Segundo a Reuters, no dia 30 de junho, a Meituan lançou o modelo de IA open-source LongCat-2.0, com 1,6 biliões de parâmetros, arquitetura Sparse MoE, treinado inteiramente num supercluster de ASIC nacional, sem usar GPUs NVIDIA ou software CUDA, e com janela de contexto de 1 milhão de tokens.
Especificações técnicas e cenários de aplicação do LongCat-2.0
O LongCat-2.0 utiliza a arquitetura Sparse MoE, semelhante às soluções Mixtral da DeepSeek e da Mistral: o modelo não ativa todos os 1,6 biliões de parâmetros ao mesmo tempo; em vez disso, um router interno seleciona um conjunto de submodelos especializados para cada token, reduzindo os custos de inferência em comparação com modelos densos de escala equivalente. As principais especificações técnicas e limitações de implementação são as seguintes:
Parâmetros: 1,6 biliões (arquitetura MoE esparsa, não ativando todos os parâmetros simultaneamente)
Janela de contexto: 1 milhão de tokens (DeepSeek-R1-0528 e GPT-OSS têm 128 mil tokens cada)
Hardware de treino: Supercluster de ASIC nacional (sem GPUs NVIDIA, sem software CUDA)
Aplicações alvo: Agentes de IA, ferramentas de programação (compreensão de código, edição de base de código completa, tarefas automatizadas)
Forma de implementação: Cluster de inferência a nível de datacenter; não suporta dispositivos de consumo ou a maioria das implementações locais.
Contexto de mercado do treino com chips nacionais e dados da Bernstein
A Meituan afirma que a arquitetura de inferência principal do LongCat-2.0 é portável e pode funcionar no hardware existente na China. O lançamento ocorre num momento em que os controlos de exportação dos EUA continuam a restringir a exportação de chips de IA avançados para empresas chinesas.
A empresa de pesquisa de ações Bernstein estima que a NVIDIA detém atualmente cerca de 40% do mercado chinês de chips de IA, uma quota semelhante à da Huawei; a Bernstein prevê também que a Huawei fará progressos este ano, reduzindo a quota da NVIDIA no mercado chinês em cerca de 8 pontos percentuais.
Estado atual das alegações de desempenho: ainda sem verificação de terceiros
Nos benchmarks publicados, a Meituan comparou o LongCat-2.0 com vários modelos de fonte fechada, mas a reportagem refere que estas alegações de desempenho ainda não foram verificadas por uma avaliação independente e imparcial de terceiros.
A reportagem também indica que a otimização para chips nacionais pode limitar o desempenho do LongCat-2.0 em hardware NVIDIA, que atualmente domina os datacenters globais. A Meituan afirma que a sua arquitetura de inferência principal continua a ser portável, e os testes independentes determinarão a adoção por programadores fora da China.
Perguntas Frequentes
Para que cenários de aplicação é significativa a janela de contexto de 1 milhão de tokens do LongCat-2.0?
Até à data da reportagem, os limites superiores da janela de contexto do DeepSeek-R1-0528 e do OpenAI GPT-OSS são ambos de 128 mil tokens; o LongCat-2.0 afirma atingir 1 milhão de tokens, o que é potencialmente significativo para aplicações de agentes de IA que necessitam de processar bases de código muito longas e cadeias de tarefas complexas. No entanto, estas alegações de especificações aguardam verificação independente.
Qual é o contexto de I&D de IA da Meituan?
O negócio principal da Meituan é a entrega de comida e serviços de vida local. Em 2023, a empresa entrou na área da IA ao adquirir a startup de IA Light Year Beyond por 281 milhões de dólares, e só em 2025 anunciou publicamente os seus planos de modelos internos. O LongCat-2.0 está posicionado como o motor de inferência para os agentes de IA e ferramentas de programação da empresa.
Quais são as vantagens e desvantagens da arquitetura MoE esparsa do LongCat-2.0 em comparação com um modelo denso de 1,6 biliões?
A principal vantagem do MoE esparso é não ativar todos os parâmetros, encaminhando para submodelos específicos, reduzindo os custos computacionais de inferência em comparação com modelos densos de escala equivalente. No entanto, a arquitetura otimizada para hardware específico (como ASIC nacional) pode ter limitações de desempenho noutro hardware (como GPUs NVIDIA), e os resultados de testes independentes ainda não foram divulgados.