Meituan LongCat-2.0 de código aberto: 1,6 biliões de parâmetros sem GPU NVIDIA

2026-07-01 02:46:54

Segundo a Reuters, no dia 30 de junho, a Meituan lançou o modelo de IA open-source LongCat-2.0, com 1,6 biliões de parâmetros, arquitetura Sparse MoE, treinado inteiramente num supercluster de ASIC nacional, sem usar GPUs NVIDIA ou software CUDA, e com janela de contexto de 1 milhão de tokens.

Especificações técnicas e cenários de aplicação do LongCat-2.0

O LongCat-2.0 utiliza a arquitetura Sparse MoE, semelhante às soluções Mixtral da DeepSeek e da Mistral: o modelo não ativa todos os 1,6 biliões de parâmetros ao mesmo tempo; em vez disso, um router interno seleciona um conjunto de submodelos especializados para cada token, reduzindo os custos de inferência em comparação com modelos densos de escala equivalente. As principais especificações técnicas e limitações de implementação são as seguintes:

Parâmetros: 1,6 biliões (arquitetura MoE esparsa, não ativando todos os parâmetros simultaneamente)

Janela de contexto: 1 milhão de tokens (DeepSeek-R1-0528 e GPT-OSS têm 128 mil tokens cada)

Hardware de treino: Supercluster de ASIC nacional (sem GPUs NVIDIA, sem software CUDA)

Aplicações alvo: Agentes de IA, ferramentas de programação (compreensão de código, edição de base de código completa, tarefas automatizadas)

Forma de implementação: Cluster de inferência a nível de datacenter; não suporta dispositivos de consumo ou a maioria das implementações locais.

Contexto de mercado do treino com chips nacionais e dados da Bernstein

A Meituan afirma que a arquitetura de inferência principal do LongCat-2.0 é portável e pode funcionar no hardware existente na China. O lançamento ocorre num momento em que os controlos de exportação dos EUA continuam a restringir a exportação de chips de IA avançados para empresas chinesas.

A empresa de pesquisa de ações Bernstein estima que a NVIDIA detém atualmente cerca de 40% do mercado chinês de chips de IA, uma quota semelhante à da Huawei; a Bernstein prevê também que a Huawei fará progressos este ano, reduzindo a quota da NVIDIA no mercado chinês em cerca de 8 pontos percentuais.

Estado atual das alegações de desempenho: ainda sem verificação de terceiros

Nos benchmarks publicados, a Meituan comparou o LongCat-2.0 com vários modelos de fonte fechada, mas a reportagem refere que estas alegações de desempenho ainda não foram verificadas por uma avaliação independente e imparcial de terceiros.

A reportagem também indica que a otimização para chips nacionais pode limitar o desempenho do LongCat-2.0 em hardware NVIDIA, que atualmente domina os datacenters globais. A Meituan afirma que a sua arquitetura de inferência principal continua a ser portável, e os testes independentes determinarão a adoção por programadores fora da China.

Perguntas Frequentes

Para que cenários de aplicação é significativa a janela de contexto de 1 milhão de tokens do LongCat-2.0?

Até à data da reportagem, os limites superiores da janela de contexto do DeepSeek-R1-0528 e do OpenAI GPT-OSS são ambos de 128 mil tokens; o LongCat-2.0 afirma atingir 1 milhão de tokens, o que é potencialmente significativo para aplicações de agentes de IA que necessitam de processar bases de código muito longas e cadeias de tarefas complexas. No entanto, estas alegações de especificações aguardam verificação independente.

Qual é o contexto de I&D de IA da Meituan?

O negócio principal da Meituan é a entrega de comida e serviços de vida local. Em 2023, a empresa entrou na área da IA ao adquirir a startup de IA Light Year Beyond por 281 milhões de dólares, e só em 2025 anunciou publicamente os seus planos de modelos internos. O LongCat-2.0 está posicionado como o motor de inferência para os agentes de IA e ferramentas de programação da empresa.

Quais são as vantagens e desvantagens da arquitetura MoE esparsa do LongCat-2.0 em comparação com um modelo denso de 1,6 biliões?

A principal vantagem do MoE esparso é não ativar todos os parâmetros, encaminhando para submodelos específicos, reduzindo os custos computacionais de inferência em comparação com modelos densos de escala equivalente. No entanto, a arquitetura otimizada para hardware específico (como ASIC nacional) pode ter limitações de desempenho noutro hardware (como GPUs NVIDIA), e os resultados de testes independentes ainda não foram divulgados.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.

Notícias relacionadas

21h atrás

Meituan lança modelo de IA LongCat-2.0 com 1,6 biliões de parâmetros a 30 de junho

06-30 03:19

Meituan lança LongCat-2.0, modelo de 1,6 biliões de parâmetros classifica-se no Top 3 do OpenRouter

Google lança modelo de geração de imagens com o menor custo, 0,034 dólares por mil imagens.

Market Whisper1h atrás

A IA de conversão de pensamento em texto da Meta atinge 61% de precisão, código-fonte aberto lançado simultaneamente.

Market Whisper21h atrás

OpenAI anuncia o teclado macro Codex, a ser lançado em 15 de julho.

Market Whisper06-30 03:41

Kinexys do JPMorgan adiciona cinco moedas da Ásia-Pacífico; Payoneer e JERA são as primeiras a adotar.

Market Whisper06-30 03:23

**Aviso da Moon's Dark Side:** Fraudes de financiamento frequentes, todas as transações não autorizadas de ações antigas são inválidas.

Market Whisper06-30 02:46

Comentar

0/400

Nenhum comentário