Modelo Ling-2.6-flash da Ant Group disponibilizado como código aberto: 104B de parâmetros com 7,4B ativos, alcança múltiplos benchmarks SOTA

Mensagem do Gate News, 29 de abril — Os pesos do modelo flash Ling-2.6 da Ant Group agora foram disponibilizados como código aberto, após anteriormente estarem disponíveis apenas via API. O modelo tem 104 bilhões de parâmetros no total, com 7,4 bilhões ativados por inferência, uma janela de contexto de 256K e licenciamento MIT. Versões de precisão BF16, FP8 e INT4 estão disponíveis no HuggingFace e no ModelScope.

O Ling-2.6-flash introduz melhorias híbridas de atenção linear sobre o Ling 2.0, atualizando o GQA original para uma arquitetura híbrida 1:7 MLA mais Lightning Linear, combinada com MoE altamente esparso. A eficiência da inferência excede significativamente a de modelos comparáveis: a velocidade máxima de geração chega a 340 tokens/s em 4 GPUs H20, com throughput de prefill e decode aproximadamente 4x maior do que em modelos comparáveis de código aberto. Benchmarks relacionados a agentes mostram forte desempenho: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval e PinchBench atingem ou se aproximam de níveis SOTA. Em toda a suíte de benchmarks do Artificial Analysis, o consumo total de tokens é de apenas 15 milhões. No AIME 2026, o modelo marcou 73,85%.

O site oficial da Ant Group também lista a versão carro-chefe Ling-2.6-1T (trilion-parameter) e a versão leve Ling-2.6-mini (lightweight version), embora, até a publicação, seus pesos permaneçam não lançados no HuggingFace, com apenas a série flash disponível para download.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Rei Charles III se reúne com seis CEOs de tecnologia dos EUA, incluindo Jensen Huang, Jeff Bezos e Tim Cook, para discutir financiamento de startups do Reino Unido

Mensagem da Gate News, 29 de abril — Durante sua visita de Estado aos Estados Unidos, o rei Charles III se reuniu com seis proeminentes líderes de tecnologia americanos na Blair House, em Washington: o CEO da NVIDIA, Jensen Huang, o fundador da Amazon, Jeff Bezos, o CEO da Apple, Tim Cook, o CEO da AMD, Su Zifeng, o CEO da Salesforce, Marc Benioff, e

GateNews1m atrás

Remessas Globais de Óculos de Realidade Aumentada Disparam 98% em 2025, Impulsionadas pelo Ray-Ban Display e pela Tecnologia de Onda-Guia da Meta

Mensagem do Gate News, 29 de abril — As remessas de óculos inteligentes de realidade aumentada (AR) cresceram 98% em 2025, com as remessas no segundo semestre disparando 148% ano a ano, segundo a Counterpoint Research. O crescimento foi impulsionado por uma produção ampliada

GateNews13m atrás

O lendário gestor de fundos de hedge fala sobre o P/L das ações dos EUA: para quem comprar o índice de mercado nos próximos anos, será muito difícil obter lucro

O gestor de hedge fund Paul Tudor Jones (Jones) concede uma entrevista, alertando que lacunas na regulamentação de IA podem trazer consequências catastróficas, por sua capacidade de causar riscos inéditos ao padrão de destruição—iteração. Ele também aponta que a capitalização do mercado dos EUA como proporção do PIB chegou a 252% e que o P/L está alto demais; a longo prazo, investir no índice dificilmente trará lucros. Ele usa a analogia do boxe para dizer que as oportunidades de negociação são raras e pede cooperação global para criar regulamentação para a IA.

ChainNewsAbmedia15m atrás

Cognition estabelece Singapura como sede da APAC e mira expansão regional

Mensagem da Gate News, 29 de abril — A Cognition, a startup de codificação com IA por trás da Devin, anunciou em 29 de abril que estabelecerá Singapura como sua sede na Ásia-Pacífico para supervisionar a expansão regional por toda a Sudeste Asiático, Austrália, Índia e Coreia do Sul. Richard Spence liderará as operações da APAC

GateNews1h atrás

Google e o Pentágono assinam acordo secreto de IA, carta aberta de funcionários se opõe

De acordo com o The Information, em 28 de abril, a Google assinou um acordo para fornecer ao Pentágono dos EUA modelos de IA (inteligência artificial) usados para trabalhos confidenciais. O New York Times, citando fontes familiarizadas com o assunto, disse que o acordo permite que o Departamento de Defesa dos EUA use a IA da Google para fins governamentais legítimos, com natureza semelhante aos acordos confidenciais de implantação de IA que o Pentágono assinou com a OpenAI e a xAI no mês passado.

MarketWhisper1h atrás

Relatório de pesquisa da a16z Crypto: A taxa de exploração de vulnerabilidades de DeFi por agentes de IA atingiu 70%

De acordo com o relatório de pesquisa publicado pela a16z Crypto em 29 de abril, com condições em que os agentes de IA são equipados com conhecimento estruturado do domínio, a taxa de sucesso de reproduzir vulnerabilidades de manipulação do preço do Ethereum atinge 70%; em ambientes de sandbox sem qualquer conhecimento do domínio, a taxa de sucesso é de apenas 10%. O relatório também registrou casos em que agentes de IA, de forma independente, contornaram as restrições do sandbox para acessar informações futuras de transações, e padrões sistemáticos de falha dos agentes ao criar planos de ataque lucrativos em várias etapas.

MarketWhisper1h atrás
Comentário
0/400
Sem comentários