DeepSeek V4 Consegue Pontuação Perfeita no Putnam-2025, Empata com Axiom em Raciocínio Matemático Formal

Mensagem do Gate News, 24 de abril — A DeepSeek V4 publicou resultados de avaliações de raciocínio matemático formal, alcançando uma pontuação perfeita de 120/120 no Putnam-2025, empatando com a Axiom pelo primeiro lugar.

No regime prático usando LeanExplore e amostragem restrita, o V4-Flash-Max obteve 81.00 no benchmark Putnam-200 Pass@8, superando significativamente o Seed-2.0-Prover (35.50), o Gemini 3 Pro (26.50) e o Seed-1.5-Prover (26.50). Os resultados do regime de fronteira mostraram a V4 à frente do Seed-1.5-Prover (110/120) e do Aristotle (100/120).

A V4 emprega uma abordagem híbrida de raciocínio formal-informal: o raciocínio informal gera soluções candidatas em linguagem natural, a auto-verificação filtra os resultados e um agente formal completa provas rigorosas em Lean. Os resultados do regime de fronteira utilizaram escalonamento computacional em larga escala, enquanto as pontuações do regime prático refletem melhor as capacidades padrão de implantação.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Cofundador da NeoSoul Kaelan: a Indústria de IA deve permitir que brinquedos existam; a inovação muitas vezes começa como produtos experimentais

Mensagem do Gate News, 24 de abril — Em um fórum recente em Hong Kong sobre finanças inteligentes e criptografadas, o cofundador da NeoSoul, Kaelan, compartilhou percepções sobre como avaliar projetos de IA no estágio inicial, em uma indústria de IA que evolui rapidamente. Além de avaliar produtos atuais, as equipes devem demonstrar a capacidade de acompanhar as capacidades dos modelos subjacentes, afirmou ele.

GateNews12m atrás

Meta e Amazon concordam com acordo multibilionário para fornecer chips Graviton para o desenvolvimento de IA

Mensagem do Gate News, 24 de abril — A Meta Platforms e os Serviços de Computação em Nuvem da Amazon (AWS) alcançaram um acordo multibilionário para apoiar as iniciativas de inteligência artificial da Meta nos próximos anos, segundo o Wall Street Journal. De acordo com o acordo, a Meta usará dezenas de milhões de núcleos de chips AWS Graviton c

GateNews23m atrás

DeepSeek V4-Flash entra no Ollama Cloud, servidor nos EUA: Claude Code, OpenClaw conectados em um clique

Ollama Cloud colocou DeepSeek V4-Flash à venda, com inferência em servidores nos EUA, oferecendo três conjuntos de comandos de um clique para conectar ao Claude Code, OpenClaw e Hermes. V4-Flash/V4-Pro adotam uma arquitetura MoE, com suporte nativo a contexto de 1M, e reduzem custos com compressão Token-wise + atenção esparsa DSA; em cenários de 1M, o FLOPs por token cai 27% e o cache KV diminui 10%. A API é compatível com OpenAI ChatCompletions e Anthropic, facilitando a alternância entre diferentes fluxos de trabalho, reduzindo custos e riscos de soberania de dados.

ChainNewsAbmedia1h atrás

Web3 AI Infrastructure AIW3 Capta $2M na Rodada Seed Liderada pela Buffalo Capital

Mensagem do Gate News, 24 de abril — A plataforma de infraestrutura de IA Web3 AIW3 anunciou a conclusão de uma rodada de captação seed de $2 milhões. A rodada foi liderada pela Buffalo Capital, com GalaXin Capital e Three-stones Ventures participando como co-investidoras. A AIW3 está fazendo a transição para um paradigma de execução on-chain de Agente-como-Serviço

GateNews2h atrás

Cohere Adquire Empresa Alemã de IA Aleph Alpha e Garante $600M Investimento para Expansão na Europa

Mensagem do Gate News, 24 de abril — A empresa canadense de IA Cohere anunciou planos para adquirir a empresa alemã de IA Aleph Alpha para fortalecer sua presença na Europa. A Schwarz Group, apoiadora da Aleph Alpha, planeja investir $600 milhões na rodada de financiamento Série E da Cohere. A rodada de financiamento deve ser concluída em 202

GateNews2h atrás

Xpeng e Xiaomi lideram avanço de IA embarcada no Beijing Auto Show

Mensagem da Gate News, 24 de abril — Montadoras chinesas exibiram sistemas avançados de IA embarcada no Beijing Auto Show em 24 de abril, à medida que o país acelera sua estratégia AI Plus e busca maior independência de semicondutores estrangeiros. A Xpeng demonstrou estacionamento controlado por voz que permite que os motoristas emitam comandos falados em vez de selecionar manualmente localizações.

GateNews3h atrás
Comentário
0/400
Sem comentários