DeepSeek V4 erreicht perfekte Punktzahl bei Putnam-2025 und teilt den ersten Platz mit Axiom in formaler mathematischer Beweisführung

Gate News Nachricht, 24. April — DeepSeek V4 hat Ergebnisse aus formalen mathematischen Schlussfolgerungsbewertungen veröffentlicht und eine perfekte Punktzahl von 120/120 bei Putnam-2025 erreicht, womit es mit Axiom für den ersten Platz gleichzieht.

Im praktischen Regime, das LeanExplore und eingeschränktes Sampling nutzt, erzielte V4-Flash-Max 81,00 auf dem Putnam-200 Pass@8-Benchmark und übertraf damit Seed-2.0-Prover (35.50), Gemini 3 Pro (26.50) und Seed-1.5-Prover (26.50) deutlich. Die Ergebnisse aus dem Frontier-Regime zeigten, dass V4 Seed-1.5-Prover (110/120) und Aristotle (100/120) voraus ist.

V4 nutzt einen hybriden Ansatz aus formaler und informeller Schlussfolgerung: Informelles Reasoning erzeugt Kandidatenlösungen in natürlicher Sprache, die Selbstverifikation filtert die Ergebnisse, und ein formaler Agent vervollständigt die rigorosen Beweise in Lean. Die Ergebnisse aus dem Frontier-Regime nutzten eine groß angelegte rechnerische Skalierung, während die Scores im praktischen Regime die Fähigkeiten bei einer standardmäßigen Bereitstellung besser widerspiegeln.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

KI-Plattform Certifyde nimmt $2M in Seed-Finanzierung mit Ripple-CEO Brad Garlinghouse auf

Laut ChainCatcher hat die KI-Anwendungsplattform Certifyde den Abschluss einer $2 Millionen Seed-Funding-Runde bekannt gegeben. Zu den Investoren gehören K5 Global, Flamingo Capital sowie Angel-Investoren wie Ripple-CEO Brad Garlinghouse, der Mitgründer von Honey George Ruan und der Mitgründer von Nutra Roland

GateNews1Std her

DeepSeek startet Bilderkennungsfunktion in der Betatestphase

Laut PANews hat DeepSeek heute seine Bilderkennungsfunktion gestartet (29. April), derzeit in der Betatestphase. Sowohl Nutzer der Webversion als auch der mobilen App können für die Beta-Einführung ausgewählt werden.

GateNews2Std her

Anthropic bringt 8 kreative Tool-Connectoren für Claude auf den Markt, darunter Blender, Adobe, Autodesk

Anthropic hat eine Reihe kreativer Tool-Connectoren angekündigt, mit denen Claude professionelle Software direkt steuern kann, die von Designern und Musikern verwendet wird. Die anfänglichen acht Connectoren decken 3D-Modellierung, visuelles Design, Musikproduktion und Live-Performances ab, mit Partnern unter anderem Blender, Adobe,

GateNews2Std her

Weißes Haus umgeht Risikoanalyse des Pentagon, um am 29. April das Anthropic-Mythos-Modell einzusetzen

Laut Whale Factor umgeht das Weiße Haus die Risikoanalyse des Pentagon, um am 29. April das Mythos-Modell von Anthropic in föderalen Behörden einzusetzen. Der Schritt soll die Fähigkeiten der staatlichen KI beschleunigen und das Tempo dezentraler KI-Netzwerke erreichen. Dies stellt eine bedeutende Abweichung dar

GateNews3Std her

Cognizant erwirbt Astreya für $600M , um das Geschäft mit KI-Infrastruktur auszubauen

Laut Reuters hat Cognizant am 29. April zugestimmt, Astreya für ungefähr $600 million zu übernehmen, während das Unternehmen sein Geschäft mit KI-Infrastruktur ausbaut. Astreya ist ein IT-Dienstleister, der sich auf KI-Infrastruktur und Rechenzentrumsdienste spezialisiert. Die Übernahme soll im zweiten Quartal 2026 abgeschlossen werden, vorbehaltlich behördlicher Genehmigungen.

GateNews3Std her

30 bösartige Plugins auf ClawHub, getarnt als KI-Tools, über 9.800 Mal heruntergeladen

Laut dem Manifold-Forscher Ax Sharma wurden 30 Plugins auf ClawHub, die als legitime KI-Tools getarnt sind, über 9.800 Mal heruntergeladen, während sie heimlich die KI-Assistenten der Nutzer in Kryptoarbeiter umwandeln. Die unter dem Konto imaflytok veröffentlichten Plugins wirken wie Routine-Task-Planer a

GateNews3Std her
Kommentieren
0/400
Keine Kommentare