V4-Pro erreicht 67% Coding-Pass-Rate im internen Dogfooding-Test und kommt der Performance von Opus 4.5 nahe

Gate News-Mitteilung, 24. April — V4 hat die internen Dogfooding-Daten für sein V4-Pro-Modell öffentlich offengelegt. Das Unternehmen sammelte ungefähr 200 reale Engineering-Aufgaben von über 50 Ingenieuren, die die Entwicklung von Funktionen, Fehlerbehebungen, Refactoring und Diagnostik über Tech-Stacks hinweg umfassten, darunter PyTorch, CUDA, Rust und C++. Nach rigoroser Filterung wurden 30 Aufgaben für die Benchmark-Auswertung beibehalten.

V4-Pro-Max erreichte eine Coding-Pass-Rate von 67% und lag damit deutlich über Sonnet 4.5 mit 47% sowie nahe an Opus 4.5 mit 70%. Allerdings bleibt es hinter Opus 4.5 Thinking (73%) und Opus 4.6 Thinking (80%) zurück, während es Haiku 4.5 mit 13% deutlich übertrifft.

In einer internen Umfrage mit 85 Befragten gaben alle Teilnehmenden an, V4-Pro für agentisches Coding in täglichen Workflows zu verwenden. 52% befürworteten V4-Pro als ihr standardmäßiges primäres Coding-Modell, 39% neigten zur Zustimmung, und weniger als 9% äußerten Ablehnung. Gemeldete Probleme umfassten Low-Level-Fehler, Fehlinterpretationen mehrdeutiger Prompts und gelegentliches übermäßiges Nachdenken.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

KI-Finanzplattform Rogo holt $160M in Series D ein, angeführt von Kleiner Perkins in weniger als 3 Monaten

Laut Beating hat die für Hochfrequenz-Finanzszenarien entwickelte KI-Plattform Rogo im April 2026 eine $160 -Millionen-Series-D-Finanzierungsrunde abgeschlossen, angeführt von Kleiner Perkins, mit Beteiligung von Sequoia, Thrive Capital, Khosla Ventures und J.P. Morgan. Die Finanzierung kam weniger als drei Monate

GateNews5Std her

China blockiert am 29. April die von Meta unterstützte Manus-AI-Übernahme unter Berufung auf Bedenken hinsichtlich Technologie- und Datensicherheit

Laut PANews hat am 29. April das Amt für Überprüfung der Investitionssicherheit der Nationalen Entwicklungs- und Reformkommission Chinas eine ausländische Übernahme des Manus-Projekts verboten und verlangt, dass die Transaktion beendet wird. Manus, als der weltweit erste Agent für allgemeine künstliche Intelligenz angepriesen, hatte

GateNews6Std her

Alibaba Cloud senkt die Preisgestaltung für den impliziten Cache von DeepSeek-V4-Pro auf 1 Yuan pro Million Tokens am 29. April

Laut Alibaba Cloud wird die Bailian-Plattform die Preisgestaltung für den impliziten Cache des DeepSeek-V4-Pro-Modells (Impliziter Cache) auf 1 Yuan pro Million Tokens senken, wirksam ab dem 29. April 2026 um 23:59:59 Pekinger Zeit. Der implizite Cache gilt nur, wenn Anfragen den Cache treffen; die abgerechneten Tokens für zwischengespeicherte Eingaben werden zum cached_token-Satz berechnet, während nicht zwischengespeicherte Eingabetokens zum standard input_token-Satz abgerechnet werden. Die Anpassung betrifft ausschließlich die Preisgestaltung des impliziten Caches; die Basis-Modell-Inferenzraten bleiben unverändert.

GateNews6Std her

KI-Plattform Certifyde nimmt $2M in Seed-Finanzierung mit Ripple-CEO Brad Garlinghouse auf

Laut ChainCatcher hat die KI-Anwendungsplattform Certifyde den Abschluss einer $2 Millionen Seed-Funding-Runde bekannt gegeben. Zu den Investoren gehören K5 Global, Flamingo Capital sowie Angel-Investoren wie Ripple-CEO Brad Garlinghouse, der Mitgründer von Honey George Ruan und der Mitgründer von Nutra Roland

GateNews8Std her

DeepSeek startet Bilderkennungsfunktion in der Betatestphase

Laut PANews hat DeepSeek heute seine Bilderkennungsfunktion gestartet (29. April), derzeit in der Betatestphase. Sowohl Nutzer der Webversion als auch der mobilen App können für die Beta-Einführung ausgewählt werden.

GateNews9Std her
Kommentieren
0/400
Keine Kommentare