Der CEO von MiniMax Intelligence, Li Dahai, erklärte auf der 2026er Beijing Zhiyuan Conference, dass Agent-Technologie trotz des schnellen Fortschritts einen maßvollen Ansatz erfordert. Im Gespräch mit Pengpai News und anderen Medien führte Li aus, dass die öffentlichen Erwartungen an Zero-Error-Agents das übersteigen, was die aktuelle technische Entwicklungskurve liefern kann, da die Technologie noch Zeit braucht, um auszureifen. Er nannte 2025 als das erste Jahr der Agents und rechnete mit einem explosiven Wachstum, das die menschliche Gesellschaft nachhaltig prägen wird, betonte jedoch die Notwendigkeit einer ruhigen Einschätzung der aktuellen technischen Fähigkeiten im Bereich der KI-Agents.

Li Dahai beschreibt Agent-Technologie-Limitierungen und rasante Evolution

Li Dahai räumte ein, dass die Integration großer Modelle und Agent-Technologie sich sehr schnell weiterentwickelt, wobei einige Szenarien bereits in der Praxis landen. Bei der Diskussion über Agent-Limitierungen sagte Li unverblümt: „Probleme überall.“ Er führte aus, dass „die Evolution von Modell- und Agent-Technologie sehr schnell ist“ und erklärte: „Vielleicht hat die Arbeit heute noch eine Fehlerquote von 10% und im nächsten Monat sinkt die Fehlerquote auf 1% — die schnelle Evolution ist zu einem zentralen Trend geworden.“

MiniMax CEO widerspricht dem Irrtum über Small-Model-Distillation

Li Dahai stellte sich direkt gegen den weit verbreiteten Glauben der Branche, dass „gute kleine Modelle daraus entstehen müssen, indem man sie aus Ultra-Large-Foundation-Modellen distilliert“, und bezeichnete dies als „kognitiven Irrtum“. Er erklärte: „Hinter der Distillation steckt eine sehr konkrete Prämisse: Das Objekt der Distillation selbst muss ein gutes Modell sein. Distillation ist im Wesentlichen: Für Unternehmen, die nicht in der Lage sind, selbst Foundation-Modelle zu entwickeln, aber Anwendungen ans Ziel bringen wollen, nutzen sie bestehende Small-sized Foundation-Modelle und gewinnen durch Feintuning spezifische Szenario-Fähigkeiten. In diesem Prozess verwenden sie möglicherweise tatsächlich andere große Modelle, um Daten zu synthetisieren, damit kleine Modelle die entsprechenden Fähigkeiten erwerben.“ Li sagte, dass dies das Paradigma für das gesamte Training großer Modelle ist und nicht nur auf kleine Modelle beschränkt.

MiniMax verlagert Trainings-Workloads auf inländische Chips

Li Dahai gab bekannt: „Seit diesem Jahr, nachdem die Branche insgesamt das Inference auf inländische Chips verlagert hat, verlagern auch wir schrittweise das Training auf inländische Chips und inländische Cluster.“ Er identifizierte zwei parallele Wege zur Verbesserung des inländischen Ökosystems für Rechenleistung: Der erste ist Bottom-up-Verfeinerung, bei der große Modellunternehmen das Ökosystem schrittweise durch ihre eigenen Trainingspraktiken verbessern, „wie man ein Steinplatten-Sägeblatt Stück für Stück benetzt, was Zeit braucht.“ Der zweite Weg ist Top-down-Planung, veranschaulicht durch die tiefe Zusammenarbeit von MiniMax mit dem Zhiyuan Research Institute am FlagOS-Software-Ökosystem, bei der große Modellunternehmen und Chip-Unternehmen eine enge Kooperation eingehen und unter Planung vorankommen. Li Yuxuan, Leiter von MiniMax Intelligence AIInfra, merkte an, dass Inference tatsächlich höhere Präzision erfordert als Training, und dass die von MiniMax vorgeschlagene Modell-Skalierungstechnologie zu einem entscheidenden Durchbruch wurde: Mit sehr kleinen Modellen große Modelle vorhersagen und damit eine tiefgehende Evaluation auf inländischen Chips ermöglichen, experimentelle Details mit Herstellern im Ausland abstimmen und bestätigen, dass die Trainingspräzision nutzbar ist. MiniMax legte offen, dass es auf der Huawei-Plattform ein extrem niedriges bitbreiten-quantization-aware Training erreicht hat und 95% der Effizienz des gewöhnlichen Trainings erzielt. Li Dahai erklärte, dass die 5% Verluste aus dem Overhead des Quantizers selbst stammen und dieser Overhead durch die tiefe Zusammenarbeit mit Huawei auf ein Minimum optimiert wurde.

MiniCPM-5 1B erreicht nahe GPT-4o-Leistung im ArtificialAnalysis-Benchmark

MiniMax Intelligence gab bekannt, dass die MiniCPM Small Cannon fünfte Generation im 1B-Modell eine Punktzahl von 17,9 bei der maßgeblichen ArtificialAnalysis (AA)-Evaluation erreicht hat. Forschende aus der Open-Source-Community verglichen und fanden, dass GPT-4o (200B Parameter), das im Mai 2024 veröffentlicht wurde, bei derselben Art von Evaluation 18,3-18,6 erzielte — der Unterschied zwischen den beiden liegt nur bei 0,4-0,7 Punkten. Li Dahai sagte: „Im Jahr 2024 haben wir prognostiziert, dass bis Ende 2026 das Intelligenzniveau von Edge-Modellen das Niveau von GPT-4 erreichen könnte. Aus den aktuellen Daten heraus wurde dieses Ziel vorzeitig erreicht.“

Während der vorherigen „MiniMax Open Source Week“ veröffentlichte MiniMax Intelligence zwei Edge-Großmodelle: MiniCPM5-1B und BitCPM-CANN. MiniCPM5-1B aktualisierte die Obergrenze der Modell-Intelligenz-Dichte erneut: Mit nur 1B Parameterumfang übertraf es alle Modelle unter 2B Parametern auf der international renommierten AA-Index-Leaderboard; verglichen mit Qwen3.5-2B, das 3 Monate früher veröffentlicht wurde, hat MiniCPM5-1B nicht nur eine bessere Leistung, sondern reduzierte auch die Parameter um die Hälfte.

ForgeTrain AI-geschriebenes Framework trainiert 10% schneller als NVIDIA Megatron

Das MiniCPM5-1B-Modell wurde von MiniMax Intelligence mit dem unabhängig entwickelten AI-Trainingsframework ForgeTrain vortrainiert. Dabei handelt es sich um das weltweit erste production-grade Large-Model-Pre-Training-Framework, das vollständig von KI geschrieben wurde, ohne Beteiligung eines menschlichen Programmierers. Die Trainingsgeschwindigkeit liegt 10% schneller als bei NVIDIA Megatron.

FAQ

Was sagte Li Dahai über die Limitierungen von Agent-Technologie auf der 2026 Beijing Zhiyuan Conference?

Li Dahai sagte, dass die öffentlichen Erwartungen an Zero-Error-Agents das übersteigen, was die aktuelle technische Entwicklungskurve liefern kann, und dass die Technologie noch Zeit braucht, um auszureifen. Er beschrieb die aktuellen Agent-Limitierungen als „Probleme überall“, betonte jedoch, dass die Fehlerquoten schnell sinken — in manchen Fällen von 10% auf 1% innerhalb eines Monats.

Wie vergleicht sich die Leistung von MiniCPM-5 1B mit GPT-4o im ArtificialAnalysis-Benchmark?

MiniCPM-5 1B (mit 1B Parametern) erzielte 17,9 bei der ArtificialAnalysis-Evaluation, während GPT-4o (mit 200B Parametern, veröffentlicht im Mai 2024) 18,3-18,6 bei derselben Evaluation erzielte, was zu einem Unterschied von nur 0,4-0,7 Punkten zwischen beiden Modellen führt.

Was ist ForgeTrain und wie unterscheidet es sich von NVIDIA Megatron?

ForgeTrain ist das unabhängig entwickelte AI-Trainingsframework von MiniMax Intelligence. Es ist das weltweit erste production-grade Large-Model-Pre-Training-Framework, das vollständig von KI geschrieben wurde, ohne Beteiligung eines menschlichen Programmierers. Es trainiert 10% schneller als NVIDIA Megatron.

View Source

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.