
Microsoft (Microsoft) kündigte auf der Build-Konferenz im Juni die Einführung von 7 neuen KI-Modellen an, die die Bereiche Inferenz, Code, Bilder, Transkription und Sprache abdecken. In 4 wichtigen Kern-Programmier-Benchmark-Tests schneidet MAI-Code-1-Flash durchgängig besser ab als Claude Haiku 4.5 und verringert bei SWE-Bench Verified die Token-Nutzung um bis zu 60%.
7 Modellliste: Fünf Kernbereiche umfassend abgedeckt
Die Microsoft-Build-Konferenz hat 6 Modelle mit vollständigen Namen veröffentlicht: MAI Thinking-1 (Inferenz), MAI Code-1-Flash (Code), MAI Image-2.5 (Bilder), MAI Image-2.5-Flash (Bilder-Kompaktversion), MAI Transcribe-1.5 (Transkription) sowie ein Sprachmodell; der vollständige Name des 7. Modells ist in den aktuellen Berichten noch nicht vollständig offengelegt. Microsoft erklärt, dass das Flaggschiff-Inferenzmodell MAI-Thinking-1 bei STEM-Inferenz- und Codierungsaufgaben mit vergleichbaren Modellen konkurrenzfähig sei, liefert jedoch keine konkreten Benchmark-Daten.
MAI-Code-1-Flash vs Claude Haiku 4.5: 4 Benchmark-Testergebnisse
MAI-Code-1-Flash erreicht in den folgenden 4 Benchmarks durchgehend höhere Erfolgsquoten als Claude Haiku 4.5 und nutzt dabei weniger Token:
SWE-Bench Pro:MAI-Code-1-Flash 51,2% vs Claude Haiku 4.5 35,2%,Vorsprung 16 Punkte
SWE-Bench Verified:Token-Nutzung zur Lösung komplexer Probleme um bis zu 60% reduziert
IF Bench (exakte Anweisungsverfolgung):MAI-Code-1-Flash führt mit 28,9 Punkten
Advanced IF:MAI-Code-1-Flash führt mit 14,5 Punkten
Die offiziellen Microsoft-Dokumente zeigen, dass MAI-Code-1-Flash in Kern-Gegenmaßnahmen-Kategorien wie dem Einstellung-Fallstrick mit einer Genauigkeit noch unter 50% liegt und somit ein identifizierter Bereich für weitere Verbesserungen ist.
MAI-Code-1-Flash verfügbarer Umfang: Keine zusätzliche Konfiguration für Privatnutzer
MAI-Code-1-Flash ist nun in der VS Code GitHub Copilot-Version für Privatnutzer verfügbar. Es kann über den Modell-Auswahler direkt genutzt werden oder von Copilot automatisch geroutet werden. Das Modell nutzt eine adaptive Long-Context-Längensteuerung: Für einfache Anforderungen bleibt es schlank, für komplexe Aufgaben werden mehr Inferenz-Ressourcen eingesetzt. Der Bereitstellungszeitplan für die Enterprise-Version und andere Nutzergruppen von MAI-Code-1-Flash ist derzeit nicht bekannt gegeben.
Häufige Fragen
Welche 7 neuen Modelle hat Microsoft auf der Build 2026 veröffentlicht?
Für die vollständig benannten Modelle gehören MAI Thinking-1、MAI Code-1-Flash、MAI Image-2.5、MAI Image-2.5-Flash、MAI Transcribe-1.5 sowie ein sprachbezogenes Modell, insgesamt 6 Modelle; der vollständige Name des 7. Modells ist in den aktuellen offiziellen Berichten noch nicht vollständig offengelegt.
Wie wird die 60% Token-Reduzierung bei MAI-Code-1-Flash erreicht?
Microsoft erklärt, dass das Modell im Training eine adaptive Long-Context-Längensteuerung verwendet und die Reaktionstiefe automatisch an die Komplexität der Aufgabe anpasst. Die Ergebnisse von Microsoft im SWE-Bench Verified-Test zeigen, dass die Token-Nutzung bei der Lösung komplexer Probleme um bis zu 60% reduziert werden kann.
Für welche Nutzer ist MAI-Code-1-Flash derzeit verfügbar und wie sieht der Zeitplan für die Enterprise-Version aus?
Stand Juni 2026 ist MAI-Code-1-Flash für VS Code GitHub Copilot Privatnutzer verfügbar, ohne dass eine zusätzliche Konfiguration erforderlich ist. Microsoft hat den Bereitstellungszeitplan für die Enterprise-Version oder andere Nutzergruppen noch nicht bekannt gegeben.