Microsoft stellte am Dienstag auf seinem jährlichen Build-Event sieben neue KI-Modelle vor und behauptete, sie hätten in Blindtests und Bildbearbeitungs-Benchmarks besser abgeschnitten als Anthropics Claude Sonnet 4.6 und Googles Nano Banana 2. Die Veröffentlichung ist Teil von Microsofts Bemühungen, sich als Entwickler von KI der Spitzenklasse zu positionieren – nicht nur als größter Unterstützer und Infrastruktur-Provider von OpenAI. Die Ankündigung erfolgt, während der Wettbewerb unter führenden Entwicklern von KI weiter zunimmt; Anthropic und Google hatten zuletzt jeweils eigene Flaggschiff-Modelle veröffentlicht.
MAI-Thinking-1 übertrifft Claude Sonnet 4.6 in Blindtests
MAI-Thinking-1, das Flaggschiff-Text-Grundlagenmodell von Microsoft, wurde in Blindtests, die von unabhängigen Auswertern durchgeführt wurden, gegenüber Anthropics Claude Sonnet 4.6 bevorzugt, so Microsofts KI-CEO Mustafa Suleyman. Das Modell erzielte 97% auf AIME 2025, einem Benchmark zur Messung fortgeschrittener Problemlösungs- und Argumentationsfähigkeiten. Suleyman erklärte, das Ergebnis von MAI bei SWE Bench Pro platziere es „direkt neben Opus 4.6 bei einem der härtesten Coding-Benchmarks“. Microsoft behauptete außerdem, MAI habe „die höchste Gewinnrate geliefert und GPT-5,5 in der Qualität übertroffen, während es bei den Kosten 10x günstiger“ sei.
„Ich freue mich sehr, heute sieben neue erstklassige MAI-Modelle ankündigen zu können“, schrieb Suleyman auf X. „Sie stehen für das, was wir als eine neue Ära in der KI betrachten – entwickelt, um dafür zu sorgen, dass Sie die Kontrolle behalten und gleichzeitig an der Spitze bleiben.“
Microsoft bringt sechs weitere KI-Modelle in den Bereichen Coding, Bild, Voice
Microsoft stellte MAI-Code-1-Flash vor, ein leichtgewichtiges Coding-Modell, das für GitHub Copilot und Visual Studio Code entwickelt wurde. Das Unternehmen präsentierte zudem MAI-Image-2.5 und dessen Flash-Variante, die Microsoft zufolge Googles Nano Banana Pro bei Bildbearbeitungsaufgaben übertreffen. Ebenfalls angekündigt wurden MAI Transcribe-1.5, ein Transkriptionsmodell, das 43 Sprachen unterstützt, und MAI-Voice-2, ein Speech-Generation-Modell, das natürlicher klingende Stimmen in 15 Sprachen erzeugen kann und sich an einen Sprecher aus einem kurzen Audio-Sample anpasst.
„Das ist eine außergewöhnliche Zeit in der Technologie. Die Rechenleistung, die zum Trainieren von Frontier-Modellen verwendet wird, ist um den Faktor eine Billion gestiegen“, sagte Suleyman in einem Blogbeitrag zur Ankündigung der neuen Modelle. „Jetzt erwarten wir eine weitere Tausendfach-Steigerung in den nächsten drei Jahren – was wiederum mehr fortgeschrittene Fähigkeiten bedeutet und die fortgesetzte Einführung immer effektiverer KI.“
Anthropic und Google veröffentlichen konkurrierende Modelle
Letzte Woche kündigte Anthropic die Einführung von Opus 4.8 an, das laut dem Unternehmen bei Benchmark-Tests schneller und intelligenter ist und neue Funktionen mitbringt. Am Dienstag kündigte Anthropic eine Erweiterung seines Project Glasswing an und stellte 150 Unternehmen Zugang zu seinem auf Cybersicherheit fokussierten Mythos-Modell bereit. Auf dem Google I/O im Mai stellte Google Gemini Omni vor, ein multimodales KI-Modell, das Gemini mit Veo, Nano Banana und Genie-Mediengenerierungsmodellen kombiniert – sowie Gemini Spark, ein cloudbasiertes KI-Agentenmodell, das darauf ausgelegt ist, Aufgaben über Apps und Workflows hinweg zu verwalten.
„Entwickler und Unternehmen verlangen seit langem nach KI, die zu ihren Bedingungen liefert – und unter ihrer Kontrolle“, schrieb Suleyman. „Wir sehen das als einen großen Schritt hin zu genau diesem Ziel.“
FAQ
Was hat Microsoft auf dem Build-Event am Dienstag angekündigt?
Microsoft stellte sieben neue KI-Modelle vor, darunter MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5, MAI Transcribe-1.5 und MAI-Voice-2, und behauptete, sie hätten in verschiedenen Benchmarks besser abgeschnitten als Anthropics Claude Sonnet 4.6 und Googles Nano Banana 2.
Wie schnitt MAI-Thinking-1 bei Benchmarks ab?
MAI-Thinking-1 erzielte 97% auf AIME 2025 und wurde in Blindtests, die von unabhängigen Auswertern durchgeführt wurden, gegenüber Claude Sonnet 4.6 bevorzugt, so Microsofts KI-CEO Mustafa Suleyman.