Laut Beating wechselte Google Gemini 3.1 Flash-Lite vom Preview- in den allgemeinen Verfügbarkeitsstatus (GA) am 8. Mai und wurde damit das günstigste und schnellste Modell in der Gemini-3-Reihe. Die Eingabepreise liegen bei 0,25 US-Dollar pro Million Tokens und die Ausgabepreise bei 1,50 US-Dollar pro Million Tokens – die Eingabekosten sind 75% niedriger als bei Claude 4.5 Haiku (1,00 US-Dollar) und die Ausgabe 70% günstiger (5,00 US-Dollar). Das Modell bietet ein Context-Window von 1 Million Tokens und erreicht 363 Tokens pro Sekunde Durchsatz, 45% schneller als sein Vorgänger Gemini 2.5 Flash.
Leistungs-Benchmarks zeigen GPQA Diamond (wissenschaftliches Schließen auf Graduierten-Niveau) bei 86,9%, über dem Wert von Claude 4.5 Haiku (73,0%) und GPT-5 mini (82,3%). MMMU-Pro (multimodales Denken) erreicht 76,8%. Zu den frühen Anwendern zählt die Plattform Gladly für den Kundenservice, die 60% Kostensenkung und eine 99,6% Erfolgsquote bei Produktions-Workloads meldet, sowie JetBrains, das Flash-Lite in IDE-Hilfswerkzeuge integriert.
Related News