Google wird Gemini 3.2 Flash am 20. Mai auf dem I/O vorstellen und damit die GPT-5.5-Leistung mit nur 1/15 der Kosten erreichen

AT-2,06%
ON-5,02%
MAY-1,8%
Laut Abacus.AI-CEO Bindu Reddy plant Google, während der I/O-Konferenz am 20. Mai Gemini 3.2 Flash vorzustellen. Die Leistung soll bei Codierungs- und Reasoning-Aufgaben 92% von GPT-5.5 erreichen, während die Inferenzkosten auf nur ein Fünfzehntel bis ein Zwanzigstel der letzteren gesenkt werden. Die meisten Abfragen sollen eine Latenz von unter 200 Millisekunden haben. Reddy führte den Durchbruch auf Googles Distillation- und Sparsity-Techniken zurück, die ein Frontier-Modell in die Flash-Stufe komprimieren – ohne die typische Performance-Einbruch-Kluft, die man üblicherweise bei der Modelloptimierung sieht.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare