Google va lancer Gemini 3,2 Flash à l’I/O le 20 mai, avec des performances comparables à celles de GPT-5,5 pour un coût de 1/15

AT-18,91%
ON0,59%
MAY2,23%
D’après la PDG d’Abacus.AI, Bindu Reddy, Google prévoit de dévoiler Gemini 3.2 Flash lors de sa conférence I/O le 20 mai, avec des performances atteignant 92 % de celles de GPT-5.5 sur les tâches de codage et de raisonnement tout en réduisant les coûts d’inférence à seulement un quinzième à un vingtième de ceux-ci. La plupart des requêtes auront une latence inférieure à 200 millisecondes. Reddy a attribué cette percée aux techniques de distillation et de sparsité de Google, qui compressent un modèle de pointe dans la catégorie Flash sans la baisse de performance typique généralement observée lors de l’optimisation des modèles.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire