Google Gemini 3.1 Flash-Lite est officiellement lancé : le prix d’entrée est 75 % moins élevé que celui de Claude 4.5 Haiku, avec un score GPQA de 86,9 %

D’après Beating, Google Gemini 3.1 Flash-Lite est passé de la phase de préversion à la disponibilité générale (GA) le 8 mai, devenant le modèle le moins cher et le plus rapide de la série Gemini 3. Le prix en entrée est fixé à 0,25 $ par million de tokens et en sortie à 1,50 $ par million de tokens — les coûts d’entrée sont 75% moins élevés que ceux de Claude 4.5 Haiku (1,00 $) et la sortie est 70% moins chère (5,00 $). Le modèle dispose d’une fenêtre de contexte de 1 million de tokens et atteint un débit de 363 tokens par seconde, soit 45% plus rapide que son prédécesseur Gemini 2.5 Flash.

Les références de performance affichent GPQA Diamond (raisonnement scientifique au niveau licence/graduate) à 86,9%, dépassant Claude 4.5 Haiku (73,0%) et GPT-5 mini (82,3%). MMMU-Pro (raisonnement multimodal) atteint 76,8%. Les premiers utilisateurs incluent la plateforme de service client Gladly, qui indique une réduction de 60% des coûts et un taux de réussite de 99,6% sur des charges de travail en production, ainsi que JetBrains, qui intègre Flash-Lite dans des outils d’assistance de l’IDE.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

CoreWeave dépasse les estimations de revenus du T1 avec 2,08 milliards de dollars, l’action progresse de 3 %

Selon Reuters, CoreWeave a annoncé un chiffre d'affaires du premier trimestre de 2,08 milliards de dollars le 7 mai, dépassant l'estimation moyenne des analystes de 1,97 milliard de dollars. Une forte demande en calcul haute performance utilisée pour entraîner et exécuter des modèles d'IA a stimulé la croissance du fournisseur cloud. Son action a grimpé de 3% en séance de bourse prolongée

GateNewsIl y a 2m

OpenAI change le modèle par défaut de ChatGPT pour GPT-5.5 instantané, réduisant les hallucinations de 52,5%

D’après OpenAI, la société a remplacé le modèle par défaut de ChatGPT par GPT-5.5 Instant le 8 mai. Lors de tests internes, le modèle a produit 52,5 % moins d’affirmations hallucinées que GPT-5.3 Instant sur des prompts à enjeux élevés, tout en réduisant de 37,3 % les affirmations inexactes dans des conversations signalées par les utilisateurs pour un problème de fait erroné

GateNewsIl y a 12m

Le PDG de Nvidia, Huang : L’infrastructure IA de nouvelle génération exige de vastes connexions optiques, le cuivre ne suffit pas le 8 mai

D’après BlockBeats, le 8 mai, le PDG de Nvidia, Jensen Huang, a déclaré que les infrastructures d’IA de nouvelle génération nécessiteront de nombreuses connexions optiques, car le cuivre ne peut pas répondre aux besoins informatiques en forte croissance. Huang a salué le nouveau partenariat de Nvidia avec Corning, le qualifiant d’importante opportunité

GateNewsIl y a 16m

Cloudflare licencie plus de 1 100 employés (20 % de ses effectifs) pour se tourner vers des opérations pilotées par l’IA

Selon Reuters, Cloudflare a licencié plus de 1 100 employés, soit environ 20 % de ses effectifs, le 8 mai afin de restructurer ses opérations autour d’outils d’IA. Le PDG Matthew Prince a déclaré que l’entreprise repense chaque équipe et chaque fonction pour s’adapter à l’ère d’une IA agentique, en précisant qu’elle utilise déjà l’IA en interne.

GateNewsIl y a 30m

Google lance Fitbit Air à 99,99 dollars, le traqueur sans écran devient le hub du coach santé Gemini le 26 mai

D’après Beating, Google a lancé Fitbit Air, un traqueur de santé sans écran au prix de 99,99 dollars, prévu pour une expédition le 26 mai. L’appareil ne pèse que 5,2 grammes et propose une autonomie de 7 jours avec une charge rapide de 5 minutes. Des capteurs suivent la fréquence cardiaque sur 24 heures, la détection de la fibrillation auriculaire, la saturation en oxygène dans le sang, et h

GateNewsIl y a 32m

OpenAI publie trois modèles vocaux dans l’API en temps réel ; GPT-Realtime-2 affiche une fenêtre de contexte de 128K

D'après Beating, OpenAI a publié trois modèles vocaux dans son API Realtime : GPT-Realtime-2 pour les conversations vocales avec raisonnement, GPT-Realtime-Translate pour la traduction en temps réel, et GPT-Realtime-Whisper pour la transcription en continu. GPT-Realtime-2 est le premier modèle vocal d'OpenAI avec un niveau de GPT-5 re

GateNewsIl y a 48m
Commentaire
0/400
Aucun commentaire