Google publie son modèle d'IA le plus puissant, Gemini 3—Voici ce que vous devez savoir

2025-11-18 18:03:00

Le hub de l'art, de la mode et du divertissement de Decrypt.

Découvrez SCENE

Google a lancé Gemini 3 Pro en avant-première publique aujourd'hui, le qualifiant de modèle d'IA le plus performant de l'entreprise à ce jour. Le système gère simultanément du texte, des images, de l'audio et de la vidéo tout en traitant jusqu'à 1 million de jetons de contexte—environ l'équivalent de 700 000 mots, ou environ 10 romans complets.

Le modèle de prévisualisation est disponible gratuitement pour que tout le monde puisse l'essayer ici.

Google a déclaré que le modèle a surpassé son prédécesseur, Gemini 2.5 Pro, dans presque tous les critères que l'entreprise a testés. Lors du Dernier Examen de l'Humanité, un test de raisonnement académique, Gemini 3 Pro a obtenu 37,5 % contre 21,6 % pour 2.5 Pro. Sur ARC-AGI-2, un benchmark de puzzle de raisonnement visuel, l'écart s'est encore élargi : 31,1 % contre 4,9 %.

Bien sûr, le véritable défi à ce stade de la course à l'IA n'est pas tant technique qu'il s'agit de gagner des parts de marché commerciales.

Google, qui semblait autrefois indomptable dans le domaine de la recherche, a cédé une énorme part de marché à OpenAI, qui revendique environ 800 millions d'utilisateurs hebdomadaires pour ChatGPT contre Gemini, qui aurait environ 650 millions d'utilisateurs mensuels. Google n'a pas précisé combien d'utilisateurs hebdomadaires il a, mais cela serait bien inférieur à son nombre mensuel.

Néanmoins, les réalisations techniques de Gemini 3 sont impressionnantes.

Présentation de Gemini 3 — notre modèle le plus intelligent qui vous aide à concrétiser n'importe quelle idée.

Gemini 3 est notre prochaine étape sur le chemin vers l'AGI et a :

🧠 Raisonnement à la pointe de la technologie

🖼️ Compréhension multimodale approfondie

💻 Un codage puissant pour que vous puissiez passer de l'invite à l'application en un seul coup… pic.twitter.com/zG8r95pGcS

— Google (@Google) 18 novembre 2025

Gemini 3 Pro utilise ce que Google appelle une architecture de mélange d'experts sparses. Au lieu d'activer tous les paramètres de plus d'un trillion pour chaque requête, le système achemine chaque entrée vers des sous-réseaux spécialisés. Seule une fraction du modèle - l'expert de cette tâche spécifique - fonctionne à un moment donné, réduisant les coûts de calcul tout en maintenant la performance.

Contrairement à GPT et Claude, qui sont des modèles grands et denses (un homme à tout faire), l'approche de Google fonctionne comme une grande organisation. Une entreprise de 1 000 employés n'appelle pas tout le monde à chaque réunion ; des équipes spécifiques traitent des problèmes spécifiques. Gemini 3 Pro fonctionne de la même manière, dirigeant les questions vers les bons réseaux d'experts.

Google a formé le modèle sur des documents web, des dépôts de code, des images, des fichiers audio et des vidéos, en plus des données synthétiques générées par d'autres systèmes d'IA. L'entreprise a filtré les données d'entraînement pour la qualité et la sécurité, en supprimant le contenu pornographique, le matériel violent et tout ce qui enfreint les lois sur la sécurité des enfants. L'entraînement s'est déroulé sur les unités de traitement tensoriel de Google en utilisant JAX et le logiciel ML Pathways.

Un test rapide du modèle a montré qu'il était très performant. Dans notre test de codage habituel demandant de générer un jeu furtif, c'était le premier modèle à générer un jeu en 3D au lieu d'une expérience en 2D. D'autres essais ont fourni des versions en 2D, mais toutes étaient fonctionnelles et rapides.

Cette approche suit le style de ChatGPT ou Perplexity qui encouragent des interactions supplémentaires en partageant des questions de suivi et des suggestions, mais l'implémentation de Google est beaucoup plus claire et utile.

Lors de la génération de code, l'interface fournit des conseils pour aider dans les invites suivantes, afin que l'utilisateur puisse orienter le modèle vers la génération d'un meilleur code, corriger des bugs et améliorer la logique de l'application, l'interface utilisateur, etc. Elle offre également aux utilisateurs la possibilité de déployer leur code et des applications alimentées par Gemini.

Dans l'ensemble, ce modèle semble être particulièrement axé sur les tâches de codage. La créativité n'est pas son point fort, mais il peut être facile à guider avec un bon système de prompt et des exemples, car il dispose d'une très grande fenêtre de contexte de tokens.

Une version archivée de la carte du modèle de Gemini 3—un document qui fournit des informations essentielles sur la conception du modèle, son utilisation prévue, ses performances et ses limitations—publiée par Google DeepMind montre que Gemini 3 Pro peut générer jusqu'à 64 000 tokens de sortie et maintient une date limite de connaissance de janvier 2025. Google a reconnu que le modèle peut halluciner et connaît parfois des lenteurs ou des délais d'attente.

Une carte modèle officielle n'est pas actuellement disponible.

Comme mentionné, Google AI Studio offre actuellement à tout le monde un accès gratuit à Gemini 3 Pro. Vertex AI et l'API Gemini prennent également en charge le modèle. Gemini 3 Pro n'est pas encore disponible via l'application Gemini, cependant—pas même pour les abonnés payants de Gemini Pro.

La sortie de novembre positionne Google contre Claude Sonnet 4.5 d'Anthropic, Grok 4.1 et même GPT-5.1 d'OpenAI. Les scores de référence suggèrent que Gemini 3 Pro est en tête en matière de raisonnement et de tâches multimodales, bien que la performance dans le monde réel varie selon le cas d'utilisation.

Google a distribué Gemini 3 Pro via ses plateformes cloud sous réserve des conditions de service existantes. La politique de l'entreprise sur l'utilisation interdite de l'IA générative s'applique, bloquant l'utilisation dans des activités dangereuses, des compromissions de sécurité, du contenu sexuellement explicite, de la violence, des discours de haine et de la désinformation.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.