Google lance Gemini Omni Flash : édition vidéo conversationnelle, intégrée à YouTube Shorts et Google Flow

GOOGLX-0,11%

Gemini Omni Flash

Google a annoncé le lancement de la première gamme de produits Gemini Omni lors de Google I/O 2026 le 19 mai : Gemini Omni Flash, puis a publié officiellement une fiche technique sur son site officiel le 22 mai. Les plateformes intégrées dès le départ incluent l’application Gemini, Google Flow et YouTube Shorts.

Fonctions principales de Gemini Omni Flash déjà confirmées

Édition vidéo conversationnelle : les utilisateurs éditent des vidéos via des instructions en langage naturel. Chaque instruction s’exécute en s’ajoutant aux actions de la précédente ; le modèle maintient la cohérence des rôles, des effets physiques fiables et la mémoire du scénario. Il prend en charge la modification du fond, du style, de l’angle ou de détails précis, sans avoir à régénérer l’intégralité de la séquence.

Simulation d’un moteur physique avancé : la compréhension intuitive renforcée par Omni de la gravité, de la dynamique et de la dynamique des fluides améliore le réalisme des scènes, permettant aux utilisateurs de créer des effets physiques plus précis, comme des scènes dynamiques impliquant des collisions d’objets, l’écoulement de liquides et des réactions en chaîne.

Génération à partir d’entrées multimodales : Omni peut traiter n’importe quelle combinaison d’entrées (images, texte, extraits vidéo, audio) comme une seule instruction afin de générer un contenu de sortie unifié ; au début, l’entrée audio prend en charge la citation vocale, tandis que d’autres types d’entrées audio seront proposés ultérieurement.

Intégration des connaissances et visualisation des concepts : Omni s’inspire de la capacité de Gemini à exploiter des connaissances ancrées dans l’histoire, les sciences et la culture, au-delà d’un simple appariement de modèles. Il peut produire du contenu explicatif à partir d’invites brèves, par exemple expliquer des concepts scientifiques complexes comme le repliement des protéines à l’aide d’une animation en pâte à modeler.

Fonction d’avatar virtuel numérique : les utilisateurs peuvent créer une version numérique incluant leur propre voix, générant des vidéos dont l’apparence et la voix ressemblent à la personne. Les fonctions d’édition audio et de la voix restent en phase de test et ne sont pas encore ouvertes à tous les utilisateurs.

SynthID : filigrane et mécanisme de transparence pour le contenu IA déjà confirmé

Toutes les vidéos créées via Gemini Omni intègrent automatiquement un filigrane numérique SynthID. Il s’agit d’une technologie de filigrane invisible développée par Google DeepMind ; l’insertion ne nuit pas à la qualité visuelle des vidéos. Les utilisateurs peuvent vérifier si une vidéo a été générée par Gemini Omni via trois canaux déjà confirmés : l’application Gemini, Gemini dans le navigateur Chrome, et Google Search. Google indique que l’outil de vérification de SynthID est conçu pour aider les utilisateurs à comprendre comment les contenus en ligne sont créés et modifiés, dans le cadre de sa politique de développement responsable de l’IA.

Canaux d’accès déjà confirmés et calendrier de déploiement

Disponible immédiatement : utilisateurs des abonnements payants Google AI Plus, Pro et Ultra, via l’application Gemini et Google Flow

D’ici cette semaine : utilisateurs des applications YouTube Shorts et YouTube Create, gratuitement

Dans les prochaines semaines : développeurs et clients entreprises, via Gemini API et Agent Platform API

Questions fréquentes

En quoi le « modèle du monde » de Gemini Omni Flash se différencie-t-il des modèles de génération vidéo classiques ?

Google positionne Gemini Omni comme un « modèle du monde ». Cela signifie que le modèle ne se contente pas d’exécuter une transformation de génération entrée-sortie à partir des données fournies, mais dispose aussi d’une capacité d’inférence causale fondée sur une base de connaissances du monde réel entraînée avec Gemini (notamment des lois physiques, des contextes culturels, ainsi que des connaissances historiques et scientifiques). Par exemple : prédire les actions à venir d’objets dans une scène, appliquer des effets issus de vrais moteurs physiques, ou transformer des descriptions linguistiques en contenu visuel ayant une signification sémantique. La différence de positionnement par rapport aux modèles de diffusion vidéo conçus uniquement pour l’appariement de motifs est donc d’ordre architectural.

Le filigrane SynthID peut-il être retiré ou contourné ?

La documentation officielle de Google confirme que le filigrane SynthID est invisible (sans impact sur le contenu visuel des vidéos) et est intégré dans la structure numérique de la vidéo, vérifiable via les outils officiels de vérification de Google. Google ne divulgue pas dans ses documents officiels la manière technique précise dont le filigrane est implémenté. À ce jour, aucune évaluation technique indépendante publique n’est enregistrée concernant la fiabilité et la résistance aux altérations de SynthID.

Quels formats d’entrée Gemini Omni Flash prend-il actuellement en charge, et quels types de sorties sera-t-il amené à étendre ?

Entrées déjà confirmées : texte, images fixes, extraits vidéo, audio vocal (au début). Google a confirmé dans son blog officiel que d’autres types d’entrées audio seront ajoutés « rapidement ». Côté sorties, la version actuelle d’Omni Flash se concentre sur la vidéo. Google indique que, dans le futur, la série Omni prendra en charge des modes de sortie image et audio, mais que le calendrier de lancement précis n’est pas confirmé dans la présente annonce.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire