En 2026, la gamme de produits d’OpenAI, autrefois centrée sur un seul ChatGPT, s’est étendue à 7 axes : modèles de langage (série GPT-5.5), agent de programmation (Codex), génération vidéo (Sora 2), agent navigateur (Operator), génération d’images (gpt-image-1), reconnaissance vocale (Whisper), intégrations vectorielles (Embeddings). Cet article récapitule, pour chaque axe produit, son positionnement, ses tarifs, ses cas d’usage et la correspondance avec les niveaux d’abonnement — pour que vous n’ayez pas besoin de lire chaque document officiel d’OpenAI et que vous sachiez en 5 minutes combien vous devrez payer et ce que vous pourrez faire.
Tableau récapitulatif de la gamme OpenAI (mise à jour mai 2026)
Produit Type Cas d’usage Méthode d’obtention Série GPT-5.5 Modèles de langage Écriture, recherche, programmation, raisonnement ChatGPT App, API Codex Agent de programmation Écrire du code, modifier un codebase, exécuter des commandes shell Codex App (desktop), CLI, intégration IDE Sora 2 Génération vidéo Courts métrages, publicités, contenus visuels Site Sora, intégration à ChatGPT Operator Agent navigateur Agir sur des pages web à votre place, réservation, achats, formulaires ChatGPT Pro intégré gpt-image-1 Génération d’images Photos de produit, illustrations, contenus pour réseaux sociaux ChatGPT intégré, API Whisper Reconnaissance vocale Transcription de réunions, sous-titres, saisie vocale API (facturée à la minute) Embeddings Intégrations vectorielles RAG (recherche), recherche sémantique, calcul de similarité API (facturée au token)
Série GPT-5.5 : le modèle de langage principal d’OpenAI
GPT-5.5 est le modèle phare actuel lancé par OpenAI le 24 avril 2026. La série est divisée en trois niveaux :
GPT-5.5 : version standard, incluse par défaut dans l’abonnement ChatGPT Plus, API ouverte
GPT-5.5 Pro : version premium, exclusive à ChatGPT Pro (200 $/mois), plus performante que la 5.5 sur les tâches de raisonnement complexes
GPT-5.5-mini : version économique, utilisée quand vous exécutez beaucoup de tâches via l’API
Principales améliorations de GPT-5.5 : le context passe de 200K à 1M token, la précision d’utilisation des outils pour les tâches d’agent s’améliore, Terminal-Bench atteint 82,7 % (la référence la plus forte d’OpenAI pour les tâches d’agent). Voir le reportage de lancement GPT-5.5 sur abmedia.
Il existe aussi GPT-5.4-Cyber (version dédiée à la cybersécurité, limitée aux défenseurs certifiés), et les anciens GPT-4o et GPT-4 Turbo restent disponibles via l’API pour les choisir, mais ils ne sont plus le choix par défaut. Pour de nouveaux projets, utilisez directement la série 5.5, sans conserver les versions plus anciennes.
Codex : l’agent de programmation d’OpenAI
Codex est un agent de programmation créé par OpenAI pour les développeurs, dont la position est similaire à celle de Claude Code d’Anthropic. Il peut lire et écrire directement des fichiers locaux, exécuter des commandes shell, s’interfacer avec GitHub pour des PR, et traiter des tâches de refactorisation de code en plusieurs étapes.
Méthodes d’obtention de Codex :
Codex App desktop : macOS/Windows, avec une interface graphique et plusieurs sessions côte à côte
Codex CLI : version pour terminal, pouvant s’intégrer à des scripts shell
Intégration IDE : sous forme d’extension dans VS Code, ou les suites JetBrains
Données de mai 2026 publiées pour Codex : au cours de la première semaine, la croissance des revenus via l’API a doublé, et c’est l’axe produit à la croissance la plus rapide chez OpenAI (voir l’article du 2/5). Les mises à jour récentes incluent « Codex Pets » (affichage de sprite personnalisé sur le bureau, n’affecte pas le travail mais augmente l’immersion), corrections de comportements pour Goblin, et gestion multi-sessions côté entreprise. Voir le guide complet OpenAI Codex pillar.
Sora 2 : le modèle de génération vidéo d’OpenAI
Sora 2 est un modèle de génération vidéo lancé par OpenAI au cours du second semestre 2025, et qui a été déployé de façon stable en 2026 auprès des abonnés ChatGPT Plus et Pro. Il permet de générer des courts métrages haute résolution de 5 à 60 secondes à partir de descriptions textuelles, avec prise en charge des mouvements de personnages, des changements de scènes et du contrôle des mouvements de caméra.
Accès à Sora 2 :
Site dédié Sora : sora.openai.com, avec une interface de génération complète et une bibliothèque de contenus
Intégration à ChatGPT : générer directement une vidéo en parlant via un prompt dans une conversation ChatGPT
API : facturée selon le nombre de secondes générées et la résolution (détails dans l’annonce d’OpenAI)
En pratique, l’avantage de Sora 2 est une excellente compréhension des instructions « texte vers vidéo ». Sur les scènes complexes (plusieurs personnages, bascules intérieur/extérieur, mouvements de caméra spécifiques), la précision de génération est nettement supérieure à celle du Sora original. Ses limites : la cohérence des personnages sur les longues vidéos (plus de 60 secondes) et les interactions physiques complexes présentent encore parfois des failles. Scénarios fréquents des utilisateurs à Taïwan : courts métrages marketing sur les réseaux, démonstrations de produits, images de base pour des animations explicatives.
Operator : l’agent navigateur d’OpenAI
Operator est un agent proposé par OpenAI pour l’automatisation du navigateur : l’utilisateur peut donner des instructions pour que Operator ouvre des pages web, remplisse des formulaires, fasse des réservations, réalise des achats, récupère des données et effectue les traitements suivants. Operator est inclus dans l’offre ChatGPT Pro (200 $/mois) ; les utilisateurs Plus n’ont pas encore accès.
Usages typiques :
« Réserve-moi un restaurant français à Taipei Xinyi, mercredi prochain à 19 h » → Operator ouvre le navigateur pour chercher, évaluer, appeler ou réserver
« Compare le prix pour 5 nuits d’ici le mois prochain dans ces 3 hôtels et dresse un tableau » → Operator ouvre Booking, Agoda et vérifie chaque site officiel
« Sur AWS, modifie ces réglages de bucket S3 pour n’autoriser que des IP spécifiques » → Operator exécute ça dans la console de contrôle
Différence entre Operator et Codex : Codex opère sur le code et les fichiers, tandis qu’Operator opère sur les « pages web et formulaires ». Pour les non-développeurs, Operator est un choix d’automatisation plus intuitif ; pour les développeurs, Codex reste la référence pour écrire du code.
gpt-image-1, Whisper, Embeddings : outils API
En plus des produits côté consommateur, OpenAI propose aussi trois outils API pour les développeurs :
gpt-image-1 — modèle de génération d’images de 2026, remplace DALL-E 3 et devient le pilier d’OpenAI. Peut générer plusieurs tailles comme 1024×1024, 1024×1792, 1536×1024, avec une qualité et une cohérence supérieures à DALL-E 3. Appel direct dans les conversations ChatGPT, et sur l’API, facturation selon le nombre d’images générées. La prochaine génération gpt-image-2 sort en avril 2026 : elle nécessitera une vérification de l’organisation OpenAI pour l’utiliser via l’API ; la version intégrée à ChatGPT sera directement disponible pour les abonnés.
Whisper — modèle de reconnaissance vocale, supporte plusieurs langues (y compris le chinois traditionnel, avec accent taïwanais), et est facturé à la minute d’audio. Cas d’usage concrets : transcription automatique de réunions, sous-titres de podcasts, outils de saisie Voice-to-text. Whisper est le seul produit d’OpenAI rendant publics des poids de modèle téléchargeables pour une utilisation en self-hosted ; toutefois, l’API cloud donne généralement de meilleurs résultats, avec en plus des mises à jour automatiques.
Embeddings — modèle d’intégration vectorielle, transforme le texte en vecteurs de grande dimension pour le RAG (recherche augmentée), la recherche sémantique et la comparaison de similarité de documents. Les principaux endpoints actuels d’OpenAI sont text-embedding-3-large et text-embedding-3-small. Pour les développeurs qui doivent construire une base de connaissances interne à l’entreprise, un système de FAQ pour le support client, ou classer des documents, Embeddings constitue l’infrastructure de base.
Niveaux d’abonnement OpenAI : quels forfaits donnent accès à quels produits
Forfait Prix mensuel Principales différences Free 0 GPT-5.5 limité, sans Sora/Operator/Codex Pro Plus 20 GPT-5.5 complet, Sora 2, gpt-image-1, et quotas standards de Codex Pro 200 GPT-5.5 Pro, Operator, quotas élevés de Codex, calcul prioritaire Team 25/par utilisateur Collaboration entreprise, base de connaissances d’équipe, garantie de non-entraîner les modèles Enterprise Négociation sur les prix SSO, SOC 2, personnalisation contractuelle, sans limites
Pour les utilisateurs individuels, avec 20 $ Plus, la plupart des scénarios sont couverts : seuls les utilisateurs intensifs d’Operator et de Codex, ou les développeurs qui ont besoin de GPT-5.5 Pro, doivent passer à 200 $ Pro. Pour les équipes ou entreprises, la garantie « les données ne servent pas à entraîner les modèles » du forfait Team est une condition nécessaire dans de nombreux contextes de conformité.
FAQ
OpenAI faut-il obligatoirement s’abonner ? Que peut-on faire gratuitement ?
Pas nécessairement. La version gratuite permet d’utiliser GPT-5.5 (avec des limites), une génération d’images basique et la saisie vocale. En revanche, Sora, Operator, les fonctions avancées de Codex et GPT-5.5 Pro requièrent un abonnement. Pour la plupart des utilisateurs, Plus à 20 $ suffit.
ChatGPT Pro à 200 $ : ça vaut le coup ?
Ça dépend de votre usage : si vous écrivez beaucoup de code chaque jour (usage intensif de Codex), si vous avez besoin du meilleur raisonnement offert par GPT-5.5 Pro, ou si vous avez besoin d’Operator pour automatiser le travail web — oui, ça vaut le coup. Pour une utilisation classique d’écriture et de recherche, ou pour consulter des informations, les utilisateurs peuvent rester sur Plus à 20 $.
API OpenAI vs abonnement ChatGPT : lequel revient le moins cher ?
L’API est facturée au token, adaptée aux développeurs qui veulent intégrer OpenAI à leurs propres programmes. L’abonnement ChatGPT est « illimité » chaque mois (avec limites d’usage), adapté aux utilisateurs qui veulent travailler via une interface de conversation. Beaucoup de personnes ont les deux : abonnement pour parler avec ChatGPT, puis API pour brancher OpenAI à leurs outils.
Sora 2 est-il utilisable à Taïwan ?
Oui. OpenAI n’a pas de restrictions par région à Taïwan, et le paiement prend en charge les cartes de crédit. Sora 2 est disponible sur ChatGPT Plus et Pro.
Qu’est-ce qui est le mieux : OpenAI Codex ou Anthropic Claude Code ?
Les deux ont leurs points forts. Codex s’intègre davantage avec l’écosystème d’OpenAI (Sora, gpt-image-1, Operator) ; Claude Code, de son côté, avec CLI/desktop multi-sessions et un respect strict des instructions, est souvent choisi par les développeurs comme option n° 1. Si le budget le permet, vous pouvez tester les deux pendant un mois et voir lequel correspond le mieux à votre flux de travail. Voir la comparaison complète ChatGPT vs Claude vs Gemini.
En quoi l’Operator d’OpenAI diffère-t-il des agents d’Anthropic ?
Operator se concentre sur l’opération du navigateur (pages web, formulaires, réservations) ; l’objectif est de remplacer le travail consistant à « s’asseoir devant l’ordinateur et cliquer ». Chez Anthropic, la direction des agents est Claude Code et Mythos : le premier opère sur le code et les fichiers, tandis que le second est un agent de recherche automatisée à un stade de preview. Les deux approches divergent, et le choix dépend du contexte de votre travail.
Cet article « Gamme complète OpenAI 2026 : comment choisir GPT-5.5, Codex, Sora, Operator, et les forfaits d’abonnement » est apparu pour la première fois sur la chaîne d’actualités ABMedia.