Gate News, 22. April – OpenAI hat am 21. April damit begonnen, ChatGPT Images 2.0 für alle ChatGPT- und Codex-Nutzer auszurollen; zahlende Nutzer können dabei noch fortgeschrittenere Ausgaben erzeugen. Das Unternehmen hat die gpt-image-2-API gestartet, mit Preisen, die sich nach Ausgabequalität und Auflösung richten.
Das neue Modell verbessert das Rendering von kleinem Text und UI-Elementen, unterstützt Schriften einschließlich Japanisch, Koreanisch, Hindi und Bengalisch und befolgt detaillierte Anweisungen noch präziser. Images 2.0 führt „Thinking“-Funktionen ein: Das Modell kann im Web nach Echtzeit-Informationen suchen, mehrere klar unterscheidbare Bilder aus einem einzigen Prompt erzeugen und Ausgaben zur Steigerung von Genauigkeit und Konsistenz verfeinern. Komplexe Generierungen können mehrere Minuten dauern; das Modell hat einen Wissensstand bis Dezember 2025.
OpenAI hat die Architektur des Modells nicht offengelegt. Als Preis-Kontext: Googles Imagen 4 kostet $0.02 bis $0.06 pro Bild, während das Generieren von 10,000 Bildern mit GPT Image 1 Mini im Modus niedriger Qualität etwa $50 kostet – verglichen mit ungefähr $1,670 für eine Ausgabe in hoher Qualität.