ChatGPT-Bilder 2.0 sind da! Die Genauigkeit der Texterzeugung wurde deutlich verbessert, sodass Sie mühelos Marketingplakate erstellen können

ChainNewsAbmedia

OpenAI hat am Dienstag offiziell ChatGPT Images 2.0 veröffentlicht und verbessert nicht nur deutlich die Genauigkeit bei der Texterzeugung, sondern auch die Designästhetik bei Postern und Porträts. Das Modell führt außerdem zum ersten Mal den „Gedankenmodus“ ein, wodurch die Bildgenerierung über die Fähigkeit zur Internetsuche und zum gleichzeitigen Batch-Output mehrerer Bilder verfügt und sich in Richtung umfassender Anwendungsszenarien für den kommerziellen Einsatz bewegt.

(Canva kündigt eine tiefe Integration von Claude an, um KI-Entwürfe in Design-Endprodukte umzuwandeln)

Vom freien Erfinden zum perfekten Menü: KI hat endlich das Buchstabieren gelernt

Rückblick auf vor zwei Jahren: Die Schwächen der KI-Bildgenerierungsmodelle bei der Textausgabe sind praktisch allen bekannt. Sobald im Prompt Textanforderungen enthalten sind, ist das Ergebnis oft von absurden Rechtschreibfehlern oder sogar frei erfundenem Inhalt durchsetzt – besonders stark in nicht-englischen Sprachen wie Chinesisch, Japanisch und Koreanisch.

Eine illustrative Grafik für ein koreanisches Poster aus der offiziellen Ankündigung

Heute kann ChatGPT Images 2.0 bereits ein Werbeplakat erzeugen, das sich direkt für Anbieter verwenden lässt, mit klaren und korrekten Texten. In den letzten Jahren haben Forschende aktiv neue Architekturen wie (Autoregressive Models) erforscht, und deren Funktionslogik, das Textverständnis sowie die Fähigkeiten zur Generierung und Validierung wurden deutlich verbessert.

Gedankenmodus online: Vernetzte Suche und Konstruktionskonsistenz – alles passt

Die zentralste Verbesserung von ChatGPT Images 2.0 ist der „Gedankenmodus (Thinking Capabilities)“. Derzeit ist er für bezahlte Nutzer von ChatGPT Plus, Pro, der Business-Version und der Enterprise-Version verfügbar. Nach dem Aktivieren kann das Modell Informationen in Echtzeit über das Internet durchsuchen, um die Bildgenerierung zu unterstützen. Außerdem kann es passende visuelle Erläuterungsgrafiken auf Grundlage der von den Nutzern hochgeladenen Dateien erstellen und das Bildmaterial vor der offiziellen Ausgabe selbst prüfen sowie optimieren.

Bei der Batch-Generierung kann der Gedankenmodus mit einem einzelnen Prompt maximal acht Bilder auf einmal ausgeben, wobei zwischen den Bildern die konsistente Darstellung von Rollen, die Objektarten und der Gesamteindruck gewahrt bleiben. Das eignet sich für Comic-Storyboard-Aufnahmen, Serien von Bildern und Texten für Social Media, ja sogar für Raumplanungsentwürfe in der Innenraumgestaltung.

Illustrative Grafik für das Comic-Storyboard aus der offiziellen Ankündigung

In Bezug auf die Auflösung unterstützt das neue Modell eine maximale Ausgabe von 2K und bietet zudem neue Seitenverhältnisoptionen von 3:1 bis 1:3, um verschiedene kommerzielle Anforderungen noch besser abzudecken.

Asiatische Sprachen stark optimiert – Nutzer aus Japan, China und Korea freuen sich!

Neben Englisch hat OpenAI besonders betont, dass Images 2.0 bei asiatischen Schriftarten erheblich optimiert wurde, darunter Japanisch, Koreanisch und Chinesisch – mit jeweils klaren Verbesserungen.

Einige Tage zuvor bestätigte auch ein Testartikel, der in chinesischen Tech-Communities viral ging, die Meldung: Mehrere Zhihu-Ersteller führten damals praktische Vergleichstests zwischen GPT-Image-2 und dem Konkurrenzprodukt Google Nano Banana Pro durch. Dabei ging es um unterschiedliche Szenarien wie das Design chinesischer Poster, E-Commerce-Coverbilder, Schnittstellen für Social-Media-Medien sowie datenvisualisierte Diagramme.

Zhihu-Artikel: Tests von GPT-Image 2.0

Die Testergebnisse zeigen, dass GPT-Image-2 bei der Ästhetik der chinesischen Schriftarten, den Layout-Hierarchiestufen und dem gesamten Designgefühl deutlich die Oberhand hat. Die generierten Poster wirken stärker wie echte kommerzielle Materialien, statt wie Vorlagen-Ausgaben mit einem klar erkennbaren „AI-Gefühl“. Der Artikel weist außerdem darauf hin, dass GPT-Image-2 bei der Rekonstruktion von (wie Spielbildschirmen oder Screenshots aus Kommunikationssoftware) und von realistischen Porträtszenen ebenfalls eine höhere Detailgenauigkeit zeigt.

ChatGPT Images 2.0 wird vollständig freigegeben, die API läuft gleichzeitig an

Aktuell wird ChatGPT Images 2.0 ab diesem Dienstag allen Nutzern von ChatGPT und Codex kostenlos für grundlegende Funktionen bereitgestellt; bezahlte Nutzer können dagegen fortgeschrittenere Ausgabeeffekte freischalten. Gleichzeitig öffnet OpenAI auch die GPT-Image-2 API. Die Preisgestaltung richtet sich nach Ausgabequalität und Auflösungsklassen und bietet Unternehmen sowie Entwicklern eine flexible Integration.

Es ist außerdem erwähnenswert, dass die Wissensabschneidefrist des neuen Modells der 12. Monat 2025 ist (2025 年 12 月). Bei Prompt-Anfragen zur Generierung von Bildern mit Bezug zu den neuesten aktuellen Ereignissen kann die Genauigkeit daher möglicherweise eingeschränkt sein. Zudem lässt sich die Generierungszeit komplexer Bildkompositionen nicht so schnell wie bei gewöhnlichen textbasierten Frage-Antworten darstellen, aber sie dauert dennoch nur wenige Minuten.

Dieser Artikel „ChatGPT Images 2.0 ist da! Deutlich höhere Genauigkeit bei der Texterzeugung, ganz leicht Marketingposter erstellen“ erschien zuerst auf „鏈新聞 ABMedia“.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare