KI-Antwort-Engine wird kollektiv kontaminiert: Bei den richtigen Antworten von Gemini 3 haben 56% keine Quellenunterstützung

ChainNewsAbmedia

Laut dem ausführlichen Analyseartikel des Autors Pedro Dias, der am 21. April 2026 in The Inference veröffentlicht wurde, ist der Zusammenbruch von KI-Modellen (model collapse) nicht die „zukünftige Bedrohung“, um die sich die Branche sorgt – er geschieht bereits jetzt in einer anderen Form: KI-Antwortmaschinen zitieren bei der Abfrage unmittelbar Webseiteninhalte, die von anderen KI-Systemen generiert wurden, als maßgebliche Quellen, ohne dass der gesamte Verunreinigungskreislauf eine erneute Modell-Neutrainierung durchlaufen muss. Diese Argumentation wird als zentrale Metapher mit der „Schlange, die sich selbst an ihrem Schwanz bindet (Ouroboros), hat gelernt, sich selbst zu zitieren“ beschrieben.

Die wichtigsten Unterschiede zwischen Model Collapse und Retrieval Contamination

Die traditionelle Sorge um die Verschlechterung von KI-Modellen dreht sich um model collapse: Syntheseinhalte verunreinigen schrittweise Trainingsdaten, und die Qualität zukünftiger Generationen von Modellen sinkt. Das ist ein Risiko, das schleichend ist und erst nach mehreren Wiederholungsrunden beim Retraining sichtbar wird.

Die Warnung, die Pedro Dias formuliert, betrachtet eine andere Ebene: retrieval contamination (Retrieval-Verunreinigung). Antwortmaschinen auf Basis von RAG (retrieval-augmented generation) wie Perplexity, Google AI Overviews, ChatGPT, Grok usw. greifen zum Zeitpunkt der Fragen durch Nutzer sofort Webseiteninhalte ab und verwenden sie als Grundlage für die Antworten. Wenn die abgegriffenen Webseiten selbst fehlerhafte Inhalte sind, die von KI generiert wurden, stellt die Engine sie den Lesern als Tatsachen dar – und diese Verunreinigung wirkt sofort, ohne dass es irgendein Neutrenning geben müsste.

Drei echte Fallbeispiele: KI-Engines werden von erfundenen Fehlinformationen getäuscht, die sie selbst generiert haben

Der Autor führt drei konkrete Ereignisse an:

  1. Lily-Ray-Ereignis: Perplexity zitierte einmal ein angebliches Google-Algorithmus-Update namens „September 2025 Perspective Core Algorithm Update“ als maßgebliche Information – dieses Update existiert überhaupt nicht, die Quelle war ein von KI generierter SEO-Blog-Fehltext.

  2. Thomas Germain im Selbsttest: Der Journalist Thomas Germain veröffentlichte einen Testblog „der stärkste Tech-Reporter, wenn man Hot Dogs isst“, und innerhalb von 24 Stunden wurde er von Google AI Overviews und ChatGPT auf den ersten Platz gesetzt und zitiert; außerdem erfand er noch einen nicht existierenden „Stanford-Tabasko-Meisterschaftswettbewerb“ als Beleg.

  3. Grokipedia: Das von Musk unter xAI betriebene Wikipedia-Projekt hat bereits oder umgeschrieben 885,279 Artikel, einschließlich falscher Fakten (z. B. dass das Sterbedatum des Vaters des kanadischen Sängers Feist falsch ist) und unbelegte Zitate. Grokipedia hatte Mitte Februar 2026 bei Google bereits den Großteil seiner Sichtbarkeit verloren.

Oumi-Studie: Gemini 3 hat eine hohe Trefferquote, aber 56% ohne Quelle

Die von NYT beauftragte Bewertung durch Oumi: Gemini 2 erreicht eine Trefferquote von 85% im SimpleQA-Benchmark, Gemini 3 steigert sich auf 91%. Doch derselbe Test zeigt, dass bei den richtigen Antworten von Gemini 3 56% „ungrounded“ sind – das Modell liegt richtig in der Antwort, aber es gibt keine verifizierbare Unterstützung durch eine Quelle; bei Gemini 2 liegt dieser Anteil bei 37%.

Das bedeutet: Neue Generationen von Modellen sind in der Antwort „formell genauer“, gehen aber gleichzeitig beim „Nachweis der Quellen der Antwort“ zurück. In Szenarien wie Medien, Forschung, Fact-Checking usw. ist dieser Rückschritt weitaus tödlicher als eine reine Fehlerquote, weil Leser nicht bis zur ursprünglichen maßgeblichen Dokumentation zurückverfolgen können, um sich selbst zu vergewissern.

Größenordnung der Branche: Google AI Overviews erreicht 2 Milliarden Nutzer

Die Größenordnung dieses Verunreinigungsproblems: Google AI Overviews hat mehr als 2 Milliarden monatlich aktive Nutzer, die jährliche Google-Suchanfrage übersteigt 5 Billionen Mal, und ChatGPT hat eine wöchentliche aktive Reichweite von knapp 900 Millionen (50 Millionen bezahlt). Das heißt, für den weitaus größten Teil der Internetnutzer sind die Kanäle, über die sie Faktinformationen erhalten, bereits durch die „Antwortmaschinen-Schicht“ gegangen, in der „möglicherweise durch KI-generierte Inhalte verunreinigt“ werden kann.

Eine weitere Studie von Ahrefs zeigt, dass unter den von ChatGPT zitierten Quellen 44% „best X“-Listenartikel sind – genau diese Art von Beiträgen wird in großer Menge von der SEO-Branche produziert, um den durch Antwortmaschinen abfließenden Traffic abzufedern, und bildet damit zufällig auch die wichtigsten Hauptquellen für die Verunreinigung durch Antwortmaschinen.

Strukturelles Fazit: Die Zitier-Ebene ist von verlässlicher Autorenidentität entkoppelt

Die abschließende Schlussfolgerung des Autors: Die Zitier-Ebene von KI-Antwortmaschinen ist bereits von der verlässlichen Autorenidentität entkoppelt. Die SEO-Branche produziert KI-Inhalte → die Antwortmaschinen greifen sie als Tatsachen auf → Leser glauben daran → die SEO-Branche erhält Anreize, mehr KI-Inhalte zu produzieren, wodurch ein sich selbst verstärkender Verunreinigungskreislauf entsteht. Aktuell gibt es in der gesamten Branche keinen klaren Mechanismus zur Rechenschaft, der dafür sorgt, dass die KI-Engines die Qualität der von ihnen zitierten Quellen verantworten.

Für Nutzer bedeutet das: In der aktuellen Phase dürfen Perplexity, AI Overviews und ChatGPT-Antworten nicht als Endpunkt für Fact-Checking betrachtet werden; es braucht weiterhin die manuelle Rückverfolgung auf die offiziellen Erstquellen, um die Genauigkeit sicherzustellen.

Dieser Artikel „KI-Antwortmaschinen kollektive Verunreinigung: 56% der richtigen Antworten von Gemini 3 ohne Quellenunterstützung“ erschien erstmals auf Lianxin ABMedia.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare