
Im Dezember 2020 erhielt Timnit Gebru (ehemalige Co-Leiterin des Google-Teams für Ethik und KI) während ihres Urlaubs eine E-Mail, in der ihr mitgeteilt wurde, dass sie von Google entlassen wurde; der Auslöser war, dass Google verlangte, sie solle eine Mitarbeiter-Name-auf-Publikation zurückziehen oder entfernen, sie jedoch ablehnte. Die in der Arbeit beschriebenen Halluzinationen und das fehlende Verständnis, die Verzerrungsverstärkung, die Umweltskosten, die nicht überprüfbaren Trainingsdaten sowie die sprachliche Zentrierung — all diese Punkte fanden sich fünf Jahre später in der Realität wieder.
Halluzinationen und fehlendes Verständnis: In der Arbeit von 2021 wurde das Phänomen beschrieben, das später als „Halluzinationen“ bezeichnet wurde: LLM würden nur sprachliche Formen anhand von Wahrscheinlichkeiten zusammensetzen, „ohne irgendeinen Bezug zu Bedeutung“. Dieses Problem gilt heute als bekannter Mangel aller gängigen KI-Systeme und wurde in mehreren unabhängigen wissenschaftlichen Auswertungen bestätigt.
Verzerrungsverstärkung: Amazons ab 2014 entwickeltes KI-Rekrutierungstool wurde 2018 wegen systematischer Diskriminierung von Bewerberinnen abgeschaltet; das Modell hatte daraus Verzerrungen gegenüber Männern gelernt, indem es sich an historischen Lebensläufen orientierte, in denen mehrheitlich Männer standen. Obermeyer et al. veröffentlichten 2019 in „Science“ eine Studie, die aufdeckte, dass ein weit verbreiteter medizinischer Risiko-Algorithmus „medizinische Kosten“ anstelle der „Schwere der Erkrankung“ als Stellgröße nutzte — was bei gleichen Risikowerten dazu führte, dass schwarze Patienten tatsächlich schwerer erkrankt waren; die Studie bestätigte, dass der Anteil der als zusätzlichen Betreuungsbedarf eingestuften schwarzen Patienten nach der Korrektur von 17,7% auf 46,5% steigen würde.
Umweltskosten: Googles Umweltbericht 2024 enthüllt, dass die Treibhausgasemissionen im Jahr 2023 bei rund 14,30 Millionen Tonnen CO₂e lagen, also 48% über der Basis von 2019. Google bestätigte als Hauptgrund den starken Anstieg des Stromverbrauchs von durch KI befeuerten Rechenzentren, was die von Google ursprünglich für 2030 geplanten Klimaneutralitätsziele direkt bedroht.
Nicht überprüfbare Trainingsdaten: Im Dezember 2023 fand der Stanford Internet Observatory in dem LAION-5B-Datensatz (mit 5,85 Milliarden Bild-Text-Paaren, der zuvor zum Training von Stable Diffusion genutzt wurde) 3.226 mutmaßliche Inhalte zu sexualisierter Gewalt an Kindern (CSAM), davon 1.008, die von externen Organisationen bestätigt wurden; LAION-5B wurde daraufhin entfernt.
Sprachliche Zentrierung: Eine Studie von Thompson et al. aus dem Jahr 2024 analysierte einen Web-Korpus aus 6,38 Milliarden Sätzen und stellte fest, dass 57,1% der Sätze zu mehrsprachigen parallelen Sammlungen gehören, was sehr wahrscheinlich zu niedrigwertigen, stark wiederholten Inhalten führt, die durch maschinelle Übersetzung erzeugt wurden; außerdem ist dieser Anteil in Sprachen mit geringer Ressourcenausstattung besonders hoch — was bedeutet, dass die Korpora in diesen Sprachen durch minderwertige Erzeugnisse der maschinellen Übersetzung verschmutzt werden.
Die Arbeit hat insgesamt sechs Autorinnen und Autoren; vier davon sind Google-Mitarbeiter. Als Gebru die Entlassungsbenachrichtigung erhielt, befand sie sich im Urlaub; Googles Forderung war, die Mitarbeiter-Namensnennung zurückzuziehen oder zu entfernen. Nachdem Gebru abgelehnt hatte, wurde ihr im Urlaub die Entlassungsentscheidung mitgeteilt.
Die Arbeit wurde im März 2021 offiziell veröffentlicht. Die Arbeit stellt ausdrücklich fest: Die Unternehmen, die LLM bauen, können aufgrund ihrer strukturellen finanziellen und Wettbewerbsvorteile „Sicherheit und Ethik“ nicht dazu bringen, das Tempo der Produkteinführung auszubremsen. Das Ereignis, das zur Entlassung von Gebru führte, wurde vielfach als konkrete Bestätigung dieses strukturellen Arguments zitiert.
Laut der Arbeit selbst gibt es zwei Ebenen: Die erste Ebene ist technisch: Sie zeigt, dass LLM fünf Arten systematischer Risiken aufweisen — Halluzinationen, Verzerrungsverstärkung, Umweltskosten, nicht überprüfbare Daten und sprachliche Zentrierung. Die zweite Ebene ist grundlegender: Sie zeigt, warum diese fünf Risiken schwer zu lösen sind — weil die Unternehmen, die LLM entwickeln, unter Wettbewerbs- und Finanzdruck strukturell dazu tendieren, dass Tempo Vorrang vor Sicherheit erhält. Die Arbeit wurde im Peer-Review-Prozess auf der ACM FAccT-Tagung durch die akademische Begutachtung getragen.
Laut öffentlich zugänglichen Berichten wurde Amazons KI-Rekrutierungstool seit 2014 entwickelt; das Modell wurde anhand von historischen Lebenslaufdaten trainiert, die über die vergangenen zehn Jahre hinweg mehrheitlich von Männern geprägt waren, und hat dadurch automatisch Bewertungsmuster gelernt, die Männer bevorzugen. Das führte dazu, dass Lebensläufe mit Begriffen wie „women's chess club“ automatisch Punkte verloren. Dieses Bias-Problem wurde 2018 entdeckt; Amazon stellte daraufhin das Tool außer Betrieb und bestätigte, dass es nicht zur Bewertung echter Bewerberinnen und Bewerber eingesetzt wurde.
Laut Googles Umweltbericht 2024 erreichen die Treibhausgasemissionen 2023 rund 14,30 Millionen Tonnen CO₂e, also 48% mehr als die Basis von 2019. Google nennt eindeutig als Hauptgrund, dass der Betrieb von Rechenzentren, die durch KI angetrieben werden, stark gewachsen ist. Googles Erklärung macht jedoch nicht den Anspruch, dass die Emissionszunahme zu 100% durch KI verursacht wurde; bestätigt wird vielmehr, dass die Expansion der KI-Infrastruktur der wichtigste Treiber für die Zunahme ist.
Related News
Meta-Aktie fällt um über 5% nach einem Bericht über möglichen KI-Finanzierungs-Deal mit geplanntem Aktienverkauf
Anthropic fordert globale KI-Verlangsamung angesichts des Risikos rekursiver Selbsterweiterung
Broadcom bricht um 12% ein und löst einen Verkaufsdruck bei KI-Aktien aus! Der taiwanesische Aktienmarkt stürzt um tausend Punkte ab, während Bitcoin zeitweise die Marke von 63.000 US-Dollar unterschreitet.
Der CEO von Google DeepMind sagt in einem Vortrag an der Stanford University die Ankunft von AGI bis 2030 voraus
Die KI-Kostenkrise befeuert neue Vergleiche mit der frischen Dot-Com-Blase