OpenAI verfolgt das Goblin-Problem auf ein nerdiges Belohnungssignal für die Persönlichkeit zurück, Goblin-Erwähnungen steigen um 175% in GPT-5.1

Laut OpenAI identifizierte das Unternehmen die wahre Ursache des „Goblin“-Problems, das GPT-Modelle ab GPT-5.1 plagte. Ein Belohnungssignal, das genutzt wurde, um das „Nerdy“-Persönlichkeitsmerkmal zu verstärken, ermutigte Ausgaben mit Verweisen auf Fantasiewesen; 76,2% des Trainingsdatensatzes zeigten diese Verzerrung. Die Persönlichkeit „Nerdy“ machte lediglich 2,5% der ChatGPT-Antworten aus, trug aber zu 66,7% der Goblin-Erwähnungen bei. Die Häufigkeit stieg um 3.881% von GPT-5.2 auf GPT-5.4.

OpenAI entfernte im März die Persönlichkeit „Nerdy“, beseitigte das verzerrte Belohnungssignal und filterte Trainingsdaten. Das Unternehmen fügte zudem Unterdrückungsanweisungen zu den Developer-Prompts von GPT-5.5 in Codex hinzu. Die Untersuchung führte zur Entwicklung neuer Modellverhalten-Audit-Tools.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

OpenAI bringt GPT-5.5-Cyber in den Ring: Wettstreit mit Anthropic Mythos

OpenAI gibt die Einführung von GPT-5.5-Cyber bekannt, das speziell für die Cybersicherheit entwickelt wurde. Es soll innerhalb von „in den nächsten Tagen“ mithilfe eines verlässlichen Zugriffs-Mechanismus im Rahmen von Regierungskooperationen bei wichtigen Verteidigungseinheiten bereitgestellt werden und ist kein offenes Verkaufsangebot. Im Gegensatz zum offenen Pfad von Anthropic Mythos ist das Weiße Haus dagegen, dies auf 70 Unternehmen auszuweiten. Der Preparedness Framework wird als High bewertet (noch nicht critical), während gleichzeitig die Cybersicherheitsmaßnahmen verstärkt werden. Im weiteren Verlauf wird die Einsatzliste beobachtet, ob die CISA möglicherweise aufgenommen wird, und die Unterschiede zwischen den beiden Sicherheitsstandards.

ChainNewsAbmedia33M her

Schneider Electric Umsatz im Q1 erreicht 9,8 Milliarden Euro, dank KI-gestärkter Nachfrage aus Rechenzentren um 11,2% gesteigert

Laut Reuters meldete Schneider Electric am 30. April einen Umsatz im ersten Quartal von 9,8 Milliarden Euro (US$11,4 Milliarden), wobei sich das organische Wachstum dank der Nachfrage nach KI-Rechenzentren auf 11,2% erhöhte. Der französische Anbieter von Energie- und Kühlausrüstung sagte, das Ergebnis liege leicht über den Konsensschätzungen und

GateNews39M her

Protum sichert sich 2 Millionen US-Dollar Seed-Runde für eine KI-Governance-Plattform und peilt einen Abschluss im Juni 2026 an

Laut TechCrunch Startup Spotlight ist Protum, ein Startup für KI-Governance, dabei, eine Seed-Runde in Höhe von 2 Millionen US-Dollar aufzunehmen, die bis Juni 2026 abgeschlossen sein soll. Gegründet von Sandeep J., der 25 Jahre Erfahrung in der Transformation von Unternehmen mitbringt, bietet Protum eine Plattform, die darauf ausgelegt ist, Unternehmen kontinuierlich

GateNews1Std her

Ein Abschwung bei Entlassungen in Unternehmen könnte zu einer beidseitig verlierenden Situation für Arbeitgeber und Beschäftigte führen. Eine Studie empfiehlt: eine Steuer auf KI-Automatisierung einzuführen.

Studien zeigen die Externalitäten von KI-bedingten Entlassungen: Die Kosten der Entlassungen tragen die Unternehmen allein, der Verlust an Kaufkraft jedoch wird vom gesamten Markt getragen. Je mehr entlassen wird, desto schwächer wird die Nachfrage – beide Seiten verlieren. Es wird vorgeschlagen, eine KI-Automatisierungssteuer zu erheben, um die externen Kosten zu internalisieren, und die Einnahmen zur Umschulung zu verwenden, um die Nachfrage wiederzubeleben und die Wirtschaft zu stabilisieren.

ChainNewsAbmedia1Std her

Claude erhebt eine Sprachsteuer? Studie zeigt: Übersetzungen von Inhalten aus dem Chinesischen, Japanischen und Koreanischen verbrauchen in den letzten drei Jahren fast dreimal so viele Token

Der Forscher Komatsuzaki wies auf X darauf hin, dass Tokenizer gängiger LLMs eine Sprachsteuer für nicht-englische Sprachen darstellen. In einem Übersetzungstest von 《The Bitter Lesson》 zeigte Claude bei Hindi, Arabisch, Russisch und Chinesisch jeweils etwa 3,24×, 2,86×, 2,04× und 1,71× mehr Tokens, deutlich mehr als bei OpenAI. Chinesische lokale Modelle sind für Chinesisch deutlich freundlicher, was darauf hindeutet, dass die Trainingsdaten unausgewogen zugunsten des Englischen ausfallen und so zu ungleichen Kosten führen, wodurch sich die Verbreitung zu einer Hürde entwickelt.

ChainNewsAbmedia1Std her

Microsofts KI-Geschäft verdoppelt sich auf $370B -Einnahmen; plant $190B -Capex für 2026

Am 29. April meldete Microsoft die Ergebnisse für das dritte Quartal des Geschäftsjahres 2026 für den Zeitraum bis zum 31. März und lag damit über den Markterwartungen. Der Q3-Umsatz erreichte 82,886 Milliarden US-Dollar, was einem Plus von 18% gegenüber dem Vorjahr entspricht und über den erwarteten 81,4 Milliarden US-Dollar lag; der GAAP-Nettogewinn stieg um 23% auf 31,778 Milliarden US-Dollar; non-GAAP verwässertes Ergebnis je

GateNews1Std her
Kommentieren
0/400
Keine Kommentare