
Der bekannte Hacker George Hotz (hatte im Alter von 17 Jahren erstmals das iPhone geknackt; bevor Sony verklagte, hatte er die PlayStation 3 rückentwickelt; Autor des Open-Source-Tinygrad Deep-Learning-Frameworks) veröffentlichte am 25. Mai einen Blogbeitrag mit dem Titel „The Eternal Sloptember“ und behauptete: „Die Anwendung von KI-Agenten auf die Softwareentwicklung wird einer der teuersten Fehler in der Geschichte dieses Bereichs sein.
核心論點:高低績效團隊的不對稱輸出問題
Hotz 的論點建立在組織結構差異上:高績效團隊擁有足夠緊密的回饋機制,能夠發現代理生成的問題;低績效團隊缺乏自我檢查機制,卻「利用代理實現了比以往高出十倍的產出」。在大型科技公司中,他預測結果是「程式碼品質平均水準的快速下降,而這種下降卻被龐大的程式碼量所掩蓋」,最終導致「大量劣質產品氾濫成災,優質產品黯然失色」。他舉例:報導稱蘋果正在其整個工程團隊中推廣 AI 編碼工具,他直接問道:「你認為未來兩年 macOS 會變得更好還是更糟?」
六個月測試的具體結論與 Hotz 的立場歸屬
Hotz 表示在測試中,代理「會預先完成所有工作,遞給你一個老虎機拉桿——你拉動它,然後祈禱剩下的工作能夠順利完成。它始終無法完全實現。」他嘗試了讓模型自動處理代碼、工程師審核輸出的模式,但表示「每次都必須手動修改」。他將自己歸入 Meta 首席 AI 科學家 Yann LeCun 和 AI 批評者 Gary Marcus 的陣營,認為語言模型本質上是複雜的模式匹配器,無法解決真正的新問題。
業界分歧:Karpathy 和 Amodei 的對立立場
Andrej Karpathy 曾在 2025 年初對代理持懷疑態度,但在新模型發布後改變立場,於 5 月 19 日加入 Anthropic 預訓練團隊,稱接下來幾年的工作為「意義非凡的成長經驗」。Dario Amodei 在達沃斯表示,部分 Anthropic 工程師已停止編寫代碼而讓模型處理。微軟 CEO Satya Nadella 也將 GitHub Copilot 向代理系統的轉型定義為平台層面的變革。
常見問題
Geht Hotz’ Argumentation auf die Nutzung von KI-Tools durch alle Ingenieure?
Nein. Hotz macht deutlich, dass das Problem nicht darin liegt, ersetzt zu werden, sondern in den Effekten der Organisationsgröße: Hochleistungs-Ingenieure können die Problem-Ausgaben von Agenten erkennen, Geringleistungs-Ingenieure jedoch nicht. Seine Kritik richtet sich darauf, dass Teams mit niedriger Leistung nach einer starken Nutzung von Agenten die Gesamtqualität des Codes ausbremsen.
Hotz 提到的「越來越難以察覺」的問題具體指什麼?
Hotz 表示「輸出結果存在問題,但這種問題越來越難以察覺,這正是我們對一個日益精確的統計模型所預期的」。問題不在於代理產生明顯的錯誤,而在於產生外表正確但內在存在缺陷的代碼,缺乏足夠能力的工程師無法識別這些問題。
Wofür steht die Uneinigkeit zwischen Hotz und Karpathy?
Die beiden Ingenieure mit hoher Branchenanerkennung vertreten gegensätzliche Positionen: Hotz ist der Ansicht, KI-Coding-Agenten seien eine Katastrophe, Karpathy (ist inzwischen bei Anthropic) glaubt, Agenten hätten die Softwareentwicklung grundlegend verändert. Ihre Uneinigkeit spiegelt wider, dass in der Branche derzeit noch kein Konsens über den tatsächlichen Nutzen von KI-Coding-Agenten besteht.