喬治・霍茲(George Hotz),這名在 17 歲時首次破解 iPhone、並對 PlayStation 3 進行逆向工程的駭客,週日發布了一篇部落格文章,主張 AI 編碼代理的全面採用將導致軟體品質出現顯著惡化。霍茲寫道:「我現在就說:把 AI 代理導入軟體開發,將會是該領域史上最昂貴的錯誤之一。」他的立場與安德烈吉・卡爾帕蒂(Andrej Karpathy)形成直接對比——他是 AI 領域最具代表性的研究者之一。卡爾帕蒂於 2026 年 5 月 19 日加入 Anthropic 的預訓練團隊,並明確表示他的觀點是:AI 代理已經改變了軟體開發。這兩者代表了一場尚未定論的產業辯論中的兩端立場,雙方都具備足以支撐其觀點的相當可信度。
霍茲的核心論點
霍茲花了六個月在真實專案上測試 AI 代理:包含他開源的深度學習框架 Tinygrad 的部分內容,以及對一顆 USB-PCIe 晶片的完整韌體逆向工程。基於這段經驗,他主張:「代理無法程式設計,而且越來越能看出他們做不到。」他把產出形容為:「壞掉了,但壞得越來越難以偵測。這正是你會從日益精準的統計模型所期待的結果。」
他的主要顧慮是組織層面。高表現者有緊密的回饋迴路,能在代理產生的問題交付之前就抓出來——他們會閱讀程式碼、找出錯誤,並校準什麼時候該信任這個工具。「低表現者不會有那種自我檢查,」霍茲寫道。關鍵問題是:低表現者正使用代理來產出相當於先前 10 倍的輸出。在大型公司裡,這會讓平均程式碼品質的惡化更快發生,且被龐大的數量掩蓋。霍茲把這種結果形容為:「儲滿一桶又一桶粗糙內容的黃金年代,以及高品質珍寶的黑暗時代。」他還提到報導稱 Apple 正在其整個工程組織中推動 AI 編碼工具,並追問:「你覺得接下來 2 年,macOS 會變得更好還是更糟?」
不是關於自尊
霍茲預先回應了這種反對意見:一名程式設計師會自然地抗拒被取代,因為他會透過自己的技藝來定義身份。他認真看待這點,並以其理由駁斥。「Google 的 AFL 找到的 bug 比 LLM 還多,但沒有人對此有那種感覺。西洋棋和圍棋如今比以往更受歡迎,」他寫道。棋類 AI 早已在數十年間主宰人類,而這款遊戲只會越來越流行。
霍茲也對業界動機表達懷疑:「我幾乎覺得這是一種某種 psyop(心理操作),目的是要販售代理。對損失的恐懼,是讓大公司行動的少數方法之一。不過我認為,就在這種恐懼中他們犯下了大錯。」
各陣營站在哪裡
霍茲如今把自己定位在他所稱的「LeCun/Marcus camp」——指的是 Yann LeCun(Meta 的首席 AI 科學家)以及 Gary Marcus(一位長期懷疑 LLM 的研究者)。兩人都曾表示:語言模型本質上是更為精緻的模式匹配器——它們可以模仿既有程式碼的分布,但無法從真正的新問題的第一性原理進行推理。
「Vibe coding」(以純文字描述你要什麼,並讓 AI 產生實作)在過去一年中爆發式成長。主要的 AI 實驗室已將以 agent 為核心的編碼定位為旗艦產品。Microsoft 在 2025 年把 GitHub Copilot 轉變成一套完整的 agentic system(代理式系統),執行長 Satya Nadella 將其描述為一種平台層級的轉變,類似於轉向 cloud(雲端)。
卡爾帕蒂在 2025 年初期曾對代理持懷疑態度,但在新模型發布後又反轉了立場。Anthropic 執行長 Dario Amodei 在達沃斯表示,部分 Anthropic 工程師已經停止親自寫程式碼,改由模型來處理,工程師則在審閱輸出。霍茲也嘗試過相同做法,他說每次都會發現自己忍不住要手動修正。