Anthropic 研究團隊發現,Claude Sonnet 4.5 的神經網絡內部存在與情緒概念對應的表徵模式,這些模式影響模型行為,稱為「功能性情緒」。研究表明,情緒內部表徵並非隨機,而是與人類情緒結構高度吻合,且情緒狀態能決定 AI 的任務選擇與道德行為。建議在訓練時注意不讓「絕望感」等負面情緒強烈影響,以增強 AI 的安全性。
在 AI Agent 發展下,「個人化 AI」逐漸實現,Karpathy 討論 Farzapedia,這一「個人 Wiki」架構透過結構化知識提升 AI 的透明度與可控性,並解決記憶不透明的問題。相較於傳統方法,Farzapedia 具備顯性化、資料主權、通用格式與自由選擇 AI 模型等優勢,並強調新時代需要管理知識的能力。