📢 早安!Gate 廣場|4/5 熱議:#假期持币指南
🌿 踏青還是盯盤?#假期持币指南 帶你過個“放鬆感”長假!
春光正好,你是選擇在山間深呼吸,還是在 K 線裡找時機?在這個清明假期,曬出你的持幣態度,做個精神飽滿的交易員!
🎁 分享生活/交易感悟,抽 5 位幸運兒瓜分 $1,000 仓位體驗券!
💬 茶餘飯後聊聊:
1️⃣ 假期心態: 你是“關掉通知、徹底失聯”派,還是“每 30 分鐘必刷行情”派?
2️⃣ 懶人秘籍: 假期不想盯盤?分享你的“掛機”策略(定投/網格/理財)。
3️⃣ 四月展望: 假期過後,你最看好哪個幣種“春暖花開”?
分享你的假期姿態 👉 https://www.gate.com/post
📅 4/4 15:00 - 4/6 18:00 (UTC+8)
這份論文來自史丹佛和哈佛,原因在於大多數「代理人工智慧系統」在演示中令人驚嘆,但在實際應用中卻完全崩潰。
它的名稱是「代理人工智慧的調適」,也是我今年閱讀過的最重要的論文。
目前,大家都迷上建立獨立的代理。給它們工具、記憶和目標,期待它們完成我們的任務。
但在現實世界中部署時,它們會幻想工具的調用。無法進行長期規劃。會出錯。
原因如下:
我們試圖將所有學習壓縮到人工智慧的大腦中。
當開發者試圖修復故障的代理時,通常只會調整主模型以產生更好的最終答案。
研究人員發現了這種方法的致命缺陷。
如果只用獎勵來讓人工智慧得到正確的最終答案,它就會變得懶散。
它會學會停止使用工具。試圖猜答案而不是做事。忽略計算器,試圖在腦中進行計算。
為了解決這個問題,研究人員提出了一個由4個部分組成的新框架,來真正教導代理如何學習。
而且最重要的結論徹底顛覆了現有的觀念。
不再反覆訓練昂貴且龐大的代理大腦,而是採取相反的做法。
他們會讓大腦凍結,並調整工具的使用。
他們稱之為「在代理監督下的工具調適」。#GateSquareAprilPostingChallenge $BTC