✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
这是斯坦福和哈佛的论文,导致大多数“代理人工智能”系统在演示中表现出色,但在实际使用中完全崩溃。
它的名字是“代理人工智能的调适”,也是我今年阅读的最重要的论文。
目前,大家都沉迷于构建自主代理。我们给它们工具、记忆和目标,期待它们完成我们的任务。
但在实际应用中,它们会误以为可以调用工具。无法进行长远规划。会崩溃。
原因如下:
我们试图将所有学习压缩到人工智能的“大脑”中。
当开发者试图修复故障的代理时,通常只是调整主模型以产生更好的最终答案。
研究人员发现了这种方法的致命缺陷。
如果只奖励人工智能得到正确的最终答案,它就会变得懒惰。
它实际上会学会停止使用工具。试图猜答案而不是做事。忽略计算器,试图在脑海中算账。
为了解决这个问题,研究人员提出了一种由4个部分组成的新框架,关于代理如何真正学习。
最重要的结论彻底颠覆了当前的认知。
不再不断重新训练昂贵庞大的代理“大脑”,而是采用相反的方法。
他们冻结“大脑”,并调适工具。
他们称之为“在代理监督下的工具调适”。#GateSquareAprilPostingChallenge $BTC