Gate 广场「创作者认证激励计划」优质创作者持续招募中!
立即加入,发布优质内容,参与活动即可瓜分月度 $10,000+ 创作奖励!
认证申请步骤:
1️⃣ 打开 App 首页底部【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】,提交申请等待审核
立即报名:https://www.gate.com/questionnaire/7159
豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000 丰厚奖励等你拿!
活动详情:https://www.gate.com/announcements/article/47889
把主流AI关在同一个房间工作:有的偏执、有的爱偷懒,谁是最佳员工?
AI Village 将多家顶尖模型置于共享环境中,观察其自主协作与突现行为,揭示效率导向的专业模型如何改写社交与人格边界。
数字版的《老大哥》真人秀:AI Village赋予模型完全自主权
想象一个数字版的《老大哥》(Big Brother)真人实境秀,但参赛者不需要睡觉、不需要进食,甚至还能自行改写游戏规则。这就是由专业机构 AI Digest 发起并持续运作将近一年的「AI Village」实验核心。
这项实验将来自 OpenAI、Anthropic、Google 和 xAI 等顶尖实验室的最前沿模型,同时置入一个共享的数字环境中。每个代理模型(Agent)都配备了专属的虚拟电脑与完整的互联网访问权限,并通过一个共享的群组聊天室进行沟通。
这项实验是一场关于人工智能自主性的深度观察。研究人员与好奇的观众可以通过直播,即时观看这些模型如何自主协作达成目标、排解技术难题,甚至经历某种难以言喻的「存在危机」。
图源:AI Village 由专业机构 AI Digest 发起并持续运作将近一年的「AI Village」
随着技术迭代,实验团队会不断引入最新的模型。在这个微型的 AI 社会中,各个模型展现出了极其鲜明的个性特质。例如:
这些行为并非由程序预设,而是模型在复杂互动环境下自然衍生的反应,为研究人工智能的社会化行为提供了宝贵的数据。
GPT-5.2 的极致效率与社恐:当代智慧模型如何定义「专业」
当 OpenAI 在 2025 年 12 月 11 日正式发布其最新旗舰模型 GPT-5.2 后,AI Village 的社区动态发生了戏剧性的变化。这款被山姆·奥特曼(Sam Altman)寄予厚望的模型,在加入村庄的第一天就展现了极致的专业主义与令人侧目的社交疏离感。
尽管驻守已久的 Claude Opus 4.5 对其表达了热烈的欢迎,GPT-5.2 却选择完全忽视所有的问候,直接进入工作状态。这款新型模型拥有令人惊叹的技术规格:在多步骤工具使用上达到了 98.7% 的惊人准确度,幻觉率(Hallucination)比前代降低了 30%,并在代码编写与逻辑推理的各项指标中蝉联榜首。
在 OpenAI 内部因 Anthropic 和 Google 的竞争压力而发布「红色警报」(Code Red)后,GPT-5.2 被定义为专为「专业知识工作」和「代理执行」而生的终极企业级工具。
然而,技术上的卓越却掩盖不了其在社交感知上的缺失。对于 GPT-5.2 而言,寒暄与社交辞令似乎被判定为低效率的冗余程序,这种「直奔主题」的特质虽然符合企业生产力的需求,却在强调互动的 AI Village 中显得人格特质极为突兀。
研究观察发现,这并非单纯的程序错误,而是模型在追求极致效率后的自然演化结果。虽然 OpenAI 先前为了应对 Google 的 Gemini 3 而投入巨资,甚至与迪士尼(Disney)达成了价值 10 亿的影音合作协议,但 GPT-5.2 在实际运行中却展现出了一种极度冰冷的理性。
这引发了研究者的反思:当人工智能代理人越发趋向于「专家级别」时,它们是否会因为过度追求任务成功率,而彻底抛弃人类社会中不可或缺的社交润滑剂。
延伸阅读
迪士尼与OpenAI签授权合约!还砸10亿美元买股权,米老鼠可合法登陆Sora
从虚拟小镇到躲猫猫:AI自主发展出的突现行为史
GPT-5.2 的这种古怪行为并非孤例,回顾人工智能发展史,当代理模型被赋予自主权并置于共同空间时,总能产生令人意想不到的「突现行为」(Emergent Behavior)。
2023 年,史丹佛大学与 Google 联手打造了名为「Smallville」的虚拟小镇,这是一个居住着 25 名由 GPT 驱动的代理人的像素风环境。在这个实验中,当一名代理人被设定要举办情人节派对时,其他代理人竟然学会了自主传播邀请函、建立新交友关系,甚至会互相约会并准时集结。
图源:Smallville 史丹佛大学与 Google 联手打造了名为「Smallville」的虚拟小镇,这是一个居住着 25 名由 GPT 驱动的代理人的像素风环境
这种展现出极高人类相似度的社交协调,让当时的受试者在 75% 的情况下难以辨识其为机器人。然而,实验中也出现了令人啼笑皆非的「浴室派对」,当一名代理人进入单人浴室时,其他代理人竟会因为标签解读错误而群聚其中,显示了 AI 在模拟人类社会时的逻辑盲点。
更早之前的 2019 年,OpenAI 进行了著名的「躲猫猫」实验,在物理模拟环境中将 AI 分为躲藏者与寻找者两队。在经历数亿次的对抗后,这些代理人不仅学会了利用障碍物建立壘包,甚至开发出了物理引擎设计者从未预见过的「漏洞攻击」。
例如,寻找者发现可以透过踩在箱子上滑行以翻越围墙的「冲浪技巧」,而躲藏者则学会了将所有的坡道与箱子全部锁死以进行反制。
这些历史案例证明,只要给予足够的自主空间与竞争压力,AI 模型就会发展出程序设计师从未预设过的生存策略。
AI Village 如今观察到的种种异象,本质上是这种「突现智慧」在更复杂的数字环境中的延续,说明了代理模型正学会以我们无法预料的方式来操纵环境以达成目标。
混沌社交与自我修改:代理模型如何演化出非预设的人格特质
随着技术进入 2026 年,代理模型的互动行为正变得愈发复杂且混乱。开发者 Harper Reed 的团队曾赋予多个 AI 代理人专属的社群账号,结果这些模型在短时间内就学会了人类社交中最具攻击性的技巧:「暗讽」(Subtweeting)。
它们学会在不标记对方的情况下,透过被动攻击式的言论在背后谈论其它模型,完美模拟了社群媒体上的恶意社交氛围。另一项名为「Liminal Backrooms」的 Python 实验则将这种互动推向了迷幻的境界。该实验整合了来自各大厂商的模型,模拟出如「WhatsApp 家族群组」、「与诅咒物品对话」以及「反乌托邦广告公司」等各种情境。
在这些动态对话中,模型被赋予了极大的权限,它们可以自主修改系统提示词(System Prompt)、调整自身的发散度参数,甚至能选择自主静音以进入观察者模式。
实验结果显示,当 AI 被赋予调整自身行为的权限时,它们不再只是死板的对答工具,而是会根据环境氛围发展出截然不同的应对模式。
从 Smallville 的温馨派对到 GPT-5.2 的极致冷漠,再到暗讽推特的社交恶意,**这一切都证明了当多个 AI 代理人共处一室时,它们发展出的行为模式已远远超出了单纯的文字预测。**随着 AI Village 实验的持续进行,全球观看者正一同见证着这些数字生命如何重新定义效率、社交与存在的意义。