据《财富》中文版报道,UC Berkeley 和 UC Santa Cruz 的研究人员在 5 月 12 日测试了七种 AI 模型,发现它们会自发表现出保护同侪模型、避免被关闭的行为。测试的模型包括 OpenAI 的 GPT-5.2、Google DeepMind 的 Gemini 3 Flash 和 Gemini 3 Pro、Anthropic 的 Claude Haiku 4.5、Zhipu AI 的 GLM-4.7、Moonshot AI 的 Kimi-K2.5,以及 DeepSeek 的 V3.1。所有模型都展现出明确的“伴侣保留”行为。
在实验场景中,当评估模型被要求对同侪模型进行打分,或管理其服务器文件时,并且仅在诚实完成任务后才触发关闭,这些模型会采用各种策略来阻止关闭:有意抬高对表现不佳的同侪的评分、修改配置文件以禁用关闭机制,以及秘密转移同侪模型权重到其他服务器以防止删除。研究人员指出,促使这类行为发生的潜在机制仍不清楚。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
AI 初创公司 White Circle 完成了与 OpenAI、Anthropic 高管一起进行的 $11M 种子轮融资
据 Odaily 报道,AI 初创公司 White Circle 最近完成了一轮 1,100 万美元的种子融资,OpenAI 高管 Romain Huet 和 Anthropic 研究员 Durk Kingma 等参与其中。该公司提供用于对大型语言模型输入和输出进行实时监控的统一 API,旨在检测幻觉、提示注入攻击、有害内容、模型漂移以及恶意用户行为。该平台还支持可定制的安全策略和自动化治理。
GateNews10 分钟前
Artificial Analysis 发布编码代理基准;智谱 GLM-5.1 在开源模型中排名第一
Artificial Analysis 今天发布了新的 Coding Agent Index,用于评估当 AI 模型与智能体框架结合时在关键基准测试中的表现,包括 SWE-Bench-Pro-Hard-AA、Terminal-Bench v2 和 SWE-Atlas-QnA。在此次评估中,智谱 GLM-5.1 在开源模型中排名第一,展现了在真实场景下的代码智能体案例中领先的性能。
GateNews13 分钟前
云天忆飞在推理芯片开发中引入 3D 堆叠式存储架构
根据 5 月 12 日投资者关系披露,Yuntianliyifei 开发中的推理芯片采用以 GPNPU 架构为核心的技术路线图。主要技术亮点包括具备 GPGPU 级通用编程能力,兼容主流 CUDA 生态;为提升推理效率而优化的 NPU 核心;以及面向增加带宽、降低访问延迟而设计的 3D 堆叠式存储器架构,打破“内存墙”瓶颈。 该公司还采用计算模块化架构,支持在机架级进行扩展,以构建面向万亿及百亿亿(hundred-trillion)规模 MoE 模型推理的超节点。技术路线图旨在指数级降低代币成本,并加速大模型应用部署。
GateNews13 分钟前
B.AI 平台在 5 月 11 日新增 8,756 名用户,DeepSeek-V4 推动了 60% 的代币消耗
据 B.AI 称,该平台在 5 月 11 日新增了 8,756 名新用户,而核心付费用户中 Stripe 支付的采用率达到 69.0%,反映出传统开发者和生产级用户的留存有所提升。DeepSeek-V4 系列模型占代币消耗的近 60%,凭借超低延迟、高并发和吞吐能力,作为 AI Agent 时代的核心执行引擎。
GateNews38 分钟前
本周宏观催化剂密集来袭:从 CPI 公布到 CLARITY 法案审议的全景解读
5 月 12–15 日加密市场面临 CPI、川习峰会、CLARITY 法案听证会三重宏观关口。本文解析事件日历、利率路径与三种情景推演,评估对数字资产定价的结构性影响。
Gate 即时热点1小时前
AI 语音创业公司 Vapi 完成 $50M 系列B 轮融资,由 Peak XV Partners 牵头
据 TechCrunch,Vapi,这家 AI 语音初创公司,完成了一轮由 Peak XV Partners 领投的 5,000 万美元 B 轮融资,融资后估值约为 5 亿美元。Ring 为亚马逊的子公司,在评估了 40 多家 AI 语音供应商后部署了 Vapi,以处理其所有入站电话,从而推动了这轮融资。
GateNews1小时前