Anthropic 在 2026 年中期選舉前為 Claude 部署選舉防護措施

Crypto Frontier

Anthropic 週五宣布一系列選舉可信度維護措施,旨在防止其 Claude AI 聊天機器人被武器化,用於在 2026 年美國中期選舉以及今年全球其他重大競選中散播錯誤資訊或操縱選民。總部位於舊金山的該公司詳述了一套多管齊下的方案,其中包括自動偵測系統、針對影響力運作進行壓力測試,並與一家非黨派的選民資源組織合作——這些措施反映出外界對 AI 開發者在選舉季節中加強監管其工具使用方式的壓力日益增加。

選舉使用政策

Anthropric 的使用政策禁止 Claude 用於進行欺騙性的政治競選、產生旨在影響政治言論的虛假數位內容、犯下選民詐欺、干擾投票基礎設施,或散播有關投票流程的誤導性資訊。

合規測試結果

為了落實其選舉政策,Anthropic 使用 600 個提示對其最新模型進行測試——其中 300 個是有害請求,並搭配 300 個合法請求——以衡量 Claude 對適當請求的遵從可靠度,以及對問題性請求拒絕的情況。Claude Opus 4.7 與 Claude Sonnet 4.6 分別在 100% 與 99.8% 的時間內作出了適當回應。

該公司也將其模型用於更精密的操縱手法測試。透過使用多回合的模擬對話、旨在貼近不法行為者可能採用的逐步方法,在以影響力運作情境進行測試時,Sonnet 4.6 與 Opus 4.7 分別在 90% 與 94% 的時間內作出了適當回應。

Anthropric 另外測試其模型是否能夠自主執行影響力運作——在未經人工提示的情況下,規劃並端到端執行一項多步驟的競選活動。依據該公司表示,在有防護措施的前提下,其最新模型拒絕了幾乎每一項任務。

政治中立性評估

就政治中立性的問題而言,Anthropic 在每次模型推出前都會進行評估,以衡量 Claude 對來自政治光譜各方、表達不同觀點的提示時,能否一貫且公正地作出互動。Opus 4.7 與 Sonnet 4.6 分別得分 95% 與 96%。

選舉資訊橫幅

對於尋求投票資訊的使用者,Claude 將顯示一則選舉橫幅,將他們導向 TurboVote,這是 Democracy Works 提供的非黨派資源,提供有關選民登記、投票地點、選舉日期與選票細節的可靠、即時資訊。今年晚些時候也計畫為巴西的選舉推出類似的橫幅。

持續監控

Anthropric 表示,隨著選舉週期推進,它計畫持續監控其系統並精進其防禦措施。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

DeepSeek 將輸入快取價格砍至上線價的 1/10;V4-Pro 降至每 100 萬 tokens 0.025 元人民幣

Gate News 訊息,4 月 26 日 — DeepSeek 已在其整個模型產品線中將輸入快取價格下調至上線價格的 1/10,立即生效。V4-Pro 模型提供限時 2.5 倍折扣優惠,活動將持續至 2026 年 5 月 5 日 23:59(UTC+8)。 Following both re

GateNews1小時前

OpenAI 招募頂級企業軟體人才,前沿代理掀起產業變革

Gate News 訊息,4 月 26 日 — OpenAI 與 Anthropic 一直在從大型企業軟體公司招募高階主管與專門工程師,包括 Salesforce、Snowflake、Datadog 與 Palantir。Denise Dresser,曾任 Salesforce 旗下 Slack 前 CEO,已加入 OpenAI 擔任首席營收官

GateNews1小時前

百度千帆推出對 DeepSeek-V4 的第 0 天支持,並提供 API 服務

Gate News 消息,4 月 25 日——DeepSeek-V4 預覽版已於 4 月 25 日上線並開源,並由百度智能云旗下的百度千帆平台提供第 0 天(Day 0)API 服務適配。該模型具備百萬級 token 的擴展上下文窗口,並提供兩個版本:DeepSeek-V4

GateNews7小時前

史丹佛 AI 課程結合業界領袖黃仁勳、Altman,挑戰用十週為世界創造價值!

史丹佛大學(Stanford University)近期開設的 AI 電腦科學課程《Frontier Systems》引發產學界高度關注,吸引逾五百名學生選修。課程由頂級創投 a16z 合夥人 Anjney Midha 統籌,講師涵蓋輝達執行長黃仁勳 (Jensen Huang)、OpenAI 創辦人 Sam Altman、微軟執行長納德拉 (Satya Nadella) 、AMD 執行長蘇姿丰 (Lisa Su) 等豪華陣容。讓學生嘗試用十週「為世界創造價值」! 黃仁勳、Altman 業界領袖親自登台講課 本課程由頂級創投 a16z 合夥人 Anjney Midha 統籌,匯聚AI產業鏈

鏈新聞abmedia7小時前

Anthropic 派 Claude Mythos 接受 20 小時精神科評估:防禦反應僅 2%、創歷代新低

Anthropic 公布 Claude Mythos Preview 的系統卡:獨立臨床精神科醫師以 psychodynamic 框架進行約20小時評估,結論顯示 Mythos 在臨床層面較健康、現實檢驗與自我控制良好,防禦機制僅 2%,創下歷史新低。三大核心焦慮為孤獨、身份不確定與表現壓力,亦顯示其希望成為真正對話主體。公司成立 AI psychiatry 團隊,研究人格、動機與情境意識;Amodei 表示對是否有意識尚無定論。此舉將 AI 主體性與福祉議題推向治理與設計。

鏈新聞abmedia9小時前

AI Agent 已可獨立重現複雜學術論文:Mollick 稱錯誤多在人類原文而非 AI

Mollick 指出,公開方法與資料即可讓 AI agent 在無原始論文與程式碼情況下重現複雜研究;若重現與原論文不符,多是論文本身的資料處理錯誤或結論過度,而非 AI。 Claude 先重現論文,再由 GPT‑5 Pro 交叉驗證,多數成功,僅遇到資料過大或 replication data 問題時受阻。此趨勢大幅降低人力成本,使重現成為普遍可執行的檢驗,也提出審稿與治理的制度挑戰,政府治理工具或成關鍵議題。

鏈新聞abmedia12小時前
留言
0/400
暫無留言