2026-04-13 15:52:30

Claude Opus 4.6 最近好像真的變笨了……

上週在 BridgeBench 幻覺基準測試裡，它還穩穩排第2，準確率83.3%
結果4月12日重新測試，直接掉到第10名，準確率只剩68.3%，幻覺率暴增98%
前後對比圖一看，差距真的很明顯
不少人最近用它寫程式、做推理時也感覺明顯變笨了，指令忘得快、胡說八道增多

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
Gate13週年Dr.Han公開信
3.7萬熱度
#
加密市場小幅下跌
16.85萬熱度
#
美軍封鎖霍爾木茲海峽
70.89萬熱度
#
AaveDAO2500萬美元撥款提案
180.57萬熱度
#
Gate廣場四月發帖挑戰
162.78萬熱度

置頂
🎉 Gate 廣場創作者狂歡正式開啟
發文衝榜、社群接龍、分享有獎 — 瓜分 2，000 USDT 及週年禮包
📅 活動時間：4 月 8 日 - 4 月 22 日
✅ 發文衝榜：內容品質 + 互動數據 + 挖礦收益綜合評分瓜分1200 USDT
✅ TG群組打卡：每週抽 3 份週年禮盒 + 7 份 200 U 體驗金券
✅ X 同步獎：分享內容至 X 平台，瓜分 500 USDT 額外獎池
📌 活動詳情：https://www.gate.com/announcements/article/50593
📌 報名連結：https://www.gate.com/questionnaire/7536
‍#Gate广场 #创作者狂欢 #内容挖矿
✍️ Gate 廣場「創作者認證激勵計劃」進行中！
我們歡迎優質創作者積極創作，申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵！
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟：
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面，等待審核
讓優質內容被更多人看到，一起共建創作者社區！
活動詳情：https://www.gate.com/announcements/article/47889
#Gate广场四月发帖挑战狂歡開啟！🧧
發帖即賺，天天都有紅包領，新人100%中獎！
🎁 福利亮點：
✅ 新人禮：發布廣場首帖，100% 必中紅包！
✅ 發帖獎：發帖越多，互動越多，紅包金額越大！
✅ 分享王：轉發活動連結到廣場或外部平台，送 Gate 開瓶器 + 200U！
✅ 衝榜單： Top 100 都有獎，Gate 13 周年限定禮盒、紅牛夾克等您拿！
立即行動，發佈你的四月廣場第一帖！
👉️ https://www.gate.com/post
🗓 截止日期： 4 月 15 日
詳情：https://www.gate.com/announcements/article/50520

Claude Opus 4.6 最近好像真的變笨了……

熱門話題

Gate13週年Dr.Han公開信

加密市場小幅下跌

美軍封鎖霍爾木茲海峽

AaveDAO2500萬美元撥款提案

Gate廣場四月發帖挑戰

置頂