Claude Opus 4.6 最近好像真的降智了…… 上周在 BridgeBench 幻觉基准测试里,它还稳稳排第2,准确率83.3% 结果4月12日重新测试,直接掉到第10名,准确率只剩68.3%,幻觉率暴增98% 前后对比图一看,差距真的很明显 不少人最近用它写代码、做推理时也感觉明显变笨了,指令忘得快、胡说八道增多
Claude ほんとに高すぎる! 一枚の画像で教える:今、どのモデルがコストパフォーマンス最高か? Anthropicは一夜にしてClaudeサブスクリプションに依存していたすべてのサードパーティツールを一掃: Cline、Cursor、Windsurf、OpenClawはすべて消滅... 実測の結果、ついにClaude Opus 4.6の最適なネイティブコーディング代替案を見つけた(公式チャネル直結、仲介なし): それは: GLM-5.1