ゲートニュース(4月23日)— アンソロピックのエンジニアリングチームは、過去1か月間にユーザーから報告されたClaude Codeの品質低下は、APIや基盤となるモデルの問題ではなく、3つの独立したプロダクト層の変更に起因することを確認した。3つの問題はそれぞれ4月7日、4月10日、そして4月20日に修正され、最終版は現在v2.1.116となっている。
最初の変更は3月4日に発生した。チームは、推論の強度が高いOpus 4.6で、ときおり極端なレイテンシのスパイクが発生するのを抑えるため、Claude Codeのデフォルトの推論エフォートレベルを「high」から「medium」に引き下げた。パフォーマンス低下に関する広範なユーザーの不満を受けて、チームは4月7日にこの変更を元に戻した。現在のデフォルトは、Opus 4.7は「xhigh」、その他のモデルは「high」となっている。
2つ目の問題は3月26日に導入されたバグだった。システムは、会話が1時間以上非アクティブになると古い推論レコードを消去して、セッション復旧コストを下げるよう設計されていた。しかし実装上の欠陥により、消去がその後のすべてのターンで繰り返し実行される一方で、1回だけ実行されるべきところが、そのためにモデルが以前の推論コンテキストを段階的に失っていく原因になった。これは、忘れっぽさの増加、繰り返し操作、異常なツール呼び出しとして現れた。このバグはまた、すべてのリクエストでキャッシュミスを発生させ、ユーザーの利用クォータ消費を加速させた。再現条件を覆い隠す、互いに関係のない2つの社内実験が行われたため、デバッグが1週間以上に及んだ。4月10日に修正した後、チームはOpus 4.7を使って問題のあるコードをレビューし、Opus 4.7ならバグを特定できる一方でOpus 4.6ではできないことを確認した。
3つ目の変更は、Opus 4.7とともに4月16日にリリースされた。チームは冗長な出力を減らすために、システムプロンプトに指示を追加した。数週間にわたる社内テストでは回帰は見られなかったが、リリース後に他のプロンプトとのやり取りを行うと、コーディング品質が低下した。拡張評価では、Opus 4.6と4.7の両方でパフォーマンスが3%低下していることが判明し、4月20日にロールバックが行われた。
これら3つの変更は、異なる時期に異なるユーザーグループに影響し、その組み合わせによって広範で一貫性のない品質低下が生まれ、診断を難しくした。アンソロピックは今後、ユーザーと同じ公開ビルドバージョンを使うために、より多くの社内従業員を必要とし、すべてのシステムプロンプト変更について完全なモデル評価スイートを実行し、段階的ロールアウトの期間を設けると述べた。補償として、アンソロピックはすべてのサブスクリプションユーザーの利用クォータをリセットした。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
Meta Platforms、5月20日に従業員を10%削減へ。約8,000のポジションに影響
Gate News メッセージ、4月24日 — Meta Platforms は、5月20日に向けて、従業員を約10%削減し、約8,000のポジションに影響が及ぶ予定です。レイオフは、業務運用の効率を改善しつつ、人工知能への投資を増やすことを目的としています。
計画されている組織再編は、
GateNews38分前
トランプ政権がAIの精製(テイリング)を取り締まる計画を発表、中国企業がモデル能力を組織的に盗んでいるとして告発
ホワイトハウス科学技術政策局(OSTP)の大統領補佐官マイケル・J・クラツィオス(Michael J. Kratsios)が4月23日に公式声明を発表し、トランプ政権が情報を把握しており、外国の実体(主に中国)が「数万のエージェント・アカウント」およびジェイルブレイク技術を通じて米国の大手人工知能企業を意図的に標的にし、米国のAIモデルの能力を組織的に抽出していることを示し、同時に4つの対処措置を公表した。
MarketWhisper1時間前
DeepSeek は V4 のオープンソース・プレビュー版を提供し、技術スコア 3206 で GPT-5.4 を上回った
DeepSeekは4月24日に正式にV4プレビューバージョンシリーズをリリースし、MITライセンスのもとでオープンソース化されており、モデルの重みはHugging FaceおよびModelScopeで同時に公開されています。DeepSeek V4の技術レポートによると、V4-Pro-Max(最高推論強度モード)はCodeforcesのベンチマークで3206点を獲得し、GPT-5.4を上回りました。
MarketWhisper1時間前
カンブリコン、DeepSeek-V4のDay 0適応を完了—中国のAIチップ・エコシステムにとってのマイルストーンを記す
ゲートニュース、4月24日 — カンブリコンは本日、DeepSeekの最新の大規模言語モデルであるDeepSeek-V4のDay 0適応を完了したことを発表しました。独自のNeuWareソフトウェア・エコシステムとvLLMフレームワークを使用しています。適応コードは同時にオープンソース化されており、
GateNews1時間前
TencentがオープンソースしたHy3プレビュー版は、コードベンチマークテストで前世代比40%向上
テンセントは4月23日にGitHub、Hugging Face、ModelScopeの各プラットフォームで、Hy3のプレビュー版の大規模言語モデルを正式にオープンソースとして公開し、あわせてテンセントクラウド(Tencent Cloud)でも有料APIサービスを提供している。Decryptが4月24日に報じたところによれば、Hy3プレビュー版は1月下旬にトレーニングを開始し、公開カレンダー時点では3か月に満たない。
MarketWhisper1時間前
破綻していなければ 158 兆ウォン相当の FTX ポートフォリオ投資額
FTXは、流動性不足と資本流出により2022年11月に連邦破産法第11章(Chapter 11)の適用を申請した中央集権型暗号資産取引所であり、崩壊していなければ約158.796兆ウォン相当の投資を保有していたはずだと、パク氏が引用した分析によれば述べられている
CryptoFrontier1時間前