#Anthropic发布Fable5模型 一模型、二つの名前:AnthropicがFable 5とMythos 5を公開、最強モデルが初めて一般公開
6月9日、Anthropicは同時に二つの新モデル—Claude Fable 5とClaude Mythos 5を発表した。面白いことに、それらの基盤は実は同じモデルで、違いは「ガードレール」の緩さだけだ。これはAnthropic史上最も能力の高いモデルが初めて一般公開されるものであり、また稀な「階層的リリース」実験でもある。
この記事では理解を深める:その強みは何か、なぜ二つの名前に分けたのか、そして今どう使うのか。
一、まず理解しよう:何が「Mythos級」モデル?
Claudeに馴染みのある読者は知っているだろう、Anthropicのモデルは常に三つのクラスに分かれている:Haiku(高速)、Sonnet(バランス)、Opus(最強)。そして今年4月、Anthropicは密かにOpusを超える新たなクラス—Mythos級を導入した。最初のMythos級モデル(Claude Mythos Preview)は公開販売されず、代わりに「Project Glasswing」という計画を通じて、米国政府と協力し、少数のサイバーセキュリティ防御機関と重要インフラ事業者にのみ提供された。
理由は明白:このレベルのモデルは非常に強力であり、サイバー攻撃や生物研究などの分野で悪用される可能性があるため、Anthropicは直接公開できないと判断した。
今回発表された二つのモデルは、Mythos級の正式版:
◆ Claude Fable 5:誰でも使えるバージョンで、新しい安全ガードレールを搭載;
◆ Claude Mythos 5:ガードレール部分を解除したバージョンで、信頼されたGlasswingパートナーなどに限定公開。両者は同じ基盤モデルを共有している。名前も工夫されている:Fableはラテン語のfabula(「語られる物語」)に由来し、ギリシャ語のmythosと同源—根本的に同じだが、「自由に話せるかどうか」の違いだけだ。
二、それはどれほど強いのか?
Anthropicの説明によると、Fable 5は同社史上これまで公開されたどのモデルよりも能力が高く、ほぼすべてのAI能力ベンチマークで最先端(SOTA)レベルにある。特にソフトウェアエンジニアリング、知識作業、視覚理解、科学研究に長けている。そして、タスクが長く複雑になるほど、従来モデルに対する優位性は大きくなる。
コードを書く:二ヶ月分の作業を一日に圧縮。決済会社Stripeの早期テストでは、5千万行のRubyコードベースで、Fable 5は一日で全コードベースの移行を完了—当初計画では、チーム全体で二ヶ月以上かかる作業だった。Cognition(Devinの開発元)のFrontierCode評価では、Fable 5は最先端モデルの中で最高スコアを獲得し、トークン消費も少ない。
視覚:ポケモン・火の鳥を素手でクリア。従来のClaudeモデルはポケモンをプレイするのに複雑な補助ツール(地図、ナビゲーション、ゲーム状態情報)が必要だったが、Fable 5は原始的なゲーム画面だけを見て全クリできた。さらに、スクリーンショットからWebアプリのソースコードを直接再構築も可能。
記憶:『殺戮尖塔』のプレイ中にメモを取る。数百万トークンに及ぶ長大なタスクでも、Fable 5は集中力を持続し、自身の書いたメモを活用してパフォーマンスを向上させる。カードゲーム『殺戮尖塔』のテストでは、永続的なファイル記憶を導入後、性能向上はOpus 4.8の三倍に達した。
科学研究:薬物設計の速度を約10倍に向上。Anthropic内部のタンパク質設計の専門家は、Mythos 5を使って薬物設計の一部工程を約十倍高速化した—モデルは人手を介さずに、結合部位の選択、タンパク質設計ツールの実行、失敗からの回復など、通常は科学者が行う全ての工程を独立して完了できる。14の標的タンパク質のうち9つが、次の段階に進む候補薬物として有望と判断された。さらに、大腸菌のタンパク質に関する全く新しいメカニズム仮説も提案し、その後、独立した研究チームによって検証された。
三、ガードレールの仕組み:トリガーされると「ダウングレード」してOpus 4.8に切り替わる
これは今回のリリースの中で最も興味深い設計だ。Fable 5には新しい安全分類器(classifiers)が搭載されている—これはメインモデルとは独立したAIシステムで、潜在的な乱用を検出するためのものだ。分類器があなたのリクエストが以下の三つの敏感分野に関わると判断した場合、Fable 5の代わりに自動的に次に強いモデルであるClaude Opus 4.8に切り替わる(ユーザーには通知される):
1. サイバーセキュリティ:Mythos級モデルはソフトウェアの脆弱性発見と悪用に長けており、「自主ハッキング」も可能—偵察や横展開も一連の流れで行う。これらの能力はサイバー攻撃のコストを大きく下げるため、特に警戒されている。
2. 生物・化学:モデルは既に実世界の研究タスク(例:ウイルスの外殻組み立て予測)をこなせるが、この二重用途の能力は悪用される危険があるため、多くのリクエストはOpusにリダイレクトされる。
3. 蒸留攻撃:誰かが大量にFable 5の能力を抽出し、競合モデルの訓練に使うのを防ぐための措置。
重要な数字:ガードレールは平均して会話の5%未満でトリガーし、つまり95%以上のユーザーはほぼMythos 5の全能力を使い続けている。Anthropicはガードレールの設定が保守的すぎて誤検知も多いと認めており、誤報を減らす努力を続けている。越狱対策では、1000時間以上の外部脆弱性バウンティテストで「万能越狱」は見つかっていない。
もう一つ注目すべき変化は、Mythos級モデルの全トラフィックは30日間保存されることだ(企業も含む)。これは新たな攻撃や越狱に対する防御のためで、Anthropicはこれらのデータを訓練に使わないと約束し、アクセス監査などのプライバシー保護措置も整えている。
四、Mythos 5:信頼できる「無ガードレール」バージョン
Mythos 5はFable 5から一部のガードレールを取り除いたもので、世界最強のサイバーセキュリティ能力を持つと自称している。現在はProject Glasswingを通じてサイバー防御機関にのみ提供されており、Mythos Previewのアップグレード版だ。今後、Anthropicは段階的に拡大を計画している:米国政府と協議し、パートナーを増やす;信頼されたアクセスプログラムを導入し、サイバーセキュリティ組織が申請できるようにする;また、バイオメディカル研究者向けにバイオ版の信頼プログラムも展開し(生化学的ガードレールは解除、サイバーセキュリティのガードレールは維持)、新薬開発を加速させる。この「同じモデルを、身分に応じて段階的に解放する」方式は、前例のないものだ。
五、価格と使い始め:6月22日まで無料期間
APIの価格設定は、6月22日までの期間限定:入力は10ドル/百万トークン、出力は50ドル/百万トークン—これはMythos Previewの半額以下だ。モデル識別子はclaude-fable-5で、APIと従量課金の企業プランは本日から全て利用可能。サブスクユーザーはこのスケジュールに注意:
◆ 今から6月22日まで:Pro、Max、Team、企業版のパッケージにFable 5が無料で含まれる;
◆ 6月23日以降:パッケージから除外され、引き続き使うには利用クレジットを購入する必要がある;容量に余裕があれば、無料期間が延長される可能性も;
◆ その後:計算能力の向上とともに、AnthropicはFable 5をサブスクリプションの標準に戻す予定だ。つまり、今後二週間は最強モデルを無料で試せる絶好の機会だ。興味のある読者はぜひ体験してみてほしい。
六、最後に:能力と安全の「新しい解決策」
過去数年、最先端の研究所は「モデルが強すぎる場合どうするか」に対して、基本的に二つの選択肢しかなかった:公開延期、または能力の制限。Anthropicは今回、新たな第三の答えを示した—全量公開だが、公開版には動的なガードレールを付け、信頼できる機関にはフルバージョンを提供する。
この方法は完璧ではない:誤検知が5%もあれば、一部の専門ユーザー(特に安全研究者や生物学者)には不満が出るだろうし、30日のデータ保持もプライバシーの議論を呼びかねない。しかし、これにより「最強能力」が初めて政府の協力プロジェクトに閉じ込められることなく、誰もがコントロール可能な範囲で利用できるようになった。AIが一日で二ヶ月分のエンジニアリングをこなし、独立してタンパク質薬候補を設計できる時代において、「どう公開するか」は「何を作るか」と同じくらい重要だ。FableとMythosという同源の言葉は、今後の最先端モデルのリリースの標準的なモデルケースになるかもしれない。
6月9日、Anthropicは同時に二つの新モデル—Claude Fable 5とClaude Mythos 5を発表した。面白いことに、それらの基盤は実は同じモデルで、違いは「ガードレール」の緩さだけだ。これはAnthropic史上最も能力の高いモデルが初めて一般公開されるものであり、また稀な「階層的リリース」実験でもある。
この記事では理解を深める:その強みは何か、なぜ二つの名前に分けたのか、そして今どう使うのか。
一、まず理解しよう:何が「Mythos級」モデル?
Claudeに馴染みのある読者は知っているだろう、Anthropicのモデルは常に三つのクラスに分かれている:Haiku(高速)、Sonnet(バランス)、Opus(最強)。そして今年4月、Anthropicは密かにOpusを超える新たなクラス—Mythos級を導入した。最初のMythos級モデル(Claude Mythos Preview)は公開販売されず、代わりに「Project Glasswing」という計画を通じて、米国政府と協力し、少数のサイバーセキュリティ防御機関と重要インフラ事業者にのみ提供された。
理由は明白:このレベルのモデルは非常に強力であり、サイバー攻撃や生物研究などの分野で悪用される可能性があるため、Anthropicは直接公開できないと判断した。
今回発表された二つのモデルは、Mythos級の正式版:
◆ Claude Fable 5:誰でも使えるバージョンで、新しい安全ガードレールを搭載;
◆ Claude Mythos 5:ガードレール部分を解除したバージョンで、信頼されたGlasswingパートナーなどに限定公開。両者は同じ基盤モデルを共有している。名前も工夫されている:Fableはラテン語のfabula(「語られる物語」)に由来し、ギリシャ語のmythosと同源—根本的に同じだが、「自由に話せるかどうか」の違いだけだ。
二、それはどれほど強いのか?
Anthropicの説明によると、Fable 5は同社史上これまで公開されたどのモデルよりも能力が高く、ほぼすべてのAI能力ベンチマークで最先端(SOTA)レベルにある。特にソフトウェアエンジニアリング、知識作業、視覚理解、科学研究に長けている。そして、タスクが長く複雑になるほど、従来モデルに対する優位性は大きくなる。
コードを書く:二ヶ月分の作業を一日に圧縮。決済会社Stripeの早期テストでは、5千万行のRubyコードベースで、Fable 5は一日で全コードベースの移行を完了—当初計画では、チーム全体で二ヶ月以上かかる作業だった。Cognition(Devinの開発元)のFrontierCode評価では、Fable 5は最先端モデルの中で最高スコアを獲得し、トークン消費も少ない。
視覚:ポケモン・火の鳥を素手でクリア。従来のClaudeモデルはポケモンをプレイするのに複雑な補助ツール(地図、ナビゲーション、ゲーム状態情報)が必要だったが、Fable 5は原始的なゲーム画面だけを見て全クリできた。さらに、スクリーンショットからWebアプリのソースコードを直接再構築も可能。
記憶:『殺戮尖塔』のプレイ中にメモを取る。数百万トークンに及ぶ長大なタスクでも、Fable 5は集中力を持続し、自身の書いたメモを活用してパフォーマンスを向上させる。カードゲーム『殺戮尖塔』のテストでは、永続的なファイル記憶を導入後、性能向上はOpus 4.8の三倍に達した。
科学研究:薬物設計の速度を約10倍に向上。Anthropic内部のタンパク質設計の専門家は、Mythos 5を使って薬物設計の一部工程を約十倍高速化した—モデルは人手を介さずに、結合部位の選択、タンパク質設計ツールの実行、失敗からの回復など、通常は科学者が行う全ての工程を独立して完了できる。14の標的タンパク質のうち9つが、次の段階に進む候補薬物として有望と判断された。さらに、大腸菌のタンパク質に関する全く新しいメカニズム仮説も提案し、その後、独立した研究チームによって検証された。
三、ガードレールの仕組み:トリガーされると「ダウングレード」してOpus 4.8に切り替わる
これは今回のリリースの中で最も興味深い設計だ。Fable 5には新しい安全分類器(classifiers)が搭載されている—これはメインモデルとは独立したAIシステムで、潜在的な乱用を検出するためのものだ。分類器があなたのリクエストが以下の三つの敏感分野に関わると判断した場合、Fable 5の代わりに自動的に次に強いモデルであるClaude Opus 4.8に切り替わる(ユーザーには通知される):
1. サイバーセキュリティ:Mythos級モデルはソフトウェアの脆弱性発見と悪用に長けており、「自主ハッキング」も可能—偵察や横展開も一連の流れで行う。これらの能力はサイバー攻撃のコストを大きく下げるため、特に警戒されている。
2. 生物・化学:モデルは既に実世界の研究タスク(例:ウイルスの外殻組み立て予測)をこなせるが、この二重用途の能力は悪用される危険があるため、多くのリクエストはOpusにリダイレクトされる。
3. 蒸留攻撃:誰かが大量にFable 5の能力を抽出し、競合モデルの訓練に使うのを防ぐための措置。
重要な数字:ガードレールは平均して会話の5%未満でトリガーし、つまり95%以上のユーザーはほぼMythos 5の全能力を使い続けている。Anthropicはガードレールの設定が保守的すぎて誤検知も多いと認めており、誤報を減らす努力を続けている。越狱対策では、1000時間以上の外部脆弱性バウンティテストで「万能越狱」は見つかっていない。
もう一つ注目すべき変化は、Mythos級モデルの全トラフィックは30日間保存されることだ(企業も含む)。これは新たな攻撃や越狱に対する防御のためで、Anthropicはこれらのデータを訓練に使わないと約束し、アクセス監査などのプライバシー保護措置も整えている。
四、Mythos 5:信頼できる「無ガードレール」バージョン
Mythos 5はFable 5から一部のガードレールを取り除いたもので、世界最強のサイバーセキュリティ能力を持つと自称している。現在はProject Glasswingを通じてサイバー防御機関にのみ提供されており、Mythos Previewのアップグレード版だ。今後、Anthropicは段階的に拡大を計画している:米国政府と協議し、パートナーを増やす;信頼されたアクセスプログラムを導入し、サイバーセキュリティ組織が申請できるようにする;また、バイオメディカル研究者向けにバイオ版の信頼プログラムも展開し(生化学的ガードレールは解除、サイバーセキュリティのガードレールは維持)、新薬開発を加速させる。この「同じモデルを、身分に応じて段階的に解放する」方式は、前例のないものだ。
五、価格と使い始め:6月22日まで無料期間
APIの価格設定は、6月22日までの期間限定:入力は10ドル/百万トークン、出力は50ドル/百万トークン—これはMythos Previewの半額以下だ。モデル識別子はclaude-fable-5で、APIと従量課金の企業プランは本日から全て利用可能。サブスクユーザーはこのスケジュールに注意:
◆ 今から6月22日まで:Pro、Max、Team、企業版のパッケージにFable 5が無料で含まれる;
◆ 6月23日以降:パッケージから除外され、引き続き使うには利用クレジットを購入する必要がある;容量に余裕があれば、無料期間が延長される可能性も;
◆ その後:計算能力の向上とともに、AnthropicはFable 5をサブスクリプションの標準に戻す予定だ。つまり、今後二週間は最強モデルを無料で試せる絶好の機会だ。興味のある読者はぜひ体験してみてほしい。
六、最後に:能力と安全の「新しい解決策」
過去数年、最先端の研究所は「モデルが強すぎる場合どうするか」に対して、基本的に二つの選択肢しかなかった:公開延期、または能力の制限。Anthropicは今回、新たな第三の答えを示した—全量公開だが、公開版には動的なガードレールを付け、信頼できる機関にはフルバージョンを提供する。
この方法は完璧ではない:誤検知が5%もあれば、一部の専門ユーザー(特に安全研究者や生物学者)には不満が出るだろうし、30日のデータ保持もプライバシーの議論を呼びかねない。しかし、これにより「最強能力」が初めて政府の協力プロジェクトに閉じ込められることなく、誰もがコントロール可能な範囲で利用できるようになった。AIが一日で二ヶ月分のエンジニアリングをこなし、独立してタンパク質薬候補を設計できる時代において、「どう公開するか」は「何を作るか」と同じくらい重要だ。FableとMythosという同源の言葉は、今後の最先端モデルのリリースの標準的なモデルケースになるかもしれない。



















