IplanRIOは6月13日、Rio 3.5 Open 397Bをリリースし、既存のモデルを上回るベンチマークスコア(Qwen 3.7 Plusを含む)を持つ「政府が構築したフロンティアAIモデル」であると打ち出した。リリースから数日後、AI企業Nexは、このモデルが直接的な0.6 Nex / 0.4 Qwenの重みマージであることを示す数学的証明を公開した。さらに、全60層にわたるコリニアリティ測定が0.993で、混合比がα ≈ 0.571と安定しているとも述べた。IplanRIOはその後、モデルカードを更新してNexへのクレジットを付与し、ベンチマークの主張を削除し、「最終的に蒸留したモデルではなく、ベースのマージ版を誤ってアップロードした」という問題だとした。争点は、オープンソースAI開発における帰属(アトリビューション)の基準である。既存のオープン・オープンウェイト・モデルの上に構築することは一般的だが、Apache 2.0やMITのようなライセンス条件に基づき、参照元モデルすべてへの明確なクレジットが必要になる。
ブラジルのリオデジャネイロにあるIplanRIOは、6月13日にRio 3.5をリリースした。市のIT当局は、3970億パラメータを持つフロンティア級のモデルで、自治体が開発した寛容なオープンソースライセンスだと説明した。リリースはブラジルのワールドカップ開幕戦と時期が重なり、モデルに関するコメントがブラジルから国際的な視聴者へ急速に広まった。
当初のモデルカードでは、Rio 3.5はQwen 3.5 397Bのポストトレインで、Alibabaのオープンベースモデルに、上からSwiReasoningという推論レイヤーを追加したものだと述べていた。報告された開発費はR$500,000で、約$100,000 USDだった。アーキテクチャはMixture-of-Expertsを使用し、トークンごとに3970億パラメータのうち約170億が有効化される。モデルはビジョンとテキストに対応し、12以上の言語を扱い、MITライセンスのもとで提供される。
SwiReasoningは、トレーニング不要の推論フレームワークで、2つのモードを切り替える。モデルが次の単語に自信がある場合(確率分布の低エントロピー)には、平易な言葉で推論する。不確かな場合は、トークンを出さずに、隠れた内部状態で潜在的な推論へ切り替える。
自己申告のベンチマークスコアには、Terminal-Bench 2.1が70.8%含まれ、Qwen 3.7 Plusの70.3%やDeepSeek v4 Proの67.9%をわずかに上回った。IMOAnswerBenchではRio 3.5が89.5%を記録した。HLE—Humanity's Last Exam—ではRio 3.5が36.5%で、Qwen 3.7 Plusの34.7%を上回った。リオデジャネイロ市長エドゥアルド・カヴァリ―エーレはリリースについてツイートし、「リオで訓練され、[リオの自治体]により過去1年間にわたって公的資金で賄われたオープンAIモデルが、他のあらゆるモデルをただ超えたところです。」と述べた。
Nex-AGI(上海拠点のオープンソースAI連盟)は、リリースから数日後にXへ投稿した。分析は次のように述べた。「今週、Rio 3.5モデルがインターネットを壊した。どんでん返し?それは実質、私たちのオープンソースモデルNex N2 Proが、別の帽子をかぶっているだけです。」Nexは重みを解析し、次の式を報告した。Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。検証スクリプトと、完全なGitHubレポートが続いた。
根拠には、行動面と数学面の両方が含まれていた。Nexは、デプロイされたモデルからハードコードされた「You are Rio(あなたはRioです)」というシステムプロンプトを取り除き、アイデンティティ質問を120問送った。プロンプトがない状態で、Nexはそのモデルが「Nex, from Nex-AGI」と名乗った割合が79.2%で、「Rio」は0%だったと報告している。モデルはNexの固有の来歴を逐語的に読み上げ、「Shanghai Innovation Institute」や「大規模モデル・エコシステムの連合」について言及した。
数学的には、Nexは全60層にわたってコリニアリティを測定した。その結果は0.993だった。混合比はα ≈ 0.571に保たれ、小数第3位まで安定していると述べた。Nexは次のように言った。「Rioのあらゆる重みテンソルは、数千の標準偏差の単位で見れば、NexとQwenの0.6/0.4のブレンドと同一です。全60層にわたって、ネットワークのあらゆる構成要素においてです。無実の説明など存在しません。」
Rio 3.5の数日前にリリースされたNex N2 Proは、Terminal-Bench 2.1で75.3%を獲得しており、Rioの70.8%より高い。経済予測ベンチマークであるGDPvalでは、Nexは1,585で、Rioの1,533に対して上回っている。
IplanRIOはHugging Faceのモデルカードを更新した。ベンチマーク表は削除され、帰属(アトリビューション)が変更された。更新されたReadmeは次のように述べている。「当該モデルは、nex-agi/Nex-N2-ProとQwen/Qwen3.5-397B-A17Bのマージにより構築されており、より強力なモデルからのオンポリシー蒸留が先行しています。前バージョンでは誤ったアップロードを検出しました。最終的な蒸留モデルではなく、ベースのマージ版がアップロードされていました。混乱を招いたことをお詫びし、心より申し訳なく思っております。」
IplanRIOからの他の公開声明はない。Nexは現在、モデルカードでクレジットされている。「誤ったアップロード」の説明では、意図していたリリースは、マージされたベースの生のマージそのものではなく、蒸留版だったと主張している。オンポリシー蒸留では、より強い教師モデルが出力を生成し、生徒モデルがその出力を使って訓練し、その後生徒が独自に出力を生成する。
IplanRIOは、完全な帰属を反映した修正版の蒸留モデルをアップロードするために取り組んでいると述べた。
モデルのマージは、関係するライセンスの範囲内で合法である。Nex N2 ProはApache 2.0で、クレジット付きでの利用、改変、再配布を認めている。Qwen 3.5もオープンなライセンスで提供されている。この問題は、出力を独立して開発した成果のように提示しつつ、参照元モデルすべてに名前を付けないことにあった。
技術コメンテーターのラファエル・クイントゥアニリャは、Nex N2 ProはQwenの上に構築されているため、チームが基盤となるアーキテクチャのクレジットを付けて、それをそのままにしていた可能性があると指摘した。また、モデルがワールドカップの試合中にバイラル化した点を挙げ、「必ずしも『一般公開に備えた状態』ではない」と述べた。開発者のルーカス・モンターノは、「2つの約400B級モデルをマージしてから、ポリシー蒸留を適用することは簡単ではない」と述べつつ、技術的なエラーとコミュニケーション上の失敗の両方があったことを認めた。
AI研究者のディエゴ・アンブロージョは、当初のローンチではRio 3.5を「自律的なポストトレーニングと、独自のファインチューニングの結果」と説明していたことを指摘し、その表現からは、マージではなく元の研究であるかのような含意があったと述べた。
NexはXにこう書いた。「リオの市が私たちの仕事を使ってSOTAの性能を達成したことを光栄に思います。しかしオープンソースの世界では、帰属が重要です。」
IplanRIOは6月13日に何をリリースしましたか?
IplanRIOは6月13日にRio 3.5 Open 397Bをリリースした。政府が構築したフロンティアAIモデルで、3970億パラメータ、Mixture-of-Expertsのアーキテクチャ、そしてTerminal-Bench 2.1で70.8%、IMOAnswerBenchで89.5%、HLE—Humanity's Last Exam—で36.5%を含むベンチマークスコアがあると説明されている。モデルはMITライセンスのもとでリリースされ、開発費はR$500,000と報告されている。
Nexの数学的分析は、Rio 3.5について何を示しましたか?
Nexは、Rio 3.5が次の式による直接の重みマージであることを示す数学的証明を公開した。Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。分析では、全60層でコリニアリティが0.993であることを測定し、混合比がα ≈ 0.571と安定していることを示した。アイデンティティテストでは、ハードコードされたシステムプロンプトを削除すると、モデルが「Nex, from Nex-AGI」と名乗ったのが79.2%のときで、「Rio」は0%だったことが分かった。
IplanRIOはNexの調査結果にどう対応しましたか?
IplanRIOはHugging Faceのモデルカードを更新してNexをクレジットし、ベンチマークの主張を削除し、こう述べた。「前バージョンにおいて誤ったアップロードを検出しました。そこでは、最終的な蒸留モデルではなく、ベースのマージ版がアップロードされていました。」更新されたカードでは、モデルを「より強力なモデルからのオンポリシー蒸留が先行し、nex-agi/Nex-N2-ProとQwen/Qwen3.5-397B-A17Bのマージによって構築された」と説明している。IplanRIOは、完全な帰属を伴う修正済みの蒸留モデルをアップロードするよう取り組んでいると述べた。
関連ニュース
IREN社がスペイン拠点のNostrum Groupを490 MWのAIデータセンターパワーで買収
AMDが$900B の時価総額を上回り、Ryzen AI HaloがNvidia DGXに挑戦
AIリーダーがモデルの差別化と「中国の体現型インテリジェンス」の機会を知遠カンファレンスで議論
ChatGPT Pro、セミアナリシスのサブスクリプション試験で14,000ドル相当のAI価値を提供
ビットテンサー、AnthropicのAIモデル停止命令を受けて16%上昇