IplanRIO выпустила Rio 3.5 Open 397B 13 июня, позиционируя его как правительственную фронтирную AI-модель с бенчмарками, превосходящими существующие модели, включая Qwen 3.7 Plus. Через несколько дней после релиза AI-компания Nex опубликовала математическое доказательство, показывающее, что модель представляет собой прямое слияние весов 0.6 Nex / 0.4 Qwen, при этом измеренная коллинеарность составляет 0,993 для всех 60 слоёв, а коэффициент смешивания стабильно равен α ≈ 0,571. Затем IplanRIO обновила модельную карточку, чтобы отдать кредит Nex, убрала заявленные бенчмарк-показатели и объяснила инцидент как «некорректную загрузку» базовой merged-версии вместо финальной distilled-модели. Спор сосредоточен на стандартах атрибуции в open-source разработке AI: построение на существующих open-weight-моделях — распространённая практика, но она требует явного указания всех исходных моделей в соответствии с лицензионными условиями вроде Apache 2.0 и MIT.

IplanRIO Releases Rio 3.5 Model on June 13

IplanRIO из Рио-де-Жанейро выпустила Rio 3.5 13 июня. IT-агентство города охарактеризовало её как модель фронтирного класса с 397 миллиардами параметров и либеральной open-source-лицензией, разработанную муниципальным правительством. Релиз совпал с матчем-открытием чемпионата мира по футболу в Бразилии, и комментарии о модели быстро распространились из Бразилии на международную аудиторию.

В оригинальной модельной карточке Rio 3.5 описывалась как пост-тренинг Qwen 3.5 397B, открытой базовой модели Alibaba, с добавленным сверху reasoning-слоем под названием SwiReasoning. Сообщаемая стоимость разработки составила R$500 тыс., примерно $100 тыс. USD. Архитектура использует Mixture-of-Experts, активируя около 17 миллиардов из 397 миллиардов параметров на токен. Модель поддерживает зрение и текст, обрабатывает более десятка языков и поставляется под лицензией MIT.

SwiReasoning — фреймворк инференса без обучения, который переключает два режима. Когда модель уверена в следующем слове — низкая энтропия в распределении вероятностей — она рассуждает простым языком. Когда уверенности недостаточно, она переключается на латентное reasoning во внутренних скрытых состояниях, не выдавая токены.

Самостоятельно заявленные бенчмарк-показатели включали Terminal-Bench 2.1 на уровне 70,8%, немного опережая Qwen 3.7 Plus (70,3%) и DeepSeek v4 Pro (67,9%). На IMOAnswerBench Rio 3.5 набрала 89,5%. На HLE — Humanity's Last Exam — Rio 3.5 показала 36,5%, опередив результат Qwen 3.7 Plus (34,7%). Мэр Рио-де-Жанейро Эдуардо Кавалиере написал в твиттере о релизе, заявив: «Открытая AI-модель, обученная в Рио и публично профинансированная в течение последнего года [муниципалитетом Рио], только что обогнала все остальные модели».

Nex Publishes Mathematical Proof of Weight Merge

Nex-AGI, альянс open-source AI из Шанхая, опубликовал на X анализ через дни после релиза. В нём говорилось: «На этой неделе модель Rio 3.5 сломала интернет. Сюжетный поворот? По сути это наша open-source-модель Nex N2 Pro, только в другой “шляпе”». Nex проанализировала веса и привела формулу: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Затем последовали скрипт верификации и полный отчёт на GitHub.

Доказательства включали поведенческие и математические компоненты. Nex убрала из развёрнутой модели жёстко заданный system prompt «You are Rio» и задала 120 вопросов на идентичность. Без prompt Nex сообщила, что модель называла себя «Nex, from Nex-AGI» в 79,2% случаев и «Rio» в 0% случаев. Модель дословно пересказала конкретную предысторию Nex, упомянув «Shanghai Innovation Institute» и «a large-model ecosystem alliance».

Математически Nex измерила коллинеарность по всем 60 слоям. Результат вернулся на уровне 0,993. Коэффициент смешивания держался на α ≈ 0,571, стабильно до трёх знаков после запятой. Nex заявила: «Каждый weight tensor в Rio — в пределах тысяч стандартных отклонений — тот же самый blend 0,6/0,4 Nex и Qwen, по всем 60 слоям и по каждому компоненту сети. Никакого “невинного” объяснения не существует».

Nex N2 Pro, выпущенная за дни до Rio 3.5, набирает 75,3% на Terminal-Bench 2.1 — выше, чем 70,8% у Rio. На GDPval, бенчмарке прогнозирования экономики, Nex находится на 1 585 против 1 533 у Rio.

IplanRIO Updates Model Card and Credits Nex

IplanRIO обновила модельную карточку на Hugging Face. Таблица бенчмарков была удалена, а атрибуция изменена. Обновлённый Readme гласит: «Модель собрана через merge nex-agi/Nex-N2-Pro и Qwen/Qwen3.5-397B-A17B, перед которым выполнялась On-Policy Distillation от более сильной модели. Мы обнаружили некорректную загрузку в предыдущей версии: вместо финальной distilled-модели была загружена базовая merged-версия. Мы извиняемся за путаницу и приносим глубокие извинения».

Других публичных заявлений от IplanRIO не публиковалось. Теперь в модельной карточке указан Nex. Объяснение про «некорректную загрузку» утверждает, что задуманный релиз представлял собой distilled-версию merged-базы, а не сам сырой merge. On-policy distillation предполагает, что более сильная teacher-модель генерирует ответы, а студент обучается на этих ответах и затем генерирует свои.

IplanRIO заявила, что работает над загрузкой исправленной distilled-модели с полной атрибуцией.

Community Debate on Attribution Standards

Слияние моделей является законным в рамках задействованных лицензий. Nex N2 Pro — Apache 2.0, что допускает использование, модификацию и перераспространение с указанием авторства. Qwen 3.5 имеет открытое лицензирование. Проблема была в том, что результат выдавался как независимо разработанная работа без указания всех исходных моделей.

Техкомментатор Рафаэль Кинтанилья отметил, что поскольку Nex N2 Pro построена на Qwen, команда могла указать авторство лежащей в основе архитектуры и оставить это там. Он подчеркнул, что модель стала вирусной во время матча на чемпионате мира, «не обязательно “готовой для публичного потребления”». Разработчик Лукас Монтана сказал, что «слияние двух моделей порядка 400B и затем применение policy distillation — это не тривиально», при этом признавая и техническую ошибку, и сбой в коммуникации.

Исследователь AI Диего Амбросио отметил, что в исходном описании релиза Rio 3.5 рассматривалась как результат «автономного пост-тренинга и проприетарного fine-tuning» — это подавалось так, будто это исходные исследования, а не merge.

Nex написала на X: «Мы польщены тем, что город Рио использовал нашу работу, чтобы добиться SOTA-результатов. Но в мире open-source атрибуция имеет значение».

FAQ

Что выпустила IplanRIO 13 июня?

IplanRIO выпустила Rio 3.5 Open 397B 13 июня, описанную как фронтирную AI-модель, построенную правительством, с 397 миллиардами параметров, архитектурой Mixture-of-Experts и бенчмарками, включая 70,8% на Terminal-Bench 2.1, 89,5% на IMOAnswerBench и 36,5% на HLE. Модель была выпущена под лицензией MIT, при этом сообщаемая стоимость разработки составила R$500 тыс.

Что математический анализ Nex показал о Rio 3.5?

Nex опубликовала математическое доказательство, что Rio 3.5 — прямое слияние весов по формуле: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Анализ измерил коллинеарность на уровне 0,993 для всех 60 слоёв при стабильном коэффициенте смешивания α ≈ 0,571. Тесты идентичности показали, что при удалении жёстко заданного system prompt модель идентифицировала себя как «Nex, from Nex-AGI» в 79,2% случаев и как «Rio» в 0% случаев.

Как IplanRIO ответила на выводы Nex?

IplanRIO обновила модельную карточку на Hugging Face, чтобы указать Nex, убрала заявленные бенчмарк-показатели и заявила: «Мы обнаружили некорректную загрузку в предыдущей версии, где была загружена базовая merged-версия вместо финальной distilled-модели». В обновлённой карточке модель описывается как «собранная через merge nex-agi/Nex-N2-Pro и Qwen/Qwen3.5-397B-A17B, перед которой выполнялась On-Policy Distillation от более сильной модели». IplanRIO заявила, что работает над загрузкой исправленной distilled-модели с полной атрибуцией.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

6ч назад

Nex раскрывает Rio 3,5 как 0,6/0,4 Nex-Qwen при слиянии весов 14 июня

12ч назад

DGrid AI выпустила исследовательскую работу PoQ-Judge, сократив расходы на оценку качества LLM на 72%

15ч назад

Модель Rio-3.5-Open-397B обвинили в том, что это просто оболочка Qwen3.5 и NexN2Pro, и заявили об этом в течение 24 часов после запуска

Связанные статьи

IREN приобретает базирующуюся в Испании Nostrum Group для электропитания ЦОД под ИИ мощностью 490 МВт

Ethan Brooks6ч назад

AMD обходит $900B по капитализации рынка, а Ryzen AI Halo бросает вызов Nvidia DGX Spark

Oliver Grant11ч назад