IplanRIO випустила Rio 3.5 Open 397B 13 червня, позиціонуючи її як урядовий прикордонний AI-модуль із бенчмарк-показниками, що перевершили вже відомі моделі, зокрема Qwen 3.7 Plus. Через кілька днів після релізу AI-компанія Nex опублікувала математичний доказ, що модель є прямим злиттям ваг у співвідношенні 0,6 Nex / 0,4 Qwen, із вимірами колінеарності 0,993 у всіх 60 шарах і стабільним коефіцієнтом змішування α ≈ 0,571. Після цього IplanRIO оновила картку моделі, додавши Nex, прибрала заяви про бенчмарки та приписала інцидент «некоректному завантаженню» базової злитої версії замість фінальної дистильованої моделі. Спір зосереджений на стандартах атрибуції в розробці відкритого коду AI, де опора на наявні відкриті моделі з вагами є поширеною практикою, але потребує явного зазначення всіх моделей-джерел відповідно до ліцензійних умов, як-от Apache 2.0 та MIT.
IplanRIO з Ріо-де-Жанейро випустила Rio 3.5 13 червня. Міське ІТ-агентство описало її як модель прикордонного класу з 397 мільярдами параметрів і ліберальною ліцензією на відкритий код, розроблену муніципальним урядом. Реліз збігся з першим матчем Бразилії на Кубку світу, а коментарі щодо моделі швидко поширилися з Бразилії на міжнародну аудиторію.
Оригінальна картка моделі описувала Rio 3.5 як посттренування Qwen 3.5 397B — відкритої базової моделі Alibaba — з доданим зверху шаром міркувань під назвою SwiReasoning. Повідомлена вартість розробки становила R$500,000, приблизно $100,000 USD. Архітектура використовує Mixture-of-Experts, активуючи близько 17 мільярдів із 397 мільярдів параметрів на токен. Модель підтримує зір і текст, обробляє понад десяток мов і постачається під ліцензією MIT.
SwiReasoning — це фреймворк для інференсу без тренування, який перемикається між двома режимами. Коли модель упевнена щодо наступного слова — низька ентропія у розподілі ймовірностей — вона міркує простою мовою. Коли невпевнена, вона переходить до латентного міркування у прихованих внутрішніх станах, не генеруючи токени.
Самозаявлені бенчмарк-результати включали Terminal-Bench 2.1 на 70,8%, трохи випередивши Qwen 3.7 Plus на 70,3% і DeepSeek v4 Pro на 67,9%. На IMOAnswerBench Rio 3.5 набрала 89,5%. На HLE — Humanity's Last Exam — Rio 3.5 посіла 36,5%, випередивши 34,7% у Qwen 3.7 Plus. Мер Ріо-де-Жанейро Едуардо Кавалієрра у твіті розповів про реліз, заявивши: «Відкрита AI-модель, натренована в Ріо та публічно профінансована протягом останнього року [Муніципалітетом Ріо], щойно випередила всі інші моделі».
Nex-AGI, альянс відкритого коду AI зі Шанхаю, опублікував допис у X через кілька днів після релізу. У розборі сказано: «Модель Rio 3.5 зламала інтернет цього тижня. Сюжетний твіст? Насправді це наша open-source модель Nex N2 Pro, що вбралася в інший “капелюх”». Nex проаналізувала ваги й повідомила формулу: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Після цього з’явився скрипт для перевірки та повний звіт на GitHub.
Докази включали і поведінкові, і математичні компоненти. Nex прибрала жорстко закладений системний промпт «You are Rio» з розгорнутої моделі та надіслала 120 тестових питань на ідентичність. Без промпта Nex повідомляє, що модель називала себе «Nex, from Nex-AGI» у 79,2% випадків і «Rio» — у 0% випадків. Модель дослівно відтворила конкретну бексторію Nex, згадуючи «Shanghai Innovation Institute» та «a large-model ecosystem alliance».
Математично Nex виміряла колінеарність у всіх 60 шарах. Результат повернувся на 0,993. Коефіцієнт змішування зберігався на рівні α ≈ 0,571, стабільно до трьох знаків після коми. Nex заявила: «Кожен тензор ваг у Rio — у тисячах стандартних відхилень — це той самий бленд 0,6/0,4 Nex і Qwen, у всіх 60 шарах та в кожному компоненті мережі. Немає “невинного” пояснення».
Nex N2 Pro, випущена за кілька днів до Rio 3.5, набирає 75,3% на Terminal-Bench 2.1 — більше, ніж 70,8% у Rio. На GDPval, бенчмарку економічного прогнозування, Nex має 1 585 проти 1 533 у Rio.
IplanRIO оновила картку моделі на Hugging Face. Бенчмарк-таблицю прибрали, а атрибуцію змінили. Оновлений Readme каже: «Модель зібрано шляхом злиття nex-agi/Nex-N2-Pro та Qwen/Qwen3.5-397B-A17B, перед цим — On-Policy Distillation від сильнішої моделі. Ми виявили некоректне завантаження в попередній версії, де було завантажено базову злиту версію замість фінальної дистильованої моделі. Нам прикро за спричинену плутанину та просимо вибачення в найщирішій формі».
Інших публічних заяв від IplanRIO не з’являлося. Тепер у картці моделі Nex вказано як джерело. Пояснення про «некоректне завантаження» стверджує, що задуманий реліз — це дистильована версія злитої бази, а не саме “сире” злиття. On-policy distillation передбачає, що сильніший teacher-модель генерує відповіді, а студент тренується на цих відповідях і генерує свої власні.
IplanRIO заявила, що працює над завантаженням виправленої дистильованої моделі з повною атрибуцією на місці.
Злиття моделей є легальним відповідно до ліцензій, які залучені. Nex N2 Pro має Apache 2.0, що дозволяє використання, модифікацію та перерозподіл із зазначенням авторства. Qwen 3.5 має відкриту ліцензію. Проблема полягала в тому, щоб подати результат як незалежно створену роботу без називання всіх моделей-джерел.
Техкоментатор Рафаель Квінтаньїлья зауважив, що оскільки Nex N2 Pro побудована на Qwen, команда могла кредитувати базову архітектуру й залишити це там. Він підкреслив, що модель стала вірусною під час матчу на Кубку світу: «не обов’язково “готовою для публічного споживання”». Розробник Лукас Монтана сказав, що «злиття двох моделей класу ~400B і потім застосування policy distillation — це не тривіально», водночас визнавши і технічну помилку, і збій комунікації.
AI-дослідник Дієго Амброзіо зауважив, що в оригінальному релізі Rio 3.5 описували як результат «автономного пост-тренування та пропрієтарного fine-tuning», тобто таке формулювання натякало на оригінальне дослідження, а не на злиття.
Nex написала в X: «Ми приємно вражені, що Місто Ріо використало нашу роботу, щоб досягти SOTA. Але у світі open-source атрибуція має значення».
Що IplanRIO випустила 13 червня?
IplanRIO випустила Rio 3.5 Open 397B 13 червня, описану як урядовий прикордонний AI-модуль із 397 мільярдами параметрів, архітектурою Mixture-of-Experts та бенчмарк-показниками, зокрема 70,8% на Terminal-Bench 2.1, 89,5% на IMOAnswerBench і 36,5% на HLE. Модель була випущена під ліцензією MIT, а повідомлена вартість розробки — R$500,000.
Що математичний аналіз Nex показав про Rio 3.5?
Nex опублікувала математичний доказ, що Rio 3.5 — це пряме злиття ваг із формулою: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Аналіз виміряв колінеарність на рівні 0,993 у всіх 60 шарах із стабільним коефіцієнтом змішування α ≈ 0,571. Тести на ідентичність показали, що модель самоідентифікувалася як «Nex, from Nex-AGI» у 79,2% випадків і «Rio» — у 0% випадків, коли прибрали жорстко закладений системний промпт.
Як IplanRIO відреагувала на висновки Nex?
IplanRIO оновила картку моделі на Hugging Face, щоб віддати кредит Nex, прибрала заяви про бенчмарки та заявила: «Ми виявили некоректне завантаження в попередній версії, де було завантажено базову злиту версію замість фінальної дистильованої моделі». Оновлена картка описує модель як «збудовану шляхом злиття nex-agi/Nex-N2-Pro і Qwen/Qwen3.5-397B-A17B, перед цим — On-Policy Distillation від сильнішої моделі». IplanRIO заявила, що працює над завантаженням виправленої дистильованої моделі з повною атрибуцією.
Пов’язані новини
IREN купує базовану в Іспанії Nostrum Group потужністю 490 МВт для електроживлення AI дата-центру
AMD перевершує $900B за ринковою капіталізацією, а Ryzen AI Halo кидає виклик Nvidia DGX
Лідери в сфері ШІ обговорюють диференціацію моделей і можливості Китаю в напрямі втіленого інтелекту на конференції Zhiyuan
ChatGPT Pro забезпечує 14 000 доларів США вартості AI у тесті підписки Semianalysis
Bittensor зростає на 16% після розпорядження про зупинку AI-моделі Anthropic