Модель Rio 3,5 від IplanRIO підтвердилася як Nex Weight Merge у спорі щодо атрибуції

IplanRIO випустила Rio 3.5 Open 397B 13 червня, позиціонуючи її як урядовий прикордонний AI-модуль із бенчмарк-показниками, що перевершили вже відомі моделі, зокрема Qwen 3.7 Plus. Через кілька днів після релізу AI-компанія Nex опублікувала математичний доказ, що модель є прямим злиттям ваг у співвідношенні 0,6 Nex / 0,4 Qwen, із вимірами колінеарності 0,993 у всіх 60 шарах і стабільним коефіцієнтом змішування α ≈ 0,571. Після цього IplanRIO оновила картку моделі, додавши Nex, прибрала заяви про бенчмарки та приписала інцидент «некоректному завантаженню» базової злитої версії замість фінальної дистильованої моделі. Спір зосереджений на стандартах атрибуції в розробці відкритого коду AI, де опора на наявні відкриті моделі з вагами є поширеною практикою, але потребує явного зазначення всіх моделей-джерел відповідно до ліцензійних умов, як-от Apache 2.0 та MIT.

IplanRIO Releases Rio 3.5 Model on June 13

IplanRIO з Ріо-де-Жанейро випустила Rio 3.5 13 червня. Міське ІТ-агентство описало її як модель прикордонного класу з 397 мільярдами параметрів і ліберальною ліцензією на відкритий код, розроблену муніципальним урядом. Реліз збігся з першим матчем Бразилії на Кубку світу, а коментарі щодо моделі швидко поширилися з Бразилії на міжнародну аудиторію.

Оригінальна картка моделі описувала Rio 3.5 як посттренування Qwen 3.5 397B — відкритої базової моделі Alibaba — з доданим зверху шаром міркувань під назвою SwiReasoning. Повідомлена вартість розробки становила R$500,000, приблизно $100,000 USD. Архітектура використовує Mixture-of-Experts, активуючи близько 17 мільярдів із 397 мільярдів параметрів на токен. Модель підтримує зір і текст, обробляє понад десяток мов і постачається під ліцензією MIT.

SwiReasoning — це фреймворк для інференсу без тренування, який перемикається між двома режимами. Коли модель упевнена щодо наступного слова — низька ентропія у розподілі ймовірностей — вона міркує простою мовою. Коли невпевнена, вона переходить до латентного міркування у прихованих внутрішніх станах, не генеруючи токени.

Самозаявлені бенчмарк-результати включали Terminal-Bench 2.1 на 70,8%, трохи випередивши Qwen 3.7 Plus на 70,3% і DeepSeek v4 Pro на 67,9%. На IMOAnswerBench Rio 3.5 набрала 89,5%. На HLE — Humanity's Last Exam — Rio 3.5 посіла 36,5%, випередивши 34,7% у Qwen 3.7 Plus. Мер Ріо-де-Жанейро Едуардо Кавалієрра у твіті розповів про реліз, заявивши: «Відкрита AI-модель, натренована в Ріо та публічно профінансована протягом останнього року [Муніципалітетом Ріо], щойно випередила всі інші моделі».

Nex Publishes Mathematical Proof of Weight Merge

Nex-AGI, альянс відкритого коду AI зі Шанхаю, опублікував допис у X через кілька днів після релізу. У розборі сказано: «Модель Rio 3.5 зламала інтернет цього тижня. Сюжетний твіст? Насправді це наша open-source модель Nex N2 Pro, що вбралася в інший “капелюх”». Nex проаналізувала ваги й повідомила формулу: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Після цього з’явився скрипт для перевірки та повний звіт на GitHub.

Докази включали і поведінкові, і математичні компоненти. Nex прибрала жорстко закладений системний промпт «You are Rio» з розгорнутої моделі та надіслала 120 тестових питань на ідентичність. Без промпта Nex повідомляє, що модель називала себе «Nex, from Nex-AGI» у 79,2% випадків і «Rio» — у 0% випадків. Модель дослівно відтворила конкретну бексторію Nex, згадуючи «Shanghai Innovation Institute» та «a large-model ecosystem alliance».

Математично Nex виміряла колінеарність у всіх 60 шарах. Результат повернувся на 0,993. Коефіцієнт змішування зберігався на рівні α ≈ 0,571, стабільно до трьох знаків після коми. Nex заявила: «Кожен тензор ваг у Rio — у тисячах стандартних відхилень — це той самий бленд 0,6/0,4 Nex і Qwen, у всіх 60 шарах та в кожному компоненті мережі. Немає “невинного” пояснення».

Nex N2 Pro, випущена за кілька днів до Rio 3.5, набирає 75,3% на Terminal-Bench 2.1 — більше, ніж 70,8% у Rio. На GDPval, бенчмарку економічного прогнозування, Nex має 1 585 проти 1 533 у Rio.

IplanRIO Updates Model Card and Credits Nex

IplanRIO оновила картку моделі на Hugging Face. Бенчмарк-таблицю прибрали, а атрибуцію змінили. Оновлений Readme каже: «Модель зібрано шляхом злиття nex-agi/Nex-N2-Pro та Qwen/Qwen3.5-397B-A17B, перед цим — On-Policy Distillation від сильнішої моделі. Ми виявили некоректне завантаження в попередній версії, де було завантажено базову злиту версію замість фінальної дистильованої моделі. Нам прикро за спричинену плутанину та просимо вибачення в найщирішій формі».

Інших публічних заяв від IplanRIO не з’являлося. Тепер у картці моделі Nex вказано як джерело. Пояснення про «некоректне завантаження» стверджує, що задуманий реліз — це дистильована версія злитої бази, а не саме “сире” злиття. On-policy distillation передбачає, що сильніший teacher-модель генерує відповіді, а студент тренується на цих відповідях і генерує свої власні.

IplanRIO заявила, що працює над завантаженням виправленої дистильованої моделі з повною атрибуцією на місці.

Community Debate on Attribution Standards

Злиття моделей є легальним відповідно до ліцензій, які залучені. Nex N2 Pro має Apache 2.0, що дозволяє використання, модифікацію та перерозподіл із зазначенням авторства. Qwen 3.5 має відкриту ліцензію. Проблема полягала в тому, щоб подати результат як незалежно створену роботу без називання всіх моделей-джерел.

Техкоментатор Рафаель Квінтаньїлья зауважив, що оскільки Nex N2 Pro побудована на Qwen, команда могла кредитувати базову архітектуру й залишити це там. Він підкреслив, що модель стала вірусною під час матчу на Кубку світу: «не обов’язково “готовою для публічного споживання”». Розробник Лукас Монтана сказав, що «злиття двох моделей класу ~400B і потім застосування policy distillation — це не тривіально», водночас визнавши і технічну помилку, і збій комунікації.

AI-дослідник Дієго Амброзіо зауважив, що в оригінальному релізі Rio 3.5 описували як результат «автономного пост-тренування та пропрієтарного fine-tuning», тобто таке формулювання натякало на оригінальне дослідження, а не на злиття.

Nex написала в X: «Ми приємно вражені, що Місто Ріо використало нашу роботу, щоб досягти SOTA. Але у світі open-source атрибуція має значення».

FAQ

Що IplanRIO випустила 13 червня?

IplanRIO випустила Rio 3.5 Open 397B 13 червня, описану як урядовий прикордонний AI-модуль із 397 мільярдами параметрів, архітектурою Mixture-of-Experts та бенчмарк-показниками, зокрема 70,8% на Terminal-Bench 2.1, 89,5% на IMOAnswerBench і 36,5% на HLE. Модель була випущена під ліцензією MIT, а повідомлена вартість розробки — R$500,000.

Що математичний аналіз Nex показав про Rio 3.5?

Nex опублікувала математичний доказ, що Rio 3.5 — це пряме злиття ваг із формулою: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Аналіз виміряв колінеарність на рівні 0,993 у всіх 60 шарах із стабільним коефіцієнтом змішування α ≈ 0,571. Тести на ідентичність показали, що модель самоідентифікувалася як «Nex, from Nex-AGI» у 79,2% випадків і «Rio» — у 0% випадків, коли прибрали жорстко закладений системний промпт.

Як IplanRIO відреагувала на висновки Nex?

IplanRIO оновила картку моделі на Hugging Face, щоб віддати кредит Nex, прибрала заяви про бенчмарки та заявила: «Ми виявили некоректне завантаження в попередній версії, де було завантажено базову злиту версію замість фінальної дистильованої моделі». Оновлена картка описує модель як «збудовану шляхом злиття nex-agi/Nex-N2-Pro і Qwen/Qwen3.5-397B-A17B, перед цим — On-Policy Distillation від сильнішої моделі». IplanRIO заявила, що працює над завантаженням виправленої дистильованої моделі з повною атрибуцією.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів