IplanRIO lançou o Rio 3.5 Open 397B em 13 de junho, anunciando-o como um modelo de IA de fronteira construído pelo governo, com pontuações de benchmarks superando modelos estabelecidos, incluindo Qwen 3.7 Plus. Dias após o lançamento, a empresa de IA Nex publicou uma prova matemática mostrando que o modelo é uma fusão direta de pesos com proporção 0,6 Nex / 0,4 Qwen, com medições de colinearidade de 0,993 em todas as 60 camadas e uma razão de mistura estável de α ≈ 0,571. Posteriormente, o IplanRIO atualizou a ficha do modelo para dar crédito à Nex, removeu as alegações de benchmark e atribuiu o problema a um “envio incorreto” de uma versão base mesclada, em vez de um modelo final destilado. A disputa se concentra em padrões de atribuição no desenvolvimento de IA open-source, em que construir sobre modelos abertos com pesos já existentes é uma prática comum, mas exige crédito explícito a todos os modelos de origem sob termos de licenciamento como Apache 2.0 e MIT.

IplanRIO Releases Rio 3.5 Model on June 13

O IplanRIO do Rio de Janeiro lançou o Rio 3.5 em 13 de junho. A agência de TI da cidade descreveu o modelo como de classe de fronteira, com 397 bilhões de parâmetros e licença open-source permissiva, desenvolvido pelo governo municipal. O lançamento coincidiu com a abertura da Copa do Mundo do Brasil, e comentários sobre o modelo se espalharam rapidamente do Brasil para públicos internacionais.

A ficha original do modelo descrevia o Rio 3.5 como um pós-treino de Qwen 3.5 397B, modelo open-base da Alibaba, com uma camada de raciocínio chamada SwiReasoning adicionada por cima. O custo de desenvolvimento reportado foi de R$500.000, aproximadamente US$ 100.000 USD. A arquitetura usa Mixture-of-Experts, ativando cerca de 17 bilhões dos 397 bilhões de parâmetros por token. O modelo suporta visão e texto, lida com mais de uma dúzia de idiomas e é disponibilizado sob uma licença MIT.

SwiReasoning é uma estrutura de inferência sem treinamento que alterna entre dois modos. Quando o modelo está confiante sobre a próxima palavra — entropia baixa na distribuição de probabilidade — ele raciocina em linguagem simples. Quando incerto, ele muda para raciocínio latente em estados internos ocultos sem emitir tokens.

As pontuações de benchmark autorrelatadas incluíam Terminal-Bench 2.1 a 70,8%, superando Qwen 3.7 Plus a 70,3% e DeepSeek v4 Pro a 67,9%. No IMOAnswerBench, o Rio 3.5 marcou 89,5%. Em HLE — Humanity's Last Exam — o Rio 3.5 ficou em 36,5%, à frente dos 34,7% do Qwen 3.7 Plus. O prefeito do Rio de Janeiro Eduardo Cavaliere twittou sobre o lançamento, dizendo: “Um modelo de IA aberto treinado no Rio e financiado publicamente no último ano por [a Prefeitura do Rio] acabou de superar todos os outros modelos.”

Nex Publishes Mathematical Proof of Weight Merge

A Nex-AGI, uma aliança de IA open-source sediada em Xangai, postou no X dias após o lançamento. A análise afirmou: “O modelo Rio 3.5 quebrou a internet esta semana. A reviravolta? É essencialmente nosso modelo open-source, Nex N2 Pro, usando um chapéu diferente.” A Nex analisou os pesos e reportou a fórmula: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Um script de verificação e um relatório completo no GitHub foram publicados depois.

As evidências incluíram componentes comportamentais e matemáticos. A Nex removeu do modelo implantado o prompt de sistema fixo “You are Rio” e enviou 120 perguntas de identidade. Sem o prompt, a Nex relata que o modelo se identificou como “Nex, from Nex-AGI” 79,2% das vezes e como “Rio” 0% das vezes. O modelo recitou exatamente o histórico específico da Nex, mencionando o “Shanghai Innovation Institute” e “uma aliança de ecossistema de modelos de grande porte”.

Matematicamente, a Nex mediu a colinearidade em todas as 60 camadas. O resultado voltou em 0,993. A razão de mistura ficou em α ≈ 0,571, estável até três casas decimais. A Nex afirmou: “Todo tensor de pesos no Rio é, a milhares de desvios-padrão, a mesma mistura 0,6/0,4 de Nex e Qwen — em todas as 60 camadas e em cada componente da rede. Não há explicação inocente.”

O Nex N2 Pro, lançado dias antes do Rio 3.5, marca 75,3% no Terminal-Bench 2.1 — acima dos 70,8% do Rio. No GDPval, um benchmark de previsão econômica, a Nex está em 1.585 contra 1.533 do Rio.

IplanRIO Updates Model Card and Credits Nex

O IplanRIO atualizou a ficha do modelo no Hugging Face. A tabela de benchmarks foi removida e a atribuição foi alterada. O Readme atualizado afirma: “O modelo é construído via uma fusão de nex-agi/Nex-N2-Pro e Qwen/Qwen3.5-397B-A17B, precedida por On-Policy Distillation a partir de um modelo mais forte. Detectamos um envio incorreto na versão anterior, em que a versão base mesclada foi enviada em vez do modelo final destilado. Pedimos desculpas pela confusão e nos desculpamos de forma intensa.”

Nenhuma outra declaração pública do IplanRIO foi divulgada. Agora a Nex é creditada na ficha do modelo. A explicação de “envio incorreto” afirma que o lançamento pretendido era uma versão destilada da base mesclada, e não a própria fusão “crua”. On-policy distillation envolve um modelo docente mais forte gerando saídas, enquanto o aluno treina nessas saídas e gera as próprias.

O IplanRIO afirmou que está trabalhando para enviar o modelo corrigido e destilado, com atribuição completa no lugar.

Community Debate on Attribution Standards

A fusão de modelos é legal sob as licenças envolvidas. O Nex N2 Pro é Apache 2.0, permitindo uso, modificação e redistribuição com atribuição. O Qwen 3.5 é licenciado de forma aberta. A questão se concentrou em apresentar a saída como trabalho desenvolvido de forma independente sem nomear todos os modelos de origem.

O comentarista de tecnologia Rafael Quintanilha observou que, como o Nex N2 Pro é construído sobre o Qwen, o time pode ter creditado a arquitetura subjacente e deixado isso aí. Ele apontou que o modelo viralizou durante uma partida da Copa do Mundo, “não necessariamente ‘pronto para consumo público’.” O desenvolvedor Lucas Montano disse que “fundir dois modelos de classe ~400B e então aplicar policy distillation não é trivial”, enquanto reconhecia um erro técnico e uma falha de comunicação.

O pesquisador de IA Diego Ambrosio notou que o lançamento original descreveu o Rio 3.5 como resultado de “pós-treino autônomo e fine-tuning proprietário” — enquadrando isso como pesquisa original, e não uma fusão.

A Nex escreveu no X: “Ficamos lisonjeados de que a Cidade do Rio tenha usado nosso trabalho para alcançar desempenho SOTA. Mas, no mundo open-source, a atribuição importa.”

FAQ

What did IplanRIO release on June 13?

O IplanRIO lançou o Rio 3.5 Open 397B em 13 de junho, descrito como um modelo de IA de fronteira construído pelo governo, com 397 bilhões de parâmetros, arquitetura Mixture-of-Experts e pontuações de benchmarks incluindo 70,8% no Terminal-Bench 2.1, 89,5% no IMOAnswerBench e 36,5% no HLE. O modelo foi lançado sob uma licença MIT, com custo de desenvolvimento reportado de R$500.000.

What did Nex's mathematical analysis show about Rio 3.5?

A Nex publicou uma prova matemática mostrando que o Rio 3.5 é uma fusão direta de pesos com a fórmula: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. A análise mediu colinearidade em 0,993 em todas as 60 camadas, com uma razão de mistura estável de α ≈ 0,571. Testes de identidade mostraram que o modelo se identificou como “Nex, from Nex-AGI” 79,2% das vezes e como “Rio” 0% das vezes quando o prompt de sistema fixado foi removido.

How did IplanRIO respond to Nex's findings?

O IplanRIO atualizou a ficha do modelo no Hugging Face para creditar a Nex, removeu as alegações de benchmark e afirmou: “Detectamos um envio incorreto na versão anterior, em que a versão base mesclada foi enviada em vez do modelo final destilado.” A ficha atualizada descreve o modelo como “construído via uma fusão de nex-agi/Nex-N2-Pro e Qwen/Qwen3.5-397B-A17B, precedida por On-Policy Distillation a partir de um modelo mais forte.” O IplanRIO afirmou que está trabalhando para enviar o modelo destilado corrigido, com atribuição completa.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

6h atrás

Nex revela que Rio 3,5 é 0,6/0,4 na mesclagem de pesos Nex-Qwen em 14 de junho

12h atrás

DGrid AI lança paper de pesquisa PoQ-Judge, reduzindo em 72% os custos de avaliação da qualidade de LLMs

15h atrás

Modelo Rio-3.5-Open-397B Acusado de Ser uma “Casca” do Qwen3.5 e do NexN2Pro Dentro de 24 Horas Após o Lançamento

IREN adquire a Nostrum Group, com sede na Espanha, por energia para data centers de IA de 490 MW

Ethan Brooks6h atrás

A AMD ultrapassa a $900B de valor de mercado enquanto o Ryzen AI Halo desafia o Nvidia DGX com faíscas

Oliver Grant11h atrás

Líderes de IA Debatem Diferenciação de Modelos e Oportunidade de Inteligência Corporificada da China na Conferência Zhiyuan

Oliver Grant15h atrás

ChatGPT Pro Entrega Valor em IA de US$ 14.000 em Teste de Assinatura do Semianalysis

Oliver Grant06-13 19:28

Bittensor dispara 16% após ordem de desligamento do modelo de IA da Anthropic

Oliver Grant06-13 16:15

Comentário

0/400

Sem comentários