أطلقت IplanRIO نموذج Rio 3.5 Open 397B في 13 يونيو، وقدّمتُه على أنه نموذج ذكاء اصطناعي حدّيّ بُني من قِبل الحكومة، مع نتائج معيارية تتصدر النماذج الراسخة بما في ذلك Qwen 3.7 Plus. بعد أيام من الإطلاق، نشرَت شركة الذكاء الاصطناعي Nex برهانًا رياضيًا يُظهر أن النموذج عبارة عن دمجٍ مباشر لأوزان بنسبة 0.6 Nex / 0.4 Qwen، مع قياسات التلازم الخطي (collinearity) عند 0.993 عبر جميع الطبقات الـ60، ونسبة خلط مستقرة تبلغ α ≈ 0.571. بعد ذلك، حدّثت IplanRIO بطاقة النموذج لمنح Nex الفضل، وأزالت ادعاءات الاختبارات المعيارية، ونسبت المشكلة إلى "تحميل غير صحيح" لنسخة مدمجة أولية بدلًا من نموذج نهائي مُقطّر (distilled). يتمحور الخلاف حول معايير نسبة الفضل في تطوير الذكاء الاصطناعي مفتوح المصدر، حيث يعدّ البناء على نماذج مفتوحة الأوزان ممارسة شائعة، لكنه يتطلب إقرارًا صريحًا بجميع نماذج المصدر وفق شروط الترخيص مثل Apache 2.0 وMIT.
أطلقت IplanRIO في مدينة ريو دي جانيرو نموذج Rio 3.5 في 13 يونيو. وصفت وكالة تقنية المدينة النموذج بأنه من فئة "حدّيّة" مع 397 مليار معلمة وترخيص مفتوح المصدر مرن، جرى تطويره بواسطة الحكومة البلدية. تزامن الإطلاق مع افتتاح كأس العالم في البرازيل، وانتشرت التعليقات حول النموذج بسرعة من البرازيل إلى جماهير دولية.
كانت بطاقة النموذج الأصلية قد وصفت Rio 3.5 بأنه تدريب بعدي (post-train) لـ Qwen 3.5 397B، وهو نموذج open-base من Alibaba، مع إضافة طبقة استدلال تسمى SwiReasoning فوقه. كانت تكلفة التطوير المبلغ عنها R$500,000، أي ما يعادل تقريبًا 100,000 دولار أمريكي. تستخدم البنية Mixture-of-Experts، حيث تُفعِّل نحو 17 مليار من أصل 397 مليار معلمة لكل رمز (token). يدعم النموذج الرؤية والنص، ويتعامل مع أكثر من اثنتي عشرة لغة، ويأتي تحت رخصة MIT.
SwiReasoning هو إطار استدلال (inference) خالٍ من التدريب (training-free) يبدّل بين وضعين. عندما يكون النموذج واثقًا بشأن الكلمة التالية—أي تَدنّي الاضطراب/اللايقين (low entropy) في توزيع الاحتمالات—يُجري الاستدلال بلغةٍ واضحة. وعندما يكون غير متأكد، ينتقل إلى استدلالٍ كامن داخل حالات داخلية مخفية دون إصدار رموز.
تضمنت نتائج الاختبارات المعيارية الذاتية المبلغ عنها Terminal-Bench 2.1 بنسبة 70.8%، متفوقًا على Qwen 3.7 Plus بنسبة 70.3% وDeepSeek v4 Pro بنسبة 67.9%. وعلى IMOAnswerBench، سجل Rio 3.5 نسبة 89.5%. وعلى HLE—امتحان البشرية الأخير (Humanity's Last Exam)—حقق Rio 3.5 نسبة 36.5%، متقدمًا على Qwen 3.7 Plus التي سجلت 34.7%. وغرّد عمدة ريو دي جانيرو إدواردو كافالييرو (Eduardo Cavaliere) بشأن الإطلاق، قائلًا: "نموذج ذكاء اصطناعي مفتوح تم تدريبه في ريو وتم تمويله علنًا خلال العام الماضي بواسطة [بلدية ريو]، وقد تجاوز للتو جميع النماذج الأخرى."
نشر تحالف Nex-AGI مفتوح المصدر للذكاء الاصطناعي ومقره شنغهاي على X بعد أيام من الإطلاق. جاء في التحليل: "لقد كسر نموذج Rio 3.5 الإنترنت هذا الأسبوع. حبكة التحول؟ إنه عمليًا نموذجنا مفتوح المصدر Nex N2 Pro، مرتديًا قبعةً مختلفة." حللت Nex الأوزان وقدّمت المعادلة: Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5. وتبعتها سكربت للتحقق وتقرير كامل على GitHub.
اشتملت الأدلة على مكونات سلوكية ورياضية. أزالت Nex من النموذج المُنشر التوجيه النظامي الثابت (hardcoded) "You are Rio" وأرسلت 120 سؤالًا لتحديد الهوية. وبدون التوجيه، تفيد Nex بأن النموذج عرّف نفسه "Nex, from Nex-AGI" بنسبة 79.2% من المرات و"Rio" بنسبة 0% من المرات. وتلا النموذج سيرة Nex الخلفية المحددة حرفيًا، مع ذكر "Shanghai Innovation Institute" و"تحالف منظومة نماذج كبيرة (large-model ecosystem)".
رياضيًا، قاست Nex التلازم الخطي عبر جميع الطبقات الـ60. جاءت النتيجة عند 0.993. وظلت نسبة المزج ثابتة عند α ≈ 0.571، مستقرة حتى ثلاث منازل عشرية. وذكرت Nex: "كل موتر أوزان (weight tensor) في Rio هو، بما يعادل آلاف الانحرافات المعيارية، المزج نفسه 0.6/0.4 بين Nex وQwen—عبر جميع الطبقات الـ60 ولكل مكوّن من مكونات الشبكة. لا توجد أي تبريرات بريئة."
يسجل Nex N2 Pro، الذي أُطلق قبل أيام من Rio 3.5، نسبة 75.3% على Terminal-Bench 2.1—أعلى من 70.8% التي حققها Rio. وعلى GDPval، وهو معيار للتنبؤ الاقتصادي، تقف Nex عند 1,585 مقابل 1,533 لدى Rio.
حدّثت IplanRIO بطاقة نموذج Hugging Face. تمت إزالة جدول الاختبارات المعيارية وتغيير نسبة الفضل. ينصّ Readme المحدث على: "تم بناء النموذج عبر دمج nex-agi/Nex-N2-Pro وQwen/Qwen3.5-397B-A17B، بما يسبقه تقطير ضمن السياسات (On-Policy Distillation) من نموذج أقوى. اكتشفنا تحميلًا غير صحيح في النسخة السابقة، حيث تم رفع النسخة المدمجة الأساسية بدلًا من النموذج النهائي المُقطّر. نعتذر عن الالتباس ونعتذر بشدة."
لم يصدر أي بيان عام آخر من IplanRIO. تُنسب الآن Nex في بطاقة النموذج. تدّعي تفسيرات "التحميل غير الصحيح" أن النسخة المقصودة للإطلاق كانت نسخة مُقطّرة من الأساس المدمج، وليست الدمج الخام ذاته. يتضمن التقطير ضمن السياسات نموذج معلم (teacher) أقوى ينتج المخرجات، بينما يتدرب الطالب (student) على تلك المخرجات ويولد مخرجاته الخاصة.
ذكرت IplanRIO أنها تعمل على رفع النموذج المُقطّر المصحح مع وضع نسبة الفضل كاملة.
يُعدّ دمج النماذج مسموحًا قانونيًا وفق الرخص المعنية. Nex N2 Pro مرخص بـ Apache 2.0، ما يتيح الاستخدام والتعديل وإعادة التوزيع مع الإشارة بالفضل. Qwen 3.5 مرخص بشكل مفتوح. تمحور الخلاف حول تقديم المخرجات على أنها عملٌ مُطوّر بشكل مستقل دون تسمية جميع نماذج المصدر.
أشار أحد المعلقين التقنيين، رافائيل كوينتانيلها (Rafael Quintanilha)، إلى أنه نظرًا لأن Nex N2 Pro مبني على Qwen، فقد يكون الفريق قد نسب الفضل للبنية الأساسية وترَكها كذلك. وأوضح أن النموذج انتشر على نطاق واسع خلال مباراة في كأس العالم، "ليس بالضرورة 'جاهزًا للاستهلاك العام'." وقال المطور لوكاس مونتانيو (Lucas Montano) إن "دمج نموذجين من فئة ~400B ثم تطبيق تقطير ضمن السياسات ليس أمرًا بسيطًا" مع الاعتراف بوجود خطأ تقني وفشل في التواصل.
ذكر باحث في مجال الذكاء الاصطناعي، دييغو أمبروسيو (Diego Ambrosio)، أن الإطلاق الأول وصف Rio 3.5 بأنه ناتج عن "تدريب بعدي ذاتي المنشأ وتكييف (fine-tuning) حصري"—وهو تأطير يوحي بأن البحث الأصلي تم إنجازه ذاتيًا، وليس مجرد دمج.
كتبت Nex على X: "نحن ممتنون لأن مدينة ريو استخدمت عملنا لتحقيق أداء على مستوى SOTA. لكن في عالم المصادر المفتوحة، تعدّ نسب الفضل أمرًا مهمًا."
What did IplanRIO release on June 13?
أطلقت IplanRIO Rio 3.5 Open 397B في 13 يونيو، ووُصف بأنه نموذج ذكاء اصطناعي حدّي بُني من قِبل الحكومة، بواقع 397 مليار معلمة، وبنية Mixture-of-Experts، وتضمنت درجات الاختبارات المعيارية 70.8% على Terminal-Bench 2.1، و89.5% على IMOAnswerBench، و36.5% على HLE. أُطلق النموذج تحت رخصة MIT مع تكلفة تطوير مُبلغ عنها قدرها 500,000 ريال برازيلي.
What did Nex's mathematical analysis show about Rio 3.5?
نشرت Nex برهانًا رياضيًا يُظهر أن Rio 3.5 هو دمج مباشر للأوزان بالمعادلة: Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5. وقد قيست التلازم الخطي عند 0.993 عبر جميع الطبقات الـ60 مع نسبة مزج ثابتة قدرها α ≈ 0.571. وأظهرت اختبارات الهوية أن النموذج عرّف نفسه "Nex, from Nex-AGI" بنسبة 79.2% من المرات و"Rio" بنسبة 0% عند إزالة توجيه النظام الثابت (hardcoded).
How did IplanRIO respond to Nex's findings?
حدّثت IplanRIO بطاقة نموذج Hugging Face لمنح Nex الفضل، وأزالت ادعاءات الاختبارات المعيارية، وذكرت: "اكتشفنا تحميلًا غير صحيح في النسخة السابقة، حيث تم رفع النسخة المدمجة الأساسية بدلًا من النموذج المُقطّر النهائي." وتصف البطاقة المحدثة النموذج بأنه "مبني عبر دمج nex-agi/Nex-N2-Pro وQwen/Qwen3.5-397B-A17B، بما يسبقه تقطير ضمن السياسات من نموذج أقوى." كما ذكرت IplanRIO أنها تعمل على رفع النموذج المُقطّر المصحح مع نسبة الفضل كاملة.
أخبار ذات صلة
استحوذت IREN على شركة Nostrum Group ومقرها إسبانيا مقابل 490 ميغاواط لتوليد طاقة مراكز بيانات الذكاء الاصطناعي
تتجاوز AMD $900B القيمة السوقية، بينما تهدد “Ryzen AI Halo” منافسة “Nvidia DGX” المتقدّمة
قادة الذكاء الاصطناعي يناقشون تمييز النماذج وفرصة "الذكاء المجسّد" في الصين خلال مؤتمر زييوان
قدّم ChatGPT Pro قيمة ذكاء اصطناعي بقيمة 14,000 دولار في اختبار اشتراك شبه التحليل
يرتفع Bittensor بنسبة 16% بعد صدور أمر بإيقاف نموذج الذكاء الاصطناعي من Anthropic