ข้อความข่าว Gate วันที่ 27 เมษายน — ทีม MiMo ของ Xiaomi ได้ทำการเปิดซอร์สชุดโมเดลภาษา MiMo-V2.5 ภายใต้ใบอนุญาต MIT รองรับการนำไปใช้ในเชิงพาณิชย์ การฝึกต่อเนื่อง และการปรับแต่งด้วยการเรียนรู้แบบเฉพาะทาง ทั้งสองโมเดลมีหน้าต่างบริบท 1 million(หนึ่งล้าน)token MiMo-V2.5-Pro เป็นโมเดล pure-text mixture-of-experts (MoE) ที่มีพารามิเตอร์ทั้งหมด 1.02 trillion(1.02 ล้านล้าน)และพารามิเตอร์ที่ใช้งานอยู่ 42 billion(42 พันล้าน)ส่วน MiMo-V2.5 เป็นโมเดลมัลติโหมดดั้งเดิมที่มีพารามิเตอร์ทั้งหมด 310 billion(310 พันล้าน)และพารามิเตอร์ที่ใช้งานอยู่ 15 billion(15 พันล้าน)รองรับความเข้าใจด้านข้อความ รูปภาพ วิดีโอ และเสียง
MiMo-V2.5-Pro มุ่งเป้าสำหรับงานของเอเจนต์ที่ซับซ้อนและงานด้านการเขียนโปรแกรม ในเกณฑ์มาตรฐาน ClawEval ทำได้ 64% Pass@3 ขณะใช้ประมาณ 70,000 tokens ต่อหนึ่งไทม์ไลน์ของงาน—ลดลง 40% ถึง 60% ของจำนวน token เมื่อเทียบกับ Claude Opus, Gemini 3.1 Pro และ GPT-5.4 โมเดลได้คะแนน 78.9 บน SWE-bench Verified ในเดโมหนึ่ง V2.5-Pro สามารถใช้งานคอมไพเลอร์แบบสมบูรณ์จาก SysY ไปยัง RISC-V สำหรับโปรเจกต์คอร์สของ Peking University ด้วยตัวเองภายใน 4.3 ชั่วโมง ด้วยการเรียกใช้เครื่องมือ 672 ครั้ง ทำคะแนนเต็ม 233/233 บนชุดทดสอบที่ซ่อนอยู่
MiMo-V2.5 ออกแบบมาสำหรับสถานการณ์เอเจนต์มัลติโหมด โดยติดตั้งวิชันเอนโค้ดแบบเฉพาะ (729 million parameters) และเอาดิโอเอนโค้ด (261 million parameters) โดยได้คะแนน 62.3 ในส่วนย่อยทั่วไปของ Claw-Eval ทั้งสองโมเดลใช้สถาปัตยกรรมแบบผสมผสานที่รวม sliding window attention (SWA) และ global attention (GA) โดยจับคู่กับโมดูล 3 ชั้นสำหรับการทำนายหลายโทเคน (MTP) เพื่อเร่งการอนุมาน น้ำหนักโมเดลมีให้ที่ Hugging Face
นอกเหนือจากการเปิดซอร์สแล้ว ทีม MiMo ยังได้เปิดตัว “Orbit Quadrillion Token Creator Incentive Program” โดยมอบ 100 quadrillion tokens ฟรีภายใน 30 วันให้กับผู้ใช้งานทั่วโลก นักพัฒนารายบุคคล ทีม และองค์กรสามารถสมัครผ่านหน้าโปรแกรม โดยมีรอบการประเมินประมาณ 3 วันทำการ ผลประโยชน์ที่ได้รับการอนุมัติจะถูกจัดสรรเป็น Token Plans หรือเครดิตโดยตรง เข้ากันได้กับเครื่องมืออย่าง Claude Code และ Cursor