Meituan โอเพนซอร์ส LongCat-2.0: พารามิเตอร์ 1.6 ล้านล้าน ไม่ต้องใช้ GPU NVIDIA

据路透社于 6 月 30 日报道,美团(Meituan)发布开源 AI 模型 LongCat-2.0,参数规模达 1.6 兆,采用稀疏混合专家(Sparse MoE)架构,完全使用国产 ASIC 超级集群芯片训练,未使用任何英伟达 GPU 或 CUDA 软件栈,模型上下文窗口达 100 万 tokens。

ข้อกำหนดทางเทคนิคและกรณีการใช้งานเป้าหมายของ LongCat-2.0

LongCat-2.0 ใช้สถาปัตยกรรม Sparse Mixture of Experts (Sparse MoE) ซึ่งคล้ายกับแนวทางของ DeepSeek และ Mixtral จาก Mistral: โมเดลจะไม่เปิดใช้งานพารามิเตอร์ทั้งหมด 1.6 ล้านล้านตัวพร้อมกัน แต่จะใช้เราเตอร์ภายในเลือกชุดย่อยโมเดลเฉพาะสำหรับแต่ละ token ซึ่งช่วยลดต้นทุนการอนุมานเมื่อเทียบกับโมเดล Dense ที่มีขนาดเท่ากัน ข้อกำหนดทางเทคนิคหลักและข้อจำกัดในการปรับใช้มีดังนี้:

ขนาดพารามิเตอร์: 1.6 ล้านล้าน (สถาปัตยกรรม Sparse MoE ไม่เปิดใช้งานพารามิเตอร์ทั้งหมดพร้อมกัน)

หน้าต่างบริบท: 1 ล้าน tokens (DeepSeek-R1-0528 และ GPT-OSS มี 128,000 tokens)

ฮาร์ดแวร์ฝึกอบรม: ซูเปอร์คลัสเตอร์ ASIC ที่ผลิตในประเทศ (ไม่มี GPU ของ NVIDIA, ไม่มีซอฟต์แวร์สแต็ก CUDA)

การใช้งานเป้าหมาย: AI Agent, เครื่องมือเขียนโค้ด (การทำความเข้าใจโค้ด, การแก้ไขทั้งไลบรารี, งานอัตโนมัติ)

รูปแบบการปรับใช้: คลัสเตอร์อนุมานระดับศูนย์ข้อมูล ไม่รองรับอุปกรณ์ระดับผู้บริโภคหรือการปรับใช้ในพื้นที่ส่วนใหญ่

ภูมิหลังตลาดของการฝึกอบรมด้วยชิปที่ผลิตในประเทศและข้อมูลจาก Bernstein

Meituan อ้างว่าสถาปัตยกรรมการอนุมานหลักของ LongCat-2.0 สามารถพกพาได้และสามารถทำงานบนฮาร์ดแวร์ที่มีอยู่ในจีน การเปิดตัวครั้งนี้เกิดขึ้นในช่วงเวลาที่การควบคุมการส่งออกของสหรัฐฯ ยังคงจำกัดการส่งออกชิป AI ขั้นสูงไปยังบริษัทจีน

บริษัทวิจัยหุ้น Bernstein ประมาณการว่าปัจจุบัน NVIDIA มีส่วนแบ่งตลาดประมาณ 40% ในตลาดชิป AI ของจีน ขณะที่ Huawei มีส่วนแบ่งใกล้เคียงกัน Bernstein ยังคาดการณ์ว่า Huawei จะมีความคืบหน้าในปีนี้ ทำให้ส่วนแบ่งตลาดของ NVIDIA ในจีนลดลงประมาณ 8 จุดเปอร์เซ็นต์

สถานะปัจจุบันของการอ้างสิทธิ์ด้านประสิทธิภาพ: ยังไม่มีการตรวจสอบจากบุคคลที่สาม

Meituan เปรียบเทียบ LongCat-2.0 กับโมเดล Closed-source หลายตัวในการทดสอบ Benchmark ที่เผยแพร่ แต่รายงานที่เกี่ยวข้องชี้ว่าการอ้างสิทธิ์ด้านประสิทธิภาพเหล่านี้ยังไม่ได้รับการประเมินและตรวจสอบจากบุคคลที่สามที่เป็นอิสระและเป็นกลางจนถึงขณะนี้

รายงานยังชี้ให้เห็นว่าการปรับให้เหมาะสมสำหรับชิปที่ผลิตในประเทศอาจจำกัดประสิทธิภาพของ LongCat-2.0 บนฮาร์ดแวร์ NVIDIA ซึ่งยังคงครองตลาดศูนย์ข้อมูลทั่วโลก Meituan ระบุว่าสถาปัตยกรรมการอนุมานหลักยังคงสามารถพกพาได้ และการทดสอบอิสระจะเป็นตัวกำหนดความเต็มใจของนักพัฒนานอกจีนในการนำไปใช้

คำถามที่พบบ่อย

หน้าต่างบริบท 1 ล้าน tokens ของ LongCat-2.0 มีความหมายต่อกรณีการใช้งานใดบ้าง?

ณ เวลาที่รายงาน DeepSeek-R1-0528 และ OpenAI GPT-OSS มีขีดจำกัดหน้าต่างบริบทอยู่ที่ 128,000 tokens ในขณะที่ LongCat-2.0 อ้างว่าถึง 1 ล้าน tokens ซึ่งอาจมีความสำคัญต่อแอปพลิเคชัน AI Agent ที่ต้องการจัดการกับคลังโค้ดที่ยาวมากหรือสายงานที่ซับซ้อน อย่างไรก็ตาม การอ้างสิทธิ์ข้อกำหนดดังกล่าวยังรอการตรวจสอบอย่างอิสระ

ภูมิหลังด้านการวิจัยและพัฒนา AI ของ Meituan คืออะไร?

ธุรกิจหลักของ Meituan คือการจัดส่งอาหารและบริการในท้องถิ่น หลังจากเข้าสู่สาขา AI ในปี 2023 ด้วยการซื้อกิจการสตาร์ทอัพ AI Light Year Beyond ในราคา 281 ล้านดอลลาร์สหรัฐ Meituan เพิ่งเปิดเผยแผนโมเดลภายในอย่างเปิดเผยในปี 2025 โดย LongCat-2.0 ถูกวางตำแหน่งให้เป็นเอนจินการอนุมานสำหรับ AI Agent และเครื่องมือเขียนโค้ดของบริษัท

สถาปัตยกรรม Sparse MoE ของ LongCat-2.0 มีข้อดีและข้อเสียอย่างไรเมื่อเทียบกับโมเดล Dense ขนาด 1.6 ล้านล้าน?

ข้อได้เปรียบหลักของ Sparse MoE คือไม่ต้องเปิดใช้งานพารามิเตอร์ทั้งหมด แต่จะเลือกเส้นทางไปยังชุดย่อยโมเดลเฉพาะ ซึ่งช่วยลดต้นทุนการคำนวณในการอนุมานเมื่อเทียบกับโมเดล Dense ที่มีขนาดเท่ากัน อย่างไรก็ตาม สถาปัตยกรรมที่ปรับให้เหมาะสมกับฮาร์ดแวร์เฉพาะ (เช่น ASIC ที่ผลิตในประเทศ) อาจมีข้อจำกัดด้านประสิทธิภาพบนฮาร์ดแวร์อื่น (เช่น GPU ของ NVIDIA) และผลการทดสอบอิสระยังไม่ได้รับการเผยแพร่

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น