据路透社于 6 月 30 日报道,美团(Meituan)发布开源 AI 模型 LongCat-2.0,参数规模达 1.6 兆,采用稀疏混合专家(Sparse MoE)架构,完全使用国产 ASIC 超级集群芯片训练,未使用任何英伟达 GPU 或 CUDA 软件栈,模型上下文窗口达 100 万 tokens。
LongCat-2.0 ใช้สถาปัตยกรรม Sparse Mixture of Experts (Sparse MoE) ซึ่งคล้ายกับแนวทางของ DeepSeek และ Mixtral จาก Mistral: โมเดลจะไม่เปิดใช้งานพารามิเตอร์ทั้งหมด 1.6 ล้านล้านตัวพร้อมกัน แต่จะใช้เราเตอร์ภายในเลือกชุดย่อยโมเดลเฉพาะสำหรับแต่ละ token ซึ่งช่วยลดต้นทุนการอนุมานเมื่อเทียบกับโมเดล Dense ที่มีขนาดเท่ากัน ข้อกำหนดทางเทคนิคหลักและข้อจำกัดในการปรับใช้มีดังนี้:
ขนาดพารามิเตอร์: 1.6 ล้านล้าน (สถาปัตยกรรม Sparse MoE ไม่เปิดใช้งานพารามิเตอร์ทั้งหมดพร้อมกัน)
หน้าต่างบริบท: 1 ล้าน tokens (DeepSeek-R1-0528 และ GPT-OSS มี 128,000 tokens)
ฮาร์ดแวร์ฝึกอบรม: ซูเปอร์คลัสเตอร์ ASIC ที่ผลิตในประเทศ (ไม่มี GPU ของ NVIDIA, ไม่มีซอฟต์แวร์สแต็ก CUDA)
การใช้งานเป้าหมาย: AI Agent, เครื่องมือเขียนโค้ด (การทำความเข้าใจโค้ด, การแก้ไขทั้งไลบรารี, งานอัตโนมัติ)
รูปแบบการปรับใช้: คลัสเตอร์อนุมานระดับศูนย์ข้อมูล ไม่รองรับอุปกรณ์ระดับผู้บริโภคหรือการปรับใช้ในพื้นที่ส่วนใหญ่
Meituan อ้างว่าสถาปัตยกรรมการอนุมานหลักของ LongCat-2.0 สามารถพกพาได้และสามารถทำงานบนฮาร์ดแวร์ที่มีอยู่ในจีน การเปิดตัวครั้งนี้เกิดขึ้นในช่วงเวลาที่การควบคุมการส่งออกของสหรัฐฯ ยังคงจำกัดการส่งออกชิป AI ขั้นสูงไปยังบริษัทจีน
บริษัทวิจัยหุ้น Bernstein ประมาณการว่าปัจจุบัน NVIDIA มีส่วนแบ่งตลาดประมาณ 40% ในตลาดชิป AI ของจีน ขณะที่ Huawei มีส่วนแบ่งใกล้เคียงกัน Bernstein ยังคาดการณ์ว่า Huawei จะมีความคืบหน้าในปีนี้ ทำให้ส่วนแบ่งตลาดของ NVIDIA ในจีนลดลงประมาณ 8 จุดเปอร์เซ็นต์
Meituan เปรียบเทียบ LongCat-2.0 กับโมเดล Closed-source หลายตัวในการทดสอบ Benchmark ที่เผยแพร่ แต่รายงานที่เกี่ยวข้องชี้ว่าการอ้างสิทธิ์ด้านประสิทธิภาพเหล่านี้ยังไม่ได้รับการประเมินและตรวจสอบจากบุคคลที่สามที่เป็นอิสระและเป็นกลางจนถึงขณะนี้
รายงานยังชี้ให้เห็นว่าการปรับให้เหมาะสมสำหรับชิปที่ผลิตในประเทศอาจจำกัดประสิทธิภาพของ LongCat-2.0 บนฮาร์ดแวร์ NVIDIA ซึ่งยังคงครองตลาดศูนย์ข้อมูลทั่วโลก Meituan ระบุว่าสถาปัตยกรรมการอนุมานหลักยังคงสามารถพกพาได้ และการทดสอบอิสระจะเป็นตัวกำหนดความเต็มใจของนักพัฒนานอกจีนในการนำไปใช้
ณ เวลาที่รายงาน DeepSeek-R1-0528 และ OpenAI GPT-OSS มีขีดจำกัดหน้าต่างบริบทอยู่ที่ 128,000 tokens ในขณะที่ LongCat-2.0 อ้างว่าถึง 1 ล้าน tokens ซึ่งอาจมีความสำคัญต่อแอปพลิเคชัน AI Agent ที่ต้องการจัดการกับคลังโค้ดที่ยาวมากหรือสายงานที่ซับซ้อน อย่างไรก็ตาม การอ้างสิทธิ์ข้อกำหนดดังกล่าวยังรอการตรวจสอบอย่างอิสระ
ธุรกิจหลักของ Meituan คือการจัดส่งอาหารและบริการในท้องถิ่น หลังจากเข้าสู่สาขา AI ในปี 2023 ด้วยการซื้อกิจการสตาร์ทอัพ AI Light Year Beyond ในราคา 281 ล้านดอลลาร์สหรัฐ Meituan เพิ่งเปิดเผยแผนโมเดลภายในอย่างเปิดเผยในปี 2025 โดย LongCat-2.0 ถูกวางตำแหน่งให้เป็นเอนจินการอนุมานสำหรับ AI Agent และเครื่องมือเขียนโค้ดของบริษัท
ข้อได้เปรียบหลักของ Sparse MoE คือไม่ต้องเปิดใช้งานพารามิเตอร์ทั้งหมด แต่จะเลือกเส้นทางไปยังชุดย่อยโมเดลเฉพาะ ซึ่งช่วยลดต้นทุนการคำนวณในการอนุมานเมื่อเทียบกับโมเดล Dense ที่มีขนาดเท่ากัน อย่างไรก็ตาม สถาปัตยกรรมที่ปรับให้เหมาะสมกับฮาร์ดแวร์เฉพาะ (เช่น ASIC ที่ผลิตในประเทศ) อาจมีข้อจำกัดด้านประสิทธิภาพบนฮาร์ดแวร์อื่น (เช่น GPU ของ NVIDIA) และผลการทดสอบอิสระยังไม่ได้รับการเผยแพร่
news.related.news
Google เปิดตัวโมเดลสร้างภาพต้นทุนต่ำที่สุด ราคา 0.034 ดอลลาร์ต่อพันภาพ
Meta AI แปลงความคิดเป็นข้อความมีความแม่นยำถึง 61% พร้อมปล่อยโค้ดโอเพนซอร์สพร้อมกัน
OpenAI ประกาศเปิดตัวคีย์บอร์ด Macro Codex วางจำหน่าย 15 กรกฎาคม
月之暗面เตือน: การฉ้อโกงทางการเงินเกิดขึ้นบ่อยครั้ง การซื้อขายหุ้นเก่าที่ไม่ได้รับอนุญาตทั้งหมดเป็นโมฆะ
ช่องโหว่โควตาของ Codex ล่มอีกครั้ง OpenAI ดำเนินการฮาร์ดรีเซ็ตครั้งที่สอง