Mistral AI เปิดตัว Leanstral: Agent โค้ด Lean 4 โอเพนซอร์สตัวแรกที่สามารถสร้างหลักฐานรูปแบบอัตโนมัติ

ข่าว Gate News เมื่อวันที่ 17 มีนาคม Mistral AI ได้เปิดตัว Leanstral ซึ่งเป็นเอเจนโอเพนซอร์สตัวแรกที่ออกแบบมาเพื่อเครื่องมือการตรวจสอบทางฟอร์มาลาเชียล Lean 4 จุดเด่นของโมเดลนี้คือสามารถสร้างโค้ด AI พร้อมทั้งส่งออกหลักฐานทางฟอร์มาลาเชียลที่สามารถตรวจสอบโดยอัตโนมัติด้วย Lean 4 ได้ ซึ่งช่วยหลีกเลี่ยงข้อจำกัดของการตรวจสอบด้วยมนุษย์ในกระบวนการสร้างโค้ด AI แบบดั้งเดิม

Leanstral ใช้สถาปัตยกรรม MoE แบบ Sparse มีพารามิเตอร์รวม 120 พันล้านและพารามิเตอร์เปิดใช้งาน 6 พันล้าน เปิดให้ใช้งานแบบโอเพนซอร์สภายใต้สัญญาอนุญาต Apache 2.0 และได้รับการปรับแต่งสำหรับ lean-lsp-mcp ผู้ใช้สามารถเริ่มต้นได้ง่ายใน Mistral Vibe ด้วยคำสั่ง /leanstall โดยไม่ต้องตั้งค่า หรือเรียกใช้งานผ่าน API ฟรีที่ labs-leanstral-2603 พร้อมทั้งรองรับการดาวน์โหลดน้ำหนักเพื่อการติดตั้งเอง

Mistral ยังปล่อยเกณฑ์การประเมินใหม่ FLTEval ซึ่งใช้โครงการฟอร์มาลาเชียลของทฤษฎีบทฟีมาของชุมชน Lean 4 เป็นฉากทดสอบ ผลการเปรียบเทียบประสิทธิภาพแสดงให้เห็นว่า Leanstral pass@2 ทำคะแนนได้ 26.3 ด้วยต้นทุน 36 ดอลลาร์ ซึ่งสูงกว่าคะแนน 23.7 ของ Claude Sonnet 4.6 ที่มีต้นทุน 549 ดอลลาร์; pass@16 ทำคะแนนได้ 31.9 ด้วยต้นทุน 290 ดอลลาร์ ซึ่งนำหน้า Sonnet 8 คะแนน ในขณะที่ Claude Opus 4.6 ต้องใช้เงิน 1,650 ดอลลาร์เพื่อให้ได้ 39.6 คะแนน ในโมเดลโอเพนซอร์ส Qwen3.5-397B-A17B ต้องรัน 4 ครั้งจึงจะได้ 25.4 คะแนน ซึ่งยังต่ำกว่า Leanstral pass@2

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น