DeepSeek V4 เปิดตัวพร้อมหน้าต่างบริบท 1M; ชิป Huawei Ascend และ Cambricon ทำได้เต็มรูปแบบ

ข้อความข่าว Gate ประจำวันที่ 24 เมษายน — DeepSeek V4-Pro และ DeepSeek V4-Flash ได้รับการปล่อยอย่างเป็นทางการและเปิดซอร์สเมื่อวันที่ 24 เมษายน โดยมีความยาวการประมวลผลบริบทเพิ่มขึ้นอย่างมีนัยสำคัญจาก 128K เป็น 1M ซึ่งคิดเป็นการเพิ่มความจุเกือบ 10 เท่า โดย Huawei Computing ประกาศว่า ผลิตภัณฑ์ซูเปอร์โหนด Ascend ของบริษัท รองรับโมเดลตระกูล DeepSeek V4 อย่างเต็มรูปแบบผ่านความร่วมมืออย่างใกล้ชิดระหว่างเทคโนโลยีชิปและโมเดล

Huawei Ascend 950 ทำให้การดีพลอยการอินเฟอเรนซ์ของโมเดล DeepSeek V4 มีอัตราการส่งผ่านสูงและหน่วงเวลาต่ำ โดยใช้เทคนิค fused kernel และ multi-stream parallelism เพื่อลดภาระการคำนวณ Attention และค่าใช้จ่ายในการเข้าถึงหน่วยความจำ สำหรับ DeepSeek V4-Pro เมื่อมีอินพุต 8K Ascend 950 ทำได้ประมาณ 20ms TPOT ด้วยอัตราการ Decode แบบ single-card 4,700 TPS; สำหรับ DeepSeek V4-Flash ภายใต้อินพุต 8K จะทำได้ประมาณ 10ms TPOT ด้วยทรูพุต 1,600 TPS Ascend A3 ซีรีส์ซูเปอร์โหนดยังทำได้เต็มรูปแบบเช่นกัน โดยมีการจัดเตรียมชุดอ้างอิงสำหรับการเทรนนิงเพื่อการ fine-tune ได้อย่างรวดเร็ว จากซูเปอร์โหนด Ascend A3 ขนาด 64 การ์ดที่มีโหมด large EP DeepSeek V4-Flash ทำได้มากกว่า 2,000 TPS ในการ Decode แบบ single-card สำหรับสถานการณ์อินพุต-เอาต์พุต 8K/1K โดยใช้เอนจินการอินเฟอเรนซ์ vLLM สายผลิตภัณฑ์ Ascend A2, A3 และ 950 ทั้งหมดของ Huawei รองรับทั้ง DeepSeek V4-Flash และ V4-Pro

Huawei Cloud ประกาศความเข้ากันได้แบบผู้มาก่อนได้เปรียบกับ DeepSeek V4 โดยให้บริการ API token แบบคลิกเดียวแก่ผู้พัฒนาผ่านแพลตฟอร์ม MaaS ของบริษัท Huawei Cloud ปรับความสามารถในเลเยอร์ระบบ เลเยอร์โอเปอเรเตอร์ และเลเยอร์คลัสเตอร์ให้เหมาะสม เพื่อให้มั่นใจว่าโมเดลสามารถปรับตัวได้อย่างรวดเร็วและทำการดีพลอยที่มีประสิทธิภาพสูง องค์กรต่างๆ รวมถึง Kingsoft WPS และ 360 ได้ผนวกรวมโมเดลใหม่ของ DeepSeek ผ่าน Huawei Cloud แล้ว

Cambricon ยังประกาศความเข้ากันได้ Day 0 กับ DeepSeek V4-Flash และ V4-Pro โดยอิงตามเฟรมเวิร์กการอินเฟอเรนซ์ vLLM โดยมีโค้ดสำหรับการปรับใช้เปิดซอร์สให้กับชุมชน GitHub Cambricon เคยทำสำเร็จในการปรับใช้แบบผู้มาก่อนได้เปรียบเช่นกันเมื่อ DeepSeek V3.2 เปิดตัวเมื่อปีที่แล้ว โดยได้ดำเนินการปรับปรุงสมรรถนะแบบร่วมมืออย่างลึกซึ้งระหว่างซอฟต์แวร์และฮาร์ดแวร์สำหรับโมเดลตระกูล DeepSeek

news.article.disclaimer

btc.bar.articles

Public เข้าซื้อแอป Treasury ของแพลตฟอร์มการลงทุน AI เพื่อขยายการเทรดคริปโต

ตามรายงานของ ChainCatcher Public ได้ประกาศเข้าซื้อแพลตฟอร์มบริการลงทุนด้าน AI อย่าง Treasury App เพื่อเสริมความแข็งแกร่งให้กับธุรกิจโบรกเกอร์ที่ขับเคลื่อนด้วย AI ของบริษัท มูลค่าการเข้าซื้อกิจการไม่ได้มีการเปิดเผย ปัจจุบัน Public รองรับการซื้อขายหุ้น พันธบัตร และสกุลเงินดิจิทัล รวมถึง Bitcoin, Ethereum, a

GateNews6 นาที ที่แล้ว

Blitzy ปิดการระดมทุนรอบ $200M แล้ว โดยมี Northzone เป็นผู้นำ

ตามรายงานของ ChainCatcher บริษัท Blitzy ซึ่งเป็นบริษัทเทคโนโลยี AI ด้านการเขียนโค้ดที่ก่อตั้งร่วมโดย Sid Pardeshi อดีตสถาปนิกของ Nvidia ได้ปิดรอบระดมทุนมูลค่า 200 ล้านดอลลาร์ โดยมี Northzone เป็นผู้นำการลงทุน Battery Ventures, Jump Capital และ Morgan Creek Digital เข้าร่วมในรอบนี้ แพลตฟอร์มสามารถแยกวิเคราะห์ระบบที่ซับซ้อนได้ด้วย

GateNews47 นาที ที่แล้ว

สหภาพยุโรปห้ามสื่อลามกปลอมแปลงด้วย AI แบบ deepfake ในวันที่ 7 พฤษภาคม

ตามรายงานของสำนักข่าวซินหัว เมื่อวันที่ 7 พฤษภาคม สมาชิกสภายุโรปและรัฐสมาชิกได้บรรลุฉันทามติในการห้ามระบบปัญญาประดิษฐ์จากการสร้างเนื้อหาลามกเชิงลึกปลอม (deepfake pornographic) ข้อห้ามดังกล่าวจะถูกนำไปรวมไว้ในร่างแก้ไขพระราชบัญญัติปัญญาประดิษฐ์ปี 2024 สภายุโรป

GateNews1 ชั่วโมง ที่แล้ว

Tether เปิดตัวโมเดล AI ทางการแพทย์ QVAC MedPsy และทำคะแนนได้ 62.62 จากเวอร์ชันที่มีพารามิเตอร์ 17 พันล้านพารามิเตอร์

ตามรายงานของ Odaily กลุ่มวิจัย Tether AI ปล่อยตัว QVAC MedPsy ซึ่งเป็นโมเดล AI ทางการแพทย์ที่ออกแบบให้ทำงานแบบออฟไลน์บนสมาร์ทโฟนและอุปกรณ์สวมใส่โดยไม่ต้องพึ่งพาระบบคลาวด์ เวอร์ชัน 1.7 พันล้านพารามิเตอร์ทำคะแนนได้ 62.62 จากเกณฑ์การประเมินทางการแพทย์ 7 รายการ โดยทำได้ดีกว่า MedGemma-1.5-4B ของ Google อยู่ 11.42 poi

GateNews1 ชั่วโมง ที่แล้ว

B.AI API เปิดตัวโมเดลใหม่ 4 รุ่น รวมถึง GPT-5.5 Instant ภายใน 48 ชั่วโมงหลังการเปิดตัวของ OpenAI

B.AI API เปิดตัวโมเดลใหม่ 4 รุ่น ได้แก่ GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 และ GLM-5.1 โดย GPT-5.5 Instant ได้ดำเนินการปรับใช้ระบบพื้นฐานและรวมอินเทอร์เฟซให้เสร็จภายใน 48 ชั่วโมงหลังการเปิดตัวของ OpenAI ทำให้สามารถเข้าถึงได้แบบไม่ต้องรอดีเลย์ถึง

GateNews1 ชั่วโมง ที่แล้ว

โมเดล AI ด้านการแพทย์ของ Tether มูลค่า 1.7B ทำผลงานเหนือคู่แข่งที่ใหญ่กว่า 16 เท่าในวันนี้

ตามทีมวิจัย AI ของ Tether บริษัทได้เปิดตัวโมเดลภาษาทางการแพทย์ซีรีส์ QVAC MedPsy วันนี้ โดยออกแบบมาเพื่อการรันแบบออฟไลน์ในเครื่องสำหรับสมาร์ทโฟนและอุปกรณ์สวมใส่ โดยไม่ต้องพึ่งพาระบบคลาวด์ เวอร์ชันที่มีพารามิเตอร์ 1.7B ทำคะแนนได้ 62.62 จากการทดสอบเกณฑ์ทางการแพทย์ 7 รายการ ซึ่งสูงกว่า Google MedGemma-4B

GateNews1 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น