DeepSeek บริษัทปัญญาประดิษฐ์ในหางโจว ได้เพิ่มความสามารถในการจดจำภาพและวิดีโอให้กับแชตบอตหลักผ่านฟีเจอร์ใหม่ที่เรียกว่า “โหมดจดจำภาพ” ทำให้สอดคล้องกับแชตบอตเอไอรายใหญ่อื่นๆ การเปิดตัวเกิดขึ้นพร้อมกับเหตุการณ์สำคัญในซัพพลายเชนชิปของจีน โดยบริษัทเซมิคอนดักเตอร์ในประเทศ 4 แห่ง ได้แก่ Huawei Ascend, Cambricon, Hygon Information และ Moore Threads ได้ยืนยันการรองรับโมเดลเรือธงใหม่ล่าสุดของ DeepSeek อย่าง DeepSeek-V4 ภายในวันเดียวกัน ซึ่งถือเป็นการเปลี่ยนผ่านจากช่วงการปรับตัวที่ยาวนานหลายเดือนก่อนหน้านี้ที่มักพบได้ในแวดวงนอกระบบนิเวศของ Nvidia

วิสัยทัศน์ของ DeepSeek และการขยายโมเดล

DeepSeek เปิดตัว “โหมดจดจำภาพ” อย่างเงียบๆ ควบคู่กับอีกสองโหมดที่เปิดตัวก่อนหน้านี้ในเดือนนี้ ได้แก่ “expert” และ “flash” ตามที่เฉิน เสี่ยวขังคัง (Chen Xiaokang) ผู้บริหารทีมมัลติโหมดของ DeepSeek กล่าวว่า เครื่องมือนี้ถูกทดสอบครั้งแรกกับผู้ใช้กลุ่มเล็กทั้งบนเว็บไซต์และแอปมือถือ เฉิน เต๋อลี่ (Chen Deli) นักวิจัยอาวุโสของบริษัท ฉลองการเปิดตัวด้วยโพสต์ที่อ้างถึงโลโก้ของบริษัทว่า “ปลาน้อยตอนนี้มองเห็นได้แล้ว”

ฟีเจอร์ด้านภาพและวิดีโอมาถึงเพียงไม่กี่วันหลังจากที่ DeepSeek ปล่อยตัวอย่างของ DeepSeek-V4 และทำให้ค่าน้ำหนักของโมเดลพร้อมให้ดาวน์โหลดและใช้งานสาธารณะ V4 ถูกจัดโครงสร้างเป็นสองโมเดลที่แตกต่างกัน ได้แก่ DeepSeek-V4-Pro ซึ่งมีพารามิเตอร์ 1.6 ล้านล้าน พารามิเตอร์ ออกแบบมาเพื่อการให้เหตุผลที่ซับซ้อนและเวิร์กโฟลว์อัตโนมัติแบบหลายขั้นตอน และ DeepSeek-V4-Flash ที่ถูกปรับให้เหมาะกับการรองรับปริมาณคำขนาดใหญ่ด้วยต้นทุนที่ต่ำกว่า ทั้งสองโมเดลรองรับ context window ขนาดหนึ่งล้านโทเค็น และใช้การออกแบบ attention แบบไฮบริด ซึ่งบริษัทระบุว่าสามารถลดความต้องการด้านกำลังประมวลผลและหน่วยความจำระหว่างการรัน (inference)

ผู้ผลิตชิปจีนบรรลุการรองรับแบบเปิดตัววันเดียวกัน

สิ่งที่ดึงดูดความสนใจของอุตสาหกรรมไม่ใช่เพียงตัวโมเดลเท่านั้น แต่เป็นการสนับสนุนฮาร์ดแวร์ที่ประสานกันซึ่งแสดงให้เห็นในวันปล่อยตัว V4 Huawei Ascend ยืนยันความเข้ากันได้กับชิป A2, A3 และ 950 โดย Ascend 950 ใช้กระบวนการคอมพิวต์แบบฟิวส์และสตรีมการประมวลผลแบบขนานเพื่อเร่งการรันสำหรับทั้ง V4-Pro และ V4-Flash Cambricon ปรับการทำงานให้เสร็จสิ้นโดยใช้เฟรมเวิร์ก inference แบบโอเพนซอร์ส vLLM และเผยแพร่โค้ดบน GitHub Hygon Information ทำการปรับแต่งโมเดลอย่างลึกบนแพลตฟอร์ม DCU เพื่อให้เปลี่ยนผ่านจากการปล่อยโมเดลไปสู่การใช้งานจริงได้อย่างราบรื่น Moore Threads ร่วมมือกับ Beijing Academy of Artificial Intelligence เพื่อรัน V4 บนการ์ด MTT S5000 โดยใช้สแต็กซอฟต์แวร์ FlagOS

การรองรับแบบวันเดียวกันนี้ข้ามชิปเซ็ตหลายรุ่นถือเป็นการเบี่ยงเบนจากรูปแบบในอดีต ก่อนหน้านี้ ฮาร์ดแวร์ที่อยู่นอกระบบนิเวศของ Nvidia มักต้องใช้เวลาหลายเดือนจึงจะรองรับโมเดลใหม่ขนาดใหญ่ได้ นักวิเคราะห์ในอุตสาหกรรมระบุว่า การบรรลุความเข้ากันได้ข้ามชิปเซ็ตในประเทศที่แตกต่างกัน 4 ชุดในวันเปิดตัว สะท้อนการเปลี่ยนแปลงอย่างแท้จริงต่อความพร้อมด้านโครงสร้างพื้นฐานเซมิคอนดักเตอร์และเอไอของจีน

นัยเชิงกลยุทธ์: ต้นทุนและความเป็นอิสระของซัพพลายเชน

ความสำคัญในภาพรวมของการเปิดตัวของ DeepSeek นั้นกว้างขวางเกินกว่าแค่ความสำเร็จทางเทคนิคเฉพาะราย ด้วยการทำให้ V4 สามารถรันได้โดยกำเนิดบนชิปจีนหลายตัวพร้อมกัน DeepSeek จึงลดความเสี่ยงด้านการพึ่งพาจากข้อจำกัดการส่งออกที่ในอดีตเคยขวางบริษัทจีนไม่ให้เข้าถึงโปรเซสเซอร์อเมริกันที่ล้ำหน้าที่สุด ประสิทธิภาพด้านต้นคงยังคงเป็นแกนหลักของกลยุทธ์ของ DeepSeek—บริษัทให้ความสำคัญกับการทำให้ต้นทุนการใช้งานโมเดลต่ำ เพื่อให้ธุรกิจสามารถสร้างระบบอัตโนมัติได้โดยไม่ต้องเผชิญค่าใช้จ่ายด้านการคำนวณที่สูงจนเกินไป

นักสังเกตการณ์ในอุตสาหกรรมมองว่าการปล่อยครั้งนี้สะท้อนถึงการที่ทั้งซัพพลายเชนเติบโตเต็มที่มากกว่าการเป็นเพียง “การก้าวกระโดด” ด้านเทคโนโลยีครั้งเดียว ความร่วมมือระหว่าง DeepSeek ผู้ผลิตชิป และเฟรมเวิร์กซอฟต์แวร์ แสดงให้เห็นถึงการพัฒนาระบบนิเวศแบบบูรณาการ แนวโน้มนี้ชี้ให้เห็นว่าการแข่งขันในเอไอกำลังเปลี่ยนจากการมุ่งเน้นความล้ำของโมเดลแต่ละตัว ไปสู่ความสามารถในการคงไว้ซึ่งระบบที่ครบถ้วน คุ้มค่า และเป็นอิสระในระยะยาว

คำถามที่พบบ่อย (FAQ)

DeepSeek เพิ่มความสามารถใหม่อะไรให้กับแชตบอตของตน?
DeepSeek เพิ่ม “โหมดจดจำภาพ” ที่ทำให้แชตบอตสามารถเข้าใจภาพถ่ายและวิดีโอได้ ไม่ใช่แค่ข้อความ ฟีเจอร์นี้ถูกทดสอบครั้งแรกกับผู้ใช้กลุ่มเล็กทั้งบนเว็บไซต์และแอปมือถือ ทำให้ความสามารถของ DeepSeek สอดคล้องกับแชตบอตเอไอรายใหญ่อื่นๆ ที่นำเสนอความสามารถลักษณะเดียวกัน

บริษัทชิปจีนบริษัทใดสนับสนุน DeepSeek-V4 ในวันเปิดตัว?
บริษัทชิปจีน 4 แห่งยืนยันการรองรับ DeepSeek-V4 แบบวันเดียวกัน ได้แก่ Huawei Ascend (ด้วยชิป A2, A3 และ 950), Cambricon, Hygon Information และ Moore Threads ความเข้ากันได้แบบวันเดียวกันข้ามชิปเซ็ตหลายรุ่นนี้เคยพบได้ยากนอกระบบนิเวศของ Nvidia โดยปกติต้องใช้เวลาหลายเดือนในการทำงานปรับตัว

DeepSeek-V4 มีสองเวอร์ชันอะไรบ้าง และแตกต่างกันอย่างไร?
DeepSeek-V4-Pro มีพารามิเตอร์ 1.6 ล้านล้าน และออกแบบมาเพื่อการให้เหตุผลที่ซับซ้อนและเวิร์กโฟลว์อัตโนมัติแบบหลายขั้นตอน ส่วน DeepSeek-V4-Flash ได้รับการปรับให้เหมาะกับการจัดการคำขนาดใหญ่ในต้นทุนที่ต่ำกว่า ทั้งสองรองรับ context window ขนาดหนึ่งล้านโทเค็น และใช้การออกแบบ attention แบบไฮบริดเพื่อช่วยลดความต้องการด้านกำลังประมวลผลและหน่วยความจำ

news.view.source

news.article.disclaimer

news.related.news

04-29 10:37

DeepSeek เปิดตัวฟีเจอร์การรู้จำภาพในช่วงทดสอบเบต้า

04-29 09:09

นักวิจัยมัลติโหมดของ DeepSeek ส่งสัญญาณถึงโมเดลด้านการมองเห็นรุ่นใหม่ในวันที่ 29 เมษายน

04-29 07:06

โทเค็น AI ของ Gensyn เปิดตัวในวันนี้

btc.bar.articles

สร้างพอร์ตโฟลิโอคริปโตที่แข็งแกร่งยิ่งขึ้นด้วยเหรียญที่มีแนวโน้ม 3 ตัวเหล่านี้

Crypto News Land04-29 15:06