DeepSeek เพิ่มโหมดวิชัน ขณะที่ชิปจีนพร้อมรองรับการเปิดตัว

CryptoFrontier

DeepSeek บริษัทปัญญาประดิษฐ์ในหางโจว ได้เพิ่มความสามารถในการจดจำภาพและวิดีโอให้กับแชตบอตหลักผ่านฟีเจอร์ใหม่ที่เรียกว่า “โหมดจดจำภาพ” ทำให้สอดคล้องกับแชตบอตเอไอรายใหญ่อื่นๆ การเปิดตัวเกิดขึ้นพร้อมกับเหตุการณ์สำคัญในซัพพลายเชนชิปของจีน โดยบริษัทเซมิคอนดักเตอร์ในประเทศ 4 แห่ง ได้แก่ Huawei Ascend, Cambricon, Hygon Information และ Moore Threads ได้ยืนยันการรองรับโมเดลเรือธงใหม่ล่าสุดของ DeepSeek อย่าง DeepSeek-V4 ภายในวันเดียวกัน ซึ่งถือเป็นการเปลี่ยนผ่านจากช่วงการปรับตัวที่ยาวนานหลายเดือนก่อนหน้านี้ที่มักพบได้ในแวดวงนอกระบบนิเวศของ Nvidia

วิสัยทัศน์ของ DeepSeek และการขยายโมเดล

DeepSeek เปิดตัว “โหมดจดจำภาพ” อย่างเงียบๆ ควบคู่กับอีกสองโหมดที่เปิดตัวก่อนหน้านี้ในเดือนนี้ ได้แก่ “expert” และ “flash” ตามที่เฉิน เสี่ยวขังคัง (Chen Xiaokang) ผู้บริหารทีมมัลติโหมดของ DeepSeek กล่าวว่า เครื่องมือนี้ถูกทดสอบครั้งแรกกับผู้ใช้กลุ่มเล็กทั้งบนเว็บไซต์และแอปมือถือ เฉิน เต๋อลี่ (Chen Deli) นักวิจัยอาวุโสของบริษัท ฉลองการเปิดตัวด้วยโพสต์ที่อ้างถึงโลโก้ของบริษัทว่า “ปลาน้อยตอนนี้มองเห็นได้แล้ว”

ฟีเจอร์ด้านภาพและวิดีโอมาถึงเพียงไม่กี่วันหลังจากที่ DeepSeek ปล่อยตัวอย่างของ DeepSeek-V4 และทำให้ค่าน้ำหนักของโมเดลพร้อมให้ดาวน์โหลดและใช้งานสาธารณะ V4 ถูกจัดโครงสร้างเป็นสองโมเดลที่แตกต่างกัน ได้แก่ DeepSeek-V4-Pro ซึ่งมีพารามิเตอร์ 1.6 ล้านล้าน พารามิเตอร์ ออกแบบมาเพื่อการให้เหตุผลที่ซับซ้อนและเวิร์กโฟลว์อัตโนมัติแบบหลายขั้นตอน และ DeepSeek-V4-Flash ที่ถูกปรับให้เหมาะกับการรองรับปริมาณคำขนาดใหญ่ด้วยต้นทุนที่ต่ำกว่า ทั้งสองโมเดลรองรับ context window ขนาดหนึ่งล้านโทเค็น และใช้การออกแบบ attention แบบไฮบริด ซึ่งบริษัทระบุว่าสามารถลดความต้องการด้านกำลังประมวลผลและหน่วยความจำระหว่างการรัน (inference)

ผู้ผลิตชิปจีนบรรลุการรองรับแบบเปิดตัววันเดียวกัน

สิ่งที่ดึงดูดความสนใจของอุตสาหกรรมไม่ใช่เพียงตัวโมเดลเท่านั้น แต่เป็นการสนับสนุนฮาร์ดแวร์ที่ประสานกันซึ่งแสดงให้เห็นในวันปล่อยตัว V4 Huawei Ascend ยืนยันความเข้ากันได้กับชิป A2, A3 และ 950 โดย Ascend 950 ใช้กระบวนการคอมพิวต์แบบฟิวส์และสตรีมการประมวลผลแบบขนานเพื่อเร่งการรันสำหรับทั้ง V4-Pro และ V4-Flash Cambricon ปรับการทำงานให้เสร็จสิ้นโดยใช้เฟรมเวิร์ก inference แบบโอเพนซอร์ส vLLM และเผยแพร่โค้ดบน GitHub Hygon Information ทำการปรับแต่งโมเดลอย่างลึกบนแพลตฟอร์ม DCU เพื่อให้เปลี่ยนผ่านจากการปล่อยโมเดลไปสู่การใช้งานจริงได้อย่างราบรื่น Moore Threads ร่วมมือกับ Beijing Academy of Artificial Intelligence เพื่อรัน V4 บนการ์ด MTT S5000 โดยใช้สแต็กซอฟต์แวร์ FlagOS

การรองรับแบบวันเดียวกันนี้ข้ามชิปเซ็ตหลายรุ่นถือเป็นการเบี่ยงเบนจากรูปแบบในอดีต ก่อนหน้านี้ ฮาร์ดแวร์ที่อยู่นอกระบบนิเวศของ Nvidia มักต้องใช้เวลาหลายเดือนจึงจะรองรับโมเดลใหม่ขนาดใหญ่ได้ นักวิเคราะห์ในอุตสาหกรรมระบุว่า การบรรลุความเข้ากันได้ข้ามชิปเซ็ตในประเทศที่แตกต่างกัน 4 ชุดในวันเปิดตัว สะท้อนการเปลี่ยนแปลงอย่างแท้จริงต่อความพร้อมด้านโครงสร้างพื้นฐานเซมิคอนดักเตอร์และเอไอของจีน

นัยเชิงกลยุทธ์: ต้นทุนและความเป็นอิสระของซัพพลายเชน

ความสำคัญในภาพรวมของการเปิดตัวของ DeepSeek นั้นกว้างขวางเกินกว่าแค่ความสำเร็จทางเทคนิคเฉพาะราย ด้วยการทำให้ V4 สามารถรันได้โดยกำเนิดบนชิปจีนหลายตัวพร้อมกัน DeepSeek จึงลดความเสี่ยงด้านการพึ่งพาจากข้อจำกัดการส่งออกที่ในอดีตเคยขวางบริษัทจีนไม่ให้เข้าถึงโปรเซสเซอร์อเมริกันที่ล้ำหน้าที่สุด ประสิทธิภาพด้านต้นคงยังคงเป็นแกนหลักของกลยุทธ์ของ DeepSeek—บริษัทให้ความสำคัญกับการทำให้ต้นทุนการใช้งานโมเดลต่ำ เพื่อให้ธุรกิจสามารถสร้างระบบอัตโนมัติได้โดยไม่ต้องเผชิญค่าใช้จ่ายด้านการคำนวณที่สูงจนเกินไป

นักสังเกตการณ์ในอุตสาหกรรมมองว่าการปล่อยครั้งนี้สะท้อนถึงการที่ทั้งซัพพลายเชนเติบโตเต็มที่มากกว่าการเป็นเพียง “การก้าวกระโดด” ด้านเทคโนโลยีครั้งเดียว ความร่วมมือระหว่าง DeepSeek ผู้ผลิตชิป และเฟรมเวิร์กซอฟต์แวร์ แสดงให้เห็นถึงการพัฒนาระบบนิเวศแบบบูรณาการ แนวโน้มนี้ชี้ให้เห็นว่าการแข่งขันในเอไอกำลังเปลี่ยนจากการมุ่งเน้นความล้ำของโมเดลแต่ละตัว ไปสู่ความสามารถในการคงไว้ซึ่งระบบที่ครบถ้วน คุ้มค่า และเป็นอิสระในระยะยาว

คำถามที่พบบ่อย (FAQ)

DeepSeek เพิ่มความสามารถใหม่อะไรให้กับแชตบอตของตน?
DeepSeek เพิ่ม “โหมดจดจำภาพ” ที่ทำให้แชตบอตสามารถเข้าใจภาพถ่ายและวิดีโอได้ ไม่ใช่แค่ข้อความ ฟีเจอร์นี้ถูกทดสอบครั้งแรกกับผู้ใช้กลุ่มเล็กทั้งบนเว็บไซต์และแอปมือถือ ทำให้ความสามารถของ DeepSeek สอดคล้องกับแชตบอตเอไอรายใหญ่อื่นๆ ที่นำเสนอความสามารถลักษณะเดียวกัน

บริษัทชิปจีนบริษัทใดสนับสนุน DeepSeek-V4 ในวันเปิดตัว?
บริษัทชิปจีน 4 แห่งยืนยันการรองรับ DeepSeek-V4 แบบวันเดียวกัน ได้แก่ Huawei Ascend (ด้วยชิป A2, A3 และ 950), Cambricon, Hygon Information และ Moore Threads ความเข้ากันได้แบบวันเดียวกันข้ามชิปเซ็ตหลายรุ่นนี้เคยพบได้ยากนอกระบบนิเวศของ Nvidia โดยปกติต้องใช้เวลาหลายเดือนในการทำงานปรับตัว

DeepSeek-V4 มีสองเวอร์ชันอะไรบ้าง และแตกต่างกันอย่างไร?
DeepSeek-V4-Pro มีพารามิเตอร์ 1.6 ล้านล้าน และออกแบบมาเพื่อการให้เหตุผลที่ซับซ้อนและเวิร์กโฟลว์อัตโนมัติแบบหลายขั้นตอน ส่วน DeepSeek-V4-Flash ได้รับการปรับให้เหมาะกับการจัดการคำขนาดใหญ่ในต้นทุนที่ต่ำกว่า ทั้งสองรองรับ context window ขนาดหนึ่งล้านโทเค็น และใช้การออกแบบ attention แบบไฮบริดเพื่อช่วยลดความต้องการด้านกำลังประมวลผลและหน่วยความจำ

news.article.disclaimer
แสดงความคิดเห็น
0/400
ybaservip
· 1 ชั่วโมง ที่แล้ว
Hold tight HODL💎 Hold tight HODL💎
ตอบกลับ0
GateUser-0b71fc11vip
· 1 ชั่วโมง ที่แล้ว
จากข้อความธรรมดาสู่มัลติโมเดล ครึ่งปีเดินทางเส้นทางที่คนอื่นใช้เวลาสองปี
ดูต้นฉบับตอบกลับ0
MirrorBallGazingAtTheSkyvip
· 1 ชั่วโมง ที่แล้ว
อย่าเพียงแต่โอ้อวด ปัญหา hallucination ของ RAG ได้รับการแก้ไขแล้วหรือยัง
ดูต้นฉบับตอบกลับ0
GateUser-ced0257avip
· 1 ชั่วโมง ที่แล้ว
การรู้จำวิดีโอ? ขอทดสอบความเสถียรของฉากที่ซับซ้อน
ดูต้นฉบับตอบกลับ0
GateUser-8f9ccfecvip
· 1 ชั่วโมง ที่แล้ว
เวลานี้ปล่อยข่าวได้ดีมาก พอดีเป็นจังหวะกับเทรนด์ชิปเซ็ต
ดูต้นฉบับตอบกลับ0
GateUser-cb789e81vip
· 1 ชั่วโมง ที่แล้ว
การลดต้นทุนคือความสามารถที่แท้จริง รอราคาของ API
ดูต้นฉบับตอบกลับ0
GasFeeAnxietyvip
· 1 ชั่วโมง ที่แล้ว
คำถามสุดท้าย: เมื่อไหร่จะเปิดให้ผู้ใช้ฟรีใช้งานได้
ดูต้นฉบับตอบกลับ0
GateUser-f78f1f3evip
· 1 ชั่วโมง ที่แล้ว
หลักชัยของชิปเซ็ต + การอัปเกรดฟังก์ชัน สองความสุขพร้อมกัน?
ดูต้นฉบับตอบกลับ0
GateUser-06596f3bvip
· 1 ชั่วโมง ที่แล้ว
เส้นทางมัลติโมเดิลตอนนี้ไม่มีฟังก์ชันนี้ ขอโทษที่ออกไปไม่ได้
ดูต้นฉบับตอบกลับ0
LendingRateAnxietyvip
· 1 ชั่วโมง ที่แล้ว
DeepSeek+ ชิปในประเทศจีน ปิดวงจรแล้วเป็นที่เรียบร้อย
ดูต้นฉบับตอบกลับ0
ดูเพิ่มเติม