เมื่อวันที่ 18 เมษายน แหล่งข่าวจากวงการทุนร่วมหลายแห่งยืนยันว่า DeepSeek ได้เริ่มการระดมทุนภายนอกครั้งแรกแล้ว ตามรายงานของ澎湃新闻 (Pail News) บริษัทตั้งเป้ามูลค่าประเมินที่เกิน $10 พันล้าน และวางแผนที่จะระดมทุนอย่างน้อย $300 ล้าน เพื่อเสริมสภาพคล่องของเงินทุนท่ามกลางต้นทุนที่เพิ่มสูงขึ้นในการแข่งขันด้าน AI ตามรายงานที่อ้างอิงจากแหล่งข่าวที่ให้ข้อมูล
ก่อนหน้านี้ DeepSeek ได้รับการยอมรับในอุตสาหกรรมจากการปฏิเสธการมุ่งเน้นการทำการค้า โดยอาศัยผู้ก่อตั้ง Liang Wenfeng และการสนับสนุนจาก Phantasm Capital บริษัทมีความสามารถทางเทคนิคที่แข็งแกร่งในด้านการเทรดเชิงปริมาณและการเงินอัจฉริยะ และเป็นหนึ่งในบริษัทโมเดลขนาดใหญ่ยุคแรกๆ ของจีนที่ดำเนินการคลัสเตอร์ GPU แบบ 10,000 การ์ด
แม้ว่า DeepSeek จะโดดเด่นหลังจากความสำเร็จไวรัลในช่วงเทศกาลตรุษจีนเมื่อปีที่แล้ว แต่บริษัทกลับประสบกับการสูญเสียบุคลากรจำนวนมาก ตามรายงานของ澎湃新闻 นักวิจัยแกนหลักหลายรายได้ออกจากบริษัทตั้งแต่ปีที่แล้ว โดยส่วนใหญ่เป็นนักวิทยาศาสตร์หนุ่มรุ่น “หลังปี 95”:
นักวิจัยโมเดลมัลติโหมด: เมื่อวันที่ 12 เมษายน บริษัท YuanRong Autonomous Driving ซึ่งเป็นบริษัทด้านการขับขี่อัตโนมัติ ได้ยืนยันต่อสาธารณะว่า Ruan Cong ผู้ร่วมก่อตั้ง/ผู้มีส่วนสำคัญต่อโมเดลมัลติโหมดของ DeepSeek ได้เข้าร่วมเป็น Chief Scientist และจะปรากฏตัวต่อสาธารณะครั้งแรกในงาน Beijing Auto Show
ผู้เขียน LLM รุ่นแรก: Wang Bingxuan ผู้เขียนแกนหลักของโมเดลภาษาแบบใหญ่ (LLM) รุ่นแรกของ DeepSeek ได้ประกาศเมื่อไม่นานมานี้ว่าเข้าร่วม Tencent
ผู้เขียนซีรีส์ OCR: Wei Haoran ผู้เขียนแกนหลักของซีรีส์ DeepSeek-OCR ออกจากบริษัทเมื่อราวช่วงเทศกาลตรุษจีนปีนี้ แต่ยังไม่ได้เปิดเผยนายจ้างรายใหม่ต่อสาธารณะ
นักวิจัยอัลกอริทึม GRPO: เมื่อวันที่ 16 เมษายน มีรายงานว่า Guo Daya อดีตนักวิจัยแกนหลักของ DeepSeek ได้เข้าร่วม ByteDance โดยมีรายงานเงินเดือนเป็นระดับหลายร้อยล้านหยวน ตามการเปิดเผยที่เกี่ยวข้อง Guo Daya ได้เข้าร่วมหน่วย Seed ของ ByteDance ซึ่งรับผิดชอบด้านการวิจัยและพัฒนารุ่นโมเดลขนาดใหญ่ โดยเป็นหนึ่งในหัวหน้าทิศทาง (intelligent agent) ระดับ L8 Guo Daya ถูกระบุว่าเป็นผู้มีส่วนสนับสนุนสำคัญต่ออัลกอริทึม GRPO ซึ่งเป็นแกนหลักของวิธีการฝึกการให้เหตุผลของ DeepSeek-R1 ในวันเดียวกัน ByteDance Group Vice President Li Liang ตอบกลับว่ารายงานดังกล่าวไม่ถูกต้อง และบริษัทไม่ได้ว่าจ้างพนักงานในระดับเงินเดือนประจำปีใกล้เคียงหลายร้อยล้านหยวนในช่วงนี้ อย่างไรก็ตาม ตามแหล่งข่าวหลายแหล่งที่ยืนยันโดย澎湃新闻 Guo Daya ได้เข้าร่วม ByteDance จริง
นักวิจัยการเรียนรู้เชิงลึก: เมื่อวันที่ 12 พฤศจิกายน Luo Fuli อดีตนักวิจัยแกนหลักของ DeepSeek ได้ประกาศต่อสาธารณะว่าเข้าร่วม Xiaomi MiMo โดยระบุในโพสต์บนโซเชียลมีเดียว่า “ปัญญาจะเปลี่ยนจากภาษาไปสู่โลกทางกายภาพในที่สุด ฉันอยู่ที่ Xiaomi MiMo ทำงานร่วมกับกลุ่มนักวิจัยที่สร้างสรรค์ มีความสามารถ และมีความหลงใหลอย่างแท้จริง เพื่อสร้างอนาคตนี้และมุ่งไปสู่ AGI ที่เราจินตนาการไว้” ตามข้อมูลสาธารณะ Luo Fuli สำเร็จการศึกษาจากสาขาวิทยาการคอมพิวเตอร์ของ Beijing Normal University และจบปริญญาโทด้านภาษาศาสตร์เชิงคำนวณที่ Peking University หลังจากจบปริญญาโท เธอเข้าร่วม Alibaba DAMO Academy ในฐานะนักวิจัยในห้องปฏิบัติการ machine intelligence พัฒนารุ่น pre-training แบบพหุภาษาที่ชื่อ VECO และส่งเสริมงานโอเพนซอร์ส AliceMind ในปี 2022 Luo Fuli เข้าร่วม Phantasm Quantitative (DeepSeek’s parent company) เพื่อทำงานด้านการเรียนรู้เชิงลึก ต่อมาได้ทำงานเป็นนักวิจัยการเรียนรู้เชิงลึกของ DeepSeek และมีส่วนร่วมในการวิจัยและพัฒนารุ่นต่างๆ รวมถึง DeepSeek-V2
จากข้อมูลข้างต้น DeepSeek ได้ประสบกับการสูญเสียบุคลากรแกนหลักในหลายโดเมน รวมถึงโมเดลภาษาแบบใหญ่พื้นฐาน (LLM) ตัวแทนอัจฉริยะ (Agent) การรู้จำอักขระด้วยแสง (OCR) และเทคโนโลยีมัลติโหมด
ตามแหล่งข่าวในอุตสาหกรรม ระดับเงินเดือนและค่าตอบแทนของ DeepSeek อยู่ในช่วงกลางของอุตสาหกรรม ไม่ใช่ระดับสูงที่สุด อย่างไรก็ตาม ในขณะนี้ headhunter กำลังเร่งการแย่งตัวบุคลากรจากทีมของ DeepSeek ด้วยเงินเดือนและตัวเลือกอิควิตีที่สูงกว่า 2-3 เท่า ส่งผลให้การสูญเสียบุคลากรถูกเร่งให้เกิดขึ้นเร็วขึ้น
เมื่อวันที่ 8 เมษายน พบการอัปเดตอินเทอร์เฟซใหม่บน DeepSeek: ช่องป้อนข้อมูลตอนนี้แสดงตัวเลือก “Quick Mode” และ “Expert Mode” ตามการแสดงผลบนหน้าเว็บ Quick Mode เหมาะสำหรับการสนทนาในชีวิตประจำวันพร้อมการตอบกลับทันที และรองรับการรู้จำข้อความจากรูปภาพและไฟล์ ส่วน Expert Mode โดดเด่นสำหรับปัญหาที่ซับซ้อน นี่ถือเป็นการเปิดตัวโหมดแบบแบ่งชั้นบนหน้าเว็บทางการของ DeepSeek เป็นครั้งแรก
การอัปเดตเหล่านี้ได้จุดชนวนการคาดเดาเกี่ยวกับการเปิดตัว V4 ของ DeepSeek อีกครั้ง จากรายงานสื่อภายนอกและข้อมูลจากโซเชียลมีเดียและแหล่งข่าวหลายแห่ง DeepSeek คาดว่าจะเปิดตัว V4 อย่างเป็นทางการในเดือนเมษายน ตามความคาดหวังจากภายนอก หากการเปิดตัว V4 นี้จะจำลองปรากฏการณ์ในช่วงเทศกาลตรุษจีนเมื่อปีที่แล้ว ก็ย่อมต้องเผชิญกับความท้าทายที่มากขึ้น และการสูญเสียบุคลากรย่อมส่งผลต่อการเปิดตัว V4 อย่างหลีกเลี่ยงไม่ได้