4月18日,多家風險投資消息人士向澎湃新聞(Pail News)確認,深度求索已啟動其首輪外部募資。據引用知情人士的報導,該公司目標估值超過$10 十億,並計劃至少$300 百萬融資,以在AI競爭成本上升之際鞏固資本儲備。
深度求索先前因拒絕以商業化為重心而獲得業界認可,依靠創辦人梁文鋒以及幻方資本的支持。該公司在量化交易和智慧金融等領域具備強大的技術能力,並且是中國最早的一批大型模型公司之一,運行著1萬張卡的GPU集群。
儘管深度求索在去年春節期間因病毒式走紅而聲名大噪,公司仍出現了顯著的人才流失。據澎湃新聞報導,多名核心研究人員自去年以來相繼離開,主要是「95後」的年輕科學家:
多模態模型研究員:4月12日,自動駕駛公司遠榮自動駕駛公開確認,深度求索多模態模型的核心貢獻者阮聰已加入,擔任首席科學家,並將在北京車展上首次公開亮相。
第一代LLM作者:王秉軒,深度求索首個大型語言模型的核心作者,近期宣布加入騰訊。
OCR系列作者:魏浩然,深度求索-OCR系列的核心作者,今年春節前後離職,但尚未公開披露其新雇主。
GRPO演算法研究員:4月16日,有報導稱,前深度求索核心研究員郭大牙已加入字節跳動,並報導其年薪達到數億元人民幣。根據相關披露,郭大牙加入字節跳動負責大型模型研發的Seed組織,作為(智能體)方向的L8級代理負責人之一。郭大牙被認定為GRPO演算法的重要貢獻者,而該演算法是深度求索-R1的推理訓練方法論核心。同一天,字節跳動集團副總裁李亮回應稱該報導不準確,公司近期也沒有聘請年薪接近數億元人民幣的員工。然而,據澎湃新聞確認的多家消息來源指出,郭大牙確實已加入字節跳動。
深度學習研究員:11月12日,前深度求索核心研究員羅伏力公開宣布加入小米MiMo,在一則社群媒體貼文中表示:「智慧終將從語言走向物理世界。我在小米MiMo,與一群富有創意、才華出眾、並且真正充滿熱情的研究人員一起,打造我們期望的未來,並追求我們所設想的AGI。」根據公開資訊,羅伏力畢業於北京師範大學計算機科學專業,並在北京大學完成了計算語言學碩士學位。取得碩士學位後,她加入阿里巴巴DAMO學院,擔任機器智慧實驗室研究員,開發多語言預訓練模型VECO,並推動AliceMind的開源工作。2022年,羅伏力加入幻方量化(深度求索的母公司)從事深度學習工作,之後擔任深度求索深度學習研究員,並參與了包括深度求索-V2在內的模型研發。
基於上述資訊,深度求索在多個領域出現了核心人才流失,包括基礎大語言模型(LLM)、智慧代理(Agent)、光學字元辨識(OCR)以及多模態技術。
據業界消息人士稱,深度求索的薪資與薪酬水平在業內屬於中等,而非最高。然而,目前獵頭正加速從深度求索團隊挖角,提供2至3倍更高的薪資與股權選項,從而加速人員流失。
4月8日,深度求索出現了新的介面更新:輸入框現在顯示「快速模式」與「專家模式」選項。根據網頁顯示,快速模式適用於日常對話並提供即時回應,且支援從圖片與檔案進行文字辨識;而專家模式擅長處理複雜問題。這意味著深度求索首次在其官方網頁中引入分層模式。
這些更新也重新引發外界對深度求索V4發布的猜測。根據外媒報導以及來自社群媒體與多家消息來源的信息,深度求索預期將在4月正式推出V4。依據外界預期,若此次V4發布要複製去年的春節現象,毫無疑問將面臨更大的挑戰,而人員流失也將不可避免地影響V4的發布。