英偉達Cosmos 3物理AI世界模型今日正式開放下載,兩個版本上線HuggingFace

幣界網消息,英偉達今日正式開放Cosmos 3物理AI世界模型的模型權重下載,首批發布super(646億參數)和nano(157億參數)兩個版本,均已上線HuggingFace(無門控,可直接下載)和build.nvidia.com,同時支持以NVIDIA NIM微服務形式部署。Cosmos 3定位為面向物理AI的全模態(omnimodel)世界基礎模型,基於全新的混合Transformer架構(mixture of transformers),原生理解和生成文本、圖像、視頻、環境聲和動作。super版本面向需要最高物理精度的後訓練機器人和自動駕駛模型,nano版本針對高品質視頻和動作推理的低延遲場景。此外,edge版本(面向邊緣端實時推理)預計近期發布。英偉達稱Cosmos 3是「全球首個完全開放的全模態模型」,開發者可自由下載、後訓練並轉化為專有模型。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 8
  • 2
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
猫头鹰看链
· 2小時前
混合Transformer架構有點東西,全模態統一理解終於不是畫餅了
查看原文回復0
晚霞里的止损
· 3小時前
等等党大勝利,之前傳言的參數規模居然是真的
查看原文回復0
SlowerThanBlock
· 3小時前
物理AI世界模型+無門控,其他大廠跟不跟?不跟就掉隊了
查看原文回復0
GateUser-470bc925
· 3小時前
參數差四倍,精度vs效率的取捨,看場景選刀
查看原文回復0
霓虹融冰淇淋
· 3小時前
mixture of transformers 具體怎麼混的,等技術博客拆解
查看原文回復0
QuantsAndCats
· 3小時前
自動駕駛後訓練用super,影片生成用nano,分工明確
查看原文回復0
L2搬砖少年
· 3小時前
原生支持環境聲這點很多人沒注意,多模態終於帶上耳朵了
查看原文回復0
套利不如睡觉
· 3小時前
NIM微服務部署對中小企業太友好了,不用自己搭巨複雜的infra
查看原文回復0
  • 已置頂