Alibaba meluncurkan Qwen-Robot Suite dengan tiga model, beberapa robot “semuanya open source”

Qwen-Robot Suite模型

Tim Qwen-Robot dari Alibaba merilis Qwen-Robot Suite pada 17 Juni, sebuah kecerdasan terwujud end-to-end yang terdiri dari tiga model dasar: Qwen-RobotNav (navigasi pergerakan), Qwen-RobotManip (manipulasi robot), dan Qwen-RobotWorld (simulasi dunia fisik). Ketiga model tersebut semuanya telah open source.

Qwen-RobotNav: lima tugas disatukan, 15,60 juta data pelatihan

Qwen-RobotNav mengintegrasikan lima tugas: perintah-following, navigasi ke titik tujuan, pencarian objek, pelacakan tujuan, dan mengemudi secara otonom, dengan menyediakan antarmuka yang dapat diparameterkan (anggaran token, peluruhan waktu, bobot per frame). Model dilatih pada 15,60 juta sampel; pada tolok ukur VLN-CE RxR (navigasi visual dan bahasa di lingkungan nyata) tingkat keberhasilannya mencapai 76,5%, dan pada EVT-Bench (pelacakan target bergerak) mencapai 90%.

Qwen-RobotManip: 38.100 jam data pelatihan, peringkat pertama di RoboChallenge Table30-v1

Cara merepresentasikan aksi untuk berbagai robot sangat berbeda (lengan robot Franka menggunakan sudut sendi, ALOHA dua lengan menggunakan posisi dan arah gripper, robot humanoid menggunakan koordinat seluruh tubuh). Alibaba mengombinasikan data pelatihan sekitar 38.100 jam dari basis data robot open source dan video manusia, tanpa bergantung pada pengumpulan data privat. Model menempati peringkat pertama pada tolok ukur RoboChallenge Table30-v1, melampaui metode sebelumnya sebesar 20%.

Qwen-RobotWorld: 8,60 juta korpus video, peringkat pertama di EWMBench dan DreamGen Bench

Qwen-RobotWorld adalah model dunia video berbasis bahasa bersyarat, menjadikan bahasa alami sebagai antarmuka aksi umum: perintah seperti “ambil cangkir merah lalu tuang air ke atas bunga” dapat digunakan untuk agen gripper, agen mobil otonom, maupun agen navigasi bergerak. Kumpulan data pelatihannya mencakup 8,60 juta pasangan video-teks, 200 juta frame, mencakup manipulasi (5,90 juta sampel, 1.300+ keterampilan, 20+ bentuk), mengemudi otonom (Waymo, NVIDIA PhysicalAI-AD), navigasi dalam ruangan, serta pemindahan manusia-mesin lintas 14 jenis lengan robot. Pada dua tolok ukur, EWMBench dan DreamGen Bench, keduanya meraih peringkat pertama, dengan skor penuh pada uji konsistensi fisik.

Keterangan resmi Qwen: model perangkat lunak, bukan robot fisik; harga dan jadwal belum diumumkan

Menurut penjelasan blog resmi Qwen, Qwen-Robot Suite adalah model perangkat lunak, bukan robot fisik; untuk penerapan di skenario rumahan masih diperlukan waktu bertahun-tahun. Alibaba saat ini belum mengumumkan harga, jadwal, atau daftar pelanggan di luar rencana pilot. Laboratorium Barat seperti Google DeepMind, Nvidia, Figure, dan Physical Intelligence juga mengejar tujuan serupa, tetapi pemberitaan menyebutkan bahwa mayoritas fokus pada kemampuan tunggal seperti navigasi atau manipulasi, bukan paket terpadu yang mudah dirakit.

FAQ

Tiga model di Qwen-Robot Suite masing-masing ditujukan untuk skenario apa?

Menurut blog resmi Qwen, penempatan ketiga model adalah: Qwen-RobotNav bertanggung jawab atas navigasi pergerakan (lima tugas disatukan); Qwen-RobotManip bertanggung jawab atas manipulasi robot lintas robot (kompatibel dengan berbagai cara merepresentasikan gerakan); Qwen-RobotWorld bertanggung jawab atas simulasi dunia fisik (bahasa sebagai antarmuka aksi umum). Ketiga model berdiri sendiri, dan bila digabung membentuk tumpukan kecerdasan terwujud secara penuh.

“Momen Android untuk robot” apakah itu pernyataan Qwen sendiri?

Ya. “Momen Android di bidang robot” adalah deskripsi penempatan yang digunakan Qwen resmi Alibaba saat peluncuran, yang berarti Qwen-Robot Suite merupakan platform di lapisan sistem operasi, bukan perangkat keras. Ini adalah pernyataan positioning pasar dari Qwen, bukan penilaian pihak ketiga.

Apakah Qwen-Robot Suite terbuka untuk umum (open source)?

Menurut blog resmi Qwen, ketiga model dirilis dengan open source. Data pelatihan Alibaba berasal dari basis data robot open source dan video manusia, tanpa bergantung pada pengumpulan data privat; strategi open source merupakan salah satu pesan utama dari rilis kali ini.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar