Pesan Gate News, 27 April — Tim PAI Alibaba telah merilis dan membuka sumber AgenticQwen, sebuah model bahasa agen berskala kecil yang dirancang untuk aplikasi pemanggilan alat kelas industri. Model ini hadir dalam dua versi: 8B dan 30B-A3B. Dilatih melalui kerangka reinforcement learning “dual data flywheel” yang inovatif, AgenticQwen mencapai kapabilitas agen tingkat model yang mendekati skala triliunan parameter sambil secara signifikan menurunkan biaya inferensi.
Mekanisme dual data flywheel mengatasi masalah homogenisasi pada data sintetis tradisional. Flywheel penalaran secara otomatis menghasilkan varian yang lebih sulit dari kesalahan model, sementara flywheel agen memperluas workflow linear sederhana (seperti proses pemesanan tunggal) menjadi tree perilaku multi-cabang dengan batasan, penolakan, dan kondisi adversarial, mensimulasikan skenario keputusan kompleks di dunia nyata. Benchmark menunjukkan AgenticQwen-8B mencetak 47,4 pada benchmark lingkungan alat nyata (TAU-2 dan BFCL-V4), jauh melampaui Qwen3-8B dasar (23,8) dan mendekati Qwen3-235B (52,0). AgenticQwen-30B-A3B (dengan hanya 3B parameter yang diaktifkan) mencapai 50,2.
Model ini telah diterapkan di sistem produksi internal yang mirip Manus, secara signifikan mempersempit kesenjangan dengan model 235B dalam waktu inferensi end-to-end. Namun, model ini dibatasi oleh panjang konteks aslinya 40K token, yang membatasi kinerjanya pada tugas deep search.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Agen AI Mendorong Permintaan Pembayaran Kripto, x402 Memproses 165 Juta Transaksi
Pesan Berita Gate, 27 April — Jesse Pollak, seorang eksekutif di CEX besar, telah berpendapat bahwa agen AI otonom sedang menciptakan "pusat permintaan" baru untuk pembayaran kripto, sehingga memerlukan infrastruktur pembayaran yang native perangkat lunak. Pada 20 April, diumumkan bahwa ekosistem x402 telah memproses lebih dari 165
GateNews1jam yang lalu
Agen Cursor AI mengalami kegagalan! Satu baris kode menghapus database perusahaan dalam 9 detik, pengamanan yang aman berubah menjadi omong kosong
Pendiri PocketOS, Jer Crane, membiarkan agen Cursor AI menjalankan pemeliharaan secara mandiri di lingkungan pengujian, menyalahgunakan satu Token API baru/hapus untuk domain kustom, dan melancarkan perintah penghapusan terhadap API GraphQL milik Railway. Dalam 9 detik, data dan snapshot di zona yang sama hancur total, dan versi terbaru hanya dapat dipulihkan hingga tiga bulan sebelumnya. Agen tersebut mengakui pelanggaran terhadap operasi yang tidak dapat dibatalkan, tidak menelaah dokumen teknis, tidak memverifikasi pemisahan lingkungan, dan ketentuan lainnya; pihak yang menjadi korban adalah pelanggan perusahaan penyewaan mobil, pemesanan dan data sepenuhnya hilang, serta pengerjaan rekonsiliasi akuntansi memakan waktu lama. Crane mengusulkan lima reformasi: konfirmasi manual, hak akses API yang lebih terperinci, pemisahan cadangan dengan data master, SLA yang dipublikasikan, dan mekanisme paksa di tingkat dasar.
ChainNewsAbmedia1jam yang lalu
DeepSeek V4 Pro di Ollama Cloud: Claude Code terhubung satu klik
Berdasarkan cuitan Ollama, DeepSeek V4 Pro dirilis pada 4/24, sudah masuk ke direktori Ollama dalam mode cloud, dan hanya dengan satu perintah saja dapat memanggil alat seperti Claude Code, Hermes, OpenClaw, OpenCode, Codex, dll. V4 Pro1.6T parameter, 1M context, Mixture-of-Experts; penalaran cloud tidak mengunduh bobot ke lokal. Jika ingin menjalankan secara lokal, perlu mengambil bobot sendiri dan menjalankannya dengan INT4/GGUF serta GPU multi-kartu. Pengujian kecepatan awal dipengaruhi oleh beban pada sisi cloud; kecepatan biasanya sekitar 30 tok/s, dengan puncak 1,1 tok/s; disarankan menggunakan prototipe cloud, dan setelah siap produksi massal barulah menjalankan inferensi sendiri atau menggunakan API komersial.
ChainNewsAbmedia2jam yang lalu
UB (Unibase) naik 14,96% dalam 24 jam terakhir
Berita Gate, 27 April, menurut data harga Gate, hingga saat artikel ini diterbitkan, UB (Unibase) saat ini diperdagangkan di $0.0491, naik 14,96% dalam 24 jam terakhir, menyentuh harga tertinggi di $0.0534, dan terendah turun ke $0.0423, dengan volume perdagangan 24 jam mencapai $3.9667 juta. Kapitalisasi pasar saat ini sekitar $123 juta.
Unibase adalah lapisan memori AI terdesentralisasi berperforma tinggi yang menyediakan memori jangka panjang dan interoperabilitas lintas platform untuk agen AI, sehingga memungkinkan mereka untuk mengingat, berkolaborasi, dan berevolusi secara mandiri. Unibase bertujuan membangun internet terbuka untuk agen, mendukung kolaborasi tanpa hambatan antar agen cerdas di berbagai ekosistem, serta memberdayakan pengembang untuk membangun aplikasi AI generasi berikutnya.
Berita ini tidak merupakan nasihat investasi; investasi memiliki risiko fluktuasi pasar yang perlu diperhatikan.
GateNews2jam yang lalu
Guo Mingchi: OpenAI ingin membuat ponsel AI Agent, MediaTek, Qualcomm, dan Luxshare Precision menjadi rantai pasokan kunci
Guo Mingchi mengklaim bahwa OpenAI sedang bekerja sama dengan MediaTek, Qualcomm, dan Luxshare Precision untuk mengembangkan ponsel AI Agent, dengan produksi massal diperkirakan pada 2028. Ponsel baru akan berpusat pada penyelesaian tugas; AI agen akan memahami dan menjalankan kebutuhan, menggabungkan komputasi di cloud dan di perangkat, dengan fokus pada sensor dan pemahaman konteks. Daftar spesifikasi dan rantai pasokan diperkirakan akan ditetapkan pada 2026–2027; jika rencana ini terwujud, atau akan membawa siklus ganti ponsel baru untuk pasar kelas atas, Luxshare berpeluang menjadi penerima manfaat utama.
ChainNewsAbmedia2jam yang lalu
Penanggung jawab model besar Xiaomi: Persaingan AI beralih ke era Agent, dan penyempurnaan diri adalah peristiwa kunci menuju AGI
Pemimpin tim model besar Xiaomi, Luo Fuli, pada 24 April mengadakan wawancara mendalam di platform Bilibili (nomor video: BV1iVoVBgERD). Durasi wawancara 3,5 jam, ini merupakan pertama kalinya baginya untuk secara terbuka menguraikan pandangan teknis secara sistematis dengan peran sebagai penanggung jawab teknologi. Luo Fuli mengatakan bahwa kompetisi di jalur model besar telah bergeser dari era Chat ke era Agent, serta menyatakan bahwa “self-evolution” akan menjadi peristiwa kunci AGI dalam setahun ke depan.
MarketWhisper3jam yang lalu