Artificial Analysis merilis Index Agen Koding baru hari ini untuk mengevaluasi bagaimana model AI berperforma saat digabungkan dengan framework agen di berbagai tolok ukur utama, termasuk SWE-Bench-Pro-Hard-AA, Terminal-Bench v2, dan SWE-Atlas-QnA. Zhipu GLM-5.1 menempati peringkat pertama di antara model open-source dalam evaluasi, menunjukkan performa terdepan pada skenario agen koding di dunia nyata.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
TT Chain Mengintegrasikan Sistem Keamanan AegisAI untuk Perlindungan RWA pada 11 Mei
Menurut pengumuman TT Chain pada 11 Mei, jaringan blockchain Layer-2 mengintegrasikan infrastruktur keamanan berbasis AI milik AegisAI ke dalam ekosistem aset dunia nyata. Kolaborasi ini meningkatkan perlindungan untuk transaksi aset tokenisasi dan operasi lintas-chain melalui kemampuan deteksi ancaman yang canggih serta audit smart contract. Agen AI otonom milik AegisAI mendeteksi serangan phishing, mencegah upaya akses yang tidak sah, dan mengidentifikasi kerentanan pada smart contract secara
GateNews50menit yang lalu
JD.com Meningkatkan Agen AI Buatan Sendiri, Pertumbuhan Pengguna Melebihi 300% di Q1
Menurut CEO Xu Ran pada panggilan laporan pendapatan JD.com pada 12 Mei, perusahaan tersebut sedang melakukan peningkatan menyeluruh terhadap agen AI yang dikembangkannya sendiri agar dapat mengidentifikasi, mengaktifkan, dan mencocokkan kebutuhan pengguna dengan lebih tepat. Asisten AI JD.com, Jingdong Jingyan, mengalami peningkatan penggunaan pengguna lebih dari 300% dari tahun ke tahun pada kuartal pertama.
GateNews1jam yang lalu
The Graph Meluncurkan Fitur Pembayaran x402 yang Mendukung Akses Data On-Chain Per Permintaan dengan USDC pada 12 Mei
Menurut pengumuman resmi The Graph pada 12 Mei, Graph Gateway kini mendukung x402 Payments, memungkinkan pengembang dan AI Agents mengakses data on-chain melalui pembayaran per permintaan menggunakan USDC tanpa memerlukan API keys, akun, atau dasbor. Pengguna menerima respons HTTP 402 yang berisi informasi harga, lalu menyelesaikan pembayaran berbasis tanda tangan di USDC pada jaringan Base untuk mengambil data pada permintaan berikutnya. Pembaruan ini mencakup endpoint baru /api/x402/, SDK pemb
GateNews1jam yang lalu
SAP Berinvestasi di n8n, Menggandakan Penilaian Platform Otomatisasi Workflow hingga 5,2 miliar dolar AS
Menurut Bloomberg, SAP berinvestasi pada n8n pada Selasa, menggandakan valuasi platform otomasi workflow tersebut menjadi 5,2 miliar dolar AS. Raksasa perangkat lunak Jerman itu juga menandatangani perjanjian kemitraan multi-tahun dengan n8n untuk mengintegrasikan alat platform ke dalam platform pembangun agen AI SAP, Joule Studio, menurut pernyataan SAP.
GateNews2jam yang lalu
DAPPOS Meluncurkan xBubble, Agen AI Universal dengan 10+ Fitur Utama untuk Pengguna Non-Teknis
Menurut ChainCatcher, DAPPOS secara resmi meluncurkan xBubble, sebuah produk agen AI universal yang dirancang untuk pengguna non-teknis. Produk ini secara otomatis merekomendasikan agen khusus untuk menyelesaikan tugas dengan prompt yang minimal dan lebih sedikit iterasi debugging. xBubble menyediakan 10+ kemampuan inti yang mencakup pembuatan gambar, video, dokumen, dan situs web, serta mendukung penerapan lokal dan cloud.
GateNews7jam yang lalu
Nous Research Meluncurkan Agent Hermes untuk Kontrol Komputer macOS, Mengurangi Konsumsi Token hingga 95%
Nous Research mengumumkan bahwa Hermes Agent miliknya telah meluncurkan fungsionalitas kontrol komputer macOS, menurut pemantauan oleh Beating. Fitur ini memungkinkan operasi latar belakang seperti pencarian email dan penulisan kode tanpa mengganggu input pengguna atau fokus jendela. Melalui mekanisme kompresi konteks empat lapis, framework ini menurunkan konsumsi token dari sekitar 600.000 menjadi 30.000 token saat menjalankan 20 operasi berurutan pada resolusi 1568×900.
GateNews9jam yang lalu