Menurut Beating, tim Kaiming He dari MIT baru-baru ini merilis ELF (Embedded Language Flows), sebuah model difusi bahasa yang menyimpang dari pendekatan autoregresif “memprediksi token berikutnya” yang digunakan oleh model bergaya GPT. Sebagai gantinya, ELF melakukan generasi teks dalam ruang embedding kontinu, mengubahnya menjadi token diskrit hanya pada langkah terakhir.
Pada tolok ukur generasi tanpa kondisi OpenWebText, ELF-B dengan 105M parameter mencapai sekitar 24,1 perplexity generasi (Gen. PPL) dengan sampling 32 langkah, mengungguli berbagai baseline model bahasa difusi diskrit maupun kontinu. Yang menonjol, ELF-B hanya memerlukan kira-kira 45 miliar token pelatihan, sekitar satu orde besarnya lebih sedikit dibanding metode sebanding yang biasanya melampaui 500 miliar token.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Tesla Berencana Meluncurkan Produk AI Lebih Banyak untuk Tiongkok, Memanfaatkan 400+ Pemasok Lokal
Menurut China Daily, Tesla berencana menghadirkan lebih banyak produk AI dan cerdas ke Tiongkok, dengan Wakil Presiden Grace Tao menyoroti integrasi rantai pasok yang dalam perusahaan di negara tersebut. Per Maret 2026, Tesla bekerja sama dengan lebih dari 400 pemasok asal Tiongkok, lebih dari 60 di antaranya memasok jaringan globalnya, dengan pelokalan komponen di Shanghai Gigafactory melebihi 95%. Perusahaan mengoperasikan 588 toko yang dikelola langsung di 119 kota di Tiongkok daratan, diduku
GateNews11menit yang lalu
SoftBank Melaporkan Keuntungan Belum Direalisasi Senilai 45 Miliar Dolar dari Investasi OpenAI per Akhir Maret
Menurut ChainCatcher, SoftBank melaporkan keuntungan belum terealisasi kumulatif senilai 45 miliar dolar AS dari investasinya di OpenAI per akhir Maret. Pada April 2026, perusahaan menyalurkan pinjaman sebesar 20 miliar dolar AS terutama untuk investasi OpenAI, di mana 2,5 miliar dolar AS dilunasi pada bulan yang sama.
GateNews11menit yang lalu
Duta Besar Tiongkok Xie Feng Menyerukan Persaingan AI yang Sehat dengan AS Menjelang Kunjungan Trump
Menurut Kedutaan Besar AS di Tiongkok, Duta Besar Tiongkok untuk Amerika Serikat Xie Feng membahas hubungan AS-Tiongkok dan kunjungan mendatang Presiden Trump ke Tiongkok dalam sebuah wawancara dengan koresponden kebijakan diplomatik senior Newsweek Tom O'Connor, yang dirilis menjelang perjalanan tersebut.
GateNews21menit yang lalu
UE Membahas Bergabung dengan Aliansi Teknologi Pax Silica yang Didukung AS dalam Beberapa Pekan Mendatang
Menurut Bloomberg, Uni Eropa sedang dalam pembicaraan untuk bergabung dengan Pax Silica, aliansi yang didukung AS untuk semikonduktor, infrastruktur AI, mineral kritis, dan pusat data, sebagai bagian dari upaya mengurangi ketergantungan pada China. Komisi Eropa berencana mengirim pejabat senior ke AS dalam beberapa minggu mendatang untuk membahas ketentuan. Langkah ini muncul saat Swedia dan Finlandia telah lebih dulu bergabung dengan aliansi tersebut, dan Uni Eropa mencari dukungan dari Prancis
GateNews31menit yang lalu
Samsung Berencana Memulai Produksi Massal Memori Server AI CXL 3,1 pada Kuartal Keempat
Menurut The Korea Herald, Samsung Electronics berencana memulai produksi massal modul memori CXL 3.1 untuk server AI pada kuartal keempat, setelah pengiriman sampel pada kuartal ketiga. Modul CMM-D 3.1 menggabungkan DRAM dan pengontrol CXL dalam satu papan, mendukung hingga 1 terabyte dengan bandwidth 72 gigabytes per detik pada PCIe 6.0. Samsung sebelumnya mengirimkan sampel CXL 2.0 ke lebih dari 40 perusahaan termasuk Microsoft dan Amazon.
GateNews41menit yang lalu
Mantan Peneliti AI Alibaba Linjun Lin Meluncurkan Lab AI Baru Senilai Sekitar 2 Miliar Dolar AS
Menurut The Information, Linjun Lin, mantan peneliti AI di Alibaba, baru-baru ini mendirikan sebuah laboratorium kecerdasan buatan baru. Startup tersebut diperkirakan memiliki valuasi sekitar $2 miliar.
GateNews43menit yang lalu