Pesan Gate News, 24 April — DeepSeek telah merilis seri model open-source V4 di bawah Lisensi MIT, dengan bobot kini tersedia di Hugging Face dan ModelScope. Seri ini mencakup dua model (MoE) mixture-of-experts: V4-Pro dengan total parameter 1,6 triliun dan 49 miliar yang diaktifkan per token, serta V4-Flash dengan total parameter 284 miliar dan 13 miliar yang diaktifkan per token. Keduanya mendukung jendela konteks 1 juta token.
Arsitekturnya menampilkan tiga peningkatan kunci: mekanisme attention hibrida yang menggabungkan compressed sparse attention (CSA) dan heavily compressed attention (HCA) yang secara signifikan mengurangi overhead untuk konteks panjang—FLOPs inferensi V4-Pro untuk konteks 1M hanya 27% dari V3.2, dan KV cache (VRAM untuk menyimpan informasi historis selama inferensi) hanya 10% dari V3.2; manifold-constrained hyperconnections (mHC) menggantikan residual connection tradisional untuk meningkatkan stabilitas propagasi sinyal lintas-lapis; dan optimizer Muon untuk konvergensi pelatihan yang lebih cepat. Pra-pelatihan menggunakan lebih dari 32 triliun token data.
Pascapelatihan menggunakan pendekatan dua tahap: pertama melatih expert khusus domain melalui supervised fine-tuning (SFT) dan reinforcement learning GRPO, lalu menggabungkannya menjadi satu model melalui distilasi online. V4-Pro-Max (highest inference mode) mengklaim sebagai model open-source terkuat dengan benchmark coding kelas atas dan kesenjangan yang secara signifikan dipersempit dibandingkan model frontier closed-source dalam tugas penalaran dan agen. V4-Flash-Max mencapai performa penalaran level Pro dengan anggaran komputasi yang cukup, tetapi dibatasi oleh skala parameter pada pengetahuan murni dan tugas agen yang kompleks. Bobot disimpan dalam presisi campuran FP4+FP8.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Insinyur OpenAI Clive Chan Menantang Rekomendasi Perangkat Keras V4, Mengutip Kesalahan dan Ketidakjelasan Dibanding V3
Kabar Gerbang, 24 April — Insinyur OpenAI Clive Chan telah mengajukan keberatan terperinci terhadap bab rekomendasi perangkat keras dalam laporan teknis V4, menyebutnya "mencengangkan: biasa saja dan rawan kesalahan" dibandingkan versi V3 yang terkenal. Panduan perangkat keras V3, yang mencakup sesi Tanya Jawab
GateNews30menit yang lalu
Naver Meluncurkan Beta AI Tab saat Google Gemini Masuk Pasar Pencarian Korea Selatan
Pesan Berita Gate, 24 April — Naver mengumumkan dimulainya beta tertutup untuk AI Tab, fitur pencarian percakapan barunya, setelah peluncuran Gemini oleh Google di Chrome di Korea Selatan.
AI Tab akan muncul berdampingan dengan tab pencarian Naver yang sudah ada, memberi pengguna ruang khusus untuk pertanyaan percakapan
GateNews41menit yang lalu
Perekrutan Kejuruan AI di India Melonjak 59,5%, Meluas di Luar Pusat Teknologi
Laporan Pasar Tenaga Kerja AI LinkedIn 2026, yang dirilis pada 24 April, menemukan bahwa perekrutan untuk insinyur AI di India naik 59,5% dari tahun ke tahun, menandai laju tercepat di antara pasar-pasar yang diteliti oleh platform tersebut.
Pertumbuhan ini didorong oleh permintaan yang menyebar melampaui pusat teknologi yang sudah mapan. Kota-kota termasuk
CryptoFrontier1jam yang lalu
Commonwealth Bank Memotong 120 Pekerjaan di Tengah Perluasan AI
Bank Persemakmuran Australia mengumumkan bahwa pihaknya akan memangkas sekitar 120 pekerjaan karena bank terbesar di negara itu meninjau peran-peran dan memperluas penggunaan kecerdasan buatan, menurut Bloomberg. Pemangkasan tersebut mencakup 43 peran di Bankwest di Australia Barat, dengan enam posisi terdampak oleh otomatisasi. Ini a
CryptoFrontier1jam yang lalu
Cursor Mengungkap Alasan Pelatihan XAI: Daya komputasi terjebak, SpaceX memegang opsi senilai 60 miliar dolar AS lainnya untuk akuisisi
Pengumuman Anysphere menyatakan bahwa Cursor akan menggunakan infrastruktur Colossus dari xAI untuk melatih model baru guna memecahkan hambatan daya komputasi; SpaceX mengajukan opsi akuisisi senilai 60 miliar dolar (dapat diakuisisi sepenuhnya dalam waktu hingga tahun 2026), dan jika tidak, membayar sekitar 10 miliar dolar sebagai kompensasi kerja sama. Kedua transaksi tersebut berjalan bersamaan, membentuk ulang siapa yang dapat melatih Cursor serta siapa yang bisa membeli Cursor; Cursor tetap mengizinkan banyak model untuk sisi backend, tetapi arah jangka panjangnya bergantung pada apakah SpaceX menggunakan hak akuisisinya.
ChainNewsAbmedia1jam yang lalu
Penilaian pasar sekunder Anthropic menembus 1 triliun dolar: Forge Global mengungguli OpenAI sebesar 880 miliar
Berdasarkan laporan Decrypt, valuasi sekunder Anthropic dari Forge Global sekitar 1 triliun dolar, OpenAI sekitar 8.800 miliar dolar, dengan pembalikan tren yang pertama kali muncul di pasar sekunder. ARR Anthropic meningkat dari sekitar 9 miliar pada akhir 2025 menjadi sekitar 30 miliar pada Maret 2026, dengan pertumbuhan 233% selama tiga bulan, yang mendorong valuasi pasar privat. Valuasi sekunder berbeda dari pendanaan tahap awal, mencerminkan kepercayaan terhadap potensi keluar (exit); ke depan, masih mengamati empat jalur: teknologi, kebijakan, bisnis, dan narasi.
ChainNewsAbmedia1jam yang lalu