Beating menyatakan bahwa Google Gemini 3.1 Flash-Lite beralih dari pratinjau ke ketersediaan umum (GA) pada 8 Mei, menjadi model termurah dan tercepat dalam lini Gemini 3. Harga input ditetapkan $0,25 per 1 juta token dan output $1,50 per 1 juta token—biaya input 75% lebih rendah daripada Claude 4.5 Haiku ($1,00) dan biaya output 70% lebih rendah ($5,00). Model ini memiliki jendela konteks 1 juta token dan mencapai throughput 363 token per detik, 45% lebih cepat dibanding pendahulunya Gemini 2.5 Flash.
Benchmark kinerja menunjukkan GPQA Diamond (penalaran sains tingkat pascasarjana) sebesar 86,9%, melampaui Claude 4.5 Haiku 73,0% dan GPT-5 mini 82,3%. MMMU-Pro (penalaran multimodal) mencapai 76,8%. Pengadopsi awal termasuk platform layanan pelanggan Gladly, yang melaporkan penurunan biaya 60% dan tingkat keberhasilan 99,6% pada beban kerja produksi, serta JetBrains, yang mengintegrasikan Flash-Lite ke dalam alat bantu IDE.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
CoreWeave Mengungguli Perkiraan Pendapatan Q1 dengan $2,08 miliar, Saham Naik 3%
Menurut Reuters, CoreWeave melaporkan pendapatan kuartal pertama sebesar $2,08 miliar pada 7 Mei, melampaui estimasi rata-rata analis sebesar $1,97 miliar. Permintaan kuat untuk komputasi berperforma tinggi yang digunakan untuk melatih dan menjalankan model AI mendorong pertumbuhan penyedia cloud tersebut. Sahamnya naik 3% pada perdagangan lanjutan
GateNews2menit yang lalu
OpenAI Mengubah Model Default ChatGPT ke GPT-5.5 Instan, Mengurangi Halusinasi sebesar 52,5%
Menurut OpenAI, perusahaan mengubah model default ChatGPT menjadi GPT-5.5 Instant pada 8 Mei. Dalam pengujian internal, model ini menghasilkan 52,5% lebih sedikit klaim halusinasi dibanding GPT-5.3 Instant pada prompt berisiko tinggi, sekaligus menurunkan klaim yang tidak akurat sebesar 37,3% dalam percakapan yang ditandai pengguna untuk kesalahan faktu
GateNews12menit yang lalu
CEO Nvidia Huang: Infrastruktur AI Generasi Berikutnya Membutuhkan Koneksi Optik yang Luas, Tembaga Tidak Cukup pada 8 Mei
Menurut BlockBeats, pada 8 Mei, CEO Nvidia Jensen Huang menyatakan bahwa infrastruktur AI generasi berikutnya akan memerlukan koneksi optik dalam jumlah besar karena tembaga tidak dapat memenuhi kebutuhan komputasi yang tumbuh pesat. Huang memuji kemitraan baru Nvidia dengan Corning, menyebutnya sebagai peluang penting
GateNews16menit yang lalu
Cloudflare PHK 1.100+ Karyawan (20% dari Tenaga Kerja) untuk Beralih ke Operasional yang Didorong AI
Menurut Reuters, Cloudflare melakukan pemutusan hubungan kerja terhadap lebih dari 1.100 karyawan, mewakili sekitar 20% dari total tenaga kerjanya, pada 8 Mei untuk merestrukturisasi operasional di sekitar alat-alat AI. CEO Matthew Prince menyatakan perusahaan sedang mendesain ulang setiap tim dan fungsi untuk beradaptasi dengan era agentic AI, seraya mencatat penggunaan AI di internal.
GateNews30menit yang lalu
Google Meluncurkan Fitbit Air seharga 99,99 dolar AS, Pelacak Tanpa Layar Menjadi Hub Gemini Health Coach pada 26 Mei
Menurut Beating, Google meluncurkan Fitbit Air, pelacak kesehatan tanpa layar dengan harga $99,99, yang dijadwalkan mulai dikirim pada 26 Mei. Perangkat ini berbobot hanya 5,2 gram dan memiliki baterai 7 hari dengan kemampuan pengisian cepat 5 menit. Sensor melacak detak jantung 24 jam, deteksi fibrilasi atrium, oksigen darah, h
GateNews32menit yang lalu
OpenAI Merilis Tiga Model Suara dalam Realtime API; GPT-Realtime-2 Hadir dengan Jendela Konteks 128K
Menurut Beating, OpenAI merilis tiga model suara di Realtime API-nya: GPT-Realtime-2 untuk percakapan suara dengan penalaran, GPT-Realtime-Translate untuk terjemahan real-time, dan GPT-Realtime-Whisper untuk transkripsi streaming. GPT-Realtime-2 adalah model suara pertama OpenAI dengan kemampuan setara GPT-5-level re
GateNews48menit yang lalu