Tencent merilis Hy3 versi pratinjau sumber terbuka, tolok ukur pengujian kode meningkat 40% dibanding pendahulunya

MarketWhisper

騰訊開源Hy3預覽版

Tencent resmi merilis model bahasa besar Hy3 versi pratinjau open-source pada 23 April di platform GitHub, Hugging Face, dan ModelScope, sekaligus menyediakan layanan API berbayar melalui Tencent Cloud. Menurut laporan Decrypt pada 24 April, Hy3 versi pratinjau memulai pelatihan pada akhir Januari, dan pada tanggal rilis belum sampai tiga bulan.

Arsitektur Model Hy3 dan Latar Belakang Pengembangan

Menurut pengumuman resmi Tencent, Hy3 versi pratinjau adalah arsitektur mixture of experts (MoE): mengarahkan setiap kueri ke kumpulan sub-jaringan pakar yang ditentukan untuk pemrosesan, alih-alih mengaktifkan semua parameter secara asinkron, guna mengurangi kebutuhan komputasi.

Jumlah paramater pada model unggulan generasi sebelumnya Hy2 lebih dari 4.000 miliar. Pernyataan resmi Tencent menyebutkan bahwa 2.950 miliar adalah konfigurasi dengan optimasi terbaik untuk efisiensi inferensi; setelah melewati skala tersebut, manfaat marjinal dari penambahan parameter tidak lagi sebanding.

Menurut laporan Decrypt, pekerjaan pelatihan Hy3 dipimpin oleh Yao Shunyu (姚顺宇), ilmuwan utama kecerdasan buatan di Tencent. Setelah rekonstruksi ulang infrastruktur dasar untuk tumpukan pelatihan pra-pelatihan dan reinforcement learning selesai pada Februari 2026, pelatihan Hy3 kemudian dimulai secara resmi.

Data Pengujian Tolok Ukur Utama

Berdasarkan hasil pengujian tolok ukur yang diungkapkan oleh pengumuman resmi Tencent:

SWE-bench Verified(perbaikan error kode program nyata GitHub):Hy3 versi pratinjau 74,4%, Hy2 53,0%;pada periode yang sama, GLM-5 77,8%, Kimi-K2.5 76,8%, Claude Opus 4,6 80,8%

Terminal-Bench 2.0(eksekusi tugas mandiri dari baris perintah):Hy3 versi pratinjau 54,4%, Hy2 23,2%

BrowseComp(tugas pencarian web yang kompleks):Hy3 versi pratinjau 67,1%, Hy2 28,7%

WideSearch:Hy3 versi pratinjau 70,2%, lebih tinggi daripada GLM-5 dan Kimi-K2.5, lebih rendah daripada Claude Opus 4,6 yang 77,2%

Ujian kualifikasi doktor matematika Universitas Tsinghua(musim semi 2026):rata-rata dari tiga kali run (avg@3) 88,4, nilai tertinggi untuk model di Tiongkok

Kompetisi Olimpiade Biologi untuk siswa sekolah menengah Tiongkok 2025(CHSBO 2025):87,8 poin, nilai tertinggi untuk model sejenis di Tiongkok

Platform Deploy dan Harga API

Menurut pengumuman resmi Tencent, Hy3 versi pratinjau telah dideploy di platform berikut: Yuanbao(元寶)、QQ、Tencent Docs(腾讯文件)、CodeBuddy、WorkBuddy, dan OpenClaw.

Harga API di Tencent Cloud adalah 0,18 dolar AS per satu juta token input dan 0,59 dolar AS per satu juta token output; untuk rencana penandaan pribadi, biaya bulanan mulai dari sekitar 4,10 dolar AS. Pengumuman Tencent juga menunjukkan bahwa pada CodeBuddy dan WorkBuddy, latensi penandaan pertama Hy3 dibandingkan pendahulunya turun 54%, waktu generasi end-to-end berkurang 47%, dan berhasil menyelesaikan alur kerja agen yang terdiri dari 495 langkah.

Pertanyaan yang Sering Diajukan

Kapan Tencent Hy3 versi pratinjau dirilis, dan bisa didapatkan di platform apa?

Berdasarkan pengumuman resmi Tencent dan laporan Decrypt pada 24 April 2026, Hy3 versi pratinjau dirilis sebagai open-source pada 23 April 2026 (Kamis) di GitHub, Hugging Face, dan ModelScope, sementara Tencent Cloud secara bersamaan menyediakan layanan API berbayar.

Dibandingkan model generasi sebelumnya Hy2, apa perbedaan utama pengujian tolok ukur Hy3 versi pratinjau?

Menurut pengumuman resmi Tencent, skor SWE-bench Verified meningkat dari 53,0% pada Hy2 menjadi 74,4%; BrowseComp naik dari 28,7% menjadi 67,1%; Terminal-Bench 2.0 meningkat dari 23,2% menjadi 54,4%.

Berapa harga API untuk Hy3 versi pratinjau?

Berdasarkan harga resmi Tencent Cloud, API Hy3 versi pratinjau dimulai dari 0,18 dolar AS per satu juta token input dan 0,59 dolar AS per satu juta token output; biaya bulanan untuk rencana penandaan pribadi mulai dari sekitar 4,10 dolar AS.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Pendiri NeoSoul Kaelan: Industri AI Harus Membiarkan Mainan Ada, Inovasi Sering Berawal dari Produk Eksperimental

Pesan Berita Gate, 24 April — Dalam sebuah forum terbaru di Hong Kong tentang keuangan terenkripsi cerdas, pendiri NeoSoul bersama Kaelan berbagi wawasan tentang cara mengevaluasi proyek AI pada tahap awal, di industri AI yang terus berkembang dengan cepat. Selain menilai produk saat ini, tim harus menunjukkan kemampuan untuk mengikuti perkembangan kemampuan model yang mendasarinya, katanya. Namun ...

GateNews10menit yang lalu

Meta dan Amazon Setuju Kesepakatan Bernilai Multi-Miliar Dolar untuk Menyediakan Chip Graviton untuk Pengembangan AI

Pesan Gate News, 24 April — Meta Platforms dan Amazon Web Services (AWS) telah mencapai kesepakatan bernilai multi-miliar dolar untuk mendukung inisiatif kecerdasan buatan Meta selama beberapa tahun ke depan, menurut Wall Street Journal. Dalam kesepakatan tersebut, Meta akan menggunakan puluhan juta inti chip AWS Graviton c

GateNews22menit yang lalu

DeepSeek V4-Flash naik ke Ollama Cloud, server AS: Claude Code, OpenClaw sekali klik integrasi

Ollama Cloud telah menambahkan DeepSeek V4-Flash, penalaran dijalankan di server di AS, dan menyediakan tiga set perintah sekali klik untuk menghubungkan Claude Code, OpenClaw, dan Hermes. V4-Flash/V4-Pro menggunakan arsitektur MoE, mendukung konteks 1M secara native, serta menurunkan biaya dengan kompresi Token-wise + perhatian jarang DSA; dalam skenario 1M, FLOPs per token turun 27%, dan cache KV turun 10%. API kompatibel dengan OpenAI ChatCompletions dan Anthropic, sehingga mudah untuk beralih antar berbagai alur kerja, mengurangi biaya dan risiko kedaulatan data.

ChainNewsAbmedia1jam yang lalu

Infrastruktur AI Web3 AIW3 Menggalang $2M dalam Pendanaan Seed yang Dipimpin oleh Buffalo Capital

Berita Gate, 24 April — Platform infrastruktur AI Web3, AIW3, mengumumkan penyelesaian pendanaan putaran seed sebesar $2 juta. Putaran ini dipimpin oleh Buffalo Capital, dengan GalaXin Capital dan Three-stones Ventures berpartisipasi sebagai co-investor. AIW3 beralih menuju paradigma eksekusi on-chain Agent-as-a-Service AaaS, menyediakan layanan strategi yang dapat dipanggil, orkestrasi agen otonom, dan aliran modal yang terkoordinasi oleh vault secara native. Proyek ini bertujuan membangun lapisan eksekusi on-chain generasi berikutnya yang bersifat sistem-level. Perusahaan menyatakan bahwa infrastruktur protokol intinya secara resmi telah memasuki tahap operasional real-time yang sepenuhnya dapat diverifikasi, meletakkan dasar bagi pengembangan jangka panjang jaringan agen terdesentralisasi yang dapat diskalakan dan ekosistemnya.

GateNews2jam yang lalu

Cohere Mengakuisisi Perusahaan AI Jerman Aleph Alpha, Mengamankan $600M Investasi untuk Ekspansi Eropa

Berita Gate, 24 April — Perusahaan AI Kanada Cohere mengumumkan rencana untuk mengakuisisi perusahaan AI Jerman Aleph Alpha guna memperkuat kehadirannya di Eropa. Schwarz Group, pendukung Aleph Alpha, berencana untuk menginvestasikan $600 juta dalam putaran pendanaan Seri E Cohere. Putaran pendanaan diperkirakan akan ditutup pada 202

GateNews2jam yang lalu

Xpeng, Xiaomi Lead In-Car AI Push at Beijing Auto Show

Gate News message, April 24 — Chinese automakers showcased advanced in-car AI systems at the Beijing Auto Show on April 24, as the country accelerates its AI Plus strategy and seeks greater independence from foreign semiconductors. Xpeng demonstrated voice-controlled parking that allows drivers to

GateNews3jam yang lalu
Komentar
0/400
Tidak ada komentar