Tinygrad Melaporkan GLM 5.2 Mencapai 120 Token per Detik pada Konfigurasi Dual Blackwell Senilai $150.000

Menurut BlockBeats, pada 21 Juni Tinygrad melaporkan bahwa GLM 5.2 mencapai kecepatan inferensi 120 token per detik pada pengaturan tinybox arsitektur Blackwell berkoneksi ganda. Konfigurasi senilai $150.000 tersedia baik sebagai dua unit tinybox standar atau satu tinybox Pro. Tinygrad memposisikan penawaran ini sebagai alternatif deployment privat untuk layanan inferensi berbasis cloud, dengan slogan “buy once, never pay cloud fees again.” GLM belum secara resmi mengonfirmasi klaim performa tersebut.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar