Yuntianliyifei Memperkenalkan Arsitektur Memori Bertumpuk 3D dalam Pengembangan Chip Inference

Berdasarkan pengungkapan hubungan investor pada 12 Mei, chip inferensi dalam pengembangan Yuntianliyifei mengadopsi arsitektur GPNPU sebagai peta jalan teknologi inti. Sorotan teknis utamanya meliputi kemampuan pemrograman universal setara GPGPU yang kompatibel dengan ekosistem CUDA arus utama, inti NPU yang dioptimalkan untuk efisiensi inferensi, serta arsitektur memori bertumpuk 3D yang dirancang untuk meningkatkan bandwidth dan mengurangi latensi akses, menembus hambatan bottleneck memori.

Perusahaan ini juga menggunakan arsitektur modular komputasi untuk mendukung pembangunan supernode skala-peningkatan di tingkat rak bagi inferensi model MoE dengan skala triliun dan ratusan triliun. Peta jalan teknologinya menargetkan penurunan biaya token secara eksponensial dan percepatan penerapan deployment aplikasi model besar.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar