Theo các công bố quan hệ nhà đầu tư vào ngày 12/5, chip suy luận đang phát triển của Yuntianliyifei áp dụng kiến trúc GPNPU làm công nghệ cốt lõi trong lộ trình. Các điểm nhấn kỹ thuật chính bao gồm khả năng lập trình vạn năng ở mức GPGPU, tương thích với hệ sinh thái CUDA phổ biến, các lõi NPU được tối ưu cho hiệu suất suy luận và kiến trúc bộ nhớ xếp chồng 3D nhằm tăng băng thông và giảm độ trễ truy cập, vượt qua nút thắt cổ chai “bức tường bộ nhớ”.
Công ty cũng triển khai kiến trúc mô-đun tính toán để hỗ trợ xây dựng siêu nút mở rộng theo cấp rack, phục vụ suy luận các mô hình MoE quy mô nghìn tỷ và hàng trăm nghìn tỷ. Lộ trình công nghệ đặt mục tiêu giảm chi phí token theo cấp số nhân và đẩy nhanh triển khai ứng dụng cho các mô hình lớn.