Згідно з повідомленнями для інвесторів, оприлюдненими 12 травня, інференційний чіп Yuntianliyifei, що розробляється, використовує архітектуру GPNPU як основну технологічну дорожню карту. Ключові технічні акценти включають універсальне програмування на рівні GPGPU, сумісне з поширеними екосистемами CUDA, оптимізовані NPU-ядра для підвищення ефективності інференсу та 3D-стековану архітектуру пам’яті, створену для збільшення пропускної здатності й зменшення затримок доступу, щоб подолати вузьке місце «memory wall».
Також компанія застосовує обчислювальну модульну архітектуру для підтримки побудови суперноди рівня стійки з масштабуванням rack-level для інференсу MoE-моделей у масштабах трильйонів і сотень трильйонів. Технологічна дорожня карта спрямована на експоненційне зниження вартості токенів і прискорення розгортання застосувань великих моделей.