Yuntianliyifei apresenta uma arquitectura de memória em camadas 3D no desenvolvimento de chips de inferência

De acordo com as divulgações das relações com investidores a 12 de maio, o chip de inferência em desenvolvimento de Yuntianliyifei adota uma arquitetura GPNPU como sua principal folha de rota tecnológica. Os principais destaques técnicos incluem uma capacidade de programação universal ao nível de GPGPU compatível com os ecossistemas CUDA mais comuns, núcleos NPU otimizados para eficiência de inferência e uma arquitetura de memória empilhada em 3D concebida para aumentar a largura de banda e reduzir a latência de acesso, ultrapassando o gargalo do problema de largura de banda da memória.

A empresa também utiliza uma arquitetura modular de computação para suportar a construção de supernós escalados ao nível de racks, para inferência de modelos MoE em escalas de biliões e centenas de biliões. A folha de rota da tecnologia tem como objetivo reduzir exponencialmente os custos por token e acelerar a implementação de aplicações de grandes modelos.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário