Tinygrad relata que o GLM 5.2 atinge 120 tokens por segundo em uma configuração dual Blackwell por US$ 150 mil

De acordo com a BlockBeats, em 21 de junho, a Tinygrad informou que o GLM 5.2 atinge 120 tokens por segundo de velocidade de inferência em uma configuração tinybox com arquitetura Blackwell de dupla rede. A configuração de US$ 150 mil está disponível como duas unidades padrão tinybox ou uma unidade tinybox Pro. A Tinygrad posiciona a oferta como uma alternativa de implantação privada a serviços de inferência baseados em nuvem, com o slogan "compre uma vez, nunca mais pague taxas de nuvem". O GLM não confirmou oficialmente as alegações de desempenho.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários