O CEO da Coinbase, Brian Armstrong, afirmou a 26 de junho que a Coinbase definiu o GLM 5.2, lançado recentemente pela Zhipu AI, e o Kimi 2.7, da Beijing Moonshot AI, como os modelos de linguagem de grande escala predefinidos para os engenheiros internos da empresa; os gastos com IA da Coinbase foram reduzidos para quase metade, enquanto a utilização de tokens continuou a crescer exponencialmente no mesmo período.
Armstrong explicou que o GLM 5.2 e o Kimi 2.7 são implementados principalmente em cenários de tarefas rotineiras, como assistência padrão de código em fluxos de trabalho gerais de engenharia; para tarefas que requerem planeamento complexo, os engenheiros ainda podem optar por modelos de ponta. Na revisão de código, a Coinbase adota uma estratégia paralela de múltiplos modelos, permitindo que diferentes modelos verifiquem mutuamente os resultados de saída para manter os padrões de qualidade.
Armstrong atribuiu a redução para quase metade dos gastos com IA da Coinbase à seguinte reestruturação da infraestrutura em três camadas:
Encaminhamento inteligente: o sistema pré-processa os prompts, combinando a taxa de acerto da cache com o preço do modelo, distribuindo automaticamente as tarefas para o modelo mais adequado e económico.
Cache agressivo: exige que todos os pedidos tenham capacidade de perceção de cache, com a taxa de acerto da cache do LibreChat a saltar de 5% para 60%.
Contexto enxuto: recomenda que os engenheiros abram novas sessões e reduzam o âmbito dos ficheiros ao alternar tarefas, de modo a diminuir os tokens desperdiçados.
Armstrong enfatizou que o objetivo desta otimização de custos não é suprimir a utilização, mas sim expandir a escala de adoção da IA. Afirmou que o objetivo é permitir que os engenheiros utilizem livremente qualquer número de tokens e modelos, sem estabelecer um teto de custos, ao mesmo tempo que vinculam a utilização ao impacto no negócio. Armstrong considera que este modelo pode ser adotado por qualquer empresa, sendo as declarações acima uma afirmação pública pessoal sua.
O GLM 5.2 é o modelo mais recente lançado pela empresa chinesa de IA Zhipu AI; o Kimi 2.7 é o modelo de linguagem de grande escala da Beijing Moonshot AI Technology Co., Ltd. Ambos os modelos foram lançados em código aberto. Armstrong explicou que a Coinbase os implementou em cenários de tarefas rotineiras de engenharia, continuando a utilizar modelos de ponta para tarefas complexas.
De acordo com a explicação de Armstrong, o cerne da redução de custos é a reestruturação da infraestrutura em três camadas: encaminhamento inteligente (distribuição automática de tarefas para o modelo mais económico), cache agressivo (a taxa de acerto da cache do LibreChat subiu de 5% para 60%) e contexto enxuto (redução de tokens desperdiçados). Com base nisso, a utilização de modelos de código aberto chineses de menor custo para substituir parte da utilização de tarefas rotineiras anteriormente realizadas por modelos de ponta americanos comprime ainda mais os gastos totais.
De acordo com a declaração pública de Armstrong de 26 de junho de 2026, ele não mencionou os detalhes da revisão de segurança de dados ou os acordos de conformidade envolvidos na adoção do GLM 5.2 e do Kimi 2.7. A Coinbase é uma bolsa de criptoativos regulada nos Estados Unidos, e o conteúdo específico do quadro de conformidade relevante não foi divulgado nesta declaração.
CZ em entrevista analisa três razões do bear market e anuncia que deixa de comandar exchange de criptomoedas
Calendário de desbloqueio de tokens coloca $241M Supply em foco
Calendário de desbloqueio de tokens coloca oferta de $241M em foco
Modelo de IA chinês GLM 5.2 atrai utilizadores empresariais que procuram alternativas abertas