Microsoft cancelou a maioria das suas licenças do Claude Code no mês passado para reduzir os custos com gastos em IA, de acordo com o The Verge. A medida reflete uma mudança mais ampla na indústria, à medida que as empresas começam a gerir as despesas de IA como orçamentos de TI tradicionais, em vez de incentivar a adoção sem restrições. O CEO Satya Nadella questionou esta semana se um futuro dominado por um punhado de fornecedores de modelos de fronteira é viável, defendendo, em vez disso, um ecossistema de IA mais competitivo. A mudança ocorre à medida que os modelos de código aberto reduzem a diferença de desempenho em relação aos sistemas proprietários, enquanto os custos de inferência diminuem, criando o que os observadores da indústria descrevem como a primeira fase deflacionária da IA desde que o ChatGPT lançou o boom da IA generativa no final de 2022.
A Microsoft começou a cancelar a maioria das suas licenças do Claude Code no mês passado para reduzir custos, reportou o The Verge. A decisão reflete uma mudança na forma como as empresas encaram os gastos com IA. Em vez de incentivar a adoção irrestrita de IA, as empresas estão agora a gerir as despesas de IA como qualquer outra despesa operacional, a monitorizar o consumo de tokens, a impor limites de utilização e a encaminhar cargas de trabalho para modelos de menor custo sempre que possível.
O CEO Satya Nadella afirmou esta semana que um futuro dominado por um punhado de fornecedores de modelos de fronteira pode não ser inevitável. Ele argumentou a favor de um ecossistema de IA mais competitivo, onde os clientes possam escolher entre múltiplos modelos, em vez de dependerem de alguns fornecedores premium.
À medida que mais fornecedores de IA cobram aos clientes com base na utilização de tokens, em vez de subscrições fixas, cada prompt, conclusão e chamada de API tornou-se uma despesa operacional mensurável. Esta mudança está a afetar a emergente economia de tokens da indústria. As empresas estão a começar a monitorizar e gerir os gastos com IA com o mesmo escrutínio aplicado a outros orçamentos de TI.
A mudança apresenta desafios para empresas de IA de fronteira como a OpenAI e a Anthropic. A sua vantagem competitiva já não é definida apenas por construir o modelo mais capaz. Elas também devem preservar o poder de fixação de preços num mercado onde modelos abertos de alto desempenho proliferam e as empresas se tornam mais conscientes dos custos.
Tanto a OpenAI como a Anthropic apresentaram confidencialmente os seus IPOs junto da Comissão de Valores Mobiliários dos EUA (SEC). Isto poderá atrair a atenção dos investidores não só para a sua liderança tecnológica, mas também para saber se conseguem manter preços premium num mercado cada vez mais competitivo.
A Z.ai lançou o seu modelo GLM-5.2 este mês. Programadores do Vale do Silício elogiaram o modelo pelas suas capacidades de codificação e agentivas. O modelo está entre os melhores desempenhos em benchmarks públicos de IA e oferece um desempenho de codificação comparável aos principais modelos proprietários da OpenAI e da Anthropic a aproximadamente um sexto do custo, de acordo com um relatório da Reuters que cita a empresa e os rastreadores de benchmarks.
Muitos dos modelos de pesos abertos mais competitivos estão a emergir da China, reduzindo rapidamente a diferença em relação às ofertas proprietárias e subcotando-as no preço. Empresas chinesas, incluindo a Z.ai, a DeepSeek e a Alibaba, têm adotado cada vez mais lançamentos de pesos abertos que permitem às empresas auto-hospedar e personalizar modelos, em vez de dependerem exclusivamente de APIs premium.
Investigadores da Universidade de Chicago e da Universidade Chapman argumentam que os controlos de exportação dos EUA sobre chips avançados de IA incentivaram involuntariamente a China a investir em ecossistemas de IA aberta e inovação eficiente em termos de computação. Os investigadores descobriram que, após as principais medidas de controlo de exportação dos EUA, os programadores chineses aumentaram o envolvimento com repositórios de LLM de código aberto muito mais do que os seus homólogos dos EUA.
A investigação chinesa mudou para otimização de inferência, compressão de modelos e ajuste fino eficiente em parâmetros após as restrições. As conclusões dos investigadores sugerem que os controlos de exportação podem ter acelerado, em vez de dificultado, o desenvolvimento da China de modelos de IA abertos e eficientes em termos de custos.
O Global X Artificial Intelligence & Technology ETF (AIQ) subiu 47% nos últimos 12 meses. O iShares U.S. Technology ETF (IYW) subiu 44% no mesmo período.
Porque é que a Microsoft cancelou as licenças do Claude Code? A Microsoft cancelou a maioria das suas licenças do Claude Code no mês passado para reduzir os custos com gastos em IA, conforme reportado pelo The Verge. A medida reflete uma tendência mais ampla da indústria, onde as empresas estão a gerir as despesas de IA como orçamentos de TI tradicionais, em vez de incentivar a adoção sem restrições.
Qual é a diferença de custo entre o modelo GLM-5.2 da Z.ai e os modelos proprietários? O modelo GLM-5.2 da Z.ai oferece um desempenho de codificação comparável aos principais modelos proprietários da OpenAI e da Anthropic a aproximadamente um sexto do custo, de acordo com um relatório da Reuters que cita a empresa e os rastreadores de benchmarks. O modelo foi lançado este mês e está entre os melhores desempenhos em benchmarks públicos de IA.
Notícias relacionadas
Ações da Microsoft registam pior primeira metade desde 2000 com declínio de 24%
Mastercard estabelece 2030 como meta para a mudança para tokens e pagamentos biométricos
Anthropic acusa Alibaba de realizar a maior campanha conhecida para copiar a IA Claude
MSTR, PLTR, NFLX atingem mínimos de 52 semanas em meio à rotação do mercado.
Vazamento de Código do Claude da Anthropic Sugere o Retorno de Fable 5 com Limites de Uso Semanais