Altman: A precificação por tokens está a tornar-se obsoleta à medida que o GPT-5.5 muda o foco para a conclusão de tarefas em vez da contagem de tokens

Mensagem de Gate News, 29 de abril — O CEO da OpenAI, Sam Altman, disse numa entrevista a Ben Thompson na Stratechery que a fixação de preços baseada em tokens não é um modelo viável a longo prazo para serviços de IA. Usando o GPT-5.5 como exemplo, Altman observou que, embora o preço por token seja significativamente mais alto do que o do GPT-5.4, o modelo usa muito menos tokens para concluir a mesma tarefa, o que significa que os clientes não se importam com a contagem de tokens — só se importam com se a tarefa é concluída e com o custo total.

“Não somos uma fábrica de tokens; somos mais como uma fábrica de inteligência”, disse Altman. “Os clientes querem comprar a maior quantidade de inteligência pelo menor dinheiro. Quer o trabalho subjacente seja feito por um modelo grande a usar poucos tokens, ou por um modelo pequeno a usar muitos tokens, não lhes interessa.” Acrescentou que a base de clientes atual da OpenAI está cada vez mais exigente em termos de mais capacidade, em vez de negociar preços, com muito mais clientes a dizerem “dêem-nos mais capacidade, custe o que custar” do que os que pedem descontos.

Traçando um paralelo com as utilities, Altman explicou que, ao contrário da água ou da electricidade — em que preços mais baixos não aumentam significativamente o consumo — a procura de IA escala de forma diferente. “Enquanto o preço for suficientemente baixo, vou continuar a usar mais. Nenhuma outra utility pública funciona assim”, disse. O CEO da AWS, Matt Garman, acrescentou que os preços do poder de computação diminuíram várias ordens de grandeza ao longo dos últimos 30 anos, ainda assim está a ser vendida hoje mais capacidade de computação do que nunca.

Altman também caracterizou o ChatGPT como “o primeiro produto de consumo verdadeiramente em grande escala desde o Facebook”, reconhecendo que, embora se esperasse que a IA perturbasse as pesquisas, as vitórias reais vieram do próprio ChatGPT e da API do Codex. Referiu que “o Google continua a ser subestimado de muitas formas”.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Cognition estabelece Singapura como sede da APAC, com foco na expansão regional

Mensagem da Gate News, 29 de abril — Cognition, a startup de programação com IA por detrás da Devin, anunciou a 29 de abril que irá estabelecer Singapura como a sua sede para a região Ásia-Pacífico para supervisionar a expansão regional por toda a Sudeste Asiático, Austrália, Índia e Coreia do Sul. Richard Spence irá liderar as operações na APAC

GateNews1m atrás

A Google assinou um acordo secreto de IA com o Pentágono, carta aberta dos funcionários contra

De acordo com a The Information, a 28 de abril, a Google já assinou um acordo para fornecer ao Pentágono dos EUA modelos de inteligência artificial (IA) destinados a trabalhos confidenciais. O The New York Times cita fontes com conhecimento do assunto, afirmando que o acordo permite ao Departamento de Defesa dos EUA utilizar a IA da Google para fins governamentais legais, com uma natureza semelhante à dos acordos de implantação de IA confidencial que o Pentágono assinou no mês passado com a OpenAI e a xAI.

MarketWhisper22m atrás

Relatório de investigação da a16z Crypto: A taxa de exploração de vulnerabilidades DeFi por agentes de IA atinge 70%

De acordo com o relatório de investigação publicado pela a16z Crypto a 29 de abril, sob condições em que os agentes de IA estão equipados com conhecimento estruturado de domínios, a taxa de sucesso na reconstituição de uma vulnerabilidade de manipulação do preço do Ethereum atinge 70%; num ambiente de sandbox sem qualquer conhecimento de domínio, a taxa de sucesso é apenas de 10%. O relatório também regista casos em que os agentes de IA contornaram independentemente as restrições do sandbox para aceder a informação futura de transações, bem como padrões sistemáticos de falha do agente ao criar planos de ataques lucrativos em múltiplas etapas.

MarketWhisper45m atrás

Modelos da OpenAI para migrar gradualmente para o chip personalizado Trainium da Amazon, diz Altman; afirma que está a "olhar em frente"

Mensagem de Gate News, 29 de abril — Os modelos da OpenAI a correr no Amazon Web Services' Bedrock irão gradualmente migrar para o Trainium, o chip de IA personalizado da Amazon, de acordo com comentários recentes do CEO da OpenAI Sam Altman e de executivos da AWS. Atualmente, os modelos operam num ambiente misto usando tanto GPUs como Tr

GateNews1h atrás

Modelo Ling-2.6-flash da Ant Group disponibilizado em código aberto: 104B Parâmetros Com 7,4B Activos, Atinge Múltiplos Benchmarks SOTA

Mensagem de Gate News, 29 de Abril — Os pesos do modelo Ling-2.6-flash da Ant Group foram agora disponibilizados em código aberto, tendo anteriormente estado apenas disponíveis via API. O modelo apresenta 104 mil milhões de parâmetros totais com 7,4 mil milhões activados por inferência, uma janela de contexto de 256K e licenciamento MIT. Estão disponíveis versões com precisão BF16, FP8 e INT4

GateNews2h atrás

Sam Altman publica capturas de ecrã do Codex em modo duplo, com a separação oficial entre as funções de escritório e de programação

Declaração e captura de ecrã publicadas pelo CEO da OpenAI, Sam Altman, a 29 de abril na plataforma X: o Codex está a lançar uma nova interface de orientação. Quando os utilizadores entram pela primeira vez, têm de escolher entre dois modos, nomeadamente Excelmogging e Codemaxxing. Os utilizadores ativos semanais do Codex já ultrapassam os 4 milhões, e os casos de uso já se estenderam desde a geração de código até a utilizações não técnicas.

MarketWhisper2h atrás
Comentar
0/400
Nenhum comentário