De acordo com a análise mais recente no blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam custos de inferência por token 35 vezes mais baixos. Usando o modelo de teste DeepSeek-R1, a Blackwell (GB300 NVL72) é alugada a 2,65 USD por GPU por hora, face aos 1,41 USD da Hopper, mas o throughput de um único GPU salta de 90 para 6.000 tokens por segundo. Este ganho de throughput de 65x reduz os custos por milhão de tokens de 4,20 USD para 0,12 USD.
O valor de 0,12 USD assume optimização total de software, incluindo inferência com baixa precisão FP4 e previsão multi-token (MTP). Sem MTP activado, os custos por milhão de tokens atingem aproximadamente 2,35 USD, descendo para 0,11 USD com ele ativo, demonstrando um impacto de optimização de 21x apenas com essa funcionalidade.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
O negócio de IA da Microsoft duplica para $370B de ARR; planos $190B para capex em 2026
Em 29 de abril, a Microsoft comunicou os resultados fiscais do terceiro trimestre de 2026 para o período encerrado em 31 de março, superando as expectativas do mercado. A receita do 3.º trimestre atingiu 82,886 mil milhões de dólares, acima em 18% face ao ano anterior e acima dos 81,4 mil milhões de dólares esperados; o lucro líquido GAAP cresceu 23% para 31,778 mil milhões de dólares; os ganhos diluídos não-GAAP por
GateNews5m atrás
A DevDay 2026 da OpenAI vai decorrer a 29/09, em São Francisco
Anúncio oficial da OpenAI de 29 de abril: a conferência anual DevDay 2026 para programadores, do nível mais elevado, terá lugar a 29 de setembro em São Francisco, regressando ao formato de conferência presencial após vários anos. Em simultâneo, foi também divulgada uma iniciativa de submissão: os programadores usam o GPT-5.5 e o Image Gen para criar obras e apresentá-las, sendo que, a cada semana, o Codex seleciona 2-3 submissões criativas entre as entradas, que recebem bilhetes gratuitos para o DevDay (incluindo despesas de passagem interurbana e alojamento).
Tema da conferência: ecossistema de programadores centrado no GPT-5.5 + Image Gen
A base de aplicações central desta edição do DevDay está claramente alinhada com o GPT-5.5. O GPT-5.5 entrou em funcionamento a 23 de abril e, a 24, foi disponibilizada de forma completa a API; juntamente com o GPT-5.4 no fim de abril
ChainNewsAbmedia49m atrás
BioMysteryBench: Mythos O especialista em desvendar mitos sem solução 29,6%
A Anthropic publicou a 29 de abril, num anúncio oficial de investigação, o BioMysteryBench—um novo referencial de avaliação para capacidades de análise de bioinformática por IA, composto por questões abertas em cenários reais de investigação. Os dados mais dignos de destaque são estes: nos itens que continuaram por resolver após a tentativa de um painel de especialistas humanos, o modelo de topo da Anthropic, Mythos, resolveu 29,6%, enquanto o Opus 27,0% conseguiu resolver 27,0%.
Concepção da avaliação: duas vias — questões resolvíveis e questões que os especialistas não conseguem resolver
O BioMysteryBench é composto por dois tipos de questões. O primeiro é o das “questões resolvíveis” — tarefas de análise concebidas por investigadores de bioinformática, com respostas de referência para comparação. O segundo é o das “questões que os especialistas não conseguem resolver” — problemas que, após a tentativa de um painel de especialistas humanos, permanecem sem uma resposta credível, para testar se os modelos conseguem ultrapassar os limites do conhecimento disponível na área.
ChainNewsAbmedia52m atrás
A OpenAI anuncia o lançamento do modelo de cibersegurança GPT-5.5-Cyber nos próximos dias
Segundo a Cointelegraph, Sam Altman anunciou que a OpenAI vai lançar o GPT-5.5-Cyber, um modelo de cibersegurança, nos próximos dias. O modelo será disponibilizado a defensores críticos de cibersegurança, com a OpenAI a planear estabelecer mecanismos de acesso fiáveis em colaboração com entidades governamentais para
GateNews1h atrás
O CEO da Google DeepMind prevê que a AGI chega até 2030, dando às empresas quatro anos para se prepararem
De acordo com a série de vídeos da Sequoia Capital com Demis Hassabis, o CEO da Google DeepMind prevê que a inteligência artificial geral (AGI) vai chegar até 2030. Hassabis, vencedor do Prémio Nobel de Química em 2024, vê este calendário como uma realidade empresarial estrita que obriga os líderes a repensar o produto de
GateNews1h atrás
OpenAI para operar como uma empresa de lucro perpetuamente baixo, assina um contrato de energia de 20 anos
Segundo a Odaily, o CEO da OpenAI, Sam Altman, afirmou no Stripe Sessions que a OpenAI pretende tornar-se uma empresa de infraestruturas massiva e de crescimento rápido, com lucros perpetuamente baixos, oferecendo produtos semelhantes a um “contador inteligente” que os utilizadores podem comprar para automatizar as operações de negócio ou incorporar em
GateNews1h atrás