Resultados da pesquisa de "DEEPSEEK"
Hoje
04:17

Os GPU Nvidia Blackwell custam o dobro, mas o custo da inferência por token desce 35x face ao Hopper

De acordo com a mais recente análise do blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas oferecem custos de inferência por token 35 vezes mais baixos. Usando o DeepSeek-R1 como modelo de teste, a Blackwell (GB300 NVL72) é alugada a 2,65 USD por GPU por hora, face aos 1,41 USD da Hopper, mas uma única GPU
Mais
13:41

Alibaba Cloud reduz o preço da cache implícita do DeepSeek-V4-Pro para 1 yuan por milhão de tokens a 29 de abril

De acordo com a Alibaba Cloud, a sua plataforma Bailian vai reduzir o preço da cache implícita do modelo DeepSeek-V4-Pro (Implicit Cache) para 1 yuan por milhão de tokens, com efeitos a partir de 29 de abril de 2026 às 23:59:59, horário de Pequim. A cache implícita só se aplica quando as solicitações atingem a cache; os tokens de entrada em cache são faturados à taxa cached_token, enquanto os tokens de entrada sem cache são cobrados às taxas padrão de input_token.
Mais
00:30

ZetaChain lança a Anuma, uma plataforma de agregação de IA focada na privacidade

Mensagem do Gate News, 28 de abril — A equipa da ZetaChain lançou oficialmente a Anuma, uma plataforma de agregação de IA focada na privacidade que permite aos utilizadores aceder a vários modelos de IA—incluindo GPT, Claude, Gemini, Grok, DeepSeek, Kimi e Qwen—através de uma única interface. A Anuma oferece armazenamento local de privacidade, mul
Mais
06:31

DeepSeek reduz preços do V4-Pro em 75%, corta custos de cache da API para um décimo

Mensagem de Notícias da Gate, 27 de Abril — A DeepSeek anunciou um desconto de 75% no seu novo modelo V4-Pro para programadores e reduziu os preços de acerto de cache de entrada em toda a sua gama de APIs para um décimo dos níveis anteriores. O modelo V4, lançado a 25 de Abril nas versões Pro e Flash, foi otimizado para os processadores Ascend da Huawei. A DeepSeek disse que o V4-Pro tem melhor desempenho do que outros modelos de código aberto em benchmarks de conhecimento do mundo e fica apenas em segundo lugar atrás do Gemini-Pro-3.1 da Google, um modelo proprietário. A família V4 foi concebida especificamente para agentes de IA a lidar com tarefas complexas além das capacidades de um chatbot. Os custos da API V4-Pro já ficam abaixo dos principais concorrentes ocidentais, com preços de $3.48 por milhão de tokens de saída em comparação com para o GPT-4.5 da OpenAI. A tabela de preços do V4-Flash está em $0.14 por milhão de tokens de entrada e $0.28 por milhão de tokens de saída, o que pode permitir aplicações economicamente eficientes, como rever bases de código inteiras ou documentos regulamentares em solicitações únicas.
Mais