De acordo com a Beating, o Google Gemini 3.1 Flash-Lite passou de pré-visualização para disponibilidade geral (GA) a 8 de maio, tornando-se o modelo mais barato e rápido na série Gemini 3. O preço de entrada está fixado em 0,25 USD por milhão de tokens e o de saída em 1,50 USD por milhão de tokens — os custos de entrada são 75% inferiores aos do Claude 4.5 Haiku (1,00 USD) e a saída é 70% mais barata (5,00 USD). O modelo tem uma janela de contexto de 1 milhão de tokens e atinge uma taxa de transferência de 363 tokens por segundo, 45% mais rápida do que o seu antecessor Gemini 2.5 Flash.
Os testes de desempenho mostram GPQA Diamond (raciocínio em ciências ao nível de pós-graduação) a 86,9%, ultrapassando os 73,0% do Claude 4.5 Haiku e os 82,3% do GPT-5 mini. MMMU-Pro (raciocínio multimodal) chega a 76,8%. Entre os primeiros utilizadores estão a plataforma de atendimento ao cliente Gladly, que reporta uma redução de custos de 60% e uma taxa de sucesso de 99,6% em cargas de trabalho em produção, e a JetBrains, ao integrar o Flash-Lite nas ferramentas de assistência do IDE.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
CoreWeave supera as estimativas de receitas do 1.º trimestre com 2,08 mil milhões de dólares, ação sobe 3%
De acordo com a Reuters, a CoreWeave comunicou uma receita do primeiro trimestre de 2,08 mil milhões de dólares a 7 de maio, superando a estimativa média dos analistas de 1,97 mil milhões de dólares. A forte procura por computação de alto desempenho usada para treinar e executar modelos de IA impulsionou o crescimento da empresa de cloud. As suas ações subiram 3% nas negociações a seguir ao fecho
GateNews2m atrás
A OpenAI altera o modelo predefinido do ChatGPT para o GPT-5.5 instantâneo, reduzindo as alucinações em 52,5%
De acordo com a OpenAI, a empresa mudou o modelo predefinido do ChatGPT para o GPT-5.5 Instant em 8 de maio. Em testes internos, o modelo produziu 52,5% menos alegações alucinadas do que o GPT-5.3 Instant em prompts de alto risco, enquanto reduzia as alegações imprecisas em 37,3% em conversas assinaladas pelos utilizadores por erro factual de
GateNews12m atrás
CEO da Nvidia Huang: A Infraestrutura de IA de Próxima Geração Exige Ligações Ópticas Extensas, o Cobre é Insuficiente a 8 de maio
De acordo com a BlockBeats, a 8 de maio, o CEO da Nvidia, Jensen Huang, afirmou que a infra-estrutura de IA da próxima geração exigirá ligações ópticas extensas, uma vez que o cobre não consegue responder às necessidades computacionais que crescem rapidamente. Huang elogiou a nova parceria da Nvidia com a Corning, chamando-lhe uma oportunidade importante
GateNews16m atrás
A Cloudflare Despede Mais de 1.100 Funcionários (20% da Força de Trabalho) para Mudar para Operações Orientadas por IA
De acordo com a Reuters, a Cloudflare dispensou mais de 1.100 funcionários, o que representa aproximadamente 20% da sua força de trabalho, a 8 de maio, para reestruturar as operações em torno de ferramentas de IA. O CEO Matthew Prince afirmou que a empresa está a redesenhar todas as equipas e funções para se adaptar a uma era de IA agentica, salientando o uso interno de IA
GateNews30m atrás
A Google lança o Fitbit Air por 99,99$, o rastreador sem ecrã torna-se o hub do Gemini Health Coach a 26 de maio
Segundo Beating, a Google lançou o Fitbit Air, um rastreador de saúde sem ecrã, com preço de 99,99 USD, previsto para começar a ser enviado a 26 de maio. O dispositivo pesa apenas 5,2 gramas e inclui uma bateria de 7 dias, com capacidade de carregamento rápido de 5 minutos. Os sensores monitorizam a frequência cardíaca 24 horas por dia, a deteção de fibrilhação auricular, a saturação de oxigénio no sangue, e h
GateNews32m atrás
A OpenAI Lança Três Modelos de Voz na API em Tempo Real; GPT-Realtime-2 Inclui uma Janela de Contexto de 128K
Segundo Beating, a OpenAI lançou três modelos de voz na sua Realtime API: GPT-Realtime-2 para conversação por voz com raciocínio, GPT-Realtime-Translate para tradução em tempo real e GPT-Realtime-Whisper para transcrição em streaming. O GPT-Realtime-2 é o primeiro modelo de voz da OpenAI com nível GPT-5-level re
GateNews48m atrás