Segundo as informações, investigadores da NVIDIA e do MIT lançaram o Lightning OPD (Offline On-Policy Distillation), um novo quadro de pós-treino para modelos de linguagem de grande dimensão que elimina a necessidade de manter um modelo “teacher” em funcionamento durante o treino. Ao pré-computar, offline, as log-probabilidades do modelo “teacher”, o quadro melhora a eficiência do treino em 4x, libertando todos os recursos da GPU para o treino do modelo “student”.
Em testes com 8 GPUs NVIDIA H100, o Lightning OPD conseguiu destilar com sucesso o Qwen3-30B-A3B-Base (um modelo MoE com 30 mil milhões de parâmetros) e atingiu 71,0 no benchmark AIME 2024, enquanto o OPD standard ficou sem memória no mesmo hardware. Para o modelo Qwen3-8B mais pequeno, o quadro exigiu apenas 30 horas de GPU para alcançar 69,9 pontos.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Google deita os olhos no acordo da SpaceX para foguetes de dados em órbita, com planos para dois protótipos de satélites até ao início de 2027
Segundo a Reuters, a Google está em negociações com a SpaceX para um acordo de lançamento de foguetões para centros de dados em órbita, à medida que a empresa explora a possibilidade de transferir infraestruturas de computação para o espaço. A empresa anunciou em novembro que a sua iniciativa Project Suncatcher pretende lançar dois satélites protótipo para a órbita até ao início de 2027. As conversas surgem na sequência do anúncio recente da Anthropic de que vai utilizar capacidade de computação
GateNews10m atrás
A Peak XV Partners lidera a $50M Série B da Vapi, plataforma de voz com IA
De acordo com a TechCrunch, a Vapi, uma startup de software de agentes de voz com IA com sede em São Francisco, levantou 50 milhões de dólares numa ronda de Série B liderada pela Peak XV Partners, avaliando a empresa em aproximadamente 500 milhões de dólares. A ronda, que contou com a participação da M12, Kleiner Perkins e Bessemer, elevou o financiamento total da Vapi para 72 milhões de dólares. A Amazon Ring adoptou a Vapi no final de 2025 para lidar com picos de chamadas de apoio durante as f
GateNews20m atrás
A Anthropic procura adquirir a startup de ferramentas para programadores Stainless por pelo menos 300 milhões de dólares
De acordo com uma fonte familiarizada com o assunto, a Anthropic está em negociações para adquirir a startup de ferramentas para programadores Stainless por, pelo menos, 300 milhões de dólares a 12 de maio. O negócio pode envolver um pagamento parcial em ações próprias da Anthropic, embora as negociações ainda estejam numa fase inicial.
GateNews50m atrás
A Anthropic consegue pelo menos $30B , com avaliação de $900 mil milhões+, o maior round de financiamento da empresa
Segundo fontes familiarizadas com o assunto, a Anthropic está em discussões preliminares com investidores para angariar pelo menos 30 mil milhões de dólares em novo financiamento a 13 de maio, assinalando a maior ronda de captação da empresa até à data. A empresa de IA procura o capital numa valorização superior a 900 mil milhões de dólares.
GateNews1h atrás
A Anthropic negocia um financiamento de 30 mil milhões de dólares, e a valorização poderá ultrapassar os 900 mil milhões, num desafio ao pico de capitalização do mercado de IA
A Anthropic está a negociar pelo menos 30 mil milhões de dólares num novo round de financiamento, com uma avaliação-alvo que poderá ultrapassar os 90 mil milhões de dólares; se for concluído, será o maior volume da história da empresa. O financiamento será usado para expandir as infraestruturas de capacidade de computação, apoiar o crescimento da série Claude e poderá, também, em torno de outubro deste ano, fazer uma oferta pública no mercado, como último impulso antes de entrar no mercado aberto.
ChainNewsAbmedia1h atrás
A Google lança a inteligência Gemini para Android, com estreia nos Galaxy S26 e no Pixel 10 ainda este verão
A 12 de maio, o Google apresentou o Gemini Intelligence, uma nova funcionalidade de IA para Android que automatiza tarefas de múltiplas etapas entre várias aplicações com a aprovação do utilizador. A funcionalidade será lançada inicialmente neste verão nos Samsung Galaxy S26 e nos dispositivos Google Pixel 10, antes de alargar a relógios, carros, óculos e portáteis mais tarde este ano. O Gemini Intelligence permite que os utilizadores concluam ações complexas sem alternar manualmente entre aplic
GateNews3h atrás