A Microsoft disponibiliza em open-source o modelo Phi-Ground 4B, com desempenho superior ao do OpenAI Operator e do Claude na precisão de cliques no ecrã

Segundo a Beating, a Microsoft lançou recentemente de forma open-source a família de modelos Phi-Ground, concebida para resolver o problema de onde a IA deve clicar num ecrã de computador. A versão com 4 mil milhões de parâmetros, emparelhada com modelos de linguagem maiores para planeamento de instruções, superou a precisão de cliques do OpenAI Operator e do Claude Computer Use no benchmark Showdown e ficou em primeiro lugar entre todos os modelos com menos de 100 mil milhões de parâmetros, em cinco avaliações, incluindo ScreenSpot-Pro.

A equipa treinou com mais de 40 milhões de amostras de dados e descobriu que três técnicas de treino comuns utilizadas em artigos académicos deixaram de ser eficazes à escala. A abordagem principal revelou-se simples: gerar coordenadas como números regulares, como “523, 417”. Pesquisas anteriores inventaram vocabulários de posições especializados para coordenadas, mas isso não escalou. A equipa também descobriu que colocar instruções de texto antes das imagens melhorou o desempenho, já que os modelos podiam identificar alvos ao processar os pixéis. Além disso, métodos de aprendizagem por reforço como DPO melhoraram a precisão mesmo após afinação (fine-tuning).

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Quantra e FishWar anunciam parceria estratégica para integrar jogos com IA com a infraestrutura de RWA a 9 de maio

De acordo com anúncios oficiais a 9 de maio, a Quantra e a FishWar anunciaram uma parceria estratégica para combinar experiências de gaming potenciadas por IA com infraestruturas de blockchain de ativos do mundo real. A colaboração, partilhada através dos canais oficiais de redes sociais de ambas as empresas, visa integrar as soluções de tokenização de RWA da Quantra com a plataforma GameFi da FishWar na Sei Network. A parceria procura reforçar a escalabilidade do gaming em blockchain, a interac

GateNews6m atrás

Sam Altman revela as divisões do uso do ChatGPT por idade, com mais de um terço dos jovens dos 18-24 anos a utilizá-lo diariamente em 10 de maio

De acordo com a Fortune, o CEO da OpenAI, Sam Altman, revelou a 10 de maio que os utilizadores do ChatGPT, em diferentes faixas etárias, apresentam padrões de utilização distintos. Os utilizadores mais velhos tratam a plataforma como uma substituição do Google, enquanto os que têm entre 20 e 30 anos a usam como um conselheiro pessoal. Os estudantes universitários empregam-na como um sistema operativo diário, tirando partido da memória das conversas para conselhos emocionais, negociação de carrei

GateNews46m atrás

O secretário financeiro de Hong Kong, Paul Chan, destaca as três principais vantagens da Grande Baía: IA, indústria transformadora e finanças

De acordo com a ChainCatcher, o secretário financeiro de Hong Kong, Paul Chan, divulgou recentemente uma declaração por escrito, na qual delineou as três principais vantagens da Grande Baía: investigação em IA de ponta, cadeias completas de fabrico de alto nível e um centro financeiro internacional. Chan afirmou que esta combinação de “IA + fabrico + finanças” coloca Hong Kong para desempenhar duas funções-chave durante o período do 15.º Plano Quinquenal: coordenação industrial e ligação regulat

GateNews1h atrás

Disputa do Anthropic Code Mode: MCP vs CLI — as ferramentas travam o Runtime e os tokens caem de 150 mil para 2 mil

Em 2025, ao longo de todo o ano, a comunidade de engenharia de IA discutiu sem parar qual é que, na questão «MCP vs CLI», é mais adequado para chamadas de ferramentas por agentes; e a tese da Anthropic, publicada em novembro de 2025, «Code execution with MCP», redefiniu o problema a partir de primeiros princípios. akshay\pachaar organizou a thread em 5/10 e explicou que o problema nunca esteve no protocolo em si, mas sim no hábito antigo de «enfiar todas as descrições de ferramentas no context n

ChainNewsAbmedia4h atrás

A ByteDance planeia um aumento de 25% na despesa com infraestruturas de IA para 200 mil milhões de yuan este ano

De acordo com a ChainCatcher, citando a Golden Data, a ByteDance planeia aumentar a despesa com infraestruturas de IA em 25% até 200 mil milhões de yuans este ano, impulsionada pelos custos crescentes dos chips de memória e pelo desenvolvimento acelerado da inteligência artificial.

GateNews4h atrás

Plataforma de IA Empresarial Pit fecha rodada de financiamento $16M liderada pela a16z

Segundo a Odaily, a plataforma empresarial de IA Pit anunciou a conclusão de uma ronda de financiamento de 16 milhões de dólares, liderada pela a16z, com participação da Lakestar e de executivos da OpenAI, Anthropic, Google, Deel e Revolut. A Pit posiciona-se como “equipa de produtos de IA como serviço”, concebida para substituir folhas de cálculo tradicionais e sistemas SaaS rígidos.

GateNews4h atrás
Comentar
0/400
Nenhum comentário