Oppo X-OmniClaw: agente de IA Android open-source é executado localmente sem cloud

OliverGrant

A equipa Multi-X da Oppo publicou o X-OmniClaw, uma framework de agentes Android de IA open-source que mantém a lógica central no dispositivo, chamando modelos de linguagem baseados na nuvem apenas para tarefas de raciocínio pesado. Ao contrário da maioria dos sistemas de IA para telemóveis que correm em servidores na nuvem que alojam cópias virtuais de Android, o X-OmniClaw é executado diretamente no dispositivo físico do utilizador, mantendo acesso à câmara do telefone, às fotografias e aos ficheiros locais.

## Arquitetura: Três pilares da inteligência no dispositivo

O X-OmniClaw funciona através de três componentes interligados que operam como um ciclo contínuo único, segundo a documentação técnica da Oppo.

Omni Perception combina feeds de câmara, conteúdo do ecrã e entrada de voz num único pipeline. Um modelo visão-linguagem interpreta a cena antes de o agente agir. Por exemplo, se um utilizador apontar a câmara a um produto e pedir o seu preço, o agente identifica primeiro o que está a ver, depois abre a aplicação de compras relevante e começa a pesquisar sem exigir introdução manual.

Omni Memory distingue o X-OmniClaw de chatbots de uma única resposta, mantendo contexto entre tarefas, mudanças de aplicações e sessões. O agente constrói memória semântica de longo prazo a partir da galeria de fotos do utilizador, convertendo imagens brutas em notas estruturadas sobre objetos, cenas e acontecimentos. Segundo o relatório, “a continuidade em tempo de execução é o que permite que o X-OmniClaw funcione como um agente contínuo no dispositivo, em vez de um sistema de respostas pontuais”.

Omni Action trata a execução ao combinar dados da interface XML com modelos visuais no dispositivo e reconhecimento ótico de caracteres (OCR) para determinar exatamente o que tocar, mesmo em ecrãs cheios. A framework inclui uma funcionalidade de comportamento clonado que permite aos utilizadores gravar um percurso de navegação uma vez e, depois, o reproduzir instantaneamente via atalhos Android deeplink em sessões futuras, contornando a navegação em múltiplos passos entre aplicações.

## Exemplos de funcionamento

A Oppo demonstrou várias aplicações práticas do X-OmniClaw:

- Identificação de produtos e preços: o agente identifica um produto físico via câmara, abre o Taobao, percorre os resultados e devolve um resumo de preços sem exigir qualquer digitação.

- Apoio educacional: um companheiro flutuante no ecrã ajuda os utilizadores a resolver exercícios de matemática passo a passo, lendo autonomamente o conteúdo do ecrã, processando cada pergunta e avançando quando está completo.

- Criação de vídeo a partir da galeria: quando solicitado a montar um vídeo de highlights a partir de fotos com temática de periquitos, o sistema analisa a galeria usando memória semântica para encontrar imagens correspondentes, abre o editor de vídeo do CapCut via deeplink, seleciona ficheiros em lote e gera o vídeo. O relatório indica que este processo, que antes exigia “alguns minutos ou mais”, é reduzido a um punhado de passos automatizados.

## Enquadramento no ecossistema de agentes de IA

O X-OmniClaw estende uma arquitetura pioneira pela OpenClaw, uma framework de agentes open-source que atingiu mais de 373.000 estrelas no GitHub e que acabou por ser apoiada pela OpenAI. O Hermes Agent da Nous Research avançou o conceito ainda mais com um ciclo de aprendizagem autoaperfeiçoável que compõe capacidades com o tempo. Ambos os projetos correram principalmente em hardware de computador. O X-OmniClaw adapta esta arquitetura para smartphones ao construir sobre a base de código open-source do HermesApp e ao incorporar o modelo estruturado de skills da OpenClaw como inspiração fundamental, depois personalizando-o para a natureza multimodal e sempre ativa dos dispositivos móveis.

O código está disponível no GitHub, com a Oppo a comprometer-se a lançar todos os ativos e a continuar a atualizar o projeto à medida que o sistema evolui.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário