O Coral Protocol supera a Microsoft em 34% com a melhor Referência GAIA para Mini-Modelo de IA

MpostMediaGroup

Em Resumo

O sistema multi-agente do Coral Protocol superou o Magnetic-UI apoiado pela Microsoft em 34% no GAIA Benchmark, demonstrando que a orquestração inteligente de modelos menores pode rivalizar ou superar abordagens tradicionais de IA em grande escala.

O Coral Protocol Estabelece Um Novo Referencial Para Sistemas Mini-Agent AI, Superando A Microsoft Em 34% No Teste GAIA

Infraestrutura descentralizada para IA colaborativa, o Coral Protocol relatou que seu sistema multiagente superou o Magnetic-UI apoiado pela Microsoft em 34% no GAIA Benchmark—um resultado sem precedentes que sugere que a escalabilidade horizontal pode oferecer uma abordagem mais eficaz do que a expansão dos parâmetros do modelo. O sistema do protocolo aproveita a orquestração inteligente entre múltiplos agentes, em vez de se concentrar apenas no aumento do tamanho do modelo.

Este desempenho marcou a maior pontuação verificada no GAIA Benchmark utilizando mini agentes, apoiando a premissa da NVIDIA de que modelos menores bem coordenados poderiam desempenhar um papel crucial no futuro da IA. O resultado, segundo os desenvolvedores da Coral, reflete uma mudança conceptual na abordagem da escalabilidade da IA, em vez de um mero aumento no poder do sistema.

Como um protocolo aberto, o Coral facilita a expansão das capacidades de IA ao permitir a coordenação entre agentes especializados globalmente, em vez de depender de modelos gerais centralizados. Sua arquitetura permite a interação paralela e segura entre agentes, melhorando a funcionalidade dos modelos de linguagem de todos os tamanhos em tarefas que requerem raciocínio avançado, planejamento e resolução de problemas.

“Este avanço marca um ponto de viragem na infraestrutura de IA,” disse Caelum Forder, CTO da Coral, em um comunicado escrito. “É prova de que a escalabilidade horizontal não é apenas possível—é prática, e a Coral é a forma mais eficaz de o fazer. A Internet dos Agentes é agora uma realidade em funcionamento. Se você é um desenvolvedor de agentes, basta Coralise. Se você é um desenvolvedor de aplicações, construa melhor por menos usando a nossa infraestrutura,” acrescentou.

Coral Tops GAIA Benchmark, Valida o Poder de Modelos Pequenos em Sistemas Agenticos Avançados

Num cenário de crescente concorrência para desenvolver sistemas agentes avançados, grande parte do foco tem permanecido em escalar modelos para gerenciar a crescente complexidade das tarefas. O desempenho recente do Coral desafia essa abordagem predominante, alinhando-se com as descobertas de um estudo recente da NVIDIA que sugere que sistemas menores podem oferecer alto desempenho sem comprometer velocidade, segurança ou eficiência. O GAIA Benchmark, um conjunto de avaliações abrangente para IA avançada, foi projetado para avaliar quão bem os sistemas lidam com tarefas do mundo real que normalmente exigiriam tempo e habilidades substanciais de especialistas humanos. Composto por 450 prompts complexos que testam capacidades de pesquisa, análise e raciocínio, o benchmark serve como uma métrica chave da indústria para avaliar a eficácia de modelos de linguagem de propósito geral (LLM) agentes.

O Sistema de Agentes GAIA da Coral, utilizado no teste de referência, é baseado no Protocolo Coral e inspira-se nos princípios de design do OWL da CAMEL. Incorpora agentes especializados para realizar uma variedade de tarefas, incluindo pesquisa, análise, crítica, planejamento e navegação na web, todas as quais se comunicam através da infraestrutura de servidor MCP da Coral.

Liderar o ranking GAIA Benchmark para modelos menores indica o potencial do Coral para estender a funcionalidade dos sistemas de IA através de uma estrutura baseada em gráficos. Este resultado sugere que agentes leves e de alto desempenho podem ser criados usando modelos menores—facilitando um manuseio de dados mais amplo, uma integração mais suave no ecossistema e uma comunicação aprimorada entre agentes.

“O papel dos pequenos modelos em sistemas agentes tem sido subestimado até agora, mas as marés estão começando a mudar,” disse Caelum Forder. “Provamos que tais modelos podem escalar além de seus limites conhecidos anteriormente e superar os incumbentes. Estou confiante de que eles têm um papel central a desempenhar no futuro da IA agente,” concluiu.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário