A Anthropic lança a estratégia Advisor: Opus como consultor em conjunto com Sonnet, melhorando o desempenho e reduzindo os custos em 12%

A Anthropic anunciou a 9 de abril a introdução formal da “Estratégia de Advisor” na plataforma Claude. Os programadores já podem, através da Messages API, fazer com que a Opus assuma o papel de consultora, em conjunto com Sonnet ou Haiku como executores, alcançando numa única chamada de API um desempenho intelectual próximo do da Opus, ao mesmo tempo que reduzem significativamente os custos. Esta funcionalidade está atualmente disponível numa versão de testes pública.

Mecanismo de funcionamento: o executor, quando se depara com um problema difícil, consulta automaticamente a Opus

O conceito central da Estratégia de Advisor é separar a inferência da execução. Depois de os programadores adicionarem a ferramenta advisor nas chamadas da Messages API, quando os agentes Sonnet ou Haiku, durante a execução de uma tarefa, se depararem com decisões difíceis, consultam automaticamente a Opus. Obtêm recomendações de planeamento e continuam a execução. Todo o processo é concluído dentro de uma única chamada de API, sem necessidade de o programador orquestrar adicionalmente.

Esta arquitetura é semelhante à divisão de trabalho entre consultores seniores e executores numa equipa — a Opus fica responsável pelas decisões estratégicas de alto nível, enquanto a Sonnet ou a Haiku ficam responsáveis pela operação prática; ambos colaboram no mesmo fluxo de trabalho.

Teste em situação real: melhor desempenho e custos mais baixos

De acordo com os dados de avaliação publicados pela Anthropic, no benchmark SWE-bench Multilingual, o desempenho da Sonnet com advisor da Opus foi superior em 2,7 pontos percentuais ao da utilização isolada de Sonnet. Além disso, o custo por tarefa diminuiu 11,9%.

A redução de custos deve-se ao facto de a maioria das tarefas continuar a ser tratada pela Sonnet ou pela Haiku, que são mais baratas. A Opus é chamada apenas nos pontos de decisão críticos, evitando os custos elevados de a utilizar ao longo de todo o processo.

Significado para os programadores

A Estratégia de Advisor oferece aos programadores que constroem AI agents uma nova opção de compromisso entre custo e desempenho. No passado, os programadores tinham de escolher entre “usar Opus durante todo o processo, mas com custos altos” ou “usar Sonnet durante todo o processo, mas pode falhar ao lidar com problemas complexos”. Agora é possível obter as vantagens de ambos com uma arquitetura híbrida.

A comunidade reagiu entusiasticamente: alguns programadores compararam-na à “linha de vida” de “ligar para pedir ajuda” do programa “Milionário” — os executores trabalham normalmente de forma independente e só quando surge um problema realmente difícil é que pedem ajuda aos especialistas.

Este artigo “A Anthropic lança a Estratégia de Advisor: Opus como consultora, com Sonnet para executar; melhoria de desempenho e redução de custos em 12%” foi publicado pela primeira vez em ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A CoreWeave garante um acordo de $6 mil milhões para a computação em nuvem de IA com a Jane Street

A CoreWeave garantiu um acordo de $6 mil milhões com a Jane Street para serviços de cloud de IA, que inclui um investimento de $1 mil milhões em acções da CoreWeave. A transição para infraestruturas de cloud de IA posicionou a CoreWeave como líder no sector.

GateNews1h atrás

A Google lança o Gemini 3.1 Flash TTS: suporta 70 línguas e cenários para encenação, voz de IA mais natural

A Google AI anunciou o lançamento do Gemini 3.1 Flash TTS, um modelo de texto-para-voz com suporte para 70 línguas, com novas funcionalidades como realizador de cenários, controlo ao nível do locutor e etiquetas de áudio. Em comparação com a geração anterior, o Gemini 3.1 melhora a naturalidade e a expressividade da voz, e pode ser utilizado através do Google AI Studio ou da Gemini API, sendo adequado a vários cenários de aplicação.

ChainNewsAbmedia1h atrás

DownDetector relata utilizadores do Claude a enfrentarem problemas no serviço

Mensagem de notícias da Gate, 15 de Abril — DownDetector, um website de monitorização do estado da rede, registou relatos de utilizadores que indicam que o Claude, um assistente de IA, está a enfrentar problemas de serviço.

GateNews11h atrás

Allbirds Levanta $50M através de Obrigações Conversíveis, faz a transição para Infraestrutura de IA como NewBird AI

Allbirds angariou $50 milhões através de obrigações conversíveis e irá passar do retalho de calçado para a computação em IA, rebatizando-se como NewBird AI para refletir a sua nova missão.

GateNews12h atrás

A OpenAI Planeia Novos Preços para os Anúncios do ChatGPT, Explorando Mais Atualizações

Mensagem de Notícias da Gate, 15 de Abril — A OpenAI está a planear introduzir novos preços para os anúncios do ChatGPT e a explorar outras opções de atualização, de acordo com o The Information.

GateNews13h atrás

A Startup de IA Hilbert Angaria $28M numa Série A Liderada pela Andreessen Horowitz

A Hilbert, uma startup de IA, angariou $28 milhões numa ronda de Série A liderada pela Andreessen Horowitz para ajudar as empresas a automatizar decisões para impulsionar o crescimento e a melhorar a eficácia dos seus investimentos em IA.

GateNews13h atrás
Comentar
0/400
Nenhum comentário