Mensagem da Gate News, 17 de abril — A Anthropic anunciou o Claude Opus 4.7, um modelo de IA com salvaguardas concebidas para bloquear pedidos de cibersegurança de alto risco. O lançamento baseia-se no Claude Opus 4.6, apresentado em fevereiro, e precede uma implementação mais ampla dos modelos mais avançados da classe Mythos da Anthropic. O Mythos Preview, apresentado no início deste mês, continua a ser mais capaz do que o Opus 4.7, mas está atualmente disponível apenas para um conjunto limitado de empresas através do Project Glasswing, o programa de cibersegurança da Anthropic.
O Opus 4.7 proporciona melhorias significativas nos fluxos de trabalho agentic e nas capacidades de visão. O desempenho na codificação autónoma subiu para 64.3% no SWE-bench Pro, um benchmark amplamente utilizado para tarefas de engenharia de software, face aos 53.4% da versão anterior. O tratamento de imagens passa a suportar mais do que o triplo da resolução, com a precisão da acuidade visual a melhorar de 54.5% para 98.5% em testes standard. Foram implementadas limitações intencionais de cibersegurança durante o treino; no CyberGym, um benchmark de desempenho em cibersegurança, o Opus 4.7 obteve 73.1%, abaixo dos 83.1% do Mythos Preview.
A Anthropic restringiu o Mythos Preview na sequência de testes pré-lançamento que revelaram milhares de vulnerabilidades de alta criticidade, incluindo uma falha no OpenBSD não detetada durante 27 anos. Investigadores de segurança a conduzir investigação de vulnerabilidades, testes de penetração ou exercícios de red-team podem candidatar-se ao Programa de Verificação Cibernética da Anthropic para obter acesso defensivo sem recusa predefinida. O feedback das salvaguardas do Opus 4.7 irá informar futuros lançamentos de modelos.