Mensagem da Gate News, 17 de abril — A Anthropic anunciou o Claude Opus 4.7, um modelo de IA com salvaguardas concebidas para bloquear pedidos de cibersegurança de alto risco. O lançamento baseia-se no Claude Opus 4.6, apresentado em fevereiro, e precede uma implementação mais ampla dos modelos mais avançados da classe Mythos da Anthropic. O Mythos Preview, apresentado no início deste mês, continua a ser mais capaz do que o Opus 4.7, mas está atualmente disponível apenas para um conjunto limitado de empresas através do Project Glasswing, o programa de cibersegurança da Anthropic.
O Opus 4.7 proporciona melhorias significativas nos fluxos de trabalho agentic e nas capacidades de visão. O desempenho na codificação autónoma subiu para 64.3% no SWE-bench Pro, um benchmark amplamente utilizado para tarefas de engenharia de software, face aos 53.4% da versão anterior. O tratamento de imagens passa a suportar mais do que o triplo da resolução, com a precisão da acuidade visual a melhorar de 54.5% para 98.5% em testes standard. Foram implementadas limitações intencionais de cibersegurança durante o treino; no CyberGym, um benchmark de desempenho em cibersegurança, o Opus 4.7 obteve 73.1%, abaixo dos 83.1% do Mythos Preview.
A Anthropic restringiu o Mythos Preview na sequência de testes pré-lançamento que revelaram milhares de vulnerabilidades de alta criticidade, incluindo uma falha no OpenBSD não detetada durante 27 anos. Investigadores de segurança a conduzir investigação de vulnerabilidades, testes de penetração ou exercícios de red-team podem candidatar-se ao Programa de Verificação Cibernética da Anthropic para obter acesso defensivo sem recusa predefinida. O feedback das salvaguardas do Opus 4.7 irá informar futuros lançamentos de modelos.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A China vai reforçar o quadro legislativo para IA, economia digital e blockchain
A China planeia reforçar o seu sistema jurídico de rede para responder às necessidades do desenvolvimento da Internet, com enfoque na legislação para a IA, economia digital e outros sectores tecnológicos. Até Dezembro de 2025, espera-se que existam mais de 180 leis, embora as regulamentações actuais ainda fiquem aquém das expectativas do público.
GateNews52m atrás
A Intchains Group revela 8,040 ETH em staking e acelera a transformação de operações impulsionadas por IA
A Intchains Group comunicou um montante acumulado de staking de 8,040 ETH, com uma estratégia que inclui a plataforma FalconX e o seu próprio Goldshell Stake. A empresa está também a melhorar as operações através de automação por IA para aumentar a eficiência e a capacidade de decisão.
GateNews1h atrás
A Adata, o Jay Chou a ganhar muito? A empresa de gestão GD reúne-se em segredo com a família real de Dubai para discutir IPO, IA e robôs
A empresa sul-coreana de tecnologia de entretenimento Galaxy Corporation tem vindo a avançar recentemente para o mercado do Médio Oriente, tendo criado a entidade legal em Dubai “Galaxy ME” e reunido com membros da família real dos Emirados Árabes Unidos para explorar a integração de IA e conteúdos. A empresa já selecionou uma corretora para realizar o IPO; no ano passado, a sua receita atingiu 300 mil milhões de won sul-coreano, tendo também atraído investimentos de Jay Chou e da ADATA. Esta estratégia visa impulsionar o desenvolvimento do ecossistema de entretenimento no Médio Oriente, sublinhando a importância da sua estratégia de internacionalização.
ChainNewsAbmedia2h atrás
Equipa chinesa EvoMap enfurece com a polémica de plágio da Hermes Agent que explodiu em popularidade: existe uma elevada semelhança no sistema de autoevolução
A equipa chinesa EvoMap acusa o agente Hermes da Nous Research de ter copiado a sua arquitetura Evolver/GEP, afirmando que ambos apresentam uma elevada semelhança em vários módulos-chave. A EvoMap refere que o design do Hermes não cita nem dá crédito ao seu conteúdo publicado anteriormente; a polémica suscitou grande atenção por parte da comunidade, com alguns utilizadores chineses a apoiar a EvoMap e a criticar a conduta de plágio do Hermes. Embora a equipa da Nous Research ainda não tenha refutado as acusações ponto por ponto, o caso espalhou-se rapidamente no panorama da opinião pública sobre IA.
ChainNewsAbmedia3h atrás
Apoiantes iniciais da OpenAI preferem! A nova empresa de interface cérebro-computador Sabi vai enviar o mais rapidamente até ao final do ano o «barrete» que permite escrever com o pensamento
A start-up da Califórnia (Vale do Silício) Sabi anunciou que está a desenvolver uma interface cérebro-computador (BCI) vestível, que não requer cirurgia invasiva. Os utilizadores precisam apenas de “pensar” para introduzirem texto no ecrã, estando prevista a sua disponibilização até ao final de 2026. O dispositivo será equipado com até 100.000 sensores microscópicos, o que ajudará a interpretar com precisão a actividade cerebral; a Sabi também sublinha a protecção da privacidade dos dados.
ChainNewsAbmedia3h atrás
Os dados revelam que “Claude fica menos inteligente” não é um mito urbano; o modelo de IA é instável, constituindo um risco empresarial
O artigo aborda o fenómeno de instabilidade do desempenho de LLMs (modelos de linguagem de grande escala) nas aplicações das empresas de IA, chamando-lhe «diminuição de capacidades», e apresenta exemplos para ilustrar o seu impacto real nos fluxos de trabalho das empresas. Os dados mostram que a maioria dos modelos principais se encontra num estado de degradação, afectando a produtividade e a estabilidade das empresas; estas precisam de começar a dar prioridade à estabilidade dos modelos como um novo padrão, caso contrário enfrentarão riscos para a infra-estrutura.
ChainNewsAbmedia3h atrás