Thông điệp Gate News, ngày 17 tháng 4 — Anthropic đã công bố Claude Opus 4.7, một mô hình AI có các cơ chế bảo vệ được thiết kế để chặn các yêu cầu an ninh mạng rủi ro cao. Bản phát hành này được xây dựng dựa trên Claude Opus 4.6, được giới thiệu vào tháng 2, và đi trước một đợt triển khai rộng hơn đối với các mô hình thuộc lớp Mythos tiên tiến hơn của Anthropic. Mythos Preview, được giới thiệu sớm hơn trong tháng này, vẫn có năng lực cao hơn Opus 4.7 nhưng hiện chỉ sẵn có cho một nhóm công ty giới hạn thông qua Project Glasswing, chương trình an ninh mạng của Anthropic.
Opus 4.7 mang lại những cải tiến đáng kể cho các quy trình làm việc mang tính tác nhân (agentic) và năng lực thị giác. Hiệu suất lập trình tự động tăng lên 64.3% trên SWE-bench Pro, một bộ benchmark được sử dụng rộng rãi cho các tác vụ kỹ thuật phần mềm, từ mức 53.4% ở phiên bản trước. Xử lý hình ảnh hiện hỗ trợ độ phân giải cao hơn hơn ba lần, với độ chính xác về thị lực (visual-acuity) cải thiện từ 54.5% lên 98.5% trên các bài kiểm tra tiêu chuẩn. Các giới hạn an ninh mạng có chủ ý đã được triển khai trong quá trình huấn luyện; trên CyberGym, một benchmark hiệu suất an ninh mạng, Opus 4.7 đạt 73.1%, thấp hơn mức 83.1% của Mythos Preview.
Anthropic đã hạn chế Mythos Preview sau thử nghiệm tiền phát hành phát hiện hàng nghìn lỗ hổng có mức độ nghiêm trọng cao, bao gồm một lỗ hổng trong OpenBSD không được phát hiện trong 27 năm. Các nhà nghiên cứu an ninh tiến hành nghiên cứu lỗ hổng, kiểm thử xâm nhập (penetration testing) hoặc các bài tập red-team có thể đăng ký Chương trình Xác minh An ninh mạng (Cyber Verification Program) của Anthropic để truy cập phòng thủ mà không bị từ chối mặc định. Phản hồi từ các cơ chế bảo vệ của Opus 4.7 sẽ định hướng cho các bản phát hành mô hình trong tương lai.