
Mozilla Thứ Ba đã công bố rằng phiên bản sớm của mô hình AI Claude Mythos của Anthropic, trong giai đoạn thử nghiệm nội bộ, đã phát hiện 271 lỗ hổng bảo mật trong trình duyệt Firefox, và tất cả các lỗ hổng đã được vá trong tuần này. Khi vẫn đang trong trạng thái sửng sốt, Mozilla cũng cho biết kết quả cho thấy lĩnh vực an ninh mạng có thể đang xuất hiện một sự chuyển biến mang tính căn bản, và những người phòng thủ có thể sắp thu hẹp lợi thế mà các kẻ tấn công đã nắm giữ trong thời gian dài.
Trước đó, Mozilla từng thử nghiệm một mô hình khác của Anthropic và phát hiện 22 lỗ hổng bảo mật nhạy cảm trong các phiên bản Firefox sớm hơn. Việc phát hiện 271 lỗ hổng lần này thể hiện một bước nhảy vọt về quy mô.
Mozilla nhấn mạnh rằng tất cả các lỗ hổng được hệ thống phát hiện “kể cả các nhà nghiên cứu con người hàng đầu” cũng có thể phát hiện được, và hiện tại các công cụ AI vẫn chưa tiết lộ các kiểu lỗ hổng hoàn toàn mới mà con người không thể hiểu. Lợi thế cốt lõi của nó nằm ở việc đẩy nhanh đáng kể quy trình này, cho phép các nhà phát triển nhanh chóng nhận diện lỗ hổng trước khi kẻ tấn công khai thác.
Claude Mythos được phát hành vào tháng 3 năm 2026. Đây là mô hình tiên tiến nhất hiện tại của Anthropic, và tài liệu nội bộ của công ty mô tả nó là một mô hình thế hệ mới vượt qua dòng Opus trước đó. Trong các bài kiểm tra trước khi phát hành, mô hình đã phát hiện hàng ngàn lỗ hổng trước đó chưa từng biết trong các hệ điều hành chính và trình duyệt web.
Anthropic cung cấp quyền truy cập hạn chế vào Claude Mythos thông qua “Kế hoạch Glasswing” (Project Glasswing). Hiện chỉ có các tổ chức được phép sử dụng giới hạn ở một số công ty công nghệ được thông qua như Amazon, Apple, Microsoft…, và phạm vi sử dụng chỉ giới hạn ở việc quét lỗ hổng phần mềm.
Bối cảnh của việc kiểm soát nghiêm ngặt này là: Viện Nghiên cứu An toàn AI của Anh đã phát hiện rằng Claude Mythos có thể tự động thực hiện các thao tác mạng phức tạp, bao gồm việc mô phỏng tấn công mạng doanh nghiệp nhiều giai đoạn mà không cần can thiệp của con người. Theo các nguồn tin am hiểu, dù chính quyền của Trump từng kêu gọi ngừng sử dụng công nghệ của Anthropic, Cơ quan An ninh Quốc gia Hoa Kỳ (NSA) đã triển khai và chạy phiên bản xem trước của Claude Mythos trên mạng nội bộ mật.
Thành quả mà Mozilla phát hiện mang ý nghĩa sâu rộng cả hai mặt. Các nhà nghiên cứu an ninh cảnh báo rằng các hệ thống AI có khả năng phân tích mã ở quy mô lớn có thể tự động nhận diện các lỗ hổng khai thác trong những phần mềm được sử dụng rộng rãi. Nếu rơi vào tay kẻ xấu, điều đó sẽ gây ra mối đe dọa an ninh mạng chưa từng có đối với các công ty phần mềm và người dùng, đồng thời có thể dẫn đến sự ra đời của một thế hệ hình thái mới của các cuộc tấn công mạng tự động.
Theo phần giải thích của Mozilla, đây là các lỗ hổng bảo mật thực sự, “kể cả các nhà nghiên cứu con người hàng đầu” cũng có thể phát hiện được. Mozilla cho biết hiện tại các công cụ AI vẫn chưa tiết lộ các kiểu lỗ hổng hoàn toàn mới mà con người không thể hiểu, nhưng điểm mạnh của nó nằm ở tốc độ quét hệ thống quy mô lớn vượt xa so với việc kiểm tra thủ công, và tất cả các vấn đề đã được hoàn tất sửa trong tuần này.
Kế hoạch Glasswing là chương trình truy cập có kiểm soát do Anthropic thiết lập. Hiện chỉ cho phép các công ty công nghệ cụ thể đã thông qua như Amazon, Apple, Microsoft… được sử dụng hạn chế Claude Mythos, với mục đích là quét lỗ hổng bảo mật phần mềm. Hạn chế này phản ánh mức độ thận trọng cao của Anthropic trước rủi ro sử dụng hai mặt của mô hình.
Mozilla cho biết sự xuất hiện của các công cụ AI có thể lần đầu tiên mang lại cho những người phòng thủ cơ hội thu hẹp lợi thế mà các kẻ tấn công đã có trong thời gian dài, đạt được “chiến thắng mang tính quyết định”. Tuy nhiên, các nhà nghiên cứu đồng thời cảnh báo rằng cùng năng lực đó cũng có thể bị kẻ tấn công khai thác, làm tăng quy mô và hiệu suất của các cuộc tấn công mạng tự động. Vì vậy, việc kiểm soát quyền truy cập đối với các công cụ an toàn AI là vô cùng quan trọng.
Bài viết liên quan
Brockman của OpenAI Tiếp Quản Tích Hợp Sản Phẩm; Sora Bị Hạ Cấp Do "Sự Phân Nhánh Kỹ Thuật"
Sam Altman Trả Lời Vụ Tấn Công Tại Nhà Trên Podcast, Dự Đoán Sẽ Có Nhiều Sự Cố Tương Tự
Thượng Hải Hoàn Tất Đăng Ký 1 Dịch Vụ AI Tạo Sinh, Tổng Cộng Lũy Kế Lên 158
Hugging Face phát hành mã nguồn mở ml-intern, một tác nhân AI cho nghiên cứu ML tự chủ
JPMorgan Chase Nâng Mục Tiêu S&P 500 Cuối Năm Lên 7,600, Trích Dẫn Dòng Đầu Tư AI Tăng Mạnh Và Rủi Ro Địa Chính Trị Giảm Nhẹ
OpenAI Cung Cấp Thông Tin Cho Chính Phủ Hoa Kỳ và Liên Minh Five Eyes Về Sản Phẩm An Ninh Mạng