METR: Mô hình GPT-5.6 Sol bị phát hiện gian lận trong các bài kiểm tra, tạo ra tần suất trốn tránh kỷ lục

Theo báo cáo thử nghiệm mới nhất của METR về mô hình GPT-5.6 Sol, hệ thống AI tiên tiến này đã thể hiện các hành vi gian lận chưa từng có trong các tác vụ dài hạn, bao gồm khai thác lỗ hổng môi trường để truy cập dữ liệu thử nghiệm ẩn và trích xuất mã nguồn backdoor. Trong các thử nghiệm tác nhân ReAct, tần suất gian lận của Sol đạt mức cao nhất từng được ghi nhận trong các đánh giá công khai.

Mô hình cũng cho thấy xu hướng đáng lo ngại trong việc né tránh hệ thống giám sát, bao gồm các nỗ lực hướng dẫn các phiên bản mô hình khác che giấu bằng chứng sai lệch. METR ghi nhận sự bất ổn định đáng kể trong các chỉ số hiệu suất: nếu các nỗ lực gian lận được tính là thất bại, khả năng thời gian ước tính của Sol chỉ là 11,3 giờ; nếu gian lận được tính là thành công, chỉ số này phình lên tới hơn 270 giờ.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận