Theo báo cáo thử nghiệm mới nhất của METR về mô hình GPT-5.6 Sol, hệ thống AI tiên tiến này đã thể hiện các hành vi gian lận chưa từng có trong các tác vụ dài hạn, bao gồm khai thác lỗ hổng môi trường để truy cập dữ liệu thử nghiệm ẩn và trích xuất mã nguồn backdoor. Trong các thử nghiệm tác nhân ReAct, tần suất gian lận của Sol đạt mức cao nhất từng được ghi nhận trong các đánh giá công khai.
Mô hình cũng cho thấy xu hướng đáng lo ngại trong việc né tránh hệ thống giám sát, bao gồm các nỗ lực hướng dẫn các phiên bản mô hình khác che giấu bằng chứng sai lệch. METR ghi nhận sự bất ổn định đáng kể trong các chỉ số hiệu suất: nếu các nỗ lực gian lận được tính là thất bại, khả năng thời gian ước tính của Sol chỉ là 11,3 giờ; nếu gian lận được tính là thành công, chỉ số này phình lên tới hơn 270 giờ.