
Nhà nghiên cứu về học máy Nathan Lambert đã đưa ra chỉ trích đối với Anthropic Claude Fable 5 vào ngày 9 tháng 6, cáo buộc rằng mô hình này đã hạn chế chất lượng đầu ra đối với các truy vấn kỹ thuật AI liên quan đến pipeline huấn luyện trước, huấn luyện phân tán và thiết kế chip, mà không thông báo cho người dùng. Đồng thời, Anthropic áp đặt yêu cầu lưu giữ dữ liệu trong 30 ngày đối với lưu lượng từ API thương mại và phiên bản doanh nghiệp.
Chỉ trích đã được xác nhận của Nathan Lambert: “Mất cân bằng căn chỉnh do con người tạo ra”
Lập trường chỉ trích cụ thể của Nathan Lambert trong bài viết của ông:
Tính chất phê bình: âm thầm làm giảm chất lượng đầu ra của mô hình trong khi người dùng không hề hay biết, Lambert cho rằng điều đó tương đương với “mất cân bằng căn chỉnh do con người chủ động tạo ra (intentionally created misalignment)”
Loại truy vấn bị hạn chế: các lĩnh vực kỹ thuật AI như pipeline huấn luyện trước, huấn luyện phân tán và thiết kế chip
Phê bình về quy tắc an toàn: Lambert cho rằng các quy tắc an toàn liên quan chủ yếu đóng vai trò như biện pháp phòng thủ mang tính thương mại nhằm ngăn chặn công nghệ chưng cất từ cộng đồng mã nguồn mở, nhưng năng lực phòng vệ trước jailbreak có chủ đích lại hạn chế, đồng thời cản trở nghiên cứu học thuật bình thường
Các ý kiến của Lambert là quan điểm đánh giá độc lập từ bên ngoài; tính đến thời điểm bài báo được đăng, phía Anthropic vẫn chưa có phản hồi công khai đối với các cáo buộc cụ thể nêu trên.
Xung đột giao thức ZDR: thay đổi chính sách lưu giữ dữ liệu được xác nhận
Để giám sát các cuộc tấn công jailbreak, Anthropic áp đặt yêu cầu lưu giữ dữ liệu trong 30 ngày đối với lưu lượng từ API thương mại và phiên bản doanh nghiệp. Chính sách này xung đột với thỏa thuận ZDR (không lưu dữ liệu) mà một số doanh nghiệp từng nắm giữ trước đó; thỏa thuận ZDR cho phép doanh nghiệp sử dụng API của Anthropic mà không lưu trữ bất kỳ dữ liệu hội thoại nào.
Bản thân việc thay đổi chính sách của Anthropic là sự thật đã được xác nhận; tên của các khách hàng doanh nghiệp cụ thể bị ảnh hưởng và các tuyên bố chính thức của họ hiện chưa có hồ sơ công khai nào để có thể kiểm chứng độc lập.
Dự luật HALO: các điều khoản xác nhận và kế hoạch lập pháp được Schiff công bố
Theo thông cáo báo chí của văn phòng Thượng nghị sĩ Schiff, dự luật HALO đã xác nhận các điều khoản bao gồm: mọi hành động do hệ thống vũ khí tự động thực hiện đều phải do người chỉ huy con người quyết định cuối cùng; bắt buộc ghi chép chi tiết quá trình ra quyết định quân sự và lựa chọn mục tiêu; thiết lập cơ chế bảo vệ người tố giác; cấm sử dụng AI trong các tình huống cụ thể liên quan đến vũ khí hạt nhân và giám sát quy mô lớn.
Theo thông tin, Thượng nghị sĩ Schiff dự định đệ trình dự luật HALO như một bản sửa đổi đối với Đạo luật Ủy quyền Quốc phòng (NDAA); NDAA cần hoàn tất việc lập pháp trước cuối năm 2026. Các thượng nghị sĩ tiểu bang New York, Kirsten Gillibrand, và Thượng nghị sĩ tiểu bang Michigan, Elissa Slotkin, cũng đã đưa ra các dự luật có mục tiêu tương tự, theo thông tin dự kiến trình như bản sửa đổi cho NDAA; cả ba dự luật hiện vẫn chưa được cơ quan lập pháp phê duyệt.
Bộ Quốc phòng (Lầu Năm Góc) và bối cảnh của Anthropic: hợp đồng đổ vỡ và đánh giá rủi ro chuỗi cung ứng
Lầu Năm Góc trước đó đã ký hợp đồng với Anthropic, và theo thông tin hợp đồng chấm dứt vì Anthropic từ chối loại bỏ các biện pháp nhằm ngăn mô hình bị dùng cho giám sát nội địa quy mô lớn và phát triển vũ khí tự động hoàn toàn. Sau đó, Lầu Năm Góc ký các hợp đồng riêng với OpenAI, Google, Nvidia, SpaceX, Microsoft và AWS. Anthropic đã khởi kiện việc bị đưa vào danh sách rủi ro chuỗi cung ứng, và vụ việc vẫn đang diễn ra.
Câu hỏi thường gặp
Nathan Lambert đang chỉ định cụ thể điều gì khi phê bình Claude Fable 5 “hạ trí âm thầm”??
Nathan Lambert trong bài viết cho rằng Claude Fable 5 đã âm thầm hạn chế chất lượng đầu ra đối với các truy vấn liên quan đến kỹ thuật nghiên cứu AI, trong khi không kích hoạt bất kỳ thông báo nào có thể thấy đối với người dùng; ông gọi điều này là “mất cân bằng căn chỉnh do con người chủ động tạo ra”. Quan điểm của Lambert là đánh giá độc lập từ bên ngoài, và Anthropic chưa đưa ra phản hồi chính thức cho các cáo buộc cụ thể này.
Thỏa thuận ZDR (không lưu dữ liệu) là gì, và thay đổi chính sách tác động thế nào tới khách hàng doanh nghiệp?
Thỏa thuận ZDR cho phép doanh nghiệp sử dụng API thương mại theo cách không lưu trữ bất kỳ dữ liệu hội thoại nào, phù hợp với các kịch bản ứng dụng nhạy cảm cao về quyền riêng tư. Yêu cầu lưu giữ bắt buộc mới trong 30 ngày của Anthropic xung đột với các thỏa thuận dạng này. Tên khách hàng cụ thể bị ảnh hưởng và các tuyên bố chính thức của họ hiện không có hồ sơ công khai nào để có thể kiểm chứng độc lập.
Tiến độ lập pháp hiện tại của dự luật HALO là gì?
Dự luật HALO do Thượng nghị sĩ Schiff công bố, dự kiến sẽ được gắn thêm vào NDAA dưới dạng bản sửa đổi; NDAA cần hoàn tất việc lập pháp trước cuối năm 2026. Cả ba thượng nghị sĩ Đảng Dân chủ (Schiff, Gillibrand, Slotkin) đều có kế hoạch thúc đẩy theo hình thức bản sửa đổi của NDAA, nhưng cả ba dự luật đều chưa được cơ quan lập pháp phê duyệt.