Anthropic phát hành mô hình Claude Fable 5, hạn chế các chủ đề về an ninh mạng và sinh học

Theo Anthropic, công ty đã công khai phát hành Claude Fable 5 vào hôm thứ Ba, một mô hình thuộc lớp Mythos mới vượt trội hơn các mô hình Opus tuyến đầu trước đó của họ về năng lực tổng thể. Mô hình được trang bị các cơ chế bảo vệ nhằm ngăn không cho nó trả lời các truy vấn về các chủ đề nhạy cảm, bao gồm an ninh mạng, sinh học và hóa học, nơi Anthropic bày tỏ lo ngại về khả năng bị lạm dụng bởi các tác nhân xấu. Khác với Mythos 5 vốn vẫn bị giới hạn cho một nhóm nhỏ các chuyên gia phòng thủ mạng, Fable 5 có thể truy cập công khai và các truy vấn bị hạn chế sẽ được chuyển đến mô hình Claude Opus 4.8 trước đó, đồng thời cảnh báo người dùng về việc chuyển hướng này. Anthropic cho biết các cơ chế bảo vệ này được tinh chỉnh chặt hơn mức lý tưởng, dẫn đến tỷ lệ dương tính giả dưới 5% trong quá trình thử nghiệm, mà công ty cho là có thể chấp nhận để giảm thiểu rủi ro gây hại nghiêm trọng.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận