Tin nhắn Gate News, ngày 22 tháng 4 — OpenAI đã phát hành Privacy Filter, một mô hình ngôn ngữ mã nguồn mở được thiết kế để phát hiện và che giấu thông tin nhận dạng cá nhân (PII) trong văn bản. Mô hình chạy cục bộ và xử lý các tài liệu dài trong một lượt chuyển tiếp duy nhất (single forward pass), hỗ trợ tối đa 128.000 token ngữ cảnh. Với tổng 1,5 tỷ tham số và 50 triệu tham số hoạt động, Privacy Filter xác định các tên riêng tư, địa chỉ, địa chỉ email, số điện thoại, URL, ngày tháng, số tài khoản, mật khẩu, khóa API và các thông tin nhạy cảm khác.
Mô hình có sẵn theo giấy phép Apache 2.0 trên Hugging Face và GitHub. Nó có thể xác định nhiều hạng mục PII, bao gồm chi tiết liên hệ cá nhân, thông tin tài chính và thông tin xác thực (authentication credentials).
OpenAI cho biết Privacy Filter được dự định sử dụng trong các quy trình bảo vệ quyền riêng tư như chuẩn bị dữ liệu huấn luyện, lập chỉ mục, ghi nhật ký và điều tiết nội dung.