Сообщение Gate News, 22 апреля — OpenAI выпустила Privacy Filter, модель с открытым исходным кодом, предназначенную для обнаружения и редактирования персонально идентифицируемой информации (PII) в тексте. Модель работает локально и обрабатывает длинные документы за один проход вперёд, поддерживая до 128 000 токенов контекста. При 1,5 млрд общих параметров и 50 млн активных параметров Privacy Filter идентифицирует частные имена, адреса, адреса электронной почты, номера телефонов, URL-адреса, даты, номера счетов, пароли, ключи API и другую чувствительную информацию.
Модель доступна по лицензии Apache 2.0 на Hugging Face и GitHub. Она может выявлять широкий спектр категорий ПДн, включая персональные контактные данные, финансовую информацию и учетные данные для аутентификации.
OpenAI заявила, что Privacy Filter предназначен для использования в рабочих процессах с сохранением конфиденциальности, таких как подготовка обучающих данных, индексация, логирование и модерация контента.