Mensaje de Gate News, 22 de abril — OpenAI ha lanzado Privacy Filter, un modelo de lenguaje de código abierto diseñado para detectar y anonimizar información personal identificable (PII) en texto. El modelo se ejecuta localmente y procesa documentos largos en una sola pasada hacia adelante, con capacidad de hasta 128.000 tokens de contexto. Con 1.500 millones de parámetros totales y 50 millones de parámetros activos, Privacy Filter identifica nombres privados, direcciones, direcciones de correo electrónico, números de teléfono, URLs, fechas, números de cuenta, contraseñas, claves de API y otra información sensible.
El modelo está disponible bajo la licencia Apache 2.0 en Hugging Face y GitHub. Puede identificar una amplia gama de categorías de PII, incluyendo datos personales de contacto, información financiera y credenciales de autenticación.
OpenAI señaló que Privacy Filter está destinado a utilizarse en flujos de trabajo que preservan la privacidad, como la preparación de datos de entrenamiento, la indexación, el registro (logging) y la moderación de contenido.