رسالة Gate News، 22 أبريل — قامت OpenAI بإصدار Privacy Filter، وهو نموذج لغوي مفتوح المصدر مصمم لاكتشاف معلومات التعريف الشخصية (PII) في النص وإخفائها. يعمل النموذج محليًا ويعالج المستندات الطويلة بتمرير واحد فقط للأمام، ويدعم ما يصل إلى 128,000 رمز من السياق. وبإجمالي 1.5 مليار معلمة و50 مليون معلمة نشطة، يحدد Privacy Filter الأسماء الخاصة والعناوين وعناوين البريد الإلكتروني وأرقام الهواتف وعناوين URL والتواريخ وأرقام الحسابات وكلمات المرور ومفاتيح API وغيرها من المعلومات الحساسة.
يتوفر النموذج بموجب ترخيص Apache 2.0 على Hugging Face وGitHub. ويمكنه تحديد مجموعة واسعة من فئات معلومات التعريف الشخصية بما في ذلك تفاصيل الاتصال الشخصية والمعلومات المالية ومؤهلات المصادقة.
ذكرت OpenAI أن Privacy Filter مُعد للاستخدام في سير عمل يراعي الخصوصية مثل إعداد بيانات التدريب، والفهرسة، والتسجيل، والمراجعة على المحتوى.