El equipo de PaddlePaddle de Baidu lanzó recientemente PP-OCRv6, un nuevo sistema de OCR que ofrece tres versiones: Tiny (1,5M parámetros), Small (7,7M) y Medium (34,5M). El modelo Medium ofrece una mejora del 4,6% en la precisión de detección y del 5,1% en la precisión de reconocimiento en comparación con PP-OCRv5, al tiempo que integra chino, inglés, japonés y 46 idiomas con alfabeto latino en un único modelo unificado.
El sistema emplea técnicas de reparametrización estructural para reducir la carga computacional y, a la vez, aumentar la precisión. Con la optimización de OpenVINO, la versión Medium logra hasta 5,2x más velocidad de inferencia en CPU. Según los puntos de referencia oficiales, PP-OCRv6 iguala o supera el rendimiento de algunos modelos visión-lenguaje de miles de millones de parámetros pese a usar solo millones de parámetros. El código se ha integrado en el proyecto de código abierto PaddleOCR.