Gate News-Meldung, 17. April — Agile Soda hat Agentic OCR vorgestellt, eine KI-gestützte Plattform für Dokumentenautomatisierung, die kein Vorab-Training erfordert und sofort bereitgestellt werden kann. Die Plattform, aufgebaut auf großen Sprachmodellen (LLM) und Vision- Sprachmodellen (VLM), soll den traditionellen OCR-Markt verändern, indem der Bedarf an einer erneuten Modellanpassung für dokumenttypspezifische Modelle entfällt.
Im Gegensatz zu herkömmlichen OCR-Systemen, die Wochen bis Monate für das Retraining neuer Dokumenttypen benötigen, ermöglicht Agentic OCR Nutzern, Extraktionsfelder zu definieren – wie Name, Vertragsdatum und Betrag – und die KI erkennt, klassifiziert und extrahiert die Informationen automatisch. Nutzer können Beispieldokumente hochladen, um Klassifizierungs- und Extraktionsvorlagen automatisch zu generieren; eine Bereitstellung am selben Tag erfordert keinen Code und keine Trainingsdaten. In Validierungstests über 20 Dokumenttypen hinweg erreichte die Plattform 98% Genauigkeit bei der Dokumentklassifizierung und über 95% Genauigkeit bei der Informationsextraktion.
Die Plattform integriert aktives Lernen und verbessert die Leistung, während sie genutzt wird. Wenn Nutzer Extraktionsfehler korrigieren, übernimmt das System die Korrekturen automatisch und steigert die Genauigkeit kontinuierlich, ohne zusätzliches Training – was zu 5–15% Leistungsverbesserungen führt. Agile Soda hat die Leistungsvalidierung mit großen inländischen Banken, Versicherungsunternehmen und Kartenherausgebern abgeschlossen und rollt derzeit die Bereitstellungen aus. Zukünftige Pläne umfassen die Erweiterung um RAG-basierte Chatbots, die Analyse von Dokumentvergleichen und Workflow-Automatisierung als umfassende Plattform für Dokumentenagenten.