OCR-Anwendung

OCR-Anwendung: Optimierung der Texterkennung – Freeform und OCR-Training

OCR-Modul-Optimierung-TexterkennungFür eine optimale OCR (Optical Character Recognition) -Texterkennung kann das Freeform-Modul zusätzlich um ein Trainingsmodul zur kontrollierten selbstlernenden Texterkennung ergänzt werden. Diese Module sind optionale Bestandteile vom Posteingangs-Verarbeitungsserver biz²ScanServer von inPuncto.

Die OCR-Anwendung wird mit einem OCR-Projekt (dort sind die kundenspezifischen Erkennungsthematiken für die Freeform eingestellt) gestartet. In der OCR-Anwendung sollen die verschiedenen Werte (z.B. Rechnungsdatum, IBAN, Bestellnummer, Lieferscheinnummer etc.) aus einem Dokument mittels des Moduls Freeform-Texterkennung herausgelesen werden. Geschieht dies nicht oder nur teilweise, dann kann das Dokument entweder automatisch oder manuell zum OCR-Training bzw. Trainingsarbeitsplatz weitergeleitet werden.

Das Modul OCR-Training ist ein optionaler Bestandteil des Posteingangs-Verarbeitungsservers biz²ScanServer, wo anhand verschiedener Indexfelder die Positionen verschiedener Werte trainiert werden können. Die im OCR-Training ermittelten Positionen der Indexfelder für den jeweiligen Dokumententyp werden dann in einer Datenbank abgespeichert, sodass bei den nächsten Dokumenten des gleichen Typs diese Informationen zur Verfügung stehen und die OCR-Anwendung weiß, wo bei diesem Dokumenttyp nach den Werten zu suchen ist.

Kurze Darstellung des Prozesses „OCR-Training“ von Dokumenten (Rechnungen, Lieferscheine etc.):

Wenn Dokumente trainiert werden sollen, erfolgt dies an einem „Trainingsarbeitsplatz“.

  • Beim OCR-Training eines Dokuments müssen nicht immer alle Felder trainiert werden; bei manchen Dokumenttypen sind u.U. nicht alle Indexfelder vorhanden.
  • Während des Trainings geben Sie mit Hilfe der Maus an, wo sich jedes zu trainierende Feld auf dem Dokument befindet.
  • Da im OCR-Training zu jedem Dokument die gesamten Erkennungsergebnisse gespeichert wurden, können Sie einfach durch Anklicken mit der Maus angeben, wo die zu einem Feld relevanten Daten stehen.

Es gibt zwei Möglichkeiten Dokumente zum OCR-Training zu senden: Die OCR-Anwendung enthält ein Modul, das feststellt, ob ein Dokument trainiert werden sollte und der Validation-Benutzer hat die Möglichkeit, Dokumente explizit zum Training zu schicken, wenn er entdeckt, dass die Erkennungsergebnisse nicht befriedigend sind.

Verschiedene Optimierungsstrategien: Ein solches OCR-Training kann entweder im Voraus (vor dem Produktionsbetrieb) absolviert werden oder auch während des Produktionsbetriebs nachtrainiert werden.

Damit aus beiden Modulen (Freeform-Texterkennung und OCR-Trainingsmodul) das beste Ergebnis ermittelt werden kann, ist der OCR-Anwendung ein „Voter“ nachgeschaltet, der die Ergebnisse aus beiden Modulen miteinander vergleicht und entsprechend gewichtet. Da sich das endgültige Ergebnis dann aus beiden Modulen zusammensetzt ist eine höhere und bessere Texterkennungsquote gewährleistet als nur mit dem Modul Freeform-Texterkennung.

VIDEO:

In diesem Video zeigen wir Ihnen anhand einer Demorechnung, wie mit dem OCR-Trainingsarbeitsplatz die OCR-Erkennung trainiert und optimiert wird:

Ihr Ansprechpartner

Ihr inPuncto Team

E-Mail: kontakt[at]inpuncto.com
Telefon: +49 (0) 711 66 188 500

Geprüft und zertifiziert!

OCR-Anwendung mit Freeform Texterkennung mit geprüfter Software von inPuncto

Geprüfte Revisionssicherheit für Ihre dokumentenbasierte Prozesse mit inPuncto ECM-Software

Weitere SAP-Add-On Produkte
für Ihr Dokumentenmanagement

Weitere SAP-Add-On Produkte für Ihr Dokumentenmanagement