Verwenden von Validierungsmustern/-listen zum Kennzeichnen von Abweichungen in extrahierten Daten

Mithilfe von Validierungsmustern/-listen können Sie Abweichungen in extrahierten Daten kennzeichnen und somit verhindern, dass falsche Daten verarbeitet werden.

Wenn explizit ein Muster für ein Datums-/Zahlenformat angegeben wurde, wird das Datum/die Zahl bis zu einem gewissen Grad automatisch korrigiert.

Vgl. die folgenden Beispiele:

Tabelle 1. Beispiel für ein Datumsformatmuster
Falsche OCR-Daten Muster Autokorrektur
15 10-2015 dd-mm-yyyy 15-10-2015
Tabelle 2. Beispiel für ein Zahlenformatmuster
Falsche OCR-Daten Muster Autokorrektur
123 4567 9999999 1234567