Richtlinien für das Extrahieren von Daten aus handschriftlichen Dokumenten
- Zuletzt aktualisiert2025/01/20
Wenn Sie Daten aus handschriftlichen Dokumenten extrahieren, sollten Sie unbedingt beachten, dass diese Dokumente in der Regel eine geringere Datenextraktionsgenauigkeit aufweisen als getippte oder gedruckte Dokumente.
Die geringere Genauigkeit der Datenextraktion ist in der Regel auf die folgenden Gründe zurückzuführen:
- Inkonsistente Zeichenformen und -größen
- Variabler Abstand zwischen Wörtern und Buchstaben
- Überlappende oder verbundene Zeichen
- Verwendung unterschiedlicher Tinten- und Papierarten
- Verwendung von Abkürzungen oder Umgangssprache
- Verschmierungen und Korrekturen
- Textplatzierung, die nicht der Standardformatierung folgt
Vor dem Extrahieren von Daten aus handschriftlichen Dokumenten vergewissern Sie sich, dass Sie die folgenden Richtlinien einhalten:
- Verwenden Sie Google Vision OCR oder Standardformulare anstelle von ABBYY OCR.
- Wenn Sie die Option zur Generative KI-gesteuerten Datenextraktion aktiviert haben, müssen Sie visionsgestützte generative KI-Modelle verwenden. Einzelheiten finden Sie unter Vision-gestützte Datenerfassung über generative KI.
- Verwenden Sie beim Scannen und Speichern von Dokumenten möglichst die folgenden empfohlenen Einstellungen:
- Verwenden Sie zum Scannen von Dokumenten die beste DPI (z. B. 300 DPI).
- Scannen Sie Dokumente in Graustufen- oder Farbeinstellungen.
- Vermeiden Sie beim Speichern von Dokumenten eine aggressive Komprimierung.