Auswählen einer OCR-Engine
- Zuletzt aktualisiert2024/03/14
Auswählen einer OCR-Engine
Sie können OCR-Engines auswählen, die basierend auf Ihren Dokumenttypen Ihren Anforderungen an die Datenextraktion am besten entsprechen. Ein Neustart von IQ Bot-Diensten ist für eine Engine-Änderung nicht erforderlich.
Während der Installation von IQ Bot legt das System die neueste Version von Tesseract Optische Zeichenerkennung als Standardengine für OCR fest. Dies ist auch die Standardeinstellung für das Produkt. Sie können die OCR-Engine jedoch manuell in der Datei Settings.txt einstellen, die dann zur Standardengine wird. Ähnlich wie in früheren Versionen von IQ Bot können Sie in die Datei Settings.txt weiterhin manuell den OCR-Engine-Namen eintragen, den Sie als Standard festlegen möchten.
- Durch die Auswahl einer OCR-Engine in der Nutzeroberfläche werden die Einstellungen in der Datei Settings.txt überschrieben.
- Da Tegaki API OCR eine separate Einrichtung von Lokal erfordert, die in Automation 360 IQ Bot Cloud nicht unterstützt wird, sind alle anderen OCR-Engines außer Tegaki API OCR verfügbar.
Sie haben immer die neueste Version der von Automation 360 IQ Bot Cloud unterstützten OCR-Engines, können aber keine bestimmte OCR-Version auswählen.
In der folgenden Tabelle werden die verschiedenen OCR-Engines, die in IQ Bot unterstützt werden, und die entsprechenden Optionen aufgeführt:
Qualifizierer | OCR-Version: | Unterstützte Installation | Handschriftlich | Unterstützte Sprachen | Dokumentqualität | Dokumenttyp |
---|---|---|---|---|---|---|
Tesseract OCR | 4 | Cloud und Lokal | n. v. |
English Deutsch Spanisch Italienisch Französisch |
Keine Geräusche Kein dunkler Hintergrund Keine Stempel/Wasserzeichen 200+ dpi |
Rechnungen, Bestellungen usw. Halbstrukturierte Formate |
ABBYY FineReader Engine | 12,3 oder 12,4 | Cloud und Lokal | n. v. |
English Alle lateinisch+ Chinesisch Japanisch Koreanisch |
Weniger Geräusche Dunkler Hintergrund mit weißer Schrift Mit Stempeln/Wasserzeichen 96+ dpi |
Rechnungen, Bestellungen usw. Halbstrukturierte Formate Hypothekenformulare, Steuerformulare Unstrukturierte Formate |
Microsoft Azure Computer Vision OCR Engine | 2,0 oder 3,2 | Cloud und Lokal | Nur Englisch |
English Alle lateinisch+ Chinesisch Japanisch Koreanisch |
Weniger Geräusche Dunkler Hintergrund Mit Stempeln/Wasserzeichen 96+ dpi |
Rechnungen, Bestellungen usw. Halbstrukturierte Formate Pässe, Führerschein etc. KYC-Dokumente |
Google Vision API | Die Version wird automatisch an die aktuelle Version angepasst | Cloud und Lokal | n. v. |
English Alle lateinisch+ Asiatisch |
Weniger Geräusche Dunkler Hintergrund Mit Stempeln/Wasserzeichen 96+ dpi |
Rechnungen, Bestellungen usw. Halbstrukturierte Formate Hypothekenformulare, Steuerformulare Unstrukturierte Formate |