Automation 360

Auswählen einer OCR-Engine

Als PDF herunterladen

Inhalte

Auswählen einer OCR-Engine

Als PDF herunterladen

Zuletzt aktualisiert2025/04/23

Sie können OCR-Engines auswählen, die basierend auf Ihren Dokumenttypen Ihren Anforderungen an die Datenextraktion am besten entsprechen. Ein Neustart von IQ Bot-Diensten ist für eine Engine-Änderung nicht erforderlich.

Während der Installation von IQ Bot legt das System die neueste Version von Tesseract Optische Zeichenerkennung als Standardengine für OCR fest. Dies ist auch die Standardeinstellung für das Produkt. Sie können die OCR-Engine jedoch manuell in der Datei Settings.txt einstellen, die dann zur Standardengine wird. Ähnlich wie in früheren Versionen von IQ Bot können Sie in die Datei Settings.txt weiterhin manuell den OCR-Engine-Namen eintragen, den Sie als Standard festlegen möchten.

Bei der Erstellung einer Lerninstanz können Sie eine OCR-Engine aus dem Dropdown-Menü Optische Zeichenerkennung auswählen. Einzelheiten finden Sie unter Lerninstanz erstellen.

Anmerkung:

Durch die Auswahl einer OCR-Engine in der Nutzeroberfläche werden die Einstellungen in der Datei Settings.txt überschrieben.
Sie haben immer die neueste Version der von OCR Automation 360 IQ Bot unterstützten Cloud-Engines, können aber keine bestimmte OCR-Version auswählen.

In der folgenden Tabelle werden die verschiedenen OCR-Engines, die in IQ Bot unterstützt werden, und die entsprechenden Optionen aufgeführt:

Tabelle 1. Liste der OCR-Engines und ihrer Spezifikationen
Qualifizierer	OCR-Version:	Unterstützte Installation	Handschriftlich	Unterstützte Sprachen	Dokumentqualität	Dokumenttyp
Tesseract OCR	4	Cloud und Lokal	n. v.	English Deutsch Spanisch Italienisch Französisch	Keine Geräusche Kein dunkler Hintergrund Keine Stempel/Wasserzeichen 200+ dpi	Rechnungen, Bestellungen usw. Halbstrukturierte Formate
ABBYY FineReader Engine	12,3 oder 12,4	Cloud und Lokal	n. v.	English Alle lateinisch+ Chinesisch Japanisch Koreanisch	Weniger Geräusche Dunkler Hintergrund mit weißer Schrift Mit Stempeln/Wasserzeichen 96+ dpi	Rechnungen, Bestellungen usw. Halbstrukturierte Formate Hypothekenformulare, Steuerformulare Unstrukturierte Formate
Microsoft Azure Computer Vision OCR Engine	2,0 oder 3,2	Cloud und Lokal	Nur Englisch	English Alle lateinisch+ Chinesisch Japanisch Koreanisch	Weniger Geräusche Dunkler Hintergrund Mit Stempeln/Wasserzeichen 96+ dpi	Rechnungen, Bestellungen usw. Halbstrukturierte Formate Pässe, Führerschein etc. KYC-Dokumente
Google Vision API	Die Version wird automatisch an die aktuelle Version angepasst	Cloud und Lokal	n. v.	English Alle lateinisch+ Asiatisch	Weniger Geräusche Dunkler Hintergrund Mit Stempeln/Wasserzeichen 96+ dpi	Rechnungen, Bestellungen usw. Halbstrukturierte Formate Hypothekenformulare, Steuerformulare Unstrukturierte Formate

Prozedur

Wählen Sie auf der Seite Neue Lerninstanz erstellen die Domäne und Sprache der Dokumente aus.
Auf der Seite mit der Liste Meine Lerninstanz ist die neue Spalte OCR-Engine verfügbar, in der die OCR-Engine angezeigt wird, die zum Erstellen jeder Lerninstanz verwendet wird. Diese Informationen sind für den Nutzer nützlich, wenn er über die Verarbeitung von Dokumenten entscheidet.
Die Bereiche Zu extrahierende Felder und Erweiterte Einstellungen werden angezeigt, wenn Sie die Domäne auswählen.
Jede Domäne ist mit einer vordefinierten Liste von unterstützten Primärsprachen verfügbar. Die Sprachauswahl ist aktiviert und kann in der Dropdown-Liste Primärsprache der Dokumente basierend auf den unterstützten Sprachen für eine bestimmte Domäne ausgewählt werden.
Anmerkung: Wenn Sie eine Sprache aus der Dropdown-Liste Primärsprache der Dokumente auswählen und dann eine Engine auswählen, die diese Sprache nicht unterstützt, zeigt das System eine Fehlermeldung in der Dropdown-Liste Optische Zeichenerkennung an.

Klicken Sie auf Erweiterte Einstellungen > Optische Zeichenerkennung, um die Dropdown-Liste der OCR-Engine-Optionen anzuzeigen.

Wenn die OCR-Engine-Auswahl ungültig ist, ist die Option Instanz erstellen und analysieren ausgegraut.

Anmerkung: IQ Bot installiert automatisch alle OCR-Engines mit Ausnahme von ABBYY FineReader Engine während des Installationsvorgangs.

Wichtig: Sie können nur den ausgewählten OCR-Motor in Automation 360 IQ Bot Lokal konfigurieren. OCR-Einstellungen in der Automation 360 IQ Bot Cloud können nicht bearbeitet werden, da sie außer für ABBYY FineReader Engine nicht zugänglich sind. Sie können die Konfigurationseinstellungen für ABBYY FineReader Engine mit der appConfigurations-REST API bearbeiten.

Sie können aus den folgenden Optionen wählen:

Option	Beschreibung
Tesseract OCR 4	Dies ist die Standardengine, sofern sie nicht in der Datei Settings.txt geändert wurde.
ABBYY FineReader Engine	Um zu überprüfen, ob ABBYY FineReader Engine auf Ihrem Computer installiert und zur Verwendung verfügbar ist, überprüfen Sie die Datei Settings.txt, den Plug-in-Ordner von OCR für die SDK-Dateien und die Dropdown-Liste Optische Zeichenerkennung. Anmerkung: Wird auch im IQ Bot [Lokales Gerät]-Paket und IQ Bot Extraction-Paket unterstützt. Verwenden der ABBYY FineReader Engine OCR-Engine in IQ Bot
Microsoft Azure Computer Vision OCR Engine	IQ Bot unterstützt alle von dieser OCR-Engine unterstützten Sprachen. Verwenden Sie Microsoft Azure Computer Vision OCR Engine.
Google Vision API	IQ Bot unterstützt Google Vision API als OCR-Engine und unterstützt alle von dieser Engine unterstützten Sprachen. Verwenden der Google Vision API-OCR-Engine
Meine PDF-Dokumente enthalten keine Bilder.	Alle hochgeladenen PDF-Dokumente werden standardmäßig mit der PDFBox OCR verarbeitet, unabhängig von der angegebenen oder ausgewählten OCR-Engine. Wenn Sie Nicht-PDF-Dokumente oder PDF-Dokumente hochladen, die Bilder enthalten, deaktivieren Sie das Kontrollkästchen Meine PDF-Dokumente enthalten keine Bilder, um sicherzustellen, dass die von Ihnen angegebene oder ausgewählte OCR-Engine zur Verarbeitung der Dokumente verwendet wird. Das Kontrollkästchen Meine PDF-Dokumente enthalten keine Bilder ist standardmäßig aktiviert. Informationen zum Deaktivieren dieser Funktion finden Sie unter Deaktivieren der PDFBox-Option.

Tipp: Wenn IQ Bot keine Daten aus qualitativ minderwertigen oder handschriftlichen Dokumenten extrahieren kann, beheben Sie das Problem:

IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

Anmerkung: Verwenden Sie die folgenden Dateien, um die OCR-Einstellungen zu ändern:

AbbyyImagePreProcessingSettings.json
LangugeCodeToAbbyyLanguageCode.json
Azure3OCREngineSettings.json
GoogleOCREngineSettings.json
AzureOCREngineSettings.json

How to change OCR Settings in IQ Bot (A-People login required)

Zurück

Kein vorheriges Thema

Weiter

Kein nächstes Thema

Zurück

Kein vorheriges Thema

Weiter

Kein nächstes Thema