Auswählen einer OCR-Engine

Sie können OCR-Engines auswählen, die basierend auf Ihren Dokumenttypen Ihren Anforderungen an die Datenextraktion am besten entsprechen. Ein Neustart von IQ Bot-Diensten ist für eine Engine-Änderung nicht erforderlich.

Während der Installation von IQ Bot legt das System die neueste Version von Tesseract Optische Zeichenerkennung als Standardengine für OCR fest. Dies ist auch die Standardeinstellung für das Produkt. Sie können die OCR-Engine jedoch manuell in der Datei Settings.txt einstellen, die dann zur Standardengine wird. Ähnlich wie in früheren Versionen von IQ Bot können Sie in die Datei Settings.txt weiterhin manuell den OCR-Engine-Namen eintragen, den Sie als Standard festlegen möchten.

Bei der Erstellung einer Lerninstanz können Sie eine OCR-Engine aus dem Dropdown-Menü Optische Zeichenerkennung auswählen. Einzelheiten finden Sie unter Lerninstanz erstellen.
Anmerkung:
  • Durch die Auswahl einer OCR-Engine in der Nutzeroberfläche werden die Einstellungen in der Datei Settings.txt überschrieben.
  • Da Tegaki API OCR eine separate Einrichtung von Lokal erfordert, die in Automation 360 IQ Bot Cloud nicht unterstützt wird, sind alle anderen OCR-Engines außer Tegaki API OCR verfügbar.

    Sie haben immer die neueste Version der von Automation 360 IQ Bot Cloud unterstützten OCR-Engines, können aber keine bestimmte OCR-Version auswählen.

In der folgenden Tabelle werden die verschiedenen OCR-Engines, die in IQ Bot unterstützt werden, und die entsprechenden Optionen aufgeführt:

Tabelle 1. Liste der OCR-Engines und ihrer Spezifikationen
Qualifizierer OCR-Version: Unterstützte Installation Handschriftlich Unterstützte Sprachen Dokumentqualität Dokumenttyp
Tesseract OCR 4 Cloud und Lokal n. v.

English

Deutsch

Spanisch

Italienisch

Französisch

Keine Geräusche

Kein dunkler Hintergrund

Keine Stempel/Wasserzeichen

200+ dpi

Rechnungen, Bestellungen usw.

Halbstrukturierte Formate

ABBYY FineReader Engine 12,3 oder 12,4 Cloud und Lokal n. v.

English

Alle lateinisch+

Chinesisch

Japanisch

Koreanisch

Weniger Geräusche

Dunkler Hintergrund mit weißer Schrift

Mit Stempeln/Wasserzeichen

96+ dpi

Rechnungen, Bestellungen usw.

Halbstrukturierte Formate

Hypothekenformulare, Steuerformulare

Unstrukturierte Formate

Microsoft Azure Computer Vision OCR Engine 2,0 oder 3,2 Cloud und Lokal Nur Englisch

English

Alle lateinisch+

Chinesisch

Japanisch

Koreanisch

Weniger Geräusche

Dunkler Hintergrund

Mit Stempeln/Wasserzeichen

96+ dpi

Rechnungen, Bestellungen usw.

Halbstrukturierte Formate

Pässe, Führerschein etc.

KYC-Dokumente

Google Vision API Die Version wird automatisch an die aktuelle Version angepasst Cloud und Lokal n. v.

English

Alle lateinisch+

Asiatisch

Weniger Geräusche

Dunkler Hintergrund

Mit Stempeln/Wasserzeichen

96+ dpi

Rechnungen, Bestellungen usw.

Halbstrukturierte Formate

Hypothekenformulare, Steuerformulare

Unstrukturierte Formate

Prozedur

  1. Wählen Sie auf der Seite Neue Lerninstanz erstellen die Domäne und Sprache der Dokumente aus.
    Auf der Seite mit der Liste Meine Lerninstanz ist die neue Spalte OCR-Engine verfügbar, in der die OCR-Engine angezeigt wird, die zum Erstellen jeder Lerninstanz verwendet wird. Diese Informationen sind für den Nutzer nützlich, wenn er über die Verarbeitung von Dokumenten entscheidet.
  2. Die Bereiche Zu extrahierende Felder und Erweiterte Einstellungen werden angezeigt, wenn Sie die Domäne auswählen.
    Jede Domäne ist mit einer vordefinierten Liste von unterstützten Primärsprachen verfügbar. Die Sprachauswahl ist aktiviert und kann in der Dropdown-Liste Primärsprache der Dokumente basierend auf den unterstützten Sprachen für eine bestimmte Domäne ausgewählt werden.
    Anmerkung: Wenn Sie eine Sprache aus der Dropdown-Liste Primärsprache der Dokumente auswählen und dann eine Engine auswählen, die diese Sprache nicht unterstützt, zeigt das System eine Fehlermeldung in der Dropdown-Liste Optische Zeichenerkennung an.
  3. Klicken Sie auf Erweiterte Einstellungen > Optische Zeichenerkennung, um die Dropdown-Liste der OCR-Engine-Optionen anzuzeigen.

    Wenn die OCR-Engine-Auswahl ungültig ist, ist die Option Instanz erstellen und analysieren ausgegraut.

    Anmerkung: IQ Bot installiert automatisch alle OCR-Engines mit Ausnahme von ABBYY FineReader Engine während des Installationsvorgangs.
    Wichtig: Sie können die ausgewählte OCR-Engine nur in Automation 360 IQ Bot Lokal konfigurieren. OCR-Einstellungen in Automation 360 IQ Bot Cloud können nicht bearbeitet werden, da nur ABBYY FineReader Engine darauf zugreifen kann. Sie können die Konfigurationseinstellungen für ABBYY FineReader Engine mit der REST API appConfigurations bearbeiten.

    Sie können aus den folgenden Optionen wählen:

    OptionBeschreibung
    Tesseract OCR 4 Dies ist die Standardengine, sofern sie nicht in der Datei Settings.txt geändert wurde.
    ABBYY FineReader Engine

    Um zu überprüfen, ob ABBYY FineReader Engine auf Ihrem Computer installiert und zur Verwendung verfügbar ist, überprüfen Sie die Datei Settings.txt, den Plug-in-Ordner von OCR für die SDK-Dateien und die Dropdown-Liste Optische Zeichenerkennung.

    Anmerkung: Wird auch im IQ Bot [Lokales Gerät]-Paket und IQ Bot Extraction-Paket unterstützt.

    Verwenden der ABBYY FineReader Engine OCR-Engine in IQ Bot

    Microsoft Azure Computer Vision OCR Engine IQ Bot unterstützt alle von dieser OCR-Engine unterstützten Sprachen.

    Verwenden Sie Microsoft Azure Computer Vision OCR Engine.

    Google Vision API IQ Bot unterstützt Google Vision API als OCR-Engine und unterstützt alle von dieser Engine unterstützten Sprachen.

    Verwenden der Google Vision API-OCR-Engine

    Meine PDF-Dokumente enthalten keine Bilder.

    Alle hochgeladenen PDF-Dokumente werden standardmäßig mit der PDFBox OCR verarbeitet, unabhängig von der angegebenen oder ausgewählten OCR-Engine.

    Wenn Sie Nicht-PDF-Dokumente oder PDF-Dokumente hochladen, die Bilder enthalten, deaktivieren Sie das Kontrollkästchen Meine PDF-Dokumente enthalten keine Bilder, um sicherzustellen, dass die von Ihnen angegebene oder ausgewählte OCR-Engine zur Verarbeitung der Dokumente verwendet wird.

    Das Kontrollkästchen Meine PDF-Dokumente enthalten keine Bilder ist standardmäßig aktiviert. Informationen zum Deaktivieren dieser Funktion finden Sie unter Deaktivieren der PDFBox-Option.
    Tipp: Wenn IQ Bot keine Daten aus qualitativ minderwertigen oder handschriftlichen Dokumenten extrahieren kann, beheben Sie das Problem:

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

    Anmerkung: Verwenden Sie die folgenden Dateien, um die OCR-Einstellungen zu ändern:
    • AbbyyImagePreProcessingSettings.json
    • LangugeCodeToAbbyyLanguageCode.json
    • Azure3OCREngineSettings.json
    • GoogleOCREngineSettings.json
    • AzureOCREngineSettings.json
    How to change OCR Settings in IQ Bot (A-People login required)