Lesen und beachten Sie die Automation Anywhere-Dokumentation

Automation 360

Inhalt schließen

Inhalte

Inhalt öffnen

Auswählen einer OCR-Engine

  • Aktualisiert: 2021/09/09
    • Automation 360 v.x
    • Erkunden
    • RPA Workspace

Auswählen einer OCR-Engine

Sie können in der Nutzeroberfläche verschiedene OCR-Engines auswählen, um festzustellen, welche basierend auf Ihren Dokumenttypen Ihren Anforderungen an die Datenextraktion am besten entspricht. Ein Stopp und Neustart von IQ Bot-Diensten ist für eine Engine-Änderung nicht erforderlich.

Während der Installation von IQ Bot legt das System die neueste Version von Tesseract Optical Character Reader als Standardengine für OCR fest. Dies ist auch die globale Einstellung für das Produkt.

Sie können die OCR-Engine jedoch manuell in der Datei Settings.txt einstellen, die dann zur Standardengine wird. Ähnlich wie in früheren Versionen von IQ Bot können Sie in die Datei Settings.txt weiterhin manuell den OCR-Engine-Namen eintragen, den Sie als Standard festlegen möchten.

Wenn Sie eine veraltete Version der OCR-Engine oder eine nicht unterstützte Engine über die Datei Settings.txt auswählen, zeigt das System eine Fehlermeldung an.

Wenn Sie eine Lerninstanz erstellen, können Sie eine OCR-Engine aus der Dropdown-Liste auswählen, die direkt in der Nutzeroberfläche verfügbar ist.
Anmerkung: Durch die Auswahl einer OCR-Engine in der Nutzeroberfläche werden die Einstellungen in der Datei Settings.txt überschrieben.

Erstellen einer Lerninstanz

Prozedur

  1. Wählen Sie auf der Seite Neue Lerninstanz erstellen die Domäne und Sprache der Dokumente aus.
    Auf der Seite mit der Liste Meine Lerninstanz ist die neue Spalte OCR-Engine verfügbar, in der die OCR-Engine angezeigt wird, die zum Erstellen jeder Lerninstanz verwendet wird. Diese Informationen sind für den Nutzer nützlich, wenn er über die Verarbeitung von Dokumenten entscheidet.
  2. Die Bereiche Zu extrahierende Felder und Erweiterte Einstellungen werden angezeigt, wenn Sie die Domäne auswählen.
    Jede Domäne ist mit einer vordefinierten Liste von unterstützten Primärsprachen verfügbar. Die Sprachauswahl ist aktiviert und kann in der Dropdown-Liste Primärsprache der Dokumente basierend auf den unterstützten Sprachen für eine bestimmte Domäne ausgewählt werden.
    Anmerkung: Wenn Sie eine Sprache aus der Dropdown-Liste Primärsprache der Dokumente auswählen und dann eine Engine auswählen, die diese Sprache nicht unterstützt, zeigt das System eine Fehlermeldung in der Dropdown-Liste Optische Zeichenerkennung an.
  3. Klicken Sie auf Erweiterte Einstellungen > Optische Zeichenerkennung, um die Dropdown-Liste der OCR-Engine-Optionen anzuzeigen.

    Wenn die OCR-Engine-Auswahl ungültig ist, ist die Option Instanz erstellen und analysieren ausgegraut.

    Anmerkung: IQ Bot installiert automatisch alle OCR-Engines mit Ausnahme von ABBYY FineReader Engine während des Installationsvorgangs.
    Wichtig: Sie können die ausgewählte OCR-Engine nur in Automation 360 IQ Bot On-Premises konfigurieren. OCR-Einstellungen in Automation 360 IQ Bot Cloud können nicht bearbeitet werden, da nur ABBYY FineReader Engine darauf zugreifen kann. Sie können die Konfigurationseinstellungen für ABBYY FineReader Engine mit der REST API appConfigurations bearbeiten.

    Sie können aus den folgenden Optionen wählen:

    OptionBeschreibung
    Tesseract OCR4 Dies ist die Standardengine, sofern sie nicht in der Datei Settings.txt geändert wurde.
    ABBYY FineReader Engine

    Um zu überprüfen, ob ABBYY FineReader Engine auf Ihrem Computer installiert und zur Verwendung verfügbar ist, überprüfen Sie die Datei Settings.txt, den Plug-in-Ordner von OCR für die SDK-Dateien und die Dropdown-Liste Optische Zeichenerkennung.

    Anmerkung: Wird auch im IQ Bot [Local Device]-package und IQ Bot Extraction-package unterstützt.

    Verwenden der ABBYY FineReader Engine OCR-Engine in IQ Bot

    Microsoft Azure Computer Vision OCR engine IQ Bot unterstützt alle von dieser OCR-Engine unterstützten Sprachen.

    Verwenden Sie Microsoft Azure Computer Vision OCR engine.

    Google Vision API IQ Bot unterstützt Google Vision API als OCR-Engine und unterstützt alle von dieser Engine unterstützten Sprachen.

    Verwenden der Google Vision API-OCR-Engine

    Tegaki API IQ Bot unterstützt seine OCR-Engine zum Extrahieren von Daten für Dokumente in japanischer und koreanischer Sprache. Sie müssen Ihre private Lizenz herunterladen und verwenden, um die Tegaki API zu nutzen.
    Anmerkung: Die Tegaki API OCR-Engine wird in Automation 360 IQ Bot Cloud nicht unterstützt.

    Verwenden der Tegaki API OCR-Engine

    Meine PDF-Dokumente enthalten keine Bilder.

    Alle hochgeladenen PDF-Dokumente werden standardmäßig mit der PDFBox OCR verarbeitet, unabhängig von der angegebenen oder ausgewählten OCR-Engine.

    Wenn Sie Nicht-PDF-Dokumente oder PDF-Dokumente hochladen, die Bilder enthalten, deaktivieren Sie das Kontrollkästchen Meine PDF-Dokumente enthalten keine Bilder, um sicherzustellen, dass die von Ihnen angegebene oder ausgewählte OCR-Engine zur Verarbeitung der Dokumente verwendet wird.

    Das Kontrollkästchen Meine PDF-Dokumente enthalten keine Bilder ist standardmäßig aktiviert. Informationen zum Deaktivieren dieser Funktion finden Sie unter Deaktivieren der PDFBox-Option.
    Tipp: Wenn IQ Bot keine Daten aus qualitativ minderwertigen oder handschriftlichen Dokumenten extrahieren kann, beheben Sie das Problem:

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

Feedback senden