Verwenden der Google Vision API-OCR-Engine

Verwenden Sie die Google Vision API OCR-Engine mit IQ Bot, um die Genauigkeit der Ergebnisse der optischen Zeichenerkennung (OCR) für Trainingsdokumente in asiatischen Sprachen, insbesondere in Japanisch und Koreanisch, zu verbessern. Die Google Vision API OCR-Engine in IQ Bot unterstützt alle von der Engine unterstützten Sprachen.

Vorbereitungen

Überprüfen Sie, ob der Standardport 443 verfügbar ist, um die Kommunikation für den API-Endpunkt über TCP zu aktivieren.

Anmerkung: Eine Liste der zulässigen Service-URLs für die Verwendung von Google Vision API finden Sie unten im Beispielabschnitt.
Google Vision API-Dateien werden während der Installation von IQ Bot automatisch auf Ihrem Computer installiert, werden als integriertes Plug-in mit einer Installation in einem Schritt bereitgestellt und stehen allen Nutzern zur Verfügung:
  • Es handelt sich um eine OCR-Cloud-Engine.
  • Google Vision API unterstützt keine Dokumente mit mehr als einer Sprache. Stellen Sie vor der Verwendung dieser Funktion sicher, dass Sie hauptsächlich nur japanischen oder koreanischen Text extrahieren möchten.
  • Sprachen, die statt von links nach rechts von rechts nach links geschrieben werden, werden zur Extraktion in IQ Bot nicht unterstützt. Dies sind z. B. die Sprachen Arabisch, Aramäisch, Aserbaidschanisch, Divehi, Fulbe, Hebräisch, Kurdisch, N'Ko, Persisch, Rohingya, Syrisch und Urdu.

    Vor dieser Version unterstützte die Engine in erster Linie die Datenextraktion nur für japanischen und koreanischen Text.

    Unterstützte Sprachen in Automation 360 IQ Bot

  • Daten werden nicht in Google Cloud gespeichert und sofort gelöscht.

    Weitere Informationen zum Datenschutz für die Datenaufbewahrung finden Sie unter Google Data Usage.

IQ Bot stellt Ihnen die Lizenz zur Verwendung der Google Vision API OCR-Engine zur Verfügung. Sie können auch Ihren eigenen Lizenzschlüssel verwenden.

Verwenden Ihres eigenen Lizenzschlüssels für die Google Vision API-OCR-Engine

Anmerkung: Aktualisierungen von Google Vision API wie OCR-Engine-Verbesserungen, -Erweiterungen und -Fehlerbehebungen können die Extraktion von Inhalten beeinträchtigen, wenn Sie diese OCR-Engine in IQ Bot verwenden. Wir empfehlen Ihnen daher, sich regelmäßig in den Google Vision API-Versionshinweisen über die neuesten Updates zu informieren.

Einzelheiten finden Sie unter Mögliche Auswirkungen des Google Vision API-OCR-Updates.

Sie haben folgende Möglichkeiten, diese OCR-Engine zu verwenden:
Optionen Beschreibung
Option 1: Google Vision API als Standardengine festlegen Die Datei Settings.txt konfigurieren.
Einschränkung: Die Konfiguration der Datei settings.txt ist für Automation 360 IQ Bot Cloud nicht anwendbar.
Option 2: Die Google Vision API-Engine direkt über die Nutzeroberfläche auswählen, wenn Sie eine Lerninstanz erstellen Auswählen einer OCR-Engine

Prozedur

Konfigurieren Sie die Datei Settings.txt wie folgt, um Google Vision API als OCR-Standardengine festzulegen:

Einschränkung: Die Konfiguration der Datei settings.txt ist für Automation 360 IQ Bot Cloud nicht anwendbar.

  1. Führen Sie das IQ Bot-Installationsprogramm aus.
  2. Optional: Legen Sie Google Vision API als Standard-OCR für neue Lerninstanzen fest.
    Navigieren Sie zu ..\Automation 360 IQ Bot\Configurations\Settings.txt und ändern Sie den folgenden Wert: OCREngine=GoogleVisionAPI.
    Dadurch wird die Google Vision API OCR-Engine als Standardengine für Ihre Umgebung festgelegt.
  3. Die Datei GoogleOCREngineSettings.json wird im Ordner ..\Automation 360 IQ Bot\Configurations mit den folgenden Standardwerten generiert:
    Verwenden Sie Folgendes mit Google Vision API:
    {
      "ADCJson": null,
      "EngineType": 2,
      "EnableFieldMerging": true,
      "EnableFieldRegions": true,
      "DebuggingFolder": "C:\\Users\\Public\\Documents\\Automation 360 IQBot Platform\\Logs\\Engine\\Google"
     }
  4. Aktualisieren Sie bei Dokumenten in japanischer und koreanischer Sprache das Feld: "EnableCustomParse": true.
    Anmerkung: Nach der Änderung ist kein Neustart des Diensts erforderlich.
Liste der für Google Vision API verwendeten Service-URLs (optional)
Verwenden Sie bei Bedarf die folgenden zulässigen URLs:
Anmerkung: Alle URLs verweisen auf eine globale Serviceregion in den USA.
  • API-URL: https://vision.googleapis.com/
  • Auth-URL: https://accounts.google.com/o/oauth2/auth
  • Token-URL: https://oauth2.googleapis.com/token
  • URL des Auth-Anbieters: https://www.googleapis.com/oauth2/v1/certs
  • Client-Auth-URL: https://www.googleapis.com/robot/v1/metadata/x509

Nächste Maßnahme

  1. Erstellen Sie eine neue Lerninstanz mit dem asiatischen Sprachdokument, das Sie trainieren möchten.
  2. Trainieren Sie das Dokument und stellen Sie Ihre Lerninstanz auf Produktion.
  3. Laden Sie asiatische Sprachdateien hoch und führen Sie den Bot aus.
  4. Laden Sie die Ergebnisse der Extraktion herunter und prüfen Sie deren Genauigkeit.