Verwenden der Google Vision API-OCR-Engine
- Zuletzt aktualisiert2021/09/21
Verwenden der Google Vision API-OCR-Engine
Verwenden Sie die Google Vision API OCR-Engine mit IQ Bot, um die Genauigkeit der Ergebnisse der optischen Zeichenerkennung (OCR) für Trainingsdokumente in asiatischen Sprachen, insbesondere in Japanisch und Koreanisch, zu verbessern. Die Google Vision API OCR-Engine in IQ Bot unterstützt alle von der Engine unterstützten Sprachen.
Vorbereitungen
Überprüfen Sie, ob der Standardport 443 verfügbar ist, um die Kommunikation für den API-Endpunkt über TCP zu aktivieren.
- Es handelt sich um eine OCR-Cloud-Engine.
- Google Vision API unterstützt keine Dokumente mit mehr als einer Sprache. Stellen Sie vor der Verwendung dieser Funktion sicher, dass Sie hauptsächlich nur japanischen oder koreanischen Text extrahieren möchten.
- Sprachen, die statt von links nach rechts von rechts nach links geschrieben werden, werden zur Extraktion in IQ Bot nicht unterstützt. Dies sind z. B. die Sprachen Arabisch, Aramäisch, Aserbaidschanisch, Divehi, Fulbe, Hebräisch, Kurdisch, N'Ko, Persisch, Rohingya, Syrisch und Urdu.
Vor dieser Version unterstützte die Engine in erster Linie die Datenextraktion nur für japanischen und koreanischen Text.
- Daten werden nicht in Google Cloud gespeichert und sofort gelöscht.
Weitere Informationen zum Datenschutz für die Datenaufbewahrung finden Sie unter Google Data Usage.
IQ Bot stellt Ihnen die Lizenz zur Verwendung der Google Vision API OCR-Engine zur Verfügung. Sie können auch Ihren eigenen Lizenzschlüssel verwenden.
Verwenden Ihres eigenen Lizenzschlüssels für die Google Vision API-OCR-Engine
Einzelheiten finden Sie unter Mögliche Auswirkungen des Google Vision API-OCR-Updates.
Optionen | Beschreibung |
---|---|
Option 1: Google Vision API als Standardengine festlegen | Die Datei Settings.txt konfigurieren. Einschränkung: Die Konfiguration der Datei settings.txt ist für Automation 360 IQ Bot
Cloud nicht anwendbar.
|
Option 2: Die Google Vision API-Engine direkt über die Nutzeroberfläche auswählen, wenn Sie eine Lerninstanz erstellen | Auswählen einer OCR-Engine |
Prozedur
Konfigurieren Sie die Datei Settings.txt wie folgt, um Google Vision API als OCR-Standardengine festzulegen:
- API-URL: https://vision.googleapis.com/
- Auth-URL: https://accounts.google.com/o/oauth2/auth
- Token-URL: https://oauth2.googleapis.com/token
- URL des Auth-Anbieters: https://www.googleapis.com/oauth2/v1/certs
- Client-Auth-URL: https://www.googleapis.com/robot/v1/metadata/x509
Nächste Maßnahme
- Erstellen Sie eine neue Lerninstanz mit dem asiatischen Sprachdokument, das Sie trainieren möchten.
- Trainieren Sie das Dokument und stellen Sie Ihre Lerninstanz auf Produktion.
- Laden Sie asiatische Sprachdateien hoch und führen Sie den Bot aus.
- Laden Sie die Ergebnisse der Extraktion herunter und prüfen Sie deren Genauigkeit.