Mögliche Auswirkungen des Google Vision API-OCR-Updates

Die Google Vision API-OCR ist Cloud-basiert und wird in der Regel entsprechend dem Veröffentlichungszyklus von Google auf eine neuere Version aktualisiert. Als Ergebnis dieses Upgrades können Auswirkungen auf die Dokumentenextraktionsverarbeitung und die Extraktionsergebnisse in IQ Bot zu beobachten sein.

Auswirkungen auf die Klassifizierung von Dokumenten in IQ Bot nach der Aktualisierung von Google Vision API-OCR

Die Klassifizierung der Dokumente erfolgt auf der Grundlage des OCR-Ergebnisses, insbesondere der Reihenfolge, in der die Felder erkannt werden. Wenn also der Inhalt der OCR-Ergebnisse variiert, können die Klassifizierungsergebnisse eines ähnlichen, zuvor verarbeiteten Dokuments bei der Dokumentenextraktion sichtbare Unterschiede aufweisen.

Die automatische Aktualisierung wirkt sich in zweierlei Hinsicht auf den Klassifizierungsdienst aus:
  • Den Dokumenten werden unterschiedlichen Gruppen zugeordnet: Die Dokumente werden nach der Verarbeitung anderen Gruppen zugewiesen als ursprünglich. Infolgedessen können einige Datenextraktionen fehlschlagen, die zuvor erfolgreich waren.
  • Neue Gruppen werden erstellt: Die Dokumente, die zuvor mit einer Gruppe bearbeitet wurden, können nun dazu führen, dass eine neue Gruppe erstellt wird.

Auswirkungen auf die Datenextraktion in IQ Bot nach Aktualisierung der Google Vision API-OCR

Eine Änderung der OCR-Ausgabe kann zu folgenden Unterschieden bei der Datenextraktion aus einem ähnlichen Dokumenttyp führen:

  • Verbesserung der Zeichenerkennung und die damit verbundenen Auswirkungen: Infolge der verbesserten Erkennung von Schlüsselwörtern liefern bisher nicht erkannte Werte aus einem Dokument nun bessere Extraktionsergebnisse.
    Anmerkung: Wenn eine Verarbeitungslogik geschrieben wird, um das Fehlen der erkannten Zeichen zu beheben, kann dies zu Problemen bei der Verarbeitung des Dokuments führen.
  • Verschlechterung der Zeichenerkennung und ihre Auswirkungen: Die Validierung kann aufgrund einer Verschlechterung der OCR-Ausgabe fehlschlagen und das Dokument wird an den Validator weitergeleitet. In einem Szenario, in dem es keine Validierungseinrichtung gibt, kann es zu einer Verschlechterung der extrahierten Datenausgabe kommen.

Optionen zur Milderung

Wenn Sie auf eines der oben genannten Probleme stoßen, haben Sie folgende Möglichkeiten:

  • Umlernen bestehender Lerninstanzen zur Behebung von Problemen bei der Dokumentenklassifizierung.
  • Schreiben einer Verarbeitungslogik mit Python, um die Extraktionsergebnisse zu reduzieren.
  • Evaluieren der Erstellung von Lerninstanzen mit verschiedenen OCR-Anbietern, die von IQ Bot unterstützt werden.
  • Erstellen Sie ein Support-Ticket mit Automation Anywhere.