Unterstützung von Document Automation für Google Custom Document Extractor (CDE)
- Zuletzt aktualisiert2024/10/31
Unterstützung von Document Automation für Google Custom Document Extractor (CDE)
In Document Automation können Sie eine vom Benutzer trainierte Lerninstanz erstellen und mit einem Google Custom Document Extractor-Prozessor (CDE) extrahieren.
Diese neue Funktion kann zum Trainieren eines Modells mit dem Google Custom Document Extractor (CDE) für beliebige Dokumenttypen in 50 Sprachen verwendet werden. Sobald ein Modell bereitgestellt ist, kann die Prozessor-URL in den Extraktionsprozess von Document Automation eingebettet werden.
Um Google CDE verwenden zu können, müssen Sie über Folgendes verfügen:
- ein Google-Abonnement für die Google Document AI-Workbench.
- die Zuweisung der Rolle KI-Dokumentbetrachter für die Erstellung von Prozessoren und Erstellung eines Servicekontos auf dem Google Cloud-Plattform. Siehe Create service accounts und IAM roles for Document AI.
- eine Lizenz für die .
Anmerkung: Wenn Sie mit der vertrauenswürdigen Liste der API-URLs für Google CDE arbeiten, müssen Sie alle APIs dieser Liste auf dem Bot-Agent-Rechner hinzufügen. Dies ist Die Liste der zulässigen APIs für Google CDE:
- Google-Konten
- Google OAuth
- Google-APIs
- Prozessor-Endpunkt (nur der Host, der der vertrauenswürdigen Liste hinzugefügt werden soll)Beispiel:
https://eu-documentai.googleapis.com/v1/projects/<<Project ID>>/locations/eu/processors/<<Processor ID>>:process
Verwendung von Google CDE
Der Aufwand für die Erstellung und Pflege von Modellen mit Google CDE ist durch verschiedene Szenarien gerechtfertigt, wie zum Beispiel:
- Zusätzliche unterstützte Sprachen Bei der Arbeit mit Dokumenten, die die Unterstützung zusätzlicher Sprachen erfordern, und bei denen die vorhandenen, vorab trainierten Modelle diese Fähigkeit nicht bieten, ist Google CDE unverzichtbar.
Informationen zu unterstützten Sprachen finden Sie unter Sprachunterstützung für Google CDE.
- Nicht unterstützte Dokumentenformate: Google CDE ist von Vorteil, wenn es um Dokumenttypen geht, für die es keine kompatiblen Parser gibt.
- Bewältigung von Genauigkeits- und Leistungsproblemen: Bei bestimmten Dokumentenformaten kann es selbst bei der Verwendung von vorab trainierten Modellen schwierig sein, die gewünschte Genauigkeit zu erreichen. Google CDE mit speziellen Trainingseinheiten zu Dokumenten kann eine bessere Genauigkeit bieten.
- Benutzerdefinierte oder nicht standardisierte Feldextraktion: Google CDE kann in Szenarien verwendet werden, in denen spezifische Felder aus Dokumenten extrahiert werden müssen, die in benutzerdefinierten oder nicht standardisierten Formaten vorliegen.
- Extraktion auf der Grundlage eines spezifischen Trainings, wenn keine Bezeichnungen vorhanden sind: Google CDE ist von Vorteil, wenn Informationen aus Feldern extrahiert werden müssen, für die es keine vordefinierten Bezeichnungen gibt.