Erstellen einer Lerninstanz mit Google CDE

Eine Lerninstanz ist eine Struktur, die Informationen wie Dokumenttyp, Sprache und zu extrahierende Felder enthält. Nachdem Sie einen benutzerdefinierten Extraktionsprozessor erstellt haben, müssen Sie eine Lerninstanz erstellen, um Daten aus den Dokumenten zu extrahieren.

Vorbereitungen

  • Vergewissern Sie sich, dass Sie einen Google Custom Document Extractor (CDE)-Prozessor erfolgreich erstellt und trainiert haben.
  • Vergewissern Sie sich, dass Ihr Control Room über die Produktlizenz für den Dokumentenarbeitsbereich (Anzahl der Seiten) verfügt.
  • Vergewissern Sie sich, dass Sie BYOK konfiguriert haben. Weitere Informationen finden Sie unter Konfigurieren von BYOK (Bring your own key) für Google CDE.

Um einen neuen Prozessor mit Google Document AI zu integrieren, ist der entscheidende Schritt die Erstellung einer Lerninstanz. Dies beinhaltet die Verwendung der Option Google Document AI (User-defined) als Anbieter. Durch die Erstellung einer Lerninstanz mit dieser Option können Nutzer Formular- und Tabellenfelder mit den gleichen Namen wie im Prozessor definieren.
Anmerkung:
  • Derzeit unterstützt Google Document AI die Extraktion einzelner Tabellen.
  • Die Kontrollkästchenfunktion (im Vorschaumodus) kann zu einer inkonsistenten Extraktion für die Kontrollkästchenfelder und damit eventuell zu inkonsistenten Ergebnissen führen. In solchen Fällen, wenn das System nicht in der Lage ist, den Wert des Kontrollkästchens exakt zu extrahieren, wird es als Nicht gefunden gekennzeichnet.

Prozedur

  1. Navigieren Sie auf der Control Room-Startseite zu Verwalten > Lerninstanzen > Lerninstanz erstellen.
    Das Fenster Lerninstanz erstellen wird in einer neuen Registerkarte geöffnet.
  2. Fügen Sie einen Namen für die neu zu erstellende Lerninstanz hinzu.
  3. Wählen Sie aus dem Dropdown-Menü Dokumenttyp die Option Benutzerdefiniert aus.
  4. Wählen Sie im Menü Anbieter die Option Google Document AI (nutzerdefiniert).
  5. Wählen Sie das Feld Tabelle oder Formulare.
  6. Erstellen Sie neue Felder mit identischen Namen wie die, die im Google CDE-Prozessor verwendet werden.
    Anmerkung: Achten Sie beim Erstellen neuer Felder darauf, dass ihre Namen mit den im Google-Prozessor verwendeten Schemabezeichnungen übereinstimmen. Dies gilt sowohl für Formularfelder als auch für Tabellenfelder.
  7. Klicken Sie auf Erstellen.

    Wenn eine neue Lerninstanz erstellt wird, erstellt der Control Room einen Ordner mit dem gleichen Namen wie die Lerninstanz im Ordner Automatisierung > Dokumentarbeitsbereich.

  8. Aktualisieren Sie den Extraktionsbot der Lerninstanz mit dem Dienstkonto und der Prozessor-Endpunkt-URL.
    1. Öffnen Sie den Bot für die Lerninstanz unter Bots > IQ Bot-Prozesse> {LI Name} > {LI Name}_extractionbot.
    2. Wählen Sie einen Locker und einen Schlüssel für den Anmeldetresor. Weitere Informationen finden Sie unter Konfigurieren von BYOK (Bring your own key) für Google CDE.
    3. Kopieren Sie die URL des Vorhersage-Endpunkts vom Google CDE-Prozessor.
      Vorhersage-Endpunkt in Google Document AI
    4. Fügen Sie die kopierte URL in das Feld Document-AI-Endpunkt-URL für Dokumentenprozessor ein.

      Document-AI-Endpunkt-URL für Dokumentenprozessor

Nächste Maßnahme

Laden Sie Dokumente in die Lerninstanz hoch, beheben Sie Validierungsfehler und überprüfen Sie die extrahierten Daten. Weitere Informationen finden Sie unter Dokumente bearbeiten in Document Automation.