Erstellen einer Lerninstanz mit Google CDE

Eine Lerninstanz ist eine Struktur, die Informationen wie Dokumenttyp, Sprache und zu extrahierende Felder enthält. Nachdem Sie einen benutzerdefinierten Extraktionsprozessor erstellt haben, müssen Sie eine Lerninstanz erstellen, um Daten aus den Dokumenten zu extrahieren.

Vorbereitungen

  • Vergewissern Sie sich, dass Sie einen Google Custom Document Extractor (CDE)-Prozessor erfolgreich erstellt und trainiert haben.
  • Vergewissern Sie sich, dass Ihr Control Room über die Produktlizenz für den Dokumentenarbeitsbereich (Anzahl der Seiten) verfügt.
  • Vergewissern Sie sich, dass Sie BYOK konfiguriert haben. Weitere Informationen finden Sie unter Konfigurieren von BYOK (Bring your own key) für Google CDE.

Um einen neuen Prozessor mit Google Document AI zu integrieren, ist der entscheidende Schritt die Erstellung einer Lerninstanz. Dies beinhaltet die Verwendung der Option Google Document AI (User-defined) als Anbieter. Durch die Erstellung einer Lerninstanz mit dieser Option können Nutzer Formular- und Tabellenfelder mit den gleichen Namen wie im Prozessor definieren.
Anmerkung:
  • Derzeit unterstützt Google Document AI die Extraktion einzelner Tabellen.
  • Die Kontrollkästchenfunktion (im Vorschaumodus) kann zu einer inkonsistenten Extraktion für die Kontrollkästchenfelder und damit eventuell zu inkonsistenten Ergebnissen führen. In solchen Fällen, wenn das System nicht in der Lage ist, den Wert des Kontrollkästchens exakt zu extrahieren, wird es als Nicht gefunden gekennzeichnet.

Prozedur

  1. Navigieren Sie auf der Control Room-Startseite zu Verwalten > Lerninstanzen > Lerninstanz erstellen.
    Das Fenster Lerninstanz erstellen wird in einer neuen Registerkarte geöffnet.
  2. Fügen Sie einen Namen für die neu zu erstellende Lerninstanz hinzu.
  3. Wählen Sie aus dem Dropdown-Menü Dokumenttyp die Option Benutzerdefiniert aus.
  4. Wählen Sie im Menü Anbieter die Option Google Document AI (nutzerdefiniert).
  5. Klicken Sie auf Weiter.
  6. Wählen Sie die Registerkarte Formularfelder oder Tabellenfelder aus.
  7. Erstellen Sie neue Felder mit denselben Namen wie die im Google CDE-Prozessor verwendeten Schemabezeichnungen.
    Anmerkung: Achten Sie beim Erstellen neuer Felder darauf, dass ihre Namen mit den im Google-Prozessor verwendeten Schemabezeichnungen übereinstimmen. Sie müssen auf die Übereinstimmung der Namen sowohl für Formularfelder als auch für Tabellenfelder achten.
  8. Klicken Sie auf Erstellen.

    Wenn eine neue Lerninstanz erstellt wird, erstellt der Control Room einen Ordner mit dem gleichen Namen wie die Lerninstanz im Ordner Automatisierung > Prozesse des Dokumentarbeitsbereichs.

    Sie können benutzerdefinierte Formular- und Tabellenfelder für Google Document AI-Lerninstanzen hinzufügen. Wenn Sie Daten aus Feldern extrahieren möchten, die von Google nicht unterstützt werden, können Sie benutzerdefinierte Felder erstellen. Mit dieser Erweiterung können Sie vortrainierte Modelle von Google zusammen mit benutzerdefinierten Feldern für die Dokumentenextraktion verwenden.

    Beachten Sie die folgenden Punkte, wenn Sie benutzerdefinierte Felder für Google Document AI-Lerninstanzen hinzufügen:
    • Sie können benutzerdefinierte Formular- und Tabellenfelder für Dokumenttypen hinzufügen.
    • Sie können die benutzerdefinierten Felder bearbeiten und speichern.
    • Für die benutzerdefinierten Felder ist ein regulärer Ausdruck (Regex) verfügbar.
    • Sie können benutzerdefinierte Felder für vorhandene Lerninstanzen hinzufügen, die mit dem alten Paket verbunden sind.

      In diesem Szenario wird beim Speichern der Lerninstanz eine Benachrichtigung zur Aktualisierung der Paket -Version angezeigt.

    • Wenn ein Paket nicht mit mehreren Funktionen kompatibel ist, wird eine Meldung entsprechend der höchsten Paket-Version angezeigt.
    • Sie können die benutzerdefinierten Felder zusammen mit den Einstellungen in die .dw-Datei importieren oder aus ihr exportieren.
    • Wenn Sie die benutzerdefinierten Felder extrahieren, sind diese Felder abwärtskompatibel mit der älteren Paket-Version.
      • Wenn eine Lerninstanz die benutzerdefinierten Felder verwendet, löst das alte Paket (v.29 und früher) keinen Fehler aus und enthält leere Werte für benutzerdefinierte Felder.
      • Ähnlich wie bei den Standardfeldern wendet das alte Paket (v.29) die Normalisierung und Regeln für benutzerdefinierte Felder an, falls zutreffend.
  9. Aktualisieren Sie den Extraktionsbot der Lerninstanz mit dem Dienstkonto und der Prozessor-Endpunkt-URL.
    1. Öffnen Sie den Bot für die Lerninstanz unter Automatisierung > Prozesse des Dokumentarbeitsbereichs > <LI name> > <Li name>_extractionbot.
    2. Wählen Sie unter Zusätzliche Einstellungen die Option Google DocAI aus.
    3. Wählen Sie im Feld Dienstkonto den Anmeldedatentresor, die Anmeldedaten und das Attribut aus, in dem der Schlüssel für das Dienstkonto gespeichert ist. Weitere Informationen finden Sie unter Konfigurieren von BYOK (Bring your own key) für Google CDE.
    4. Kopieren Sie die URL des Vorhersage-Endpunkts vom Google CDE-Prozessor.
      Vorhersage-Endpunkt in Google Document AI
    5. Fügen Sie die kopierte URL in das Feld Endpunkt-URL für Dokumentenprozessor ein.

      Document-AI-Endpunkt-URL für Dokumentenprozessor

Nächste Maßnahme

Laden Sie Dokumente in die Lerninstanz hoch, beheben Sie Validierungsfehler und überprüfen Sie die extrahierten Daten. Weitere Informationen finden Sie unter Dokumente bearbeiten in Document Automation.