Erstellen von Lerninstanzen mit generative KI für unstrukturierte Dokumente

Verwenden Sie dieses Thema als Anleitung zum Erstellen einer Lerninstanz, die die generative KI-Funktion (GenAI) zum Extrahieren von Daten aus unstrukturierten Dokumenten wie Verträgen, Vereinbarungen, Berichten, Briefen und E-Mails nutzt.

Mit generative KI können Sie eine Lerninstanz erstellen, um Daten aus unstrukturierten Dokumenten zu extrahieren, ohne die Lerninstanz zu trainieren. Dies ist entscheidend für eine schnelle und genaue Dokumentenverarbeitung. Lassen Sie sich durch die Schritte zur Erstellung einer Lerninstanz mit der generative KI-Funktion führen, die eine genaue Datenextraktion aus unstrukturierten Dokumenten ermöglicht.

Vorbereitungen

Ein professioneller Entwickler eines Unternehmens übernimmt folgende Aufgaben:
  • Lerninstanzen erstellen, bearbeiten und löschen
  • Hochladen von Dokumenten zur Bearbeitung und Prüfung
  • Ein- und Auschecken von Lerninstanzen von privaten zu öffentlichen Ordnern

Lizenzanforderung: Bot Creator-Lizenz zur Durchführung der oben genannten Aufgaben.

Zugewiesene Rollen und Berechtigung:
  • AAE_IQBot-Dienste oder AAE_IQBot-Administrator
  • AAE_Basic

Prozedur

  1. Melden Sie sich im Control Room an, navigieren Sie zu Managen > Lerninstanzen und klicken Sie auf die Schaltfläche Lerninstanz erstellen, um eine neue Lerninstanz zu erstellen.
  2. Geben Sie dann einen eindeutigen Namen für die Lerninstanz ein, um sie in der Liste Lerninstanzen einfach zu identifizieren, und wählen Sie die anderen Optionen wie folgt aus:
    Mit der Funktion generative KI können Sie Lerninstanzen für unstrukturierte Dokumente erstellen
    1. Beschreibung (optional): Dies ist ein optionales Feld, das verwendet werden kann, um eine aussagekräftige Beschreibung hinzuzufügen und die Verwendung der Lerninstanz zusammenzufassen.
    2. Dokumenttyp: Unstrukturiertes Dokument
      Wenn Sie diese Option wählen, wird die generative KI-gesteuerte Datenextraktion aktiviert. Diese Funktion ist standardmäßig für unstrukturierte Dokumenttypen aktiviert.
    3. Sprache: English
      Derzeit unterstützen wir nur die englische Sprache.
    4. Gebietsschema: entsprechend dem Gebietsschema der Dokumente.
      Das Gebietsschema wird auf Grundlage Ihrer Sprache und des Landes, aus dem das Dokument stammt, ausgewählt.
    5. Anbieter: Automation Anywhere (benutzerdefiniert)
      Dieser Wert ist standardmäßig ausgewählt, da wir derzeit nur diese Option anbieten.
    6. OCR-Anbieter: Google Vision OCR oder ABBYY OCR
      Unterstützung für ABBYY OCR ist neu ab Version 32.
  3. Klicken Sie auf Weiter, um mit der Erstellung von Formular- und Tabellenfeldern für die Lerninstanz zu beginnen.
    Einzelheiten zum Erstellen von Formular- und Tabellenfeldern finden Sie unter: Erstellen einer Lerninstanz in Document Automation, Schritte 10–12.
  4. Klicken Sie auf Feld hinzufügen, um mit dem Hinzufügen von Feldern für jeden Datenpunkt oder jede Entität, für die Sie Daten aus Ihren Dokumenten extrahieren möchten, zu beginnen.
  5. Als nächstes fügen Sie einen Feldnamen hinzu, der für den zu extrahierenden Datenpunkt spezifisch sein muss, eine Feldbezeichnung, die zur Erstellung einer Standardsuchabfrage verwendet wird, und wählen Sie Datentyp, um die Datenstruktur des Feldwertes zu definieren.
    Sie können aus der Dropdown-Liste die Wertoptionen Text, Zahl, Datum oder Adressdaten auswählen.
  6. Wenn Sie die generative KI-Fähigkeit nutzen, ist das Feld Zuverlässigkeit ausgegraut. Das Feld kann auf Erforderlich oder Optional gesetzt werden.
  7. Im Abschnitt Anfrage nach generativem KI-Modell durchsuchen haben Sie die Möglichkeit, die vom System generierte Abfrage zu verwenden oder eine benutzerdefinierte Abfrage hinzuzufügen.
    Zum Beispiel würde die generative KI-Standardabfrage für ein Feld Gesamtkosten lauten: „Wie hoch sind die Gesamtkosten?“. Sie können die Abfrage zu „Wie hoch sind die Gesamtkosten? Extrahiere die Zahl ohne die Währung.“ anpassen. So werden die Gesamtkosten ohne die Währungsinformationen extrahiert.
    Mit der generative KI-Funktion Tabellenfelder für eine Lerninstanz in Document Automation erstellen
  8. Im nächsten Schritt definieren Sie die Feldregeln und Dokumentenregeln für die Formular- und Tabellenfelder.
    Ausführliche Informationen zum Erstellen von Tabellenfeldern sowie zum Hinzufügen von Feldregeln und Dokumentenregeln finden Sie in Erstellen einer Lerninstanz in Document Automation und Referenzen für die Erstellung einer Lerninstanz in Document Automation.
  9. Ab Version 32 können Sie während der Definition von Tabellenfeldern gleich mehrere Tabellen definieren. Je nach Anwendungsfall können Sie weitere Tabellen definieren, indem Sie auf das Symbol Tabelle hinzufügen neben dem Dropdown-Feld Tabelle klicken.
  10. Klicken Sie auf Erstellen, um die Erstellung der Lerninstanz abzuschließen.

Nächste Maßnahme

  1. Veröffentlichen Sie die Lerninstanz im öffentlichen Repository, so dass die Lerninstanz im öffentlichen Modus verwendet werden kann, um Daten aus echten Dokumenten zu extrahieren, und damit Validatoren Dokumente manuell validieren können. Einzelheiten finden Sie unter Lerninstanz für die Produktion veröffentlichen.
  2. Identifizieren Sie auf der Listenseite Managen > Lerninstanzen die Lerninstanz, die Sie gerade erstellt und veröffentlicht haben, und klicken Sie auf Verarbeiten, um mit dem Hochladen von Dokumenten zur Verarbeitung und Datenextraktion zu beginnen. Einzelheiten finden Sie unter Dokumente bearbeiten in Document Automation.
  3. Öffnen Sie das CSV-Dokument mit den extrahierten Daten und vergleichen Sie es mit dem verarbeiteten Dokument, um zu überprüfen und zu bestätigen, dass die von der Generative KI aktivierten Suchabfragefelder die Daten mit hoher Genauigkeit extrahiert haben.