Aktion „Daten extrahieren“

TaskBots verwenden die Aktion „Daten extrahieren“, um die auf Document Automation hochgeladenen Dokumente zu verarbeiten.

Wenn Sie eine Lerninstanz in Document Automation erstellen, erstellt Control Room automatisch den Extraktionsbot. Um diesen Bot zu bearbeiten, navigieren Sie zu Automatisierung > Prozesse des Dokumentarbeitsbereichs, wählen den Ordner mit dem gleichen Namen wie die Lerninstanz aus und öffnen den Extraktionsbot.

In der folgenden Tabelle werden die Aktions-Felder beschrieben.
Anmerkung:
  • Wir raten davon ab, die Variablen in diesen Feldern zu ändern, da dies den Prozess stören könnte.
  • Sie erhalten eine Fehlermeldung, wenn Sie einen Bot mit den folgenden Aktionen erstellen und den Bot ausführen:
    1. Verwenden Sie die Aktion „Dokument klassifizieren“ im Paket „Advanced Classifier“, um ein Dokument zu klassifizieren.
    2. Verwenden Sie die Aktion „Daten extrahieren“, die die Lerninstanz des Typs Unstrukturiertes Dokument im Paket Dokumentenextraktion verwendet, um Daten aus einem Dokument zu extrahieren.

    Daher raten wir davon ab, die Aktion „Dokument klassifizieren“ und die Aktion „Daten extrahieren“, die die Lerninstanz des Typs Unstrukturiertes Dokument verwenden, im selben Bot zu verwenden.

Feld Beschreibung
Zu extrahierendes Dokument Dateipfad zum hochgeladenen Dokument.
Name der Lerninstanz Name der Lerninstanz, die mit diesem Bot verknüpft ist.
Ergebnisse der Ausgabe Geben Sie an, wo die Document Automation-Daten gespeichert werden sollen. Je nach Anwendungsfall können Sie die Daten entweder auf den Document Automation-Server hochladen oder in Ihrem lokalen Ordner speichern.
  • Auf Server hochladen: Die bei der Extraktion erzeugten Daten werden zur weiteren Verarbeitung (z. B. Validierung) auf den Server hochgeladen und später von einem Bot mit der Aktion Daten herunterladen heruntergeladen.
  • In lokalem Ordner speichern: Die von Document Automation erzeugten Daten werden nicht an den Server gesendet, sondern im angegebenen Ordnerpfad gespeichert.
    Anmerkung: Wenn Sie diese Option wählen, sendet Document Automation Dateien zur Validierung und erhöht die Validierungswarteschlange. Sie können das Dokument jedoch nicht im Automation Co-Pilot-Validator anzeigen, da keine zugehörige Automation Co-Pilot-Anforderung vorliegt. Außerdem können Sie den Bot, der die Aktion Daten herunterladen ausführt, aus dem Prozess entfernen, da die Auswahl dieser Option diesen Schritt im Prozess-Bot überflüssig macht.
Zusätzliche Einstellungen Einzelheiten finden Sie unter Aktion „Daten extrahieren“.
(Optional) Antworten als Datensatz speichern Wählen Sie eine der folgenden Registerkarten für die Zieldatensatzvariable:
  • Mehrere Variablen: Sie können die Ausgabe in mehreren Variablen speichern, indem Sie den Schlüssel und die Variable, der der Schlüssel zugeordnet wird, bereitstellen. Diese Variable kann einen der folgenden Typen aufweisen: Zeichenfolge, Nummer, Datum/Zeit, Boolescher Wert usw. Wenn Ihre Quelldatensatzvariable beispielsweise zwei Einträge wie Name und Kontaktnummer enthält, können Sie die Ausgabe wie folgt speichern:
    Schlüssel Zur Variable zuordnen
    Name StrName
    Kontaktnummer MobileNo

    Die Variablen StrName und MobileNo sind Variablen vom Typ Zeichenfolge bzw. Ziffer.

  • Datensatz: Sie können die Ausgabe in einer Datensatzvariablen speichern. Klicken Sie auf das Dropdown-Menü, um eine vorhandene Variable auszuwählen oder eine neue zu erstellen.

Zusätzliche Einstellungen

In der folgenden Tabelle sind alle zusätzlichen Einstellungen wie Standard, Google Document AI, Microsoft OpenAI, Anthropic und IQ Bot in der Aktion Daten extrahieren aufgeführt. Sie müssen die Lizenz-Anmeldedaten für die ausgewählten Einstellungen für externe Dienste eingeben.

Zusätzliche Einstellungen Beschreibung
Keine Dies ist die Standardoption für den Extraktionsbot. Wenn Sie keine externen Verbindungen verwenden möchten, können Sie die Option Keine wählen.
Google DocAI
  • Dienstkonto: Geben Sie die Lizenz-Anmeldedaten ein, die Ihr Google Document AI-Sicherheitstoken enthalten. Wenn Sie nicht Ihre eigenen Anmeldedaten verwenden möchten, wählen Sie die Option Keine aus. Verwenden Sie die Option Anmeldedaten, Variable oder Unsichere Zeichenfolge, um die Anmeldedaten für das Dienstkonto einzugeben.
  • Endpunkt-URL für Dokumentenprozessor: Geben Sie die URL für Ihr Dienstkonto an.
  • Name des Cloud-Speicherbereichs (optional): Geben Sie den Namen des Cloud-Speicherbereichs an. Wenn Ihr Dokument mehr als 10 Seiten umfasst, werden die Eingabedatei und die Extraktionsergebnisse vorübergehend in diesem Bereich gespeichert.
MS OpenAI
  • Dienstkonto für GPT: Verwenden Sie die Option Anmeldedaten, Variable oder Unsichere Zeichenfolge, um die Lizenz-Anmeldedaten einzugeben, die Ihr AI-Sicherheitstoken für die Abfrage enthalten. Wenn Sie nicht Ihre eigenen Anmeldedaten verwenden möchten, wählen Sie die Option Keine aus.
  • Endpunkt-URL für GPT-Modell: Geben Sie eine URL zu einem Dokumentenverarbeitungs-Endpunkt an. Beispiel: https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/chat/completions?api-version={api-version}
  • Dienstkonto für Einbettungen: Verwenden Sie die Option Anmeldedaten, Variable oder Unsichere Zeichenfolge, um die Lizenz-Anmeldedaten einzugeben, die Ihr Microsoft OpenAI-Sicherheitstoken für die Einbettung enthalten. Sie können auch Ihre eigenen Anmeldedaten verwenden.
  • Endpunkt-URL für ADA-Modell: Geben Sie eine URL zu einem Dokumentenverarbeitungs-Endpunkt an. Zum Beispiel https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/embeddings?api-version={api-version}.
Anthropic Einzelheiten finden Sie unter Daten mit Anthropic-Modellen extrahieren.
IQ Bot (optional): Gruppenbezeichnung (optional): Wenn die Lerninstanz in Automation 360 IQ Bot erstellt und mit Document Automation verbunden wurde, wird dieses Feld automatisch (Variable) mit dem Namen der entsprechenden Dokumentgruppe ausgefüllt.