Aktion „Daten extrahieren“

TaskBots verwenden die Aktion „Daten extrahieren“, um die auf Document Automation hochgeladenen Dokumente zu verarbeiten.

Wenn Sie eine Lerninstanz in Document Automation erstellen, erstellt Control Room automatisch den Extraktionsbot. Um diesen Bot zu bearbeiten, navigieren Sie zu Automatisierung > Document Workspace-Prozesse, wählen den Ordner mit dem gleichen Namen wie die Lerninstanz und öffnen den Extraktionsbot.

In der folgenden Tabelle werden die Aktions-Felder beschrieben.
Anmerkung:
  • Wir raten davon ab, die Variablen in diesen Feldern zu ändern, da dies den Prozess stören könnte.
  • Sie erhalten eine Fehlermeldung, wenn Sie einen Bot mit den folgenden Aktionen erstellen und den Bot ausführen:
    1. Verwenden Sie die Aktion „Dokument klassifizieren“ im Paket „Advanced Classifier“, um ein Dokument zu klassifizieren.
    2. Verwenden Sie die Aktion „Daten extrahieren“, die die Lerninstanz des Typs Unstrukturiertes Dokument im Paket Dokumentenextraktion verwendet, um Daten aus einem Dokument zu extrahieren.

    Daher raten wir davon ab, die Aktion „Dokument klassifizieren“ und die Aktion „Daten extrahieren“, die die Lerninstanz des Typs Unstrukturiertes Dokument verwenden, im selben Bot zu verwenden.

  • Wenn Sie die Datenextraktion-Aktion zusammen mit IQ Bot-Pre-processor-, Dokumentenklassifizierer- oder OCR-Aktionen in einem einzigen Bot verwenden, schlägt Bot fehl. Sie können jedoch die IQ Bot-Pre-processor-, Dokumentenklassifizierer- und OCR-Aktionen in einem einzigen Bot verwenden.

    Problemumgehung: Stellen Sie sicher, dass Sie einen separaten Bot erstellen, wenn Sie eine Aktion aus dem IQ Bot-Pre-processor, Dokumentenklassifizierer oder OCR verwenden, sowie die Datenextraktion-Aktion des Dokumentenextraktion-Pakets. Wenn Sie diese Bots in einer Reihenfolge ausführen müssen, integrieren Sie diese Bots in einen Automation Co-Pilot-Prozess.

Feld Beschreibung
Zu extrahierendes Dokument Dateipfad zum hochgeladenen Dokument.
Name der Lerninstanz Name der Lerninstanz, die mit diesem Bot verknüpft ist.
Ergebnisse der Ausgabe Geben Sie an, wo die Document Automation-Daten gespeichert werden sollen. Je nach Anwendungsfall können Sie die Daten entweder auf den Document Automation-Server hochladen oder in Ihrem lokalen Ordner speichern.
  • Hochladen auf den Server: Die bei der Extraktion erzeugten Daten werden zur weiteren Verarbeitung (z. B. Validierung) auf den Server hochgeladen und später von einem Bot mit der Daten herunterladen-Aktion heruntergeladen.
  • In einem lokalen Ordner speichern: Die von Document Automation erzeugten Daten werden nicht an den Server gesendet, sondern im angegebenen Ordnerpfad gespeichert.
    Anmerkung: Wenn Sie diese Option wählen, sendet Document Automation Dateien zur Validierung und erhöht die Validierungsschlange. Sie können das Dokument jedoch nicht im Automation Co-Pilot-Validator anzeigen, da es keine zugehörige Automation Co-Pilot-Anforderung gibt. Außerdem können Sie den Bot, der die Daten herunterladen-Aktion ausführt, aus dem Prozess entfernen, da die Auswahl dieser Option diesen Schritt im Prozess-Bot überflüssig macht.
Zusätzliche Einstellungen Einzelheiten finden Sie unter .
(Optional) Antworten als Datensatz speichern Wählen Sie eine der folgenden Registerkarten für die Zielaufzeichnungsvariable:
  • Mehrere Variablen: Sie können die Ausgabe in mehreren Variablen speichern, indem Sie den Schlüssel und die Variable, der der Schlüssel zugeordnet wird, bereitstellen. Diese Variable kann einen der folgenden Typen haben: Zeichenfolge, Nummer, Datum/Uhrzeit, Boolescher Wert und so weiter. Wenn Ihre Quelldatensatzvariable beispielsweise zwei Einträge wie Name und Kontaktnummer enthält, können Sie die Ausgabe wie folgt speichern:
    Schlüssel Zur Variable zuordnen
    Name StrName
    Kontaktnummer Mobilnummer

    Die Variablen StrName und MobileNo sind Variablen vom Typ Zeichenfolge bzw. Ziffer.

  • Datensatz: Sie können die Ausgabe in einer Datensatzvariablen speichern. Klicken Sie auf das Dropdown-Menü, um eine vorhandene Variable auszuwählen oder eine neue zu erstellen.

Zusätzliche Einstellungen

In der folgenden Tabelle sind alle zusätzlichen Einstellungen wie Standard, Google Document AI, Microsoft OpenAI, Anthropic, und IQ Bot in der Daten extrahieren-Aktion aufgeführt. Sie müssen die Lizenz-Anmeldedaten für die ausgewählten Einstellungen für externe Dienste eingeben.

Zusätzliche Einstellungen Beschreibung
Keine Dies ist die Standardoption für Ihren Extraktionsbot. Wenn Sie keine externen Verbindungen verwenden möchten, können Sie die Option Keine wählen.
Google DocAI
  • Dienstkonto: Geben Sie die Lizenz-Anmeldedaten ein, die Ihr Google Document AI-Sicherheitstoken enthalten. Wenn Sie Ihre eigenen Anmeldedaten nicht verwenden möchten, wählen Sie die Option Keine. Verwenden Sie die Option Anmeldedaten, Variable oder Unsichere Zeichenfolge, um die Anmeldedaten des Dienstkontos einzugeben.
  • Endpunkt-URL für Dokumentenprozessor: Geben Sie die URL für Ihr Dienstkonto an.
  • Name des Cloud-Speicherbereichs (optional): Geben Sie den Namen des Cloud-Speicherbereichs an. Wenn Ihr Dokument mehr als 10 Seiten umfasst, werden die Eingabedatei und die Extraktionsergebnisse vorübergehend in diesem Bereich gespeichert.
MS OpenAI
  • Dienstkonto für GPT: Verwenden Sie die Option Anmeldedaten, Variable oder Unsichere Zeichenfolge, um die Lizenz-Anmeldedaten einzugeben, die Ihr AI-Sicherheitstoken für die Abfrage enthalten. Wenn Sie Ihre eigenen Anmeldedaten nicht verwenden möchten, wählen Sie die Option Keine.
  • Endpunkt-URL für GPT-Modell: Geben Sie eine URL zu einem Dokumentenverarbeitungs-Endpunkt an. Zum Beispiel, https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/chat/completions?api-version={api-version}
  • Dienstkonto für Einbettungen: Verwenden Sie die Option Anmeldedaten, Variable oder Unsichere Zeichenfolge, um die Lizenz-Anmeldedaten einzugeben, die Ihr Microsoft OpenAI-Sicherheitstoken für die Einbettung enthalten. Sie können auch Ihre eigenen Anmeldedaten verwenden.
  • Endpunkt-URL für ADA-Modell: Geben Sie eine URL zu einem Dokumentenverarbeitungs-Endpunkt an. Zum Beispiel, https://{your-resource-name}.openai.azure.com/openai/deployments/{deployment-id}/embeddings?api-version={api-version}.
Anthropic Einzelheiten finden Sie unter Daten mit Anthropic-Modellen extrahieren.
IQ Bot (optional): Gruppenbezeichnung (optional): Wenn die Lerninstanz in Automation 360 IQ Bot erstellt und mit Document Automation verbunden wurde, wird dieses Feld automatisch (Variable) mit dem Namen der entsprechenden Dokumentgruppe ausgefüllt.