Verwendung der Klassifizierung im Datenextraktions-Workflow

Um Dokumentverarbeitungs-Workflows zu optimieren, die sowohl Klassifizierung als auch Datenextraktion umfassen, können Sie die Klassifizierungsaufgabe in den Dokumentverarbeitungs-Workflow integrieren. Durch diese Integration ist keine manuelle Vorklassifizierung von Dokumenten mehr erforderlich. Stattdessen ist ein einheitlicher, automatisierter Prozess möglich, der beide Aufgaben nacheinander in einem einzigen Workflow erledigt.

Vorbereitungen

Stellen Sie sicher, dass Sie eine Lerninstanz erstellt haben, die Sie mit diesem Prozess verwenden möchten, und sie in der Produktion veröffentlicht haben. Einzelheiten finden Sie unter Lerninstanz für die Produktion veröffentlichen.

In diesem Verfahren haben wir die Aktion „Klassifizieren“ im Dokumentenklassifizierer-Paket sowie entsprechende Variablen erstellt. Abhängig von der gewählten Klassifizierungsaktion müssen Sie möglicherweise das Verfahren ändern und unterschiedliche Variablensätze erstellen.

Prozedur

  1. Melden Sie sich bei Ihrem Control Room an.
  2. Navigieren Sie zu Automatisierung > Private Registerkarte.
  3. Klicken Sie auf Erstellen > Task Bot.
    Stellen Sie sicher, dass Sie den Bot nicht in den Ordner Prozesse des Dokumentarbeitsbereichs legen.
  4. Geben Sie einen Namen für den Bot ein, wie z. B. „Dokumentenverarbeitung-mit-Klassifizierung“.
  5. Erstellen Sie die folgenden Variablen:
    Variablenname Beschreibung Datentyp Wert
    SourcePath Dateipfad zu dem Ordner, der die Dokumente enthält, die klassifiziert werden sollen Zeichenfolge Geben Sie den Dateipfad ein, in dem sich die zu klassifizierenden Dokumente befinden.
    ClassifiedFilePath Dateipfad zu dem Ordner, der die klassifizierten Dokumente enthält Zeichenfolge Geben Sie den Dateipfad ein, in dem die klassifizierten Dokumente verfügbar sind.
    OutputPath Dateipfad zu dem Ordner, der die extrahierten Daten und ungültigen oder fehlgeschlagenen Dokumente enthält Zeichenfolge Geben Sie den Dateipfad ein, in dem die Extraktionsausgabe erfolgen soll.
    FilesInFolderClassification Enthält Dateiname und Erweiterung. Wörterbuch n. v.
    FoldersInFolderDataProcessing Enthält den Ordnernamen. Zeichenfolge n. v.
    FilesInFolderDataProcessing Enthält Dateiname und Erweiterung. Wörterbuch n. v.

    Einzelheiten finden Sie unter Erstellen von Variablen.

  6. Fügen Sie die Aktion Schleife ein, die alle zu klassifizierenden Dokumente in einem bestimmten Dateipfad durchläuft.
    1. Doppelklicken Sie auf die Aktion Schleife oder ziehen Sie sie in den Editor.
    2. Wählen Sie den Iterator Für jede Datei im Ordner aus.
    3. Geben Sie in das Feld Ordnerpfad $SourcePath$ ein.
    4. Im Feld Dateinamen und Erweiterung dieser Variablen zuweisen geben Sie $FilesInFolderClassification$ ein.
    Einzelheiten finden Sie unter Schleife Paket.
  7. Konfigurieren Sie Aktionen zum Klassifizieren von Dokumenten.
    1. Ziehen Sie die Aktion Klassifizieren im Dokumentenklassifizierer-Paket in den Schleifen-Container.
    2. Im Feld Eingabedatei wählen Sie die Option Desktop-Datei und geben Sie $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$ ein.
    3. Wählen Sie im Feld Klassifizierer die entsprechende Modelldatei.
    4. Wählen Sie im Feld Ausgabeordnerpfad die Option Desktop-Ordner und geben Sie $ClassifiedFilePath$ ein.
    Einzelheiten finden Sie unter Dokumentenklassifizierer Paket.
  8. Fügen Sie die Aktion Schleife ein, die alle Ordner in einem bestimmten Dateipfad durchläuft.
    1. Doppelklicken Sie auf die Aktion Schleife oder ziehen Sie sie in den Editor.
    2. Wählen Sie den Iterator Für jeden Ordner im Ordner aus.
    3. Geben Sie im Feld Ordnerpfad $ClassifiedFilePath$ ein.
      Anmerkung: Wir haben die Variable ClassifiedFilePath für den Ordnerpfad ausgewählt, da die klassifizierten Dokumente als separate Ordner in diesem Ordner gespeichert werden.
    4. Im Feld Relativen Ordnerpfad dieser Variablen zuweisen geben Sie $FoldersInFolderDataProcessing$ ein.
    Einzelheiten finden Sie unter Schleife Paket.
  9. Fügen Sie die Aktion Schleife ein, die alle Dateien für die Datenverarbeitung in einem bestimmten Dateipfad durchläuft.
    1. Doppelklicken Sie auf die Aktion Schleife oder ziehen Sie sie in den Editor.
    2. Wählen Sie den Iterator Für jede Datei im Ordner aus.
    3. Geben Sie im Feld Ordnerpfad $ClassifiedFilePath$/$FoldersInFolderDataProcessing$. ein.
    4. Im Feld Dateinamen und Erweiterung zu dieser Variablen zuweisen geben Sie $FilesInFolderDataProcessing$ ein.
    Einzelheiten finden Sie unter Schleife Paket.
  10. Konfigurieren Sie Aktionen, um Dokumente in den Prozess hochzuladen, der mit einer bestimmten Lerninstanz verbunden ist.
    1. Ziehen Sie die Aktion Anforderung erstellen im Process Composer-Paket in den Schleifen-Container.
    2. Klicken Sie im Feld Öffentlicher Prozess auf Durchsuchen und wählen Sie eine Lerninstanz aus, die im öffentlichen Modus verfügbar ist.
    3. Im Feld Datei „InputFile“ wählen Sie die Option Desktop-Datei und geben Sie $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ ein.
    4. Geben Sie im Feld Zeichenfolge „InputFileName“ $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ ein.
    5. Geben Sie im Feld Zeichenfolge „OutputFolder“ $OutputPath$ ein.
    Einzelheiten finden Sie unter Process Composer Paket.
  11. Über das File-Paket können Sie die folgenden Aktionen durchführen:
    • Mit der Aktion Desktop-Datei kopieren können Sie eine Kopie der erfolgreich verarbeiteten Dateien an einem anderen Speicherort auf Ihrem Desktop erstellen. Geben Sie zum Beispiel $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ in das Quelldatei-Feld ein.
    • Mit der Aktion Löschen können Sie Dokumente entfernen, nachdem sie in Document Automation hochgeladen wurden. Geben Sie zum Beispiel $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ in das Datei-Feld ein.

    Einzelheiten finden Sie unter Textdatei Paket.

  12. Klicken Sie auf Speichern.
Wenn Sie diese Automatisierung jetzt ausführen, werden Dokumente zuerst klassifiziert und dann in der Lerninstanz für die Datenextraktion verwendet.