Verwendung der Vorverarbeitung im Datenextraktions-Workflow

Um Dokumentenverarbeitungs-Workflows zu optimieren, die sowohl Vorverarbeitung als auch Datenextraktion umfassen, können Sie die Vorverarbeitungsaufgabe in den Dokumentenverarbeitungs-Workflow integrieren. Durch diese Integration ist keine manuelle Vorverarbeitung von Dokumenten mehr erforderlich. Stattdessen ist ein einheitlicher, automatisierter Workflow möglich, der beide Aufgaben nacheinander in einem einzigen Workflow erledigt.

Vorbereitungen

Stellen Sie sicher, dass Sie eine Lerninstanz erstellt haben, die Sie mit diesem Prozess verwenden möchten, und sie in der Produktion veröffentlicht haben. Einzelheiten finden Sie unter Lerninstanz für die Produktion veröffentlichen.

In diesem Verfahren haben wir die Aktion „Bild verbessern“ im Vorverarbeitungspaket verwendet und entsprechend Variablen erstellt. Je nachdem, welche Vorverarbeitungsaktion Sie auswählen, müssen Sie möglicherweise das Verfahren ändern und unterschiedliche Variablensätze erstellen.

Prozedur

  1. Melden Sie sich bei Ihrem Control Room an.
  2. Navigieren Sie zu Automatisierung > Private Registerkarte.
  3. Klicken Sie auf Erstellen > Task Bot.
    Stellen Sie sicher, dass Sie den Bot nicht in den Ordner Prozesse des Dokumentarbeitsbereichs legen.
  4. Geben Sie einen Namen für den Bot ein, wie z. B. „Dokumentenverarbeitung-mit-Klassifizierung“.
  5. Erstellen Sie die folgenden Variablen:
    Variablenname Beschreibung Datentyp Wert
    SourcePath Dateipfad zum Ordner mit den vorzuverarbeitenden Dokumenten Zeichenfolge Geben Sie den Dateipfad ein, in dem sich die vorzuverarbeitenden Dokumente befinden.
    PreProcessedFilePath Dateipfad zum Ordner mit den vorverarbeiteten Dokumenten Zeichenfolge Geben Sie den Dateipfad ein, in dem die vorverarbeiteten Dokumente verfügbar sind.
    OutputPath Dateipfad zu dem Ordner, der die extrahierten Daten und ungültigen oder fehlgeschlagenen Dokumente enthält Zeichenfolge Geben Sie den Dateipfad ein, in dem die Extraktionsausgabe erfolgen soll.
    FilesInFolderPreProcessing Enthält Dateiname und Erweiterung. Wörterbuch n. v.
    FilesInFolderDataProcessing Enthält Dateiname und Erweiterung. Wörterbuch n. v.

    Einzelheiten finden Sie unter Erstellen von Variablen.

  6. Fügen Sie die Aktion Schleife ein, die alle zu klassifizierenden Dokumente in einem bestimmten Dateipfad durchläuft.
    1. Doppelklicken Sie auf die Aktion Schleife oder ziehen Sie sie in den Editor.
    2. Wählen Sie den Iterator Für jede Datei im Ordner aus.
    3. Geben Sie in das Feld Ordnerpfad $SourcePath$ ein.
    4. Im Feld Dateinamen und Erweiterung dieser Variablen zuweisen geben Sie $FilesInFolderPreProcessing$ ein.
    Einzelheiten finden Sie unter Schleife Paket.
  7. Konfigurieren Sie Aktionen zur Vorverarbeitung von Dokumenten.
    1. Ziehen Sie die Aktion Bild verbessern im Vorverarbeitungs-Paket in den Schleifen-Container.
    2. Im Feld Eingabedatei wählen Sie die Option Desktop-Datei und geben Sie $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$ ein.
    3. Wählen Sie im Feld Ausgabepfad die Option Desktop-Ordner und geben Sie $PreProcessedFilePath$ ein.
    Einzelheiten finden Sie unter IQ Bot-Pre-processor Paket.
  8. Fügen Sie eine Aktion Schleife ein, die alle Dokumente für die Datenverarbeitung in einem bestimmten Dateipfad durchläuft.
    1. Doppelklicken Sie auf die Aktion Schleife oder ziehen Sie sie in den Editor.
    2. Wählen Sie den Iterator Für jede Datei im Ordner aus.
    3. Geben Sie im Feld Ordnerpfad $PreProcessedFilePath$ . ein.
    4. Im Feld Dateinamen und Erweiterung zu dieser Variablen zuweisen geben Sie $FilesInFolderDataProcessing$ ein.
    Einzelheiten finden Sie unter Schleife Paket.
  9. Konfigurieren Sie Aktionen, um Dokumente in den Prozess hochzuladen, der mit einer bestimmten Lerninstanz verbunden ist.
    1. Ziehen Sie die Aktion Anforderung erstellen im Process Composer-Paket in den Schleifen-Container.
    2. Klicken Sie im Feld Öffentlicher Prozess auf Durchsuchen und wählen Sie eine Lerninstanz aus, die im öffentlichen Modus verfügbar ist.
    3. Im Feld Datei „InputFile“ wählen Sie die Option Desktop-Datei und geben Sie $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ ein.
    4. Geben Sie im Feld Zeichenfolge „InputFileName“ $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ ein.
    5. Geben Sie im Feld Zeichenfolge „OutputFolder“ $OutputPath$ ein.
    Einzelheiten finden Sie unter Process Composer Paket.
  10. Über das Dateipaket können Sie die folgenden Aktionen ausführen:
    • Mit der Aktion Desktop-Datei kopieren können Sie eine Kopie der erfolgreich verarbeiteten Dateien an einem anderen Speicherort auf Ihrem Desktop erstellen. Geben Sie zum Beispiel $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ in das Quelldatei-Feld ein.
    • Mit der Aktion Löschen können Sie Dokumente entfernen, nachdem sie in Document Automation hochgeladen wurden. Geben Sie zum Beispiel $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ das Datei-Feld ein.

    Einzelheiten finden Sie unter Textdatei Paket.

  11. Klicken Sie auf Speichern.
Wenn Sie diese Automatisierung jetzt ausführen, werden Dokumente zunächst vorverarbeitet, um die Bildqualität zu verbessern, und dann in der Lerninstanz für die Datenextraktion verwendet.