データ抽出ワークフローにおける前処理の使用

事前処理とデータ抽出の両方を含むドキュメント処理ワークフローを効率化するために、事前処理タスクをドキュメント処理ワークフローに統合できます。 この統合により、手動でドキュメントを事前処理する必要がなくなり、単一のワークフロー内で両方のタスクを順番に処理する統合された自動ワークフローが可能になります。

前提条件

このプロセスで使用するラーニングインスタンスを作成し、本番環境に公開したことを確認してください。 「ラーニングインスタンスを本番環境に公開する」を参照してください。

この手順では、プリプロセッサー パッケージの画像のエンハンスメント アクションを使用し、それに応じて変数を作成しました。 選択したプリプロセッサー アクションに応じて、手順を変更し、異なる変数のセットを作成する必要がある場合があります。

手順

  1. Control Room にログインします。
  2. [オートメーション] > [プライベート タブ] の順に移動します。
  3. [作成] > [タスク Bot] をクリックします。
    Bot を [Document Workspace Processes] フォルダーに配置しないようにしてください。
  4. doc-processing-with-classification などの Bot の名前を入力します。
  5. 次の変数を作成します。
    変数名 説明 データ タイプ
    SourcePath 事前処理するドキュメントが含まれるフォルダーのファイル パス 文字列 事前処理するドキュメントが置かれているファイルパスを入力します
    PreProcessedFilePath 事前処理されるドキュメントが含まれるフォルダーのファイル パス 文字列 事前処理されるドキュメントを使用できるファイルパスを入力します
    OutputPath 抽出されたデータと無効または失敗したドキュメントが含まれるフォルダーのファイル パス 文字列 抽出を出力するファイル パスを入力
    FilesInFolderPreProcessing ファイル名と拡張子が保持される ディクショナリ NA
    FilesInFolderDataProcessing ファイル名と拡張子が保持される ディクショナリ NA

    変数の作成」を参照してください。

  6. [ループ] アクションを挿入し、特定のファイル パスにある分類するすべてのドキュメントで反復します。
    1. [ループ] アクションをダブルクリックするかエディターにドラッグします。
    2. [フォルダー内の各ファイル] 反復子を選択します。
    3. [フォルダー パス] フィールドに「$SourcePath$」と入力します。
    4. [Assign file name and extension to this variable (ファイル名と拡張子をこの変数に割り当てる)] フィールドに「$FilesInFolderPreProcessing$」と入力します。
    ループ パッケージ」を参照してください。
  7. ドキュメントを事前処理するためのアクションを構成します。
    1. プリプロセッサー で、[画像のエンハンスメント] アクションを パッケージ [ループ] コンテナにドラッグします
    2. [入力ファイル] フィールドで、[デスクトップ ファイル] オプションを選択し、「$SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$」と入力します。
    3. [出力パス] フィールド で [デスクトップ フォルダー] オプションを選択し、「$PreProcessedFilePath$」と入力します。
    IQ Bot Pre-processor パッケージ」を参照してください。
  8. [ループ] アクションを挿入し、特定のファイル パスで処理するデータのすべてのドキュメントで反復します。
    1. [ループ] アクションをダブルクリックするかエディターにドラッグします。
    2. [フォルダー内の各ファイル] 反復子を選択します。
    3. [フォルダー パス] フィールドに、「$PreProcessedFilePath$ .」と入力します。
    4. [Assign file name and extension to this variable (ファイル名と拡張子をこの変数に割り当てる)] フィールドに「$FilesInFolderDataProcessing$」と入力します。
    ループ パッケージ」を参照してください。
  9. 特定のラーニングインスタンスに関連するプロセスにドキュメントをアップロードするようにアクションを構成します。
    1. で、[リクエストを作成] アクションを Process Composer パッケージ [ループ] コンテナにドラッグします。
    2. [公開プロセス] で、[参照] を選択し、公開モードで使用可能なラーニングインスタンスを選択します。
    3. [ファイル “InputFile”] フィールドで、[デスクトップ ファイル] オプションを選択し、「$PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$」と入力します。
    4. [String “InputFileName” (文字列 “InputFileName”)] フィールドに「$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$」と入力します。
    5. [String “OutputFolder” (文字列 “OutputFolder”)] フィールドに「$OutputPath$」と入力します。
    Process Composer パッケージ」を参照してください。
  10. ファイル パッケージを使用すると、次のアクションを実行できます。
    • [Copy Desktop file (デスクトップ ファイルのコピー)] を使用すると、正常に処理されたファイルのコピーをデスクトップ上の別の場所に作成できます。 たとえば、「$PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$」と [ソース ファイル] フィールドに入力します。
    • [削除] アクションを使用すると、Document Automation にアップロードされたドキュメントを削除できます。 例:「$PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$」と [ファイル] フィールドに入力します。

    テキスト ファイル パッケージ」を参照してください。

  11. [保存] をクリックします。
このオートメーションを実行すると、ドキュメントは画像の品質を向上させるために最初に事前処理され、その後、ラーニングインスタンスでデータ抽出に使用されます。