分類とデータ抽出の両方を含むドキュメント処理ワークフローを効率化するために、分類タスクをドキュメント処理ワークフローに統合できます。 この統合により、手動でドキュメントを事前に分類する必要がなくなり、単一のワークフロー内で両方のタスクを順番に処理する統合された自動プロセスが可能になります。

前提条件

このプロセスで使用するラーニングインスタンスを作成し、本番環境に公開したことを確認してください。 「ラーニングインスタンスを本番環境に公開する」を参照してください。

この手順では、ドキュメント分類子 パッケージの分類アクションを使用し、それに応じて変数を作成しました。 選択した分類子アクションに応じて、手順を変更し、異なる変数のセットを作成する必要がある場合があります。

手順

  1. Control Room にログインします。
  2. [オートメーション] > [プライベート タブ] の順に移動します。
  3. [作成] > [タスク Bot] をクリックします。
    Bot を [Document Workspace Processes] フォルダーに配置しないようにしてください。
  4. doc-processing-with-classification などの Bot の名前を入力します。
  5. 次の変数を作成します。
    変数名 内容 データ タイプ
    SourcePath 分類するドキュメントが含まれるフォルダーのファイル パス 文字列 分類するドキュメントが置かれているファイル パスを入力します
    ClassifiedFilePath 分類されるドキュメントが含まれるフォルダーのファイル パス 文字列 分類されるドキュメントを使用できるファイル パスを入力します
    OutputPath 抽出されたデータと無効または失敗したドキュメントが含まれるフォルダーのファイル パス 文字列 抽出を出力するファイル パスを入力
    FilesInFolderClassification ファイル名と拡張子を保持 ディクショナリ NA
    FoldersInFolderDataProcessing フォルダー名を保持します 文字列 NA
    FilesInFolderDataProcessing ファイル名と拡張子を保持 ディクショナリ NA

    変数の作成」を参照してください。

  6. [ループ] アクションを挿入し、特定のファイル パスにある分類するすべてのドキュメントで反復します。
    1. [ループ] アクションをダブルクリックするかエディターにドラッグします。
    2. フォルダー内の各ファイル 反復子を選択します。
    3. [フォルダー パス] フィールドに「$SourcePath$」と入力します。
    4. [Assign file name and extension to this variable (ファイル名と拡張子をこの変数に割り当てる)] フィールドに「$FilesInFolderClassification$」と入力します。
    ループ パッケージ」を参照してください。
  7. ドキュメントを分類するためのアクションを構成します。
    1. で、[分類] アクションを ドキュメント分類子 パッケージ [ループ] コンテナにドラッグします
    2. [入力ファイル] フィールドで、[デスクトップ ファイル] オプションを選択し、「$SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$」と入力します。
    3. [クラシファイア] フィールドで、適切なモデル ファイルを選択します。
    4. [出力フォルダーパス] フィールドで [デスクトップフォルダー] オプションを選択し、「$ClassifiedFilePath$」と入力します。
    ドキュメント分類子 パッケージ」を参照してください。
  8. [ループ] アクションを挿入し、特定のファイル パスにあるすべてのフォルダーで反復します。
    1. [ループ] アクションをダブルクリックするかエディターにドラッグします。
    2. [フォルダー内の各フォルダー] 反復子を選択します。
    3. [フォルダー パス] フィールドに、「$ClassifiedFilePath$」と入力します。
      注: 群類されたドキュメントはこのフォルダー内の別のフォルダーとして保存されるので、フォルダー パスに ClassifiedFilePath 値を選択しました。
    4. [Assign relative folder path to this variable (相対フォルダパスをこの変数に割り当てる)] フィールドに「$FoldersInFolderDataProcessing$」と入力します。
    ループ パッケージ」を参照してください。
  9. [ループ] アクションを挿入し、特定のファイル パスで処理するデータのすべてのファイルで反復します。
    1. [ループ] アクションをダブルクリックするかエディターにドラッグします。
    2. フォルダー内の各ファイル 反復子を選択します。
    3. [フォルダー パス] フィールドに、「$ClassifiedFilePath$/$FoldersInFolderDataProcessing$.」と入力します。
    4. [Assign file name and extension to this variable (ファイル名と拡張子をこの変数に割り当てる)] フィールドに「$FilesInFolderDataProcessing$」と入力します。
    ループ パッケージ」を参照してください。
  10. 特定のラーニングインスタンスに関連するプロセスにドキュメントをアップロードするようにアクションを構成します。
    1. で、[リクエストを作成] アクションを Process Composer パッケージ [ループ] コンテナにドラッグします。
    2. [公開プロセス] で、[参照] を選択し、公開モードで使用可能なラーニングインスタンスを選択します。
    3. [ファイル “InputFile”] フィールドで、[デスクトップ ファイル] オプションを選択し、「$ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$」と入力します。
    4. String “InputFileName” フィールドに「$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$」と入力します。
    5. String “OutputFolder” フィールドに「$OutputPath$」と入力します。
    Process Composer パッケージ」を参照してください。
  11. ファイル パッケージを使用すると、以下のアクションを実行できます。
    • [Copy Desktop file (デスクトップ ファイルのコピー)] を使用すると、正常に処理されたファイルのコピーをデスクトップ上の別の場所に作成できます。 例:「$ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$」と [ソース ファイル] フィールドに入力します。
    • [削除] アクションを使用すると、ドキュメント オートメーション にアップロードされたドキュメントを削除できます。 たとえば、「$ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$」と [ファイル] フィールドに入力します。

    テキスト ファイル パッケージ」を参照してください。

  12. [保存] をクリックします。
このオートメーションを実行すると、ドキュメントは最初に分類され、その後、ラーニングインスタンスでデータ抽出に使用されます。