[ページの分類] アクションの使用

[ページの分類] アクションは、[高度な分類子をトレーニング] アクションを使用して作成されたモデル ファイルに基づいて、入力ドキュメントのページをグループ化し、モデルに適合しないページをフィルタリングします。

前提条件

  • まだ行っていない場合は、[高度な分類子をトレーニング] アクションを使用してモデル ファイルを作成します。
  • 入力ファイルが必要な形式であることを確認します。

[ループ] アクション内で [ページの分類] アクションを使用して Bot をビルドし、選択したフォルダー内の各ファイルを繰り返し分類します。

手順

  1. [アクション] パレットで、[高度な分類子] パッケージの [ページの分類] アクションをダブルクリックまたはドラッグします。
  2. [入力ファイル] フィールドに、分類する受信ファイルのデフォルトのファイルパスを指定します。
    • Control Room ファイル
    • デスクトップ ファイル
    • 変数
  3. [クラシファイア] フィールドに、モデル ファイルのファイルパスを入力します。.zip フォルダーを選択するか、このフォルダーから .clsproj3 ファイルを抽出して選択します。
    • Control Room ファイル
    • デスクトップ ファイル
    • 変数
  4. [出力フォルダー] パス オプションを使用して、分類出力ドキュメントを保存します。出力ドキュメントのページは、モデル ファイルで作成されたカテゴリに基づいて、それぞれのサブフォルダーに保存されます。
    • デスクトップ フォルダー
    • 変数
  5. [ライセンス] フィールドに、ライセンス資格情報を入力します。
  6. [資格情報] オプションを選択した場合、[選択] をクリックして、ライセンス ロッカーからライセンスを取得します。
  7. 任意: 以下のように設定します。
    分類出力変数を保存: 分類結果を、次のキーを使用してディクショナリのリストとして保存します。
    • fileName: インデックス値を付加した処理するファイル名。例: <<file name_pageIndex>>。
    • index: 複数のページがある場合のページ番号の値
    • category: 分類後のファイルが属するカテゴリ。たとえば、人事関連のドキュメントはすべて 1 つのカテゴリに分類されます。
    • confidence: トレーニング データに基づいて、ファイルが属するカテゴリなどの分類を示すしきい値のパーセンテージ値。
    注:
    • [高度な分類子] で分類のタイプを次のように選択できます。
      • 画像ベースの分類
      • テキストベースの分類
      • 画像ベースとテキストベースの両方の分類
  8. [保存]、[実行] の順にクリックします。

次のステップ

類似したドキュメントの各サブフォルダーを使用して、ドキュメントからデータを抽出するラーニングインスタンスを作成およびトレーニングできます。