[ドキュメントの分類] アクションの使用

[ドキュメントの分類] アクションは、[高度な分類子をトレーニング] アクションで作成された特定のモデル ファイルを使用して、各ドキュメントの最初のページに基づいて入力ドキュメントを分類します。

前提条件

  • まだ行っていない場合は、[高度な分類子をトレーニング] アクションを使用してモデル ファイルを作成します。
  • 入力ファイルが必要な形式であることを確認します。
注: 以下のアクションBot を作成し、Bot を実行するとエラーが表示されます。
  1. ドキュメントを分類するには、高度な分類子パッケージでドキュメントの分類アクションを使用します。
  2. ドキュメントからデータを抽出するには、ドキュメント抽出パッケージの [非構造化ドキュメント] タイプのラーニングインスタンスを使用しているデータ抽出アクションを使用します。

したがって、同じ Bot で [非構造化ドキュメント] タイプのラーニングインスタンスを使用しているドキュメント分類アクションとデータ抽出アクションは使用しないことをお勧めします。

[ループ] アクション内で [ドキュメントの分類] アクションを使用して Bot をビルドし、選択したフォルダー内の各ファイルを繰り返し分類します。

手順

  1. [アクション] パレットで、[高度な分類子] パッケージの [ドキュメントの分類] アクションをダブルクリックまたはドラッグします。
  2. [入力ファイル] フィールドに、分類する受信ファイルのデフォルトのファイルパスを指定します。
    • Control Room ファイル
    • デスクトップ ファイル
    • 変数
  3. [クラシファイア] フィールドに、モデル ファイルのファイルパスを入力します。.zip フォルダーを選択するか、このフォルダーから .clsproj3 ファイルを抽出して選択します。
    • Control Room ファイル
    • デスクトップ ファイル
    • 変数
  4. [出力フォルダー] パス オプションを使用して、分類出力ドキュメントを保存します。出力ドキュメントのページは、モデル ファイルで作成されたカテゴリに基づいて、それぞれのサブフォルダーに保存されます。
    • デスクトップ フォルダー
    • 変数
  5. [ライセンス] フィールドに、ライセンス資格情報を入力します。
  6. [資格情報] オプションを選択した場合、[選択] をクリックして、ライセンス ロッカーからライセンスを取得します。
  7. 任意: [信頼度に基づくしきい値 (%)] を設定します。ドキュメントのカテゴリ予測の信頼度の値が信頼度のしきい値より小さい場合、ドキュメントは Unclassified フォルダーに移動されます。
  8. 出力を保持するリスト変数を選択または作成します。分類結果は、次のキーを持つリストとして表示されます。
    • fileName: 処理したいファイルの名前
    • category: 分類後のファイルが属するカテゴリ。たとえば、人事関連のドキュメントはすべて 1 つのカテゴリに分類されます。
    • confidence: トレーニング データに基づいて、ファイルが属するカテゴリなどの分類を示すしきい値のパーセンテージ値。