[高度な分類子をトレーニング] アクションの使用

[高度な分類子をトレーニング] アクションを使用して、[ドキュメントの分類]、[ページの分類]、または [ドキュメントを分割] アクションによって使用されるモデル ファイルを作成し、入力に必要なカテゴリにドキュメントを並べ替えます。

前提条件

Bot をビルドする前に、サンプル ドキュメントを収集してフォルダーに分類します。サンプル ドキュメントのセットが次の要件を満たしていることを確認します。
  • 少なくとも 2 つのカテゴリがある。
  • カテゴリごとに 15 ファイル以上が必要です。20 ファイルが推奨されます。
  • カテゴリの最大数に制限はありません。ただし、トレーニング データ セットとそれに対応するモデル サイズが大きくなると、分類プロセスのパフォーマンスが低下するおそれがあることに注意することが重要です。したがって、最適なパフォーマンスを得るために、モデル ファイルごとにカテゴリ数を 150 以内に収めることをお勧めします。
  • サポートされているファイル形式は、以下のとおりです。
    • .tiff
    • .bitmap
    • .jepg
    • .png
    • .pdf
    • .txt
  • 画像は 300dpi (ドット パー インチ) の解像度で提供することをお勧めします。許容される解像度は 200dpi 以上です。
注:

この最小要件を満たしていない場合、Bot 実行時にエラー メッセージが表示されます。

手順

  1. [アクション] パレットで、高度な分類子パッケージの [高度な分類子をトレーニング] アクションをダブルクリックまたはドラッグします。
  2. [モデル名] フィールドにモデル ファイルの名前を入力します。
  3. [デスクトップ フォルダー] または [変数] から [トレーニング フォルダー パス] を選択します。入力フォルダー パスには、クラシファイアをトレーニングするドキュメントのカテゴリに対応する名前を持つサブディレクトリが必要です。たとえば、売上関連のドキュメントがある場合、入力フォルダー パスには、請求書や発注書などのサブフォルダーが必要です。
  4. 任意: [デスクトップ ファイル] を選択した場合は、[参照] をクリックしてデフォルトのファイルパスを変更します。例: C:\Users\Dave\BankStatement\TrainingData
  5. [モデル出力パス] フィールドを使用して、出力モデル ファイルのディレクトリを選択します。
  6. [ライセンス] フィールドに、ライセンス資格情報を入力します。
  7. [資格情報] オプションを選択した場合、[選択] をクリックして、ライセンス ロッカーからライセンスを取得します。
  8. [ドキュメント分割トレーニング] フィールドで
    [無効] を選択した場合:
    1. [詳細設定] で、構築したい分類子のタイプに基づき、ドロップダウン メニューから [分類タイプ] を選択します。
      • ビジュアル クラシファイア
      • コンテンツ クラシファイア
      • ビジュアル & コンテンツ クラシファイア
    2. 任意: [テキスト ルール] を追加します。
    [有効] を選択した場合:
    1. 以下のオプションが表示されます。
      • 不明なドキュメントをマージする - デフォルトでチェックされていません。
      • 不明なページのしきい値 - デフォルトで 30%。
      • 分割の信頼度に基づくしきい値 (または分割しきい値) - デフォルトで 70%。
    2. [詳細設定] で、構築したい分類子のタイプに基づき、ドロップダウン メニューから [分類タイプ] を選択します。
      • ビジュアル クラシファイア
      • コンテンツ クラシファイア
      • ビジュアル & コンテンツ クラシファイア
    3. 任意: [テキスト ルール] を追加します。
    注: ルール ファイルは、1 つのカテゴリにつき 1 つだけでなければなりません。ルール ファイルをカテゴリ フォルダー外に配置した場合、以下のエラー メッセージが表示されます。

    Invalid rule file location

  9. [保存]、[実行] の順にクリックします。

次のステップ

モデルを作成したら、入力ドキュメントを分類する Bot をビルドします。詳細については、「[ドキュメントの分類] アクションの使用」を参照してください。