ドキュメント分類子の概要

ドキュメント分類子パッケージでは、ドキュメントを抽出のためにドキュメントを適切なラーニングインスタンスにグループ化または分類します。

このパッケージを使用して次のタスクを実行できます。

  • レイアウト、コンテンツ、またはその両方に基づいて、ドキュメント ファイルのページを異なるフォルダーにグループ化します。
  • 最初のページのレイアウト、コンテンツ、またはその両方に基づいて、ドキュメント ファイルのドキュメントを異なるフォルダーにグループ化します。

このパッケージの使用はオプションであり、ドキュメント レベルまたはページ レベルで別々のフォルダーにグループ化する必要があるさまざまなドキュメントがある場合にのみ必要です。

注: このパッケージを使用して文書を処理するには、分類子 (ページ数) ライセンスが必要です。

ドキュメント分類子パッケージは、以下の機能を提供します。

モデルのトレーニング
モデルを作成し、そのモデルをトレーニングしてドキュメントやページを分類できるようにします。
ドキュメントの分類
各ドキュメントの最初のページのレイアウト、コンテンツ、またはその両方に基づいてドキュメント ファイルを個別のフォルダーに分類できます。
ページの分類
ドキュメントのページを個別のフォルダーに分割し、レイアウト、コンテンツ、またはその両方に基づいてページをフィルタリングできます。

高度な分類子とドキュメント分類子の違いを理解するには、「高度な分類子とドキュメント分類子の比較」を参照してください。