ドキュメントの分類の概要

ドキュメントの分類は、分類パッケージを使用して実行される自動プロセスであり、レイアウト、コンテンツ、またはその両方などの属性に基づいて、ドキュメントまたはドキュメント内のページをさまざまなカテゴリにグループ化または分類します。

この処理は、ドキュメントを整理してからドキュメント処理を実行する必要があるシナリオで使用できます。たとえば、ドキュメントの分類処理が完了したら、適切なラーニングインスタンスで処理できます。

分類の仕組み

ドキュメントの分類により、次の方法でドキュメントの処理が可能になります。

ドキュメントの整理
ファイルに多数のドキュメントが含まれている場合、ドキュメントの分類によってドキュメントを関連するカテゴリに分類できるため、ドキュメントの管理と取得が容易になります。これらのファイルには、同じ種類のドキュメント (請求書など) または異なる種類のドキュメント (請求書、船荷証券、注文書など) を含めることができます。
ワークフローの効率化
分類子が正しいドキュメントを識別すると、分類されたドキュメントを適切なドキュメント処理ワークフローで使用できるため、ドキュメントの識別とデータ抽出の精度が向上します。たとえば、データ抽出に適したラーニングインスタンスでドキュメントを処理できます。
効率性の向上
ドキュメントのソートと分類にかかる手作業の労力を削減することで、ドキュメントの分類の時間を削減し、手作業によるエラーを最小限に抑えます。

分類子の種類

個々の事例またはビジネス要件に基づいて、次のいずれかの分類子オプションを選択できます。

ドキュメント分類子

この分類子は、各ドキュメントの最初のページに基づいて、ドキュメントをさまざまなカテゴリ フォルダー (ドキュメント カテゴリを表す) にグループ化します。

さらに、ドキュメント分類子は、ドキュメント内の個々のページを異なるフォルダーに分類することもできます。大きなドキュメントに複数ページのドキュメントが埋め込まれている場合は、このページ レベルの分類が完了した後、個々のページをマージしてそれらを単一のドキュメントとして処理する必要があります。たとえば、住宅ローンドキュメントの 1 ページ目と 2 ページ目に顧客情報 (KYC)、3 ページ目と 4 ページ目に顧客銀行取引明細書が含まれている場合、1 ページ目と 2 ページ目は顧客情報として分類され、KYC フォルダーに保存され、3 ページ目と 4 ページ目は銀行取引明細書として分類され、銀行取引明細書フォルダーに保存されます。KYC ページを 1 つのドキュメントとして処理するには、KYC フォルダーに保存されている 1 ページ目と 2 ページ目をマージする必要があります。同様に、銀行取引明細書を単一のドキュメントとして処理するには、銀行取引明細書フォルダーに保存されている 3 ページ目と 4 ページ目をマージする必要があります。

高度な分類子
この分類子は、ドキュメント分類子の機能に加えて、ドキュメントを複数のドキュメントに分割することができ、また定義済みのルールを使用してドキュメント レベルまたはページ レベルで分類することもできます。これには、Skilja の別のライセンスが必要です。ドキュメント分類子が要件を満たさない場合にのみ、この分類子を使用することをお勧めします。

高度な分類子とドキュメント分類子の違いを理解するには、「高度な分類子とドキュメント分類子の比較」を参照してください。