高度な分類子の概要
- 最終更新日2024/10/31
高度な分類子の概要
高度な分類子パッケージを使用して、ドキュメントをフォルダー構造に分類し、そこからドキュメントをそれぞれのラーニングインスタンスにアップロードしてドキュメント オートメーションで抽出することができます。
このパッケージを使用して次のタスクを実行できます。
- レイアウト、コンテンツ、またはその両方に基づいて、ドキュメント ファイルのページを異なるフォルダーにグループ化します。
- 最初のページのレイアウト、コンテンツ、またはその両方に基づいて、ドキュメント ファイルのドキュメントを異なるフォルダーにグループ化します。
- 選択した分類モデルに基づいて、ドキュメント ファイルのページを異なるフォルダーに分割します。
このパッケージの使用はオプションで、さまざまなドキュメントがありドキュメント レベルまたはページ レベルでグループ化する必要がある場合、またはページのセットを別々のフォルダーに分轄する場合にのみ必要です。
注: このパッケージは、サードパーティの分類サービスである Skilja を使用しており、運用するには Skilja からの別のライセンスが必要です。
機能
高度な分類子パッケージは、以下の機能を提供します。
- モデルのトレーニング
- モデルを作成し、そのモデルをトレーニングしてドキュメントやページを分類し、ドキュメントのページを分割できるようにします。
- ドキュメントの分類
- 各ドキュメントの最初のページのレイアウト、コンテンツ、またはその両方に基づいてドキュメント ファイルを個別のフォルダーに分類できます。
- ページの分類
- ドキュメントのページを個別のフォルダーに分割し、レイアウト、コンテンツ、またはその両方に基づいてページをフィルタリングできます。
- ドキュメントを分割
- 選択した分類モデルに基づいて、ドキュメントのページを異なるフォルダーに分割できます。分類モデルは、さまざまなドキュメント パターンのサンプルを使用し、ドキュメントの最初、中間、および最後のページを分析して、ドキュメントのページを分割するようにトレーニングされます。
ドキュメント分類子ではなく、高度な分類子が必要になるタイミングを教えてください。
高度な分類子パッケージは、次の場合に必要です。
- 定義済みのルールに基づいて、ドキュメントやページを分類する必要がある場合。たとえば、医療機関が請求書や注文書を含む文書を分類する場合、高度な分類子はキーワードなどの定義済みルールを使用して文書を分類します。高度な分類子は、ドキュメント内の請求書、領収書などのキーワードを識別して請求書を分類し、ドキュメント内の注文書、PO、注文などのキーワードを識別して注文書を分類します。
- 特定のパターンに基づいて、ドキュメントのページを分割する必要がある場合。たとえば、金融機関が請求書、銀行取引明細書、税フォーム、領収書などを含むドキュメントを分類する場合、高度な分類子はレイアウトやコンテンツなどのパターンを使用してドキュメントを分類し、各タイプのページを分割します。
高度な分類子とドキュメント分類子の違いを理解するには、「高度な分類子とドキュメント分類子の比較」を参照してください。
高度な分類子パッケージおよびそのアクションを使用してドキュメントを処理するには、有効な Skillja (サードパーティ プロバイダー) ライセンスが必要です。ライセンスの詳細を取得するには、contact@scalehub.com にお問い合わせください 。詳細については、「高度な分類子のライセンスを接続する」を参照してください。
高度な分類子パッケージをダウンロードし、パッケージを Control Room にアップロードする必要があります。
- パッケージをダウンロードするには、A-People Downloads page (Login required) フォルダーに移動し、特定の Automation 360 IQ Bot バージョン > [インストールの設定] フォルダーをクリックし、パッケージをダウンロードします。たとえば、bot-command-advanced-classifier-<version>.jar です。
- パッケージを Control Room にアップロードするには、「Control Room に パッケージ を追加」を参照してください。