高度な分類子の概要

高度な分類子パッケージを使用して、ドキュメントをフォルダー構造に分類し、そこからドキュメントをそれぞれのラーニングインスタンスにアップロードしてドキュメント オートメーションで抽出することができます。

このパッケージを使用して次のタスクを実行できます。

  • レイアウト、コンテンツ、またはその両方に基づいて、ドキュメント ファイルのページを異なるフォルダーにグループ化します。
  • 最初のページのレイアウト、コンテンツ、またはその両方に基づいて、ドキュメント ファイルのドキュメントを異なるフォルダーにグループ化します。
  • 選択した分類モデルに基づいて、ドキュメント ファイルのページを異なるフォルダーに分割します。

このパッケージの使用はオプションで、さまざまなドキュメントがありドキュメント レベルまたはページ レベルでグループ化する必要がある場合、またはページのセットを別々のフォルダーに分轄する場合にのみ必要です。

注: このパッケージは、サードパーティの分類サービスである Skilja を使用しており、運用するには Skilja からの別のライセンスが必要です。

機能

高度な分類子パッケージは、以下の機能を提供します。

モデルのトレーニング
モデルを作成し、そのモデルをトレーニングしてドキュメントやページを分類し、ドキュメントのページを分割できるようにします。
ドキュメントの分類
各ドキュメントの最初のページのレイアウト、コンテンツ、またはその両方に基づいてドキュメント ファイルを個別のフォルダーに分類できます。
ページの分類
ドキュメントのページを個別のフォルダーに分割し、レイアウト、コンテンツ、またはその両方に基づいてページをフィルタリングできます。
ドキュメントを分割
選択した分類モデルに基づいて、ドキュメントのページを異なるフォルダーに分割できます。分類モデルは、さまざまなドキュメント パターンのサンプルを使用し、ドキュメントの最初、中間、および最後のページを分析して、ドキュメントのページを分割するようにトレーニングされます。

高度な分類子を使用してドキュメントを分割し、ドキュメントとページを分類する

ドキュメント分類子ではなく、高度な分類子が必要になるタイミングを教えてください。

高度な分類子パッケージは、次の場合に必要です。

  • 定義済みのルールに基づいて、ドキュメントやページを分類する必要がある場合。たとえば、医療機関が請求書や注文書を含む文書を分類する場合、高度な分類子はキーワードなどの定義済みルールを使用して文書を分類します。高度な分類子は、ドキュメント内の請求書、領収書などのキーワードを識別して請求書を分類し、ドキュメント内の注文書、PO、注文などのキーワードを識別して注文書を分類します。
  • 特定のパターンに基づいて、ドキュメントのページを分割する必要がある場合。たとえば、金融機関が請求書、銀行取引明細書、税フォーム、領収書などを含むドキュメントを分類する場合、高度な分類子はレイアウトやコンテンツなどのパターンを使用してドキュメントを分類し、各タイプのページを分割します。

高度な分類子とドキュメント分類子の違いを理解するには、「高度な分類子とドキュメント分類子の比較」を参照してください。

高度な分類子パッケージおよびそのアクションを使用してドキュメントを処理するには、有効な Skillja (サードパーティ プロバイダー) ライセンスが必要です。ライセンスの詳細を取得するには、contact@scalehub.com にお問い合わせください 。詳細については、「高度な分類子のライセンスを接続する」を参照してください。

高度な分類子パッケージをダウンロードし、パッケージControl Room にアップロードする必要があります。

  • パッケージをダウンロードするには、A-People Downloads page (Login required) フォルダーに移動し、特定の Automation 360 IQ Bot バージョン > [インストールの設定] フォルダーをクリックし、パッケージをダウンロードします。たとえば、bot-command-advanced-classifier-<version>.jar です。
  • パッケージControl Room にアップロードするには、「Control Room に パッケージ を追加」を参照してください。