高度な分類子パッケージ

高度な分類子パッケージでは、ドキュメントをフォルダー構造に分類できます。ドキュメントをフォルダーから各ラーニングインスタンスにアップロードすると、Document Automationでコンテンツを抽出することができます。

注:
  • 高度な分類子パッケージおよび関連するアクションを使用してドキュメントを処理するには、有効な Skillja (サードパーティ プロバイダー) ライセンスが必要です。詳細については、「高度な分類子パッケージの BYOK (Bring Your Own Key) を設定する」を参照してください。
  • ライセンスの詳細については、contact@scalehub.com までお問い合わせください。
  • 高度な分類子パッケージは「IQ Bot ダウンロード」リンクからダウンロードできます。
  • このパッケージを Control Room にアップロードする必要があります。詳細については、「Control Room に パッケージ を追加」を参照してください。

高度な分類子パッケージアクション

パッケージには [高度な分類子をトレーニング]、[ドキュメントの分類]、[ページの分類]、[ドキュメントを分割] アクションが含まれます。これらの アクション を使用してモデル ファイルを作成し、そのファイルを使用してアップロードしたドキュメントを異なるフォルダーに分類できます。これらの アクション は、ドキュメントの前処理機能を果たします。

アクション 説明
高度な分類子をトレーニング [高度な分類子をトレーニング] アクションを使用して、[ドキュメントの分類]、[ページの分類]、[ドキュメントを分割] アクションによって使用されるモデル ファイルを作成し、入力に必要なカテゴリにドキュメントを並べ替えます。詳細については、「[高度な分類子をトレーニング] アクションの使用」を参照してください。
ドキュメントの分類 [ドキュメントの分類] アクションは、[高度な分類子をトレーニング] アクションで作成された特定のモデル ファイルを使用して、各ドキュメントの最初のページに基づいて入力ドキュメントを分類します。詳細については、「[ドキュメントの分類] アクションの使用」を参照してください。
ページの分類 [ページの分類] アクションは、[高度な分類子をトレーニング] アクションを使用して作成されたモデル ファイルに基づいて、入力ドキュメントのページをグループ化し、モデルに適合しないページをフィルタリングします。詳細については、「[ページの分類] アクションの使用」を参照してください。
ドキュメントを分割 [ドキュメントを分割] アクションを使用して、選択した分類モデルに基づいて、入力ドキュメントを複数のドキュメントに分割します。詳細については、「[ドキュメントを分割] アクションの使用」を参照してください。
注:

高度な分類子パッケージは、画像ベースの分類のために Tesseract OCR を利用します。Tesseract OCR でサポートされる言語の詳細なリストについては、「Tesseract OCR のサポート対象言語」を参照してください。