高度な分類子パッケージ
- 最終更新日2024/12/03
高度な分類子パッケージ
高度な分類子パッケージでは、ドキュメントをフォルダー構造に分類できます。 ドキュメントをフォルダーから各ラーニングインスタンスにアップロードすると、ドキュメント オートメーションでコンテンツを抽出することができます。
注:
- A-People ダウンロード ポータル パッケージ から高度な分類子A-People Downloads page (Login required)をダウンロードします。 このパッケージを入手するには、特定の Automation 360 IQ Bot バージョン > [インストールの設定] をクリックし、パッケージをダウンロードします。 たとえば、bot-command-advanced-classifier-<version>.jar です。
- このパッケージを Control Room にアップロードする必要があります。 詳細については、「Control Room に パッケージ を追加」を参照してください。
- 高度な分類子パッケージ アクションを使用する場合は、入力パスと出力パスに以下が含まれていないことを確認してください。
- 連続した特殊文字。 例えば、C:\Documents and Settings\user1\My Documents\AdvanceClassifier-_@#!^&()=+-~`][12。
- パスで使用されるフォルダー名には、次の文字は含まれません: , \' #.
高度な分類子アクションのパッケージ
パッケージには [高度な分類子をトレーニング]、[ドキュメントの分類]、[ページの分類]、[ドキュメントを分割] アクションが含まれます。 これらの アクション を使用してモデル ファイルを作成し、そのファイルを使用してアップロードしたドキュメントを異なるフォルダーに分類できます。 これらの アクション は、ドキュメントの前処理機能を果たします。
アクション | 説明 |
---|---|
高度な分類子をトレーニング | [高度な分類子をトレーニング] アクションを使用して、[ドキュメントの分類]、[ページの分類]、[ドキュメントを分割] アクションによって使用されるモデル ファイルを作成し、入力に必要なカテゴリにドキュメントを並べ替えます。 詳細については、「[高度な分類子をトレーニング] アクションの使用」を参照してください。 |
ドキュメントの分類 | [ドキュメントの分類] アクションは、[高度な分類子をトレーニング] アクションで作成された選択されたモデルファイルを使用して、各ドキュメントの最初のページに基づいて入力ドキュメントを分類します。 詳細については、「[ドキュメントの分類] アクションの使用」を参照してください。 |
ページの分類 | [ページの分類] アクションは、[高度な分類子をトレーニング] アクションを使用して作成されたモデル ファイルに基づいて、入力ドキュメントのページをグループ化し、モデルに適合しないページをフィルタリングします。 詳細については、「[ページの分類] アクションの使用」を参照してください。 |
ドキュメントを分割 | [ドキュメントを分割] アクションを使用して、選択した分類モデルに基づいて、入力ドキュメントを複数のドキュメントに分割します。 詳細については、「[ドキュメントを分割] アクションの使用」を参照してください。 |
注:
高度な分類子パッケージは、画像ベースの分類のために Tesseract OCR を利用します。 Tesseract OCR でサポートされる言語の詳細なリストについては、「Tesseract OCR のサポート対象言語」を参照してください。