IQ Bot分類アクショングループは、IQ Bot分類子をトレーニング アクションを使用して作成されたモデルファイルに基づいて、入力ドキュメントのページを分類します。
[Botループ] 内で
アクション[分類] を使用して
アクション をビルドし、選択したフォルダー内の各ファイルを繰り返し分類します。
手順
-
アクション
パレットで、[ループ] アクションから [ループ] パッケージをダブルクリックまたはドラッグします。
-
[ループ タイプ] フィールドで、[反復子] オプションを選択します。
-
[反復子] フィールドで、ドロップダウン リストから [フォルダー内の各ファイル] を選択します。
-
[フォルダー パス] フィールドで、入力ファイルを含むフォルダーのパスを選択します。
-
[ファイル名と拡張子をこの変数に代入] フィールドで、ディクショナリ変数を作成するか、選択してファイルの名前と拡張子を選択したフォルダー パスに保存します。
この例では、dictFile という名前のディクショナリ変数を使用することにします。
-
アクション
パレットで、[ドキュメント分類子] アクションから [分類] パッケージをダブルクリックするか、ドラッグします。
-
[入力ファイル] フィールドに、変数を使用する動的ファイル パスを入力します。
-
たとえば C:\input\ などのフォルダーを指すファイル パスを追加します。
-
動的なファイル名文字列 ($dictFile(name)$.$dictFile(extension)$) を追加します。
注: ファイル名を保持する変数と拡張子を保持する変数の間には、必ずピリオドを含めてください。
name キーと extension キーは事前定義されています。 アクション を挿入してループで実行すると、フォルダー全体で反復し、フォルダー内のすべてのファイルが 1 つずつ呼び出されます。 [入力ファイル] の値は次のようになります: C:\input\$dictFile(name)$.$dictFile(extension)$
-
[クラシファイア] フィールドで、モデル ファイルのファイル パスを指定します。
.zip フォルダーを選択するか、このフォルダーから
.icmf ファイルを抽出して選択します。
注: 分類の結果およびパフォーマンスを向上させるには、[クラシファイアをトレーニング]
から取得した .zip フォルダーにある .icmf
アクション ファイルを使用することをお勧めします。
-
[出力フォルダー パス] オプションを使用して、分類出力ドキュメントを保存します。
- オプション:
次の [詳細設定] を構成します。
-
信頼度に基づくしきい値 (%): ページのカテゴリ予測の信頼度の値が信頼度のしきい値未満の場合は、Unclassified フォルダーに移動されます。
-
分類出力変数を保存: 分類結果を、次のキーを使用してディクショナリのリストとして保存します。
- fileName
- pageIndex
- category
- confidence
注:
-
ドキュメント分類子 で分類のタイプを次のように選択できます。
- 画像ベースの分類
- テキストベースの分類
- 画像ベースとテキストベースの両方の分類
- より高い信頼度に基づくしきい値を予測するために、ドキュメント ページが類似している場合に信頼度に基づくしきい値を計算することをお勧めします。 必要な信頼度に基づくしきい値を決定するために、分類出力から信頼度に基づく値を確認できます。
-
ドキュメント分類子 は、分類のための言語を自動検出することができ、ABBYY (光学式文字認識アプリケーション) が対応するすべての言語をサポートしています。
-
保存、実行 の順にクリックします。
出力ドキュメントのページは、モデル ファイルで作成されたカテゴリに基づいて、それぞれのサブフォルダーに保存されます。 出力フォルダー内の以前に分類されたドキュメントはすべて上書きされます。
次のステップ
類似したドキュメントの各サブフォルダーを使用して、ドキュメントからデータを抽出するラーニングインスタンスを作成およびトレーニングできます。 「ラーニングインスタンスの作成」を参照してください。