分類子について
- 最終更新日2022/02/03
分類子について
ドキュメントがどのように分類されるのか、また分類に影響を与える要因について学びます。
ラーニングインスタンスにドキュメントがアップロードされると、分類子は、レイアウト (ページ上のフィールドの表示順) に基づいてドキュメントをドキュメント グループに分類します。本番環境のラーニングインスタンスにドキュメントがアップロードされ、そのドキュメントがどのドキュメント グループのレイアウトとも一致しない場合、分類子はそのドキュメントのために新しいグループを作成します。
次の図は、アップロードされた請求書のうち、特定のフィールドを含むものが、請求書上のフィールドの表示順に応じて、3 つのグループにどのように分類されるかを示しています。
また、手動でドキュメント グループを定義して、同一のレイアウトを持つすべてのドキュメントを処理することもできます。この場合は、IQ Bot は分類子をバイパスして、アップロードされたドキュメントと同じレイアウトで作成したグループにドキュメントを送ります。このオプションは、OCR がドキュメントの 1 つまたは複数のフィールドの検出に失敗し、分類子が不必要に新しいドキュメントグループを作成したり、ドキュメントを誤ったグループに送信したりする場合に有効です。「新しいドキュメント グループの作成」を参照してください。
注: ユーザーが作成したドキュメント グループは削除できません。
分類子は、RPA Bots と ドキュメント分類子
パッケージ によりサポートされています。また、さまざまなドキュメント タイプの識別とソートを自動化する アクション が含まれています。「ドキュメント分類子 パッケージ」を参照してください。リソース
分類子の仕組みや使い方については、以下のビデオをご覧ください。
デフォルト ドメインまたはカスタム ドメインで作成されたラーニングインスタンス
IQ Bot は、ドキュメントを正常に分類するために選択したフィールドの最小数を確認します。それ以外の場合、ドキュメントは未分類としてマークされます。
次に例を示します。
- 1 ~ 4 個のフィールドを選択して新しいラーニングインスタンスを作成する場合、IQ Bot はその特定のラーニングインスタンスに表示されるフィールドの合計数から少なくとも 4 個のフィールドを確認します。同様に、5 個のフィールドを選択してラーニングインスタンスを作成する場合は、IQ Bot は少なくとも 5 個のフィールドを確認します。
- 6 個以上のフィールドを選択してラーニングインスタンスを作成する場合は、IQ Bot は少なくとも 6 個のフィールドを確認します。たとえば、請求書ドメインで 8 個のフィールドを選択した場合、IQ Bot は使用可能なすべてのフィールドのうち少なくとも 6 個のフィールドを確認します。
他のドメインで作成されたラーニングインスタンス
複数のフィールドでラーニングインスタンスを作成する場合、IQ Bot は少なくとも 1 個のフィールドを確認し、ドキュメントを分類します。いずれのフィールドも IQ Bot で検出されない場合、そのドキュメントは未分類としてマークされます。
分類に影響する要素
要素 | 注 |
---|---|
ページ レイアウト | ページ レイアウトがドキュメント コンテンツの位置に関して元のドキュメントと異なる場合、IQ Bot はドキュメントを別のグループに送信します。 |
ラベルの向き | ドキュメント内のすべてのラベルは、同じ方向に向いている必要があります。一部のラベルが垂直で、一部が水平の場合、ドキュメントは別のグループに送信されます。 |
ラベルの位置 | ラベルはページ上の任意の場所に配置できます。ただし、ラベルの順序 (左から右、上から下) は、トレーニング ドキュメントと同じである必要があります。 |
一致率 | IQ Bot はラベルに 70% の一致を使用します。 |
ラーニングインスタンスの作成後に追加されるフィールド | ラーニングインスタンスの作成後に追加されたフィールドは、分類プロセスから除外されます。 |