使用事例の評価

コンテンツ抽出モデルは、特定の種類のドキュメントからデータを抽出するために IQ Bot に統合できます。

Standard Forms の使用を進める前に、使用事例を評価し、Standard Forms からのコンテンツ抽出が要件を満たしているかどうかを判断します。以下の質問を参考に、お客様の使用事例で Standard Forms の処理が必要かどうかを判断します。

Standard Forms とは何ですか?
定義されたテンプレートを持つ固定フォーマット タイプのドキュメント。レイアウト全体のバリエーションはほとんどないか、まったくありません。標準フォームは構造化ドキュメントとも呼ばれ、一般に情報密度が高いことが特徴で、通常は公的または法的ドキュメントです。次の表は、Standard Forms の例を示しています。
税フォーム 医療フォーム 法的フォーム
サンプル税フォーム サンプル医療フォーム 法的フォーム
ドキュメントのレイアウトはベンダーごとに異なりますか?
異なる場合、Standard Forms を使ったコンテンツ抽出のこの使用事例は、最良の選択肢ではありません。
各種データ要素 (チェックボックス、テーブルなど) の位置はドキュメント内で固定されていますか?
固定されていない場合、これらは Standard Forms ではないため、このタイプのコンテンツ抽出は適していません。
ドキュメントは動的フォームですか? たとえば、値が他のデータ要素に依存しているドキュメントがあるとします。
その場合、そのようなドキュメントのコンテンツは、Standard Forms のコンテンツ抽出を使用して処理できません。
サポートされている言語のドキュメントですか?
Language support: document analysis」を参照してください。サポート言語でない場合、ドキュメントは Standard Forms として処理できません。
ドキュメントに繰り返しセクションはありますか?
ある場合、これは Standard Forms の使用事例ではありません。ただし、このような繰り返しセクションの数が固定されており、ドキュメント間で違いがない場合、Standard Forms として処理できます。
ドキュメントには、行と列の数が異なるテーブルが含まれていますか?
含まれている場合、これらのドキュメントは Standard Forms と見なされません。Standard Forms では、行と列の数が固定されていなければなりません。
年度ごとに異なるドキュメント レイアウトを Standard Forms と見なすことはできますか? たとえば、2020 年の W-4 ドキュメントと 2021 年の W-4 ドキュメントはどうですか?
ドキュメント レイアウトが同一年度内や組織間で変化しない場合、Standard Forms と見なすことができます。年度ごとにレイアウトが異なる場合、それらのドキュメントを処理するには異なる Standard Forms モデルを使用する必要があります。