抽出サービスを確認する
- 最終更新日2024/05/17
抽出サービスを確認する
コンテンツの抽出元のドキュメントが Standard Forms であることを確認したら、お客様の要件に合った Standard Forms 抽出サービスのタイプを計画することができます。
Standard Forms を処理するためのテクノロジーは以下のとおりです。
IQ Bot 抽出サービス
これは、OCR とヒューリスティックを使用して Standard Forms からコンテンツを抽出するテンプレートベースの抽出サービスです。Standard Forms につき 1 つのテンプレートをトレーニングする必要があります。
IQ Bot 抽出サービスの使用ガイドライン
- ドキュメントの品質が高い (300dpi)
- ドキュメントのコンテンツの密度があまり高くない
- 入力ドキュメントに手書き部分がない (限定サポート)
- 現在のところ署名は未サポート
- はっきりとしたヘッダー、テーブルの境界線などを持つシンプルなテーブル レイアウト (単一ページ内) が含まれている
- チェックボックスを持つテーブルやコンテンツが含まれていない (限定サポート)
- セクションの繰り返しがない (限定サポート)
IQ Bot 抽出サービスのメリット
- すぐに使用できる統合されたシンプルな設定
- 抽出精度を高めるさまざまな OCR エンジン
- 特定のケースで複雑なレイアウト (セクションの繰り返し、連続したテーブルなど) を抽出可能 (要テスト)
- IQ Bot ライセンスのみ必要
Azure AI Document Intelligence サービス
Standard Forms からコンテンツを抽出するためのカスタム ビルドの人工知能 (AI) モデルを提供するサードパーティ テクノロジーです。ドキュメントをラベル付けしてトレーニングできるカスタム モデルを作成できます。
Azure AI Document Intelligence サービスの使用ガイドライン
- 入力ドキュメント:
- 高い密度 (詳細や情報を多く含む) で、ある程度の品質 (200dpi 以上) にすることができる
- チェックボックスとラジオボタンを含めることができる
- 手書きコンテンツを含めることができる
- 署名を含めることができる
- テーブルを含めることができる
入力ドキュメントには、1 ページに渡るテーブルが含まれることもあります。しかし、Standard Forms に、複数のページにまたがるテーブルが含まれている場合、コンテンツの抽出に失敗することがあります。
- 入力ドキュメントのセクションを繰り返すことはできません
- 転置テーブルを含むドキュメント
Azure AI Document Intelligence サービスのメリット
- 多様な Standard Forms タイプのドキュメントを処理できる
- 自動検出機能により、ヘッダーレス テーブル、反転テーブルなど、さまざまなタイプのテーブルを識別できる
- 手書きフォームが十分にサポートされる