抽出サービスを確認する

コンテンツの抽出元のドキュメントが Standard Forms であることを確認したら、お客様の要件に合った Standard Forms 抽出サービスのタイプを計画することができます。

Standard Forms を処理するためのテクノロジーは以下のとおりです。

IQ Bot 抽出サービス

これは、OCR とヒューリスティックを使用して Standard Forms からコンテンツを抽出するテンプレートベースの抽出サービスです。Standard Forms につき 1 つのテンプレートをトレーニングする必要があります。

IQ Bot 抽出サービスの使用ガイドライン
  • ドキュメントの品質が高い (300dpi)
  • ドキュメントのコンテンツの密度があまり高くない
  • 入力ドキュメントに手書き部分がない (限定サポート)
  • 現在のところ署名は未サポート
  • はっきりとしたヘッダー、テーブルの境界線などを持つシンプルなテーブル レイアウト (単一ページ内) が含まれている
  • チェックボックスを持つテーブルやコンテンツが含まれていない (限定サポート)
  • セクションの繰り返しがない (限定サポート)
IQ Bot 抽出サービスのメリット
  • すぐに使用できる統合されたシンプルな設定
  • 抽出精度を高めるさまざまな OCR エンジン
  • 特定のケースで複雑なレイアウト (セクションの繰り返し、連続したテーブルなど) を抽出可能 (要テスト)
  • IQ Bot ライセンスのみ必要

Microsoft Azure Form Recognizer サービス

Standard Forms からコンテンツを抽出するためのカスタム ビルドの人工知能 (AI) モデルを提供するサードパーティ テクノロジーです。ドキュメントをラベル付けしてトレーニングできるカスタム モデルを作成できます。

Microsoft Azure Forms Recognizer サービスの使用ガイドライン

  • 入力ドキュメント:
    • 高い密度 (詳細や情報を多く含む) で、ある程度の品質 (200dpi 以上) にすることができる
    • チェックボックスとラジオボタンを含めることができる
    • 手書きコンテンツを含めることができる
    • 署名を含めることができる
    • テーブルを含めることができる

      入力ドキュメントには、1 ページに渡るテーブルが含まれることもあります。しかし、Standard Forms に、複数のページにまたがるテーブルが含まれている場合、コンテンツの抽出に失敗することがあります。

  • 入力ドキュメントのセクションを繰り返すことはできません
  • 転置テーブルを含むドキュメント

Microsoft Azure Forms Recognizer サービスのメリット

  • 多様な Standard Forms タイプのドキュメントを処理できる
  • 自動検出機能により、ヘッダーレス テーブル、反転テーブルなど、さまざまなタイプのテーブルを識別できる
  • 手書きフォームが十分にサポートされる