Google Vision API OCR のアップグレードによる影響

Google Vision API OCR はクラウド ベースで、通常、Google のリリース サイクルに合わせて新しいバージョンにアップグレードされます。このアップグレードに伴い、IQ Bot でのドキュメント抽出処理および抽出結果に影響が生じる可能性があります。

Google Vision API OCR の更新後の IQ Bot におけるドキュメント分類に対する影響

ドキュメントは、OCR 結果、特にフィールドの検出順序に基づいて分類されます。したがって、OCR 結果の内容が異なると、以前に処理された類似のドキュメントの分類結果に基づきドキュメント抽出を行う際に、明らかな差異が生じることがあります。

自動アップグレードが Classifier サービスに与える影響には、以下の 2 種類があります。
  • ドキュメントに異なるグループが割り当てられる: 処理されたドキュメントが、これまでとは異なるグループに割り当てられます。その結果、以前はうまくいっていたデータ抽出が失敗することがあります。
  • 新しいグループが作成される: 以前はあるグループとして処理されていたドキュメントが、新たに作成されたグループに割り当てられることがあります。

Google Vision API OCR の更新後の IQ Bot におけるデータ抽出に対する影響

OCR 出力が変わると、類似のドキュメント タイプからのデータ抽出で以下のような差異が生じることがあります。

  • 文字認識の性能向上とそれに伴う影響: キーワードの文字認識の性能が向上すると、以前は認識できなかったドキュメント内の値をより高精度に抽出できるようになります。
    注: 文字が検出できなかった場合の修正処理ロジックが組み込まれていると、ドキュメントの処理時に問題が生じることがあります。
  • 文字認識の性能低下とそれに伴う影響: OCR 出力の性能低下によりドキュメントの検証に失敗すると、ドキュメントは検証ツールへと転送されます。検証の設定が行われていない場合は、抽出されたデータ出力の品質が低下することがあります。

影響緩和のための選択肢

前述の問題が発生した場合の対策として、以下のような選択肢があります。

  • 既存のラーニングインスタンスの再トレーニングを行い、ドキュメント分類の問題を修正します。
  • Python を使用して、抽出結果に対する影響を緩和するための処理ロジックを記述します。
  • IQ Bot がサポートするさまざまな OCR プロバイダーを使用してラーニングインスタンスを作成し、評価します。
  • Automation Anywhere でサポート チケットを発行します。