Google Vision API OCR エンジンの使用
- 最終更新日2021/09/21
Google Vision API OCR エンジンの使用
IQ Bot で Google Vision API OCR エンジンを使用することで、特に日本語や韓国語などのアジア言語のトレーニング ドキュメントで光学式文字認識 (OCR) 結果の精度を向上させることができます。 IQ Bot の Google Vision API OCR エンジンは、エンジンがサポートするすべての言語をサポートします。
前提条件
TCP を使用した API エンドポイントの通信を有効にするためにデフォルトのポート 443 が使用可能であることを確認します。
注: 以下の例のセクションで、Google Vision API を使用するために許可されているサービス URL のリストを参照してください。
Google Vision API ファイルは、IQ Bot のインストール中にマシンに自動的にインストールされ、内蔵プラグインとして提供され、シングルステップでインストールできます。これは、すべてのユーザーが使用できます。
- これはクラウド OCR エンジンです。
- Google Vision API は、複数の言語を含むドキュメントをサポートしていません。この機能を使用する前に、主に日本語または韓国語のテキストのみを抽出することを確認してください。
- 左から右ではなく、右から左に書かれている言語は、ドキュメント抽出は IQ Bot ではサポートされていません。たとえば、アラビア語、アラム語、アゼリ語、ディベヒ語、フラ語、ヘブライ語、クルド語、ンコ語、ペルシャ語、ロヒンギャ語、シリア語、ウルドゥー語です。
このリリース以前は、エンジンは主に日本語と韓国語のテキストのデータ抽出のみをサポートしていました。
- データは Google Cloud に保存されず、直ちに削除されます。
データ保持のプライバシーに関する詳細については、Google Data Usage を参照してください。
IQ Bot は、Google Vision API OCR エンジンを使用するためのライセンスを提供します。また、独自のライセンスキーを使用することもできます。
Google Vision API OCR エンジン用の独自のライセンスキーの使用
注:
OCR エンジンの改良、機能強化、バグ修正など、Google Vision API の更新により、IQ Bot でこの OCR エンジンを使用したときのコンテンツ抽出に影響が及ぶ可能性があります。そのため、定期的に Google Vision API のリリース ノートで、最新の更新を確認することをお勧めします。
「Google Vision API OCR のアップグレードによる影響」を参照してください。
この OCR エンジン使用する際は、次のオプションを使用できます。
オプション | 説明 |
---|---|
オプション 1: Google Vision API をデフォルト エンジンとして設定 |
Settings.txt ファイルを構成します。 制約事項:
settings.txt ファイルの構成は、Automation 360 IQ Bot
クラウド には該当しません
|
オプション 2: ラーニングインスタンスの作成時に UI から直接 Google Vision API エンジンを選択 | OCR エンジンの選択 |
手順
Google Vision API をデフォルトの OCR エンジンとして設定するには、次のように Settings.txt ファイルを構成します。
制約事項:
settings.txt ファイルの構成は、Automation 360 IQ Bot
クラウド には該当しません
Google Vision API に使用されるサービス URL のリスト (オプション)
必要に応じて、次の許可された URL を使用します。
注: すべての URL は、米国のグローバル サービス リージョンを指しています。
- API URL: https://vision.googleapis.com/
- 認証 URL: https://accounts.google.com/o/oauth2/auth
- トークン URL: https://oauth2.googleapis.com/token
- 認証プロバイダ URL: https://www.googleapis.com/oauth2/v1/certs
- クライアント認証 URL: https://www.googleapis.com/robot/v1/metadata/x509
次のステップ
- トレーニングを希望するアジア言語のドキュメントを使用して新しいラーニングインスタンスを作成します。
- ドキュメントでトレーニングし、ラーニングインスタンスを本番に設定します。
- アジア言語のファイルをアップロードし、Bot を実行します。
- 抽出結果をダウンロードして精度を確認します。