Google Vision API OCR エンジンの使用
- 最終更新日2020/09/30
Google Vision API OCR エンジンの使用
IQ Bot Version 11.3.4 とパッチで Google Vision API OCR エンジンのベータ バージョンを使用して、特に日本語や韓国語などのアジア言語のトレーニングドキュメントで光学式文字認識 (OCR) 結果の精度を向上させることができます。 Google Vision API(GA) IQ Bot Version 11.3.5 の OCR エンジンは、エンジンがサポートするすべての言語をサポートします。
前提条件
TCP を使用した API エンドポイントの通信を有効にするためにデフォルトのポート 443 が使用可能であることを確認します。
注: 以下の例のセクションで、Google Vision API を使用するために許可されているサービス URL のリストを参照してください。
Google Vision API ファイルは、IQ Bot のインストール中にマシンに自動的にインストールされ、内蔵プラグインとして提供され、シングルステップでインストールできます。これは、すべてのユーザーが使用できます。
- これはクラウド OCR エンジンです。
- (ベータ) Google Vision API は、複数の言語を含むドキュメントをサポートしていません。この機能を使用する前に、主に日本語または韓国語のテキストのみを抽出することを確認してください。
- IQ Bot Version 11.3.5 は、Google Vision API OCR エンジンでサポートされているすべての言語をサポートしています。注: 左から右ではなく、右から左に書かれている言語は、ドキュメント抽出は IQ Bot ではサポートされていません。たとえば、アラビア語、アラム語、アゼリ語、ディベヒ語、フラ語、ヘブライ語、クルド語、ンコ語、ペルシャ語、ロヒンギャ語、シリア語、ウルドゥー語です。
このリリース以前は、エンジンは主に日本語と韓国語のテキストのデータ抽出のみをサポートしていました。
- データは Google Cloud に保存されず、直ちに削除されます。
データ保持のプライバシーに関する詳細については、Google Data Usage を参照してください。
IQ Bot は、Google Vision API OCR エンジンを使用するためのライセンスを提供します。また、独自のライセンスキーを使用することもできます。
Google Vision API OCR エンジン用の独自のライセンスキーの使用
この OCR エンジン使用する際は、次のオプションを使用できます。
オプション | 説明 |
---|---|
オプション 1: Google Vision API をデフォルト エンジンとして設定 | Settings.txt ファイルを構成します。 |
オプション 2: ラーニングインスタンスの作成時に UI から直接 Google Vision API エンジンを選択 | OCR エンジンの選択 |
手順
Google Vision API をデフォルトの OCR エンジンとして設定するには、次のように Settings.txt ファイルを構成します。
Google Vision API に使用されるサービス URL のリスト (オプション)
必要に応じて、次の許可された URL を使用します。
注: すべての URL は、米国のグローバル サービス リージョンを指しています。
- API URL: https://vision.googleapis.com/
- 認証 URL: https://accounts.google.com/o/oauth2/auth
- トークン URL: https://oauth2.googleapis.com/token
- 認証プロバイダー URL: https://www.googleapis.com/oauth2/v1/certs
- クライアント認証 URL: https://www.googleapis.com/robot/v1/metadata/x509
次のステップ
- トレーニングを希望するアジア言語のドキュメントを使用して新しいラーニングインスタンスを作成します。
- ドキュメントでトレーニングし、ラーニングインスタンスを本番に設定します。
- アジア言語のファイルをアップロードし、bot を実行します。
- 抽出結果をダウンロードして精度を確認します。