Google Vision API OCR エンジンの使用

IQ BotGoogle Vision API OCR エンジンを使用することで、特に日本語や韓国語などのアジア言語のトレーニング ドキュメントで光学式文字認識 (OCR) 結果の精度を向上させることができます。 IQ BotGoogle Vision API OCR エンジンは、エンジンがサポートするすべての言語をサポートします。

前提条件

TCP を使用した API エンドポイントの通信を有効にするためにデフォルトのポート 443 が使用可能であることを確認します。

注: 以下の例のセクションで、Google Vision API を使用するために許可されているサービス URL のリストを参照してください。
Google Vision API ファイルは、IQ Bot のインストール中にマシンに自動的にインストールされ、内蔵プラグインとして提供され、シングルステップでインストールできます。これは、すべてのユーザーが使用できます。
  • これはクラウド OCR エンジンです。
  • Google Vision API は、複数の言語を含むドキュメントをサポートしていません。この機能を使用する前に、主に日本語または韓国語のテキストのみを抽出することを確認してください。
  • 左から右ではなく、右から左に書かれている言語は、ドキュメント抽出は IQ Bot ではサポートされていません。たとえば、アラビア語、アラム語、アゼリ語、ディベヒ語、フラ語、ヘブライ語、クルド語、ンコ語、ペルシャ語、ロヒンギャ語、シリア語、ウルドゥー語です。

    このリリース以前は、エンジンは主に日本語と韓国語のテキストのデータ抽出のみをサポートしていました。

    Automation 360 IQ Bot でサポートされている言語

  • データは Google Cloud に保存されず、直ちに削除されます。

    データ保持のプライバシーに関する詳細については、Google Data Usage を参照してください。

IQ Bot は、Google Vision API OCR エンジンを使用するためのライセンスを提供します。また、独自のライセンスキーを使用することもできます。

Google Vision API OCR エンジン用の独自のライセンスキーの使用

注: OCR エンジンの改良、機能強化、バグ修正など、Google Vision API の更新により、IQ Bot でこの OCR エンジンを使用したときのコンテンツ抽出に影響が及ぶ可能性があります。そのため、定期的に Google Vision API のリリース ノートで、最新の更新を確認することをお勧めします。

Google Vision API OCR のアップグレードによる影響」を参照してください。

この OCR エンジン使用する際は、次のオプションを使用できます。
オプション 説明
オプション 1: Google Vision API をデフォルト エンジンとして設定 Settings.txt ファイルを構成します。
制約事項: settings.txt ファイルの構成は、Automation 360 IQ Bot クラウド には該当しません
オプション 2: ラーニングインスタンスの作成時に UI から直接 Google Vision API エンジンを選択 OCR エンジンの選択

手順

Google Vision API をデフォルトの OCR エンジンとして設定するには、次のように Settings.txt ファイルを構成します。

制約事項: settings.txt ファイルの構成は、Automation 360 IQ Bot クラウド には該当しません

  1. IQ Bot インストーラーを実行します。
  2. オプション: 新しいラーニングインスタンスのデフォルトの OCR として Google Vision API を設定します。
    ..\Automation 360 IQ Bot\Configurations\Settings.txt に移動し、次の値を変更します。OCREngine=GoogleVisionAPI
    ご使用の環境のデフォルト エンジンとして Google Vision API OCR エンジンが設定されます。
  3. GoogleOCREngineSettings.json ファイルは、..\Automation 360 IQ Bot\Configurations フォルダー内で以下のデフォルト値で生成されます。
    以下を Google Vision API で使用します。
    {
      "ADCJson": null,
      "EngineType": 2,
      "EnableFieldMerging": true,
      "EnableFieldRegions": true,
      "DebuggingFolder": "C:\\Users\\Public\\Documents\\Automation 360 IQBot Platform\\Logs\\Engine\\Google"
     }
  4. 日本語と韓国語のドキュメントの場合、次のフィールドを更新します。"EnableCustomParse": true
    注: 変更を行った後、サービスを再起動する必要はありません。
Google Vision API に使用されるサービス URL のリスト (オプション)
必要に応じて、次の許可された URL を使用します。
注: すべての URL は、米国のグローバル サービス リージョンを指しています。
  • API URL: https://vision.googleapis.com/
  • 認証 URL: https://accounts.google.com/o/oauth2/auth
  • トークン URL: https://oauth2.googleapis.com/token
  • 認証プロバイダ URL: https://www.googleapis.com/oauth2/v1/certs
  • クライアント認証 URL: https://www.googleapis.com/robot/v1/metadata/x509

次のステップ

  1. トレーニングを希望するアジア言語のドキュメントを使用して新しいラーニングインスタンスを作成します。
  2. ドキュメントでトレーニングし、ラーニングインスタンスを本番に設定します。
  3. アジア言語のファイルをアップロードし、Bot を実行します。
  4. 抽出結果をダウンロードして精度を確認します。