OCR エンジンの選択

UI からさまざまな OCR エンジンを選択して、ドキュメント タイプに基づくデータ抽出の要件に最適なものを確認できます。エンジン変更を実装するには、IQ Bot サービスの停止と再起動は必要ありません。

IQ Bot のインストール中、システムは Tesseract Optical Character Reader の最新バージョンをデフォルトの OCR エンジンとして設定します。これは、製品のグローバル設定でもあります。

ただし、デフォルトのエンジンとなる OCR エンジンは Settings.txt ファイルで手動で設定することができます。IQ Bot の以前のリリースと同様に、デフォルトとして設定する OCR エンジン名で Settings.txt ファイルを手動で更新できます。

Settings.txt ファイル構成で、廃止バージョンの OCR エンジンまたはサポートされていないエンジンを選択すると、エラー メッセージが表示されます。

ラーニングインスタンスの作成では、UI で直接利用できるドロップダウン リストから OCR エンジンを選択できます。
注: インターフェースで OCR エンジンを選択すると、Settings.txt ファイルの設定が無効になります。

ラーニング インスタンスを作成

手順

  1. [新しいラーニング インスタンスを作成] ページで、ドメインとドキュメントの言語を選択します。
    [ラーニング インスタンス] リスト ページでは、新しい [OCR エンジン] 列が利用でき、各ラーニング インスタンスの作成に使用される OCR エンジンが表示されます。この情報は、ユーザーがドキュメント処理を決定する際に役立ちます。
  2. ドメインを選択すると、[抽出するフィールド] と [詳細設定] セクションが表示されます。
    各ドメインは、主要なサポート言語の定義済みリストで利用できます。言語の選択は有効になっており、特定のドメインでサポートされている言語に基づいて、[ドキュメントの主要言語] ドロップダウン リストから使用できます。
    注: [ドキュメントの主要言語] ドロップダウン リストから言語を選択し、その言語をサポートしていないエンジンを選択すると、[光学式文字認識] ドロップダウン リストにエラー メッセージが表示されます。
  3. [詳細設定] > [光学式文字認識] をクリックして、OCR エンジン オプションのドロップダウン リストを表示します。

    OCR エンジンの選択が無効な場合、[インスタンスを作成して分析] オプションは無効化されます。

    注: IQ Bot は、ABBYY FineReader Engine を除くすべての OCR エンジンを自動的にインストールします。
    重要: Automation 360 IQ Bot On-Premises では、選択した OCR エンジンの設定のみできます。Automation 360 IQ Bot CloudOCR 設定は、ABBYY FineReader Engine 以外はアクセスできないため、編集できません。appConfigurations REST API を使用して、ABBYY FineReader Engine の構成設定を編集できます。

    以下から選択できます。

    オプション説明
    Tesseract OCR4 これは、Settings.txt ファイルで変更されない限り、デフォルトのエンジンです。
    ABBYY FineReader Engine

    使用しているマシンに ABBYY FineReader Engine がインストールされていて使用可能であることを確認するには、Settings.txt ファイル、SDK ファイルの OCR プラグイン フォルダー、および [光学式文字認識] ドロップダウン リストを確認します。

    注: IQ Bot [Local Device] packageおよび IQ Bot Extraction packageでもサポートされています。

    IQ Bot での ABBYY FineReader Engine OCR エンジンの使用

    Microsoft Azure Computer Vision OCR engine IQ Bot は、この OCR エンジンでサポートされているすべての言語をサポートしています。

    Microsoft Azure Computer Vision OCR engine を使用する

    Google Vision API IQ BotGoogle Vision APIOCR エンジンとしてサポートしていて、このエンジンでサポートされるすべての言語をサポートしています。

    Google Vision API OCR エンジンの使用

    Tegaki API IQ Bot は、日本語および韓国語のドキュメントに固有のデータを抽出するのにこの OCR エンジンをサポートしています。Tegaki API を使用するには、プライベート ライセンスをダウンロードして使用する必要があります。
    注: Automation 360 IQ Bot CloudTegaki API OCR エンジンはサポートされていません。

    Tegaki API OCR エンジンを使用する

    PDF ドキュメントに画像はありません

    アップロードしたすべての PDF ドキュメントは、指定または選択した OCR エンジンに関係なく、デフォルトで PDFBox OCR を使用して処理されます。

    PDF 以外のドキュメントまたは画像を含む PDF ドキュメントをアップロードする場合は、[PDF ドキュメントに画像はありません] チェックボックスをオフにして、指定または選択した OCR エンジンがドキュメントの処理に使用されるようにします。

    [PDF ドキュメントには画像がありません] チェック ボックスは、デフォルトで有効になっています。この機能を無効にするに方法については、「PDFBox オプションの無効化」を参照してください。
    ヒント: IQ Bot が低品質のドキュメントや手書きのドキュメントからデータを抽出できない場合は、問題のトラブルシューティングを行ってください。

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)