OCR エンジンの選択

ドキュメント タイプに基づくデータ抽出の要件に最適な OCR エンジンを選択できます。エンジン変更を実装するには、IQ Bot サービスの再起動は必要ありません。

IQ Bot のインストール中、システムは Tesseract Optical Character Reader の最新バージョンをデフォルトの OCR エンジンとして設定します。これは、製品のデフォルト設定でもあります。ただし、デフォルトのエンジンとなる OCR エンジンは Settings.txt ファイルで手動で設定することができます。IQ Bot の以前のリリースと同様に、デフォルトとして設定する OCR エンジン名で Settings.txt ファイルを手動で更新できます。

ラーニングインスタンス作成時に、[光学式文字認識] のドロップダウン メニューから OCR のエンジンを選択できます。「ラーニングインスタンスの作成」を参照
注: インターフェースで OCR エンジンを選択すると、Settings.txt ファイルの設定が無効になります。

IQ Bot でサポートされている各種 OCR エンジンとそれに対応するオプションのリストを次の表に示します。

表 1. OCR エンジンとその仕様のリスト
対象エンジン OCR バージョン サポートされているインストール 手書き サポートされている言語 ドキュメント品質 ドキュメント タイプ
Tesseract OCR 4 CloudOn-Premises 該当なし

英語

ドイツ語

スペイン語

イタリア語

フランス語

ノイズがない

暗い背景がない

スタンプ/ウォーターマークなし

200dpi 以上

請求書、PO など

半構造化形式

ABBYY FineReader エンジン 12.3 または 12.4 CloudOn-Premises 該当なし

英語

すべてのラテン系言語

中国語

日本語

韓国語

ノイズが少ない

暗い背景と白いフォント

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

住宅ローン関連用紙、税申告用紙

非構造化形式

Microsoft Azure Computer Vision OCR エンジン 2.0 または 3.2 CloudOn-Premises 英語のみ

英語

すべてのラテン系言語

中国語

日本語

韓国語

ノイズが少ない

暗い背景

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

パスポート、運転免許証など

KYC ドキュメント

Google Vision API バージョンは現在のリリースと一致するように自動的に更新されます CloudOn-Premises 該当なし

英語

すべてのラテン系言語

アジア系言語

ノイズが少ない

暗い背景

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

住宅ローン関連用紙、税申告用紙

非構造化形式

手順

  1. [新しいラーニングインスタンスを作成] ページで、ドメインとドキュメントの言語を選択します。
    [ラーニングインスタンス] リスト ページでは、新しい [OCR エンジン] 列が利用でき、各ラーニングインスタンスの作成に使用される OCR エンジンが表示されます。この情報は、ユーザーがドキュメント処理を決定する際に役立ちます。
  2. ドメインを選択すると、[抽出するフィールド] と [詳細設定] セクションが表示されます。
    各ドメインは、主要なサポート言語の定義済みリストで利用できます。言語の選択は有効になっており、特定のドメインでサポートされている言語に基づいて、[ドキュメントの主要言語] ドロップダウン リストから使用できます。
    注: [ドキュメントの主要言語] ドロップダウン リストから言語を選択し、その言語をサポートしていないエンジンを選択すると、[光学式文字認識] ドロップダウン リストにエラー メッセージが表示されます。
  3. [詳細設定] > [光学式文字認識] をクリックして、OCR エンジン オプションのドロップダウン リストを表示します。

    OCR エンジンの選択が無効な場合、[インスタンスを作成して分析] オプションは無効化されます。

    注: IQ Bot は、ABBYY FineReader エンジン を除くすべての OCR エンジンを自動的にインストールします。
    重要: Automation 360 IQ Bot On-Premises では、選択した OCR エンジンの設定のみできます。Automation 360 IQ Bot CloudOCR 設定は、ABBYY FineReader エンジン 以外はアクセスできないため、編集できません。appConfigurations REST API を使用して、ABBYY FineReader エンジン の構成設定を編集できます。

    以下から選択できます。

    オプション説明
    Tesseract OCR 4 これは、Settings.txt ファイルで変更されない限り、デフォルトのエンジンです。
    ABBYY FineReader エンジン

    使用しているマシンに ABBYY FineReader エンジン がインストールされていて使用可能であることを確認するには、Settings.txt ファイル、SDK ファイルの OCR プラグイン フォルダー、および [光学式文字認識] ドロップダウン リストを確認します。

    注: IQ Bot [Local Device] packageおよび IQ Bot Extraction packageでもサポートされています。

    IQ Bot での ABBYY FineReader エンジン OCR エンジンの使用

    Microsoft Azure Computer Vision OCR エンジン IQ Bot は、この OCR エンジンでサポートされているすべての言語をサポートしています。

    Microsoft Azure Computer Vision OCR エンジン を使用する

    Google Vision API IQ BotGoogle Vision APIOCR エンジンとしてサポートしていて、このエンジンでサポートされるすべての言語をサポートしています。

    Google Vision API OCR エンジンの使用

    PDF ドキュメントに画像はありません

    アップロードしたすべての PDF ドキュメントは、指定または選択した OCR エンジンに関係なく、デフォルトで PDFBox OCR を使用して処理されます。

    PDF 以外のドキュメントまたは画像を含む PDF ドキュメントをアップロードする場合は、[PDF ドキュメントに画像はありません] チェックボックスをオフにして、指定または選択した OCR エンジンがドキュメントの処理に使用されるようにします。

    [PDF ドキュメントには画像がありません] チェック ボックスは、デフォルトで有効になっています。この機能を無効にするに方法については、「PDFBox オプションの無効化」を参照してください。
    ヒント: IQ Bot が低品質のドキュメントや手書きのドキュメントからデータを抽出できない場合は、問題のトラブルシューティングを行ってください。

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

    注: 以下のファイルを使用して、OCR の設定を変更します。
    • AbbyyImagePreProcessingSettings.json
    • LangugeCodeToAbbyyLanguageCode.json
    • Azure3OCREngineSettings.json
    • GoogleOCREngineSettings.json
    • AzureOCREngineSettings.json
    How to change OCR Settings in IQ Bot (A-People login required)