OCR エンジンの選択

ドキュメント タイプに基づくデータ抽出の要件に最適な OCR エンジンを選択できます。 エンジン変更を実装するには、IQ Bot サービスの再起動は必要ありません。

IQ Bot のインストール中、システムは Tesseract Optical Character Reader の最新バージョンをデフォルトの OCR エンジンとして設定します。 これは、製品のデフォルト設定でもあります。 ただし、デフォルトのエンジンとなる OCR エンジンは Settings.txt ファイルで手動で設定することができます。 IQ Bot の以前のリリースと同様に、デフォルトとして設定する エンジン名で OCRSettings.txt ファイルを手動で更新できます。

ラーニングインスタンス作成時に、OCR[光学式文字認識] のドロップダウン メニューから のエンジンを選択できます。 [ラーニングインスタンスの作成]を参照してください。
注:
  • インターフェースで OCR エンジンを選択すると、Settings.txt ファイルの設定が無効になります。
  • OCR Automation 360 IQ Bot でサポートされている Cloud エンジンの最新バージョンは常に使用できますが、特定の OCR バージョンを選択することはできません。

OCR でサポートされている各種 IQ Bot エンジンとそれに対応するオプションのリストを次の表に示します。

表 1. OCR エンジンとその仕様のリスト
対象エンジン OCR バージョン サポートされているインストール 手書き サポートされている言語 ドキュメント品質 ドキュメント タイプ
Tesseract OCR 4 CloudOn-Premises 該当なし

英語

ドイツ語

スペイン語

イタリア語

フランス語

ノイズがない

暗い背景がない

スタンプ/ウォーターマークなし

200dpi 以上

請求書、PO など

半構造化形式

ABBYY FineReader エンジン 12.3 または 12.4 CloudOn-Premises 該当なし

英語

すべてのラテン系言語

中国語 (繁体字)

日本語

韓国語

ノイズが少ない

暗い背景と白いフォント

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

住宅ローン関連用紙、税申告用紙

非構造化形式

Microsoft Azure Computer Vision OCR エンジン 2.0 または 3.2 CloudOn-Premises 英語のみ

英語

すべてのラテン系言語

中国語 (繁体字)

日本語

韓国語

ノイズが少ない

暗い背景

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

パスポート、運転免許証など

KYC ドキュメント

Google Vision API バージョンは現在のリリースと一致するように自動的に更新されます CloudOn-Premises 該当なし

英語

すべてのラテン系言語

アジア系言語

ノイズが少ない

暗い背景

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

住宅ローン関連用紙、税申告用紙

非構造化形式

手順

  1. [新しいラーニング インスタンスを作成] ページで、ドメインとドキュメントの言語を選択します。
    [ラーニングインスタンス] リスト ページでは、新しい [OCR エンジン] 列が利用でき、各ラーニングインスタンスの作成に使用される OCR エンジンが表示されます。 この情報は、ユーザーがドキュメント処理を決定する際に役立ちます。
  2. ドメインを選択すると、[抽出するフィールド][詳細設定] セクションが表示されます。
    各ドメインは、主要なサポート言語の定義済みリストで利用できます。 言語の選択は有効になっており、特定のドメインでサポートされている言語に基づいて、[ドキュメントの主要言語] ドロップダウン リストから使用できます。
    注: [ドキュメントの主要言語] ドロップダウン リストから言語を選択し、その言語をサポートしていないエンジンを選択すると、[光学式文字認識] ドロップダウン リストにエラー メッセージが表示されます。
  3. [詳細設定] > [光学式文字認識] をクリックして、OCR エンジン オプションのドロップダウン リストを表示します。

    OCR エンジンの選択が無効な場合、[インスタンスを作成して分析] オプションは無効化されます。

    注: IQ Bot は、OCR を除くすべての ABBYY FineReader エンジン エンジンを自動的にインストールします。
    重要: OCR Automation 360 IQ Bot On-Premisesでは、OCR選択した エンジンの設定のみできます。 Automation 360 IQ Bot Cloud の 設定は ABBYY FineReader エンジン を除いてアクセスできないため、編集できません。 REST API を使用して、ABBYY FineReader エンジンappConfigurations構成設定を編集できます。

    以下から選択できます。

    オプション内容
    Tesseract OCR 4 これは、Settings.txt ファイルで変更されない限り、デフォルトのエンジンです。
    ABBYY FineReader エンジン

    使用しているマシンに ABBYY FineReader エンジン がインストールされていて使用可能であることを確認するには、Settings.txt ファイル、SDK ファイルの OCR プラグイン フォルダー、および [光学式文字認識] ドロップダウン リストを確認します。

    注: IQ Bot [Local Device] packageおよび IQ Bot Extraction packageでもサポートされています。

    IQ Bot での ABBYY FineReader エンジン OCR エンジンの使用

    Microsoft Azure Computer Vision OCR エンジン IQ Bot は、この OCR エンジンでサポートされているすべての言語をサポートしています。

    Microsoft Azure Computer Vision OCR エンジン を使用する

    Google Vision API IQ BotGoogle Vision APIOCR エンジンとしてサポートしていて、このエンジンでサポートされるすべての言語をサポートしています。

    Google Vision API OCR エンジンの使用

    PDF ドキュメントに画像はありません

    アップロードしたすべての PDF ドキュメントは、指定または選択した OCR エンジンに関係なく、デフォルトで PDFBox OCR を使用して処理されます。

    PDF 以外のドキュメントまたは画像を含む PDF ドキュメントをアップロードする場合は、[PDF ドキュメントに画像はありません] チェックボックスをオフにして、指定または選択した OCR エンジンがドキュメントの処理に使用されるようにします。

    [PDF ドキュメントには画像がありません] チェック ボックスは、デフォルトで有効になっています。 この機能を無効にするに方法については、[PDFBox オプションの無効化] を参照してください。
    ヒント: IQ Bot が低品質のドキュメントや手書きのドキュメントからデータを抽出できない場合は、問題のトラブルシューティングを行ってください。

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

    注: 以下のファイルを使用して、OCR の設定を変更します。
    • AbbyyImagePreProcessingSettings.json
    • LangugeCodeToAbbyyLanguageCode.json
    • Azure3OCREngineSettings.json
    • GoogleOCREngineSettings.json
    • AzureOCREngineSettings.json
    How to change OCR Settings in IQ Bot (A-People login required)