OCR エンジンの選択

ドキュメント タイプに基づくデータ抽出の要件に最適な OCR エンジンを選択できます。エンジン変更を実装するには、IQ Bot サービスの再起動は必要ありません。

IQ Bot のインストール中、システムは Tesseract Optical Character Reader の最新バージョンをデフォルトの OCR エンジンとして設定します。これは、製品のデフォルト設定でもあります。ただし、デフォルトのエンジンとなる OCR エンジンは Settings.txt ファイルで手動で設定することができます。IQ Bot の以前のリリースと同様に、デフォルトとして設定する OCR エンジン名で Settings.txt ファイルを手動で更新できます。

ラーニングインスタンス作成時に、[光学式文字認識] のドロップダウン メニューから OCR のエンジンを選択できます。「ラーニングインスタンスの作成」を参照
注: インターフェースで OCR エンジンを選択すると、Settings.txt ファイルの設定が無効になります。

IQ Bot でサポートされている各種 OCR エンジンとそれに対応するオプションのリストを次の表に示します。

表 1. OCR エンジンとその仕様のリスト
対象エンジン OCR バージョン サポートされているインストール 手書き サポートされている言語 ドキュメント品質 ドキュメント タイプ
Tesseract OCR 4 クラウドオンプレミス 該当なし

英語

ドイツ語

スペイン語

イタリア語

フランス語

ノイズがない

暗い背景がない

スタンプ/ウォーターマークなし

200dpi 以上

請求書、PO など

半構造化形式

ABBYY FineReader エンジン 12.3 または 12.4 クラウドオンプレミス 該当なし

英語

すべてのラテン系言語

中国語 (繁体字)

日本語

韓国語

ノイズが少ない

暗い背景と白いフォント

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

住宅ローン関連用紙、税申告用紙

非構造化形式

Microsoft Azure Computer Vision OCR エンジン 2.0 または 3.2 クラウドオンプレミス 英語のみ

英語

すべてのラテン系言語

中国語 (繁体字)

日本語

韓国語

ノイズが少ない

暗い背景

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

パスポート、運転免許証など

KYC ドキュメント

Google Vision API バージョンは現在のリリースと一致するように自動的に更新されます クラウドオンプレミス 該当なし

英語

すべてのラテン系言語

アジア系言語

ノイズが少ない

暗い背景

スタンプ/ウォーターマークあり

96dpi 以上

請求書、PO など

半構造化形式

住宅ローン関連用紙、税申告用紙

非構造化形式

手順

  1. [新しいラーニングインスタンスを作成] ページで、ドメインとドキュメントの言語を選択します。
    [ラーニングインスタンス] リスト ページでは、新しい [OCR エンジン] 列が利用でき、各ラーニングインスタンスの作成に使用される OCR エンジンが表示されます。この情報は、ユーザーがドキュメント処理を決定する際に役立ちます。
  2. ドメインを選択すると、[抽出するフィールド] と [詳細設定] セクションが表示されます。
    各ドメインは、主要なサポート言語の定義済みリストで利用できます。言語の選択は有効になっており、特定のドメインでサポートされている言語に基づいて、[ドキュメントの主要言語] ドロップダウン リストから使用できます。
    注: [ドキュメントの主要言語] ドロップダウン リストから言語を選択し、その言語をサポートしていないエンジンを選択すると、[光学式文字認識] ドロップダウン リストにエラー メッセージが表示されます。
  3. [詳細設定] > [光学式文字認識] をクリックして、OCR エンジン オプションのドロップダウン リストを表示します。

    OCR エンジンの選択が無効な場合、[インスタンスを作成して分析] オプションは無効化されます。

    注: IQ Bot は、ABBYY FineReader エンジン を除くすべての OCR エンジンを自動的にインストールします。
    重要: Automation 360 IQ Bot オンプレミスでは、選択した OCR エンジンの設定のみできます。Automation 360 IQ Bot クラウドOCR 設定は、ABBYY FineReader エンジン 以外はアクセスできないため、編集できません。appConfigurations REST API を使用して、ABBYY FineReader エンジン の構成設定を編集できます。

    以下から選択できます。

    オプション説明
    Tesseract OCR 4 これは、Settings.txt ファイルで変更されない限り、デフォルトのエンジンです。
    ABBYY FineReader エンジン

    使用しているマシンに ABBYY FineReader エンジン がインストールされていて使用可能であることを確認するには、Settings.txt ファイル、SDK ファイルの OCR プラグイン フォルダー、および [光学式文字認識] ドロップダウン リストを確認します。

    注: IQ Bot [ローカルデバイス] パッケージおよび IQ Bot Extraction パッケージでもサポートされています。

    IQ Bot での ABBYY FineReader エンジン OCR エンジンの使用

    Microsoft Azure Computer Vision OCR エンジン IQ Bot は、この OCR エンジンでサポートされているすべての言語をサポートしています。

    Microsoft Azure Computer Vision OCR エンジン を使用する

    Google Vision API IQ BotGoogle Vision APIOCR エンジンとしてサポートしていて、このエンジンでサポートされるすべての言語をサポートしています。

    Google Vision API OCR エンジンの使用

    PDF ドキュメントに画像はありません

    アップロードしたすべての PDF ドキュメントは、指定または選択した OCR エンジンに関係なく、デフォルトで PDFBox OCR を使用して処理されます。

    PDF 以外のドキュメントまたは画像を含む PDF ドキュメントをアップロードする場合は、[PDF ドキュメントに画像はありません] チェックボックスをオフにして、指定または選択した OCR エンジンがドキュメントの処理に使用されるようにします。

    [PDF ドキュメントには画像がありません] チェック ボックスは、デフォルトで有効になっています。この機能を無効にするに方法については、「PDFBox オプションの無効化」を参照してください。
    ヒント: IQ Bot が低品質のドキュメントや手書きのドキュメントからデータを抽出できない場合は、問題のトラブルシューティングを行ってください。

    IQ Bot で、低品質ドキュメントおよび手書きのドキュメントからデータを抽出できない (A-People のログインが必要)

    注: 以下のファイルを使用して、OCR の設定を変更します。
    • AbbyyImagePreProcessingSettings.json
    • LangugeCodeToAbbyyLanguageCode.json
    • Azure3OCREngineSettings.json
    • GoogleOCREngineSettings.json
    • AzureOCREngineSettings.json
    IQ Bot の OCR 設定を変更する方法 (A-People のログインが必要)