Automation 360

OCR エンジンの選択

PDF としてダウンロード

コンテンツ

OCR エンジンの選択

PDF としてダウンロード

バージョン:
最終更新日2024/03/14

OCR エンジンの選択

ドキュメントタイプに基づくデータ抽出の要件に最適な OCR エンジンを選択できます。エンジン変更を実装するには、IQ Bot サービスの再起動は必要ありません。

IQ Bot のインストール中、システムは Tesseract Optical Character Reader の最新バージョンをデフォルトの OCR エンジンとして設定します。これは、製品のデフォルト設定でもあります。ただし、デフォルトのエンジンとなる OCR エンジンは Settings.txt ファイルで手動で設定することができます。IQ Bot の以前のリリースと同様に、デフォルトとして設定する OCR エンジン名で Settings.txt ファイルを手動で更新できます。

ラーニングインスタンス作成時に、[光学式文字認識] のドロップダウンメニューから OCR のエンジンを選択できます。「ラーニングインスタンスの作成」を参照してください。

注:

インターフェースで OCR エンジンを選択すると、Settings.txt ファイルの設定が無効になります。
Tegaki API OCR には、Automation 360 IQ Bot クラウドでサポートされていない個別のオンプレミスセットアップが必要なため、Tegaki API OCR を除く他のすべての OCR エンジンを使用できます。
Automation 360 IQ Bot クラウドでサポートされている OCR エンジンの最新バージョンは常に使用できますが、特定の OCR バージョンを選択することはできません。

IQ Bot でサポートされている各種 OCR エンジンとそれに対応するオプションのリストを次の表に示します。

表 1. OCR エンジンとその仕様のリスト
対象エンジン	OCR バージョン	サポートされているインストール	手書き	サポートされている言語	ドキュメント品質	ドキュメントタイプ
Tesseract OCR	4	クラウドとオンプレミス	該当なし	英語ドイツ語スペイン語イタリア語フランス語	ノイズがない暗い背景がないスタンプ/ウォーターマークなし 200dpi 以上	請求書、PO など半構造化形式
ABBYY FineReader エンジン	12.3 または 12.4	クラウドとオンプレミス	該当なし	英語すべてのラテン系言語中国語 (繁体字) 日本語韓国語	ノイズが少ない暗い背景と白いフォントスタンプ/ウォーターマークあり 96dpi 以上	請求書、PO など半構造化形式住宅ローン関連用紙、税申告用紙非構造化形式
Microsoft Azure Computer Vision OCR エンジン	2.0 または 3.2	クラウドとオンプレミス	英語のみ	英語すべてのラテン系言語中国語 (繁体字) 日本語韓国語	ノイズが少ない暗い背景スタンプ/ウォーターマークあり 96dpi 以上	請求書、PO など半構造化形式パスポート、運転免許証など KYC ドキュメント
Google Vision API	バージョンは現在のリリースと一致するように自動的に更新されます	クラウドとオンプレミス	該当なし	英語すべてのラテン系言語アジア系言語	ノイズが少ない暗い背景スタンプ/ウォーターマークあり 96dpi 以上	請求書、PO など半構造化形式住宅ローン関連用紙、税申告用紙非構造化形式

手順

[新しいラーニングインスタンスを作成] ページで、ドメインとドキュメントの言語を選択します。
[ラーニングインスタンス] リストページでは、新しい [OCR エンジン] 列が利用でき、各ラーニングインスタンスの作成に使用される OCR エンジンが表示されます。この情報は、ユーザーがドキュメント処理を決定する際に役立ちます。
ドメインを選択すると、[抽出するフィールド] と [詳細設定] セクションが表示されます。
各ドメインは、主要なサポート言語の定義済みリストで利用できます。言語の選択は有効になっており、特定のドメインでサポートされている言語に基づいて、[ドキュメントの主要言語] ドロップダウンリストから使用できます。
注: [ドキュメントの主要言語] ドロップダウンリストから言語を選択し、その言語をサポートしていないエンジンを選択すると、[光学式文字認識] ドロップダウンリストにエラーメッセージが表示されます。

[詳細設定] > [光学式文字認識] をクリックして、OCR エンジンオプションのドロップダウンリストを表示します。

OCR エンジンの選択が無効な場合、[インスタンスを作成して分析] オプションは無効化されます。

注: IQ Bot は、ABBYY FineReader エンジンを除くすべての OCR エンジンを自動的にインストールします。

重要: Automation 360 IQ Bot オンプレミスでは、選択した OCR エンジンの設定のみできます。Automation 360 IQ Bot クラウドの OCR 設定は、ABBYY FineReader エンジン以外はアクセスできないため、編集できません。appConfigurations REST API を使用して、ABBYY FineReader エンジンの構成設定を編集できます。

以下から選択できます。

オプション	説明
Tesseract OCR 4	これは、Settings.txt ファイルで変更されない限り、デフォルトのエンジンです。
ABBYY FineReader エンジン	使用しているマシンに ABBYY FineReader エンジンがインストールされていて使用可能であることを確認するには、Settings.txt ファイル、SDK ファイルの OCR プラグインフォルダー、および [光学式文字認識] ドロップダウンリストを確認します。注: IQ Bot [ローカルデバイス] パッケージおよび IQ Bot Extraction パッケージでもサポートされています。 IQ Bot での ABBYY FineReader エンジン OCR エンジンの使用
Microsoft Azure Computer Vision OCR エンジン	IQ Bot は、この OCR エンジンでサポートされているすべての言語をサポートしています。 Microsoft Azure Computer Vision OCR エンジンを使用する
Google Vision API	IQ Bot は Google Vision API を OCR エンジンとしてサポートしていて、このエンジンでサポートされるすべての言語をサポートしています。 Google Vision API OCR エンジンの使用
PDF ドキュメントに画像はありません	アップロードしたすべての PDF ドキュメントは、指定または選択した OCR エンジンに関係なく、デフォルトで PDFBox OCR を使用して処理されます。 PDF 以外のドキュメントまたは画像を含む PDF ドキュメントをアップロードする場合は、[PDF ドキュメントに画像はありません] チェックボックスをオフにして、指定または選択した OCR エンジンがドキュメントの処理に使用されるようにします。 [PDF ドキュメントには画像がありません] チェックボックスは、デフォルトで有効になっています。この機能を無効にするに方法については、「PDFBox オプションの無効化」を参照してください。

ヒント: IQ Bot が低品質のドキュメントや手書きのドキュメントからデータを抽出できない場合は、問題のトラブルシューティングを行ってください。

IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

注: 以下のファイルを使用して、OCR の設定を変更します。

AbbyyImagePreProcessingSettings.json
LangugeCodeToAbbyyLanguageCode.json
Azure3OCREngineSettings.json
GoogleOCREngineSettings.json
AzureOCREngineSettings.json

How to change OCR Settings in IQ Bot (A-People login required)