OCR エンジンの選択
- 更新日 2024/01/29
OCR エンジンの選択
ドキュメント タイプに基づくデータ抽出の要件に最適な OCR エンジンを選択できます。エンジン変更を実装するには、IQ Bot サービスの再起動は必要ありません。
IQ Bot のインストール中、システムは Tesseract Optical Character Reader の最新バージョンをデフォルトの OCR エンジンとして設定します。これは、製品のデフォルト設定でもあります。ただし、デフォルトのエンジンとなる OCR エンジンは Settings.txt ファイルで手動で設定することができます。IQ Bot の以前のリリースと同様に、デフォルトとして設定する OCR エンジン名で Settings.txt ファイルを手動で更新できます。
ラーニングインスタンス作成時に、[光学式文字認識] のドロップダウン メニューから OCR のエンジンを選択できます。「ラーニングインスタンスの作成」を参照
注: インターフェースで OCR エンジンを選択すると、Settings.txt ファイルの設定が無効になります。
IQ Bot でサポートされている各種 OCR エンジンとそれに対応するオプションのリストを次の表に示します。
対象エンジン | OCR バージョン | サポートされているインストール | 手書き | サポートされている言語 | ドキュメント品質 | ドキュメント タイプ |
---|---|---|---|---|---|---|
Tesseract OCR | 4 | クラウドとオンプレミス | 該当なし |
英語 ドイツ語 スペイン語 イタリア語 フランス語 |
ノイズがない 暗い背景がない スタンプ/ウォーターマークなし 200dpi 以上 |
請求書、PO など 半構造化形式 |
ABBYY FineReader エンジン | 12.3 または 12.4 | クラウドとオンプレミス | 該当なし |
英語 すべてのラテン系言語 中国語 (繁体字) 日本語 韓国語 |
ノイズが少ない 暗い背景と白いフォント スタンプ/ウォーターマークあり 96dpi 以上 |
請求書、PO など 半構造化形式 住宅ローン関連用紙、税申告用紙 非構造化形式 |
Microsoft Azure Computer Vision OCR エンジン | 2.0 または 3.2 | クラウドとオンプレミス | 英語のみ |
英語 すべてのラテン系言語 中国語 (繁体字) 日本語 韓国語 |
ノイズが少ない 暗い背景 スタンプ/ウォーターマークあり 96dpi 以上 |
請求書、PO など 半構造化形式 パスポート、運転免許証など KYC ドキュメント |
Google Vision API | バージョンは現在のリリースと一致するように自動的に更新されます | クラウドとオンプレミス | 該当なし |
英語 すべてのラテン系言語 アジア系言語 |
ノイズが少ない 暗い背景 スタンプ/ウォーターマークあり 96dpi 以上 |
請求書、PO など 半構造化形式 住宅ローン関連用紙、税申告用紙 非構造化形式 |