选择OCR引擎
- Updated: 2025/04/23
您可以选择适合您文档类型的数据提取需求的 OCR 引擎。 更改引擎不需要重启 IQ Bot 服务。
在安装 IQ Bot 期间,系统会将 Tesseract Optical Character Reader 的最新版本设置为默认 OCR 引擎。 这也是产品的默认设置。 但是,您可以在 OCRSettings.txt 文件中手动设置 引擎,这将成为默认引擎。 与IQ Bot的先前版本类似,您可以使用本人设置的默认引擎名字,继续手动更新Settings.txtOCR文件。
创建学习实例时,您可以从光学字符识别的下拉菜单中选择一个 OCR 引擎。 请参阅 创建学习实例
注:
- 在界面中选择OCR引擎将覆盖Settings.txt文件中的设置。
-
您将始终拥有由 Automation 360 IQ Bot Cloud 支持的 OCR 引擎的最新版本,但无法选择特定的 OCR 版本。
以下表格列出了在 IQ Bot 中支持的各种 OCR 引擎及其相应的选项:
限定符 | OCR 版本 | 支持的安装 | 手写 | 支持的语言 | 文档质量 | 文档类型 |
---|---|---|---|---|---|---|
Tesseract OCR | 4 | Cloud 和 On-Premises | 无 |
英语 德语 西班牙语 意大利语 法语 |
无噪音 无深色背景 无印章/水印 200+ dpi |
发票、采购订单等。 半结构化格式 |
ABBYY FineReader Engine | 12.3 或 12.4 | Cloud 和 On-Premises | 无 |
英语 所有拉丁+ 中文 日语 韩语 |
更少噪音 深色背景配白色字体 有邮票/水印 96+ DPI |
发票、采购订单等。 半结构化格式 抵押贷款表格,税务表格 非结构化格式 |
Microsoft Azure Computer Vision OCR 引擎 | 2.0 或 3.2 | Cloud 和 On-Premises | 仅限英文 |
英语 所有拉丁+ 中文 日语 韩语 |
更少噪音 深色背景 有邮票/水印 96+ DPI |
发票、采购订单等。 半结构化格式 护照、驾驶执照等。 KYC 文档 |
Google Vision API | 版本会自动更新以匹配当前版本 | Cloud 和 On-Premises | 无 |
英语 所有拉丁+ 亚洲人 |
更少噪音 深色背景 有邮票/水印 96+ DPI |
发票、采购订单等。 半结构化格式 抵押贷款表格,税务表格 非结构化格式 |