您可以选择适合您文档类型的数据提取需求的 OCR 引擎。 更改引擎不需要重启 IQ Bot 服务。

在安装 IQ Bot 期间,系统会将 Tesseract Optical Character Reader 的最新版本设置为默认 OCR 引擎。 这也是产品的默认设置。 但是,您可以在 OCRSettings.txt 文件中手动设置 引擎,这将成为默认引擎。 与IQ Bot的先前版本类似,您可以使用本人设置的默认引擎名字,继续手动更新Settings.txtOCR文件。

创建学习实例时,您可以从光学字符识别的下拉菜单中选择一个 OCR 引擎。 请参阅 创建学习实例
注:
  • 在界面中选择OCR引擎将覆盖Settings.txt文件中的设置。
  • 您将始终拥有由 Automation 360 IQ Bot Cloud 支持的 OCR 引擎的最新版本,但无法选择特定的 OCR 版本。

以下表格列出了在 IQ Bot 中支持的各种 OCR 引擎及其相应的选项:

表 1. OCR 引擎及其规格列表
限定符 OCR 版本 支持的安装 手写 支持的语言 文档质量 文档类型
Tesseract OCR 4 CloudOn-Premises

英语

德语

西班牙语

意大利语

法语

无噪音

无深色背景

无印章/水印

200+ dpi

发票、采购订单等。

半结构化格式

ABBYY FineReader Engine 12.3 或 12.4 CloudOn-Premises

英语

所有拉丁+

中文

日语

韩语

更少噪音

深色背景配白色字体

有邮票/水印

96+ DPI

发票、采购订单等。

半结构化格式

抵押贷款表格,税务表格

非结构化格式

Microsoft Azure Computer Vision OCR 引擎 2.0 或 3.2 CloudOn-Premises 仅限英文

英语

所有拉丁+

中文

日语

韩语

更少噪音

深色背景

有邮票/水印

96+ DPI

发票、采购订单等。

半结构化格式

护照、驾驶执照等。

KYC 文档

Google Vision API 版本会自动更新以匹配当前版本 CloudOn-Premises

英语

所有拉丁+

亚洲人

更少噪音

深色背景

有邮票/水印

96+ DPI

发票、采购订单等。

半结构化格式

抵押贷款表格,税务表格

非结构化格式

过程

  1. 创建新学习实例页面上,选择文档的域和语言。
    我的学习实例列表页面中,有一个新的OCR 引擎列,它显示创建每个学习实例的OCR引擎。 此信息能够帮助用户决定文档处理。
  2. 选择域时,将显示要提取的字段高级设置
    每个域都存在于预先设定的主要支持语言列表。 根据特定域支持的语言,文档主要语言下拉列表中的语言选择会被启用并使用。
    注: 如果在文档主要语言下拉列表中选择了一种语言,然后选择了不支持该语言的引擎,系统会在光学字符识别下拉列表中显示一条错误消息。
  3. 单击高级设置 > 光学字符识别,以显示 OCR 引擎选项下拉列表。

    如果OCR引擎选择无效,则不会启用创建实例和分析选项。

    注: 在安装过程中IQ Bot自动安装所有OCR引擎,除非ABBYY FineReader Engine
    重要: 只能在 Automation 360 IQ Bot On-Premises 中对选定的 OCR 引擎进行配置。除 ABBYY FineReader Engine 外,Automation 360 IQ Bot Cloud 中的 OCR 设置无法编辑,因为无法访问。 您可以使用 appConfigurations REST API 对 ABBYY FineReader Engine 的配置设置进行编辑。

    可从以下选项中选择:

    选项描述
    Tesseract OCR 4 除非在 Settings.txt 文件中更改,这就是默认引擎。
    ABBYY FineReader Engine

    要验证 ABBYY FineReader Engine 是否已安装且可供您的计算机使用,请检查 Settings.txt 文件、SDK 文件的 OCR 插件文件夹以及光学字符识别下拉列表。

    注:IQ Bot [Local Device] packageIQ Bot Extraction package 中也受支持。

    在 IQ Bot 中使用 ABBYY FineReader Engine OCR 引擎

    Microsoft Azure Computer Vision OCR 引擎 IQ Bot 支持此 OCR 引擎提供的所有语言。

    使用 Microsoft Azure Computer Vision OCR 引擎

    Google Vision API IQ Bot 支持 Google Vision API 用作 OCR 引擎,并支持此引擎提供的所有语言。

    使用 Google Vision API OCR 引擎

    我的 PDF 文档没有图像

    无论您指定或选择了哪种 OCR 引擎,您上传的所有 PDF 文档默认都会使用 PDFBox OCR 进行处理。

    如果您正在上传非 PDF 文档或包含图像的 PDF 文档,请取消选中我的 PDF 文档没有图像复选框,以确保使用您指定或选择的 OCR 引擎处理文档。

    默认情况下,我的PDF文档没有图像复选框处于启用状态。 要禁用此功能,请参阅 禁用 PDFBox 选项
    提示: 如果 IQ Bot 无法从低质量或手写文档中提取数据,请检查此问题:

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

    注: 使用以下文件更改 OCR 设置:
    • AbbyyImagePreProcessingSettings.json
    • LanguageCodeToAbbyyLanguageCode.json
    • Azure3OCREngineSettings.json
    • GoogleOCREngineSettings.json
    • AzureOCREngineSettings.json
    How to change OCR Settings in IQ Bot (A-People login required)