阅读和查看 Automation Anywhere 文档

Automation 360

关闭内容

内容

打开内容

选择 OCR 一个引擎

  • 已更新:2021/09/09
    • Automation 360 v.x
    • 探索
    • RPA Workspace

选择 OCR 一个引擎

您可以从 OCR 用户界面中选择不同的引擎,以根据文档类型查看最适合您数据提取要求的引擎。 IQ Bot 实施发动机变更时不需要停止和重新启动服务。

IQ Bot 在安装过程中,系统会将的最新版本设置 Tesseract Optical Character Reader 为默认 OCR 引擎。这也是产品的全局设置。

但是,您可以在 OCR settings.txt 文件中手动设置引擎,该文件将成为默认引擎。与以前的版本类似 IQ Bot,您可以继续使用 OCR 要设置为默认值的引擎名称手动更新 settings.txt 文件。

如果 OCR 通过 settings.txt 文件配置选择过时的引擎版本或不支持的引擎,系统将显示一条错误消息。

创建学习实例时,您可以从 OCR 直接在 UI 中可用的下拉列表中选择引擎。
注:OCR 接口中选择引擎会覆盖 settings.txt 文件中的设置。

创建学习实例

过程

  1. “创建新的学习实例 ”页面上,选择文档的域和语言。
    在“我的学习实例 ”列表页中, 有一个新的 OCR 引擎列,显示 OCR 用于创建每个学习实例的引擎。在决定文档处理时,此信息对用户非常有用。
  2. 选择域时,将显示要提取的字段和高级设置部分。
    每个域都有预定义的主要支持语言列表。语言选择已启用,并可从 文档的主要语言 下拉列表中选择,该列表基于特定域支持的语言。
    注: 如果从 文档的主要语言 下拉列表中选择一种语言,然后选择不支持该语言的引擎,系统会在 光学字符识别 下拉列表中显示一条错误消息。
  3. 单击 高级设置 > 光学字符识别 以显示 OCR 引擎选项下拉列表。

    如果 OCR 引擎选择无效, 则不 会启用创建实例和分析选项。

    注: IQ Bot OCR 在安装过程中自动安装除 ABBYY FineReader Engine之外的所有引擎。
    重要: 您只能 OCR 在中配置选定的引擎 Automation 360 IQ Bot On-PremisesOCR 无法 Automation 360 IQ Bot Cloud 编辑中的设置,因为除 ABBYY FineReader Engine之外,这些设置不可访问。您可以编辑 ABBYY FineReader Engine 使用 appConfigurations REST API 的配置设置。

    您可以从以下选项中进行选择:

    选项描述
    Tesseract OCR4. 除非 在 settings.txt 文件中更改,否则这是默认引擎。
    ABBYY FineReader Engine

    要验证 ABBYY FineReader Engine 计算机上是否已安装并可供使用,请检查 settings.txt 文件, OCR SDK 文件的插件文件夹和 光学字符识别 下拉列表。

    注: IQ Bot [Local Device] package 在和中也支持 IQ Bot Extraction package

    ABBYY FineReader Engine OCR 在中使用发动机 IQ Bot

    Microsoft Azure Computer Vision OCR engine IQ Bot 支持此 OCR 引擎支持的所有语言。

    使用 Microsoft Azure Computer Vision OCR engine

    Google Vision API IQ Bot 支持 Google Vision API 作为 OCR 引擎,并支持此引擎支持的所有语言。

    使用 Google Vision API OCR 引擎

    Tegaki API IQ Bot 支持他 OCR 提取日语和韩语文档特定数据的引擎。您需要下载并使用您的私人许可证才能使用 Tegaki API
    注: Tegaki API OCR 中不支持发动机 Automation 360 IQ Bot Cloud

    使用 Tegaki API OCR 引擎

    我的 PDF 文档没有图像

    OCR 默认情况下,所有上传的 PDF 文档都使用 PDFBox 进行处理,而不管 OCR 您指定或选择了哪种引擎。

    如果要上载包含图像 OCR 的非 PDF 文档或 PDF 文档,请清除“我的 PDF 文档没有图像”复选框,以确保使用您指定或选定的引擎来处理文档。

    默认情况下,“我的 PDF 文档没有图像”复选框处于启用状态。要禁用此功能,请参阅 禁用 PDFBox 选项
    提示: 如果 IQ Bot 无法从低质量或手写文档中提取数据,请解决此问题:

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

发送反馈