使用 Google Vision API OCR 引擎与 IQ Bot 相结合,以提高亚洲语言(尤其是日语和韩语)训练文档光学字符识别 (OCR) 结果的准确性。 IQ Bot 中的 Google Vision API OCR 引擎支持引擎所支持的所有语言。

先决条件

验证默认端口 443 是否可用于为使用 TCP的 API 端点启用通信。

注: 请参阅下面示例部分中允许的使用 Google Vision API 的服务 URL 列表。
Google Vision API 文件在 IQ Bot 安装期间自动安装在您的计算机上,作为内置插件提供,只需一步安装即可使用,所有用户均可使用:
  • 这是一个云 OCR 引擎。
  • Google Vision API 不支持包含多种语言的文档。 使用此功能之前,请确保主要仅提取日文或韩文。
  • IQ Bot 内文档提取不支持从右到左(而不是从左到右)书写的语言。 例如,阿拉伯语、亚拉姆语、阿塞拜疆语、迪维希语、富拉语、希伯来语、库尔德语、朝鲜语、波斯语、罗辛亚语、叙利亚语和乌尔都语。

    在此版本发布之前,引擎主要支持日文和韩文文本的数据提取。

    Automation 360 IQ Bot 中支持的语言

  • 数据不会存储在 Google Cloud 中,并会立即删除。

    有关数据保留隐私的更多信息,请参阅:Google Data Usage

IQ Bot 为您提供使用 Google Vision API OCR 引擎的许可证。 您也可以使用自己的许可证密钥。

对 Google Vision API OCR 引擎使用您自己的许可证密钥

注:Google Vision API 的更新,例如 OCR 引擎的改进、增强和错误修复,可能会影响您在 IQ Bot 中使用此 OCR 引擎时的内容提取。 因此,我们建议您定期查阅 Google Vision API 版本说明以获取最新更新。

请参阅 Google Vision API OCR 升级的潜在改变

您有以下使用此 OCR 引擎的选项:
选项 描述
选项 1:Google Vision API 设置为默认引擎 配置 Settings.txt 文件。
限制: 配置 settings.txt 文件不适用于 Automation 360 IQ Bot Cloud
选项 2: 创建学习实例时直接从 UI 中选择 Google Vision API 引擎 选择OCR引擎

过程

要将 Google Vision API 设置为默认 OCR 引擎,请按如下方式配置 Settings.txt 文件:

限制: 配置 settings.txt 文件不适用于 Automation 360 IQ Bot Cloud

  1. 运行 IQ Bot 安装程序。
  2. 可选: Google Vision API 设置为新学习实例的默认 OCR。
    导航到 ..\Automation 360 IQ Bot\Configurations\Settings.txt,并修改以下值: OCREngine=GoogleVisionAPI.
    这将把 Google Vision API OCR 引擎设置为环境的默认引擎。
  3. GoogleOCREngineSettings.json 文件在 ..\Automation 360 IQ Bot\Configurations 文件夹中生成,默认值如下:
    请将以下内容与 Google Vision API 配合使用:
    { "ADCJson": null, "EngineType": 2, "EnableFieldMerging": true, "EnableFieldRegions": true, "DebuggingFolder": "C:\\Users\\Public\\Documents\\Automation 360 IQBot Platform\\Logs\\Engine\\Google" }
  4. 对于日语和韩语文档,请更新字段:"EnableCustomParse": true
    注: 更改后无需重新启动服务。
用于 Google Vision API 的服务 URL 列表(可选)
如果需要,请使用以下允许的 URL:
注: 所有 URL 指向美国的全球服务地区。
  • API URL:https://vision.googleapis.com/
  • 身份验证 URL:https://accounts.google.com/o/oauth2/auth
  • 令牌 URL:https://oauth2.googleapis.com/token
  • 身份验证提供程序 URL:https://www.googleapis.com/oauth2/v1/certs
  • 客户端身份验证 URL:https://www.googleapis.com/robot/v1/metadata/x509

后续步骤

  1. 使用您要训练的亚洲语言文档创建新学习实例。
  2. 训练文档并将您的学习实例设置为实际正式部署环境。
  3. 上传亚洲语言文件并运行 bot
  4. 下载并查看提取结果的准确性。