使用 Google Vision API OCR 引擎
- Updated: 2021/09/21
使用 Google Vision API OCR 引擎与 IQ Bot 相结合,以提高亚洲语言(尤其是日语和韩语)训练文档光学字符识别 (OCR) 结果的准确性。 IQ Bot 中的 Google Vision API OCR 引擎支持引擎所支持的所有语言。
先决条件
验证默认端口 443 是否可用于为使用 TCP的 API 端点启用通信。
注: 请参阅下面示例部分中允许的使用 Google Vision API 的服务 URL 列表。
Google Vision API 文件在 IQ Bot 安装期间自动安装在您的计算机上,作为内置插件提供,只需一步安装即可使用,所有用户均可使用:
- 这是一个云 OCR 引擎。
- Google Vision API 不支持包含多种语言的文档。 使用此功能之前,请确保主要仅提取日文或韩文。
-
IQ Bot 内文档提取不支持从右到左(而不是从左到右)书写的语言。 例如,阿拉伯语、亚拉姆语、阿塞拜疆语、迪维希语、富拉语、希伯来语、库尔德语、朝鲜语、波斯语、罗辛亚语、叙利亚语和乌尔都语。
在此版本发布之前,引擎主要支持日文和韩文文本的数据提取。
- 数据不会存储在 Google Cloud 中,并会立即删除。
有关数据保留隐私的更多信息,请参阅:Google Data Usage
IQ Bot 为您提供使用 Google Vision API OCR 引擎的许可证。 您也可以使用自己的许可证密钥。
对 Google Vision API OCR 引擎使用您自己的许可证密钥
注: 对 Google Vision API 的更新,例如 OCR 引擎的改进、增强和错误修复,可能会影响您在 IQ Bot 中使用此 OCR 引擎时的内容提取。 因此,我们建议您定期查阅 Google Vision API 版本说明以获取最新更新。
您有以下使用此 OCR 引擎的选项:
选项 | 描述 |
---|---|
选项 1: 将 Google Vision API 设置为默认引擎 | 配置 Settings.txt 文件。 限制: 配置 settings.txt 文件不适用于 Automation 360 IQ Bot
Cloud
|
选项 2: 创建学习实例时直接从 UI 中选择 Google Vision API 引擎 | 选择OCR引擎 |
过程
要将 Google Vision API 设置为默认 OCR 引擎,请按如下方式配置 Settings.txt 文件:
限制: 配置 settings.txt 文件不适用于 Automation 360 IQ Bot
Cloud
用于 Google Vision API 的服务 URL 列表(可选)
如果需要,请使用以下允许的 URL:
注: 所有 URL 指向美国的全球服务地区。
- API URL:https://vision.googleapis.com/
- 身份验证 URL:https://accounts.google.com/o/oauth2/auth
- 令牌 URL:https://oauth2.googleapis.com/token
- 身份验证提供程序 URL:https://www.googleapis.com/oauth2/v1/certs
- 客户端身份验证 URL:https://www.googleapis.com/robot/v1/metadata/x509
后续步骤
- 使用您要训练的亚洲语言文档创建新学习实例。
- 训练文档并将您的学习实例设置为实际正式部署环境。
- 上传亚洲语言文件并运行 bot。
- 下载并查看提取结果的准确性。