Google Vision API OCR 升级的潜在改变
- Updated: 2022/09/02
Google Vision API OCR 升级的潜在改变
Google Vision API OCR 是基于云的,通常会根据谷歌的发布周期升级到新版本。 由于此次升级,可能会对 IQ Bot 中的文档提取处理和提取结果产生改变。
在 Google Vision API OCR 更新后对 IQ Bot 中文档分类的改变
文档的分类基于 OCR 结果,特别是字段被检测到的顺序。 因此,如果 OCR 结果的内容有所不同,则与之前处理的类似文档相比,在文档提取过程中分类结果可能会显示出明显差异。
自动升级对分类器服务有两方面的影响:
- 文档被分配到不同的组: 文档在处理时将被分配到与之前不同的组。 因此,一些以前成功的数据提取可能会失败。
- 新群组已创建: 之前以某一组别处理的文档现在可能会导致创建一个新组。
在 Google Vision API OCR 更新后对 IQ Bot 的数据提取的改变
OCR 输出的变化可能会导致从类似文档类型中提取数据时出现以下差异:
-
字符识别的改进及其相关的改变: 由于关键词字符识别的改进,文档中之前未被识别的值现在将提供更好的提取结果。注: 如果编写了任何处理逻辑来修复未检测到字符的问题,那么在处理文档时可能会导致问题。
- 字符识别的退化及其改变: 验证可能会因为 OCR 输出退化而失败,文档将被发送到验证器。 在没有验证设置的情况下,提取的数据输出可能会出现退化。
改善措施选项
如果您遇到任何前面提到的问题,您可以探索以下选项:
- 重新训练现有的学习实例以解决文档分类问题。
- 使用 Python 编写处理逻辑以改善提取结果。
- 评估使用 IQ Bot 支持的不同 OCR 提供商创建学习实例。
- 提交支持工单给 Automation Anywhere。