Google Vision API OCR 升级的潜在改变

Google Vision API OCR 是基于云的,通常会根据谷歌的发布周期升级到新版本。 由于此次升级,可能会对 IQ Bot 中的文档提取处理和提取结果产生改变。

Google Vision API OCR 更新后对 IQ Bot 中文档分类的改变

文档的分类基于 OCR 结果,特别是字段被检测到的顺序。 因此,如果 OCR 结果的内容有所不同,则与之前处理的类似文档相比,在文档提取过程中分类结果可能会显示出明显差异。

自动升级对分类器服务有两方面的影响:
  • 文档被分配到不同的组: 文档在处理时将被分配到与之前不同的组。 因此,一些以前成功的数据提取可能会失败。
  • 新群组已创建: 之前以某一组别处理的文档现在可能会导致创建一个新组。

Google Vision API OCR 更新后对 IQ Bot 的数据提取的改变

OCR 输出的变化可能会导致从类似文档类型中提取数据时出现以下差异:

  • 字符识别的改进及其相关的改变: 由于关键词字符识别的改进,文档中之前未被识别的值现在将提供更好的提取结果。
    注: 如果编写了任何处理逻辑来修复未检测到字符的问题,那么在处理文档时可能会导致问题。
  • 字符识别的退化及其改变: 验证可能会因为 OCR 输出退化而失败,文档将被发送到验证器。 在没有验证设置的情况下,提取的数据输出可能会出现退化。

改善措施选项

如果您遇到任何前面提到的问题,您可以探索以下选项:

  • 重新训练现有的学习实例以解决文档分类问题。
  • 使用 Python 编写处理逻辑以改善提取结果。
  • 评估使用 IQ Bot 支持的不同 OCR 提供商创建学习实例。
  • 提交支持工单给 Automation Anywhere