了解系统如何通过用户在 Validator 中提供的更改来提高提取准确度。

当创建学习实例时,用户可以选择启用此功能,以根据用户在 Validator 中提供的更改向学习实例发送反馈。在 Document Automation 中,当用户调整或重新定位 Validator 中的提取区域时,运行在实际正式模式下的学习实例可以持续“学习”。

下图直观地概述了学习实例通过验证持续接收反馈的过程:

通过验证反馈“教授”学习实例的过程

  1. 上传的文档通过提取引擎。
  2. 如果学习实例成功提取数据,则提取的值将下载到 成功 文件夹中的一个文件。

    如果学习实例无法提取数据,系统会评估文档是否包含不熟悉的布局。

  3. 如果学习实例无法识别文档布局(新布局),则文档将被发送到手动验证,用户通过设置提取区域来“教授”学习实例如何提取数据。
  4. 提取的值被下载到 成功 文件夹中的一个文件,并且更改被收集在一个反馈文件中,该文件被发送到反馈数据库。
    注:
    • 仅在用户更改提取区域时收集反馈。 如果用户手动输入文本,系统不会收集反馈。
    • 反馈文件仅包含字段位置的数据,以提高后续文档的提取准确度。

    如果学习实例识别出该群集,它会从反馈数据库中检索先前的反馈并用其提取数据。

使用验证反馈从表格中提取特定值

Automation 360 v.27 开始,您可以训练一个学习实例从包含多个字段的单元格中提取数据。

例如,如果产品描述列还包括项目编号,您可以在验证界面中突出显示项目编号。 当学习实例处理后续文档时,它将提取项目编号并忽略产品描述。

请按照以下步骤配置学习实例以从单元格中提取特定值:
  1. 使用 Automation Anywhere 预训练模型创建一个学习实例,并选择发送验证反馈的选项:在 Document Automation 中创建学习实例
  2. 上传示例文档:在 Document Automation 中处理文档
  3. 在验证器中,找到该字段并重新绘制框,仅围绕您想要提取的值。
  4. 单击提交后,有关新提取区域的信息将发送到反馈数据库。
  5. 上传更多文档以测试提取的准确度。 当您对结果满意后,继续准备学习实例以在实际正式环境中运行:实际正式发布学习实例
注: 您还可以使用此过程来利用基于验证的改进,针对使用 IQ BotIQ Bot 导入到 Document Automation 的学习实例,以 Document Automation 桥接 package。 有关更多信息,请参阅 IQ Bot - DA Bridge package

Document Automation 如何识别新布局

Document Automation 提取基于对象检测。 在文档处理过程中,提取引擎识别对象或字段及其关联值的键值对。 引擎创建了文档的“指纹”,其中存储对象的序列以及每个对象在文档中的位置。

当处理文档时,如果引擎识别出键及其位置,则根据现有指纹对文档进行分类和提取。 否则,引擎会保存键及其位置的新指纹。

引擎识别文档中现有指纹或创建新指纹的过程