通过验证提高提取准确度
- Updated: 2025/04/14
了解系统如何通过用户在 Validator 中提供的更改来提高提取准确度。
当创建学习实例时,用户可以选择启用此功能,以根据用户在 Validator 中提供的更改向学习实例发送反馈。在 Document Automation 中,当用户调整或重新定位 Validator 中的提取区域时,运行在实际正式模式下的学习实例可以持续“学习”。
下图直观地概述了学习实例通过验证持续接收反馈的过程:
- 上传的文档通过提取引擎。
- 如果学习实例成功提取数据,则提取的值将下载到
成功
文件夹中的一个文件。如果学习实例无法提取数据,系统会评估文档是否包含不熟悉的布局。
- 如果学习实例无法识别文档布局(新布局),则文档将被发送到手动验证,用户通过设置提取区域来“教授”学习实例如何提取数据。
- 提取的值被下载到
成功
文件夹中的一个文件,并且更改被收集在一个反馈文件中,该文件被发送到反馈数据库。注:- 仅在用户更改提取区域时收集反馈。 如果用户手动输入文本,系统不会收集反馈。
- 反馈文件仅包含字段位置的数据,以提高后续文档的提取准确度。
如果学习实例识别出该群集,它会从反馈数据库中检索先前的反馈并用其提取数据。
使用验证反馈从表格中提取特定值
从 Automation 360 v.27 开始,您可以训练一个学习实例从包含多个字段的单元格中提取数据。
例如,如果产品描述列还包括项目编号,您可以在验证界面中突出显示项目编号。 当学习实例处理后续文档时,它将提取项目编号并忽略产品描述。
请按照以下步骤配置学习实例以从单元格中提取特定值:
- 使用 Automation Anywhere 预训练模型创建一个学习实例,并选择发送验证反馈的选项:在 Document Automation 中创建学习实例
- 上传示例文档:在 Document Automation 中处理文档
- 在验证器中,找到该字段并重新绘制框,仅围绕您想要提取的值。
- 单击提交后,有关新提取区域的信息将发送到反馈数据库。
- 上传更多文档以测试提取的准确度。 当您对结果满意后,继续准备学习实例以在实际正式环境中运行:实际正式发布学习实例
注: 您还可以使用此过程来利用基于验证的改进,针对使用 IQ Bot 从 IQ Bot 导入到 Document Automation 的学习实例,以 Document Automation 桥接 package。 有关更多信息,请参阅 IQ Bot - DA Bridge package。
Document Automation 如何识别新布局
Document Automation 提取基于对象检测。 在文档处理过程中,提取引擎识别对象或字段及其关联值的键值对。 引擎创建了文档的“指纹”,其中存储对象的序列以及每个对象在文档中的位置。
当处理文档时,如果引擎识别出键及其位置,则根据现有指纹对文档进行分类和提取。 否则,引擎会保存键及其位置的新指纹。