数据提取过程的高级定制
- Updated: 2025/04/30
提取过程的高级自定义功能使您能够在需要根据您的场景或要求进行自定义时修改默认提取过程。 通过根据您的特定文档类型和提取需求定制提取过程,您可以提高数据的准确性和效率。
以下是一些可能需要您修改提取过程的示例:
- 您的场景需要在处理文档之前提高用于数据提取的图像质量。
- 您的场景需要在进一步处理数据之前,或在将数据发送到记录系统或供用户审核之前,修改提取的数据。
当您创建一个学习实例时,系统会创建一个默认工作流,其中包括以下组件以在 Control Room 中处理文档:Automation Co-Pilot 过程、提取 bot、下载 bot 和一个 Automation Co-Pilot 表单。 您可以配置表单、表格字段选项以及学习实例的组件,以调整学习实例的工作流来满足您的业务需求。
您可以通过以下过程对数据提取过程进行高级自定义:
- 文档预处理: 在文档处理工作流中集成预处理,以提升图像质量,并在数据提取处理之前对页面和文档进行分类。 请参阅 在数据提取工作流中使用预处理 和 在数据提取工作流中使用分类。
- 数据提取规则: 添加或修改数据验证规则,为数据元素定义正则表达式 (regex) 或模式,并调整字段的置信水平,以提高数据提取的准确性。 请参阅 Document Automation中的验证规则。
- 修改默认的 Automation Co-Pilot 流程: 修改此流程以包含自定义规则或逻辑,集成企业系统,添加自定义审批工作流。 请参阅 修改默认流程。
- 自定义解析器: 将您预先训练的领域特定模型集成到文档处理工作流中,以加速部署。 请参阅 在学习实例中集成第三方解析器。