学习实例是一种结构,其中包含文档类型、语言和要提取的字段等信息。 创建 Standard Forms后,您必须创建学习实例以从文档中提取数据。

先决条件

  • 确保您的 Standard Forms 配置已完成。
  • 确保您的 Control Room 具有 Document Automation Standard Forms(页数)产品许可证。

过程

  1. Control Room 主页,导航到AI > Document Automation > 创建学习实例。
    创建学习实例出现在右上角
    创建学习实例窗口在新标签页中打开。
  2. 为要创建的新学习实例添加名称。
  3. 文档类型下拉菜单中,选择标准表单
    标准表单作为文档类型
    注: 默认情况下,提供程序名称选择为 Microsoft 表单识别器
  4. 对于模型选择,请单击浏览,并使用名称或描述过滤器搜索模型。
  5. 选择您的模型并单击下一步
  6. 要继续,您必须至少选择一个字段:
    • 表单

    选择表单字段或表格字段
    注:
    • 对于神经模型,表格字段不会自动更新,您必须使用格式 {table_name}: {field_name} 手动添加表格字段。
    • 对于神经模型,标准表单支持多个白哦个,这些表格在 表格选项卡下显示为表名:字段名
  7. 部分其他字段属性如下:
    选项描述
    字段名称 输入以字母(A-Z 或 a-z)开头的字段名称。

    在标准字段中,字段名称是硬编码的,无法更改。

    字段标签 输入一个用户友好的名称以帮助验证者。

    例如,您可以将组织税号重命名为本地化名称,例如增值税号

    字段标签不影响提取。

    置信度 设置阈值以减少潜在的误报。

    在处理时,Document Automation 引擎为文档中的每个字段分配一个分数,以指示数据被正确提取的确定性。 如果文档中包含分数低于置信度阈值的字段,则该文档将被发送到验证队列。

    如果您输入较高的置信度阈值,将有更多文档被发送到验证队列。 如果您输入较低的置信度阈值,将有更少的文档被发送到验证队列。

    支持的数值范围从零到一百。

    数据类型 地址*、文本数字日期中选择。

    如果字段中的数据与数据类型不匹配,文档将被发送到验证队列。

    Document Automation 支持多种日期格式。
    注: 如果您正在配置具有用户定义文档类型的学习实例,表单字段包括地址数据类型,该类型提取地址的整个结构。
    必填 选择以下选项之一:
    • 必填项: 字段不能为空。
    • 可选: 字段可以为空或在文档中不存在。
    验证规则 根据数据类型,使用模式、公式、列表和语句(例如以某个字符开始或结束)来创建规则。

    开头和结尾 | 模式 | 列表 | 公式

  8. 单击创建
当创建一个新的学习实例时,Control Room 会在自动化 > 文档工作区文件夹中创建一个与学习实例同名的文件夹。 文件夹包含两个 bots(提取和下载)、一个流程和一个表单。学习实例资产的屏幕截图示例
  • 流程: 使用 if/else 场景管理流程,通过该场景,Document Automation 从上传的文档中提取数据、将文档分配给用户进行验证,并下载提取的数据。 要了解更多详情,请参阅 Document Automation 中的 Automation Co-Pilot for Business Users 流程
  • 提取机器人: 从上传的文档中提取定义字段的数据。
  • 下载机器人: 将提取的数据下载到设备或共享网络上的特定文件夹。
  • 表单: 定义发送到流程的输入参数。 输入参数包括学习实例名称、上传的文件和输出文件路径。

后续步骤

将文档上传到学习实例,修复验证错误,并验证提取的数据:在 Document Automation 中处理文档