创建学习实例以开始处理文档。 在 Community Edition 中,您可以使用 ABBYY OCR 提供程序从英文发票中提取数据。

过程

  1. Control Room 主页导航到 AI > Document Automation ,然后单击创建学习实例
  2. 输入该学习实例的名称和描述。
    Document Automation 不允许重复的学习实例名称,因此您提供的名称必须是唯一的。
  3. 单击下一步

我们建议您在配置表单和表格字段时,将示例文档与 Control Room 窗口并排打开。

注:
  • 表单字段是指在文档中仅出现一次的字段类型。
  • 表格字段是一种在文档中反复出现的字段,通常以表格的形式出现。

  1. 配置表单和表格字段以进行提取。 有关更多详情,请参阅 查看和搜索字段
    1. 单击字段以打开字段编辑器。 有关更多详情,请参阅 编辑字段和创建自定义别名的指南
    2. 将鼠标悬停在字段右侧的菜单图标上,访问上下箭头。
    3. 使用箭头重新排列字段的顺序,以实现更高效的手动验证。
      字段的顺序不会改变提取。
    有关其他字段属性的更多信息,请参阅 表单和表格字段的注意事项
  2. 单击 添加字段 并指定字段详细信息,例如字段名称、字段标签、置信度、数据类型、格式化日期/数字等。 有关更多详情,请参阅 表单和表格字段的注意事项
    注: 如果您选择了生成式 AI 驱动的数据提取选项,我们建议您在创建学习实例时添加字段的优质提示,以获得预期结果。 请参阅 Document Automation - 使用 generative AI 的数据提取
    以下图像显示了在学习实例中配置的表单和表格字段:
    学习实例的表单字段

    学习实例的表格字段和在学习实例级别添加自定义表格
    注: 添加字段选项不适用于收据文档类型。
  3. 单击创建

后续步骤

将文档上传到学习实例,修复验证错误,并验证提取的数据:在 Community Edition 中处理文档