通过创建学习实例来开始处理文档,从各种支持的文档类型中提取数据。 学习实例是一种结构,其中包含文档类型、语言、要提取的字段等信息。

先决条件

  • 要创建学习实例,您必须是学习实例创建者用户。 请参阅 Document Automation 用户
  • 对于支持 OCR 的文档类型,默认的 OCR 是 ABBYY FineReader Engine。或者,您可以创建一个学习实例来使用 Google Vision OCR 处理文档。
  • 对于标准表单文档类型,请确保您已创建自定义提取模型。 请参阅 使用 Standard Forms 创建自定义提取模型

观看此视频,了解创建学习实例的完整端到端过程:

过程

  1. Control Room 主页导航到 AI > Document Automation ,然后单击创建学习实例
  2. 输入该学习实例的名称和描述。
    Document Automation 不允许重复的学习实例名称,因此您提供的名称必须是唯一的。
  3. 选择合适的文档类型。
    注: 使用用户定义的文档类型来处理在视觉上与发票相似的文档,例如包含键值对和表格结构的采购订单和销售订单。 在此文档类型中,您可以创建和配置所有表单和表格字段。
  4. 选择语言。
    有关 Document Automation 中支持的语言的详细信息,请参阅 Document Automation 中支持的语言

    如果您选择在步骤 3 配置解析器时使用的文档类型,则在解析器配置期间选择的语言会自动被选中。 此外,区域设置列表会根据自动选择的语言显示语言选项。

  5. 选择提供商。
    如果您在步骤 4 中选择了英语语言, Automation Anywhere(预训练)会被自动选中。

    如果您选择在步骤 3 中配置解析器时使用的文档类型,则配置的(第三方)解析器会自动被选为提供商。

  6. 可选: 选择 OCR 提供商。
    您可从以下选项中进行选择:
    • ABBYY
    • Google Vision
    • 数字 PDF 提取器
      注: 仅使用数字 PDF 提取器选项从数字 PDF 中提取数据,而不能从扫描的文档或图像中提取数据。

    默认情况下,Document Automation 使用 ABBYY FineReader Engine 处理文档。

    具有 Cloud Control Room 的用户可以选择使用 Google Vision OCR 或数字 PDF 提取器处理文档。

  7. 可选: 您可以使用通过验证提高准确性选项向系统发送反馈,以改进提取结果。 有关更多信息,请参见 通过验证提高提取准确性
    注:
  8. 可选: 选择生成式 AI 驱动的数据提取选项以使用 generative AI 功能进行提取。 有关更多信息,请参阅 Document Automation - 使用 generative AI 的数据提取
    选择以下 generative AI 提供商之一:
    注:
    • 要使用生成式 AI 驱动的数据提取选项,请确保您使用的是 Document Extraction package 版本 3.31.16 或更高版本。 请参阅 Document Extraction package updates
    • 仅对选定的文档类型提供生成式 AI 驱动的数据提取选项。 对于某些文档类型,生成式 AI 驱动的数据提取选项默认启用,且无法禁用。 对于此类文档类型,您只能选择 generative AI 提供商。
    • 当您从之前的版本更新到 v.33 或更高版本时,Open AI 将被设置为默认的数据提取提供商。
    • 当您在学习实例中选择 Anthropic 作为数据提取提供商且未在相应的提取 bot 中配置所需的 Anthropic 设置时,处理文档时会出现错误。
    • 如果您为学习实例选择了 Anthropic 提供商,并错误配置了 Anthropic 设置或在相应的提取 bot 中选择了不同的提供商,处理文档时将会看到错误。
    • 如果您使用 OpenAI 处理了文档,然后切换到 Anthropic 进行数据提取,那么只有在切换到 Anthropic 之后处理的文档才会使用 Anthropic 进行数据提取。 对于先前处理的文档,提取的数据将使用 OpenAI
    • Open AIOpenAI 提供访问 Open AI 强大的语言模型,用于内容生成、摘要、图像理解、语义搜索和自然语言到代码的翻译。 该提供商可通过嵌入式许可证(不需要任何额外的许可证)和自带许可证 (BYOL) 使用。 如果您使用自带许可证 (BYOL),请确保在提取 bot 中配置 OpenAI 的附加设置以使用此提供商。 请参阅 Extract data action
    • Anthropic: 您现在可以通过 AWS 和 GCP 使用 Anthropic generative AI 模型在 Document Automation 中进行数据提取。 此产品为您提供灵活性,可以根据贵公司认证的 Cloud 提供商选择 generative AI 模型。

      Anthropic 提供以下优势:

      • 高效处理大型非结构化文档
      • 可以处理英文和其他语言的文档
      • 以更高的数据提取准确性更快地处理文档

      如果您使用自带许可证 (BYOL),则必须在 Google Vertex AIAmazon Bedrock 服务上配置 Anthropic Claude 模型,然后在提取 bot 中配置其他设置以使用此提供商。 请参阅 Extract data action

    在 Document Automation 中创建学习实例
  9. 单击下一步

我们建议您在配置表单和表格字段时,将示例文档与 Control Room 窗口并排打开。

注:
  • 表单字段是指在文档中仅出现一次的字段类型。
  • 表格字段是一种在文档中反复出现的字段,通常以表格的形式出现。

  1. 配置表单和表格字段以进行提取。 有关更多详情,请参阅 查看和搜索字段
    1. 单击字段以打开字段编辑器。 有关更多详情,请参阅 编辑字段和创建自定义别名的指南
    2. 将鼠标悬停在字段右侧的菜单图标上,访问上下箭头。
    3. 使用箭头重新排列字段的顺序,以实现更高效的手动验证。
      字段的顺序不会改变提取。
    有关其他字段属性的更多信息,请参阅 表单和表格字段的注意事项
  2. 单击 添加字段 并指定字段详细信息,例如字段名称、字段标签、置信度、数据类型、格式化日期/数字等。 有关更多详情,请参阅 表单和表格字段的注意事项
    注: 如果您选择了生成式 AI 驱动的数据提取选项,我们建议您在创建学习实例时添加字段的优质提示,以获得预期结果。 请参阅 Document Automation - 使用 generative AI 的数据提取
    以下图像显示了在学习实例中配置的表单和表格字段:
    学习实例的表单字段

    学习实例的表格字段和在学习实例级别添加自定义表格
    注: 添加字段选项不适用于收据文档类型。
  3. 可选: 表格字段选项卡上,单击 + 图标以在学习实例级别添加自定义表格。
    1. 输入表格名称。
    2. 可选: 输入提示,描述要从中提取数据的文档中表格的详细信息。 例如,如果文档包含多个表头相同但标题不同的表格,可以在提示中指定准确的表格标题,以确保从正确的表格中提取数据。
      要更新表格提示,请单击编辑表格编辑表格图标)图标,更新提示,然后单击更新
    3. 单击添加
    4. 单击 添加字段 并指定字段详细信息,例如字段名称、字段标签、置信度、数据类型、格式化日期/数字等。 有关更多详情,请参阅 表单和表格字段的注意事项
      注: 您还可以在编辑学习实例时添加和删除自定义表格。
    自定义表格显示在表格下拉列表中。
    在学习实例级别创建表格并显示在下拉列表中

    您还可以在文档规则选项卡上查看自定义和默认表格中的字段,但无法选择所有不同表格中的字段。 有关多表格支持的更多详细信息,请参阅 在学习实例中创建或编辑自定义多表格的指南

  4. 单击创建
当创建一个新的学习实例时,Control Room 会在 自动化 > 文档工作区流程 文件夹中创建一个与学习实例同名的文件夹。 文件夹包含两个bots(提取和下载)、一个流程和一个表单。 有关更多详情,请参阅 Bots 输出文件和文件夹结构

后续步骤

将文档上传到学习实例,修复验证错误,并验证提取的数据:在 Document Automation 中处理文档