Automation 360

在 Document Automation 中创建学习实例

Download as PDF

Table of Contents

在 Document Automation 中创建学习实例

Download as PDF

Updated: 2026/04/01

通过创建学习实例来开始处理文档，从各种支持的文档类型中提取数据。学习实例是一种结构，其中包含文档类型、语言、要提取的字段等信息。

先决条件

要创建学习实例，您必须是学习实例创建者用户。请参阅 Document Automation 用户。
对于支持 OCR 的文档类型，默认的 OCR 是 ABBYY FineReader Engine。或者，您可以创建一个学习实例来使用 Google Vision OCR 处理文档。
对于标准表单文档类型，请确保您已创建自定义提取模型。请参阅使用 Standard Forms 创建自定义提取模型。

过程

从 Control Room 主页导航到 AI > Document Automation ，然后单击新建。
输入该学习实例的名称和描述。
Document Automation 不允许重复的学习实例名称，因此您提供的名称必须是唯一的。
选择合适的文档类型。

注：使用用户定义的文档类型来处理在视觉上与发票相似的文档，例如包含键值对和表格结构的采购订单和销售订单。在此文档类型中，您可以创建和配置所有表单和表格字段。
选择语言。
有关 Document Automation 中支持的语言的详细信息，请参阅 Document Automation 中支持的语言。
如果您选择在步骤 3 配置解析器时使用的文档类型，则在解析器配置期间选择的语言会自动被选中。此外，区域设置列表会根据自动选择的语言显示语言选项。
选择提供商。
如果您在步骤 4 中选择了英语语言， Automation Anywhere（预训练）会被自动选中。
如果您选择在步骤 3 中配置解析器时使用的文档类型，则配置的（第三方）解析器会自动被选为提供商。
可选： 选择 OCR 提供商。
您可从以下选项中进行选择：
- ABBYY
- Google Vision
- 数字 PDF 提取器
  
  注：仅使用数字 PDF 提取器选项从数字 PDF 中提取数据，而不能从扫描的文档或图像中提取数据。
默认情况下，Document Automation 使用 ABBYY FineReader Engine 处理文档。

具有 Cloud Control Room 的用户可以选择使用 Google Vision OCR 或数字 PDF 提取器处理文档。
在使用以下方式处理文档部分中，选择以下选项之一：
- 任务机器人：默认情况下，此选项处于选中状态。使用 Bot Runners 执行数据提取。
- 云提取：使用 Cloud Extraction Service 执行数据提取。
  注：要使用云提取，您需要购买 Enterprise Platform 许可证以及 Document AI Credits。
要了解任务机器人和云提取之间的区别，请参阅 Cloud Extraction Service。
可选： 您可以使用通过验证提高准确性选项向系统发送反馈，以改进提取结果。有关更多信息，请参见通过验证提高提取准确性。
注：
- 仅对选定的文档类型提供使用验证提高准确性选项。
- 使用验证提高准确性选项将使用在生成式 AI 模型搜索查询功能中提供的用户提示来提升数据提取的准确性。请参阅 Document Automation - 使用 generative AI 的数据提取。
可选： 选择生成式 AI 驱动的数据提取选项以使用 generative AI 功能进行提取。有关更多信息，请参阅 Document Automation - 使用 generative AI 的数据提取。
选择 Automation Anywhere generative AI 提供商或自定义 generative AI 模型连接：
注：
- 有关创建自定义 generative AI 模型连接的信息，请参阅在 Document Automation 中使用 Model connections。
- 要使用生成式 AI 驱动的数据提取选项，请确保您使用的是 Document Extraction package 版本 3.31.16 或更高版本。请参阅 Document Extraction package 更新。
- 仅对选定的文档类型提供生成式 AI 驱动的数据提取选项。对于某些文档类型，生成式 AI 驱动的数据提取选项默认启用，且无法禁用。对于此类文档类型，您只能选择 generative AI 提供商。
- 当您从之前的版本更新到 v.33 或更高版本时，Open AI 将被设置为默认的数据提取提供商。
- 如果您为学习实例选择了 Anthropic 提供商，并错误配置了 Anthropic 设置或在相应的提取 bot 中选择了不同的提供商，处理文档时将会看到错误。
- 如果您使用 OpenAI 处理了文档，然后切换到 Anthropic 进行数据提取，那么只有在切换到 Anthropic 之后处理的文档才会使用 Anthropic 进行数据提取。对于先前处理的文档，提取的数据将使用 OpenAI。
- Open AI：OpenAI 提供访问 Open AI 强大的语言模型，用于内容生成、摘要、图像理解、语义搜索和自然语言到代码的翻译。该提供商可通过嵌入式许可证（不需要任何额外的许可证）和自带密钥 (BYOK) 使用。如果您使用 BYOK，请确保在提取 bot 中配置 OpenAI 的附加设置以使用此提供商。请参阅提取数据 action。
- Anthropic：您现在可以通过 AWS 和 GCP 使用 Anthropic generative AI 模型在 Document Automation 中进行数据提取。此产品为您提供灵活性，可以根据贵公司认证的 Cloud 提供商选择 generative AI 模型。
  Anthropic 提供以下优势：
  - 高效处理大型非结构化文档
  - 可以处理英文和其他语言的文档
  - 以更高的数据提取准确性更快地处理文档
  如果您使用 BYOK，则必须在 Google Vertex AI 或 Amazon Bedrock 服务上配置 Anthropic Claude 模型，然后在提取 bot 中配置其他设置以使用此提供商。请参阅提取数据 action。
- Google Gemini : 您现在可以使用 Google Gemini generative AI 模型在 Document Automation 中进行数据提取。
  Google Gemini 提供以下优势：
  - 高效处理大型非结构化文档
  - 处理英文和其他语言的文档
  - 处理复杂的文档布局
  - 更快的文档处理速度和更高的数据提取准确性
  注： Google Gemini 模型不支持 BYOK。
单击下一步。

我们建议您在配置表单和表格字段时，将示例文档与 Control Room 窗口并排打开。

注：

表单字段是指在文档中仅出现一次的字段类型。
表格字段是一种在文档中反复出现的字段，通常以表格的形式出现。

配置表单和表格字段以进行提取。有关更多详情，请参阅查看和搜索字段。
1. 单击字段以打开字段编辑器。有关更多详情，请参阅编辑字段和创建自定义别名的指南
2. 将鼠标悬停在字段右侧的菜单图标上，访问上下箭头。
3. 使用箭头重新排列字段的顺序，以实现更高效的手动验证。
  字段的顺序不会改变提取。
有关其他字段属性的更多信息，请参阅表单和表格字段的注意事项。
单击添加字段并指定字段详细信息，例如字段名称、字段标签、置信度、数据类型、格式化日期/数字等。有关更多详情，请参阅表单和表格字段的注意事项。

注：如果您选择了生成式 AI 驱动的数据提取选项，我们建议您在创建学习实例时添加字段的优质提示，以获得预期结果。请参阅 Document Automation - 使用 generative AI 的数据提取。
以下图像显示了在学习实例中配置的表单和表格字段：

注：添加字段选项不适用于收据文档类型。
可选： 在表格字段选项卡上，单击 + 图标以在学习实例级别添加自定义表格。
1. 输入表格名称。
2. 可选： 输入提示，描述要从中提取数据的文档中表格的详细信息。例如，如果文档包含多个表头相同但标题不同的表格，可以在提示中指定准确的表格标题，以确保从正确的表格中提取数据。
  要更新表格提示，请单击编辑表格（）图标，更新提示，然后单击更新。
3. 单击添加。
4. 单击添加字段并指定字段详细信息，例如字段名称、字段标签、置信度、数据类型、格式化日期/数字等。有关更多详情，请参阅表单和表格字段的注意事项。
  
  注：您还可以在编辑学习实例时添加和删除自定义表格。
自定义表格显示在表格下拉列表中。

您还可以在文档规则选项卡上查看自定义和默认表格中的字段，但无法选择所有不同表格中的字段。有关多表格支持的更多详细信息，请参阅在学习实例中创建或编辑自定义多表格的指南。
单击创建。

当创建一个新的学习实例时，Control Room 会在自动化 > 文档工作区流程文件夹中创建一个与学习实例同名的文件夹。文件夹包含两个bots（提取和下载）、一个流程和一个表单。有关更多详情，请参阅 Bots 输出文件和文件夹结构。

后续步骤

将文档上传到学习实例，修复验证错误，并验证提取的数据：在 Document Automation 中处理文档

Automation 360

在 Document Automation 中创建学习实例

先决条件

过程

后续步骤

Related Content