在 Document Automation 中创建学习实例
- Updated: 2026/04/01
通过创建学习实例来开始处理文档,从各种支持的文档类型中提取数据。 学习实例是一种结构,其中包含文档类型、语言、要提取的字段等信息。
先决条件
- 要创建学习实例,您必须是
学习实例创建者用户。 请参阅 Document Automation 用户。 - 对于支持 OCR 的文档类型,默认的 OCR 是 ABBYY FineReader Engine。或者,您可以创建一个学习实例来使用 Google Vision OCR 处理文档。
- 对于标准表单文档类型,请确保您已创建自定义提取模型。 请参阅 使用 Standard Forms 创建自定义提取模型。
过程
- 从 Control Room 主页导航到 AI > Document Automation ,然后单击新建。
-
输入该学习实例的名称和描述。
Document Automation 不允许重复的学习实例名称,因此您提供的名称必须是唯一的。
-
选择合适的文档类型。
注: 使用用户定义的文档类型来处理在视觉上与发票相似的文档,例如包含键值对和表格结构的采购订单和销售订单。 在此文档类型中,您可以创建和配置所有表单和表格字段。
-
选择语言。
有关 Document Automation 中支持的语言的详细信息,请参阅 Document Automation 中支持的语言。
如果您选择在步骤 3 配置解析器时使用的文档类型,则在解析器配置期间选择的语言会自动被选中。 此外,区域设置列表会根据自动选择的语言显示语言选项。
-
选择提供商。
如果您在步骤 4 中选择了英语语言, Automation Anywhere(预训练)会被自动选中。
如果您选择在步骤 3 中配置解析器时使用的文档类型,则配置的(第三方)解析器会自动被选为提供商。
- 可选:
选择 OCR 提供商。
您可从以下选项中进行选择:
- ABBYY
- Google Vision
- 数字 PDF 提取器注: 仅使用数字 PDF 提取器选项从数字 PDF 中提取数据,而不能从扫描的文档或图像中提取数据。
默认情况下,Document Automation 使用 ABBYY FineReader Engine 处理文档。
具有 Cloud Control Room 的用户可以选择使用 Google Vision OCR 或数字 PDF 提取器处理文档。
-
在使用以下方式处理文档部分中,选择以下选项之一:
- 任务机器人: 默认情况下,此选项处于选中状态。 使用 Bot Runners 执行数据提取。
-
云提取: 使用 Cloud Extraction Service 执行数据提取。注: 要使用云提取,您需要购买 Enterprise Platform 许可证以及 Document AI Credits。
要了解任务机器人和云提取之间的区别,请参阅 Cloud Extraction Service。
- 可选:
您可以使用通过验证提高准确性选项向系统发送反馈,以改进提取结果。 有关更多信息,请参见 通过验证提高提取准确性。
注:
- 仅对选定的文档类型提供使用验证提高准确性选项。
- 使用验证提高准确性选项将使用在生成式 AI 模型搜索查询功能中提供的用户提示来提升数据提取的准确性。 请参阅 Document Automation - 使用 generative AI 的数据提取。
- 可选:
选择生成式 AI 驱动的数据提取选项以使用 generative AI 功能进行提取。 有关更多信息,请参阅 Document Automation - 使用 generative AI 的数据提取。
选择 Automation Anywhere generative AI 提供商或自定义 generative AI 模型连接:注:
- 有关创建自定义 generative AI 模型连接的信息,请参阅 在 Document Automation 中使用 Model connections。
- 要使用生成式 AI 驱动的数据提取选项,请确保您使用的是 Document Extraction package 版本 3.31.16 或更高版本。 请参阅 Document Extraction package updates。
- 仅对选定的文档类型提供生成式 AI 驱动的数据提取选项。 对于某些文档类型,生成式 AI 驱动的数据提取选项默认启用,且无法禁用。 对于此类文档类型,您只能选择 generative AI 提供商。
- 当您从之前的版本更新到 v.33 或更高版本时,Open AI 将被设置为默认的数据提取提供商。
- 如果您为学习实例选择了 Anthropic 提供商,并错误配置了 Anthropic 设置或在相应的提取 bot 中选择了不同的提供商,处理文档时将会看到错误。
- 如果您使用 OpenAI 处理了文档,然后切换到 Anthropic 进行数据提取,那么只有在切换到 Anthropic 之后处理的文档才会使用 Anthropic 进行数据提取。 对于先前处理的文档,提取的数据将使用 OpenAI。
- Open AI:OpenAI 提供访问 Open AI 强大的语言模型,用于内容生成、摘要、图像理解、语义搜索和自然语言到代码的翻译。 该提供商可通过嵌入式许可证(不需要任何额外的许可证)和自带密钥 (BYOK) 使用。 如果您使用 BYOK,请确保在提取 bot 中配置 OpenAI 的附加设置以使用此提供商。 请参阅 提取数据 action。
-
Anthropic: 您现在可以通过 AWS 和 GCP 使用 Anthropic
generative AI 模型在 Document Automation 中进行数据提取。 此产品为您提供灵活性,可以根据贵公司认证的 Cloud 提供商选择 generative AI 模型。
Anthropic 提供以下优势:
- 高效处理大型非结构化文档
- 可以处理英文和其他语言的文档
- 以更高的数据提取准确性更快地处理文档
如果您使用 BYOK,则必须在 Google Vertex AI 或 Amazon Bedrock 服务上配置 Anthropic Claude 模型,然后在提取 bot 中配置其他设置以使用此提供商。 请参阅 提取数据 action。
-
Google Gemini
: 您现在可以使用 Google Gemini
generative AI 模型在 Document Automation 中进行数据提取。
Google Gemini 提供以下优势:
- 高效处理大型非结构化文档
- 处理英文和其他语言的文档
- 处理复杂的文档布局
- 更快的文档处理速度和更高的数据提取准确性
注: Google Gemini 模型不支持 BYOK。
- 单击下一步。
我们建议您在配置表单和表格字段时,将示例文档与 Control Room 窗口并排打开。
- 表单字段是指在文档中仅出现一次的字段类型。
- 表格字段是一种在文档中反复出现的字段,通常以表格的形式出现。
-
配置表单和表格字段以进行提取。 有关更多详情,请参阅 查看和搜索字段。
- 单击字段以打开字段编辑器。 有关更多详情,请参阅 编辑字段和创建自定义别名的指南
- 将鼠标悬停在字段右侧的菜单图标上,访问上下箭头。
-
使用箭头重新排列字段的顺序,以实现更高效的手动验证。
字段的顺序不会改变提取。
有关其他字段属性的更多信息,请参阅 表单和表格字段的注意事项。 -
单击 添加字段 并指定字段详细信息,例如字段名称、字段标签、置信度、数据类型、格式化日期/数字等。 有关更多详情,请参阅 表单和表格字段的注意事项。
注: 如果您选择了生成式 AI 驱动的数据提取选项,我们建议您在创建学习实例时添加字段的优质提示,以获得预期结果。 请参阅 Document Automation - 使用 generative AI 的数据提取。以下图像显示了在学习实例中配置的表单和表格字段:


注: 添加字段选项不适用于收据文档类型。 - 可选:
在表格字段选项卡上,单击 + 图标以在学习实例级别添加自定义表格。
- 输入表格名称。
- 可选:
输入提示,描述要从中提取数据的文档中表格的详细信息。 例如,如果文档包含多个表头相同但标题不同的表格,可以在提示中指定准确的表格标题,以确保从正确的表格中提取数据。
要更新表格提示,请单击编辑表格(
)图标,更新提示,然后单击更新。 - 单击添加。
-
单击 添加字段 并指定字段详细信息,例如字段名称、字段标签、置信度、数据类型、格式化日期/数字等。 有关更多详情,请参阅 表单和表格字段的注意事项。
注: 您还可以在编辑学习实例时添加和删除自定义表格。
自定义表格显示在表格下拉列表中。
您还可以在文档规则选项卡上查看自定义和默认表格中的字段,但无法选择所有不同表格中的字段。 有关多表格支持的更多详细信息,请参阅 在学习实例中创建或编辑自定义多表格的指南。
- 单击创建。
后续步骤
将文档上传到学习实例,修复验证错误,并验证提取的数据:在 Document Automation 中处理文档