在创建学习实例时,请记住以下注意事项:表单和表格字段、搜索字段、创建学习实例后有关输出文件夹的附加信息等等。

查看和搜索字段

Document Automation 提供了一套标准的表单和表格字段,其中许多字段最初是不可见的。您可以通过字段名称、字段标签或数据类型来搜索字段。

要查看完整的字段列表,请单击显示未使用的字段。 请参见以下视频以观看演示:

编辑字段和创建自定义别名的指南

  • 您可以编辑字段的大多数属性。
  • 您无法编辑名称和默认别名。Document Automation 将默认别名(即硬编码的关键字)分配给标准字段,以帮助进行提取。
  • 您无法修改或删除默认别名,但可以在自定义别名字段中添加别名。

    请参阅以下视频以了解如何创建自定义别名的演示:

表单和表格字段的注意事项

以下表格列出了描述中需要指定的所有字段名称和必填值。
选项 描述
字段名称 输入以字母(A-Z 或 a-z)开头的字段名称。

在标准字段中,字段名称是硬编码的,无法更改。

字段标签 输入一个用户友好的名称以帮助验证者。

例如,您可以将组织税号重命名为本地化名称,例如增值税号

字段标签不影响提取。

置信度 设置阈值以减少潜在的误报。

在处理时,Document Automation 引擎为文档中的每个字段分配一个分数,以指示数据被正确提取的确定性。 如果文档中包含分数低于置信度阈值的字段,则该文档将被发送到验证队列。

如果您输入较高的置信度阈值,将有更多文档被发送到验证队列。 如果您输入较低的置信度阈值,将有更少的文档被发送到验证队列。

支持的数值范围从一到一百。

数据类型 从以下数据类型中进行选择:
  • 地址*: 当您需要从文档中提取地址字段时,请使用此数据类型。 该系统经过训练可以提取各种地址字段,并使用此数据类型指示系统从文档中检测和提取地址。
  • 文本: 当您需要从文档中提取文本字段时,请使用此数据类型。 该系统经过训练可以提取各种文本字段,并使用此数据类型指示系统从文档中检测和提取文本。
  • 数字: 当您需要从文档中提取数值字段时,请使用此数据类型。 该系统经过训练可以提取各种数值字段,并使用此数据类型指示系统从文档中检测和提取数字。
  • 日期: 当您需要从文档中提取日期字段时,请使用此数据类型。 该系统经过训练可以提取各种日期格式,并使用此数据类型指示系统从文档中检测和提取日期。

如果字段中的数据与数据类型不匹配,文档将被发送到验证队列。

Document Automation 支持日期和数字格式的变化。

* 如果您正在配置具有用户定义文档类型的学习实例,表单字段包括地址数据类型,该类型提取地址的整个结构。

格式化日期/数字 设置标准外观以将提取的日期和数字转换为特定格式。 这能确保您的数据库和其他记录系统的一致性和准确性。

例如,如果您选择将日期标准化为 MM/DD/YYYY,而处理过的文档包含一个日期,显示为 2023 年 2 月 12 日,学习实例将把该日期重新格式化为 02/12/2023

如果您选择将数字标准化为英语(美国)区域设置,并且处理过的文档中包含一个显示为 100,00 的数字,学习实例将把该数字重新格式化为 100.00

必填 选择以下选项之一:
  • 必填项: 字段不能为空。
  • 可选: 字段可以为空或在文档中不存在。
使用验证反馈提高准确性 禁用或启用该字段的验证反馈。 当您在创建学习实例页面上选择使用验证提高准确性选项时,默认情况下此选项对所有字段启用。 启用此选项时,提供的字段验证反馈将用于提高数据提取的准确性。 但是,如果您发现即使不需要验证反馈也能根据您的要求提取字段值,或者当您需要使用替代解决方案(例如预先训练的模型或 generative AI 提供商)来改进数据提取时,您可以清除此选项的复选框以禁用该字段的验证反馈。
注:
  • 验证反馈只能锁定在学习实例级别,不适用于表单和表格字段。
  • 当验证反馈被锁定在学习实例级别时,字段级验证反馈选项设置为只读模式,因为系统不会考虑任何验证反馈来提高数据准确性。 要编辑字段级验证,您必须为学习实例禁用验证锁定。
  • 如果禁用表格字段的验证反馈,则这些字段不会显示在高级训练设置选项中。 例如,如果您想在高级培训设置中选择“数量”列作为主要列,并且如果此表格字段的验证反馈被禁用,则“数量”列将不会显示在“主要列”列表中。
默认别名 此字段无需采取任何措施。Document Automation 将默认别名(硬编码关键字)分配给标准字段以帮助提取。
自定义别名 其他关键词可帮助 Document Automation 找到该字段。 例如,将增值税号等字段的国家或地区特定名称添加为组织税号自定义字段的别名。
注: 自定义别名必须唯一。 不能复制另一个字段的默认别名。 例外: 表单字段可以具有与表格字段重复的自定义别名,反之亦然。
验证规则 根据数据类型,使用模式、公式、列表和语句(例如以...开始或以...结束)创建规则。

公式验证 | 正则表达式模式验证

在学习实例中创建或编辑自定义多表格的指南

在创建或编辑学习实例级别的多表格时,请考虑以下几点:
  • 此功能适用于以下文档类型:Automation Anywhere(预训练)、Automation Anywhere(用户定义)、IQ BotDocument Automation桥接package,以及非结构化(generative AI)。
  • 一次只能针对一个表格字段设置规则,不能跨属于不同表格的字段进行设置。
  • 所有字段名称都必须唯一。
  • 高级训练设置适用于多表格。 它将基于每个表格工作,而不是跨表格工作。
  • 您可以导入、导出和复制包含多表格的学习实例。
  • 您可以删除在学习实例中创建的自定义表格,但默认表格无法删除。
  • 自定义多表格名称的最大字符数为 50 个字符,列名称的最大字符数为 200 个字符。
  • 表名字段中,只允许使用字母数字、下划线、空格和连字符。
  • 您无法在创建或编辑学习实例时重命名表名。
  • 多表格支持不适用于 Standard FormsGoogle Document AI、提单、运单、到货通知和装箱单文档类型。
  • 输出(CSV)文件将以 table_name字段名称格式指示所有表格引用(默认和自定义多表格)。

Bots 输出文件和文件夹结构

当创建一个新的学习实例时,Control Room 会在自动化 > 文档工作区文件夹中创建一个与学习实例同名的文件夹。 文件夹包含两个 bots(提取和下载)、一个流程和一个表单。
学习实例资产的示例截图
  • 流程: 使用 if/else 场景管理流程,通过该场景,Document Automation 从上传的文档中提取数据、将文档分配给用户进行验证,并下载提取的数据。 要了解更多详情,请参阅 Document Automation 中的 Automation Co-Pilot for Business Users 流程
  • 提取机器人: 从上传的文档中提取定义字段的数据。
  • 下载机器人: 将提取的数据下载到设备或共享网络上的特定文件夹。
  • 表单: 定义发送到流程的输入参数。 输入参数包括学习实例名称、上传的文件和输出文件路径。