使用本主题作为指南,创建学习实例,利用 generative AI (GenAI) 功能从合同、协议、报告、信件和电子邮件等非结构化文档中提取数据。

使用 generative AI,您可以创建学习实例,从非结构化文档中提取数据,而无需对学习实例进行训练。 这对于快速、准确的文档处理至关重要。 我们来了解一下如何创建具有 generative AI 功能的学习实例。所述功能可以从非结构化文档中准确提取数据。

先决条件

公司的一名专业开发人员将执行以下任务:
  • 创建、编辑和删除学习实例
  • 上传文档以进行处理和测试
  • 将学习实例从私有文件夹签入和签出到公共文件夹

许可证要求:需要 Bot Creator 许可证来执行上述任务。

分配的角色和权限:
  • AAE_IQBot ServicesAAE_IQBot Admin
  • AAE_Basic

过程

  1. 登录到 Control Room,导航到 AI > Document Automation ,然后单击创建学习实例按钮以开始创建新的学习实例。
  2. 接下来,输入一个唯一的学习实例名称,以便在学习实例列表中轻松识别,然后继续选择其他选项,如下所示:
    创建一个具有 generative AI 功能的非结构化文档学习实例。
    1. 描述(可选): 这是一个可选字段,可用于添加有意义的描述并总结学习实例的使用情况。
    2. 文档类型: 非结构化文档
      选择此选项后,将启用 generative AI 驱动的数据提取功能。 对于非结构化文档类型,将默认启用此功能。
    3. 语言: 选择语言。
    4. 区域设置:根据文档的区域设置。
      根据您的语言和文档来源国家/地区选择区域设置。
    5. 供应商: Automation Anywhere(用户定义)
      由于我们目前仅提供此选项,因此默认选择此值。
    6. OCR 提供商Google Vision OCR 或 ABBYY OCR
      从版本 v32 开始,新增了对 ABBYY OCR 的支持。
  3. 单击下一步以开始为学习实例创建表单和表格字段。
    有关创建表单和表格字段的详细信息,请参阅:在 Document Automation 中创建学习实例,第 10-12 步。
  4. 单击 添加字段,开始为您想要从文档中提取数据的每个数据点或实体添加字段。
  5. 接下来,添加一个字段名称,该名称必须特定于您要提取的数据点,添加一个字段标签,用于创建默认搜索查询,并选择数据类型,以定义字段值的数据结构。
    您可以从下拉菜单中选择文本、数字、日期或地址数据类型值选项。
  6. 当利用 generative AI 功能时,置信度字段显示为灰色。 该字段可以设置为必填可选
  7. 生成式 AI 模型的搜索查询部分,您可以选择使用系统生成的查询或添加自定义查询。
    例如,对于一个总成本字段,默认的 generative AI 查询将显示总成本是多少?。 您可以将查询自定义为总成本是多少?提取不带货币符号的数字。 这将提取不含货币信息的总成本。
    在具有 generative AI 功能的Document Automation中为学习实例创建表格字段
  8. 在下一步中,为表单和表格字段定义字段规则文档规则
    有关创建表格字段、添加字段规则文档规则的详细信息,请参阅 在 Document Automation 中创建学习实例在 Document Automation 中创建学习实例时的注意事项
  9. 从 v32 开始,您可以在定义表格字段的过程中定义多个表格。 根据场景,您可以通过单击表格字段下拉菜单旁边的添加表格图标定义其他表格。
  10. 单击创建,以完成学习实例的创建。

后续步骤

  1. 将学习实例发布到公共存储库,以便学习实例可以在公共模式下用于从真实文档中提取数据,并且验证者可以手动验证文档。 请参阅 实际正式发布学习实例
  2. AI > Document Automation 列表页面,找到您刚创建并发布的学习实例,然后单击处理,以开始上传文档进行处理和数据提取。 请参阅 在 Document Automation 中处理文档
  3. 打开包含提取数据的 CSV 文档,与处理后的文档进行比较,以验证和确认 Generative AI 启用的搜索查询字段中的提取数据是否高度准确。