作为平民开发者或专业开发者,您可以将文档提取任务添加到任何流程中,以从文档中提取数据。 提取可使用任务机器人(通过机器人运行程序)或 Automation Anywhere 云提取服务来完成。

您可以使用 Process Composer 配置任务,以自定义和控制您的 Document Automation 工作流。 请参阅 Document Automation 中面向业务用户的 Automation Co-Pilot 流程以获取详细信息。

过程

  1. Document Extraction 任务从元素面板拖动到您的流程中。
  2. 文档提取面板中,配置:
    1. 元素 ID(例如,DocumentExtraction)。
    2. 任务名称(例如,$input[InputFileName]$ - 在 UI 中作为参考显示。
    3. 您有两个选项来处理文档。 选择源选择
      • 选项 A:任务机器人(默认),以使用机器人运行程序提取文档。
      • 选项 B:云提取,以使用 Automation Anywhere 云提取服务提取文档。
      选项 A: 使用任务机器人处理文档
      1. 选择任务机器人
        注: 任务机器人必须拥有来自文档提取软件包的提取数据操作。
      2. (可选)在实施前单击预览机器人
      3. 设置队列超时(1 分钟到 24 小时),以避免延迟,并防止机器人在未在指定时间内启动时导致流程停滞。
      4. 检查输入值并分配变量。 输入字段由所选的任务机器人设置。 但是,如果您选择了预先制作的 Document Automation 提取机器人,这些是预期的输入字段(此列表可能会根据创建学习实例时的版本而变化):
        • InputFilePath:$inputFile(桌面路径或通过创建请求操作传递的文件对象[推荐]。)
        • LearningInstanceName:$input[LearningInstancename]$(这是一个可选变量;在此示例中,它是 Document Automation 自动生成机器人时使用的学习实例名称。)
        • Version:$input[Version]$(可选变量;在此示例中,用于传递在测试模式下使用的学习实例版本。
        • ReferenceID:$CopilotRefId$(可选变量;在此示例中,用于在 Document Automation 自动生成机器人时,跨版本跟踪文档提取结果的 ID。)
      5. 作为平民开发者或专业开发者,您可以选择任务机器人的执行方式:在请求创建者的桌面本地执行或远程执行。
        机器人任务执行模式下拉菜单中,您可以选择以下模式:
        • 远程执行(默认): 本地机器人根据您的全局/流程调度程序设置远程运行,并在审核日志中生成相应条目。 通过远程执行,自动化可以在用户处理其他任务的同时独立运行,并在自动化完成后由 Automation Co-Pilot 发出通知。
        • 本地执行(主窗口): 本地机器人在请求创建者设备的主窗口上执行,并在审核日志中生成相应条目。 请求必须由具有受监管许可的用户创建,并选择一个默认设备;否则,机器人任务执行模式默认为远程执行。 本地执行使敏感数据保持 On-Premises,并且在本地桌面上不会产生排队时间。
        • 本地执行(子窗口): 本地机器人在请求创建者设备的子窗口上执行,并在审核日志中生成相应条目。 请求必须由具有受监管许可的用户创建,并选择一个默认设备;否则,机器人任务执行模式默认为远程执行。 本地执行使敏感数据保持 On-Premises,并且在本地桌面上不会产生排队时间。 允许在执行期间使用主桌面。
      选项 B: 使用 Automation Anywhere Cloud Extraction 服务处理文档
      1. 选择云提取,以使用 Automation Anywhere Cloud Extraction 服务提取文档。 有关更多详情,请参阅Automation Anywhere Cloud Service
      2. 输入输入文件。 例如,我们建议您输入通过创建请求操作 (
        amp;ProcessRequest{input}{InputFile}$
        ) 传递的文件对象引用 ($InputFile$)。
      3. 输入学习实例名称。 这是 Document Automation 中学习实例的名称,例如 (
        amp;ProcessRequest{input}{InputFile}$
        )。
      4. 学习实例版本。 此字段通常由 Document Automation 自动填写。 我们不建议更改此字段。 如果您不确定,请直接留空。
      5. Document Extraction 软件包版本。 您无需进行任何设置即可使用最新版本。 但是如果您想使用较旧的版本处理数据,可以输入该版本。
        注: 如果您未进行设置,将会自动使用最新的测试模式版本和最新的文档提取包版本
  3. 数据隐私标签字段(可选)中,添加字符串或变量以将敏感输出标记为隐藏。
  4. 单击保存以完成。
    现在您已在流程自动化中配置了文档提取任务。 任务完成后:
    • 如果您使用任务机器人进行文档提取,Process Composer 将关闭该任务,并保留在所选任务机器人中设置的输出变量。
    • 如果您使用云提取进行文档提取,任务将在事件完成时关闭。 文档提取任务包括以下输出字段:
      输出字段 描述 可能的值
      DocumentID 已处理文档的唯一 ID 不适用
      状态 文档的当前状态
      • DW_EXTRACT_SUCCESS: 文档提取任务完成

      • DW_EXTRACT_FAILURE: 文档提取任务失败

      • DW_EXTRACT_VALIDATION: 文档提取任务已成功完成,但文档包含验证错误。

      StatusCode 执行后的状态结果 不适用
      StatusMessage 状态代码的解释 不适用
      ErrorMessage 失败原因的描述 不适用
      ErrorModule 指示发生错误的提供程序 可能的选项包括:
      • 本地
      • V8
      • DocAI
      • 经典 (IQBot)
      • StandardForm

客户场景: 使用 Cloud Document Extraction 的发票处理自动化

此场景适用于 Acme Manufacturing Corporation。
  • 挑战: 每天从数百个供应商提交的数据中手工输入发票数据,既容易出错,速度又慢,还耗费大量资源。
  • 业务目标: 使用 Automation Anywhere 的云提取服务自动提取发票数据,提高准确性并缩短周转时间。

解决方案概览和工作流:

Acme 在 Automation 360 中实施了 Document Automation 工作流,并使用云提取服务实时提取和处理发票数据。

关键组件

  • 通过电子邮件或上传门户提交的供应商发票。

  • 基于云的结构化/非结构化数据提取。

  • 与公司 ERP 系统 (SAP) 的无缝集成。

文档提取场景

  1. 触发器: 供应商将发票 (PDF) 上传到安全门户。
  2. 机器人启动: 在 Process Composer 中定义的流程自动化被触发。
  3. 云提取任务:
    • 自动化包括使用云提取文档提取任务

    • 输入文件作为文件对象 ($InputFile$) 传递。

    • 系统引用了名称为 Invoice_AI_Model 的已训练学习实例,并且

  4. 云端处理:
    • 文档上传到 Automation Anywhere Cloud。

    • AI 提取发票字段: 发票号码、供应商名称、采购订单号、明细项目、金额和到期日期。

  5. 验证(可选):

    如果已配置,提取的数据会路由到人工验证员以处理低置信度条目。

  6. 集成: 在验证或自动批准后,结构化数据通过 API 集成推送到 SAP
  7. 审计与通知:
    • 将记录 DocumentIDStatusStatusMessage 等输出变量。
    • 财务团队收到一条 Automation Co-Pilot 通知,其中包含摘要和异常(如有)。
下表显示了 Acme Manufacturing Corp. 的业务影响和指标
指标 自动化前 云提取后
平均发票处理时间 10 分钟 1.5 分钟
数据输入错误 ~5% <0.2%
每月成本 $8,000(手动劳动) $1,200(机器人+云成本)
主要优势
  • 无需基础架构: 提取在云端安全处理。

  • AI 驱动的准确性: 在不同的发票格式中进行一致的提取。

  • 可扩展且灵活: 处理高峰负载(例如,月末高峰)。

  • 可供审核: 全面跟踪状态、消息和错误。