Cloud Extraction Service 架构

Cloud Extraction Service 架构概述了文档处理的数据流程,详细说明了使用各种组件和第三方服务进行数据上传、提取和下载的各个阶段。

以下 Cloud Extraction Service 架构为文档处理数据流程中涉及的各个阶段提供了高层次的概览。

注:

下图显示了 Cloud Extraction Service 中所用不同组件的概览:

使用 Cloud Extraction Service 功能时的文档处理工作流示意图
客户网络
客户网络是数据提取过程的起始点。
  • 输入: 此过程包括上传需要处理的文档,以提取数据。
  • 上传 机器人: 此过程包括将文档上传到 Control Room Cloud 存储服务。
  • 下载 机器人: 此过程包括从文档中下载提取的信息。
  • 输出: 此过程包括存储提取的信息。
Automation Anywhere Cloud
Control Room(仅 Cloud): 通过确认来自 Bot Runner 设备的请求,编排数据提取过程。
Cloud Extraction Service: 此过程包括通过向 OCR 和第三方 Cloud 服务发送请求来提取文档中的信息。 所有数据提取请求均通过 Cloud Extraction Service 发送和接收。
第三方 Cloud 服务
Google Vision OCR: 此过程包括将文档转换为机器可读格式,并且在 Google Cloud 上对文档进行 OCR 处理。
LLM 提供商: 此过程包括使用第三方 生成式 AI 模型进行数据提取。

使用 生成式 AI 提供程序进行数据提取

下图显示了通过 生成式 AI 提供程序中不同组件的端到端数据流:

使用 Cloud Extraction Service 功能时 生成式 AI 提供程序的数据流程图

以下部分表示在使用 生成式 AI 提供程序时,通过不同组件的数据流的不同阶段:

阶段 1: 将文件上传到 Control Room

数据流程图显示文件上传到 Control Room

用户将文件上传到 Control Room,或者调度程序 机器人 从共享位置上传文件。 文件已临时上传到 Control Room 存储服务。

阶段 2: 文档提取流程

文档提取流程的数据流程图

Control Room 使用 Automation Anywhere 预训练模型或第三方 Cloud 提取服务启动数据提取流程。

  • Automation Anywhere 预训练模型: 数据提取通过 Cloud Extraction Service 进行处理。
  • Document Automation 订阅: 数据提取请求通过 Automation Anywhere 代理网关从第三方 Cloud 提取服务发送和接收。
阶段 3: 正在下载输出

下载输出的数据流程图

数据提取结果会以 CSV 或 JSON 格式下载到用户定义的网络路径。 客户通常会创建 机器人,以将此信息上传到下游应用程序或录制系统。

使用 Microsoft Azure AI Document Intelligence 进行数据提取

下图显示了通过 Microsoft Azure AI Document Intelligence 不同组件的端到端数据流:

使用 Cloud Extraction Service 功能时,Microsoft Azure AI Document Intelligence 的数据流程图

阶段 1: 正在上传文件并获取配置信息

数据流程图显示文件上传到 Control Room

用户将文件上传到 Control Room,或者调度程序 机器人 从共享位置上传文件。 文件已临时上传到 Control Room 存储服务。

阶段 2: 数据提取流程

使用 Microsoft Azure AI Document Intelligence 服务执行文档提取流程的数据流程图

Control Room 使用 Cloud Extraction Service 启动 OCR 和数据提取流程。 数据提取请求直接通过 Microsoft Azure AI Document Intelligence 服务发送和接收,适用于 Document Automation 订阅。 数据提取结果被发送到 Control Room

阶段 3: 正在下载输出

下载输出的数据流程图

数据提取结果会以 CSV 或 JSON 格式下载到用户定义的网络路径。 客户通常会创建 机器人,以将此信息上传到下游应用程序或录制系统。