Cloud Extraction Service 架构
- Updated: 2025/11/21
Cloud Extraction Service 架构
Cloud Extraction Service 架构概述了文档处理的数据流程,详细说明了使用各种组件和第三方服务进行数据上传、提取和下载的各个阶段。
以下 Cloud Extraction Service 架构为文档处理数据流程中涉及的各个阶段提供了高层次的概览。
- Cloud Extraction Service 不支持自带密钥 (BYOK)。
- 有关如何在 Document Automation 中存储文档的信息,请参阅 Document Automation 安全常见问题解答。
下图显示了 Cloud Extraction Service 中所用不同组件的概览:
- 客户网络
- 客户网络是数据提取过程的起始点。
- 输入: 此过程包括上传需要处理的文档,以提取数据。
- 上传 机器人: 此过程包括将文档上传到 Control Room Cloud 存储服务。
- 下载 机器人: 此过程包括从文档中下载提取的信息。
- 输出: 此过程包括存储提取的信息。
- Automation Anywhere Cloud
- Control Room(仅 Cloud): 通过确认来自 Bot Runner 设备的请求,编排数据提取过程。
- 第三方 Cloud 服务
- Google Vision OCR: 此过程包括将文档转换为机器可读格式,并且在 Google Cloud 上对文档进行 OCR 处理。
使用 生成式 AI 提供程序进行数据提取
下图显示了通过 生成式 AI 提供程序中不同组件的端到端数据流:
以下部分表示在使用 生成式 AI 提供程序时,通过不同组件的数据流的不同阶段:
- 阶段 1: 将文件上传到 Control Room
-
用户将文件上传到 Control Room,或者调度程序 机器人 从共享位置上传文件。 文件已临时上传到 Control Room 存储服务。
- 阶段 2: 文档提取流程
-
Control Room 使用 Automation Anywhere 预训练模型或第三方 Cloud 提取服务启动数据提取流程。
- Automation Anywhere 预训练模型: 数据提取通过 Cloud Extraction Service 进行处理。
- Document Automation 订阅: 数据提取请求通过 Automation Anywhere 代理网关从第三方 Cloud 提取服务发送和接收。
- 阶段 3: 正在下载输出
-
数据提取结果会以 CSV 或 JSON 格式下载到用户定义的网络路径。 客户通常会创建 机器人,以将此信息上传到下游应用程序或录制系统。
使用 Microsoft Azure AI Document Intelligence 进行数据提取
下图显示了通过 Microsoft Azure AI Document Intelligence 不同组件的端到端数据流:
- 阶段 1: 正在上传文件并获取配置信息
-
用户将文件上传到 Control Room,或者调度程序 机器人 从共享位置上传文件。 文件已临时上传到 Control Room 存储服务。
- 阶段 2: 数据提取流程
-
Control Room 使用 Cloud Extraction Service 启动 OCR 和数据提取流程。 数据提取请求直接通过 Microsoft Azure AI Document Intelligence 服务发送和接收,适用于 Document Automation 订阅。 数据提取结果被发送到 Control Room。
- 阶段 3: 正在下载输出
-
数据提取结果会以 CSV 或 JSON 格式下载到用户定义的网络路径。 客户通常会创建 机器人,以将此信息上传到下游应用程序或录制系统。