根据您的业务需求或组织规模,将扩展需求分为三个容量级别。

低容量
适合文档处理需求较低的小型企业或团队。
  • 处理能力: 每天最多 2,400 页(每小时 100 页)。
  • 通常由单个 Bot Runner 管理。
中等容量
适合具有中等文档处理需求的中型组织或部门。
  • 处理能力: 每天最多 10,000 页(每小时 400-500 页)。
  • 使用 2 到 5 个 Bot Runners 处理工作负载。
高容量
最适合有大量文档处理需求的大型企业或组织。
  • 处理能力: 每天超过 10,000 页(每小时超过 500 页)。
  • 需要 5 个以上Bot Runners 以达到最佳性能。

每个容量级别的建议

低容量建议
对于低容量场景,如果您遵循推荐的配置,一个 Bot Runner 应该就足够了。 由于容量较低,通常不需要进行详细调整,因此,安装较为简单。 但是,请确保默认工作流和配置与基准保持一致,以免造成意外延迟。 请参阅 Bot Runner 配置和设置
中等容量建议
要确定所需的 Bot Runners 数量,请将总处理容量除以基准性能,即每小时 100 页或每天 2,400 页。 例如,如果您每天需要处理 6,000 页,则需要 3 个Bot Runners。 中等容量场景的关键注意事项包括以下内容:
  • 校准: 对照基准校准设备性能。 如果性能差异显著,请确保遵循推荐的配置。 请参阅 Bot Runner 配置和设置
  • 提供商差异: 如果使用 Automation Anywhere 以外的提取模型,例如,Microsoft Standard Forms(文档智能)或 Google Document AI,预计性能将提高 30%。
  • 多页文档: 通常,多页文档在每小时处理的页数方面表现出更高的性能。
  • 使用 LLM: 使用 LLM 可能会增加处理时间,尤其是在字段数量较多、文档较大或文档复杂性增加的情况下。
  • 队列管理: 使用仅在队列大小低于 100 时创建请求的 Task Bot 解决工作流瓶颈。 这可以防止系统过载并确保更顺畅的运行。 请参阅 构建 bot 以将文档上传到 Document Automation
高容量建议
对于高容量场景,中等容量的注意事项同样适用,但需要更加注重测试和基础设施优化:
  • 初步测试: 使用真实样本进行测试对于高容量处理至关重要,因为即使每页处理时间存在细微差异,也会显著改变所需的 Bot Runners 数量。
  • 专用摄取 bots : 准备一些 Bot Runners 专用于文档摄取,以确保队列持续活跃并防止任务分配延迟。
  • 常见瓶颈
    • 网络拥塞: 使用单个网络共享可能会导致延迟。 通过使用单独的文件夹将上传和下载分布在多个Bot Runners上,以确保并行处理。
    • 数据库性能: 监控本地数据库的CPU/内存使用情况、I/O操作和潜在的死锁。
    • 工作流优化: 尽可能通过将后处理步骤与直通式处理 (STP) 流程合并到提取步骤中来减少部署时间。