在将UI Agents作为更大流程中的一个函数使用时,请考虑您的设计如何在环境中导航,以及如何在各项任务之间组织顺序以实现您的目标。

这些示例展示了明确定义的自然语言Goals如何使坐席能够导航网页门户、完成表单、提取结构化数据、下载文件并执行多步工作流。 重点在于编写精确的提示、定义结构化输出,并将复杂目标分解为更小且可靠的任务。

这还突出了企业级功能,例如串联多个运行操作、跨浏览器会话操作、使用受保护变量保护敏感数据、配置代理以及生成详细的执行日志。 这些示例共同展示了UI Agents如何作为自适应、受管控的组件,在更大的端到端自动化架构中发挥作用。

常见场景

为获得最佳效果,您可以将输入到UI Agents的提示与以下运行时示例进行比较。 查找可用于引导UI Agents达到期望结果的提示示例。
演示可用的各种设计。

面向坐席流程自动化的设计模式

您可以遵循以下一种或多种设计模式来构建复杂的坐席流程自动化。

模式 1: 仅限浏览器任务的UI坐席: 一种可靠的模式,适用于可以在一次不间断会话中完成的单一、独立任务。
演示仅在浏览器任务中需要坐席时所需的操作。
模式 2: RPA 使用 UI 坐席 作为浏览器任务的回退方案: 当处理少量且变更不频繁的应用程序,或希望降低完整坐席化解决方案的成本时,这是一个有价值的模式。
演示当坐席用作浏览器任务的后备时所需的操作。
模式 3: RPA用于非浏览器任务,UI坐席用于浏览器任务: 当工作可以被划分为多个独立任务,并且在同一台机器上执行时几乎没有依赖关系时,这是一种有价值的模式。
演示当浏览器任务由坐席完成,非浏览器任务由RPA完成时所需的操作。

场景和示例

请参阅以下示例,了解配置详情以及执行常见操作的示例提示。