UI-Agent-Paket
- Zuletzt aktualisiert2026/03/30
UI Agents ist Automation Anywheres vollständig autonomer Reasoning-Engine zum Erstellen und Ausführen zuverlässiger unbeaufsichtigter UI-Automatisierungen anhand von Prompts in natürlicher Sprache.
Übersicht
Während RPA Klicks skripten kann, ermöglichen UI Agents (oder Computernutzung) uns, Ergebnisse zu beschreiben, indem Selektoren und starre Abläufe durch zielorientierte Pläne ersetzt werden, die sich an UI-Änderungen anpassen und zur Laufzeit komplexe Schlussfolgerungen ziehen können.
Diese Flexibilität macht UI Agents perfekt für Teams, um fragile und komplexe Automatisierungen zu modernisieren, ohne Systeme neu schreiben zu müssen.
Vorteile
Einfach zu erstellen und zu warten: UI Agents sind im Wesentlichen zielbasierte KI-Agents, die für die Ausführung in einem Browser konzipiert sind. UI Agents nehmen ein in natürlicher Sprache formuliertes Ziel als Eingabe entgegen und führen dieses Ziel direkt in der Zielanwendung aus. Dadurch sind sie sehr einfach zu erstellen und noch einfacher zu warten.
Anpassungsfähig und widerstandsfähig: UI Agents verlassen sich nicht auf layoutspezifische Skripte. Sie verstehen den Seitenzustand, analysieren die präsentierten Informationen und entscheiden, was als Nächstes zu tun ist. So funktionieren Automatisierungen weiterhin, auch wenn sich Websites ändern, und können mit minimalem Anpassungsaufwand auf mehrere Seiten skaliert werden.
Automatisieren Sie die End-to-End-Workflow-Navigation: Wir haben diese UI Agents ebenfalls so konzipiert, dass sie mit RPA-Aktionen koexistieren. Das bedeutet, dass Sie Ihren End-to-End-Prozess ganz einfach über Browser- und Nicht-Browser-Schritte hinweg automatisieren können – alles innerhalb desselben Editors.
Wie funktioniert es?

UI Agents erhält ein Ziel in natürlicher Sprache als Eingabe und startet anschließend automatisch die Ziel-Website.
Zuerst beobachtet er den aktuellen Zustand der Seite und erstellt dann einen Plan für das ihm gegebene Ziel. Er führt dann diese geplanten Aktionen im Browser aus und prüft, ob das Benutzerziel erreicht ist oder weitere Aktionen erforderlich sind. Wenn weitere Aktionen erforderlich sind, beobachtet er erneut den Zustand der Website, erstellt einen neuen Plan, führt ihn aus und überprüft das Ergebnis.
Der Agent führt diese Schleife weiter aus, bis das Benutzerziel vollständig erreicht ist.
Hauptmerkmale und Wertversprechen
Lassen Sie uns einige der wichtigsten Funktionen des UI Agents herausarbeiten:
- Er nutzt große Aktionsmodelle (LAM), die ein tiefes Verständnis von Website-Navigationen haben, was ihm hohe Zuverlässigkeit und Genauigkeit verleiht.
- Es ist außerdem nahtlos in dieselben Automatisierungseditoren integriert, wodurch die Einarbeitungszeit verkürzt und das Erstellen komplexer Automatisierungen über dieselbe Oberfläche erleichtert wird.
- Es verfügt außerdem über integrierte Governance und Schutzvorrichtungen, sodass Sie diese sicher ausführen können.
- Und schließlich prüfen wir jedes Aktionsmodell auf Zuverlässigkeit, Belastbarkeit und Genauigkeit, bevor wir es Ihnen zur Verfügung stellen.
Ein zentrales Ergebnis, das Sie aus all dem erhalten, ist schnellere Wertschöpfung, bei der Sie Ihre Automatisierungen sehr schnell erstellen können; und Sie können neue Anwendungsfälle und Szenarien erschließen, die zuvor nur sehr schwer zu automatisieren waren.
Voraussetzungen
- Lizenzierung:Eines der folgenden – Bot Creator, Citizen Developer, Beaufsichtigter Bot Runner, Unbeaufsichtigter Bot Runner.
- Rolle: Eines der folgenden – AAE_Basic, Pro Developer Custom-Rolle, Citizen Developer Custom-Rolle
- Browser: Google Chrome (neueste Version)
- Betriebssystem: Windows oder MacOS
- Konfigurieren Sie das Large Action Model: Siehe Richten Sie Narada für UI-Agents ein
Zugehörige Links: