UI Agents パッケージで完全な UI エージェントを実現するために、3つすべてのアクション(開始、実行、終了セッション)を使用する方法の詳細。

新しい TaskBot を作成し、UI Agentsパッケージのアクションを使用してください。 UI エージェントのビルドを完了するには、パッケージから3つのアクションが必要です。

手順

セッションを開始: これは、UI エージェントを構築する際の最初のアクションである必要があります。 このアクションは、エージェントが実行されるブラウザーセッションを作成して起動します。

  1. ご希望のアクションモデルを選択してください。
  2. 選択したアクションモデルの認証情報をキーに入力してください。
  3. 任意で、その他のオプション > プロキシ を使用して、プロキシ経由でブラウザーセッションを起動します。
  4. UIエージェントが実行されているブラウザーに対して、一意のセッション名を指定してください。

実行: このアクションでタスクを設定します。

  1. セッション開始アクションから、固有のセッション名を入力してください。
  2. 任意で、エージェントが開く必要があるウェブサイトを開始 URLとして入力します。
  3. エージェント 目標 を入力します。 UI エージェントへのプロンプト方法を見てください。
  4. 任意で、セキュア変数 を設定して、アクションモデルから機密性の高い値を難読化します。
  5. 任意で、エージェントの出力のデータ型を出力フォーマット JSONで指定します。 デフォルトでは、エージェントの出力は文字列データ型になります。
  6. 実行アクションの タイムアウト を入力します。 タイムアウトが発生すると、タスクは終了します。 タスクの複雑さに応じてこれを調整してください。
  7. 出力ファイルパスと、エージェントがメタデータ、アクショントレース、および出力(該当する場合)を記録するファイル名を指定する必要があります。
    ファイルは事前に存在している必要があり、ファイルパスは有効でなければなりません。 このファイルの内容は、実行アクションが実行されるたびに上書きされます。
    注: ファイルが存在しない場合は、エージェントが作成します。 有効なファイル拡張子は JSON および TXT です(例: C:\UIAgentLog.json または C:\UIAgentLog.txt)。 可読性のために JSON の使用を推奨します。
  8. 任意で、出力を変数に割り当ての変数を選択して出力のコンテキストを保存します。

セッションの終了: UI エージェントブラウザーセッションを閉じる

  1. 終了するセッション名を入力します。