UI Agentsのためにプロンプトを作成する際に、目標を説明する言語について検討すべき提案。

エージェントを導くために、目標、遵守すべきルール、および必要な情報を明確に指定することが、UI Agents を使ってエンドツーエンドのタスクを達成する最も簡単な方法です。 覚えておいてください、エージェントは目標を達成するために多くのステップを順番に踏む必要があり、不明確な目標はワークフローや結果のずれにつながる可能性があります。

UI Agents は、目標が 10ステップ未満 で達成できる場合に最も確実に動作します。 目標に複数のステップが必要な場合は、それを複数の小さな目標に分解してください。各目標はエージェントに送信できます。 参照:複数のタスクの連結

繰り返しが重要な場合、どの UI エージェントにおいてもタスクの具体性を考慮することが重要です。 エージェントの信頼性と、タスクの目標がどれだけ具体的でなければならないかの間には直接的な関係があります。 最良の結果を得るために、目標におけるタスクを実行する際のニュアンスを記述してください。
  • 最初に目的を明確に述べてください。 「完了」とはどのような状態かを一文で説明してください。(例:目標は……です。)
  • 何をすべきか、そして何をすべきでないかをはっきり伝えてください。 境界を含めてください(例:支払いを送信しない、記録を削除しないなど)。
  • 完全な入力と定義を提供してください。 正確な名前や ID、日付範囲、あいまいな用語の意味(例:トップ顧客 = ARR で上位20社)を指定してください。
  • 大きな目標を順序立てたステップに分解しましょう。 各ステップをテスト可能な状態に保ち、リサーチ+アクション+コミュニケーションを1つのプロンプトにまとめないようにしてください。
  • 出力と形式を指定してください: フリーテキスト vs JSON、必須フィールド、および欠損データのラベル付け方法。
  • ルールを追加: 特定のビジネスルール(例:連絡先を求められた場合はメールアドレスを使用する)。 いつ一時停止するかを指示してください(データ不足、有料壁、MFA、キャプチャ、エラーなど)。
  • フォールバックパスを含めてください。 UI 要素が見つからない場合の対応方法(検索を使用する、別のナビゲーションを試す、2回目の試行を行い、それでも見つからなければ中止する)。
対照的なプロンプト例
実行する 実行する 以下は避けてください。 以下は避けてください。
1. Enter search 'RPA' in the
 search box. 
2. Submit the search request top right.
3. Return the first 2 links from the web page, along with author, data of published details
Enter the following payment information into the web form.
Invoice No.: A12
Amount: 100
Card Number: 1234-5678-9999
Rules: 1. If asked for Account Number, enter Invoice Number.
2. Do not retry if an error appears after submission.
Log into the admin portal and fix the billing issue for the Acme account
Check our top customers, see who might churn, email them something, and update the CRM.