Anthropic: [マルチモーダル AI] アクション

Anthropic: マルチモーダル AI アクションでは Amazon Bedrock Anthropic の Claude 3 モデルにオートメーションを接続し、入力として提供された画像の内容を記述するなどの複雑なタスクを処理できます。

前提条件

  • Anthropic を使用するには、Bot Creator ロールが必要です。Bot のマルチモーダル AI アクション。
  • リクエストを送信するために必要な資格情報があることを確認してください。資格情報の取得については、「Amazon Bedrock: 認証アクション」を参照してください。

この例では、Claude 3 モデルに特定の画像を送り、的を絞った質問をして、その内容に基づいて適切な回答を生成する方法を紹介します。

手順

  1. Control Room で [アクション] ペインに移動し、[生成 AI] > [Amazon Bedrock] を選択し、[Anthropic: マルチモーダル AI] をドラッグしてキャンバスに配置します。
  2. 以下のフィールドを入力または選択します。

    Anthropic マルチモーダル

    1. [地域] を入力します。地域の詳細については、「Amazon Bedrock GA の地域」を参照してください。
    2. [モデル] ドロップダウンからプロンプトに使用する大規模言語モデル (LLM) を選択します。以下のモデルを選択できます。
      • Claude 3 Sonnet v1
      • Claude 3 Haiku v1
      • [その他のサポートされているバージョン] にその他の対応モデルを入力できます。
      この例では [Claude 3 Sonnet v1] を選択します。
    3. レスポンスを生成するモデルのプロンプトを入力します。
    4. 画像を 5 枚までアップロードします。この例では、草原に 3 匹の犬がいる画像を使用します。
    5. 複数の画像をアップロードするには、[はい] を選択します。画像は 5 枚までアップロードできます。
    6. [最大長] を入力します。
      デフォルトでは、値を入力しない場合、最大長は、生成されるレスポンスの長さを考慮して、選択したモデルの最大コンテキスト長に収まるように自動的に設定されます。
    7. [Temperature (温度)] を入力します。この値は、レスポンスのランダム性を示します。温度がゼロに近づくにつれて、レスポンスが具体的になります。値が高いほど、よりランダムなレスポンスとなります。
    8. セッションの名前を入力し、セッションを現在のセッションに限定します。認証アクションに使用するものと同じ名前を使用します。
    9. オプションのパラメーターを管理するには、[その他のオプションを表示] をクリックし、[はい] を選択します。[はい] を選択した場合は、次のような他のパラメーターを追加できます。[システム プロンプト]、[Top P]、[Top K]、[手順を追加]、[シーケンスを停止] などのパラメーターを追加するか、Anthropic バージョンを入力できます。これらのオプションのパラメーターの詳細については、「モデルを学ぶ」を参照してください。
      注: Claude 3 モデルは [システム プロンプト] を受け入れます。従来の指示とは異なり、システム プロンプトは構造化された方法によって Claude 3 を導きます。Claude 3 が単に一連の命令に従うのではなく、プロンプトの背後にある意図を理解し、その目標を達成するための応答を生成するようにトレーニングされているためです。
    10. 変数にレスポンスを保存します。
      この例では、レスポンスは multiModalResponse に保存されます。
  3. [実行] をクリックして、Bot を起動します。
    メッセージ ボックス アクションでレスポンスを印刷することで、フィールドの値を読み取ることができます。この例では、multiModalResponse がレスポンスを印刷します。

次の画像を入力としてプロンプトに入力すると、生成されるレスポンスは下表のようになります。

プロンプト レスポンス
画像の説明

プロンプト画像 - 草原の犬

画像では、3 匹の愛らしい子犬が屋外の草原で一緒に走っています。おそらくオーストラリアン シェパードか、それに似たタイプの牧畜犬種のようです。毛は、黒、白、褐色のミックスです。子犬たちは耳が垂れており、エネルギーに満ちあふれていて、広場を駆け回ってはしゃいでいる瞬間を撮影されました。背景は少しぼかした設定で、手前の生き生きと楽しそうな子犬たちに焦点が合っています。この画像は、遊び好きな子犬の幸福感、若々しさ、純粋な楽しさを伝えています。