Vertex AI: マルチモーダル プロンプト AI アクション
- 最終更新日2024/10/31
Vertex AI: マルチモーダル プロンプト AI アクション
Vertex AI: マルチモーダル プロンプト AI アクションでは、画像、ビデオ、テキストなど、複数の種類の情報を処理できる Google のマルチモーダル モデルを使用します。この機能により、入力として指定された画像やビデオの内容を記述するといった複雑なタスクを処理できます。
前提条件
- Vertex AI: マルチモーダル プロンプト AI アクションをオートメーションで使用するには、Bot Creator ロールが必要です。
- Google Cloud のアクションを呼び出す前に、リクエストを送信するために必要な認証情報があり、Vertex AI: [接続] アクション が含まれていることを確認してください。
この例は、このモデルにクッキーの皿の写真を送り、Vertex AI: マルチモーダル プロンプト AI アクションを使用してクッキーのレシピを生成し、適切なレスポンスを得るように依頼する方法を示しています。
手順
Vertex AI の マルチモーダル プロンプト AI アクションがどのように新たな可能性を引き出すかをご覧ください! 実際の使用例を紹介するビデオをご覧ください。
次の画像を入力としてプロンプトに入力すると、生成されるレスポンスは下表のようになります。
プロンプト | レスポンス |
---|---|
レシピを作成します。 |
原材料:
手順:
|