Vertex AI: マルチモーダル プロンプト AI アクション
- 最終更新日2025/08/15
Vertex AI: [マルチモーダル プロンプト AI] アクションは、画像、動画、テキストなど、複数のモダリティからの情報を処理できる Google のマルチモーダルモデルを使用しています。 この機能により、画像や動画の内容を入力として説明するなど、複雑なタスクを処理することができます。
前提条件
- Vertex AI を使用するには、Bot 作成者ロールが必要です。 オートメーションにおけるマルチモーダル プロンプト AI アクション。
- Google Cloud のアクションを呼び出す前に、リクエストを送信するために必要な認証情報があり、Vertex AI: [接続] アクション が含まれていることを確認してください。
この例では、このモデルにクッキーの皿の写真を送信し、それらのクッキーのレシピを Vertex AI を使って生成するよう依頼する方法を示します: マルチモーダルプロンプトAI アクション を使用して、適切なレスポンスを得る方法について説明します。
手順
Vertex AI の マルチモーダル プロンプト AI アクションの新たな可能性をご覧ください! 実際の事例を紹介するビデオをご覧ください。
次の画像がプロンプトと一緒に入力として提供されると、生成された応答は以下の表に示されます:
プロンプト | レスポンス |
---|---|
レシピを生成します。![]() |
材料:
レシピ:
|