顶点 AI: Multimodal Prompt AI 操作
- Updated: 2025/04/23
顶点 AI: Multimodal Prompt AI 操作使用 Google 的多模态模型,该模型能够处理来自多种模态的信息,包括图像、视频和文本。 这种功能使其能够处理复杂的任务,例如描述作为输入的图像和视频的内容。
先决条件
- 您必须拥有 Bot Creator 角色才能在自动化中使用 Vertex AI: Multimodal Prompt AI 操作。
- 确保您拥有发送请求所需的凭据,并在调用任何 Google Cloud 操作之前包含 Vertex AI: 连接操作。
此示例展示了如何向该模型发送一盘饼干的照片,并要求它使用 Vertex AI: Multimodal Prompt AI 操作 生成这些饼干的食谱并获得适当的响应。
过程
看看 Vertex AI 的 Multimodal Prompt AI 操作如何解锁新的可能性!观看此视频,了解真实场景。
当以下图像与提示一起作为输入提供时,生成的响应显示在下表中:
提示 | 响应 |
---|---|
生成食谱。![]() |
成分:
说明:
|