Acción Vertex AI: Acción Multimodal Prompt AI
- Última actualización2024/10/31
Acción Vertex AI: Acción Multimodal Prompt AI
La acción Vertex AI: La acción Multimodal Prompt AI utiliza el modelo multimodal de Google, que es capaz de procesar información de múltiples modalidades, incluidas imágenes, videos y texto. Esta función le permite manejar tareas complejas, como describir el contenido de una imagen y un video proporcionado como entrada.
Antes de empezar
- Debe tener el rol Bot creator para usar la acción Vertex AI: Acción Multimodal Prompt AI en una automatización.
- Asegúrese de tener las credenciales necesarias para enviar una solicitud y haber incluido Vertex AI: Acción Conectar antes de invocar cualquier acción de Google Cloud.
Este ejemplo muestra cómo enviarle a este modelo una foto de un plato de galletas y pedirle que genere una receta para esas galletas usando Vertex AI: Multimodal Prompt AI como acción para obtener una respuesta adecuada.
Procedimiento
Vea cómo la acción Vertex AI: Multimodal Prompt AI desbloquea nuevas posibilidades. Mire este video que muestra un caso de uso del mundo real.
Cuando se proporciona la siguiente imagen como entrada junto con el indicador, la respuesta generada se muestra en la siguiente tabla:
Indicador | Respuesta |
---|---|
Generar una receta. |
Ingredientes:
Instrucciones:
|