Acción Vertex AI: Acción Multimodal Prompt AI
- Actualizado: 2024/04/04
Acción Vertex AI: Acción Multimodal Prompt AI
La acción Vertex AI: La acción Multimodal Prompt AI utiliza el modelo multimodal de Google, que es capaz de procesar información de múltiples modalidades, incluidas imágenes, videos y texto. Esta función le permite manejar tareas complejas, como describir el contenido de una imagen y un video proporcionado como entrada.
Antes de empezar
- Debe tener el rol Bot creator para usar la acción Vertex AI: Acción Multimodal Prompt AI en una automatización.
- Asegúrese de tener las credenciales necesarias para enviar una solicitud y haber incluido Acción Conectar antes de invocar cualquier acción de Google Cloud.
Este ejemplo muestra cómo enviarle a este modelo una foto de un plato de galletas y pedirle que genere una receta para esas galletas usando Vertex AI: Multimodal Prompt AI como acción para obtener una respuesta adecuada.
Procedimiento
Cuando se proporciona la siguiente imagen como entrada junto con el indicador, la respuesta generada se muestra en la siguiente tabla:
Indicador | Respuesta |
---|---|
Generar una receta. |
Ingredientes:
Instrucciones:
|
¿Este tema le resultó útil?