Automation 360

Anthropic: action MultiModal AI

Descargar como PDF

Contenidos

Anthropic: action MultiModal AI

Descargar como PDF

Última actualización2026/03/02

Anthropic: action MultiModal AI

El Anthropic: La action Multimodal AI conecta su automatización con modelos de Claude 3 de Amazon Bedrock Anthropic que pueden manejar tareas complejas, como describir el contenido de imágenes provistas como entradas.

Antes de empezar

Debe tener el rol Bot Creator para usar Anthropic: Acción Multimodal AI en un bot.
Asegúrese de que dispone de las credenciales necesarias para enviar una solicitud. Para obtener más información sobre la adquisición de credenciales, consulte Amazon Bedrock: action Autenticar.

En este ejemplo, se muestra cómo enviar al modelo de Claude 3 una imagen específica y hacer preguntas concretas a fin de generar respuestas relevantes basadas en el contenido.

Procedimiento

En la Control Room, navegue hasta el panel Acciones, seleccione IA generativa > Amazon Bedrock y arrastre Anthropic: Multimodal AI y colóquelo en el lienzo.
Ingrese o seleccione los siguientes campos:
1. Ingrese la Región. Para obtener información sobre la región, consulte Regiones de Amazon Bedrock GA.
2. Seleccione un modelo de lenguaje extenso (LLM) para usar en su indicador del menú desplegable Modelo. Puede seleccionar los siguientes modelos:
  - Claude 3 Sonnet v1
  - Claude 3 Haiku v1
  - Otra versión compatible: La opción Otra versión compatible permite ingresar el ID de modelo de cualquier modelo Anthropic Claude compatible con Amazon Bedrock que siga el mismo formato de solicitud y respuesta que los modelos Claude 3. Para obtener detalles sobre el esquema de solicitud y respuesta compatible, consulte la documentación de Amazon Bedrock para los modelos Anthropic Claude.
  En este ejemplo, se selecciona Claude 3 Sonnet v1.
3. Ingrese un Indicador que el modelo usará para generar una respuesta.
4. Suba hasta cinco imágenes. En este ejemplo, se muestra una imagen con tres perros en un área con césped. Para cargar las imágenes, realice una de las siguientes acciones:
  - Seleccione el Enlace de la imagen e ingrese una url de imagen o
  - seleccione Cargar imagen para cargar una imagen mediante transmisión de archivos (consulte Transmisión de archivos mediante la variable de archivo) o desde un archivo de la Control Room o un archivo local.
5. Seleccione Sí para cargar varias imágenes. Puede subir hasta cinco imágenes.
6. Introducir la longitud máxima.
  De manera predeterminada, si no ingresa un valor, la longitud máxima se establece automáticamente para mantenerla dentro de la longitud máxima de contexto del modelo seleccionado considerando la longitud de la respuesta generada.
7. Introduzca una Temperatura. Este valor se refiere a la aleatoriedad de la respuesta. A medida que la temperatura se acerca a cero, la respuesta se vuelve específica. Cuanto más alto es el valor, más aleatoria es la respuesta.
8. Ingrese el nombre de la sesión para limitarla a la sesión actual. Utilice el mismo nombre de la acción de Autenticación.
9. Para administrar los parámetros opcionales, haga clic en Mostrar más opciones y seleccione Sí. Si selecciona Sí, puede agregar otros parámetros como los siguientes: Indicación del sistema, P superior, K superior, Agregar instrucciones, Detener secuencias o ingresar una versión de Anthropic. Para obtener información acerca de estos parámetros opcionales, consulte ‌Modelos de aprendizaje‌.
  
  Nota: Los modelos de Claude 3 aceptan Indicaciones del sistema. A diferencia de las instrucciones tradicionales, las indicaciones del sistema proporcionan una manera estructurada de guiar a Claude 3. Esto se debe a que Claude 3 está entrenado para comprender la intención detrás de su mensaje y generar respuestas que cumplan con ese objetivo, en lugar de simplemente seguir un conjunto de comandos.
10. Guardar la respuesta en una variable.
  En este ejemplo, la respuesta se guarda en multiModalResponse
Haga clic en Ejecutar para iniciar el bot.
Podrá leer el valor del campo simplemente mediante la impresión de la respuesta en un Cuadro de mensaje action. En este ejemplo, multiModalResponse imprime la respuesta.

Cuando se proporciona la siguiente imagen como entrada junto con el indicador, la respuesta generada se muestra en la siguiente tabla:


Indicador	Respuesta
Explique la imagen	La imagen muestra tres adorables cachorros corriendo juntos al aire libre en un campo cubierto de césped. Parecen ser de una raza pastora, quizás sean pastores ovejeros australianos o una raza similar. Sus pelajes tienen una mezcla de los colores negro, blanco y marrón. Los cachorros tienen orejas caídas y están llenos de energía. En la imagen, se los ve jugando mientras corren por el espacio abierto. En el fondo, se ve un entorno ligeramente borroso, por lo que los cachorros juguetones y alegres resaltan en primer plano. La imagen transmite una sensación de felicidad, juventud y pura diversión asociada con los cachorros juguetones.

Ningún tema anterior

No hay tema siguiente

Ningún tema anterior

No hay tema siguiente