Anthropic: acción MultiModal AI

El Anthropic: La acción Multimodal AI conecta su automatización con modelos de Claude 3 de Amazon Bedrock Anthropic que pueden manejar tareas complejas, como describir el contenido de imágenes provistas como entradas.

Antes de empezar

  • Debe tener el rol Bot Creator para usar Anthropic: Acción Multimodal AI en un bot.
  • Asegúrese de que dispone de las credenciales necesarias para enviar una solicitud. Para obtener más información sobre la adquisición de credenciales, consulte Amazon Bedrock: acción Autenticar.

En este ejemplo, se muestra cómo enviar al modelo de Claude 3 una imagen específica y hacer preguntas concretas a fin de generar respuestas relevantes basadas en el contenido.

Procedimiento

  1. En la Control Room, navegue hasta el panel Acciones, seleccione IA generativa > de Amazon Bedrock y arrastre Anthropic: MultiModal AI y colóquelo en el lienzo.
  2. Ingrese o seleccione los siguientes campos:

    Antrópico-multimodal

    1. Ingrese la Región. Para obtener información sobre la región, consulte Regiones de Amazon Bedrock GA.
    2. Seleccione un modelo de lenguaje extenso (LLM) para usar en su indicador del menú desplegable Modelo. Puede seleccionar los siguientes modelos:
      • Claude 3 Sonnet v1
      • Claude 3 Haiku v1
      • Otra versión compatible para ingresar otros modelos compatibles.
      En este ejemplo, se selecciona Claude 3 Sonnet v1.
    3. Ingrese un Indicador que el modelo usará para generar una respuesta.
    4. Suba hasta cinco imágenes. En este ejemplo, se muestra una imagen con tres perros en un área con césped.
    5. Seleccione para cargar varias imágenes. Puede subir hasta cinco imágenes.
    6. Introducir la longitud máxima.
      De manera predeterminada, si no ingresa un valor, la longitud máxima se establece automáticamente para mantenerla dentro de la longitud máxima de contexto del modelo seleccionado considerando la longitud de la respuesta generada.
    7. Introduzca una Temperatura. Este valor se refiere a la aleatoriedad de la respuesta. A medida que la temperatura se acerca a cero, la respuesta se vuelve específica. Cuanto más alto es el valor, más aleatoria es la respuesta.
    8. Ingrese el nombre de la sesión para limitarla a la sesión actual. Utilice el mismo nombre de la acción de Autenticación.
    9. Para administrar los parámetros opcionales, haga clic en Mostrar más opciones y seleccione . Si selecciona , puede agregar otros parámetros como los siguientes: Indicación del sistema, Top P, Top K, Agregar instrucciones, Detener secuencias o ingresar una versión de Anthropic. Para obtener información acerca de estos parámetros opcionales, consulte ‌Modelos de aprendizaje‌.
      Nota: Los modelos de Claude 3 aceptan Indicaciones del sistema. A diferencia de las instrucciones tradicionales, las indicaciones del sistema proporcionan una manera estructurada de guiar a Claude 3. Esto se debe a que Claude 3 está entrenado para comprender la intención detrás de su mensaje y generar respuestas que cumplan con ese objetivo, en lugar de simplemente seguir un conjunto de comandos.
    10. Guardar la respuesta en una variable.
      Por ejemplo, la respuesta se guarda en multiModalResponse.
  3. Haga clic en Ejecutar para iniciar el bot.
    Podrá leer el valor del campo simplemente mediante la impresión de la respuesta en un Cuadro de mensaje acción. En este ejemplo, multiModalResponse imprime la respuesta.

Cuando se proporciona la siguiente imagen como entrada junto con el indicador, la respuesta generada se muestra en la siguiente tabla:

Indicador Respuesta
Explique la imagen

Imagen de la indicación: Perros sobre el césped

La imagen muestra tres adorables cachorros corriendo juntos al aire libre en un campo cubierto de césped. Parecen ser de una raza pastora, quizás sean pastores ovejeros australianos o una raza similar. Sus pelajes tienen una mezcla de los colores negro, blanco y marrón. Los cachorros tienen orejas caídas y están llenos de energía. En la imagen, se los ve jugando mientras corren por el espacio abierto. En el fondo, se ve un entorno ligeramente borroso, por lo que los cachorros juguetones y alegres resaltan en primer plano. La imagen transmite una sensación de felicidad, juventud y pura diversión asociada con los cachorros juguetones.