L'action Anthropic : action IA multimodale

L'action Anthropic : L'action IA multimodale connecte votre automatisation aux modèles Claude 3 d'Amazon Bedrock Anthropic qui peuvent traiter des tâches complexes, telles que la description du contenu d'images fournies en entrée.

Prérequis

  • Vous devez avoir le rôle de Créateur de robots pour utiliser l'action Anthropic : Action IA multimodale dans un robot.
  • Assurez-vous de disposer des informations d'identification nécessaires pour envoyer une demande. Pour en savoir plus sur l'acquisition d'informations d'identification, consultez L'action Amazon Bedrock : action Authentifier.

Cet exemple montre comment envoyer au modèle Claude 3 une image spécifique et lui poser des questions ciblées, en générant des réponses pertinentes basées sur le contenu.

Procédure

  1. Dans la Control Room, accédez au volet Actions, sélectionnez IA générative > Amazon Bedrock, puis faites glisser l'action Anthropic : IA multimodale et placez-la dans le canevas.
  2. Renseignez ou sélectionnez les champs suivants :

    Anthropic-multimodal

    1. Saisissez la Région. Pour plus d'informations sur les régions, consultez cet article sur les régions Amazon Bedrock GA.
    2. Sélectionnez un grand modèle de langage (LLM) à utiliser pour votre invite dans la liste déroulante Modèle. Vous pouvez sélectionner les modèles suivants :
      • Claude 3 Sonnet v1
      • Claude 3 Haiku v1
      • Autre version prise en charge pour entrer d'autres modèles pris en charge.
      Dans cet exemple, le modèle Claude 3 Sonnet v1 est sélectionné.
    3. Saisissez une Invite que le modèle utilisera pour générer une réponse.
    4. Chargez jusqu'à cinq images. Cet exemple présente une image avec 3 chiens sur une étendue d'herbe.
    5. Sélectionnez Oui pour charger plusieurs images. Vous pouvez charger jusqu'à cinq images.
    6. Entrez la Longueur maximum.
      Par défaut, si vous ne saisissez pas de valeur, la longueur maximum est automatiquement définie de manière à respecter la longueur maximum du contexte pour le modèle sélectionné en tenant compte de la longueur de la réponse générée.
    7. Saisissez une Température. Cette valeur fait référence au caractère aléatoire de la réponse. À mesure que la température se rapproche de zéro, la réponse devient spécifique. Plus la valeur est élevée, plus la réponse est aléatoire.
    8. Saisissez le nom de la session pour limiter la session à la session en cours. Utilisez le nom utilisé dans l'action d'authentification.
    9. Pour gérer les paramètres facultatifs, cliquez sur Afficher plus d'options et sélectionnez Oui. Si vous sélectionnez Oui, vous pouvez ajouter d'autres paramètres tels que : Invite du système, Top P, Top K, Ajouter des instructions, Séquences d'arrêt, ou saisir une version d'Anthropic. Pour plus d'informations sur ces paramètres facultatifs, consultez cet article sur les modèles d'apprentissage.
      Remarque : Les modèles Claude 3 acceptent les invites du système. Contrairement aux instructions classiques, les invites du système offrent une manière structurée de guider Claude 3. En effet, Claude 3 est entraîné pour comprendre l'intention qui se cache derrière votre demande et générer des réponses qui répondent à cet objectif, plutôt que de se contenter de suivre une série de commandes.
    10. Enregistrez la réponse dans une variable.
      Dans cet exemple, la réponse est enregistrée dans multiModalResponse.
  3. Cliquez sur Exécuter pour démarrer le robot.
    Vous pouvez lire la valeur du champ en affichant la réponse dans une action Zone de message. Dans cet exemple, multiModalResponse affiche la réponse.

Lorsque l'image suivante est fournie comme entrée avec l'invite, la réponse générée est indiquée dans le tableau ci-dessous :

Invite Réponse
Expliquer l'image

Image de l'invite - Chiens sur l'herbe

L'image montre trois adorables chiots courant ensemble en plein air sur une étendue d'herbe. Ils semblent appartenir à une race de bergers, peut-être des bergers australiens ou un type similaire. Leur pelage est un mélange de noir, de blanc et de fauve. Les chiots aux oreilles tombantes débordent d'énergie, comme le montre un moment de jeu où ils courent à travers l'espace ouvert. L'arrière-plan est légèrement flou, ce qui permet de mettre l'accent sur les chiots vifs et joyeux au premier plan. L'image transmet un sentiment de bonheur, de jeunesse et de pur plaisir associé aux jeunes chiens enjoués.