Automation 360

Anthropic: action IA multimodale

Télécharger au format PDF

Contenus

Anthropic: action IA multimodale

Télécharger au format PDF

Dernière mise à jour2026/03/02

Anthropic: action IA multimodale

L\'action Anthropic : L\'action IA multimodale connecte votre automatisation aux modèles Claude 3 d\'Amazon Bedrock Anthropic qui peuvent traiter des tâches complexes, telles que la description du contenu d\'images fournies en entrée.

Prérequis

Vous devez avoir le rôle de Créateur de robots pour utiliser l\'action Anthropic : Action IA multimodale dans un robot.
Assurez-vous de disposer des informations d\'identification nécessaires pour envoyer une demande. Pour en savoir plus sur l\'acquisition d\'informations d\'identification, consultez Amazon Bedrock: action Authentifier.

Cet exemple montre comment envoyer au modèle Claude 3 une image spécifique et lui poser des questions ciblées, en générant des réponses pertinentes basées sur le contenu.

Procédure

Dans la Control Room, accédez au volet Actions, sélectionnez IA générative > Amazon Bedrock, puis faites glisser l\'action Anthropic : MultiModal AI et placez-la dans le canevas.
Renseignez ou sélectionnez les champs suivants :
1. Saisissez la Région. Pour plus d\'informations sur les régions, consultez cet article sur les régions Amazon Bedrock GA.
2. Sélectionnez un grand modèle de langage (LLM) à utiliser pour votre invite dans la liste déroulante Modèle. Vous pouvez sélectionner les modèles suivants :
  - Claude 3 Sonnet v1
  - Claude 3 Haiku v1
  - Autre version prise en charge : L\'option Autre version prise en charge vous permet de saisir l\'identifiant du modèle de n\'importe quel modèle Anthropic Claude pris en charge par Amazon Bedrock et respectant le même format de requête et de réponse que les modèles Claude 3. Pour plus d\'informations sur le schéma de requête et de réponse pris en charge, consultez la documentation Amazon Bedrock pour les modèles Anthropic Claude.
  Dans cet exemple, le modèle Claude 3 Sonnet v1 est sélectionné.
3. Saisissez une Invite que le modèle utilisera pour générer une réponse.
4. Chargez jusqu\'à cinq images. Cet exemple présente une image avec 3 chiens sur une étendue d\'herbe. Pour importer des images, effectuez l\'une des opérations suivantes :
  - Sélectionnez Lien d\'image et saisissez une URL d\'image ou
  - Sélectionnez Charger une image pour importer une image via un flux de fichiers (voir Streaming de fichiers à l\'aide de la variable de fichier), un fichier Control Room ou un fichier local.
5. Sélectionnez Oui pour charger plusieurs images. Vous pouvez charger jusqu\'à cinq images.
6. Entrez la Longueur maximum.
  Par défaut, si vous ne saisissez pas de valeur, la longueur maximum est automatiquement définie de manière à respecter la longueur maximum du contexte pour le modèle sélectionné en tenant compte de la longueur de la réponse générée.
7. Saisissez une Température. Cette valeur fait référence au caractère aléatoire de la réponse. À mesure que la température se rapproche de zéro, la réponse devient spécifique. Plus la valeur est élevée, plus la réponse est aléatoire.
8. Saisissez le nom de la session pour limiter la session à la session en cours. Utilisez le nom utilisé dans l\'action d\'authentification.
9. Pour gérer les paramètres facultatifs, cliquez sur Afficher plus d\'options et sélectionnez Oui. Si vous sélectionnez Oui, vous pouvez ajouter d\'autres paramètres tels que : Invite du système, Top P, Top K, Ajouter des instructions, Séquences d\'arrêt, ou saisir une version d\'Anthropic. Pour plus d\'informations sur ces paramètres facultatifs, consultez cet article sur les modèles d\'apprentissage.
  
  Remarque : Les modèles Claude 3 acceptent les invites du système. Contrairement aux instructions classiques, les invites du système offrent une manière structurée de guider Claude 3. En effet, Claude 3 est entraîné pour comprendre l\'intention qui se cache derrière votre demande et générer des réponses qui répondent à cet objectif, plutôt que de se contenter de suivre une série de commandes.
10. Enregistrez la réponse dans une variable.
  Dans cet exemple, la réponse est enregistrée dans multiModalResponse
Cliquez sur Exécuter pour démarrer le bot.
Vous pouvez lire la valeur du champ en affichant la réponse dans une Zone de message action. Dans cet exemple, multiModalResponse affiche la réponse.

Lorsque l\'image suivante est fournie comme entrée avec l\'invite, la réponse générée est indiquée dans le tableau ci-dessous :


Invite	Réponse
Expliquer l\'image $Invite de l\'image - Chiens sur l\'herbe$	L\'image montre trois adorables chiots courant ensemble en plein air sur une étendue d\'herbe. Ils semblent appartenir à une race de bergers, peut-être des bergers australiens ou un type similaire. Leur pelage est un mélange de noir, de blanc et de fauve. Les chiots aux oreilles tombantes débordent d\'énergie, comme le montre un moment de jeu où ils courent à travers l\'espace ouvert. L\'arrière-plan est légèrement flou, ce qui permet de mettre l\'accent sur les chiots vifs et joyeux au premier plan. L\'image transmet un sentiment de bonheur, de jeunesse et de pur plaisir associé aux jeunes chiens enjoués.

Pas de rubrique précédente

Pas de rubrique suivante

Pas de rubrique précédente

Pas de rubrique suivante