Anthropic: ação IA multimodal

A ação Anthropic: IA multimodal conecta sua automação aos modelos Claude 3 Amazon Bedrock Anthropic que podem lidar com tarefas complexas, como descrever o conteúdo de imagens fornecidas como entradas.

Pré-requisitos

  • Você precisa ter a função Criador de bots para usar a ação Anthropic: IA multimodal em um bot.
  • Certifique-se de que você tenha as credenciais necessárias para enviar uma solicitação. Para obter mais informações sobre como adquirir credenciais, consulte Amazon Bedrock: ação Autenticação.

Este exemplo mostra como enviar ao modelo Claude 3 uma imagem específica e fazer perguntas direcionadas, gerando respostas relevantes com base no conteúdo.

Procedimento

  1. Na Control Room, acesse o painel Ações, selecione IA generativa > Amazon Bedrock, arraste Anthropic: IA multimodal e coloque na tela.
  2. Insira ou selecione os seguintes campos:

    Multimodal Anthropic

    1. Insira a Região. Para obter informações sobre região, consulte Regiões do Amazon Bedrock GA.
    2. Selecione um LLM (Large Language Model, grande modelo de linguagem) para usar para o seu prompt na lista suspensa Modelo. É possível selecionar os seguintes modelos:
      • Claude 3 Sonnet v1
      • Claude 3 Haiku v1
      • Outra versão suportada para inserir outros modelos suportados.
      Neste exemplo, o Claude 3 Sonnet v1 está selecionado.
    3. Insira um Prompt para que o modelo gere uma resposta.
    4. Faça upload de até cinco imagens. Este exemplo mostra uma imagem com 3 cães em um gramado.
    5. Selecione Sim para carregar múltiplas imagens. Você pode fazer upload de até cinco imagens.
    6. Insira o Comprimento máximo.
      Por padrão, se você não inserir um valor, o tamanho máximo será definido automaticamente para mantê-lo dentro do comprimento máximo de contexto do modelo selecionado, considerando o comprimento da resposta gerada.
    7. Digite uma Temperatura. Esse valor se refere à aleatoriedade da resposta. À medida que a temperatura se aproxima de zero, a resposta torna-se específica. Quanto maior o valor, mais aleatória é a resposta.
    8. Insira o nome da sessão para limitar a sessão à sessão atual. Use o mesmo nome usado na ação Autenticação.
    9. Para gerenciar os parâmetros opcionais, clique em Mostrar mais opções e selecione Sim. Se você selecionar Sim, poderá adicionar outros parâmetros, como: Prompt do sistema, Top P, Top K, Adicionar instruções, Parar sequências ou insira uma Versão do Anthropic. Para mais informações sobre esses parâmetros opcionais, consulte Aprender modelos.
      Nota: Os modelos do Claude 3 aceitam Prompts do sistema. Ao contrário das instruções tradicionais, os prompts do sistema fornecem uma forma estruturada de orientar o Claude 3. Isso ocorre, porque o Claude 3 é treinado para compreender a intenção por trás do prompt e gerar respostas que atendam a esse objetivo, em vez de simplesmente seguir um conjunto de comandos.
    10. Salve a resposta em uma variável.
      Neste exemplo, a resposta é salva como multiModalResponse.
  3. Clique em Executar para iniciar o bot.
    Você pode ler o valor do campo imprimindo a resposta em uma ação de Caixa de mensagem. Neste exemplo, multiModalResponse imprime a resposta.

Quando a imagem a seguir é fornecida como entrada junto com o prompt, a resposta gerada é mostrada na tabela abaixo:

Prompt Resposta
Explain the Image (Explique a imagem)

Imagem de prompt: cães na grama

The image shows three adorable puppy dogs running together outdoors on a grassy field. (A imagem mostra três adoráveis filhotes de cachorro correndo juntos ao ar livre em um gramado.) They appear to be of a herding breed, possibly Australian Shepherds or a similar type. (Eles parecem ser de uma raça de pastoreio, provavelmente, pastores australianos ou uma raça semelhante.) Their coats are a mix of black, white, and tan colors. (Suas pelagens são uma mistura de preto, branco e marrom.) The puppies have floppy ears and are full of energy, captured in a playful moment as they race across the open space. (Os filhotes têm orelhas caídas e estão cheios de energia, a imagem foi capturada em um momento de diversão enquanto correm em um espaço aberto.) The background has a slightly blurred setting, allowing the focus to be on the lively and joyful puppies in the foreground. (O segundo plano tem um cenário levemente desfocado, permitindo que o foco fique nos filhotes animados e alegres em primeiro plano.) The image conveys a sense of happiness, youthfulness, and the pure fun associated with playful young dogs. (A imagem transmite uma sensação de felicidade, juventude e pura diversão associada a cães filhotes e brincalhões.)