Automation 360

Vertex AI: Ação Prompt de IA Multimodal

Baixar como PDF

Contents (Conteúdo)

Vertex AI: Ação Prompt de IA Multimodal

Baixar como PDF

Última atualização2025/12/22

O Vertex AI: A ação Prompt de IA Multimodal usa o modelo multimodal do Google que é capaz de processar informações de múltiplas modalidades, incluindo imagens, vídeos e texto. Esse recurso permite lidar com tarefas complexas, como descrever o conteúdo de uma imagem e um vídeo fornecidos como entrada.

Pré-requisitos

Você precisa ter a função Criador de bots para usar Vertex AI: ação Prompt de IA Multimodal em uma automação.
Certifique-se de ter as credenciais necessárias para enviar uma solicitação e de ter incluído Vertex AI: Ação Conectar antes de chamar qualquer ação do Google Cloud.

Este exemplo mostra como enviar para o modelo uma foto de um prato de biscoitos e pedir que ele gere uma receita desses biscoitos usando Vertex AI: action Prompt de IA Multimodal e receber uma resposta apropriada.

Procedimento

Na Automation Anywhere Control Room, acesse o painel Ações, selecione IA generativa > Google, arraste IA do Vertex: Prompt de IA MultiModal e coloque-o na tela.
Insira ou selecione os seguintes campos:
1. Insira o Número/nome do projeto. Este é o ID do projeto exclusivo do GCP. Para obter mais informações sobre o ID do projeto, consulte ID do projeto do Google Cloud.
2. Insira o Local. Para obter mais informações sobre o local do Vertex AI, consulte Locais Vertex AI.
3. Clique no menu suspenso Editor e selecione Google; ou selecione Terceiros para inserir um editor de terceiros.
4. Selecione um LLM (Large Language Model, grande modelo de linguagem) para usar para o seu prompt na lista suspensa Modelo. É possível selecionar os seguintes modelos:
  - Gemini Pro Vision (Descontinuado)
  - Gemini 2.0 Flash-Lite
  - Gemini 2.0 Flash
  - Gemini 2.5 Flash-Lite
  - Gemini 2.5 Flash
  - Gemini 2.5 Pro
5. Insira um Prompt para que o modelo gere uma resposta.
6. Carregue até dez imagens ou um vídeo. Neste exemplo, uma imagem de um prato de biscoitos é carregada. Para enviar as imagens, faça uma das seguintes ações:
  - Selecione Link da imagem e insira um url de imagem ou
  - Selecione Carregar imagem para fazer upload de uma imagem via transmissão de arquivo (consulte Transmissão de arquivo utilizando a variável de arquivo) ou arquivo da Control Room ou arquivo da área de trabalho.
7. Selecione Sim para carregar múltiplas imagens. Você pode carregar até dez imagens.
8. Insira o número máximo de tokens (Máx. de tokens) para gerar. Por padrão, se você não inserir um valor, o número máximo de tokens gerados será definido automaticamente para mantê-lo dentro do comprimento máximo de contexto do modelo selecionado, considerando o comprimento da resposta gerada.
9. Digite uma Temperatura. Esse valor se refere à aleatoriedade da resposta. À medida que a temperatura se aproxima de zero, a resposta se torna mais focada e determinística. Quanto maior o valor, mais aleatória é a resposta.
10. Digite Vertex-Default como o nome da sessão para limitá-la à sessão atual. O nome digitado deve corresponder à sessão estabelecida durante a conexão ao GCP.
11. Para gerenciar os parâmetros opcionais, selecione Sim em Mostrar mais opções para adicionar outros parâmetros, como Top K e Top P. Para obter informações sobre esses parâmetros opcionais, consulte Aprender modelos.
12. Salve a resposta em uma variável. Neste exemplo, a resposta é salva como VertexMultiModelResponse.
Clique em Executar para iniciar o bot. Você pode ler o valor do campo imprimindo a resposta em uma action Caixa de mensagem. Neste exemplo, VertexMultiModelResponse imprime a resposta.

Veja como a ação Prompt de IA Multimodal da Vertex AI abre novas possibilidades! Assista ao vídeo que apresenta um caso de uso do mundo real.

Quando a imagem a seguir é fornecida como entrada junto com o prompt, a resposta gerada é mostrada na tabela abaixo:


Prompt	Resposta
Generate a recipe.(Gere uma receita.)	Ingredientes: 1 cup all-purpose flour (1 xícara de farinha) 1/2 teaspoon baking powder (1/2 colher de chá de fermento em pó) 1/4 teaspoon salt (1/4 colher de chá de sal) 1/2 cup (1 stick) unsalted butter, softened (1/2 xícara (1 tablete) de manteiga sem sal, amolecida) 1/2 cup granulated sugar (1/2 xícara de açúcar refinado) 1 large egg (1 ovo grande) 1 teaspoon vanilla extract (1 colher de chá de extrato de baunilha) 1 cup semisweet chocolate chips (1 xícara de gotas de chocolate meio amargo) Instruções: (Instruções:) Preheat oven to 375 degrees F (190 degrees C). (Pré-aqueça o forno a 190 °C (375 °F).) Line a baking sheet with parchment paper. (Forre uma assadeira com papel manteiga.) In a medium bowl, whisk together the flour, baking powder, and salt. (Em uma tigela média, misture a farinha, o fermento e o sal.) In a large bowl, cream together the butter and sugar until light and fluffy. (Em uma tigela grande, bata a manteiga e o açúcar até obter um creme claro e aerado.) Beat in the egg and vanilla extract. (Adicione o ovo e o extrato de baunilha.) Gradually add the dry ingredients to the wet ingredients, mixing until just combined. (Aos poucos, vá adicionando os ingredientes secos aos úmidos, misturando tudo até incorporar bem.) Fold in the chocolate chips. (Acrescente as gotas de chocolate.) Drop the dough by rounded tablespoons onto the prepared baking sheet, spacing them about 2 inches apart. (Modele os biscoitos com a ajuda de colheres de sopa arredondadas enquanto os transfere para a assadeira preparada, deixando um espaço de cerca de 5 centímetros entre ele.) Bake for 10-12 minutes, or until the edges are golden brown and the centers are set. (Asse por 10 a 12 minutos ou até que as bordas estejam douradas e os centros firmes.) Let cool on the baking sheet for a few minutes before transferring to a wire rack to cool completely. (Deixe esfriar na assadeira por alguns minutos antes de transferir para uma grade para esfriar completamente.)