Criar Conexões de modelo fundamentadas com o recurso de RAG da Google Vertex AI

Use o recurso de RAG (geração aumentada de recuperação) da Google Vertex AI para criar Conexões de modelo de Fundamentado em armazenamento de dados e gerar informações precisas e contextualmente relevantes referenciadas da Google Data Source.

Nota:

As Conexões de modelo de Fundamentado em armazenamento de dados da Google Vertex AI agora estão disponíveis na versão v34 do Automation 360 também no Nuvem. Você pode usar este recurso no Nuvem e No local.

O Google Data Store com fragmentação de documentos agora é compatível para garantir resultados ideais nas execuções de automação. Você pode habilitar a fragmentação de documentos no Google Data Store para usar modelos baseados em Google Vertex AI no AI Agent Studio.

Agora estamos oferecendo a opção de criar Conexões de modelo do Fundamentado em armazenamento de dados usando o serviço do Agent Builder. Uma consulta de pesquisa no Google Data Store recupera conteúdo relevante de grandes conjuntos de dados e o fornece ao modelo para gerar uma resposta precisa.

Durante a execução de uma automação, usar Conexões de modelo criadas com o Fundamentado em armazenamento de dados recupera a resposta referenciando o Google Data Source no Google Data Store. Isso garante uma resposta otimizada do conteúdo relevante com maior precisão. A fundamentação é um aspecto importante ao usar um modelo básico, pois ela fornece respostas fundamentadas com base nos dados organizacionais e previne imprecisões nas respostas e alucinações do modelo.
Nota: Para usar o recurso de RAG da Google Vertex AI no AI Agent Studio, você iria primeiro criar uma fonte de dados no Agent Builder. Então, criar uma Conexão de modelo utilizando a opção Fundamentado em armazenamento de dados.

Consulte: Armazenamento de dados na Google Vertex AI .

Pré-requisitos

O administrador de automação precisa dessas funções e permissões para criar e gerenciar Conexões de modelo para sua empresa.
  • Função: AAE_Basic, função personalizada de administrador de automação
  • Permissão: Executor de bots assistido
  • Configurações: O AI Data Management (Gerenciamento de dados de IA) deve ser habilitado pelo administrador de automação e a caixa de seleção para a opção Allow users to disable logs on AI Skills (Permitir que os usuários desabilitem logs em habilidades de IA) deve estar marcada.

Veja Funções e permissões para Ferramentas de IA para consultar as permissões de função personalizada do administrador de automação.

Outros requisitos:
  • Como mencionado anteriormente, você primeiro criaria uma Google Data Source para criar uma Conexão de modelo de Fundamentado em armazenamento de dados e usá-la com sucesso em uma Habilidade de IA. Consulte Armazenamento de dados e Criar um Vertex Data Store.
  • Para armazenar detalhes de autenticação em um cofre de credenciais, tenha essas informações em mãos. Consulte Armazenamento seguro de credenciais no Cofre de credenciais.
  • Para testar uma Conexão de modelo, é necessário estar conectado ao Agente de bot 22.60.10 e mais recente. Como parte do teste, é necessário executar o bot na sua área de trabalho. Portanto, certifique-se de que o Agente de bot esteja configurado para seu usuário. Para esta tarefa, se você tiver que mudar a conexão para uma outra Control Room, consulte: Alternar o registro do dispositivo entre instâncias da Control Room.
  • Você precisa de acesso ao Gravador e ao Habilidades de IA para testar a conexão com sucesso. Um Prompt de teste deve ser executado para testar a Conexão de modelo.

Procedimento

  1. No ambiente da Control Room, navegue até IA > Conexões de modelo > Criar conexão de modelo.
  2. Na tela Criar conexão de modelo, você pode definir estas Configurações de conexão:
    Criar Conexões de modelo fundamentadas com o recurso de RAG da Google Vertex AI
    Você pode inserir manualmente o nome do modelo no campo Escolher um modelo ou criar um personalizado. O nome que você inserir será usado para criar a Conexão de modelo.
    1. Nome da conexão do modelo: Forneça um nome para fácil identificação da Conexão de modelo.
    2. Descrição (opcional): Adicione uma breve descrição que defina a conexão.
    3. Escolha um fornecedor: Escolha um fornecedor de modelo básico na lista de fornecedores compatíveis. Para criar uma Conexão de modelo de Fundamentado em armazenamento de dados com a Google Vertex AI, selecione Google Vertex AI na lista suspensa.
    4. Escolha um tipo: Escolha Fundamentado em armazenamento de dados para usar o recurso de RAG para a Google Vertex AI.
    5. Escolher um modelo ou criar um personalizado: Escolha um modelo na lista suspensa.
      Além disso, também oferecemos suporte a outros modelos disponíveis no Google Data Store, que não estão disponíveis na lista suspensa. Se você quiser adicionar um modelo do Google Data Store, será necessário inserir o nome e a versão do modelo com o URI completo do modelo. Por exemplo: Se o modelo for Gemini 1.5 Flash 001, o formato seria gemini-1.5-001/answer_gen/v1.
      Para obter uma lista completa dos modelos suportados por cada fornecedor de modelo básico, consulte .
    6. Clique em Avançar para ir para a seção Detalhes de autenticação.
  3. Na seção Detalhes de autenticação, defina estas configurações:
    1. Nome do projeto: Este é o projeto da conta do Google Cloud.
    2. Região: Selecione uma região na lista suspensa para se conectar e autenticar a Conexão de modelo. Você também pode adicionar sua própria região, configurada ao criar uma fonte de dados no Agent Builder.
    3. Conexão OAuth da Control Room: Crie um ID de cliente OAuth 2.0. Um ID de cliente é usado para identificar um único aplicativo para os servidores OAuth do Google.
    4. Depois de configurar os detalhes de autenticação, confirme e clique em Avançar para prosseguir para a seção Testar conexão para testar a Conexão de modelo.
    Nota: Para obter informações sobre como configurar o Google Cloud Project e a Conexão OAuth da Control Room para a Google Vertex AI, consulte Vertex AI: Ação Conectar.
  4. Clique em Testar conexão para garantir que todos os detalhes da conexão tenham sido definidos corretamente e verificar se a conexão está funcionando.
    Esta é uma operação de desktop usando um Agente de bot. Use o Agente de bot 22.60.10 e mais recente para testes bem-sucedidos.
    • Se a conexão funcionar conforme o esperado, o sistema processará a solicitação e você receberá uma mensagem de sucesso gerada pelo sistema.
    • Se a conexão não funcionar conforme o esperado, você receberá uma mensagem gerada pelo sistema informando o motivo da falha na conexão. Por exemplo, se você não baixou o pacote do modelo básico compatível para o espaço de trabalho, você receberá uma mensagem de erro. Será necessário baixar o pacote e testar a Conexão de modelo de novo.
    • Se o teste de uma Conexão de modelo não tiver êxito ou se você deixar a tarefa incompleta, a Conexão de modelo não será salva e você terá que reiniciar o processo de criação da Conexão de modelo.
  5. Clique em Avançar para ir para a seção Convidar funções e começar a atribuir funções personalizadas aos usuários.
    O administrador de automação pode criar funções personalizadas e atribuir as Conexões de modelo à função, que pode ser atribuída aos usuários. Apenas usuários atribuídos a essa função personalizada podem usar essa Conexão de modelo.
  6. Atribua a Conexão de modelo à função personalizada (usando RBAC) para que os usuários atribuídos à função possam acessá-la.
  7. Clique em Criar conexão de modelo para concluir a criação da Conexão de modelo.
    Após a criação bem-sucedida da Conexão de modelo, o desenvolvedor profissional a utilizará para criar uma Habilidade de IA.

    Consulte: Create Habilidades de IA with Fundamentado em armazenamento de dados Conexões de modelo

    .

Próximas etapas

Depois de criar e testar a Conexão de modelo, ela é atribuída aos desenvolvedores profissionais, que usa essa conexão para criar Habilidades de IA.

Como o próximo passo na sua sequência de tarefas, vá para Create Habilidades de IA with Fundamentado em armazenamento de dados Conexões de modelo e crie uma Habilidade de IA e conecte-se a uma Conexão de modelo do Fundamentado em armazenamento de dados para usá-la em uma automação.