Criar uma instância de aprendizado usando o Google CDE

uma instância de aprendizado é uma estrutura que contém informações, tais como tipo de documento, idioma e os campos a serem extraídos. Após criar um processador de extração personalizado, você deve criar uma instância de aprendizado para extrair dados dos documentos.

Pré-requisitos

  • Certifique-se de ter criado e treinado com sucesso um processador Google Custom Document Extractor (CDE).
  • Certifique-se de que a Control Room tenha a licença do produto Document Workspace (número de páginas).
  • Verifique se configurou o BYOK. Para obter mais informações, consulte Configurar o traga sua própria chave (BYOK) para Google CDE.

Para integrar um novo processador com o IA de documentos do Google, a etapa crucial é a criação de uma instância de aprendizado. Isso envolve a utilização do provedor como opção Google Document AI (definida pelo usuário). Ao criar uma instância de aprendizado usando essa opção, os usuários podem definir campos do formulário e tabela com nomes correspondentes conforme apresentados no processador.
Nota:
  • Atualmente, o IA de documentos do Google oferece suporte à extração de tabela única.
  • O recurso de caixa de seleção (no modo de visualização) pode resultar em uma extração inconsistente para os campos de caixas de seleção, o que pode levar a resultados inconsistentes. Nesses casos, se o sistema não conseguir extrair com precisão o valor do campo da caixa de seleção, ele será rotulado como Não encontrado.

Procedimento

  1. Na página inicial da Control Room, navegue até Gerenciar > Instâncias de aprendizado > Criar instâncias de aprendizado.
    A janela Criar instância de aprendizado é aberta em uma nova guia.
  2. Acrescente um nome para a nova instância de aprendizado a ser criada.
  3. No menu suspenso Tipo de documento, selecione Definido pelo usuário.
  4. No menu Provedor, selecione Google Document AI (definido pelo usuário).
  5. Selecione o campo Tabela ou Formulários.
  6. Crie novos campos com nomes idênticos aos utilizados no processador Google CDE.
    Nota: Ao criar novos campos, certifique-se de que seus nomes correspondam aos rótulos de esquema usados no processador do Google. Isso se aplica a campos do formulário e campos da tabela.
  7. Clique em Create (Criar).

    Quando uma nova instância de aprendizado é criada, a Control Room cria uma pasta com o mesmo nome da instância de aprendizado na pasta Automação > Espaço de trabalho para documentos.

  8. Atualize o bot de extração da instância de aprendizado com a conta de serviço e URL do endpoint do processador.
    1. Abra o bot para a instância de aprendizado em Bots > IQ Bot Processes > {LI name} > {LI name}_extractionbot.
    2. Escolha um cofre de credenciais e uma chave. Para obter mais informações, consulte Configurar o traga sua própria chave (BYOK) para Google CDE.
    3. Copie o URL do endpoint de previsão do processador Google CDE.
      Endpoint de previsão no Google Document AI
    4. Cole o URL copiado no URL do endpoint do Document AI para o processador de documentos.

      URL do endpoint do Document AI para o processador de documentos

Próximas etapas

Carregue documentos para a instância de aprendizado, corrija erros de validação e verifique os dados extraídos. Para obter mais informações, consulte Processar documentos no Automação de documento.