Criar instância de aprendizado com IA generativa para documentos semiestruturados

Use este tópico como um guia para criar uma instância de aprendizado aproveitando o recurso de IA generativa (IA generativa) para extrair dados de documentos semiestruturados, como faturas, pedidos definidos pelo usuário e pedidos de compras ou documentos da cadeia de suprimentos, como: aviso de chegada, conhecimento de embarque, listas de embalagem e conhecimento de transporte.

Para extração de dados de documentos semiestruturados, os usuários têm a opção de utilizar o recurso do IA generativa além do recurso de feedback de validação do usuário pronto para uso, marcando a opção Melhorar a precisão usando validação ao criar uma instância de aprendizado. Isso garante a extração consistente e melhorada de dados com precisão imediata. Aqui vão as orientações das etapas de criação de uma instância de aprendizado com o recurso da IA generativa que permitirá a extração precisa de dados de documentos semiestruturados.

Pré-requisitos

Um desenvolvedor profissional de uma empresa realizaria as seguintes tarefas:
  • Criar, editar e excluir instâncias de aprendizagem
  • Fazer upload de documentos para processamento e teste
  • Fazer checkin e checkout de instâncias de aprendizado de pastas privadas para públicas

Requisito de licença: Licença de Bot Creator para executar as tarefas acima.

Funções e permissões atribuídas:
  • AAE_IQBot Services ou AAE_IQBot Admin
  • AAE_Basic

Procedimento

  1. Faça login na Control Room e navegue até Gerenciar > Instâncias de aprendizado e clique no botão Criar instância de aprendizado para começar a criar uma nova instância de aprendizado.
  2. Em seguida, insira um nome exclusivo de instância de aprendizado para identificá-la facilmente na lista Instâncias de aprendizado e selecione as outras opções da seguinte forma:
    Crie uma instância de aprendizado para documento semiestruturado com o recurso IA generativa
    1. Descrição (opcional): Esse é um campo opcional que pode ser usado para adicionar uma descrição significativa e resumir o uso da instância de aprendizado.
    2. Tipo de documento: Selecione de uma lista de documentos semiestruturados disponíveis, como: Faturas, definido pelo usuário, aviso de chegada, conhecimento de embarque, listas de embalagem e conhecimento de transporte.
      Ao selecionar esta opção, o recurso de extração de dados orientada por IA generativa é habilitado, além do recurso Melhorar a precisão usando validação, que é oferecido de imediato e é baseado no feedback enviado ao sistema por meio das alterações fornecidas pelo usuário feitas no Validador durante o processo de validação. Esse é um recurso essencial para documentos semiestruturados, pois garante melhor resultado na extração de dados com uma combinação de feedback de validação pelo usuário e recurso de IA generativa.
    3. Idioma: Inglês
      Atualmente, oferecemos suporte apenas para o inglês.
    4. Localização: conforme a localização de origem dos documentos.
      O local é selecionado com base no seu idioma e país de origem do documento.
    5. Provedor: Automation Anywhere (definido pelo usuário)
    6. Fornecedor de OCR: Google Vision OCR ou ABBYY OCR
      Você tem a opção de escolher entre as duas opções de OCR compatíveis.
  3. Clique em Próximo para começar a criar campos de formulário e de tabela para a instância de aprendizado. Da v32 em diante, a funcionalidade IA generativa está disponível para campos de formulário e tabela. Você pode usar a funcionalidade GenAI além do suporte de alias personalizado padrão. Consulte Criar uma instância de aprendizado no Automação de documento, etapa 9, para obter detalhes sobre como adicionar pseudônimos a um campo.
    O Automação de documento usa aliases personalizados e funcionalidade de feedback por padrão para documentos semiestruturados. As consultas para campos com menor confiança e dados de campo ausentes são passadas para IA generativa para extração.
    Instância de aprendizagem para documentos semiestruturados com consulta de pesquisa IA generativa habilitada
  4. A funcionalidade IA generativa para campos de tabela pode ser usada para identificação de colunas, o que aprimora a extração de dados com foco em colunas da tabela. Esse recurso é um grande valor agregado para extração de tabelas. GenAI pode identificar uma coluna específica da tabela com base na consulta de pesquisa definida sem necessidade de treinar documentos e funciona como um recurso pronto para uso em Automação de documento. Portanto, você pode usar a consulta de pesquisa habilitada para GenAI para identificar a coluna e, em seguida, extrair dados específicos para um campo dessa coluna usando o modelo de extração Automação de documento.
  5. Em seguida, adicione um Nome do campo, que precisa ser específico para o ponto de dados que você deseja extrair, e um Rótulo do campo, que é usado para criar uma consulta de pesquisa padrão, e selecione Tipo de dados para definir a estrutura de dados do valor do campo.
    Você pode selecionar entre as opções de valor de tipo de dados Texto, Número, Data ou Endereço no menu suspenso. Para ver detalhes sobre a criação de campos do formulário, consulte: Criar uma instância de aprendizado no Automação de documento, etapa 10.
  6. Os campos de formulário e tabela podem ser definidos como Obrigatório ou Opcional. Quando você usa o recurso IA generativa, o campo Confiança fica bloqueado.
  7. Você tem a opção adicional de usar o recurso Extrair campo usando padrão para extração.
  8. Na seção Pesquisar consulta para modelo de IA generativa, você tem a opção de usar a consulta gerada pelo sistema ou adicionar uma consulta personalizada.
    Por exemplo, para um campo de endereço, a consulta padrão de IA generativa seria ‘What is the Home address?’ (Qual é o endereço residencial?). Você pode personalizar a consulta para 'What is the Home address with city and state?' (Qual é o endereço residencial com cidade e estado?).
  9. Na próxima etapa, defina as Regras de campo e Regras de documento para os campos de tabela e formulário e clique em Criar para concluir a criação da instância de aprendizado. Para ver detalhes sobre a definição do formulário e das regras do documento, consulte: Regras de validação em Automação de documento.

Próximas etapas

  1. Publique a instância de aprendizado no repositório público para que possa ser usada em modo público para extrair dados de documentos reais e os validadores possam validar manualmente os documentos. Consulte Publicar a instância de aprendizado para produção.
  2. Na página de lista Gerenciar > Instâncias de aprendizado, identifique a instância de aprendizado que você acabou de criar e publicar e clique em Processar para começar a fazer upload de documentos para processamento e extração de dados. Consulte Processar documentos no Automação de documento.
  3. Abra o documento CSV com os dados extraídos para comparar com o documento processado a fim de validar e confirmar que os campos da consulta de pesquisa habilitados por IA generativa extraíram dados com alta precisão.