Criar instância de aprendizado com IA generativa para documentos semiestruturados

Use este tópico como um guia para criar uma instância de aprendizado aproveitando o recurso IA generativa (IA generativa) para extrair dados de documentos semiestruturados, como faturas, pedidos definidos pelo usuário e pedidos de compras ou documentos da cadeia de suprimentos, como: Aviso de chegada, conhecimento de embarque, listas de embalagem e conhecimento de transporte.

Para extração de dados de documentos semiestruturados, os usuários têm a opção de utilizar o recurso do IA generativa além do recurso de feedback de validação do usuário pronto para uso, marcando a opção Melhorar a precisão usando validação ao criar uma instância de aprendizado. Isso garante a extração consistente e melhorada de dados com precisão imediata. Aqui vão as orientações das etapas de criação de uma instância de aprendizado com o recurso da IA generativa que permitirá a extração precisa de dados de documentos semiestruturados.

Pré-requisitos

  • Para documento de cadeia de suprimentos, o recurso Extração de dados baseada em IA generativa está habilitado por padrão e não pode ser desabilitado. Portanto, você deve habilitar IA generativa e outras conexões externas de Document Automation para processar documentos sem erros. Consulte Habilite a IA generativa e outras conexões externas para Document Automation.
  • Um desenvolvedor profissional de uma empresa realizaria as seguintes tarefas:
    • Criar, editar e excluir instâncias de aprendizado
    • Fazer upload de documentos para processamento e teste
    • Fazer checkin e checkout de instâncias de aprendizado de pastas privadas para públicas
  • Requisito de licença: Licença de Criador de bots para executar as tarefas acima.

  • Funções e permissões atribuídas:
    • AAE_IQBot Services ou AAE_IQBot Admin
    • AAE_Basic

Procedimento

  1. Faça login na Control Room, navegue até IA > Document Automation e clique no botão Criar instância de aprendizagem para começar a criar uma nova instância de aprendizado.
  2. Em seguida, insira um nome exclusivo de instância de aprendizado para identificá-la facilmente na lista Instâncias de aprendizado e selecione as outras opções da seguinte forma:
    Crie uma instância de aprendizado para documento semiestruturado com o recurso de IA generativa
    1. Descrição (opcional): Esse é um campo opcional que pode ser usado para adicionar uma descrição significativa e resumir o uso da instância de aprendizado.
    2. Tipo de documento: Selecione de uma lista de documentos semiestruturados disponíveis, como: Faturas, definido pelo usuário, aviso de chegada, conhecimento de embarque, listas de embalagem e conhecimento de transporte.
      Ao selecionar esta opção, o recurso de extração de dados orientada por IA generativa é habilitado, além do recurso Melhorar a precisão usando validação, que é oferecido de imediato e é baseado no feedback enviado ao sistema por meio das alterações fornecidas pelo usuário feitas no Validador durante o processo de validação. Esse é um recurso essencial para documentos semiestruturados, pois garante melhor resultado na extração de dados com uma combinação de feedback de validação pelo usuário e recurso de IA generativa.
    3. Idioma: Inglês
      Atualmente, oferecemos suporte apenas para o inglês.
    4. Localização: conforme a localização de origem dos documentos.
      O local é selecionado com base no seu idioma e país de origem do documento.
    5. Provedor: Automation Anywhere (definido pelo usuário)
    6. Provedor de OCR: Google Vision OCR ou ABBYY OCR
      Você tem a opção de escolher entre as duas opções de OCR compatíveis.
  3. Clique em Próximo para começar a criar campos de formulário e de tabela para a instância de aprendizado. Da v32 em diante, a funcionalidade IA generativa está disponível para campos de formulário e tabela. Você pode usar a funcionalidade GenAI além do suporte de alias personalizado padrão. Consulte Criar uma instância de aprendizado no Document Automation, etapa 9, para obter detalhes sobre como adicionar pseudônimos a um campo.
    O Document Automation usa aliases personalizados e funcionalidade de feedback por padrão para documentos semiestruturados. As consultas para campos com menor confiança e dados de campo ausentes são passadas para IA generativa para extração.
    Instância de aprendizado para documentos semiestruturados com consulta de pesquisa habilitada para IA generativa
  4. A funcionalidade IA generativa para campos de tabela pode ser usada para identificação de colunas, o que aprimora a extração de dados com foco em colunas da tabela. Esse recurso é um grande valor agregado para extração de tabelas. GenAI pode identificar uma coluna específica da tabela com base na consulta de pesquisa definida sem necessidade de treinar documentos e funciona como um recurso pronto para uso em Document Automation. Portanto, você pode usar a consulta de pesquisa habilitada para GenAI para identificar a coluna e, em seguida, extrair dados específicos para um campo dessa coluna usando o modelo de extração Document Automation.
  5. Em seguida, adicione um Nome do campo, que precisa ser específico para o ponto de dados que você deseja extrair, e um Rótulo do campo, que é usado para criar uma consulta de pesquisa padrão, e selecione Tipo de dados para definir a estrutura de dados do valor do campo.
    Você pode selecionar entre as opções de valor de tipo de dados Texto, Número, Data ou Endereço no menu suspenso. Para ver detalhes sobre a criação de campos do formulário, consulte: Criar uma instância de aprendizado no Document Automation, etapa 10.
  6. Os campos de formulário e tabela podem ser definidos como Obrigatório ou Opcional. Quando você usa o recurso IA generativa, o campo Confiança fica bloqueado.
  7. Você tem a opção adicional de usar o recurso Extrair campo usando padrão para extração.
  8. Na seção Pesquisar consulta para modelo de IA generativa, você tem a opção de usar a consulta gerada pelo sistema ou adicionar uma consulta personalizada.
    Por exemplo, para um campo de endereço, a consulta padrão de IA generativa seria ‘What is the Home address?\' (Qual é o endereço residencial?). Você pode personalizar a consulta para \'What is the Home address with city and state?\' (Qual é o endereço residencial com cidade e estado?).
  9. Na próxima etapa, defina as Regras de campo e Regras de documento para os campos de formulário e tabela e clique em Criar para concluir a criação da instância de aprendizado. Para ver detalhes sobre a definição das regras de formulário e de documentos, consulte: Regras de validação em Document Automation.

Próximas etapas

  1. Publique a instância de aprendizado no repositório público para que possa ser usada em modo público para extrair dados de documentos reais e os validadores possam validar manualmente os documentos. Consulte Publicar a instância de aprendizado para produção.
  2. Na página de lista IA > Document Automation , identifique a instância de aprendizado que você acabou de criar e publicar e clique em Processar para começar a fazer upload de documentos para processamento e extração de dados. Consulte Processar documentos no Document Automation.
  3. Abra o documento CSV com os dados extraídos para comparar com o documento processado a fim de validar e confirmar que os campos da consulta de pesquisa habilitados por IA generativa extraíram dados com alta precisão.