Melhore a precisão da extração por meio da validação

Entenda como o sistema melhora a precisão da extração pelas mudanças no sistema Validador.

Quando uma instância de aprendizado é criada, o usuário tem a opção de habilitar esse recurso para enviar feedback para a instância de aprendizado com base nas alterações fornecidas pelo usuário no Validador. Em Document Automation, o aprendizado em modo de produção pode "aprender" continuamente sempre que um usuário redimensiona ou realoca a região de extração na região de Validador.

O gráfico a seguir oferece uma visão geral visual do processo pelo qual as instâncias de aprendizado recebem continuamente um feedback da validação:

O processo de "ensinar" instâncias de aprendizado pelo feedback de validação

  1. Um documento carregado passa pelo motor de extração.
  2. Se a instância de aprendizado extrair os dados com sucesso, os valores extraídos serão baixados para um arquivo na pasta Success.

    Se a instância de aprendizado não puder extrair os dados, o sistema avalia se o documento contém um layout desconhecido.

  3. Se a instância de aprendizado não reconhecer o layout do documento (novo layout), o documento é enviado para validação manual onde o usuário "ensina" à instância de aprendizado como extrair os dados pela definição da região de extração.
  4. Os valores extraídos são baixados para um arquivo na pasta Success e as mudanças são coletadas em um arquivo de feedback, que é enviado para o banco de dados de feedback.
    Nota:
    • O feedback só é coletado quando o usuário muda a região de extração. Se o usuário introduzir manualmente o texto, o sistema não coletará feedback.
    • O arquivo de feedback contém apenas dados sobre a localização do campo para melhorar a precisão da extração para documentos subsequentes.

    Se a instância de aprendizado reconhece o cluster, ela recupera o feedback anterior do banco de dados de feedback e o utiliza para extrair dados.

Use o feedback de validação para extrair valores específicos em uma tabela

A partir da Automation 360v.27, é possível treinar uma instância de aprendizagem para extrair dados de uma célula que contenha mais do que um campo.

Por exemplo, se uma coluna de descrição do produto também incluir o número do item, você pode delinear o número do item na interface de Validação. Quando a instância de aprendizagem processa documentos subsequentes, ela extrai o número do item e ignora a descrição do produto.

Siga este procedimento para configurar uma instância de aprendizagem para extrair valores específicos de uma célula:
  1. Crie uma instância de aprendizagem usando um modelo Automation Anywhere pré-treinado e selecione a opção para enviar feedback de validação: Criar uma instância de aprendizado no Document Automation
  2. Fazer upload de exemplos de documentos: Processar documentos no Document Automation
  3. No Validador, localize o campo e redesenhe a caixa para apenas circundar os valores que você deseja extrair.
  4. Depois de clicar em Enviar, a informação sobre a nova região de extração é enviada para a base de dados de feedback.
  5. Carregue mais documentos para testar a precisão da extração. Quando estiver satisfeito com os resultados, continue para a preparação da instância de aprendizagem a ser executada em produção: Publicar a instância de aprendizado para produção
Nota: Você também pode usar esse procedimento para aproveitar melhorias baseadas em validação para instâncias de aprendizagem importadas no Document Automation do IQ Bot usando o pacote IQ Bot para Document Automation Bridge. Para obter mais informações, consulte IQ Bot pacote – DA Bridge.

Como Document Automation identifica novos layouts

A extração Document Automation é baseada na detecção de objetos. Durante o processamento de documentos, o motor de extração identifica objetos ou pares de valores-chave do campo e valor associado. O motor cria uma "impressão digital" do documento, que armazena a sequência dos objetos e a localização de cada objeto no documento.

Quando um documento é processado, se o motor reconhece as chaves e suas localizações, o documento é classificado e extraído com base naquela impressão digital existente. Caso contrário, o motor economiza uma nova impressão digital das chaves e de suas localizações.

Processo pelo qual o motor reconhece a impressão digital existente em um documento ou cria uma nova impressão digital