Melhore a precisão da extração por meio da validação
- Última atualização2024/10/31
Melhore a precisão da extração por meio da validação
Entenda como o sistema melhora a precisão da extração pelas mudanças no sistema Validador.
Quando uma instância de aprendizado é criada, o usuário tem a opção de habilitar esse recurso para enviar feedback para a instância de aprendizado com base nas alterações fornecidas pelo usuário no Validador. Em Document Automation, o aprendizado em modo de produção pode "aprender" continuamente sempre que um usuário redimensiona ou realoca a região de extração na região de Validador.
O gráfico a seguir oferece uma visão geral visual do processo pelo qual as instâncias de aprendizado recebem continuamente um feedback da validação:
- Um documento carregado passa pelo motor de extração.
- Se a instância de aprendizado extrair os dados com sucesso, os valores extraídos serão baixados para um arquivo na pasta
Success
.Se a instância de aprendizado não puder extrair os dados, o sistema avalia se o documento contém um layout desconhecido.
- Se a instância de aprendizado não reconhecer o layout do documento (novo layout), o documento é enviado para validação manual onde o usuário "ensina" à instância de aprendizado como extrair os dados pela definição da região de extração.
- Os valores extraídos são baixados para um arquivo na pasta
Success
e as mudanças são coletadas em um arquivo de feedback, que é enviado para o banco de dados de feedback.Nota:- O feedback só é coletado quando o usuário muda a região de extração. Se o usuário introduzir manualmente o texto, o sistema não coletará feedback.
- O arquivo de feedback contém apenas dados sobre a localização do campo para melhorar a precisão da extração para documentos subsequentes.
Se a instância de aprendizado reconhece o cluster, ela recupera o feedback anterior do banco de dados de feedback e o utiliza para extrair dados.
Use o feedback de validação para extrair valores específicos em uma tabela
A partir da Automation 360v.27, é possível treinar uma instância de aprendizagem para extrair dados de uma célula que contenha mais do que um campo.
Por exemplo, se uma coluna de descrição do produto também incluir o número do item, você pode delinear o número do item na interface de Validação. Quando a instância de aprendizagem processa documentos subsequentes, ela extrai o número do item e ignora a descrição do produto.
- Crie uma instância de aprendizagem usando um modelo Automation Anywhere pré-treinado e selecione a opção para enviar feedback de validação: Criar uma instância de aprendizado no Document Automation
- Fazer upload de exemplos de documentos: Processar documentos no Document Automation
- No Validador, localize o campo e redesenhe a caixa para apenas circundar os valores que você deseja extrair.
- Depois de clicar em Enviar, a informação sobre a nova região de extração é enviada para a base de dados de feedback.
- Carregue mais documentos para testar a precisão da extração. Quando estiver satisfeito com os resultados, continue para a preparação da instância de aprendizagem a ser executada em produção: Publicar a instância de aprendizado para produção
Como Document Automation identifica novos layouts
A extração Document Automation é baseada na detecção de objetos. Durante o processamento de documentos, o motor de extração identifica objetos ou pares de valores-chave do campo e valor associado. O motor cria uma "impressão digital" do documento, que armazena a sequência dos objetos e a localização de cada objeto no documento.
Quando um documento é processado, se o motor reconhece as chaves e suas localizações, o documento é classificado e extraído com base naquela impressão digital existente. Caso contrário, o motor economiza uma nova impressão digital das chaves e de suas localizações.