Melhorar a extração de dados da tabela
- Última atualização2024/11/29
Melhorar a extração de dados da tabela
Use as configurações avançadas de treinamento para treinar documentos e fornecer entradas adicionais para o mecanismo de extração do Document Automation melhorar a extração de dados da tabela.
- Coluna primária: Defina a coluna principal para a identificação da linha com base nos requisitos.
- Indicador do fim de tabela: Adicione um valor do indicador do fim de tabela para o sistema extrair dados até que o valor atinja o valor especificado, excluindo o valor do indicador do fim de tabela.
- Rótulos de cabeçalho: Ajustar ou mapear novamente os campos da tabela conforme exigido.
Pré-requisitos
- A opção Configuração de treinamento avançado estará disponível somente se a opção Melhorar a precisão usando validação estiver habilitada.
- A permissão Treinar grupos é exigida para fornecer informações sobre rótulos de cabeçalho, indicador do fim de tabela e uma coluna primária usada para a detecção da linha.
- Só pode haver uma coluna primária.
- O indicador do fim de tabela é uma região identificada pelo sistema de texto (SIR).
Procedimento
Coluna primária
Por exemplo, após extrair o documento, os dados da tabela multilinha da coluna Número do item são extraídos em uma única linha, mas você quer extraí-los em linhas separadas. Nesses casos, defina o Número do item como a coluna primária para melhorar a extração da tabela. Para obter mais detalhes, consulte Exemplo de configuração da coluna primária usando configurações avançadas de treinamento.
Indicador de fim de tabela
Por exemplo, ao processar um documento, ele extrai dados inteiros da tabela em que você deseja extrair os dados de linha até Total a pagar. Nesses casos, é possível especificar o valor do Indicador do fim de tabela para que os dados da tabela até esse valor (excluindo o valor do Indicador do fim de tabela) sejam extraídos e nenhum outro dado da linha seja extraído.
Rótulo do cabeçalho
Quando há uma incompatibilidade de rótulo nos dados da tabela, por exemplo, o rótulo do cabeçalho extraído é Preço unitário, mas é preferível que seja Preço. Nesses casos, é possível alterar o rótulo do cabeçalho.
Outro caso de uso é que você pode remapear todos os valores do Preço unitário ou alterar o rótulo do cabeçalho com os dados da coluna. Você pode usar o preenchimento automático para agilizar esse remapeamento. Por exemplo, após a extração, a coluna Preço da instância de aprendizado é extraída como Preço estendido, mas é preferível que o rótulo do cabeçalho seja Preço unitário, junto com os dados da coluna. Nesses casos, é possível alterar o rótulo do cabeçalho Preço estendido para Preço unitário e selecionar e remapear todos os valores das células da coluna Preço unitário.