Visão geral da classificação de documentos
- Última atualização2024/12/16
Visão geral da classificação de documentos
A classificação de documentos é um processo automatizado executado usando pacotes do classificador para agrupar ou classificar documentos ou páginas de um documento em diferentes categorias com base em seus atributos, como layout, conteúdo ou ambos.
Você pode usar esse processo em cenários em que é necessário organizar documentos e, depois, processar o documento. Por exemplo, após a conclusão do processo de classificação de documentos, você pode processá-los em instâncias de aprendizado apropriadas.
Como funciona a classificação
A classificação de documentos permite o processamento de documentos das seguintes maneiras:
- Organização de documentos
- Quando um arquivo contém vários documentos, a classificação de documentos ajuda a classificá-los em categorias relevantes, facilitando o gerenciamento e a recuperação desses documentos. Esses arquivos podem ter documentos do mesmo tipo (como faturas) ou de tipos diferentes (como faturas, conhecimentos de embarque e pedidos de compra).
- Simplificação do fluxo de trabalho
- Quando o classificador identifica os documentos corretos, você pode usar os documentos classificados no fluxo de trabalho de processamento de documentos correto, melhorando a identificação dos documentos e a precisão da extração de dados, por exemplo, processando documentos em instâncias de aprendizado apropriadas para extração de dados.
- Aprimoramento da eficiência
- Ao reduzir o esforço manual envolvido na classificação e ordenação de documentos, a classificação de documentos é mais rápida e minimiza erros manuais.
Tipos de classificadores
Você pode escolher uma das seguintes opções de classificador com base no seu caso de uso individual ou nos requisitos do seu negócio.
- Classificador de documentos
-
Este classificador agrupa documentos em pastas de diferentes categorias (que representam categorias de documentos) com base na primeira página de cada documento.
Além disso, o Classificador de documentos também pode classificar páginas individuais de um documento em pastas diferentes. Se houver documentos de várias páginas incorporados em um documento maior, as páginas individuais precisarão ser mescladas após a conclusão dessa classificação de nível de página para processá-las como documentos únicos. Por exemplo, se um documento de hipoteca incluir informações do cliente (KYC) nas páginas 1 e 2 e extrato bancário do cliente nas páginas 3 e 4, as páginas 1 e 2 serão classificadas como informações do cliente e salvas na pasta KYC e as páginas 3 e 4 serão classificadas como extratos bancários e salvas na pasta de extratos bancários. Para processar páginas KYC como um único documento, você precisará mesclar as páginas 1 e 2 armazenadas na pasta KYC. Da mesma forma, para processar o extrato bancário como um único documento, você precisará mesclar as páginas 3 e 4 armazenadas na pasta do extrato bancário.
- Classificador avançado
- Este classificador, além dos recursos do Classificador de documentos, permite dividir um documento em vários documentos e permite a classificação no nível do documento ou da página usando regras predefinidas. Recomendamos que você somente use este classificador quando o Classificador de documentos não atender às suas necessidades.
Para entender a diferença entre o Classificador avançado e o Classificador de documentos, consulte Comparação entre Classificador avançado e Classificador de documentos.