pacote Classificador avançado

O pacote Classificador avançado permite classificar documentos em uma estrutura de pastas. Você pode carregar os documentos das pastas para a respectiva instância de aprendizagem para extração de conteúdo em Automação de documento.

Nota: .

Ações no Advanced Classifier pacote

O pacote contém as ações Treinar classificador avançado, Classificar documentos, Classificador páginas e Dividir documento. Você pode usar essas ações para criar um arquivo de modelo e usar o arquivo para classificar documentos carregados em diferentes pastas. Essas ações funcionam como precursoras do processamento de documentos.

Ações Descrição
Treinar classificador avançado Use a ação Treinar classificador avançado para criar um arquivo de modelo usado pelas ações Classificar documentos, Classificar páginas ou Dividir documento para classificar os documentos em categorias necessárias para entrada. Para obter mais informações, consulte Usar a ação Treinar Classificador avançado.
Classificar documentos A ação Classificar documentos agrupa os documentos de entrada com base na primeira página de cada documento, usando o arquivo de modelo selecionado que é criado com a ação Treinar classificador avançado. Para obter mais informações, consulte Como usar a ação Classificar documento.
Classificar páginas A ação Classificar páginas agrupa as páginas de um documento de entrada com base no arquivo de modelo que foi criado utilizando a ação Treinar classificador avançado e filtra as páginas que não se enquadram no modelo. Para obter mais informações, consulte Como usar a ação Classificar páginas.
Dividir documento Use a ação Dividir documento para separar o documento de entrada em vários documentos com base no modelo de classificação selecionado. Para obter mais informações, consulte Usar a ação Dividir documento.
Nota:

O pacote Classificador avançado utiliza o Tesseract OCR para classificação baseada em imagem. Para obter uma lista abrangente de idiomas compatíveis com Tesseract OCR, consulte Idiomas compatíveis com o Tesseract OCR.