Como usar a ação Classificar páginas

A ação Classificar páginas agrupa as páginas de um documento de entrada com base no arquivo de modelo que foi criado utilizando a ação Treinar classificador avançado e filtra as páginas que não se enquadram no modelo.

Pré-requisitos

  • Se você ainda não fez isso, use a ação Treinar classificador avançado para criar um arquivo modelo.
  • Certifique-se de que os arquivos de entrada estejam no formato exigido.

Construa um bot com a ação Classificar páginas dentro de uma ação de Loop para classificar iterativamente cada arquivo na pasta selecionada.

Procedimento

  1. Na paleta Ações, clique duas vezes ou arraste a ação Classificar páginas do pacote Classificador avançado.
  2. No campo Arquivo de entrada, forneça o caminho de arquivo padrão para os arquivos de entrada para classificação:
    • Arquivo da Control Room
    • Arquivo de desktop
    • Variável
  3. No campo Classificador, forneça o caminho de arquivo do arquivo modelo. Você pode selecionar a pasta .zip ou extrair o .clsproj3 dessa pasta e selecioná-la.
    • Arquivo da Control Room
    • Arquivo de desktop
    • Variável
  4. Use a opção caminho da Pasta de saída para salvar os documentos de saída de classificação. As páginas do documento de saída são salvas nas respectivas subpastas com base nas categorias criadas no arquivo de modelo.
    • Pasta de desktop
    • Variável
  5. No campo Licença, forneça uma credencial de licença.
  6. Se você selecionar a opção Credencial, clique em Escolher para obter uma licença do armário de licenças.
  7. Opcional: Configure o seguinte:
    Salvar variável de saída de classificação: Salve os resultados de classificação como uma lista de dicionários com as seguintes chaves:
    • fileName: Nome do arquivo que você deseja processar junto com o valor do índice anexado. Por exemplo, <<file name_pageIndex>>
    • index: Valor de número da página quando há várias páginas
    • category: A categoria à qual o arquivo pertence após a classificação. Por exemplo, todos os documentos relacionados com RH serão colocados numa categoria.
    • confidence: O valor percentual limite que mostra a classificação, por exemplo, qual arquivo pertence à qual categoria, com base nos dados de treinamento.
    Nota:
    • Você pode selecionar o tipo de classificação no Classificador avançado:
      • Classificação baseada na imagem
      • Classificação baseada em texto
      • Classificação baseada tanto em imagem como em texto
  8. Clique em Salvar e Executar.

Próximas etapas

Você pode usar cada subpasta de documentos semelhantes para criar e treinar uma instância de aprendizado para extrair dados dos documentos.