Como usar a ação Classificar

IQ Bot Classificar a ação agrupa as páginas de um documento de entrada com base no arquivo de modelo que foi criado usando o IQ Bot Treinar classificador ação.

Pré-requisitos

Construa um bot com o Classificaração dentro de um Loopação para classificar iterativamente cada arquivo na pasta selecionada.

Procedimento

  1. Na paleta Ações, clique duas vezes ou arraste a ação Loop do pacote Loop.
  2. No campo Tipo de loop, selecione a opção Iterador.
  3. No campo Iterador, selecione Para cada arquivo na pasta na lista suspensa.
  4. No campo Caminho da pasta selecione o caminho para a pasta que contém os arquivos de entrada.
  5. No campo Atribuir nome e extensão do arquivo a esta variável, crie ou selecione uma variável de dicionário para armazenar os nomes e extensões dos arquivos no caminho da pasta selecionada.
    Para este exemplo, usaremos uma variável de dicionário chamada dictFile.
  6. Na paleta Ações , clique duas vezes ou arraste a ação Classificar do pacote Classificador de documentos.
  7. No campo Arquivo de entrada, insira um caminho de arquivo dinâmico usando uma variável.
    1. Adicione um caminho de arquivo que aponte para a pasta, por exemplo C:\input\.
    2. Adicione a string de nome de arquivo dinâmico: $dictFile(name)$.$dictFile(extension)$.
      Nota: Certifique-se de incluir um ponto entre a variável que contém o nome do arquivo e aquela que contém a extensão.
    As chaves nome e extensão são predefinidas. Quando inserida e executada em um loop, a ação itera por toda a pasta e chama os arquivos na pasta, um de cada vez. O valor Caminho do arquivo exibe algo como: C:\input\$dictFile(name)$.$dictFile(extension)$
  8. No campo Classificador, forneça o caminho do arquivo para o arquivo modelo.
    Você pode selecionar a pasta .zip ou extrair o .icmf dessa pasta e selecione-a.
    Nota: Para melhores resultados de classificação e desempenho, recomendamos que você utilize o arquivo .icmf disponível na pasta .zip obtida da ação Treinar classificador.
  9. Use a opção Caminho da pasta de saída para salvar o documento de saída de classificação.
  10. Opcional: Defina as seguintes CONFIGURAÇÕES AVANÇADAS:
    • Limite de confiança (%): Se o valor de confiança da previsão de categoria de uma página for menor que o limite de confiança, ele será movido para a pasta Unclassified.
    • Salvar variável de saída de classificação: Salve os resultados de classificação como uma lista de dicionários com as seguintes chaves:
      • fileName
      • pageIndex
      • categoria
      • confiança
    Nota:
    • Você pode selecionar o tipo de classificação no Classificador de documentos:
      • Classificação baseada na imagem
      • Classificação baseada em texto
      • Classificação baseada tanto em imagem como em texto
    • Para projetar um limite de confiança mais elevado, sugerimos que você calcule o limite de confiança quando as páginas do documento forem semelhantes. Para determinar o limite de confiança necessário, é possível revisar os valores de confiança a partir dos resultados da classificação.
    • O Classificador de documentos pode detectar automaticamente o idioma para classificação, e suporta todos os idiomas suportados pela ABBYY (uma aplicação de reconhecimento óptico de caracteres).
  11. Clique em Salvar e Executar.
    As páginas do documento de saída são salvas nas respectivas subpastas com base nas categorias criadas no arquivo de modelo. Quaisquer documentos previamente classificados na pasta de saída serão substituídos.

Próximas etapas

Você pode usar cada subpasta de documentos semelhantes para criar e treinar uma instância de aprendizado para extrair dados dos documentos. Consulte Criar instância de aprendizado.