A ação Classificar do IQ Bot agrupa as páginas de um documento de entrada com base no arquivo de modelo que foi criado usando a ação Treinar classificador do IQ Bot.
Construa um bot com o Classificar
ação dentro de um Loop
ação para classificar iterativamente cada arquivo na pasta selecionada.
Procedimento
-
Na paleta
Ações
, clique duas vezes ou arraste a ação
Loop do pacote
Loop.
-
No campo Tipo de loop, selecione a opção Iterador.
-
No campo Iterador, selecione Para cada arquivo na pasta na lista suspensa.
-
No campo Caminho da pasta selecione o caminho para a pasta que contém os arquivos de entrada.
-
No campo Atribuir nome e extensão do arquivo a esta variável, crie ou selecione uma variável de dicionário para armazenar os nomes e extensões dos arquivos no caminho da pasta selecionada.
Para este exemplo, usaremos uma variável de dicionário chamada dictFile.
-
Na paleta
Ações
, clique duas vezes ou arraste a ação
Classificar do pacote
Classificador de documentos.
-
No campo Arquivo de entrada, insira um caminho de arquivo dinâmico usando uma variável.
-
Adicione um caminho de arquivo que aponte para a pasta, por exemplo C:\input\.
-
Adicione o nome de arquivo dinâmico string: $dictFile(name)$.$dictFile(extension)$.
Nota: Certifique-se de incluir um ponto entre a variável que contém o nome do arquivo e aquela que contém a extensão.
As chaves nome e extensão são predefinidas. Quando inserida e executada em um loop, a ação itera por toda a pasta e chama os arquivos na pasta, um de cada vez. O valor Caminho do arquivo exibe algo como: C:\input\$dictFile(nome)$.$dictFile(extensão)$
-
No campo Classificador, forneça o caminho do arquivo para o arquivo modelo.
Você pode selecionar a pasta
.zip ou extrair o
.icmf dessa pasta e selecione-a.
Nota: Para melhores resultados de classificação e desempenho, recomendamos que você utilize o arquivo .icmf disponível na pasta .zip obtida da ação
Treinar classificador.
-
Use a opção Caminho da pasta de saída para salvar o documento de saída de classificação.
- Opcional:
Defina as seguintes CONFIGURAÇÕES AVANÇADAS:
-
Limite de confiança (%): Se o valor de confiança da previsão de categoria de uma página for menor que o limite de confiança, ele será movido para a pasta Unclassified.
-
Salvar variável de saída de classificação: Salve os resultados de classificação como uma lista de dicionários com as seguintes chaves:
- fileName
- pageIndex
- categoria
- confiança
Nota:
- Você pode selecionar o tipo de classificação no Classificador de documentos:
- Classificação baseada na imagem
- Classificação baseada em texto
- Classificação baseada tanto em imagem como em texto
- Para projetar um limite de confiança mais elevado, sugerimos que você calcule o limite de confiança quando as páginas do documento forem semelhantes. Para determinar o limite de confiança necessário, é possível revisar os valores de confiança a partir dos resultados da classificação.
- O Classificador de documentos pode detectar automaticamente o idioma para classificação, e suporta todos os idiomas suportados pela ABBYY (uma aplicação de reconhecimento óptico de caracteres).
-
Clique em Salvar e Executar.
As páginas do documento de saída são salvas nas respectivas subpastas com base nas categorias criadas no arquivo de modelo. Quaisquer documentos previamente classificados na pasta de saída serão substituídos.
Próximas etapas
Você pode usar cada subpasta de documentos semelhantes para criar e treinar uma instância de aprendizado para extrair dados dos documentos. Consulte Criar instância de aprendizado.