Usar a ação Treinar Classificador avançado

Use a ação Treinar Classificador avançado para criar um arquivo de modelo que é usado pelas ações Classificar documentos, Classificar páginas, ou Dividir documento para classificar os documentos nas categorias necessárias para entrada.

Pré-requisitos

Antes de construir o bot, colete exemplos de documentos e categorize-os em pastas. Garanta que o conjunto de documentos de exemplo atenda aos seguintes requisitos:
  • Tenha pelo menos duas categorias.
  • É necessário um mínimo de 15 arquivos por categoria, com uma recomendação de 20 arquivos por categoria.
  • Não há restrições quanto ao número máximo de categorias. No entanto, é importante observar que, à medida que o conjunto de dados de treinamento e o tamanho do modelo correspondente aumentam, o desempenho do processo de classificação pode diminuir. Portanto, é aconselhável manter o número de categorias em um intervalo de 150 por arquivo de modelo para otimizar o desempenho.
  • Os formatos de arquivo suportados são os seguintes:
    • .tiff
    • .bitmap
    • .jepg
    • .png
    • .pdf
    • .txt
  • Recomendamos que você forneça imagens com uma resolução de 300 dpi (pontos por polegada). A resolução mínima aceitável é de 200 dpi.
Nota:

Se esses requisitos mínimos não forem atendidos, uma mensagem de erro será exibida durante o tempo de execução do bot.

Procedimento

  1. Na paleta Ações, clique duas vezes ou arraste a ação Treinar Classificador avançado do pacote Classificador avançado.
  2. Digite um nome para o arquivo de modelo no campo Nome do modelo.
  3. Selecione o caminho da pasta de entrada Treinamento em Pasta da área de trabalho ou Variável. O caminho da pasta de entrada deve ter subdiretórios com os nomes que correspondem à categoria dos documentos nos quais você deseja treinar o classificador. Por exemplo, se você tiver documentos relacionados a vendas, o caminho da pasta de entrada deve ter subpastas como Invoice e Purchase Order.
  4. Opcional: Se você selecionar Arquivo da área de trabalho, clique em Procurar para alterar o caminho de arquivo padrão. Por exemplo, C:\Users\Dave\BankStatement\TrainingData
  5. Use o campo Caminho de saída do modelo para selecionar o diretório para o arquivo de modelo de saída.
  6. No campo Licença, forneça uma credencial de licença.
  7. Se você selecionar a opção Credencial, clique em Escolher para obter uma licença do armário de licenças.
  8. No campo Treinamento de divisão de documento:
    Se você selecionar Desativado:
    1. Em Configurações avançadas, escolha o Tipo de classificação no menu suspenso com base no tipo de classificador que você deseja criar:
      • Classificador visual
      • Classificador de conteúdo
      • Classificador visual e de conteúdo
    2. Opcional: Adicione as Regras de texto.
    Se você selecionar Ativado:
    1. Você verá as seguintes opções:
      • Mesclar documento desconhecido - Desmarcado, por padrão.
      • Limite de página desconhecida - 30 por cento, por padrão
      • Limite de confiança de divisão (ou Limite de divisão de separação) - 70 por cento, por padrão.
    2. Em Configurações avançadas, escolha o Tipo de classificação no menu suspenso com base no tipo de classificador que você deseja criar:
      • Classificador visual
      • Classificador de conteúdo
      • Classificador visual e de conteúdo
    3. Opcional: Adicione as Regras de texto.
    Nota: Deve haver apenas um arquivo de regras por categoria. Se o arquivo de regras for colocado fora das pastas de categoria, será exibida a seguinte mensagem de erro:

    Invalid rule file location

  9. Clique em Salvar e Executar.

Próximas etapas

Depois de criar o modelo, construa um bot para classificar os documentos de entrada. Para obter mais informações, consulte Como usar a ação Classificar documento.