Usar classificação no fluxo de trabalho de extração de dados

Para otimizar os fluxos de trabalho de processamento de documentos que envolvem classificação e extração de dados, você pode integrar a tarefa de classificação ao fluxo de trabalho de processamento de documentos. Essa integração elimina a necessidade de pré-classificação manual de documentos, possibilitando um processo unificado e automatizado que lida com ambas as tarefas sequencialmente em um único fluxo de trabalho.

Pré-requisitos

Verifique se você criou uma instância de aprendizado para o que deseja usar com este processo e que a publicou na produção. Consulte Publicar a instância de aprendizado para produção.

Neste procedimento, usamos a ação Classificar no Classificador de documentos pacote e criamos variáveis em concordância. Dependendo da ação do classificador escolhida, talvez seja obrigatório modificar o procedimento e criar diferentes conjuntos de variáveis.

Procedimento

  1. Faça login em sua Control Room.
  2. Navegue para a guia Automação > Privado.
  3. Clique em Criar > Task Bot.
    Não coloque o bot na pasta Documentar processos do espaço de trabalho.
  4. Dê um nome para o bot, como processamento de documentos com classificação.
  5. Crie as seguintes variáveis:
    Nome da variável Descrição Tipo de dados Valor
    SourcePath Caminho do arquivo para a pasta que contém documentos a serem classificados String Insira o caminho do arquivo onde os documentos a serem classificados estão localizados
    ClassifiedFilePath Caminho do arquivo para a pasta que contém documentos que estão classificados String Insira o caminho do arquivo onde os documentos classificados estão disponíveis
    OutputPath Caminho do arquivo para a pasta que contém os dados extraídos e documentos inválidos ou com falha String Digite o caminho do arquivo onde você deseja a saída de extração
    FilesInFolderClassification Possui nome de arquivo e extensão Dicionário América do Norte
    FoldersInFolderDataProcessing Contém o nome da pasta String América do Norte
    FilesInFolderDataProcessing Possui nome de arquivo e extensão Dicionário América do Norte

    Consulte Criar uma variável.

  6. Insira uma ação Loop para iterar em todos os documentos para classificar em um caminho de arquivo específico.
    1. Clique duas vezes ou arraste a ação Loop no editor.
    2. Selecione o iterador Para cada arquivo na pasta.
    3. No campo Caminho da pasta, insira $SourcePath$.
    4. No campo Atribuir nome de arquivo e extensão a esta variável, insira $FilesInFolderClassification$.
    Consulte Loop pacote.
  7. Configurar ações para classificar documentos.
    1. Arraste a ação Classificar no Classificador de documentos pacote para o contêiner Loop.
    2. No campo Arquivo de entrada, selecione a opção Arquivo de desktop e insira $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$.
    3. No campo Classificador, selecione o arquivo de modelo apropriado.
    4. No campo Caminho da pasta de saída, selecione a opção Pasta de desktop e insira $ClassifiedFilePath$.
  8. Insira uma ação Loop para iterar através de todas as pastas em um caminho de arquivo específico.
    1. Clique duas vezes ou arraste a ação Loop no editor.
    2. Selecione o iterador Para cada pasta na pasta.
    3. No campo Caminho da pasta, insira $ClassifiedFilePath$.
      Nota: Nós selecionamos a variável ClassifiedFilePath para o caminho da pasta, pois os documentos classificados são armazenados como pastas separadas nesta pasta.
    4. No campo Atribuir caminho de pasta relativo a esta variável, insira $FoldersInFolderDataProcessing$.
    Consulte Loop pacote.
  9. Insira uma ação Loop para iterar através de todos os arquivos de processamento de dados em um caminho de arquivo específico.
    1. Clique duas vezes ou arraste a ação Loop no editor.
    2. Selecione o iterador Para cada arquivo na pasta.
    3. No campo Caminho da pasta, insira $ClassifiedFilePath$/$FoldersInFolderDataProcessing$.
    4. No campo Atribuir nome e extensão de arquivo a esta variável, insira $FilesInFolderDataProcessing$.
    Consulte Loop pacote.
  10. Configure ações para fazer upload de documentos para o processo associado a uma instância de aprendizado específica.
    1. Arraste a ação Criar uma solicitação no Process Composer pacote no contêiner Loop.
    2. No campo Processo público, clique em Procurar e selecione uma instância de aprendizado que esteja disponível no modo público.
    3. No campo Arquivo “InputFile”, selecione a opção Arquivo de desktop e insira $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    4. No campo String “InputFileName”, insira $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    5. No campo String “OutputFolder”, insira $OutputPath$.
  11. Ao usar o Arquivo pacote, você pode executar as seguintes ações:
    • Ao usar a ação Copiar arquivo de desktop, você pode fazer uma cópia dos arquivos que foram processados com êxito para um local diferente no desktop. Por exemplo, insira $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ no campo Arquivo de origem.
    • Ao usar a ação Excluir, você pode remover documentos depois do upload deles para Document Automation. Por exemplo, insira $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ no campo File.

    Consulte Arquivo de texto pacote.

  12. Clique em Salvar.
Agora, quando você executa essa automação, os documentos são classificados primeiro e depois usados na instância de aprendizado para extração de dados.