Usar pré-processamento no fluxo de trabalho de extração de dados

Para otimizar os fluxos de trabalho de processamento de documentos que envolvem pré-processamento e extração de dados, você pode integrar a tarefa de pré-processamento ao fluxo de trabalho de processamento de documentos. Essa integração elimina a necessidade de pré-processamento manual de documentos, permitindo um fluxo de trabalho unificado e automatizado que lida com ambas as tarefas de maneira sequencial em um único fluxo de trabalho.

Pré-requisitos

Verifique se você criou uma instância de aprendizado para o que deseja usar com este processo e que a publicou na produção. Consulte Publicar a instância de aprendizado para produção.

Neste procedimento, usamos a ação Aprimorar imagem no pacote Pré-processador e criamos variáveis adequadamente. Dependendo da ação do pré-processador escolhida, talvez seja obrigatório modificar o procedimento e criar diferentes conjuntos de variáveis.

Procedimento

  1. Faça login em sua Control Room.
  2. Navegue para a guia Automação > Privado.
  3. Clique em Criar > Task Bot.
    Não coloque o bot na pasta Documentar processos do espaço de trabalho.
  4. Dê um nome para o bot, como processamento de documentos com classificação.
  5. Crie as seguintes variáveis:
    Nome da variável Descrição Tipo de dados Valor
    SourcePath Caminho do arquivo para a pasta que contém os documentos a serem pré-processados String Insira o caminho do arquivo onde os documentos a serem pré-processados estão localizados
    PreProcessedFilePath Caminho do arquivo para a pasta que contém os documentos pré-processados String Insira o caminho do arquivo onde os documentos pré-processados estão disponíveis
    OutputPath Caminho do arquivo para a pasta que contém os dados extraídos e documentos inválidos ou com falha String Digite o caminho do arquivo onde você deseja a saída de extração
    FilesInFolderPreProcessing Possui nome de arquivo e extensão Dicionário América do Norte
    FilesInFolderDataProcessing Possui nome de arquivo e extensão Dicionário América do Norte

    Consulte Criar uma variável.

  6. Insira uma ação Loop para iterar em todos os documentos para classificar em um caminho de arquivo específico.
    1. Clique duas vezes ou arraste a ação Loop no editor.
    2. Selecione o iterador Para cada arquivo na pasta.
    3. No campo Caminho da pasta, insira $SourcePath$.
    4. No campo Atribuir nome e extensão de arquivo a esta variável, insira $FilesInFolderPreProcessing$.
    Consulte Loop pacote.
  7. Configure ações para pré-processamento de documentos.
    1. Arraste a ação Aprimorar imagem no pacote Pré-processador para o contêiner Loop.
    2. No campo Arquivo de entrada, selecione a opção Arquivo de desktop e insira $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$.
    3. No campo Caminho de saída, selecione a opção Pasta de desktop e insira $PreProcessedFilePath$.
  8. Insira uma ação Loop para iterar através de todos os documentos de processamento de dados em um caminho de arquivo específico.
    1. Clique duas vezes ou arraste a ação Loop no editor.
    2. Selecione o iterador Para cada arquivo na pasta.
    3. No campo Caminho da pasta, insira $PreProcessedFilePath$ .
    4. No campo Atribuir nome e extensão de arquivo a esta variável, insira $FilesInFolderDataProcessing$.
    Consulte Loop pacote.
  9. Configure ações para fazer upload de documentos para o processo associado a uma instância de aprendizado específica.
    1. Arraste a ação Criar uma solicitação no Process Composer pacote no contêiner Loop.
    2. No campo Processo público, clique em Procurar e selecione uma instância de aprendizado que esteja disponível no modo público.
    3. No campo Arquivo “InputFile”, selecione a opção Arquivo de desktop e insira $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    4. No campo String “InputFileName”, insira $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    5. No campo String “OutputFolder”, insira $OutputPath$.
  10. Ao usar o pacote Arquivos, você pode executar as seguintes ações:
    • Ao usar a ação Copiar arquivo de desktop, você pode fazer uma cópia dos arquivos que foram processados com êxito para um local diferente no desktop. Por exemplo, insira $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ no campo Arquivo de origem.
    • Ao usar a ação Excluir, você pode remover documentos depois que eles forem carregados no Document Automation. Por exemplo, insira $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ no campo Arquivo.

    Consulte Arquivo de texto pacote.

  11. Clique em Salvar.
Agora, quando você executa essa automação, os documentos são pré-processados primeiro para melhorar a qualidade da imagem e depois usados na instância de aprendizado para extração de dados.