Utilisation du prétraitement dans le flux de travail d\'extraction de données

Pour rationaliser les flux de travail du traitement de documents impliquant à la fois le prétraitement et l\'extraction de données, vous pouvez intégrer la tâche de prétraitement dans le flux de travail du traitement de documents. Grâce à cette intégration, il n\'est plus nécessaire de pré-traiter manuellement les documents, ce qui permet la gestion des deux tâches de manière séquentielle au sein d\'un seul flux de travail automatisé et unifié.

Prérequis

Assurez-vous d\'avoir créé une instance d\'apprentissage que vous souhaitez utiliser avec ce processus et de l\'avoir publiée en production. Reportez-vous à la rubrique Publication de l'instance d'apprentissage en production.

Dans cette procédure, nous avons utilisé l\'action Améliorer l\'image dans le package Préprocesseur et créé des variables en conséquence. Selon l\'action de préprocesseur choisie, vous devrez peut-être modifier la procédure et créer différents ensembles de variables.

Procédure

  1. Connectez-vous à votre Control Room.
  2. Accédez à Automatisation > Onglet privé.
  3. Cliquez Créer > Bot de tâche.
    Veillez à ne pas placer le robot dans le dossier Processus d\'espace de travail des documents.
  4. Donnez un nom au robot, comme traitement-doc-avec-classification.
  5. Créez les variables suivantes :
    Nom de variable Description Type de données Valeur
    SourcePath Chemin d\'accès au dossier contenant les documents à pré-traiter Chaîne Saisissez le chemin du fichier dans lequel se trouvent les documents à pré-traiter
    PreProcessedFilePath Chemin d\'accès au dossier contenant les documents prétraités Chaîne Saisissez le chemin du fichier où les documents pré-traités sont disponibles
    OutputPath Chemin d\'accès au dossier contenant les données extraites et les documents non valides ou ayant échoué. Chaîne Saisissez le chemin d\'accès de fichier où vous souhaitez enregistrer le résultat de l\'extraction
    FilesInFolderPreProcessing Contient le nom et l\'extension du fichier Dictionnaire s/o
    FilesInFolderDataProcessing Contient le nom et l\'extension du fichier Dictionnaire s/o

    Reportez-vous à la rubrique Création d'une variable.

  6. Insérez une action Boucle pour itérer dans tous les documents à classer dans un chemin de fichier spécifique.
    1. Double-cliquez sur l\'action Boucle ou faites-la glisser vers l\'éditeur.
    2. Sélectionnez l\'itérateur Pour chaque fichier du dossier.
    3. Dans le champ Chemin du dossier, saisissez $SourcePath$.
    4. Dans le champ Attribuer un nom de fichier et une extension à cette variable, entrez $FilesInFolderPreProcessing$.
    Reportez-vous à la rubrique Boucle package.
  7. Configurez les actions pour prétraiter les documents.
    1. Faites glisser l\'action Améliorer l\'image du package Préprocesseur dans le conteneur Boucle.
    2. Dans le champ Input File, sélectionnez l\'option Desktop file, et entrez $SourcePath$/$FichiersInFolder{name}$.$FichiersInFolder{extension}$.
    3. Dans le champ Chemin de sortie, sélectionnez l\'option Dossier Bureau et entrez $PreProcessedFilePath$.
    Reportez-vous à la rubrique IQ Bot Pre-processor package.
  8. Insérez une action Boucle pour itérer dans tous les documents pour le traitement des données dans un chemin de fichier spécifique.
    1. Double-cliquez sur l\'action Boucle ou faites-la glisser vers l\'éditeur.
    2. Sélectionnez l\'itérateur Pour chaque fichier du dossier.
    3. Dans le champ Chemin du dossier, saisissez $PreProcessedFilePath$ .
    4. Dans le champ Attribuer un nom de fichier et une extension à cette variable, entrez $FilesInFolderDataProcessing$.
    Reportez-vous à la rubrique Boucle package.
  9. Configurez les actions afin de charger des documents dans le processus associé à une instance d\'apprentissage spécifique.
    1. Faites glisser l\'action Créer une demande du Process Composer package dans le conteneur Boucle.
    2. Dans le champ Processus public, cliquez sur Parcourir et sélectionnez une instance d\'apprentissage disponible en mode public.
    3. Dans le champ Fichier “InputFile”, sélectionnez l\'option fichier Bureau, et entrez $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    4. Dans le champ Chaîne «InputFileName», saisissez $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    5. Dans le champ Chaîne «OutputFolder», saisissez $OutputPath$.
    Reportez-vous à la rubrique Process Composer package.
  10. Grâce au package Fichier, vous pouvez effectuer les actions suivantes :
    • À l\'aide de l\'action Copier le fichier du bureau, vous pouvez faire une copie des fichiers qui ont été traités avec succès vers un autre emplacement sur votre bureau. Par exemple, entrez $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ dans le champ Fichier source.
    • En utilisant l\'action Supprimer, vous pouvez supprimer des documents après leur chargement sur Document Automation. Par exemple, entrez $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ le champ Fichier.

    Reportez-vous à la rubrique Fichier texte package.

  11. Cliquez sur Enregistrer.
Désormais, lorsque vous exécutez cette automatisation, les documents sont d\'abord prétraités pour améliorer la qualité de l\'image, puis utilisés dans l\'instance d\'apprentissage pour l\'extraction de données.