Utilisation de la classification dans le flux de travail d\'extraction de données

Pour rationaliser les flux de travail du traitement de documents impliquant à la fois la classification et l\'extraction de données, vous pouvez intégrer la tâche de classification dans le flux de travail de traitement de documents. Grâce à cette intégration, il n\'est plus nécessaire de pré-classer manuellement les documents, ce qui permet la gestion des deux tâches de manière séquentielle au sein d\'un seul flux de travail par un processus unifié et automatisé

Prérequis

Assurez-vous d\'avoir créé une instance d\'apprentissage que vous souhaitez utiliser avec ce processus et de l\'avoir publiée en production. Reportez-vous à la rubrique Publication de l'instance d'apprentissage en production.

Dans cette procédure, nous avons utilisé l\'action Classer dans le Classificateur de documents package et créé des variables en conséquence. Selon l\'action de classificateur choisie, vous devrez peut-être modifier la procédure et créer différents ensembles de variables.

Procédure

  1. Connectez-vous à votre Control Room.
  2. Accédez à Automatisation > Onglet privé.
  3. Cliquez Créer > Bot de tâche.
    Veillez à ne pas placer le robot dans le dossier Processus d\'espace de travail des documents.
  4. Donnez un nom au robot, comme traitement-doc-avec-classification.
  5. Créez les variables suivantes :
    Nom de variable Description Type de données Valeur
    SourcePath Chemin d\'accès au dossier contenant les documents à classer Chaîne Saisissez le chemin de fichier dans lequel se trouvent les documents à classer
    ClassifiedFilePath Chemin d\'accès au dossier contenant les documents classés Chaîne Saisissez le chemin de fichier où les documents classés sont disponibles
    OutputPath Chemin d\'accès au dossier contenant les données extraites et les documents non valides ou ayant échoué. Chaîne Saisissez le chemin d\'accès de fichier où vous souhaitez enregistrer le résultat de l\'extraction
    FilesInFolderClassification Contient le nom et l\'extension du fichier Dictionnaire s/o
    FoldersInFolderDataProcessing Contient le nom du dossier Chaîne s/o
    FilesInFolderDataProcessing Contient le nom et l\'extension du fichier Dictionnaire s/o

    Reportez-vous à la rubrique Création d'une variable.

  6. Insérez une action Boucle pour itérer dans tous les documents à classer dans un chemin de fichier spécifique.
    1. Double-cliquez sur l\'action Boucle ou faites-la glisser vers l\'éditeur.
    2. Sélectionnez l\'itérateur Pour chaque fichier du dossier.
    3. Dans le champ Chemin du dossier, saisissez $SourcePath$.
    4. Dans le champ Attribuer un nom de fichier et une extension à cette variable, entrez $FilesInFolderClassification$.
    Reportez-vous à la rubrique Boucle package.
  7. Configurez les actions pour classer les documents.
    1. Faites glisser l\'action Classer du Classificateur de documents package dans le conteneur Boucle.
    2. Dans le champ Input File, sélectionnez l\'option Desktop file, et entrez $SourcePath$/$FichiersInFolder{name}$.$FichiersInFolder{extension}$.
    3. Dans le champ Classificateur, indiquez le fichier du modèle approprié.
    4. Dans le champ Chemin du dossier de sortie, sélectionnez l\'option Dossier Bureau et entrez $ClassifiedFilePath$.
    Reportez-vous à la rubrique Classificateur de documents package.
  8. Insérez une action Boucle pour itérer dans tous les dossiers dans un chemin de fichier spécifique.
    1. Double-cliquez sur l\'action Boucle ou faites-la glisser vers l\'éditeur.
    2. Sélectionnez l\'itérateur Pour chaque dossier du dossier.
    3. Dans le champ Chemin du dossier, saisissez $ClassifiedFilePath$.
      Remarque : Nous avons sélectionné la variable ClassifiedFilePath pour le chemin du dossier car les documents classifiés sont stockés dans des dossiers séparés dans ce dossier.
    4. Dans le champ Attribuer un chemin de dossier relatif à cette variable, entrez $FoldersInFolderDataProcessing$.
    Reportez-vous à la rubrique Boucle package.
  9. Insérez une action Boucle pour itérer dans tous les fichiers pour le traitement des données dans un chemin de fichier spécifique.
    1. Double-cliquez sur l\'action Boucle ou faites-la glisser vers l\'éditeur.
    2. Sélectionnez l\'itérateur Pour chaque fichier du dossier.
    3. Dans le champ Chemin du dossier, saisissez $ClassifiedFilePath$/$FoldersInFolderDataProcessing$.
    4. Dans le champ Attribuer un nom de fichier et une extension à cette variable, entrez $FilesInFolderDataProcessing$.
    Reportez-vous à la rubrique Boucle package.
  10. Configurez les actions afin de charger des documents dans le processus associé à une instance d\'apprentissage spécifique.
    1. Faites glisser l\'action Créer une demande du Process Composer package dans le conteneur Boucle.
    2. Dans le champ Processus public, cliquez sur Parcourir et sélectionnez une instance d\'apprentissage disponible en mode public.
    3. Dans le champ Fichier “InputFile”, sélectionnez l\'option Fichier du bureau, et entrez $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    4. Dans le champ Chaîne «InputFileName», saisissez $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    5. Dans le champ Chaîne «OutputFolder», saisissez $OutputPath$.
    Reportez-vous à la rubrique Process Composer package.
  11. Le File package permet d\'effectuer les actions suivantes :
    • À l\'aide de l\'action Copier le fichier du bureau, vous pouvez faire une copie des fichiers qui ont été traités avec succès vers un autre emplacement sur votre bureau. Par exemple, entrez $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ dans le champ Fichier source
    • En utilisant l\'action Supprimer, vous pouvez supprimer des documents après leur chargement sur Automatisation de documents. Par exemple, entrez $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ dans le champ Fichier.

    Reportez-vous à la rubrique Fichier texte package.

  12. Cliquez sur Enregistrer.
Désormais, lorsque vous exécutez cette automatisation, les documents sont d\'abord classés, puis utilisés dans l\'instance d\'apprentissage pour l\'extraction de données.