Utilisation de l'action Classer les pages

L'action Classer les pages regroupe les pages d'un document d'entrée en fonction du fichier modèle qui a été créé à l'aide de l'action Entraîner le classificateur avancé et filtre les pages qui ne correspondent pas au modèle.

Prérequis

  • Si cela n'est pas déjà fait, utilisez l'action Entraîner le classificateur avancé pour créer un fichier de modèle.
  • Assurez-vous que les fichiers d'entrée sont au format requis.

Créez un robot avec l'action Classer les pages dans une action Boucle afin de classer chaque fichier du dossier sélectionné de manière itérative.

Procédure

  1. Dans la palette Actions, double-cliquez sur l'action Classer les pages du package Classificateur avancé ou faites-la glisser.
  2. Dans le champ Fichier d'entrée, indiquez le chemin de fichier par défaut des fichiers entrants pour la classification :
    • Fichier de la Control Room
    • Fichier de bureau
    • Variable
  3. Dans le champ Classificateur, indiquez le chemin d'accès au fichier du modèle. Vous pouvez soit sélectionner le dossier .zip soit extraire le fichier .clsproj3 de ce dossier et le sélectionner.
    • Fichier de la Control Room
    • Fichier de bureau
    • Variable
  4. Utilisez l'option de chemin du Dossier de sortie pour enregistrer les documents de sortie de classification. Les pages du document de sortie sont enregistrées dans les sous-dossiers respectifs en fonction des catégories créées dans le fichier modèle.
    • Dossier Bureau
    • Variable
  5. Dans le champ Licence, indiquez une information d'identification pour la licence.
  6. Si vous sélectionnez l'option Information d'identification, cliquez sur Choisir pour obtenir une licence à partir de la consigne de licences.
  7. Facultatif : Configurez les éléments suivants :
    Enregistrer la variable de sortie de classification : enregistrez les résultats de classification sous forme de liste de dictionnaires avec les clés suivantes :
    • fileName : nom du fichier que vous souhaitez traiter avec ajout de la valeur de l'index. Par exemple, <<file name_pageIndex>>
    • index : valeur du nombre de pages lorsque vous avez plusieurs pages
    • catégorie : la catégorie à laquelle le fichier appartient après classification. Par exemple, tous les documents relatifs aux ressources humaines seront placés dans une seule catégorie.
    • confiance : la valeur seuil en pourcentage qui montre la classification, par exemple, quel fichier appartient à quelle catégorie sur la base des données de formation.
    Remarque :
    • Vous pouvez sélectionner le type de classification dans le Classificateur avancé :
      • Classification basée sur l'image
      • Classification basée sur le texte
      • Classification basée sur l'image et le texte
  8. Cliquez sur Enregistrer et sur Exécuter.

Étapes suivantes

Vous pouvez utiliser chaque sous-dossier de documents similaires pour créer et entraîner une instance d'apprentissage afin d'extraire des données des documents.