Utilisation de l'action Fractionner un document

Utilisez l'action Fractionner un document pour séparer le document d'entrée en plusieurs documents sur la base du modèle de classification sélectionné.

Prérequis

  • Si cela n'est pas déjà fait, utilisez l'action Entraîner le classificateur avancé pour créer un fichier de modèle.
  • Assurez-vous que les fichiers d'entrée sont au format requis.

Pour fractionner un document en plusieurs documents, procédez comme suit :

Procédure

  1. Dans la palette Actions, double-cliquez sur l'action Fractionner un document du package Classificateur avancé ou faites-la glisser.
    Remarque : Les documents PDF et TIFF comportant plusieurs pages sont les seules entrées valides pour l'action Fractionner un document.
  2. Dans le chemin Fichier d'entrée, sélectionnez l'une des options suivantes pour spécifier l'emplacement du fichier d'entrée :
    • Fichier de la Control Room
    • Fichier de bureau
    • Variable
  3. Utilisez l'option de chemin du Dossier de sortie pour enregistrer les documents de sortie de classification.
    • Dossier Bureau
    • Variable
  4. Dans le champ Licence, indiquez une information d'identification pour la licence.
  5. Si vous sélectionnez l'option Information d'identification, cliquez sur Choisir pour obtenir une licence à partir du coffre des informations d'identification.
  6. Utilisez l'option Enregistrer la variable de sortie fractionnée pour enregistrer les documents de sortie de classification. enregistrez les résultats de classification sous forme de liste de dictionnaires avec les clés suivantes :
    • fileName : nom du fichier que vous souhaitez traiter
    • documentIndex : numéro du document (par catégorie)
    • pageIndex : nombre de pages (par document)
    • catégorie : la catégorie à laquelle le fichier appartient après classification. Par exemple, tous les documents relatifs aux ressources humaines seront placés dans une seule catégorie.
    • classConfidence : sur la base des données de formation, le système classe les documents et identifie la valeur seuil en pourcentage qui indique la classification, par exemple, quel fichier appartient à quelle catégorie.
    • splitConfidence : sur la base des données de formation, le système divise les documents en différentes catégories et identifie la valeur du pourcentage de division qui indique le niveau de confiance à l'égard de la division pour la classification.
  7. Cliquez sur Enregistrer et sur Exécuter.