Utilisation de l'action Entraîner le classificateur avancé

Utiliser l'action Entraîner le classificateur avancé pour créer un fichier de modèle utilisé par les actions Classer un document, Classer les pages ou Fractionner un document afin de trier les documents dans les catégories requises.

Prérequis

Avant de créer le robot, regroupez des exemples de documents et classez-les dans des dossiers. Assurez-vous que le jeu d'exemples de documents remplit les conditions suivantes :
  • Il doit posséder au moins deux catégories.
  • Bien que 15 fichiers par catégorie minimum soient requis, nous vous recommandons d'en utiliser 20 par catégorie.
  • Le nombre maximal de catégories ne fait l'objet d'aucune restriction. Toutefois, il est important de noter qu'au fur et à mesure de l'augmentation de l'ensemble des données d'apprentissage et de la taille du modèle correspondant, les performances du processus de classification peuvent diminuer. Il est donc conseillé de maintenir le nombre de catégories autour de 150 par fichier modèle pour assurer des performances optimales.
  • Les formats de fichiers pris en charge sont les suivants :
    • .tiff
    • .bitmap
    • .jepg
    • .png
    • .pdf
    • .txt
  • Nous vous recommandons de fournir des images présentant une résolution de 300 dpi (points par pouce). La résolution minimale acceptable est de 200 dpi.
Remarque :

Si ces exigences minimales ne sont pas satisfaites, un message d'erreur s'affiche pendant l'exécution du robot.

Procédure

  1. Dans la palette Actions, double-cliquez sur l'action Entraîner le classificateur avancé du package Classificateur avancé ou faites-la glisser.
  2. Donnez un nom au fichier de modèle dans le champ Nom du modèle.
  3. Sélectionnez Chemin du dossier d'entraînement dans Dossier Bureau ou Variable. Le chemin du dossier d'entrée doit disposer de sous-répertoires avec les noms qui correspondent à la catégorie des documents sur lesquels vous souhaitez entraîner le classificateur. Par exemple, si vous avez des documents liés aux ventes, le chemin du dossier d'entrée doit avoir des sous-dossiers tels que Facture et Bon de commande.
  4. Facultatif : Si vous sélectionnez Fichier de bureau, cliquez sur Parcourir pour modifier le chemin de fichier par défaut. Par exemple, C:\Users\Dave\BankStatement\TrainingData
  5. Utilisez le champ Chemin de sortie du modèle pour sélectionner le répertoire du fichier de modèle de sortie.
  6. Dans le champ Licence, indiquez une information d'identification pour la licence.
  7. Si vous sélectionnez l'option Information d'identification, cliquez sur Choisir pour obtenir une licence à partir de la consigne de licences.
  8. Dans le champ Entraînement au fractionnement de document :
    Si vous sélectionnez Désactivé :
    1. Dans les paramètres avancés, choisissez le Type de classification dans le menu déroulant en fonction du type de classificateur que vous souhaitez créer :
      • Classificateur visuel
      • Classificateur de contenu
      • Classificateur visuel et de contenu
    2. Facultatif : Ajoutez les Règles de texte.
    Si vous sélectionnez Activé :
    1. Les options suivantes s'affichent :
      • Fusionner les documents inconnus - Non coché, par défaut.
      • Seuil de page inconnu - 30 %, par défaut
      • Seuil de confiance du fractionnement (ou seuil de fractionnement de la séparation) - 70 %, par défaut.
    2. Dans les paramètres avancés, choisissez le Type de classification dans le menu déroulant en fonction du type de classificateur que vous souhaitez créer :
      • Classificateur visuel
      • Classificateur de contenu
      • Classificateur visuel et de contenu
    3. Facultatif : Ajoutez les Règles de texte.
    Remarque : Il ne doit y avoir qu'un seul fichier de règles par catégorie. Si le fichier de règles est placé en dehors des dossiers de catégories, le message d'erreur suivant affiche :

    Invalid rule file location

  9. Cliquez sur Enregistrer et sur Exécuter.

Étapes suivantes

Après avoir créé le modèle, créez un robot pour classer les documents d'entrée. Pour plus d'informations, consultez Utilisation de l'action Classer le document.