package Classificateur avancé

Le package Classificateur avancé vous permet de classer les documents dans une structure de dossiers. Vous pouvez charger les documents depuis les dossiers vers l'instance d'apprentissage correspondante pour l'extraction du contenu dans Document Automation.

Remarque : .

Actions dans le package Advanced Classifier

Le package contient les actions Entraîner le Classificateur avancé, Classer un document, Classer les pages et Fractionner un document. Vous pouvez utiliser ces actions pour créer un fichier de modèle, puis faire appel à ce fichier pour classer les documents chargés dans différents dossiers. Ces actions précèdent le traitement des documents.

Actions Description
Entraîner le Classificateur avancé Utilisez l'action Entraîner le Classificateur avancé pour créer un fichier de modèle utilisé par les actions Classer un document, Classer les pages ou Fractionner un document afin de trier les documents dans les catégories requises. Pour plus d'informations, consultez Utilisation de l'action Entraîner le classificateur avancé.
Classer un document L'action Classer le document regroupe les documents d'entrée en fonction de la première page de chaque document, à l'aide du fichier de modèle sélectionné et créé avec l'action Entraîner le Classificateur avancé. Pour plus d'informations, consultez Utilisation de l'action Classer le document.
Classer les pages L'action Classer les pages regroupe les pages d'un document d'entrée en fonction du fichier de modèle qui a été créé à l'aide de l'action Entraîner le Classificateur avancé et filtre les pages qui ne correspondent pas au modèle. Pour plus d'informations, consultez Utilisation de l'action Classer les pages.
Fractionner un document Utilisez l'action Fractionner un document pour séparer le document d'entrée en plusieurs documents sur la base du modèle de classification sélectionné. Pour plus d'informations, consultez Utilisation de l'action Fractionner un document.
Remarque :

Le package Classificateur avancé s'appuie sur Tesseract OCR pour la classification basée sur l'image. Pour une liste exhaustive des langues prises en charge par Tesseract OCR, consultez Langues prises en charge par Tesseract.