Présentation de la classification des documents

La classification des documents est un processus automatisé effectué à l'aide de packages Classificateur. Il consiste à regrouper ou classer des documents ou des pages de document dans différentes catégories en fonction de leurs attributs, tels que la mise en page et/ou le contenu.

Vous pouvez utiliser ce processus lorsque vous devez organiser des documents, puis exécuter le traitement de ces documents. Par exemple, une fois le processus de classification des documents terminé, vous pouvez les traiter dans les instances d'apprentissage appropriées.

Comment fonctionne la classification

La classification des documents permet de traiter les documents de la manière suivante :

Organisation des documents
Lorsqu'un fichier contient de nombreux documents, la classification des documents permet de les trier dans des catégories pertinentes, facilitant ainsi la gestion et la récupération de ces documents. Ces fichiers peuvent contenir des documents du même type (tels que des factures) ou de types différents (tels que des factures, des connaissements et des bons de commande).
Flux de travail rationalisé
Lorsque le classificateur identifie les documents corrects, vous pouvez utiliser les documents classés dans le flux de travail de traitement de documents approprié. Cela améliore l'identification des documents et la précision de l'extraction des données, par exemple, le traitement des documents dans des instances d'apprentissage appropriées pour l'extraction de données.
Efficacité accrue
En réduisant l'effort manuel consacré au tri et à la classification des documents, le processus de classification des documents permet de gagner du temps et de minimiser les erreurs manuelles.

Types de classificateurs

Vous pouvez choisir l'une des options de classificateur suivantes en fonction de votre cas d'utilisation individuel ou de vos besoins métier.

Classificateur de documents

Ce classificateur regroupe les documents dans différents dossiers de catégorie (représentant des catégories de documents) en fonction de la première page de chaque document.

Il peut également classer les pages individuelles d'un document dans différents dossiers. Si un document volumineux contient des documents de plusieurs pages, une fois cette classification au niveau de la page terminée, les pages individuelles devront être fusionnées pour être traitées comme des documents uniques. Par exemple, si les pages 1 et 2 d'un document hypothécaire contiennent des informations client (KYC) et les pages 3 et 4 un relevé bancaire, les pages 1 et 2 sont classées comme informations client et enregistrées dans le dossier KYC, tandis que les pages 3 et 4 sont classées comme relevés bancaires et enregistrées dans le dossier Relevés bancaires. Pour traiter les pages KYC comme un document unique, vous devrez fusionner les pages 1 et 2 stockées dans le dossier KYC. De même, pour traiter le relevé bancaire comme un document unique, vous devrez fusionner les pages 3 et 4 stockées dans le dossier Relevés bancaires.

Classificateur avancé
Ce classificateur offre les mêmes capacités que le Classificateur de documents, mais permet en outre de diviser un document en plusieurs documents et d'établir une classification au niveau du document ou de la page à l'aide de règles prédéfinies. Il requiert une licence distincte de Skilja. Nous vous recommandons d'utiliser ce classificateur uniquement lorsque le Classificateur de documents ne répond pas à vos exigences.

Pour comprendre les différences entre le Classificateur avancé et le Classificateur de documents, consultez la rubrique Comparaison entre le classificateur avancé et le classificateur de documents.