Présentation du prétraitement des documents

Notre package de préprocesseur vous permet d'optimiser les documents avant de les traiter pour l'extraction de données.

Ce package sert d'étape initiale dans le flux de travail du traitement des documents pour préparer les documents à une gestion efficace dans Document Automation.

Le package extrait le contenu tel que les codes-barres, le nombre de pages et le contenu des pages à partir de documents ou traite les fichiers image avant qu'ils ne soient consommés dans Document Automation. Le prétraitement améliore l'efficacité et la précision globales du traitement des documents, permettant une meilleure extraction des données.

Remarque : L'utilisation de ce package est facultative. Elle n'est nécessaire que lorsque vous devez améliorer la qualité des documents à traiter.

Le package de prétraitement fournit également les fonctionnalités suivantes :

Traitement de l'image
  • Concaténer les images : combine deux images dans un seul fichier.
  • Convertir les images au format PDF : convertit un fichier image en fichier PDF textuel.
  • Modifier l'image : Cette action recadre ou redimensionne un fichier image.
  • Améliorer l'image : ajoute des effets, tels que des niveaux de gris, du flou et de la netteté, à un fichier image.
  • Orienter l'image : retourne ou fait pivoter un fichier image.
Extraction de contenu
  • Obtenir des codes-barres : détecte et extrait tous les codes-barres dans un document.
  • Obtenir des informations sur le document : récupère les informations du document telles que le chemin d'accès au fichier, l'extension et le nombre de pages.
  • Contenu de la page : extrait du texte depuis une page spécifique dans un document.