Présentation de l\'extraction de document
- Dernière mise à jour2024/12/16
Présentation de l\'extraction de document
Le processus d\'extraction de document vous permet de définir des champs de formulaire et de tableau spécifiques que vous souhaitez extraire de vos documents.
Le système extrait ensuite automatiquement les données spécifiées de ces documents pour une analyse plus approfondie et une intégration dans les flux de travail en aval. Ce processus améliore l\'efficacité, la précision et la productivité globale du traitement des données.
Lorsqu\'un utilisateur crée une nouvelle instance d\'apprentissage, la Control Room crée automatiquement un dossier portant le même nom que l\'instance d\'apprentissage à l\'intérieur du dossier . Dans ce dossier, la Control Room crée les deux robots suivants :
- Robot d\'extraction : extrait les données des champs définis dans les documents chargés.
- Robot de téléchargement : télécharge les données extraites dans un dossier spécifique sur le périphérique ou sur un réseau partagé en fonction de l\'option de résultats de sortie configurée dans le robot de téléchargement.
Le package Extraction de document est utilisé pour extraire des données et télécharger les données extraites des documents vers un emplacement spécifique.
Le package Extraction de document fournit également les fonctionnalités suivantes :
- Différents types de documents : traitez une large gamme de types de documents pour divers cas d\'utilisation de traitement de documents. Vous pouvez intégrer vos analyseurs d\'extraction de données personnalisés pour exploiter vos modèles pré-entraînés et spécifiques au domaine pour vos flux de travail de traitement de documents.
- Règles de validation : définissez différentes conditions, telles que la correspondance de modèles ou les contrôles d\'égalité. Lorsque ces conditions sont remplies, vous pouvez rapidement prendre des mesures pour signaler des erreurs ou des avertissements, nettoyer ou remplacer des valeurs ou en définir de nouvelles. Ces règles garantissent l\'exactitude des données extraites dans plusieurs champs de vos documents.
- Fournisseurs IA générative : extrayez des données à partir de différents types de documents en utilisant des modèles pré-entraînés provenant de fournisseurs d\'IA générative tels que Azure OpenAI ou Anthropic. Les utilisateurs peuvent définir une seule fois des requêtes de recherche lors de la configuration des champs. Pour chaque document traité, les données seront ensuite extraites sans aucune configuration supplémentaire.
- Commentaires de validation : fournissez des commentaires sur la précision des données extraites en vérifiant et en corrigeant les données extraites. Ce processus crée une boucle de commentaires qui aide le système à améliorer continuellement la précision des données.
- Validateur de Copilote d\'automatisation : fournit une interface conviviale pour mettre en évidence les erreurs ou les avertissements dans les documents. Le validateur affiche un contour rouge pour les champs qui nécessitent une validation. Les utilisateurs peuvent valider les données de ces champs et soumettre les documents pour retraitement.
- Intégration avec Automation 360 : intégrez de manière transparente les données extraites dans divers flux de travail pour un traitement ultérieur dans Automation 360.