Choisir un modèle d\'extraction
- Dernière mise à jour2024/10/18
Choisir un modèle d\'extraction
Automatisation de documents prend en charge différents fournisseurs d\'extraction pour répondre à une large gamme de cas d\'utilisation de traitement de documents. Pour déterminer quel fournisseur d\'extraction utiliser pour le traitement des documents, vous pouvez être amené à comparer différents fournisseurs d\'extraction ou à choisir une combinaison de plusieurs fournisseurs d\'extraction pour répondre à un cas d\'utilisation particulier.
Par exemple, pour les dossiers de demande de prêt, vous souhaiterez peut-être utiliser le fournisseur d\'extraction Automation Anywhere pour extraire certaines données telles que les formulaires W-2 et les relevés bancaires, et le fournisseur d\'extraction Google Document AI pour extraire certaines données telles que les factures et les documents d\'identité. Dans un tel scénario, l\'extraction de données à l\'aide d\'un seul des fournisseurs d\'extraction ne fournit pas une couverture complète.
Un élément essentiel pour choisir un fournisseur d\'extraction est le type de document que vous souhaitez traiter : structuré, semi-structuré ou non structuré. Pour plus d\'informations sur les types de documents, consultez la rubrique Types de document.
Documents structurés
Pour les documents structurés qui suivent une structure cohérente et une mise en page claire, nous vous recommandons d\'utiliser le modèle d\'extraction de formulaires standards dans Automatisation de documents pour l\'extraction de données. Ce modèle utilise une combinaison de capacités de reconnaissance optique de caractères (OCR) avec un modèle basé sur des modèles pour extraire des paires clé-valeur et des données de tableau à partir de documents structurés au format très cohérent, comme des formulaires ou des pièces d\'identité. Reportez-vous à la rubrique Créer des modèles personnalisés dans Automatisation de documents à l'aide de Formulaires standards.
Documents semi-structurés
Les documents semi-structurés nécessitent souvent des tests et une validation de différents modèles et fournisseurs d\'extraction pour déterminer la combinaison qui fournira les données requises. Certains cas d\'utilisation peuvent nécessiter la création de plusieurs instances d\'apprentissage avec différentes combinaisons de modèles et de fournisseurs d\'extraction pour extraire les données requises des champs et des tableaux. Ce modèle utilise une combinaison de fonctionnalités OCR avec une extraction basée sur des mots-clés, des expressions régulières et des commentaires de validation pour extraire des paires clé-valeur et des données de tableau à partir d\'un large éventail de formats.
Type de document | Fournisseurs d\'extraction | |
---|---|---|
Automation Anywhere | Google Document AI | |
Facturation | Oui | Oui |
Avis de réception | Oui | Non |
Connaissement | Oui | Non |
Liste relative aux bordereaux d\'expédition | Oui | Non |
Reçus | Non | Oui |
Défini par l\'utilisateur | Oui | Oui |
Facture de services | Non | Oui |
Lettre de transport | Oui | Non |
Documents non structurés
Pour les documents non structurés sans format standard, mise en page fixe ou avec des données sans étiquettes comme les contrats, nous vous recommandons d\'utiliser le modèle d\'extraction de documents non structurés dans Automatisation de documents pour l\'extraction de données. L\'extraction de documents non structurés repose sur des modèles IA générative qui peuvent comprendre le sens sémantique et analyser des formats de documents complexes.