Choisir un modèle d\'extraction

Automatisation de documents prend en charge différents fournisseurs d\'extraction pour répondre à une large gamme de cas d\'utilisation de traitement de documents. Pour déterminer quel fournisseur d\'extraction utiliser pour le traitement des documents, vous pouvez être amené à comparer différents fournisseurs d\'extraction ou à choisir une combinaison de plusieurs fournisseurs d\'extraction pour répondre à un cas d\'utilisation particulier.

Par exemple, pour les dossiers de demande de prêt, vous souhaiterez peut-être utiliser le fournisseur d\'extraction Automation Anywhere pour extraire certaines données telles que les formulaires W-2 et les relevés bancaires, et le fournisseur d\'extraction Google Document AI pour extraire certaines données telles que les factures et les documents d\'identité. Dans un tel scénario, l\'extraction de données à l\'aide d\'un seul des fournisseurs d\'extraction ne fournit pas une couverture complète.

Un élément essentiel pour choisir un fournisseur d\'extraction est le type de document que vous souhaitez traiter : structuré, semi-structuré ou non structuré. Pour plus d\'informations sur les types de documents, consultez la rubrique Types de document.

Documents structurés

Pour les documents structurés qui suivent une structure cohérente et une mise en page claire, nous vous recommandons d\'utiliser le modèle d\'extraction de formulaires standards dans Automatisation de documents pour l\'extraction de données. Ce modèle utilise une combinaison de capacités de reconnaissance optique de caractères (OCR) avec un modèle basé sur des modèles pour extraire des paires clé-valeur et des données de tableau à partir de documents structurés au format très cohérent, comme des formulaires ou des pièces d\'identité. Reportez-vous à la rubrique Créer des modèles personnalisés dans Automatisation de documents à l'aide de Formulaires standard.

Documents semi-structurés

Les documents semi-structurés nécessitent souvent des tests et une validation de différents modèles et fournisseurs d\'extraction pour déterminer la combinaison qui fournira les données requises. Certains cas d\'utilisation peuvent nécessiter la création de plusieurs instances d\'apprentissage avec différentes combinaisons de modèles et de fournisseurs d\'extraction pour extraire les données requises des champs et des tableaux. Ce modèle utilise une combinaison de fonctionnalités OCR avec une extraction basée sur des mots-clés, des expressions régulières et des commentaires de validation pour extraire des paires clé-valeur et des données de tableau à partir d\'un large éventail de formats.

Le tableau suivant répertorie les différents modèles d\'extraction pré-entraînés et fournisseurs disponibles dans Automatisation de documents pour le traitement de documents semi-structurés. La disponibilité des modèles d\'extraction dépend de la langue que vous sélectionnez. Lorsqu\'un modèle d\'extraction prend en charge les fournisseurs d\'extraction Automation Anywhere et Google Document AI, vous pourrez parfois souhaiter comparer les deux pour voir lequel est le meilleur pour le cas d\'utilisation ou même utiliser les deux en conjonction si nécessaire pour extraire toutes les données pertinentes.
Remarque : Utilisez le modèle générique (défini par l\'utilisateur) si vous ne voyez pas le modèle que vous souhaitez utiliser disponible dans la liste des modèles d\'extraction pré-entraînés.
Type de document Fournisseurs d\'extraction
Automation Anywhere Google Document AI
Facturation Oui Oui
Avis de réception Oui Non
Connaissement Oui Non
Liste relative aux bordereaux d\'expédition Oui Non
Reçus Non Oui
Défini par l\'utilisateur Oui Oui
Facture de services Non Oui
Lettre de transport Oui Non
Utilisation d\'un type de document défini par l\'utilisateur

Documents non structurés

Pour les documents non structurés sans format standard, mise en page fixe ou avec des données sans étiquettes comme les contrats, nous vous recommandons d\'utiliser le modèle d\'extraction de documents non structurés dans Automatisation de documents pour l\'extraction de données. L\'extraction de documents non structurés repose sur des modèles IA générative qui peuvent comprendre le sens sémantique et analyser des formats de documents complexes.

Remarque : Pour encore plus de flexibilité, des analyseurs tiers peuvent également être intégrés à l\'aide de la fonctionnalité Configurer l\'analyseur en plus des options décrites ci-dessus. Reportez-vous à la rubrique Intégration d'un analyseur tiers dans une instance d'apprentissage