Traiter les documents dans Automatisation de documents
- Dernière mise à jour2024/08/21
Traiter les documents dans Automatisation de documents
Chargez des exemples de factures pour tester l'instance d'apprentissage, vérifier les données extraites et corriger les erreurs de validation.
Prérequis
- Si vous ne l'avez pas déjà fait, consultez la rubrique Créer une instance d\'apprentissage dans Automatisation de documents.
- Vérifiez que votre périphérique est connecté à la Control Room : Installer l'Agent de robot et enregistrer le périphérique
- Si l'instance d'apprentissage utilise un modèle Google Document AI et que vous n'avez pas acheté de licences Google Document AI par l'intermédiaire d'Automation Anywhere, vous devez fournir vos informations d'identification Google Document AI au robot d'extraction. Consultez la rubrique Configuration de la clé pour Google Document AI.
- Si l'instance d'apprentissage utilise un modèle Automation Anywhere, assurez-vous que chaque fichier ne dépasse pas 50 Mo.
Si l'instance d'apprentissage utilise un modèle Google Document AI, assurez-vous que chaque fichier ne dépasse pas 20 Mo et contient 5 pages maximum.
- Assurez-vous que les exemples de documents se présentent dans l'un des types de documents pris en charge suivants :
- JPG
- JPEG
- PNG
- TIF
- TIFF
- Le format de sortie par défaut pour les données extraites est le fichier CSV. Pour convertir la sortie en JSON, consultez la rubrique Changement du format de sortie de CSV à JSON.
Effectuez les étapes suivantes pour charger des exemples de factures vers l'instance d'apprentissage afin de tester les capacités d'extraction de données de l'instance d'apprentissage.
Procédure
S'il y a une valeur à côté du lien Valider les documents, vous devez valider manuellement les champs du document. Sinon, passez à l'étape 3.
Étapes suivantes
Créez un robot qui charge les documents d'un dossier source vers l'instance d'apprentissage. Ensuite, publiez les ressources de l'instance d'apprentissage (processus, formulaire, et robots) dans le référentiel public afin que l'instance d'apprentissage puisse être utilisée en mode public afin d'extraire des données de documents réels, et que les validateurs puissent valider manuellement les documents : Publication de l'instance d'apprentissage en production