Traiter les documents dans Édition Community

Téléchargez des exemples de factures pour entraîner l'instance d'apprentissage, vérifier les données extraites et corriger les erreurs de validation.

Prérequis

  • Si vous ne l'avez pas déjà fait, consultez Créer une instance d'apprentissage dans Édition Community.
  • Assurez-vous que chaque fichier ne dépasse pas 2 Mo.
  • Assurez-vous que les exemples de factures se présentent dans les types de documents pris en charge suivants :
    • PDF
    • JPG
    • JPEG
    • PNG
    • TIF
    • TIFF

Chargez les exemples de factures vers une instance d'apprentissage pour tester les fonctionnalités d'extraction de données de l'instance d'apprentissage. Si un document nécessite une validation manuelle, le système l'envoie à Validator où vous devez saisir manuellement les données correctes.

Procédure

  1. Chargez les documents vers l'instance d'apprentissage :
    Remarque : Édition Community peut traiter un maximum de cinq documents à la fois. Vous devez attendre qu'un document ait bien été traité (et validé si nécessaire) pour télécharger un autre document.
    1. Cliquez sur Traiter les documents.
    2. Dans la fenêtre Traiter les documents, cliquez sur Parcourir pour sélectionner les fichiers à charger.
    3. Dans le champ Télécharger les données vers saisissez le chemin d'accès au fichier où les données extraites sont éditées dans un fichier CSV.
    4. Cliquez sur Traiter les documents.
      La fenêtre Bot Runner s'ouvre. La fenêtre disparaît lorsque le traitement des documents est terminé. Actualisez le tableau Instances d'apprentissage pour afficher les métriques mises à jour.

S'il y a une valeur à côté de l'option Valider les documents, vous devez valider manuellement les champs contenant des erreurs. Sinon, passez à l'étape 2b pour examiner les données extraites.

  1. Corriger les erreurs de validation
    1. Cliquez sur Valider les documents.
      La gestion des tâches Automation Co-Pilot s'ouvre dans un nouvel onglet avec le premier document en échec dans la file d'attente. Pour découvrir l'interface utilisateur du validateur, consultez la rubrique Utilisation du validateur de gestionnaire de tâches Automation Co-Pilot pour Automatisation de documents.
    2. Examinez chaque champ pour vérifier le type de données et la valeur extraite.
      Automatisation de documents prend en charge les types de données suivants : texte, chiffre, date, adresse et case à cocher.
      Dans la liste déroulante du panneau droit, vous pouvez aussi sélectionner Afficher les champs qui nécessitent une validation.
      Remarque : Lorsque des documents sont en attente de validation, si vous modifiez l'instance d'apprentissage, cliquez sur Retraiter pour réessayer l'extraction.

      Le retraitement des documents n'affecte pas la métrique des documents chargés.

    3. Mettez à jour les champs contenant des erreurs.
      Cliquez sur le champ ou dessinez un cadre autour des valeurs que vous voulez extraire.
      En ce qui concerne les modèles pré-entraînés Automation Anywhere, vous pouvez configurer l'instance d'apprentissage pour extraire des valeurs spécifiques dans un champ et ignorer les autres. Pour plus d'informations, consultez Extraction des données dans Automatisation de documents.
      • Pour ignorer un document sans en corriger les erreurs, cliquez sur Ignorer pour passer au document suivant dans la file d'attente de validation.
      • Pour supprimer un document qui ne peut pas être traité, cliquez sur Marquer comme non valide.
    4. Après avoir apporté les corrections nécessaires, cliquez sur Soumettre afin de terminer le traitement du document.
      Le document suivant dans la file d'attente apparaît. Lorsque tous les documents sont corrigés, le système affiche un message indiquant qu'il n'y a plus de tâches disponibles.
    5. Fermez l'onglet pour revenir à la page Instances d'apprentissage.
  2. Vérifiez les résultats de sortie :
    1. Ouvrez le fichier dans le dossier Success contenant les données extraites et examinez les résultats pour vous assurer qu'ils correspondent à votre cas d'utilisation.
      Les formulaires Microsoft renvoient les valeurs extraites (données OCR) au format JSON, comme GUID_0-MSFormTableResult.json. Outre les données de document extraites dans le fichier CSV <<GUID>>_FileName, le dossier Success contient également les données de tableau extraites dans un autre fichier CSV. En fonction du nombre de tableaux dans le document, il peut exister différents fichiers CSV pour chaque tableau. Par exemple, <<GUID_PAGE_NUMBER-Table_FILENAME_PAGENUMBER_TABLENUMBER.

      Grâce à des données de tableau distinctes, vous pouvez comparer les données extraites avec les données du moteur Microsoft dans le fichier GUID_0-MSFormTableResult.json.

    2. Facultatif : Examinez le tableau de bord Instance d'apprentissage.
      Le tableau de bord affiche le nombre total de documents chargés et le nombre de documents en attente de validation.

Étapes suivantes

Félicitations ! Vous avez maintenant traité avec succès vos premiers documents dans la version Édition Community de Automatisation de documents.