Créer une instance d'apprentissage avec IA générative pour les documents semi-structurés

Aidez-vous de cette rubrique pour créer une instance d'apprentissage à l'aide de la fonctionnalité IA générative (GenAI) afin d'extraire des données de documents semi-structurés, comme des factures, des commandes définies par l'utilisateur et des commandes d'achat ou des documents relatifs à la chaîne d'approvisionnement, tels que : avis de réception, connaissement, bordereau d'expédition et lettre de transport.

Pour extraire des données à partir de documents semi-structurés, les utilisateurs peuvent utiliser la capacité IA générative en plus de la fonction de retour d'information de validation de l'utilisateur prête à l'emploi en cochant l'option Améliorer la précision par la validation lors de la création d'une instance d'apprentissage. Cela garantit une extraction plus qualitative et plus cohérente des données avec une précision prédéfinie. Voici les étapes de création d'une instance d'apprentissage avec la fonctionnalité IA générative. Celle-ci vous permettra d'extraire des données précises à partir de documents semi-structurés.

Prérequis

Dans une société, un développeur professionnel effectue généralement les tâches suivantes :
  • créer, modifier et supprimer des instances d'apprentissage ;
  • charger des documents à des fins de traitement et de test ;
  • archiver et extraire des instances d'apprentissage de dossiers privés vers des dossiers publics.

Exigence de licence : licence Bot Creator pour effectuer les tâches susmentionnées.

Rôles et autorisations attribués :
  • AAE_IQBot Services ou AAE_IQBot Admin
  • AAE_Basic

Procédure

  1. Connectez-vous à la Control Room et accédez à Gérer > Instances d'apprentissage, puis cliquez sur le bouton Créer une instance d'apprentissage pour démarrer la création d'une nouvelle instance d'apprentissage.
  2. Ensuite, donnez un nom unique à cette instance d'apprentissage afin de la retrouver plus facilement dans la liste Instances d'apprentissage, puis sélectionnez les autres options, comme suit :
    Créer une instance d'apprentissage pour les documents semi-structurés avec la fonctionnalité d'IA générative
    1. Description (facultatif) : utilisez ce champ facultatif pour ajouter une description significative et résumer l'utilisation de l'instance d'apprentissage.
    2. Type de document : effectuez votre choix dans une liste de documents semi-structurés disponibles, par exemple : factures, définis par l'utilisateur, avis de réception, connaissements, bordereaux d'expédition et lettres de transport.
      Lorsque vous sélectionnez cette option, vous bénéficiez de la fonctionnalité d'extraction de données pilotée par l'IA générative en plus de l'option prête à l'emploi Amélioration de la précision par validation proposée par défaut et basée sur les commentaires envoyés au système en fonction des modifications que l'utilisateur apporte au Validateur pendant le processus de validation. Cette fonctionnalité est essentielle pour les documents semi-structurés, car elle garantit une meilleure extraction des données grâce au retour d'information de validation de l'utilisateur et à l'IA générative.
    3. Langue : Anglais
      Actuellement, seul l'anglais est pris en charge.
    4. Paramètres régionaux : selon les paramètres régionaux appliqués aux documents.
      Les paramètres régionaux sont sélectionnés en fonction de votre langue et du pays d'origine du document.
    5. Fournisseur : Automation Anywhere (défini par l'utilisateur)
    6. Fournisseur OCR : OCR Google Vision ou Reconnaissance de texte ABBYY
      Vous pouvez sélectionner l'une des deux options Reconnaissance de texte prises en charge.
  3. Cliquez sur Suivant pour commencer à créer des champs de formulaire et de tableau pour l'instance d'apprentissage. À partir de la version 32, la fonctionnalité IA générative est disponible pour les champs de formulaire et de tableau. Vous pouvez utiliser la fonctionnalité GenAI, outre la prise en charge des alias personnalisés par défaut. Consultez l'étape 9 de la rubrique Créer une instance d'apprentissage dans Document Automation pour en savoir plus sur l'ajout d'alias pour un champ.
    Document Automation utilise par défaut des alias personnalisés et la fonctionnalité Commentaires pour les documents semi-structurés. Les requêtes concernant les champs avec un seuil de confiance inférieur et les données de champ manquantes sont transmises à IA générative à des fins d'extraction.
    Instance d'apprentissage pour les documents semi-structurés avec une requête de recherche compatible avec IA générative
  4. Il est possible d'utiliser la fonctionnalité IA générative pour les champs de tableau en vue d'identifier les colonnes, et d'améliorer ainsi l'extraction des données en se concentrant sur les colonnes de tableau. Cette fonctionnalité offre une valeur ajoutée significative pour l'extraction de tableaux. Fonctionnalité prête à l'emploi dans Document Automation, GenAI peut identifier une colonne de tableau spécifique en fonction de la requête de recherche définie sans avoir besoin d'entraîner des documents. Vous pouvez donc utiliser la requête de recherche compatible avec GenAI pour identifier la colonne, puis extraire des données spécifiques d'un champ de cette colonne à l'aide du modèle d'extraction Document Automation.
  5. Ensuite, ajoutez un nom de champ, qui doit être propre au point de données que vous souhaitez extraire, ainsi qu'une étiquette de champ, qui sert à créer une requête de recherche par défaut, puis sélectionnez Type de données pour définir la structure de données de la valeur du champ.
    Vous pouvez sélectionner dans la liste déroulante les options de valeur de type Texte, Chiffre, Date ou Données d'adresse. Pour en savoir plus sur la création de champs de formulaire, consultez la rubrique : Créer une instance d'apprentissage dans Document Automation, étape 10.
  6. Vous pouvez définir les champs de formulaire et de tableau sur Obligatoire ou Facultatif. Lorsque vous utilisez la fonctionnalité IA générative, le champ Confiance est grisé.
  7. Vous pouvez également utiliser la fonctionnalité Extraire un champ à l'aide d'un modèle pour l'extraction.
  8. Dans la section Requête de recherche pour le modèle d'IA générative, vous pouvez utiliser la requête générée par le système ou ajouter une requête personnalisée.
    Par exemple, pour un champ d'adresse, la requête IA générative par défaut serait la suivante : Quelle est l'adresse personnelle ?. Vous pouvez personnaliser la requête comme suit : Quelle est l'adresse personnelle avec la ville et l'État ?.
  9. À l'étape suivante, définissez les Règles au niveau du champ et les Règles au niveau du document pour les champs de formulaire et de tableau, puis cliquez sur Créer pour terminer la création de l'instance d'apprentissage. Pour en savoir plus sur la définition du formulaire et des règles au niveau du document, consultez la rubrique : Règles de validation dans Document Automation.

Étapes suivantes

  1. Publiez l'instance d'apprentissage dans le référentiel public pour l'utiliser en mode public et extraire des données de documents réels, et pour que les validateurs puissent valider manuellement les documents. Reportez-vous à la rubrique Publication de l'instance d'apprentissage en production.
  2. Sur la page de liste Gérer > Instances d'apprentissage, identifiez l'instance d'apprentissage que vous venez de créer et de publier, puis cliquez sur Traiter pour commencer à charger les documents à des fins de traitement et d'extraction de données. Reportez-vous à la rubrique Traiter les documents dans Document Automation.
  3. Ouvrez le document CSV contenant les données extraites pour le comparer au document traité afin de confirmer que les champs de recherche activés par l'IA générative ont permis d'extraire des données avec une grande précision.