Créer une instance d'apprentissage avec IA générative pour les documents non structurés

Aidez-vous de cette rubrique pour créer une instance d'apprentissage à l'aide de la fonctionnalité IA générative (GenAI) afin d'extraire des données de documents non structurés, tels que des contrats, des accords, des rapports, des lettres et des e-mails.

Grâce à IA générative, vous pouvez créer une instance d'apprentissage pour extraire des données à partir de documents non structurés sans former l'instance d'apprentissage. Cette fonctionnalité est essentielle pour un traitement rapide et précis des documents. Voici les étapes de création d'une instance d'apprentissage avec la fonctionnalité IA générative. Celle-ci vous permettra d'extraire avec précision les données à partir de documents non structurés.

Prérequis

Dans une société, un développeur professionnel effectue généralement les tâches suivantes :
  • créer, modifier et supprimer des instances d'apprentissage ;
  • charger des documents à des fins de traitement et de test ;
  • archiver et extraire des instances d'apprentissage de dossiers privés vers des dossiers publics.

Exigence de licence : licence Bot Creator pour effectuer les tâches susmentionnées.

Rôles et autorisations attribués :
  • AAE_IQBot Services ou AAE_IQBot Admin
  • AAE_Basic

Procédure

  1. Connectez-vous à la Control Room et accédez à Gérer > Instances d'apprentissage, puis cliquez sur le bouton Créer une instance d'apprentissage pour démarrer la création d'une nouvelle instance d'apprentissage.
  2. Ensuite, donnez un nom unique à cette instance d'apprentissage afin de la retrouver plus facilement dans la liste Instances d'apprentissage, puis sélectionnez les autres options, comme suit :
    Créer une instance d'apprentissage pour les documents non structurés avec la fonctionnalité d'IA générative
    1. Description (facultatif) : utilisez ce champ facultatif pour ajouter une description significative et résumer l'utilisation de l'instance d'apprentissage.
    2. Type de document : document non structuré
      En sélectionnant cette option, la fonctionnalité d'extraction de données pilotée par l'IA générative est activée. Cette option est activée par défaut pour les types de documents non structurés.
    3. Langue : Anglais
      Actuellement, seul l'anglais est pris en charge.
    4. Paramètres régionaux : selon les paramètres régionaux appliqués aux documents.
      Les paramètres régionaux sont sélectionnés en fonction de votre langue et du pays d'origine du document.
    5. Fournisseur : Automation Anywhere (défini par l'utilisateur)
      Cette valeur est sélectionnée par défaut, car nous n'offrons actuellement que cette option.
    6. Fournisseur OCR : OCR Google Vision ou Reconnaissance de texte ABBYY
      La prise en charge d'Reconnaissance de texte ABBYY est une nouveauté de la version v32.
  3. Cliquez sur Suivant pour commencer à créer des champs de formulaire et de tableau pour l'instance d'apprentissage.
    Pour en savoir plus sur la création de champs de formulaire et de tableau, voir : Créer une instance d'apprentissage dans Document Automation, étapes 10 à 12.
  4. Cliquez sur Ajouter un champ pour commencer à ajouter des champs pour chaque point de données ou entité pour lesquels vous souhaitez extraire des données à partir de vos documents.
  5. Ensuite, ajoutez un nom de champ, qui doit être propre au point de données que vous souhaitez extraire, ainsi qu'une étiquette de champ, qui sert à créer une requête de recherche par défaut, puis sélectionnez Type de données pour définir la structure de données de la valeur du champ.
    Vous pouvez sélectionner dans la liste déroulante les options de valeur de type Texte, Chiffre, Date ou Données d'adresse.
  6. Lorsque vous utilisez la fonctionnalité IA générative, le champ Confiance est grisé. Ce champ peut être obligatoire ou facultatif.
  7. Dans la section Requête de recherche pour le modèle d'IA générative, vous pouvez utiliser la requête générée par le système ou ajouter une requête personnalisée.
    Par exemple, pour un champ Coût total, la requête IA générative par défaut serait la suivante : « Quel est le coût total ? ». Vous pouvez personnaliser la requête de la manière suivante : « Quel est le coût total ? Extraire la valeur sans la devise ». Cette requête permet d'extraire le coût total sans les informations relatives à la devise.
    Créer des champs de tableau pour une instance d'apprentissage dans Document Automation avec la fonctionnalité IA générative
  8. À l'étape suivante, définissez les Règles au niveau du champ et les Règles au niveau du document pour les champs de formulaire et de tableau.
    Voir Créer une instance d'apprentissage dans Document Automation et Références pour la création d'une instance d'apprentissage dans Document Automation pour en savoir plus sur la création de champs de tableau, et l'ajout de règles au niveau du champ et de règles au niveau du document.
  9. À partir de la version 32, vous pouvez définir plusieurs tableaux au cours du processus de définition des champs de tableau. En fonction de votre cas d'utilisation, vous pouvez définir des tableaux supplémentaires en cliquant sur l'icône Ajouter un tableau en regard de la liste déroulante du champ tableau.
  10. Cliquez sur Créer pour terminer la création de l'instance d'apprentissage.

Étapes suivantes

  1. Publiez l'instance d'apprentissage dans le référentiel public pour l'utiliser en mode public et extraire des données de documents réels, et pour que les validateurs puissent valider manuellement les documents. Reportez-vous à la rubrique Publication de l'instance d'apprentissage en production.
  2. Sur la page de liste Gérer > Instances d'apprentissage, identifiez l'instance d'apprentissage que vous venez de créer et de publier, puis cliquez sur Traiter pour commencer à charger les documents à des fins de traitement et d'extraction de données. Reportez-vous à la rubrique Traiter les documents dans Document Automation.
  3. Ouvrez le document CSV contenant les données extraites pour le comparer au document traité afin de confirmer que les champs de recherche activés par IA générative ont permis d'extraire des données avec une grande précision.