Créer une instance d'apprentissage à l'aide de Google CDE

Une instance d'apprentissage est une structure qui contient des informations telles que le type de document, la langue et les champs à extraire. Après avoir créé un processeur d'extraction personnalisé, vous devez créer une instance d'apprentissage pour extraire les données des documents.

Prérequis

  • Assurez-vous d'avoir créé et entraîné avec succès un processeur Google Custom Document Extractor (CDE).
  • Assurez-vous que votre Control Room dispose de la licence de produit Espace de travail documentaire (nombre de pages).
  • Assurez-vous d'avoir configuré le BYOK. Pour plus d'informations, consultez Configurer BYOK (Bring Your Own Key) pour Google CDE.

Pour intégrer un nouveau processeur dans Google Document AI, l'étape cruciale est la création d'une instance d'apprentissage. Il s'agit d'utiliser le fournisseur comme option Google Document AI (défini par l'utilisateur). En créant une instance d'apprentissage à l'aide de cette option, les utilisateurs peuvent définir des champs de formulaire et de tableau dont les noms correspondent à ceux présents dans le processeur.
Remarque :
  • Actuellement, Google Document AI prend en charge l'extraction d'un seul tableau.
  • La fonctionnalité de case à cocher (en mode aperçu) peut entraîner une extraction incohérente pour les champs de case à cocher, ce qui peut donner des résultats incohérents. Dans ce cas, si le système n'est pas en mesure d'extraire précisément la valeur du champ de case à cocher, la valeur sera étiquetée comme Introuvable.

Procédure

  1. À partir de la page d'accueil de la Control Room, accédez à Gérer > Instances d'apprentissage > Créer une instance d'apprentissage.
    La fenêtre Créer une instance d'apprentissage s'ouvre dans un nouvel onglet.
  2. Ajoutez un nom pour la nouvelle instance d'apprentissage à créer.
  3. Dans le menu déroulant Type de document, sélectionnez Défini par l'utilisateur.
  4. Dans le menu Fournisseur, sélectionnez Google Document AI (défini par l'utilisateur).
  5. Sélectionnez le champ Tableau ou Formulaires.
  6. Créez de nouveaux champs avec des noms identiques à ceux utilisés dans le processeur Google CDE.
    Remarque : Lorsque vous créez de nouveaux champs, veillez à ce que leur nom corresponde aux étiquettes de schéma utilisées dans le processeur Google. Cela s'applique à la fois aux champs de formulaire et aux champs de tableau.
  7. Cliquez sur Créer.

    Lorsqu'une nouvelle instance d'apprentissage est créée, la Control Room crée un dossier portant le même nom que celui de l'instance d'apprentissage dans le dossier Automatisation > Espace de travail de document.

  8. Mettez à jour le robot d'extraction de l'instance d'apprentissage avec le compte de service et l'URL du point de terminaison du processeur.
    1. Ouvrez le robot pour l'instance d'apprentissage à partir de Robot > Processus IQ Bot > {LI name} > {LI name}_extractionbot.
    2. Choisissez une consigne et une clé pour le coffre des informations d'identification. Pour plus d'informations, consultez Configurer BYOK (Bring Your Own Key) pour Google CDE.
    3. Copiez l'URL du point de terminaison de prédiction à partir du processeur Google CDE.
      Point de terminaison de prédiction dans Google Document AI
    4. Collez l'URL copiée dans l'URL du point de terminaison de Document AI pour le processeur de documents.

      URL du point de terminaison de Document AI pour le processeur de documents

Étapes suivantes

Chargez des documents vers l'instance d'apprentissage, corrigez les erreurs de validation et vérifiez les données extraites. Pour plus d'informations, consultez Traiter les documents dans Document Automation.