Créer une instance d\'apprentissage dans Automatisation de documents

Commencez à traiter les documents en créant une instance d\'apprentissage afin d\'extraire des données de différents types de documents pris en charge. Une instance d\'apprentissage est une structure qui contient des informations telles que le type de document, la langue, les champs à extraire, et bien plus.

Prérequis

  • Pour créer une instance d\'apprentissage, vous devez être un utilisateur Learning instance creator. Reportez-vous à la rubrique Utilisateurs de Automatisation de documents.
  • Pour les types de documents qui prennent en charge la reconnaissance optique des caractères, la reconnaissance optique des caractères par défaut est Moteur FineReader ABBYY.Vous pouvez également créer une instance d\'apprentissage pour traiter les documents à l\'aide de OCR Google Vision.
  • Pour le type de document Formulaires standard, assurez-vous d\'avoir créé un modèle d\'extraction personnalisé. Reportez-vous à la rubrique Créer un modèle d\'extraction personnalisé à l\'aide de Formulaires standard.

Regardez cette vidéo pour découvrir le processus de bout en bout complet de création d\'une instance d\'apprentissage :

Procédure

  1. À partir de la page d\'accueil de la Control Room, accédez à IA > Document Automation , et cliquez sur Créer une instance d\'apprentissage.
  2. Saisissez un nom et une description pour l\'instance d\'apprentissage.
    Automatisation de documents n\'autorise pas la duplication des noms d\'instances d\'apprentissage. Le nom que vous fournissez doit donc être unique.
  3. Sélectionnez un type de document approprié.
    Remarque : Utilisez le type de document Défini par l\'utilisateur pour traiter des documents visuellement similaires aux factures, tels que les bons de commande et les commandes de vente, qui contiennent des paires clé-valeur et une structure de tableau. Dans ce type de document, vous créez et configurez tous les champs de formulaire et de tableau.
  4. Sélectionnez la langue.
    Pour plus d\'informations sur les langues prises en charge dans Automatisation de documents, voir Langues prises en charge dans Automatisation de documents.

    Si vous sélectionnez un type de document utilisé lors de la configuration de l\'analyseur à l\'étape 3, la langue sélectionnée lors de la configuration de l\'analyseur est automatiquement sélectionnée. En outre, la liste des paramètres régionaux affiche les options linguistiques en fonction de la langue sélectionnée automatiquement.

  5. Sélectionnez un fournisseur.
    Si vous avez sélectionné la langue anglaise à l\'étape 4, Automation Anywhere (Pré-entraîné) est sélectionné automatiquement.

    Si vous sélectionnez un type de document utilisé lors de la configuration de l\'analyseur à l\'étape 3, l\'analyseur (tiers) configuré est automatiquement sélectionné comme fournisseur.

  6. Facultatif : Sélectionnez le fournisseur ROC. Par défaut, Automatisation de documents traite les documents dans Moteur FineReader ABBYY.
    Les utilisateurs avec une Control Room dans le cloud peuvent choisir de traiter les documents dans OCR Google Vision.
  7. Facultatif : Vous pouvez utiliser l\'option Amélioration de la précision à l\'aide de la validation pour envoyer des commentaires au système afin d\'améliorer les résultats de l\'extraction. Pour plus d\'informations, voir Amélioration de la précision de l\'extraction par la validation.
    Remarque : L\'option Amélioration de la précision à l\'aide de la validation est disponible uniquement pour les types de documents sélectionnés.
  8. Facultatif : Sélectionnez l\'option Extraction de données optimisée par l\'IA générative pour utiliser les capacités IA générative pour l\'extraction. Pour plus d\'informations, consultez Automatisation de documents - Extraction de données à l\'aide de l\'IA générative.
    Sélectionnez l\'un des fournisseurs d\'IA générative suivants :
    Remarque :
    • Pour utiliser l\'option d\'extraction de données pilotée par l\'IA générative, assurez-vous d\'utiliser la Extraction de document package version 3.31.16 ou ultérieure. Reportez-vous à la rubrique Mises à jour du Extraction de document package.
    • L\'option Extraction de données pilotée par l\'IA générative est disponible uniquement pour les types de documents sélectionnés. Pour certains types de documents, l\'option Extraction de données pilotée par l\'IA générative est activée par défaut et ne peut pas être désactivée. Vous pouvez uniquement choisir le fournisseur IA générative pour ces types de documents.
    • Lorsque vous passez d\'une version précédente à la version v.33 ou à une version ultérieure, Open AI est défini comme fournisseur d\'extraction de données par défaut.
    • Lorsque vous sélectionnez Anthropic comme fournisseur d\'extraction de données dans une instance d\'apprentissage et que vous ne configurez pas les paramètres Anthropic requis dans le robot d\'extraction correspondant, une erreur s\'affiche lors du traitement des documents.
    • Si vous avez sélectionné le fournisseur Anthropic pour une instance d\'apprentissage et que vous n\'avez pas correctement configuré les paramètres Anthropic ou avez sélectionné un fournisseur différent dans le robot d\'extraction correspondant, une erreur s\'affiche lors du traitement des documents.
    • Si vous avez traité des documents en utilisant OpenAI et que vous êtes ensuite passé à Anthropic pour l\'extraction de données, seuls les documents qui seront traités après le passage à Anthropic utiliseront Anthropic pour l\'extraction de données. Pour les documents traités précédemment, les données extraites seraient utilisées avec OpenAI.
    • Open AI: OpenAIfournit un accès aux puissants modèles linguistiques d\'Open AI pour la génération de contenu, la synthèse, la compréhension d\'images, la recherche sémantique et la traduction du langage naturel en code. Ce fournisseur est disponible sous forme de licence intégrée (aucune licence supplémentaire requise) et de licence BYOL (Bring Your Own License). Si vous utilisez BYOL, assurez-vous de configurer les paramètres supplémentaires pour OpenAI dans l\'extraction robot afin d\'utiliser ce fournisseur. Reportez-vous à la rubrique action Extraire des données.
    • Anthropic : Vous pouvez désormais utiliser les modèles Anthropic IA générative disponibles via AWS et GCP pour l\'extraction de données dans Automatisation de documents. Cette offre vous permet de choisir le modèle d\'IA générative en fonction du fournisseur cloud certifié par votre société.

      Anthropic comprend les fonctionnalités suivantes :

      • Traitement efficace des documents volumineux non structurés
      • Peut gérer des documents en anglais et dans d\'autres langues
      • Traitement de documents plus rapide avec une meilleure précision d\'extraction des données

      Si vous utilisez BYOL, vous devez configurer le modèle Anthropic Claude sur le service Google Vertex AI ou Amazon Bedrock, puis configurer les paramètres supplémentaires dans le robot d\'extraction pour utiliser ce fournisseur. Reportez-vous à la rubrique action Extraire des données.

    Création d\'une instance d\'apprentissage dans Automatisation de documents
  9. Cliquez sur Suivant.

Nous vous recommandons d\'ouvrir un exemple de document à côté de la fenêtre Control Room pendant que vous configurez les champs de formulaire et de tableau.

Remarque :
  • Un champ de formulaire est un type de champ qui n\'apparaît qu\'une seule fois dans un document.
  • Un champ de tableau est un type de champ qui se répète dans tout un document, généralement sous forme d\'un tableau.

  1. Configurez les champs de formulaire et de tableau pour l\'extraction. Pour plus d\'informations, voir .
    1. Cliquez sur un champ pour ouvrir l\'éditeur de champs. Pour plus d\'informations, consultez .
    2. Passez la souris sur l\'icône de menu située à droite d\'un champ pour accéder aux flèches haut/bas.
    3. Utilisez les flèches pour réorganiser l\'ordre des champs pour une validation manuelle plus efficace.
      L\'ordre des champs n\'a pas d\'impact sur l\'extraction.
    Pour en savoir plus sur les autres attributs de champ, voir .
  2. Cliquez sur Ajouter un champ et spécifiez les détails des champs tels que le nom du champ, l\'étiquette du champ, la confiance, le type de données, le format date/nombre, etc. Pour plus d\'informations, voir .
    L\'image suivante montre les champs de formulaire et de tableau configurés dans une instance d\'apprentissage :
    Champs de formulaire d\'une instance d\'apprentissage

    Champs de tableau d\'une instance d\'apprentissage et ajout d\'une table personnalisée au niveau de l\'instance d\'apprentissage
    Remarque : L\'option Ajouter un champ n\'est pas disponible pour le type de document Reçus.
  3. Facultatif : Dans l\'onglet Champs de tableau, cliquez sur l\'icône + pour ajouter un tableau personnalisé au niveau de l\'instance d\'apprentissage.
    1. Donnez un nom au tableau et cliquez sur Ajouter.
    2. Cliquez sur Ajouter un champ et spécifiez les détails des champs tels que le nom du champ, l\'étiquette du champ, la confiance, le type de données, le format date/nombre, etc. Pour plus d\'informations, voir .
      Remarque : Vous pouvez également ajouter et supprimer le tableau personnalisé lors de la modification d\'une instance d\'apprentissage.
    Le tableau personnalisé figure dans la liste déroulante tableau.
    Tableau créé au niveau de l\'instance d\'apprentissage et affiché dans la liste déroulante

    Vous pouvez également afficher les champs des tableaux personnalisés et par défaut dans l\'onglet Règles au niveau du document, mais ne pouvez pas sélectionner des champs dans tous les tableaux. Pour en savoir plus sur la prise en charge de plusieurs tableaux, voir .

  4. Cliquez sur Créer.
Lorsqu\'une nouvelle instance d\'apprentissage est créée, la Control Room crée un dossier portant le même nom que celui de l\'instance d\'apprentissage dans le dossier Automatisation > Processus de l\'espace de travail des documents. Le dossier contient deux robots (extraction et téléchargement), un processus et un formulaire. Pour plus d\'informations, voir .

Étapes suivantes

Chargez des documents vers l\'instance d\'apprentissage, corrigez les erreurs de validation et vérifiez les données extraites : Traiter les documents dans Automatisation de documents