Créer une instance d'apprentissage dans Automatisation de documents

Commencez à traiter les documents en créant une instance d'apprentissage afin d'extraire des données de différents types de documents pris en charge. Une instance d'apprentissage est une structure qui contient des informations telles que le type de document, la langue, les champs à extraire, et bien plus.

Prérequis

  • Pour créer une instance d'apprentissage, vous devez être un utilisateur Learning instance creator. Reportez-vous à la rubrique Utilisateurs de Automatisation de documents.
  • Pour les types de documents qui prennent en charge la reconnaissance optique des caractères, la reconnaissance optique des caractères par défaut est Moteur FineReader ABBYY. Vous pouvez également créer une instance d'apprentissage pour traiter les documents à l'aide de OCR Google Vision.
  • Pour le type de document Formulaires standard, assurez-vous d'avoir créé un modèle d'extraction personnalisé. Reportez-vous à la rubrique Création d'un formulaire standard dans Automatisation de documents.

Regardez cette vidéo pour découvrir le processus de bout en bout complet de création d'une instance d'apprentissage :

Procédure

  1. À partir de la page d'accueil de la Control Room, accédez à Gérer > Instances d'apprentissage > Créer une instance d'apprentissage.
  2. Saisissez un nom et une description pour l'instance d'apprentissage.
    Automatisation de documents n'autorise pas la duplication des noms d'instances d'apprentissage. Le nom que vous fournissez doit donc être unique.
  3. Sélectionnez un type de document approprié.
    Remarque : Utilisez le type de document Défini par l'utilisateur pour traiter des documents visuellement similaires aux factures, tels que les bons de commande et les commandes de vente, qui contiennent des paires clé-valeur et une structure de tableau. Dans ce type de document, vous créez et configurez tous les champs de formulaire et de tableau.
  4. Sélectionnez la langue.
    Pour plus d'informations sur les langues prises en charge dans Automatisation de documents, voir Langues prises en charge dans Automatisation de documents.

    Si vous sélectionnez un type de document utilisé lors de la configuration de l'analyseur à l'étape 3, la langue sélectionnée lors de la configuration de l'analyseur est automatiquement sélectionnée. En outre, la liste des paramètres régionaux affiche les options linguistiques en fonction de la langue sélectionnée automatiquement.

  5. Sélectionnez un fournisseur.
    Si vous avez sélectionné la langue anglaise à l'étape 4, Automation Anywhere (Pré-entraîné) est sélectionné automatiquement.

    Si vous sélectionnez un type de document utilisé lors de la configuration de l'analyseur à l'étape 3, l'analyseur (tiers) configuré est automatiquement sélectionné comme fournisseur.

  6. Facultatif : Sélectionnez le fournisseur Reconnaissance de texte. Par défaut, Automatisation de documents traite les documents dans Moteur FineReader ABBYY.
    Les utilisateurs avec une Control Room dans le cloud peuvent choisir de traiter les documents dans OCR Google Vision.
  7. Facultatif : Vous pouvez utiliser l'option Amélioration de la précision à l'aide de la validation pour envoyer des commentaires au système afin d'améliorer les résultats de l'extraction. Pour plus d'informations, voir Amélioration de la précision de l'extraction par la validation.
    Remarque : L'option Amélioration de la précision à l'aide de la validation est disponible uniquement pour les types de documents sélectionnés.
  8. Facultatif : Sélectionnez l'option Extraction de données optimisée par l'IA générative pour utiliser les capacités IA générative pour l'extraction. Pour plus d'informations, consultez Automatisation de documents - Extraction de données à l'aide de l'IA générative.
    Sélectionnez l'un des fournisseurs d'IA générative suivants :
    Remarque :
    • L'option Extraction de données pilotée par l'IA générative est disponible uniquement pour les types de documents sélectionnés. Pour certains types de documents, l'option Extraction de données pilotée par l'IA générative est activée par défaut et ne peut pas être désactivée. Vous pouvez uniquement choisir le fournisseur IA générative pour ces types de documents.
    • Lorsque vous passez d'une version précédente à la version v.33 ou à une version ultérieure, Open AI est défini comme fournisseur d'extraction de données par défaut.
    • Lorsque vous sélectionnez Anthropic comme fournisseur d'extraction de données dans une instance d'apprentissage et que vous ne configurez pas les paramètres Anthropic requis dans le robot d'extraction correspondant, une erreur s'affiche lors du traitement des documents.
    • Si vous avez sélectionné le fournisseur Anthropic pour une instance d'apprentissage et que vous n'avez pas correctement configuré les paramètres Anthropic ou avez sélectionné un fournisseur différent dans le robot d'extraction correspondant, une erreur s'affiche lors du traitement des documents.
    • Si vous avez traité des documents à l'aide d'Open AI et que vous êtes ensuite passé à Anthropic pour l'extraction des données, seuls les documents traités après le passage à Anthropic utilisent Anthropic pour l'extraction des données. Pour les documents déjà traités, les données extraites utilisent Open AI.
    • Open AI : Azure OpenAI permet d'accéder aux puissants modèles de langage d'Open AI pour la génération de contenu, la synthèse, la compréhension des images, la recherche sémantique et la traduction du langage naturel en code. Ce fournisseur est disponible sous forme de licence intégrée (aucune licence supplémentaire requise) et de licence BYOL (Bring Your Own License). Si vous utilisez BYOL, veillez à configurer les paramètres supplémentaires pour Open AI dans le robot d'extraction pour utiliser ce fournisseur. Reportez-vous à la rubrique Utilisation de l'action Extraire des données.
    • Anthropic : Vous pouvez désormais utiliser les modèles Anthropic IA générative disponibles via AWS et GCP pour l'extraction de données dans Automatisation de documents. Cette offre vous permet de choisir le modèle d'IA générative en fonction du fournisseur cloud certifié par votre société.

      Anthropic comprend les fonctionnalités suivantes :

      • Traitement efficace des documents volumineux non structurés
      • Peut gérer des documents en anglais et dans d'autres langues
      • Traitement de documents plus rapide avec une meilleure précision d'extraction des données

      Si vous utilisez BYOL, vous devez configurer le modèle Anthropic Claude sur le service Google Vertex AI ou Amazon Bedrock, puis configurer les paramètres supplémentaires dans le robot d'extraction pour utiliser ce fournisseur. Reportez-vous à la rubrique Utilisation de l'action Extraire des données.

    Créer une instance d'apprentissage dans Automatisation de documents
  9. Cliquez sur Suivant.

Nous vous recommandons d'ouvrir un exemple de document à côté de la fenêtre Control Room pendant que vous configurez les champs de formulaire et de tableau.

Remarque :
  • Un champ de formulaire est un type de champ qui n'apparaît qu'une seule fois dans un document.
  • Un champ de tableau est un type de champ qui se répète dans tout un document, généralement sous forme d'un tableau.

  1. Configurez les champs de formulaire et de tableau pour l'extraction. Pour plus d'informations, voir Références pour la création d'une instance d'apprentissage dans Automatisation de documents.
    1. Cliquez sur un champ pour ouvrir l'éditeur de champs. Pour plus d'informations, consultez Références pour la création d'une instance d'apprentissage dans Automatisation de documents.
    2. Passez la souris sur l'icône de menu située à droite d'un champ pour accéder aux flèches haut/bas.
    3. Utilisez les flèches pour réorganiser l'ordre des champs pour une validation manuelle plus efficace.
      L'ordre des champs n'a pas d'impact sur l'extraction.
  2. Cliquez sur Ajouter un champ et spécifiez les détails des champs tels que le nom du champ, l'étiquette du champ, la confiance, le type de données, le format date/nombre, etc. Pour plus d'informations, voir Références pour la création d'une instance d'apprentissage dans Automatisation de documents.
    L'image suivante montre les champs de formulaire et de tableau configurés dans une instance d'apprentissage :
    Champs de formulaire d'une instance d'apprentissage

    Champs de tableau d'une instance d'apprentissage et ajout d'une table personnalisée au niveau de l'instance d'apprentissage
  3. Facultatif : Dans l'onglet Champs de tableau, cliquez sur l'icône + pour ajouter un tableau personnalisé au niveau de l'instance d'apprentissage.
    1. Donnez un nom au tableau et cliquez sur Ajouter.
    2. Cliquez sur Ajouter un champ et spécifiez les détails des champs tels que le nom du champ, l'étiquette du champ, la confiance, le type de données, le format date/nombre, etc. Pour plus d'informations, voir Références pour la création d'une instance d'apprentissage dans Automatisation de documents.
      Remarque : Vous pouvez également ajouter et supprimer le tableau personnalisé lors de la modification d'une instance d'apprentissage.
    Le tableau personnalisé figure dans la liste déroulante tableau.
    Tableau créé au niveau de l'instance d'apprentissage et affiché dans la liste déroulante

    Vous pouvez également afficher les champs des tableaux personnalisés et par défaut dans l'onglet Règles au niveau du document, mais ne pouvez pas sélectionner des champs dans tous les tableaux. Pour en savoir plus sur la prise en charge de plusieurs tableaux, voir Références pour la création d'une instance d'apprentissage dans Automatisation de documents.

  4. Cliquez sur Créer.
Lorsqu'une nouvelle instance d'apprentissage est créée, la Control Room crée un dossier portant le même nom que celui de l'instance d'apprentissage dans le dossier Automatisation > Processus d'espace de travail des documents. Le dossier contient deux robots (extraction et téléchargement), un processus et un formulaire. Pour plus d'informations, voir Références pour la création d'une instance d'apprentissage dans Automatisation de documents.

Étapes suivantes

Chargez des documents vers l'instance d'apprentissage, corrigez les erreurs de validation et vérifiez les données extraites : Traiter les documents dans Automatisation de documents