Créer une instance d\'apprentissage dans Document Automation

Télécharger au format PDF

Commentaires

Dernière mise à jour2025/03/24

Créer une instance d\'apprentissage dans Document Automation

Commencez à traiter les documents en créant une instance d\'apprentissage afin d\'extraire des données de différents types de documents pris en charge. Une instance d\'apprentissage est une structure qui contient des informations telles que le type de document, la langue, les champs à extraire, etc.

Prérequis

Pour créer une instance d\'apprentissage, vous devez être un utilisateur Learning instance creator. Voir Utilisateurs de Document Automation.
Pour les types de documents qui prennent en charge l\'OCR, l\'OCR par défaut est Moteur FineReader ABBYY.Vous pouvez également créer une instance d\'apprentissage pour traiter les documents en utilisant OCR Google Vision.
Pour le type de document Formulaires standard, assurez-vous d\'avoir créé un modèle d\'extraction personnalisé. Reportez-vous à la rubrique Créez un modèle d\'extraction personnalisé à l\'aide de Formulaires standards.

Regardez cette vidéo pour découvrir le processus de bout en bout complet de création d\'une instance d\'apprentissage :

Procédure

À partir de la page d\'accueil de la Control Room, accédez à IA > Document Automation , et cliquez sur Créer une instance d\'apprentissage.
Saisissez un nom et une description pour l\'instance d\'apprentissage.
Document Automation n\'autorise pas la duplication des noms d\'instances d\'apprentissage. Le nom que vous fournissez doit donc être unique.
Sélectionnez un type de document approprié.

Remarque : Utilisez le type de document Défini par l\'utilisateur pour traiter des documents visuellement similaires aux factures, tels que les bons de commande et les documents de vente, qui contiennent des paires clé-valeur et une structure de tableau. Dans ce type de document, vous créez et configurez tous les champs de formulaire et de tableau.
Sélectionnez la langue.
Pour plus d\'informations sur les langues prises en charge dans Document Automation, voir Langues prises en charge dans Document Automation.
Si vous sélectionnez un type de document utilisé lors de la configuration de l\'analyseur à l\'étape 3, la langue sélectionnée lors de la configuration de l\'analyseur est automatiquement sélectionnée. En outre, la liste des paramètres régionaux affiche les options linguistiques en fonction de la langue sélectionnée automatiquement.
Sélectionnez un fournisseur.
Si vous avez sélectionné la langue anglaise à l\'étape 4, Automation Anywhere (Pré-entraîné) est sélectionné automatiquement.
Si vous sélectionnez un type de document utilisé lors de la configuration de l\'analyseur à l\'étape 3, l\'analyseur (tiers) configuré est automatiquement sélectionné comme fournisseur.
Facultatif : Sélectionnez un Reconnaissance de texte fournisseur.
Vous pouvez sélectionner l\'une des options suivantes :
- ABBYY
- Google Vision
- Extracteur de PDF numérique
Par défaut, Document Automation traite les documents à l\'aide de Moteur FineReader ABBYY.

Les utilisateurs avec une cloud Control Room peuvent choisir de traiter les documents en utilisant OCR Google Vision ou Digital PDF Extractor.
Facultatif : Vous pouvez utiliser l\'option Amélioration de la précision à l\'aide de la validation pour envoyer des commentaires au système afin d\'améliorer les résultats de l\'extraction. Pour plus d\'informations, voir Amélioration de la précision de l\'extraction par la validation.
Remarque :
- L\'option Amélioration de la précision à l\'aide de la validation est disponible uniquement pour certains types de documents.
- L\'option Amélioration de la précision à l\'aide de la validation utilisera les invites utilisateur fournies dans la fonctionnalité Search query for generative AI model pour améliorer l\'extraction des données. Voir Document Automation - Extraction de données à l\'aide de l\'IA générative.
Facultatif : Sélectionnez l\'option Extraction de données optimisée par l\'IA générative pour utiliser les capacités IA générative pour l\'extraction. Pour plus d\'informations, consultez Document Automation - Extraction de données à l\'aide de l\'IA générative.
Sélectionnez l\'un des fournisseurs de IA générative suivants :
Remarque :
- Pour utiliser l\'option d\'extraction de données pilotée par l\'IA générative, assurez-vous d\'utiliser la Extraction de document package version 3.31.16 ou ultérieure. Voir Extraction de document packageMises à jour.
- L\'option Extraction de données pilotée par l\'IA générative est disponible uniquement pour certains types de documents. Pour certains types de documents, l\'option Extraction de données pilotée par l\'IA générative est activée par défaut et ne peut pas être désactivée. Vous ne pouvez choisir que le fournisseur IA générative pour ce type de document.
- Lorsque vous mettez à jour d\'une version précédente vers v.33 ou une version ultérieure, Open AI sera défini comme fournisseur d\'extraction de données par défaut.
- Lorsque vous sélectionnez Anthropic comme fournisseur d\'extraction de données dans une instance d\'apprentissage et que vous ne configurez pas les paramètres Anthropic requis dans le robot d\'extraction correspondant, vous verrez une erreur lors du traitement des documents.
- Si vous avez sélectionné le fournisseur Anthropic pour une instance d\'apprentissage et que vous avez mal configuré les paramètres Anthropic ou sélectionné un fournisseur différent dans le robot d\'extraction correspondant, vous verrez une erreur lors du traitement des documents.
- Si vous avez traité des documents en utilisant OpenAI et que vous êtes ensuite passé à Anthropic pour l\'extraction de données, seuls les documents qui seront traités après le passage à Anthropic utiliseront Anthropic pour l\'extraction de données. Pour les documents traités précédemment, les données extraites seraient utilisées avec OpenAI.
- Open AI: OpenAIfournit un accès aux puissants modèles linguistiques d\'Open AI pour la génération de contenu, la synthèse, la compréhension d\'images, la recherche sémantique et la traduction du langage naturel en code. Ce fournisseur est disponible via une licence intégrée (ne nécessite aucune licence supplémentaire) et via BYOL (apportez votre propre licence). Si vous utilisez BYOL, assurez-vous de configurer les paramètres supplémentaires pour OpenAI dans l\'extraction robot afin d\'utiliser ce fournisseur. Voir action Extraire des données.
- Anthropic : Vous pouvez désormais utiliser les modèles Anthropic IA générative disponibles via AWS et GCP pour l\'extraction de données dans Document Automation. Cette offre vous offre la flexibilité de sélectionner le modèle IA générative en fonction du fournisseur cloud que votre entreprise a certifié.
  Anthropic comprend les fonctionnalités suivantes :
  - Traitement efficace de grands documents non structurés
  - Peut gérer des documents en anglais et dans d\'autres langues
  - Traite les documents plus rapidement avec une meilleure précision d\'extraction des données
  Si vous utilisez BYOL, vous devez configurer le modèle Anthropic Claude sur le service Google Vertex AI ou Amazon Bedrock, puis configurer les paramètres supplémentaires dans le robot d\'extraction pour utiliser ce fournisseur. Reportez-vous à la rubrique action Extraire des données.
$Création d\'une instance d\'apprentissage dans Document Automation$
Cliquez sur Suivant.

Nous vous recommandons d\'ouvrir un exemple de document à côté de la fenêtre Control Room pendant que vous configurez les champs de formulaire et de tableau.

Remarque :

Un champ de formulaire est un type de champ qui n\'apparaît qu\'une seule fois dans un document.
Un champ de tableau est un type de champ qui se répète dans tout un document, généralement sous forme d\'un tableau.

Configurez les champs de formulaire et de tableau pour l\'extraction. Pour plus d\'informations, voir .
1. Cliquez sur un champ pour ouvrir l\'éditeur de champs. Pour plus d\'informations, consultez .
2. Passez la souris sur l\'icône de menu située à droite d\'un champ pour accéder aux flèches haut/bas.
3. Utilisez les flèches pour réorganiser l\'ordre des champs pour une validation manuelle plus efficace.
  L\'ordre des champs n\'a pas d\'impact sur l\'extraction.
Pour en savoir plus sur les autres attributs de champ, voir .
Cliquez sur Ajouter un champ et spécifiez les détails des champs tels que le nom du champ, l\'étiquette du champ, la confiance, le type de données, le format date/nombre, etc. Pour plus d\'informations, voir .

Remarque : Si vous avez sélectionné l\'option extraction de données pilotée par l\'IA générative, nous vous recommandons d\'ajouter de bonnes invites pour les champs afin d\'obtenir les résultats escomptés lors de la création des instances d\'apprentissage. Reportez-vous à la rubrique Document Automation - Extraction de données à l\'aide de l\'IA générative.
L\'image suivante montre les champs de formulaire et de tableau configurés dans une instance d\'apprentissage :
$Champs de formulaire d\'une instance d\'apprentissage$

$Champs de tableau d\'une instance d\'apprentissage et ajout d\'une table personnalisée au niveau de l\'instance d\'apprentissage$

Remarque : L\'option Ajouter un champ n\'est pas disponible pour le type de document Reçus.
Facultatif : Dans l\'onglet Champs de tableau, cliquez sur l\'icône + pour ajouter un tableau personnalisé au niveau de l\'instance d\'apprentissage.
1. Saisissez un nom pour le tableau.
2. Facultatif : Saisissez une invite bien définie pour décrire les détails de la table dans le document à partir duquel vous souhaitez extraire des données. Par exemple, si un document contient plusieurs tableaux avec des en-têtes identiques mais des titres différents, vous pouvez spécifier le titre exact du tableau dans l\'invite pour vous assurer que les données sont extraites du bon tableau.
  Pour mettre à jour une invite de tableau, cliquez sur l\'icône Modifier le tableau (), mettez à jour l\'invite, puis cliquez sur Mettre à jour.
3. Cliquez sur Ajouter.
4. Cliquez sur Ajouter un champ et spécifiez les détails des champs tels que le nom du champ, l\'étiquette du champ, la confiance, le type de données, le format date/nombre, etc. Pour plus d\'informations, voir .
  
  Remarque : Vous pouvez également ajouter et supprimer le tableau personnalisé lors de la modification d\'une instance d\'apprentissage.
Le tableau personnalisé figure dans la liste déroulante tableau.
$Tableau créé au niveau de l\'instance d\'apprentissage et affiché dans la liste déroulante$

Vous pouvez également afficher les champs des tableaux personnalisés et par défaut dans l\'onglet Règles au niveau du document, mais ne pouvez pas sélectionner des champs dans tous les tableaux. Pour en savoir plus sur la prise en charge de plusieurs tableaux, voir .
Cliquez sur Créer.

Lorsqu\'une nouvelle instance d\'apprentissage est créée, la Control Room crée un dossier portant le même nom que celui de l\'instance d\'apprentissage dans le dossier Automatisation > Processus de l\'espace de travail des documents. Le dossier contient deux robots (extraction et téléchargement), un processus et un formulaire. Pour plus d\'informations, voir .

Étapes suivantes

Chargez des documents vers l\'instance d\'apprentissage, corrigez les erreurs de validation et vérifiez les données extraites : Traiter les documents dans Document Automation