Créer une instance d\'apprentissage dans Community Edition

Créez une instance d\'apprentissage pour commencer le traitement des documents. Dans Community Edition, vous pouvez extraire des données pour les types de documents et langues pris en charge en utilisant le fournisseur d\'OCR ABBYY.

Procédure

  1. À partir de la page d\'accueil de la Control Room, accédez à IA > Document Automation , et cliquez sur Créer une instance d\'apprentissage.
  2. Saisissez un nom et une description pour l\'instance d\'apprentissage.
    Document Automation n\'autorise pas la duplication des noms d\'instances d\'apprentissage. Le nom que vous fournissez doit donc être unique.
  3. Sélectionnez un type de document approprié.
    Remarque : Utilisez le type de document Défini par l\'utilisateur pour traiter des documents visuellement similaires aux factures, tels que les bons de commande et les documents de vente, qui contiennent des paires clé-valeur et une structure de tableau. Dans ce type de document, vous créez et configurez tous les champs de formulaire et de tableau.
  4. Sélectionnez la langue.
  5. Facultatif : Vous pouvez utiliser l\'option Amélioration de la précision à l\'aide de la validation pour envoyer des commentaires au système afin d\'améliorer les résultats de l\'extraction. Pour plus d\'informations, voir Amélioration de la précision de l\'extraction par la validation.
  6. Facultatif : Sélectionnez l\'option Extraction de données optimisée par l\'IA générative pour utiliser les capacités IA générative pour l\'extraction. Pour plus d\'informations, consultez Document Automation - Extraction de données à l\'aide de l\'IA générative.

    Les fournisseurs IA générative offrent les avantages suivants :

    • Traitement efficace de grands documents non structurés
    • Peut gérer des documents en anglais et dans d\'autres langues
    Sélectionnez l\'un des fournisseurs de IA générative suivants :
    Remarque :
    • Lorsque vous effectuez une mise à jour depuis une version antérieure vers la v.38 ou une version ultérieure, Open AI sera défini comme fournisseur d\'extraction de données par défaut.
    • Si vous avez traité des documents en utilisant OpenAI et que vous êtes ensuite passé à Anthropic pour l\'extraction de données, seuls les documents qui seront traités après le passage à Anthropic utiliseront Anthropic pour l\'extraction de données. Pour les documents traités précédemment, les données extraites seraient utilisées avec Azure OpenAI.
    • Open AI : le modèle Azure OpenAI est utilisé pour l\'extraction de données. Ce fournisseur est disponible via une licence intégrée (ne nécessite aucune licence supplémentaire) et via BYOL (apportez votre propre licence).

      Si vous utilisez BYOL, assurez-vous de configurer les paramètres supplémentaires pour OpenAI dans l\'extraction robot afin d\'utiliser ce fournisseur. Voir action Extraire des données.

    • Anthropic : Vous pouvez désormais utiliser les modèles Anthropic IA générative disponibles via AWS et GCP pour l\'extraction de données dans Document Automation. Cette offre vous offre la flexibilité de sélectionner le modèle IA générative en fonction du fournisseur Cloud que votre entreprise a certifié.

      Si vous utilisez BYOL, vous devez configurer le modèle Anthropic Claude sur le service Google Vertex AI ou Amazon Bedrock, puis configurer les paramètres supplémentaires dans le robot d\'extraction pour utiliser ce fournisseur. Voir action Extraire des données.

  7. Cliquez sur Suivant.

Nous vous recommandons d\'ouvrir un exemple de document à côté de la fenêtre Control Room pendant que vous configurez les champs de formulaire et de tableau.

Remarque :
  • Un champ de formulaire est un type de champ qui n\'apparaît qu\'une seule fois dans un document.
  • Un champ de tableau est un type de champ qui se répète dans tout un document, généralement sous forme d\'un tableau.

  1. Configurez les champs de formulaire et de tableau pour l\'extraction. Pour plus d\'informations, voir Afficher et rechercher les champs.
    1. Cliquez sur un champ pour ouvrir l\'éditeur de champs. Pour plus d\'informations, consultez Directives pour modifier les champs et créer des alias personnalisés.
    2. Passez la souris sur l\'icône de menu située à droite d\'un champ pour accéder aux flèches haut/bas.
    3. Utilisez les flèches pour réorganiser l\'ordre des champs pour une validation manuelle plus efficace.
      L\'ordre des champs n\'a pas d\'impact sur l\'extraction.
    Pour en savoir plus sur les autres attributs de champ, voir Considérations pour les champs de formulaire et de tableau.
  2. Cliquez sur Ajouter un champ et spécifiez les détails des champs tels que le nom du champ, l\'étiquette du champ, la confiance, le type de données, le format date/nombre, etc. Pour plus d\'informations, voir Considérations pour les champs de formulaire et de tableau.
    Remarque : Si vous avez sélectionné l\'option extraction de données pilotée par l\'IA générative, nous vous recommandons d\'ajouter de bonnes invites pour les champs afin d\'obtenir les résultats escomptés lors de la création des instances d\'apprentissage. Voir Document Automation - Extraction de données à l\'aide de l\'IA générative.
    L\'image suivante montre les champs de formulaire et de tableau configurés dans une instance d\'apprentissage :
    Champs de formulaire d\'une instance d\'apprentissage

    Champs de tableau d\'une instance d\'apprentissage et ajout d\'une table personnalisée au niveau de l\'instance d\'apprentissage
    Remarque : L\'option Ajouter un champ n\'est pas disponible pour le type de document Reçus.
  3. Cliquez sur Créer.

Étapes suivantes

Chargez des documents vers l\'instance d\'apprentissage, corrigez les erreurs de validation et vérifiez les données extraites : Traiter les documents dans Community Edition