Créer une instance d\'apprentissage dans Community Edition

Créez une instance d\'apprentissage pour commencer le traitement des documents. Dans Community Edition, vous pouvez extraire des données pour les types de documents et langues pris en charge en utilisant le fournisseur d\'OCR ABBYY.

Procédure

  1. From the Control Room home page, navigate to IA > Document Automation , and click Create Learning Instance.
  2. Enter a name and description for the learning instance.
    Document Automation does not allow duplicate learning instance names, so the name you provide must be unique.
  3. Sélectionnez un type de document approprié.
    Remarque : Utilisez le type de document Défini par l\'utilisateur pour traiter des documents visuellement similaires aux factures, tels que les bons de commande et les documents de vente, qui contiennent des paires clé-valeur et une structure de tableau. Dans ce type de document, vous créez et configurez tous les champs de formulaire et de tableau.
  4. Sélectionnez la langue.
  5. Facultatif : Vous pouvez utiliser l\'option Amélioration de la précision à l\'aide de la validation pour envoyer des commentaires au système afin d\'améliorer les résultats de l\'extraction. Pour plus d\'informations, voir Amélioration de la précision de l\'extraction par la validation.
  6. Facultatif : Sélectionnez l\'option Extraction de données optimisée par l\'IA générative pour utiliser les capacités IA générative pour l\'extraction. Pour plus d\'informations, consultez Document Automation - Extraction de données à l\'aide de l\'IA générative.

    Les fournisseurs IA générative offrent les avantages suivants :

    • Traitement efficace de grands documents non structurés
    • Peut gérer des documents en anglais et dans d\'autres langues
    Sélectionnez l\'un des fournisseurs de IA générative suivants :
    Remarque :
    • Lorsque vous effectuez une mise à jour depuis une version antérieure vers la v.38 ou une version ultérieure, Open AI sera défini comme fournisseur d\'extraction de données par défaut.
    • Si vous avez traité des documents en utilisant OpenAI et que vous êtes ensuite passé à Anthropic pour l\'extraction de données, seuls les documents qui seront traités après le passage à Anthropic utiliseront Anthropic pour l\'extraction de données. Pour les documents traités précédemment, les données extraites seraient utilisées avec Azure OpenAI.
    • Open AI : le modèle Azure OpenAI est utilisé pour l\'extraction de données. Ce fournisseur est disponible via une licence intégrée (ne nécessite aucune licence supplémentaire) et via BYOL (apportez votre propre licence).

      Si vous utilisez BYOL, assurez-vous de configurer les paramètres supplémentaires pour OpenAI dans l\'extraction robot afin d\'utiliser ce fournisseur. Voir action Extraire des données.

    • Anthropic : Vous pouvez désormais utiliser les modèles Anthropic IA générative disponibles via AWS et GCP pour l\'extraction de données dans Document Automation. Cette offre vous offre la flexibilité de sélectionner le modèle IA générative en fonction du fournisseur Cloud que votre entreprise a certifié.

      Si vous utilisez BYOL, vous devez configurer le modèle Anthropic Claude sur le service Google Vertex AI ou Amazon Bedrock, puis configurer les paramètres supplémentaires dans le robot d\'extraction pour utiliser ce fournisseur. Voir action Extraire des données.

  7. Click Next.

We recommend that you open a sample document side by side with the Control Room window as you configure the form and table fields.

Remarque :
  • A form field is a type of field that occurs only one time in a document.
  • A table field is a type of field that reoccurs throughout a document, typically in the form of a table.

  1. Configure the form and table fields for extraction. For more details, see Afficher et rechercher les champs.
    1. Click a field to open the fields editor. For more details, see .Directives pour modifier les champs et créer des alias personnalisés
    2. Hover over the menu icon to the right of a field to access the up/down arrows.
    3. Use the arrows to rearrange the order of the fields for a more efficient manual validation.
      The order of the fields does not impact extraction.
    To learn more about the other field attributes, see Considérations pour les champs de formulaire et de tableau.
  2. Click Add a field and specify the fields details such as field name, fields label, confidence, data type, format date/number, and so on. For more details, see Considérations pour les champs de formulaire et de tableau.
    Remarque : If you have selected the Generative AI-driven data extraction option, we recommend that you add good prompts for fields to get the expected results when you create the learning instances. See Document Automation - Extraction de données à l\'aide de l\'IA générative.
    The following image shows form and table fields configured in a learning instance:
    Form fields of a learning instance

    Table fields of a learning instance and adding custom table at learning instance level
    Remarque : The Add a field option is not available for Receipts document type.
  3. Click Create.

Étapes suivantes

Chargez des documents vers l\'instance d\'apprentissage, corrigez les erreurs de validation et vérifiez les données extraites : Traiter les documents dans Community Edition