Créez un modèle d\'extraction de Formulaires standards dans la Control Room.
Prérequis
- Assurez-vous que votre Control Room dispose de la licence de produit Document Automation (nombre de pages) Pour en savoir plus sur les licences, consultez la rubrique Compréhension des licences dans Document Automation.
- Vous devez avoir les rôles Administrateur AAE_IQ Bot ou Services AAE_IQ Bot pour effectuer cette tâche.
- Identifiez entre cinq et quinze documents d\'entraînement.
- La limite maximale du type de document Formulaires standards est de 157 286 400octets.
- Pour connaître les limitations liées à l\'utilisation de modèles neuronaux personnalisés, reportez-vous à Document Intelligence custom neural model.
Procédure
-
Dans le Control Room, accédez à
, puis cliquez sur Créer un modèle.
Remarque : Vous ne pourrez pas voir l\'option
Créer un modèle sur la page des instances d\'apprentissage pour créer des modèles lorsque vous utilisez votre propre licence (BYOL). Voir
Build and train a custom extraction model.
La fenêtre Projets s\'ouvre dans un nouvel onglet.
-
Cliquez sur Créer un projet.
-
Saisissez un nom pour le projet, cliquez sur Parcourir pour charger des documents afin d\'entraîner le modèle d\'extraction, puis cliquez sur Créer.
-
Définissez les balises du champ:
-
Cliquez sur l\'icône plus (+) dans le coin supérieur droit de l\'écran et sélectionnez Champ.
-
Donnez un nom à l\'étiquette et sélectionnez Entrée. Par exemple,
Invoice Number
ou Invoice Date
.
Remarque : Chaque balise de champ et sa balise d\'emplacement correspondante sont associées à une couleur unique de sorte qu\'il est facile de les associer lors de la distinction ou de la validation visuelle de données. Cliquez sur une balise de champ pour mettre en surbrillance la balise d\'emplacement correspondante sur le document.
-
Définissez les balises du tableau:
-
liquez sur l\'icône plus (+) dans le coin supérieur droit de l\'écran et sélectionnez Table.
-
Donnez un nom au tableau et cliquez sur Créer.
-
Pour chaque colonne du tableau, sélectionnez le nom de la colonne et effectuez l\'une des actions suivantes :
-
Renommer la colonne : Sélectionnez cette option pour renommer la colonne et sélectionnez Entrée pour renommer.
-
Insérer une colonne : Sélectionnez cette option pour insérer une colonne après la colonne sélectionnée.
-
Supprimer la colonne : Sélectionnez cette option pour supprimer la colonne sélectionnée.
-
Mettez à jour les détails de la colonne.
- Facultatif :
Cliquez sur l\'icône plus (+) pour ajouter plus de lignes.
-
Cliquez sur le bouton de fermeture (x) dans le coin supérieur droit de l\'écran pour quitter la vue du tableau.
-
Cliquez sur l\'option Région dans le coin supérieur gauche de l\'écran et définissez l\'emplacement des données pour chaque champ :
-
Pour les champs de formulaire, mettez en surbrillance l\'emplacement des données à extraire et sélectionnez le nom du champ correspondant dans la liste.
-
Pour chaque cellule du tableau, mettez en surbrillance l\'emplacement des données à extraire, puis sélectionnez la cellule. Cliquez sur le bouton de fermeture (x) dans le coin supérieur droit de l\'écran pour quitter la vue du tableau.
-
Sélectionnez le document suivant et répétez les étapes pour définir les emplacements des champs de formulaire et de tableau.
-
Cliquez sur l\'icône Entraîner et saisissez un nom pour le modèle.
-
Sélectionnez l\'un des modèles suivants :
-
Modèle : Un modèle personnalisé est un modèle de document facile à entraîner qui extrait avec précision les paires clé-valeur étiquetées, les marques de sélection, les tableaux, les régions et les signatures des documents. Ce modèle est généralement utilisé pour extraire des données de documents structurés qui ont une mise en page cohérente et des modèles visuels définis. Voir Document Intelligence custom template model.
-
Neuronal : Le modèle neuronal personnalisé est un type de modèle basé sur l\'apprentissage profond qui combine des caractéristiques de mise en page et de langage pour extraire avec précision les champs étiquetés des documents. Ce modèle est plus approprié pour extraire des données de divers types de documents tels que des documents semi-structurés et non structurés. Voir Document Intelligence custom neural model.
Important : Comme le modèle neuronal personnalisé utilise la technologie de l\'apprentissage profond, il est possible que l\'entraînement du modèle prenne un certain temps. Par conséquent, il se peut que vous ne voyiez pas le modèle immédiatement sur la page des modèles personnalisés. Nous vous recommandons d\'attendre la fin de l\'entraînement, puis de sélectionner ce modèle pour l\'utiliser.
-
Cliquez sur Entraîner.
-
Cliquez sur l\'icône Analyser, cliquez sur Rechercher un fichier, sélectionnez un document, puis cliquez sur Exécuter l\'analyse pour tester le modèle d\'extraction.
Remarque : À partir de
Automation 360 v.29, vous pouvez créer et entraîner de nouveaux modèles dans
Azure AI Document Intelligence v.3.0 uniquement. Si vous utilisez
Azure AI Document Intelligence v.2.1, vous devez effectuer une mise à jour vers
Azure AI Document Intelligence v.3.0 en suivant les étapes ci-dessous :
- Ouvrez Projet.
- Cliquez sur l\'icône Entraîner.
- Cliquez sur Entraîner. Le modèle est créé dans Azure AI Document Intelligence v.3.0.