Amélioration de l\'extraction des données des tableaux
- Dernière mise à jour2024/11/28
Amélioration de l\'extraction des données des tableaux
Utilisez les paramètres de formation avancés pour entraîner vos documents et fournir des entrées supplémentaires au moteur d\'extraction Automatisation de documents afin d\'améliorer l\'extraction des données de tableau.
- Colonne principale : Définissez la colonne principale pour l\'identification des lignes en fonction de vos exigences.
- Indicateur de fin de tableau : Ajouter une valeur d\'indicateur de fin de tableau pour que le système extraie les données jusqu\'à ce que la valeur atteigne la valeur spécifiée, à l\'exclusion de la valeur d\'indicateur de fin de tableau.
- Étiquettes d\'en-tête : Ajuster ou remettre en correspondance les champs de tableau si nécessaire.
Prérequis
- L\'option Paramètres de formation avancés n\'est disponible que si l\'option Améliorer la précision grâce à la validation est activée.
- Assurez-vous que vous disposez de l\'autorisation Entraîner des groupes pour fournir des informations sur les étiquettes d\'en-tête, l\'indicateur de fin de tableau et une colonne principale utilisée pour la détection des lignes.
- Il ne peut y avoir qu\'une seule colonne principale.
- L\'indicateur de fin de tableau est une région de texte identifiée par le système (SIR).
Procédure
Colonne principale
Par exemple, après l\'extraction du document, les données de tableau à plusieurs lignes de la colonne Numéro d\'élément sont extraites dans une seule ligne, mais vous souhaitez les extraire dans des lignes séparées. Dans de tels cas, vous pouvez définir le Numéro d\'élément comme colonne principale pour améliorer l\'extraction de la table. Pour plus de détails, voir Exemple de définition de la colonne principale à l\'aide des paramètres de formation avancés.
Indicateur de fin de table
Par exemple, lorsque vous traitez un document, il extrait les données de tableau entier, alors que vous souhaitez extraire les données des lignes jusqu\'à Total à payer. Dans de tels cas, vous pouvez spécifier la valeur Indicateur de fin de tableau afin que les données du tableau jusqu\'à cette valeur (à l\'exclusion de la valeur Indicateur de fin de tableau) soient extraites et qu\'aucune autre ligne de données ne soit extraite.
Étiquette d\'en-tête
Lorsqu\'il y a une erreur d\'étiquette dans les données de tableau, par exemple l\'étiquette d\'en-tête extraite est Prix unitaire mais vous voulez que l\'étiquette d\'en-tête soit Prix. Dans de tels cas, vous pouvez modifier l\'étiquette d\'en-tête.
Un autre cas d\'utilisation est la possibilité de remapper toutes les valeurs de Unit Price ou de modifier l\'étiquette d\'en-tête en même temps que les données de la colonne. Vous pouvez utiliser le remplissage automatique pour accélérer ce re-mappage. Par exemple, après l\'extraction, la colonne Prix de l\'instance d\'apprentissage est extraite en tant que Prix étendu, mais vous souhaitez que l\'étiquette d\'en-tête soit Prix unitaire avec les données de la colonne. Dans de tels cas, vous pouvez changer l\'étiquette d\'en-tête Prix étendu par Prix unitaire et vous devez sélectionner et remapper toutes les valeurs des cellules de la colonne Prix unitaire.