Mises à jour du package Extraction de document

Passez en revue les mises à jour des versions publiées du package Extraction de document telles que les nouvelles fonctionnalités et les fonctionnalités améliorées, ainsi que les correctifs et les limitations. La page indique également les dates de publication de chaque version, ainsi que les versions de la Control Room et de l'Agent de robot compatibles.

Résumé des versions

Le tableau suivant répertorie les versions du package Extraction de document publiées soit avec une version Automation 360, soit sous forme de package seul (par ordre décroissant des dates de publication). Cliquez sur le lien de la version pour obtenir des informations sur les mises à jour de cette version du package.
Version Date de publication Type de publication Agent de robot version Version Control Room
Mises à jour du package Extraction de document 5 avril 2024 Avec Automation 360 v.32 (Sur site) 21.252 ou versions ultérieures 19223 ou versions ultérieures
Mises à jour du package Extraction de document 21 mars 2024 Avec version Automation 360 v.32 (Sandbox) 21.252 ou versions ultérieures 19223 ou versions ultérieures
Mises à jour du package Extraction de document 26 janvier 2024 Package seul ; version Automation 360 post-v.31 21.252 ou versions ultérieures 19223 ou versions ultérieures
Mises à jour du package Extraction de document 22 décembre 2023 Package seul ; version Automation 360 ultérieure à v.31 (Sandbox) 21.252 ou versions ultérieures 19223 ou versions ultérieures
Mises à jour du package Extraction de document 6 décembre 2023 Avec version Automation 360 v.31 (Sandbox) 21.252 ou versions ultérieures 19223 ou versions ultérieures
Mises à jour du package Extraction de document 28 novembre 2023 Avec Automation 360 v.30 21.252 ou versions ultérieures 19223 ou versions ultérieures
Mises à jour du package Extraction de document 16 novembre 2023 Package seul ; version Automation 360 post-v.30 21.252 ou versions ultérieures 19223 ou versions ultérieures
3.30.24 21 septembre 2023 Package seul ; version Automation 360 ultérieure à v.30 (Sandbox) 21.252 ou versions ultérieures 19223 ou versions ultérieures
3.30.22 6 septembre 2023 Avec version Automation 360 v.30 (Sandbox) 21.252 ou versions ultérieures 19223 ou versions ultérieures
Mises à jour du package Extraction de document 21 août 2023 Package seul ; version Automation 360 ultérieure à v.29 21.98 ou versions ultérieures 15345 ou versions ultérieures
3.30.19 16 août 2023 Package seul ; version Automation 360 ultérieure à v.29 21.98 ou versions ultérieures 15345 ou versions ultérieures
Mises à jour du package Extraction de document 17 juillet 2023 Package seul ; version Automation 360 post-v.29 21.98 ou versions ultérieures 15345 ou versions ultérieures
Mises à jour du package Extraction de document 6 juin 2023 Avec version Automation 360 v.29 (Sandbox) 21.98 ou versions ultérieures 15345 ou versions ultérieures
Remarque :
  • Pour télécharger un package individuel (mis à jour dans une version Automation 360 où vous ne voulez que le package), utilisez cette URL :

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • Pour le package Extraction de document, la convention d'appellation est la suivante : bot-command-iqbot-extraction360-<version-number>-full.jar

    Par exemple : bot-command-iqbot-extraction360-3.31.22-full.jar

Pour plus de détails sur le téléchargement d'un package et son ajout manuel à la Control Room, voir Ajout de packages à la Control Room.

3.32.23

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Solutions
Les utilisateurs peuvent désormais enregistrer les commentaires de validation dans leur environnement Document Automation lorsque le proxy est activé dans la machine de l'Agent de robot.

ID de cas Service Cloud : 02092484

Lorsque OCR Google Vision et le proxy sont activés, l'extraction de documents n'échoue plus pour les documents non structurés et n'affiche pas de message d'erreur.

ID de cas Service Cloud : 02104409

3.32.22

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Solutions
Grâce à l'amélioration du modèle de détection des tableaux dans les documents qui ajoute un indicateur de fin de tableau, vous pouvez désormais extraire des données de tableau de toutes les pages dans la langue sélectionnée. Il réduit ainsi les problèmes d'extraction des tableaux manquant et des dernières lignes des pages.

ID de cas Service Cloud : 02065073

Grâce à l'amélioration de l'extraction des tableaux, les tableaux non structurés n'affichent plus de valeurs inutiles et extraient désormais correctement les données de tableau.

3.31.22

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Solutions
Après avoir ajouté des commentaires de validation à l'instance d'apprentissage, l'extraction de document n'échoue plus avec un message d'erreur.

Auparavant, l'extraction de documents échouait lorsque la case de validation était cochée.

Une fois votre commentaire de validation ajouté à l'instance d'apprentissage, celui-ci est enregistré pour tous les tableaux de toutes les pages du document et les données sont extraites correctement de toutes les pages.

Auparavant, le commentaire n'était pas enregistré pour toutes les pages.

ID de cas Service Cloud : 01995135, 02093575, 02093389

Après avoir ajouté les commentaires de validation, si les ID des tableaux correspondent, les données de tous les tableaux de chaque page sont maintenant extraites et affichées dans le validateur.

Auparavant, dans de tels cas, certaines pages étaient ignorées et les données n'apparaissaient pas dans le validateur de toutes les pages.

Lorsque vous appliquez les paramètres de formation avancés, vous devez permuter les colonnes et toutes les valeurs des colonnes doivent être mappées correctement. Par conséquent, les données sont extraites correctement dans des colonnes séparées. Vous pouvez choisir de remapper toutes les cellules de colonne ou de supprimer toutes les autres lignes de cellule incorrectes tout en conservant les deux premières lignes intactes. La colonne ne doit contenir aucune cellule incorrecte et toutes les cellules de la colonne doivent avoir des valeurs correctes.

Auparavant, dans de tels cas, les données de deux colonnes étaient extraites dans une seule colonne.

Vous pouvez maintenant extraire les valeurs des champs de tableau dans le bon ordre et le problème d'extraction de plusieurs lignes ne persiste plus. Vous pouvez également utiliser la fonctionnalité Indicateur de fin de tableau pour extraire plusieurs lignes après avoir appliqué les données du commentaire lorsqu'il n'y a qu'une seule ligne dans le tableau.
Remarque : Pour les tableaux à une seule ligne, les bonnes pratiques consistent à utiliser la fonctionnalité Indicateur de fin de tableau. Sinon, dans certains cas, l'extraction peut être partielle.

ID de cas Service Cloud : 02091013

Après avoir formé un document, lorsque l'utilisateur le traite à nouveau avec OCR Google Vision, les commentaires sont enregistrés et les données requises sont extraites.

Auparavant, dans de tels cas, vous n'étiez pas en mesure de traiter un type de document spécifique et vous deviez à chaque fois valider le document manuellement.

ID de cas Service Cloud : 02098682

3.31.17

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Solutions
Avec OCR Google Vision, vous pouvez désormais traiter les documents sans disposer d'une licence Google Document AI. De plus, aucun message d'erreur n'est généré.

Auparavant, une licence Google Document AI était nécessaire pour traiter les documents et une erreur était générée lors de l'extraction des documents. Vous étiez donc dans l'impossibilité d'extraire les documents avec OCR Google Vision.

ID de cas Service Cloud : 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Solutions
Lorsque les utilisateurs créent une instance d'apprentissage avec Google Document AI (BYOK) et un proxy authentifié, l'extraction du document n'échoue plus pour les documents de plus de 10 pages.

Auparavant, dans de tels cas, l'extraction échouait avec un message d'erreur et les utilisateurs ne pouvaient pas traiter les documents.

3.31.15

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Solutions
Si les Règles de document contiennent plusieurs conditions utilisant l'opérateur ET avec (ou sans) un groupe, un message d'erreur approprié est désormais affiché. De plus, l'action correspondante est maintenant appliquée aux champs.

3.31.13

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Qu'est-ce qui a changé ?
Grâce à l'amélioration de l'extraction des documents non structurés dans Document Automation, vous pouvez :
  • traiter efficacement les requêtes complexes ;
  • valider les documents en améliorant la navigation vers la page appropriée.
Solutions
Grâce à l'amélioration de l'extraction des tableaux à l'aide du moteur OCR ABBYY, les commentaires heuristiques fonctionnent désormais correctement.
  • Pour l'allemand, l'extraction des factures fonctionne correctement après l'application des commentaires et toutes les données du tableau sont extraites.
  • Pour l'espagnol, les données du tableau sont extraites correctement de la facture.
  • Pour l'anglais, les données des factures sont extraites de toutes les pages avec l'OCR ABBYY.

ID de cas Service Cloud : 01995901

Lorsqu'un utilisateur extrait les données d'un tableau à partir d'un fichier PDF avec un tableau développé sur plusieurs pages, les données de toutes les pages sont extraites avec succès après avoir appliqué les commentaires heuristiques.

Auparavant, les utilisateurs ne pouvaient pas extraire des données de la deuxième page du fichier PDF lorsque le tableau était développé sur plusieurs pages.

ID de cas Service Cloud : 01996536

En commençant l'extraction à partir de la première page pour tous les champs, le retour heuristique fonctionne désormais correctement pour la capture de données de tableaux multilignes et génère une sortie correcte.

Auparavant, les données de tableaux multilignes n'étaient pas extraites, même après avoir fourni des commentaires heuristiques. Par conséquent, la sortie n'était pas générée correctement.

ID de cas Service Cloud : 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Pour les Formulaires standard Microsoft, l'extraction du tableau n'échoue plus lorsque les cellules sont vides et les utilisateurs peuvent extraire le document avec succès.
Lorsqu'un utilisateur importe une instance d'apprentissage et traite les documents, le document extrait présente l'ordre correct des mots pour les dates dans toutes les pages.
Lorsqu'un utilisateur importe une instance d'apprentissage et traite les documents, toutes les valeurs sont affichées dans le tableau après extraction.

Auparavant, dans de tels cas, la région identifiée par le système (SIR) était mise en évidence mais une valeur vide apparaissait dans le tableau.

Lorsqu'un utilisateur importe un fichier .dw avec des commentaires heuristiques et traite un document qui contient une valeur (-) dans la dernière ligne, les documents sont extraits correctement sans ignorer la valeur négative dans la dernière ligne.

Auparavant, dans de tels cas, la dernière ligne était ignorée, ce qui entraînait une perte de données ou un traitement incorrect.

Lorsqu'un utilisateur traite un document contenant un tableau, l'extraction se termine avec succès sans le message d'erreur DOCUMENT_PARTIALLY_FAILED ou Extraction Timeout.

Auparavant, dans de tels cas, certains documents n'étaient pas extraits en raison de détections multiples à partir du même tableau, ce qui entraînait un problème de taille du tableau (max () arg).

Lorsqu'un utilisateur importe une instance d'apprentissage et traite les documents, toutes les lignes sont extraites séparément de toutes les pages.

Auparavant, les lignes de la deuxième page étaient fusionnées en une seule ligne.

Limitations
Lorsqu'un utilisateur utilise OCR Google Vision, la détection ou l'extraction du tableau ne fonctionne pas.

Solution de contournement : il est recommandé d'utiliser le moteur OCR ABBYY.

ID de cas Service Cloud : 01995901

Dans certains cas, lorsque les tableaux sont répartis sur plusieurs pages sans en-tête dans toutes les pages (pages sans en-tête), les données ne sont pas extraites de toutes les pages après l'application des commentaires.

3.30.24

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Solutions
Les utilisateurs peuvent désormais afficher correctement les données extraites de la deuxième ligne à l'aide des commentaires heuristiques.
Pour le type de document Bon de commande, vous pouvez désormais correctement extraire les valeurs des champs de tableau de toutes les pages.
Le fichier de commentaires généré n'affiche plus de message d'erreur et les utilisateurs peuvent traiter correctement les documents.

3.30.22

  • Version Agent de robot compatible : 21.252 ou versions ultérieures
  • Version Control Room compatible : 19223 ou versions ultérieures
Nouveautés
Document Automation fournit une extraction améliorée grâce aux nouvelles actions Obtenir les données du document et Mettre à jour les données du document. Vous pouvez utiliser ces actions pour appliquer une logique personnalisée à la manipulation et à la validation des données afin d'optimiser le traitement direct (STP) et de réduire les efforts de vérification manuelle.

3.30.21

  • Version Agent de robot compatible : 21.98 ou versions ultérieures
  • Version Control Room compatible : 15345 ou versions ultérieures
Solutions
Cette version du package Extraction de document est un correctif qui corrige l'erreur '501: DOCUMENT_PARTIALLY_FAILED', qui se produisait lors du traitement de certains documents.

3.30.19

  • Version Agent de robot compatible : 21.98 ou versions ultérieures
  • Version Control Room compatible : 15345 ou versions ultérieures
Solutions
Le package Extraction de document offre une meilleure capacité d'extraction pour les colonnes d'en-tête de tableaux complexes.
  • Scénario 1 : Extraction de données à partir d'en-têtes de colonnes de tableaux dont plusieurs en-têtes ont été fusionnés en une seule colonne.
  • Scénario 2 : Extraction de données à partir d'en-têtes de colonnes de tableaux présentant une division en sous-en-têtes.
Pour activer l'extraction améliorée des données d'en-tête de tableau, procédez comme suit :
  1. Créez ou modifiez une instance d'apprentissage.
  2. Pour ajouter ou modifier des champs de tableau, accédez à l'onglet Champs de tableau et cliquez sur Ajouter un champ > Propriétés de champ.
  3. Ajoutez chaque en-tête de tableau comme champ de tableau distinct. Par exemple :

    Scénario 1 : Ajoutez l'en-tête de colonne et chaque sous-en-tête fusionné comme champ de tableau distinct. Utilisez la capture d'écran comme référence pour extraire les données des trois champs d'en-tête de colonne fusionnés, pour lesquels vous créez trois champs de tableau distincts tels que CGST avec l'alias CGST, SGST avec l'alias SGST et CESS avec l'alias CESS.

    Exemple d'en-tête de colonne avec plusieurs sous-en-têtes.

    Scénario 2 : Ajoutez l'en-tête de colonne et chaque sous-en-tête comme champ de tableau distinct. Comme dans l'exemple ci-dessus, pour un en-tête de colonne CGST avec une division en sous-en-têtes Taux et AMT, vous devez créer deux champs de tableau distincts : Taux CGST avec l'alias Taux CGST, et AMT CGST avec l'alias AMT CGST.

    Exemple d'en-tête de colonne avec une division en plusieurs sous-en-têtes.

  4. Cliquez sur Soumettre pour enregistrer vos modifications.

3.29.17

  • Version Agent de robot compatible : 21.98 ou versions ultérieures
  • Version Control Room compatible : 15345 ou versions ultérieures
Solutions
Le package Extraction de document contient des correctifs d'amélioration de l'extraction pour les champs de formulaire et de tableau.

3.29.14

  • Version Agent de robot compatible : 21.98 ou versions ultérieures
  • Version Control Room compatible : 15345 ou versions ultérieures
Nouveautés
Document Automation permet d'améliorer l'extraction grâce à un retour d'information heuristique, en mettant l'accent sur les scénarios complexes, tels que les tableaux multiples. En outre, des améliorations ont été apportées en matière d'extraction pour les champs de formulaire et de performances prêtes à l'emploi (en particulier pour les champs de tableau).