Impact potentiel de la mise à niveau de la reconnaissance de texte API Google Vision

La reconnaissance de texte API Google Vision est basée sur le cloud, et généralement, elle est mise à jour vers une version plus récente selon le cycle de publication de Google. Cette mise à niveau peut avoir un impact sur le traitement de l'extraction de documents et sur les résultats de l'extraction dans IQ Bot.

Impact sur la classification des documents dans IQ Bot après la mise à jour de la reconnaissance de texte API Google Vision

La classification des documents est basée sur le résultat de la reconnaissance de texte, en particulier l'ordre dans lequel les champs sont détectés. Ainsi, si le contenu des résultats de la reconnaissance de texte varie, les résultats de classification du document similaire traité précédemment peuvent présenter des différences visibles lors de l'extraction du document.

La mise à jour automatique affecte le service de classification de deux manières :
  • Différents groupes sont affectés aux documents : une fois traités, les documents seront affectés à des groupes différents de ceux vers lesquels ils ont été acheminés jusqu'à présent. Par conséquent, certaines extractions de données, qui étaient auparavant réussies, peuvent échouer.
  • Des groupes sont créés : les documents qui étaient précédemment traités avec un groupe peuvent maintenant donner lieu à la création d'un autre groupe.

Impact sur l'extraction des données dans IQ Bot après la mise à jour de la reconnaissance de texte API Google Vision

Une modification de la sortie de la reconnaissance de texte peut entraîner les différences suivantes lors de l'extraction de données d'un type de document similaire :

  • Amélioration de la reconnaissance des caractères et son impact associé : Grâce à l'amélioration de la reconnaissance des caractères des mots-clés, les valeurs précédemment non reconnues d'un document fourniront désormais de meilleurs résultats d'extraction.
    Remarque : Si une logique de traitement est écrite pour remédier à l'absence de caractères détectés, cela peut causer des problèmes lors du traitement du document.
  • Dégradation de la reconnaissance des caractères et son impact : la validation peut échouer en raison d'une dégradation de la sortie de la reconnaissance de texte, et le document sera acheminé vers le validateur. Dans un scénario où il n'y a pas de configuration de validation, la sortie des données extraites peut subir une dégradation.

Options d'atténuation

Si vous rencontrez l'un des problèmes mentionnés ci-dessus, vous pouvez explorer les options suivantes :

  • Réentraînez l'instance d'apprentissage existante pour résoudre les problèmes de classification des documents.
  • Rédigez une logique de traitement à l'aide de Python pour atténuer les résultats de l'extraction.
  • Évaluez la création d'une instance d'apprentissage avec différents fournisseurs OCR pris en charge par IQ Bot.
  • Ouvrez un ticket d'assistance avec Automation Anywhere.