Lire et examiner la documentation Automation Anywhere

Automation Anywhere Automation 360

Fermer les contenus

Contenus

Ouvrir les contenus

Sélectionner un moteur OCR

  • Mis à jour le : 9/09/2021
    • Automation 360 v.x
    • IQ Bot
    • Flux de processus
    • Digitize

Sélectionner un moteur OCR

Vous pouvez sélectionner différents moteurs OCR à partir de l’interface utilisateur pour voir ce qui correspond le mieux à vos exigences pour l’extraction de données en fonction de vos types de documents. Il n’est pas nécessaire d’arrêter et de redémarrer les services IQ Bot pour mettre en œuvre une modification de moteur.

Pendant l’installation de IQ Bot, le système définit la dernière version de Tesseract Optical Character Reader comme moteur OCR par défaut. Il s’agit également du paramètre global pour le produit.

Cependant, vous pouvez définir manuellement le moteur OCR dans le fichier Settings.txt, qui devient le moteur par défaut. Comme pour les versions précédentes de IQ Bot, vous pouvez continuer à mettre à jour manuellement le fichier Settings.txt avec le nom du moteur OCR que vous souhaitez définir comme moteur par défaut.

Si vous sélectionnez une version obsolète du moteur OCR ou un moteur non pris en charge via la configuration du fichier Settings.txt, le système affiche un message d'erreur.

Lors de la création d’une instance d'apprentissage, vous pouvez sélectionner un OCR moteur dans la liste déroulante disponible directement dans l’interface utilisateur.
Remarque : La sélection d'un moteur OCR dans l'interface remplace les paramètres du fichier Settings.txt.

Créer une instance d'apprentissage

Procédure

  1. Sur la page Créer une nouvelle instance d'apprentissage, sélectionnez le domaine et la langue des documents.
    Dans la page Ma liste d'instances d'apprentissage, une nouvelle colonne Moteur OCR est disponible qui montre le moteur OCR utilisé pour créer chaque instance d'apprentissage. Ces informations sont utiles à l’utilisateur lorsqu’il décide du traitement du document.
  2. Les sections Champs à extraire et Paramètres avancés s'affichent lorsque vous sélectionnez le domaine.
    Chaque domaine est disponible avec une liste prédéfinie de langues principales prises en charge. La sélection de la langue est activée et disponible dans la liste déroulante Langue principale des documents en fonction des langues prises en charge pour un domaine spécifique.
    Remarque : Si vous sélectionnez une langue dans la liste déroulante Langue principale des documents, puis sélectionnez un moteur qui ne prend pas en charge cette langue, le système affiche un message d'erreur dans la liste déroulante Reconnaissance optique des caractères.
  3. Cliquez sur Paramètres avancés > Reconnaissance optique des caractères pour afficher la liste déroulante des options du moteur OCR.

    Si la sélection du moteur OCR n'est pas valide, l'option Créer une instance et analyser n'est pas activée.

    Remarque : IQ Bot installe automatiquement tous les moteurs OCR pendant le processus d’installation, à l’exception de ABBYY FineReader Engine.
    Important : Vous pouvez uniquement configurer le moteur OCR sélectionné dans Automation 360 IQ Bot On-Premises. Il n'est pas possible de modifier les paramètres OCR dans Automation 360 IQ Bot Cloud car ils ne sont pas accessibles, sauf pour ABBYY FineReader Engine. Vous pouvez modifier les paramètres de configuration pour ABBYY FineReader Engine à l'aide de l'API REST appconfigurations.

    Vous pouvez sélectionner l'une des options suivantes :

    OptionDescription
    Tesseract OCR4 Il s'agit du moteur par défaut, à moins qu'il ne soit modifié dans le fichier Settings.txt.
    ABBYY FineReader Engine

    Pour vérifier si ABBYY FineReader Engine est installé et disponible sur votre ordinateur, consultez le fichier Settings.txt, le dossier de plug-ins OCR des fichiers SDK et la liste déroulante Reconnaissance optique des caractères.

    Remarque : Également pris en charge dans IQ Bot [Local Device] package et IQ Bot Extraction package.

    Utiliser le moteur ABBYY FineReader Engine OCR dans IQ Bot

    Microsoft Azure Computer Vision OCR engine IQ Bot prend en charge toutes les langues gérées par ce moteur OCR.

    Utilisez Microsoft Azure Computer Vision OCR engine.

    Google Vision API IQ Bot prend en charge Google Vision API en tant que moteur OCR et prend en charge toutes les langues gérées par ce moteur.

    Utiliser le moteur OCR Google Vision API

    Tegaki API IQ Bot prend en charge son moteur OCR pour extraire des données propres aux documents en japonais et en coréen. Vous devez télécharger et utiliser votre licence privée pour utiliser Tegaki API.
    Remarque : Le moteur OCR Tegaki API n'est pas pris en charge dans Automation 360 IQ Bot Cloud.

    Utiliser Tegaki API OCR le moteur

    Mes documents PDF n'ont pas d'image

    Tous les documents PDF que vous chargez sont traités par défaut à l'aide de OCR PDFBox, quel que soit le moteur OCR que vous avez spécifié ou sélectionné.

    Si vous chargez des documents non PDF ou des documents PDF contenant des images, désactivez la case à cocher Mes documents PDF n'ont pas d'image pour vous assurer que le moteur OCR que vous avez spécifié ou sélectionné est utilisé pour traiter les documents.

    La case Mes documents PDF n'ont pas d'image est cochée par défaut. Pour désactiver cette fonction, reportez-vous à la section Désactiver l’option PDFBox.
    Conseil : Si IQ Bot n’est pas en mesure d’extraire des données de documents de mauvaise qualité ou manuscrits, solutionnez le problème :

    IQ Bot unable to extract data from low quality and Handwritten documents (A-People login required)

Envoyer le commentaire