Automation 360

Utiliser le moteur OCR API Google Vision

Télécharger au format PDF

Contenus

Utiliser le moteur OCR API Google Vision

Télécharger au format PDF

Dernière mise à jour2021/09/21

Utiliser le moteur OCR API Google Vision

Utilisez le moteur Reconnaissance de texte API Google Vision avec IQ Bot pour améliorer la précision des résultats de reconnaissance optique des caractères (Reconnaissance de texte) pour les documents d'entraînement en langues asiatiques, en particulier en japonais et en coréen. Le moteur Reconnaissance de texte API Google Vision dans IQ Bot prend en charge toutes les langues gérées par le moteur.

Prérequis

Vérifiez que le port par défaut 443 est disponible pour activer la communication pour le point de terminaison de l’API à l’aide de TCP.

Remarque : Consultez la liste des URL de service autorisées pour l’utilisation de API Google Vision dans la section d’exemple ci-dessous.

API Google Vision Les fichiers sont installés automatiquement sur votre ordinateur pendant l’installation de IQ Bot et sont fournis sous forme de plug-in intégré, avec une installation en une étape, et sont disponibles pour tous les utilisateurs :

Il s’agit d’un moteur Reconnaissance de texte cloud.
API Google Vision ne prend pas en charge les documents incluant plusieurs langues. Avant d'utiliser cette fonctionnalité, assurez-vous d'extraire le texte en japonais ou en coréen.
Les langues écrites de droite à gauche plutôt que de gauche à droite ne sont pas prises en charge dans IQ Bot pour l’extraction de document. Par exemple, l'arabe, l'araméen, l'azéri, le divehi, le fula, l'hébreu, le kurde, le n'ko, le persan, le rohingya, le syriaque et l'urdu.
Avant cette version, le moteur prenait principalement en charge l’extraction de données pour le texte japonais et coréen uniquement.

Langues prises en charge dans Automation 360 IQ Bot
Les données ne sont pas stockées dans Google Cloud et sont immédiatement supprimées.
Pour plus d’informations sur la confidentialité pour la conservation des données, voir : Google Data Usage

IQ Bot vous fournit la licence d’utilisation du moteur. API Google Vision Reconnaissance de texte Vous pouvez également utiliser votre propre clé de licence.

Utilisez vos propres clés de licence pour le moteur OCR de API Google Vision

Remarque : Les mises à jour de API Google Vision telles que les améliorations du moteur Reconnaissance de texte, les améliorations et les corrections de bogues peuvent affecter l'extraction du contenu lorsque vous utilisez ce moteur Reconnaissance de texte dans IQ Bot. Par conséquent, nous vous recommandons de consulter régulièrement les notes de version API Google Vision pour connaître les dernières mises à jour.

Reportez-vous à la rubrique Impact potentiel de la mise à niveau de la reconnaissance de texte API Google Vision.

Vous disposez des options suivantes pour utiliser ce moteur Reconnaissance de texte :


Options	Description
Option 1 : Définir API Google Vision comme votre moteur par défaut	Configurez le fichier Settings.txt. Restriction : La configuration du fichier settings.txt n'est pas applicable à Automation 360 IQ Bot cloud
Option 2 : Sélectionnez le moteur API Google Vision directement à partir de l’interface utilisateur lors de la création d’une instance d’apprentissage	Sélectionner un moteur Reconnaissance de texte

Procédure

Pour définir API Google Vision comme moteur Reconnaissance de texte par défaut, configurez le fichier Settings.txt comme suit :

Restriction : La configuration du fichier settings.txt n'est pas applicable à Automation 360 IQ Bot cloud

Exécutez le programme d’installation IQ Bot.
Facultatif : Définissez API Google Vision comme OCR par défaut pour les nouvelles instances d'apprentissage.
Accédez à ..\Automation 360 IQ Bot\Configurations\Settings.txt et modifiez la valeur suivante : OCREngine=GoogleVisionAPI.

Cela définira le moteur API Google Vision Reconnaissance de texte comme moteur par défaut pour votre environnement.

Le fichier GoogleOCREngineSettings.json est généré dans le dossier ..\Automation 360 IQ Bot\Configurations avec les valeurs par défaut, comme suit :

Utilisez ce qui suit avec API Google Vision :

{
  "ADCJson": null,
  "EngineType": 2,
  "EnableFieldMerging": true,
  "EnableFieldRegions": true,
  "DebuggingFolder": "C:\\Users\\Public\\Documents\\Automation 360 IQBot Platform\\Logs\\Engine\\Google"
 }

Pour les documents en japonais et en coréen, mettez à jour le champ : "EnableCustomParse": true.

Remarque : Le redémarrage du service n'est pas nécessaire après la modification.

Liste des URL de service utilisées pour API Google Vision (facultatif)

Utilisez les URL autorisées suivantes si nécessaire :

Remarque : Toutes les URL d’API pointent vers une région de service mondiale aux États-Unis.

URL de l'API : https://vision.googleapis.com/
URL d'authentification : https://accounts.google.com/o/oauth2/auth
URL du jeton : https://oauth2.googleapis.com/token
URL du fournisseur d'authentification : https://www.googleapis.com/oauth2/v1/certs
URL d'authentification du client : https://www.googleapis.com/robot/v1/metadata/x509

Étapes suivantes

Créez une nouvelle instance d'apprentissage avec le document de langue asiatique que vous souhaitez entraîner.
Entraînez le document et configurez votre instance d'apprentissage sur la phase de production.
Téléchargez les fichiers de langue asiatique et exécutez le robot.
Téléchargez et passez en revue le niveau précision des résultats de l'extraction.

Pas de rubrique précédente

Pas de rubrique suivante

Pas de rubrique précédente

Pas de rubrique suivante