Amélioration de la qualité des résultats à l'aide de la confiance OCR
- Mis à jour : 2019/05/20
Amélioration de la qualité des résultats à l'aide de la confiance OCR
Améliorez la qualité des résultats de la plateforme IQ Bot en utilisant la confiance OCR au niveau des caractères SIR (System Identified Region, région identifiée par le système) et en la comparant à un seuil prédéfini.
La validation basée sur la confiance est utile pour un champ de type texte. Pour les champs Date ou Nombre également, la validation basée sur la confiance peut aider à acheminer un document contenant des valeurs difficiles à voir pour un humain, même si les champs peuvent satisfaire aux critères de validation définis.
Activer la validation basée sur la confiance OCR
Cette fonctionnalité est désactivée par défaut. Pour activer cette fonctionnalité, ouvrez le fichier de configuration Settings.txt disponible dans <IQ Bot Installation Folder>\Configurations\, et définissez la valeur de seuil souhaitée dans la propriété ConfidenceThreshold. Pour cet exemple, définissez la valeur du seuil de confiance au niveau du caractère sur 99, soit ConfidenceThreshold=99
. Lorsque cette fonctionnalité est désactivée, la valeur par défaut est définie sur 0.
Fonctionnement de la validation basée sur la confiance OCR
Dans un document, si le niveau de confiance au niveau des caractères SIR d'un champ est inférieur à celui du seuil de confiance défini, la validation de ce champ échoue et entraîne l'échec du document concerné.
Lors de l'entraînement avec un document, l'échec de la validation basée sur la confiance par rapport à un champ s'affiche dans un rectangle orange dans l'aperçu (s'il n'existe aucune autre erreur de validation pour ce champ). D'autres erreurs de validation ont priorité sur la validation par niveau de confiance OCR au niveau des caractères.
Data objects (SIRs) are not identified by OCR for Chinese PDF documents (A-People login required)
How to convert PDF files to TIFF files (A-People login required)