Mejore la calidad de salida utilizando la confianza de OCR

Mejorar la calidad de salida de IQ Bot la plataforma mediante la confianza de la región identificada por el sistema (SIR) y el reconocimiento óptico de caracteres (OCR) comparándolo con un umbral predefinido.

La validación basada en la confianza resulta útil para un campo de tipo de texto y para los campos Fecha o Número porque ayuda a enrutar un documento, con valores contenciosos, para que lo vea un ser humano a pesar de los campos que cumplen los criterios de validación establecidos.

Active la validación basada en confianza de OCR

Nota: Esta opción sólo es aplicable si se ha seleccionado Tesseract OCR al crear la instancia de aprendizaje.

Esta función está desactivada de forma predeterminada. Para habilitar esta función, abra el archivo de configuración Settings.txt disponible en <IQ Bot Installation Folder>\Configurations\y establezca el valor de umbral deseado en la propiedad ConfidenceThreshold . En este ejemplo, establezca el valor del umbral de confianza a nivel de carácter en 99, es decir , ConfidenceThreshold=99. Cuando esta función está desactivada, el valor predeterminado se establece en 0, lo que significa que la función está desactivada.

Nota: El valor del umbral de confianza se aplica uniformemente a todas las instancias de aprendizaje.

Cómo funciona la validación basada en confianza de OCR

En un documento si la confianza de nivel DE carácter SIR de un campo es inferior a la del umbral de confianza establecido, la validación de ese campo falla, lo que resulta en el fallo de ese documento.

Nota: Si un valor de campo falla debido a una regla de validación (por ejemplo, Formato de número no válido) que no sea un error de validación de confianza de OCR, verá la información sobre herramientas y no la información sobre herramientas para Confianza baja.

Durante la formación de un documento, aparece un error de validación basado en la confianza en un campo en un cuadro naranja durante la vista previa si no existen otros errores de validación para ese campo. Otros errores de validación tienen prioridad sobre la validación de confianza a nivel de caracteres de OCR.

Troubleshoot: Si el motor de OCR no puede identificar SIR para documentos PDF en idioma chino, solucione el problema: