Lea y revise la documentación de Automation Anywhere

Automation 360

Cerrar contenidos

Contenidos

Abrir contenidos

Mejorar la calidad de los resultados mediante la confianza del OCR

  • Actualizado: 2022/08/31
    • Automation 360 v.x
    • IQ Bot
    • Digitize

Mejorar la calidad de los resultados mediante la confianza del OCR

Mejorar la calidad de salida de la IQ Bot plataforma utilizando la región identificada por el sistema (SIR) y la confianza del reconocimiento óptico de caracteres (OCR) comparándola con un umbral predefinido.

La validación basada en la confianza es útil para un campo de tipo texto y para los campos de Fecha o Número porque ayuda a dirigir un documento, con valores conflictivos, para que un humano lo vea a pesar de que los campos satisfagan los criterios de validación establecidos.

Habilitar la validación basada en la confianza del OCR

Nota: Esta opción sólo es aplicable si ha seleccionado Tesseract OCR al crear la instancia de aprendizaje.

Esta función esta inhabilitada de forma predeterminada. Para activar esta función, abra el archivo Ajustes.txt disponible en <carpeta de instalación de IQ Bot>\NConfiguracionesy establezca el valor del umbral deseado en el campo ConfidenceThreshold de confianza. Para este ejemplo, establezca el valor del umbral de confianza a nivel de caracteres en 99es decir Umbral de confianza=99. Cuando esta función está desactivada, el valor por defecto es 0, lo que significa que la función está desactivada.

Nota: El valor del umbral de confianza se aplica uniformemente a todas las instancias de aprendizaje.

Cómo funciona la validación basada en la confianza del OCR

En un documento, si la confianza del nivel de caracteres SIR de un campo es inferior a la del umbral de confianza establecido, la validación de ese campo falla, lo que provoca el fracaso de ese documento.

Nota: Si un valor de campo falla debido a una regla de validación (por ejemplo, Formato de número no válido) que no sea un fallo de validación de confianza del OCR, verá esa información sobre herramientas, y no la de Confianza baja.

Mientras se entrena un documento, un fallo de validación basado en la confianza contra un campo aparece en un cuadro naranja durante la vista previa si no existen otros errores de validación para ese campo. Otros errores de validación tienen prioridad sobre la validación de confianza a nivel de caracteres del OCR.

Troubleshoot: Si el motor de OCR no puede identificar los SIR de los documentos PDF en chino, solucione el problema:
Enviar comentarios