Melhorar a qualidade da saída usando a confiança do OCR

Melhorar a qualidade de saída da plataforma IQ Bot usando a região identificada do sistema (SIR) e a confiança de reconhecimento de caracteres ópticos (OCR), comparando-a com um limite predefinido.

A validação baseada na confiança é útil para um campo tipo texto e para campos de Data ou Número porque ajuda a encaminhar um documento, com valores controversos, para um humano visualizar apesar de os campos satisfazerem os critérios de validação estabelecidos.

Habilitar validação baseada na confiança de OCR

Nota: Esta opção só é aplicável se você selecionou Tesseract OCR ao criar a instância de aprendizado.

Este recurso está desativado por padrão. Para habilitar este recurso, abra o arquivo de configuração Settings.txt disponível em <IQ Bot Installation Folder>\Configurations\ e definir o valor limite desejado na propriedade ConfidenceThreshold. Para este exemplo, defina o valor do limite de confiança no nível do caractere como 99, ou sejaConfidenceThreshold=99. Quando este recurso é desativado, o valor padrão é definido como 0, o que significa que o recurso está desativado.

Nota: O valor do limite de confiança é uniformemente aplicável em todas as instâncias de aprendizado.

Como funciona o trabalho de validação com base na confiança no OCR

Em um documento, se a confiança no nível de caracteres SIR de um campo for menor do que a do limite de confiança definido, a validação para esse campo falhará, resultando na falha do documento.

Nota: Se um valor de campo falhar devido a uma regra de validação (por exemplo, Formato de número inválido) que não seja a falha de validação de confiança no OCR, você verá essa dica de ferramenta e não a dica de ferramenta para Baixa confiança.

Ao treinar um documento, a falha de validação baseada na confiança contra um campo aparece em uma caixa laranja durante a pré-visualização, se não existirem outros erros de validação para esse campo. Outros erros de validação tem precedência sobre a validação de confiança no nível de caracteres do OCR.