OCR 신뢰도를 사용하여 출력 품질 개선

사전 정의된 임계값과 비교하여 시스템 식별 영역(SIR) 및 광학 문자 인식(OCR) 신뢰도를 사용하여 IQ Bot 플랫폼의 출력 품질을 개선합니다.

신뢰도 기반 유효성 검사는 텍스트 유형 필드와 날짜 또는 번호 필드에 유용합니다. 이는 필드가 설정 유효성 검사 기준을 충족함에도 불구하고 논쟁의 여지가 있는 값으로 문서를 라우팅하는 데 도움이 되기 때문입니다.

OCR 신뢰도 기반 유효성 검사 사용

주: 이 옵션은 학습 인스턴스를 생성할 Tesseract OCR 때 선택한 경우에만 적용됩니다.

이 기능은 기본적으로 비활성화되어 있습니다. 이 기능을 활성화하려면 \\Configurations\\에서 사용할 수 있는 <IQ Bot Installation Folder>Settings.txt 구성 파일을 열고 ConfidenceThreshold 속성에서 원하는 임계값을 설정합니다. 이 예제에서는 문자 수준 신뢰 임계값을 99로 설정합니다. 즉, ConfidenceThreshold=99입니다. 이 기능이 비활성화되면 기본값이 0으로 설정되어 기능이 비활성화되었음을 나타냅니다.

주: 신뢰 임계값은 모든 학습 인스턴스에 걸쳐 균일하게 적용됩니다.

OCR 신뢰도 기반 검증의 작동 방식

문서에서 필드의 SIR 문자 수준 신뢰도가 설정된 신뢰도 임계값보다 낮으면 해당 필드에 대한 유효성 검사가 실패하여 해당 문서가 실패합니다.

주: OCR 신뢰도 검증 실패 이외의 검증 규칙(예: 잘못된 숫자 형식)으로 인해 필드 값이 실패하는 경우 낮은 신뢰도에 대한 툴팁이 아니라 해당 툴팁이 표시됩니다.

문서를 교육하는 동안 해당 필드에 대해 다른 유효성 검사 오류가 없는 경우 해당 필드에 대한 신뢰도 기반 유효성 검사 실패가 미리보기 중 주황색 상자에 나타납니다. 다른 검증 오류는 OCR 문자 수준 신뢰도 검증보다 우선합니다.

Troubleshoot: OCR 엔진이 중국어 PDF 문서에 대한 SIR을 식별할 수 없는 경우 문제를 해결합니다.