OCR 신뢰성을 사용하여 출력 품질 향상

사전 정의된 임계값과 비교하여 시스템 식별 영역(SIR) 및 광학 문자 인식(OCR) 신뢰를 사용하여 IQ Bot 플랫폼의 출력 품질을 향상시킵니다.

신뢰 기반 유효성 검사는 텍스트 유형 필드와 날짜 또는 숫자 필드에 유용합니다. 설정된 유효성 검사 기준을 충족하는 필드에도 불구하고 사람이 볼 수 있도록 논쟁의 여지가 있는 값으로 문서를 라우팅하는 데 도움이 되기 때문입니다.

OCR 신뢰 기반 유효성 검사 사용

주: 이 옵션은 학습 인스턴스를 생성할 때 Tesseract OCR을 선택한 경우에만 적용됩니다.

이 기능은 기본적으로 사용되지 않습니다. 이 기능을 사용하려면 <IQ Bot Installation Folder>\Configurations\에서 사용할 수 있는 Settings.txt 구성 파일을 열고 ConfidenceThreshold 속성에서 원하는 임계값을 설정합니다. 이 예에서는 문자 수준 신뢰도 임계값을 99로 설정합니다. 따라서 ConfidenceThreshold=99입니다. 이 기능을 사용하지 않으면 기본값이 0으로 설정되어 기능을 사용할 수 없음을 나타냅니다.

주: 신뢰 임계 값은 모든 학습 인스턴스에 걸쳐 균일하게 적용됩니다.

OCR 신뢰 기반 검증이 작동하는 방법

문서에서 필드의 SIR 문자 수준 신뢰도가 신뢰도 임계 값보다 낮 으면 해당 필드에 대한 유효성 검사가 실패하여 해당 문서가 실패합니다.

주: OCR 신뢰도 유효성 검사 실패 이외의 유효성 검사 규칙(예: 유효하지 않은 숫자 형식)으로 인해 필드 값이 실패한 경우, 낮은 신뢰도에 대한 툴팁이 아니라 해당 툴팁을 볼 수 있습니다.

문서를 트레이닝하는 동안 해당 필드에 대해 다른 유효성 검사가 오류가 없는 경우 필드에 대한 신뢰 기반 유효성 검사 실패가 미리보기 중에 주황색 상자에 나타납니다. 다른 유효성 검사 오류는 OCR 문자 수준 신뢰 유효성 검사보다 우선합니다.

Troubleshoot: OCR 엔진이 중국어 PDF 문서에 대한 SIR을 식별할 수 없는 경우, 문제를 해결합니다.