IQ Bot 분류 작업은 IQ Bot Train Classifier 작업을 사용하여 생성된 모델 파일을 기준으로 입력 문서의 페이지를 그룹화합니다.
루프 작업 내에서 분류 작업을 사용하여 봇을 작성해 선택한 폴더의 각 파일을 반복적으로 분류합니다.
프로시저
-
작업 팔레트의 루프 패키지에서 루프 작업을 더블 클릭하거나 드래그합니다.
-
루프 유형 필드에서 반복자 옵션을 선택합니다.
-
반복자 필드의 드롭다운 목록에서 폴더 내 각 파일 대상을 선택합니다.
-
폴더 경로 필드에서 입력 파일이 포함된 폴더의 경로를 선택합니다.
-
이 변수에 파일 이름 및 확장명 지정 필드에서 사전 변수를 생성하거나 선택하여 선택한 폴더 경로에 파일의 이름 및 확장명을 저장합니다.
이 예에서는 dictFile이라는 사전 변수를 사용합니다.
-
작업 팔레트의 Document Classifier 패키지에서 분류 작업을 더블 클릭하거나 드래그합니다.
-
입력 파일 필드에서 변수를 사용하여 동적 파일 경로를 입력합니다.
-
폴더를 가리키는 파일 경로를 추가합니다(예: C:\input\).
-
동적 파일 이름 문자열을 추가합니다. $dictFile(name)$.$dictFile(extension)$.
주: 파일 이름이 포함된 변수와 확장명이 포함된 변수 사이에 마침표를 포함해야 합니다.
이름 및 확장명 키는 미리 정의되어 있습니다. 작업은 루프에 삽입되고 실행될 때 전체 폴더를 반복하여 폴더 내의 모든 파일을 한 번에 하나씩 호출합니다. 입력 파일 값은 다음과 같습니다. C:\input\$dictFile(name)$.$dictFile(extension)$
-
분류기 필드에 모델 파일에 대한 파일 경로를 입력합니다.
.zip 폴더를 선택하거나 이 폴더에서
.icmf 파일을 추출하여 선택할 수 있습니다.
주: 더 나은 분류 결과 및 성능을 위해 Train Classifier 작업로부터 얻은 .zip 폴더에서 사용 가능한 .icmf 파일을 사용하는 것이 좋습니다.
-
출력 폴더 경로 옵션을 사용하여 분류 출력 문서를 저장합니다.
- 옵션:
다음 고급 설정을 구성합니다.
- 신뢰도 임계값(%): 페이지의 범주 예측에 대한 신뢰 값이 신뢰도 임계값보다 작으면 Unclassified 폴더로 이동합니다.
- 분류 출력 변수 저장: 분류 결과를 다음 키와 함께 사전 목록으로 저장합니다.
- fileName
- pageIndex
- category
- confidence
주:
- 문서 분류기에서 다음 분류 유형을 선택할 수 있습니다.
- 이미지 기반 분류
- 텍스트 기반 분류
- 이미지 및 텍스트 기반 모두 분류
- 더 높은 신뢰도 임계값을 예상하려면 문서 페이지가 유사할 때 신뢰도 임계값을 계산하는 것이 좋습니다. 필요한 신뢰도 임계값을 결정하기 위해 분류 출력에서 신뢰도 값을 검토할 수 있습니다.
- 문서 분류기는 분류를 위한 언어를 자동 감지할 수 있으며, ABBYY(광학 문자 인식 애플리케이션)에서 지원하는 모든 언어를 지원합니다.
-
저장 및 실행을 클릭합니다.
출력 문서의 페이지는 모델 파일에서 생성된 범주에 따라 해당 하위 폴더에 저장됩니다. 출력 폴더의 이전에 분류된 모든 문서를 덮어씁니다.
다음 단계
유사한 문서의 각 하위 폴더를 사용하여 문서에서 데이터를 추출하는 학습 인스턴스를 생성하고 트레이닝할 수 있습니다. 학습 인스턴스 생성 항목을 참조하십시오.