문서 분할 작업을 사용하여 선택한 분류 모델을 기반으로 입력 문서를 여러 문서로 분리합니다.
전제 조건
- 아직 생성하지 않은 경우 Train Advanced Classifier 작업을 사용하여 모델 파일을 생성합니다.
- 입력 파일이 필요한 형식인지 확인하십시오.
문서를 여러 문서로 분할하려면 다음과 같이 합니다.
프로시저
-
작업 팔레트의 Advanced Classifier 패키지에서 문서 분할 작업을 더블 클릭하거나 드래그합니다.
주: 문서 분할 작업에는 여러 페이지가 있는 PDF 및 TIFF 문서만 입력할 수 있습니다.
-
입력 파일 경로에서, 다음 옵션 중 하나를 선택하여 입력 파일의 위치를 지정합니다.
- Control Room 파일
- 바탕화면 파일
- 변수
-
출력 폴더 경로 옵션을 이용하여 분류 출력 문서를 저장합니다.
-
라이선스 필드에 라이선스 자격증명을 입력합니다.
-
자격증명 옵션을 선택한 경우 선택을 클릭하여 자격증명 저장소의 라이선스를 입력합니다.
-
분할 출력 변수 저장 옵션을 이용하여 분류 출력 문서를 저장합니다. 분류 결과를 다음 키와 함께 사전 목록으로 저장합니다.
- fileName: 처리하려는 파일 이름
- documentIndex: 문서 번호(카테고리별)
- pageIndex: 페이지 번호(문서 기준)
- category: 분류 후 파일이 속한 카테고리입니다. 예를 들어 모든 인사 관련 문서는 하나의 카테고리에 배치됩니다.
- classConfidence: 시스템은 학습 데이터를 기반으로 문서를 분류하고 어떤 파일이 어떤 카테고리에 속하는지 등의 분류를 보여주는 임계값 백분율 값을 식별합니다.
- splitConfidence: 시스템은 학습 데이터를 기반으로 문서를 다양한 카테고리로 분할하고 분류에 대한 분할 신뢰도를 나타내는 분할 백분율 값을 식별합니다.
-
저장 및 실행을 클릭합니다.