문서 분할 작업 사용

문서 분할 작업을 사용하여 선택한 분류 모델을 기반으로 입력 문서를 여러 문서로 분리합니다.

전제 조건

  • 아직 생성하지 않은 경우 Train Advanced Classifier 작업을 사용하여 모델 파일을 생성합니다.
  • 입력 파일이 필요한 형식인지 확인하십시오.

문서를 여러 문서로 분할하려면 다음과 같이 합니다.

프로시저

  1. 작업 팔레트의 Advanced Classifier 패키지에서 문서 분할 작업을 더블 클릭하거나 드래그합니다.
    주: 문서 분할 작업에는 여러 페이지가 있는 PDF 및 TIFF 문서만 입력할 수 있습니다.
  2. 입력 파일 경로에서, 다음 옵션 중 하나를 선택하여 입력 파일의 위치를 지정합니다.
    • Control Room 파일
    • 바탕화면 파일
    • 변수
  3. 출력 폴더 경로 옵션을 이용하여 분류 출력 문서를 저장합니다.
    • 바탕화면 폴더
    • 변수
  4. 라이선스 필드에 라이선스 자격증명을 입력합니다.
  5. 자격증명 옵션을 선택한 경우 선택을 클릭하여 자격증명 저장소의 라이선스를 입력합니다.
  6. 분할 출력 변수 저장 옵션을 이용하여 분류 출력 문서를 저장합니다. 분류 결과를 다음 키와 함께 사전 목록으로 저장합니다.
    • fileName: 처리하려는 파일 이름
    • documentIndex: 문서 번호(카테고리별)
    • pageIndex: 페이지 번호(문서 기준)
    • category: 분류 후 파일이 속한 카테고리입니다. 예를 들어 모든 인사 관련 문서는 하나의 카테고리에 배치됩니다.
    • classConfidence: 시스템은 학습 데이터를 기반으로 문서를 분류하고 어떤 파일이 어떤 카테고리에 속하는지 등의 분류를 보여주는 임계값 백분율 값을 식별합니다.
    • splitConfidence: 시스템은 학습 데이터를 기반으로 문서를 다양한 카테고리로 분할하고 분류에 대한 분할 신뢰도를 나타내는 분할 백분율 값을 식별합니다.
  7. 저장실행을 클릭합니다.