페이지 분류 작업 사용

페이지 분류 작업Train Advanced Classifier 작업을 사용하여 생성된 모델 파일을 기반으로 입력 문서의 페이지를 그룹화하고, 모델에 맞지 않는 페이지를 필터링합니다.

전제 조건

  • 아직 생성하지 않은 경우 Train Advanced Classifier 작업을 사용하여 모델 파일을 생성합니다.
  • 입력 파일이 필요한 형식인지 확인하십시오.

루프 작업 내에서 페이지 분류 작업을 사용하여 Bot을 구축해 선택한 폴더의 각 파일을 반복적으로 분류합니다.

프로시저

  1. 작업 팔레트의 Advanced Classifier 패키지에서 페이지 분류를 더블 클릭하거나 드래그합니다.
  2. 입력 파일 필드에 분류를 위해 들어오는 파일의 기본 파일 경로를 입력합니다.
    • Control Room 파일
    • 바탕화면 파일
    • 변수
  3. Classifier 필드에 모델 파일의 파일 경로를 입력합니다. .zip 폴더를 선택하거나 이 폴더에서 .clsproj3 파일을 추출하여 선택할 수 있습니다.
    • Control Room 파일
    • 바탕화면 파일
    • 변수
  4. 출력 폴더 경로 옵션을 이용하여 분류 출력 문서를 저장합니다. 출력 문서의 페이지는 모델 파일에서 생성된 범주에 따라 해당 하위 폴더에 저장됩니다.
    • 바탕화면 폴더
    • 변수
  5. 라이선스 필드에 라이선스 자격증명을 입력합니다.
  6. 자격증명 옵션을 선택한 경우 선택을 클릭하여 라이선스 로커에서 라이선스를 가져옵니다.
  7. 선택 사항: 다음을 구성합니다.
    분류 출력 변수 저장: 분류 결과를 다음 키와 함께 사전 목록으로 저장합니다.
    • fileName: 인덱스 값과 함께 처리할 파일 이름입니다. 예를 들어, <<file name_pageIndex>>
    • 인덱스: 페이지가 여러 개인 경우 페이지 번호 값
    • category: 분류 후 파일이 속한 카테고리입니다. 예를 들어 모든 인사 관련 문서는 하나의 카테고리에 배치됩니다.
    • confidence: 학습 데이터를 기반으로 어떤 파일이 어떤 카테고리에 속하는지 등의 분류를 보여주는 임계값 백분율 값입니다.
    주:
    • Advanced Classifier에서 다음 분류 유형을 선택할 수 있습니다.
      • 이미지 기반 분류
      • 텍스트 기반 분류
      • 이미지 및 텍스트 기반 모두 분류
  8. 저장실행을 클릭합니다.

다음 단계

유사한 문서의 각 하위 폴더를 사용하여 문서에서 데이터를 추출하는 학습 인스턴스를 생성하고 트레이닝할 수 있습니다.