문서 분류 사용 작업

문서 분류 작업Train Advanced Classifier 작업으로 생성된 특정 모델 파일을 사용하여 각 문서의 첫 번째 페이지를 기반으로 입력 문서를 그룹화합니다.

전제 조건

  • 아직 생성하지 않은 경우 Train Advanced Classifier 작업을 사용하여 모델 파일을 생성합니다.
  • 입력 파일이 필요한 형식인지 확인하십시오.
주: 다음과 같은 작업으로 bot을 생성하고 bot을 실행하면 오류가 표시됩니다.
  1. 고급 분류기 패키지의 문서 분류 작업을 사용하여 문서를 분류할 수 있습니다.
  2. 문서 추출 패키지에 있는 비정형 문서 유형의 학습 인스턴스를 사용하는 데이터 추출 작업을 사용하여 문서에서 데이터를 추출합니다.

따라서 같은 bot에서 비정형 문서 유형의 학습 인스턴스를 사용하는 문서 분류 작업 및 데이터 추출 작업을 사용하지 않을 것을 권장합니다.

루프 작업 내에서 문서 분류 작업을 사용하여 Bot을 작성해 선택한 폴더의 각 파일을 반복적으로 분류합니다.

프로시저

  1. 작업 팔레트의 Advanced Classifier 패키지에서 문서 분류 작업을 더블 클릭하거나 드래그합니다.
  2. 입력 파일 필드에 분류를 위해 들어오는 파일의 기본 파일 경로를 입력합니다.
    • Control Room 파일
    • 바탕화면 파일
    • 변수
  3. Classifier 필드에 모델 파일의 파일 경로를 입력합니다. .zip 폴더를 선택하거나 이 폴더에서 .clsproj3 파일을 추출하여 선택할 수 있습니다.
    • Control Room 파일
    • 바탕화면 파일
    • 변수
  4. 출력 폴더 경로 옵션을 이용하여 분류 출력 문서를 저장합니다. 출력 문서의 페이지는 모델 파일에서 생성된 범주에 따라 해당 하위 폴더에 저장됩니다.
    • 바탕화면 폴더
    • 변수
  5. 라이선스 필드에 라이선스 자격증명을 입력합니다.
  6. 자격증명 옵션을 선택한 경우 선택을 클릭하여 라이선스 로커에서 라이선스를 가져옵니다.
  7. 선택 사항: 신뢰도 임계값(%)을 구성합니다. 문서의 범주 예측에 대한 신뢰도 값이 신뢰도 임계값보다 작으면 문서가 미분류 폴더로 이동합니다.
  8. 출력을 저장할 변수를 선택하거나 생성합니다. 다음 키와 함께 목록으로 분류 결과가 제공됩니다.
    • fileName: 처리하려는 파일 이름
    • category: 분류 후 파일이 속한 카테고리입니다. 예를 들어 모든 인사 관련 문서는 하나의 카테고리에 배치됩니다.
    • confidence: 학습 데이터를 기반으로 어떤 파일이 어떤 카테고리에 속하는지 등의 분류를 보여주는 임계값 백분율 값입니다.