문서 분류 작업 사용

IQ Bot 문서 분류 작업IQ Bot Train Classifier 작업으로 생성된 선택 모델 파일을 사용하여 각 문서의 첫 번째 페이지를 기반으로 입력 문서를 그룹화합니다. 수동으로 문서 그룹을 만드는 경우 이 작업을 사용합니다.

전제 조건

주: 다음과 같은 으로 작업을 생성하고 을 실행하면 오류가 표시됩니다.
  1. 고급 분류기 패키지의 문서 분류 작업을 사용하여 문서를 분류할 수 있습니다.
  2. 문서 추출 패키지에 있는 비정형 문서 유형의 학습 인스턴스를 사용하는 데이터 추출 작업을 사용하여 문서에서 데이터를 추출합니다.

따라서 같은 에서 비정형 문서 유형의 학습 인스턴스를 사용하는 문서 분류작업 및 데이터 추출작업을 사용하지 않을 것을 권장합니다.

프로시저

  1. 작업 팔레트의 Document Classifier 작업에서 문서 분류 패키지을 더블 클릭하거나 드래그합니다.
  2. 입력 파일 필드에 분류를 위해 들어오는 파일의 기본 파일 경로를 입력합니다.
  3. Classifier 필드에 모델 파일의 파일 경로를 입력합니다.
    .zip 폴더를 선택하거나 이 폴더에서 .icmf 파일을 추출하여 선택할 수 있습니다.
    주: 더 나은 분류 결과 및 성능을 위해 Train Classifier 작업로부터 얻은 .zip 폴더에서 사용 가능한 .icmf 파일을 사용하는 것이 좋습니다.
  4. 출력 폴더 경로 옵션을 이용하여 분류 출력 문서를 저장합니다.
    출력 문서의 페이지는 모델 파일에서 생성된 범주에 따라 해당 하위 폴더에 저장됩니다.
  5. 옵션: 신뢰도 임계값(%)을 구성합니다.
    문서의 범주 예측에 대한 신뢰도 값이 신뢰도 임계값보다 작으면 문서가 미분류 폴더로 이동합니다.
  6. 일반 모드 또는 Express Mode 중에서 선택합니다.
    • 일반 모드: Classifier가 전체 문서를 구문 분석하고 모든 페이지의 필드를 기반으로 문서를 그룹화합니다.
    • Express Mode: Classifier가 첫 번째 페이지의 필드를 기반으로 문서를 그룹화합니다.
  7. 출력을 저장할 변수를 선택하거나 생성합니다.
    다음 키와 함께 목록으로 분류 결과가 제공됩니다.
    • fileName
    • pageIndex
    • category
    • confidence