분류 작업 사용

IQ Bot 분류 작업IQ Bot Train Classifier 작업을 사용하여 생성된 모델 파일을 기준으로 입력 문서의 페이지를 그룹화합니다.

전제 조건

루프 내에서 작업분류을 사용하여 작업을 작성해 선택한 폴더의 각 파일을 반복적으로 분류합니다.

프로시저

  1. 작업 팔레트의 루프 작업에서 루프 패키지을 더블 클릭하거나 드래그합니다.
  2. 루프 유형 필드에서 반복자 옵션을 선택합니다.
  3. 반복자 필드의 드롭다운 목록에서 폴더 내 각 파일 대상을 선택합니다.
  4. 폴더 경로 필드에서 입력 파일이 포함된 폴더의 경로를 선택합니다.
  5. 이 변수에 파일 이름 및 확장명 지정 필드에서 사전 변수를 생성하거나 선택하여 선택한 폴더 경로에 파일의 이름 및 확장명을 저장합니다.
    이 예에서는 dictFile이라는 사전 변수를 사용합니다.
  6. 작업 팔레트의 Document Classifier 작업에서 분류 패키지을 더블 클릭하거나 드래그합니다.
  7. 입력 파일 필드에서 변수를 사용하여 동적 파일 경로를 입력합니다.
    1. 폴더를 가리키는 파일 경로를 추가합니다(예: C:\input\).
    2. 동적 파일 이름 문자열을 추가합니다. $dictFile(name)$.$dictFile(extension)$.
      주: 파일 이름이 포함된 변수와 확장명이 포함된 변수 사이에 마침표를 포함해야 합니다.
    이름확장명 키는 미리 정의되어 있습니다. 작업은 루프에 삽입되고 실행될 때 전체 폴더를 반복하여 폴더 내의 모든 파일을 한 번에 하나씩 호출합니다. 입력 파일 값은 다음과 같습니다. C:\input\$dictFile(name)$.$dictFile(extension)$
  8. 분류기 필드에 모델 파일에 대한 파일 경로를 입력합니다.
    .zip 폴더를 선택하거나 이 폴더에서 .icmf 파일을 추출하여 선택할 수 있습니다.
    주: 더 나은 분류 결과 및 성능을 위해 Train Classifier 작업로부터 얻은 .zip 폴더에서 사용 가능한 .icmf 파일을 사용하는 것이 좋습니다.
  9. 출력 폴더 경로 옵션을 사용하여 분류 출력 문서를 저장합니다.
  10. 옵션: 다음 고급 설정을 구성합니다.
    • 신뢰도 임계값(%): 페이지의 범주 예측에 대한 신뢰 값이 신뢰도 임계값보다 작으면 Unclassified 폴더로 이동합니다.
    • 분류 출력 변수 저장: 분류 결과를 다음 키와 함께 사전 목록으로 저장합니다.
      • fileName
      • pageIndex
      • category
      • confidence
    주:
    • 문서 분류기에서 다음 분류 유형을 선택할 수 있습니다.
      • 이미지 기반 분류
      • 텍스트 기반 분류
      • 이미지 및 텍스트 기반 모두 분류
    • 더 높은 신뢰도 임계값을 예상하려면 문서 페이지가 유사할 때 신뢰도 임계값을 계산하는 것이 좋습니다. 필요한 신뢰도 임계값을 결정하기 위해 분류 출력에서 신뢰도 값을 검토할 수 있습니다.
    • 문서 분류기는 분류를 위한 언어를 자동 감지할 수 있으며, ABBYY(광학 문자 인식 애플리케이션)에서 지원하는 모든 언어를 지원합니다.
  11. 저장실행을 클릭합니다.
    출력 문서의 페이지는 모델 파일에서 생성된 범주에 따라 해당 하위 폴더에 저장됩니다. 출력 폴더의 이전에 분류된 모든 문서를 덮어씁니다.

다음 단계

유사한 문서의 각 하위 폴더를 사용하여 문서에서 데이터를 추출하는 학습 인스턴스를 생성하고 트레이닝할 수 있습니다. 학습 인스턴스 생성 항목을 참조하십시오.