Train Advanced Classifier 작업 사용
- 최종 업데이트2025/03/03
Train Advanced Classifier 작업를 사용하면 문서 분류, 페이지 분류 또는 문서 분할 작업에서 사용하는 모델 파일을 생성하여 문서를 입력에 필요한 범주로 정렬할 수 있습니다.
전제 조건
주: ABBYY OCR을 사용하여 모델을 훈련하는 경우 TIFF 파일은 지원되지 않습니다. 교육 폴더에 TIFF 파일을 포함시키면 교육 폴더에서 데이터가 손실되거나 파일이 누락되는 등 의도치 않은 결과가 발생할 수 있습니다. TIFF 파일을 PDF로 변환한 다음 모델을 학습시키는 것이 좋습니다.
Bot을 구축하기 전에 예제 문서를 수집하고 폴더로 분류합니다. 예제 문서 세트가 다음 요구 사항을 충족하는지 확인하십시오.
- 최소 2개의 범주가 있습니다.
- 범주당 최소 15개의 파일이 필요하며 범주당 20개의 파일이 권장됩니다.
- 최대 범주 수에는 제한이 없습니다. 그러나 학습 데이터 세트와 해당 모델 크기가 증가함에 따라 분류 프로세스의 성능이 저하될 수 있다는 점을 유의하십시오. 따라서 최적의 성능을 위해 모델 파일당 범주 수를 150개 범위 내로 유지하는 것이 좋습니다.
- 지원되는 파일 형식은 다음과 같습니다.
- .tiff
- .bitmap
- .jepg
- .png
- .txt
- 300dpi(인치당 도트 수) 해상도의 이미지를 제공하는 것이 좋습니다. 최소 허용 해상도는 200dpi입니다.
주:
이러한 최소 요구사항이 충족되지 않으면 Bot 실행시간에 오류 메시지가 나타납니다.
프로시저
다음 단계
모델을 생성한 후 Bot을 구축하고 입력 문서를 분류합니다. 자세한 내용은 문서 분류 작업 사용 항목을 참조하십시오.