PDFBox 옵션 비활성화
- 최종 업데이트2021/04/20
PDFBox 옵션 비활성화
기본적으로 PDFBox 옵션은 활성화됩니다. 이미지와 텍스트가 포함된 하이브리드 PDF 문서를 트레이닝할 때는 이 옵션을 비활성화합니다.
이 PDFBox 옵션은 완전한 디지털 문서에만 가장 잘 작동합니다. 이미지와 텍스트가 포함된 하이브리드 문서를 사용할 때는 더 나은 문서 분류를 위해 PDFBox 옵션을 비활성화하는 것이 좋습니다.
주: 시스템에서 PDFBox 옵션은 기본적으로 활성화됩니다. 디지털 문서를 처리할 계획인 경우에만 PDFBox를 활성화된 상태로 유지해야 합니다. 그렇지 않으면 처리가 실패합니다.
PDFBox가 활성화된 경우 다음 PDF 유형을 처리할 수 있습니다.
- 벡터 및 하이브리드 PDF는 PDFBox를 사용하여 처리할 수 있습니다.
- 래스터 PDF는 PDFBox를 사용하여 먼저 처리할 수 있으며 세그먼트가 없다면 문서 이미지 OCR을 사용하여 PDF를 다시 처리합니다.
IQ Bot에서 PDFBox 옵션을 비활성화/활성화하는 방법은 두 가지가 있습니다.
- 학습 인스턴스를 생성하는 동안 UI에서 직접. 새 학습 인스턴스 생성 페이지에서 으로 이동하여 내 PDF 문서에는 이미지가 없습니다 확인란을 비활성화/활성화합니다.
- Setting.txt 파일에서 다음과 같이 설명합니다.