PDFBox 옵션 비활성화

기본적으로 PDFBox 옵션은 활성화됩니다. 이미지와 텍스트가 포함된 하이브리드 PDF 문서를 트레이닝할 때는 이 옵션을 비활성화합니다.

PDFBox 옵션은 완전한 디지털 문서에만 가장 잘 작동합니다. 이미지와 텍스트가 포함된 하이브리드 문서를 사용할 때는 더 나은 문서 분류를 위해 PDFBox 옵션을 비활성화하는 것이 좋습니다.
주: 시스템에서 PDFBox 옵션은 기본적으로 활성화됩니다. 디지털 문서를 처리할 계획인 경우에만 PDFBox를 활성화된 상태로 유지해야 합니다. 그렇지 않으면 처리가 실패합니다.
PDFBox가 활성화된 경우 다음 PDF 유형을 처리할 수 있습니다.
  • 벡터 및 하이브리드 PDF는 PDFBox를 사용하여 처리할 수 있습니다.
  • 래스터 PDF는 PDFBox를 사용하여 먼저 처리할 수 있으며 세그먼트가 없다면 문서 이미지 OCR을 사용하여 PDF를 다시 처리합니다.
IQ Bot에서 PDFBox 옵션을 비활성화/활성화하는 방법은 두 가지가 있습니다.
  • 학습 인스턴스를 생성하는 동안 UI에서 직접. 새 학습 인스턴스 생성 페이지에서 고급 설정 > 광학 문자 인식으로 이동하여 내 PDF 문서에는 이미지가 없습니다 확인란을 비활성화/활성화합니다.
  • Setting.txt 파일에서 다음과 같이 설명합니다.

프로시저

  1. C:\Program Files (x86)\Automation Anywhere IQ Bot\Configurations로 이동합니다.
  2. Setting.txt 파일을 열고 PDFBoxOCREnabled=truePDFBoxOCREnabled=false로 변경합니다.
    그러면 새 학습 인스턴스에 대해(이 변경 사항을 적용한 후) PDFBox에 의해 업로드된 문서의 처리가 해제되고, 기존 학습 인스턴스에는 적용되지 않습니다. IQ Bot이 선택한 OCR 엔진을 PDF 문서에도 사용합니다.
    주: PDFBox이 비활성화된 경우, PDF 문서가 60페이지 미만인지 확인합니다.
  3. Setting.txt 파일을 업데이트한 후에는 IQ Bot 서비스의 stoppedanduninstalledinstalledandstartedstart를 실행할 필요가 없습니다.