Desative a opção PDFBox

A opção PDFBox é habilitada por padrão. Desative a opção quando estiver treinando documentos PDF híbridos, contendo imagens e texto.

A opção PDFBox funciona melhor apenas com documentos totalmente digitais. Ao usar documentos híbridos contendo imagens e texto, nossa recomendação é desabilitar a opção PDFBox para melhor classificação de documentos.
Nota: A opção PDFBox é habilitada no sistema por padrão. Certifique-se de que o PDFBox seja mantido ativado apenas se você planeja processar documentos digitais, caso contrário, o processamento falhará.
Se o PDFBox estiver ativado, você pode processar os seguintes tipos de PDF:
  • O PDF vetorial e híbrido pode ser processado usando o PDFBox
  • O PDF raster pode ser processado primeiro usando o PDFBox e, se nenhum segmento for encontrado, então o PDF será processado novamente usando OCR da imagem do documento
Há duas maneiras de desabilitar/ativar a opção PDFBox no IQ Bot:
  • Diretamente na interface do usuário, durante a criação de uma instância de aprendizado. Na página Criar nova instância de aprendizado, vá para Configurações avançadas > Reconhecimento de caracteres ópticos e desative/ative a caixa de seleção Meus documentos PDF não têm imagens.
  • No arquivo Setting.txt, descrito a seguir:

Procedimento

  1. Navegue para C:\Program Files (x86)\Automation Anywhere IQ Bot\Configurations.
  2. Abra o arquivo Configuração.txt e mude PDFBoxOCREnabled=true para PDFBoxOCREnabled=false
    Isso desliga o processamento de documentos carregados por PDFBox para novas instâncias de aprendizado (após a aplicação dessa mudança) e não se aplica às instâncias de aprendizado existentes. IQ Bot usará o motor OCR selecionado também para documentos PDF.
    Nota: Quando o PDFBox estiver desativado, certifique-se de que seu documento PDF tenha menos de 60 páginas.
  3. Após atualizar o arquivo Setting.txt, a execução stoppedanduninstalled e installedandstartedstart dos serviços IQ Bot não é necessária.