PDFBox オプションの無効化

デフォルトでは、PDFBox オプションが有効になっています。画像とテキストを含むハイブリッド PDF ドキュメントでトレーニングする場合は、このオプションを無効にします。

PDFBox オプションは、完全にデジタル化されたドキュメントで最適に機能します。画像とテキストを含むハイブリッド ドキュメントを使用する場合、ドキュメント分類の精度を向上させるために PDFBox オプションを無効にすることをお勧めします。
注: PDFBox オプションは、デフォルトで有効になっています。電子ドキュメントの処理を計画している場合のみ、PDFBox を有効に保ってください。そうしないと処理に失敗します。
PDFBox が有効な場合、以下の PDF タイプを処理することができます。
  • ベクターとハイブリッド PDFBox を使用して PDF を処理することができます。
  • ラスター PDF は、まず PDFBox を使用して処理され、その際にセグメントが見つからない場合、PDF はドキュメント画像 OCR を使用して再度処理されます。
IQ BotPDFBox オプションを有効または無効にするには、次の 2 つの方法があります。
  • ラーニングインスタンスの作成中に UI で直接行う[新しいラーニングインスタンスを作成] ページで、[詳細設定] > [光学式文字認識] に移動し、[PDF ドキュメントに画像はありません] チェックボックスを選択/選択解除します。
  • Setting.txt ファイルでは、次のように記述されています。

手順

  1. C:\Program Files (x86)\Automation Anywhere IQ Bot\Configurations に移動します。
  2. Setting.txt ファイルを開き、PDFBoxOCREnabled=truePDFBoxOCREnabled=false に変更します。
    この変更を適用した後、新しいラーニングインスタンスに対する PDFBox によるアップロード済みドキュメントの処理がオフになり、既存のラーニングインスタンスに適用されなくなります。IQ Bot は選択した OCR エンジンを PDF ドキュメントにも使用します。
    注: PDFBox が無効化されている場合は、PDF ドキュメントが 60 ページ未満であることを確認します。
  3. Setting.txt ファイルを更新した後は、IQ Bot サービスの stoppedanduninstalledinstalledandstartedstart を実行する必要はありません。