PDFBox オプションの無効化
- 最終更新日2021/04/20
PDFBox オプションの無効化
デフォルトでは、PDFBox オプションが有効になっています。画像とテキストを含むハイブリッド PDF ドキュメントでトレーニングする場合は、このオプションを無効にします。
PDFBox オプションは、完全にデジタル化されたドキュメントで最適に機能します。画像とテキストを含むハイブリッド ドキュメントを使用する場合、ドキュメント分類の精度を向上させるために PDFBox オプションを無効にすることをお勧めします。
注: PDFBox オプションは、デフォルトで有効になっています。電子ドキュメントの処理を計画している場合のみ、PDFBox を有効に保ってください。そうしないと処理に失敗します。
PDFBox が有効な場合、以下の PDF タイプを処理することができます。
- ベクターとハイブリッド PDFBox を使用して PDF を処理することができます。
- ラスター PDF は、まず PDFBox を使用して処理され、その際にセグメントが見つからない場合、PDF はドキュメント画像 OCR を使用して再度処理されます。
IQ Bot の PDFBox オプションを有効または無効にするには、次の 2 つの方法があります。
- ラーニングインスタンスの作成中に UI で直接行う[新しいラーニングインスタンスを作成] ページで、 に移動し、[PDF ドキュメントに画像はありません] チェックボックスを選択/選択解除します。
- Setting.txt ファイルでは、次のように記述されています。