ドキュメントの事前処理の概要

当社のプリプロセッサー packageは、データ抽出のために処理する前にドキュメントを最適化できます。

このpackageは、ドキュメント処理ワークフローの最初のステップとして、Document Automationでドキュメントを効率的に処理できるように準備します。

packageがドキュメントから抽出したバーコード、ページ数、ページ内容などのコンテンツや処理した画像ファイルが、Document Automationで使用されます。事前処理により、ドキュメント処理の全体的な効率と精度が向上し、データ抽出が改善されます。

注: このpackageの使用は、任意です。処理するドキュメントの品質を向上させる必要がある場合にのみ必要です。

事前処理packageは、以下の機能を提供します。

画像処理
  • 画像の連結: 2 つの画像を 1 つのファイルに結合します。
  • 画像を PDF に変換: 画像ファイルをテキスト対応の PDF ファイルに変換します。
  • 画像の編集: 画像ファイルをトリミングまたはサイズ変更します。
  • 画像のエンハンスメント: 画像ファイルにグレースケール、ぼかし、鮮明化などの効果を追加します。
  • 画像の方向: 画像ファイルを反転または回転します。
コンテンツ抽出
  • バーコードの取得: ドキュメント内のすべてのバーコードを検出し、抽出します。
  • ドキュメント情報の取得: ファイルパス、拡張子、ページ数などのドキュメント情報を取得します。
  • ページ コンテンツ: ドキュメントの特定のページからテキストを抽出します。