手書きの文書からデータを抽出する際には、これらの文書は通常、タイプされた文書や印刷された文書よりもデータ抽出精度が低いことを知っておくことが重要です。

データ抽出精度が低いのは通常、以下の理由によるものです。

  • 一貫性のない文字の形状とサイズ
  • 単語と文字の間の可変スペーシング
  • 重なり合ったまたは接続された文字
  • 異なる種類のインクと紙の使用
  • 略語やスラングの使用
  • 汚れと修正
  • 標準フォーマットに従わないテキスト配置

手書きの文書からデータを抽出する前に、以下のガイドラインに従っていることを確認してください。

  • Google Vision OCR または 標準フォーム を使用し、ABBYY OCR の代わりにしてください。
  • 生成 AI駆動のデータ抽出オプションを有効にしている場合は、ビジョン駆動の生成 AIモデルを使用していることを確認してください。 「ビジョン駆動の 生成 AI データ抽出」を参照してください。
  • 可能であれば、文書をスキャンして保存する際には、以下の推奨設定を使用してください。
    • 文書をスキャンするための最適なDPIを使用してください(例えば、300 DPI)。
    • ドキュメントをグレースケールまたはカラー設定でスキャンします。
    • ドキュメントを保存する際には、攻撃的な圧縮を使用しないでください。