手書き文書からデータを抽出するためのガイドライン
- 最終更新日2025/01/20
手書きの文書からデータを抽出する際には、これらの文書は通常、タイプされた文書や印刷された文書よりもデータ抽出精度が低いことを知っておくことが重要です。
データ抽出精度が低いのは通常、以下の理由によるものです。
- 一貫性のない文字の形状とサイズ
- 単語と文字の間の可変スペーシング
- 重なり合ったまたは接続された文字
- 異なる種類のインクと紙の使用
- 略語やスラングの使用
- 汚れと修正
- 標準フォーマットに従わないテキスト配置
手書きの文書からデータを抽出する前に、以下のガイドラインに従っていることを確認してください。
- Google Vision OCR または 標準フォーム を使用し、ABBYY OCR の代わりにしてください。
- 生成 AI駆動のデータ抽出オプションを有効にしている場合は、ビジョン駆動の生成 AIモデルを使用していることを確認してください。 「ビジョン駆動の 生成 AI データ抽出」を参照してください。
- 可能であれば、文書をスキャンして保存する際には、以下の推奨設定を使用してください。
- 文書をスキャンするための最適なDPIを使用してください(例えば、300 DPI)。
- ドキュメントをグレースケールまたはカラー設定でスキャンします。
- ドキュメントを保存する際には、攻撃的な圧縮を使用しないでください。