从手写文档中提取数据时,重要的是要知道这些文档的提取准确性通常低于电子版或印刷版文档。

数据提取准确性较低通常是由以下原因导致:

  • 字符形状和大小不一致
  • 单词和字母之间的间距不一致
  • 字符重叠或相连
  • 使用不同类型的油墨和纸张
  • 使用缩写或俚语
  • 污迹和更正
  • 文本位置不符合标准格式

在从手写文档中提取数据之前,请确保遵循以下指南:

  • 确保使用 Google Vision OCRStandard Forms 而不是 ABBYY OCR。
  • 如果您启用了 Generative AI 驱动的数据提取选项,请确保使用视觉驱动的 generative AI 模型。 请参阅 视觉驱动的 generative AI 数据提取
  • 如果可能,请在扫描和保存文档时使用以下推荐设置:
    • 使用最佳 DPI 扫描文档(例如,300 DPI)。
    • 扫描文档前时设置灰度或颜色。
    • 保存文档时,不要过度压缩。