Quando você extrai dados de documentos manuscritos, é importante saber que esses documentos geralmente têm menor precisão de extração de dados do que os documentos digitados ou impressos.

A baixa precisão da extração de dados geralmente se deve aos seguintes motivos:

  • Inconsistência de formato e tamanho dos caracteres
  • Espaçamento variável entre palavras e letras
  • Caracteres sobrepostos ou conectados
  • Utilização de diferentes tipos de tintas e papéis
  • Uso de abreviações ou gírias
  • Manchas e correções
  • Posicionamento de texto que não segue a formatação padrão

Antes de extrair dados de documentos manuscritos, certifique-se de seguir as seguintes diretrizes:

  • Certifique-se de usar Google Vision OCR ou Formulários padrão em vez do ABBYY OCR.
  • Se você habilitou a opção de extração de dados orientada por IA generativa, use modelos de IA generativa baseados em visão. Consulte Extração de dados com tecnologia de visão IA generativa.
  • Se possível, use as seguintes configurações recomendadas ao digitalizar e salvar documentos:
    • Use o melhor DPI para digitalizar documentos (por exemplo, 300 DPI).
    • Digitalize documentos em escala de cinza ou em cores.
    • Evite usar compactação agressiva ao salvar documentos.