Diretrizes para extração de dados de documentos manuscritos
- Última atualização2025/01/20
Quando você extrai dados de documentos manuscritos, é importante saber que esses documentos geralmente têm menor precisão de extração de dados do que os documentos digitados ou impressos.
A baixa precisão da extração de dados geralmente se deve aos seguintes motivos:
- Inconsistência de formato e tamanho dos caracteres
- Espaçamento variável entre palavras e letras
- Caracteres sobrepostos ou conectados
- Utilização de diferentes tipos de tintas e papéis
- Uso de abreviações ou gírias
- Manchas e correções
- Posicionamento de texto que não segue a formatação padrão
Antes de extrair dados de documentos manuscritos, certifique-se de seguir as seguintes diretrizes:
- Certifique-se de usar Google Vision OCR ou Formulários padrão em vez do ABBYY OCR.
- Se você habilitou a opção de extração de dados orientada por IA generativa, use modelos de IA generativa baseados em visão. Consulte Extração de dados com tecnologia de visão IA generativa.
- Se possível, use as seguintes configurações recomendadas ao digitalizar e salvar documentos:
- Use o melhor DPI para digitalizar documentos (por exemplo, 300 DPI).
- Digitalize documentos em escala de cinza ou em cores.
- Evite usar compactação agressiva ao salvar documentos.