Guías para extraer datos de documentos manuscritos
- Última actualización2025/01/20
Al extraer datos de documentos manuscritos, es importante saber que estos documentos suelen tener una precisión de extracción de datos menor que los documentos mecanografiados o impresos.
La menor precisión en la extracción de datos suele deberse a las siguientes razones:
- Caracteres de formas y tamaños incoherentes
- Espaciado variable entre palabras y letras
- Caracteres superpuestos o conectados
- Uso de diferentes tipos de tintas y papeles
- Uso de abreviaturas o jerga
- Manchas y correcciones
- Colocación de texto que no sigue el formato estándar
Antes de extraer datos de documentos manuscritos, asegúrese de cumplir con las siguientes directrices:
- Asegúrese de utilizar OCR de Google Vision o Formularios estándares en lugar de ABBYY OCR.
- Si habilitó la opción de extracción de datos impulsada por IA generativa, asegúrese de utilizar modelos de IA generativa impulsados por visión. Consulte Extracción de datos impulsada por visión IA generativa.
- Si es posible, utilice la siguiente configuración recomendada al escanear y guardar documentos:
- Utilice la mejor resoIución en PPP para escanear documentos (por ejemplo, 300 ppp).
- Escanee documentos en escala de grises o en configuraciones de color.
- Evite utilizar una compresión agresiva al guardar documentos.