Directives pour l\'extraction des données de documents manuscrits
- Dernière mise à jour2025/01/20
Lorsque vous extrayez des données à partir de documents manuscrits, il est important de savoir que ces documents ont généralement une précision d\'extraction de données inférieure à celle des documents dactylographiés ou imprimés.
La précision inférieure de l\'extraction des données est généralement due aux raisons suivantes :
- Formes et tailles de caractères incohérentes
- Espacement variable entre les mots et les lettres
- Caractères superposés ou reliés
- Utilisation de différents types d\'encres et de papiers
- Utilisation d\'abréviations ou d\'argot
- Taches et corrections
- Placement de texte qui ne respecte pas la mise en forme standard
Avant d\'extraire des données à partir de documents manuscrits, assurez-vous de respecter les consignes suivantes :
- Assurez-vous d\'utiliser l\'OCR Google Vision ou des Formulaires standards au lieu de l\'OCR ABBYY.
- Si vous avez activé l\'option d\'extraction de données pilotée par IA générative, assurez-vous d\'utiliser des modèles IA générative basés sur la vision. Voir Extraction de données IA générative alimentée par la vision.
- Si possible, utilisez les paramètres recommandés suivants lors de la numérisation et de l\'enregistrement de documents :
- Utilisez la meilleure résolution pour numériser des documents (par exemple, 300 ppp).
- Numérisez les documents en niveaux de gris ou en couleur.
- Évitez d\'utiliser une compression agressive lors de l\'enregistrement des documents.