Utilisation d\'un type de document non structuré
- Dernière mise à jour2024/10/29
Utilisation d\'un type de document non structuré
Vous pouvez utiliser le type de document non structuré pour extraire des données de documents non structurés sans format standard, mise en page fixe ou avec des données sans étiquettes.
Le modèle utilise une combinaison de capacités OCR avec le traitement du langage naturel (NLP) et les technologies IA générative pour effectuer une analyse sémantique et extraire des paires clé-valeur et des données de tableau à partir de documents non structurés.
Voici quelques exemples de documents non structurés :
- Documents juridiques
- Correspondance (y compris les e-mails)
- Rapports
Ce modèle offre la possibilité de choisir parmi les IA générative fournisseurs suivants :
- OpenAI
- L\'utilisation de cette option fournit les fonctionnalités suivantes :
- Gérer un large éventail de tâches
- Gestion des documents en anglais et dans d\'autres langues
- Prise en charge des capacités multimodales
- Capacités de réglage fin pour certains modèles
- Anthropic
- L\'utilisation de cette option fournit les fonctionnalités suivantes :
- Traitement efficace des documents volumineux non structurés
- Gestion des documents en anglais et dans d\'autres langues
- Traitement plus rapide des documents avec une meilleure précision d\'extraction des données
Les fournisseurs de IA générative fournissent une intelligence généralisée, ce qui signifie qu\'aucune formation spécifique de l\'instance d\'apprentissage ou du modèle n\'est requise pour différents types de documents. Au lieu de cela, lors de la configuration d\'une instance d\'apprentissage, les utilisateurs doivent optimiser les invites de requête pour identifier et définir comment les données doivent être extraites des documents. Par exemple, vous pouvez définir les invites d\'exemple suivantes pour récupérer des données spécifiques à partir de contrats et d\'accords :
- Quelle est la date d\'entrée en vigueur du contrat ?
- Quel est le numéro de référence ?
- Quelle est la date d\'entrée en vigueur du contrat ? Renvoie la réponse au format JJ/MM/AAAA.
- Quel est le numéro de référence ? Il devrait suivre ce modèle AAA-12345.
- Y a-t-il des impôts impayés à la date d\'entrée en vigueur de l\'accord ? Répondez par oui ou non.Remarque : Si l\'invite de requête est vide, les résultats de l\'extraction ou la sortie seront vides. Il se peut que vous souhaitiez parfois laisser une invite vide en tant que substituts pour les données lorsque votre flux de travail implique le post-traitement des données. Par exemple, si vous souhaitez récupérer des données d\'une base de données et les utiliser sur le terrain pour comparaison.
Les champs de formulaire et de table définis par le système ne sont pas disponibles car le type de document non structuré n\'utilise pas de format standard, de mise en page fixe, ou manque de données sans étiquettes. Vous devez définir tous les champs de formulaire et de tableau qui nécessitent une extraction de données lorsque vous configurez une instance d\'apprentissage.
Les clients souhaitant utiliser des instances privées de cloud des modèles de IA générative sur Microsoft Azure, AWS ou GCP peuvent se connecter aux modèles dans leurs cloud privés. Reportez-vous à la rubrique Connectez vos propres services IA générative.