Extraction de données IA générative alimentée par la vision
- Dernière mise à jour2025/02/13
Les modèles IA générative alimentés par la vision améliorent l\'automatisation des documents en augmentant la précision de l\'extraction de données à partir de documents complexes et non structurés, en utilisant des capacités telles que l\'analyse de la mise en page et la reconnaissance des champs de formulaire. Ces modèles rationalisent les flux de travail en réduisant l\'intervention humaine et sont pris en charge dans diverses régions par des fournisseurs tels que Microsoft OpenAI et Anthropic Claude.
L\'intégration de modèles IA générative alimentés par la vision dans Document Automation aidera à traiter des documents avec des structures visuellement complexes telles que la reconnaissance des cases à cocher et la détection des signatures.
Lorsque vous utilisez le package qui prend en charge les modèles IA générative alimentés par la vision, vous pouvez utiliser le tag d\'invite @GenAIVision pour indiquer au moteur Extraction de document d\'utiliser les modèles IA générative alimentés par la vision pour l\'extraction de données. Pour plus d\'informations, consultez Utilisation de balises d\'invite dans les invites IA générative.
Fonctionnalités
L\'image suivante montre certaines des capacités des modèles IA générative basés sur la vision utilisés dans Document Automation :
Document Automation avec des modèles IA générative basés sur la vision offre les fonctionnalités améliorées suivantes par rapport aux autres modèles IA générative :
- Analyse de la mise en page
- Reconnaissance des champs de formulaire
- Reconnaissance de tableaux
- Reconnaissance d\'images et de graphiques
- Reconnaissance de signature et de cases à cocher
Avantages
Les modèles IA générative alimentés par la vision offrent les avantages suivants :
- Extraction de données transparente
- Extrait des données de tableaux complexes avec des lignes imbriquées, des colonnes fusionnées et des sections. Reconnaît et capture les éléments de sélection tels que les cases à cocher.
- Développé pour des cas d\'utilisation réels
- Relève les défis liés à l\'extraction de données à partir de divers types de documents tels que les factures, les bons de commande, les documents de santé et les documents de la chaîne d\'approvisionnement.
- Configuration sans effort
- Utilise des modèles pré-entraînés qui fonctionnent immédiatement, où les requêtes de recherche sont utilisées pour identifier et extraire des informations.
Matrice de prise en charge des régions
Le tableau suivant présente les modèles IA générative basés sur la vision pris en charge par les fournisseurs IA générative dans différentes régions :
Régions | Fournisseurs | Le modèle IA générative alimenté par la vision est-il pris en charge ? | Modèles de IA générative pris en charge |
---|---|---|---|
États-Unis | Microsoft OpenAI | Oui | GPT-4o |
Anthropic Claude (Amazon Bedrock) | Oui | Claude 3 Haiku | |
Europe | Microsoft OpenAI | Oui | GPT-4o |
Anthropic Claude (Amazon Bedrock) | Oui | Claude 3 Haiku | |
Reste du monde | Microsoft OpenAI | Non* | GPT-3.5 Turbo |
Anthropic Claude (Amazon Bedrock) | Oui | Claude 3 Haiku |
* Vous pouvez configurer BYOL pour utiliser votre propre modèle IA générative basé sur la vision pour l\'extraction de données. Reportez-vous à la rubrique action Extraire des données.