Les modèles IA générative alimentés par la vision améliorent l\'automatisation des documents en augmentant la précision de l\'extraction de données à partir de documents complexes et non structurés, en utilisant des capacités telles que l\'analyse de la mise en page et la reconnaissance des champs de formulaire. Ces modèles rationalisent les flux de travail en réduisant l\'intervention humaine et sont pris en charge dans diverses régions par des fournisseurs tels que Microsoft OpenAI et Anthropic Claude.

Remarque : Assurez-vous que vous utilisez la version 3.35.14 ou ultérieure du Extraction de document packagepour utiliser les modèles IA générative basés sur la vision.

L\'intégration de modèles IA générative alimentés par la vision dans Document Automation aidera à traiter des documents avec des structures visuellement complexes telles que la reconnaissance des cases à cocher et la détection des signatures.

Lorsque vous utilisez le package qui prend en charge les modèles IA générative alimentés par la vision, vous pouvez utiliser le tag d\'invite @GenAIVision pour indiquer au moteur Extraction de document d\'utiliser les modèles IA générative alimentés par la vision pour l\'extraction de données. Pour plus d\'informations, consultez Utilisation de balises d\'invite dans les invites IA générative.

Fonctionnalités

L\'image suivante montre certaines des capacités des modèles IA générative basés sur la vision utilisés dans Document Automation :

Document Automation avec des capacités de modèles IA générative basés sur la vision

Document Automation avec des modèles IA générative basés sur la vision offre les fonctionnalités améliorées suivantes par rapport aux autres modèles IA générative :

  • Analyse de la mise en page
  • Reconnaissance des champs de formulaire
  • Reconnaissance de tableaux
  • Reconnaissance d\'images et de graphiques
  • Reconnaissance de signature et de cases à cocher

Avantages

Les modèles IA générative alimentés par la vision offrent les avantages suivants :

Extraction de données transparente
Extrait des données de tableaux complexes avec des lignes imbriquées, des colonnes fusionnées et des sections. Reconnaît et capture les éléments de sélection tels que les cases à cocher.
Développé pour des cas d\'utilisation réels
Relève les défis liés à l\'extraction de données à partir de divers types de documents tels que les factures, les bons de commande, les documents de santé et les documents de la chaîne d\'approvisionnement.
Configuration sans effort
Utilise des modèles pré-entraînés qui fonctionnent immédiatement, où les requêtes de recherche sont utilisées pour identifier et extraire des informations.

Matrice de prise en charge des régions

Le tableau suivant présente les modèles IA générative basés sur la vision pris en charge par les fournisseurs IA générative dans différentes régions :

Remarque : Si vous utilisez votre propre licence (BYOL) pour un fournisseur, ces paramètres ne seront pas pris en compte. Pour la configuration de BYOL pour un fournisseur, voir action Extraire des données.
Régions Fournisseurs Le modèle IA générative alimenté par la vision est-il pris en charge ? Modèles de IA générative pris en charge
États-Unis Microsoft OpenAI Oui GPT-4o
Anthropic Claude (Amazon Bedrock) Oui Claude 3 Haiku
Europe Microsoft OpenAI Oui GPT-4o
Anthropic Claude (Amazon Bedrock) Oui Claude 3 Haiku
Reste du monde Microsoft OpenAI Non* GPT-3.5 Turbo
Anthropic Claude (Amazon Bedrock) Oui Claude 3 Haiku

* Vous pouvez configurer BYOL pour utiliser votre propre modèle IA générative basé sur la vision pour l\'extraction de données. Reportez-vous à la rubrique action Extraire des données.