Les modèles generative AI alimentés par la vision améliorent l\'automatisation des documents en augmentant la précision de l\'extraction de données à partir de documents complexes et non structurés, en utilisant des capacités telles que l\'analyse de la mise en page et la reconnaissance des champs de formulaire. Ces modèles rationalisent les flux de travail en réduisant l\'intervention humaine et sont pris en charge dans diverses régions par des fournisseurs tels que Microsoft OpenAI et Anthropic Claude.

Remarque : Assurez-vous que vous utilisez la version 3.35.14 ou ultérieure du Document Extraction packagepour utiliser les modèles generative AI basés sur la vision.

L\'intégration de modèles generative AI alimentés par la vision dans Document Automation aidera à traiter des documents avec des structures visuellement complexes telles que la reconnaissance des cases à cocher et la détection des signatures.

Lorsque vous utilisez le package qui prend en charge les modèles generative AI alimentés par la vision, vous pouvez utiliser le tag d\'invite @GenAIVision pour indiquer au moteur Document Extraction d\'utiliser les modèles generative AI alimentés par la vision pour l\'extraction de données. Pour plus d\'informations, consultez Utilisation de balises d\'invite dans les invites generative AI.

Capacités

L\'image suivante montre certaines des capacités des modèles generative AI basés sur la vision utilisés dans Document Automation :

Document Automation avec des capacités de modèles generative AI basés sur la vision

Document Automation avec les modèles generative AI basés sur la vision offre les fonctionnalités améliorées suivantes par rapport aux autres modèles generative AI :

  • Analyse de la mise en page
  • Reconnaissance des champs de formulaire
  • Reconnaissance de tableaux
  • Reconnaissance d\'images et de graphiques
  • Reconnaissance de signature et de cases à cocher

Avantages

Les modèles generative AI alimentés par la vision offrent les avantages suivants :

Extraction de données fluide
Extrait des données de tableaux complexes avec des lignes imbriquées, des colonnes fusionnées et des sections. Reconnaît et capture les éléments de sélection tels que les cases à cocher.
Développé pour des cas d\'utilisation réels
Relève les défis liés à l\'extraction de données depuis divers types de documents tels que les factures, les bons de commande, les documents de soins de santé et les documents de la chaîne d\'approvisionnement.
Configuration sans effort
Utilise des modèles pré-entraînés qui fonctionnent immédiatement, où les requêtes de recherche sont utilisées pour identifier et extraire des informations.

Matrice de prise en charge des régions

Le tableau suivant présente les modèles generative AI basés sur la vision pris en charge par les fournisseurs generative AI dans différentes régions :

Remarque :
Régions Fournisseurs Le modèle generative AI alimenté par la vision est-il pris en charge ? Modèles de generative AI pris en charge
États-Unis Microsoft OpenAI Oui GPT-5.1
Anthropic Claude (Amazon Bedrock) Oui Claude Haiku 4.5
Google Gemini Oui Gemini 2.5 Flash
Europe Microsoft OpenAI Oui GPT-5.1
Anthropic Claude (Amazon Bedrock) Oui Claude Haiku 4.5
Google Gemini Oui Gemini 2.5 Flash
Australie Microsoft OpenAI Oui GPT-4.0
Anthropic Claude (Amazon Bedrock) Oui Claude Haiku 4.5
Inde Microsoft OpenAI Oui GPT-4.0
Anthropic Claude (Amazon Bedrock) Oui Claude 3 Haiku
Canada Microsoft OpenAI Oui GPT-4.0
Japon Microsoft OpenAI Oui GPT-4.0

Ressources supplémentaires

Pour en savoir plus, recherchez le cours Extraction de données alimentée par la vision Generative AI dans Automation Anywhere University: RPA Training and Certification (A-People login required).