Examiner le service d'extraction

Après avoir confirmé que les documents dont vous voulez extraire le contenu sont des formulaires standard, vous pouvez planifier le type de service d'extraction de formulaires standard qui correspond à vos besoins.

Les technologies suivantes sont disponibles pour le traitement des formulaires standard :

Service d'extraction IQ Bot

Il s'agit d'un service d'extraction basé sur des modèles qui utilise Reconnaissance de texte et l'heuristique pour extraire le contenu de formulaires standard. Vous devez entraîner un modèle par formulaire standard.

Directives concernant l'utilisation du service d'extraction IQ Bot
  • Les documents sont de bonne qualité (300 ppp)
  • Le contenu des documents n'est pas très dense
  • Les documents d'entrée ne comportent pas de copies manuscrites (support limité)
  • Les signatures ne sont pas prises en charge actuellement
  • Contient une mise en page simple des tableaux (s'étend sur une page) avec un en-tête clair, des limites de tableaux, etc.
  • Ne contient pas de tableaux ou de contenu comportant des cases à cocher (support limité)
  • Ne comporte pas de sections répétées (support limité)
Avantages du service d'extraction IQ Bot
  • Configuration intégrée et simple, prête à l'emploi
  • Divers moteurs Reconnaissance de texte pour augmenter la précision de l'extraction
  • Les mises en page complexes (sections répétées, tableaux continus, etc.) peuvent être extraites pour des cas spécifiques (tests nécessaires).
  • Ne nécessite qu'une licence IQ Bot

Service Microsoft Azure Form Recognizer

Une technologie tierce, qui fournit des modèles d'intelligence artificielle (IA) personnalisés afin d'extraire le contenu des formulaires standard. Vous pouvez créer des modèles personnalisés dans lesquels les documents peuvent être étiquetés et formés.

Directives concernant l'utilisation du service Microsoft Azure Form Recognizer

  • Documents d'entrée :
    • peuvent être denses (contenir beaucoup de détails et d'informations) et être d'une qualité raisonnable (> 200 ppp)
    • peut contenir des cases à cocher et des boutons radio
    • peut contenir du contenu manuscrit
    • peut contenir des signatures
    • peut contenir des tableaux

      Les documents d'entrée peuvent également contenir des tableaux qui s'étendent sur une seule page. Cependant, si les formulaires standard contiennent des tableaux qui s'étendent sur plusieurs pages, l'extraction du contenu peut échouer.

  • Aucune des sections des documents d'entrée n'est répétée
  • Documents contenant des tableaux de transposition

Avantages du service Microsoft Azure Form Recognizer

  • Divers documents de type formulaire standard peuvent être traités
  • La fonction de détection automatique permet d'identifier différents types de tableaux, tels que les tableaux sans en-tête, les tableaux inversés, etc.
  • Bonne prise en charge des formulaires manuscrits