Utilisation de l'action Extraire un champ

Utilisez l'action Extraire le champ pour extraire des champs d'un PDF et les attribuer à des variables.

Important :
  • Lorsque vous extrayez des champs d'un PDF qui contient 20 champs de formulaire, le temps de traitement peut être de 30 à 40 % plus long que pour les PDF sans champs de formulaire.
  • Lorsque vous utilisez cette action pour extraire un bouton radio d'un fichier PDF, la valeur générée peut être -1 si aucune case d'option n'est sélectionnée. Auparavant, lorsque vous ne sélectionniez aucune case d'option, le résultat était 0.

Procédure

Pour extraire des champs d'un fichier PDF, procédez comme suit :

  1. Dans la palette Actions, double-cliquez sur l'action Extraire un champ ou faites-la glisser depuis le package PDF.
  2. Dans le chemin PDF, sélectionnez l'une des options suivantes pour spécifier l'emplacement du fichier PDF :
    • Fichier de la Control Room : Vous permet de sélectionner un fichier PDF disponible dans un dossier dans le Control Room.
    • Profil de bureau : Vous permet de sélectionner un fichier PDF disponible sur votre périphérique.
    • Variable : Vous permet de spécifier la variable de fichier qui contient l'emplacement du fichier PDF.
  3. Dans le champ Le fichier est protégé, sélectionnez Oui si le fichier est chiffré, puis indiquez le Mot de passe de l'utilisateur ou le Mot de passe du propriétaire.
  4. Cliquez sur Ouvrir le lecteur PDF.
  5. Dans la fenêtre Sélectionner un fichier PDF, sélectionnez un fichier PDF à partir du fichier de la Control Room ou d'un fichier de bureau.
  6. Facultatif : Saisissez le mot de passe.
  7. Cliquez sur Charger pour ouvrir le Lecteur de PDF.
    Dans la fenêtre Lecteur de PDF, le PDF s'ouvre avec toutes les zones structurées mises en surbrillance dans des rectangles en pointillés violets.
  8. Sélectionnez la zone rectangulaire du champ à extraire, puis cliquez sur Ajouter un champ pour ajouter le champ et sa valeur dans le tableau Extraire des champs.
  9. Facultatif : Vous pouvez ajouter des champs non structurés qui ne sont pas mis en surbrillance dans le fichier PDF. Sélectionnez l'option Dessiner une région disponible en haut du lecteur PDF, puis tracez un rectangle autour de la région requise.

    Un rectangle rouge en pointillés est mis en surbrillance avec une option Ajouter une région personnalisée

  10. Cliquez sur Ajouter une région personnalisée pour afficher les coordonnées capturées dans la fenêtre Région personnalisée. Entrez le Nom de clé qui peut être utilisé dans la variable de sortie.
    Remarque : Lors de l'extraction de texte PDF à l'aide de l'option Dessiner une région > Ajouter une région personnalisée, assurez-vous que les données PDF sont dans l'ordre séquentiel et que le codage des polices est standard pour effectuer correctement l'extraction des données. Les données non codées, telles que les données provenant de fichiers scannés et d'images, ne seront pas extraites.
  11. Cliquez sur Fermer pour ajouter le champ dans le tableau Extraire des champs.
    La liste des champs extraits apparaît sous le tableau Extraire des champs dans le volet droit de la fenêtre du Lecteur de PDF.
    Les champs extraits deviennent des rectangles en pointillés bleus dans le lecteur de PDF. Vous pouvez modifier les champs extraits en sélectionnant le rectangle bleu autour du champ.
    Utilisez le bouton d'ellipse verticale en regard du champ extrait dans le tableau Extraire des champs pour Modifier, Déplacer ou Supprimer le champ.
  12. Cliquez sur Fermer pour fermer le lecteur de PDF.
  13. Dans le champ Enregistrer la sortie dans une variable, choisissez une variable de dictionnaire ou plusieurs variables pour contenir les valeurs de champ.
  14. Cliquez sur Enregistrer.