Extrayez le texte d'un fichier PDF et enregistrez-le dans un fichier texte grâce à l'action
Extraire un texte.
Important :
- Si le fichier PDF ne contient pas les polices correctes, l'action
Extraire un texte ne parviendra pas à extraire correctement le texte.
- Lorsque vous utilisez cette action pour extraire du texte d'un fichier PDF, si ce texte est constitué d'une seule ligne de données alors que le fichier PDF contient les mêmes données sur deux lignes, les données peuvent apparaître sur deux lignes.
Remarque : Lorsque vous extrayez des champs d'un PDF qui contient 20 champs de formulaire, le temps de traitement peut être de 30 à 40 % plus long que pour les PDF sans champs de formulaire.
Procédure
Pour extraire le texte d'un fichier PDF, procédez comme suit :
-
Dans la palette
Actions
, double-cliquez sur l'action
Extraire un texte ou faites-la glisser depuis le package
PDF
.
-
Dans le chemin PDF, sélectionnez l'une des options suivantes pour spécifier l'emplacement du fichier PDF :
-
Fichier de la Control Room : Vous permet de sélectionner un fichier PDF disponible dans un dossier dans le Control Room.
-
Profil de bureau : Vous permet de sélectionner un fichier PDF disponible sur votre périphérique.
-
Variable : Vous permet de spécifier la variable de fichier qui contient l'emplacement du fichier PDF.
- Facultatif :
Dans le champ Mot de passe de l'utilisateur ou Mot de passe du propriétaire, saisissez un mot de passe pour restreindre l'accès au fichier PDF chiffré.
-
Mot de passe de l'utilisateur : Autoriser les utilisateurs à effectuer des opérations spécifiques sur le fichier PDF chiffré.
-
Mot de passe du propriétaire : Autoriser les utilisateurs à utiliser un mot de passe pour ouvrir le fichier.
-
Dans le champ Type de texte, sélectionnez l'une des options suivantes :
-
Dans le champ Intervalle de pages, sélectionnez l'une des options suivantes :
-
Toutes les pages : cette option vous permet d'enregistrer toutes les pages du fichier PDF en tant qu'image.
-
Pages : cette option vous permet de saisir les numéros de page des pages que vous souhaitez enregistrer en tant qu'image.
-
Dans le champ Exporter les données vers le fichier texte, spécifiez un nom et un emplacement pour le fichier texte.
Remarque : Vous devez inclure l'extension .txt dans le nom du fichier texte. Par exemple, si le nom du fichier est June_Quarter_report, l'extension .txt est ajoutée pour obtenir June_Quarter_report.txt.
-
Cochez la case Remplacer les fichiers avec le même nom pour remplacer les fichiers existants avec le même nom.
Remarque : Si cette option n'est pas sélectionnée et que robot rencontre un fichier portant le même nom à l'emplacement spécifié, le robot échoue.
- Facultatif :
Dans la liste Attribuer les propriétés PDF à une variable de dictionnaire, sélectionnez une variable de dictionnaire pour contenir les propriétés du fichier.
-
Cliquez sur Enregistrer.