Extraiga el texto de un archivo PDF y guárdelo como un archivo de texto utilizando la acción Extraer texto.
Importante: Si las fuentes correctas no están incrustadas en el archivo PDF, la acción Extraer texto no extrae el texto correctamente.
Nota: Cuando se extraen campos de un PDF que contiene 20 campos de formulario, el tiempo de procesamiento puede ser entre un 30 y un 40 % más largo que el de los PDF sin campos de formulario.
Procedimiento
Siga estos pasos para extraer texto de un archivo PDF:
-
En la paleta Acciones, haga doble clic o arrastre la acción Extraer texto del paquete PDF.
-
En la ruta de PDF, seleccione una de las siguientes opciones para especificar la ubicación del PDF:
- Archivo de Control Room: Permite seleccionar un archivo PDF que esté disponible en una carpeta en la Control Room.
- Perfil de escritorio: Permite seleccionar un archivo PDF que esté disponible en el dispositivo.
- Variable: Permite especificar la variable de archivo que contiene la ubicación del archivo PDF.
- Opcional:
En el campo Contraseña del usuario o Contraseña del propietario, escriba una contraseña para restringir el acceso al archivo PDF cifrado.
- Contraseña del usuario: Permite a los usuarios realizar operaciones específicas en el archivo PDF cifrado.
- Contraseña del propietario: Permite que los usuarios utilicen una contraseña para abrir el archivo.
-
En el campo Tipo de texto, seleccione una de las siguientes opciones:
-
En el campo Rango de páginas, seleccione una de las siguientes opciones:
- Todas las páginas: Le permite guardar todas las páginas del archivo PDF como una imagen.
- Páginas: Le permite escribir los números de las páginas que desee guardar como imagen.
-
En el campo Exportar datos a archivo de texto, especifique un nombre para el archivo de texto y la ubicación.
Nota: Deberá incluir la extensión .txt en el nombre del archivo de texto. Por ejemplo, si el nombre del archivo es June_Quarter_report, la extensión .txt es June_Quarter_report.txt.
-
Seleccione la casilla de verificación Sobrescribir archivos con el mismo nombre para sobrescribir los archivos existentes con el mismo nombre.
Nota: Si esta opción no está seleccionada y el bot encuentra un archivo con el mismo nombre en la ubicación especificada, el bot fallará.
- Opcional:
Desde la lista Asignar propiedades PDF a una variable de diccionario, seleccione una variable de diccionario para conservar las propiedades del archivo.
-
Haga clic en Guardar.