Lea y revise la documentación de Automation Anywhere

Automation 360

Cerrar contenidos

Contenidos

Abrir contenidos

Utilizar la action Extraer texto

  • Actualizado: 2022/06/17
    • Automation 360 v.x
    • Crear
    • Espacio de trabajo de RPA

Utilizar la action Extraer texto

Extraiga el texto de un archivo PDF y guárdelo como un archivo de texto utilizando la action Extraer texto.

Importante: Si las fuentes correctas no están incrustadas en el archivo PDF, la action Extraer texto no extrae el texto correctamente.

Procedimiento

Siga estos pasos para extraer texto de un archivo PDF:

  1. En la paleta Actions, haga doble clic o arrastre la action Extraer texto del package PDF.
  2. En la ruta del PDF, seleccione una de las siguientes opciones para especificar la ubicación del PDF:
    • Archivo de Sala de control: Permite seleccionar un archivo PDF que esté disponible en una carpeta en Control Room.
    • Perfil de escritorio: Permite seleccionar un archivo PDF que esté disponible en el dispositivo.
    • Variable: Permite especificar la variable de archivo que contiene la ubicación del archivo PDF.
  3. Opcional: En el campo Contraseña de usuario o Contraseña de propietario, escriba una contraseña para restringir el acceso al archivo PDF cifrado.
    • Contraseña de usuario: Permite a los usuarios realizar operaciones específicas en el archivo PDF cifrado.
    • Contraseña de propietario: Permite que los usuarios utilicen una contraseña para abrir el archivo.
  4. En el campo Tipo de texto, seleccione una de las siguientes opciones:
    • Texto sin formato: Extrae el texto y lo copia en un archivo de texto.

      Funciona de manera similar a copiar y pegar el texto de un archivo PDF a un archivo de texto.

    • Texto estructurado: Conserva el formato original del texto extraído del archivo PDF.
      Puede seleccionar la opción Reducir la pérdida de datos para asegurarse de que se extraiga el texto completo con una superposición mínima de caracteres. Con esta funcionalidad, se reduce el número de caracteres superpuestos por otros.
      Nota: Cuando se selecciona esta opción para extraer texto, el texto extraído puede contener caracteres de espacio adicionales.
  5. En el campo Rango de páginas seleccione una de las siguientes opciones:
    • Todas las páginas: Le permite guardar todas las páginas del archivo PDF como una imagen.
    • Páginas: Le permite escribir los números de las páginas que desee guardar como imagen.
  6. En el campo Exportar datos a archivo de texto, especifique un nombre para el archivo de texto y la ubicación.
    Nota: Deberá incluir la extensión .txt en el nombre del archivo de texto. Por ejemplo, si el nombre del archivo es June_Quarter_report, la extensión .txt es June_Quarter_report.txt.
  7. Seleccione la casilla Sobrescribir archivos con el mismo nombre para sobrescribir el archivo, en caso de que exista un archivo con el mismo nombre.
    Nota: Si esta opción no está seleccionada y el bot encuentra un archivo con el mismo nombre en la ubicación especificada, el bot fallará.
  8. Opcional: Desde la lista Asignar propiedades PDF a una variable del diccionario seleccione una variable del diccionario para conservar las propiedades del archivo.
    Para obtener más información, consulte Usar una variable de diccionario para las propiedades de PDF.
  9. Haga clic en Guardar.
Enviar comentarios