Uso del procesamiento previo en el flujo de trabajo de extracción de datos

Para optimizar los flujos de trabajo de procesamiento de documentos que implican tanto el procesamiento previo como la extracción de datos, puede integrar la tarea de procesamiento previo en el flujo de trabajo de procesamiento de documentos. Esta integración elimina la necesidad de procesar previamente de forma manual los documentos, lo que permite lograr un flujo de trabajo unificado y automatizado que gestiona ambas tareas secuencialmente dentro de un único flujo de trabajo.

Antes de empezar

Asegúrese de haber creado una instancia de aprendizaje que desea utilizar con este proceso y de haberla publicado en producción. Consulte Publicar la instancia de aprendizaje en producción.

En este procedimiento, utilizamos la acción Mejorar imagen del paquete Preprocesador y se crean variables según corresponda. Dependiendo de la acción del preprocesador que elija, es posible que tenga que modificar el procedimiento y crear diferentes conjuntos de variables.

Procedimiento

  1. Inicie sesión en la Control Room.
  2. Vaya a Automatización > Pestaña privada.
  3. Haga clic en Crear > Bot de tareas.
    Asegúrese de no colocar el bot en la carpeta Procesos del espacio de trabajo del documento.
  4. Asigne un nombre al bot, como por ejemplo procesamiento-de-documentos-con-clasificación.
  5. Cree las siguientes variables:
    Nombre de la variable Descripción Tipo de datos Valor
    SourcePath Ruta del archivo a la carpeta que contiene los documentos que se van a preprocesar String Ingrese la ruta del archivo donde se encuentran los documentos para preprocesar
    PreProcessedFilePath Ruta del archivo a la carpeta que contiene los documentos preprocesados String Ingrese la ruta del archivo donde se encuentran disponibles los documentos preprocesados
    OutputPath Ruta de acceso a la carpeta que contiene los datos extraídos y los documentos no válidos o con errores String Ingrese la ruta del archivo en el que desea que se realice la salida de extracción
    FilesInFolderPreProcessing Contiene el nombre y la extensión del archivo Diccionario NA
    FilesInFolderDataProcessing Contiene el nombre y la extensión del archivo Diccionario NA

    Consulte Crear una variable.

  6. Introduzca una acción de Bucle para iterar todos los documentos que deben clasificarse en una ruta específica de archivo.
    1. Haga doble clic o arrastre la acción Bucle hacia el editor.
    2. Seleccione el iterador Para cada archivo en la carpeta.
    3. En el campo Ruta de la carpeta, ingrese $SourcePath$.
    4. En el campo Asignar nombre de archivo y extensión a esta variable, ingrese $FilesInFolderPreProcessing$.
    Consulte Bucle paquete.
  7. Configure acciones para preprocesar documentos.
    1. Arrastre la acción Mejorar imagen en el paquete Preprocesador hasta el contenedor Bucle.
    2. En el campo Ingresar archivo, seleccione la opción Archivo de escritorio e introduzca $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$.
    3. En el campo Ruta de salida, seleccione la opción Carpeta de escritorio e ingrese $PreProcessedFilePath$.
  8. Introduzca un Bucle para iterar todos los documentos en una ruta específica de archivo.
    1. Haga doble clic o arrastre la acción Bucle hacia el editor.
    2. Seleccione el iterador Para cada archivo en la carpeta.
    3. En el campo Ruta de la carpeta, ingrese $PreProcessedFilePath$ .
    4. En el campo Asignar nombre de archivo y extensión a esta variable, ingrese $FilesInFolderDataProcessing$.
    Consulte Bucle paquete.
  9. Configure acciones para cargar documentos en el proceso asociado a una instancia específica de aprendizaje.
    1. Arrastre la acción Crear una solicitud en el paquete de Process Composer hasta el contenedor de Bucle.
    2. En el campo Proceso público, haga clic en Explorar y seleccione una instancia de aprendizaje que esté disponible en el modo público.
    3. En el campo Archivo "InputFile", seleccione la opción Archivo de escritorio e introduzca $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    4. En el campo String “InputFileName”, ingrese $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    5. En el campo String "OutputFolder", ingrese $OutputPath$.
  10. Con el paquete Archivo, puede realizar las siguientes acciones:
    • Con la acción Copiar archivo del escritorio, puede realizar una copia de los archivos que se procesaron correctamente en una ubicación diferente en su escritorio. Por ejemplo, ingrese $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ en el campo Archivo fuente.
    • Con la acción Eliminar, puede eliminar documentos después de cargarlos en Document Automation. Por ejemplo, ingrese $PreProcessedFilePath$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ en el campo File.

    Consulte Archivo de texto paquete.

  11. Haga clic en Guardar.
Ahora, cuando ejecute esta automatización, los documentos se preprocesan primero para mejorar la calidad de la imagen y luego se utilizan en la instancia de aprendizaje para la extracción de datos.