Uso de la clasificación en el flujo de trabajo de extracción de datos

Para optimizar los flujos de trabajo de procesamiento de documentos que implican tanto la clasificación como la extracción de datos, puede integrar la tarea de clasificación en el flujo de trabajo de procesamiento de documentos. Esta integración elimina la necesidad de preclasificar manualmente los documentos, lo que permite lograr un proceso unificado y automatizado que gestiona ambas tareas secuencialmente dentro de un único flujo de trabajo.

Antes de empezar

Asegúrese de haber creado una instancia de aprendizaje que desea utilizar con este proceso y de haberla publicado en producción. Consulte Publicar la instancia de aprendizaje en producción.

En este procedimiento, hemos utilizado la acción Clasificar en el paquete de Clasificador de documentos y se crean variables según corresponda. Dependiendo de la acción del clasificador que elija, es posible que tenga que modificar el procedimiento y crear diferentes conjuntos de variables.

Procedimiento

  1. Inicie sesión en la Control Room.
  2. Vaya a Automatización > Pestaña privada.
  3. Haga clic en Crear > Bot de tareas.
    Asegúrese de no colocar el bot en la carpeta Procesos del espacio de trabajo del documento.
  4. Asigne un nombre al bot, como por ejemplo procesamiento-de-documentos-con-clasificación.
  5. Cree las siguientes variables:
    Nombre de la variable Descripción Tipo de datos Valor
    SourcePath Ruta del archivo a la carpeta que contiene los documentos que se van a clasificar String Ingrese la ruta del archivo donde se encuentran los documentos a clasificar
    ClassifiedFilePath Ruta de acceso a la carpeta que contiene los documentos que se van a clasificar String Ingrese la ruta del archivo donde se encuentran disponibles los documentos clasificados
    OutputPath Ruta de acceso a la carpeta que contiene los datos extraídos y los documentos no válidos o con errores String Ingrese la ruta del archivo en el que desea que se realice la salida de extracción
    FilesInFolderClassification Contiene el nombre y la extensión del archivo Diccionario NA
    FoldersInFolderDataProcessing Contiene el nombre de la carpeta String NA
    FilesInFolderDataProcessing Contiene el nombre y la extensión del archivo Diccionario NA

    Consulte Crear una variable.

  6. Introduzca una acción de Bucle para iterar todos los documentos que deben clasificarse en una ruta específica de archivo.
    1. Haga doble clic o arrastre la acción Bucle hacia el editor.
    2. Seleccione el iterador Para cada archivo en la carpeta.
    3. En el campo Ruta de la carpeta, ingrese $SourcePath$.
    4. En el campo Asignar nombre de archivo y extensión a esta variable, ingrese $FilesInFolderClassification$.
    Consulte Bucle paquete.
  7. Configure acciones para clasificar documentos.
    1. Arrastre la acción Clasificar en el paquete de Clasificador de documentos hasta el contenedor Bucle.
    2. En el campo Ingresar archivo, seleccione la opción Archivo de escritorio e introduzca $SourcePath$/$FilesInFolder{name}$.$FilesInFolder{extension}$.
    3. En el campo Clasificador, seleccione el archivo modelo adecuado.
    4. En el campo Ruta de la carpeta de salida, seleccione la opción Carpeta de escritorio e ingrese $ClassifiedFilePath$.
  8. Introduzca una acción de Bucle para iterar todas las carpetas en una ruta específica de archivo.
    1. Haga doble clic o arrastre la acción Bucle hacia el editor.
    2. Seleccione el iterador Para cada carpeta en la carpeta.
    3. En el campo Ruta de la carpeta, ingrese $ClassifiedFilePath$.
      Nota: Hemos seleccionado la variable ClassifiedFilePath para la ruta de la carpeta, ya que los documentos clasificados se almacenan como carpetas separadas en esta carpeta.
    4. En el campo Asignar ruta de carpeta relativa a esta variable, ingrese $FoldersInFolderDataProcessing$.
    Consulte Bucle paquete.
  9. Introduzca una acción de Bucle para iterar todos los archivos en una ruta específica de archivo.
    1. Haga doble clic o arrastre la acción Bucle hacia el editor.
    2. Seleccione el iterador Para cada archivo en la carpeta.
    3. En el campo Ruta de la carpeta, ingrese $ClassifiedFilePath$/$FoldersInFolderDataProcessing$.
    4. En el campo Asignar nombre de archivo y extensión a esta variable, ingrese $FilesInFolderDataProcessing$.
    Consulte Bucle paquete.
  10. Configure acciones para cargar documentos en el proceso asociado a una instancia específica de aprendizaje.
    1. Arrastre la acción Crear una solicitud en el paquete de Process Composer hasta el contenedor Bucle.
    2. En el campo Proceso público, haga clic en Explorar y seleccione una instancia de aprendizaje que esté disponible en el modo público.
    3. En el campo Archivo “InputFile”, seleccione la opción Archivo de escritorio y escriba $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    4. En el campo String “InputFileName”, ingrese $FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$.
    5. En el campo String "OutputFolder", ingrese $OutputPath$.
  11. Con el paquete de Archivo puede realizar las siguientes tareas:
    • Con la acción Copiar archivo del escritorio, puede realizar una copia de los archivos que se procesaron correctamente en una ubicación diferente en su escritorio. Por ejemplo, ingrese $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ en el campo Archivo de origen.
    • Con la acción Eliminar, puede borrar documentos después de que se carguen en Document Automation. Por ejemplo, ingrese $ClassifiedFilePath$/$FoldersInFolderDataProcessing$/$FilesInFolderDataProcessing{name}$.$FilesInFolderDataProcessing{extension}$ en el campo Archivo.

    Consulte Archivo de texto paquete.

  12. Haga clic en Guardar.
Ahora, cuando ejecute esta automatización, los documentos primero se clasificarán y luego se utilizarán en la instancia de aprendizaje para la extracción de datos.