Uso de la acción Clasificar páginas

La acción Clasificar páginas agrupa las páginas de un documento de entrada en función del archivo de modelo que se creó con la acción Entrenar clasificador avanzado y filtra las páginas que no se ajustan al modelo.

Antes de empezar

  • Si aún no lo ha hecho, use la acción Entrenar clasificador avanzado para crear un archivo de modelo.
  • Asegúrese de que los archivos de entrada estén en formato requerido.

Cree un bot con la acción Clasificar páginas dentro de una acción de Bucle para clasificar iterativamente cada archivo en la carpeta seleccionada.

Procedimiento

  1. En la paleta Acciones, haga doble clic o arrastre la acción Clasificar páginas desde el paquete Clasificador avanzado.
  2. En el campo Archivo de entrada, proporcione la ruta de archivo predeterminada para los archivos entrantes para su clasificación:
    • Archivo de Control Room
    • Archivo de escritorio
    • Variable
  3. En el campo Clasificador, proporcione la ruta del archivo del modelo. Puede seleccionar la carpeta .zip o extraer el archivo .clsproj3 de esta carpeta y seleccionarlo.
    • Archivo de Control Room
    • Archivo de escritorio
    • Variable
  4. Utilice la opción Ruta de la Carpeta de salida para guardar los documentos de salida de la clasificación. Las páginas del documento de salida se guardan en las respectivas subcarpetas según las categorías creadas en el archivo del modelo.
    • Carpeta de escritorio
    • Variable
  5. En el campo Licencia, indique una credencial de licencia.
  6. Si selecciona la opción Credencial, haga clic en Seleccionar para obtener una licencia del almacén de licencias.
  7. Opcional: Configure lo siguiente:
    Guardar variable de salida de clasificación: Guarde los resultados de clasificación como una lista de diccionarios con las siguientes claves:
    • fileName: Nombre del archivo que desea procesar junto con el valor del índice adjunto. Por ejemplo, <<file name_pageIndex>>
    • index: Valor del número de página cuando tiene varias páginas
    • category: La categoría a la que pertenece el archivo después de la clasificación. Por ejemplo, todos los documentos relacionados con RR. HH. se colocarán en una categoría.
    • confidence: El valor del porcentaje de umbral que muestra una clasificación; por ejemplo, qué archivo pertenece a qué categoría según los datos de capacitación.
    Nota:
    • Puede seleccionar el tipo de clasificación en el Clasificador Avanzado:
      • Clasificación por imágenes
      • Clasificación por texto
      • Clasificación tanto por imágenes como por textos
  8. Haga clic en Guardar y Ejecutar.

Qué hacer a continuación

Puede utilizar cada subcarpeta de documentos similares para crear y entrenar una instancia de aprendizaje a fin de extraer datos de los documentos.