Cómo usar Clasificar acción

La IQ Bot Clasificar de acción agrupa las páginas de un documento de entrada según el archivo de modelo que se creó con la IQ Bot Clasificador de entrenamiento de acción.

Antes de empezar

Cree un bot con la acción Clasificar dentro de una acción Bucle para clasificar iterativamente cada archivo en la carpeta seleccionada.

Procedimiento

  1. En la paleta de Acciones, haga doble clic en la acción Bucle o arrástrela desde el paquete Bucle.
  2. En el campo Tipo de bucle, seleccione la opción Iterador.
  3. En el campo Iterador, seleccione Para cada archivo de la carpeta desde la lista desplegable.
  4. En el campo Ruta de la carpeta, seleccione la ruta de la carpeta que contiene los archivos de entrada.
  5. En el campo Asignar nombre y extensión de archivo a esta variable, cree o seleccione una variable de diccionario para almacenar los nombres y las extensiones de los archivos en la ruta de la carpeta seleccionada.
    Para este ejemplo, utilizaremos una variable de diccionario llamada dictFile.
  6. En la paleta Acciones, haga doble clic en la acción Clasificar o arrástrela desde el paquete Clasificador de documentos.
  7. En el campo Archivo de entrada, escriba una ruta del archivo dinámico con una variable.
    1. Agregue una ruta de archivo que apunte a la carpeta, por ejemplo, C:\input\.
    2. Agregue la cadena de nombre de archivo dinámica: $dictFile(name)$.$dictFile(extension)$.
      Nota: Asegúrese de incluir un punto entre la variable que contiene el nombre del archivo y la que contiene la extensión.
    Las claves nombre y extensión están predefinidas. Cuando se inserta y ejecuta en un bucle, la acción se repetirá en toda la carpeta y llamará a los archivos de la carpeta uno a la vez. El valor Archivo de entrada se parece a lo siguiente: C:\input\$dictFile(name)$.$dictFile(extension)$
  8. En el campo Clasificador, indique la ruta del archivo modelo.
    Puede seleccionar la carpeta .zip o extraer el archivo .icmf desde esta carpeta y seleccionarla.
    Nota: Para obtener mejores resultados de clasificación y rendimiento, recomendamos utilizar el archivo .icmf disponible en la carpeta .zip obtenida desde la acción Clasificador de entrenamiento.
  9. Utilice la opción Ruta de la carpeta salida para guardar el documento de salida de clasificación.
  10. Opcional: Configure la siguiente CONFIGURACIÓN AVANZADA:
    • Umbral de confianza (%): Si el valor de confianza de la predicción de categoría de una página es menor que el umbral de confianza, se mueve a la carpeta No clasificado.
    • Guardar variable de salida de clasificación: Guarde los resultados de clasificación como una lista de diccionarios con las siguientes claves:
      • Nombre de archivo
      • pageIndex
      • categoría
      • confianza
    Nota:
    • Puede seleccionar el tipo de clasificación en el Clasificador de documentos:
      • Clasificación por imágenes
      • Clasificación por texto
      • Clasificación tanto por imágenes como por textos
    • Para proyectar un umbral de confianza más alto, le sugerimos que calcule el umbral de confianza cuando las páginas del documento sean similares. Para determinar el umbral de confianza obligatorio, puede revisar los valores de confianza del resultado de la clasificación.
    • El Clasificador de documentos puede autodetectar el idioma para la clasificación y es compatible con todos los idiomas admitidos por ABBYY (una aplicación de reconocimiento óptico de caracteres).
  11. Haga clic en Guardar y Ejecutar.
    Las páginas del documento de salida se guardan en las respectivas subcarpetas según las categorías creadas en el archivo de modelo. Cualquier documento clasificado previamente en la carpeta de salida se sobrescribirá.

Qué hacer a continuación

Puede utilizar cada subcarpeta de documentos similares para crear y entrenar una instancia de aprendizaje a fin de extraer datos de los documentos. Consulte Crear una instancia de aprendizaje.