Uso de la acción Entrenar clasificador avanzado

Use la acción Entrenar clasificador avanzado para crear un archivo de modelo que utilice las acciones Clasificar documentos, Clasificar páginas o Dividir documento a fin de ordenar los documentos en las categorías requeridas para la entrada.

Antes de empezar

Nota: Los archivos TIFF no son compatibles cuando entrena los modelos usando ABBYY OCR. La inclusión de archivos TIFF en la carpeta de entrenamiento puede provocar resultados no deseados, como la pérdida de datos o la ausencia de archivos en la carpeta de entrenamiento. Le recomendamos que convierta los archivos TIFF en PDF y, a continuación, entrene el modelo.
Antes de crear el bot, recopile documentos de ejemplo y clasifíquelos en carpetas. Asegúrese de que el conjunto de documentos de ejemplo cumpla los siguientes requisitos:
  • Tiene, al menos, dos categorías.
  • Se requiere un mínimo de 15 archivos por categoría, con una recomendación de 20 archivos por categoría.
  • No hay restricciones en cuanto a la cantidad máxima de categorías. Sin embargo, es importante señalar que, a medida que aumenta el conjunto de datos de entrenamiento y el tamaño del modelo correspondiente, puede disminuir el rendimiento del proceso de clasificación. Por lo tanto, es aconsejable mantener la cantidad de categorías dentro de un rango de 150 por archivo de modelo para un rendimiento óptimo.
  • Los formatos de archivo compatibles son los siguientes:
    • .tiff
    • .bitmap
    • .jepg
    • .png
    • .pdf
    • .txt
  • Le recomendamos que proporcione imágenes con una resolución de 300 ppp (puntos por pulgada). La resolución mínima aceptable es de 200 ppp.
Nota:

Si no se cumplen estos requisitos mínimos, se muestra un mensaje de error durante el tiempo de ejecución del bot.

Procedimiento

  1. En la paleta Acciones, haga doble clic en la acción Entrenar clasificador avanzado o arrástrela desde el paquete Clasificador avanzado.
  2. Ingrese un nombre para el archivo de modelo en el campo Nombre de modelo.
  3. Seleccione la Ruta de la carpeta de entrenamiento desde Carpeta del escritorio o Variable. La ruta de la carpeta de entrada debe tener subdirectorios con los nombres que corresponden a la categoría de los documentos sobre los que desea capacitar al clasificador. Por ejemplo, si tiene documentos relacionados con las ventas, la ruta de la carpeta de entrada debe tener subcarpetas como Factura y Orden de compra.
  4. Opcional: Si selecciona Archivo de escritorio, haga clic en Explorar para cambiar la ruta de archivo predeterminada. Por ejemplo, C:\Users\Dave\BankStatement\TrainingData
  5. Use el campo Ruta de salida de modelo para seleccionar el directorio para el archivo de modelo de salida.
  6. En el campo Licencia, indique una credencial de licencia.
  7. Si selecciona la opción Credencial, haga clic en Seleccionar para obtener una licencia del almacén de licencias.
  8. En el campo Entrenamiento de la división de documentos:
    Si selecciona Inhabilitado:
    1. en Configuración avanzada, elija el Tipo de clasificación en el menú desplegable en función del tipo de clasificador que desee crear:
      • Clasificador visual
      • Clasificador de contenido
      • Clasificador visual y de contenido
    2. Opcional: Agregue las Reglas de texto.
    Si selecciona Habilitado:
    1. verá las siguientes opciones:
      • Combinar documento desconocido: desactivado, por defecto.
      • Umbral de páginas desconocidas: 30 %, por defecto
      • Umbral de confianza de división (o umbral de división de separación): 70 %, por defecto.
    2. en Configuración avanzada, elija el Tipo de clasificación en el menú desplegable en función del tipo de clasificador que desee crear:
      • Clasificador visual
      • Clasificador de contenido
      • Clasificador visual y de contenido
    3. En el campo Tipo de OCR, seleccione un motor de OCR para la clasificación.
    4. Opcional: Agregue las Reglas de texto.
    Nota: Solo debe haber un archivo de reglas por categoría. Si el archivo de reglas se coloca fuera de las carpetas de categorías, muestra el siguiente mensaje de error:

    Ubicación del archivo de reglas no válida

  9. Haga clic en Guardar y Ejecutar.

Qué hacer a continuación

Después de crear el modelo, cree un bot para clasificar los documentos de entrada. Para obtener más información, consulte Uso de la acción Clasificar documento.