Descripción general de la clasificación de documentos

La clasificación de documentos es un proceso automatizado que se realiza utilizando los paquetes clasificadores para agrupar o clasificar documentos o páginas dentro de un documento en diferentes categorías según sus atributos, como el diseño, el contenido o ambos.

Puede utilizar este proceso en escenarios donde necesite organizar documentos y luego ejecutar el procesamiento de documentos. Por ejemplo, una vez finalizado el proceso de clasificación de documentos, puede procesarlos en instancias de aprendizaje adecuadas.

Cómo funciona la clasificación

La clasificación de documentos permite el procesamiento de documentos de las siguientes maneras:

Organizar documentos
Cuando un archivo contiene numerosos documentos, la clasificación de documentos ayuda a ordenarlos en categorías relevantes, lo que facilita su administración y recuperación. Estos archivos pueden tener documentos del mismo tipo (como facturas) o de diferentes tipos (como facturas, conocimientos de embarque y órdenes de compra).
Flujos de trabajo optimizados
Cuando el clasificador identifica los documentos correctos, puede utilizar los documentos clasificados en el flujo de trabajo de procesamiento de documentos correcto, lo que permite mejorar la identificación de documentos y la precisión de la extracción de datos, por ejemplo, con el procesamiento de documentos en instancias de aprendizaje adecuadas para la extracción de datos.
Eficiencia aumentada
Al reducir el esfuerzo manual dedicado a ordenar y clasificar documentos, la clasificación de documentos ahorra tiempo y minimiza los errores manuales.

Tipos de clasificadores

Puede elegir una de las siguientes opciones de clasificador según su caso de uso individual o sus requisitos empresariales.

Clasificador de documentos

Este clasificador agrupa documentos en diferentes carpetas de categorías (que representan categorías de documentos) según la primera página de cada documento.

Además, el Clasificador de documentos también puede clasificar páginas individuales dentro de un documento en diferentes carpetas. Si hay documentos de varias páginas integrados en el documento más grande, será necesario fusionar las páginas individuales después de completar esta clasificación a nivel de página para procesarlas como documentos individuales. Por ejemplo, si un documento hipotecario incluye información del cliente (KYC) en la página 1 y la página 2 y un extracto bancario del cliente en la página 3 y la página 4, la página 1 y la página 2 se clasifican como información del cliente y se guardan en la carpeta KYC y la página 3 y la página 4 se clasifican como extractos bancarios y se guardan en la carpeta de extractos bancarios. Para procesar las páginas de KYC como un solo documento, deberá fusionar la página 1 y la página 2 almacenadas en la carpeta KYC. De manera similar, para procesar el extracto bancario como un solo documento, deberá fusionar la página 3 y la página 4 almacenadas en la carpeta del extracto bancario.

Clasificador avanzado
Este clasificador, además de las capacidades del Clasificador de documentos, permite dividir un documento en varios documentos y posibilita la clasificación a nivel de documento o página utilizando reglas predefinidas. Se requiere una licencia separada de Skilja. Le recomendamos que utilice este clasificador solo cuando el Clasificador de documentos no cumpla con sus requisitos.

Para comprender las diferencias entre el Clasificador avanzado y el Clasificador de documentos, consulte Comparación del clasificador avanzado y el clasificador de documentos.