Descripción general del preprocesamiento de documentos

Nuestro package preprocesador le permite optimizar documentos antes de procesarlos para la extracción de datos.

Este package sirve como un paso inicial en el flujo de trabajo de procesamiento de documentos para prepararlos para un manejo efectivo en Document Automation.

El package extrae contenido como códigos de barras, recuento de páginas y contenido de páginas de documentos o procesa archivos de imagen antes de que se consuman en Document Automation. El preprocesamiento mejora la eficiencia general y la precisión del procesamiento de documentos, lo que permite una mejor extracción de datos.

Nota: El uso de este package es opcional. Solo se requiere cuando se necesita mejorar la calidad de los documentos a procesar.

El preprocesamiento de package proporciona las siguientes capacidades:

Procesamiento de imágenes
  • Concatenar imágenes: Combina dos imágenes en un único archivo.
  • Convertir imágenes a PDF: Convierte un archivo de imagen en un documento PDF habilitado para texto.
  • Editar imagen: Recorta o redimensiona un archivo de imagen.
  • Mejorar imagen: Agrega efectos a un archivo de imagen, como escala de grises, desenfoque y nitidez.
  • Orientar imagen: Voltea o rota un archivo de imagen.
Extracción de contenido
  • Obtener códigos de barras: Detecta y extrae todos los códigos de barras en un documento.
  • Obtener información del documento: Recupera información del documento, como la ruta del archivo, la extensión y la cantidad de páginas.
  • Contenido de la página: Extrae texto de una página específica en un documento.