Descripción general de la extracción de documentos

El proceso de extracción de documentos le permite definir los campos específicos de formularios y de tablas que desea extraer de sus documentos.

Luego, el sistema extrae automáticamente los datos indicados de estos documentos para su posterior análisis e integración en flujos de trabajo posteriores. Este proceso mejora la eficiencia, la precisión y la productividad general en el procesamiento de datos.

Cuando un usuario crea una nueva instancia de aprendizaje, la Control Room crea automáticamente una carpeta con el mismo nombre que la instancia de aprendizaje en la carpeta Automatización > Espacio de trabajo de los documentos. Dentro de esa carpeta, Control Room crea los dos siguientes bots:

  • Bot de extracción: Extrae los datos de los campos definidos en los documentos cargados.
  • Descargar bot: Descarga los datos extraídos a una carpeta específica en el dispositivo o red compartida según la opción de resultados de salida configurada en el bot Descargar.

El paquete Extracción de documentos se utiliza para extraer datos y descargar los datos extraídos de los documentos a una ubicación específica.

El paquete Extracción de documentos proporciona las siguientes capacidades:

  • Diversos tipos de documentos: Procese una amplia gama de tipos de documentos para diversos casos de uso de procesamiento de documentos. Integre sus analizadores de extracción de datos personalizados para aprovechar sus modelos específicos de dominio ya entrenados para sus flujos de trabajo de procesamiento de documentos.
  • Reglas de validación: Defina condiciones variadas, como la coincidencia de patrones o las comprobaciones de igualdad. Cuando se cumplen estas condiciones, puede marcar errores o advertencias, limpiar o sustituir valores, o establecer valores nuevos rápidamente. Estas reglas garantizan la exactitud de los datos extraídos en varios campos de sus documentos.
  • Proveedores de IA generativa: Extraiga datos de diferentes tipos de documentos mediante el uso de modelos previamente entrenados de proveedores de IA generativa como Azure OpenAI o Anthropic. Los usuarios pueden definir consultas de búsqueda al configurar los campos una vez y luego, para cada documento procesado, los datos se extraen sin necesidad de configuraciones adicionales.
  • Comentarios de validación: Proporcionar retroalimentación sobre la precisión de los datos extraídos verificando y corrigiendo dichos datos. Este proceso crea un ciclo de retroalimentación que ayuda al sistema a mejorar continuamente la precisión de los datos a lo largo del tiempo.
  • Validador de Automation Co-Pilot: Proporciona una interfaz fácil de usar para resaltar los errores o advertencias en los documentos. El validador muestra un contorno rojo para los campos que requieren validación. Los usuarios pueden validar los datos de dichos campos y enviar los documentos para su reprocesamiento.
  • Integración con Automation 360: Integre sin problemas los datos extraídos en varios flujos de trabajo para su posterior procesamiento en Automation 360.