Mejorar la extracción de datos de tabla
- Última actualización2024/11/28
Mejorar la extracción de datos de tabla
Utilice la configuración de entrenamiento avanzada para entrenar sus documentos y proporcionar entradas adicionales para el motor de extracción Document Automation a fin de mejorar la extracción de datos de tablas.
- Columna principal: Configure la columna principal para la identificación de filas según sus requisitos.
- Indicador de fin de tabla: Agregue un valor del indicador de fin de tabla para que el sistema extraiga datos hasta que el valor alcance el valor especificado, a excepción del valor del indicador de fin de tabla.
- Etiquetas de encabezado: Ajustar o reasignar los campos de la tabla según sea necesario.
Antes de empezar
- La opción Configuración de entrenamiento avanzada solo está disponible si la opción Mejorar la precisión mediante validación está habilitada.
- Asegúrese de tener el permiso Entrenar grupos para proporcionar información sobre etiquetas de encabezado, indicador de fin de tabla y una columna principal utilizada para la detección de filas.
- Solo puede haber una columna principal.
- El indicador de final de tabla es una región identificada por el sistema (SIR) de texto.
Procedimiento
Columna principal
Por ejemplo, después de extraer el documento, los datos de la tabla de varias líneas de la columna Número de artículo se extraen en una sola fila, pero usted debe extraerlos en filas separadas. En tales casos, puede establecer el Número de artículo como columna principal para mejorar la extracción de la tabla. Para obtener más detalles, consulte Ejemplo de configuración de la columna principal mediante la configuración de entrenamiento avanzada.
Indicador de fin de tabla
Por ejemplo, cuando procesa un documento, extrae todos los datos de la tabla desde donde desea extraer datos de filas hasta Total pagadero. En tales casos, puede especificar el valor del Indicador de fin de tabla para que se extraigan los datos de la tabla hasta ese valor (a excepción del valor Indicador de fin de tabla) y no se extraigan más datos de fila.
Etiqueta de encabezado
Cuando hay una etiqueta que no coincide en los datos de la tabla, por ejemplo, la etiqueta del encabezado extraída es Precio unitario, pero usted necesita que la etiqueta del encabezado sea Precio. En tales casos, puede cambiar la etiqueta del encabezado.
Otro caso de uso consiste en que puede reasignar todos los valores de Precio unitario o cambiar la etiqueta del encabezado junto con los datos de la columna. Puede usar el llenado automático para agilizar esta reasignación. Por ejemplo, después de la extracción, la columna Precio de la instancia de aprendizaje se extrae como Precio total, pero usted necesita que la etiqueta del encabezado sea Precio unitario junto con los datos de su columna. En tales casos, puede cambiar la etiqueta del encabezado Precio total por Precio unitario y debe seleccionar y reasignar todos los valores de las celdas de la columna Precio unitario.