Actualizaciones de Extracción de documentos paquete

Revise las actualizaciones de las versiones publicadas de paquete Extracción de documentos, como las funciones nuevas y mejoradas, así como las correcciones y limitaciones. La página también enumera las fechas de lanzamiento de cada versión, y las versiones compatibles de Control Room y Agente de bot.

Resumen de las versiones

En la siguiente tabla se enumeran las versiones del paquete Extracción de documentos publicadas con una versión de Automation 360 o como versión de solo paquete (en orden descendente de fechas de publicación). Haga clic en el enlace de la versión para obtener información sobre las actualizaciones de esa versión del paquete.
Versión Fecha de actualización Tipo de versión Versión de Agente de bot Compilación de Control Room
Actualizaciones de Extracción de documentos paquete 5 de abril del 2024 Con el lanzamiento de Automation 360 v.32 (Local) 21.252 o posterior 19223 o posterior
Actualizaciones de Extracción de documentos paquete 21 de marzo del 2024 Con el lanzamiento de Automation 360 v.32 (Sandbox) 21.252 o posterior 19223 o posterior
Actualizaciones de Extracción de documentos paquete 26 de enero del 2024 Paquete-solo para versiones posteriores a Automation 360 v.31 21.252 o posterior 19223 o posterior
Actualizaciones de Extracción de documentos paquete 22 de diciembre del 2023 Solo Paquete; para versiones posteriores a Automation 360 v.31 (Sandbox) 21.252 o posterior 19223 o posterior
Actualizaciones de Extracción de documentos paquete 6 de diciembre del 2023 Con el lanzamiento de Automation 360 v.31 (Sandbox) 21.252 o posterior 19223 o posterior
Actualizaciones de Extracción de documentos paquete 28 de noviembre del 2023 Con Automation 360 versión v.30 21.252 o posterior 19223 o posterior
Actualizaciones de Extracción de documentos paquete 16 de noviembre del 2023 Paquete-solo para versiones posteriores a Automation 360 v.30 21.252 o posterior 19223 o posterior
3.30.24 21 de septiembre del 2023 Solo Paquete; para versiones posteriores a Automation 360 v.30 (Sandbox) 21.252 o posterior 19223 o posterior
3.30.22 6 de septiembre del 2023 Con el lanzamiento de Automation 360 v.30 (Sandbox) 21.252 o posterior 19223 o posterior
Actualizaciones de Extracción de documentos paquete 21 de agosto de 2023 Solo para Paquete; para versiones posteriores a Automation 360 v.29 21.98 o posterior 15345 o posterior
3.30.19 16 de agosto de 2023 Solo para Paquete; para versiones posteriores a Automation 360 v.29 21.98 o posterior 15345 o posterior
Actualizaciones de Extracción de documentos paquete 17 de julio del 2023 Paquete-solo para versiones posteriores a Automation 360 v.29 21.98 o posterior 15345 o posterior
Actualizaciones de Extracción de documentos paquete 6 de junio del 2023 Con el lanzamiento de Automation 360 v.29 (Sandbox) 21.98 o posterior 15345 o posterior
Nota:
  • Para descargar un paquete individual (actualizado en una versión de Automation 360 en la que solo necesite el paquete), utilice esta URL:

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • Para el paquete Extracción de documentos, la convención de nomenclatura es: bot-command-iqbot-extraction360-<version-number>-full.jar

    Por ejemplo, bot-command-iqbot-extraction360-3.31.22-full.jar

Para conocer los pasos detallados sobre cómo descargar un paquete y agregarlo manualmente a la Control Room, consulte Agregue paquetes a Control Room.

3.32.23

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Los usuarios ahora pueden guardar los comentarios de validación en su entorno de Automatización de documentos cuando el proxy está habilitado en la máquina de Agente de bot.

ID de caso de Servicio de nube: 02092484

Con OCR de Google Vision y el proxy habilitado, la extracción del documento ya no falla para documentos no estructurados y no muestra un mensaje de error.

ID de caso de Servicio de nube: 02104409

3.32.22

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Con el modelo mejorado de detección de tablas de documentos que consiste en agregar Indicador de fin de tabla, ahora puede extraer datos de tablas de todas las páginas para el idioma seleccionado. De esta manera, puede reducir las tablas faltantes y los problemas de extracción de las últimas filas de las páginas.

ID de caso de Servicio de nube: 02065073

Con la función de extracción de tablas mejorada, las tablas no estructuradas ya no muestran los valores no deseados y ahora extraen los datos de la tabla correctamente.

3.31.22

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Después de agregar comentarios de validación a la instancia de aprendizaje, la extracción de documentos ya no falla con un mensaje de error.

Anteriormente, la extracción del documento fallaba cuando se seleccionaba la casilla de verificación de validación.

Después de agregar comentarios de validación a la instancia de aprendizaje, los comentarios se guardan para todas las tablas en todas las páginas del documento y los datos se extraen de manera correcta de todas las páginas.

Anteriormente, los comentarios no se guardaban para todas las páginas.

ID de caso de Servicio de nube: 01995135, 02093575, 02093389

Después de agregar los comentarios de validación, si los ID de las tablas coinciden, los datos de todas las tablas de cada página se extraen y se muestran en el validador.

Anteriormente, en tales casos, se omitían algunas páginas y no se mostraban los datos de todas las páginas en el validador.

Cuando aplica la configuración de entrenamiento avanzada, necesita intercambiar columnas y todos los valores de las columnas deben asignarse de manera correcta. Como resultado, los datos se extraen de manera correcta en columnas separadas. Puede seleccionar volver a asignar todas las celdas de las columnas o eliminar todas las demás filas de celdas incorrectas manteniendo intactas las dos primeras filas. No debe haber celdas incorrectas en la columna y todas las celdas de la columna deben tener los valores correctos.

Anteriormente, en tales casos, los datos de dos columnas se extraían en una sola columna.

Ahora puede extraer los valores de los campos de la tabla en el orden correcto y el problema de extracción de varias filas ya no persiste. Además, puede utilizar la función indicador de fin de tabla para extraer varias líneas después de aplicar datos de retroalimentación cuando solo hay una fila en la tabla.
Nota: Para tablas de una sola fila, la mejor práctica es utilizar la función indicador de fin de tabla. De lo contrario, en escenarios específicos la extracción podría ser parcial.

ID de caso de Servicio de nube: 02091013

Después de entrenar un documento, cuando el usuario lo procesa con OCR de Google Vision, se guardan los comentarios y se extraen los datos requeridos.

Anteriormente, en tales casos, no era posible procesar un tipo específico de documento y era necesario validarlo manualmente cada vez.

ID de caso de Servicio de nube: 02098682

3.31.17

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Con OCR de Google Vision, ahora puede procesar los documentos correctamente sin una licencia de Google Document AI. Además, no genera ningún mensaje de error.

Anteriormente, solicitaba una licencia de Google Document AI para procesar los documentos y generaba un error al extraer los documentos. Por lo tanto, no se podían extraer los documentos con OCR de Google Vision.

ID de caso de Servicio de nube: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Cuando los usuarios crean una instancia de aprendizaje con Google Document AI (BYOK) y proxy autenticado, la extracción de documentos ya no falla en documentos de más de 10 páginas.

Anteriormente, en tales casos, la extracción fallaba y aparecía un mensaje de error y los usuarios no podían procesar los documentos.

3.31.15

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Si las Reglas del documento contienen varias condiciones utilizando el operador Y con (o sin) un grupo, ahora se muestra un mensaje de error apropiado. Además, ahora se aplica la acción correspondiente en los campos.

3.31.13

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Cambios
Con la función de extracción mejorada de documentos no estructurados en Automatización de documentos, puede realizar lo siguiente:
  • Procesar consultas complejas de forma eficaz.
  • Validar documentos con navegación mejorada a la página pertinente.
Correcciones
Con la función de extracción de tablas mejorada mediante el motor ABBYY OCR, la retroalimentación heurística ahora funciona de forma correcta.
  • En el caso del idioma alemán, la extracción de facturas funciona de forma correcta después de aplicar retroalimentación y se extraen todos los datos de la tabla.
  • En el caso del idioma español, los datos de la tabla se extraen de forma correcta del documento de factura.
  • En el caso del idioma inglés, los datos de la factura se extraen de todas las páginas con ABBYY OCR.

ID de caso de Servicio de nube: 01995901

Cuando un usuario extrae los datos de una tabla de un archivo PDF en el que la tabla se expande a varias páginas, los datos de todas las páginas se extraen de forma correcta después de aplicar la retroalimentación heurística.

Anteriormente, los usuarios no podían extraer datos de la segunda página del archivo PDF cuando la tabla se expandía a varias páginas.

ID de caso de Servicio de nube: 01996536

Al comenzar la extracción desde la primera página para todos los campos, los comentarios heurísticos ahora funcionan correctamente para la captura de datos de tablas de varias líneas y generan el resultado correcto.

Anteriormente, los datos de la tabla de varias líneas no se extraían incluso después de proporcionar la retroalimentación heurística. Como consecuencia, los resultados no se generaban correctamente.

ID de caso de servicio de nube: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Para Formularios estándar de Microsoft, la extracción de la tabla ya no falla cuando las celdas están vacías y los usuarios pueden extraer el documento de forma correcta.
Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, el documento extraído muestra el orden correcto de las palabras para las fechas en todas las páginas.
Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, todos los valores se muestran en la tabla después de la extracción.

Anteriormente, en tales casos, la región identificada por el sistema (SIR) estaba resaltada, pero se mostraba un valor vacío en la tabla.

Cuando un usuario importa un archivo .dw con retroalimentación heurística y procesa un documento que contiene el valor (-) en la última fila, los documentos se extraen de forma correcta sin omitir el valor negativo en la última fila.

Anteriormente, en tales casos, se omitía la última fila, lo que provocaba la pérdida de datos o un procesamiento incorrecto.

Cuando un usuario procesa un documento que contiene una tabla, la extracción finaliza exitosamente sin el mensaje de error DOCUMENT_PARTIALLY_FAILED o Tiempo de espera de extracción.

Anteriormente, en tales casos, algunos documentos no se extraían debido a múltiples detecciones de la misma tabla y causaban un problema de tamaño de la tabla (max () arg).

Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, todas las filas se extraen por separado de todas las páginas.

Anteriormente, las filas de la segunda página se fusionaban en una sola.

Limitaciones
Cuando un usuario utiliza OCR de Google Vision, la detección o extracción de la tabla no funcionará.

Solución: Se recomienda utilizar el motor ABBYY OCR.

ID de caso de Servicio de nube: 01995901

En casos específicos, donde las tablas se distribuyen en varias páginas sin encabezados en todas las páginas (páginas sin encabezado), los usuarios pueden observar que los datos no se extraen de todas las páginas después de aplicar la retroalimentación.

3.30.24

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Los usuarios ahora pueden ver los datos extraídos de la segunda fila correctamente mediante el uso de los comentarios heurísticos.
Para el tipo de documento Orden de compra, ahora puede extraer correctamente los valores de campo de tabla de todas las páginas.
El archivo de comentarios generado ya no muestra ningún mensaje de error y los usuarios pueden procesar documentos correctamente.

3.30.22

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Novedades
Automatización de documentos proporciona una extracción mejorada a través de las nuevas acciones Obtener datos de documento y Actualizar datos de documento. Puede utilizar estas acciones para aplicar la lógica personalizada para la manipulación y validación de datos con el fin de maximizar el procesamiento directo (STP) y reducir los esfuerzos de verificación manual.

3.30.21

  • Versión de Agente de bot compatible: 21.98 o posterior
  • Versión de Control Room compatible: 15345 o posterior
Correcciones
Esta versión del paquete de Extracción de documentos es un parche para corregir el error '501: DOCUMENT_PARTICITY_FAILED' que se producía al procesar algunos documentos.

3.30.19

  • Versión de Agente de bot compatible: 21.98 o posterior
  • Versión de Control Room compatible: 15345 o posterior
Correcciones
El paquete de Extracción de documentos proporciona una capacidad de extracción mejorada para columnas de encabezado de tabla complejas.
  • Escenario 1: Extracción de datos de encabezados de columna de tabla con varios encabezados fusionados en una sola columna.
  • Escenario 2: Extracción de datos de encabezados de columna de tabla con varios subencabezados divididos.
Siga estos pasos para lograr una extracción de datos de encabezados de tabla mejorada:
  1. Crear o editar una instancia de aprendizaje.
  2. Para agregar o editar los campos de la tabla, vaya a la pestaña Campos de tabla y haga clic en Agregar un campo > Propiedades de Campo.
  3. Agregue cada encabezado de tabla como un campo de tabla independiente. Por ejemplo:

    Escenario 1: Agregue el encabezado de columna y cada subencabezado fusionado como un campo de tabla independiente. Con la captura de pantalla como referencia, debe extraer datos de los tres campos de encabezado de columna fusionados, para los que debe haber creado tres campos de tabla independientes, como CGST con alias CGST, SGST con alias SGST y CESS con alias CESS.

    Ejemplo de encabezado de columna con varios subencabezados.

    Escenario 2: Agregue el encabezado de columna y cada subencabezado dividido como un campo de tabla independiente. Al igual que en el ejemplo anterior, para un encabezado de columna CGST con los subencabezados divididos Rate y AMT, deberá crear dos campos de tabla separados CGST Rate con alias CGST Rate y CGST AMT con alias CGST AMT.

    Ejemplo de encabezado de columna con varios subencabezados divididos.

  4. Haga clic en Enviar para guardar sus cambios.

3.29.17

  • Versión de Agente de bot compatible: 21.98 o posterior
  • Versión de Control Room compatible: 15345 o posterior
Correcciones
El paquete de extracción de documentos tiene correcciones de mejora de extracción tanto para los campos de formularios y tablas.

3.29.14

  • Versión de Agente de bot compatible: 21.98 o posterior
  • Versión de Control Room compatible: 15345 o posterior
Novedades
Automatización de documentos proporciona una extracción mejorada a través de una retroalimentación heurística centrada en escenarios complejos, como las tablas múltiples. Además, existen mejoras en la extracción tanto para los campos de formulario como para el rendimiento inmediato (específicamente para los campos de tabla).