Actualizaciones del paquete de Extracción de documentos

Revise las actualizaciones de las versiones publicadas del paquete de Extracción de documentos, como las funciones nuevas y mejoradas, así como las correcciones y limitaciones. La página también enumera las fechas de lanzamiento de cada versión, y las versiones compatibles de Control Room y Agente de bot.

Resumen de las versiones

En la siguiente tabla se enumeran las versiones del Extracción de documentos de paquete publicadas con una versión de Automation 360 o como versión de solo paquete (en orden descendente de fechas de publicación). Haga clic en el enlace de la versión para obtener información sobre las actualizaciones de esa versión del paquete.
Versión Fecha de actualización Tipo de versión Versión de Agente de bot Compilación de Control Room
13 de diciembre de 2024 Paquete-solo para versiones posteriores a Automation 360 v.35 21.252 o posterior 19223 o posterior
26 de noviembre de 2024 Con el lanzamiento de Automation 360 v.35 (Sandbox) 21.252 o posterior 19223 o posterior
27 de septiembre de 2024 Con el lanzamiento de Automation 360 v.34 (Sandbox) 21.252 o posterior 19223 o posterior
15 de julio de 2024 Paquete-solo para versiones posteriores a Automation 360 v.33 21.252 o posterior 19223 o posterior
14 de junio de 2024 Solo Paquete; posterior al lanzamiento de Automation 360 v.32 21.252 o posterior 19223 o posterior
26 de junio de 2024 Con la versión v.33 de Automation 360 (Local) 21.252 o posterior 19223 o posterior
18 de abril de 2024 Solo Paquete; posterior al lanzamiento de Automation 360 v.32 21.252 o posterior 19223 o posterior
5 de abril de 2024 Con el lanzamiento de Automation 360 versión 32 (Local) 21.252 o posterior 19223 o posterior
21 de marzo de 2024 Con el lanzamiento de Automation 360 v.32 (Sandbox) 21.252 o posterior 19223 o posterior
26 de enero de 2024 Paquete-solo para versiones posteriores a Automation 360 v.31 21.252 o posterior 19223 o posterior
22 de diciembre de 2023 Solo Paquete; posterior al lanzamiento de Automation 360 v.31 (Sandbox) 21.252 o posterior 19223 o posterior
6 de diciembre de 2023 Con el lanzamiento de Automation 360 v.31 (Sandbox) 21.252 o posterior 19223 o posterior
28 de noviembre de 2023 Con Automation 360 versión 30 21.252 o posterior 19223 o posterior
16 de noviembre de 2023 Solo Paquete; posterior al lanzamiento de Automation 360 v.30 21.252 o posterior 19223 o posterior
3.30.24 21 de septiembre de 2023 Solo Paquete; para versiones posteriores a Automation 360 v.30 (Sandbox) 21.252 o posterior 19223 o posterior
3.30.22 6 de septiembre de 2023 Con el lanzamiento de Automation 360 v.30 (Sandbox) 21.252 o posterior 19223 o posterior
21 de agosto de 2023 Solo para Paquete; para versiones posteriores a Automation 360 v.29 21.98 o posterior 15345 o posterior
3.30.19 16 de agosto de 2023 Solo para Paquete; para versiones posteriores a Automation 360 v.29 21.98 o posterior 15345 o posterior
17 de julio de 2023 Paquete-solo para versiones posteriores a Automation 360 v.29 21.98 o posterior 15345 o posterior
6 de junio de 2023 Con el lanzamiento de Automation 360 v.29 (Sandbox) 21.98 o posterior 15345 o posterior
Nota:
  • Para descargar un paquete individual (actualizado en una versión de Automation 360 en la que solo necesite el paquete), utilice esta URL:

    https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar

  • Para el paquete de Extracción de documentos, la convención de nomenclatura es: bot-command-iqbot-extraction360-<version-number>-full.jar

    Por ejemplo, bot-command-iqbot-extraction360-3.31.22-full.jar

Para conocer los pasos detallados sobre cómo descargar un paquete y agregarlo manualmente a la Control Room, consulte Agregue paquetes a Control Room.

3.xx.x

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Novedades
Extracción de datos mediante modelos de IA generativa impulsados por visión

Los modelos de IA generativa impulsados por visión están integrados en Document Automation para procesar documentos con estructuras visualmente complejas, como las siguientes:

  • Tablas con filas anidadas y columnas combinadas
  • Secciones repetidas

Los modelos de IA generativa impulsados por visión ofrecen los siguientes beneficios:

  • Mejora la precisión de la extracción de datos de tablas complejas y documentos no estructurados.
  • Mejora de la eficiencia del procesamiento de documentos al reducir la intervención humana.
  • Optimización del flujo de trabajo de procesamiento de documentos al mejorar la precisión de extracción de datos y la eficiencia en el procesamiento de documentos.

Extracción de datos impulsada por visión IA generativa

Cambios
Modelo de extracción de datos mejorado (ID de caso de Servicio de nube: 02086778)

Se ha mejorado el motor de extracción de datos para extraer fechas en el formato correcto de los documentos.

Correcciones
La extracción de datos ahora funcionará en instancias de aprendizaje que utilicen un proveedor IA generativa y los campos estén configurados con la opción de modelo Consulta de búsqueda para lA generativa con el fin devolver la respuesta en formato JSON.

Anteriormente, la extracción de datos podía fallar o devolver valores vacíos para dichos campos.

Ahora podrá extraer datos de tablas que contengan datos apilados después de facilitar comentarios de validación.

Anteriormente, se extraían valores incorrectos en tal escenario.

Ahora puede extraer correctamente el valor del campo total de los documentos en alemán y en español utilizando el proveedor Automation Anywhere.

Anteriormente, el valor del campo total se extraía incorrectamente en ciertos escenarios.

3.35.7

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Cambios
Modelo de extracción de tablas mejorado (ID de caso de servicio de nube: 02141734)

El modelo de extracción de tablas se actualiza para procesar documentos que tienen encabezados complejos en tablas.

Correcciones
Ahora puede procesar documentos para extraer datos sin encontrar errores relacionados con el almacenamiento.

Anteriormente, se mostraba un error relacionado con el almacenamiento al procesar ciertos documentos.

ID de caso de Servicio de nube: 02141163, 02132605

Se corrigieron problemas de vulnerabilidad Para obtener más información, haga clic en el enlace de descarga de la versión y consulte los informes de seguridad y cumplimiento en A-People Downloads page (Login required).

3.34.7

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Cambios
Modelo de mejora en la extracción de tablas

Se actualiza el modelo de extracción de tablas para mejorar la opción del indicador de final de tabla.

ID de caso de Servicio de nube: 02145073, 02154694, 02160765

Correcciones

Cuando crea una instancia de aprendizaje con el tipo de documento establecido en documento No estructurado y el idioma establecido en Sueco, la Extracción de documentos extrae correctamente los datos del tipo de documento no estructurado para el idioma sueco.

Ahora puede proporcionar consultas en la opción Búsqueda de consulta para el modelo de IA generativa y extraer datos con éxito de los documentos de lista de empaque sin ver un error.

Anteriormente, se mostraba un error cuando se proporcionaban ciertas consultas en dicho escenario.

ID de caso de Servicio de nube: 02154341, 02154706, 02173044

Se corrigieron problemas de vulnerabilidad Para obtener más información, haga clic en el enlace de descarga de la versión y consulte los informes de seguridad y cumplimiento en A-People Downloads page (Login required).

3.33.18

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Novedades

Integración inmediata con Anthropic

Ahora puede usar el proveedor Anthropic IA generativa directamente sin ninguna configuración adicional.

Cree una instancia de aprendizaje en Document Automation

Cambios
Modelo de mejora en la extracción de tablas

El modelo de extracción de tablas se actualiza para mejorar la extracción de datos para tablas que abarcan varias páginas en tipos de documentos no estructurados.

Corrección

Al extraer datos utilizando un proveedor de IA generativa, los campos devolverán los valores adecuados si la respuesta se solicita en formato JSON dentro de la consulta de búsqueda.

Anteriormente, los campos específicos devolvían un valor vacío en ese escenario.

3.33.13

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Cambios
Modelo de extracción de tablas mejorado (ID de caso de servicio de nube: 02122434)

El modelo de extracción de tablas se actualiza para mejorar la extracción de la estructura de la tabla y la gestión de errores.

Correcciones
Ahora puede proporcionar comentarios de validación en el campo de formulario estándar vendor_name en una instancia de aprendizaje para extraer correctamente los nombres de los proveedores.

Anteriormente, encontraba un error en tal escenario.

ID de caso de servicio de nube: 02124772, 02122434, 02126627, 02129868, 02132605

En el caso de los documentos que contienen varias páginas y tablas, los campos de la columna principal y del indicador de fin de tabla de todas las tablas de la configuración de entrenamiento avanzada del validador se actualizan adecuadamente después de proporcionar comentarios de validación.

Anteriormente, los campos de la columna principal y del indicador de fin de tabla no se actualizaban en todas las tablas.

Los comentarios de validación ahora funcionan en varias tablas cuando procesa documentos que contienen varias tablas con instancias de aprendizaje.
Limitación
La extracción de datos fallará en el siguiente escenario:
  • Ha creado una instancia de aprendizaje donde el tipo de documento está configurado en Documento no estructurado y el idioma en Sueco.
  • El bot de extracción para la instancia de aprendizaje utiliza la versión 3.33.13 del paquete Extracción de documentos.

3.33.11

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Ahora puede procesar documentos utilizando una instancia de aprendizaje en los siguientes casos:
  • La instancia de aprendizaje se creó con campos de casilla de verificación en IQ Bot.
  • La instancia de aprendizaje se importa a Document Automation utilizando el paquete Puente de IQ Bot a Document Automation.
  • La opción Mejorar la precisión mediante la validación está habilitada para la instancia de aprendizaje en Document Automation.

Anteriormente, la extracción de datos fallaba en tal escenario.

3.32.26

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Cuando procesa un documento con Google Document AI, el bot de extracción ahora se ejecuta con éxito para el idioma Portugués y le envía el documento al validador.

Cuando procesa un documento con objetos de escritura o firma, estos objetos ahora se incluyen en el archivo JSON de salida final.

Anteriormente, debido al alto umbral de confianza establecido para las firmas, los objetos de escritura o firma no se incluían en el archivo JSON de salida final.

Cuando procesa un documento con Custom Document Extractor (CDE) de Google con la configuración “Traiga su propia clave” (BYOK) y el procesador correspondiente utiliza el modelo fundacional, el procesamiento del documento ya no falla debido a una falla transformacional.
Con un modelo de estructura de tabla mejorado específicamente para la detección de columnas de tablas complejas, ahora puede obtener resultados de extracción más precisos.

ID de caso de Servicio de nube: 02110860

Para instancias de aprendizaje puenteadas de IQ Bot a Document Automation, cuando se habilitan y aplican los comentarios de validación, y el usuario procesa el siguiente documento, los datos de todas las páginas ahora se extraen con éxito sin filas fusionadas.

3.32.23

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Se corrigieron las vulnerabilidades notificadas en el análisis de seguridad.

3.32.22

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Con el modelo mejorado de detección de tablas de documentos que consiste en agregar Indicador de fin de tabla, ahora puede extraer datos de tablas de todas las páginas para el idioma seleccionado. De esta manera, puede reducir las tablas faltantes y los problemas de extracción de las últimas filas de las páginas.

ID de caso de Servicio de nube: 02065073

Con la función de extracción de tablas mejorada, las tablas no estructuradas ya no muestran los valores no deseados y ahora extraen los datos de la tabla correctamente.
Los usuarios ahora pueden guardar los comentarios de validación en su entorno de Document Automation cuando el proxy está habilitado en la máquina de Agente de bot.

ID de caso de Servicio de nube: 02092484

Con OCR de Google Vision y el proxy habilitado, la extracción del documento ya no falla para documentos no estructurados y no muestra un mensaje de error.

ID de caso de Servicio de nube: 02104409

3.31.22

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Después de agregar comentarios de validación a la instancia de aprendizaje, la extracción de documentos ya no falla con un mensaje de error.

Anteriormente, la extracción del documento fallaba cuando se seleccionaba la casilla de verificación de validación.

Después de agregar comentarios de validación a la instancia de aprendizaje, los comentarios se guardan para todas las tablas en todas las páginas del documento y los datos se extraen de manera correcta de todas las páginas.

Anteriormente, los comentarios no se guardaban para todas las páginas.

ID de caso de Servicio de nube: 01995135, 02093575, 02093389

Después de agregar los comentarios de validación, si los ID de las tablas coinciden, los datos de todas las tablas de cada página se extraen y se muestran en el validador.

Anteriormente, en tales casos, se omitían algunas páginas y no se mostraban los datos de todas las páginas en el validador.

Cuando aplica la configuración de entrenamiento avanzada, necesita intercambiar columnas y todos los valores de las columnas deben asignarse de manera correcta. Como resultado, los datos se extraen de manera correcta en columnas separadas. Puede seleccionar volver a asignar todas las celdas de las columnas o eliminar todas las demás filas de celdas incorrectas manteniendo intactas las dos primeras filas. No debe haber celdas incorrectas en la columna y todas las celdas de la columna deben tener los valores correctos.

Anteriormente, en tales casos, los datos de dos columnas se extraían en una sola columna.

Ahora puede extraer los valores de los campos de la tabla en el orden correcto y el problema de extracción de varias filas ya no persiste. Además, puede utilizar la función indicador de fin de tabla para extraer varias líneas después de aplicar datos de retroalimentación cuando solo hay una fila en la tabla.
Nota: Para tablas de una sola fila, la mejor práctica es utilizar la función indicador de fin de tabla. De lo contrario, en escenarios específicos la extracción podría ser parcial.

ID de caso de Servicio de nube: 02091013

Después de entrenar un documento, cuando el usuario lo procesa con OCR de Google Vision, se guardan los comentarios y se extraen los datos requeridos.

Anteriormente, en tales casos, no era posible procesar un tipo específico de documento y era necesario validarlo manualmente cada vez.

ID de caso de Servicio de nube: 02098682

3.31.17

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Con OCR de Google Vision, ahora puede procesar los documentos correctamente sin una licencia de Google Document AI. Además, no genera ningún mensaje de error.

Anteriormente, solicitaba una licencia de Google Document AI para procesar los documentos y generaba un error al extraer los documentos. Por lo tanto, no se podían extraer los documentos con OCR de Google Vision.

ID de caso de Servicio de nube: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573

3.31.16

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Cuando los usuarios crean una instancia de aprendizaje con Google Document AI (BYOK) y proxy autenticado, la extracción de documentos ya no falla en documentos de más de 10 páginas.

Anteriormente, en tales casos, la extracción fallaba y aparecía un mensaje de error y los usuarios no podían procesar los documentos.

3.31.15

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Si las Normas del documento contienen varias condiciones utilizando el operador Y con (o sin) un grupo, ahora se muestra un mensaje de error apropiado. Además, ahora se aplica la acción correspondiente en los campos.

3.31.13

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Cambios
Con la función de extracción mejorada de documentos no estructurados en Document Automation, puede realizar lo siguiente:
  • Procesar consultas complejas de forma eficaz.
  • Validar documentos con navegación mejorada a la página pertinente.
Correcciones
Con la función de extracción de tablas mejorada mediante el motor ABBYY OCR, la retroalimentación heurística ahora funciona de forma correcta.
  • En el caso del idioma alemán, la extracción de facturas funciona de forma correcta después de aplicar retroalimentación y se extraen todos los datos de la tabla.
  • En el caso del idioma español, los datos de la tabla se extraen de forma correcta del documento de factura.
  • En el caso del idioma inglés, los datos de la factura se extraen de todas las páginas con ABBYY OCR.

ID de caso de Servicio de nube: 01995901

Cuando un usuario extrae los datos de una tabla de un archivo PDF en el que la tabla se expande a varias páginas, los datos de todas las páginas se extraen de forma correcta después de aplicar la retroalimentación heurística.

Anteriormente, los usuarios no podían extraer datos de la segunda página del archivo PDF cuando la tabla se expandía a varias páginas.

ID de caso de Servicio de nube: 01996536

Al comenzar la extracción desde la primera página para todos los campos, los comentarios heurísticos ahora funcionan correctamente para la captura de datos de tablas de varias líneas y generan el resultado correcto.

Anteriormente, los datos de la tabla de varias líneas no se extraían incluso después de proporcionar la retroalimentación heurística. Como consecuencia, los resultados no se generaban correctamente.

ID de caso de servicio de nube: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090

Para Formularios estándares de Microsoft, la extracción de la tabla ya no falla cuando las celdas están vacías y los usuarios pueden extraer el documento de forma correcta.
Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, el documento extraído muestra el orden correcto de las palabras para las fechas en todas las páginas.
Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, todos los valores se muestran en la tabla después de la extracción.

Anteriormente, en tales casos, la región identificada por el sistema (SIR) estaba resaltada, pero se mostraba un valor vacío en la tabla.

Cuando un usuario importa un archivo .dw con retroalimentación heurística y procesa un documento que contiene el valor (-) en la última fila, los documentos se extraen de forma correcta sin omitir el valor negativo en la última fila.

Anteriormente, en tales casos, se omitía la última fila, lo que provocaba la pérdida de datos o un procesamiento incorrecto.

Cuando un usuario procesa un documento que contiene una tabla, la extracción finaliza exitosamente sin el mensaje de error DOCUMENT_PARTIALLY_FAILED o Tiempo de espera de extracción.

Anteriormente, en tales casos, algunos documentos no se extraían debido a múltiples detecciones de la misma tabla y causaban un problema de tamaño de la tabla (max () arg).

Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, todas las filas se extraen por separado de todas las páginas.

Anteriormente, las filas de la segunda página se fusionaban en una sola.

Limitaciones
Cuando un usuario utiliza OCR de Google Vision, la detección o extracción de la tabla no funcionará.

Solución: Se recomienda utilizar el motor ABBYY OCR.

ID de caso de Servicio de nube: 01995901

En casos específicos, donde las tablas se distribuyen en varias páginas sin encabezados en todas las páginas (páginas sin encabezado), los usuarios pueden observar que los datos no se extraen de todas las páginas después de aplicar la retroalimentación.

3.30.24

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Correcciones
Los usuarios ahora pueden ver los datos extraídos de la segunda fila correctamente mediante el uso de los comentarios heurísticos.
Para el tipo de documento Orden de compra, ahora puede extraer correctamente los valores de campo de tabla de todas las páginas.
El archivo de comentarios generado ya no muestra ningún mensaje de error y los usuarios pueden procesar documentos correctamente.

3.30.22

  • Versión de Agente de bot compatible: 21.252 o posterior
  • Versión de Control Room compatible: 19223 o posterior
Novedades
Document Automation proporciona una extracción mejorada a través de las nuevas acciones Obtener datos de documento y Actualizar datos de documento. Puede utilizar estas acciones con el fin de aplicar la lógica personalizada para la manipulación y validación de datos que le permiten reducir los esfuerzos de verificación manual.

3.30.21

  • Versión de Agente de bot compatible: 21.98 o posterior
  • Versión de Control Room compatible: 15345 o posterior
Correcciones
Esta versión del paquete de Extracción de documentos es un parche para corregir el error \'501: DOCUMENT_PARTIALLY_FAILED\' que se producía al procesar algunos documentos.

3.30.19

  • Versión de Agente de bot compatible: 21.98 o posterior
  • Versión de Control Room compatible: 15345 o posterior
Correcciones
El paquete de Extracción de documentos proporciona una capacidad de extracción mejorada para columnas de encabezado de tabla complejas.
  • Escenario 1: Extracción de datos de encabezados de columna de tabla con varios encabezados fusionados en una sola columna.
  • Escenario 2: Extracción de datos de encabezados de columna de tabla con varios subencabezados divididos.
Siga estos pasos para lograr una extracción de datos de encabezados de tabla mejorada:
  1. Crear o editar una instancia de aprendizaje.
  2. Para agregar o editar los campos de la tabla, vaya a la pestaña Campos de tabla y haga clic en Agregar un campo > Propiedades de campo.
  3. Agregue cada encabezado de tabla como un campo de tabla independiente. Por ejemplo:

    Escenario 1: Agregue el encabezado de columna y cada subencabezado fusionado como un campo de tabla independiente. Con la captura de pantalla como referencia, debe extraer datos de los tres campos de encabezado de columna fusionados, para los que debe haber creado tres campos de tabla independientes, como CGST con alias CGST, SGST con alias SGST y CESS con alias CESS.

    Ejemplo de encabezado de columna con varios subencabezados.

    Escenario 2: Agregue el encabezado de columna y cada subencabezado dividido como un campo de tabla independiente. Al igual que en el ejemplo anterior, para un encabezado de columna CGST con los subencabezados divididos Rate y AMT, deberá crear dos campos de tabla separados CGST Rate con alias CGST Rate y CGST AMT con alias CGST AMT.

    Ejemplo de encabezado de columna con varios subencabezados divididos.

  4. Haga clic en Enviar para guardar los cambios.

3.29.17

  • Versión de Agente de bot compatible: 21.98 o posterior
  • Versión de Control Room compatible: 15345 o posterior
Correcciones
El paquete de extracción de documentos tiene correcciones de mejora de extracción tanto para los campos de formularios y tablas.

3.29.14

  • Versión de Agente de bot compatible: 21.98 o posterior
  • Versión de Control Room compatible: 15345 o posterior
Novedades
Document Automation proporciona una extracción mejorada a través de una retroalimentación heurística centrada en escenarios complejos, como las tablas múltiples. Además, existen mejoras en la extracción tanto para los campos de formulario como para el rendimiento inmediato (específicamente para los campos de tabla).