Actualizaciones del paquete de Extracción de documentos
- Última actualización2024/12/16
Actualizaciones del paquete de Extracción de documentos
Revise las actualizaciones de las versiones publicadas del paquete de Extracción de documentos, como las funciones nuevas y mejoradas, así como las correcciones y limitaciones. La página también enumera las fechas de lanzamiento de cada versión, y las versiones compatibles de Control Room y Agente de bot.
Resumen de las versiones
En la siguiente tabla se enumeran las versiones del Extracción de documentos de paquete publicadas con una versión de Automation 360 o como versión de solo paquete (en orden descendente de fechas de publicación). Haga clic en el enlace de la versión para obtener información sobre las actualizaciones de esa versión del paquete.Versión | Fecha de actualización | Tipo de versión | Versión de Agente de bot | Compilación de Control Room |
---|---|---|---|---|
13 de diciembre de 2024 | Paquete-solo para versiones posteriores a Automation 360 v.35 | 21.252 o posterior | 19223 o posterior | |
26 de noviembre de 2024 | Con el lanzamiento de Automation 360 v.35 (Sandbox) | 21.252 o posterior | 19223 o posterior | |
27 de septiembre de 2024 | Con el lanzamiento de Automation 360 v.34 (Sandbox) | 21.252 o posterior | 19223 o posterior | |
15 de julio de 2024 | Paquete-solo para versiones posteriores a Automation 360 v.33 | 21.252 o posterior | 19223 o posterior | |
14 de junio de 2024 | Solo Paquete; posterior al lanzamiento de Automation 360 v.32 | 21.252 o posterior | 19223 o posterior | |
26 de junio de 2024 | Con la versión v.33 de Automation 360 (Local) | 21.252 o posterior | 19223 o posterior | |
18 de abril de 2024 | Solo Paquete; posterior al lanzamiento de Automation 360 v.32 | 21.252 o posterior | 19223 o posterior | |
5 de abril de 2024 | Con el lanzamiento de Automation 360 versión 32 (Local) | 21.252 o posterior | 19223 o posterior | |
21 de marzo de 2024 | Con el lanzamiento de Automation 360 v.32 (Sandbox) | 21.252 o posterior | 19223 o posterior | |
26 de enero de 2024 | Paquete-solo para versiones posteriores a Automation 360 v.31 | 21.252 o posterior | 19223 o posterior | |
22 de diciembre de 2023 | Solo Paquete; posterior al lanzamiento de Automation 360 v.31 (Sandbox) | 21.252 o posterior | 19223 o posterior | |
6 de diciembre de 2023 | Con el lanzamiento de Automation 360 v.31 (Sandbox) | 21.252 o posterior | 19223 o posterior | |
28 de noviembre de 2023 | Con Automation 360 versión 30 | 21.252 o posterior | 19223 o posterior | |
16 de noviembre de 2023 | Solo Paquete; posterior al lanzamiento de Automation 360 v.30 | 21.252 o posterior | 19223 o posterior | |
3.30.24 | 21 de septiembre de 2023 | Solo Paquete; para versiones posteriores a Automation 360 v.30 (Sandbox) | 21.252 o posterior | 19223 o posterior |
3.30.22 | 6 de septiembre de 2023 | Con el lanzamiento de Automation 360 v.30 (Sandbox) | 21.252 o posterior | 19223 o posterior |
21 de agosto de 2023 | Solo para Paquete; para versiones posteriores a Automation 360 v.29 | 21.98 o posterior | 15345 o posterior | |
3.30.19 | 16 de agosto de 2023 | Solo para Paquete; para versiones posteriores a Automation 360 v.29 | 21.98 o posterior | 15345 o posterior |
17 de julio de 2023 | Paquete-solo para versiones posteriores a Automation 360 v.29 | 21.98 o posterior | 15345 o posterior | |
6 de junio de 2023 | Con el lanzamiento de Automation 360 v.29 (Sandbox) | 21.98 o posterior | 15345 o posterior |
- Para descargar un paquete individual (actualizado en una versión de Automation 360 en la que solo necesite el paquete), utilice esta URL:
https://aai-artifacts.my.automationanywhere.digital/packages/<package-file-name>-<version.number>.jar
- Para el paquete de Extracción de documentos, la convención de nomenclatura es:
bot-command-iqbot-extraction360-<version-number>-full.jar
Por ejemplo,
bot-command-iqbot-extraction360-3.31.22-full.jar
Para conocer los pasos detallados sobre cómo descargar un paquete y agregarlo manualmente a la Control Room, consulte Agregue paquetes a Control Room.
3.xx.x
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Novedades |
---|
Extracción de datos mediante modelos de IA generativa impulsados por visión
Los modelos de IA generativa impulsados por visión están integrados en Document Automation para procesar documentos con estructuras visualmente complejas, como las siguientes:
Los modelos de IA generativa impulsados por visión ofrecen los siguientes beneficios:
|
Cambios |
---|
Modelo de extracción de datos mejorado (ID de caso de Servicio de nube: 02086778) Se ha mejorado el motor de extracción de datos para extraer fechas en el formato correcto de los documentos. |
Correcciones |
---|
La extracción de datos ahora funcionará en instancias de aprendizaje que utilicen un proveedor IA generativa y los campos estén configurados con la opción de modelo Consulta de búsqueda para lA generativa con el fin devolver la respuesta en formato JSON. Anteriormente, la extracción de datos podía fallar o devolver valores vacíos para dichos campos. |
Ahora podrá extraer datos de tablas que contengan datos apilados después de facilitar comentarios de validación. Anteriormente, se extraían valores incorrectos en tal escenario. |
Ahora puede extraer correctamente el valor del campo total de los documentos en alemán y en español utilizando el proveedor Automation Anywhere. Anteriormente, el valor del campo total se extraía incorrectamente en ciertos escenarios. |
3.35.7
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Cambios |
---|
Modelo de extracción de tablas mejorado (ID de caso de servicio de nube: 02141734) El modelo de extracción de tablas se actualiza para procesar documentos que tienen encabezados complejos en tablas. |
Correcciones |
---|
Ahora puede procesar documentos para extraer datos sin encontrar errores relacionados con el almacenamiento. Anteriormente, se mostraba un error relacionado con el almacenamiento al procesar ciertos documentos. ID de caso de Servicio de nube: 02141163, 02132605 |
Se corrigieron problemas de vulnerabilidad Para obtener más información, haga clic en el enlace de descarga de la versión y consulte los informes de seguridad y cumplimiento en A-People Downloads page (Login required). |
3.34.7
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Cambios |
---|
Modelo de mejora en la extracción de tablas
Se actualiza el modelo de extracción de tablas para mejorar la opción del indicador de final de tabla. ID de caso de Servicio de nube: 02145073, 02154694, 02160765 |
Correcciones |
---|
Cuando crea una instancia de aprendizaje con el tipo de documento establecido en documento No estructurado y el idioma establecido en Sueco, la Extracción de documentos extrae correctamente los datos del tipo de documento no estructurado para el idioma sueco. |
Ahora puede proporcionar consultas en la opción Búsqueda de consulta para el modelo de IA generativa y extraer datos con éxito de los documentos de lista de empaque sin ver un error. Anteriormente, se mostraba un error cuando se proporcionaban ciertas consultas en dicho escenario. ID de caso de Servicio de nube: 02154341, 02154706, 02173044 |
Se corrigieron problemas de vulnerabilidad Para obtener más información, haga clic en el enlace de descarga de la versión y consulte los informes de seguridad y cumplimiento en A-People Downloads page (Login required). |
3.33.18
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Novedades |
---|
Integración inmediata con Anthropic Ahora puede usar el proveedor Anthropic IA generativa directamente sin ninguna configuración adicional. |
Cambios |
---|
Modelo de mejora en la extracción de tablas
El modelo de extracción de tablas se actualiza para mejorar la extracción de datos para tablas que abarcan varias páginas en tipos de documentos no estructurados. |
Corrección |
---|
Al extraer datos utilizando un proveedor de IA generativa, los campos devolverán los valores adecuados si la respuesta se solicita en formato JSON dentro de la consulta de búsqueda. Anteriormente, los campos específicos devolvían un valor vacío en ese escenario. |
3.33.13
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Cambios |
---|
Modelo de extracción de tablas mejorado (ID de caso de servicio de nube: 02122434) El modelo de extracción de tablas se actualiza para mejorar la extracción de la estructura de la tabla y la gestión de errores. |
Correcciones |
---|
Ahora puede proporcionar comentarios de validación en el campo de formulario estándar vendor_name en una instancia de aprendizaje para extraer correctamente los nombres de los proveedores. Anteriormente, encontraba un error en tal escenario. ID de caso de servicio de nube: 02124772, 02122434, 02126627, 02129868, 02132605 |
En el caso de los documentos que contienen varias páginas y tablas, los campos de la columna principal y del indicador de fin de tabla de todas las tablas de la configuración de entrenamiento avanzada del validador se actualizan adecuadamente después de proporcionar comentarios de validación. Anteriormente, los campos de la columna principal y del indicador de fin de tabla no se actualizaban en todas las tablas. |
Los comentarios de validación ahora funcionan en varias tablas cuando procesa documentos que contienen varias tablas con instancias de aprendizaje. |
Limitación |
---|
La extracción de datos fallará en el siguiente escenario:
|
3.33.11
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Ahora puede procesar documentos utilizando una instancia de aprendizaje en los siguientes casos:
Anteriormente, la extracción de datos fallaba en tal escenario. |
3.32.26
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Cuando procesa un documento con Google Document AI, el bot de extracción ahora se ejecuta con éxito para el idioma Portugués y le envía el documento al validador. |
Cuando procesa un documento con objetos de escritura o firma, estos objetos ahora se incluyen en el archivo JSON de salida final. Anteriormente, debido al alto umbral de confianza establecido para las firmas, los objetos de escritura o firma no se incluían en el archivo JSON de salida final. |
Cuando procesa un documento con Custom Document Extractor (CDE) de Google con la configuración “Traiga su propia clave” (BYOK) y el procesador correspondiente utiliza el modelo fundacional, el procesamiento del documento ya no falla debido a una falla transformacional. |
Con un modelo de estructura de tabla mejorado específicamente para la detección de columnas de tablas complejas, ahora puede obtener resultados de extracción más precisos. ID de caso de Servicio de nube: 02110860 |
Para instancias de aprendizaje puenteadas de IQ Bot a Document Automation, cuando se habilitan y aplican los comentarios de validación, y el usuario procesa el siguiente documento, los datos de todas las páginas ahora se extraen con éxito sin filas fusionadas. |
3.32.23
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Se corrigieron las vulnerabilidades notificadas en el análisis de seguridad. |
3.32.22
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Con el modelo mejorado de detección de tablas de documentos que consiste en agregar Indicador de fin de tabla, ahora puede extraer datos de tablas de todas las páginas para el idioma seleccionado. De esta manera, puede reducir las tablas faltantes y los problemas de extracción de las últimas filas de las páginas. ID de caso de Servicio de nube: 02065073 |
Con la función de extracción de tablas mejorada, las tablas no estructuradas ya no muestran los valores no deseados y ahora extraen los datos de la tabla correctamente. |
Los usuarios ahora pueden guardar los comentarios de validación en su entorno de Document Automation cuando el proxy está habilitado en la máquina de Agente de bot. ID de caso de Servicio de nube: 02092484 |
Con OCR de Google Vision y el proxy habilitado, la extracción del documento ya no falla para documentos no estructurados y no muestra un mensaje de error. ID de caso de Servicio de nube: 02104409 |
3.31.22
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Después de agregar comentarios de validación a la instancia de aprendizaje, la extracción de documentos ya no falla con un mensaje de error. Anteriormente, la extracción del documento fallaba cuando se seleccionaba la casilla de verificación de validación. |
Después de agregar comentarios de validación a la instancia de aprendizaje, los comentarios se guardan para todas las tablas en todas las páginas del documento y los datos se extraen de manera correcta de todas las páginas. Anteriormente, los comentarios no se guardaban para todas las páginas. ID de caso de Servicio de nube: 01995135, 02093575, 02093389 |
Después de agregar los comentarios de validación, si los ID de las tablas coinciden, los datos de todas las tablas de cada página se extraen y se muestran en el validador. Anteriormente, en tales casos, se omitían algunas páginas y no se mostraban los datos de todas las páginas en el validador. |
Cuando aplica la configuración de entrenamiento avanzada, necesita intercambiar columnas y todos los valores de las columnas deben asignarse de manera correcta. Como resultado, los datos se extraen de manera correcta en columnas separadas. Puede seleccionar volver a asignar todas las celdas de las columnas o eliminar todas las demás filas de celdas incorrectas manteniendo intactas las dos primeras filas. No debe haber celdas incorrectas en la columna y todas las celdas de la columna deben tener los valores correctos. Anteriormente, en tales casos, los datos de dos columnas se extraían en una sola columna. |
Ahora puede extraer los valores de los campos de la tabla en el orden correcto y el problema de extracción de varias filas ya no persiste. Además, puede utilizar la función indicador de fin de tabla para extraer varias líneas después de aplicar datos de retroalimentación cuando solo hay una fila en la tabla. Nota: Para tablas de una sola fila, la mejor práctica es utilizar la función indicador de fin de tabla. De lo contrario, en escenarios específicos la extracción podría ser parcial.
ID de caso de Servicio de nube: 02091013 |
Después de entrenar un documento, cuando el usuario lo procesa con OCR de Google Vision, se guardan los comentarios y se extraen los datos requeridos. Anteriormente, en tales casos, no era posible procesar un tipo específico de documento y era necesario validarlo manualmente cada vez. ID de caso de Servicio de nube: 02098682 |
3.31.17
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Con OCR de Google Vision, ahora puede procesar los documentos correctamente sin una licencia de Google Document AI. Además, no genera ningún mensaje de error. Anteriormente, solicitaba una licencia de Google Document AI para procesar los documentos y generaba un error al extraer los documentos. Por lo tanto, no se podían extraer los documentos con OCR de Google Vision. ID de caso de Servicio de nube: 02097428, 02096992, 02097798, 02097157, 02098378, 02098563, 02094573 |
3.31.16
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Cuando los usuarios crean una instancia de aprendizaje con Google Document AI (BYOK) y proxy autenticado, la extracción de documentos ya no falla en documentos de más de 10 páginas. Anteriormente, en tales casos, la extracción fallaba y aparecía un mensaje de error y los usuarios no podían procesar los documentos. |
3.31.15
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Si las Normas del documento contienen varias condiciones utilizando el operador Y con (o sin) un grupo, ahora se muestra un mensaje de error apropiado. Además, ahora se aplica la acción correspondiente en los campos. |
3.31.13
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Cambios |
---|
Con la función de extracción mejorada de documentos no estructurados en Document Automation, puede realizar lo siguiente:
|
Correcciones |
---|
Con la función de extracción de tablas mejorada mediante el motor ABBYY OCR, la retroalimentación heurística ahora funciona de forma correcta.
ID de caso de Servicio de nube: 01995901 |
Cuando un usuario extrae los datos de una tabla de un archivo PDF en el que la tabla se expande a varias páginas, los datos de todas las páginas se extraen de forma correcta después de aplicar la retroalimentación heurística. Anteriormente, los usuarios no podían extraer datos de la segunda página del archivo PDF cuando la tabla se expandía a varias páginas. ID de caso de Servicio de nube: 01996536 |
Al comenzar la extracción desde la primera página para todos los campos, los comentarios heurísticos ahora funcionan correctamente para la captura de datos de tablas de varias líneas y generan el resultado correcto. Anteriormente, los datos de la tabla de varias líneas no se extraían incluso después de proporcionar la retroalimentación heurística. Como consecuencia, los resultados no se generaban correctamente. ID de caso de servicio de nube: 01944805, 01946809, 01952836, 01957090, 01975800, 01981088, 01944805, 01946809, 01952836, 01957090 |
Para Formularios estándares de Microsoft, la extracción de la tabla ya no falla cuando las celdas están vacías y los usuarios pueden extraer el documento de forma correcta. |
Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, el documento extraído muestra el orden correcto de las palabras para las fechas en todas las páginas. |
Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, todos los valores se muestran en la tabla después de la extracción. Anteriormente, en tales casos, la región identificada por el sistema (SIR) estaba resaltada, pero se mostraba un valor vacío en la tabla. |
Cuando un usuario importa un archivo .dw con retroalimentación heurística y procesa un documento que contiene el valor (-) en la última fila, los documentos se extraen de forma correcta sin omitir el valor negativo en la última fila. Anteriormente, en tales casos, se omitía la última fila, lo que provocaba la pérdida de datos o un procesamiento incorrecto. |
Cuando un usuario procesa un documento que contiene una tabla, la extracción finaliza exitosamente sin el mensaje de error DOCUMENT_PARTIALLY_FAILED o Tiempo de espera de extracción. Anteriormente, en tales casos, algunos documentos no se extraían debido a múltiples detecciones de la misma tabla y causaban un problema de tamaño de la tabla (max () arg). |
Cuando un usuario importa una instancia de aprendizaje y procesa los documentos, todas las filas se extraen por separado de todas las páginas. Anteriormente, las filas de la segunda página se fusionaban en una sola. |
Limitaciones |
---|
Cuando un usuario utiliza OCR de Google Vision, la detección o extracción de la tabla no funcionará. Solución: Se recomienda utilizar el motor ABBYY OCR. ID de caso de Servicio de nube: 01995901 |
En casos específicos, donde las tablas se distribuyen en varias páginas sin encabezados en todas las páginas (páginas sin encabezado), los usuarios pueden observar que los datos no se extraen de todas las páginas después de aplicar la retroalimentación. |
3.30.24
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Correcciones |
---|
Los usuarios ahora pueden ver los datos extraídos de la segunda fila correctamente mediante el uso de los comentarios heurísticos. |
Para el tipo de documento Orden de compra, ahora puede extraer correctamente los valores de campo de tabla de todas las páginas. |
El archivo de comentarios generado ya no muestra ningún mensaje de error y los usuarios pueden procesar documentos correctamente. |
3.30.22
- Versión de Agente de bot compatible: 21.252 o posterior
- Versión de Control Room compatible: 19223 o posterior
Novedades |
---|
Document Automation proporciona una extracción mejorada a través de las nuevas acciones Obtener datos de documento y Actualizar datos de documento. Puede utilizar estas acciones con el fin de aplicar la lógica personalizada para la manipulación y validación de datos que le permiten reducir los esfuerzos de verificación manual. |
3.30.21
- Versión de Agente de bot compatible: 21.98 o posterior
- Versión de Control Room compatible: 15345 o posterior
Correcciones |
---|
Esta versión del paquete de Extracción de documentos es un parche para corregir el error \'501: DOCUMENT_PARTIALLY_FAILED\' que se producía al procesar algunos documentos. |
3.30.19
- Versión de Agente de bot compatible: 21.98 o posterior
- Versión de Control Room compatible: 15345 o posterior
Correcciones |
---|
El paquete de Extracción de documentos proporciona una capacidad de extracción mejorada para columnas de encabezado de tabla complejas.
Siga estos pasos para lograr una extracción de datos de encabezados de tabla mejorada:
|
3.29.17
- Versión de Agente de bot compatible: 21.98 o posterior
- Versión de Control Room compatible: 15345 o posterior
Correcciones |
---|
El paquete de extracción de documentos tiene correcciones de mejora de extracción tanto para los campos de formularios y tablas. |
3.29.14
- Versión de Agente de bot compatible: 21.98 o posterior
- Versión de Control Room compatible: 15345 o posterior
Novedades |
---|
Document Automation proporciona una extracción mejorada a través de una retroalimentación heurística centrada en escenarios complejos, como las tablas múltiples. Además, existen mejoras en la extracción tanto para los campos de formulario como para el rendimiento inmediato (específicamente para los campos de tabla). |