Automation 360

Cree una instancia de aprendizaje en Document Automation

Descargar como PDF

Contenidos

InicioAutomation 360Document AutomationDescripción general de las instancias de aprendizajeCree una instancia de aprendizaje en Document Automation

Índice

Cree una instancia de aprendizaje en Document Automation

Descargar como PDF

Última actualización2025/03/24

Cree una instancia de aprendizaje en Document Automation

Para comenzar a procesar los documentos, cree una instancia de aprendizaje con el fin de extraer los datos de los distintos tipos de documentos compatibles. Una instancia de aprendizaje es una estructura que contiene información como el tipo de documento, el idioma y los campos que deben extraerse, etc.

Antes de empezar

Para crear una instancia de aprendizaje, debe ser un usuario de Learning instance creator. Consulte Document Automation usuarios.
En el caso de los tipos de documentos que admiten OCR, el OCR predeterminado es Motor ABBYY FineReader.De manera alternativa, puede crear una instancia de aprendizaje para procesar documentos en OCR de Google Vision.
En el caso del tipo de documento Formularios estándar, asegúrese de crear un modelo de extracción personalizado. Consulte Crear un modelo de extracción personalizado mediante Formularios estándares.

Mire este video para conocer el proceso integral de creación de una instancia de aprendizaje:

Procedimiento

Desde la página de inicio de Control Room, vaya a IA > Document Automation y haga clic en Crear instancia de aprendizaje.
Ingrese un nombre y una descripción para la instancia de aprendizaje.
Document Automation no permite duplicar los nombres de las instancias de aprendizaje, por lo que el nombre que proporcione debe ser único.
Seleccione un tipo de documento adecuado.

Nota: Use el tipo de documento Definido por el usuario para procesar documentos que visualmente sean similares a las facturas, como las órdenes de compra y las órdenes de venta, que contienen pares clave-valor y una estructura de tabla. En este tipo de documentos, se crean y configuran todos los campos del formulario y de la tabla.
Seleccionar el idioma.
Para obtener detalles sobre los idiomas que se admiten en Document Automation, consulte Idiomas admitidos en Document Automation.
Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el idioma seleccionado durante la configuración del analizador se selecciona automáticamente. Además, la lista de configuración regional muestra las opciones de idioma según el idioma seleccionado automáticamente.
Seleccione un proveedor.
Si seleccionó el idioma inglés en el paso 4, Automation Anywhere (Preentrenado) se selecciona automáticamente.
Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el analizador configurado (de terceros) se selecciona automáticamente como proveedor.
Opcional: Seleccione un proveedor de OCR.
Puede seleccionar entre las siguientes opciones:
- ABBYY
- Google Vision
- Digital PDF Extractor
De manera predeterminada, Document Automation procesa los documentos usando Motor ABBYY FineReader.

Los usuarios con una Control Room Nube pueden seleccionar procesar los documentos mediante OCR de Google Vision o Digital PDF Extractor.
Opcional: Puede utilizar la opción Mejorar la precisión mediante la validación para enviar comentarios al sistema con el fin de mejorar los resultados de extracción. Para obtener más información, consulte Mejorar la precisión de la extracción mediante la validación.
Nota:
- La opción Mejorar la precisión mediante la validación está disponible solo para los tipos de documentos seleccionados.
- La opción Mejorar la precisión mediante la validación utilizará los indicadores del usuario proporcionados en la función Consulta de búsqueda para modelo de IA generativa para mejorar la extracción de datos. Consulte Extracción de datos en Document Automation mediante IA generativa.
Opcional: Seleccione la opción Extracción de datos impulsada por IA generativa para utilizar las funciones de IA generativa para la extracción. Para obtener más información, consulte Extracción de datos en Document Automation mediante IA generativa.
Seleccione uno de los siguientes proveedores de IA generativa:
Nota:
- Para usar la opción de extracción de datos impulsada por IA generativa, asegúrese de estar utilizando la versión 3.31.16 o una posterior del paquete de Extracción de documentos. Consulte Actualizaciones del paquete de Extracción de documentos.
- La opción Extracción de datos impulsada por IA generativa está disponible solo en los tipos de documentos seleccionados. En algunos tipos de documentos, la opción Extracción de datos impulsada por IA generativa está habilitada de forma predeterminada y no se puede deshabilitar. Solo puede elegir el proveedor de IA generativa para este tipo de documentos.
- Cuando actualice desde una versión anterior a v.33 o posterior, Open AI se configurará como el proveedor de extracción de datos predeterminado.
- Cuando selecciona Anthropic como proveedor de extracción de datos en una instancia de aprendizaje y no configura los requisitos de configuración Anthropic necesarios en el bot de extracción correspondiente, verá un error al procesar los documentos.
- Si ha seleccionado el proveedor Anthropic para una instancia de aprendizaje y configuró incorrectamente la configuración Anthropic o seleccionó un proveedor diferente en el bot de extracción correspondiente, verá un error al procesar los documentos.
- Si procesó documentos usando OpenAI y, luego, cambió a Anthropic para la extracción de datos, solo los documentos que se procesarán después de cambiar a Anthropic utilizarán Anthropic para la extracción de datos. En el caso de los documentos procesados previamente, los datos extraídos utilizarían OpenAI.
- Open AI: OpenAI facilita el acceso a los potentes modelos de lenguaje de Open AI para generar contenido, resumirlo, comprender imágenes, buscar semántica y traducir lenguaje natural a código. Este proveedor está disponible mediante licencia integrada (no requiere licencias adicionales) y del modelo traiga su propia licencia (BYOL). Si está utilizando BYOL, asegúrese de establecer la configuración adicional para OpenAI en el bot de extracción para utilizar este proveedor. Consulte acción Extraer datos.
- Anthropic: Ahora puede usar los modelos disponibles de Anthropic en IA generativa a través de AWS y GCP para la extracción de datos en Document Automation. Esta oferta le brinda flexibilidad para seleccionar el modelo de IA generativa según el proveedor de Nube que su empresa haya certificado.
  Anthropic ofrece las siguientes ventajas:
  - Procesar de manera eficiente los documentos grandes y no estructurados.
  - Puede manejar documentos tanto en inglés como en otros idiomas.
  - Procesa documentos de manera más rápida con una mayor precisión en la extracción de datos.
  Si usa el método traiga su propia licencia (BYOL), debe configurar el modelo de Claude de Anthropic en el servicio Google Vertex AI o Amazon Bedrock y, luego, establecer la configuración adicional en el bot de extracción para utilizar este proveedor. Consulte acción Extraer datos.
Haga clic en Siguiente.

Le recomendamos que abra un documento de muestra junto a la ventana de Control Room mientras se configuran los campos del formulario y de la tabla.

Nota:

Un campo de formulario es un tipo de campo que solo aparece una vez en un documento.
Un campo de tabla es un tipo de campo que se repite en todo un documento, normalmente en el formulario de una tabla.

Configure los campos del formulario y de la tabla para la extracción. Para obtener más información, consulte .
1. Haga clic en un campo para abrir el editor de campos. Para obtener más información, consulte .
2. Pase el mouse sobre el ícono del menú a la derecha de un campo para acceder a las flechas arriba/abajo.
3. Utilice las flechas para reorganizar el orden de los campos para obtener una validación manual más eficiente.
  El orden de los campos no afecta a la extracción.
Para obtener más información sobre otros atributos de campo, consulte .
Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte .

Nota: Si ha seleccionado la opción de Extracción de datos impulsada por IA generativa, le recomendamos que agregue buenos indicadores para los campos a fin de obtener los resultados esperados al crear las instancias de aprendizaje. Consulte Extracción de datos en Document Automation mediante IA generativa.
La siguiente imagen muestra campos de formulario y tabla configurados en una instancia de aprendizaje:

Nota: La opción Agregar un campo no está disponible para el tipo de documento Recibos.
Opcional: En la pestaña Campos de tabla, haga clic en el ícono + para agregar una tabla personalizada a nivel de instancia de aprendizaje.
1. Ingrese un nombre para la tabla.
2. Opcional: Ingrese un indicador bien definido para describir los detalles de la tabla en el documento del cual desea extraer datos. Por ejemplo, si un documento contiene múltiples tablas con encabezados idénticos pero títulos diferentes, puede especificar el título exacto de la tabla en el indicador para asegurar que los datos se extraigan de la tabla correcta.
  Para actualizar un indicador de tabla, haga clic en el ícono Editar tabla (), actualice el indicador y haga clic en Actualizar.
3. Haga clic en Agregar.
4. Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte .
  
  Nota: También puede agregar y eliminar la tabla personalizada mientras edita una instancia de aprendizaje.
La tabla personalizada se muestra en la lista desplegable de la tabla.

También puede ver los campos de tablas personalizadas y predeterminadas en la pestaña Normas del documento, pero no puede seleccionar campos en tablas diferentes. Para obtener más detalles sobre la compatibilidad con varias tablas, consulte .
Haga clic en Crear.

Cuando se crea una nueva instancia de aprendizaje, Control Room crea una carpeta con el mismo nombre que la instancia de aprendizaje en la carpeta Automatización > Procesos del Espacio de trabajo de documentos. La carpeta contiene dos bots (extracción y descarga), un proceso y un formulario. Para obtener más información, consulte .

Qué hacer a continuación

Cargue documentos en la instancia de aprendizaje, corrija errores de validación y verifique los datos extraídos: Documentos procesados en Document Automation

Contenido relacionado

Consideraciones al crear una instancia de aprendizaje en Document Automation

Ningún tema anterior

No hay tema siguiente

Ningún tema anterior

No hay tema siguiente