Cree una instancia de aprendizaje en Document Automation

Descargar como PDF

Última actualización2026/03/30

Cree una instancia de aprendizaje en Document Automation

Para comenzar a procesar los documentos, cree una instancia de aprendizaje con el fin de extraer los datos de los distintos tipos de documentos compatibles. Una instancia de aprendizaje es una estructura que contiene información como el tipo de documento, el idioma y los campos que deben extraerse, etc.

Antes de empezar

Para crear una instancia de aprendizaje, debe ser un usuario de Learning instance creator. Consulte Document Automation usuarios.
En el caso de los tipos de documentos que admiten OCR, el OCR predeterminado es Motor ABBYY FineReader.De manera alternativa, puede crear una instancia de aprendizaje para procesar documentos en OCR de Google Vision.
En el caso del tipo de documento Formularios estándar, asegúrese de crear un modelo de extracción personalizado. Consulte Crear un modelo de extracción personalizado mediante Standard Forms.

Procedimiento

Desde la página de inicio de la Control Room, vaya a IA > Document Automation y haga clic enCrear nuevo.
Ingrese un nombre y una descripción para la instancia de aprendizaje.
Document Automation no permite duplicar los nombres de las instancias de aprendizaje, por lo que el nombre que proporcione debe ser único.
Seleccione un tipo de documento adecuado.

Nota: Use el tipo de documento Definido por el usuario para procesar documentos que visualmente sean similares a las facturas, como las órdenes de compra y las órdenes de venta, que contienen pares clave-valor y una estructura de tabla. En este tipo de documentos, se crean y configuran todos los campos del formulario y de la tabla.
Seleccionar el idioma.
Para obtener detalles sobre los idiomas que se admiten en Document Automation, consulte Idiomas admitidos en Document Automation.
Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el idioma seleccionado durante la configuración del analizador se selecciona automáticamente. Además, la lista de configuración regional muestra las opciones de idioma según el idioma seleccionado automáticamente.
Seleccione un proveedor.
Si seleccionó el idioma inglés en el paso 4, Automation Anywhere (Preentrenado) se selecciona automáticamente.
Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el analizador configurado (de terceros) se selecciona automáticamente como proveedor.
Opcional: Seleccione un proveedor de OCR.
Puede seleccionar entre las siguientes opciones:
- ABBYY
- Google Vision
- Digital PDF Extractor
  
  Nota: Utilice la opción Digital PDF Extractor solo para extraer datos de archivos PDF digitales y no de documentos escaneados o imágenes.
De manera predeterminada, Document Automation procesa los documentos usando Motor ABBYY FineReader.

Los usuarios con una Control Room Cloud pueden seleccionar procesar los documentos mediante OCR de Google Vision o Digital PDF Extractor.
En la sección Procesar documento usando, seleccione una de las siguientes opciones:
- Bot de tarea: Esta opción está seleccionada de forma predeterminada. Utilice Bot Runners para realizar la extracción de datos.
- Extracción en la nube: Utilice Cloud Extraction Service para realizar la extracción de datos.
  Nota: Para usar la extracción en la nube, necesitará comprar la licencia Enterprise Platform junto con la Document AI Credits.
Para entender la diferencia entre el Bot de tarea y la Extracción en la nube, consulte Cloud Extraction Service.
Opcional: Puede utilizar la opción Mejorar la precisión mediante la validación para enviar comentarios al sistema con el fin de mejorar los resultados de extracción. Para obtener más información, consulte Mejorar la precisión de la extracción mediante la validación.
Nota:
- La opción Mejorar la precisión mediante la validación está disponible solo para los tipos de documentos seleccionados.
- La opción Mejorar la precisión mediante la validación utilizará los indicadores del usuario proporcionados en la función Consulta de búsqueda para modelo de IA generativa para mejorar la extracción de datos. Consulte Extracción de datos en Document Automation mediante generative AI.
Opcional: Seleccione la opción Extracción de datos impulsada por IA generativa para utilizar las funciones de generative AI para la extracción. Para obtener más información, consulte Extracción de datos en Document Automation mediante generative AI.
Seleccione un proveedor de generative AI de Automation Anywhere o una conexión de modelo de generative AI personalizada:
Nota:
- Para saber cómo crear conexiones de modelo de generative AI personalizadas, consulte Usar Model connections en Document Automation.
- Para usar la opción de extracción de datos impulsada por IA generativa, asegúrese de estar utilizando la versión 3.31.16 o una posterior del package de Document Extraction. Consulte Actualizaciones de Document Extraction package.
- La opción Extracción de datos impulsada por IA generativa está disponible solo en los tipos de documentos seleccionados. En algunos tipos de documentos, la opción Extracción de datos impulsada por IA generativa está habilitada de forma predeterminada y no se puede deshabilitar. Solo puede elegir el proveedor de generative AI para este tipo de documentos.
- Cuando actualice desde una versión anterior a v.33 o posterior, Open AI se configurará como el proveedor de extracción de datos predeterminado.
- Si ha seleccionado el proveedor Anthropic para una instancia de aprendizaje y configuró incorrectamente la configuración Anthropic o seleccionó un proveedor diferente en el bot de extracción correspondiente, verá un error al procesar los documentos.
- Si procesó documentos usando OpenAI y, luego, cambió a Anthropic para la extracción de datos, solo los documentos que se procesarán después de cambiar a Anthropic utilizarán Anthropic para la extracción de datos. En el caso de los documentos procesados previamente, los datos extraídos utilizarían OpenAI.
- Open AI: OpenAI facilita el acceso a los potentes modelos de lenguaje de Open AI para generar contenido, resumirlo, comprender imágenes, buscar semántica y traducir lenguaje natural a código. Este proveedor está disponible mediante licencia integrada (no requiere licencias adicionales) y del modelo traiga su propia clave (BYOK). Si está utilizando BYOL, asegúrese de establecer la configuración adicional para OpenAI en el bot de extracción para utilizar este proveedor. Consulte action Extraer datos.
- Anthropic: Ahora puede usar los modelos disponibles de Anthropic en generative AI a través de AWS y GCP para la extracción de datos en Document Automation. Esta oferta le brinda flexibilidad para seleccionar el modelo de generative AI según el proveedor de Cloud que su empresa haya certificado.
  Anthropic ofrece las siguientes ventajas:
  - Procesar de manera eficiente los documentos grandes y no estructurados.
  - Puede manejar documentos tanto en inglés como en otros idiomas.
  - Procesa documentos de manera más rápida con una mayor precisión en la extracción de datos.
  Si usa el método traiga su propia licencia (BYOL), debe configurar el modelo de Claude de Anthropic en el servicio Google Vertex AI o Amazon Bedrock y, luego, establecer la configuración adicional en el bot de extracción para utilizar este proveedor. Consulte action Extraer datos.
- Google Gemini : Ahora puede utilizar los modelos de generative AI de Google Gemini para la extracción de datos en Document Automation.
  Google Gemini ofrece las siguientes ventajas:
  - Procesar de manera eficiente los documentos grandes y no estructurados.
  - Administrar los documentos tanto en inglés como en otros idiomas.
  - Manejar diseños de documentos complejos.
  - Procesar con mayor rapidez los documentos durante la extracción de datos más precisa.
  Nota: BYOL no es compatible con los modelos de Google Gemini.
Haga clic en Siguiente.

Le recomendamos que abra un documento de muestra junto a la ventana de Control Room mientras se configuran los campos del formulario y de la tabla.

Nota:

Un campo de formulario es un tipo de campo que solo aparece una vez en un documento.
Un campo de tabla es un tipo de campo que se repite en todo un documento, normalmente en el formulario de una tabla.

Configure los campos del formulario y de la tabla para la extracción. Para obtener más información, consulte Ver y buscar campos.
1. Haga clic en un campo para abrir el editor de campos. Para obtener más información, consulte Directrices para editar los campos y crear alias personalizados.
2. Pase el mouse sobre el ícono del menú a la derecha de un campo para acceder a las flechas arriba/abajo.
3. Utilice las flechas para reorganizar el orden de los campos para obtener una validación manual más eficiente.
  El orden de los campos no afecta a la extracción.
Para obtener más información sobre otros atributos de campo, consulte Consideraciones sobre los campos de formularios y tablas.
Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte Consideraciones sobre los campos de formularios y tablas.

Nota: Si ha seleccionado la opción de Extracción de datos impulsada por IA generativa, le recomendamos que agregue buenos indicadores para los campos a fin de obtener los resultados esperados al crear las instancias de aprendizaje. Consulte Extracción de datos en Document Automation mediante generative AI.
La siguiente imagen muestra campos de formulario y tabla configurados en una instancia de aprendizaje:

Nota: La opción Agregar un campo no está disponible para el tipo de documento Recibos.
Opcional: En la pestaña Campos de tabla, haga clic en el ícono + para agregar una tabla personalizada a nivel de instancia de aprendizaje.
1. Ingrese un nombre para la tabla.
2. Opcional: Ingrese un indicador para describir los detalles de la tabla en el documento del cual desea extraer datos. Por ejemplo, si un documento contiene múltiples tablas con encabezados idénticos pero títulos diferentes, puede especificar el título exacto de la tabla en el indicador para asegurar que los datos se extraigan de la tabla correcta.
  Para actualizar un indicador de tabla, haga clic en el ícono Editar tabla (), actualice el indicador y haga clic en Actualizar.
3. Haga clic en Agregar.
4. Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte Consideraciones sobre los campos de formularios y tablas.
  
  Nota: También puede agregar y eliminar la tabla personalizada mientras edita una instancia de aprendizaje.
La tabla personalizada se muestra en la lista desplegable de la tabla.

También puede ver los campos de tablas personalizadas y predeterminadas en la pestaña Normas del documento, pero no puede seleccionar campos en tablas diferentes. Para obtener más detalles sobre la compatibilidad con varias tablas, consulte Directrices para crear o editar tablas múltiples personalizadas en una instancia de aprendizaje.
Haga clic en Crear.

Cuando se crea una nueva instancia de aprendizaje, Control Room crea una carpeta con el mismo nombre que la instancia de aprendizaje en la carpeta Automatización > Procesos del Espacio de trabajo de documentos. La carpeta contiene dos bots (extracción y descarga), un proceso y un formulario. Para obtener más información, consulte Estructura de archivos y carpetas de salida de los Bots.

Qué hacer a continuación

Cargue documentos en la instancia de aprendizaje, corrija errores de validación y verifique los datos extraídos: Documentos procesados en Document Automation