Cree una instancia de aprendizaje en Document Automation

Para comenzar a procesar los documentos, cree una instancia de aprendizaje con el fin de extraer los datos de los distintos tipos de documentos compatibles. Una instancia de aprendizaje es una estructura que contiene información como el tipo de documento, el idioma y los campos que deben extraerse, etc.

Antes de empezar

  • Para crear una instancia de aprendizaje, debe ser un usuario de Learning instance creator. Consulte Document Automation usuarios.
  • En el caso de los tipos de documentos que admiten OCR, el OCR predeterminado es Motor ABBYY FineReader.De manera alternativa, puede crear una instancia de aprendizaje para procesar documentos en OCR de Google Vision.
  • En el caso del tipo de documento Formularios estándar, asegúrese de crear un modelo de extracción personalizado. Consulte Crear un modelo de extracción personalizado mediante Formularios estándares.

Mire este video para conocer el proceso integral de creación de una instancia de aprendizaje:

Procedimiento

  1. Desde la página de inicio de Control Room, vaya a IA > Document Automation y haga clic en Crear instancia de aprendizaje.
  2. Ingrese un nombre y una descripción para la instancia de aprendizaje.
    Document Automation no permite duplicar los nombres de las instancias de aprendizaje, por lo que el nombre que proporcione debe ser único.
  3. Seleccione un tipo de documento adecuado.
    Nota: Use el tipo de documento Definido por el usuario para procesar documentos que visualmente sean similares a las facturas, como las órdenes de compra y las órdenes de venta, que contienen pares clave-valor y una estructura de tabla. En este tipo de documentos, se crean y configuran todos los campos del formulario y de la tabla.
  4. Seleccionar el idioma.
    Para obtener detalles sobre los idiomas que se admiten en Document Automation, consulte Idiomas admitidos en Document Automation.

    Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el idioma seleccionado durante la configuración del analizador se selecciona automáticamente. Además, la lista de configuración regional muestra las opciones de idioma según el idioma seleccionado automáticamente.

  5. Seleccione un proveedor.
    Si seleccionó el idioma inglés en el paso 4, Automation Anywhere (Preentrenado) se selecciona automáticamente.

    Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el analizador configurado (de terceros) se selecciona automáticamente como proveedor.

  6. Opcional: Seleccione el proveedor OCR. De manera predeterminada, Document Automation procesa los documentos en Motor ABBYY FineReader.
    Los usuarios con un Cloud Control Room pueden seleccionar procesar los documentos en OCR de Google Vision.
  7. Opcional: Puede utilizar la opción Mejorar la precisión mediante la validación para enviar comentarios al sistema con el fin de mejorar los resultados de extracción. Para obtener más información, consulte Mejorar la precisión de la extracción mediante la validación.
    Nota: La opción Mejorar la precisión mediante la validación está disponible solo para los tipos de documentos seleccionados.
  8. Opcional: Seleccione la opción Extracción de datos impulsada por IA generativa para utilizar las funciones de IA generativa para la extracción. Para obtener más información, consulte Extracción de datos en Document Automation mediante IA generativa.
    Seleccione uno de los siguientes proveedores de IA generativa:
    Nota:
    • Para usar la opción de extracción de datos impulsada por IA generativa, asegúrese de estar utilizando la versión 3.31.16 o una posterior del paquete de Extracción de documentos. Consulte Actualizaciones del paquete de Extracción de documentos.
    • La opción Extracción de datos impulsada por IA generativa está disponible solo en los tipos de documentos seleccionados. En algunos tipos de documentos, la opción Extracción de datos impulsada por IA generativa está habilitada de forma predeterminada y no se puede deshabilitar. Solo puede elegir el proveedor de IA generativa para este tipo de documentos.
    • Cuando actualice desde una versión anterior a v.33 o posterior, Open AI se configurará como el proveedor de extracción de datos predeterminado.
    • Cuando selecciona Anthropic como proveedor de extracción de datos en una instancia de aprendizaje y no configura los requisitos de configuración Anthropic necesarios en el bot de extracción correspondiente, verá un error al procesar los documentos.
    • Si ha seleccionado el proveedor Anthropic para una instancia de aprendizaje y configuró incorrectamente la configuración Anthropic o seleccionó un proveedor diferente en el bot de extracción correspondiente, verá un error al procesar los documentos.
    • Si procesó documentos usando OpenAI y, luego, cambió a Anthropic para la extracción de datos, solo los documentos que se procesarán después de cambiar a Anthropic utilizarán Anthropic para la extracción de datos. En el caso de los documentos procesados previamente, los datos extraídos utilizarían OpenAI.
    • Open AI: OpenAI facilita el acceso a los potentes modelos de lenguaje de Open AI para generar contenido, resumirlo, comprender imágenes, buscar semántica y traducir lenguaje natural a código. Este proveedor está disponible mediante licencia integrada (no requiere licencias adicionales) y del modelo traiga su propia licencia (BYOL). Si está utilizando BYOL, asegúrese de establecer la configuración adicional para OpenAI en el bot de extracción para utilizar este proveedor. Consulte acción Extraer datos.
    • Anthropic: Ahora puede usar los modelos disponibles de Anthropic en IA generativa a través de AWS y GCP para la extracción de datos en Document Automation. Esta oferta le brinda flexibilidad para seleccionar el modelo de IA generativa según el proveedor de Nube que su empresa haya certificado.

      Anthropic ofrece las siguientes ventajas:

      • Procesar de manera eficiente los documentos grandes y no estructurados.
      • Puede manejar documentos tanto en inglés como en otros idiomas.
      • Procesa documentos de manera más rápida con una mayor precisión en la extracción de datos.

      Si usa el método traiga su propia licencia (BYOL), debe configurar el modelo de Claude de Anthropic en el servicio Google Vertex AI o Amazon Bedrock y, luego, establecer la configuración adicional en el bot de extracción para utilizar este proveedor. Consulte acción Extraer datos.

    Crear una instancia de aprendizaje en Document Automation
  9. Haga clic en Siguiente.

Le recomendamos que abra un documento de muestra junto a la ventana de Control Room mientras se configuran los campos del formulario y de la tabla.

Nota:
  • Un campo de formulario es un tipo de campo que solo aparece una vez en un documento.
  • Un campo de tabla es un tipo de campo que se repite en todo un documento, normalmente en el formulario de una tabla.

  1. Configure los campos del formulario y de la tabla para la extracción. Para obtener más información, consulte Consideraciones al crear una instancia de aprendizaje en Document Automation.
    1. Haga clic en un campo para abrir el editor de campos. Para obtener más información, consulte Consideraciones al crear una instancia de aprendizaje en Document Automation.
    2. Pase el mouse sobre el ícono del menú a la derecha de un campo para acceder a las flechas arriba/abajo.
    3. Utilice las flechas para reorganizar el orden de los campos para obtener una validación manual más eficiente.
      El orden de los campos no afecta a la extracción.
    Para obtener más información sobre otros atributos de campo, consulte Consideraciones al crear una instancia de aprendizaje en Document Automation.
  2. Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte Consideraciones al crear una instancia de aprendizaje en Document Automation.
    La siguiente imagen muestra campos de formulario y tabla configurados en una instancia de aprendizaje:
    Campos de formulario de una instancia de aprendizaje

    Campos de tabla de una instancia de aprendizaje y adición de una tabla personalizada a nivel de instancia de aprendizaje
    Nota: La opción Agregar un campo no está disponible para el tipo de documento Recibos.
  3. Opcional: En la pestaña Campos de tabla, haga clic en el ícono + para agregar una tabla personalizada a nivel de instancia de aprendizaje.
    1. Ingrese un nombre para la tabla y haga clic en Agregar.
    2. Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte Consideraciones al crear una instancia de aprendizaje en Document Automation.
      Nota: También puede agregar y eliminar la tabla personalizada mientras edita una instancia de aprendizaje.
    La tabla personalizada se muestra en la lista desplegable de la tabla.
    Tabla creada a nivel de instancia de aprendizaje y mostrada en la lista desplegable

    También puede ver los campos de tablas personalizadas y predeterminadas en la pestaña Normas del documento, pero no puede seleccionar campos en tablas diferentes. Para obtener más detalles sobre la compatibilidad con varias tablas, consulte Consideraciones al crear una instancia de aprendizaje en Document Automation.

  4. Haga clic en Crear.
Cuando se crea una nueva instancia de aprendizaje, Control Room crea una carpeta con el mismo nombre que la instancia de aprendizaje en la carpeta Automatización > Procesos del Espacio de trabajo de documentos. La carpeta contiene dos bots (extracción y descarga), un proceso y un formulario. Para obtener más información, consulte Consideraciones al crear una instancia de aprendizaje en Document Automation.

Qué hacer a continuación

Cargue documentos en la instancia de aprendizaje, corrija errores de validación y verifique los datos extraídos: Documentos procesados en Document Automation