Cree una instancia de aprendizaje Automatización de documentos

Para comenzar a procesar los documentos, cree una instancia de aprendizaje con el fin de extraer los datos de los distintos tipos de documentos compatibles. Una instancia de aprendizaje es una estructura que contiene información como el tipo de documento, el idioma y los campos que deben extraerse, etc.

Antes de empezar

Mire este video para conocer el proceso integral de creación de una instancia de aprendizaje:

Procedimiento

  1. Desde la página de inicio de Control Room, vaya a Administrar > Instancias de aprendizaje > Crear instancia de aprendizaje.
  2. Ingrese un nombre y una descripción para la instancia de aprendizaje.
    Automatización de documentos no permite duplicar los nombres de las instancias de aprendizaje, por lo que el nombre que proporcione debe ser único.
  3. Seleccione un tipo de documento adecuado.
    Nota: Use el tipo de documento Definido por el usuario para procesar documentos que visualmente sean similares a las facturas, como las órdenes de compra y las órdenes de venta, que contienen pares clave-valor y una estructura de tabla. En este tipo de documentos, se crean y configuran todos los campos del formulario y de la tabla.
  4. Seleccionar el idioma.
    Para obtener detalles sobre los idiomas que se admiten en Automatización de documentos, consulte Idiomas admitidos en Automatización de documentos.

    Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el idioma seleccionado durante la configuración del analizador se selecciona automáticamente. Además, la lista de configuración regional muestra las opciones de idioma según el idioma seleccionado automáticamente.

  5. Seleccione un proveedor.
    Si seleccionó el idioma inglés en el paso 4, Automation Anywhere (Preentrenado) se selecciona automáticamente.

    Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el analizador configurado (de terceros) se selecciona automáticamente como proveedor.

  6. Opcional: Seleccione el proveedor OCR. De manera predeterminada, Automatización de documentos procesa los documentos en Motor ABBYY FineReader.
    Los usuarios con un Cloud Control Room pueden seleccionar procesar los documentos en OCR de Google Vision.
  7. Opcional: Puede utilizar la opción Mejorar la precisión mediante la validación para enviar comentarios al sistema con el fin de mejorar los resultados de extracción. Para obtener más información, consulte Mejora de la precisión de la extracción mediante la validación.
    Nota: La opción Mejorar la precisión mediante validación está disponible solo para los tipos de documentos seleccionados.
  8. Opcional: Seleccione la opción Extracción de datos impulsada por IA generativa para utilizar las funciones de IA generativa para la extracción. Para obtener más información, consulte Extracción de datos en Automatización de documentos mediante IA generativa.
    Seleccione uno de los siguientes proveedores de IA generativa:
    Nota:
    • La opción Extracción de datos impulsada por IA generativa está disponible solo en los tipos de documentos seleccionados. En algunos tipos de documentos, la opción Extracción de datos impulsada por IA generativa está habilitada de forma predeterminada y no se puede deshabilitar. Solo puede elegir el proveedor de IA generativa para este tipo de documentos.
    • Cuando actualice desde una versión anterior a v.33 o posterior, Open AI se configurará como el proveedor de extracción de datos predeterminado.
    • Cuando selecciona Anthropic como proveedor de extracción de datos en una instancia de aprendizaje y no configura los requisitos de configuración Anthropic necesarios en el bot de extracción correspondiente, verá un error al procesar los documentos.
    • Si ha seleccionado el proveedor Anthropic para una instancia de aprendizaje y configuró incorrectamente la configuración Anthropic o seleccionó un proveedor diferente en el bot de extracción correspondiente, verá un error al procesar los documentos.
    • Si procesó documentos usando Open AI y, luego, cambió a Anthropic para la extracción de datos, solo los documentos que se procesarán después de cambiar a Anthropic utilizarán Anthropic para la extracción de datos. En el caso de los documentos procesados previamente, los datos extraídos utilizarían Open AI.
    • Open AI: Azure OpenAI facilita el acceso a los potentes modelos de lenguaje de Open AI para generar contenido, resumirlo, comprender imágenes, buscar semántica y traducir lenguaje natural a código. Este proveedor está disponible mediante licencia integrada (no requiere licencias adicionales) y del modelo traiga su propia licencia (BYOL). Si está utilizando BYOL, asegúrese de establecer la configuración adicional para Open AI en el bot de extracción para utilizar este proveedor. Consulte acción Extraer datos.
    • Anthropic: Ahora puede usar los modelos disponibles de IA generativa en Anthropic a través de AWS y GCP para la extracción de datos en Automatización de documentos. Esta oferta le brinda flexibilidad para seleccionar el modelo de IA generativa según el proveedor de Nube que su empresa haya certificado.

      Anthropic ofrece las siguientes ventajas:

      • Procesar de manera eficiente los documentos grandes y no estructurados.
      • Puede manejar documentos tanto en inglés como en otros idiomas.
      • Procesa documentos de manera más rápida con una mayor precisión en la extracción de datos.

      Si usa el método traiga su propia licencia (BYOL), debe configurar el modelo de Claude de Anthropic en el servicio Google Vertex AI o Amazon Bedrock y, luego, establecer la configuración adicional en el bot de extracción para utilizar este proveedor. Consulte acción Extraer datos.

    Crear instancia de aprendizaje en Automatización de documentos
  9. Haga clic en Siguiente.

Le recomendamos que abra un documento de muestra junto a la ventana de Control Room mientras se configuran los campos del formulario y de la tabla.

Nota:
  • Un campo de formulario es un tipo de campo que solo aparece una vez en un documento.
  • Un campo de tabla es un tipo de campo que se repite en todo un documento, normalmente en el formulario de una tabla.

  1. Configure los campos del formulario y de la tabla para la extracción. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
    1. Haga clic en un campo para abrir el editor de campos. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
    2. Pase el mouse sobre el ícono del menú a la derecha de un campo para acceder a las flechas arriba/abajo.
    3. Utilice las flechas para reorganizar el orden de los campos para obtener una validación manual más eficiente.
      El orden de los campos no afecta a la extracción.
    Para obtener más información sobre otros atributos de campo, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
  2. Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
    La siguiente imagen muestra campos de formulario y tabla configurados en una instancia de aprendizaje:
    Campos de formulario de una instancia de aprendizaje

    Campos de tabla de una instancia de aprendizaje y adición de una tabla personalizada a nivel de instancia de aprendizaje
  3. Opcional: En la pestaña Campos de tabla, haga clic en el ícono + para agregar una tabla personalizada a nivel de instancia de aprendizaje.
    1. Ingrese un nombre para la tabla y haga clic en Agregar.
    2. Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
      Nota: También puede agregar y eliminar la tabla personalizada mientras edita una instancia de aprendizaje.
    La tabla personalizada se muestra en la lista desplegable de la tabla.
    Tabla creada a nivel de instancia de aprendizaje y mostrada en la lista desplegable

    También puede ver los campos de tablas personalizadas y predeterminadas en la pestaña Reglas del documento, pero no puede seleccionar campos en tablas diferentes. Para obtener más detalles sobre la compatibilidad con varias tablas, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.

  4. Haga clic en Crear.
Cuando se crea una nueva instancia de aprendizaje, la Control Room crea una carpeta con el mismo nombre que la instancia de aprendizaje de la carpeta Automatización > Documentar los procesos del espacio de trabajo. La carpeta contiene dos bots (extracción y descarga), un proceso y un formulario. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.

Qué hacer a continuación

Cargue documentos en la instancia de aprendizaje, corrija errores de validación y verifique los datos extraídos: Documentos procesados en Automatización de documentos