Cree una instancia de aprendizaje Automatización de documentos

Para comenzar a procesar los documentos, cree una instancia de aprendizaje con el fin de extraer los datos de las facturas, facturas de servicios públicos o recibos. Una instancia de aprendizaje es una estructura que contiene información como el tipo de documento, el idioma y los campos que deben extraerse.

Antes de empezar

  • Para crear una instancia de aprendizaje, debe ser un usuario de Learning instance creator. Consulte Automatización de documentos usuarios.
  • Para crear una instancia de aprendizaje que utilice un modelo de Google Document AI, debe crear una credencial y un casillero para guardar su token de seguridad. Consulte Crear credencial y Crear casillero.
    Nota: Al configurar casillero, debe agregar el rol personalizado de aari-document-processor como un consumidor de casillero.
  • El OCR predeterminado es Motor ABBYY FineReader. Alternativamente, los usuarios de Cloud Control Room pueden crear una instancia de aprendizaje para procesar documentos en OCR de Google Vision.

Mire este video para conocer el proceso integral de creación de una instancia de aprendizaje:

Procedimiento

  1. Desde la página de inicio de Control Room, vaya a Administrar > Instancias de aprendizaje > Crear instancia de aprendizaje.
  2. Ingrese un nombre y una descripción para la instancia de aprendizaje.
    Automatización de documentos no permite duplicar los nombres de las instancias de aprendizaje, por lo que el nombre que proporcione debe ser único.
  3. Seleccionar el tipo de documento: Factura ,Definido por el usuario, Factura de servicios públicos o Recibo
    Use el tipo de documento definido por el usuario para procesar documentos que visualmente sean similares a las facturas, como las órdenes de compra y las órdenes de venta, que contienen pares clave-valor y una estructura de tabla. En este tipo de documentos, se crean y configuran todos los campos del formulario y de la tabla.
  4. Seleccionar el idioma.
    Automatización de documentos tiene asistencia técnica en inglés, holandés, francés, alemán, italiano, portugués (brasileño) y español. Para obtener más información, consulte Idiomas admitidos en Automatización de documentos.
    Nota: La extracción de documentos en idioma alemán actualmente está en vista previa. Los resultados de la extracción mejorarán en futuras versiones.

    Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el idioma seleccionado durante la configuración del analizador se selecciona automáticamente. Además, la lista de configuración regional muestra las opciones de idioma según el idioma seleccionado automáticamente.

  5. Si seleccionó Factura: Seleccione el proveedor.
    Si seleccionó el idioma inglés en el paso 4, Automation Anywhere (Preentrenado) se selecciona automáticamente.

    Si selecciona un tipo de documento que se utiliza al configurar el analizador en el paso 3, el analizador configurado (de terceros) se selecciona automáticamente como proveedor.

  6. Opcional: Seleccione el proveedor de OCR. De manera predeterminada, Automatización de documentos procesa los documentos en Motor ABBYY FineReader.
    Los usuarios con un Cloud Control Room pueden seleccionar procesar los documentos en OCR de Google Vision.
  7. Opcional: Puede utilizar la opción Mejorar la precisión mediante la validación para enviar comentarios al sistema con el fin de mejorar los resultados de extracción. Para obtener más información, consulte Mejora de la precisión de la extracción mediante la validación.
  8. Opcional: Seleccione la opción Extracción de datos impulsada por IA generativa para utilizar las funciones de IA generativa para la extracción. Para obtener más información, consulte Extracción de datos de Document Automation mediante IA generativa.
    Cree una instancia de aprendizaje en la Document Automation
  9. Haga clic en Siguiente.

Le recomendamos que abra un documento de muestra junto a la ventana de Control Room mientras se configuran los campos del formulario y de la tabla.

Nota:
  • Un campo de formulario es un tipo de campo que solo aparece una vez en un documento.
  • Un campo de tabla es un tipo de campo que se repite en todo un documento, normalmente en el formulario de una tabla.

  1. Configure los campos del formulario y de la tabla para la extracción. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
    1. Haga clic en un campo para abrir el editor de campos. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
    2. Pase el mouse sobre el ícono del menú a la derecha de un campo para acceder a las flechas arriba/abajo.
    3. Utilice las flechas para reorganizar el orden de los campos para obtener una validación manual más eficiente.
      El orden de los campos no afecta a la extracción.
    Para obtener más información sobre otros atributos de campo, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
  2. Haga clic en Agregar un campo y especifique los detalles de los campos, como el nombre del campo, la etiqueta del campo, la confianza, el tipo de datos, el formato de fecha/número, etc. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.
    La siguiente imagen muestra campos de formulario y tabla configurados en una instancia de aprendizaje:
    Campos de formulario de una instancia de aprendizaje

    Campos de tabla de una instancia de aprendizaje
  3. Haga clic en Crear.
Cuando se crea una nueva instancia de aprendizaje, la Control Room crea una carpeta con el mismo nombre que la instancia de aprendizaje en la carpeta Automatización > Espacio de trabajo del documento. La carpeta contiene dos bots (extracción y descarga), un proceso y un formulario. Para obtener más información, consulte Referencias para crear una instancia de aprendizaje en Automatización de documentos.

Qué hacer a continuación

Cargue documentos en la instancia de aprendizaje, corrija errores de validación y verifique los datos extraídos: Documentos procesados en Automatización de documentos