Cree una instancia de aprendizaje Automatización de documentos

Para comenzar a procesar los documentos, cree una instancia de aprendizaje con el fin de extraer los datos de las facturas, facturas de servicios públicos o recibos. Una instancia de aprendizaje es una estructura que contiene información como el tipo de documento, el idioma y los campos que deben extraerse.

Antes de empezar

  • Para crear una instancia de aprendizaje, debe ser un usuario de Learning instance creator. Consulte Automatización de documentos usuarios.
  • Para crear una instancia de aprendizaje que utilice un modelo de Google Document AI, debe crear una credencial y un casillero para guardar su token de seguridad. Consulte Crear credencial y Crear casillero.
    Nota: Al configurar casillero, debe agregar el rol personalizado de aari-document-processor como un consumidor de casillero.
  • El OCR predeterminado es Motor ABBYY FineReader. Alternativamente, los usuarios de Control Room en la nube pueden crear una instancia de aprendizaje para procesar documentos en OCR de Google Vision.

Mire este video para conocer el proceso integral de creación de una instancia de aprendizaje:

Procedimiento

  1. Desde la página de inicio de Control Room, vaya a Administrar > Instancias de aprendizaje > Crear instancia de aprendizaje.
  2. Ingrese un nombre y una descripción para la instancia de aprendizaje.
    Automatización de documentos no permite duplicar los nombres de las instancias de aprendizaje, por lo que el nombre que proporcione debe ser único.
  3. Seleccionar el tipo de documento: Factura ,Definido por el usuario, Factura de servicios públicos o Recibo
    Use el tipo de documento definido por el usuario para procesar documentos que visualmente sean similares a las facturas, como las órdenes de compra y las órdenes de venta, que contienen pares clave-valor y una estructura de tabla. En este tipo de documentos, se crean y configuran todos los campos del formulario y de la tabla.
  4. Seleccionar el idioma.
    Automatización de documentos tiene asistencia técnica en inglés, holandés, francés, alemán, italiano, portugués (brasileño) y español.
    Nota: La extracción de documentos en idioma francés, alemán y español está actualmente en vista previa. Los resultados de la extracción mejorarán en futuras versiones.
  5. Si seleccionó Factura: Seleccione el proveedor.
    Si seleccionó el idioma inglés en el paso 4,Automation Anywhere (Preentrenado) se selecciona automáticamente.
  6. Para el aprendizaje de instancias con el proveedorAutomation Anywhere (Preentrenado), puede optar por enviar comentarios al sistema para mejorar los resultados de extracción. Para obtener más información, consulte Mejoramiento de la precisión de la extracción mediante la validación
  7. Opcional: Seleccione el proveedor OCR. De manera predeterminada, Automatización de documentos procesa los documentos en Motor ABBYY FineReader.
    Los usuarios con un Control Room en la nube pueden seleccionar procesar los documentos en OCR de Google Vision.
  8. Haga clic en Next (Siguiente).

Le recomendamos que abra un documento de muestra junto a la ventana de Control Room mientras se configuran los campos del formulario y de la tabla.

Nota:
  • Un campo de formulario es un tipo de campo que solo aparece una vez en un documento.
  • Un campo de tabla es un tipo de campo que se repite en todo un documento, normalmente en el formulario de una tabla.

  1. Configure los campos del formulario y de la tabla para la extracción.
    Automatización de documentos ofrece un conjunto estándar de campos de formularios y tablas, muchos de los cuales no son visibles inicialmente. Puede buscar un campo por el nombre del campo, etiqueta de campo o tipo de datos.
    Para ver la lista completa de campos, haga clic en Mostrar campos no utilizados. Consulte el siguiente video para ver una demostración:
    Haga clic en un campo para abrir el editor de campos. Puede editar la mayoría de los atributos de un campo. No se puede editar el nombre ni los alias predeterminados. Automatización de documentos asigna alias predeterminados, que corresponden a palabras clave codificadas, a los campos estándar para ayudar a la extracción. No se pueden modificar ni eliminar los alias predeterminados, pero se pueden añadir alias en el campo Alias personalizados. Consulte el siguiente video para ver una demostración de cómo crear un alias personalizado:
    Nota: Los campos personalizados no están disponibles para las instancias de aprendizaje que utilizan el proveedor Google Document AI.
    Pase el mouse sobre el ícono del menú a la derecha de un campo para acceder a las flechas arriba/abajo. Utilice las flechas para reorganizar el orden de los campos para obtener una validación manual más eficiente. El orden de los campos no afecta a la extracción.
    Para saber más sobre los otros atributos de los campos, revise la tabla en el siguiente paso.
  2. Para agregar un campo, haga clic en Agregar un campo y complete los siguientes campos:
    OpciónDescripción
    Nombre del campo Ingrese un nombre de campo que comience con un carácter alfabético (A-Z o a-z).

    En los campos estándar, el nombre del campo está codificado y no se puede cambiar.

    Etiqueta de campo Ingrese un nombre fácil de usar para ayudar a los validadores.

    Por ejemplo, puede cambiar el nombre Número de identificación fiscal de la organización a un nombre localizado, como Número de IVA.

    La etiqueta del campo no afecta la extracción.

    Confianza Establezca un umbral para reducir los posibles falsos positivos.

    En el momento del procesamiento, el motor de Automatización de documentos asigna una puntuación a cada campo de un documento para indicar la certeza de que los datos se extrajeron correctamente. Si el documento contiene campos con una puntuación inferior al umbral de confianza, el documento se envía a la cola de validación.

    Si ingresa un umbral alto de confianza, se enviarán más documentos a la cola de validación. Si ingresa un umbral bajo de confianza, se enviarán menos documentos a la cola de validación.

    Admite valores de cero a 100.

    Tipo de datos Elija entre Dirección*,Texto, Número y Fecha.

    Si los datos del campo no coinciden con el tipo de datos, el documento se envía a la cola de validación.

    Automatización de documentos admite variaciones de formato de fecha y número.

    * Si está configurando una instancia de aprendizaje con un tipo de documento definido por el usuario, los campos del formulario incluyen el tipo de datos de dirección, que extrae toda la estructura de una dirección.

    Obligatorio Seleccione una de las siguientes opciones:
    • Obligatorio: El campo no puede estar vacío.
    • Opcional: Es posible que el campo esté vacío o no exista en el documento.
    Alias predeterminados No es necesario realizar acciones en este campo. Automatización de documentos asigna alias predeterminados, que corresponden a palabras clave codificadas, a los campos estándar para ayudar a la extracción.
    Alias personalizados Más palabras clave para ayudar a que Automatización de documentos localice el campo. Por ejemplo, agregue nombres específicos de cada país o región para campos como Número de IVA como un alias del campo personalizado Número de identificación fiscal de la organización.
    Nota: Los alias personalizados deben ser únicos. No pueden duplicar el alias predeterminado de otro campo. Excepción: Los campos del formulario pueden tener alias personalizados duplicados como los campos de la tabla y viceversa.
    Reglas de validación Dependiendo del tipo de datos, cree reglas mediante patrones, fórmulas, listas e instrucciones como empieza o termina con.

    Validación de la fórmula | Validación de patrones

  3. Haga clic en Crear.
Cuando se crea una nueva instancia de aprendizaje, Control Room crea una carpeta con el mismo nombre que la instancia de aprendizaje en la carpeta Automatización > Espacio de trabajo del documento. La carpeta contiene dos bots (extracción y descarga), un proceso y un formulario.Ejemplo de captura de pantalla de los activos de la instancia de aprendizaje
  • Proceso: Administra el proceso mediante situaciones if/else a través de los cuales Automatización de documentos extrae los datos de los documentos cargados, asigna los documentos a los usuarios para su validación y descarga los datos extraídos. Para obtener más información, consulte Sobre el proceso de AARI en Automatización de documentos
  • Bot de extracción: Extrae los datos de los campos definidos en los documentos cargados.
  • Descargar bot: Descarga los datos extraídos en una carpeta específica del dispositivo o de la red compartida.
  • Formulario: Define los parámetros de entrada que se envían al proceso. Los parámetros de entrada incluyen el nombre de la instancia de aprendizaje, el archivo cargado y la ruta del archivo de salida.

Qué hacer a continuación

Cargue documentos en la instancia de aprendizaje, corrija errores de validación y verifique los datos extraídos: Documentos procesados en Automatización de documentos