Consideraciones al crear una instancia de aprendizaje en Document Automation

Al crear una instancia de aprendizaje, tenga en cuenta estas consideraciones para los campos de formulario y tabla, los campos de búsqueda, la información adicional sobre la carpeta de salida después de crear una instancia de aprendizaje, etc.

Ver y buscar campos

Document Automation ofrece un conjunto estándar de campos de formularios y tablas, muchos de los cuales no son visibles inicialmente. Puede buscar un campo por el nombre del campo, etiqueta de campo o tipo de datos.

Para ver la lista completa de campos, haga clic en Mostrar campos no utilizados. Consulte el siguiente video para ver una demostración:

Directrices para editar los campos y crear alias personalizados

  • Puede editar la mayoría de los atributos de un campo.
  • No puede editar el nombre y los alias predeterminados. Document Automation asigna alias predeterminados, que corresponden a palabras clave codificadas, a los campos estándar para facilitar la extracción.
  • No se pueden modificar ni eliminar los alias predeterminados, pero se pueden añadir alias en el campo Alias personalizados.

    Consulte el siguiente video para ver una demostración de cómo crear un alias personalizado:

Consideraciones sobre los campos de formularios y tablas

La siguiente tabla enumera todos los nombres de campos y valores requeridos para especificar en la descripción.
Opción Descripción
Nombre del campo Ingrese un nombre de campo que comience con un carácter alfabético (A-Z o a-z).

En los campos estándar, el nombre del campo está codificado y no se puede cambiar.

Etiqueta de campo Ingrese un nombre fácil de usar para ayudar a los validadores.

Por ejemplo, puede cambiar el nombre Número de identificación fiscal de la organización a un nombre localizado, como Número de IVA.

La etiqueta del campo no afecta la extracción.

Confianza Establezca un umbral para reducir los posibles falsos positivos.

En el momento del procesamiento, el motor de Document Automation asigna una puntuación a cada campo de un documento para indicar la certeza de que los datos se extrajeron correctamente. Si el documento contiene campos con una puntuación inferior al umbral de confianza, el documento se envía a la cola de validación.

Si ingresa un umbral alto de confianza, se enviarán más documentos a la cola de validación. Si ingresa un umbral bajo de confianza, se enviarán menos documentos a la cola de validación.

Admite valores de 1 a 100.

Tipo de datos Elija entre los siguientes tipos de datos:
  • Dirección*: Utilice este tipo de datos cuando necesite extraer campos de dirección de los documentos. El sistema está entrenado para extraer varios campos de dirección y el uso de este tipo de datos le indica al sistema que detecte y extraiga la dirección de los documentos.
  • Texto: Utilice este tipo de datos cuando necesite extraer campos de texto de los documentos. El sistema está entrenado para extraer varios campos de texto y el uso de este tipo de datos le indica al sistema que detecte y extraiga texto de los documentos.
  • Number (Número): Utilice este tipo de datos cuando necesite extraer campos numéricos de los documentos. El sistema está entrenado para extraer varios campos numéricos y el uso de este tipo de datos le indica al sistema que detecte y extraiga números de los documentos.
  • Fecha: Utilice este tipo de datos cuando necesite extraer campos de fecha de los documentos. El sistema está entrenado para extraer varios formatos de fecha y el uso de este tipo de datos le indica al sistema que detecte y extraiga fechas de los documentos.

Si los datos del campo no coinciden con el tipo de datos, el documento se envía a la cola de validación.

Document Automation admite variaciones de formato de fecha y número.

* Si está configurando una instancia de aprendizaje con un tipo de documento definido por el usuario, los campos del formulario incluyen el tipo de datos de dirección, que extrae toda la estructura de una dirección.

Formato Fecha/Número Establezca un aspecto estándar para convertir las fechas y números extraídos en un formato específico. Esto garantiza la coherencia y precisión de sus bases de datos y otros sistemas de registro.

Por ejemplo, si selecciona normalizar las fechas a MM/DD/YYYY y un documento procesado contiene una fecha que aparece como 12 Feb 2023, la instancia de aprendizaje reformateará la fecha a 02/12/2023.

Si selecciona estandarizar los números a la configuración regional inglesa (Estados Unidos) y un documento procesado contiene un número que aparece como 100,00, la instancia de aprendizaje reformateará el número a 100.00.

Obligatorio Seleccione una de las siguientes opciones:
  • Obligatorio: El campo no puede estar vacío.
  • Opcional: Es posible que el campo esté vacío o no exista en el documento.
Usa la retroalimentación de validación para mejorar la precisión. Deshabilitar o habilitar la retroalimentación de validación para el campo. Cuando selecciona la opción Mejorar la precisión mediante la validación en la página Crear instancia de aprendizaje, esta opción se habilita para todos los campos de forma predeterminada. Cuando esta opción está habilitada, la retroalimentación de validación proporcionada para el campo se utiliza para mejorar la precisión de la extracción de datos. Sin embargo, si ve que se extrae un valor de campo según sus requisitos incluso sin la necesidad de retroalimentación de validación o cuando necesita utilizar soluciones alternativas, como un modelo entrenado previamente o proveedores de IA generativa para mejorar la extracción de datos, puede desmarcar la casilla de verificación de esta opción para deshabilitar la retroalimentación de validación para el campo.
Nota:
  • Los comentarios de validación solo se pueden bloquear en el nivel de instancia de aprendizaje y no están disponibles para campos de formularios y tablas.
  • Cuando la retroalimentación de validación está bloqueada en el nivel de instancia de aprendizaje, la opción de retroalimentación de validación a nivel de campo se establece en modo de solo lectura, ya que el sistema no considerará ninguna retroalimentación de validación para mejorar la precisión de los datos. Para editar la validación a nivel de campo, debe deshabilitar el bloqueo de validación para la instancia de aprendizaje.
  • Si desactiva la retroalimentación de validación para los campos de la tabla, dichos campos no se muestran en la opción Configuración de entrenamiento avanzada. Por ejemplo, si desea seleccionar una columna, Cantidad, como la columna principal en la configuración de entrenamiento avanzada y si la retroalimentación de validación para este campo de tabla está deshabilitada, la columna Cantidad no se mostrará en la lista de Columnas principales.
Alias predeterminados No se necesita ninguna acción para este campo. Document Automation asigna alias predeterminados, que corresponden a palabras clave codificadas, a los campos estándar para ayudar a la extracción.
Alias personalizados Más palabras clave para ayudar a que Document Automation localice el campo. Por ejemplo, agregue nombres específicos de cada país o región para campos como Número de IVA como un alias del campo personalizado Número de identificación fiscal de la organización. Puede agregar hasta 30 alias personalizados únicos.
Nota: Los alias personalizados deben ser únicos. No pueden duplicar el alias predeterminado de otro campo. Excepción: Los campos del formulario pueden tener alias personalizados duplicados como los campos de la tabla y viceversa.
Reglas de validación Dependiendo del tipo de datos, cree reglas mediante patrones, fórmulas, listas e instrucciones como empieza o termina con.

Validación de la fórmula | Validación de patrones de expresiones regulares

Directrices para crear o editar tablas múltiples personalizadas en una instancia de aprendizaje

Al crear o editar tablas múltiples a nivel de instancia de aprendizaje, considere los siguientes puntos:
  • Esta característica es aplicable a los tipos de documentos, como Automation Anywhere (Preentrenado), Automation Anywhere (Definido por el usuario), paquete Puente de IQ Bot a Document Automation y IA generativa no estructurado.
  • Puede configurar las reglas con un solo campo de tabla a la vez y no se pueden configurar entre campos que pertenecen a diferentes tablas.
  • Todos los nombres de los campos deben ser únicos.
  • La configuración de entrenamiento avanzada se puede aplicar a varias tablas. Funcionará por tabla y no entre tablas.
  • Puede importar, exportar y copiar instancias de aprendizaje que contengan tablas múltiples.
  • Puede eliminar la tabla personalizada creada en la instancia de aprendizaje, pero la tabla predeterminada no se puede eliminar.
  • La cantidad máxima de caracteres es de 50 caracteres para el nombre de las tablas múltiples personalizadas y de 200 caracteres para el nombre de la columna.
  • Solo se permiten caracteres alfanuméricos, guiones bajos, espacios y guiones en el campo nombre de la tabla.
  • No puede cambiar el nombre de la tabla mientras crea o edita una instancia de aprendizaje.
  • La compatibilidad con tablas múltiples no se aplica a Formularios estándares, Google Document AI, conocimientos de embarque, guías de carga, avisos de llegada y tipos de documentos de listas de empaque.
  • El archivo de salida (CSV) indicará todas las referencias de tablas (tablas múltiples predeterminadas y personalizadas) en el formato table_name: field name.

Estructura de archivos y carpetas de salida de los Bots

Cuando se crea una nueva instancia de aprendizaje, la Control Room crea una carpeta con el mismo nombre que la instancia de aprendizaje en la carpeta Automatización > Espacio de trabajo del documento. La carpeta contiene dos bots (extracción y descarga), un proceso y un formulario.
Ejemplo de captura de pantalla de activos de instancias de aprendizaje
  • Proceso: Administra el proceso mediante situaciones if/else a través de los cuales Document Automation extrae los datos de los documentos cargados, asigna los documentos a los usuarios para su validación y descarga los datos extraídos. Para obtener más información, consulte Proceso Automation Co-Pilot para usuarios de negocios en Document Automation
  • Bot de extracción: Extrae los datos de los campos definidos en los documentos cargados.
  • Descargar bot: Descarga los datos extraídos en una carpeta específica del dispositivo o de la red compartida.
  • Formulario: Define los parámetros de entrada que se envían al proceso. Los parámetros de entrada incluyen el nombre de la instancia de aprendizaje, el archivo cargado y la ruta del archivo de salida.