Crear instancia de aprendizaje conIA generativa para documentos semiestructurados

Utilice este tema como guía para crear una instancia de aprendizaje que aproveche la función IA generativa (GenAI) para extraer datos de documentos semiestructurados, como facturas, documentos definidos por el usuario, órdenes de compra o documentos de la cadena de suministro, como: Avisos de llegada, conocimientos de embarque, listas de empaque y guías de carga.

Para la extracción de datos de documentos semiestructurados, los usuarios tienen la opción de utilizar la función IA generativa además de la función de comentarios de validación del usuario lista para usar marcando la opción Mejorar la precisión usando la validación mientras se crea una instancia de aprendizaje. Esto garantiza una extracción de datos consistente y mejorada con una precisión inmediata. Lo guiaremos a través de los pasos para crear una instancia de aprendizaje con la función IA generativa que permitirá la extracción precisa de datos de documentos semiestructurados.

Antes de empezar

El desarrollador profesional de una empresa realizaría las siguientes tareas:
  • Crear, editar y eliminar instancias de aprendizaje.
  • Cargar documentos para su procesamiento y prueba.
  • Registrar y extraer instancias de aprendizaje de carpetas privadas a públicas.

Requisito de licencia: Licencia de Bot Creator para realizar las tareas anteriores.

Roles y permisos asignados:
  • AAE_IQBot Services o AAE_IQBot Admin
  • AAE_Basic

Procedimiento

  1. Inicie sesión en la Control Room, navegue hasta Administrar > Instancias de aprendizaje y haga clic en el botón Crear instancia de aprendizaje para empezar a crear una nueva instancia de aprendizaje.
  2. A continuación, introduzca un nombre de instancia de aprendizaje único para identificarla con facilidad en la lista de Instancias de aprendizaje y seleccione las otras opciones de la siguiente manera:
    Cree una instancia de aprendizaje para documentos semiestructurados con la función de IA generativa.
    1. Descripción (opcional): Este es un campo opcional que se puede utilizar para agregar una descripción significativa y resumir el uso de la instancia de aprendizaje.
    2. Tipo de documento: Seleccione de una lista de documentos semiestructurados disponibles, como los siguientes: Facturas, documentos definidos por el usuario, avisos de llegada, conocimientos de embarque, listas de empaque y guías de carga.
      Al seleccionar esta opción, se habilita la función de Extracción de datos impulsada por IA generativa además de la capacidad Mejorar la precisión usando la validación, que se ofrece lista para usar y se basa en los comentarios enviados al sistema a partir de los cambios proporcionados por el usuario realizados en el Validador durante el proceso de validación. Esta es una función clave para documentos semiestructurados, ya que garantiza una mejor extracción de datos con una combinación de comentarios de validación del usuario y capacidad GenAI.
    3. Idioma: Inglés
      En la actualidad, solo es compatible con el idioma inglés.
    4. Configuración regional: según la configuración regional de los documentos.
      La configuración regional se selecciona según el idioma y el país desde donde se origina el documento.
    5. Proveedor: ‌Automation Anywhere (definido por el usuario)
    6. Proveedor de OCR: OCR de Google Vision o ABBYY OCR
      Tiene la opción de elegir entre las dos opciones admitidas de OCR.
  3. Haga clic en Siguiente para comenzar a crear campos de formulario y tabla para la instancia de aprendizaje. A partir de la versión 32, la función de IA generativa está disponible para los campos en formularios y tablas. Puede utilizar la función de GenAI además de la compatibilidad con el alias personalizado predeterminado. Consulte Cree una instancia de aprendizaje Automatización de documentos (paso 9) para obtener más información sobre la adición del alias para un campo.
    Automatización de documentos utiliza alias personalizados y la función de comentarios de forma predeterminada para documentos semiestructurados. Las consultas de campos con confianza más baja y datos de campo faltantes se pasan a IA generativa para la extracción.
    Instancia de aprendizaje para documentos semiestructurados con consulta de búsqueda habilitada en IA generativa
  4. La función de IA generativa de los campos de tabla se puede utilizar para identificar columnas, lo que mejora la extracción de datos al centrarse en las columnas de la tabla. Esta característica es un gran valor agregado para la extracción de tablas. GenAI puede identificar una columna en una tabla específica según la consulta de búsqueda definida sin la necesidad de entrenar documentos y funciona como una característica lista para usar en Automatización de documentos. Por lo tanto, puede utilizar la consulta de búsqueda habilitada por GenAI para identificar la columna y luego extraer datos específicos para un campo de esa columna usando el modelo de extracción Automatización de documentos.
  5. A continuación, agregue un Nombre de campo que debe ser específico del punto de datos que desea extraer, una Etiqueta de campo que se utiliza para crear una consulta de búsqueda predeterminada y seleccione Tipo de datos para definir la estructura de datos del valor del campo.
    Puede seleccionar entre las opciones de valor de tipo de datos Texto, Número, Fecha o Dirección en la lista desplegable. Para obtener más información sobre la creación de campos del formulario, consulte: Cree una instancia de aprendizaje Automatización de documentos, paso 10.
  6. Los campos de formulario y tabla se pueden definir como Obligatorio u Opcional. Al aprovechar la función IA generativa, el campo Confianza aparece en gris.
  7. Tiene la opción adicional de utilizar la función Extraer campo mediante patrón para la extracción.
  8. Para la sección Consulta de búsqueda para el modelo de IA generativa, tiene la opción de ir con la consulta generada por el sistema o agregar una consulta personalizada.
    Por ejemplo, para un campo de dirección, la consulta predeterminada de IA generativa diría “¿Cuál es el domicilio?”. Puede personalizar la consulta a “¿Cuál es el domicilio con la ciudad y el estado?”.
  9. En el siguiente paso, defina las Reglas del campo y las Reglas del documento para los campos de formulario y tabla y haga clic en Crear para terminar de crear la instancia de aprendizaje. Para obtener más información sobre la definición de las reglas del formulario y documento, consulte: Reglas de validación en Automatización de documentos.

Qué hacer a continuación

  1. Publicar la instancia de aprendizaje en el repositorio público para que la instancia de aprendizaje se pueda usar en modo público para extraer datos de documentos reales, y los validadores puedan validar de manera manual los documentos. Consulte Publicar la instancia de aprendizaje en producción.
  2. En la página de la lista Administrar > Instancias de aprendizaje, identifique la instancia de aprendizaje que acaba de crear y publicar, y haga clic en Procesar para comenzar a cargar documentos para su procesamiento y extracción de datos. Consulte Documentos procesados en Automatización de documentos.
  3. Abra el documento CSV con los datos extraídos para comparar con el documento procesado a fin de validar y confirmar que los campos de consulta de búsqueda activados por GenAI han extraído datos con alta precisión.