Crear instancia de aprendizaje con IA generativa ‌para documentos no estructurados

Utilice este tema como guía para crear una instancia de aprendizaje que aproveche la capacidad de la IA generativa (GenAI) de extraer datos de documentos no estructurados, como contratos, acuerdos, informes, cartas y correos electrónicos.

Con la IA generativa, puede crear una instancia de aprendizaje para extraer datos de documentos no estructurados sin necesidad de entrenar la instancia de aprendizaje. Esto es fundamental para un procesamiento de documentos rápido y preciso. Lo guiaremos a través de los pasos para la creación de una instancia de aprendizaje con la capacidad de la IA generativa que permitirá la extracción precisa de datos de documentos no estructurados.

Antes de empezar

El desarrollador profesional de una empresa realizaría las siguientes tareas:
  • Crear, editar y eliminar instancias de aprendizaje.
  • Cargar documentos para su procesamiento y prueba.
  • Registrar y extraer instancias de aprendizaje de carpetas privadas a públicas.

Requisito de licencia: Licencia de Bot Creator para realizar las tareas anteriores.

Roles y permisos asignados:
  • AAE_IQBot Services o AAE_IQBot Admin
  • AAE_Basic

Procedimiento

  1. Inicie sesión en la Control Room, navegue hasta Administrar > Instancias de aprendizaje y haga clic en el botón Crear instancia de aprendizaje para empezar a crear una nueva instancia de aprendizaje.
  2. A continuación, introduzca un nombre de instancia de aprendizaje único para identificarla con facilidad en la lista de Instancias de aprendizaje y seleccione las otras opciones de la siguiente manera:
    Cree una instancia de aprendizaje para documentos no estructurados con la función IA generativa
    1. Descripción (opcional): Este es un campo opcional que se puede utilizar para agregar una descripción significativa y resumir el uso de la instancia de aprendizaje.
    2. Tipo de documento: Documentos no estructurados
      Al seleccionar esta opción, se activa la función de extracción de datos impulsada por IA generativa. Esta opción se activa de forma predeterminada en tipos de documentos no estructurados.
    3. Idioma: Inglés
      En la actualidad, solo es compatible con el idioma inglés.
    4. Configuración regional: según la configuración regional de los documentos.
      La configuración regional se selecciona según el idioma y el país desde donde se origina el documento.
    5. Proveedor: ‌Automation Anywhere (definido por el usuario)
      Este valor se selecciona por defecto, ya que en la actualidad solo ofrecemos esta opción.
    6. Proveedor de OCR: OCR de Google Vision o ABBYY OCR
      La compatibilidad con ABBYY OCR es una nueva característica a partir de la versión 32.
  3. Haga clic en Siguiente para comenzar a crear campos de formulario y tabla para la instancia de aprendizaje.
    Para obtener más información sobre la creación de campos de formulario y tabla, consulte: Cree una instancia de aprendizaje Automatización de documentos, pasos del 10 al 12.
  4. Haga clic en Agregar un campo para comenzar a agregar campos para cada punto de datos o entidad para la que desea extraer datos de los documentos.
  5. A continuación, agregue un Nombre de campo que debe ser específico del punto de datos que desea extraer, una Etiqueta de campo que se utiliza para crear una consulta de búsqueda predeterminada y seleccione Tipo de datos para definir la estructura de datos del valor del campo.
    Puede seleccionar entre las opciones de valor de tipo de datos Texto, Número, Fecha o Dirección en la lista desplegable.
  6. Al aprovechar la función IA generativa, el campo Confianza aparece en gris. El campo se puede definir como Obligatorio u Opcional.
  7. Para la sección Consulta de búsqueda para el modelo de IA generativa, tiene la opción de ir con la consulta generada por el sistema o agregar una consulta personalizada.
    Por ejemplo, para un campo de costo total, la consulta predeterminada de IA generativa diría “¿Cuál es el costo total?”. Puede personalizar la consulta para “¿Cuál es el costo total? Extraer el número sin la moneda”. Esto extrae el costo total sin la información acerca de la moneda.
    Cree campos de tabla para una instancia de aprendizaje en Automatización de documentos con la función de IA generativa
  8. En el siguiente paso, defina las Reglas de campo y las Reglas de documento para los campos de formulario y tabla.
    Consulte Cree una instancia de aprendizaje Automatización de documentos y Referencias para crear una instancia de aprendizaje en Automatización de documentos para obtener más información sobre cómo crear campos de tabla y agregar Reglas de campo y Reglas de documento.
  9. A partir de la versión 32, puede definir varias tablas durante el proceso de definición de Campos de tabla. Según el caso de uso, puede definir tablas adicionales haciendo clic en el icono Agregar una tabla al lado del campo con menú desplegable de la Tabla.
  10. Haga clic en Crear para terminar de crear la instancia de aprendizaje.

Qué hacer a continuación

  1. Publicar la instancia de aprendizaje en el repositorio público para que la instancia de aprendizaje se pueda usar en modo público para extraer datos de documentos reales, y los validadores puedan validar de manera manual los documentos. Consulte Publicar la instancia de aprendizaje en producción.
  2. En la página de la lista Administrar > Instancias de aprendizaje, identifique la instancia de aprendizaje que acaba de crear y publicar, y haga clic en Procesar para comenzar a cargar documentos para su procesamiento y extracción de datos. Consulte Documentos procesados en Automatización de documentos.
  3. Abra el documento CSV con los datos extraídos para comparar con el documento procesado para validar y confirmar que los campos de consulta de búsqueda activados IA generativa han extraído datos con alta precisión.