Crear una instancia de aprendizaje usando CDE de Google

Una instancia de aprendizaje es una estructura que contiene información como el tipo de documento, el idioma y los campos que deben extraerse. Después de crear un procesador de extracción personalizado, debe crear una instancia de aprendizaje para extraer datos de los documentos.

Antes de empezar

  • Asegúrese de haber creado y entrenado con éxito un procesador del extractor de documentos personalizados (CDE) de Google.
  • Asegúrese de que su Control Room tenga la licencia del producto Espacio de trabajo de documentos (número de páginas).
  • Asegúrese de haber configurado BYOK. Para obtener más información, consulte Configure la opción BYOK (traiga su propia clave) para Google CDE.

Para integrar un nuevo procesador con Google Document AI, el paso crucial es la creación de una instancia de aprendizaje. Esto implica utilizar el proveedor como opción Google Document AI (definido por el usuario). Al crear una instancia de aprendizaje con esta opción, los usuarios pueden definir campos de formularios y tablas con nombres que coincidan con los presentes en el procesador.
Nota:
  • Actualmente, Google Document AI admite la extracción de una sola tabla.
  • La función de casillas de verificación (en modo de vista previa) podría dar lugar a una extracción incoherente para el campo de casillas de verificación, lo que podría producir resultados incoherentes. En estos casos, si el sistema no puede extraer con precisión el valor del campo de la casilla de verificación, se etiquetará como No encontrado.

Procedimiento

  1. Desde la página de inicio de Control Room, vaya a Administrar > Instancias de aprendizaje > Crear instancia de aprendizaje.
    La ventana Crear instancia de aprendizaje se abre en una nueva pestaña.
  2. Añada un nombre para la nueva instancia de aprendizaje que se va a crear.
  3. En el menú desplegable Tipo de documento, seleccione Definido por el usuario.
  4. En el menú Proveedor, seleccione Google Document AI (definido por el usuario).
  5. Seleccione el campo Tabla o Formularios.
  6. Cree nuevos campos con nombres idénticos a los utilizados en el procesador CDE de Google.
    Nota: Al crear nuevos campos, asegúrese de que sus nombres coincidan con las etiquetas de esquema utilizadas en el procesador de Google. Esto aplica a los campos de formulario y a los campos de tabla.
  7. Haga clic en Crear.

    Cuando se crea una nueva instancia de aprendizaje, Control Room crea una carpeta con el mismo nombre que la instancia de aprendizaje en la carpeta Automatización > Espacio de trabajo del documento.

  8. Actualice el bot de extracción de la instancia de aprendizaje con la cuenta de servicio y la URL del extremo del procesador.
    1. Abra el bot para la instancia de aprendizaje desde Bots > IQ Bot Processes > {LI name} > {LI name}_extractionbot.
    2. Elija un casillero de bóveda de credenciales y una clave. Para obtener más información, consulte Configure la opción BYOK (traiga su propia clave) para Google CDE.
    3. Copie la URL del extremo de predicción del procesador CDE de Google.
      Extremo de predicción en Google Document AI
    4. Pegue la URL copiada en la URL del extremo de Document AI para el procesador de documentos.

      URL del extremo de Document AI para el procesador de documentos

Qué hacer a continuación

Cargue los documentos en la instancia de aprendizaje, corrija los errores de validación y verifique los datos extraídos. Para obtener más información, consulte Documentos procesados en Automatización de documentos.