Documentos procesados en Document Automation

Cargue facturas de muestra para probar la instancia de aprendizaje, verifique los datos extraídos y corrija los errores de validación.

Antes de empezar

  • Si aún no lo ha hecho, Cree una instancia de aprendizaje en Document Automation.
  • Compruebe que su dispositivo esté conectado a Control Room: Instale Agente de bot e inscriba el dispositivo
  • Si la instancia de aprendizaje usa un modelo de Google Document AI y no ha comprado licencias de Google Document AI a través de Automation Anywhere , debe proporcionar sus credenciales de Google Document AI al Bot de extracción. Consulte Configurar la clave para Google Document AI.
  • Si la instancia de aprendizaje usa un modelo Automation Anywhere, asegúrese de que cada archivo ocupe 50 MB o menos.

    Si la instancia de aprendizaje usa un modelo de IA de Google Docs, asegúrese de que cada archivo ocupe 20 MB o menos, con un máximo de 5 páginas.

  • Asegúrese de que los documentos de muestra estén en uno de los siguientes tipos de documentos admitidos:
    • PDF
    • JPG
    • JPEG
    • PNG
    • TIF
    • TIFF
  • El formato predeterminado de salida de los datos extraídos es un archivo CSV. Para cambiar la salida a JSON, consulte Cambiar el formato de salida de CSV a JSON.

Realice los siguientes pasos para cargar facturas de muestra en la instancia de aprendizaje para probar las capacidades de extracción de datos de la instancia de aprendizaje.

Procedimiento

  1. Cargue los documentos para probar a la instancia de aprendizaje:
    Consulte estos pasos en un video:

    1. Haga clic en Procesar documentos.
      Documentos procesados
    2. En la ventana Procesar documentos, haga clic en Explorar para seleccionar los archivos que desea cargar.
    3. En el campo Descargar datos a, ingrese la ruta del archivo que contendrá los datos extraídos.
      Cuando el proceso se ejecuta, crea las siguientes tres carpetas en la ruta de archivos proporcionada:
      • Success: Contiene los datos extraídos en el formato especificado (CSV o JSON).
      • Invalid: Retiene los documentos marcados como no válidos.
      • Failed: Retiene los documentos que no han podido ser procesados.

      Puede proporcionar una ruta de la carpeta de salida basada en una de las siguientes opciones:

      • Opción 1: La ruta del dispositivo local si configuró el procesamiento de documentos y la validación en el mismo dispositivo.

        Esta opción se usa normalmente cuando está probando la instancia de aprendizaje.

      • Opción 2: La ruta de la carpeta compartida si configuró la validación distribuida en dispositivos separados.

        Esta opción se usa normalmente para las instancias de aprendizaje publicadas. Por ejemplo, \\10.239.192.60\Sharepath\Output.

    4. Haga clic en Procesar documentos.
      Aparece la ventana Bot Runner. La ventana desaparece cuando se terminan de procesar los documentos. Actualice la tabla de Instancias de aprendizaje para ver las métricas actualizadas.

Si hay un valor junto al vínculo Validar documentos, debe validar manualmente los campos de los documentos. De lo contrario, vaya al paso 3.

  1. Corrija los errores de validación
    1. Haga clic en Validar documentos.
      El Administrador de tareas de Automation Co-Pilot se abre en una nueva pestaña, con el primer documento con errores en la lista de prioridad. Para ver una introducción a la interfaz de usuario del validador, consulte Validación de documentos mediante el validador Automation Co-Pilot.
    2. Revise cada campo para verificar el tipo de datos y el valor extraído.
      Document Automation es compatible con los siguientes tipos de datos: texto, número, hora, dirección y casilla de verificación
      De forma alternativa, en la lista desplegable del panel derecho, puede seleccionar Mostrar los campos que necesitan validación.
      Nota: Cuando los documentos están pendientes para la validación, si edita la instancia de aprendizaje, haga clic en Reprocesar para volver a intentar la extracción.

      El reprocesamiento de los documentos no afecta a la métrica de los documentos cargados.

    3. Actualice los campos con errores.
      Haga clic en el campo o dibuje un recuadro alrededor de los valores que desea extraer.
      En el caso de los modelos preentrenados de Automation Anywhere, puede configurar la instancia de aprendizaje para que extraiga valores específicos en un campo e ignore otros. Para obtener más información, consulte .
      • Para omitir un documento sin corregir errores, haga clic en Omitir a fin de pasar al siguiente documento en la cola de validación.
      • Para quitar un documento que no se puede procesar, haga clic en Marcar como no válido.
    4. Después de hacer las correcciones necesarias, haga clic en Enviar para que el documento se termine de procesar.
      Aparece el siguiente documento en la lista de prioridad. Cuando todos los documentos estén corregidos, el sistema muestra un mensaje que indica que no hay más tareas disponibles.
    5. Cierre la pestaña para volver a la página de Instancias de aprendizaje.
  2. Verifique los resultados de la salida:
    1. Abra el archivo en la carpeta Success que contiene los datos extraídos y revise los resultados para asegurarse de que coincidan con su caso de uso.
      Los formularios de Microsoft devuelven valores extraídos (datos OCR) en formato JSON, como GUID_0-MSFormTableResult.json. Junto con los datos del documento extraído en el archivo CSV <<GUID>>_FileName, la carpeta Success también muestra los datos extraídos de la tabla por separado en otros archivos CSV. Según la cantidad de tablas del documento, puede encontrar diferentes archivos CSV para cada tabla. Por ejemplo, <<GUID_PAGE_NUMBER-Table_FILENAME_PAGENUMBER_TABLENUMBER.

      En el caso de los datos separados de la tabla, puede comparar los datos extraídos con los datos del motor de Microsoft en el archivo GUID_0-MSFormTableResult.json.

    2. Opcional: Revise el panel Instancia de aprendizaje.
      El panel muestra la cantidad total de documentos cargados y la cantidad de documentos pendientes de validación.
Si la instancia de aprendizaje no encuentra un campo repetidamente o si los caracteres no se reconocen correctamente (como la letra “l” extraída como el número “1”), puede intentar cambiar el OCR a OCR de Google Vision.

Qué hacer a continuación

Cree un bot que cargue documentos desde una carpeta de origen a la instancia de aprendizaje. A continuación, publique los activos de la instancia de aprendizaje (proceso, formulario y bots) en el repositorio público para que la instancia de aprendizaje se pueda usar en modo público con el fin de extraer datos desde documentos reales, y los validadores puedan validar manualmente los documentos: Publicar la instancia de aprendizaje en producción