Pautas de arquitectura y seguridad para Document Automation con capacidad IA generativa

Aquí hay una lista de privacidad, seguridad y casos de uso típicos para su consideración al usar Document Automation con capacidad IA generativa.

Funcionalidad

Nota: Los modelos de IA generativa pueden producir errores o tergiversar la información que generan. Es recomendable verificar la exactitud, confiabilidad e integridad del contenido generado por el modelo de IA.
¿Qué hay de diferente en la manera en que Document Automation procesa documentos no estructurados y documentos de envío en comparación con facturas?
Automation Anywhere incorpora modelos de lenguaje grande (LLM) (modelados de manera individual) en el producto de Document Automation para ayudar con el procesamiento de documentos no estructurados y documentos de envío.
¿Qué tipos de documentos se pueden procesar usandoIA generativa?
Cualquier documento no estructurado y semiestructurado, incluidos los tipos de documentos entrenados previamente, como facturas, conocimientos de embarque, guías de carga, avisos de llegada o listas de empaque.
¿Existe alguna limitación en los tipos de campo compatibles con Document Automation?
No, admitimos campos de formulario y tabla con la función de GenAI.
¿Cuáles son los idiomas compatibles?
Oficialmente se admite el inglés, pero también funcionarían otros idiomas.
¿Cuál es la estructura de precios para Document Automation con capacidades de IA generativa?
Los cargos de Automation Anywhere por página para Document Automation y el costo de OpenAI y Anthropic están incluidos en el precio.
¿Un cliente podría llamar a su propio punto final para LLM?
Sí, admitimos que traiga su propia licencia (BYOL) para Microsoft Azure OpenAI y Claude de Anthropic, y se admite un caso de uso de punto final de LLM definido por el cliente.
¿IA generativa con función de Document Automation está disponible Local en la nube privada de un cliente?
Si, IA generativa integrado ya está disponible para su uso en las versiones Local y Nube de Document Automation.
¿Qué motor de OCR se puede utilizar para tipos de documentos no estructurados?
En la actualidad, se admite OCR de Google Vision y ABBYY OCR.
¿Qué motor OCR se puede utilizar para los documentos de envío?
Recomendamos usar ABBY OCR y OCR de Google Vision para los documentos de envío.

Seguridad

Para leer las preguntas frecuentes sobre seguridad, consulte Preguntas frecuentes de seguridad en Document Automation.

Diagrama de arquitectura

Extracción de datos mediante ABBYY OCR y proveedores de IA generativa

Extracción de datos mediante ABBYY OCR y proveedores de IA generativa

El proceso de extracción consta de varios pasos y se aplica a las implementaciones de Nube y Local:

  1. El proceso de extracción comienza tras ejecutar el paquete Extracción de documentos en un dispositivo Bot Runner. La configuración del proceso de extracción se define en una instancia de aprendizaje.
  2. Los documentos se procesan utilizando ABBYY OCR, que está implementado en el dispositivo Bot Runner.
  3. Para procesar documentos grandes, el paquete crea integraciones para diferentes fragmentos del documento.
  4. El paquete identifica el fragmento más pertinente del documento para la consulta de búsqueda proporcionada mediante la incrustación y envía ese fragmento junto con un indicador al modelo a través de la puerta de enlace proxy.

    Finalmente, el paquete recibe respuestas del modelo y las convierte en resultados de extracción de documentos.

Extracción de datos con proveedores OCR de Google Vision y IA generativa

Extracción de datos utilizando los proveedores OCR de Google Vision y IA generativa

El proceso de extracción consta de varios pasos y se aplica a las implementaciones de Nube y Local:

  1. El proceso de extracción comienza tras ejecutar el paquete Extracción de documentos en un dispositivo Bot Runner. La configuración del proceso de extracción se define en una instancia de aprendizaje.
  2. El paquete Extracción de documentos envía documentos a la puerta de enlace proxy.
  3. La puerta de enlace proxy envía esta solicitud al punto final de la API de Google Vision para OCR y envía los resultados de vuelta al paquete.
  4. Para procesar documentos grandes, el paquete crea integraciones para diferentes fragmentos del documento.
  5. El paquete identifica el fragmento más pertinente del documento para la consulta de búsqueda proporcionada mediante la incrustación y envía ese fragmento junto con un indicador al modelo a través de la puerta de enlace proxy.

    Finalmente, el paquete recibe respuestas del modelo y las convierte en resultados de extracción de documentos.

Para obtener información de seguridad de datos de Automation Anywhere Nube IA generativa, consulte: Seguridad de datos para IA generativa: preguntas frecuentes.