Diretrizes de arquitetura e segurança para Automação de documento com IA generativa capacidade

Aqui está uma lista de privacidade, segurança e casos de uso típicos para consideração ao usar o Automação de documento com o recurso IA generativa.

Funcionalidade

Nota: Os modelos de IA generativa podem produzir erros e/ou deturpar as informações que geram. É aconselhável verificar a precisão, confiabilidade e integridade do conteúdo gerado pelo modelo de IA.
O que há de diferente na maneira como o Automação de documento processa documentos não estruturados e documentos de remessa em comparação com faturas?
A Automation Anywhere incorpora grandes modelos de linguagem (modelados um a um) no produto Automação de documento para auxiliar no processamento de documentos não estruturados e documentos de remessa.
Quais tipos de documentos podem ser processados usando IA generativa?
Quaisquer documentos não estruturados e semiestruturados, incluindo tipos de documentos pré-treinados, como: faturas, conhecimento de embarque, conhecimento de transporte, aviso de chegada ou lista de embalagem.
Há alguma limitação nos tipos de campo compatíveis com o Automação de documento?
Não, suportamos campos de formulário e tabela com capacidade de GenAI.
Quais são os idiomas disponíveis?
Oficialmente, o inglês é compatível, mas outros idiomas também são.
Qual é a estrutura de preços para o Automação de documento com recursos de IA generativa?
A Automation Anywhere cobra por página pelo Automação de documento, e o custo do OpenAI está incluído no preço.
Um cliente poderia chamar o próprio endpoint do Azure para LLM do Microsoft Azure OpenAI?
Sim, oferecemos suporte para Bring Your Own License (BYOL) para Microsoft Azure OpenAI, e um caso de uso de endpoint de LLM definido pelo cliente é suportado.
O IA generativa com o recurso Automação de documento está disponível no No local na nuvem privada de um cliente?
Sim, IA generativa integrado agora está disponível para uso nas versões No local e Nuvem do Automação de documento.
Qual mecanismo do OCR pode ser usado para documentos não estruturados?
Atualmente, temos suporte para Google Vision OCR e ABBYY OCR.
Qual mecanismo do OCR pode ser usado para documentos de remessa?
Recomendamos usar ABBYY OCR e Google Vision OCR para documentos de remessa.

Segurança

Para qual LLM o Automação de documento envia as consultas?
O Automação de documento atualmente usa os serviços do Microsoft Azure OpenAI para utilizar LLMs. Atualmente usamos modelos GPT3.5-Turbo e ADA.
Em quais países os documentos do Automação de documento são enviados para processamento?
A Automation Anywhere selecionou as regiões da UE e dos EUA para processar os documentos.
A Automation Anywhere permite que os fornecedores treinem os LLMs com dados de documentos enviados para o Automação de documento?
Não, a Automation Anywhere não usa nem permite que fornecedores terceirizados usem documentos ou dados enviados por clientes ou usuários para fins de treinamento.
A Automation Anywhere treina a própria instância de LLMs em dados de documentos enviados para o Automação de documento?
Não, a Automation Anywhere não usa nem permite que fornecedores terceirizados usem documentos ou dados enviados por clientes ou usuários para fins de treinamento.
Outros fornecedores têm acesso a prompts ou documentos que os clientes enviam para o Automação de documento?
Sim, consulte o Anexo C do nosso DPA (link no fim deste parágrafo) para ver a lista de fornecedores que têm acesso aos dados enviados pelos clientes para o Automação de documento. Para os fornecedores pertinentes, na segunda coluna denominada Serviços aplicáveis constará “Automação de documento”. Link para o DPA.
A Automation Anywhere armazena documentos enviados para o Automação de documento ou dados extraídos dos documentos?
Além de provedores de host do Automation Anywhere Nuvem, os fornecedores da Automation Anywhere não armazenam nenhum documento, pois os documentos existem apenas em estado transitório. No entanto, para permitir que os clientes validem os documentos, a Automation Anywhere armazena as imagens do documento e a saída do OCR do texto do documento na instância do Nuvem.
Que tipo de dados são compartilhados com os serviços de LLM?
Documentos, conteúdo de documentos e consultas de prompt ou de pesquisa.
A Automation Anywhere vai celebrar um Contrato de Parceria Comercial (BAA, Business Associate Agreement) para o processamento de Informações de Saúde Protegidas (PHI, Protected Health Information) (conforme definido pelo C.F.R. § 160.103) em relação às PHI, que um cliente enviar para o Automação de documento?
Sim. Em geral, nosso BAA é incorporado automaticamente ao nosso Contrato de Automação em Nuvem. Entre em contato com o Gerente de Sucesso do Cliente (CSM) ou Executivo de Vendas (SE) para verificar se você tem um BAA em vigor e, se não tiver, eles darão a você uma cópia do nosso BAA.
A Automation Anywhere vai celebrar um Contrato de Processamento de Dados (DPA, Data Processing Agreement) para o processamento de Dados Pessoais que um cliente enviar para o Automação de documento?
Sim. Em geral, nosso DPA é incorporado automaticamente ao nosso Contrato de Automação em Nuvem. Entre em contato com o Gerente de Sucesso do Cliente (CSM) ou Executivo de Vendas (SE) para verificar se você tem um DPA em vigor e, se não tiver, eles darão a você uma cópia assinada do nosso DPA. Se quiser consultar os termos em nosso DPA, ele pode ser encontrado aqui: Contrato DPA da Automation Anywhere
Detalhes importantes sobre o uso de dados de Serviço do Google Vision OCR (Fonte: Google).
Uso de dados do serviço OCR do Google Vision

Diagrama de arquitetura

Document Automation com arquitetura de solução com IA generativa

O processo de extração consiste em várias etapas:
  1. Autenticação:
    • O processo de extração começa com a execução do pacote de extração de documentos em um dispositivo executor de bots
    • (1) A configuração do processo de extração é definida em uma instância de aprendizado. Se a instância de aprendizado usar a extração orientada por IA generativa, o pacote se conectará à Control Room para buscar informações sobre o local do host do Proxy Gateway e o token de autenticação.
  2. OCR:
    • A próxima etapa é recuperar uma camada de texto do documento. O sistema usa mecanismos do OCR para a tarefa
    • (2) Se o Google Vision OCR for selecionado na instância de aprendizado, o pacote enviará um documento para o Proxy Gateway
    • (3) O Proxy Gateway encaminha esta solicitação ao endpoint do Google Vision API para o OCR, e (4) envia os resultados de volta para o pacote
  3. Extração de dados:
    • (5), (6), (7) Para processar documentos grandes, o pacote cria incorporações para diferentes partes do documento usando o modelo ADA
    • (8), (9) Em seguida, o pacote identifica a parte mais relevante do documento para a(s) consulta(s) de pesquisa apresentada(s) usando incorporação e envia essa parte junto com um prompt para o modelo GPT por meio do Proxy Gateway
    • (10) Por fim, o pacote recebe respostas do GPT e as converte em resultados de extração de documentos

Para informações sobre segurança de dados do Automation Anywhere Nuvem IA generativa, consulte: Segurança de dados para IA generativa – Perguntas frequentes