Criar uma instância de aprendizado no Automação de documentos

Comece a processar documentos, criando uma instância de aprendizado para extrair dados de faturas , contas de serviços públicos ou recibos. uma instância de aprendizado é uma estrutura que contém informações, tais como tipo de documento, idioma e os campos a serem extraídos.

Pré-requisitos

  • Para criar uma instância de aprendizado, você deve ser um usuário Learning instance creator. Consulte Automação de documentos usuários.
  • O OCR padrão é Mecanismo ABBYY FineReader. Alternativamente, os usuários da Control Room podem criar uma instância de aprendizagem para processar documentos em Google Vision OCR.

Assista a este vídeo para o processo completo de ponta a ponta de criação de uma instância de aprendizado:

Procedimento

  1. Na página inicial da Control Room, navegue até Gerenciar > Instâncias de aprendizado > Criar instâncias de aprendizado.
  2. Informe um nome e uma descrição para a instância de aprendizado.
    Automação de documentos não permite a duplicação de nomes de instâncias de aprendizado, portanto, o nome que você fornece deve ser único.
  3. Selecionar um tipo de documento: Fatura, Definido pelo usuário, Cobrança de serviços públicos ou Recibo.
    Use o tipo de documentos definidos por usuário que são visualmente semelhantes a faturas, como pedidos de compra e de venda, que contêm pares de chave-valor e uma estrutura de tabela. Neste tipo de documento, você cria e configura todos os campos do formulário e da tabela.
  4. Selecione o idioma.
    Automação de documentos é compatível com inglês, holandês, francês, alemão, italiano, português (Brasil) e espanhol. Para obter mais detalhes, consulte Idiomas compatíveis no Automação de documentos.

    Se você selecionar um tipo de documento usado durante a configuração do analisador na etapa 3, o idioma será escolhido automaticamente. Além disso, a lista de localizações exibe opções de idioma com base no idioma selecionado automaticamente.

  5. Se você selecionou Fatura: Selecione o fornecedor.
    Se você selecionou o idioma inglês na etapa 4, Automation Anywhere (Pré-treinado) é selecionado de modo automático.

    Se você selecionar um tipo de documento usado ao configurar o analisador na etapa 3, o analisador configurado (de terceiros) será escolhido automaticamente como provedor.

  6. Opcional: Selecione o fornecedor do OCR. Por padrão, Automação de documentos processa documentos em Mecanismo ABBYY FineReader.
    Os usuários com uma Control Room da nuvem podem selecionar para processar documentos em Google Vision OCR.
  7. Opcional: Você pode usar a opção Melhorar a precisão usando a validação para enviar feedback ao sistema para melhorar os resultados da extração. Para obter mais informações, consulte Melhoria da precisão da extração por meio da validação.
    Nota: A opção Melhorar a precisão usando validação não está disponível para tipos de documento Contas de serviços públicos e Recibos.
  8. Opcional: Selecione a opção Extração de dados orientada por IA generativa para usar as capacidades de extração do IA generativa. Para obter mais informações, consulte Automação de documentos – extração de dados usando IA generativa.
    Selecione um dos seguintes provedores de IA generativa:
    Nota:
    • Ao atualizar de uma versão anterior para v.33 ou mais recente, o Open AI será definido como o provedor de extração de dados padrão.
    • Quando você seleciona Anthropic como o provedor de extração de dados em uma instância de aprendizagem e não define as configurações necessárias do Anthropic no bot de extração correspondente, é exibido um erro ao processar documentos.
    • Se você selecionou o provedor do Anthropic para uma instância de aprendizagem e definiu de maneira incorreta as configurações do Anthropic ou selecionou um provedor diferente no bot de extração correspondente, será exibido um erro ao processar documentos.
    • Se você processou documentos usando Open AI e depois mudou para Anthropic para extração de dados, apenas os documentos que serão processados após a mudança para o Anthropic usarão o Anthropic para extração de dados. Para os documentos processados antes, os dados extraídos estariam usando Open AI.
    • Open AI: Azure OpenAI fornece acesso aos poderosos modelos de linguagem da Open AI para geração de conteúdo, resumo, compreensão de imagens, pesquisa semântica e linguagem natural para tradução de código. Este provedor está disponível via licença OEM (não requer licenças adicionais) e Traga sua própria licença (BYOL). Se você estiver usando BYOL, certifique-se de definir as configurações adicionais para Open AI no bot de extração para usar este provedor. Consulte ação Extrair dados.
    • Anthropic: Agora você pode usar os modelos do Anthropic disponíveis no AWS e no GCP para extração de dados no Automação de documentos. Esta oferta permite selecionar do modelo de IA generativa dependendo do provedor de Nuvem que sua empresa certificou.

      O Anthropic oferece as seguintes vantagens:

      • Processa bem documentos grandes e não estruturados.
      • Processa documentos em inglês e em outros idiomas.
      • Processa documentos com muito mais rapidez e melhor precisão na extração de dados.
      • Permite usar o modelo Traga sua própria licença (BYOL).
        Nota: A licença OEM será ativada em uma versão futura.

      Você deve configurar o modelo Anthropic Claude no serviço Google Vertex AI ou Amazon Bedrock e, em seguida, definir as configurações adicionais no bot de extração para usar este provedor. Consulte ação Extrair dados.

    Como criar uma instância de aprendizado em Automação de documentos
  9. Clique em Avançar.

Recomendamos que você abra uma amostra de documento lado a lado com a janela de Control Room à medida que você configura os campos do formulário e da tabela.

Nota:
  • Um campo do formulário é um tipo de campo que ocorre apenas uma vez em um documento.
  • Um campo de tabela é um tipo de campo que ocorre novamente ao longo de um documento, normalmente na forma de uma tabela.

  1. Configure os campos do formulário e da tabela para extração. Para obter mais detalhes, consulte Referências para criar uma instância de aprendizado no Automação de documentos.
    1. Clique em um campo para abrir o editor de campos. Para obter mais detalhes, consulte Referências para criar uma instância de aprendizado no Automação de documentos.
    2. Passe o mouse sobre o ícone do menu à direita de um campo para acessar as setas para cima/para baixo.
    3. Use as setas para reorganizar a ordem dos campos para uma validação manual mais eficiente.
      A ordem dos campos não afeta a extração.
    Para saber mais sobre os outros atributos de campo, consulte Referências para criar uma instância de aprendizado no Automação de documentos.
  2. Clique em Adicionar um campo e especifique os detalhes do campo, como nome do campo, rótulo do campo, confiança, tipo de dados, formato de data/número e assim por diante. Para obter mais detalhes, consulte Referências para criar uma instância de aprendizado no Automação de documentos.
    A imagem a seguir mostra campos de formulário e tabela configurados em uma instância de aprendizado:
    Campos de formulário de uma instância de aprendizado

    Campos de tabela de uma instância de aprendizagem e adição de tabela personalizada no nível da instância de aprendizagem
  3. Opcional: Na guia Campos da tabela, clique no ícone + para adicionar uma tabela personalizada no nível da instância de aprendizagem.
    1. Digite um nome para a tabela e clique em Adicionar.
    2. Clique em Adicionar um campo e especifique os detalhes do campo, como nome do campo, rótulo do campo, confiança, tipo de dados, formato de data/número e assim por diante. Para obter mais detalhes, consulte Referências para criar uma instância de aprendizado no Automação de documentos.
      Nota: Você também pode adicionar e excluir a tabela personalizada ao editar uma instância de aprendizagem.
    A tabela personalizada é exibida na lista suspensa de tabela.
    A tabela criada no nível da instância de aprendizagem e exibida na lista suspensa

    Você também pode visualizar os campos de tabelas personalizadas e padrão na guia Regras do documento, mas não pode selecionar campos em tabelas distintas. Para obter mais detalhes sobre o suporte a múltiplas tabelas, consulte Referências para criar uma instância de aprendizado no Automação de documentos.

  4. Clique em Criar.
Quando uma nova instância de aprendizado é criada, a Control Room cria uma pasta com o mesmo nome da instância de aprendizado na pasta Automação > Espaço de trabalho para documentos. A pasta contém duas bots (extração e descarregamento), um processo e um formulário. Para obter mais detalhes, consulte Referências para criar uma instância de aprendizado no Automação de documentos.

Próximas etapas

Carregue documentos para a instância de aprendizado, corrija erros de validação e verifique os dados extraídos: Processar documentos no Automação de documentos