Criar uma instância de aprendizado no Document Automation

Comece a processar documentos, criando uma instância de aprendizado para extrair dados de vários tipos de documentos compatíveis. Uma instância de aprendizado é uma estrutura que contém informações, tais como tipo de documento, idioma, campos a serem extraídos e assim por diante.

Pré-requisitos

  • Para criar uma instância de aprendizado, você deve ser um usuário Learning instance creator. Consulte Document Automation usuários.
  • Para tipos de documentos compatíveis com OCR, o OCR padrão é Mecanismo ABBYY FineReader.Alternativamente, você pode criar uma instância de aprendizado para processar documentos usando o Google Vision OCR.
  • Para o tipo de documento Formulários padrão, certifique-se de ter criado um modelo de extração personalizado. Consulte Crie um modelo de extração personalizado usando o Formulários padrão.

Assista a este vídeo para o processo completo de ponta a ponta de criação de uma instância de aprendizado:

Procedimento

  1. Na página inicial da Control Room, navegue até IA > Document Automation e clique em Criar instância de aprendizagem.
  2. Informe um nome e uma descrição para a instância de aprendizado.
    Document Automation não permite a duplicação de nomes de instâncias de aprendizado, portanto, o nome que você fornece deve ser único.
  3. Selecione um tipo de documento apropriado.
    Nota: Use o tipo de documentos Definidos pelo usuário para processar documentos que são visualmente semelhantes a faturas, como pedidos de compra e de venda, que contêm pares de chave-valor e uma estrutura de tabela. Neste tipo de documento, você cria e configura todos os campos do formulário e da tabela.
  4. Selecione o idioma.
    Para obter detalhes sobre os idiomas compatíveis com o Document Automation, consulte Idiomas compatíveis no Document Automation.

    Se você selecionar um tipo de documento usado durante a configuração do analisador na etapa 3, o idioma será escolhido automaticamente. Além disso, a lista de localizações exibe opções de idioma com base no idioma selecionado automaticamente.

  5. Selecione um provedor.
    Se você selecionou o idioma inglês na etapa 4, Automation Anywhere (Pré-treinado) é selecionado de modo automático.

    Se você selecionar um tipo de documento usado ao configurar o analisador na etapa 3, o analisador configurado (de terceiros) será escolhido automaticamente como provedor.

  6. Opcional: Selecione o fornecedor do OCR. Por padrão, Document Automation processa documentos em Mecanismo ABBYY FineReader.
    Os usuários com uma Cloud Control Room podem selecionar para processar documentos em Google Vision OCR.
  7. Opcional: Você pode usar a opção Melhorar a precisão usando a validação para enviar feedback ao sistema para melhorar os resultados da extração. Para obter mais informações, consulte Melhoria da precisão da extração por meio da validação.
    Nota: A opção Melhorar a precisão usando validação está disponível apenas para tipos de documentos selecionados.
  8. Opcional: Selecione a opção Extração de dados orientada por IA generativa para usar as capacidades de extração do IA generativa. Para obter mais informações, consulte Document Automation – extração de dados usando IA generativa.
    Selecione um dos seguintes provedores de IA generativa:
    Nota:
    • Para usar a opção de extração de dados impulsionada por IA generativa, certifique-se de que está usando o pacote Extração de documentos versão 3.31.16 ou mais recente. Consulte Atualizações do Extração de documentos pacote.
    • A opção Extração de dados baseada em IA generativa está disponível apenas para tipos de documentos selecionados. Para alguns tipos de documentos, a opção Extração de dados baseada em IA generativa está habilitada por padrão e não pode ser desabilitada. Você só pode escolher o provedor de IA generativa para esses tipos de documentos.
    • Ao atualizar de uma versão anterior para v.33 ou mais recente, o Open AI será definido como o provedor de extração de dados padrão.
    • Quando você seleciona Anthropic como o provedor de extração de dados em uma instância de aprendizagem e não define as configurações necessárias do Anthropic no bot de extração correspondente, é exibido um erro ao processar documentos.
    • Se você selecionou o provedor do Anthropic para uma instância de aprendizagem e definiu de maneira incorreta as configurações do Anthropic ou selecionou um provedor diferente no bot de extração correspondente, será exibido um erro ao processar documentos.
    • Se você processou documentos usando OpenAI e depois mudou para Anthropic para a extração de dados, apenas os documentos que serão processados após a mudança para o Anthropic usarão o Anthropic para extração de dados. Para os documentos processados antes, os dados extraídos usariam OpenAI.
    • Open AI: OpenAI fornece acesso aos poderosos modelos de linguagem da Open AI para geração de conteúdo, resumo, compreensão de imagens, pesquisa semântica e linguagem natural para tradução de código. Esse provedor está disponível via licença integrada (não requer licenças adicionais) e BYOL (Traga sua própria licença). Se você estiver usando BYOL, certifique-se de definir as configurações adicionais para OpenAI no bot de extração para usar este provedor. Consulte ação Extrair dados.
    • Anthropic: Agora você pode usar os modelos Anthropic IA generativa disponíveis no AWS e no GCP para extração de dados no Document Automation. Esta oferta permite selecionar do modelo de IA generativa dependendo do provedor de Nuvem que sua empresa certificou.

      O Anthropic oferece as seguintes vantagens:

      • Processamento eficiente de documentos grandes e não estruturados
      • Pode manipular documentos em inglês e outros idiomas
      • Processa documentos com muito mais rapidez e melhor precisão na extração de dados

      Se estiver usando BYOL, você deve configurar o modelo Anthropic Claude no serviço Google Vertex AI ou Amazon Bedrock e, em seguida, definir as configurações adicionais no bot de extração para usar esse provedor. Consulte ação Extrair dados.

    Como criar uma instância de aprendizado em Document Automation
  9. Clique em Avançar.

Recomendamos que você abra uma amostra de documento lado a lado com a janela de Control Room à medida que você configura os campos do formulário e da tabela.

Nota:
  • Um campo do formulário é um tipo de campo que ocorre apenas uma vez em um documento.
  • Um campo de tabela é um tipo de campo que ocorre novamente ao longo de um documento, normalmente na forma de uma tabela.

  1. Configure os campos do formulário e da tabela para extração. Para mais detalhes, consulte .
    1. Clique em um campo para abrir o editor de campos. Para obter mais detalhes, consulte .
    2. Passe o mouse sobre o ícone do menu à direita de um campo para acessar as setas para cima/para baixo.
    3. Use as setas para reorganizar a ordem dos campos para uma validação manual mais eficiente.
      A ordem dos campos não afeta a extração.
    Para saber mais sobre os outros atributos de campo, consulte .
  2. Clique em Adicionar um campo e especifique os detalhes do campo, como nome do campo, rótulo do campo, confiança, tipo de dados, formato de data/número e assim por diante. Para mais detalhes, consulte .
    A imagem a seguir mostra campos de formulário e tabela configurados em uma instância de aprendizado:
    Campos de formulário de uma instância de aprendizado

    Campos de tabela de uma instância de aprendizado e adição de tabela personalizada no nível da instância de aprendizado
    Nota: A opção Adicionar um campo não está disponível para o tipo de documento Recibos.
  3. Opcional: Na guia Campos da tabela, clique no ícone + para adicionar uma tabela personalizada no nível da instância de aprendizagem.
    1. Digite um nome para a tabela e clique em Adicionar.
    2. Clique em Adicionar um campo e especifique os detalhes do campo, como nome do campo, rótulo do campo, confiança, tipo de dados, formato de data/número e assim por diante. Para mais detalhes, consulte .
      Nota: Você também pode adicionar e excluir a tabela personalizada ao editar uma instância de aprendizagem.
    A tabela personalizada é exibida na lista suspensa de tabela.
    A tabela criada no nível da instância de aprendizado e exibida na lista suspensa

    Você também pode visualizar os campos de tabelas personalizadas e padrão na guia Regras do documento, mas não pode selecionar campos em tabelas distintas. Para obter mais detalhes sobre o suporte a múltiplas tabelas, consulte .

  4. Clique em Create (Criar).
Quando uma nova instância de aprendizado é criada, a Control Room cria uma pasta com o mesmo nome da instância de aprendizado na pasta Automação > Documentar processos do espaço de trabalho. A pasta contém duas bots (extração e descarregamento), um processo e um formulário. Para mais detalhes, consulte .

Próximas etapas

Carregue documentos para a instância de aprendizado, corrija erros de validação e verifique os dados extraídos: Processar documentos no Document Automation