Crie um modelo de extração personalizado usando o Formulários padrão

Criar um modelo de extração de Formulários padrão na Control Room.

Pré-requisitos

  • Certifique-se de que a Control Room tenha uma licença de produto Document Automation (Número de páginas). Para mais informações sobre licenças, consulte Compreensão das licenças em Document Automation.
  • Você deve ter as funções Administrador de Bot AAE_IQ ou Serviços de Bot AAE_IQ para concluir esta tarefa
  • Identificar entre cinco e quinze documentos de treinamento
  • O limite máximo do tipo de documento do Formulários padrão é 157286400 bytes.
  • Para obter informações sobre as limitações do uso de modelos neurais personalizados, consulte Document Intelligence custom neural model.

Procedimento

  1. Na Control Room, navegue até IA > Document Automation e clique em Criar modelo.
    Nota: Não será possível ver a opção Criar modelo na página de instâncias de aprendizado para criar modelos ao usar sua própria licença (BYOL). Consulte Build and train a custom extraction model.
    A janela Projetos é aberta em uma nova guia.
  2. Clique em Criar projeto.
  3. Digite um nome para o projeto, clique em Procurar para carregar documentos para treinar o modelo de extração e clique em Criar.
  4. Defina as tags do campo:
    1. Clique no ícone de adição (+) no canto superior direito da tela e selecione Campo.
    2. Digite um nome para a tag e selecione Enter. Por exemplo, Número da fatura ou Data da fatura.
    Como selecionar uma região de valor de campo
    Nota: Cada tag de campo e sua tag de localização correspondente recebem uma cor exclusiva para que seja fácil associá-los ao distinguir ou validar os dados visualmente. Clicar em uma tag de campo destacará a tag de localização correspondente no documento.
  5. Defina as tags da tabela:
    1. Clique no ícone de adição (+) no canto superior direito da tela e selecione Tabela.
      Como adicionar um campo de tabela
    2. Digite um nome para a tabela e clique em Criar.
      Adicionando um nome de tabela
    3. Para cada coluna da tabela, selecione o nome da coluna e execute uma das seguintes ações:
      • Renomear coluna: Selecione essa opção para renomear a coluna e selecione Enter para renomear.
      • Inserir coluna: Selecione essa opção para inserir uma coluna após a coluna selecionada.
      • Excluir coluna: Selecione essa opção para excluir a coluna selecionada.
    4. Atualize os detalhes da coluna.
    5. Opcional: Clique no ícone de adição (+) para adicionar mais linhas.
    6. Clique no botão fechar (x) no canto superior direito da tela para sair da visualização da tabela.
    Inserir o nome da coluna na caixa contornada em verde
  6. Clique na opção Região no canto superior esquerdo da tela e defina a localização dos dados para cada campo:
    1. Para os campos do formulário, destaque a localização dos dados a serem extraídos e selecione o nome do campo correspondente na lista.
      Adicionando um nome de campo
    2. Para cada linha da tabela, destaque a localização dos dados a serem extraídos e selecione a célula. Clique no botão fechar (x) no canto superior direito da tela para sair da visualização da tabela.
      Como selecionar uma região de valor de campo de tabela
    3. Selecione o próximo documento e repita as etapas para definir as localizações dos campos do formulário e da tabela.
  7. Clique no ícone Treinar e insira um nome para o modelo.
    Ícone de modelo de treino
  8. Selecione um dos seguintes modelos:
    • Modelo: O modelo personalizado é um modelo de documento fácil de treinar que extrai com precisão pares de valores-chave rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Esse modelo normalmente é usado para extrair dados de documentos estruturados que possuem layout consistente e modelos visuais definidos. Consulte Document Intelligence custom template model.
    • Neural: O modelo neural personalizado é um tipo de modelo aprendido profundamente que combina recursos de layout e linguagem para extrair com precisão campos rotulados de documentos. Esse modelo é mais adequado para extrair dados de vários tipos de documentos, como documentos semiestruturados e não estruturados. Consulte Document Intelligence custom neural model.
      Importante: Como o modelo neural personalizado usa tecnologia de aprendizagem profunda, pode levar algum tempo para concluir o treinamento do modelo. Portanto, talvez você não veja o modelo imediatamente na página de modelos personalizados. Recomendamos que você aguarde a conclusão do treinamento e selecione este modelo para uso.
  9. Clique em Treinar.
  10. Clique no ícone Analisar, clique em Procurar arquivo, selecione um documento e clique em Executar análise para testar o modelo de extração.
    Nota: A partir do Automation 360 v.29, é possível criar e treinar novos modelos apenas no IA do Azure para Informação de Documentos v.3.0. Se estiver usando o IA do Azure para Informação de Documentos v.2.1, deverá atualizar para o IA do Azure para Informação de Documentos v.3.0 seguindo as etapas abaixo:
    1. Abra o Projeto.
    2. Clique no ícone Treinar.
    3. Clique em Treinar. O modelo é criado no IA do Azure para Informação de Documentos v.3.0.

Próximas etapas

Criar instância de aprendizado para formulários padrão
Nota: Não se pode editar um modelo de extração depois de associá-lo a uma instância de aprendizagem.