Criar um modelo de extração de Formulários padrão na Control Room.
Pré-requisitos
- Certifique-se de que a Control Room tenha uma licença de produto Document Automation (Número de páginas). Para mais informações sobre licenças, consulte Compreensão das licenças em Document Automation.
- Você deve ter as funções Administrador de Bot AAE_IQ ou Serviços de Bot AAE_IQ para concluir esta tarefa
- Identificar entre cinco e quinze documentos de treinamento
- O limite máximo do tipo de documento do Formulários padrão é 157286400 bytes.
- Para obter informações sobre as limitações do uso de modelos neurais personalizados, consulte Document Intelligence custom neural model.
Procedimento
-
Na Control Room, navegue até
e clique em Criar modelo.
A janela Projetos é aberta em uma nova guia.
-
Clique em Criar projeto.
-
Digite um nome para o projeto, clique em Procurar para carregar documentos para treinar o modelo de extração e clique em Criar.
-
Defina as tags do campo:
-
Clique no ícone de adição (+) no canto superior direito da tela e selecione Campo.
-
Digite um nome para a tag e selecione Enter. Por exemplo,
Número da fatura
ou Data da fatura
.
Nota: Cada tag de campo e sua tag de localização correspondente recebem uma cor exclusiva para que seja fácil associá-los ao distinguir ou validar os dados visualmente. Clicar em uma tag de campo destacará a tag de localização correspondente no documento.
-
Defina as tags da tabela:
-
Clique no ícone de adição (+) no canto superior direito da tela e selecione Tabela.
-
Digite um nome para a tabela e clique em Criar.
-
Para cada coluna da tabela, selecione o nome da coluna e execute uma das seguintes ações:
-
Renomear coluna: Selecione essa opção para renomear a coluna e selecione Enter para renomear.
-
Inserir coluna: Selecione essa opção para inserir uma coluna após a coluna selecionada.
-
Excluir coluna: Selecione essa opção para excluir a coluna selecionada.
-
Atualize os detalhes da coluna.
- Opcional:
Clique no ícone de adição (+) para adicionar mais linhas.
-
Clique no botão fechar (x) no canto superior direito da tela para sair da visualização da tabela.
-
Clique na opção Região no canto superior esquerdo da tela e defina a localização dos dados para cada campo:
-
Para os campos do formulário, destaque a localização dos dados a serem extraídos e selecione o nome do campo correspondente na lista.
-
Para cada linha da tabela, destaque a localização dos dados a serem extraídos e selecione a célula. Clique no botão fechar (x) no canto superior direito da tela para sair da visualização da tabela.
-
Selecione o próximo documento e repita as etapas para definir as localizações dos campos do formulário e da tabela.
-
Clique no ícone Treinar e insira um nome para o modelo.
-
Selecione um dos seguintes modelos:
-
Modelo: O modelo personalizado é um modelo de documento fácil de treinar que extrai com precisão pares de valores-chave rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. Esse modelo normalmente é usado para extrair dados de documentos estruturados que possuem layout consistente e modelos visuais definidos. Consulte Document Intelligence custom template model.
-
Neural: O modelo neural personalizado é um tipo de modelo aprendido profundamente que combina recursos de layout e linguagem para extrair com precisão campos rotulados de documentos. Esse modelo é mais adequado para extrair dados de vários tipos de documentos, como documentos semiestruturados e não estruturados. Consulte Document Intelligence custom neural model.
Importante: Como o modelo neural personalizado usa tecnologia de aprendizagem profunda, pode levar algum tempo para concluir o treinamento do modelo. Portanto, talvez você não veja o modelo imediatamente na página de modelos personalizados. Recomendamos que você aguarde a conclusão do treinamento e selecione este modelo para uso.
-
Clique em Treinar.
-
Clique no ícone Analisar, clique em Procurar arquivo, selecione um documento e clique em Executar análise para testar o modelo de extração.
Nota: A partir do
Automation 360 v.29, é possível criar e treinar novos modelos apenas no
IA do Azure para Informação de Documentos v.3.0. Se estiver usando o
IA do Azure para Informação de Documentos v.2.1, deverá atualizar para o
IA do Azure para Informação de Documentos v.3.0 seguindo as etapas abaixo:
- Abra o Projeto.
- Clique no ícone Treinar.
- Clique em Treinar. O modelo é criado no IA do Azure para Informação de Documentos v.3.0.