Criar uma instância de aprendizado no Automação de documento

Comece a processar documentos, criando uma instância de aprendizado para extrair dados de faturas , contas de serviços públicos ou recibos. uma instância de aprendizado é uma estrutura que contém informações, tais como tipo de documento, idioma e os campos a serem extraídos.

Pré-requisitos

  • Para criar uma instância de aprendizado, você deve ser um usuário Learning instance creator. Consulte Automação de documento usuários.
  • Para criar uma instância de aprendizado que utilize um modelo de IA de documentos do Google, você deve criar uma credencial e um locker para guardar seu token de segurança. Consulte Criar credencial e Criar cofre.
    Nota: Ao configurar o cofre, você deve acrescentar a função personalizada da aari-document-processor como um consumidor de cofre.
  • O OCR padrão é Mecanismo ABBYY FineReader. Alternativamente, os usuários da Control Room da nuvem podem criar uma instância de aprendizagem para processar documentos em Google Vision OCR.

Assista a este vídeo para o processo completo de ponta a ponta de criação de uma instância de aprendizado:

Procedimento

  1. Na página inicial da Control Room, navegue até Gerenciar > Instâncias de aprendizado > Criar instâncias de aprendizado.
  2. Informe um nome e uma descrição para a instância de aprendizado.
    Automação de documento não permite a duplicação de nomes de instâncias de aprendizado, portanto, o nome que você fornece deve ser único.
  3. Selecionar um tipo de documento: Fatura,Definido pelo usuário,Conta de utilidades, ou Recibo
    Use o tipo de documentos definidos por usuário que são visualmente semelhantes a faturas, como pedidos de compra e de venda, que contêm pares de chave-valor e uma estrutura de tabela. Neste tipo de documento, você cria e configura todos os campos do formulário e da tabela.
  4. Selecione o idioma.
    Automação de documento é compatível com inglês, holandês, francês, alemão, italiano, português (Brasil) e espanhol.
    Nota: A extração de documentos em francês, alemão e espanhol está atualmente em fase de implantação. Os resultados da extração melhorarão em lançamentos futuros.

    Se você selecionar um tipo de documento usado durante a configuração do analisador na etapa 3, o idioma será escolhido automaticamente. Além disso, a lista de localizações exibe opções de idioma com base no idioma selecionado automaticamente.

  5. Se você selecionou Fatura: Selecione o fornecedor.
    Se você selecionou a língua inglesa na etapa 4, Automation Anywhere (Pré-treinado) é autosselecionado.

    Se você selecionar um tipo de documento usado ao configurar o analisador na etapa 3, o analisador configurado (de terceiros) será escolhido automaticamente como provedor.

  6. Opcional: Você pode usar a opção Melhorar a precisão usando a validação para enviar feedback ao sistema para melhorar os resultados da extração. Para obter mais informações, consulte Melhore a precisão da extração por meio da validação
  7. Opcional: Selecione o fornecedor do OCR. Por padrão, Automação de documento processa documentos em Mecanismo ABBYY FineReader.
    Os usuários com uma Control Room da nuvem podem selecionar para processar documentos em Google Vision OCR.
  8. Clique em Avançar.

Recomendamos que você abra uma amostra de documento lado a lado com a janela de Control Room à medida que você configura os campos do formulário e da tabela.

Nota:
  • Um campo do formulário é um tipo de campo que ocorre apenas uma vez em um documento.
  • Um campo de tabela é um tipo de campo que ocorre novamente ao longo de um documento, normalmente na forma de uma tabela.

  1. Configure os campos do formulário e da tabela para extração.
    Automação de documento oferece um conjunto padrão de campos de formulários e tabelas, muitos dos quais não são inicialmente visíveis. Você pode pesquisar um campo por nome de campo, rótulo de campo ou tipo de dado.
    Para ver a lista completa dos campos, clique em Mostrar campos não utilizados. Consulte o vídeo a seguir para uma demonstração:
    Clique em um campo para abrir o editor de campos. Você pode editar a maioria dos atributos de um campo. Você não pode editar o nome e os aliases padrão. Automação de documento atribui aliases padrão, que são palavras-chave em “hardcoding”, a campos padrão para ajudar na extração. Você não pode modificar ou excluir aliases padrão, mas você pode adicionar aliases no campo Personalizar aliases. Veja o vídeo a seguir para uma demonstração da criação de um alias personalizado:

    Você pode adicionar campos personalizados de formulário e tabela para instâncias de aprendizado do IA de documentos do Google. Quando quiser extrair dados de campos não compatíveis com o Google, você pode criar campos personalizados. Com essa melhoria, você pode usar modelos pré-treinados do Google junto com campos personalizados para extração de documentos.

    Considere os seguintes pontos ao adicionar campos personalizados para instâncias de aprendizado do Google Document AI:
    • Você pode adicionar campos personalizados de formulário e tabela para tipos de documentos, como faturas e contas de serviços públicos.
      Nota: Você não pode adicionar campos personalizados ao documento de recebimento.
    • Você pode editar e salvar os campos personalizados.
    • Expressões regulares (RegEx) estão disponíveis para os campos personalizados.
    • Você pode adicionar campos personalizados para instâncias de aprendizado existentes que estão anexadas ao pacote antigo.

      Neste cenário, quando você salva a instância de aprendizado, uma notificação é exibida para atualizar a versão do pacote.

    • Com base nos pseudônimos, é possível extrair os campos personalizados usando o mecanismo V8.
    • Quando um pacote não é compatível com vários recursos, é exibida uma mensagem correspondente à maior versão do pacote.
    • Você pode importar ou exportar os campos personalizados de ou para o arquivo .dw junto com pseudônimos e configurações definidos.
    • Quando você extrai os campos personalizados, esses campos são compatíveis com versões anteriores à versão mais antiga do pacote.
      • Quando uma instância de aprendizado usa os campos personalizados, o pacote antigo (v.29 e anteriores) não gera erro e contém valores vazios para campos personalizados.
      • Semelhante aos campos padrão, o pacote antigo (v.29) aplica normalização e regras para campos personalizados, se aplicável.
    Passe o mouse sobre o ícone do menu à direita de um campo para acessar as setas para cima/para baixo. Use as setas para reorganizar a ordem dos campos para uma validação manual mais eficiente. A ordem dos campos não afeta a extração.
    Para saber mais sobre os outros atributos de campo, revise a tabela na próxima etapa.
  2. Para adicionar um campo, clique em Adicionar um campo e preencha os seguintes campos:
    OpçãoDescrição
    Nome do campo Digite um nome de campo que comece com um caractere alfabético (A-Z ou a-z).

    Nos campos padrão, o nome do campo é codificado e não pode ser alterado.

    Rótulo do campo Digite um nome fácil de usar para ajudar os validadores.

    Por exemplo, você pode renomear o Número de identificação fiscal da organização com um nome localizado, tal como Número de IVA.

    A etiqueta de campo não afeta a extração.

    Confiança Estabelecer um limite para reduzir potenciais falsos positivos.

    No momento do processamento, o Automação de documento atribui uma pontuação a cada campo em um documento para indicar a certeza de que os dados foram extraídos corretamente. Se o documento contiver campos com pontuação inferior ao limite de confiança, o documento é enviado para a fila de validação.

    Se você entrar com um alto limite de confiança, mais documentos serão enviados para a fila de validação. Se você entrar com um baixo limite de confiança, menos documentos serão enviados para a fila de validação.

    Suporta valores de zero a 100.

    Tipo de dados Escolha entre Endereço*,Texto, Número e Data.

    Se os dados no campo não corresponderem ao tipo de dados, o documento é enviado para a fila de validação.

    Automação de documento suporta variações de formato de data e número.

    * Se você estiver configurando uma instância de aprendizado com um tipo de documento definido pelo usuário, os campos do formulário incluem o tipo de dados do endereço, que extrai toda a estrutura de um endereço.

    Formato de data/número Defina uma aparência padrão para converter datas e números extraídos em um formato específico. Isso garante consistência e precisão nos bancos de dados e outros sistemas de registro.

    Por exemplo, se você optar por padronizar as datas para MM/DD/YYYY e um documento processado contiver uma data que apareça como 12 Feb 2023, a instância de aprendizado reformatará a data para 02/12/2023.

    Se você optar por padronizar os números para o local inglês (Estados Unidos) e um documento processado contiver um número que apareça como 100,00, a instância de aprendizado reformatará o número para 100.00.

    Obrigatório Selecione uma das seguintes opções:
    • Obrigatório: O campo não pode ficar em branco.
    • Opcional: O campo pode estar vazio ou não existir no documento.
    Aliases padrão Nenhuma ação é necessária para este campo. Automação de documento atribui aliases padrão, que são palavras-chave em “hardcoding”, a campos padrão para ajudar na extração.
    Personalizar pseudônimos Palavras-chave adicionais para ajudar o Automação de documento a localizar o campo. Por exemplo, adicione nomes específicos de países ou regiões para campos tais como Número de IVA como um alias para um campo personalizado de Número de identificação fiscal da organização.
    Nota: Os aliases personalizados devem ser únicos. Eles não podem duplicar o alias padrão de outro campo. Exceção: Os campos do formulário podem ter aliases personalizados duplicados como os campos da tabela e vice-versa.
    Regras de validação Dependendo do tipo de dados, crie regras usando padrões, fórmulas, listas e declarações, tais como inícios ou fins.

    Validação da fórmula | Validação de padrões

  3. Clique em Create (Criar).
Quando uma nova instância de aprendizado é criada, a Control Room cria uma pasta com o mesmo nome da instância de aprendizado na pasta Automação > Espaço de trabalho para documentos. A pasta contém duas bots (extração e descarregamento), um processo e um formulário.Exemplo de captura de tela dos ativos da instância de aprendizado
  • Processo: Gerencia o processo usando cenários if/else através dos quais Automação de documento extrai dados de documentos carregados, atribui documentos aos usuários para validação e faz download dos dados extraídos. Para saber mais, consulte Sobre o processo Automation Co-Pilot em Automação de documento
  • Bot de extração: Extrai dados de campos definidos nos documentos carregados.
  • Baixar bot: Faz o download dos dados extraídos para uma pasta específica no dispositivo ou para uma rede compartilhada.
  • Formulário: Define os parâmetros de entrada que são enviados para o processo. Os parâmetros de entrada incluem o nome da instância de aprendizado, o arquivo carregado e o caminho do arquivo de saída.

Copiar uma instância de aprendizado no Document Automation

Você pode copiar uma instância de aprendizado atual (pública e privada) para reutilizar os campos, o analisador, o tipo de documento e o idioma dela. Quando você copia uma instância de aprendizado pública, ela permanece no modo privado. Após copiar uma instância de aprendizado, você pode editar o parâmetro existente (exceto o analisador e o feedback heurístico) conforme necessário.

Para copiar uma instância de aprendizado:
  1. Acesse Gerenciar > Instâncias de aprendizado.

    Uma lista de todas as instâncias de aprendizado é exibida.

  2. Clique no ícone de três pontos ao lado da instância de aprendizado que você deseja copiar e clique na opção Copiar.
  3. Na janela Copiar instância de aprendizado, digite o nome da instância.
    Nota: Quando você copia uma instância de aprendizado, o nome padrão começa com o prefixo Cópia de <<nome da instância>>. Você pode alterar o nome, se necessário.
  4. Selecione as opções de cópia necessárias e clique em Copiar.

    Você pode selecionar os atributos existentes de campos de formulários e tabelas, as regras de validação de campos existentes de formulários e tabelas e o feedback heurístico.

    Uma mensagem de sucesso indica que o processo de cópia foi iniciado e uma notificação da Control Room é acionada para indicar o sucesso ou a falha do processo de cópia.

Considere os seguintes pontos ao copiar uma instância de aprendizado:
  • Não é possível copiar as métricas do painel para a instância de aprendizado.
  • Não é possível copiar a instância de aprendizado conectada.
  • Não é possível copiar as credenciais da instância de aprendizado do Doc AI.
  • Se o pacote básico da instância de aprendizado for excluído antes da cópia de uma instância, poderá ocorrer um erro durante o processo de cópia.
  • Cada instância de aprendizado copiada é uma instância separada.
  • Você pode excluir a instância de aprendizado original ou copiada quando necessário.
  • Uma entrada de auditoria é registrada.

Próximas etapas

Carregue documentos para a instância de aprendizado, corrija erros de validação e verifique os dados extraídos: Processar documentos no Automação de documento