Criar uma instância de aprendizado no Community Edition

Crie uma instância de aprendizado para iniciar o processamento de documentos. No Community Edition, você pode extrair dados de faturas em inglês usando o fornecedor de OCR ABBYY.

Procedimento

  1. Na página inicial da Control Room, navegue até Gerenciar > Instâncias de aprendizado > Criar instâncias de aprendizado.
  2. Informe um nome e uma descrição para a instância de aprendizado.
    Automação de documento não permite a duplicação de nomes de instâncias de aprendizado, portanto, o nome que você fornece deve ser único.
  3. Clique em Avançar.

Recomendamos que você abra uma amostra de documento lado a lado com a janela de Control Room à medida que você configura os campos do formulário e da tabela.

Nota:
  • Um campo do formulário é um tipo de campo que ocorre apenas uma vez em um documento.
  • Um campo de tabela é um tipo de campo que ocorre novamente ao longo de um documento, normalmente na forma de uma tabela.

  1. Configure os campos do formulário e da tabela para extração.
    Automação de documento oferece um conjunto padrão de campos de formulários e tabelas, muitos dos quais não são inicialmente visíveis. Você pode pesquisar um campo por nome de campo, rótulo de campo ou tipo de dado.
    Para ver a lista completa dos campos, clique em Mostrar campos não utilizados. Consulte o vídeo a seguir para uma demonstração:
    Clique em um campo para abrir o editor de campos. Você pode editar a maioria dos atributos de um campo. Você não pode editar o nome e os aliases padrão. Automação de documento atribui aliases padrão, que são palavras-chave em “hardcoding”, a campos padrão para ajudar na extração. Você não pode modificar ou excluir aliases padrão, mas você pode adicionar aliases no campo Personalizar aliases. Veja o vídeo a seguir para uma demonstração da criação de um alias personalizado:

    Você pode adicionar campos personalizados de formulário e tabela para instâncias de aprendizado do IA de documentos do Google. Quando quiser extrair dados de campos não compatíveis com o Google, você pode criar campos personalizados. Com essa melhoria, você pode usar modelos pré-treinados do Google junto com campos personalizados para extração de documentos.

    Considere os seguintes pontos ao adicionar campos personalizados para instâncias de aprendizado do Google Document AI:
    • Você pode adicionar campos personalizados de formulário e tabela para tipos de documentos, como faturas e contas de serviços públicos.
      Nota: Você não pode adicionar campos personalizados ao documento de recebimento.
    • Você pode editar e salvar os campos personalizados.
    • Expressões regulares (RegEx) estão disponíveis para os campos personalizados.
    • Você pode adicionar campos personalizados para instâncias de aprendizado existentes que estão anexadas ao pacote antigo.

      Neste cenário, quando você salva a instância de aprendizado, uma notificação é exibida para atualizar a versão do pacote.

    • Com base nos pseudônimos, é possível extrair os campos personalizados usando o mecanismo V8.
    • Quando um pacote não é compatível com vários recursos, é exibida uma mensagem correspondente à maior versão do pacote.
    • Você pode importar ou exportar os campos personalizados de ou para o arquivo .dw junto com pseudônimos e configurações definidos.
    • Quando você extrai os campos personalizados, esses campos são compatíveis com versões anteriores à versão mais antiga do pacote.
      • Quando uma instância de aprendizado usa os campos personalizados, o pacote antigo (v.29 e anteriores) não gera erro e contém valores vazios para campos personalizados.
      • Semelhante aos campos padrão, o pacote antigo (v.29) aplica normalização e regras para campos personalizados, se aplicável.
    Passe o mouse sobre o ícone do menu à direita de um campo para acessar as setas para cima/para baixo. Use as setas para reorganizar a ordem dos campos para uma validação manual mais eficiente. A ordem dos campos não afeta a extração.
    Para saber mais sobre os outros atributos de campo, revise a tabela na próxima etapa.
  2. Para adicionar um campo, clique em Adicionar um campo e preencha os seguintes campos:
    OpçãoDescrição
    Nome do campo Digite um nome de campo que comece com um caractere alfabético (A-Z ou a-z).

    Nos campos padrão, o nome do campo é codificado e não pode ser alterado.

    Rótulo do campo Digite um nome fácil de usar para ajudar os validadores.

    Por exemplo, você pode renomear o Número de identificação fiscal da organização com um nome localizado, tal como Número de IVA.

    A etiqueta de campo não afeta a extração.

    Confiança Estabelecer um limite para reduzir potenciais falsos positivos.

    No momento do processamento, o Automação de documento atribui uma pontuação a cada campo em um documento para indicar a certeza de que os dados foram extraídos corretamente. Se o documento contiver campos com pontuação inferior ao limite de confiança, o documento é enviado para a fila de validação.

    Se você entrar com um alto limite de confiança, mais documentos serão enviados para a fila de validação. Se você entrar com um baixo limite de confiança, menos documentos serão enviados para a fila de validação.

    Suporta valores de zero a 100.

    Tipo de dados Escolha entre Endereço*,Texto, Número e Data.

    Se os dados no campo não corresponderem ao tipo de dados, o documento é enviado para a fila de validação.

    Automação de documento suporta variações de formato de data e número.

    * Se você estiver configurando uma instância de aprendizado com um tipo de documento definido pelo usuário, os campos do formulário incluem o tipo de dados do endereço, que extrai toda a estrutura de um endereço.

    Formato de data/número Defina uma aparência padrão para converter datas e números extraídos em um formato específico. Isso garante consistência e precisão nos bancos de dados e outros sistemas de registro.

    Por exemplo, se você optar por padronizar as datas para MM/DD/YYYY e um documento processado contiver uma data que apareça como 12 Feb 2023, a instância de aprendizado reformatará a data para 02/12/2023.

    Se você optar por padronizar os números para o local inglês (Estados Unidos) e um documento processado contiver um número que apareça como 100,00, a instância de aprendizado reformatará o número para 100.00.

    Obrigatório Selecione uma das seguintes opções:
    • Obrigatório: O campo não pode ficar em branco.
    • Opcional: O campo pode estar vazio ou não existir no documento.
    Aliases padrão Nenhuma ação é necessária para este campo. Automação de documento atribui aliases padrão, que são palavras-chave em “hardcoding”, a campos padrão para ajudar na extração.
    Personalizar pseudônimos Palavras-chave adicionais para ajudar o Automação de documento a localizar o campo. Por exemplo, adicione nomes específicos de países ou regiões para campos tais como Número de IVA como um alias para um campo personalizado de Número de identificação fiscal da organização.
    Nota: Os aliases personalizados devem ser únicos. Eles não podem duplicar o alias padrão de outro campo. Exceção: Os campos do formulário podem ter aliases personalizados duplicados como os campos da tabela e vice-versa.
    Regras de validação Dependendo do tipo de dados, crie regras usando padrões, fórmulas, listas e declarações, tais como inícios ou fins.

    Validação da fórmula | Validação de padrões

  3. Clique em Create (Criar).

Próximas etapas

Carregue documentos para a instância de aprendizado, corrija erros de validação e verifique os dados extraídos: Processar documentos no Community Edition