Use ação de extração regex na regra de validação

A ação de extração de regex permite que os usuários apliquem uma expressão regular personalizada (regex) aos valores extraídos dos documentos. Com essa ação, os usuários podem manipular os dados extraídos fazendo a extração de substrings específicas com base no padrão regex especificado.

Quando um documento é processado e um valor é extraído, você pode aplicar a ação de extração de regex a esse valor. Você pode definir um padrão de regex para identificar e extrair uma parte específica do valor extraído.
Nota: Ele extrai apenas a primeira correspondência encontrada no valor, com base no padrão regex especificado.

Pré-requisitos

  • Ao aplicar a ação de extração de regex, o sistema define um valor de campo com a primeira correspondência de regex durante a extração.
  • Se a regex especificada não corresponder ao campo, ela retornará um valor de campo vazio.
  • Se você não tiver um pacote atualizado (v.31) conectado a uma instância de aprendizagem, você verá uma mensagem de aviso indicando que essa regra talvez não funcione conforme o esperado.

Exemplo

Este recurso é particularmente útil em cenários onde apenas uma parte dos dados extraídos é necessária. Por exemplo, extrair um conjunto específico de números de uma string maior, isolar uma parte de um endereço ou recuperar um fragmento específico de uma descrição de tabela.

No exemplo abaixo, se você quiser extrair o Código do fornecedor da coluna Descrição do documento, todo o texto de descrição da coluna Descrição será recuperado.

A imagem a seguir mostra os valores do Código do fornecedor com processo de extração regular.

Antes de aplicar a ação de extração de regex

Neste exemplo, veremos como extrair apenas o Código do fornecedor da coluna Descrição do documento.

Procedimento

  1. Na guia Regras de campo, clique em Adicionar regra.
  2. Especifique a condição não está vazio para o campo Código do fornecedor.
  3. Selecione o tipo de ação extração de regex.
  4. Especifique o padrão regex. Por exemplo, Vendor Code: \d{6}
  5. Teste o padrão regex aplicando o valor apropriado para o padrão especificado e clique em Atualizar. Por exemplo, Vendor Code: 381823.
    Utilizar a ação de extração de regex
  6. Clique em Processar para processar o documento.
    Com base no padrão regex especificado, apenas o valor do Código do fornecedor é extraído da coluna Descrição.

    A imagem a seguir mostra os valores do Código do fornecedor após a aplicação da ação extração de regex.

    Extração de código do fornecedor usando ação de extração regex

    São apresentados a seguir alguns exemplos de padrões regex que você pode usar para extração:
    Tipo de dados Padrão regex Exemplos
    Texto ou endereço \b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+.[A-Z|a-z]{2,}\b test@gmail.com
    \b\d{3}[-.]?\d{3}[-.]?\d{4}\b 123.456.7890 ou 123-456-7890
    Número ^\d{2}$ 12, 23 ou 99
    ^[0-9]+$ 123 ou 12434
    Data \b\d{1,2}[/-]\d{1,2}[/-]\d{4}\b 12/31/2022 ou 02/07/2012
    ^\d{2}/\d{2}/\d{4}$ 28/02/2222
    Nota: Esses padrões regex não são fixos e podem variar conforme os requisitos do seu caso de uso.