Considerações ao criar uma instância de aprendizado no Document Automation

Ao criar uma instância de aprendizado, tenha em mente estas considerações para campos de formulário e tabela, campos de pesquisa, informações adicionais sobre a pasta de saída após a criação de uma instância de aprendizado e assim por diante.

Exibir e pesquisar campos

O Document Automation oferece um conjunto padrão de campos de formulários e tabelas, muitos dos quais não são inicialmente visíveis. Você pode pesquisar um campo por nome do campo, rótulo do campo ou tipo de dados.

Para consultar a lista completa dos campos, clique em Mostrar campos não utilizados. Consulte o vídeo a seguir para uma demonstração:

Diretrizes para editar os campos e criar pseudônimos personalizados

  • Você pode editar a maioria dos atributos de um campo.
  • Não é possível editar o nome e os pseudônimos padrão. O Document Automation atribui pseudônimos padrão, que são palavras-chave codificadas, a campos padrão para ajudar na extração.
  • Você não pode modificar ou excluir aliases padrão, mas você pode adicionar aliases no campo Personalizar aliases.

    Veja o vídeo a seguir para uma demonstração da criação de um alias personalizado:

Considerações para os campos de formulário e tabela

A tabela a seguir lista todos os nomes de campos e valores obrigatórios para especificar na descrição.
Opção Descrição
Nome do campo Digite um nome de campo que comece com um caractere alfabético (A-Z ou a-z).

Nos campos padrão, o nome do campo é codificado e não pode ser alterado.

Rótulo do campo Digite um nome fácil de usar para ajudar os validadores.

Por exemplo, você pode renomear o Número de identificação fiscal da organização com um nome localizado, tal como Número de IVA.

A etiqueta de campo não afeta a extração.

Confiança Estabelecer um limite para reduzir potenciais falsos positivos.

No momento do processamento, o Document Automation atribui uma pontuação a cada campo em um documento para indicar a certeza de que os dados foram extraídos corretamente. Se o documento contiver campos com pontuação inferior ao limite de confiança, o documento é enviado para a fila de validação.

Se você entrar com um alto limite de confiança, mais documentos serão enviados para a fila de validação. Se você entrar com um baixo limite de confiança, menos documentos serão enviados para a fila de validação.

Suporta valores de um a 100.

Tipo de dados Escolha entre os seguintes tipos de dados:
  • Endereço*: Use esse tipo de dado quando precisar extrair campos de endereço de documentos. O sistema é treinado para extrair vários campos de endereço e usar esse tipo de dado indica ao sistema para detectar e extrair endereços de documentos.
  • Texto: Use esse tipo de dado quando precisar extrair campos de texto de documentos. O sistema é treinado para extrair vários campos de texto e usar esse tipo de dado indica ao sistema para detectar e extrair texto de documentos.
  • Número: Use esse tipo de dado quando precisar extrair campos numéricos de documentos. O sistema é treinado para extrair vários campos numéricos e usar esse tipo de dado indica ao sistema para detectar e extrair números de documentos.
  • Data: Use esse tipo de dado quando precisar extrair campos de data de documentos. O sistema é treinado para extrair vários formatos de data e usar esse tipo de dado indica ao sistema para detectar e extrair datas de documentos.

Se os dados no campo não corresponderem ao tipo de dados, o documento é enviado para a fila de validação.

Document Automation suporta variações de formato de data e número.

* Se você estiver configurando uma instância de aprendizado com um tipo de documento definido pelo usuário, os campos do formulário incluem o tipo de dados do endereço, que extrai toda a estrutura de um endereço.

Formato de data/número Defina uma aparência padrão para converter datas e números extraídos em um formato específico. Isso garante consistência e precisão nos bancos de dados e outros sistemas de registro.

Por exemplo, se você optar por padronizar as datas para MM/DD/YYYY e um documento processado contiver uma data que apareça como 12 Feb 2023, a instância de aprendizado reformatará a data para 02/12/2023.

Se você optar por padronizar os números para o local inglês (Estados Unidos) e um documento processado contiver um número que apareça como 100,00, a instância de aprendizado reformatará o número para 100.00.

Obrigatório Selecione uma das seguintes opções:
  • Obrigatório: O campo não pode ficar em branco.
  • Opcional: O campo pode estar vazio ou não existir no documento.
Use o feedback de validação para melhorar a precisão Desative ou habilite o feedback de validação para o campo. Quando você seleciona a opção Melhorar a precisão usando validação na página Criar instância de aprendizagem, essa opção é habilitada para todos os campos por padrão. Quando essa opção está habilitada, o feedback de validação fornecido para o campo é usado para melhorar a precisão da extração de dados. No entanto, se você perceber que um valor de campo é extraído conforme seus requisitos, mesmo sem a necessidade de feedback de validação ou quando precisar usar soluções alternativas, como modelo pré-treinado ou provedores de IA generativa para melhorar a extração de dados, você pode desmarcar a caixa de seleção dessa opção para desabilitar o feedback de validação para o campo.
Nota:
  • O feedback de validação só pode ser bloqueado no nível da instância de aprendizado e não está disponível para campos de formulário e tabela.
  • Quando o feedback de validação é bloqueado no nível da instância de aprendizado, a opção de feedback de validação no nível de campo é definida como modo somente leitura, pois o sistema não considerará nenhum feedback de validação para melhorar a precisão dos dados. Para editar a validação em nível de campo, você deve desabilitar o bloqueio de validação para a instância de aprendizado.
  • Se você desabilitar o feedback de validação para campos de tabela, esses campos não serão exibidos na opção Configurações avançadas de treinamento. Por exemplo, para selecionar a coluna Quantidade como a coluna primária nas configurações avançadas de treinamento e se o feedback de validação desse campo da tabela estiver desabilitado, a coluna Quantidade não será exibida na lista Coluna primária.
Aliases padrão Nenhuma ação é necessária para esse campo. O Document Automation atribui pseudônimos padrão, que são palavras-chave codificadas, a campos padrão para ajudar na extração.
Personalizar pseudônimos Palavras-chave adicionais para ajudar o Document Automation a localizar o campo. Por exemplo, adicione nomes específicos de países ou regiões para campos tais como Número de IVA como um alias para um campo personalizado de Número de identificação fiscal da organização. É possível adicionar até 30 aliases personalizados exclusivos.
Nota: Os aliases personalizados devem ser únicos. Eles não podem duplicar o alias padrão de outro campo. Exceção: Os campos do formulário podem ter aliases personalizados duplicados como os campos da tabela e vice-versa.
Regras de validação Dependendo do tipo de dados, crie regras usando padrões, fórmulas, listas e declarações, tais como inícios ou fins.

Validação da fórmula | Validação de padrão Regex

Diretrizes para criar ou editar a tabela múltipla personalizada em uma instância de aprendizado

Ao criar ou editar tabelas múltiplas no nível da instância de aprendizado, considere os seguintes pontos:
  • Esse recurso é aplicável a tipos de documentos como Automation Anywhere (pré-treinado), Automation Anywhere (definido pelo usuário), IQ Bot Document Automation para pacote Bridge e não estruturado (IA generativa).
  • Você pode configurar as regras com apenas um campo de tabela por vez, que não pode ser configurado em campos que pertençam a tabelas diferentes.
  • Todos os nomes de campos precisam ser exclusivos.
  • As Configurações avançadas de treinamento são aplicáveis a tabelas múltiplas. Elas funcionarão a cada tabela, não entre tabelas.
  • Você pode importar, exportar e copiar instâncias de aprendizado que contenham tabelas múltiplas.
  • Você pode excluir a tabela personalizada criada na instância de aprendizado, mas a tabela padrão não pode ser excluída.
  • O número máximo de caracteres para o nome de tabelas múltiplas personalizadas é 50 caracteres e 200 caracteres para o nome da coluna.
  • Apenas caracteres alfanuméricos, sublinhado, espaços e hifens são permitidos no campo nome da tabela.
  • Você não pode alterar o nome da tabela ao criar ou editar uma instância de aprendizado.
  • O suporte a tabelas múltiplas não é aplicável para tipos de documentos Formulários padrão, IA do Google Document, conhecimento de embarque, guia de transporte, aviso de chegada, lista de embalagem.
  • O arquivo de saída (CSV) indicará todas as referências de tabela (tabelas múltiplas padrão e personalizadas) no formato nome_tabela: nome do campo.

Arquivo de saída de Bots e estrutura de pastas

Quando uma nova instância de aprendizado é criada, a Control Room cria uma pasta com o mesmo nome da instância de aprendizado na pasta Automação > Espaço de trabalho para documentos. A pasta contém duas bots (extração e descarregamento), um processo e um formulário.
Exemplo de captura de tela de ativos de instância de aprendizagem
  • Processo: Gerencia o processo usando cenários if/else através dos quais Document Automation extrai dados de documentos carregados, atribui documentos aos usuários para validação e faz download dos dados extraídos. Para saber mais, consulte Automation Co-Pilot para usuários corporativos processo em Document Automation
  • Bot de extração: Extrai dados de campos definidos nos documentos carregados.
  • Fazer o download do bot: Faz o download dos dados extraídos para uma pasta específica no dispositivo ou para uma rede compartilhada.
  • Formulário: Define os parâmetros de entrada que são enviados para o processo. Os parâmetros de entrada incluem o nome da instância de aprendizado, o arquivo carregado e o caminho do arquivo de saída.