Considerações ao criar uma instância de aprendizado no Document Automation

Ao criar uma instância de aprendizado, tenha em mente estas considerações para campos de formulário e tabela, campos de pesquisa, informações adicionais sobre a pasta de saída após a criação de uma instância de aprendizado e assim por diante.

Exibir e pesquisar campos

O Document Automation oferece um conjunto padrão de campos de formulários e tabelas, muitos dos quais não são inicialmente visíveis. Você pode pesquisar um campo por nome do campo, rótulo do campo ou tipo de dados.

Para consultar a lista completa dos campos, clique em Mostrar campos não utilizados. Consulte o vídeo a seguir para uma demonstração:

Diretrizes para editar os campos e criar pseudônimos personalizados

  • Você pode editar a maioria dos atributos de um campo.
  • Não é possível editar o nome e os pseudônimos padrão. O Document Automation atribui pseudônimos padrão, que são palavras-chave codificadas, a campos padrão para ajudar na extração.
  • Você não pode modificar ou excluir aliases padrão, mas você pode adicionar aliases no campo Personalizar aliases.

    Veja o vídeo a seguir para uma demonstração da criação de um alias personalizado:

Considerações para os campos de formulário e tabela

A tabela a seguir lista todos os nomes de campos e valores obrigatórios para especificar na descrição.
Opção Descrição
Nome do campo Insira um nome de campo que comece com um caractere alfabético (A-Z ou a-z).

Nos campos padrão, o nome do campo é codificado e não pode ser alterado.

Rótulo do campo Insira um nome fácil de usar para ajudar os validadores.

Por exemplo, você pode renomear o Número de identificação fiscal da organização com um nome localizado, tal como Número de IVA.

A etiqueta de campo não afeta a extração.

Confiança Estabelecer um limite para reduzir potenciais falsos positivos.

No momento do processamento, o Document Automation atribui uma pontuação a cada campo em um documento para indicar a certeza de que os dados foram extraídos corretamente. Se o documento contiver campos com pontuação inferior ao limite de confiança, o documento é enviado para a fila de validação.

Se você entrar com um alto limite de confiança, mais documentos serão enviados para a fila de validação. Se você entrar com um baixo limite de confiança, menos documentos serão enviados para a fila de validação.

Suporta valores de um a 100.

Tipo de dados Escolha entre os seguintes tipos de dados:
  • Endereço*: Use esse tipo de dado quando precisar extrair campos de endereço de documentos. O sistema é treinado para extrair vários campos de endereço e usar esse tipo de dado indica ao sistema para detectar e extrair endereços de documentos.
  • Texto: Use esse tipo de dado quando precisar extrair campos de texto de documentos. O sistema é treinado para extrair vários campos de texto e usar esse tipo de dado indica ao sistema para detectar e extrair texto de documentos.
  • Número: Use esse tipo de dado quando precisar extrair campos numéricos de documentos. O sistema é treinado para extrair vários campos numéricos e usar esse tipo de dado indica ao sistema para detectar e extrair números de documentos.
  • Data: Use esse tipo de dado quando precisar extrair campos de data de documentos. O sistema é treinado para extrair vários formatos de data e usar esse tipo de dado indica ao sistema para detectar e extrair datas de documentos.

Se os dados no campo não corresponderem ao tipo de dados, o documento é enviado para a fila de validação.

Document Automation suporta variações de formato de data e número.

* Se você estiver configurando uma instância de aprendizado com um tipo de documento definido pelo usuário, os campos do formulário incluem o tipo de dados do endereço, que extrai toda a estrutura de um endereço.

Formato de data/número Defina uma aparência padrão para converter datas e números extraídos em um formato específico. Isso garante consistência e precisão nos bancos de dados e outros sistemas de registro.

Por exemplo, se você optar por padronizar as datas para MM/DD/YYYY e um documento processado contiver uma data que apareça como 12 Feb 2023, a instância de aprendizado reformatará a data para 02/12/2023.

Se você optar por padronizar os números para o local inglês (Estados Unidos) e um documento processado contiver um número que apareça como 100,00, a instância de aprendizado reformatará o número para 100.00.

Obrigatório Selecione uma das seguintes opções:
  • Obrigatório: O campo não pode ficar em branco.
  • Opcional: O campo pode estar vazio ou não existir no documento.
Use o feedback de validação para melhorar a precisão Desative ou habilite o feedback de validação para o campo. Quando você seleciona a opção Melhorar a precisão usando validação na página Criar instância de aprendizagem, essa opção é habilitada para todos os campos por padrão. Quando essa opção está habilitada, o feedback de validação fornecido para o campo é usado para melhorar a precisão da extração de dados. No entanto, se você perceber que um valor de campo é extraído conforme seus requisitos, mesmo sem a necessidade de feedback de validação ou quando precisar usar soluções alternativas, como modelo pré-treinado ou provedores de IA generativa para melhorar a extração de dados, você pode desmarcar a caixa de seleção dessa opção para desabilitar o feedback de validação para o campo.
Nota:
  • O feedback de validação só pode ser bloqueado no nível da instância de aprendizado e não está disponível para campos de formulário e tabela.
  • Quando o feedback de validação é bloqueado no nível da instância de aprendizado, a opção de feedback de validação no nível de campo é definida como modo somente leitura, pois o sistema não considerará nenhum feedback de validação para melhorar a precisão dos dados. Para editar a validação em nível de campo, você deve desabilitar o bloqueio de validação para a instância de aprendizado.
  • Se você desabilitar o feedback de validação para campos de tabela, esses campos não serão exibidos na opção Configurações avançadas de treinamento. Por exemplo, para selecionar a coluna Quantidade como a coluna primária nas configurações avançadas de treinamento e se o feedback de validação desse campo da tabela estiver desabilitado, a coluna Quantidade não será exibida na lista Coluna primária.
Aliases padrão Nenhuma ação é necessária para esse campo. O Document Automation atribui pseudônimos padrão, que são palavras-chave codificadas, a campos padrão para ajudar na extração.
Personalizar pseudônimos Palavras-chave adicionais para ajudar o Document Automation a localizar o campo. Por exemplo, adicione nomes específicos de países ou regiões para campos tais como Número de IVA como um alias para um campo personalizado de Número de identificação fiscal da organização.
Nota: Os aliases personalizados devem ser únicos. Eles não podem duplicar o alias padrão de outro campo. Exceção: Os campos do formulário podem ter aliases personalizados duplicados como os campos da tabela e vice-versa.
Regras de validação Dependendo do tipo de dados, crie regras usando padrões, fórmulas, listas e declarações, tais como inícios ou fins.

Validação da fórmula | Validação de padrão Regex

Diretrizes para criar ou editar a tabela múltipla personalizada em uma instância de aprendizado

Ao criar ou editar tabelas múltiplas no nível da instância de aprendizado, considere os seguintes pontos:
  • Esse recurso é aplicável a tipos de documentos como Automation Anywhere (pré-treinado), Automation Anywhere (definido pelo usuário), IQ Bot Document Automation para pacote Bridge e não estruturado (IA generativa).
  • Você pode configurar as regras com apenas um campo de tabela por vez, que não pode ser configurado em campos que pertençam a tabelas diferentes.
  • Todos os nomes de campos precisam ser exclusivos.
  • As Configurações avançadas de treinamento são aplicáveis a tabelas múltiplas. Elas funcionarão a cada tabela, não entre tabelas.
  • Você pode importar, exportar e copiar instâncias de aprendizado que contenham tabelas múltiplas.
  • Você pode excluir a tabela personalizada criada na instância de aprendizado, mas a tabela padrão não pode ser excluída.
  • O número máximo de caracteres para o nome de tabelas múltiplas personalizadas é 50 caracteres e 200 caracteres para o nome da coluna.
  • Apenas caracteres alfanuméricos, sublinhado, espaços e hifens são permitidos no campo nome da tabela.
  • Você não pode alterar o nome da tabela ao criar ou editar uma instância de aprendizado.
  • O suporte a tabelas múltiplas não é aplicável para tipos de documentos Formulários padrão, IA do Google Document, conhecimento de embarque, guia de transporte, aviso de chegada, lista de embalagem.
  • O arquivo de saída (CSV) indicará todas as referências de tabela (tabelas múltiplas padrão e personalizadas) no formato nome_tabela: nome do campo.

Arquivo de saída de Bots e estrutura de pastas

Quando uma nova instância de aprendizado é criada, a Control Room cria uma pasta com o mesmo nome da instância de aprendizado na pasta Automação > Espaço de trabalho para documentos. A pasta contém duas bots (extração e descarregamento), um processo e um formulário.
Exemplo de captura de tela de ativos de instância de aprendizagem
  • Processo: Gerencia o processo usando cenários if/else através dos quais Document Automation extrai dados de documentos carregados, atribui documentos aos usuários para validação e faz download dos dados extraídos. Para saber mais, consulte Automation Co-Pilot para usuários corporativos processo em Document Automation
  • Bot de extração: Extrai dados de campos definidos nos documentos carregados.
  • Fazer o download do bot: Faz o download dos dados extraídos para uma pasta específica no dispositivo ou para uma rede compartilhada.
  • Formulário: Define os parâmetros de entrada que são enviados para o processo. Os parâmetros de entrada incluem o nome da instância de aprendizado, o arquivo carregado e o caminho do arquivo de saída.