Criar instância de aprendizado

Crie uma instância de aprendizado e faça upload de exemplos de documentos para treinamento. Nesta etapa, você define os elementos de dados para um único tipo de documento, como uma fatura ou um pedido de compra, e os campos que você deseja extrair.

Pré-requisitos

Certifique-se de que os documentos de amostra atendam aos seguintes requisitos:
  • Cada documento é um arquivo separado. Por exemplo, se você baixou um e-mail e seus anexos em um único PDF, você deve separar o corpo do e-mail dos anexos. Consulte Como usar a ação Dividir documento.
  • Os documentos estão em um dos seguintes tipos de arquivo compatíveis:
    • PDF
    • JPG
    • JPEG
    • PNG
    • TIFF
  • Use documentos com um valor de resolução de pelo menos 300 pontos por polegada (dpi).
  • Na preparação, você pode fazer upload de um máximo de 150 documentos com tamanho de arquivo de 10 MB por instância de aprendizado.
  • Na produção, você pode fazer upload de no máximo 50 MB de tamanho de arquivo por documento. Entretanto, o número máximo de documentos permitidos por instância de aprendizado depende da licença.
  • Não há limitações quanto ao número de páginas por documento em um OCR em formato pdf.
  • Você pode fazer upload de 60 páginas por documento em um OCR baseado em imagem.
  • Você pode carregar até um tamanho de arquivo de 12 MB. Você pode fazer upload de documentos adicionais após criar a instância de aprendizado.
  • Os nomes dos arquivos dos documentos que você faz upload não devem começar com caracteres especiais, tais como o hífen (-).
  • Se o texto que você deseja extrair começar com qualquer um dos seguintes caracteres especiais: ‘# : , \ ` '', os caracteres especiais são ignorados pelo IQ Bot ao capturar o texto.
Nota:
  • Com o Tesseract4 OCR, atualmente existe uma limitação conhecida que restringe o número de páginas por documento a menos de 60 páginas.
  • A computação confidencial do Azure permite às organizações carregar dados criptografados para armazenamento seguro, tais como pastas privadas em uma máquina virtual. Se você carregar documentos de tais pastas seguras para IQ Bot, eles serão movidos para o status Não classificado, pois a extração de dados não é compatível para esses documentos.

Ao começar com uma coleção de documentos para inserir em um processo digital, você provavelmente terá uma mistura de tipos, formatos e orientações de documentos. Uma fatura, por exemplo, possui um conjunto consistente de elementos de dados, enquanto que um pedido de compra contém um conjunto diferente de elementos de dados. Você deve criar uma instância de aprendizado diferente para cada um desses tipos de documento, usando as seguintes etapas:

Procedimento

  1. Navegue para EXEMPLOS DE APRENDIZADO e clique na opção Nova instância.
  2. Na tela Criar nova instância de aprendizado, digite as seguintes informações:
    1. Instance name (Nome da instância): Digite um nome exclusivo.
      A versão do IQ Bot A360.21 e anterior não permite nomes de instâncias de aprendizado duplicados. Mesmo que você exclua uma instância de aprendizado, o nome não poderá ser reutilizado. A partir da versão do IQ Bot A360.22, é possível criar nomes de instâncias de aprendizado duplicadas, assim como reutilizar o nome de uma instância de aprendizado excluída.
    2. Opcional: Descrição: Insira uma descrição.
    3. Tipo de documento: Selecione o tipo de documento na lista suspensa.
      Não escolha formulários padrão como Tipo de documento enquanto cria uma instância de aprendizado. Com base na opção selecionada, um conjunto predefinido de campos de formulário e de tabela para o tipo de domínio será exibido. Por exemplo, ao selecionar Faturas, os formulários e tabelas comuns de uma fatura serão exibidos.
      Nota: Se você deseja criar um domínio para usar de forma específica para esta instância de aprendizado, selecione Tipo de documento > Outros e digite um nome do domínio. Nas próximas etapas, você personalizará o domínio.

      Para mais informações sobre como criar um domínio personalizado, veja o vídeo a seguir:

      Se você deseja criar um domínio para usar em mais de uma instância de aprendizado e tiver as permissões de acesso necessárias, você pode trabalhar com suporte Automation Anywhere para criar um domínio personalizado. Consulte Domínios personalizados no IQ Bot para obter mais informações.

    4. Idioma principal dos documentos: Use o menu suspenso para selecionar um idioma para a instância de aprendizado.
      Para criar domínios personalizados em outros idiomas e acessar até 190 idiomas compatíveis com o IQ Bot, entre em contato com o suporte da Automation Anywhere.
      Importante: Se você não conseguir ver todos os idiomas na interface do IQ Bot, solucione o problema: Unable to extract data from Multiple languages in a document (A-People login required)
    5. Fazer upload dos documentos: Clique na opção Pesquisar para carregar amostras de documentos.
  3. Marque ou desmarque campos nas seções Campos de formulário comuns e Tabelas comuns/campos de seções repetidas.
    Os campos do formulário aparecem uma vez em um documento, como a data ou o número da fatura. Os campos da tabela são campos recorrentes em todo o documento, como o total ou a quantidade do item.
    Para ver todos os campos possíveis, clique em Campos de formulário adicionais ou Tabela adicional/campos de seção repetida.
  4. Opcional: Inclua os campos adicionais inserindo o nome do campo na seção Campos de formulário adicionais ou Tabela adicional/campos de seção repetida.
    Siga as convenções de nomenclatura ao inserir um nome no campo Adicionar campos (opcional):
    • Os nomes de campo só podem começar com caracteres alfabéticos (A-Z e a-z).
    • Os nomes de campo podem incluir apenas caracteres alfanuméricos e espaços.
    • O nome do campo não pode terminar com um espaço.
  5. Reconhecimento de caracteres ópticos: Selecione o mecanismo OCR necessário.
  6. Opcional: Desmarque a caixa de seleção Meus documentos PDF não têm imagens. Para saber mais, consulte Desative a opção PDFBox
    Quando esta caixa de seleção está selecionada, o IQ Bot usa PDFBox OCR para processar documentos PDF; documentos não PDF são processados pelo OCR selecionado na etapa anterior.
  7. Detecção automática de caixa de seleção: Selecione a caixa de seleção Detectar caixas de seleção para ativar este recurso.
    A seleção desta opção permite que o IQ Bot detecte automaticamente as caixas de seleção em um documento. No entanto, isso pode aumentar o tempo de processamento de documentos.
  8. Clique na opção Criar instância e analisar para criar a instância de aprendizado.
    O sistema analisará e classificará os documentos de treinamento em grupos lógicos, com base na identificação do campo e exibirá os detalhes na guia Instância de aprendizado > Resumo.
Quando uma nova instância de aprendizado é criada, os documentos de amostra carregados são analisados e classificados em grupos com base nas características do documento. Para saber mais, consulte Sobre o classificador.

Próximas etapas

Após o Classificador terminar de classificar os documentos, você será redirecionado para o Designer, onde treinará bots para extrair dados de cada documento de amostra. Treinar uma instância de aprendizado.