Criar uma instância de aprendizado no Community Edition

Crie uma instância de aprendizado para iniciar o processamento de documentos. No Community Edition, você pode extrair dados de tipos de documentos e idiomas compatíveis utilizando o provedor de OCR ABBYY.

Procedimento

  1. Na página inicial da Control Room, navegue até IA > Document Automation e clique em Criar instância de aprendizagem.
  2. Informe um nome e uma descrição para a instância de aprendizado.
    Automação de documentos não permite a duplicação de nomes de instâncias de aprendizado, portanto, o nome que você fornece deve ser único.
  3. Selecione um tipo de documento apropriado.
    Nota: Use o tipo de documentos Definidos pelo usuário para processar documentos que são visualmente semelhantes a faturas, como pedidos de compra e de venda, que contêm pares de chave-valor e uma estrutura de tabela. Neste tipo de documento, você cria e configura todos os campos do formulário e da tabela.
  4. Selecione o idioma.
  5. Opcional: Você pode usar a opção Melhorar a precisão usando a validação para enviar feedback ao sistema para melhorar os resultados da extração. Para obter mais informações, consulte Melhoria da precisão da extração por meio da validação.
  6. Opcional: Selecione a opção Extração de dados orientada por IA generativa para usar as capacidades de extração do IA generativa. Para obter mais informações, consulte Automação de documentos – extração de dados usando IA generativa.

    Os provedores de IA generativa oferecem as seguintes vantagens:

    • Processamento eficiente de documentos grandes e não estruturados
    • Pode manipular documentos em inglês e outros idiomas
    Selecione um dos seguintes provedores de IA generativa:
    Nota:
    • Ao atualizar de uma versão anterior para a v.38 ou mais recente, o Open AI será definido como o provedor de extração de dados padrão.
    • Se você processou documentos usando OpenAI e depois mudou para Anthropic para a extração de dados, apenas os documentos que serão processados após a mudança para o Anthropic usarão o Anthropic para extração de dados. Para os documentos processados antes, os dados extraídos usariam Azure OpenAI.
    • Open AI: o modelo Azure OpenAI é usado para extração de dados. Esse provedor está disponível via licença integrada (não requer licenças adicionais) e BYOL (Traga sua própria licença).

      Se você estiver usando BYOL, certifique-se de definir as configurações adicionais para OpenAI no bot de extração para usar este provedor. Consulte ação Extrair dados.

    • Anthropic: Agora você pode usar os modelos Anthropic IA generativa disponíveis no AWS e no GCP para extração de dados no Automação de documentos. Esta oferta permite selecionar do modelo de IA generativa dependendo do provedor de Nuvem que sua empresa certificou.

      Se estiver usando BYOL, você deve configurar o modelo Anthropic Claude no serviço Google Vertex AI ou Amazon Bedrock e, em seguida, definir as configurações adicionais no bot de extração para usar esse provedor. Consulte ação Extrair dados.

  7. Clique em Avançar.

Recomendamos que você abra uma amostra de documento lado a lado com a janela de Control Room à medida que você configura os campos do formulário e da tabela.

Nota:
  • Um campo do formulário é um tipo de campo que ocorre apenas uma vez em um documento.
  • Um campo de tabela é um tipo de campo que ocorre novamente ao longo de um documento, normalmente na forma de uma tabela.

  1. Configure os campos do formulário e da tabela para extração. Para mais detalhes, consulte Exibir e pesquisar campos.
    1. Clique em um campo para abrir o editor de campos. Para obter mais detalhes, consulte Diretrizes para editar os campos e criar pseudônimos personalizados.
    2. Passe o mouse sobre o ícone do menu à direita de um campo para acessar as setas para cima/para baixo.
    3. Use as setas para reorganizar a ordem dos campos para uma validação manual mais eficiente.
      A ordem dos campos não afeta a extração.
    Para saber mais sobre os outros atributos de campo, consulte Considerações para os campos de formulário e tabela.
  2. Clique em Adicionar um campo e especifique os detalhes do campo, como nome do campo, rótulo do campo, confiança, tipo de dados, formato de data/número e assim por diante. Para mais detalhes, consulte Considerações para os campos de formulário e tabela.
    Nota: Se você selecionou a opção Extração de dados baseada em IA generativa, recomendamos que você adicione bons prompts para os campos a fim de obter os resultados esperados ao criar as instâncias de aprendizado. Consulte Automação de documentos – extração de dados usando IA generativa.
    A imagem a seguir mostra campos de formulário e tabela configurados em uma instância de aprendizado:
    Campos de formulário de uma instância de aprendizado

    Campos de tabela de uma instância de aprendizado e adição de tabela personalizada no nível da instância de aprendizado
    Nota: A opção Adicionar um campo não está disponível para o tipo de documento Recibos.
  3. Clique em Create (Criar).

Próximas etapas

Carregue documentos para a instância de aprendizado, corrija erros de validação e verifique os dados extraídos: Processar documentos no Community Edition