Criar uma instância de aprendizado no Community Edition

Crie uma instância de aprendizado para iniciar o processamento de documentos. No Community Edition, você pode extrair dados de tipos de documentos e idiomas compatíveis utilizando o provedor de OCR ABBYY.

Procedimento

  1. From the Control Room home page, navigate to IA > Document Automation , and click Create Learning Instance.
  2. Enter a name and description for the learning instance.
    Document Automation does not allow duplicate learning instance names, so the name you provide must be unique.
  3. Selecione um tipo de documento apropriado.
    Nota: Use o tipo de documentos Definidos pelo usuário para processar documentos que são visualmente semelhantes a faturas, como pedidos de compra e de venda, que contêm pares de chave-valor e uma estrutura de tabela. Neste tipo de documento, você cria e configura todos os campos do formulário e da tabela.
  4. Selecione o idioma.
  5. Opcional: Você pode usar a opção Melhorar a precisão usando a validação para enviar feedback ao sistema para melhorar os resultados da extração. Para obter mais informações, consulte Melhoria da precisão da extração por meio da validação.
  6. Opcional: Selecione a opção Extração de dados orientada por IA generativa para usar as capacidades de extração do IA generativa. Para obter mais informações, consulte Document Automation – extração de dados usando IA generativa.

    Os provedores de IA generativa oferecem as seguintes vantagens:

    • Processamento eficiente de documentos grandes e não estruturados
    • Pode manipular documentos em inglês e outros idiomas
    Selecione um dos seguintes provedores de IA generativa:
    Nota:
    • Ao atualizar de uma versão anterior para a v.38 ou mais recente, o Open AI será definido como o provedor de extração de dados padrão.
    • Se você processou documentos usando OpenAI e depois mudou para Anthropic para a extração de dados, apenas os documentos que serão processados após a mudança para o Anthropic usarão o Anthropic para extração de dados. Para os documentos processados antes, os dados extraídos usariam Azure OpenAI.
    • Open AI: o modelo Azure OpenAI é usado para extração de dados. Esse provedor está disponível via licença integrada (não requer licenças adicionais) e BYOL (Traga sua própria licença).

      Se você estiver usando BYOL, certifique-se de definir as configurações adicionais para OpenAI no bot de extração para usar este provedor. Consulte ação Extrair dados.

    • Anthropic: Agora você pode usar os modelos Anthropic IA generativa disponíveis no AWS e no GCP para extração de dados no Document Automation. Esta oferta permite selecionar do modelo de IA generativa dependendo do provedor de Nuvem que sua empresa certificou.

      Se estiver usando BYOL, você deve configurar o modelo Anthropic Claude no serviço Google Vertex AI ou Amazon Bedrock e, em seguida, definir as configurações adicionais no bot de extração para usar esse provedor. Consulte ação Extrair dados.

  7. Click Next.

We recommend that you open a sample document side by side with the Control Room window as you configure the form and table fields.

Nota:
  • A form field is a type of field that occurs only one time in a document.
  • A table field is a type of field that reoccurs throughout a document, typically in the form of a table.

  1. Configure the form and table fields for extraction. For more details, see Exibir e pesquisar campos.
    1. Click a field to open the fields editor. For more details, see .Diretrizes para editar os campos e criar pseudônimos personalizados
    2. Hover over the menu icon to the right of a field to access the up/down arrows.
    3. Use the arrows to rearrange the order of the fields for a more efficient manual validation.
      The order of the fields does not impact extraction.
    To learn more about the other field attributes, see Considerações para os campos de formulário e tabela.
  2. Click Add a field and specify the fields details such as field name, fields label, confidence, data type, format date/number, and so on. For more details, see Considerações para os campos de formulário e tabela.
    Nota: If you have selected the Generative AI-driven data extraction option, we recommend that you add good prompts for fields to get the expected results when you create the learning instances. See Document Automation – extração de dados usando IA generativa.
    The following image shows form and table fields configured in a learning instance:
    Form fields of a learning instance

    Table fields of a learning instance and adding custom table at learning instance level
    Nota: The Add a field option is not available for Receipts document type.
  3. Click Create.

Próximas etapas

Carregue documentos para a instância de aprendizado, corrija erros de validação e verifique os dados extraídos: Processar documentos no Community Edition