Criar uma instância de aprendizado no Document Automation

Baixar como PDF

Última atualização2025/08/22

Criar uma instância de aprendizado no Document Automation

Comece a processar documentos, criando uma instância de aprendizado para extrair dados de vários tipos de documentos compatíveis. Uma instância de aprendizado é uma estrutura que contém informações, tais como tipo de documento, idioma, campos a serem extraídos e assim por diante.

Pré-requisitos

Para criar uma instância de aprendizado, você deve ser um usuário Learning instance creator. Consulte Document Automation usuários.
Para tipos de documentos compatíveis com OCR, o OCR padrão é Mecanismo ABBYY FineReader.Alternativamente, você pode criar uma instância de aprendizado para processar documentos usando o Google Vision OCR.
Para o tipo de documento Formulários padrão, certifique-se de ter criado um modelo de extração personalizado. Consulte Crie um modelo de extração personalizado usando o Formulários padrão.

Assista a este vídeo para o processo completo de ponta a ponta de criação de uma instância de aprendizado:

Procedimento

Na página inicial da Control Room, navegue até IA > Document Automation e clique em Criar instância de aprendizagem.
Informe um nome e uma descrição para a instância de aprendizado.
Document Automation não permite a duplicação de nomes de instâncias de aprendizado, portanto, o nome que você fornece deve ser único.
Selecione um tipo de documento apropriado.

Nota: Use o tipo de documentos Definidos pelo usuário para processar documentos que são visualmente semelhantes a faturas, como pedidos de compra e de venda, que contêm pares de chave-valor e uma estrutura de tabela. Neste tipo de documento, você cria e configura todos os campos do formulário e da tabela.
Selecione o idioma.
Para obter detalhes sobre os idiomas compatíveis com o Document Automation, consulte Idiomas compatíveis no Document Automation.
Se você selecionar um tipo de documento usado durante a configuração do analisador na etapa 3, o idioma será escolhido automaticamente. Além disso, a lista de localizações exibe opções de idioma com base no idioma selecionado automaticamente.
Selecione um provedor.
Se você selecionou o idioma inglês na etapa 4, Automation Anywhere (Pré-treinado) é selecionado de modo automático.
Se você selecionar um tipo de documento usado ao configurar o analisador na etapa 3, o analisador configurado (de terceiros) será escolhido automaticamente como provedor.
Opcional: Selecione um fornecedor de OCR.
Você pode selecionar entre as seguintes opções:
- ABBYY
- Google Vision
- Digital PDF Extractor.
  
  Nota: Use a opção Digital PDF Extractor apenas para extrair dados de PDFs digitais e não de documentos digitalizados ou imagens.
Por padrão, o Document Automation processa documentos usando Mecanismo ABBYY FineReader.

Os usuários com uma Control Room na Nuvem podem selecionar para processar documentos usando o Google Vision OCR ou o Digital PDF Extractor.
Opcional: Você pode usar a opção Melhorar a precisão usando a validação para enviar feedback ao sistema para melhorar os resultados da extração. Para obter mais informações, consulte Melhoria da precisão da extração por meio da validação.
Nota:
- A opção Melhorar a precisão usando validação está disponível apenas para tipos de documentos selecionados.
- A opção Melhorar a precisão usando validação usará os prompts do usuário fornecidos no recurso Consulta de pesquisa para modelo de IA generativa para melhorar a extração de dados. Consulte Document Automation – extração de dados usando IA generativa.
Opcional: Selecione a opção Extração de dados orientada por IA generativa para usar as capacidades de extração do IA generativa. Para obter mais informações, consulte Document Automation – extração de dados usando IA generativa.
Selecione um dos seguintes provedores de IA generativa:
Nota:
- Para usar a opção de extração de dados impulsionada por IA generativa, certifique-se de que está usando o pacote Extração de documentos versão 3.31.16 ou mais recente. Consulte Atualizações do Extração de documentos pacote.
- A opção Extração de dados baseada em IA generativa está disponível apenas para tipos de documentos selecionados. Para alguns tipos de documentos, a opção Extração de dados baseada em IA generativa está habilitada por padrão e não pode ser desabilitada. Você só pode escolher o provedor de IA generativa para esses tipos de documentos.
- Ao atualizar de uma versão anterior para v.33 ou mais recente, o Open AI será definido como o provedor de extração de dados padrão.
- Se você selecionou o provedor do Anthropic para uma instância de aprendizagem e definiu de maneira incorreta as configurações do Anthropic ou selecionou um provedor diferente no bot de extração correspondente, será exibido um erro ao processar documentos.
- Se você processou documentos usando OpenAI e depois mudou para Anthropic para a extração de dados, apenas os documentos que serão processados após a mudança para o Anthropic usarão o Anthropic para extração de dados. Para os documentos processados antes, os dados extraídos usariam OpenAI.
- Open AI: OpenAI fornece acesso aos poderosos modelos de linguagem da Open AI para geração de conteúdo, resumo, compreensão de imagens, pesquisa semântica e linguagem natural para tradução de código. Esse provedor está disponível via licença integrada (não requer licenças adicionais) e BYOL (Traga sua própria licença). Se você estiver usando BYOL, certifique-se de definir as configurações adicionais para OpenAI no bot de extração para usar este provedor. Consulte ação Extrair dados.
- Anthropic: Agora você pode usar os modelos Anthropic IA generativa disponíveis no AWS e no GCP para extração de dados no Document Automation. Esta oferta permite selecionar do modelo de IA generativa dependendo do provedor de Nuvem que sua empresa certificou.
  O Anthropic oferece as seguintes vantagens:
  - Processamento eficiente de documentos grandes e não estruturados
  - Pode manipular documentos em inglês e outros idiomas
  - Processa documentos com muito mais rapidez e melhor precisão na extração de dados
  Se estiver usando BYOL, você deve configurar o modelo Anthropic Claude no serviço Google Vertex AI ou Amazon Bedrock e, em seguida, definir as configurações adicionais no bot de extração para usar esse provedor. Consulte ação Extrair dados.
Clique em Avançar.

Recomendamos que você abra uma amostra de documento lado a lado com a janela de Control Room à medida que você configura os campos do formulário e da tabela.

Nota:

Um campo do formulário é um tipo de campo que ocorre apenas uma vez em um documento.
Um campo de tabela é um tipo de campo que ocorre novamente ao longo de um documento, normalmente na forma de uma tabela.

Configure os campos do formulário e da tabela para extração. Para mais detalhes, consulte Exibir e pesquisar campos.
1. Clique em um campo para abrir o editor de campos. Para obter mais detalhes, consulte Diretrizes para editar os campos e criar pseudônimos personalizados.
2. Passe o mouse sobre o ícone do menu à direita de um campo para acessar as setas para cima/para baixo.
3. Use as setas para reorganizar a ordem dos campos para uma validação manual mais eficiente.
  A ordem dos campos não afeta a extração.
Para saber mais sobre os outros atributos de campo, consulte Considerações para os campos de formulário e tabela.
Clique em Adicionar um campo e especifique os detalhes do campo, como nome do campo, rótulo do campo, confiança, tipo de dados, formato de data/número e assim por diante. Para mais detalhes, consulte Considerações para os campos de formulário e tabela.

Nota: Se você selecionou a opção Extração de dados baseada em IA generativa, recomendamos que você adicione bons prompts para os campos a fim de obter os resultados esperados ao criar as instâncias de aprendizado. Consulte Document Automation – extração de dados usando IA generativa.
A imagem a seguir mostra campos de formulário e tabela configurados em uma instância de aprendizado:

Nota: A opção Adicionar um campo não está disponível para o tipo de documento Recibos.
Opcional: Na guia Campos da tabela, clique no ícone + para adicionar uma tabela personalizada no nível da instância de aprendizagem.
1. Insira um nome para a tabela.
2. Opcional: Digite um prompt para descrever os detalhes da tabela no documento do qual você deseja extrair dados. Por exemplo, se um documento contiver várias tabelas com cabeçalhos idênticos, mas títulos diferentes, você poderá especificar o título exato da tabela no prompt para garantir que os dados sejam extraídos da tabela correta.
  Para atualizar um prompt de tabela, clique no ícone Editar tabela (), atualize o prompt e clique em Atualizar.
3. Clique em Adicionar.
4. Clique em Adicionar um campo e especifique os detalhes do campo, como nome do campo, rótulo do campo, confiança, tipo de dados, formato de data/número e assim por diante. Para mais detalhes, consulte Considerações para os campos de formulário e tabela.
  
  Nota: Você também pode adicionar e excluir a tabela personalizada ao editar uma instância de aprendizagem.
A tabela personalizada é exibida na lista suspensa de tabela.

Você também pode visualizar os campos de tabelas personalizadas e padrão na guia Regras do documento, mas não pode selecionar campos em tabelas distintas. Para obter mais detalhes sobre o suporte a múltiplas tabelas, consulte Diretrizes para criar ou editar a tabela múltipla personalizada em uma instância de aprendizado.
Clique em Create (Criar).

Quando uma nova instância de aprendizado é criada, a Control Room cria uma pasta com o mesmo nome da instância de aprendizado na pasta Automação > Documentar processos do espaço de trabalho. A pasta contém duas bots (extração e descarregamento), um processo e um formulário. Para mais detalhes, consulte Arquivo de saída de Bots e estrutura de pastas.

Próximas etapas

Carregue documentos para a instância de aprendizado, corrija erros de validação e verifique os dados extraídos: Processar documentos no Document Automation