Visão geral da extração de documentos

O processo de extração de documentos permite que você defina campos específicos de formulários e tabelas que deseja extrair dos seus documentos.

O sistema extrai automaticamente os dados especificados desses documentos para análise posterior e integração em fluxos de trabalho posteriores. Esse processo aumenta a eficiência, a precisão e a produtividade geral no processamento de dados.

Quando um usuário cria uma nova instância de aprendizado, a Control Room cria automaticamente uma pasta com o mesmo nome da instância de aprendizado na pasta Automação > Área de trabalho para documentos. Dentro dessa pasta, a Control Room cria os dois seguintes bots:

  • Bot de extração: Extrai dados de campos definidos em documentos carregados.
  • Fazer o download do bot: Faz o download dos dados extraídos para uma pasta específica no dispositivo ou rede compartilhada dependendo da opção de resultados de saída configurada em Download do bot.

O pacote de extração de documentos é usado para extrair dados e fazer o download dos dados extraídos de documentos para um local específico.

O pacote de extração de documentos oferece os seguintes recursos:

  • Diversos tipos de documentos: Processe uma diversos tipos de documentos para vários casos de uso de processamento de documentos. Você pode integrar os analisadores de extração de dados personalizados para aproveitar os modelos pré-treinados e específicos de domínio para os fluxos de trabalho de processamento de documentos.
  • Regras de validação: Defina várias condições, como correspondência de padrões ou verificações de igualdade. Quando essas condições são atendidas, você pode rapidamente tomar medidas para sinalizar erros ou advertências, limpar ou substituir valores ou definir novos valores. Essas regras garantem a precisão dos dados extraídos em vários campos dos documentos.
  • Provedores de IA generativa: Extraia dados de diferentes tipos de documentos usando modelos pré-treinados de provedores de IA generativa, como Azure OpenAI ou Anthropic. Os usuários podem definir consultas de pesquisa ao configurar os campos uma vez e, então, para cada documento processado, os dados são extraídos sem nenhuma outra configuração.
  • Feedback de validação: Dê feedback sobre a precisão dos dados extraídos verificando-os e corrigindo-os. Esse processo cria um loop de feedback que ajuda o sistema a melhorar continuamente a precisão dos dados ao longo do tempo.
  • Validador de Automation Co-Pilot: Apresenta uma interface fácil de usar para realçar erros ou advertências em documentos. O validador exibe um contorno vermelho para campos que precisam de validação. Os usuários podem validar os dados desses campos e enviar os documentos para reprocessamento.
  • Integração com o Automation 360: Integre perfeitamente os dados extraídos em vários fluxos de trabalho para processamento posterior no Automation 360.