Como usar a action Extrair texto
Use a action Extrair texto para extrair o texto de um arquivo PDF e salvá-lo como arquivo de texto.
Procedimento
Para extrair texto de um arquivo PDF, siga essas etapas:
- Na paleta Actions, clique duas vezes sobre ou arraste a action Extrair imagem do package PDF.
-
No Caminho do PDF, selecione uma das seguintes opções para especificar a localização do PDF:
- Arquivo da Control Room: Permite selecionar um arquivo PDF disponível em uma pasta na Control Room.
- Perfil da Área de trabalho: Permite selecionar um arquivo PDF disponível em seu dispositivo.
- Variável: Permite especificar a variável do arquivo que contém a localização do arquivo PDF.
- Opcional:
No campo Senha do usuário ou Senha do proprietário, digite uma senha para restringir o acesso ao arquivo PDF criptografado.
- Senha de usuário: Permitir que os usuários executem operações específicas no arquivo PDF criptografado.
- Senha de proprietário: Permitir que os usuários usem uma senha para abrir o arquivo.
-
No campo Tipo de texto selecione uma das seguintes opções:
- Texto sem formatação: Permite extrair o texto e copiá-lo para um arquivo de texto.
É semelhante à cópia e à colagem de texto de um arquivo PDF para um arquivo de texto.
- Texto estruturado: Permite preservar a formatação original do texto extraído do arquivo PDF.
- Texto sem formatação: Permite extrair o texto e copiá-lo para um arquivo de texto.
-
No campo Intervalo de páginas, selecione uma das seguintes opções:
- Todas as páginas: Permite salvar todas as páginas no arquivo PDF como imagem.
- Páginas: Permite inserir os números das páginas que você deseja salvar como imagem.
-
No campo Exportar dados para arquivo de texto, especifique um nome e local para o arquivo de texto.
Nota: Inclua a extensão .txt no nome do arquivo de texto. Por exemplo, se o nome do arquivo for Relatório_trimestre_junho, a extensão.txt é Relatório_trimestre_junho.txt.
-
Marque a caixa de seleção Substituir arquivos com o mesmo nome para substituir arquivos existentes com o mesmo nome.
Nota: Se essa opção não for selecionada e o bot encontrar um arquivo com o mesmo nome no local especificado, o bot falhará.
- Opcional:
Na lista Atribuir propriedades de PDF a uma variável de dicionário, selecione uma variável de dicionário para manter as propriedades do arquivo.
Para obter mais informações, consulte Como usar uma variável do dicionário para propriedades de PDF.
- Clique em Aplicar.
- Clique em Save (Salvar)