Criar instância de aprendizado
- Última atualização2024/07/31
Criar instância de aprendizado
Crie uma instância de aprendizado e faça upload de exemplos de documentos para treinamento. Nesta etapa, você define os elementos de dados para um único tipo de documento, como uma fatura ou um pedido de compra, e os campos que você deseja extrair.
Pré-requisitos
- Cada documento é um arquivo separado. Por exemplo, se você baixou um e-mail e seus anexos em um único PDF, você deve separar o corpo do e-mail dos anexos. Consulte Como usar a ação Dividir documento.
- Os documentos estão em um dos seguintes tipos de arquivo compatíveis:
- JPG
- JPEG
- PNG
- TIFF
- Use documentos com um valor de resolução de pelo menos 300 pontos por polegada (dpi).
- Na preparação, você pode fazer upload de um máximo de 150 documentos com tamanho de arquivo de 10 MB por instância de aprendizado.
- Na produção, você pode fazer upload de no máximo 50 MB de tamanho de arquivo por documento. Entretanto, o número máximo de documentos permitidos por instância de aprendizado depende da licença.
- Não há limitações quanto ao número de páginas por documento em um OCR em formato pdf.
- Você pode fazer upload de 60 páginas por documento em um OCR baseado em imagem.
- Você pode carregar até um tamanho de arquivo de 12 MB. Você pode fazer upload de documentos adicionais após criar a instância de aprendizado.
- Os nomes dos arquivos dos documentos que você faz upload não devem começar com caracteres especiais, tais como o hífen (-).
- Se o texto que você deseja extrair começar com qualquer um dos seguintes caracteres especiais: ‘# : , \ ` '', os caracteres especiais são ignorados pelo IQ Bot ao capturar o texto.
- Com o Tesseract4 OCR, atualmente existe uma limitação conhecida que restringe o número de páginas por documento a menos de 60 páginas.
- A computação confidencial do Azure permite às organizações carregar dados criptografados para armazenamento seguro, tais como pastas privadas em uma máquina virtual. Se você carregar documentos de tais pastas seguras para IQ Bot, eles serão movidos para o status Não classificado, pois a extração de dados não é compatível para esses documentos.
Ao começar com uma coleção de documentos para inserir em um processo digital, você provavelmente terá uma mistura de tipos, formatos e orientações de documentos. Uma fatura, por exemplo, possui um conjunto consistente de elementos de dados, enquanto que um pedido de compra contém um conjunto diferente de elementos de dados. Você deve criar uma instância de aprendizado diferente para cada um desses tipos de documento, usando as seguintes etapas:
Procedimento
Próximas etapas
Após o Classificador terminar de classificar os documentos, você será redirecionado para o Designer, onde treinará bots para extrair dados de cada documento de amostra. Treinar uma instância de aprendizado.