Créer une instance d'apprentissage
- Dernière mise à jour2024/07/31
Créer une instance d'apprentissage
Créez une instance d'apprentissage et chargez les exemples de documents d'entraînement. Dans cette étape, vous définissez les éléments de données pour un seul type de document, tel qu'une facture ou un bon de commande, et les champs que vous souhaitez extraire.
Prérequis
- Chaque document est un fichier distinct. Par exemple, si vous avez téléchargé un e-mail et ses pièces jointes dans un seul PDF, vous devez séparer le corps de l'e-mail des pièces jointes. Reportez-vous à la rubrique Utilisation de l'action Diviser le document.
- Les documents sont dans l'un des types de fichiers pris en charge suivants :
- JPG
- JPEG
- PNG
- TIFF
- Utilisez des documents avec une résolution d'au moins 300 points par pouce (ppp).
- Lors de la préproduction, vous pouvez charger un maximum de 150 documents de 10 Mo par instance d'apprentissage.
- Lors de la production, vous pouvez charger des documents de 50 Mo maximum. Cependant, le nombre maximum de documents autorisés par instance d'apprentissage dépend de la licence.
- Il n'y a pas de limitation du nombre de pages par document dans un moteur de reconnaissance de texte pdfbox.
- Vous pouvez charger 60 pages par document dans un moteur de reconnaissance de texte basé sur l'image.
- Vous pouvez charger un fichier d'une taille maximale de 12 Mo. Vous pouvez charger d'autres documents après la création de l'instance d'apprentissage.
- Les noms de fichiers des documents que vous chargez ne doivent pas commencer par des caractères spéciaux, tels que le trait d'union (-).
- Si le texte à extraire commence par l'un des caractères spéciaux suivants : ‘# : , \ ` '', ces caractères spéciaux sont ignorés par IQ Bot lors de la capture du texte.
- Avec Tesseract4 OCR, une limite restreint le nombre de pages par document à moins de 60.
- L'informatique confidentielle Azure permet aux entreprises de charger des données chiffrées vers un stockage sécurisé, tel que des dossiers privés sur une machine virtuelle. Si vous chargez des documents à partir de ces dossiers sécurisés vers IQ Bot, ils sont définis sur l'état Non classés, car l'extraction de données n'est pas prise en charge pour ces documents.
Lorsque vous commencez avec une collection de documents à insérer dans un processus numérique, vous aurez probablement un mélange de types de documents, de formats et d'orientations. Par exemple, une facture comporte un ensemble cohérent d'éléments de données, alors qu'un bon de commande contient un ensemble différent d'éléments de données. Vous devez créer une instance d'apprentissage différente pour chacun de ces types de documents, en suivant les étapes suivantes :
Procédure
Étapes suivantes
Une fois que le classificateur a terminé de trier les documents, vous êtes redirigé vers le Designer où vous entraînez des robots à extraire des données de chaque exemple de document. Entraîner une instance d'apprentissage.