Langues prises en charge dans Automation 360 IQ Bot
- Dernière mise à jour2022/12/02
Langues prises en charge dans Automation 360 IQ Bot
IQ Bot prend en charge jusqu'à 31 langues. Vous pouvez également accéder à 190 langues dans IQ Bot à l'aide d'un moteur Reconnaissance de texte.
Lorsque vous examinez la liste de des langues dans IQ Bot, vous pouvez observez ce qui suit :
- Certaines langues sont répertoriées plusieurs fois en tant que variantes, par exemple norvégien, norvégien (Bokmal), norvégien (Nynorsk).
- Parmi les langues qui s'écrivent de droite à gauche, seul l'arabe est actuellement pris en charge dans IQ Bot.
- Pour les langues ne figurant pas dans l'interface utilisateur IQ Bot par défaut :
- Celles-ci s'appuient sur le moteur Moteur FineReader ABBYY 12.2 pour la segmentation de texte et la reconnaissance de texte, puis sur IQ Bot pour le classement, l'extraction et la correction automatique.
- Contactez votre représentant Services cognitifs ou technico-commercial pour créer des domaines personnalisés IQ Bot afin d'accéder à ces langues.
- Dans la base de données SQL et le fichier .json, IQ Bot nécessite des codes de langue pour 160 des langues supplémentaires qui vont apparaître dans l'interface utilisateur, ainsi que les codes de culture pour permettre la validation numérique et la validation de la date.
Remarque :
- Pour Moteur FineReader ABBYY et Moteur OCR Computer Vision de Microsoft Azure, IQ Bot utilise sa segmentation de texte + Reconnaissance de texte.
- Pour l'API Moteur OCR Computer Vision de Microsoft Azure, l'utilisateur peut sélectionner une langue à partir du menu déroulant deIQ Bot, mais l'API essaiera de détecter automatiquement la langue pendant le traitement et de remplacer celle sélectionnée par l'utilisateur si celles-ci diffèrent.
Le tableau suivant fournit une liste des langues prises en charge dans IQ Bot pour différents types de documents :
Langue | Types de documents tels que factures, contrats, assurance maladie, bons de commande, etc. | Type de document - Autre |
---|---|---|
Anglais | X | X |
Allemand | X | X |
Français | X | X |
Espagnol | X | X |
Italien | X | X |
Afrikaans | X | |
Arabe | X | |
Bulgare | X | |
Catalan | X | |
Chinois (simplifié) | X | |
Chinois (traditionnel) | X | |
République tchèque | X | |
Danois | X | |
Néerlandais | X | |
Flamand | X | |
Grec | X | |
Hongrois | X | |
Indonésien | X | |
Japonais | X | |
Coréen | X | |
Latin | X | |
Malais | X | |
Norvégien | X | |
Polonais | X | |
Portugais | X | |
Roumain | X | |
Russe | X | |
Serbe (latin) | X | |
Slovaque | X | |
Suédois | X | |
Turc | X |
Le tableau suivant répertorie les langues qui sont prises en charge dans IQ Bot par le biais d'un domaine personnalisé :
Abkhaze | Galicien | Mari | Sioux (Dakota) |
Adyghé | Ganda | Maya | Slovène |
Agul | Allemand | Miao | Somali |
Albanais | Allemand (nouvelle orthographe) | Minangkabau | Sorabe |
Arménien (oriental) | Allemand (Luxembourg) | Russe et anglais | Sotho |
Arménien (Grabar) | Guarani | Mohawk | Sundanais |
Arménien (occidental) | Hani | Mongol | Swahili |
Avar | Haoussa | Mordve | Swati |
Aymara | Hawaïen | Nahuatl | Tabassaran |
Bachkir | Islandais | Nénètse | Tagalog |
Basque | Ido | Nivkhe | Tahitien |
Biélorusse | Interlingua | Nogaï | Tadjik |
Bemba | Irlandais | Norvégien Nynorsk et Norvégien Bokmal | Tatar |
Pied noir | Kabarde | Norvégien (Bokmal) | Thaïlandais |
Breton | Kalmouk | Norvégien (Nynorsk) | Jinghpo |
Bugotu | Karatchaï balkar | Chewa | Tongien |
Birman | Karakalpak | Occidental | Tswana |
Bouriate | Cachoube | Ojibwé | Tunica |
Chamorro | Kawa | Ancien anglais | Turkmène |
Tchétchène | Kazakh | Ancien français | Turkmène (latin) |
Tchouktche | Khakasse | Ancien allemand | Touvain |
Tchouvache | Khanty | Ancien italien | Oudmourte |
Corse | Kikuyu | Ancien slave | Ouïghour (cyrillique) |
Tatar de Crimée | Kirghize | Ancien espagnol | Ouïghour (latin) |
Croate | Kikongo | Ossète | Ukrainien |
Crow | Coréen (Hangul) | Papiamento | Ouzbek (cyrillique) |
Dargwa | Koriak | Tok Pisin | Ouzbek (latin) |
Doungane | Kpèllé | Portugais (Brésil) | Vietnamien |
Néerlandais (Pays-Bas) | Koumyk | Portugais (Portugal) | Cebuano |
Esquimau (cyrillique) | Lak | Provençal | Gallois |
Esquimau (latin) | Sami (lapon) | Quechua | Wolof |
Espéranto | Letton | Rhéto-roman | Xhosa |
Estonien | Letton (langue écrite en écriture gothique) | Roumain (Moldavie) | Iakoute |
Évène | Lezghien | Romani | Yiddish |
Evenki | Lituanien | Kinyarwanda | Zapotèque |
Féroïen | Luba | Kirundi | Zoulou |
Fidjien | Macédonien | Russe (ancienne orthographe) | |
Finnois | Malgache | Russe (avec accents) | |
Frison | Malinké | Samoan | |
Frioulan | Maltais | Selkoupe | |
Gaélique écossais | Mansi | Serbe (cyrillique) | |
Gagaouze | Maori | Shona |
Le tableau suivant vous fournit des liens vers les langues prises en charge pour tous les moteurs Reconnaissance de texte pris en charge par IQ Bot :
moteurs IQ Bot pris en charge Reconnaissance de texte | Liste des langues prises en charge par |
---|---|
Moteur FineReader ABBYY | ABBYY FineReader Engine OCR supported languages |
Moteur OCR Computer Vision de Microsoft Azure | https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/language-support |
API Google Vision | https://cloud.google.com/vision/docs/languages |
Tesseract4 OCR 4.0.0 | https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html |
API Tegaki |
|
Remarque : Les langues prises en charge dans IQ Bot doivent être considérées en même temps que les langues prises en charge dans Reconnaissance de texte.
Conseil : Si vous ne parvenez pas à voir toutes les langues dans l’interface utilisateur IQ Bot ou si IQ Bot ne parvient pas à extraire des données de plusieurs langues dans un document, résolvez le problème :
Unable to extract data from Multiple languages in a document (A-People login required)
Remarque : Si vous ajoutez une langue personnalisée à un domaine personnalisé, vous devez alors conserver l'ID de la langue dans toutes les installations à partir desquelles les instances d'apprentissage IQ Bot seront exportées et importées.