Liste des langues prises en charge par IQ Bot
- Mis à jour : 2019/10/30
Liste des langues prises en charge par IQ Bot
Accédez à 190 langues à partir de IQ Bot.
Accédez à la liste des langues dans IQ Bot, où vous observerez ce qui suit :
- Certaines langues sont répertoriées plusieurs fois en tant que variantes, par exemple norvégien, norvégien (Bokmal), norvégien (Nynorsk).
- Les langues écrites de droite à gauche plutôt que de gauche à droite ne sont pas prises en charge dans IQ Bot. Par exemple, l'arabe, l'araméen, l'azéri, le divehi, le fula, l'hébreu, le kurde, le n'ko, le persan, le rohingya, le syriaque et l'urdu.
- Pour les langues ne figurant pas dans l'interface utilisateur IQ Bot par défaut :
- celles-ci s'appuient sur le moteur ABBYY FineReader Engine 12.2 pour la segmentation de texte et la reconnaissance optique des caractères, puis sur IQ Bot pour le classement, l'extraction et la correction automatique.
- Contactez votre représentant Services cognitifs ou technico-commercial pour créer des domaines IQ Bot personnalisés afin d'accéder à ces langues.
- Dans la base de données SQL et le fichier .json, IQ Bot nécessite des codes de langue pour 160 des langues supplémentaires qui vont apparaître dans l'interface utilisateur, ainsi que les codes de culture pour permettre la validation numérique et la validation de la date.
Note:
- Pour ABBYY FineReader Engine et Microsoft Azure Computer Vision OCR engine, IQ Bot utilise sa segmentation de texte + OCR.
- Pour l'API Microsoft Azure Computer Vision OCR engine, l'utilisateur peut sélectionner une langue à partir du menu déroulant deIQ Bot, mais l'API essaiera de détecter automatiquement la langue pendant le traitement et de remplacer celle sélectionnée par l'utilisateur si celles-ci diffèrent.
Le tableau suivant vous fournit des liens vers les langues prises en charge pour tous les IQ Bot moteurs OCR pris en charge, à l’exception de Tesseract4 OCR :
moteurs IQ Bot pris en charge OCR | Liste des langues prises en charge par |
---|---|
Tesseract4 OCR | Voir le tableau ci-dessous pour la liste des langues prises en charge. |
ABBYY FineReader Engine | https://abbyy.technology/en:products:fre:win:v12:languages |
Microsoft Azure Computer Vision OCR engine | https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/language-support |
Google Vision API | https://cloud.google.com/vision/docs/languages |
Tegaki API |
|
Langue de la reconnaissance optique | Tesseract4 | Dans l'interface utilisateur de IQ Bot : autre domaine par défaut |
---|---|---|
Anglais | X | X |
Abkhaze | ||
Adyghé | ||
Afrikaans | X | X |
Agul | ||
Albanais | ||
Altaïque | ||
Arménien (oriental) | ||
Arménien (Grabar) | ||
Arménien (occidental) | ||
Avar | ||
Aymara | ||
Bachkir | ||
Basque | ||
Biélorusse | ||
Bemba | ||
Pied noir | ||
Breton | ||
Bugotu | ||
Bulgare | X | X |
Birman (version préliminaire technique) | ||
Bouriate | ||
Catalan | X | X |
Chamorro | ||
Tchétchène | ||
Chinois (simplifié) | X | X |
Chinois (traditionnel) | X | X |
Tchouktche | ||
Tchouvache | ||
Corse | ||
Tatar de Crimée | ||
Croate | ||
Crow | ||
Tchèque | X | X |
Danois | X | X |
Dargwa | ||
Doungane | ||
Néerlandais | ||
Néerlandais (Pays-Bas) | ||
Néerlandais (Belgique) ou flamand | X | X |
Esquimau (cyrillique) | ||
Esquimau (latin) | ||
Espéranto | ||
Estonien | ||
Évène | ||
Evenki | ||
Féroïen | ||
Fidjien | ||
Finnois | ||
Français | X | X |
Frison | ||
Frioulan | ||
Gaélique écossais | ||
Gagaouze | ||
Galicien | ||
Ganda | ||
Allemand | X | X |
Allemand (nouvelle orthographe) | ||
Allemand (Luxembourg) | ||
Grec | X | X |
Guarani | ||
Hani | ||
Haoussa | ||
Hawaïen | ||
Hongrois | X | X |
Islandais | ||
Ido | ||
Indonésien | X | X |
Interlingua | ||
Irlandais | ||
Italien | X | X |
Japonais | X | X |
Kabarde | ||
Kalmouk | ||
Karatchaï balkar | ||
Karakalpak | ||
Cachoube | ||
Kawa | ||
Kazakh | ||
Khakasse | ||
Khanty | ||
Kikuyu | ||
Kirghize | ||
Kikongo | ||
Coréen | X | X |
Coréen (Hangul) | ||
Koriak | ||
Kpèllé | ||
Koumyk | ||
Lak | ||
Sami (lapon) | ||
Latin | X | X |
Letton | ||
Langue lettone écrite en écriture gothique | ||
Lezghien | ||
Lituanien | ||
Luba | ||
Macédonien | ||
Malgache | ||
Malais | X | X |
Malinké | ||
Maltais | ||
Mansi | ||
Maori | ||
Mari | ||
Maya | ||
Miao | ||
Minangkabau | ||
Russe et anglais | ||
Mohawk | ||
Mongol | ||
Mordve | ||
Nahuatl | ||
Nénètse | ||
Nivkhe | ||
Nogaï | ||
Norvégien Nynorsk et Norvégien Bokmal | ||
Norvégien | X | X |
Norvégien (Bokmal) | ||
Norvégien (Nynorsk) | ||
Chewa | ||
Occidental | ||
Ojibwé | ||
Ancien anglais | ||
Ancien français | ||
Ancien allemand | ||
Ancien italien | ||
Ancien slave | ||
Ancien espagnol | ||
Ossète | ||
Papiamento | ||
Tok Pisin | ||
Polonais | X | X |
Portugais | X | X |
Portugais (Brésil) | ||
Portugais (Portugal) | ||
Provençal | ||
Quechua | ||
Rhéto-roman | ||
Roumain | X | X |
Roumain (Moldavie) | ||
Romani | ||
Kinyarwanda | ||
Kirundi | ||
Russe (ancienne orthographe) | ||
Russe | X | X |
Russe (avec accents) | ||
Samoan | ||
Selkoupe | ||
Serbe | X | X |
Serbe (cyrillique) | ||
Serbe (latin) | ||
Shona | ||
Sioux (Dakota) | ||
Slovaque | X | X |
Slovène | ||
Somali | ||
Sorabe | ||
Sotho | ||
Espagnol | X | X |
Sundanais | ||
Swahili | ||
Swati | ||
Suédois | X | X |
Tabassaran | ||
Tagalog | ||
Tahitien | ||
Tadjik | ||
Tatar | ||
Thaïlandais | ||
Jinghpo | ||
Tongien | ||
Tswana | ||
Tunica | ||
Turc | X | X |
Turkmène | ||
Turkmène (latin) | ||
Touvain | ||
Oudmourte | ||
Ouïghour (cyrillique) | ||
Ouïghour (latin) | ||
Ukrainien | ||
Ouzbek (cyrillique) | ||
Ouzbek (latin) | ||
Vietnamien | ||
Cebuano | ||
Gallois | ||
Wolof | ||
Xhosa | ||
Iakoute | ||
Yiddish | ||
Zapotèque | ||
Zoulou |
Tip: Si vous ne parvenez pas à voir toutes les langues dans l’interface utilisateur IQ Bot ou si IQ Bot ne parvient pas à extraire des données de plusieurs langues dans un document, résolvez le problème :
Unable to extract data from Multiple languages in a document (A-People login required)
Cette rubrique a-t-elle été utile ?