Liste des langues prises en charge par IQ Bot

Accédez à 190 langues à partir de IQ Bot.

Accédez à la liste des langues dans IQ Bot, où vous observerez ce qui suit :
  • Certaines langues sont répertoriées plusieurs fois en tant que variantes, par exemple norvégien, norvégien (Bokmal), norvégien (Nynorsk).
  • Les langues écrites de droite à gauche plutôt que de gauche à droite ne sont pas prises en charge dans IQ Bot. Par exemple, l'arabe, l'araméen, l'azéri, le divehi, le fula, l'hébreu, le kurde, le n'ko, le persan, le rohingya, le syriaque et l'urdu.
  • Pour les langues ne figurant pas dans l'interface utilisateur IQ Bot par défaut :
    • celles-ci s'appuient sur le moteur ABBYY FineReader Engine 12.2 pour la segmentation de texte et la reconnaissance optique des caractères, puis sur IQ Bot pour le classement, l'extraction et la correction automatique.
    • Contactez votre représentant Services cognitifs ou technico-commercial pour créer des domaines IQ Bot personnalisés afin d'accéder à ces langues.
    • Dans la base de données SQL et le fichier .json, IQ Bot nécessite des codes de langue pour 160 des langues supplémentaires qui vont apparaître dans l'interface utilisateur, ainsi que les codes de culture pour permettre la validation numérique et la validation de la date.
Note:
  • Pour ABBYY FineReader Engine et Microsoft Azure Computer Vision OCR engine, IQ Bot utilise sa segmentation de texte + OCR.
  • Pour l'API Microsoft Azure Computer Vision OCR engine, l'utilisateur peut sélectionner une langue à partir du menu déroulant deIQ Bot, mais l'API essaiera de détecter automatiquement la langue pendant le traitement et de remplacer celle sélectionnée par l'utilisateur si celles-ci diffèrent.
Le tableau suivant vous fournit des liens vers les langues prises en charge pour tous les IQ Bot moteurs OCR pris en charge, à l’exception de Tesseract4 OCR :
moteurs IQ Bot pris en charge OCR Liste des langues prises en charge par
Tesseract4 OCR Voir le tableau ci-dessous pour la liste des langues prises en charge.
ABBYY FineReader Engine https://abbyy.technology/en:products:fre:win:v12:languages
Microsoft Azure Computer Vision OCR engine https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/language-support
Google Vision API https://cloud.google.com/vision/docs/languages
Tegaki API
  • Japonais
  • Coréen
  • Japonais - Anglais
  • Coréen - Anglais
Langue de la reconnaissance optique Tesseract4 Dans l'interface utilisateur de IQ Bot : autre domaine par défaut
Anglais X X
Abkhaze
Adyghé
Afrikaans X X
Agul
Albanais
Altaïque
Arménien (oriental)
Arménien (Grabar)
Arménien (occidental)
Avar
Aymara
Bachkir
Basque
Biélorusse
Bemba
Pied noir
Breton
Bugotu
Bulgare X X
Birman (version préliminaire technique)
Bouriate
Catalan X X
Chamorro
Tchétchène
Chinois (simplifié) X X
Chinois (traditionnel) X X
Tchouktche
Tchouvache
Corse
Tatar de Crimée
Croate
Crow
Tchèque X X
Danois X X
Dargwa
Doungane
Néerlandais
Néerlandais (Pays-Bas)
Néerlandais (Belgique) ou flamand X X
Esquimau (cyrillique)
Esquimau (latin)
Espéranto
Estonien
Évène
Evenki
Féroïen
Fidjien
Finnois
Français X X
Frison
Frioulan
Gaélique écossais
Gagaouze
Galicien
Ganda
Allemand X X
Allemand (nouvelle orthographe)
Allemand (Luxembourg)
Grec X X
Guarani
Hani
Haoussa
Hawaïen
Hongrois X X
Islandais
Ido
Indonésien X X
Interlingua
Irlandais
Italien X X
Japonais X X
Kabarde
Kalmouk
Karatchaï balkar
Karakalpak
Cachoube
Kawa
Kazakh
Khakasse
Khanty
Kikuyu
Kirghize
Kikongo
Coréen X X
Coréen (Hangul)
Koriak
Kpèllé
Koumyk
Lak
Sami (lapon)
Latin X X
Letton
Langue lettone écrite en écriture gothique
Lezghien
Lituanien
Luba
Macédonien
Malgache
Malais X X
Malinké
Maltais
Mansi
Maori
Mari
Maya
Miao
Minangkabau
Russe et anglais
Mohawk
Mongol
Mordve
Nahuatl
Nénètse
Nivkhe
Nogaï
Norvégien Nynorsk et Norvégien Bokmal
Norvégien X X
Norvégien (Bokmal)
Norvégien (Nynorsk)
Chewa
Occidental
Ojibwé
Ancien anglais
Ancien français
Ancien allemand
Ancien italien
Ancien slave
Ancien espagnol
Ossète
Papiamento
Tok Pisin
Polonais X X
Portugais X X
Portugais (Brésil)
Portugais (Portugal)
Provençal
Quechua
Rhéto-roman
Roumain X X
Roumain (Moldavie)
Romani
Kinyarwanda
Kirundi
Russe (ancienne orthographe)
Russe X X
Russe (avec accents)
Samoan
Selkoupe
Serbe X X
Serbe (cyrillique)
Serbe (latin)
Shona
Sioux (Dakota)
Slovaque X X
Slovène
Somali
Sorabe
Sotho
Espagnol X X
Sundanais
Swahili
Swati
Suédois X X
Tabassaran
Tagalog
Tahitien
Tadjik
Tatar
Thaïlandais
Jinghpo
Tongien
Tswana
Tunica
Turc X X
Turkmène
Turkmène (latin)
Touvain
Oudmourte
Ouïghour (cyrillique)
Ouïghour (latin)
Ukrainien
Ouzbek (cyrillique)
Ouzbek (latin)
Vietnamien
Cebuano
Gallois
Wolof
Xhosa
Iakoute
Yiddish
Zapotèque
Zoulou
Tip: Si vous ne parvenez pas à voir toutes les langues dans l’interface utilisateur IQ Bot ou si IQ Bot ne parvient pas à extraire des données de plusieurs langues dans un document, résolvez le problème :

Unable to extract data from Multiple languages in a document (A-People login required)