Langues prises en charge dans Automation 360 IQ Bot

IQ Bot prend en charge jusqu'à 31 langues. Vous pouvez également accéder à 190 langues dans IQ Bot à l'aide d'un moteur Reconnaissance de texte.

Lorsque vous examinez la liste de des langues dans IQ Bot, vous pouvez observez ce qui suit :
  • Certaines langues sont répertoriées plusieurs fois en tant que variantes, par exemple norvégien, norvégien (Bokmal), norvégien (Nynorsk).
  • Parmi les langues qui s'écrivent de droite à gauche, seul l'arabe est actuellement pris en charge dans IQ Bot.
  • Pour les langues ne figurant pas dans l'interface utilisateur IQ Bot par défaut :
    • Celles-ci s'appuient sur le moteur Moteur FineReader ABBYY 12.2 pour la segmentation de texte et la reconnaissance de texte, puis sur IQ Bot pour le classement, l'extraction et la correction automatique.
    • Contactez votre représentant Services cognitifs ou technico-commercial pour créer des domaines personnalisés IQ Bot afin d'accéder à ces langues.
    • Dans la base de données SQL et le fichier .json, IQ Bot nécessite des codes de langue pour 160 des langues supplémentaires qui vont apparaître dans l'interface utilisateur, ainsi que les codes de culture pour permettre la validation numérique et la validation de la date.
Remarque :
  • Pour Moteur FineReader ABBYY et Moteur OCR Computer Vision de Microsoft Azure, IQ Bot utilise sa segmentation de texte + Reconnaissance de texte.
  • Pour l'API Moteur OCR Computer Vision de Microsoft Azure, l'utilisateur peut sélectionner une langue à partir du menu déroulant deIQ Bot, mais l'API essaiera de détecter automatiquement la langue pendant le traitement et de remplacer celle sélectionnée par l'utilisateur si celles-ci diffèrent.

Le tableau suivant fournit une liste des langues prises en charge dans IQ Bot pour différents types de documents :

Langue Types de documents tels que factures, contrats, assurance maladie, bons de commande, etc. Type de document - Autre
Anglais X X
Allemand X X
Français X X
Espagnol X X
Italien X X
Afrikaans X
Arabe X
Bulgare X
Catalan X
Chinois (simplifié) X
Chinois (traditionnel) X
République tchèque X
Danois X
Néerlandais X
Flamand X
Grec X
Hongrois X
Indonésien X
Japonais X
Coréen X
Latin X
Malais X
Norvégien X
Polonais X
Portugais X
Roumain X
Russe X
Serbe (latin) X
Slovaque X
Suédois X
Turc X

Le tableau suivant répertorie les langues qui sont prises en charge dans IQ Bot par le biais d'un domaine personnalisé :

Abkhaze Galicien Mari Sioux (Dakota)
Adyghé Ganda Maya Slovène
Agul Allemand Miao Somali
Albanais Allemand (nouvelle orthographe) Minangkabau Sorabe
Arménien (oriental) Allemand (Luxembourg) Russe et anglais Sotho
Arménien (Grabar) Guarani Mohawk Sundanais
Arménien (occidental) Hani Mongol Swahili
Avar Haoussa Mordve Swati
Aymara Hawaïen Nahuatl Tabassaran
Bachkir Islandais Nénètse Tagalog
Basque Ido Nivkhe Tahitien
Biélorusse Interlingua Nogaï Tadjik
Bemba Irlandais Norvégien Nynorsk et Norvégien Bokmal Tatar
Pied noir Kabarde Norvégien (Bokmal) Thaïlandais
Breton Kalmouk Norvégien (Nynorsk) Jinghpo
Bugotu Karatchaï balkar Chewa Tongien
Birman Karakalpak Occidental Tswana
Bouriate Cachoube Ojibwé Tunica
Chamorro Kawa Ancien anglais Turkmène
Tchétchène Kazakh Ancien français Turkmène (latin)
Tchouktche Khakasse Ancien allemand Touvain
Tchouvache Khanty Ancien italien Oudmourte
Corse Kikuyu Ancien slave Ouïghour (cyrillique)
Tatar de Crimée Kirghize Ancien espagnol Ouïghour (latin)
Croate Kikongo Ossète Ukrainien
Crow Coréen (Hangul) Papiamento Ouzbek (cyrillique)
Dargwa Koriak Tok Pisin Ouzbek (latin)
Doungane Kpèllé Portugais (Brésil) Vietnamien
Néerlandais (Pays-Bas) Koumyk Portugais (Portugal) Cebuano
Esquimau (cyrillique) Lak Provençal Gallois
Esquimau (latin) Sami (lapon) Quechua Wolof
Espéranto Letton Rhéto-roman Xhosa
Estonien Letton (langue écrite en écriture gothique) Roumain (Moldavie) Iakoute
Évène Lezghien Romani Yiddish
Evenki Lituanien Kinyarwanda Zapotèque
Féroïen Luba Kirundi Zoulou
Fidjien Macédonien Russe (ancienne orthographe)
Finnois Malgache Russe (avec accents)
Frison Malinké Samoan
Frioulan Maltais Selkoupe
Gaélique écossais Mansi Serbe (cyrillique)
Gagaouze Maori Shona

Le tableau suivant vous fournit des liens vers les langues prises en charge pour tous les moteurs Reconnaissance de texte pris en charge par IQ Bot :

moteurs IQ Bot pris en charge Reconnaissance de texte Liste des langues prises en charge par
Moteur FineReader ABBYY ABBYY FineReader Engine OCR supported languages
Moteur OCR Computer Vision de Microsoft Azure https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/language-support
API Google Vision https://cloud.google.com/vision/docs/languages
Tesseract4 OCR 4.0.0 https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html
API Tegaki
  • Japonais
  • Coréen
  • Japonais - Anglais
  • Coréen - Anglais
Remarque : Les langues prises en charge dans IQ Bot doivent être considérées en même temps que les langues prises en charge dans Reconnaissance de texte.
Conseil : Si vous ne parvenez pas à voir toutes les langues dans l’interface utilisateur IQ Bot ou si IQ Bot ne parvient pas à extraire des données de plusieurs langues dans un document, résolvez le problème :
Unable to extract data from Multiple languages in a document (A-People login required)
Remarque : Si vous ajoutez une langue personnalisée à un domaine personnalisé, vous devez alors conserver l'ID de la langue dans toutes les installations à partir desquelles les instances d'apprentissage IQ Bot seront exportées et importées.