Lista IQ Bot de idiomas suportados
Acesse 190 idiomas no IQ Bot.
Acesse a lista de idiomas no IQ Bot, onde você observará o seguinte:
- Alguns idiomas são listados várias vezes como variantes, por exemplo, norueguês, norueguês (bokmal), norueguês (nynorsk).
- Idiomas escritos da direita para a esquerda, e não da esquerda para a direita, não são compatíveis com IQ Bot. Por exemplo, árabe, aramaico, azeri, divehi, fula, hebraico, curdo, N'ko, persa, rohingya, siríaco e urdu.
- Para idiomas que não estão na UI IQ Bot por padrão:
- Eles dependem do ABBYY FineReader Engine 12.2 para segmentação de texto e OCR, e então no IQ Bot para classificação, extração e autocorreção.
- Entre em contato com o representante de Serviços cognitivos ou Engenharia de vendas para criar domínios personalizados IQ Bot para acessar esses idiomas.
- No banco de dados SQL e arquivo json, IQ Bot exige que códigos de idioma para 160 dos idiomas adicionais sejam exibidos na UI e códigos de cultura para permitir validação numérica e de data.
Note:
- Para ABBYY FineReader Engine e Microsoft Azure Computer Vision OCR engine, o IQ Bot usa sua segmentação de texto + OCR.
- Para Microsoft Azure Computer Vision OCR engine, o usuário pode selecionar qualquer idioma no menu suspenso do IQ Bot, mas a API busca detectar automaticamente o idioma durante o processamento e substituir a seleção do usuário.
A tabela a seguir fornece links para idiomas compatíveis com todos os mecanismos IQ Bot compatíveis com OCR, exceto Tesseract4 OCR:
Mecanismos IQ Bot compatíveis com OCR | Lista de idiomas suportados |
---|---|
Tesseract4 OCR | Consulte a tabela abaixo para obter uma lista de idiomas suportados. |
ABBYY FineReader Engine | https://abbyy.technology/en:products:fre:win:v12:languages |
Microsoft Azure Computer Vision OCR engine | https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/language-support |
Google Vision API | https://cloud.google.com/vision/docs/languages |
Tegaki API |
|
Idioma de reconhecimento de caracteres ópticos (OCR) | Tesseract4 | No outro domínio da UI do IQ Bot por padrão |
---|---|---|
Inglês | X | X |
Abkhaz | ||
Adyghe | ||
Africâner | X | X |
Agul | ||
Albanês | ||
Altaico | ||
Armênio (Leste) | ||
Armênio (Grabar) | ||
Armênio (Ocidental) | ||
Avar | ||
Aymara | ||
Bashkir | ||
Basco | ||
Bielorrusso | ||
Bemba | ||
Blackfoot | ||
Bretão | ||
Bugotu | ||
Búlgaro | X | X |
Birmanês (visualização técnica) | ||
Buriata | ||
Catalão | X | X |
Chamorro | ||
Checheno | ||
Chinês (Simplificado) | X | X |
Chinês (Tradicional) | X | X |
Chukcha | ||
Tchuvache | ||
Corso | ||
Tártaro da Crimeia | ||
Croata | ||
Crow | ||
Tcheco | X | X |
Dinamarquês | X | X |
Dargwa | ||
Dungano | ||
Holandês | ||
Holandês (Países Baixos) | ||
Holandês (Bélgica) ou Flamenco | X | X |
Esquimó (cirílico) | ||
Esquimó (latino) | ||
Esperanto | ||
Estoniano | ||
Even | ||
Evenki | ||
Feroês | ||
Fijiano | ||
Finlandês | ||
Francês | X | X |
Frísio | ||
Friuliano | ||
Gaélico escocês | ||
Gagauz | ||
Galego | ||
Ganda | ||
Alemão | X | X |
Alemão (nova ortografia) | ||
Alemão (Luxemburgo) | ||
Grego | X | X |
Guarani | ||
Hani | ||
Hausa | ||
Havaiano | ||
Húngaro | X | X |
Islandês | ||
Ido | ||
Indonésio | X | X |
Interlíngua | ||
Irlandês | ||
Italiano | X | X |
Japonês | X | X |
Cabardiana | ||
Calmuco | ||
Carachaio-bálcaro | ||
Caracalpaque | ||
Cassúbio | ||
Kawa | ||
Cazaque | ||
Cacassiano | ||
Khanty (ostíaco) | ||
Quicuia | ||
Quirguiz | ||
Congolês | ||
Coreano | X | X |
Coreano (Hangul) | ||
Koriaque | ||
Kpelle | ||
Cumique | ||
Lak | ||
Sámi (lapão) | ||
Latim | X | X |
Letão | ||
Letão escrito em script gótico | ||
Lezgui | ||
Lituana | ||
Luba | ||
Macedônio | ||
Malgaxe | ||
Malaio | X | X |
Maninka | ||
Maltês | ||
Mansi | ||
Maori | ||
Mari | ||
Maia | ||
Miao | ||
Minangkabau | ||
Russo e inglês | ||
Mohawk | ||
Mongol | ||
Mordoviano | ||
Nahuatl | ||
Nenets | ||
Nivkhe | ||
Nogai | ||
Norueguês (Nynorsk) e Norueguês (Bokmal) | ||
Norueguês | X | X |
Norueguês (Bokmal) | ||
Norueguês (Nynorsk) | ||
Nianja | ||
Occidental | ||
Ojíbua | ||
Inglês antigo | ||
Francês antigo | ||
Alemão antigo | ||
Italiano antigo | ||
Antigo eslavônico | ||
Espanhol antigo | ||
Osseto | ||
Papiamento | ||
Tok Pisin | ||
Polonês | X | X |
Português | X | X |
Português (Brasil) | ||
Português (Portugal) | ||
Provençal | ||
Quíchua | ||
Reto-românico | ||
Romeno | X | X |
Romeno (Moldávia) | ||
Romani | ||
Ruanda | ||
Rundi | ||
Russo (ortografia antiga) | ||
Russo | X | X |
Russo (com acentos marcando a sílaba forte) | ||
Samoano | ||
Selkup | ||
Sérvio | X | X |
Sérvio (cirílico) | ||
Sérvio (latino) | ||
Shona | ||
Sioux (Dakota) | ||
Eslovaco | X | X |
Esloveno | ||
Somali | ||
Sorábio | ||
Sesoto | ||
Espanhol | X | X |
Sundanês | ||
Suaíli | ||
Suázi | ||
Sueco | X | X |
Tabassarã | ||
Tagalo | ||
Taitiano | ||
Tajique | ||
Tártaro | ||
Tailandês | ||
Jingpo | ||
Tonganês | ||
Tsuana | ||
Tun | ||
Turco | X | X |
Turcomeno | ||
Turcomeno (Latino) | ||
Tuviniano | ||
Udmurte | ||
Uigur (cirílico) | ||
Uigur (latino) | ||
Ucraniano | ||
Uzbeque (cirílico) | ||
Uzbeque (latino) | ||
Vietnamita | ||
Cebuano | ||
Galês | ||
Wolof | ||
Xhosa | ||
Iacuto | ||
Iídiche | ||
Zapoteca | ||
Zulu |
Tip: Se você não conseguir ver todos os idiomas na IQ Bot interface do usuário ou se o IQ Bot não conseguir extrair dados de vários idiomas em um documento, solucione o problema:
Unable to extract data from Multiple languages in a document (A-People login required)