Idiomas compatíveis no Automation 360 IQ Bot
- Última atualização2022/12/02
Idiomas compatíveis no Automation 360 IQ Bot
Até 31 idiomas são compatíveis no IQ Bot. Você também pode acessar até 190 idiomas no IQ Bot usando um mecanismo OCR.
Quando você revisa a lista de idiomas no IQ Bot, você observará o seguinte:
- Alguns idiomas são listados várias vezes como variantes, por exemplo, norueguês, norueguês (bokmal), norueguês (nynorsk).
- Entre os idiomas que são escritos da direita para a esquerda, apenas o árabe é atualmente suportado no IQ Bot.
- Para idiomas que não estão na IU do IQ Bot por padrão:
- Eles dependem do Mecanismo ABBYY FineReader 12.2 para segmentação de texto e OCR, e então no IQ Bot para classificação, extração e autocorreção.
- Entre em contato com o representante de Serviços cognitivos ou Engenharia de vendas para criar domínios personalizados IQ Bot para acessar esses idiomas.
- No banco de dados SQL e arquivo .json, IQ Bot exige que códigos de idioma para 160 dos idiomas adicionais sejam exibidos na IU e códigos de cultura para permitir validação numérica e de data.
Nota:
- Para Mecanismo ABBYY FineReader e Mecanismo de OCR Microsoft Azure Computer Vision, o IQ Bot usa sua segmentação de texto + OCR.
- Para Mecanismo de OCR Microsoft Azure Computer Vision, o usuário pode selecionar qualquer idioma no menu suspenso do IQ Bot, mas a API busca detectar automaticamente o idioma durante o processamento e substituir a seleção do usuário.
A tabela a seguir fornece uma lista dos idiomas suportados no IQ Bot para vários tipos de documentos:
Idioma | Tipos de documentos tais como fatura, contratos, seguro saúde, pedido de compra etc. | Tipo de documento - Outros |
---|---|---|
Inglês | X | X |
Alemão | X | X |
Francês | X | X |
Espanhol | X | X |
Italiano | X | X |
Africâner | X | |
Árabe | X | |
Búlgaro | X | |
Catalão | X | |
Chinês (simplificado) | X | |
Chinês (tradicional) | X | |
Tcheco | X | |
Dinamarquês | X | |
Holandês | X | |
Flamengo | X | |
Grego | X | |
Húngaro | X | |
Indonésio | X | |
Japonês | X | |
Coreano | X | |
Latim | X | |
Malaio | X | |
Norueguês | X | |
Polonês | X | |
Português | X | |
Romeno | X | |
Russo | X | |
Sérvio (latino) | X | |
Eslovaco | X | |
Sueco | X | |
Turco | X |
A tabela a seguir lista os idiomas que são suportados no IQ Bot através de um domínio personalizado:
Abkhaz | Galego | Mari | Sioux (Dakota) |
Adyghe | Ganda | Maia | Esloveno |
Agul | Alemão | Miao | Somali |
Albanês | Alemão (nova ortografia) | Minangkabau | Sorábio |
Armênio (Leste) | Alemão (Luxemburgo) | Russo e inglês | Sesoto |
Armênio (Grabar) | Guarani | Mohawk | Sundanês |
Armênio (Ocidental) | Hani | Mongol | Suaíli |
Avar | Hausa | Mordoviano | Suázi |
Aymara | Havaiano | Nahuatl | Tabassarã |
Bashkir | Islandês | Nenets | Tagalo |
Basco | Ido | Nivkhe | Taitiano |
Bielorrusso | Interlíngua | Nogai | Tajique |
Bemba | Irlandês | Norueguês (nynorsk) e norueguês (bokmal) | Tártaro |
Blackfoot | Cabardiana | Norueguês (bokmal) | Tailandês |
Bretão | Calmuco | Norueguês (nynorsk) | Jingpo |
Bugotu | Carachaio-bálcaro | Nianja | Tonganês |
Birmanês | Caracalpaque | Occidental | Tsuana |
Buriata | Cassúbio | Ojíbua | Tun |
Chamorro | Kawa | Inglês antigo | Turcomeno |
Checheno | Cazaque | Francês antigo | Turcomeno (Latino) |
Chukcha | Cacassiano | Alemão antigo | Tuviniano |
Tchuvache | Khanty (ostíaco) | Italiano antigo | Udmurte |
Corso | Quicuia | Antigo eslavônico | Uigur (cirílico) |
Tártaro da Crimeia | Quirguiz | Espanhol antigo | Uigur (latino) |
Croata | Congolês | Osseto | Ucraniano |
Crow | Coreano (Hangul) | Papiamento | Uzbeque (cirílico) |
Dargwa | Koriaque | Tok Pisin | Uzbeque (latino) |
Dungano | Kpelle | Português (Brasil) | Vietnamita |
Holandês (Países Baixos) | Cumique | Português (Portugal) | Cebuano |
Esquimó (cirílico) | Lak | Provençal | Galês |
Esquimó (latino) | Sámi (lapão) | Quíchua | Wolof |
Esperanto | Letão | Reto-românico | Xhosa |
Estoniano | Letão (idioma escrito em script gótico) | Romeno (Moldávia) | Iacuto |
Even | Lezgui | Romani | Iídiche |
Evenki | Lituana | Ruanda | Zapoteca |
Feroês | Luba | Rundi | Zulu |
Fijiano | Macedônio | Russo (ortografia antiga) | |
Finlandês | Malgaxe | Russo (com acentos marcando a sílaba forte) | |
Frísio | Maninka | Samoano | |
Friuliano | Maltês | Selkup | |
Gaélico escocês | Mansi | Sérvio (cirílico) | |
Gagauz | Maori | Shona |
A tabela a seguir fornece links para idiomas compatíveis para todos os mecanismos IQ Bot compatíveis com OCR:
Mecanismos IQ Bot compatíveis com OCR | Lista de idiomas suportados |
---|---|
Mecanismo ABBYY FineReader | ABBYY FineReader Engine OCR supported languages |
Mecanismo de OCR Microsoft Azure Computer Vision | https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/language-support |
Google Vision API | https://cloud.google.com/vision/docs/languages |
Tesseract4 OCR 4.0.0 | https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html |
Tegaki API |
|
Nota: Os idiomas suportados no IQ Bot devem ser considerados em conformidade com os idiomas suportados pelo OCR.
Dica: Se você não conseguir ver todos os idiomas na interface do usuário do IQ Bot ou se o IQ Bot não conseguir extrair dados de vários idiomas em um documento, solucione o problema:
Unable to extract data from Multiple languages in a document (A-People login required)
Nota: Se estiver adicionando um idioma personalizado a um domínio personalizado, então você deve manter o ID do idioma em todas as instalações de onde as instâncias de aprendizagem do IQ Bot serão exportadas e importadas.