Idiomas compatíveis no Automation 360 IQ Bot
- Última atualização2022/12/02
Até 31 idiomas são compatíveis no IQ Bot. Você também pode acessar até 190 idiomas no IQ Bot usando um mecanismo OCR.
Quando você revisa a lista de idiomas no IQ Bot, você observará o seguinte:
- Alguns idiomas são listados várias vezes como variantes, por exemplo, norueguês, norueguês (bokmal), norueguês (nynorsk).
- Entre os idiomas que são escritos da direita para a esquerda, apenas o árabe é atualmente suportado no IQ Bot.
- Para idiomas que não estão na IU do IQ Bot por padrão:
- Eles dependem do Mecanismo ABBYY FineReader 12.2 para segmentação de texto e OCR, e então no IQ Bot para classificação, extração e autocorreção.
- Entre em contato com o representante de Serviços cognitivos ou Engenharia de vendas para criar domínios personalizados IQ Bot para acessar esses idiomas.
- No banco de dados SQL e arquivo .json, IQ Bot exige que códigos de idioma para 160 dos idiomas adicionais sejam exibidos na IU e códigos de cultura para permitir validação numérica e de data.
Nota:
- Para Mecanismo ABBYY FineReader e Mecanismo de OCR Microsoft Azure Computer Vision, o IQ Bot usa sua segmentação de texto + OCR.
- Para Mecanismo de OCR Microsoft Azure Computer Vision, o usuário pode selecionar qualquer idioma no menu suspenso do IQ Bot, mas a API busca detectar automaticamente o idioma durante o processamento e substituir a seleção do usuário.
A tabela a seguir fornece uma lista dos idiomas suportados no IQ Bot para vários tipos de documentos:
Idioma | Tipos de documentos tais como fatura, contratos, seguro saúde, pedido de compra etc. | Tipo de documento - Outros |
---|---|---|
Inglês | X | X |
Alemão | X | X |
Francês | X | X |
Espanhol | X | X |
Italiano | X | X |
Africâner | X | |
Árabe | X | |
Búlgaro | X | |
Catalão | X | |
Chinês (simplificado) | X | |
Chinês (tradicional) | X | |
Tcheco | X | |
Dinamarquês | X | |
Holandês | X | |
Flamengo | X | |
Grego | X | |
Húngaro | X | |
Indonésio | X | |
Japonês | X | |
Coreano | X | |
Latim | X | |
Malaio | X | |
Norueguês | X | |
Polonês | X | |
Português | X | |
Romeno | X | |
Russo | X | |
Sérvio (latino) | X | |
Eslovaco | X | |
Sueco | X | |
Turco | X |
A tabela a seguir lista os idiomas que são suportados no IQ Bot através de um domínio personalizado:
Abkhaz | Galego | Mari | Sioux (Dakota) |
Adyghe | Ganda | Maia | Esloveno |
Agul | Alemão | Miao | Somali |
Albanês | Alemão (nova ortografia) | Minangkabau | Sorábio |
Armênio (Leste) | Alemão (Luxemburgo) | Russo e inglês | Sesoto |
Armênio (Grabar) | Guarani | Mohawk | Sundanês |
Armênio (Ocidental) | Hani | Mongol | Suaíli |
Avar | Hausa | Mordoviano | Suázi |
Aymara | Havaiano | Nahuatl | Tabassarã |
Bashkir | Islandês | Nenets | Tagalo |
Basco | Ido | Nivkhe | Taitiano |
Bielorrusso | Interlíngua | Nogai | Tajique |
Bemba | Irlandês | Norueguês (nynorsk) e norueguês (bokmal) | Tártaro |
Blackfoot | Cabardiana | Norueguês (bokmal) | Tailandês |
Bretão | Calmuco | Norueguês (nynorsk) | Jingpo |
Bugotu | Carachaio-bálcaro | Nianja | Tonganês |
Birmanês | Caracalpaque | Occidental | Tsuana |
Buriata | Cassúbio | Ojíbua | Tun |
Chamorro | Kawa | Inglês antigo | Turcomeno |
Checheno | Cazaque | Francês antigo | Turcomeno (Latino) |
Chukcha | Cacassiano | Alemão antigo | Tuviniano |
Tchuvache | Khanty (ostíaco) | Italiano antigo | Udmurte |
Corso | Quicuia | Antigo eslavônico | Uigur (cirílico) |
Tártaro da Crimeia | Quirguiz | Espanhol antigo | Uigur (latino) |
Croata | Congolês | Osseto | Ucraniano |
Crow | Coreano (Hangul) | Papiamento | Uzbeque (cirílico) |
Dargwa | Koriaque | Tok Pisin | Uzbeque (latino) |
Dungano | Kpelle | Português (Brasil) | Vietnamita |
Holandês (Países Baixos) | Cumique | Português (Portugal) | Cebuano |
Esquimó (cirílico) | Lak | Provençal | Galês |
Esquimó (latino) | Sámi (lapão) | Quíchua | Wolof |
Esperanto | Letão | Reto-românico | Xhosa |
Estoniano | Letão (idioma escrito em script gótico) | Romeno (Moldávia) | Iacuto |
Even | Lezgui | Romani | Iídiche |
Evenki | Lituana | Ruanda | Zapoteca |
Feroês | Luba | Rundi | Zulu |
Fijiano | Macedônio | Russo (ortografia antiga) | |
Finlandês | Malgaxe | Russo (com acentos marcando a sílaba forte) | |
Frísio | Maninka | Samoano | |
Friuliano | Maltês | Selkup | |
Gaélico escocês | Mansi | Sérvio (cirílico) | |
Gagauz | Maori | Shona |
A tabela a seguir fornece links para idiomas compatíveis para todos os mecanismos IQ Bot compatíveis com OCR:
Mecanismos IQ Bot compatíveis com OCR | Lista de idiomas suportados |
---|---|
Mecanismo ABBYY FineReader | ABBYY FineReader Engine OCR supported languages |
Mecanismo de OCR Microsoft Azure Computer Vision | https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/language-support |
Google Vision API | https://cloud.google.com/vision/docs/languages |
Tesseract4 OCR 4.0.0 | https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html |
Tegaki API |
|
Nota: Os idiomas suportados no IQ Bot devem ser considerados em conformidade com os idiomas suportados pelo OCR.
Dica: Se você não conseguir ver todos os idiomas na interface do usuário do IQ Bot ou se o IQ Bot não conseguir extrair dados de vários idiomas em um documento, solucione o problema:
Unable to extract data from Multiple languages in a document (A-People login required)
Nota: Se estiver adicionando um idioma personalizado a um domínio personalizado, então você deve manter o ID do idioma em todas as instalações de onde as instâncias de aprendizagem do IQ Bot serão exportadas e importadas.