Unterstützte Sprachen in Automation 360 IQ Bot
- Zuletzt aktualisiert2022/12/02
Unterstützte Sprachen in Automation 360 IQ Bot
Bis zu 31 Sprachen werden in IQ Bot unterstützt. Über eine IQ Bot-Engine können Sie auch auf bis zu 190 Sprachen in OCR zugreifen.
Beim Anzeigen der Sprachen in IQ Bot können Sie Folgendes sehen:
- Einige Sprachen werden in mehreren Varianten aufgeführt, z. B. Norwegisch, Norwegisch (Bokmal) und Norwegisch (Nynorsk).
- Von den Sprachen, die von rechts nach links geschrieben werden, wird derzeit nur Arabisch von IQ Bot unterstützt.
- Sprachen, die nicht standardmäßig in der UI von IQ Bot verfügbar sind:
- Diese beruhen hinsichtlich der Textsegmentierung und OCR auf ABBYY FineReader Engine 12.2 und hinsichtlich der Klassifizierung, Extraktion sowie Autokorrektur auf IQ Bot.
- Wenden Sie sich an Ihren Vertreter von Cognitive Services oder Sales Engineering, um benutzerdefinierte IQ Bot-Domänen für den Zugriff auf diese Sprachen zu erstellen.
- In der SQL-Datenbank und der JSON-Datei erfordert IQ Bot Sprachcodes für 160 zusätzliche Sprachen, damit diese in der Nutzeroberfläche erscheinen, und Kulturcodes, um numerische und Datumsvalidierungen zu ermöglichen.
Anmerkung:
- Für ABBYY FineReader Engine und Microsoft Azure Computer Vision OCR Engine verwendet IQ Bot seine Textsegmentierung plus OCR.
- Bei Microsoft Azure Computer Vision OCR Engine kann der Nutzer eine beliebige Sprache aus der Dropdown-Liste von IQ Bot auswählen, aber die API versucht, die Sprache während der Verarbeitung automatisch zu erkennen und die Nutzerauswahl zu überschreiben.
Die folgende Tabelle enthält eine Liste der unterstützten Sprachen in IQ Bot für verschiedene Dokumenttypen:
Sprache | Dokumenttypen wie Rechnungen, Verträge, Krankenversicherungen, Bestellungen und so weiter | Dokumenttyp – Sonstiges |
---|---|---|
English | X | X |
Deutsch | X | X |
Französisch | X | X |
Spanisch | X | X |
Italienisch | X | X |
Afrikaans | X | |
Arabisch | X | |
Bulgarisch | X | |
Katalanisch | X | |
Chinesisch (vereinfacht) | X | |
Chinesisch (traditionell) | X | |
Tschechien | X | |
Dänisch | X | |
Niederländisch | X | |
Flämisch | X | |
Griechisch | X | |
Ungarisch | X | |
Indonesisch | X | |
Japanisch | X | |
Koreanisch | X | |
Latein | X | |
Malaiisch | X | |
Norwegisch | X | |
Polnisch | X | |
Portugiesisch | X | |
Rumänisch | X | |
Russisch | X | |
Serbisch (Lateinisch) | X | |
Slowakisch | X | |
Schwedisch | X | |
Türkisch | X |
In der folgenden Tabelle sind die Sprachen aufgeführt, die in IQ Bot über eine benutzerdefinierte Domäne unterstützt werden:
Abchasisch | Galizisch | Mari | Sioux (Dakota) |
Adyghe | Ganda | Maya | Slowenisch |
Aghulisch | Deutsch | Miao | Somali |
Albanisch | Deutsch (neue Rechtschreibung) | Minangkabau | Sorbisch |
Armenisch (Ost) | Deutsch (Luxemburg) | Russisch und Englisch | Sotho |
Armenisch (Grabar) | Guarani | Mohawk | Sunda |
Armenisch (West) | Hani | Mongolisch | Suaheli |
Awarisch | Hausa | Mordwinisch | Siswati |
Aymara | Hawaiisch | Nahuatl | Tabassaranisch |
Baschkirisch | Isländisch | Nenzisch | Tagalog |
Baskisch | Ido | Nivchisch | Tahitianisch |
Weißrussisch | Interlingua | Nogaisch | Tadschikisch |
Bemba | Irisch | Norwegisch (Nynorsk) und Norwegisch (Bokmal) | Tatarisch |
Blackfoot | Kabardinisch | Norwegisch (Bokmal) | Thailändisch |
Bretonisch | Kalmückisch | Norwegisch (Nynorsk) | Jingpo |
Bugotu | Karatschaiisch-Balkarisch | Nyanja | Tonganisch |
Birmanisch | Karakalpakisch | Occidental | Tswana |
Burjatisch | Kasubisch | Ojibway | Tun |
Chamorro | Kawa | Altenglisch | Turkmenisch |
Tschetschenisch | Kasachisch | Altfranzösisch | Turkmenisch (Lateinisch) |
Tschuktschisch | Chakassisch | Altdeutsch | Tuwinisch |
Tschuwaschisch | Chantisch | Altitalienisch | Udmurtisch |
Korsisch | Kikuyu | Altslawisch | Uigurisch (Kyrillisch) |
Krimtatarisch | Kirgisisch | Altspanisch | Uigurisch (Lateinisch) |
Kroatisch | Kongolesisch | Ossetisch | Ukrainisch |
Crow | Koreanisch (Hangul) | Papiamento | Usbekisch (Kyrillisch) |
Darginisch | Korjakisch | Tok Pisin | Usbekisch (Lateinisch) |
Dunganisch | Kpelle | Portugiesisch (Brasilien) | Vietnamesisch |
Niederländisch (Niederlande) | Kumykisch | Portugiesisch (Portugal) | Cebuano |
Eskimo (kyrillisch) | Lakisch | Provenzalisch | Walisisch |
Eskimo (lateinisch) | Samisch (Lappisch) | Quechua | Wolof |
Esperanto | Lettisch | Rätoromanisch | Xhosa |
Estnisch | Lettische Sprache (in gotischer Schrift geschrieben) | Rumänisch (Moldawien) | Jakutisch |
Ewenisch | Lesgisch | Romani | Jiddisch |
Ewenkisch | Litauisch | Ruandisch | Zapotekisch |
Färöisch | Luba | Rundi | Zulu |
Fidschi | Mazedonisch | Russisch (alte Rechtschreibung) | |
Finnisch | Madagassisch | Russisch (mit Akzenten zum Markieren der Betonungsposition) | |
Friesisch | Malinke | Samoanisch | |
Friaulisch | Maltesisch | Selkup | |
Schottisch Gälisch | Mansisch | Serbisch (Kyrillisch) | |
Gagausisch | Maorisch | Shona |
Die folgende Tabelle enthält Links zu unterstützten Sprachen für alle von IQ Bot unterstützten OCR-Engines:
Von IQ Bot unterstützte OCR-Engines | Liste der unterstützten Sprachen |
---|---|
ABBYY FineReader Engine | ABBYY FineReader Engine OCR supported languages |
Microsoft Azure Computer Vision OCR Engine | https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/language-support |
Google Vision API | https://cloud.google.com/vision/docs/languages |
Tesseract4 OCR 4.0.0 | https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html |
Tegaki API |
|
Anmerkung: Die in IQ Bot unterstützten Sprachen müssen in Übereinstimmung mit den von OCR unterstützten Sprachen betrachtet werden.
Tipp: Wenn Sie nicht alle Sprachen in der IQ Bot-Nutzeroberfläche sehen können oder IQ Bot nicht in der Lage ist, Daten aus mehreren Sprachen in einem Dokument zu extrahieren, beheben Sie das Problem:
Unable to extract data from Multiple languages in a document (A-People login required)
Anmerkung: Wenn Sie eine benutzerdefinierte Sprache zu einer benutzerdefinierten Domäne hinzufügen, müssen Sie die Sprach-ID in allen Installationen beibehalten, aus denen IQ Bot-Lerninstanzen exportiert und importiert werden.