IBM Watson Speech to Text-Paket
- Zuletzt aktualisiert2021/09/02
IBM Watson Speech to Text-Paket
Dieses Paket unterstützt die folgenden Audiodateiformate: flac, mpeg, mp3, ogg, pcm, wav und webm. Die folgenden Sprachen werden unterstützt: Arabisch, Brasilianisches Portugiesisch, Chinesisch (Mandarin), Englisch (Vereinigtes Königreich und Vereinigte Staaten), Französisch, Deutsch, Japanisch, Koreanisch, Spanisch (Argentinisch, Kastilisch, Chilenisch, Kolumbianisch, Mexikanisch und Peruanisch).
Wichtig: Dies ist ein Beta-Paket und ist derzeit nicht mit den Automation 360 Enterprise- und Cloud-Editionen verfügbar.
| Funktion | Beschreibung |
|---|---|
| Sprecher erkennen | Identifiziert die Personen in einem Gespräch zwischen mehreren Personen.
|
| Schlüsselwort-Spotting | Erkennt bestimmte Zeichenfolgen im Transkript. Die Ausgabe enthält den/die Zeitstempel für jedes Schlüsselwort und einen Zuverlässigkeitswert. |
| Intelligente Formatierung | Konvertiert die folgenden Arten von Zeichenfolgen in konventionellere Darstellungen, um die Lesbarkeit des Transkripts zu verbessern:
|
| Profanitätsfilter | Verbirgt Schimpfwörter, indem es sie im Transkript durch Sternchen ersetzt. |