IBM Watson Speech to Text-Paket
- Zuletzt aktualisiert2021/09/02
IBM Watson Speech to Text-Paket
Dieses Paket unterstützt die folgenden Audiodateiformate: flac, mpeg, mp3, ogg, pcm, wav und webm. Die folgenden Sprachen werden unterstützt: Arabisch, Brasilianisches Portugiesisch, Chinesisch (Mandarin), Englisch (Vereinigtes Königreich und Vereinigte Staaten), Französisch, Deutsch, Japanisch, Koreanisch, Spanisch (Argentinisch, Kastilisch, Chilenisch, Kolumbianisch, Mexikanisch und Peruanisch).
Wichtig: Dies ist ein Beta-Paket und ist derzeit nicht mit den Automation 360 Enterprise- und Cloud-Editionen verfügbar.
Funktion | Beschreibung |
---|---|
Sprecher erkennen | Identifiziert die Personen in einem Gespräch zwischen mehreren Personen.
|
Schlüsselwort-Spotting | Erkennt bestimmte Zeichenfolgen im Transkript. Die Ausgabe enthält den/die Zeitstempel für jedes Schlüsselwort und einen Zuverlässigkeitswert. |
Intelligente Formatierung | Konvertiert die folgenden Arten von Zeichenfolgen in konventionellere Darstellungen, um die Lesbarkeit des Transkripts zu verbessern:
|
Profanitätsfilter | Verbirgt Schimpfwörter, indem es sie im Transkript durch Sternchen ersetzt. |