IBM Watson Speech to Text package
Dies package unterstützt die folgenden Audiodateiformate: flac, MPEG, mp3, ogg, pcm, wav und Webm. Die folgenden Engines werden unterstützt: Arabisch, Brasilianisches Portugiesisch, Chinesisch (Mandarin), Englisch (Großbritannien und USA), Französisch, Deutsch, Japanisch, Koreanisch, Spanisch (Argentinisch, Kastilisch, Chilenisch, Kolumbianisch, Mexikanisch, Und peruanischen).
Funktion | Beschreibung |
---|---|
Lautsprecher erkennen | Identifiziert die Personen in einem Gespräch zwischen mehreren Personen.
|
Stichwortspotting | Erkennt bestimmte Zeichenfolgen im Transkript. Die Ausgabe enthält die Zeitstempel für jedes Schlüsselwort und eine Vertrauensbewertung. |
Intelligente Formatierung | Konvertiert die folgenden Strings in konventionellere Darstellungen, um das Transkript leichter zu lesen:
|
Obszönitäten-Filter | Verschleiert die Obszönität, indem sie im Transkript durch Sternchen ersetzt wird. |