IBM Watson Speech to Text-Paket

Dieses Paket unterstützt die folgenden Audiodateiformate: flac, mpeg, mp3, ogg, pcm, wav und webm. Die folgenden Sprachen werden unterstützt: Arabisch, Brasilianisches Portugiesisch, Chinesisch (Mandarin), Englisch (Vereinigtes Königreich und Vereinigte Staaten), Französisch, Deutsch, Japanisch, Koreanisch, Spanisch (Argentinisch, Kastilisch, Chilenisch, Kolumbianisch, Mexikanisch und Peruanisch).

Wichtig: Dies ist ein Beta-Paket und ist derzeit nicht mit den Automation 360 Enterprise- und Cloud-Editionen verfügbar.
Funktion Beschreibung
Sprecher erkennen Identifiziert die Personen in einem Gespräch zwischen mehreren Personen.
  • Unterstützt Englisch, Japanisch und Spanisch.
  • Für Gespräche zwischen zwei Personen; maximal sechs Personen.
  • Die besten Ergebnisse erzielen Sie mit einer Audiodatei, die mindestens eine Minute lang ist.
Die Ausgabe enthält die von jedem Sprecher gesprochenen Wörter und den Zeitstempel.
Schlüsselwort-Spotting Erkennt bestimmte Zeichenfolgen im Transkript. Die Ausgabe enthält den/die Zeitstempel für jedes Schlüsselwort und einen Zuverlässigkeitswert.
Intelligente Formatierung Konvertiert die folgenden Arten von Zeichenfolgen in konventionellere Darstellungen, um die Lesbarkeit des Transkripts zu verbessern:
  • Daten
  • Zeiten
  • Reihen von Ziffern und Zahlen
  • Telefonnummer
  • Währungswerte
  • E-Mail- und Internetadressen
Beispiele finden Sie unter Intelligente Formatierungsergebnisse. Diese Funktion unterstützt Englisch, Japanisch und Spanisch.
Profanitätsfilter Verbirgt Schimpfwörter, indem es sie im Transkript durch Sternchen ersetzt.