Automation 360

IBM Watson Speech to Text-package

Als PDF herunterladen

Inhalte

IBM Watson Speech to Text-package

Als PDF herunterladen

Zuletzt aktualisiert2021/09/02

IBM Watson Speech to Text-package

Dieses package unterstützt die folgenden Audiodateiformate: flac, mpeg, mp3, ogg, pcm, wav und webm. Die folgenden Sprachen werden unterstützt: Arabisch, Brasilianisches Portugiesisch, Chinesisch (Mandarin), Englisch (Vereinigtes Königreich und Vereinigte Staaten), Französisch, Deutsch, Japanisch, Koreanisch, Spanisch (Argentinisch, Kastilisch, Chilenisch, Kolumbianisch, Mexikanisch und Peruanisch).

Wichtig: Dies ist ein Beta-package und ist derzeit nicht mit den Automation 360 Enterprise- und Cloud-Editionen verfügbar.


Funktion	Beschreibung
Sprecher erkennen	Identifiziert die Personen in einem Gespräch zwischen mehreren Personen. Unterstützt Englisch, Japanisch und Spanisch. Für Gespräche zwischen zwei Personen; maximal sechs Personen. Die besten Ergebnisse erzielen Sie mit einer Audiodatei, die mindestens eine Minute lang ist. Die Ausgabe enthält die von jedem Sprecher gesprochenen Wörter und den Zeitstempel.
Schlüsselwort-Spotting	Erkennt bestimmte Zeichenfolgen im Transkript. Die Ausgabe enthält den/die Zeitstempel für jedes Schlüsselwort und einen Zuverlässigkeitswert.
Intelligente Formatierung	Konvertiert die folgenden Arten von Zeichenfolgen in konventionellere Darstellungen, um die Lesbarkeit des Transkripts zu verbessern: Daten Zeiten Reihen von Ziffern und Zahlen Telefonnummer Währungswerte E-Mail- und Internetadressen Beispiele finden Sie unter Intelligente Formatierungsergebnisse. Diese Funktion unterstützt Englisch, Japanisch und Spanisch.
Profanitätsfilter	Verbirgt Schimpfwörter, indem es sie im Transkript durch Sternchen ersetzt.

Zurück

Kein vorheriges Thema

Weiter

Kein nächstes Thema

Zurück

Kein vorheriges Thema

Weiter

Kein nächstes Thema