Lesen und beachten Sie die Automation Anywhere-Dokumentation

Automation Anywhere Automation 360

Inhalt schließen

Inhalte

Inhalt öffnen

IBM Watson Speech to Text Paket

  • Aktualisiert: 1/09/2020
    • Automation 360 v.x
    • Erstellen
    • RPA Workspace

IBM Watson Speech to Text Paket

Dies Paket unterstützt die folgenden Audiodateiformate: flac, MPEG, mp3, ogg, pcm, wav und Webm. Die folgenden Engines werden unterstützt: Arabisch, Brasilianisches Portugiesisch, Chinesisch (Mandarin), Englisch (Großbritannien und USA), Französisch, Deutsch, Japanisch, Koreanisch, Spanisch (Argentinisch, Kastilisch, Chilenisch, Kolumbianisch, Mexikanisch, Und peruanischen).

Funktion Beschreibung
Lautsprecher erkennen Identifiziert die Personen in einem Gespräch zwischen mehreren Personen.
  • Unterstützt Englisch, Japanisch und Spanisch.
  • Für Gespräche zwischen zwei Personen; maximal sechs Personen.
  • Verwenden Sie für optimale Ergebnisse eine Audiodatei, die mindestens eine Minute lang ist.
Die Ausgabe enthält die von jedem Sprecher gesprochenen Wörter und den Zeitstempel.
Stichwortspotting Erkennt bestimmte Zeichenfolgen im Transkript. Die Ausgabe enthält die Zeitstempel für jedes Schlüsselwort und eine Vertrauensbewertung.
Intelligente Formatierung Konvertiert die folgenden Strings in konventionellere Darstellungen, um das Transkript leichter zu lesen:
  • Daten
  • Times
  • Serie von Ziffern und Zahlen
  • Telefonnummern
  • Währungswerte
  • E-Mail- und Internetadressen
Beispiele finden Sie unter Ergebnisse der intelligenten Formatierung. Diese Funktion unterstützt Englisch, Japanisch und Spanisch.
Obszönitäten-Filter Verschleiert die Obszönität, indem sie im Transkript durch Sternchen ersetzt wird.
Feedback senden