Lesen und beachten Sie die Automation Anywhere-Dokumentation

Automation Anywhere Automation 360

Inhalt schließen

Inhalte

Inhalt öffnen

IBM Watson Speech to Text package

  • Aktualisiert: 2020/01/09

    IBM Watson Speech to Text package

    Dies package unterstützt die folgenden Audiodateiformate: flac, MPEG, mp3, ogg, pcm, wav und Webm. Die folgenden Engines werden unterstützt: Arabisch, Brasilianisches Portugiesisch, Chinesisch (Mandarin), Englisch (Großbritannien und USA), Französisch, Deutsch, Japanisch, Koreanisch, Spanisch (Argentinisch, Kastilisch, Chilenisch, Kolumbianisch, Mexikanisch, Und peruanischen).

    Funktion Beschreibung
    Lautsprecher erkennen Identifiziert die Personen in einem Gespräch zwischen mehreren Personen.
    • Unterstützt Englisch, Japanisch und Spanisch.
    • Für Gespräche zwischen zwei Personen; maximal sechs Personen.
    • Verwenden Sie für optimale Ergebnisse eine Audiodatei, die mindestens eine Minute lang ist.
    Die Ausgabe enthält die von jedem Sprecher gesprochenen Wörter und den Zeitstempel.
    Stichwortspotting Erkennt bestimmte Zeichenfolgen im Transkript. Die Ausgabe enthält die Zeitstempel für jedes Schlüsselwort und eine Vertrauensbewertung.
    Intelligente Formatierung Konvertiert die folgenden Strings in konventionellere Darstellungen, um das Transkript leichter zu lesen:
    • Daten
    • Times
    • Serie von Ziffern und Zahlen
    • Telefonnummern
    • Währungswerte
    • E-Mail- und Internetadressen
    Beispiele finden Sie unter Ergebnisse der intelligenten Formatierung. Diese Funktion unterstützt Englisch, Japanisch und Spanisch.
    Obszönitäten-Filter Verschleiert die Obszönität, indem sie im Transkript durch Sternchen ersetzt wird.
    Feedback senden