package Reconnaissance vocale IBM Watson
- Dernière mise à jour2021/09/02
package Reconnaissance vocale IBM Watson
Ce package prend en charge les formats de fichiers audio suivants : flac, mpeg, mp3, ogg, pcm, wav et webm. Les langues suivantes sont prises en charge : Arabe, Portugais brésilien, Chinois (Mandarin), Anglais (Royaume-Uni et États-Unis), Français, Allemand, Japonais, Coréen, Espagnol (argentin, castillan, chilien, colombien, mexicain et péruvien).
Important : Il s'agit d'un package bêta et il n'est actuellement pas disponible avec les éditions Enterprise et Cloud Automation 360.
Fonctionnalité | Description |
---|---|
Détection des haut-parleurs | Cette fonctionnalité identifie les individus dans une conversation entre plusieurs personnes.
|
Capture de mots-clés | Cette fonctionnalité détecte des chaînes spécifiques dans la transcription. La sortie contient le ou les horodatage(s) pour chaque mot-clé et un score de confiance. |
Formatage intelligent | Cette fonctionnalité convertit les types de chaînes suivants en représentations plus conventionnelles pour rendre la transcription plus facile à lire :
|
Filtre de mots grossiers | Cette fonctionnalité obscurcit les mots grossiers en les remplaçant par des astérisques dans la transcription. |