package IBM Watson Speech to Text
Ce package prend en charge les formats de fichiers audio suivants : flac, mpeg, mp3, ogg, pcm, wav et webm. Les langues suivantes sont prises en charge : Arabe, Portugais brésilien, Chinois (Mandarin), Anglais (Royaume-Uni et États-Unis), Français, Allemand, Japonais, Coréen, Espagnol (argentin, castillan, chilien, colombien, mexicain et péruvien).
Fonctionnalité | Description |
---|---|
Détection des haut-parleurs | Identifie les individus dans une conversation entre plusieurs personnes.
|
Capture de mots-clés | Détecte les chaînes spécifiques dans la transcription. La sortie contient le ou les horodatage(s) pour chaque mot clé et un score de confiance. |
Formatage intelligent | Convertit les types de chaînes suivantes en représentations plus conventionnelles pour rendre la transcription plus facile à lire :
|
Filtre de profanité | Obscurcit les mots grossiers en les remplaçant par des astérisques dans la transcription. |