package Reconnaissance vocale IBM Watson

Ce package prend en charge les formats de fichiers audio suivants : flac, mpeg, mp3, ogg, pcm, wav et webm. Les langues suivantes sont prises en charge : Arabe, Portugais brésilien, Chinois (Mandarin), Anglais (Royaume-Uni et États-Unis), Français, Allemand, Japonais, Coréen, Espagnol (argentin, castillan, chilien, colombien, mexicain et péruvien).

Important : Il s'agit d'un package bêta et il n'est actuellement pas disponible avec les éditions Enterprise et Cloud Automation 360.
Fonctionnalité Description
Détection des haut-parleurs Cette fonctionnalité identifie les individus dans une conversation entre plusieurs personnes.
  • Cette fonctionnalité prend en charge l'anglais, le japonais et l'espagnol.
  • Utilisez-la pour une conversation entre deux personnes, et avec six personnes maximum.
  • Pour obtenir les meilleurs résultats, utilisez un fichier audio d'au moins une minute.
La sortie contient les mots prononcés par chaque haut-parleur et l'horodatage.
Capture de mots-clés Cette fonctionnalité détecte des chaînes spécifiques dans la transcription. La sortie contient le ou les horodatage(s) pour chaque mot-clé et un score de confiance.
Formatage intelligent Cette fonctionnalité convertit les types de chaînes suivants en représentations plus conventionnelles pour rendre la transcription plus facile à lire :
  • Dates
  • Fois
  • Série de chiffres et de nombres
  • Numéros de téléphone
  • Devises
  • Adresses e-mail et Web
Pour obtenir des exemples, consultez la rubrique Résultats de formatage intelligent. Cette fonctionnalité prend en charge l'anglais, le japonais et l'espagnol.
Filtre de mots grossiers Cette fonctionnalité obscurcit les mots grossiers en les remplaçant par des astérisques dans la transcription.