IBM Watson Voz a texto paquete

Este paquete es compatible con los siguientes formatos de archivo de audio: flac, mpeg, mp3, ogg, pcm, wav y webm. Es compatible con los siguientes idiomas: árabe, portugués brasileño, chino (mandarín), inglés (Reino Unido y Estados Unidos), francés, alemán, japonés, coreano, español (argentino, castellano, chileno, colombiano, mexicano y peruano).

Importante: Se trata de un paquete beta y actualmente no está disponible con las ediciones Enterprise y Cloud de Automation 360.
Característica Descripción
Detectar oradores Identifica las personas en una conversación entre varias personas.
  • Compatible con inglés, japonés y español.
  • Utilícelo para conversar entre dos personas; máximo seis personas.
  • Para obtener mejores resultados, utilice un archivo de audio de al menos un minuto.
El resultado contiene palabras dichas por cada orador y la marca de tiempo.
Detección de palabras clave Detecta cadenas específicas en la transcripción. El resultado contiene la marca de tiempo para cada palabra clave y un puntaje de confianza.
Formato inteligente Convierte los siguientes tipos de cadenas en representaciones más convencionales para facilitar la lectura de la transcripción:
  • Fechas
  • Veces
  • Serie de dígitos y números
  • Números de teléfono
  • Valores de moneda
  • Direcciones de correo electrónico y web
Para ver ejemplos, consulte Resultados de formato inteligente. Esta característica es compatible con inglés, japonés y español.
Filtro de lenguaje soez Oculta el lenguaje soez en la transcripción reemplazándolo con asteriscos.