pacote IBM Watson Fala para texto

Este pacote suporta os seguintes formatos de arquivo de áudio: flac, mpeg, mp3, ogg, pcm, wav e webm. Os seguintes idiomas são compatíveis: Árabe, português brasileiro, chinês (mandarim), inglês (Reino Unido e Estados Unidos), francês, alemão, japonês, coreano, espanhol (argentino, castelhano, chileno, colombiano, mexicano e peruano).

Importante: Este é um pacote beta e atualmente não está disponível com o Automation 360 edições Enterprise e Cloud.
Recurso Descrição
Detectar alto-falantes Identifica os indivíduos em uma conversa entre várias pessoas.
  • Suporta inglês, japonês e espanhol.
  • Use para conversa entre duas pessoas; máximo de seis pessoas.
  • Para obter melhores resultados, use um arquivo de áudio com pelo menos um minuto de duração.
A saída contém as palavras faladas por cada alto-falante e o carimbo de data/hora.
Localização de palavras-chave Detecta sequências específicas na transcrição. A saída contém os carimbos de data/hora para cada palavra-chave e uma pontuação de confiança.
Formatação inteligente Converte os seguintes tipos de sequências em representações mais convencionais para tornar a transcrição mais fácil de ler:
  • Datas
  • Vezes
  • Série de dígitos e números
  • Números de telefone
  • Valores de moeda
  • Endereços de e-mail e web
Para obter exemplos, consulte Resultados de formatação inteligente. Este recurso suporta inglês, japonês e espanhol.
Filtro de profanidade Obscurece a profanidade substituindo-a por asteriscos na transcrição.