IBM 왓슨 Speech to Text 패키지
- 최종 업데이트2021/09/02
IBM 왓슨 Speech to Text 패키지
이 패키지는 flac, mpeg, mp3, ogg, pcm, wav 및 webm의 오디오 파일 형식을 지원합니다. 지원되는 언어는 다음과 같습니다. 아랍어, 브라질 포르투갈어, 중국어(북경어), 영어(영국 및 미국), 프랑스어, 독일어, 일본어, 한국어, 스페인어(아르헨티나어, 카스티야어, 칠레어, 콜롬비아어, 멕시코어, 페루어).
중요사항: 이는 베타 패키지이며 현재 Automation 360 Enterprise 및 Cloud 에디션에서는 사용할 수 없습니다.
기능 | 설명 |
---|---|
스피커 감지 | 여러 사람 간의 대화에서 개인을 식별합니다.
|
키워드 스포팅 | 대사의 특정 문자열을 감지합니다. 출력에는 각 키워드에 대한 타임스탬프와 신뢰도 점수가 포함되어 있습니다. |
스마트 포맷팅 | 다음 유형의 문자열을 보다 일반적인 표현으로 변환하여 대사를 더 쉽게 읽을 수 있게 만듭니다.
|
비속어 필터 | 대사에서 비속어를 별표로 대체하여 비속어를 모호하게 만듭니다. |