IBM 왓슨 Speech to Text 패키지

패키지는 flac, mpeg, mp3, ogg, pcm, wav 및 webm의 오디오 파일 형식을 지원합니다. 지원되는 언어는 다음과 같습니다. 아랍어, 브라질 포르투갈어, 중국어(북경어), 영어(영국 및 미국), 프랑스어, 독일어, 일본어, 한국어, 스페인어(아르헨티나어, 카스티야어, 칠레어, 콜롬비아어, 멕시코어, 페루어).

중요사항: 이는 베타 패키지이며 현재 Automation 360 Enterprise 및 Cloud 에디션에서는 사용할 수 없습니다.
기능 설명
스피커 감지 여러 사람 간의 대화에서 개인을 식별합니다.
  • 영어, 일본어 및 스페인어를 지원합니다.
  • 두 사람 간의 대화에 이용합니다(최대 6명).
  • 최상의 결과를 얻으려면 오디오 파일을 1분 이상 이용하십시오.
출력에는 각 스피커가 이용하는 단어와 타임스탬프가 포함되어 있습니다.
키워드 스포팅 대사의 특정 문자열을 감지합니다. 출력에는 각 키워드에 대한 타임스탬프와 신뢰도 점수가 포함되어 있습니다.
스마트 포맷팅 다음 유형의 문자열을 보다 일반적인 표현으로 변환하여 대사를 더 쉽게 읽을 수 있게 만듭니다.
  • 날짜
  • 시간
  • 숫자 및 수 계열
  • 전화번호
  • 통화 값
  • 이메일 및 웹 주소
예시는 스마트 서식 지정 결과를 참조하십시오. 이 기능은 영어, 일본어 및 스페인어를 지원합니다.
비속어 필터 대사에서 비속어를 별표로 대체하여 비속어를 모호하게 만듭니다.