Automation 360

IBM 왓슨 Speech to Text 패키지

PDF로 다운로드

피드백

콘텐츠

IBM 왓슨 Speech to Text 패키지

PDF로 다운로드

피드백

업데이트됨: 2021/09/02

IBM 왓슨 Speech to Text 패키지

이 패키지는 flac, mpeg, mp3, ogg, pcm, wav 및 webm의 오디오 파일 형식을 지원합니다. 지원되는 언어는 다음과 같습니다. 아랍어, 브라질 포르투갈어, 중국어(북경어), 영어(영국 및 미국), 프랑스어, 독일어, 일본어, 한국어, 스페인어(아르헨티나어, 카스티야어, 칠레어, 콜롬비아어, 멕시코어, 페루어).

중요사항: 이는 베타 패키지이며 현재 Automation 360 Enterprise 및 Cloud 에디션에서는 사용할 수 없습니다.


기능	설명
스피커 감지	여러 사람 간의 대화에서 개인을 식별합니다. 영어, 일본어 및 스페인어를 지원합니다. 두 사람 간의 대화에 이용합니다(최대 6명). 최상의 결과를 얻으려면 오디오 파일을 1분 이상 이용하십시오. 출력에는 각 스피커가 이용하는 단어와 타임스탬프가 포함되어 있습니다.
키워드 스포팅	대사의 특정 문자열을 감지합니다. 출력에는 각 키워드에 대한 타임스탬프와 신뢰도 점수가 포함되어 있습니다.
스마트 포맷팅	다음 유형의 문자열을 보다 일반적인 표현으로 변환하여 대사를 더 쉽게 읽을 수 있게 만듭니다. 날짜 시간 숫자 및 수 계열 전화번호 통화 값 이메일 및 웹 주소 예시는 스마트 서식 지정 결과를 참조하십시오. 이 기능은 영어, 일본어 및 스페인어를 지원합니다.
비속어 필터	대사에서 비속어를 별표로 대체하여 비속어를 모호하게 만듭니다.

이 항목이 도움이 되었나요?

좋아요 싫어요