Google DeepMind, "WaveNet"으로 문자음성변환(TTS) 기술의 신기원 개막...인간과 유사한 기계 음성의 시대 예고
[News]
인공지능(AI) 바둑 프로그램 AlphaGo로 프로 바둑기사와의 대결에서 승리하며 AI의 가능성에 대한 논란을 증폭시킨 바 있는 Google 산하 AI 기업 DeepMind가 최근 텍스트를 음성으로 변환하는 문자음성변환(Text-to-Speech, TTS) 기술의 신기원을 열 잠재력을 지닌 새로운 AI 시스템 "WaveNet"을 선보이며 다시 한 번 세간을 떠들썩하게 하고 있다.
심층 신경망(Deep Neural Network, DNN)을 기반으로 하는 "WaveNet"은 오디오 신호의 파형(waveform)을 분석하는 신경망의 훈련 및 학습 과정을 통해 기존 TTS 기술과 비교해 인간에 훨씬 근접한 음성을 생성해 내며 인간과 AI가 마치 인간과 인간이 대화하듯 대화하는 환경을 구현해 낼 것으로 기대를 모으고 있다.
[News Plus]
2010년 설립된 영국의 DeepMind는 지난 2014년 5억 3,300만 달러의 인수가로 Google의 손에 들어갔다. 인간과 유사한 방식으로 비디오 게임을 하는 방법을 학습하는...
<Table 1> Google DeepMind의 심층 신경망(DNN) 기반 오디오 생성 시스템 "WaveNet" 개요
<Figure 1> "WaveNet"과 기존 TTS 시스템, 인간 음성에 대한 사운드 품질 측정 테스트 결과
[View Point]
기존 TTS 기술의 한계를 뛰어 넘으며 인간 음성에 근접한 "WaveNet"의 등장으로 인간과 AI의 대화가 AI 운영체제와 주인공이 주고 받는 대화를 중심으로 하는...
<Figure 2> "WaveNet"의 신경망 구조
'스트라베이스 Reports' 카테고리의 다른 글
(무료)미국 미디어 기업 Mode Media, 갑작스러운 영업 중단으로 충격...미디어 업계 광고 기반 수익 모델의 한계 노출 (0) | 2016.09.29 |
---|---|
가상현실(VR)을 이용한 신개념 엔터테인먼트 시설 7選 (0) | 2016.09.29 |
(무료)실시간 동영상 서비스, 수익 모델 속속 도입...”동영상 광고, 스킨 광고, PPL, 브랜드 로고 등” (0) | 2016.09.28 |
각종 통계로 보는 2016년 상반기 음악 스트리밍 시장 트렌드 (0) | 2016.09.28 |
Snapchat, "Spectacles" 출시로 웨어러블 단말 시장 진출...Google Glass 실패 떨쳐낼 스마트 안경으로 등극할까 (0) | 2016.09.28 |