Google DeepMind, "WaveNet"으로 문자음성변환(TTS) 기술의 신기원 개막...인간과 유사한 기계 음성의 시대 예고

[News]
인공지능(AI) 바둑 프로그램 AlphaGo로 프로 바둑기사와의 대결에서 승리하며 AI의 가능성에 대한 논란을 증폭시킨 바 있는 Google 산하 AI 기업 DeepMind가 최근 텍스트를 음성으로 변환하는 문자음성변환(Text-to-Speech, TTS) 기술의 신기원을 열 잠재력을 지닌 새로운 AI 시스템 "WaveNet"을 선보이며 다시 한 번 세간을 떠들썩하게 하고 있다.
심층 신경망(Deep Neural Network, DNN)을 기반으로 하는 "WaveNet"은 오디오 신호의 파형(waveform)을 분석하는 신경망의 훈련 및 학습 과정을 통해 기존 TTS 기술과 비교해 인간에 훨씬 근접한 음성을 생성해 내며 인간과 AI가 마치 인간과 인간이 대화하듯 대화하는 환경을 구현해 낼 것으로 기대를 모으고 있다.

[News Plus]
2010년 설립된 영국의 DeepMind는 지난 2014년 5억 3,300만 달러의 인수가로 Google의 손에 들어갔다. 인간과 유사한 방식으로 비디오 게임을 하는 방법을 학습하는...

<Table 1> Google DeepMind의 심층 신경망(DNN) 기반 오디오 생성 시스템 "WaveNet" 개요
<Figure 1> "WaveNet"과 기존 TTS 시스템, 인간 음성에 대한 사운드 품질 측정 테스트 결과

[View Point]
기존 TTS 기술의 한계를 뛰어 넘으며 인간 음성에 근접한 "WaveNet"의 등장으로 인간과 AI의 대화가 AI 운영체제와 주인공이 주고 받는 대화를 중심으로 하는...

<Figure 2> "WaveNet"의 신경망 구조

저작자표시 비영리 동일조건

'스트라베이스 Reports' 카테고리의 다른 글

(무료)미국 미디어 기업 Mode Media, 갑작스러운 영업 중단으로 충격...미디어 업계 광고 기반 수익 모델의 한계 노출 (0)	2016.09.29
가상현실(VR)을 이용한 신개념 엔터테인먼트 시설 7選 (0)	2016.09.29
(무료)실시간 동영상 서비스, 수익 모델 속속 도입...”동영상 광고, 스킨 광고, PPL, 브랜드 로고 등” (0)	2016.09.28
각종 통계로 보는 2016년 상반기 음악 스트리밍 시장 트렌드 (0)	2016.09.28
Snapchat, "Spectacles" 출시로 웨어러블 단말 시장 진출...Google Glass 실패 떨쳐낼 스마트 안경으로 등극할까 (0)	2016.09.28

STRABASE.com -정보통신과 과학기술분야 리서치&컨설팅 전문 기업-

Google DeepMind, "WaveNet"으로 문자음성변환(TTS) 기술의 신기원 개막...인간과 유사한 기계 음성의 시대 예고

'스트라베이스 Reports' 카테고리의 다른 글

티스토리툴바

Google DeepMind, "WaveNet"으로 문자음성변환(TTS) 기술의 신기원 개막...인간과 유사한 기계 음성의 시대 예고

'스트라베이스 Reports' 카테고리의 다른 글

'스트라베이스 Reports' Related Articles

티스토리툴바