중계체 음성합성은 스포츠 캐스터가 경기를 중계하는 느낌을 구현한 기술이다. 뉴스와 안내문 등에 사용되는 '낭독체'나 일반적인 대화를 구현한 '대화체'와 달리 경기 상황에 맞는 감탄사, 자연스러운 간투어, 발화 오류·반복 등을 통해 다양한 감정을 표현한다.

엔씨소프트 AI센터 산하 스피치 AI 랩(Speech AI Lab)의 음성합성팀과 보이스 컨버전(Voice Conversion)팀은 자연스러우면서도 잡음·왜곡이 없는 고품질 음성을 생성하며 다양한 억양을 표현·제어하기 위한 '운율 제어(Prosody control)' 기술을 연구해왔다.
AI센터의 연구 결과인 중계체 음성합성 기술은 △감정 표현의 수준 및 강도(level) 제어 △다양한 감탄사 △생동감 넘치는 음성합성 등이 특징이다. 야구, 축구, 농구와 e-스포츠 등 다양한 종목의 경기 정보 전달과 해설 등에 활용할 수 있다.
[소비자가만드는신문=김경애 기자]
저작권자 © 소비자가 만드는 신문 무단전재 및 재배포 금지