TAPTALK

(서울=연합뉴스) 김주환 기자 = 엔씨소프트[036570]는 게임 음성 제작 과정 전반에 활용할 수 있는 인공지능(AI) 모델 '제로샷 멀티버스 TTS'를 8일 공개했다.

TTS(Text to Speech)는 자연어를 입력해 캐릭터 목소리 같은 음성 콘텐츠를 제작하는 음성 합성 기술이다.

엔씨소프트의 AI 기술이 접목된 '멀티버스 TTS'는 3초 분량의 제한된 프롬프트 음성만으로도 다양한 발화 스타일 변환, 화자 음색 일치도가 높은 교차 언어 생성, 다국어 음성 제작이 가능한 것이 특징이다.

또 최적화한 단일 AI 모델로 구동할 수 있어 경쟁 TTS에 비해 상대적으로 적은 운용 비용으로 고품질의 음성을 생성할 수 있다.

엔씨소프트는 향후 멀티버스 TTS 기술을 게임 음성 제작 과정 전반에 활용할 방침이라고 밝혔다.

엔씨소프트의 멀티버스 TTS 모델 논문은 세계적인 권위를 갖는 인공지능 관련 기술 학회 'EMNLP'(자연어처리에 대한 경험적 방법론 학회)에 게재되기도 했다.

엔씨소프트 관계자는 "이번 '멀티버스 TTS'를 시작으로 연내 100종의 게임 캐릭터 음성을 제작하고, NPC(플레이어가 조종하지 않는 캐릭터)의 성격과 상황에 맞춰 음성을 제작하는 조절 기능을 지속 개발하는 것이 목표"라고 말했다.

jujuk@yna.co.kr