컴퓨터 음성에 희노애락 입힐 수 있을까

중앙일보

입력

인간의 음성에 감정의 옷은 어떻게 입혀질까. 우리는 어떻게 목소리에서 즐거움, 두려움, 슬픔 등을 인식할 수 있을까. 그리고 컴퓨터도 인간처럼 감정이 담긴 음성을 낼 수 있을까.

독일 베를린 공과대학의 컴퓨터 과학자들이 이 궁금증을 풀기 위해 나섰다. 이들은 사상 최초로 컴퓨터 음성에 인간의 감정을 불어넣는 방법을 찾고 있다.

발터 젠들마이어 교수가 이끄는 연구팀은 우선 배우들을 고용해 그들에게 따분함, 슬픔, 행복함 등을 담은 목소리로 여러 구절을 읽게 한 다음 감정이 80% 이상제대로 전달된 구절들을 음절 단위로 끊어 음의 고저, 음량, 기본 주파수, 속도, 그리고 지금까지 중시되지 않았던 조음의 정확성 등을 분석했다.

분석 결과 실험에 참가한 배우들은 기쁨이나 분노를 나타낼 때 매우 빠르면서도 정확하게 말하는 것으로 나타났는데 젠들마이어 교수는 "기쁨이나 분노를 발산할 때 우리는 각 음에 강세를 주면서 음절의 많은 부분을 강조한다"고 말했다.

젠들마이어 교수는 따분함이나 슬픔을 나타내는 경우에 말은 느려지고 불명확해는데 반해 정말 두려움을 느끼는 경우에는 "몸이 경직돼 위아래 이를 제대로 뗄 수없다"면서 이 경우 평상시 음성보다 한 옥타브 가량 높은 음성이 나오면서 주파수는두 배 가량 높아지게 된다고 말했다.

이와 함께 화를 담은 음성이 발성되는 경우 성대가 갑자기 서로 부딪치면서 교대로 더 많은 에너지를 발생시키는 반면 슬픔이 배어날 때는 성대가 더 부드럽고 천천히 진동함으로써 어둡고 거친 음색을 만들어내는 것으로 나타났다.

배우들의 음성을 분석한 연구진은 이제 컴퓨터의 음성에 인간의 감정을 입히는 프로그램을 제작하고 있다.

젠들마이어 교수는 "실험에 참가하는 청취자들이 컴퓨터 합성음에서 올바른 감정 상태를 인식한다면 이는 우리가 올바른 매개변수를 찾았음을 보여 주는 것"이라고 말했다.

젠들마이어 교수팀의 연구에 많은 기업이 관심을 보이고 있는 가운데 특히 자동언어인식과 언어합성 분야는 연구 결과에 촉각을 곤두세우고 있다.

ADVERTISEMENT
ADVERTISEMENT