음성합성을 이용한 병적 음성의 치료 결과에 대한 예측

Other Titles
 Prediction of post-treatment outcome of pathologic voice using voice synthesis 
Issue Date
[한글] 성대마비와 성대폴립환자에게 가장 유효한 치료방법은 지금까지 수술적 처치라고 알려져 있다. 음성장애로 수술을 받는 환자들의 경우 수술 후에 어느 정도로 음성을 회복할 수 있는가에 대하여 많은 의문을 가지게 되므로 수술 후 예측되는 음성을 직접 들려주는 것이 수술 전 설명에 가장 효과적인 방법일 것이다. 이에 본 연구에서는 Dr. Speech Science 음성합성 프로그램(Tiger DRS, Inc. Version 4)에 음성을 특성 지어주는 세 변수인 지터(jitter), 쉬머(shimmer)와 성대잡음(NNE(normalized noise energy))을 인위적으로 교정하여 수술 후 예측되는 음성을 합성하는 방법을 고안하였다. 성대마비로 진단 후 Type I thyroplasty와 arytenoid adduction을 시행 받은 환자 10례와 후두미세수술 후 성대폴립으로 확진된 환자 10례를 대상으로 수술 1주 전 과 1달 후 Dr. Speech Science 음성분석 프로그램(Tiger DRS, Inc. Version 4)을 이용하여 지터, 쉬머, 성대잡음 값을 측정하였다. 그리고 음성합성 프로그램을 이용하여 지터, 쉬머, 성대잡음 수치를 변화시켜 두 질병의 수술 전 병적인 음성과 유사한 ''애'' 모음을 합성한 후 합성된 수술 전 음성을 분석하여 환자의 실제 수술 전 음성과 비교하였다. 그리고 다시 음성합성 프로그램을 이용하여 두 질병의 합성된 수술 전 병적인 음성의 지터, 쉬머, 성대잡음 수치를 변화, 교정하여 두 질병의 수술 후의 음성과 유사한 음성을 합성한 후 합성된 수술 후 음성을 분석하여 환자의 실제 수술 후 음성과 비교하였다. 환자의 실제 수술 전,후의 음성의 지터, 쉬머, 성대잡음 측정치를 합성된 수술 전,후의 음성과 비교하여 다음 결과를 얻을 수 있었다 . 1. 성대폴립환자의 수술 전 음성의 지터, 쉬머, 성대잡음 값을 음성합성 프로그램에 입력하여 수술 전 음성을 합성하고 이 합성된 음성의 세 변수 값을 정상범위로 교정하여 수술 후 음성을 합성한 후 합성된 수술 전,후의 음성을 분석한 결과 환자의 실제 수술 전,후의 음성과 합성된 수술 전,후의 음성은 유사하였다. 2. 성대마비환자의 수술 전 음성의 지터, 쉬머, 성대잡음 값을 음성합성프로그램에 입력하여 수술 전 음성을 합성한 결과 합성음의 세 변수들 모두 실제 수술 전 음성의 수치보다 증가�瑛습�알 수 있다. 이 같은 결과를 유발한 세 변수들 간의 상승효과를 제거한 후 교정된 지터, 쉬머, 성대잡음 값을 음성합성 프로그램에 입력하여 합성된 음성은 성대마비환자의 실제 수술 전 음성과 유사하였다. 3. 합성프로그램에 경도의 지터, 쉬머 수치와 정상범위로 교정된 성대잡음 값을 입력 후 합성된 음성은 성대마비환자의 수술 후 음성과 유사하였다. 이상의 연구결과로 음성합성 프로그램을 이용하여 합성한 음성의 음향학적 분석상 합성음이 수술 전,후의 음성과 유사하다는 만족스런 결과를 얻을 수 있었으며 이와 같은 방법으로 합성된 수술 후 예측 음성을 환자에게 제시함으로써 환자에게 더 많은 정보를 줄 수 있고 더 나아가 환자의 치료에 대한 협조를 높일 수 있을 것이라 생각된다.
[영문] Most effective mode of treatment of vocal cord paralysis and vocal polyp became known to be surgical treatment. Patients who undergoes such surgical treatment often concern about recovery of voice after surgery. In our investigation, we give controlled values of three parameters of voice synthesis program of Dr. Speech Science. such as jitter, shimmer, and NNE(normalized noise energy) which characterize someone''s voice from others and deviced a method to synthesize the predicted voice after performing operation. Ten patients with vocal cord paralysis who underwent type I thyroplasty and arytenoid adduction and Ten patients diagnosed as having vocal polyp after laryngomicrosurgery were examined with Dr. Speech science voice analysis program 1 week prior to and 1 month after the surgery and values of vocal jitter, vocal shimmer, and glottal noise were measured. With Dr. Speech science voice synthesis program we synthesized ''ae'' vowel which is closely identical to preoperative voice of the patients with vocal polyp and cord paralysis by controlling the values of jitter, shimmer, and glottal noise, then we analyzed the synthesized voice and compared with preoperative voice. With voice synthesis program we also synthesized ''ae'' vowel which is closely identical to the patients'' postoperative voice by correcting the values of jitter, shimmer, and glottal noise of the synthesized preoperative voice. Following statements were aquainted after statistical comparison. 1. After inputting the values of jitter, shimmer, and glottal noise from preoperative voice analysis of the patients with vocal polyp into the voice synthesis program, and corrected values of above three parameter from the synthesized preoperative voices, voices identical to patients'' pre- and postoperative voices withiin statistical significance were synthesized 2. After elimination of synergistic effects between three paramenter acquried from preoperative analysis of vocal cord paralysis patients and inputting these corrected parameters into the voice synthesis program, we were able to synthesize voice identical to patients'' preoperative voices withiin statistical significance. 3. After inputting low level of high frequency noise and corrected value of glottal noise and minimally increased than normal value of jitter, shimmer into the synthesis program, we were able to synthesize voice identical to vocal cord paralysis patients'' postoperative voices withiin statistical significance. After acoustical anaysis pefromed in our study, we come out with satisfactory results that voices synthesized with Dr. Speech science program were identical to patients'' actual pre and postoperative voice in statistical significance. With providing the predicted postoperative voice syntheisized with our porposed method to the patients who will undergo surgical procedure due to pathologic voice, clinicians will be able to give the patients more information and thus increased patients cooperability can be expected.
Files in This Item:
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 2. Thesis
Yonsei Authors
Lee, Joo Hwan(이주환)
