219 366

Cited 0 times in

Assessment of statistical classification methods

Other Titles
 통계적 분류방법 평가 
Authors
 정미영 
Issue Date
2007
Description
Dept. of Graduate Program in Biostatistics and Computing/박사
Abstract
[한글]군집분석은 이미 알려진 그룹의 구조와 그룹의 수에 대한 정보가 없어서분류분석을 할 수 없을 때 유사성과 근접성의 근거로 그룹화 시키는방법이다. 특히 의학 데이터에서 이러한 경우를 많이 접할 수 있다.고전적인 군집분석방법은 많은 분야에서 이론적인 배경없이 연구자의주관적인 입장에서 그룹의 수를 결정하고 추론하여왔다. 이 논문에서는분포를 가정한 군집분석방법을 주로 다루고 있다. 이 방법에서 그룹의수를 추정하기 위해 EM 알고리즘, Maximum a Posteriori 그리고 Gibbssampler을 이용할 수 있는데 이를 비교분석하고, 덧붙여 군집의 수를평가하는 방법으로 Bayesian Information Criteria와 Laplace MetropolisCriteria를 각 방법에 적용시켜 비교해 보고자 한다. 그 결과 추정한군집의 수와 실제 군집의 수가 일치하지 않는 경우가 대부분이었다.또한, 오분류율도 높다는 것을 발견하여 이 논문에서는 군집의 수를평가하는 방법으로 Modified Fisher's Discriminant Criteria를 제안하고있다.

[영문]The cluster analysis has been a popular method for the statisticalclassification. In particular, some high-dimensional medical datahave been confronted with such classification problem. The classicalcluster analysis, however, has the theoretical shortcoming, becausethe inference to determine the number of clusters does not have anytheoretical backgrounds. To estimate the number of clusters, thisdissertation explores the cluster analysis through EM algorithm,Maximum a Posteriori and Gibbs sampler. In addition, we investigatesome appropriate assessment tools such as Baysian Informationcriteria, Laplace Metropolis criteria and the modified Fisher'sdiscriminant criteria in order to determine the number of clusters.
Files in This Item:
T009759.pdf Download
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 3. Dissertation
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/137073
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links