4 756

Cited 0 times in

적응혼합모형을 이용한 군집의 분류 방법에 대한 연구

Other Titles
 A study of classifying cluster using adaptive mixture model 
Authors
 이명희 
Issue Date
2010
Description
의학전산통계학협동과정 의학통계학전공/박사
Abstract
[한글]계층적 군집분석과 k-means와 같은 비계층적 군집분석은 데이터간 거리만을 이용해 왔다. 하지만 데이터간 거리뿐만 아니라 데이터의 분포에 대한 정보를 활용함으로써 군집분석의 성능을 높일 수 있다. 분포추정을 통한 모형기반 군집분석인 EMCLUST는 데이터의 분포가 군집의 수와 같은 정규혼합분포의 성분으로 구성되어 있다고 가정을 하여 군집을 찾아낸다. 그러나 정규분포의 성격상 구형 또는 타원형의 군집을 선호하기 때문에 EMCLUST도 전통적인 군집분석과 마찬가지로 불규칙한 형태의 군집을 찾아내기에는 유연하지 못한 방법이다. 이러한 모형의 비유연성과 관찰치간의 거리만을 이용한 기존 군집분석의 단점을 보완하기 위하여 관찰치간의 거리정보와 데이터의 분포함수를 이용한 군집분석인 커널 분포추정을 이용하는 그래프이론 기반 군집분석을 예로 들 수 있다. 각 관찰치의 확률밀도함수를 이용하여 일정 범위 내에 존재하는 지역 정점 또는 지역 계곡으로 분류하는 방법으로 기존 군집분석과 다르게 군집의 수를 사전에 지정할 필요가 없다. 또한 커널추정량을 비모수적으로 추정하기 때문에 각 군집을 유연하게 분류할 수 있다. 그러나 대용량의 데이터에 적용할 경우 커널분포 추정시 데이터의 수에 따라 커널 추정량을 추정해야 하므로 모형의 복잡도가 상당히 증가된다는 단점이 있다.따라서 본 논문은 비모수적이고 모형의 복잡도가 낮은 적응적 혼합모형을 이용한 그래프이론 기반 군집분석(Graph-theoretic based clustering using Adaptive Mixture model, AMCLSUT) 알고리듬에 관하여 제안하였다. 본 논문에서 제안하는 AMCLUST 알고리듬의 목적은 계층적 군집분석과 k-means 군집분석, EMCLUST에서 유연하게 군집을 잘 분리하지 못하는 비볼록 데이터와 같은 불규칙한 형태를 잘 찾는 것이며, 데이터의 크기에 따라 계산적인 복잡성이 증가되는 커널 군집분석보다는 덜 복잡하게 효율적으로 군집분석을 하는 것이다. 적응적 혼합모형을 추정시 군집분석의 성능을 좌우할 수 있는 분포추정의 정확성을 좋게 하기 위해 BIC를 이용한 최적의 조절모수()를 자동으로 선택하는 방법과 , 군집분석을 수행할 때 군집수를 자동적으로 찾아낼 수 있도록 지역영역의 반지름의 크기()를 자동적으로 결정하는 방법을 Gap 통계량을 이용하여 제시하였다. AMCLUST는 k-means 군집분석과 계층적 군집분석과는 다르게 군집의 수가 1개일 때에도 적용할 수 있으며 군집의 수에 대한 정보를 미리 제공해 줄 필요도 없다. 모의실험 결과 모수적이거나 준모수적인 군집분석에 비해 불규칙한 형태의 군집을 정확하게 잘 찾아내었으며 커널 군집분석보다는 계산적인 복잡성이 감소됨을 알 수 있었다. 실제 데이터를 이용한 결과에서, cDNA 마이크로어레이 데이터를 가지고 단변량 AMCLUST, 이변량 AMCLUST를 적용하여 발현이 유의하게 변이된 유전자를 찾았으며 각가 20개, 13개의 반현변이 유전자를 발견할 수 있었다. 마지막으로 건강검진 데이터를 이용한 군집분석 결과에서는 50세 미만과 50세 이상의 검진자들에 대한 심혈관계 질환이나 제 2형 당뇨 질환과 관련된 위험요인의 군집형태를 설명하기 위해서 AMCLUST를 적용하였다. 50세 미만보다 50세 이상의 검진자들에게서 위험요인의 뚜렷한 군집형태를 발견할 수 있었으며, 나이가 들수록 이러한 질환에 대한 위험도가 증가하므로 대사증후군과 관련된 발병위험도가 더 커짐을 알 수 있다.



[영문]
Files in This Item:
제한공개 원문입니다.
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 3. Dissertation
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/137373
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links