870 506

Cited 0 times in

Ensemble algorithm을 이용한 간암진단의 분류분석

Other Titles
 Ensemble for the classification of hepatocellular carcinoma in high-risk patients in Korea. 
Authors
 이우선 
Issue Date
2002
Description
의학전산통계협동과정/석사
Abstract
[한글]



본 논문의 목적은 한국인의 간암발생에 관한 자료를 바탕으로 간암 조기검진을 위한 최적의 분류모형을 제시함으로써 간암환자의 정확한 조기진단을 통해 치료의 성공을 도모하고 생존율을 높이고자 하는 것이다.

예측모형으로 Logistic Regression, CART, Neural Network를 사용하였으며 단일 분류기 모형의 성능을 향상시키기 위해 다수의 분류기 결과를 결합하는 앙상블 알고리즘을 적용하였다. 분석 대상은 1990년 1월부터 1999년 12월까지 10년 동안 연세대학교 의과대학 부속 세브란스병원 소화기내과에 방문하여 간암 발생 위험 군으로 판단되어 정기적으로 복부 초음파검사와 혈청 -FP검사를 포함한 검진을 받아온 994명의 환자이다.

단일분류기, 앙상블 기법 그리고 분류기의 개수를 실험인자로 하고 분류정확도, 민감도, 그리고 특이도를 반응변수로 하는 삼원배치법 실험을 실시하였으며 분산분석과 던칸(Duncan)검정을 이용하여 분석하였다.

분산분석의 결과 모든 반응변수 관점에서 각 인자의 주 효과는 모두 통계적으로 유의하며 특히 민감도에 있어서는 분류자의 방법과 앙상블 기법간의 교호작용이 있고 Logistic Regression을 기반으로 한 Bagging이 가장 우수한 모형으로 분석되었다. 또한 단일분류기 중 가장 좋은 모형이었던 Logistic Regression에 비해 분류정확도, 민감도 그리고 특이도 가 모두 증가하였다.

앙상블 기법의 분석 결과 특이도 및 분류정확도 관점에서는 Arc-x4, 그리고 민감도 관점에서는 Bagging이 우수한 것으로 나타났다.



--------------------

핵심되는 말 : Logistic regression, CART, Neural Network, Ensemble, Bagging Arc-x4, Hepatocellular Carcinoma

[영문]

Purpose: The purpose of this study is to apply the ensemble algorithm in an effort to increase the accuracy of an individual classifier for Hepatocellular Carcinoma in High-Risk Patients in Korea.

Materials and Methods: The data of 2,020 patients who had ultrasonography (US) due to chronic liver diseases were collected from 1990 to 1998. A total of 994 patients who have no missing input values is used to fit individual classification models

such as logistic regression, neural network and decision tree (CART) for Hepatocellular Carcinoma. We apply ensemble algorithms (Bagging and Arc-x4) to these individual classifiers by varying the number of Bootstrap resamples from 5, 50, 150 to 300. A three way ANOVA is performed in order to compare the performances

of the ensembles algorithms in terms of classification accuracy, sensitivity, and specificity.

Result: Result of the full factorial design indicated the following at 5% significance level. Ensemble algorithm is a significant factor for the classification sensitivity, specificity and accuracy. Only one interaction effect between classifier and ensemble algorithm turns out to be significant.

Conclusion: According to Duncan test, both Bagging and Arc-x4 algorithms perform better than individual classifiers. More specifically, Bagging based on logistic regression is recommended for the classification of Hepatocellular Carcinoma in High-Risk Patients.
Files in This Item:
T006958.pdf Download
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 2. Thesis
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/137748
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links