2538 956

Cited 0 times in

LASSO를 이용한 간경변 발생 예측 모형 연구

DC Field Value Language
dc.contributor.author김성은-
dc.date.accessioned2015-12-24T09:35:17Z-
dc.date.available2015-12-24T09:35:17Z-
dc.date.issued2006-
dc.identifier.urihttps://ir.ymlib.yonsei.ac.kr/handle/22282913/136096-
dc.description의학전산통계학 협동과정/석사-
dc.description.abstract[한글]간경변증(Liver Cirrhosis)은 간의 염증이 오래 지속되어 간의 정상적인 구조가 소실되고 굳어지면서 간의 표면이 울퉁불퉁해지는 것으로, 많은 합병증을 유발시킬 수 있는 질병이므로 건강검진 등의 조기진단을 통해 간경변 발생을 줄이기 위한 노력이 필요하다.본 논문에서는 1994년 5월 ~ 2005년 9월에 건강검진을 받은 85,458명의 검진자 중 병원에 내원하여 소화기내과 검사를 받은 4,093명을 대상으로 간경변 발생에 대한 위험인자를 살펴보고, 간경변 발생 예측 모형을 연구하였다. 로지스틱 회귀모형에 LASSO를 적용하여(LASSO-logistic regression) 예측모형으로 사용하였으며, 기존의 데이터마이닝 기법인 판별분석, 단계적 로지스틱 회귀분석, 의사결정나무, Random Forests, SVM-RFE와 성능을 비교하였다. 그 결과, LASSO-logistic regression을 통해 구축된 간경변 발생 예측 모형의 성능은 정확도가 91.6%, 민감도가 58.27%로 나타나 기존의 데이터마이닝 기법과 비슷한 성능을 보였다. 간경변 발생 위험인자는 B형간염S항원(HBsAg), C형간염항체(AntiHCV), 가족력, 음주력, 혈소판 수치(Platelet), 알칼라인 포스파타제(Alk.Phos), 알부민(Albumin), 로, 기존에 알려진 간경변 발생 위험인자를 잘 나타내주고 있으며, 의사결정나무, Random Forests, SVM-RFE와 달리 변수의 해석이 쉽다. 그러므로 LASSO-logisitic regression은 변수선택과 판별분석이 동시에 필요한 자료에 적합하다고 할 수 있다. [영문]Liver cirrhosis can induce a complication, so it is necessary to reduce the incidence of liver cirrhosis by early diagnosis such as screening test.This study investigated prediction model for the development of liver cirrhosis and identified the risk factors related with liver cirrhosis based on screening data accumulated from 1994 to 2005. We applied the LASSO to the logistic regression model(LASSO-logistic regression), used it as prediction model and compared the performance of any other methods with ours. As a result, accuracy and sensitivity using LASSO-logistic regression were 91.6%, 58.27%. These indicated that LASSO-logistic regression is comparable to performance of any others. And, we found that the risk factors related with liver cirrhosis were HBsAg, AntiHCV, Family history, Drinking, Platelet, Alkaline phosphatase, Albumin and . This shows that these are well known risk factors of liver cirrhosis. Also, when using LASSO-logistic regression, it is easy to interpretate the results in contrast to decision tree, Random Forests, SVM-RFE. Therefore, LASSO-logistic regression is suitable for data analysis to have need of variable selection and discriminant analysis simultaneously.-
dc.description.statementOfResponsibilityopen-
dc.publisher연세대학교 대학원-
dc.rightsCC BY-NC-ND 2.0 KR-
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/2.0/kr/-
dc.titleLASSO를 이용한 간경변 발생 예측 모형 연구-
dc.title.alternative(A) study of prediction model for the development of liver cirrhosis using LASSO-
dc.typeThesis-
dc.contributor.alternativeNameKim, Sung Eun-
dc.type.localThesis-
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 2. Thesis

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.