309 429

Cited 0 times in

Prediction of relative genomic susceptibility to 20 major cancers : a machine learning approach

DC Field Value Language
dc.contributor.author김병주-
dc.date.accessioned2019-01-02T16:44:01Z-
dc.date.available2019-01-02T16:44:01Z-
dc.date.issued2018-
dc.identifier.urihttps://ir.ymlib.yonsei.ac.kr/handle/22282913/166379-
dc.description융합오믹스의생명과학-
dc.description.abstract암의 발병은 유전적 요인, 환경 그리고 생활습관과 같은 요인들의 복잡한 상호작용을 통해서 일어납니다. 그리고 그 결과는 환자와 그를 부양하는 가족들에게 경제적, 정신적 그리고 신체적인 부담으로 나타나게 됩니다. 이러한 부담을 피하거나 혹은 최소화시키기 위한 가장 좋은 방법은 암을 예방하거나 조기에 발견, 치료하는 것입니다. 하지만 이를 위해서는 암에 걸릴 확률을 예측하는 모델을 만드는 것이 요구됩니다. 최근의 진보된 기술로 인해서 게놈 다양성을 단일 뉴클레오타이드 수준에서 정량적, 정성적인 측정을 가능하게 되었고, 이러한 모델을 만들기 위해 필요한 수많은 데이터들은 현재 허가를 받으면 사용 가능하게 되었습니다. 우리는 총 5,919명의 백인들의 유전 데이터를 The Cancer Genome Atlas와 1000 genome project 로부터 얻어서 지도학습 방법 중 하나인 k-Nearest Neighbor 을 적용하여 20종류의 암과 건강한 대조군 형질을 분류하는 연구를 수행하였습니다. 그 결과, 유전정보를 이용하여 어떤 암인지에 따라 33% 에서 88%까지 암의 종류를 예측할 수 있었습니다. 예측에 실패한 12%에서 67%는 환경요인이나 생활습관 등에 의해 암이 발병된 것으로 여겨집니다. kNN 모델의 각 개인의 이웃하고 있는 형질이 차지하고 있는 비율 또한 암의 예방 및 조기 치료를 돕는 예측 가치를 지닌 유용한 유전 감수성 정보로 활용 될 수 있을 것입니다. 또한 유전적으로 질병에 대한 감수성을 가지게 하는 Multiple Allele Assortment 모델에 대해서도 이야기를 했는데, 많은 다양한 genomic element 조합을 이루어서 특정한 특정 질병에 대한 질병 감수성을 형성한다는 모델입니다. Cancers are caused by a complex interaction of inherited genomic susceptibility, environmental factors, and lifestyle factors. It causes economic, psychological, and physical burdens of the patients and their family. The best way to avoid and minimize the risks are prevention and early intervention. However, it requires developing a model or framework for predict the cancer susceptibility. Recent advances in technology allow us to measure inherited genomic variations quantitatively and qualitatively at a single nucleotide level. The data required to develop the model is now available with the approval. We use a k-Nearest Neighbor model and perform a study of multi-class classification for the genotype of 20 cancer types and one control among 5,919 white individual’s genotypes from The Cancer Genome Atlas and the 1000 genome project. The prediction accuracies from the genomic variation profile are average 45% ranging from 33% to 88% depending on the cancer type and the counterpart of 12% to 67% is mostly from environmental and lifestyle factors. The proportion of an individual’s neighboring traits also could be used as the informative inherited genomic susceptibilities with actionable predictive values which help people for the prevention and early intervention of cancer. Furthermore, we also addressed a different concept of the Multiple Allele Assortment Model. Genomic susceptibility could be obtained by multiple assortments of different sets of genomic elements independently.-
dc.description.statementOfResponsibilityopen-
dc.publisher연세대학교-
dc.rightsCC BY-NC-ND 2.0 KR-
dc.rightshttps://creativecommons.org/licenses/by-nc-nd/2.0/kr/-
dc.titlePrediction of relative genomic susceptibility to 20 major cancers : a machine learning approach-
dc.title.alternative기계학습을 통한 20 종의 주요 암에 대한 상대적인 유전 감수성 예측-
dc.typeThesis-
dc.description.degree박사-
dc.contributor.alternativeNameKim, ByungJu-
dc.type.localDissertation-
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 3. Dissertation

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.