87 243

Cited 0 times in

A comparison of tree-based methods for survival data in precision medicine

Other Titles
 정밀의료를 위한 생존자료에서의 트리 기반 방법들 간의 비교 
Authors
 박정미 
College
 College of Medicine (의과대학) 
Department
 Others (기타) 
Degree
석사
Issue Date
2022-02
Abstract
최근 각종 질병의 진단과 치료에 있어 환자들 마다 서로 다른 치료방법이 필요성이 나타난다. 이에 따라, 유전체, 환경 및 생활습관, 임상 정보 등을 토대로 질병을 예방, 치료하는 목적을 가진 의료 패러다임이 부각된다. 이는 정밀 의료 시대가 도래 됨으로써 표적 치료로의 변화, 바이오마커를 기반으로 한 맞춤형 치료 전략 등 새로운 패러다임을 가져온다. 이러한 개인 맞춤형 의료 진단 및 치료 서비스 제공을 위한 머신 러닝의 기법들 중 하나로, 생존 자료를 활용한 트리 기반 방법들이 존재한다. 따라서, 본 연구는 치료 방법들 간에 유의적인 생존 확률 차이가 존재하는 하위 그룹을 발굴하기 위해 기존의 Simple Cox split 방법(2005), Model-based recursive partitioning(MOB) 방법(2016), The weighted classification 방법(2017)과 더불어 최근 개발된 Depth importance in precision medicine (DIPM) 방법(2020)을 비교한다. 연구 결과, DIPM, MOB, Simple Cox, 그리고 The weighted classification 순으로 성능이 좋음을 확인하였다. 특히, MOB 방법은 DIPM 방법과 비슷하거나 특정 non-tree 시나리오에서 더 좋은 정확성을 보여주었다. 이에 대한 결론의 주 요인은 방법들의 알고리즘을 통해 확인해 볼 수 있다. 기존의 방법들은 single tree만을 고려하거나 임의적으로 변수 및 cut-point를 지정하지만, DIPM은 embedded tree를 구현함으로써 각 노드 별로 random forest를 형성하여 candidate variable들을 모두 고려한다. 반면, MOB과 Weighted classification은 bootstrapping 기법을 통해 embedded tree들로 구성된 random forest를 구축한다. 따라서, 시뮬레이션을 통해 DIPM 방법과 MOB 방법에서 시간과 성능 관점의 trade-off가 존재함을 확인하였다. 이를 통해 비슷한 성능을 보이면서 계산 시간이 매우 빠른 MOB 방법을 DIPM 방법의 대안책으로 사용할 수 있을 것을 제안한다.

Precision medicine has been addressed in several clinical trials. Studies done to identify effective cancer treatments are mostly conducted on groups and do not account for individuals’ characteristics. However, it is essential to determine how subgroups are differentially affected by interventions. There are multiple tree-based methods for analyzing data with right-censored survival outcomes related to precision medicine. This study compared four tree-based methods for identifying subgroups: the latest method, the depth importance in precision medicine; double-weighted trees; model-based partitioning; and simple Cox split trees methods. Simulations were performed to compare the performance of these four methods in various scenarios where data were generated by different survival time distributions. The accuracy of each method was measured as the proportion of correctly selecting the most important predictor at the first node among the total number of simulation runs. As the first two well-performed methods, MOB and DIPM methods were fit using the Surveillance, Epidemiology, and End Results database. This study’s results can be used to help researchers and clinicians to choose the optimal tree-based method for analyzing right-censored data in precision medicine.
Files in This Item:
T015294.pdf Download
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 2. Thesis
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/189605
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links