Cited 0 times in 
Cited 0 times in 
Development of a multi-modal immunotherapy response predictor for colorectal cancer based on clinical, genomic, imaging, and pathological data
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | 홍지윤 | - |
| dc.date.accessioned | 2026-02-05T06:05:45Z | - |
| dc.date.available | 2026-02-05T06:05:45Z | - |
| dc.date.issued | 2025-08 | - |
| dc.identifier.uri | https://ir.ymlib.yonsei.ac.kr/handle/22282913/210550 | - |
| dc.description.abstract | Colorectal cancer (CRC) is the third most prevalent cancer globally, accounting for approximately 10% of all cancer cases and serving as the second leading cause of cancer-related deaths. While mismatch repair-deficient and microsatellite instability-high CRCs have shown favorable responses to immunotherapy, particularly with FDA-approved immune checkpoint inhibitors (ICIs), significant unmet medical needs remain, especially for mismatch repair-proficient and microsatellite instability-low CRCs that exhibit resistance to current treatments. Although therapeutic options exist for advanced-stage patients, there is an urgent need for more effective and systematic approaches. To address these needs, the identification of suitable biomarkers for drug selection and the prediction of individual patient responses is crucial. Recent efforts have focused on integrating diverse data types—including genomic, clinical, digital imaging, and digital pathology—to enhance predictive accuracy. This study aims to develop a multimodal immunotherapy response predictor for CRC that incorporates whole exome sequencing (WES), RNA sequencing, metagenomic sequencing, clinical data, pathology, and radiology images. We collected samples from 106 patients at Severance Hospital, including 36 responders and 70 non-responders. Our findings indicate that features derived from individual modalities are insufficient for accurately distinguishing between responders and non-responders. However, integrating these modalities produces a synergistic effect that significantly enhances classification accuracy. Our machine learning-based multimodal models, utilizing techniques such as Random Forest, Logistic Regression, Naïve Bayes, and XGBoost, demonstrated improved performance with the incorporation of additional modalities, leading to substantial enhancements in accuracy, sensitivity, specificity, positive predictive value (PPV), and negative predictive value (NPV). Notably, the tool we developed offers a significant advantage by providing response prediction scores even in cases of missing modalities or missing features within a modality. This robustness enhances its applicability in clinical settings where complete data may not always be available. We validated our model’s generalization performance through stratified k-fold cross-validation, an independent external validation set, and comparisons with single-modality immune checkpoint inhibitor response predictors. This research represents a pioneering effort to develop a multimodal predictive model for immune checkpoint inhibitor responses in colorectal cancer. Furthermore, we demonstrate that predictive performance improves incrementally with the combination of modalities, offering the potential to enhance treatment strategies and patient outcomes.대장암(CRC)은 전 세계에서 세 번째로 흔한 암으로, 전체 암 발병률의 약 10%를 차지하며, 암 관련 사망의 두 번째 주요 원인이다. 이 중 미스매치 수리 결핍과 미세위성 불안정성이 높은 유형의 대장암은 면역항암요법, 특히 FDA에서 승인한 면역관문억제제에 긍정적인 반응을 보이지만, 미세위성 불안정성이 낮은 타입은 면역관문억제제에 저항성을 나타내며, 반응을 보이는 약제가 뚜렷하지 않아 여전히 약제 선택에 대한 미충족 수요가 남아 있다. 이러한 문제를 해결하기 위해 최근에는 임상 정보, 유전체 데이터, 영상 이미지 등 다양한 데이터 유형을 통합하여 예측 정확도를 향상시키고 최적의 의사결정을 돕기 위한 노력이 이루어지고 있다. 이번 연구는 세브란스 병원에서 면역항암제 투여 환자 106명(반응군 36명, 비반응군 70명)으로부터 샘플을 수집하여 차세대 유전자 시퀀싱, 메타게놈 시퀀싱, 임상 데이터, 병리학 및 영상 데이터를 활용했다. 이들을 통합하여 대장암을 위한 다중 모달리티 기반 면역항암요법 반응 예측기를 개발하는 것을 목표로 했다. 이를 통해 단일 모달리티 특징만으로는 반응자와 비반응자를 정확하게 구분하기에 충분하지 않다는 것을 확인하였으나, 다중 모달리티를 통합하면 시너지 효과를 생성하여 분류 정확성을 크게 향상시킬 수 있음을 입증하였다. 특히, 랜덤 포레스트, 로지스틱 회귀, 나이브 베이즈, XGBoost와 같은 기계 학습 기반의 앙상블 모델을 활용하여 정확도, 민감도, 특이도, 긍정적 예측 가치(Positive Predictive Value, PPV), 부정적 예측 가치(Negative Predictive Value, NPV)에서 개선된 성과를 확인했다. 개발한 예측기는 누락된 모달리티나 모달리티 내에서 누락된 특징이 있는 경우에도 반응 예측 점수를 제공하는 중요한 장점을 갖춘다. 이러한 견고함은 완전한 데이터가 항상 사용 가능하지 않은 임상 환경에서의 적용 가능성을 높일 수 있다. 본 모델의 일반화 성능은 계층화된 k-겹 교차 검증, 독립적인 외부 검증 세트, 단일 모달 면역 체크포인트 억제제 반응 예측기와의 비교를 통해 검증했다. 이번 연구는 대장암에서 면역 체크포인트 억제제 반응을 예측하기 위한 다중 모달리티 기반 모델 개발의 선구적인 노력을 나타내며, 모달리티 조합에 따라 예측 성능이 점진적으로 향상되는 것을 보여주어 치료 전략 및 환자 결과 개선의 잠재력을 제공한다. | - |
| dc.description.statementOfResponsibility | open | - |
| dc.publisher | 연세대학교 대학원 | - |
| dc.rights | CC BY-NC-ND 2.0 KR | - |
| dc.title | Development of a multi-modal immunotherapy response predictor for colorectal cancer based on clinical, genomic, imaging, and pathological data | - |
| dc.title.alternative | 임상, 유전체, 이미징 및 병리학적 다중 모달리티 데이터를 기반으로 한 대장암 면역항암요법 반응 예측기 개발 | - |
| dc.type | Thesis | - |
| dc.contributor.college | College of Medicine (의과대학) | - |
| dc.contributor.department | Others | - |
| dc.description.degree | 박사 | - |
| dc.contributor.alternativeName | Hong, Jiyun | - |
| dc.type.local | Dissertation | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.