358 661

Cited 0 times in

A new method for neoantigen prediction to make precise immunotherapy based on large-scale genomic data

Other Titles
 대규모 유전체 데이터에 기반한 정밀 항암면역치료를 위한 신생항원 예측 방법 
Authors
 김소라 
College
 College of Medicine (의과대학) 
Degree
박사
Issue Date
2019
Abstract
종양 특이적인 돌연변이는 신항원이라고 불리는 non-self 형태의 면역원성 펩타이드(immunogenic peptide)를 생산하게 된다. 이러한 신항원은 immune checkpoint inhibitor (ICI)와 같은 항암면역치료에서는 환자 반응을 예측하기 위한 바이오마커로써 활용될 수 있고 cancer vaccine과 같은 항암면역치료에서는 그 자체가 표적으로써 활용될 수 있다. 특히 암에서 발생하는 돌연변이는 clonal evolution을 통한 intratumor heterogeneity를 바탕으로 전체 암 세포가 공유하고 있는 clonal mutation과 일부 암 세포만이 공유하고 있는 sub-clonal mutation으로 구분할 수 있는데 clonal mutation에서 유래된 clonal neoantigen을 활용할 경우 항암면역치료 반응성 예측 바이오마커로써의 활용도나 치료 효과를 더 기대할 수 있다. 또한 대규모 분석을 통하여 많은 암 환자들이 공유하는 것으로 알려진 일부 발암 돌연변이(oncogenic mutation) 중 여러 환자들에게서 신항원으로 확인되는 ‘공유 신항원(shared neoantigen)’이 있다면, 특정 암종 내에서 혹은 범암(pan-cancer)적인 활용성이 생길 수 있다. 현재까지는 신항원을 예측하기 위하여 펩타이드와 주조직적합 성 복합체(major histocompatibility complex, MHC) 간의 결합력을 측정한 IC50라는 값이 사용되고 있는데, 이를 활용할 경우 많은 수의 위양성(false positive)들이 함께 나타난다. 이를 극복하여 보다 정확하게 신항원을 예측하기 위해 머신 러닝 모델을 기반으로 하는 Neopepsee를 개발하였다. Neopepsee는 RNA-seq 데이터와 돌연변이 리스트를 입력으로 받아 발생 가능한 mutant peptide를 예측하고 면역원성과 관련 있는 9개의 특성에 대한 점수를 자동으로 계산하여 machine learning-based classifier를 통해 면역원성을 예측한다. 해당 도구의 성능 검증을 위하여 기존에 활용되고 있는 IC50값과 함께 모델 테스트용 데이터뿐만 아니라 임상에서 면역치료가 적용된 흑색종(melanoma), 백혈병(leukemia) 데이터에도 적용하여 그 성능을 평가하였다. 또한 TCGA에서 제공하는 대규모 암종 데이터에 Neopepsee를 적용하여 예측된 신항원을 이용하여 신항원의 특성이 암종별로 차이가 나타나는지 범암적으로 나타나는지를 확인하고 공유 신항원의 존재 및 clonal neoantigen의 특성에 대해 조사하였다. 그 결과 Neopepsee는 기존의 방법에 비하여 모델용 테스트 데이터뿐만 아니라 실제 임상 데이터에서도 위양성 결과가 약 2배 이상 감소하는 향상된 성능으로 확인되었다. 또한 이를 이용하여 대규모 암종별 신항원 특성에 대해 조사한 결과, 다수의 암환자에게서 확인되는 hotspot 혹은 driver gene 중 여러 샘플들의 다양한 HLA allele에서도 반복적으로 신항원으로 판명되는 공유 신항원 후보들이 다수 확인되었다. PIK3CA p.E545K로부터 생성된 TKQEKDFLW 9-mer 시퀀스는 특히 유방암과 두경부암 환자에게서 다수 확인되었고, 특히 KRAS p.G12V에서 생성된 펩타이드는 clonal neoantigen으로도 확인되므로 항암면역치료를 위한 중요한 표적 후보군으로써의 가능성이 확인되었다. 또한 pattern-based 신항원 분석을 통해 다른 위치에서 발생한 서로 다른 돌연변이에서도 동일한 펩타이드 형태의 신항원이 나타날 수 있음을 확인하였다. 신항원과 clonal neoantigen을 활용하여 예후 인자로써의 성능을 확인한 결과, 자궁암에서는 neoantigen burden에 의해 유방암에서는 clonal neoantigen burden에 의해 구분된 overall survival에 유의한 차이가 나타나는 것으로 확인되었다. 특히 clonal neoantigen의 비율을 활용하여 분석한 결과에서는 각 암종별 tumor heterogeneity 예측 뿐만 아니라 기존 분석에서 유의한 예후 예측 인자가 확인되지 않은 heterogeneous tumor type에서 유의한 수준으로 각 샘플별 예후가 나뉘어 지는 것이 확인되었다. 또한 ICI 항암면역치료를 적용한 흑색종 및 방광암 데이터를 이용하여 신항원과 clonal neoantigen의 ICI 반응성 예측 인자로써의 성능을 확인한 결과, 흑생종 데이터에서는 clonal neoantigen burden이 유의하게 ICI 반응군에서 높게 나타났고, 방광암 데이터에서는 neoantigen burden 혹은 non-synonymous mutation을 활용한 결과가 유의 수준 0.05 이하로 확인되었다. 본 연구를 통하여 개발된 Neopepsee는 기존의 방법에 비해 위양성 수를 많이 낮춰줌으로써 보다 정확한 신항원을 예측할 뿐만 아니라cancer vaccine 임상 데이터 적용 결과를 바탕으로 임상으로의 적용 가능성도 확인할 수 있었다. 또한 신항원의 특성을 대규모 데이터를 통해 조사한 결과, 암종 별로 차이가 크게 나타나므로 범용적인 활용보다 각 암종의 특성에 맞춰 선별적인 용도로써의 활용이 필요한 것으로 확인되었다.

Tumor-specific mutations form non-self immunogenic peptides called neoantigens. Neoantigens can be used as a biomarker predicting patient response to anti-cancer immunotherapy such as immune checkpoint inhibitor (ICI), and as targets for anti-cancer immunotherapy such as cancer vaccine. In particular, clonal neoantigen derived from clonal mutation can be used as effective biomarker and target of immunotherapies. Large-scale genomic studies have been revealed some of oncogenic mutations known to be shared by many cancer patients. If there is a ‘shared neoantigen’ identified in several patients among the mutations within certain carcinomas or pan-cancer, the shared neoantigen may have applicability as pan-cancer biomarker for immunotherapy. To date, a value of IC50, which predict the binding affinity between a peptide and the major histocompatibility complex (MHC), is used to predict neoantigen, but a large number of false-positives exist. To overcome this problem with the more precise neoantigen prediction, Neopepsee was developed based on a machine learning model. Neopepsee utilizes RNA-seq and a mutation list to automatically generate mutant peptides and predicts immunogenicity through a machine learning-based classifier for nine features related to immunogenicity. In order to verify the prediction performance, it was evaluated not only for the test dataset but also for independent datasets of the melanoma and leukemia, which were validated the induced T-cell responses experimentally. In addition, to investigate the existence and the characteristics of shared neoantigen and clonal neoantigen, Neopepsee was applied to the large-scale cancer data provided by the The Cancer Genome Atlas (TCGA). Neopepsee showed the improved performance to reduce false positive two times more than that of the conventional method in not only the test data but also clinical dataset. In the study on the large-scale dataset, it was confirmed there are a few shared neoantigen candidates from hotspot mutations in driver genes. The 9-mer sequence TKQEKDFLW generated from PIK3CA p.E545K determined in the HLA restriction of B*44 and B*51 was identified as a shared neoantigen candidate, especially in breast and head and neck cancer patients. The peptide produced in KRAS p. G12V was identified not only as a neoantigen but also as a clonal neoantigen, it could be used as a candidate of a target for immunotherapy. The pattern-based shared neoantigen analysis has confirmed identical peptide sequence could appear from diverse mutations in distinct genomic location. In the analysis using clonal neoantigen, it was confirmed the tumor heterogeneity is identified by the ratio distribution of clonal neoantigen in samples of each tumor. Also, high clonal neoantigen ratio in heterogeneous tumors was significantly associated with poor prognosis. It seems to be caused by immunoediting, in which the immune microenvironment is more suppressed to counter the clonal neoantigen generated in the early phase during tumor development, which was validated by significantly lower tumor immune microenvironment score in the high clonal neoantigen ratio group than in the low group. The neoantigen burden in uterine cancer and the clonal neoantigen burden in breast cancer showed significant performance of prognosis marker in the prediction of overall survival, additionally. Lastly, the clonal neoantigen burden in melanoma and the neoantigen in urothelial carcinoma showed significant performance as predictive marker of response to ICI treatment. Neopepsee predicted the more accurate neoantigen by reducing the number of false positives more than the conventional method and suggested the applicability to the clinical practice. In large-scale data analysis, it has shown that neoantigen characteristics are different according to tumor type, therefore, selective use is required according to the characteristics of each carcinoma rather than the universal application.
Files in This Item:
TA02254.pdf Download
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 3. Dissertation
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/178168
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links