394 507

Cited 0 times in

고밀도 마이크로어레이를 이용한 위암 관련 유전자의 통계적 규명

Other Titles
 Statistical identification and validation of gastric cancer-related genes using high-density cDNA microarray 
Authors
 김상철 
Issue Date
2004
Description
의과학과/석사
Abstract
[한글]

많은 수의 유전자를 동시에 관찰 할 수 있는 마이크로어레이의 개발은 생물학 뿐만 아니라 통계적 분석에도 새로운 도전이 되고있다. 본 논문에서는 위암 조직과 그 주위의 정상 조직에서 추출한 RNA를 사용한 마이크로어레이 실험 자료를 이용하여, 정상과 암 조직을 구별할 수 있는 유전자 군을 찾고자 하였다.

111명의 환자 중에서 86명의 환자는 정상과 암 조직의 쌍 자료, 13명에선 정상 조직 자료, 12명의 환자에선 암 조직 자료가 얻어져 총 197개의 자료를 이용하였다. 이중 86 쌍 자료를 비모수적 t검정과 족별 오류율 (Family Wise Error Rate), SAM (Significance Analysis of Microarray), 경험적 베이즈 절차 (Empirical Bayesian Process)를 이용하여 정상 조직과 암 조직을 구분할 수 있는 유의한 유전자를 선별하였다. 비모수적 t검정과 족별 오류율에서 조절 p-값이 0.0001보다 작은 경우에 3,516개의 유전자가 선별되었고, SAM의 경우엔 FDR (False Discovery Rate)가 0.00378%일 때 선별된 유전자는 5,657, 경험적 베이즈 절차에서 B값이 0 이상일 때 선별된 유전자는 6,661개이었다. 비모수적 t검정과 족별 오류율에서 선정된 유전자를 순서를 고려하여, 13명의 정상 조직과 12명의 암 조직으로 구성된 시험군에 적용하여 선정된 유전자들의 암과 정상을 구분할 수 있는 타당성을 선형 판별 분석 (Linear Discrimination Analysis), 2차 판별 분석 (Quadratic Discrimination Analysis) 및 SVM (Support Vector Machine)을 이용하여 평가하였다. 판별 분석 결과 상위 2개의 유전자로 정확성이 0.96~1임을 확인하였다. 각 방법에서 선별된 유전자들의 기능은 생리학적 과정 (physiological process), 세포 과정 (cellular process), 발달 과정 (developmental process) 순으로 관련되어 있음을 생물정보학 데이터 베이스를 통하여 관찰하였다 (DAVID : Database for Annotation Visualization and Integrated Discovery, http://apps1.niaid.nih.gov/david/).

위암에서 정상 조직과 암 조직을 구분할 수 있는 유전자는 많이 존재하며, 그 중 몇 개의 유전자로도 새로운 자료를 판별 분석 할 수 있음을 통계학적 기법을 이용하여 확인하였다. 이와 같이 선별된 유전자 군들은 위암의 발생과 진행을 이해하는 자료일 뿐만 아니라 실제 임상에 사용할 수 있는 생물학적 표지자의 후보물질이 될 수 있는 중요한 정보를 제공할 수 있다고 생각한다.





[영문]The development of microarray that simultaneously monitors thousands of genes has new challenge on statistics as well as biology. Using microarray data with RNA extracted from gastric cancer and normal tissue around it, this study aims to search for the genes discriminating between normal and cancer tissue using various statistical methods.

The study used total of 197 data among 111 patients - paired data of normal and cancer tissue from 86, normal from 13, and cancer from 12 patients, respectively. Using 86 paired data as a training set, significant genes discriminating normal tissue from cancer tissue were selected in a manner of Family-Wise Error Rate (FWER), SAM (Significance Analysis of Microarray) and Empirical Bayesian Process. Number of significance genes were 3,516 in the FWER when adjust p-value is less than 0.0001, 5,657 in the SAM when FDR (False Discovery Rate) is 0.00378%, and 6,661 in the empirical Bayesian process when B-statistic is more than 0, respectively. To validate the predictive accuracy of the selected genes from FWER, LDA (Linear Discrimination Analysis), QDA (Quadratic Discrimination Analysis) and SVM (Support Vector Machine) were used in a separate test set of 25 unpaired samples. As a result top 2 genes showed the prediction rate of 0.96~1. The selected genes from each method were categorized into physiological, cellular, and the developmental process according to the Database for Annotation Visualization and Integrated Discovery (DAVID, http://apps1.niaid.nih.gov/david/).

Significant number of genes to discriminate a normal and cancer tissue of the gastric cancer were selected with various statistical methods. These selected gene set might serve as an important database for understanding the carcinogenesis and progression of gastric cancer, and the potential biomarker candidates for the clinical application.
Files in This Item:
T008131.pdf Download
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 2. Thesis
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/121941
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links