0 415

Cited 0 times in

Meta-analysis of pancreatic cancer microarray dataset using DAVID algorithm

Other Titles
 DAVID algorithm을 이용한 췌장암 유전자 발현 데이터 통합분석 
Authors
 오태윤 
Issue Date
2009
Description
Dept. of Medical Science/박사
Abstract
[한글]췌장암은 진행이 매우 빠른 암으로 암 발생률은 높지 않은 편이나, 암으로 인한 사망률은 전체 암종 중 네 번째로 예후가 좋지 않다. 그리고, 환자의 5년 생존율이 3 ~ 5% 정도이며, 매년 전세계적으로 췌장암으로 인한 사망자가 대략 213,000명에 이른다. 이런 양상은 국내에서도 비슷한데, 해마다 증가 추세를 보이고 있다.

췌장암에서 예후가 좋지 않고 사망률이 높은 이유는 환자의 자각증상이 발생초기에는 매우 미미하고, 발견 된 후에는 대부분 조기 침윤이나 전이로 인해 외과적 수술이 어려우며, 여러 항암제에 대한 저항성을 가지고 있기 때문이다. 최근 다양한 암들에 대한 치료방법이 많이 발전했으나, 췌장암의 경우 초기 단계에서의 치료제나 민감도 또는 특이도가 높은 진단도구가 아직 부족한 상황이고, 사망률이 매우 높기 때문에 췌장암에 대한 원인과 발병기전에 관한 연구를 통하여 조기 진단과 치료제로 이용될 수 있는 분자적 표지자의 발굴이 매우 시급하다.

인간 유전체 연구 프로젝트 (Human Genome Project)가 완결된 이후 종양을 연구하는 방법에 있어서도 많은 변화가 생겨 났는데, 대량의 유전자 발현이나 단백질의 발현 변화를 동시에 확인 할 수 있는 High-throughput method가 발전함에 따라, 악성종양에서의 복잡한 분자들의 작용기전에 관한 연구가 가능해졌다. 그 중에서 특히 유전자 칩을 이용한 암환자의 조직과 정상조직에서의 유전자 발현의 차이를 볼 수 있는 마이크로어레이 실험(microarray experiment)은 전세계적으로 많이 이용되고 있으며, 기술이 개발된 이후 많은 암 관련 실험 자료들이 발표되었다.

그러나, 통계적인 방법으로 기술적, 물리적 오차를 제거하더라도, 많은 수의 유전자 리스트를 결과로 얻게 되어서, 분석의 결과로 나온 수많은 유전자 중에 어떤 유전자를 실험적으로 검증할 것인지 결정하기가 매우 어려웠다.

이러한 어려움을 극복하기 위해서 최근에는 통계적으로 선별된 결과를 기능적인 관점으로 유전자의 특성을 정의한 생물학적 기능 용어를 이용하여 기능상 서로 연관되어 있는 유전자를 한데 묶어서 파악하는 방법이 이용되고 있다. 그리고, 기존의 한가지 대상에 대하여 세부적인 분석을 하는 방법에서 벗어나, 암이라는 대상을 하나의 시스템으로 보고 전체적인 관점에서 어떤 현상이 일어나는 지를 분석해보는 새로운 시도를 하고 있다.

본 연구에서는 여러 연구소에서 진행된 유전자 칩을 이용한 췌장암 유전자 발현 데이터를 수집하여 통계적인 처리를 거쳐 유전자 후보군을 선별하였고, 유전자의 특성을 나타내는 여러 가지 생물학적 기능용어에서 공통적으로 연관이 있는 유전자를 찾고, 서로 연관있는 유전자들이 갖는 공통적인 기능을 조사하여 췌장암의 진행 과정에 관여하는 기능을 탐색해 보았다.

위의 결과는 각 그룹마다 많은 생물학적 기능 용어들이 있어서, 전체적인 관점에서 용어들간의 관계와 췌장암의 진행과정에서 관여하는 주요 기능을 이해하기가 어렵다. 이러한 문제를 해결하기 위해서 결과를 이용하여 네트워크를 만들었다.

DAVID 알고리즘을 이용하여 췌장암 유전자 발현 데이터를 분석한 결과, 췌장암에서 발현이 증가된 유전자군의 경우 14개의 집단으로 발현이 감소된 유전자군의 경우는 13개의 집단으로 나뉘었다. 이 결과를 토대로, 복잡한 생물학적 기능 용어간의 관계를 종합적으로 관찰하기 위하여 생물학적 기능용어에 관한 네트워크 지도를 만들었다.

이러한 접근 방법이 얼마나 타당한지 네트워크의 유효성을 확인하기 위하여 췌장암에서 관련이 있다고 알려진 Ras protein signal transduction과 가까이 있는 생물학적 기능 용어를 검색해 본 결과 positive regulation of apoptosis, RNA splicing, nuclear import, protein import into nucleus, actin cytoskeleton organization and biogenesis, chromatin modification, mRNA metabolic process, nuclear lumen, adherens junction과 같은 용어들이 네트워크 상에서 근접해 있었다.

하지만, 실제적으로 네트워크 분석을 통해 밝혀낸 결과를 in vivo와 in vitro 상에서 실험적으로 연구하고 검증하기 위해서는 생물학적 기능용어의 관계가 유전자들의 관계에서는 어떻게 연결되는 지 확인할 수 있어야 한다.

이를 확인하기 위해서 처음 진행했던 DAVID Functional Annotation Classification Chart의 결과를 이용하였다. DAVID Functional Annotation Classification Chart의 결과에는 각 생물학적 기능 용어에 관련 있는 유전자의 정보를 얻을 수 있기 때문에, 췌장암 유전자 발현 데이터에서 발현 변화를 보이는 유전자들의 기능적 연관성을 파악할 수 있다.

본 연구에서는 세포막 이동과정에 관계 있는 단백질과 네트워크 상에서 근접해 있는 생물학적 기능 용어들을 가지고, 각 용어에 포함되어 있는 췌장암에서 발현의 변화가 있는 유전자들을 조사하였다. 그리고, 유전자 수준에서의 관계를 DAVID 알고리즘을 이용하여 분석하였고, 생물학적 기능용어 분석에서와 마찬가지로 유전자 수준의 관계를 네트워크 지도로 만들었다.

이러한 결과들은 췌장암의 암화 과정에 관련된 유전자 발현으로 인해서 발생하는 기능의 변화를 생물학적 관점에서 파악함으로써 기존의 방식과 비교해 볼 때, 단순 통계학적인 방법으로 선별된 결과에 비하여 실험적으로 검증해야 할 후보 유전자를 선별하는 과정에 변별력을 높여주고, 췌장암 유전자 발현 데이터에서 기능적으로 연결되어 있는 유전자간의 관계를 파악할 수 있는 정보를 제공함으로써 향후 췌장암의 기능 변화 연구에서 어떤 유전자들이 서로 관련 있는지 확인 할 수 있다.

대량의 생물학적 정보를 시스템적인 관점에서 분석하는 방법을 적용하는 데 있어서 중요한 것은 “분석 결과를 어떻게 해석하며 가설을 어떠한 방식으로 명확하게 증명하고 설명하며 실험적으로 입증 할 수 있는가?” 이다. 그렇기 때문에, 정보에 대한 변별력이나 입증을 위해, 여러 분석 방법의 개발이 필요하며, 다른 생물학적 데이터베이스의 정보나 문헌 자료 조사를 수집하여 통합하는 것이 요구된다.



[영문]Pancreatic adenocarcinoma is a more aggressive type of cancer which is limited to unsatisfactory prognosis. For this reason, there is an urgent need to find a candidate gene that can be used as a diagnostic marker and a therapeutic target.

In recent years, high-throughput experiments have shed light on this subject through the analysis of gene expression profiles in cancer research. However, difficulties in extracting identical targets from preexisting statistically filtered gene lists that are too large and complex still remain.

Therefore, we conducted a systematic approach in answering the question of which biological functions are influenced within pancreatic cancer and more specifically, which genes are correlated to its progression.

The analysis results yielded from a process using DAVID Algorithm displayed over-expressed terms which are grouped in 14 clusters and under-expressed terms which are grouped in 13 clusters. Using these results, we constructed a network of biological functional annotation terms in pancreatic cancer microarray data.

In order to verify the usefulness of this network, we searched for biological functional annotation terms related to Ras protein signal transduction. According to the network, terms related to immune response and inflammation were assigned to group1, terms related to RNA processing and regulation of cytoskeleton organization were assigned to group2, and terms related to apoptosis and nuclear transport were assigned to group3. In addition, Ras, Rho, and Small GTPase mediated signal transduction terms were located in the center of the sub-network.

Moreover, we wanted to determine the effect of vesicular membrane protein transport pathway related gene expression on pancreatic cancer progression. In the result, we ascertained that the small GTPase mediated signal transduction is located in the center of the sub-network and connected to its five neighbors. Then, we constructed a global gene expression network among small GTPase related biological functional annotation terms, based on clustering results between the components.

On the whole, the meta-analysis results and biological annotation term networks provide pragmatic information regarding the correlations between terms which involve pancreatic cancer progression. In addition, we found an inter-related gene network which is useful in identifying genes related to pancreatic cancer using statistical and biological concepts.
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 3. Dissertation
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/124578
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links