0 443

Cited 0 times in

Development of information extraction system on genetic studies for applications in genomics

Other Titles
 질병 관련 유전학 연구에 대한 정보 검색 시스템 개발 및 유전체학 연구에서의 응용 
Authors
 이환석 
Issue Date
2004
Description
Dept. of Medical Science/박사
Abstract
[한글]

인간 유전체 염기서열 완성과 고속 대용량 유전형 검색기술의 발달로 인해 유전자와 질병간의 관련성 연구가 급속히 증가하고 있으며 이에 따라 보다 효과적이고 효율적인 연구를 위해 기존 연구 결과에 관한 체계적인 데이터베이스의 필요성이 증대되고 있다. 본 연구에서는 정보 추출 기법에 기반한 텍스트 마이닝 시스템인 MedClue 시스템을 개발하고 이를 이용해 의학 문헌 초록 데이터베이스인 MEDLINE 에 수록된 질병 관련 유전자에 대한 정보를 분석하였다. 총 44,489건의 관련성 연구 결과 초록으로부터 37,147건의 교차비가 검색되었는데 평균값은 5.81이고 중앙값은 3.02이며 가장 큰 값은 3,364.48이다. 37,147건의 교차비 중 약 9.9%인 3,704건은 유전자와 관련된 교차비로 평균값은 4.95이고 중앙값은 2.85이며 가장 큰 값은 229.8이다. 또한 총 5,571건의 염색체 연관성 연구 결과로부터 3,699건의 연관도가 검색되었는데 평균값은 6.13이고 중앙값은 4.06 이며 가장 큰 값은 99.6이다. 한편 갑상선 암과 흡연간의 이색적인 양성 연관성 및 정신분열증과 양극성 장애에 공통적인 핵심 염색체 부위 발견 등을 통해 MedClue 시스템이 추출한 체계적이고 포괄적이며 독특한 생물정보학 정보가 유전자와 질병 또는 다양한 현상들간에 관한 독창적인 가설을 창출하는데 활용될 수 있음을 검증하였다.



[영문]As the number of genetic association studies is exponentially increasing, a systematic database is needed in order to design effective strategies of the study and appropriately interpret the results. The MedClue system, an information extraction system for genetic knowledge, was developed and applied to analyze the whole results of the association and linkage studies in MEDLINE database. From 44,489 abstracts on association studies, 37,147 positive odds ratios were extracted. The average odds ratio was 5.81, the median was 3.02 and the highest odds ratio was 3,364.48. Among 37,147 positive odds ratios, 3,704 (9.9%) were results of genetic association studies. The average odds ratio from genetic association studies was 4.95, the median was 2.85 and the highest genetic odds ratio was 229.8. And from 5,571 abstracts on linkage studies, 3,699 LOD scores were extracted. The average LOD score was 6.13, the median was 4.06 and the highest LOD score was 99.6. The MedClue system is a new bioinformatics tool based on text mining technology which collates all relevant genetic information into systematic resources and novel hypotheses making the exploration and interpretation easier and creative.
Full Text
https://ymlib.yonsei.ac.kr/catalog/search/book-detail/?cid=CAT000000059770
Files in This Item:
제한공개 원문입니다.
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 3. Dissertation
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/122126
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links