Deep Learning-Based Segmentation of Respiratory Muscles in CT Images for Exploring Potential Biomarkers of Respiratory Function
Authors
최인성
College
College of Medicine (의과대학)
Department
Others (기타)
Degree
석사
Issue Date
2024-02
Abstract
호흡기 질환은 세계 주요 사망원인중 상위권에 위치해 있으며, 질병이 진행됨에 따라 호흡기능과 같은 필수적인 기능들이 저하되어 환자의 및 예후와 생명에 치명적인 영향을 미친다. 호흡근(respiratory muscle)은 환자의 호흡능력 및 질병의 예후와 밀접한 관련이 있다. 따라서 호흡근을 정량적으로 분석하면 호흡능력을 평가하는데 도움을 줄 수 있으며, 호흡기 질환 환자의 예후와 삶의 질(Quality of life)을 판단하는 측면에서도 유용한 정보를 제공할 수 있다. 본 연구에서는 흉부 컴퓨터 단층 촬영(computed tomography)영상 데이터를 활용하여 호흡근의 부피와 밀도를 정량적으로 측정하는 딥러닝 기반의 분할(segmentation) 및 분류(classification) 모델을 개발했다. 이후 호흡근의 정량적 지표가 호흡능력과 관련된 바이오마커로서 활용될 수 있는지에 대한 가능성을 검토하기 위해, 모델로부터 산출된 호흡근의 부피 및 밀도를 폐 기능 검사(pulmonary function tests; PFTs)의 파라메터와 상관관계 분석을 진행했다. 딥러닝 모델 학습 데이터는 40대부터 80대에 이르는 다양한 연령대와 성별, 그리고 정상 및 호흡기질환을 가진 총 3,200명의 흉부 CT DICOM 영상 약 60만장과 이에 대응하는 흉부 근육조직 마스크 또는 호흡근 마스크 파일로 구성되어 있다. 모델 학습은 흉부의 모든 근육 조직을 분할하기 위한 근육 조직 분할 모델, 호흡근 분할에 특화된 호흡근 분할모델, 3종류의 호흡근 분류를 위한 호흡근 분류모델로 세분화하여 진행했으며 세 모델 모두 관심영역을 집중(attention)학습하는데 특화된 Attention U-Net 구조를 사용했다. 해당 모델들은 우수한 분할 성능을 보였으며 영상의학과 전문의의 전문적 판독 견해와도 높은 일치를 보여주었다. 사전학습 모델과 호흡근 분할 모델의 정확도는 각각 0.9823, 0.9688이었으며, 손실 값은 각각 0.0177, 0.0312였다. 호흡근 분류모델에 대한 정확도와 손실 값은 각각 0.993과 0.007이었다. 폐 기능과 관련된 PFTs 파라메터와의 상관분석에서 호흡근의 부피가 호흡능력 평가 및 폐질환의 진단에 직접적으로 활용되는 PFTs 파라메터와 강한 상관관계를 보였으며, 이는 호흡근의 부피가 호흡 능력 판단 및 호흡기 질환의 진단과 치료에 있어 새로운 바이오마커로 활용될 수 있는 가능성을 보여줬다. 호흡근의 밀도는 부피에 비해 PFTs 파라메터와 상대적으로 낮은 상관관계를 보였지만, 해당 정량지표가 다양한 의료 환경에서 활용 가능성이 있을 것이라는 점에서 의미가 있었다.
Respiratory diseases are primary global mortality causes, significantly affecting respiratory functions and patient outcomes. The respiratory muscle's (RM) performance plays a pivotal role in breathing abilities. Consequently, quantitative analysis of the RM can assist in evaluating the respiratory function and offer invaluable insights into patient quality of life. In this study, we developed a deep learning-based segmentation and classification model to quantitatively measure the volume and density of respiratory muscles using thoracic computed tomography (CT) imaging data. Subsequently, to explore the potential of using these quantitative indices of respiratory muscles as biomarkers related to breathing ability, we conducted a correlation analysis between the volume and density of respiratory muscles derived from the model and parameters from pulmonary function tests (PFTs). The deep learning model training data comprised approximately 600,000 thoracic CT DICOM images from a diverse group of 3,200 individuals, spanning ages 40 to 80, including various genders, and encompassing both normal and respiratory disease conditions. Accompanying these images were corresponding thoracic muscle or respiratory muscle mask files. The training was segmented into three specialized models: a muscle tissue segmentation model for dividing all thoracic muscles, a specialized segmentation model for respiratory muscles, and a classification model for three types of respiratory muscles. All three models employed the Attention U-Net architecture, which is specifically designed for focused learning on areas of interest. These models demonstrated superior segmentation performance and showed high concordance with the professional assessments of radiologists. The accuracies of the pre-trained model and the respiratory muscle segmentation model were 0.9823 and 0.9688, respectively, with corresponding loss values of 0.0177 and 0.0312. The accuracy and loss values for the respiratory muscle classification model were 0.993 and 0.007, respectively. In the correlation analysis with pulmonary function tests (PFTs) parameters related to respiratory function, the volume of respiratory muscles showed a strong correlation with PFTs parameters used directly in the diagnosis of pulmonary diseases, suggesting the potential of respiratory muscle volume as a new biomarker in the diagnosis and treatment of respiratory diseases. Although the density of respiratory muscles had a relatively lower correlation with PFTs parameters compared to volume, the significance of this quantitative indicator lies in its potential applicability in various medical settings.