60 89

Cited 0 times in

Optimizing the maximum reported cluster size for multinomial-based spatial scan statistic

DC Field Value Language
dc.contributor.author문지수-
dc.date.accessioned2023-12-11T02:12:02Z-
dc.date.available2023-12-11T02:12:02Z-
dc.date.issued2023-02-
dc.identifier.urihttps://ir.ymlib.yonsei.ac.kr/handle/22282913/197114-
dc.description.abstractCorrectly identifying spatial disease cluster is a primary issue in public health and epidemiology, and the spatial scan statistic is widely used for detecting spatial disease clusters in spatial epidemiology and disease surveillance. The spatial scan statistic has been developed for various probability models, such as Bernoulli, Poisson, exponential, ordinal, normal and multinomial models. Specifying the maximum reported cluster size (MRCS) is vital when using the spatial scan statistic. Many studies have set the MRCS as the default setting, which is 50% of the total population. However, if we use the MRCS value as the default setting, the clusters larger than true clusters may be reported, which include less meaningful regions. Recently, an optimization measure using the Gini coefficient has been developed to choose an optimal MRCS value. However, it is difficult to clearly define the Gini coefficient for the multinomial-based spatial scan statistic because the Gini coefficient is inapplicable to nominal categorical data. In this study, we propose a spatial cluster information criterion (SCIC) for selecting the optimal MRCS value for the multinomial model. Since the SCIC is a likelihood-based method, it can be applied to the spatial scan statistic regardless of the probability model. We conducted a simulation to evaluate the performance of the proposed method in the multinomial-based spatial scan statistic, as compared with that in the ordinal-based spatial scan statistic. Three evaluation metrics are used: Sensitivity, positive predicted value (PPV), and misclassification. We also conducted a real data analysis using the Korea Community Health Survey (KCHS) data to demonstrate the usefulness of the proposed method. 공간 질병 군집을 정확하게 탐색하는 것은 역학 및 공중보건 분야에서 중요한 문제이다. 공간 검색 통계량은 공간 역학 및 질병 감시에서 공간 클러스터를 탐색하기 위한 방법으로 널리 사용되는 방법 중 하나이다. 공간 검색 통계량은 베르누이, 포아송, 지수, 순서형, 정규 및 다항 모형과 같은 다양한 확률 모형에 대하여 개발되었다. 공간 검색 통계량을 사용할 때 연구자들은 최대 도출 군집 크기를 지정해 주어야 한다. 많은 연구에서 최대 도출 군집 크기를 기본 설정인 전체 인구의 50%로 설정하여 분석한다. 그러나 최대 도출 군집 크기를 기본 설정인 50%로 지정하면 덜 의미 있는 지역을 포함하여 실제 클러스터보다 큰 클러스터가 보고될 수 있다. 최근 연구에서 최적의 최대 도출 군집 크기를 선택하기 위하여 지니계수를 사용한 최적화 기준이 개발되었다. 그러나 지니계수 방법은 명목형인 범주형 자료에 적용하기 어렵기 때문에 다항 모형 기반의 공간 검색 통계량에 대한 지니계수를 명확히 정의하기는 어렵다. 따라서 본 연구에서는 다항 모형 및 순서형 모형 기반의 공간 검색 통계량에서 최적의 최대 도출 군집 크기를 선택하기 위하여 공간 클러스터 정보 기준(SCIC) 방법을 제안하고자 한다. 제안한 SCIC 방법은 우도 기반의 방법으로 모든 확률 모형에 대하여 적용이 가능한 방법이다. 본 연구에서는 순서형 모형 기반의 공간 검색 통계량과 비교하여 다항 모형 기반의 공간 검색 통계량에서 제안한 SCIC 방법의 성능을 평가하기 위한 시뮬레이션 연구를 수행하였다. 시뮬레이션 연구에서 사용한 성능 평가 지표는 민감도, 양성예측도, 오분류율이다. 또한 본 연구에서 제안한 SCIC 방법의 유용성을 설명하기 위하여 지역사회건강조사 자료를 사용한 실제 자료 분석을 수행하였다.-
dc.description.statementOfResponsibilityopen-
dc.rightsCC BY-NC-ND 2.0 KR-
dc.titleOptimizing the maximum reported cluster size for multinomial-based spatial scan statistic-
dc.title.alternative다항분포를 기반으로 하는 공간 검색 통계량에서 최대 도출 군집 크기의 최적화-
dc.typeThesis-
dc.contributor.collegeCollege of Medicine (의과대학)-
dc.contributor.departmentOthers (기타)-
dc.description.degree박사-
dc.contributor.alternativeNameMoon, Jisu-
dc.type.localDissertation-
Appears in Collections:
1. College of Medicine (의과대학) > Others (기타) > 3. Dissertation

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.