0 153

Cited 0 times in

개인정보 비식별화가 실증적 연구결과에 미치는 영향

Other Titles
 The effect of an empirical study result for the de-identification of personal information 
Authors
 박해지 
Degree
석사
Issue Date
2017
Description
보건정보관리 전공
Abstract
연구배경 정부3.0과 빅데이터 활용 확산을 통해 데이터 개방·공유에 대한 요구의 확대가 이어지는 가운데 개인정보 보호 강화에 대한 사회적 요구 역시 지속적으로 증가하고 있다. 개인정보 보호의 규범적 제재를 하기위해 개인정보보호법은 점점 더 강화되어가고, 개인정보의 ‘보호와 활용’을 동시에 할 수 있는 대안으로 제시가 된 것이 개인정보 비식별화(de-identification)이다. 이러한 비식별화가 얼마나 사생활의 보호와 빅데이터 활용을 동시에 만족시킬 수 있는지를 구체적으로 살펴 볼 필요가 있다. 따라서 본 연구에서는 개인정보 보호라는 주제를 놓고 제도적, 기술적 방법의 분석과 고강도의 비식별화 조치의 효용성을 실제보건의료데이터를 활용하여 판단해 보고자 한다. 대상 및 방법 본 연구는 빅데이터의 활용과 개인정보의 보호라는 큰 틀에서의 상반된 문제를 바탕으로 법 제도/기술을 통한 개인정보를 살펴보는 이론적 고찰 형태의 1차 연구와, 국민건강영양조사의 2014년 원시데이터를 ARX Freeware 프로그램을 활용한 비식별화를 실제 실시하여 그 결과를 분석해 보는 2차 연구로 진행했다. 연구결과 법제적 측면에서의 개인정보보호법은 외형적으로 충분히 OECD와 EU에서 제시하는 규정과 비슷하거나 오히려 더 강력한 형태를 갖추고 있으나 이런 제재는 빅데이터 산업 활성화에 악영향을 끼쳐왔다. 좀 더 강력한 규정보다는 개인정보의 구체적 개념정의와 규제의 대상을 명확히 할 필요가 있고, 정보 사용을 위한 동의를 사전 동의(Opt-in)방식만 고수하기 보다는 사후 동의 (Opt-out)방식의 활용도 검토해야 한다. 기술적 측면에서 비식별화의 개념과 정의의 이론적 고찰을 바탕으로 실제 데이터를 K-Anonymity모델을 활용하여 비식별화 해 보았다. 적절한 변수들의 조합으로 만들어진 표준 로지스틱 회귀식을 도출해 내고, 이를 기준으로 자료의 가치 변화를 살펴보았다. 비식별화의 수준에 따라, 데이터의 형태(연속형, 이분형, 다분형)에 따라 각 변수의 설명력을 나타내는 C값과 Hosmer and Lemeshow Goodness of Fit Test의 P-value에 변화가 발생했고, 유의한 결과 값을 나타냈던 변수가 유의하지 않은 값으로 변하였다. 가장 큰 변화가 있었던 다분형 변수에 있어서는 비식별화의 수준에 따라서 데이터의 구성자체가 불규칙적으로 바뀌는 것을 확인했다. 결 론 정보주체의 개인정보보호와 산업발전을 위한 빅데이터 활용의 균형 있는 발전은 아주 어려운 과제이다. 뚜렷한 개인정보의 기준과 비식별화의 범위·방법 제시 없이 시행한 비식별화는 대규모의 국가자원을 들여 수집한 각종 자료의 가치를 무력화 시키는 결과를 낳게 된다. 데이터 활용의 목적과 데이터의 구성에 따라 정의와 규정을 달리 적용시켜 산업의 특성을 인정한 접근이 필요하다.
Appears in Collections:
4. Graduate School of Public Health (보건대학원) > Others (기타) > 2. Thesis
URI
https://ir.ymlib.yonsei.ac.kr/handle/22282913/159965
사서에게 알리기
  feedback

qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse

Links