2021-06-24 09:55 (목)
[데이터융합포럼 특별기고-11] 최근 가명정보처리 분쟁에 대한 소고
상태바
[데이터융합포럼 특별기고-11] 최근 가명정보처리 분쟁에 대한 소고
  • 길민권 기자
  • 승인 2021.05.26 13:43
이 기사를 공유합니다

안전한 데이터 활용 촉진을 위해 실무적 이슈를 논의하는 ‘데이터융합포럼’은 정기적으로 회원들의 ‘데이터 보호와 활용’ 관련 기고문들을 데일리시큐 독자들과 공유해 나갈 계획이다. 이번 기고는 데이터융합포럼 김한우 회원의 ‘최근 가명정보처리 분쟁에 대한 소고'에 대한 내용이다. <편집자 주>

가명·익명처리는 데이터3법(개인정보보호법, 정보통신망법, 신용정보법)이 개정 시행된 ‘20.8.5. 이전과 이후로 크게 나누어 볼 수 있을 것 같다. 이전은 법적근거가 미약한 비식별 조치 가이드라인에 따라, 이후에는 법적근거에 기반을 두어 가명정보의 처리(결합, 제공, 활용)를 진행할 수 있게 되었으며, 조금씩 그 활용의 움직임이 늘어나고 있는 것으로 보인다. 가명처리 관련 분쟁은 데이터3법 이전에는 SK텔레콤 등의 데이터 결합에 대한 시민단체의 형사고발을, 데이터3법 이후에는 통신3사에 대한 시민단체의 가명처리 관련 민사소송/개인정보 분쟁조정 신청/개인정보 침해신고를 대표적인 사례로 언급할 수 있을 것 같다. 본고에서는 가명정보처리 관련 분쟁의 쟁점을 데이터3법 개정 전후에 따라 비교해보고 가명처리 수요자의 처리의 목적을 달성하면서 가명처리에 따른 우려사항에 대한 현실적인 대안을 살펴보고자 한다. (*이 기고문의 내용은 저자의 개인적인 견해이며, 소속 기관의 공식적인 견해가 아님을 미리 밝혀둔다.)

1. 시민단체-가명처리기업간 가명처리 분쟁

‘17년 11월 민주사회를 위한 변호사 모임(이하 ‘민변’)外 11개 시민단체들은 SK텔레콤 외 23개 기업 및 기관에 대해 서울중앙지검에 “개인정보보호법(이하 ‘보호법’이라함) 위반혐의”로 형사고발을 진행하였다. 이 때 쟁점은 데이터 결합의 근거인 가이드라인(‘개인정보 비식별 조치 가이드라인’, ‘16.6월, 국무조정실 5개 부처 합동)가 비록 관계부처 합동 가이드라인 이였으나, 법적 지위를 갖지 못한 “가이드라인”에 기반 한 것으로 관련 기업 등은 개인정보의 수집/제공/이용과 관련하여 법적인 보호를 받을 수 없었다는 것이다.

반면, ‘20년 12월 민변外 3개 시민단체들은 3대 통신사에게 각각 제기한 민사소송(SKT), 개인정보 분쟁조정신청(KT), 개인정보 침해신고(LGU+)에서 가명처리 사실여부 확인 및 가명처리 대상 개인정보 확인 그리고 기지국에 기록된 개인정보 일체의 열람을 요구하여 “개인정보의 열람 요구권(이하 ’열람권‘) 및 처리정지 요구권(이하 ’처리정지권‘)”이 쟁점이 되었다. ’17년 분쟁과 ‘20년 분쟁의 큰 차이는 “가명처리”를 규정하고 있는 개정 데이터3법(’20.8월)에 있다고 할 수 있겠다.

시민단체들은 동일한 業을 영위하는 기업체에게 실질적으로는 동일한 개인정보관련 분쟁임에도 활용가능한 모든 형태로 이슈를 제기하였고, 비교적 빠른 결론을 얻을 수 있는 분쟁조정과 침해신고에 대해서는 결론이 내려진 상태다.

각각의 내용을 살펴보면 KT의 분쟁조정 건은 ‘개인정보의 항목이 아닌 실제 내용을 열람할 수 있도록 하라’는 분쟁조정위의 조정이 있었고, 양측은 조정안을 수용하는 것으로 마무리되었다. LGU+는 ‘홈페이지를 통해 열람 및 처리정지 방법에 대해 답변을 하였으므로 위반이라고 보기 어렵다’는 조사결과로 종결처리 되었다. 동일 업을 영위하나 가장 강한 대응을 받은 SKT는 데이터 3법 개정 후 실제 가명처리를 진행하여 자사 홈페이지에 가명정보의 처리내역을 게시해 두고 있는 업체였던 터라 대응 수위에 차이가 있었던 것으로 추측된다. 이 사례는 데이터 3법 개정 후 실제 가명처리를 실행한 업체에 대해 본인정보의 가명처리여부 확인, 본인정보의 가명처리 정지를 요구한 첫 사례로 동의 받지 않은 데이터의 활용과 프라이버시 보호에 관한 중요한 선례가 될 것으로 예상된다.

2. 가명처리 여부 확인요구(열람권)와 가명처리 정지 요구(처리정지권)

먼저, 열람권 관련하여 일반적인 개인정보에 대해서는 보호법 제35조에 따라 정보주체는 개인정보처리자가 처리하는 자신의 개인정보에 대한 열람을 요구할 수 있으나, 가명정보에 대해서는 동법 제28조의7에 따라 개인정보처리자가 정보주체의 가명처리에 대한 열람요구(가명처리 여부 확인요구)를 받아들이지 않을 근거가 있다. 만약 동 조항이 없어 열람요구를 받아들여야 한다면, 모순이 발생할 수밖에 없다. 즉, “가명정보”는 ‘개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가정보가 없이는 특정 개인을 알아볼 수 없도록 처리하는 것‘(동법 제2조 제1의2호)이므로 “추가정보”가 있으면 특정 개인을 알아볼 수 있겠으나, 추가정보는 가급적 파기하는 것이 권고되고 있으며(동법 제28조의4 제1항 및 동법 시행령 제29조의5 제1항 제5호), 가명정보를 재식별 해서도 아니되며 특정 개인을 알아보게 되는 경우 즉시 해당 정보의 처리를 정지하고, 회수·파기하여야 하기 때문이다(동법 제28조의5). 따라서 가명처리 된 이후의 가명처리 여부 확인은 그 자체가 법에서 금지되는 행위에 해당하게 될 것이다.

다음으로 가명처리에 있어서 보호법 제37조에 정의된 처리정지권을 살펴보면 “가명처리 전 개인정보에 대해 가명처리 금지”요구와 “가명처리 후 가명정보에 대한 처리정지”로 나눠볼 수 있을 것이다. “가명처리 전 가명처리 금지”요구는 개인정보처리자의 가명처리활동 전에 본인정보에 대한 가명처리 금지를 적극적으로 표현하는 것으로 앞의 사례와는 달리 기술적으로는 받아들일 수 있는 부분이라 할 수 있겠다. 다만 개인정보처리자가 동법 제28조의2 제1항에 규정된 목적인 통계작성, 과학적 연구, 공익적 기록보존 등을 위해서 가명처리 하는 경우는 (정보주체의 처리정지요구권에 준하는) 개인정보처리자의 정당한 이익이 있는 것으로 볼 수 있을 것으로 보인다. 반면 동 요구사항을 받아들여 처리 정지요구자의 데이터가 모집단에서 제외 처리될 때 모집단과 동일한 분포로 제외되지 못할 것이므로 제외된 부분만큼 데이터에 왜곡이 발생하여 모집단의 특성을 왜곡시킬 수 있는 문제가 있을 것으로 판단되며, 이는 데이터의 가치를 떨어뜨려 왜곡된 분석 결과를 유발하여 공공복리에 반하는 의사결정을 할 위험성을 가진 조치라고 볼 수 있을 것으로 보인다.

“가명처리 후 가명정보에 대한 처리정지”는 전술한 열람요구권의 사례에 따라 성립할 수 없는 사항으로 추가논의는 불필요할 것으로 보인다.

3. 가명처리에 대한 시민단체의 우려점

시민단체 입장에서 가명처리에 대해 우려하는 점은 ‘17년 형사고발관련 내용(2019년 한국인권보고서, 2019.12.9., 민주사회를 위한 변호사 모임)에서 살펴볼 수 있는 데 그 내용은 다음과 같다.

첫째로 "프라이버시 보호모델의 불완전함“을 들고 있다. 동 문서에서는 “k-익명성, l-다양성 모델만으로는 만감속성(일반 속성자) 값을 미리 알고 시도되는 민감속성 기반 공격을 막지 못함”이라고 표현하고 있으며, 이는 “다른 정보”의 활용에 따른 위험성을 뜻하는 것으로 볼 수 있겠다.

둘째로는 "재식별가능성 존재"를 들고 있다. “자사보유 데이터 셋을 전문기관을 통해 다른 기업의 데이터 셋과 결합시켜 돌려받은 기업으로서는 비식별 조치 이전 데이터 셋에서 개인을 알아볼 가능성이 있다.”라고 기술하고 있으며, 이는 “추가정보”의 활용에 따른 위험성을 뜻하는 것으로 볼 수 있을 것 같다.

셋째로 "익명데이터를 재식별한 사례의 존재“을 꼽고 있다.” 2019년 7월 과학 저널 <네이처 커뮤니케이션즈>에 발표된 영국 임페리얼 칼리지 런던 연구팀의 논문내용에서 ”15개 인구 통계적 속성(나이, 성별, 결혼 여부 등)만 알아도 그 어떤 익명화된 데이터라 할지라도 99.98% 정확도로 개인을 구분해 낼 수 있었다.“라고 말하고 있으며, 이 또한 ”다른 정보“의 활용에 따른 위험성에 기인한 것으로 보인다.

결론적으로 우려사항을 정리해보면 “가명정보도 재식별 될 가능성을 배제할 수 없다”는 것이고, 그 원인은 "다른 정보 또는 추가정보를 참조할 수 있기 때문"으로 정리해 볼 수 있을 것 같다.

4. 가명·익명처리의 효익

이러한 우려에도 불구하고 가명·익명처리를 하는 이유는 효익이 있기 때문이 아닐까 생각한다. 대표적인 사례는 서울시 올빼미버스 사례(이하 ‘올빼미버스’)를 들 수 있을 것 같다.

올빼미버스는 ‘13.9월부터 서울시에서 운행하고 있는 심야버스로 심야시간 대중교통 수요관련 서울시민들의 제안에 서울시가 ①유동인구 밀집도 분석(이동통신사의 통화량정보), ②택시 승·하차정보 분석(교통카드 데이터)을 통해 노선을 확정하여 운행되고 있다.

이러한 실제 데이터 분석에 기반한 정책집행으로 정책당국은 한정된 예산을 수요가 있는 곳에 효율적으로 집행할 수 있게 되었고, 시민들은 심야시간에도 저렴한 비용으로 귀가할 수 있는 이들을 얻게 되었다.

본 사례는 공공기관에서 민간기업체가 보유하고 있는 개인정보를 활용하여 공공복리를 목적으로 활용한 사례이다. 하지만 민간기업체가 상업적 연구목적으로 데이터를 사용하는 것이 꼭 지탄받기만 해야 하는지는 되짚어볼 필요가 있을 것 같다. 만약 사기업체인 어떤 버스회사가 회사의 영업이익 증대를 목적으로 수요가 많은 지역에 신규버스 노선을 개설할 목적으로 상기 사례와 유사하게 데이터(산업적연구)를 분석하여 버스 노선을 신설 요청하였다면 그 것은 정말로 공공복리 증진은 없고, 일개 버스업체의 사익추구로만 바라봐야하고 금지되어야 하는 것이라고 할 수 있을까?

5. 가명처리 제외 적용 시의 명과 암

상기 올빼미버스의 데이터 분석사례와 가명처리 전 정보의 처리정지권(가명처리 제외적용요청)을 연관 지어서 살펴보면 어떤 일이 벌어질 수 있을까?

조금은 억지스럽지만 다음과 같은 가정을 해보면 어떻게 될까?

*가정 : 특정 지역(ex. 강남역)에서 개인정보자기결정권 관련 홍보활동의 영향으로 해당 지역에서 활동하는 시민 전체가 통신사를 상대로 가명정보처리 정지요구를 하였고, 동 사항이 받아들여져서 상기 유동인구 밀집도 분석 시 특정 지역의 정보가 모수에서 제외됨.

개인적으로는 가명정보 처리정지권으로 본인의 프라이버시를 지킬 수 있겠지만, 결과적으로 동 데이터 분석 시 해당지역(ex. 강남역)은 유동인구가 별로 없는 것으로 측정되는 데이터 왜곡이 발생되어 잘못된 의사결정을 하게 될 수 있으며, 이러한 잘못된 의사결정의 피해는 사회적으로는 잘못된 의사결정에 따른 예산낭비를, 개인적으로는 본인의 공공복리 수혜 기회를 놓치는 원인이 될 수도 있을 것이다.

아울러 이러한 가명정보 처리 관련 분쟁과 민원 대응 문제에 더불어 가명정보의 효용저하(왜곡)까지 있게 된다면 그 어떠한 기업/기관에서도 가명정보를 처리하려 들지도 않을 것이며, 그렇게 되는 경우 4차 산업혁명 시대를 대비하기 위해 그 간의 산고(産苦)로 탄생한 가명정보관련 제도의 존폐까지 얘기해야할 수도 있을 것 같다.

6. 맺음말

지금까지 가명정보처리 관련 분쟁사례, 가명처리 관련 우려사항에 대해 살펴보았다.

데이터 3법 개정으로 경제 각 부분에서 데이터 결합을 통한 새로운 서비스의 등장이 기대된다. ‘17년 분쟁의 재항고가 ‘19.12월 최종 기각 되었고, 동 분쟁의 쟁점이 된 가명정보 결합의 근거가 ’20.8월 법제화되었지만, 아직은 제도 시행 초기이며, SK텔레콤에 대한 소송이 진행 중인 때문인지 기대치를 충족할 정도로 활성화 되지는 않은 것으로 보인다. 그러나 데이터 활용이 가

데이터융합포럼 김한우
데이터융합포럼 김한우

져오는 효익은 분명하며, 그 오·남용에 대한 우려 또한 실존하는 것이 사실이다. 아직은 시작 단계인 데이터 활용 부문에서 정부는 제도를 잘 정비하고, 개인정보처리자는 정보주체의 프라이버시를 보장하기 위한 자발적인 조치를 강화하고, 정보주체 및 시민단체는 잘못된 데이터의 활용이 발생치 않도록 감시하는 등 모든 경제주체들이 적극적인 자세로 데이터 융합에 참여할 경우, 이러한 데이터 활용은 모든 경제주체의 편익을 높이는 데 크게 기여할 것으로 생각한다.

[글. 데이터융합포럼 김한우]

# ’데이터융합포럼’은 2016년 6월 개인정보 비식별조치 가이드라인 발간에 맞춰 금융회사, 핀테크회사, 금융분야 유관기관 등의 실무자와 해당분야 전문가 중심 ‘비식별 연구반’이라는 이름으로 시작. 가이드라인 해석 및 실무적 해결방안에 대해 주제를 선정해 발제자가 발제하고 토론하는 학습 모임으로 발전. 인공지능(AI)기술로 대표되는 4차산업혁명시대를 맞아 핵심 자원인 안전한 데이터 활용을 촉진하기 위해 실무적 이슈에 대해 논의하는 포럼이다.

★정보보안 대표 미디어 데일리시큐!★


관련기사