[전문가 진단] 데이터 3법, 빅데이터·인공지능에 기여하려면
[전문가 진단] 데이터 3법, 빅데이터·인공지능에 기여하려면
  • 박성현 미래한국 발행인·서울대 통계학과 명예교수
  • 승인 2020.03.06 10:50
  • 댓글 0
이 기사를 공유합니다

지난 1월 9일 데이터 3법 개정안이 발의된 지 1년 2개월 만에 어렵게 국회를 통과하‘여데 이터 강국’으로 가는 초석이 마련되었다.
지난 1월 9일 데이터 3법 개정안이 발의된 지 1년 2개월 만에 어렵게 국회를 통과하‘여데 이터 강국’으로 가는 초석이 마련되었다.

지난 2011년 시장조사업체인 가트너는 “데이터는 21세기의 원유이며 데이터가 미래 경쟁 우위를 좌우한다”고 강조했다. 맞는 말이다. 지금 우리는 4차 산업혁명시대에 살고 있으며 이 시대의 핵심기술은 빅데이터, 인공지능, 자율주행자동차 등이다. 이 기술들은 모두 데이터 기반의 기술이며 데이터 활용 여부가 기술 수준을 말한다.

데이터 중에서 개인정보는 큰 부분을 차지하고 있다. 그동안 ‘데이터 3법(개인정보보호법, 정보통신망법, 신용정보법)’에 막혀 개인정보를 활용하는 각종의 신규 사업에 전혀 발전이 없었다. 그러나 다행스럽게도 지난 1월 9일 데이터 3법 개정안이 발의된 지 1년 2개월 만에 어렵게 국회를 통과해 ‘데이터 강국’으로 가는 초석이 마련되었다. 이 개정안은 1월 28일 국무회의에서 의결되었고 2월 4일 공포되어 6개월 후인 8월 5일에 시행될 예정이다.

지금까지는 주민등록번호처럼 개인을 특정할 수 있는 정보뿐 아니라 다른 정보와 결합해 개인의 신분이 드러날 가능성이 있는 데이터도 개인정보로 간주되어 본인 동의 없이 이를 사용할 수 없었다.

이런 이유로 스위스 국제경영개발원(IMD)이 발표한 ‘세계 디지털 경쟁력 순위 2019’에 따르면 한국의 디지털 경쟁력은 조사 대상 63개국 중 10위의 상위권이면서도 ‘빅데이터 활용 및 분석’ 항목은 40위, ‘국제적 경험’ 항목은 52위, ‘은행 및 재정 서비스’ 항목은 52위, ‘공공-민간 부문 파트너십’ 항목은 41위로, 데이터의 공개 및 활용 부문에서 모두 낙후된 상황이다. 데이터 3법 개정안은 이런 낙후성을 깨고 데이터 산업에서도 진정한 세계 디지털 경쟁력을 회복할 수 있는 절호의 기회이다.
 

‘데이터 3법 개정’의 내용

이 개정안의 주요 내용은 개인정보보호법에서는 가명정보(pseudonymous information)의 사용을 가능하게 하고, 또한 개인정보 관리·감독을 개인정보보호위원회(개보위)로 일원화하고, 정보통신망법에서는 온라인상 개인정보 감독기능을 개보위로 이관하고, 신용정보법에서는 가명정보를 금융 분야에 개인의 동의 없이 사용가능하게 한 것 등이다.

이번 법 개정의 핵심은 특정인을 식별할 수 있는 정보의 상당 부분을 가린 가명정보는 통계 작성, 공익적 기록 보존, 과학적 연구(산업적 연구 포함) 등에 정보 소유자의 사전 동의 없이 사용할 수 있게 한 것이다. 또한 이 법안에서는 익명정보(anonymous information)의 개념도 도입했다.

예를 들어 ‘홍xx, 010-xxx-xxxx, 1971년 1월생, 남성, 서울 중구 중림동, 2019년 6월 신용카드 사용금액 100만원’처럼 데이터로서의 가치는 있지만 개인을 특정하기 어렵게 한 것이 가명정보다. 익명정보는 가명정보보다 이름, 생년월일 등 사람을 조금이나마 구분할 수 있는 정보도 완전히 제거한 정보이다. 익명정보는 개인정보보호법의 보호 대상에서 완전히 제외된다. 상업적으로 자유롭게 사용할 수 있다.

이 개정안은 세 개 부처(행정안전부, 과학기술정보통신부, 금융위원회)가 나눠 관장해온 개인정보 보호를 개보위가 일괄적으로 관장하고, 이 위원회는 대통령 직속 기구에서 독립적인 중앙행정기관으로 격상되어 위원장이 국무회의에 참석하게 된다. 또한 개보위는 개인정보 컨트롤타워로서 법령 개선이나 정책 수립·집행, 개인정보 침해에 관한 조사·처분도 할 수 있다. 개보위는 2011년 발족한 대통령 소속 행정위원회이나, 데이터 3법이 개정되면서 장관급의 독립기구가 되면서 데이터 산업 진흥에 막중한 역할을 하게 되었다.

그러나 이 데이터 3법 개정안이 제대로 기능을 발휘해 빅데이터·인공지능 산업 등 데이터 기반 산업 전반의 활기찬 동력이 되기 위해서는 아직 갈 길이 멀고 철저히 준비해 8월부터 데이터 강국으로 가는 힘찬 시동을 걸어야 할 것이다. 가명정보라 할지라도 개인의 데이터를 자유롭게 사용할 수 있으면 빅데이터 산업은 활력을 찾을 수 있다. 인공지능 산업도 인공지능의 핵심기술이 데이터에 의한 기계학습, 심층학습 등이므로 데이터의 자유로운 사용은 필수적인 요건이다.

데이터 3번 개정 후에 그 후속 조치로, 빅데이터·인공지능 산업을 활성화하기 위해 앞으로 5개월간 무엇을 준비해야 하는가? 첫 째로 중요한 것은 가명정보 데이터의 구체적인 활용 범위를 규정하는 시행령이 조속히 마련되어야 한다. 개정안에 명시된 것처럼 가명정보를 통계 작성, 공익적 기록 보존, 연구 등의 목적으로 활용하는 데는 문제가 없겠지만 가명정보의 활용 가능 범위가 애매하여 수요가 많은 산업 현장, 소비자 서비스 등의 용도로 사용할 수 있느냐 하는 것이다.

시행령 개정안에 구체적인 활용 범위를 명시하지 않으면 향후 분쟁의 소지가 크다. 기업들이 데이터 3법의 개정을 환영하면서도 사업 추진을 미루는 것은 ‘악마는 디테일에 있다’는 불안감 때문이다. 개인 식별이 가능해 마음대로 사용이 제한된 ‘개인 정보’와, 식별이 불가능하지만 마음대로 사용이 허용된 ‘익명 정보’ 사이 있는 ‘가명 정보’ 사용 범위에 대해 기업이 안심하고 개인 정보를 사용할 수 있도록 명확한 사용 범위를 제시해 줘야 한다.

두 번째로, 가명정보가 특정 개인을 식별할 수 없도록 처리한 정보지만 이를 고의로 뜯어 맞춰 개인을 재식별하여 이를 악용하는 경우이다. 시민단체 등 일각에서는 재식별 가능성을 언급하며 “국가가 국민의 인권을 포기했다”고 우려하면서 가명정보의 사용을 엄격히 제한해야 한다고 주장하고 있다. 개정안에서는 가명정보로부터 고의로 조작해 재식별하고, 이를 악용하여 매출을 올릴 경우에는 5년 이하의 징역, 5천만 원 이하의 벌금, 전체 매출액의 3% 이하의 과징금을 부과하는 조항을 가지고 있다.

그러나 재식별 가능성 염려 때문에 가명정보 사용을 원천적으로 제한하는 것은 ‘빈대 무서워 초가산간을 태우는’ 우를 범하는 것과 같다. 따라서 가명정보 사용은 자유롭게 하되 악용하는 사례가 발견되면 엄하게 죄를 묻도록 하면 될 것이다. 즉 가명정보는 자유롭게 사용하게 하고 사후에 범법 행위가 발견되면 엄하게 죄를 묻는 ‘네거티브 규제’ 방향으로 하는 것이 바람직하다.

세 번째로, 데이터를 사용하기 편리하도록 표준화시키고 품질이 우수한 데이터를 생산하는 것이다. 통계학에서는 ‘쓰레기 데이터에서는 쓰레기 정보만 나온다(Garbage data in, garbage information out)’이란 말이 있다. 우리나라 빅데이터의 대부분은 공공 데이터이다. 정부 각 부처에서 생산하는 데이터의 품질관리를 기본적으로 해야 한다. 그리고 유사한 데이터를 만드는 여러 기관들은 표준화를 철저히 해 상호 호환성이 있도록 해야 빅데이터로 가치가 높다.

예를 들면 수없이 많은 병원들의 의료 데이터가 아직 사용 편리하게 표준화가 되어 있지 않다. 이런 의료 데이터도 빅데이터의 효용성을 높이기 위해 조속한 표준화가 필요하다. 각 부처 공공 데이터의 품질관리는 통계법에 의해 통계청이 하도록 되어 있다. 통계청에서 좀 더 엄밀하게 정기적으로 데이터 품질관리를 할 수 있도록 정부는 통계청에 힘을 실어주고 여건을 조성해 줘야 할 것이다.

네 번째로, 데이터 3법이 개정되면서 국제적으로도 데이터 유통에 관심을 가져 데이터 산업의 글로벌화 환경을 조성해야 한다. 데이터 기반 디지털 교역이 통상의 중심 이슈로 부상하고 있다. 따라서 데이터의 국제 이동 관련 제도를 정비할 필요가 있다. 한국 기업들은 세계 각지에 상품 기획, 연구개발, 생산, 유통, 마케팅 등 가치사슬을 갖추고 있다. 이 과정에서 인공지능, 전자상거래 플랫폼 등을 적극 활용하고 있다.

빅데이터와 AI(인공지능)에 기반한 자율주행차는 이미 현실화 되었다. 사진은 현대 자율주행차 /현 대차
빅데이터와 AI(인공지능)에 기반한 자율주행차는 이미 현실화 되었다. 사진은 현대 자율주행차 /현대차

데이터의 표준화와 우수 데이터 생산해야

주요 교역국과 이런 활동에 필요한 데이터를 원활하게 주고받을 수 있느냐는 글로벌 비즈니스의 핵심 요소이다. 예를 들어보자. 유럽연합(EU)은 2018년 5월 GDPR(EU의 개인정보보호법)을 강화해 유럽 시민의 정보가 해외 서버로 나갈 경우 승인을 받도록 했다.

우리나라의 개별 기업들이 이 승인을 받기 위해 EU와 직접 논의할 경우 시간과 비용이 많이 들어 쉽지 않다. 일본은 이미 작년 1월 EU로부터 정부 차원의 GDPR 적정성 평가를 통과해 일본의 개별 기업이 유럽 시민의 데이터를 구할 때 일일이 EU의 승인을 받지 않아도 구할 수 있도록 만들었다. 개보위도 일본과 동일하게 EU와 GDPR 적정성 관련 협의를 조속히 실시해야 하고 GDPR 등의 국제적 데이터 법제와의 정합성 제고로 자유롭게 전 세계 데이터 교환에 참여할 수 있는 기반을 마련해야 할 것이다.

다섯 번째로, 공신력 있는 데이터 전문기관들이 조속히 지정되어야 한다. 데이터 3법이 개정되면서 기업 사업 관련 데이터를 한 부처에서뿐 아니라 여러 부처에서 동시에 구하려는 대기업들이 늘어날 전망이고 데이터로부터 정보를 창출해 비즈니스를 시도하는 벤처기업들도 많이 늘어날 전망이다. 그러나 데이터 3법이 개정되어도 개별 기업이 자체적으로 수집 기관이 다른 데이터들을 결합하는 것은 여전히 불법이다. 정부 부처의 전문기관을 통해서만 가명정보 등의 비식별 정보의 결합이 가능하고 이를 개별 기업들은 사용할 수 있다. 개정안에서는 데이터 거래를 주관할 전문기관의 요건을 시행령에 정하도록 했다. 개정안이 시행되는 8월 이전에 전문기관들이 조속히 지정되어야 한다.

이는 빠르면 빠를수록 좋다. 관련 부처들(행정안전부, 과학기술정보통신부, 금융위원회 등)은 데이터 전문기관 지정을 위한 객관적인 기준 마련을 조속히 해야 할 것이다. 초기에는 공공기관을 중심으로 전문기관을 지정해야 하나 어느 정도 안정되면 신뢰성 있는 민간기관도 지정이 가능할 것으로 판단된다. 데이터 전문기관이 지정되었을 때 이 기관들은 데이터를 사용하려는 기존 기업이나 스타트업들에게 저렴하게 봉사해 주는 자세로 업무에 임해야 할 것이다. 이 기관들이 이런저런 까다로운 조건을 붙이거나 가명정보의 변환 운영·비용을 높이는 것은 데이터 사용을 억제하는 행위로 데이터 산업 활성화에 도움이 안 된다.

여섯 번째로, 데이터 3법 개정안 통과로 본인 정보의 통합조회, 신용&·자산 관리 등 서비스를 제공하는 마이데이터(MyData) 산업이 활기를 띨 전망이다. 마이데이터 사업자는 수집된 정보를 바탕으로 개인이 정보관리를 돕고 개인 맞춤형 보험 상품 추천, 금융상품 자문 등의 투자자문도 가능할 것이다. 따라서 통계모형 및 기계학습에 기초한 개인 신용평가, 인공지능을 활용한 온라인 보험료 산정 등을 기계화하고 자동화된 데이터 처리도 가능해질 전망이다.

특히 신용정보법 개정안 통과로 업체들이 개인의 신용정보를 상당 부분 활용할 수 있는 길이 열렸다. 그동안 개인정보 활용에 어려움을 겪어온 인슈어테크(보험+핀테크) 업체들은 이번 데이터 3법 통과로 업무 확장에 날개를 달 수 있게 됐다. 이러한 신규 사업 관리와 관련이 있는 정부 부처들은 이에 필요한 시행령 개정이나 사업 안내 준비를 조속히 마련해 둘 필요가 있다. 데이터 3법 개정안은 데이터 경제 활성화에 긍정적으로 작용할 전망이지만 이를 극대화시키려면 범정부 차원에서의 철저한 사전 준비가 필요할 것이다.

박성현 미래한국 발행인·서울대 통계학과 명예교수
박성현 미래한국 발행인·서울대 통계학과 명예교수

마지막으로, 데이터 3법 개정과 더불어 데이터 경제를 활성화하려면 데이터 인재 양성에도 힘써야 한다. 빅데이터 인재를 양성하는 데이터사이언스(데이터과학) 전공이 대학에 많이 들어서기 시작해 좋은 현상이지만 아직 대학에서의 데이터사이언스 교육은 초기단계를 벗어나지 못하고 있다. 아직까지 가명정보를 사용하지 못하게 하여 데이터사이언스 교육에 비용을 지불하고 외국 데이터를 사용하는 경우가 대부분이었다. 대학의 교육용 빅데이터도 국내 데이터를 사용할 수 있도록 정부는 공공 데이터의 일반인 접근도 용이하게 하고 국가 기밀에 해당하는 공공 데이터 외에 가능한 모든 공공 데이터의 공개 여건도 조속히 마련해야 한다.

늦게나마 데이터 3법 개정안이 통과된 것은 다행스러운 일이며, 정부와 국민이 힘을 합쳐 이 개정안이 우리 사회에서 활기차게 활용될 수 있도록 환경을 조성한다면 데이터 산업의 진흥을 기반으로 데이터 경제가 활성화 될 것이고, 결국 국가경쟁력이 제고될 것이다.

이를 통해 ‘4차 산업혁명의 쌀’로 불리는 빅데이터를 금융과 의료, 산업, 인공지능, 공익적 연구 등 다양한 분야에서 활용되고, 나아가 글로벌 시장에서 한국 기업들이 타국의 데이터를 마음껏 활동할 수 있도록 새로운 환경이 조성된다면, 우리나라가 4차 산업혁명의 핵심 기술인 빅데이터와 인공지능 부분에서 세계적 선두 주자로 부상하는 기반이 조성될 것이다.

본 기사는 시사주간지 <미래한국>의 고유 콘텐츠입니다.
외부게재시 개인은 출처와 링크를 밝혀주시고, 언론사는 전문게재의 경우 본사와 협의 바랍니다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.