기대와 우려가 공존하다, 데이터 3법 읽어보기
[DK PLAY/트렌드] 2020. 2. 25. 16:05


데이터의 수집과 분석이 중요하다는 이야기에 공감하지 않을 사람은 많지 않을 것 같다. 그런데 그 분석 대상이 내 일상과 행동, 습관이라면 어떻게 받아들일까? 데이터 분석과 사생활, 고개를 갸웃거릴 수밖에 없는 주제다. 최근 많은 논란 속에서 국회 통과된 ‘데이터 3법 개정안’이 바로 이 아슬아슬한 경계에 선을 긋는 제도다.



데이터 3법은 ‘개인정보 보호법’, ‘정보통신망 이용 촉진 및 정보보호 등에 대한 법률(정보통신망법)’, 그리고 ‘신용정보의 이용 및 보호에 관한 법률(신용정보법)’을 말한다. 언뜻 보면 서로 잘 연결되지 않아 보인다. 이 세 가지의 공통점은 바로 ‘개개인이 만들어내는 정보’이고, 개정안은 이 정보를 안전하고 가치 있게 활용할 수 있는 체계와 규제를 담고 있다.


‘활용’과 ‘규제‘는 사실상 정 반대에 있는 개념이다. 이 법률 개정안이 입법 통과되는 과정에서도, 아니 통과된 이후 지금까지도 논란이 이어지는 이유 역시 활용을 더 유연하게 해야 한다는 입장과 개인정보를 더 지켜야 한다는 입장이 맞부딪치기 때문이다.

당장 어느 쪽이 옳다고 판단할 수 있는 문제는 아니다. 이 데이터 3법 개정에 대한 고민은 애초에 한쪽의 손을 들어주는 것이 목적이 아니다. 디지털 트랜스포메이션을 겪고 있는 우리의 현실을 반영하는 고민, 그리고 사회적인 합의점을 찾아가는 과정이다.




데이터의 중요성은 모두가 잘 알고 있고, 이해하고 있다. 특히 4차 산업혁명에 대한 불안감이 휩쓸고 지나가면서 빅데이터의 가치와 이를 효과적으로 읽어내는 인공지능의 역할에 대해 관심이 늘어가고 있다. 우리가 인공지능 기술에 대해 단순한 호기심이나 연구 소재를 넘어 직접적인 충격을 받은 사건은 딥마인드의 ‘알파고’ 대국이다.


알파고에 대해 언뜻 컴퓨터 프로그래밍을 잘해서 사람만큼 똑똑한 두뇌를 만들어낸 것이라고 생각할 수 있다. 핵심 기술인 머신러닝은 인공지능 기술의 한 갈래로, 그 설계가 우리 두뇌의 뉴럴 네트워크와 비슷한 구조를 갖고 있고, 결과 역시 사람의 행동과 비슷하기 때문이다. 하지만 현재 인공지능 기술은 ‘사고’와는 거리가 멀다. 머신러닝, 그리고 그 상위 개념인 딥러닝은 막대한 데이터를 바탕으로 특정 패턴을 파악하는 데에서 혁신을 만들어내는 기술이다.



알파고 역시 바둑판을 이해하는 것이 아니다. 알파고는 인공지능 모델이 설계된 이후 막대한 양의 기보를 학습했다. 알파고는 처음 익명으로 바둑계에 등장했던 2015년 말, 100만 건의 바둑 기보를 학습한 상태였다. 바둑의 확률은 무한하지만 대체로 사람들이 바둑돌을 올려놓는 패턴에 대해서는 학습이 되어 있었다.


100만 건이면 1년에 1천 건의 대국을 한다고 해도 1천 년이 걸리는 양의 데이터다. 알파고는 이후로도 세상의 기보를 있는 대로 흡수해 이세돌 9단을 비롯해 중국의 커제 9단을 누르고 세계 최강의 바둑을 두었다. 나중에는 데이터를 스스로 만들어내 ‘알파고 대 알파고’의 대국을 통해 새로운 바둑을 만들어내기도 했다.


이 알파고의 핵심은 ‘데이터’에 있다. 물론 인공지능 모델을 효과적으로 설계하고, 이를 재빨리 처리하는 클라우드 기술의 중요성을 무시할 수는 없지만 결국 이 모든 기술은 세상에 공개된 데이터를 얼마나 효과적으로 다루느냐에 달려 있다. 알파고는 그동안 공개된 바둑 인공지능 중에 데이터를 가장 잘 다루기 때문에 가장 강력한 인공지능 기술로 꼽히는 것이다. 그리고 그 과정에서 ‘바둑 기보’라는 공개되어 있고, 수 천 년 동안 쌓아온 막대한 데이터를 ‘자유롭게’ 활용할 수 있었다.


이는 꼭 바둑만의 문제가 아니다. 디지털 트랜스포메이션이 화두가 되면서 거의 모든 현장에서 데이터의 중요성이 강조되고 있다. 하지만 그 관심에 비해 사회적으로 데이터에 대한 경험은 사실상 매우 부족하다는 지적이 계속 나오고 있다. 데이터 활용에 가장 목마른 기업들 역시 어떤 데이터를 어떻게 모으고, 분석해야 할지에 대해 답을 내지 못하는 경우가 많다.




많은 기업들이 데이터 분석을 위해 수없이 많은 데이터를 담고 있다. ‘일단 담아보자’가 가장 비슷한 표현일 듯하다. 막대한 컴퓨팅 파워와 저장 공간, 빅데이터 솔루션 등을 통해 일단 데이터를 보관하는 데에서 데이터 비즈니스가 출발하는 경우가 늘어나고 있다. 하지만 그에 따라 데이터 보관 비용이 만만치 않고, 제대로 정리되지 않아 활용이 어려워지면서 관리에 어려움을 겪는 기업도 그만큼 많다. 어떤 데이터가 어떻게 필요한지에 대해 정확히 이해하기 어렵기 때문이다.


이를 탓할 수는 없다. 아니, 오히려 가장 효과적인 대응책이라고 보는 것이 맞다. 데이터를 다루는 데에 어려움을 겪는 이유는 당연히 데이터 경험이 부족하기 때문이고, 이는 서서히, 그리고 반드시 좋아지게 될 부분이다. 하지만 그 과정에서 의미 있는 데이터를 놓칠 가능성만큼이나 뜻하지 않은 데이터가 수집될 가능성도 높다. 특히 기업들의 입장에서는 이용자들이 제품과 서비스를 통해 어떤 반응을 보이고, 어떻게 행동하는지에 대한 분석을 위해 이용자들의 정보를 수집할 수밖에 없다.


그 과정에서 기업들은 적지 않은 개인정보를 갖게 됐고, 이는 보안부터 사생활 침해 등 다양한 사회적 문제로 이어지곤 했다. 좋은 의도로 시작했다는 것은 썩 의심할 이유가 없지만, 결과는 꼭 뜻하는 대로 흘러가는 것만은 아니다. 자연스럽게 개인정보 보호에 대한 규제는 강화될 수밖에 없다. 특히 우리나라는 인터넷이 일찍 보급되기 시작했고, 온라인 상거래와 결제, 금융 서비스들이 빠르게 자리를 잡으면서 데이터에 대한 책임과 규제도 상당히 높은 편이다. 한 마디로 개개인의 데이터를 쉽게 활용할 수 없는 상황이다. 동시에 규제 역시 데이터가 안전하게 보호되는 장치로서의 역할은 미흡하다는 지적이다.



데이터 3법에 대한 기대와 걱정도 바로 이 부분에서 시작된다. 이 법의 의도는 빅데이터와 인공지능의 중요성이 높아지는 현 상황에서 여러 가지 데이터를 복합적으로 해석하는 다차원 분석을 통해 통찰력을 얻을 수 있도록 데이터 수집과 분석을 법적으로 체계화하는 데에 있다.


‘데이터의 수집’은 곧 ‘데이터의 위협’으로 연결된다. 데이터를 수집하고 분석하는 주체는 대개 기업과 정부 기관이다. 데이터 3법과 연결되는 핵심 목표 역시 이 데이터 수집 주체들 간의 데이터를 원활하게 주고받으면서 그 가치를 키우는 데에 있다. 물론 데이터를 통해 더 나은 서비스와 상품을 만드는 것을 목표로 하지만 그 부작용은 감시와 위협이 뒤따를 수밖에 없다. 


이미 기업들은 주민등록번호와 휴대폰 번호를 비롯해 적지 않은 정보를 수집해 왔고, 이를 바탕으로 스팸 전화와 스팸 메일이 태어났다. 또한 데이터를 제대로 관리하지 않으면서 이를 바탕으로 한 피싱, 스미싱 등이 사회의 골칫거리로 떠올랐다.




우리 사회는 이 데이터에 대해 어떤 입장일까? 기업들의 불만은 데이터를 원활하게 수집하고, 또 여러 데이터를 합치는 것이 어렵다는 입장이다. 반면 이용자들은 기업들이 너무 많은 개인정보를 원하고, 관리가 치밀하지 못하다고 생각한다.


데이터 3법이 가야 하는 방향은 바로 이 거리감을 해소하는 것이다. 더 체계적으로 데이터를 확보할 수 있도록 기틀을 잡고, 그 안에서 개인정보와 프라이버시를 강화하는 것이다. 예를 들면 개개인의 의료 정보를 체계적으로 관리해주는 서비스를 통해 여러 병원에서 검사와 진료를 받고 투약받은 기록을 바탕으로 체계적인 건강 관리를 하고, 이를 바탕으로 적절한 건강 관리나 보험 서비스를 연결하는 것이다. 이를 통해 전국 어떤 병원에서도 본인 인증만 마치면 지속적인 진료를 받을 수 있고, 각종 검진 기록을 분석해 놓칠 수 있는 사소한 질병을 미리 확인할 수 있다. 반면 그 안에서 질병 기록이 기업에 공유되면서 보험료에 영향을 끼치고, 진학이나 취업에서 부당한 대우를 받을 수 있다. 데이터는 양날의 검으로 작용할 수 있다는 이야기다.


물론 이 이야기는 철저히 가정이다. 데이터 3법 개정의 방향도 이런 긍정적인 효과와 부작용을 두루 파악하고 관리할 수 있는 방법으로 흘러가야 한다. 최근 세계를 불안에 몰아넣고 있는 코로나19 바이러스에 대한 두려움 역시 불확실성에서 시작된다. 이 불안을 해소하는 방법은 정보의 투명한 공개다. 개인이 만든 ‘코로나맵’이라는 앱은 질병관리본부에서 공개한 데이터를 알기 쉽게 지도에 그리면서 확진자들의 동선을 파악할 수 있도록 했다. 확진자들의 동선을 공개한 공공정보와 이 데이터의 활용을 고민한 코로나맵은 데이터의 긍정적인 활용을 보여준다.



데이터 3법은 진통과 논란 끝에 통과됐지만 많은 숙제를 남기고 있다. 하지만 이를 통해 데이터가 조금 더 안전하고 체계적으로 활용될 수 있는 길을 열었다는 것은 명확하다. 우리 사회가 데이터를 단숨에 잘 다루지 못하는 것처럼 이 법안 역시 한 번에 모든 입장을 완벽하게 조율할 수는 없다. 


하지만 기업이 데이터를 더 조심스럽게, 그리고 편리하게 수집하고 분석할 수 있는 길이 열린 것은 사실이다. 어떻게 보면 다소 보수적이었던 개인정보에 대해 사회가 한 발짝 뒤로 물러선 셈이다. 유럽의 GDPR이나 미국의 CCPA등 기존 데이터 활용 환경을 더 안전하게 만드는 해외의 상황과 반대로 다소 보수적으로 접근하던 개인 데이터를 개방하는 것이 우리의 상황인 만큼 기업들은 데이터를 더 조심스럽게 다루고, 국회와 정부 역시 이를 치밀하게 관리해야 할 것이다.


데이터는 4차 산업혁명의 연료라고 불린다. 그리고 그 연료는 사회 구성원, 더 나아가 그 분석 결과의 소비자들이 선순환을 기대하고 먼저 내어준 것이다. 당연하지만 그 선순환 고리에 말썽이 생기면 곧바로 연료가 끊어질 것이다. 데이터 3법은 바로 그 사회의 규칙과 합의를 정하는 가장 합리적인 역할을 해 주어야 한다. 이는 곧 4차 산업혁명을 마주하는 우리나라 전체의 경쟁력으로 이어지는 책임이기도 하다.



글: IT 칼럼니스트 최호섭


main



  • 황혜진 2020.02.26 13:39 ADDR 수정/삭제 답글

    끝에 이미지를 불러올 수 없다는 문구가 나옵니다.