▶게티이미지뱅크
‘디지털 뉴딜’은 정부가 추진하는 ‘한국판 뉴딜’의 핵심축이다. 한국판 뉴딜은 위기에 빠진 한국 경제를 건지면서 동시에 선도형 경제로 일으켜 세우겠다는 비전을 내걸고 있는데, 그 방법에 디지털 전환이 있다. 정부는 기술 융합을 통해 기존 산업, 정부 기능, 사회기반시설 등을 한 단계 발전시키겠다는 포부를 여기에 담았다.
디지털 뉴딜의 성격을 가장 잘 보여줄 수 있는 대표 사업이 ‘데이터 댐’이다. 문재인 대통령은 기업 방문 현장에서 데이터 댐을 미국의 후버댐에 빗대 한국판 뉴딜의 상징처럼 소개하기도 했다. 뉴딜은 원래 대공황을 극복하기 위해 프랭클린 루스벨트 미국 대통령이 1933년 도입한 경제·사회 정책 이름이다. 당시 미국이 후버댐 건설로 많은 일자리를 창출했듯 우리는 21세기에 데이터 댐을 구축해 그런 목표를 달성할 수 있으리란 게 정부의 설명이다. 데이터 댐은 파급력 등을 고려해 우선 도입 과제로 선정된 뉴딜의 ‘10대 대표과제’ 가운데 첫 번째로 등장하기도 한다.
공익적 활용 땐 한국판 뉴딜의 유용한 기반
데이터 댐의 내용은 마치 실제 댐에 물을 모으듯 정부가 데이터를 모아 제공하겠다는 것이다. 정부가 보유한 데이터를 공개하고, 민간의 수집·가공 등에 지원금을 대고, 거래를 활성화하는 플랫폼을 구축하는 등의 내용이다. 데이터는 이른바 4차 산업혁명의 가장 주목받는 기술인 인공지능(AI) 개발과 연구의 핵심이 되는 재료이기도 하다. 정부는 이렇게 모인 데이터를 바탕으로 민간에서 인공지능 기술을 활용한 다양한 아이디어가 샘솟고 데이터 경제 전환이 가속화되길 기대하고 있다.
데이터가 디지털 혁신의 바탕이란 점에서 데이터 댐은 순기능을 살려 공익적으로 활용하면 한국판 뉴딜의 유용한 기반이 될 수 있다. 지식정보사회에서 혁신은 과학과 연구로부터 비롯되며 데이터 과학 발전을 위해선 좋은 데이터 세트가 필요하다. 정부가 이 사업을 통해 구축하고자 하는 핵심 데이터 세트 가운데 하나인 한국어 말뭉치(코퍼스)의 경우를 보자. 말뭉치란 컴퓨터가 인간의 말을 이해하고 분석할 수 있게 하는 ‘자연어 처리’ 분야에 쓰이는 잘 정리된 문자 자료를 말한다. 자연어 처리는 음성 비서, 채팅 봇을 비롯해 활용도가 넓은 ‘인간의 말을 알아듣는 기계’를 만드는 핵심 기술인데, 현재 세계적으로 이 분야 연구는 주로 영어만 눈부시게 발전하고 있다. 영어 데이터 세트가 가장 풍부하기 때문이다.
‘알파고’를 만든 구글 딥마인드의 시배스천 루더 연구원은 자신의 블로그에서 이러다간 “당신이 무슨 말을 하느냐가 당신이 받는 정보, 교육, 인간관계를 결정”하는 위험한 미래로 갈 수 있다고 지적한 바 있다. 특정 언어를 잘 이해하는 인공지능만 급격히 발전하는 경우, 그 말을 쓰지 않는 언중은 기술의 혜택에서 소외되기 마련이다. 만약 좋은 한글 데이터 세트가 많이 생긴다면 이런 상황이 조금은 달라질 것이다.
개인정보 침해 없도록 역기능 통제해야
그런데 데이터 댐 사업은 디지털 뉴딜 정책이 어떤 위험을 안고 있는지 보여주는 사례이기도 하다. 데이터 댐은 후버댐과 다르다. 둘이 결정적으로 다른 지점은 후버댐의 물은 다 같은 물이지만 데이터 댐의 데이터는 모두 같은 데이터가 아니란 점이다. 그 가운데 어떤 데이터는 누군가에게는 정말 감추고 싶은 사생활일 수 있다. 시민단체 진보네트워크센터는 “그 데이터의 중요한 부분은 바로 우리의 ‘개인정보’다. 정부가 정보 주체의 권리를 침해하지 않는 방식으로 처리되어야 할 데이터를 (그렇지 않은 데이터와) 구분하지 않는다면 문제가 될 수 있다”고 지적했다.
디지털 뉴딜의 다른 여러 과제도 데이터 댐과 마찬가지로 한편으로는 성과가 기대되지만 한편으론 다른 가치를 훼손할 위험을 안고 있다. 지능형(AI) 정부 사업의 경우 국민 개인의 맞춤형 행정을 구현한다면 서비스 품질을 높일 수 있을 테지만, 개인 확인을 위한 모바일 신분증은 동시에 감시 위험을 높이는 기술이다. 스마트 의료 인프라 사업은 감염병 위험으로부터 의료진과 환자를 보호하고 의료 편의를 높이는 효과가 기대되지만 동시에 의료 공공성에 미치는 영향을 우려하는 목소리도 높은 것이 현실이다.
따라서 디지털 뉴딜이 목표로 하는 것처럼 국가나 사회 전반을 ‘데이터화’하고 ‘디지털화’할 경우 여기에 따라오는 역기능을 최소화하는 게 무엇보다 중요하다. 디지털이란 결국 0과 1의 전기 기술을 이용해서 정보를 빠르게 처리하는 것이다. 인간의 사고와 가치관이 더 빠르고 넓게 전달되도록 증폭하는 기술인 것이다. 그러나 디지털의 역기능을 적절히 통제하지 못한다면 우려의 목소리도 이어질 수 있다는 사실을 주의해야 한다.
권오성_ <한겨레> 기자로 미래, 과학 등을 맡던 중 뉴욕 시러큐스 대학에서 컴퓨터 기술과 저널리즘의 융합 석사과정을 마쳤다. 인공지능 등의 기술이 사회와 미디어에 가져올 영향에 관심이 많다. <데이터 과학> 등의 책을 번역했다. 현재 건국대 언론홍보대학원에서 데이터 저널리즘 과목을 가르치고 있다.