▶크라우드웍스 데이터사업팀에서 근무하는 김 모 씨.
크라우드웍스 프로젝트 매니저 김 모 씨
인공지능 시스템이 제대로 작동하기 위해 ‘양질의 데이터’는 필수 요소다. 각종 데이터를 마치 댐처럼 한곳에 모은 것을 ‘데이터 댐’이라 부른다. 물이 댐에 모여 방류되듯 여러 곳에서 생산되는 데이터를 제대로 수집·분류·가공해야 인공지능 시스템을 구축할 수 있다. 데이터 댐을 곧 ‘디지털 뉴딜’이라 부르는 이유다.
과학기술정보통신부는 디지털 뉴딜 중 데이터 댐의 핵심과제인 ‘인공지능 학습용 데이터 구축사업’(이하 데이터 구축사업)을 추진 중이다. 이는 인공지능 서비스 개발에 필수적인 인공지능 학습용 데이터를 대규모로 구축·개방하는 사업이다.
데이터 댐 자료 수집·가공 기관서 근무
20대 초반의 김 모 씨는 인공지능 데이터 관련 기업인 크라우드웍스 데이터사업팀에서 프로젝트 매니저로 일하고 있다. 크라우드웍스는 과기정통부가 추진하는 데이터 구축사업 크라우드소싱 참여기관이다. 크라우드소싱이란, 국민 누구나 온라인으로 언제 어디서나 데이터의 수집-정제-가공-품질관리 등 데이터 구축 전 과정에 참여할 수 있는 방식의 일자리를 말한다. 김 씨는 데이터 수집·가공 업무를 하는 작업자들(이하 크라우드워커)을 관리하고 있다.
김 씨가 7개 공개 대화방에서 관리하는 크라우드워커는 50~60명. 크라우드워커들은 주어진 주제와 관련해 사진이나 동영상의 데이터를 수집하고, 이를 인공지능이 학습할 수 있도록 가공하는 등의 일을 한다. 예를 들어 ‘맛집 탐방’이 주제라면, 각 지역 맛집에서 선보이는 음식 관련 사진·영상 데이터를 수집해 오거나, 수집한 데이터에 ‘라벨’을 붙여 구분하는 이른바 ‘데이터 라벨링’ 작업을 하는 식이다. 인공지능에게 특정 데이터가 무엇인지 반복해 인식시키는 기초 작업이라고 할 수 있다.
“인공지능 시대 데이터 수집·가공 일자리 활짝”
김 씨는 2019년 10월경부터 부업으로 현재 일하는 곳에서 크라우드워커로 일을 시작했고, 능력을 인정받아 9월 같은 회사에 정규직으로 취업했다. 배드민턴 선수를 꿈꿨다가 건강상 이유로 꿈을 접은 그는 배드민턴 관련 앱을 만드는 프로젝트에 크라우드워커로 참여하면서 ‘프로젝트 매니저’라는 두 번째 꿈을 이뤘다. 초기엔 ‘내가 수집해 보내는 사진과 영상 데이터가 어디에, 어떻게 쓰이는 걸까’ 궁금증이 일어 회사 측에 문의한 적도 있었다.
“디지털 뉴딜 관련해 정부가 추진하는 데이터 댐 구축에 쓰일 것으로, 앞으로 인공지능 시대에는 이 같은 데이터 구축 및 가공 업무가 늘고 중요해질 거라고 설명해 주더군요. 그 후 시범으로 나온 앱을 보고 저도 모르게 뿌듯했습니다. 배드민턴을 칠 때 어떻게 서브 및 리시브를 하는지, 어떤 자세가 올바른지 등을 알려주는 앱이었죠. 제가 수집한 자료에 디지털 기술이 더해져서 이런 서비스가 탄생할 수 있다는 게 놀라웠고, 자부심도 느꼈습니다.”
수집·라벨링은 남녀노소 쉽게 접근 가능
현재 그가 관리하는 공개 대화방에선 크라우드워커들이 ‘일본어’ ‘얼굴(표정)’ 등을 주제로 관련 데이터를 수집 중이다. 디지털 뉴딜 핵심 사업으로도 불리는 ‘다양한 데이터 수집 및 가공’은 누구나 쉽게 할 수 있다. 남녀노소 누구나 출퇴근에 구애받지 않고, 자투리 시간을 활용해 할 수 있다는 점에서 다양한 계층을 대상으로 일자리를 제공한다.
“제가 배드민턴 관련 데이터 수집에 참여했던 것처럼 각자 관심 분야에 따라 일을 선택할 수 있다는 점도 장점입니다. 프로젝트 매니저 관리 아래 대화방에서 마치 팀 프로젝트를 하듯 일하는 것도 하나의 즐거움이고요. 온라인에서 공동의 프로젝트를 수행하며 성취감을 맛볼 수 있다는 점도 또 다른 특장점이죠.”
데이터 구축사업이 가시화되면서 크라우드워커 대상 교육도 활발하게 진행되고 있다. 과기정통부는 10월부터 크라우드워커의 전문성을 함양하기 위해 인공지능·데이터 기본교육 프로그램 등을 운영하고 있고, 크라우드소싱 참여기관도 자체 교육 프로그램을 운영해 성장 기회를 제공한다.
“데이터 구축 업무 중요성 더 커질 것”
크라우드워커의 업무 중 하나인 ‘데이터 라벨링’ 등을 두고 일각에서는 ‘알바형 단기 일자리’라고 바라보기도 하지만 정부의 디지털 뉴딜 정책이 가동되면서 이 분야 일자리 양상은 많이 달라지리라는 게 현장의 전망이다. 1930년대 미국이 ‘후버댐’ 건설로 대공황을 극복한 것처럼, ‘데이터 댐’을 구축해 국가 디지털 대전환을 이끌고 일자리를 창출하겠다는 것이 한국판 디지털 뉴딜의 핵심이다.
그만큼 디지털 댐 구축에 필요한 인력의 역할은 중요해지고 있다. 김 씨의 의견도 이와 다르지 않다. “자투리 시간을 활용한 부업이나 정규직 등 고용 형태와 관계없이 관련 일자리는 늘어날 거라고 생각합니다. 디지털 뉴딜은 이미 시작됐고, 이에 따라 양질의 대량 데이터가 구축돼야 하거든요. 특히 인공지능 기술이 고도화하면서 더 정교하고 정확한 데이터 수요가 증가하고 있습니다. 그런 배경에서 크라우드워커의 업무뿐 아니라 제가 수행하는 프로젝트 매니저 업무도 더 늘어날 거라고 생각합니다.”
김청연 기자
인공지능 학습용 데이터 구축사업이란?
추가경정예산(추경) 2925억 원으로 진행하는 데이터 구축사업은 인공지능 서비스 개발에 필수적인 10대 분야 150종의 인공지능 학습용 데이터를 대규모로 구축·개방하는 사업이다. 584개 기관·기업이 참여하는 추경 사업으로 인공지능 산업 발전은 물론 코로나19발(發) 일자리 위기 극복에 기여하는 것을 중요한 목표로 추진되고 있다.
과기정통부는 이를 위해 사업 공고 시 수행 기관들이 빅데이터 기획·분석가, 인공지능 기술 및 응용서비스 개발자 등 다양한 분야의 인력을 직접 고용하는 것을 의무화(1억 원당 2.4명 이상)하고, 일자리 효과가 큰 크라우드소싱 방식을 적극적으로 도입할 수 있도록 관련 예산 비중에 따른 가점제를 운영해 많은 일자리가 창출되도록 설계했다.