본문으로 바로가기

문화/생활

“신은 죽었다.”

19세기 말 유럽 지성계에 큰 파문을 일으켰던 독일의 철학자 니체의 선언이다. 철학자는 직관 또는 성찰을 통해 이런 깨달음을 감지했는지 모른다. 그런데 이것, 근거가 있단다. 19세기 초 각종 책에서 1000단어당 1회 정도 언급되던 ‘신(God)’은 19세기 말 언급 빈도가 절반 이하로 떨어졌다. 심지어 1973년을 기점으로 신생 단어 ‘데이터(data)’보다 덜 쓰이는 것으로 집계됐다.

“신은 죽지 않았다. 다만 덜 중요해졌을 뿐이다.” 이렇게 된 것이다.

 

63 01

<빅데이터 인문학 : 진격의 서막>

에레즈 에이든 외 지음 | 사계절 | 384쪽 | 2만2000원

 

이 통계는 ‘구글 엔그램 뷰어’에 의한 것이다. 인터넷 검색업체 구글은 2004년부터 ‘구글 북스 라이브러리 프로젝트’에 따라 3000만 권 이상을 디지털화했다. 이 책은 이를 검색하는 ‘구글 엔그램 뷰어’를 개발한 하버드대 출신 두 과학자가 그 성과를 요모조모 소개한 것이다. ‘구글 엔그램 뷰어’는 1512년부터 2012년까지 8개 언어로 쓰인 책 800만 권에 실린 8000억 개 단어의 사용빈도 추이를 그래프로 보여주는 프로그램이다.

예를 들면 지난 200년 동안 가장 유명했던 인물은 누구일까. 수많은 책에 언급된 횟수를 기준으로 하면 1위는 아돌프 히틀러이다. 카를 마르크스, 지그문트 프로이트가 그 뒤를 잇고 있다. 지은이들은 유명 인물 10위 안에 유태인 학살의 주범 히틀러를 비롯해 스탈린, 무솔리니, 레닌 등 독재자들이 다수 포함된 것을 두고 “명성으로 가는 가장 확실한 길이 사람을 죽이는 세계에 있다”고 한탄하기도 한다.

그러나 정작 이들의 학문적 성과는 인문학에 정량적 분석을 도입했다는 것이다. 사실 ‘빅데이터’란 용어는 이제 우리 주변에서 자주 듣는다. 하루 수백만 건의 메시지가 오가는 트위터에 자주 사용되는 말을 통해 민심을 분석하기도 하고, 신용카드 사용처를 분석해 소비자 맞춤형 마케팅에 활용하기도 하는 등 쓰임새가 다양하다. 그런데 저자들은 구글의 디지털 자료를, 현재의 트렌드를 파악하는 단순한 ‘빅데이터’가 아니라 수 세기에 걸쳐 추세를 보는 ‘롱 데이터(long data)’로 삼는다. 그리고 로봇 검색엔진을 활용해 방대한 양의 어휘 데이터를 조사해 인간 문화의 유형을 파악해내는 이 방법을 ‘컬처로믹스(culturomics)’라 이름 붙였다.

책 외의 다른 매체에 접근할 수 없고, 특정 단어가 어떤 맥락에서 쓰였는지는 명확히 파악할 수 없다는 점 등 한계가 있긴 하다. 하지만 빅데이터에 근거한 문화 연구, 역사 연구는 인문학 연구방법론의 새 지평을 열 것으로 보인다.

책 말미에 실린 한국 빅데이터 전문가들의 대담에서 보듯 학술 연구를 위한 ‘한국형 빅데이터’ 구축과 활용, 과학계와 인문학계의 협력이 절실함을 느끼게 해주는 책이기도 하다. 빅데이터를 활용해 예컨대 우리 민족이 언제부터 단일민족으로 여겼는지를 문헌을 통해 확정할 수 있을까.

 

· 김성희 (북 칼럼니스트) 2015.3.9



지금 정책주간지 'K-공감' 뉴스레터를 구독하시고,
이메일로 다양한 소식을 받아보세요.
구독신청