구글 하루 처리 데이터양은 미국 전체 도서관 24개 분량
“많은 사람이 인터넷에서 구글을 검색해 자료를 얻지만 그건
결코 공짜가 아닙니다.”
지난 10일 워싱턴대학(UW)
한국학 도서관의 ‘북:소리(Booksori)’에서 다뤄진 ‘빅데이터(Big Data)’는 인터넷 시대의 우리 실생활에서 빅데이터가 얼마나 가까이 와있는 지를 여실히 보여줬다.
이날 강연자는 서울대 출신으로 일리노이주립대 어바인 샴페인에서 컴퓨터공학 박사학위를 받고 현재 마이크로소프트(MS)사 운영체제(OS)에서 일하고 있는 김홍석 수석 엔지니어였다.
김 박사는 이날 강연에서 디지털 세계에 존재하고 있는 엄청난 자료에 대해 실례를 들어가며 쉽게 설명했다. 가령 네티즌들이 구글을 검색해서 자료를 얻을 때 공짜인 것처럼 보이지만 검색은 많은 기업들에게 광고료를 내도록
돕는 행위가 되는 것인 만큼 결코 공짜가 아니라고 김 박사는 지적했다.
또한 네티즌들이 검색할 때 구글 측에 자신의 정보 등을 제공하게 되며 결과적으로 구글 측에 엄청난 데이터를
모으게 하는 행위가 된다고 김 박사는 설명했다.
구글이 사용자들을 위해 하루에 처리하는 용량은 24 페타바이트(Petabyte)에 달한다. 1페타바이트의 용량이 미국 전체 도서관에
있는 모든 책을 디지털로 만들었을 때의 양에 달하는 것인 만큼 구글이 하루에 미국 도서관 전체 자료의 24배를
처리하는 셈이다.
김 박사는 일반인들의 일상에서도 이미 빅데이터는 아주 가까이 존재하고 있음을 알 수 있다고 지적했다. 동네 마켓이나 온라인을 통해 물건을 구입할 때도, 음식점의
리뷰를 볼 때, 구글을 검색하면서 각종 데이터를 접하게 되고 자신도 정보를 제공하면서 알게
모르게 빅데이터가 우리 주변의 삶에 영향을 미치고 있다는 설명이다.
김 박사는 “책 등 문서는 물론이고 사진과 동영상도 빅데이터에 포함되며 과거에는 하드웨어가
중요한 시대였고, 이어 소프트웨어 시대를 거쳐 이제는 데이터가 중요한 시대가 됐다”고 강조했다.
앞으로 기업들은 이처럼 엄청나게 존재하는 빅데이터를 어떻게 활용하느냐에 따라 기업의 성패가 갈릴 것으로
전망된다고 김 박사는 설명했다.