콘텐츠 바로가기
본문 바로가기


다크 데이터

[도서] 다크 데이터

데이비드 핸드 저/노태복 역

내용 평점 4점

구성 평점 4점

빅데이터의 시대이다. 데이터를 많이 가지면 미래에 대한 예측을 더 잘하게 되고, 그 결과 데이터가 기업 경쟁력, 국가경쟁력의 원천이 되고 있다. 혹자는 데이터(D), 네트워크(N), 인공지능(AI)을 합친 DNA 기술을 4차산업시대의 핵심기술로 부른다. 막 출범한 윤석열 정부가 데이터에 기반을 둔 네트워크 경제를 통해 국가를 발전시키겠다는 공약을 한 것도 이런 점을 감안한 것이다.

 

하지만 데이터를 다루어야 할 때 조심할 점도 많다. 잘못된 데이터에 기반을 두어 판단을 하게 되면 사실을 왜곡하기 때문이다. 흔히 'Garbage in, Garbage out'이라고도 한다. 데이터를 모으는 과정에 잘못이 있을 수 있다. 또한 각종 유형의 누락된 데이터가 존재한다. 이 책에서는 각종 유형의 누락된 데이터를 '다크 데이터'로 부르며 ‘다크 데이터’의 함정을 피하고 위험을 기회로 만드는 법을 이야기한다.

 

우리가 살고 있는 우주에는 보이지는 않아도 엄연히 존재하는 '암흑물질'이 27%나 존재한다고 한다. 우리가 다루고 있는 정보의 세계에도 우리가 간과하기 쉬운 ‘다크 데이터’로 가득하다. 저자는 우리가 어떻게 누락된 데이터를 알아차리지 못하는지, 그리고 그로 인해 어떤 잘못된 결론과 행위에 이르게 되는지를 다각도에서 탐사한다. 이와 함께 '다크 데이터'에 빛을 비추고 이를 이용하는 법을 설명한다.

 

통계학적 지식이나 경제적 분석자료를 다루어 본 경험이 있으면 쉽게 이해할 수 있는 이야기이다. 현실을 보면 자신에게 유리한 자료만을 선별하여 분석해 입맛에 맞는 결론을 유도하기도 한다. 코로나에 관한 각종 통계도 관찰되지 않은 '다크 데이터'를 포함하면 완전히 다른 결론에 이를 수도 있다. '다크 데이터'는 어디에든 생겨나며 모든 곳에 존재하기 때문이다.

 

저자는 다크 데이터의 가장 큰 위험으로 우리가 그것의 존재를 모를 수 있다는 점을 지적한다. 그러면서 다크 데이터가 언제 어떻게 생겨나며, 어떻게 우리를 잘못된 결론에 이르게 하는지 수많은 사례를 통해 설명한다. 결국 우리가 현재 무엇을 놓치고 있는지를 끊임없이 질문하고 경계한다면 오히려 정확한 현실에 가까이 다가감은 물론 이를 이용할 수 있다는 점을 설명한다. 빅데이터 시대에 우리가 무엇을 걱정하고 대비해야 하는지를 알려주는 책이다.

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE2