콘텐츠 바로가기
본문 바로가기


블로그 전체검색
[출처] m.blog.yes24.com/document/15160963

『다크 데이터』

 

신청 기간 : 10월 6일 까지

모집 인원 : 5명

발표 : 10월 7일

신청 방법 : 댓글로 신청해주세요!

 

* 신청 전 도서를 받아 보실 기본주소를 꼭 확인해주세요.

 

우리가 ‘모르는’ 데이터는 왜 ‘아는’ 데이터보다 치명적인가?
세계적 통계학자 데이비드 핸드, 다크 데이터의 15가지 유형을 총망라하다!

놓쳐버린 데이터의 세계에서 함정을 피하고 위험을 기회로 만드는 법

오늘날 우리는 모두 데이터를 이용해 의사결정을 내린다. 우리는 미래를 알고 싶어하면서도, 미래가 과거와 크게 다르지 않다고 추정하는 무모한 판단을 계속한다. 하지만 우리 손에 있는 데이터가 전부는 아니다. 빅데이터의 모멘텀이 점점 가속됨에 따라 다크 데이터의 위험성도 커지고 있다. 
‘다크 데이터’는 쉽게 말해 ‘우리가 갖고 있지 않은’ 데이터다. 우리는 그 사실을 알 수도, 모를 수도 있다. 다크 데이터는 어디서든 생겨나며 모든 곳에 있다. 그리고 다크 데이터의 정의상 가장 큰 위험은 그 존재를 우리가 모를 수 있다는 점이다. 다크 데이터는 언제 어떻게 생겨나서 작동하며, 어느 순간에 우리의 뒤통수를 치는가? 다크 데이터를 역이용하여 이기는 결정을 할 방법은 없는가? 우리는 끊임없이 경계하며 자문해야 한다. “우리는 무엇을 놓치고 있는가?”
영국 왕립통계학회 회장을 역임했으며, 대영제국 훈장을 수여한 세계적인 통계학자 데이비드 핸드는 전작 《신은 주사위 놀이를 하지 않는다》에서 ‘일어날 가능성이 거의 없는 사건들’의 법칙을 다뤄 세상의 시선을 끌었다. 그런 그가 이번 책에서는 ‘우리가 모른다는 것을 아는 데이터’와 ‘우리가 모른다는 것조차 모르는 데이터’들을 대상으로 삼아, 빅데이터 시대 문제 해결의 본질적 맹점을 확인하고 보완한다. 이렇게 우리에게 없는(우리가 모르는) 데이터를 저자는 물리학의 ‘암흑물질dark matter’에 빗대어 ‘다크 데이터’라 부른다. 그러면서 ‘데이터가 불완전할 수도 있다’는 것을 인식하지 못한다면, 또 무언가를 측정하는 것이 곧 모든 것을 측정하는 것을 뜻하지는 않으며 측정 절차와 측정 대상은 미묘하고도 비뚤어진 방식으로 상호작용할 수 있다는 것을 인식하지 못한다면, 우리는 지금 세상에 무슨 일이 벌어지고 있는지에 대해 심각한 오해만 얻을 것이라고 경고한다. 
데이터는 현실을 표상해주지만, 마치 캐리커처로 그린 만화와도 같다. 우리는 마치 만화가 사람의 얼굴이나 행동의 주요 특징을 포착하듯 데이터가 현실의 중요한 특징들을 포착하기를 바라지만, 누구도 그걸 보장해주지는 않는다. 실제로 데이터는 중요한 많은 것들을 쉽사리 빠뜨리고, 잘못된 결론과 끔찍한 의사결정을 낳곤 한다. 

 

“다크 데이터는 어디에나 있다. 그리고 진실은 데이터로 드러난다”


이 책은 ‘서툰 범죄자들은 경찰에 잘 잡히지만, 진짜 영악한 사기꾼들은 발각되지 않고 빠져나가니까 결국 수많은 범죄자가 잡히지 않고 있는 것 아닌가?’(빠져 있는지 아는 데이터) 같은 간단한 궁금증 예시로 시작해, 저자가 직접 금융기관으로부터 의뢰받아 대출심사 모델을 설계하면서 파악한 다크 데이터 문제 같은 사례들로 실제 행정/비즈니스/연구 현장에서 데이터를 다룰 때 경계해야 할 지점들을 보여준다. 설문조사, 의료 및 과학 연구, 학력 평가, 건강검진, 경제 정책 수립, 법령 개정, 심지어 현대인의 일상을 위협하는 각종 사기와 기만행위 등 현대 사회에서 다크 데이터가 존재할 수 있는 수많은 영역을 둘러보며, 다크 데이터의 발생 원인을 경계하고 그것을 방지하는 전략을 설계해 다크 데이터를 제어할 수 있는지 알아본다. 
책의 1부에서는 다양한 사례를 통해 다크 데이터의 15가지 유형을 두루 살펴보고, 그것들을 간과한 것이 어떤 결과를 초래하는지 확인한다. 데이터 수집 방식을 살펴봄으로써 다크 데이터를 어떻게 감지할 것이며, 감지했거나 의심이 되면 어떤 조치를 취해야 하며 어떻게 데이터 수집 전략을 설계해 다크 데이터를 제어할 수 있는지 보여준다. 그리고 책의 2부에서는 치명적 위험을 지닌 다크 데이터를 활용하는 법을 알려준다. 곧 (우리가 불확실성과 무지를 현명하게 제어할 줄 안다는 전제하에) ‘모른다는 것’을 최대한 역이용해서 좀 더 유용한 행동을 취하는 법을 알려준다. 
 

 

서평단 여러분께

 

* 책을 읽고, 본인의 예스24 블로그에 ‘리뷰’를 써주세요.

* 리뷰를 쓰신 뒤, 현재 블로그 ‘리뷰 썼어요!’ 게시판에 리뷰 링크를 남겨주세요.

* 리뷰에 아래 문구를 꼭 넣어주세요.
YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.”


http://blog.yes24.com/blog/blogMain.aspx?blogid=reviewers&catseqno=40882212
http://blog.yes24.com/blog/blogMain.aspx?blogid=reviewers
 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE1