콘텐츠 바로가기
본문 바로가기


블로그 전체검색
신호와 소음

[도서] 신호와 소음

네이트 실버 저/이경식 역

내용 평점 5점

구성 평점 5점

'예측' 하면 떠오르는 것들을 생각해보면 날씨, 선거, 주식 등이 있다. 졸리면 자고, 배고프면 밥을 먹 듯 매일 당연하듯 습관처럼 찾아보고 확인하는 것들이다. 특히 날씨 같은 경우는 맞아도 욕하고, 틀리면 더 욕하면서도(유독 우리나라에서는 더욱) 찾아보는 예측이고, 최근 주식 열풍으로 인해 멀지 않은 곳에서 주식을 확인하는 이들 또한 어렵지 않게 볼 수 있다. 예측이 중요한 분야를 좀 더 살펴보면 기후, 지진, 자연현상, 포커, 체스, 야구와 같이 승률이 필요한 분야, 경제 전망, 테러 등이 있다. 그 대상이 취미에 의한 것이든 사회에 위협적인 대상이든 기업에서 고객을 대상으로 하는 조사하는 예측이던 간에 이제 우리 삶에서 '예측'은 필수불가결한 요소가 되었다.

 

'예측'에 대한 관심이 최근에서야 높았던 것은 아니다. 그러나 최근의 '예측'분야에 대한 관심도는 과거의 그것과는 전혀 다르다. 온라인이 활성화 되고 대중화 되며 그 속에서 끊이 없이 쏟아져 나오고 있는, 미래의 석유라 불리는 '데이터'와 '정보'의 홍수 속에서 좀 더 정확하고 유용한 자료를 뽑아내기 위한 분석 도구의 다양화로 이에 대한 전문적 교육(예: 대학(원) 등에서의 교육)을 받지 않고서도 그 방법을 학습하고 직접 활용해 볼 수 있는 기회가 많아졌기 때문이라고 생각하고 있다. 책에서 저자가 언급하는 내용은 아니지만, 이러한 기회는 많은 사람들이 자신의 커리어를 업그레이드 할 수 있는 기회로 생각하고 도전하는 창구로서도 역할도 하고 있다. 저자가 우려하는 문제를 이 상황에서도 찾아 볼 수 있다고 생각하게 되었다.

 

저자는 인간이 정보를 습득하게 되는 과정을 인쇄술이 처음 생겨난 시점으로 거슬러 올라가 이야기 한다. 물론 구텐베르크가 인쇄술을 발명하기 이전에도 책은 존재했지만, 인간의 손으로 직접 책을 만들어 냈던 그 때는 책을 구하기가 어렵기도 했지만, 그저 귀족을 위한 사치품으로 한 권씩만 만들어졌다고 한다. 그래서 당시의 책은 지식을 축적하기 위한 도구가 아니었다. 하지만, 인쇄술의 탄생이 이전의 그런 황당한 상황을 좋게만 변화시켰던 것은 아니었다. 인쇄술의 탄생으로 인해 많은 이들이 책을 통한 정보를 습득하게 되자 인간 사회의 어느 곳, 어느 시대를 가더라도 빠지지 않고 있듯이 그것을 악용하던 무리가 이 시기에도 존재했다. 인쇄술의 발달로 품질도 점점 좋아지고, 수 많은 희곡과 연극도 만들어 냈지만, '간음하지 마라'가 '간음하라'로 둔갑하는 식으로 엉뚱한 내용이 담긴 이단 책자와 유사과학 책자가 베스트 셀러 목록을 점령하는 사태도 발생한다.

 

저자는 운명과 예언을 소재로 삼은 셰익스피어의 희곡 '율리우스 카이사르'에서 키케로의 사례로 예측을 함에 있어 중요한 충고를 한다. 카이사르는 전반부 내내 대관식이 살육의 현장으로 바뀔 거라는 모든 종류의 명백한 경고 신호(예언)를 받는다. 그 내용은 "3월 15일을 경계하라"는 예언이었다. 그러나 카이사르는 설령 누가 죽는다 하더라도 자신은 아닐거라고 우기며, 방심하다 결국 암살되고 만다. 희곡에서 키케로는 "사람들은 자기 식대로 사물을 추론한다. 그 사물의 목적을 지워버린다."라고 말한다. 저자는 이 상황에서 카이사르가 제시된 증거를 (자기에게 필요한 만큼만 혹은 유리한대로) 선택적으로만 읽은 것이라고 풀이한다.

 

 

■ 예측과 '불확실성'
 

우리가 예측을 하는 가장 대표적인 이유는 불확실한 미래에서 발생할지도 모를 돌발 상황 등을 대비하기 위함이다. 여기서 중요한 것은 예측에 100%의 정확도는 없다는 점이다. 그래서 선거 여론 조사나 날씨 등에 대한 예측을 말 할 때도 오차범위가 포함되어 있는 확률로 그 값을 표시한다. 그리고 이 예측 값에는 '불확실성'이 포함되어 있다. 굳이 '불확실성'을 강조하는 데는 이유가 있다. 앞서 예측에는 100%의 정확도는 없다고 언급했다. 그럼에도 예측 값에 '불확실성'도 포함되어 있다는 사실을 우리는 쉽게 망각한다. 그래서 예측으로 발표되는 그 값을 100% 정확한 사실로 받아들일 때가 종 종 있다.

 

가장 대표적인 예로 '날씨 예보'를 들 수 있다. 분명 비 올 확률 OO% 라고 예보하여 이에 대비 하기 위해 우산을 들고 갔는데, 비가 오지 않으면 마치 100% 비가 내린다고 했는데, 오지 않았다며 불만을 터트린다. '대비' 한다는 말은 그 예보 속에 비가 내리지 않을 수도 있는 '불확실성'이 포함 되어 있음을 이해 했다는 말로도 해석할 수 있다. 그럼에도 그 사실을 잊어버리고 마치 틀린 예측을 맞게 한 것처럼 항의를 한다.

 



여우   여러 분야에 걸쳐서 적용할 수 있는 것들을 생각하고, 자기비판적이며 복잡성을 관대하게 받아들여 불가능한 부분에 대해서는 솔직하며, 여러 단서를 두고 신중하며 이론 보다는 관찰에 더 의존하는 유형의 전문가를 말한다. (여우는 더 나은 예측자다, p.129, 02. 정치)

고슴도치  커다란 한 두 문제에 집중하며 구체적으로 생각하되 대범하게 생각하며(올인 접근법), 실수는 운이 나빴다고 하며 고집스럽게 생각하고, 질서정연한 것만을 생각한다. 그리고 자기가 하는 예측은 절대적으로 생각하여 자신의 입장을 절대 바꾸려 하지 않고, 오로지 이론에 집중하는 유형의 전문가를 말한다. (고슴도치는 더 못한 예측자다, p.129, 02. 정치)



 

문제는 그 예측 값을 참고하는 대상에게만 있는 것이 아니다. 그 값을 예측하는 자에게도 있다. TV 토론이나 뉴스에 전문가라며 나오는 선거 혹은 정치 전문가, 경제 전문가들의 발언을 떠올려 보면 된다. 마치 자신의 말이 100% 맞는 말 처럼 이야기를 한다. 저자는 이런 사람들을 위와 같이 '여우'와 '고슴도치' 두 부류로 나눠 설명한다.

 

'예측'이란 것은 고정된 과녁을 향해 활을 쏘는 활쏘기가 아닌, 끊임 없이 움직이는 과녁에 활을 쏘는 것과 같다.(그렇다고 클레이 사격을 떠올리지는 마시길...) 우리가 수 많은 데이터를 가지고 그것에 관해 분석하는 순간에도 그 대상은 끊임없이 움직이고 변화하고 있다는 사실을 잊으면 안된다. 저자에 의하면 그나마 기상 전문가들은 이 불확실성에 대한 중요성을 깨닫고 그 부분에 대해서도 솔직하게 얘기하는 편이지만, 정치 전문가나 경제 전문가에게서는 이러한 태도를 찾아보기가 매우 어렵다고 얘기한다.

 

 

■ 예측과 '휴리스틱'

 



휴리스틱(Heuristic)   의사결정을 할 때 먼저 비효율적이고 타당하지 않은 것들을 없애나간 뒤 가장 효율적이고 적절한 해답을 찾아 이것을 상식화함으로써 불필요한 시행착오를 줄여나가는데, 이런 경험적 지식, 곧 의사결정 과정의 단순화된 지침을 말한다. (p.452, 09장. 체스)

 

가용성 휴리스틱(Available Heuristic, 가용성 단순추론)   자기가 경험했거나 들은 정보를 중심으로 판단하는 것을 말한다. (p.688, 13장. 테러)



 

위에서 설명한 휴리스틱을 다시 말해보면 어떠한 상황에 대해 예측할 때 지금까지 이렇게 해왔으니까와 같이 자신의 경험했던 사실이나 들은 정보를 당연하다는 듯 생각하고 생각지도 못한 그 상황이 일어나지 않을 확률이 일어날 확률 보다 높다고(혹은 반대로) 여기는 심리적 현상을 말한다. 아마 이러한 경험을 평소에 한 번쯤은 다들 겪어 보았을 거라고 생각한다. 하지만, 생각지도 못한 혹은 일어날 일 없을 거라 생각 했던 일은 '설마'라는 말 다음에 예상되는 결과 처럼 생기게 마련이다. 다시 말하면 휴리스틱은 이 책에서 말하는 '소음'. 즉, 수 많은 데이터 중에서 진짜 정보, 유용한 정보를 찾는 필터를 망가트리는 요소로 보고 있다. (휴리스틱 = 소음 필터링 방해 도구)

 

저자는 그 대표적인 사례로 2001.09.11에 뉴욕에서 발생했던 9.11 테러를 들고 있다. 저자는 이 책에 등장하는 다양한 실제 사례를 그 사례와 직.간접 적으로 연관된 사람들을 직접 찾아가 인터뷰 하고 관련 자료를 분석한 결과들을 함께 제시하며 이야기를 끌어가고 있는데, 9.11 테러 사례의 경우 '도널드 럼즈펠드'를 찾아 인터뷰 한 내용을 담고 있다. 럼즈펠드는 신호를 감지하지 못하게 방해한 휴리스틱에 대해 다음과 같은 얘기를 한다. "우리는 모두가 죽음을 두려워 할 거라고 생각하지만 행복한 미소를 띠면서 죽을 수 있는 사람들이 있다면, 또는 그런 죽음이 특권이라고 느끼는 사람들이 있다면, 그들은 우리가 상상도 하지 못하는 방식으로 행동할 수 있겠죠. 바로 테러리스트들이 그랬습니다. (p.689)" 그렇기 때문에 예측을 위해서는 당연하다고 생각 되는 것도, 설마.. 라고 생각 되는 것도 일단은 모든 가능성을 열어두고 의심을 해 볼 필요가 있는 것이다.

 

 

■ 예측에 임하는 우리의 자세. (feat 확률적 사고겸손, 열린자세, 재평가(업데이트))

저자는 서문에서 "좋은 예측을 하는 것과 그 예측을 사람들이 진지하게 받아들이도록 설득하는 것은 별개의 문제"라고 말하고 시작한다. 나는 이 부분에서 자신이 한 예측을 누군가에게 진지하게 받아들이라고 설득하는 것은 자신의 예측이 100% 정확한 사실(예측이 아닌)이라고 말하는 것과 같다고 생각했다. 앞서 예측에는 100%의 정확도는 없고, 불확실성을 내포하고 있다고 이야기 했는데, 이것과 연결해보면 결국 예측하는 사람들은 좋은 예측을 하는 사람이지 자신의 예측을 믿으라고 설득하는 일을 하는 사람이 아니라는 말이다.

 

그렇다면 좋은 예측은 무엇일까? 저자는 크게 4가지를 이야기 하고 있다. 물론 이 4가지는 내가 이 책을 읽으며 책에서 제시한 총 13가지 사례를 보며 저자가 공통적으로 강조하고 있다고 생각되는 사항을 꼽아본 것이다.

 

확률적 사고   저자는 서둘러 속단 하는 것과 대세에 편승하는 것을 확률적으로 사고하는 것을 방해하는 요인으로 보고 있다. 지금 이 순간에도 모든 것이 빠르게 변화하는 이 상황에서 매우 어려운 일이지만 느리게 생각하고(필수), 대세편승을 경계하는 것이 확률적 사고를 제대로 하는 방법이라고 말하고 있다.

겸손열린자세     저자가 여우와 고슴도치의 태도를 비교 설명하는 부분에서 극적인 변화에 감히 반대 의견을 표명할 수 없을 만큼 확실한 확률을 부여하는 '극적인 예측'을 하는 고슴도치에게 TV 출연 기회가 더 많이 돌아간다고 말한다. 그렇지만 이들은 자신의 이득을 챙기기에만 관심이 있을 뿐 자신의 잘못된 언행에 대한 책임은 절대로 지지 않는다. 반면, 여우는 세상에 존재하는 많은 것들은 예측하기 어렵기 때문에 불확실성을 고려해야 하고, 이론 뿐만 아니라 관찰(경험)등을 고루 참고하며 예측하기 때문에 그들이 가짜 신호(소음)을 쫓는 일은 고슴도치보다 훨씬 적다. 그래서 우리가 찾아야 할 사람들은 고슴도치가 아닌 여우라고 말한다.

재평가(업데이트)   예측은 고정된 과녁을 맞추는 것이 아닌 움직이는 과녁을 맞춰야 되는 일이다. 활을 겨냥하는 순간에도 계속해서 움직이고 있기 때문에 철저한 분석에도 불구하고 수시로 변경해야 될 경우가 발생한다. 이럴때 고슴도치 처럼 자신의 의견을 절대 고수할 것이 아니라 여우 처럼 모든 가능성을 열어두고 정확한 정보를 찾아 수시로 업데이트 하고, 그 사실을 공개해야 될 필요가 있다.

 

 



 

 

책은 금융위기(2008년 리먼사태), 정치(2016년 미국 대선), 야구, 기상, 지진, 경제 예측, 전염병(최근 개정판이지만 코로나19가 아닌 '신종플루'가 주요 대상이다.), 체스, 포커, 주식, 지구온난화, 테러 등 실제 발생했던 다양한 사례들을 통해 예측에 관한 이야기를 하고 있다. 그리고 이 모든 사례들은 대부분 예측에 실패한 사례들이다. 이 중에는 운과 실력이 모두 필요한 포커와 같은 도박도 있고, 아이티 지진 처럼 그동한 분석해왔던 결과와 전혀 달라 예측 불가능 하게 발생한 재해도 있었고, 수차례 확인 되었던 신호가 있었음에도 휴리스틱으로 인해 간과했던 진주만이나 9.11테러(단, 9.11 테러는 예상 가능성과 불가능성이 혼재되어 있었다) 도 있었다. 이 사례들을 설명하기 위해 통계 결과 물인 수 많은 도표와 그래프가 등장하고, 통계를 제대로 배워 본 적이 없는 나로선 이해하기 어려웠던 용어들도 꽤 등장했지만, 각 사례들의 실패원인을 통해 위에서 저자가 말한 공통적인 요소들을 확인할 수 있었다.

 

2014년 이 책 초판이 나왔을 당시에도 꽤 흥미로워 하면서도 어려운 용어 때문에 힘겹게 읽었었다. 그런데, 빅데이터라는 것이 이슈화 되면서 그 당시와 7년이 지난 현재 상황이 많이 달라져서 그런 것일까? 완전히 새로운 책을 읽는 것 같았다. 그래서 곰곰히 생각해보니 빅데이터 이슈로 관련 서적들과 방송을 반복해서 보다보니 모든 내용들이 새로워 보였던 것 같다. 안 보이던 용어들이 계속 눈에 들어와 그 개념들을 정확히 해두고 싶어 메모도 했고, 그 내용들을 이해하기 위해 필요하면 잠시 멈추고 관련 영상들도 수 없이 찾아 봤다. 그래서 개정판을 받아 보았을 때 전보다 두꺼워진 탓도 있기는 하지만, 읽는 데 한 달 정도 걸릴 거라고 한 예상이 딱 들어 맞았다. 게다가 책을 읽다보니 저자가 제시하는 각 장의 주제 하나 하나들(특히 금융위기 부분) 에서 그 동안 어려워 읽다가 포기한 책들의 내용을 이해하게 되는 경우도 있었고, 그 책들을 보충할 수 있는 개인적으로 꼭 필요했던 자료(논문과 도서)와 정보도 상당히 많이 얻을 수 있었다. 그래서 보다가 멈춰서 다른 자료 찾아보고, 모르면 다시 되돌아가 이해될 때까지 읽으며(물론 통계학 측면에서는 아직도 많은 부분 이해하지 못했다.) 정말 꾹 꾹 눌러 읽었다.

 

이 책을 읽으며 저자가 예측을 하는 사람들에게 하고 싶었던 말들을 정리하며 예전에 들었던 어느 어르신의 말이 떠올랐다. 한라산을 수십년간 매일 같이 다니는 분들도 '한라산을 그렇게 오르락 내리락 했어도 한라산의 날씨는 예측하기 어렵다'라고 하는 내용이었다. 움직이는 과녁을 맞춰야 하는 변동성과 불확실성이 담겨 있지만, 휴리스틱의 함정에 빠지지 않으면서도 예측과 자연앞에 있어서 겸손함이 묻어나는 말이 아닌가 하는 생각이 들었다.

 

분량 만큼이나 감히 쉽다고 말할 수는 없는 책이지만, 13가지의 사례를 통해 저자가 공통적으로 하는 말에 귀기울여 보면 저자가 하는 조언은 결코 어려운 내용이 아니었다. 필수적이지만 잘 지켜지지 않는 사항들이었다. 앞서 예측을 자신의 커리어 업그레이드로 삼는 자들에 대한 얘기를 (책에서 저자가 언급하지 않은 내용) 한 이유가 바로 이것 때문이다. 오랫동안 공부하고 경력이 많은 전문가들 조차도 좋은 예측을 위해 염두해야 될 사항들을 간과 하는데, 그런 과정 없이 쉽게 접할 수 있는(예: 오픈 소스 툴) 도구들로 독학하는 과정에서 저자가 말하는 사항들까지 그들이 과연 제대로 학습하고 지킬 수 있을까 하는 우려 말이다.

 

과거에 수기로 계산하고 작성하던 분석과 예측은 기술의 발달로 이제 기술의 힘을 빌려 분석과 예측하는 시대로 바뀌었다. 그렇지만, 기계가 스스로 학습한다는 딥러닝 역시 그 기초 자료는 인간에 의해서 제공이 된다. 그리고 기계가 내놓은 결과 값을 가지고 다시 해석하는 것은 역시 인간이다. 이 말은 즉슨 아무리 기술이 발달하더라도 인간과 기술은 별개가 아니며 함께 공존해야 된다는 말이다. 저자는 자신 스스로의 경험과 수 많은 이들의 인터뷰를 통해 많은 사례들의 실패들 속에서 인간의 오만함이 예측에 얼마나 큰 영향을 미치는 지 독자들에게 말하고 싶었던 것이 아닐까. 그렇기에 예측과 분석에 관심이 있거나 그 쪽으로 진로를 정했다면 전문 교육을 받았든 받지 못했던 간에 이런 책을 통해서라도 좋은 예측가가 되기 위한 제대로 된 마인드 형성을 할 수 있었으면 좋겠다는 생각을 해본다. 쉽진 않았지만, 꾹 꾹 눌러 읽은 보람을 충분히 맛 볼 수 있는 책이었다.

 

 

확률적으로 생각하되, 속도를 늦추고 의심하라.

 

 

** 본 게시글은 YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다. **

 

 

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 34

댓글쓰기
  • 스타블로거 삶의미소

    예측에 대해 이렇게 깊이 있게 알려주는 책이 있었다는 것도 토모님의 리뷰를 통해 처음 알았고요. 여우와 고슴도치의 비유도 그렇고요. 아마도 화제성을 생각하면 '극적인 예측'을 하는 고슴도치가 TV에 더 많이 나올 것 같긴 하네요.
    카이사르가 눈에 띄어서 확률과 카이사르가 무슨 관계일까하고 궁금해져서 열심히 읽어보았는데
    정말 공부하는 마음자세로 읽어야 할 것 같은 책이네요.
    이렇게 생각지도 못했던 예측과 확률에 관한 리뷰 잘 보았습니다 ^^
    토모님 오늘 하루 잘 보내세요 ^^

    2021.02.09 09:35 댓글쓰기
    • 스타블로거 토모

      개정판이 출간된다는 소식을 접하고 책이 오기를 기다리며 쉽지 않을 거라는 예상을 막상 받아보니 한 2~3일간 이 책에만 매달리면 충분히 빨리 읽을 수 있겠지.. 라고 생각했는데, 한 챕터 한 챕터 읽다보니 첫 목표는 사라지고, 삶의미소님 말씀처럼 정말 전공 교과서 보듯이 보게 되더군요. 정말 재미는 있었지만, 진도가 나가지 않아 초조해지기도 했는데, 여우.고슴도치 이야기나 카이사르 이야기처럼 공감가는 내용도 많았고, 지진과 9.11 테러 같은 중대 사건의 몰랐던 뒷 이야기도 볼 수 있어서 재미있었던 것 같아요. 아직도 통계학 적인 부분을 이해하려면 시간이 더 걸리겠지만요. ^^ 늘 리뷰 읽어주시고 달아주시는 댓글 때문에 책 읽을때마다 정신 번쩍 들게 됩니다. 좋은 밤 되시고, 오늘도 기분 좋은 하루 되세요. ^^

      2021.02.10 00:49
  • 예스블로그 예스블로그

    토모님~ 시간 내어 책 읽어 주시고 이렇게 정성스럽게 좋은 리뷰 써 주셔서 감사 드립니다! 좋은 하루 보내세요 :)

    2021.03.18 11:49 댓글쓰기
    • 스타블로거 토모

      읽는데 진도가 나가지 않아 초조해 하면서도 대충 읽으면 안되는 책이구나 느껴져 스스로 고생 자처하며 읽었는데, 덕분에 그 고생 싹 사라지는 것 같습니다. 예스님도 좋은 하루 되세요. ^^

      2021.03.23 22:35
  • 스타블로거 부자의우주

    두껍고 어려운 내용이 많이 담긴 책을 이리 리뷰하시다니
    대단하십니다.

    여우와 고슴도치. 불확실성을 잘 말하지 않는 일부 전문가들.
    휴리스틱의 오류 등등 잘 보이네요. 잘 읽히는 글 부럽습니다 ^^

    우수리뷰 선정 축하드립니다 토모님 ~~~

    2021.03.19 10:35 댓글쓰기
    • 스타블로거 토모

      책 속에 어려운 통계 이론이나 용어 등도 많이 등장해 이해가 안되는 부분도 많았지만, 각 사례에서 저자가 전반적으로 공통적으로 말하는 내용들을 의외로 어렵지 않았던 것 같아요. 저 역시 읽기 쉽지는 않았지만, 힘겹게 읽은 보람은 분명 있는 책이었습니다. 축하해주셔서 감사해요. 부자의우주님 ^^

      2021.03.23 22:37

PRIDE1