콘텐츠 바로가기
본문 바로가기


블로그 전체검색
수학으로 생각하는 힘

[도서] 수학으로 생각하는 힘

키트 예이츠 저/이충호 역

내용 평점 5점

구성 평점 5점

우리 일상 생활 속에서 수학이 어떻게 중요한 역할을 해 나아가는지 잘 설명해 주는 책이다. 우리 삶의 편리성, 안정성 등을 수학의 도움을 받아 진전되어 가지만 잘못된 수학의 해석이나 오용으로 우리를 엄청난 구렁텅이로 몰아갈 수 도 있음을 잘 선택된 예를 통해서 제시하여 준다.

수학적으로 제시되는 숫자에 놀라지 말고 그 숫자의 숨겨진 의미를 한 번쯤은 짚어 보는 습관을 들여야겠다

본문 요약

들어가며

포획-재포획법이라고 하는 이 간단한 수학적 방법은 생태학에서 나왔는데, 동물 개체군의 크기를 추정할 때 쓰는 방법이다. 여러분도 독립적인 표본을 선택한 다음 서로 겹치는 부분을 비교함으로써 이 방법을 직접 사용해볼 수 있다

응용수학자인 나는 수학이 무엇보다도 복잡한 세계를 이해하는 실용적 도구라고 생각한다. 수학 모형은 일상적인 상황을 이해하는 데 큰 도움을 주며, 반드시 수백 개의 방정식이나 수많은 행의 컴퓨터 코드가 필요한 것은 아니다. 가장 기본적인 수준에서 볼 때, 수학은 패턴이라고 말할 수 있다. 주변 세계를 바라볼 때마다 우리는 자신이 관찰한 패턴의 모형을 만든다

이 책에서는 수학의 응용(또는 오용)이 결정적 원인이 되어 사람들의 운명을 확 바꾸어놓은 실제 사건들을 살펴볼 것이다

나는 이 책을 통해 단순히 수학이 불쑥 튀어나올 곳을 알려주는 대신에 단순한 수학 규칙과 도구로 여러분을 무장시켜 일상을 살아가는데 많은 도움을 주고자 한다

  1. 눈 깜짝할 사이에 변해버린 세상

기하급수적 변화의 가공할 위력과 한계

J자 모양의 기하급수적 증가 곡선가 기하급수적 감소 곡선

기하급수적 증가: 우유병 속에 존재하는 엔테로코쿠스 파이칼리스 세포

기하급수적 감소: 자유 낙하 물 미끄럼틀(워터슬라이드)

다단계 사기의 수학

일주일 동안 16배 성장하는 태아

핵폭탄: 우라늄 원광에서 U-238 원자를 최대한 제거함으로써 U-235 원자의 순도를 아주 높게 정게하는 과정이 필요하다

체르노빌

기하급수적 감소와 연대 측정 방법

방사성 연대 측정법은 지구의 나이를 추정하거나 고대 유물의 나이를 측정

라벨에 130년 된 매캘런 싱글 몰트라고 표시된 위스키가 실은 1970년대에 제조된 값싼 블렌디드 위스키로 밝혀져 그것을 한 잔에 1만 달러에 팔던 스위스 호텔은 큰 창피를 당했다. 빈티지 스카치위스키의 3분의 1 이상이 가짜라는 사실이 발혀졌다

미술 작품의 제작 연대 확인

바이럴 마케팅 viral marketing은 밈학Memetics의 하위 분야인테, ‘밈’-어떤 양식이나 행동 또는 더 중요하게는 개념-은 소셜 네트워크를 통해 바이러스처럼 사람들 사이에 퍼져나간다

1990년에 인간 유전체를 이루는 염기 문자 30억 개의 지도를 작성 시도

책정된 10억 달러의 예산 한도 내에서 2003년에 나왔다. 지금은 한 시간이면 한 개인의 유전체를 완전히 분석할 수 있으며, 그것도 1000달러 미만의 비용

종 내에서 또는 종 간에 한정된 자원을 놓고 벌어지는 경쟁의 효과를 표현하는 가장 간단한 수학 모형을 ‘로지스틱 성장 모형 logistic growth model’ 이라고 한다

로지스틱 성장 곡선은 처음에는 기하급수적으로 증가하지만, 자원 부족이 제한요인으로 작용하면서 성장이 느려지고, 개체군 크기는 수용 능력 K에 접근한다

나이 들수록 시간이 쏜살같이 흐른다

또 다른 이론은 시간 경과를 느끼는 우리의 자각이 환경에서 받아들이는 새로운 지각 정보의 양에 좌우된다고 주장한다

시간을 느리게 흐르게 하고 싶다면, 시간을 갉아먹는 일상의 틀에서 벗어나 새롭고 다앙한 경험으로 삶을 채우라고 이 이론은 말한다

이 기하급수적 모형에서 네 살 꼬마가 다음 생일이 될 때까지 경험하는 시간은 40세인 사람이 50세가 될 때까지 기다리는 시간과 맞먹는다. 이러한 관점에서 바라보면, 나이가 들수록 시간이 가속되는 느낌이 드는 것은 충분히 이치에 닿는다

기하급수적 증가와 감소는 여러분과 나 같은 보통 사람들의 삶에 보이지 않게 아주 큰 영향을 미친다

2장 암 진단을 받고도 침착을 유지하려면

민감도와 특이도와 이차 의견 이해하기

확실성의 착각에 유의하라

선별 검사와 진단 검사의 차이를 이해하는 게 중요하다. 선별 검사 과정은 일자리를 구하는 과정에 비유할 수 있다

고용주는 몇 가지 바람직한 특성을 바탕으로 면접할 사람들을 효율적으로 추린다

선별 검사는 많은 사람들로 이루어진 집단에 광범위하고 덜 차별적인 그물을 던져 아직 분명한 증상이 나타나지 않은 사람들을 추려내도록 설계된다

선별 검사는 대개 덜 정확한 검사 방법이지만, 다수의 사람들을 대상으로 비용 효과가 높은 방식으로 적용할 수 있다

선별 검사를 통해 건강이 좋지 않을 잠재성이 있는 사람들이 일단 확인되면, 비싸지만 판별 능력이 더 뛰어난 진단 검사를 통해 처음의 선별 검사 결과를 확인하거나 일축할 수 있다

선별 검사에서 양성 반응이 나왔다고 해서 그 병에 걸렸다고 생각해서는 안 된다. 어떤 질병의 발병률이 낮을 때에는 선별 검사에서 참 양성보다는 거짓 양성이 더 많이 나올 수 있다

선별 검사에서 거짓 양성이 초래하는 문제의 일부 원인은 의료 검사의 정확성을 의심하지 않는 우리 태도에 있다. 이 현상을 흔히 ‘확실성의 착각’이라고 한다. 우리는 특히 의학적 문제에서 어느 쪽이건 확실한 답을 절실히 원하기 때문에, 적절한 수준의 의심을 품고 결과를 바라보아야 한다는 사실을 잊어버린다

두 번의 검사가 낮다

이원적 검사의 정확성 개념

검사의 ‘정확성’은 이 사람들이 그 질병에 걸리지 않았다고, 즉 ‘참 음성’으로 정확하게 확인되는 비율로 정의할 수 있다

참 음성 비율을 그 검사의 ‘특이도’라 한다. 만약 어떤 검사의 특이도가 100%라면 실제로 그 질병에 걸린 사람만 양성으로 나오고, 거짓 양성은 전혀 나타나지 않는다

특이도가 100%인 검사도 질병에 걸린 사람들 ‘모두’ 확인한다는 보장은 없다

검사의 ‘정확도’는 ‘참 양성’ 비율, 즉 실제로 질병에 걸렸으면서 검사를 통해 질병에 걸렸다고 정확하게 확인되는 사람의 비율로 정의할 수 있다. ‘민감도’라고 한다. 민감도가 100%인 검사는 병에 걸린 환자를 모두 다 찾아내 그 상태를 정확하게 경고한다

검사의 정밀도는 참 양성의 수를 전체 양성(참 양성과 거짓 양성을 합친 것)의 수로 나누어 계산한다

유방암 선별 검사와 마찬가지로 HIV 발병률이 낮고, ELISA 검사의 특이도가 100%에서 아주 약간 모자라기 때문에, 실제로 양성이면서 양성 진단을 받는 사람의 비율(검사의 정밀도)은 1/3을 조금 넘을 정도로 낮은 편이다. 그렇지만 검사의 정확도는 아주 높다. 100만 명당 99만 7005명은 정확한 판정 (양성이거나 음성)을 받으므로 정확도가 99.7%를 넘어선다. 아주 정확한 검사도 놀라울 정도로 정밀도가 떨어질 수 있다

검사의 정밀도를 높이는 단순한 방법이 있는데, 바로 두 번째 검사를 받는 것이다 (첫 번째 선별 검사, 두 번째 진단 검사)

실제 현상을 대신하는 지표를 흔히 대리 표지라고 부른다. 검사 결과가 틀릴 수 있는 이유는 대리 표지와 비슷한 다른 표지도 양성 결과를 낳을 수 있기 때문이다

좋든 싫든 거짓 양성과 거짓 음성은 피할 수가 없다. 수학과 현대 기술이 필터링 같은 도구로 일부 문제를 처리하는 데 도움을 줄 수 있지만 다른 문제들을 처리하는 법은 우리 스스로 배워야 한다. 선별 검사는 진단 검사가 아니며, 그 결과는 의심의 눈으로 바라보아야 한다는 사실을 기억해야 한다

일부 검사의 경우, 처음에 받은 것보다 더 정확한 검사가 없을 수도 있다. 이런 경우에는 동일한 검사를 한 번 더 받는 것만으로도 그 결과의 정밀도를 크게 높일 수 있다는 사실을 명심해야 한다

3장 수학으로 만들어낸 유죄

확률을 함부로 법정에 세우면 안 되는 이유

많은 사람들이 수학 공식에 맞닥뜨렸을 때 정확하게 이해하려 하지 않고 마치 잘 안다는 듯이 고개를 끄덕이면서 그것을 제시한 사람에게 경의를 표하려는 경향이 있다

서양 민주주의의 국가의 법정은 ‘유죄가 입증되기 전까지는 무죄’라는 원칙을 준수한다

무죄가 입증되기 전까지는 유죄’라는 정반대의 추정은 거의 모든 나라에서 폐기되었는데 (일본을 포함한 일부 국가) e 거짓 양성을 더 많이, 거짓 음성을 더 적게 만들어 낸다

종속 사건과 독립 사건의 단순한 차이

한 사건에 대한 지식이 다른 사건의 확률에 영향을 끼친다면, 두 사건은 서로 종속적이다. 그렇지 않다면 두 사건은 독립적이다

결합 확률을 구하려고 할 때 두 확률을 곱하는 것이 타당한 이유는 IQ와 성별이 서로 독립적이기 때문이다

사건의 독립성을 부정확하게 가정할 경우 중대한 실수를 저지르기가 얼마나 쉬운지 보여준다

개인의 특징을 모집단의 특징과 동일시하는 오류를 범했다. 이것은 생태학적 오류의 대표적인 예이다

한 가지 생태학적 오류는 단 하나의 통계 자료가 다양한 인구 집단의 성격을 규정한다고 가정할 때 일어난다

일상적인 데이터 집합의 특징을 알려주는데 쓸 수 있는 종형 곡선 또는 정규 분포는 데이터 중 절반은 평균에서 왼쪽에, 나머지 절반은 평균에서 오른쪽에 위치한 아름다운 대칭적 곡선이다. 이것은 이런 분포가 나타나는 특징은 평균과 중앙값이 일치하는 경향이 있음을 뜻한다. 많은 사람들이 이 유명한 곡선이 현실의 정보를 정확하게 나타낸다는 개념에 너무 익숙한 나머지, 평균이 데이터 집합의 ‘중앙’을 나타내는 훌룡한 표지라고 생각한다. 그래서 우리는 평균이 중앙 값에서 많이 벗어나는 분포에 맞닥뜨리면 깜짝 놀란다

거리를 걸어가다가 다음 번에 만나는 사람의 다리가 평균보다 많은 확률은 얼마일까? 그 답은 “거의 100%.” 이다

검사의 오류’ 라고 부른다. 이 논증은 용의자가 무죄라면 특정 증거가 존재할 가능성이 극히 희박함을 보여주는 것으로 시작한다

수학은 어떻게 우리 눈을 멀게 하는가

완전한 DNA 시료가 제시하는 엄청나게 낮은 확률은 매우 설득력이 높은 통계 수치처럼 보이지만, 법정에 제출되는 아주 크거나 작은 수를 맹신해서는 안 된다. 그런 수치가 나온 맥락을 항상 신중하게 고려해야 하며, 아주 작은 수를 적절하게 해석하지 않고 맥락과 상관없이 단순히 인용해서는 용의자의 유죄나 무죄를 입증할 수 없다는 사실을 명심해야 한다

잘못된 독립성 가정(한 아이가 영아 돌연사 증후군으로 죽을 확률은 두 번째 아이 역시 영아 돌연사 증후군으로 죽을 확률에 아무 영향을 주지 않는다는 가정)과 생태학적 오류(자의적으로 선택한 인구통계학적 사실을 바탕으로 클라크 가족을 저위험군 범주에 집어 넣은 오류)가 결합되는 바람에 그 수치는 실제보다 훨씬 작아졌다

누가 우리 앞에서 수학적 연막을 피우기 전에 그 상황에서 과연 수학이 적절한 도구인지 의문을 제기해야 한다

4장 통계에 속지 않는 법

맥락의 공백은 신뢰성에 켜진 빨간불

대규모 코호트 연구는 과거 어느 때보다도 빠르게 축적되고 있다. 그와 동시에 그 발견을 해석하는 데 필요한, 수를 다루는 기술도 증가하고 있다. 대개의 경우, 숨겨진 의도 같은 것은 없으며, 그저 통계 수치를 해석하기가 어려울 뿐이다. 그렇지만 어떤 발견을 비틀어 해석하면 특정 당사자에게 이익이 돌아갈 수 있다

그것들이 완전한 전체 진실은 아니다. 그래서 우리는 과장법 뒤에 숨어 있는 진짜 이야기를 파악하려고 노력해야 한다

진실’을 언제 믿어야 할지 알고 싶은 사람을 위해, 전체 이야기를 들려주지 않을 때 그것을 알아채는 간단한 방법과 통계 수치의 조작을 바로잡는 데 도움을 줄 도구를 소개할 것이다

얼핏 보기에는 이 사건들 중 어느 두 사건이 같은 날에 일어날 가능성은 낮아 보인다. 그렇지만 39건에서 둘씩 짝을 지을 수 있는 경우의 수는 741가지나 되기 때문에, 어느 두 사건이 같은 날에 일어날 확률은 약88%로 아주 낮다

일반적으로 작은 표본은 큰 표본보다 모집단의 진짜 평균에서 벗어나는 편차가 더 크게 나타난다

자발적 응답 편향, 선택 편향, 보고 편향

베이컨 샌드위치의 위험성: 상대 위험도가 20% 증가하는 것은 사실이지만, 절대 위험도는 겨우 1%만 증가할 뿐이다. 그렇지만 위험도가 1% 증가한다는 기사로는 신문을 많이 팔 수 없다

선정적인 과장 기사를 읽고 나면, 기사에서 절대 위험도-대개 하나는 핵심 조건을 충족한 집단, 또 하나는 나머지 인구 집단에 해당하는 두 가지 작은 수치(100%를 넘어서는 일이 절대로 없는)-를 제시하지 않았다는 사실을 발견하는 경우가 많다

헤드라인 뒤에 숨어 있는 진실을 알고 싶다면, 그 기사의 출처를 추적해 절대 통계 수치가 실린 원래의 간행물을 찾아보라. 혹은 그 내용을 처음 발표한 과학 논문 자체를 찾아보는 것도 좋다

지각된 이득을 강조하기 위해 소수로 나타내는 비 대신에 백분율을 사용하는 것은 ‘비율 편향’이라는 트릭에 속한다

통증이 최악의 단계에 있을 때 치료를 받으면, 치료법의 효능과 상관없이 시간이 조금 지난 뒤에 상태가 좋아질 가능성이 아주 높다. 이 현상을 ‘평균으로의 회귀’라고 한다. 이것은 결과에 무작위적 요소가 작용하는 다수의 임상 시험에 영향을 미친다

극단적인 코호트가 평균으로 회귀하는 것은 순전히 통계적 현상임을 보여 준다

표본 크기와 던진 질문, 표본의 원천을 포함해 조사 결과에 관한 세부 내용 부족-로레알의 광고 캠페인에서 보았듯이-은 또 하나의 경고 신호이다

잘못된 틀 짓기와 백분율, 지수, 절대 수치가 빠진 상대 수치에도 경고 벨을 요란하게 울려야 한다

비대조 연구나 작은 표본의 데이터에서 그럴싸한 인과 효과를 추론하는 것

누가 어떤 통계 수치를 내놓으면, 다음 질문들을 스스로에게 던져보라

  1. 비교 수치는 무엇인가?
  2. 동기는 무엇일까?
  3. 이것이 이야기의 전부일까?

이 세 가지 질문에 답을 얻으면, 통계 수치의 진실성을 판단하는 데 큰 도움이 될 것이다. 그 답을 찾을 수 없다면, 당연히 그 수치는 믿을 수 없는 것이다.

통계 수치는 사람들을 오도할 때가 많고 가끔은 부정직하지만, 완전히 틀린 경우는 드물다. 이런 수치에는 대개 진실의 씨가 들어 있는데, 열매 전체가 진실인 경우는 드물다. 이런 왜곡은 가끔 의도적으로 그릇되게 전달한 결과로 일어난다.그러나 당사자 자신이 도입한 편향이나 계산에서 저지른 실수를 몰라서 일어나기도 한다

대럴 허프는 자신의 고전적인 저서 [새빨간 거짓말, 통계]에서 “통계학은 그 수학적 기반에도 불구하고 과학에 못지 않게 미술의 속성도 지니고 있다”라고 주장한다. 결국 우리가 어떤 통계 수치를 신뢰하는 정도는 화가가 우리를 위해 그리는 그림이 얼마나 완전한가에 달려 있다. (사실주의 풍경화)

뒷받침하는 통계 수치를 미니멀리즘 화풍으로 단 하나만 그리고 나머지는 텅 빈 캔버스로 남겨두었다면, 우리는 이 ‘진실’을 믿어야 할지 심각하게 재고해야 할 것이다

5장 잘못된 자리와 잘못된 시간

수 체계가 우리를 곤경에 빠뜨리는 방법

내 전공 분야인 수학에서 우리가 싸우느라 가장 애를 먹는 것은 스스로에게 강요하는 거짓 이분법-수학을 할 수 있다고 믿는 사람들과 할 수 없다고 믿는 사람들로-이다

알려진 수학을 전부 다 이해한 수학자는 수백 년 동안 한 사람도 없었다. 우리는 모두 이 스펙트럼 위의 어느 지점에 있다. 우리가 왼쪽이나 오른쪽으로 얼마나 멀리 나아가는지는 이 지식이 자신에게 얼마나 유용하다고 생각하느냐에 달려 있따

6장 도무지 끝나지 않는 최적화

진화에서 SNS까지, 알고리듬의 무한한 잠재력

현대 알고리듬의 굉장한 위력을 잘 보여준다. 일상생활에 스며 들어 많은 측면을 단순화한 이 놀라운 도구는 두려워해야 할 대상이 아니다. 하지만 적절히 존중하면서 다루어야 하고 늘 입력과 출력을 철저히 감시해야 한다. 그러나 인간의 감시에는 검열과 편향이라는 위험이 따른다. 공정성을 위해 수동 제어를 억제할 때 어떤 일이 일어날 수 있는지 분석해보면, 편견이 알고리듬 자체에 암호화되어 숨어 있을 수 있다는 사실이 드러난다. 그것은 알고리듬을 만든 사람의 성향이 알고리듬에 각인된 것이다. 알고리듬이 아무리 유용하다 하더라도, 그것이 아무 오류 없이 작동한다고 맹신하는 대신에 그 내부 작용을 조금만 이해하면 시간과 돈과 심지어 생명까지 아낄 수 있다

그렇지만 느리면서 완벽한 답보다는 빠르면서 적당히 좋은 답에 만족해야 하는 상황도 가끔 있다

어떤 문제의 광범위한 변형들에 대해 최선의 답에 가까운 것을 찾도록 설계된 발견적 알고리듬(상식적인 근사나 경험 법칙)을 사용할 수 있다. 그런 식으로 답을 찾는 기술 중 하나가 탐욕 알고리듬이다. 이 근시안적 절차는 최선의 국지적 선택을 함으로써 전체에 대해 성립하는 최적의 해결책을 찾으려고 시도한다. 이것은 빠르고 효율적이긴 하지만, 반드시 최적의 해결책이나 좋은 해결책을 내놓는다는 보장은 없다

만약 답을 찾는 방법이 가능한 경로를 모두 다 계산하고 각각의 경로를 지나는 총 거리를 비교하는 것밖에 없다면, 이것은 NP 문제가 될 것이다. 내비게이션 사용자들에게는 다행하게도 다항식 시간 내에 ‘최단 경로 문제’의 답을 찾는 효율적인 방법-데이크스트라 알고리듬 Dijkstra’s algorithm-이 있다

성공만 한다면, 탐욕 알고리듬은 문제를 푸는 데 아주 효율적인 방법이다. 그렇지만 실패할 때에는 아무 쓸모가 없는 것보다 더 나쁠 수가 있다

개미 군집 최적화는 자연에서 영감을 얻어 만든 도구인 집단 지능 알고리듬 중 하나에 불과하다. 찌르레기 떼나 물고기 떼는 소수의 이웃과 국지적 의사소통만 나누는데도 불구하고, 그 방향 변화는 엄청나게 빠르면서도 일관성 있게 일어난다

자연에서 가장 유명한 알고리듬은 단연코 진화이다. 아주 단순하게 바라보면, 진화는 부모의 형질을 결합해 자식을 만드는 방식으로 작용한다. 환경에서 살아남고 번식하는 데 유리한 자식은 자신의 형질을 다음 세대의 더 많은 자식에게 물려준다. 때로는 세대 사이에 돌연변이가 나타나 새로운 형질이 추가될 수 있는데, 새로운 형질은 개체군 내에 존재하는 기존의 형질보다 더 나을 수도 있고 더 나쁠 수도 있다. 단 세 가지 간단한 규칙 ? 선택과 결합과 돌연변이 ? 만으로도 지구의 가장 어려운 문제들 중 일부를 해결할 수 있는 생물 다양성을 만들어내기에 충분하다

우리의 일상생활에서 작지만 중요한 개선을 이룰 수 있는 훨씬 단순한(비록 복잡한 수학을 기반으로 하지만) 알고리듬도 일부 있다. 그 중 한 집단은 ‘최적 정지 전략’이라 부르는데, 의사 결정 과정의 결과를 최적화하기 위해 필요한 행동을 취하는 데 가장 좋은 시간을 선택하는 방법을 제공한다

알고리듬은 일상생활의 많은 측면에 도움을 줄 잠재력이 아주 크지만, 모든 문제에 최선의 해결책을 제시하지는 않는다. 알고리듬은 단조로운 일을 간단하고 빨리 할 수 있게 해주지만, 사용할 때 위험이 따르는 경우가 많다. 세 부분 ? 입력과 규칙과 출력 ? 으로 이루어진 속성 때문에 일이 잘못될 수 있는 영역도 세 가지가 있다

알고리듬을 나쁜 목적으로 사용하기가 얼마나 쉬운지 잘 보여준다. 우리는 흔히 알고리듬을 감정에 치우치지 않고 냉정하게 따를 수 있는 공평무사한 지시라고 생각한다. 모든 알고리듬은 어떤 이유 때문에 개발되었다는 사실을 잊어버리고서 말이다. 규칙 자체가 사전에 미리 정해지고 냉정하게 실행할 수 있다고 해서 그 규칙을 사용하는 목적이 반드시 공평무사하다고 말할 수는 없다 ? 설사 공평무사함이 설계자가 원래 의도했던 것이라고 하더라도

공정하다고 알려진 알고리듬을 우리가 신뢰하는 이유는 일관성이 없고 개인적 성향이 강하게 드러나는 인간의 약점을 경계하기 때문이다. 그러나 비록 컴퓨터가 사전에 정해진 규칙을 따르면서 알고리듬을 객관적인 방식으로 실행할지는 몰라도, 그 규칙 자체는 사람이 만든 것이다. 프로그래머가 의식적으로건 무의식적으로건 자신의 편향을 알고리듬 자체에 직접 집어넣을 수 있는데, 컴퓨터 코드로 번역된 편견은 알아채기가 어렵다. 세계적인 첨단 기술 회사인 페이스북이 자신의 알고리듬에 권한을 이양했기 때문에 트렌딩 뉴스 이야기의 중립성을 우리가 믿을 수 있다는 주장은 전혀 타당하지 않다

우리는 자신이 읽는 뉴스 스토리의 출처를 신뢰하는가? 내비게이션이 추천하는 경로는 타당한가? 우리에게 지불하라고 제시된 자동 책정 가격은 정말로 합당한 가치가 있는가? 비록 알고리듬은 우리에게 중요한 결정을 내리는 데 도움이 되는 정보를 제공하긴 하지만, 우리 자신의 미묘하고 편향되고 비합리적이고 불가해하지만 매우 인간적인 판단을 대체할 수는 없다

7장 펜데믹 시대, 수학은 어떻게 무기가 되는가

S-I-R 모형에서 집단 면역까지, 수리역학의 분투

커맥과 매캔드릭, 그들은 모형을 제대로 만들기 위해 개인의 질병 상태에 따라 인구 집단을 세 가지 기본 범주로 나누었다. 아직 질병에 걸리지 않은 사람들에게는 다소 불길한 ‘감염 대상군’이라는 이름을 붙였다. 모든 사람은 감염 대상군으로 태어나 감염될 가능성이 있다. 질병에 감염되어 감염 대상군에게 질병을 옮길 수 있는 사람들은 ‘감염군’으로 분류했다. 세 번째 범주는 다소 완곡하게 ‘제거군’이라고 일컬었다. 병에 걸렸다가 회복되어 면역력을 얻었거나 질병을 이기지 못하고 죽은 사람들이 이 범주에 속했다. 제거군은 질병 전파에 더 이상 아무 역할도 하지 않는다. 질병 확산을 수학적으로 나타낸 이 모범적 모형은 S-I-R 모형이라 불리게 되었다

프리젠티즘’(아프거나 컨디션이 나쁜데도 억지로 출근하여 노동 생산성이 떨어지는 현상-옮긴이)은 최근에 와서야 관심을 끌기 시작했다. 수학 모형과 출근을 데이터를 결합한 연구에서 놀라운 결론이 나왔다. 유급 병가 감축을 포함해 결근율을 줄이기 위한 조처들 때문에 건강이 아무리 나빠도 출근하는 사람들이 크게 늘어났으며, 그 때문에 의도치 않게 직원이 건강이 더 나빠지고 전반적으로 작업 능률이 떨어지는 결과가 나타났다

S-I-R 모형은 몸이 아플 때에는 출근하지 않는 것이 얼마나 중요한지 보여준다. 완전히 회복할 때까지 집에 머물으로써 자신을 감염군에서 곧장 제거군으로 보낼 수 있다. 이 모형은 이렇게 간단한 행동만으로도 질병이 감염 대상군에게 전파되는 기회를 줄임으로써 발병 규모를 줄일 수 있음을 입증한다

S-I-R 모형은 커맥과 매캔드릭에게 미래도 볼 수 있게 해주었다

시뮬레이션에서 돌발 발병이 끝날 무렵에 인구 집단의 상태를 살펴본 그들은 감염 대상군에 속한 사람들이 항상 몇몇은 남아 있다는 사실을 발견했다. 이것은 감염시킬 사람이 더는 남지 않아 질병이 사라진다고 설명하는 직관적 생각(영화와 언론이 공포 이야기가 조장한)에 반하는 결과이다

S-I-R 모형은 결국에는 감염 대상자가 부족해서가 아니라 감염자가 부족해서 돌발 발병이 사라진다고 예측한다

기본 S-I-R 모형에 흔히 추가하는 또 하나의 수정 사항이 있는데, 감염된 뒤에 증상이 나타나지 않으면서 다른 사람에게 질병을 옮기는 사람들의 집단을 포함하는 것이다. 이 ‘보균자carrier’ 집단은 S-I-R 모형을 S-C-I-R 모형으로 바꾸는데, 이 모형은 오늘날의 매우 치명적인 몇 가지 질병을 포함해 많은 질병의 전파를 표현하는 데 아주 중요하다

R0는 보통 세 가지 요소로 나눌 수 있는데, 그 세 가지는 인구 집단의 크기, 감염 대상군이 감염되는 속도(흔히 감염력이라고 한다). 질병에서 회복하거나 사망하는 속도이다. 처음 두 요소가 클수록, R0도 커지는 반면, 회복 비율이 클수록 R0는 작아진다

우리가 통제할 수 있는 것은 처음 두 가지 요소뿐이다. 항생제나 항바이러스제가 일부 질병의 진행을 막을 수는 있지만, 회복이나 사망 속도는 병원체 자체의 고유한 속성인 경우가 많다

감염자를 대부분 죽이면서 빠르게 전파되는 질병은 아주 드물며, 대개는 재난 영화에만 등장한다. 높은 증례 치명률은 돌발 발병에 따른 공포를 크게 높이지만, R0가 높으면서 증례 치명률이 낮은 질병이 오히려 많은 환자를 양산해 결국에는 더 많은 사망자를 낳을 수 있다

수학에 따르면, 우리가 일단 어떤 질병을 통제할 필요가 있다고 판단했을 때, 증례 치명률은 확산 속도를 줄이는 방법에 대해 유용한 정보를 제공하지 않는다. 그러나 R0를 이루는 세 가지 요소는 치명적인 질병이 아무 방해도 받지 않고 창궐하기 전에 중요한 개입을 통해 돌발 발병을 멈출 수 있다고 시사한다

주류 언론 매체에 대한 신뢰가 하락하면서 사람들은 자신의 구미에 맞는 이런 소셜 미디어에 점점 더 빠져들어 자신이 좋아하는 주장에 귀를 기울인다. 이러한 대체 플랫폼의 부상은 증거를 바탕으로 한 과학에 아무런 도전과 위협도 받지 않은 채 백신 반대 운동이 성장할 공간을 제공했다

마치며

수학이 선사하는 자유

갈수록 계량화 되어가는 우리 사회에서 수학 지식이 약간 있으면 우리 자신을 위해 수의 힘을 이용하는 데 도움을 받을 수 있다

가장 충격적인 통계 자료를 가진 사람이 늘 논쟁에서 이기는 법이 없도록 통계 수치 뒤에 숨어 있는 수학을 설명해달라고 요구해야 한다

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PYBLOGWEB2