콘텐츠 바로가기
본문 바로가기


블로그 전체검색
누워서 읽는 통계학

[도서] 누워서 읽는 통계학

와쿠이 요시유키,와쿠이 사다미 공저/권기태 역

내용 평점 5점

구성 평점 4점

누구나 쉽게 시작하고,
블랙홀처럼 빠져드는 통계학 이야기



와쿠이 요시유키 : 도쿄교육대학 이학부 졸업후 교직에 종사. 퇴직후 저술가로 전념
와쿠이 사다미 : 도쿄대학 이학계 연구과 석사과정을 수료한 후 후지쯔에서 근무. 퇴직후 과학기술 분야의 저술가로서 집필활동을 하고 있음.


 

지은이 머리말
컴퓨터와 함께 통계학을 많은 사람이 이용할 수 있게 되었습니다.
데이터 분석제3자가 작성한 통계를 올바르게 해석하기 위해서 통계학적 교양은 필수 불가결한 것이 되었습니다.
  중학교 수학을 이해하는 정도면 통계학의 기본 개념은 충분히 파악할 수 있습니다.
현대 통계학의 기본 개념까지 소개한 높은 수준의 통계학 입문서입니다.

 


맺음말 대신
국정 지지율은 왜 신문사마다 다른가요?
  이 답은 2-9절의 칼럼 알디디 방식, 3-2절의 칼럼 국정 지지율은 언론에 따라

이렇게 다양합니다. 를 참조하기 바랍니다. 신문사마다 다른 가장 큰 이유는 각 신문사
의 조사가 임의추출에 근거하지 않았기 때문
입니다. 추정이나 검정 등과 같은 추측통
계학의 대전제는 임의추출입니다. 전제가 무너지면 통계학에서 도출되는 통계는 그다
지 믿을 만한 것이 못 됩니다. 362쪽

대전제와 원칙을 따르는 것이 중요한 이유를 읽을 수 있어서 맺음말 대신으로 삼았습니다.



중요 내용, 퀴즈, 예, 엑셀로 놀자, 칼럼 으로 구성되어 있네요.


프롤로그 : 통계학을 공부하기 전에
통계학의 기본 : 자료 정리
확률의 개념 : 츠측통계학을 지탱하는 도구
통계적 추정 : 하나를 들으면 열을 압니다
통계적 검정 : 가설에 이의를 제기합니다
데이터의 상관분석 : 두 가지 변량의 친밀도가 보입니다
회귀분석 : 자료 예측은 비즈니스에서 빼놓을 수 없습니다
베이즈 통계학 : 주 번 일어난 일은 세 번도 일어날 수 있습니다   


통계학이란 도대체 뭘까요? ~ 여러분의 통계 센스는 어느 정도인가요?
생생한 데이터는 통계학의 생명입니다 ~ 수명의 표준편차와 편찻값을 구해봅시다
확률은 추측통계학의 기본 ~ 표본평균의 분포는 정규분포 : 중심극한정리
통계적 추정이란 무엇일까요? ~ 금단의 추정 : 신의 눈으로 하는 추정 놀이
통계적 검정이란 무엇인가요? ~금단의 검정 놀이 : 신의 입장에서 검정을 시도합시다
2변량의 관계를 시각화합니다 : 상관도(산점도) ~ 2변량의 관계를 표로 시각화합니다 : 교차 집계표
광고비로 매출액을 예측합니다 : 단순회귀분석 ~ 경영자 입장에서 가맹점을 분석합니다 : 회구분석의 응용
확률을 융통성 있게 생각합시다 ~ 베이즈 통계의 친근한 응용 : 베이즈 필터
 



[본문]


19세기 영국 수상 벤저민 디즈레일리
"세상에는 세 가지 거짓말이 있다. 하나는 거짓말, 그 다음은 새
빨간 거짓말, 그리고 통계."

통계학을 배우는 목적 중 하나가 통계에 속지 않기 위함.
통계를 보면 누가, 무엇을 위해, 어떻게 만들었는가라는 질문도 잊지 말길. 21쪽

광고를 올바르게 이해할 수 있습니다
통계 데이터로 인생이 더 즐거워집니다
뉴스 보도를 더욱 올바르게 이해할 수 있습니다
통계나 통계 분석을 사용하여 업무를 진행할 수 있습니다. 31쪽
 



통계학이 틀렸다는 것은 아닙니다.
통계학은 수학을 이용한 올바른 학
이에요. 부디 오해하지 않았으면
좋겠어요.

사실을 말하자면, 상당한 양의 탄 음식을 계속 먹으면 암이 발생한다.
입니다.  따라서 일상적인
식사에서 먹는 정도로는 전혀 문제가 없습니다. 하지만 아직도 ...
단 잘못된 통계는 사라지지 않습니다
티비에서 그런 말을 들으면, 그럴듯하게
들리기 때문에 무섭죠. 35쪽

잘못된 통계를 거부할 수 있는 정도의 능력을 키워야겠습니다. 그러고 싶습니다. 그러러면 역시, 날마다 하면 수월하다. 가끔 하면 불편하다. 가 이 책에도 적용되겠습니다. 통계는 읽을 때마다 신선한 것이 머릿 속에 잘 남지 않아서요. 이 책의 조력을 기대하게 되네요.


 

첨도와 왜도
분포의 뾰족한 정도나 기울어진 방향과 정도를 나타내는 수치. 65쪽

사분위수편차
데이터 산포도 정도를 표현하는 방법은 편차제곱합이나 분산 등에 한저오디지 않습니다. 여기서는 산포도를 나타내는 다른 방법인 사분위수편차를 소개. 89쪽

분산은 통계학의 생명
데이터의 산포도를 표현하는 분산데이터의 정보량을 나타냅니다. 즉, 분산은 데이터와 다
양성 정도를 나타냅니다. 94쪽
 



편찻값도 표준화한 것입니다 109쪽
내 편찻값은 90이에요. 굉장하구나! 잘했어.



확률을 알면 사물을 보는 시각이 달라질 거예요.

전체 데이터에서 일부 데이터를 무작위로 추출하면
모든 것을 조사하지 않고도 전체 모양을 알 수 있습니다.
무작위로 추출한 데어터는 확률이라는 끈으로 전체 데이터와 단단히
연결
되어 있기 때문입니다. 117쪽

전 여전히 무작위 추출이 전체 데이터와 연결되어 있고 대표성을 가진다는 것을 잘 모르겠습니다. 아직은 아타깝지만 그렇습니다.

추측통계는 임의추출이 기본이지만

과연 그 통계가 정말 무작위로 선정
된 사람들로부터 도출된 것일까?

고 의심하는 게 중요합니다!

그렇네요. 무작위. 작위가 없어야만 하네요. 참 쉽지 않습니다.



확률변수에 익숙해집시다 132쪽

정규분포는 확률분포의 여왕 147쪽

무작위 추출은 추측통계학의 생명
그러나 실제로는 무작위 표본을 얻기란 매우 어렵습니다. 따라서 올바른 통계 이론을 사용해
도 유도한 결과는 다소 편중되거나 오류가 발생합니다. ... 통계를 맹신하는 건 위험합니다. 155쪽

통계에 대해 경각심을 갖고 대해야만 하는 이유와 데이터의 중요성을 다시 생각하게 됩니다.



여유를 두어 알아맞힙니다 : 구간추정 181쪽

구간추정 공식을 유도합시다 : 중심극한정리 185쪽

신뢰도의 의미를 바르게 이해합시다 : 신뢰도 95%, 99%
신뢰도 99%인 신뢰구간의 폭은 신뢰도 95%인 구간 폭보다 넓다. 무난한 추정을 할 수 있습니다. 193쪽
 



통계적 검정
검정은 상대를 설득하는 최강의 무기가 됩니다!
그 주장은 틀렸다. 혹은 이 주장은 타당하다. 라고 할 떄
이를 통계학으로 뒷받침하는 것이 통계적 검증입니다.
경제학, 심리학, 경영학, 사회학 등 다양한 영역에서
통계적 검증은 필수입니다.224쪽

기각역은 가설의 쓰레기통입니다 231쪽

부주의한 실수와 어리석은 실수 : 두 가지 검정 오류 237쪽

분산분석이란
(1) 각 그룹 내의 점수 차이가 큰 경우
  ... 우연이라고 판단해도 이상하지 않습니다.
(2) 각 그룹 내의 점수 차이가 작은 경우
  ... 우연이 아니라고 판단할 수 있습니다.
이처럼 그룹 간 불편분산과 그룹 내 불편분산의 비에 주목해 검정하는 것이 분산분석의 기본적인 개념입니다. 268쪽

검정이 중요한데 검정을 읽기가 쉽지 않았습니다.
다음 독서 때 제대로 읽고 오늘은 개념만 잡겠습니다.

 


세상에는 특별한 관계가 잇는
두 가지 사건이 있어요.
이것을 재미잇고, 알기 쉽게

설명해보도록 할게요.

복수의 변량을 동시에 분석하는 다변량 분석 288쪽

주성문 분석, 판별분석, 인자분석, 군집분석 293쪽
 



중요한 의사결정을 할 댸,
회귀분석은 의사결정에 도움이
되는 미래를 보여줍니다!

광고비로 매출액을 예측합니다 : 단순회귀분석
먼저 산점도를 그려봅시다
평균값, 분산, 공분산을 이용해서 에이, 비를 구합니다. 300쪽

예측의 정확도 : 결정계수

광고비와 영업 사원의 수로 매출액을 예측합니다 : 중회귀분석

회귀라는 용어
... 골턴은 부모의 키가 평균보다 크든 작든 자녀의 키는 평균에 가까워지고 있다는 통계적 경향을 발견했습니다. 아이의 키가 평균으로 회귀한다는 의미에서 이 연구를 통해 개발한 분석법에 회귀분석이라는 이름이 붙었습니다. ... 315쪽

강한 인상을 받지는 못했습니다. 다시 여러번 읽어서 이해하도록 힘내보겠습니다. 
최소한 수식에 익숙해져야 읽고 이해하기 편하겠습니다. 저의 상식 부족! 채우기 필요 



인공지능의 발전과 함께 중요성이 커진 통계학 개념입니다.

베이즈 통계학은 기존 통계학 개념과 관점이 달라 오랫동안 이단으로 취급되어 왔습니다.
그런데 왜 현대에 와서 주목받게 되었을까요? 325쪽

베이즈 통계학 대 빈도론
데이터를 얻거나 경험해야 비로소 확률변수 쎄타의 모양(확률분포)을 알 수 있다고 생각합니다. 이것이 베이즈 이론입니다.

... 현대에 인공지능이나 경제학, 심리학 등의 분야에 베이즈 이론이 사용되는 이유입니다. 
빈도론 : 고정된 확률로부터 데이터가 생성됩니다.
베이즈 이론 : 데이터로부터 확률분포가 얻어집니다.  329쪽

콜모고로프의 확률 공리 330쪽

베이즈 정리
처믐 보는 식이라 어렵게 느껴지겠지만 좀 복잡할 뿐, 곧 익숙해질 거예요. 339쪽

토머스 베이즈 343쪽

경험에 따라 확률이 매번 변합니다 : 모수는 변수 344쪽

베이즈 정리는 반복적으로 이용됩니다. 350쪽

스팸 메일 처리에 사용되는 베이즈 필터. 354쪽

... 무시당하던 베이즈 이론이 복잡한 현대에 와서는 오히려 그 모호성, 비엄밀성 때문에 받
아들여졌습니다. 인간의 경험 법칙이나 감성을 주관 확률로서 확률 및 통계학에 도입할 수 있다는 것을 알게 된 것입니다. 356쪽

중학교 수준의 수학을 다시 공부해야겠다는 것은 같지만
베이즈 이론에 때해서도 알게 되었고 임의추출이 엄정하게 지켜질 경우 확률도 믿을 수 있다는 것과 그렇지 않은 통계는 신뢰하지 말고 의심하라는 것까지 알 수 있었습니다.
용어에 익숙해진 것에 만족하지 말고 다음 단계로 넘어가기 위한 용도로 이 책을 활용하면 딱 좋은 책이란 느낌을 받았습니다.




예스24리뷰어클럽 서평단 자격으로 작성한 리뷰입니다. 아닐 수도 있습니다.

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 5

댓글쓰기
  • 스타블로거 Joy

    수업시간의 통계의 오류에 대해 배운 기억이 떠올랐습니다. 달리 말하자면 통계문항을 어떻게 만들고 또 숫자를 어떻게 활용(?)하느냐에 따라서 전혀 다른 결과가 나올 수도 있다는 것이었는데, 새삼 이제껏 제가 알고 또 믿어왔던 통계에 대해 의심(!)하는 계기가 되었습니다ㅎㅎ

    2021.06.06 20:02 댓글쓰기
    • 스타블로거 부자의우주

      ^^

      통계와 확률의 기본을 모르는 것이 통한입니다.
      공부하겠습니다 ~~~

      2021.06.06 23:24
  • 스타블로거 흙속에저바람속에

    예전에 교양인(?)이 되고 싶은 마음에 무턱대고 통계학 책 몇 권을 산 적이 있는데 대부분 완독은 고사하고 책꽂이 어딘가에서 저를 측은하게 바라만 보고 있답니다.ㅠㅠ 서평단 신청에서 이 책을 보고 호기심이 생겼던 기억이 납니다. 부자의우주님 리뷰를 보고 나니 여러 생각이 드네요. 블랙홀처럼 빠져든다는 의미가 중의적인 것 같기도 합니다.^^;;

    2021.06.06 22:21 댓글쓰기
    • 스타블로거 부자의우주

      블랙홀은 아니었습니다.
      쉽게 빠져나와서 다른 책 생각 했습니다 ^^;;

      2021.06.06 23:25
  • 파워블로그 책찾사

    이런 책을 읽으면 통계가 수학 분야에서 가장 일상에서 필요한 분야가 아닌가라는 생각을 하게 됩니다. 지금은 어떤지 모르지만 과거에는 확률, 통계가 거의 수학 끝부분에서 다뤄지면서 그렇게 깊이 공부하지는 못했던 것 같네요. 덕분에 나중에 통계를 공부할 때, 다시 처음부터 하게 되었으니까요. 리뷰를 읽으니 수학이라는 측면과 더불어 우리 사회를 이해하고 해석하는 것으로 통계를 바라봐야 할 것 같습니다.

    2021.06.09 14:06 댓글쓰기

PRIDE2