콘텐츠 바로가기
본문 바로가기


블로그 전체검색
비즈니스 데이터 과학

[도서] 비즈니스 데이터 과학

맷 태디 저/이준용 역

내용 평점 5점

구성 평점 5점

 


소개하고자 하는 도서는 통계에 기반하여 머신러닝에 대해서 설명하고자 한다.

일반적으로 데이터 분석 및 머신러닝에 대한 절차 및 과정에 대한 설명을 주요하게 다루는 것이 아닌

머신러닝 내에서 적용되는 skill이 통계적 관점에서 어떻게 해석되어지고 어떠한 이론을 기초로 해서 적용되는지에 대해서 풀어 나간다.

도서 내 실습은 R언어를 통해서 표현되지만, 이해를 돕는 정도이기에 해당 언어를 몰라도 본문 내용 이해에는 큰 지장이 없다.


목차

Chap1. 불확실성

통계는 크게 2가지 관점인 빈도주의와 베이지안주의로써 나뉘어져서 표현될 수 있다.

빈도주의는 확률에 대해서 객관적으로 해석함으로써, 관찰된 데이터와 관찰되지 않은 데이터들에 의한 우도에 의존한다.

베이지안 주의는 빈도주의와 반대로 주관적 해석함과 더불어서 조건부 확률에 대한 개념을 활용한다.

 

Chap2. 회귀

어떠한 x값을 토대로 y값을 유추함을 말하는 개념으로써, 

이때, x는 입력변수, y는 반응변수라 말할 수 있다.

이 수식을 설계하는 방법에 대해서 이번 장에서 설명한다.

 

Chap3. 정규화

흔히 머신러닝 내 정규화는 데이터의 분포를 일정하게 변환 함을 말한다.

이를 통계적 관점에서 표본내 편차와 표본외 편차라는 두 관점에서 왜 정규화를 해야 하는가,

또한 어떠한 방법으로 정규화하는지를 이번 장에서 설명한다.

 

Chap4. 분류

분류는 label 이 존재하는 지도학습 분류와 label 이 존재하지 않는 비지도 학습 분류로 나뉜다.

위 두 분류에서 확률적으로 어떻한 방법들을 사용해서 분류하며 이에 소요되는 비용에 대해서 서술한다.

또한, 병렬처리는 통해서 얻을 수 있는 이점에 대해서 설명한다.

 

Chap5. 실험

일반적인 실험의 경우는 설계한 분류, 회귀 모델들을 어떠한 방식으로 학습 시킬 것인가에 대한 설명일 것이다.

이번 장에서 말하고 싶은 것은 앞서 설계한 모델을 어떠한 통계적인 기법으로써, 옳은가 또는 옳지 않은가에 대해서

증명하는지에 대한 방법론을 제시한다. 

 

Chap6. 제어

앞 장에 실험은 완전 무작위 AB실험, 유사 실험 설계, 도구 변수 변수 시나리오 구성된다.

위 3가지 방법으로 실험을 진행하여도 결과가 원하는 방향으로 나오지 않을 수 있다.

이는 모든 요인를 관찰하는 것은 불가능하며, 이 결과를 신뢰 할 수 있도록 충분히 주요 요인이 제어 됫을거라는

기대, 추정이 필요하고 이러한 가정을 조건부 무시가능성의 가정이라고 말한다.

이에 대한 설명을 이번장에서 한다.

 

Chap7. 인수분해

일반적인 머신러닝에서는 차원축소라는 표현이 더 익숙하다.

차원 축소가 이루어 질 때, 통계적 관점에 대한 설명을 이번장에서 한다.

 

Chap8. 데이터로써의 텍스트

텍스트를 데이터로 사용하기위한 과정을 이번장에서 설명한다.

 

Chap9. 비모수

앞서 설명했던 장들은 모수로써, 입력이 반응에 영향을 미치는 방법에 제한을 둠을 말한다.

이는 결국 paramter 최적화를 통해서 데이처에 모델 적합함을 의미한다.

비모수라 함은 데이터 관촬을 통해서, 트리 및 포레스트 기반한 분류를 말하며,

이에 대해서 이번장에서 설명한다. 

 

Chap10. 인공지능

인공지능이라 함은 도메인 구조(비지니스 룰) + 데이터 생성 + 범용적 모델(ML, DL) 결합을 통해서 만들어 진다.

이에 대해서 이번장에서 설명한다.

 


정리

기존 데이터 분석에 대한 도서들의 방향성이 머신러닝에 대한 일반론적인 접근으로 풀어서 나아갔다면,

본 도서는 머신러닝에서 사용되는 수많은 skill이 통계적 관점에서 왜 쓰여졌는지에 대한 좀더 인사이트를 가질 수 있도록

풀어서 설명하고 있다.

물론, 통계에 익숙하지 않은 독자들이 더 많을 것이며, 본인 또한 그렇다.

그렇지만, 더 나은 데이터 과학자가 되기 위해서 배워야하는 기초지식으로는 의심치 않는다.

 

- 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PYBLOGWEB3