콘텐츠 바로가기
본문 바로가기


블로그 전체검색
데이터 천재들은 어떻게 기획하고 분석할까?

[도서] 데이터 천재들은 어떻게 기획하고 분석할까?

조성준,조재희,김성범,이성임,조성배,이영훈 공저

내용 평점 4점

구성 평점 5점

21세기북스의 책을 아끼는 이유 중 하나는 전문가들이 집필한 최신 흐름을 독자가 지면으로 만날 수 있다는 장점이다. <서가명강>과 <인생명강> 등의 기획을 통하여 요즘 믿고 선택하는 책들을 선보이고 있어서 독자로서 때로는 도전적이기도 하지만 무척 흥미롭다. 이과 영역에 관심을 더 보이는 아이를 본다면, (아무 것도 모르는 저지만) 권하고 싶은 분야는 바이오과학과 데이터 분야 쪽이다. 사실 우리 큰 아이에게 빅데이터를 밀고 있다. 몇 해전에 아이와 함께 송길영 데이터마이너(광부^^)의 특강에 데리고 가고 가끔 그 분의 특강을 재미있게 즐기는 팬심도 작용한다. 이 책의 공동 저자로 참여할 뻔했으나 못한 사연도 머리말에 소개되어 반가웠다.

 

이렇듯, 이 책의 저자군은 빅데이터의 강자 학자들로, 서울대에서 개최해 온 마이닝 캠프 등을 중심으로 학문, 기업간의 협업이 빚어낸 책이다. 캠프 등의 활동을 바탕으로 공동집필진이 대중에게 꼭 전달하고 싶은 것은

데이터의 의미와 이를 바라보는 관점,

시각화, 예측, 클러스터링, 이미지와 덱스트 데이터의 분석 등 핵심 분석 방법

을 각자의 전공과 무관하게 이해하고 활용할 수 있는 능력이라고 밝힌다.

기업과 공공기관에서 활용하여 의사결정을 하고 있는 우리 일상 속에서 이제는 모르면 안되는 것이라고 힘 주어 말한다.

 

덱스트 분석 등은 송길영 전문가 등의 특강 등으로 이해가 더 쉬운 편이었으나 - 아쉽게도 고교 입시 문과 수학이 경험한 수학의 전부인 탓에 수학적 수식이 가득한 장은 건너 뛰며 볼 수밖에 없었다. 5부의 이미지/동영상 분석도 흥미로운 장이다. 아무리 멋진 사진과 동영상이어도 컴퓨터는 숫자로 변화해서 인식하고 작업한다는데 동일한 곳, 사람을 인식하게 하는 숫자의 임계치를 통하여 번개 같은 속도로 처리하는 능력으로 분석을 해낸다. 제일 쉬운 예로는 자동차의 번호판 등 숫자나 문자를 인식하는 것이다. 저자는 의료 영상에서 정상 세포와 질병 관련 세포를 구분하는 것도 언급하는데, 최근 왓슨을 매각한 IBM의 행보와 우리나라 의료 현장의 상황을 바탕으로 보면 정교한 단계는 아닌 것 같다.

읽고 쓰는 것을 즐기는 내가 가장 즐겁게 읽은 장은 '비지니스 성패를 가르는 텍스트 데이터에 주목하라'는 6부이다. 6부 말미에 텍스트 분석을 잘 하기 위한 저자의 제안이 뒤따르는데 최근에 읽은 <AI는 차별을 인간에게서 배운다> (역시 21세기북스의 책이라 반가운^^) 도 환기됐다.

 

부록으로 데이터마이닝과 관련한 구체적인 직업과 해당 학과를 소개하고 있다. 아이들에게 권하고 싶을 정도로 이 분야에 관심을 갖고 있는 나로선 반가운 부록이다.

진로로 고민 중인 청(소)년들을 비롯하여

책의 서두처럼 나의 온라인 활동을 기업과 공공기관이 어떻게 수익 등 여러 활동에 어떻게 사용하는지 궁금한 모든 이들께 추천한다.

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE1