콘텐츠 바로가기
본문 바로가기


블로그 전체검색
빅데이터 커리어 가이드북

[도서] 빅데이터 커리어 가이드북

조성준,김현용,박서영,안용대,임성연 저

내용 평점 5점

구성 평점 5점

데이터 활용이 화두다. 나이가 많거나 경험이 있거나, 지위가 높은 사람의 의견을 따라 의사결정 하던 기업 문화가 데이터로 바뀌고 있다. 이런 현상은 IT기업에만 국한된 것이 아니라 전방위적으로 확산되고 있지만 여전히 데이터를 적절히 활용하는지에 대해서는 막막한 것도 사실이다. 이에 빅데이터 분야의 맥을 짚고 데이터를 어떻게 활용하면 될지, 더 나아가 빅데이터 전문가가 되기 위한 커리어를 알려주는 책이 눈길을 끈다.

4차 산업혁명 시대, 자산의 재정의가 일어나고 있다. 출처=픽사베이

 

데이터가 돈이다.

디지털 신호인 데이터가 자산이 될 수 있다는 말이 처음에는 와 닿지 않았을 것이다. 그러나 어느새 데이터는 석유 못지 않은 돈이 되었다. 2016년 4차 산업혁명이 화두가 되고 같은 해 알파고(AlphaGo)와 이세돌의 바둑 대결은 데이터의 잠재력을 세상에 드러낸 계기가 됐다. 이제는 너도나도 데이터가 중요하다는 것을 알게 됐다. 이에 발맞춰 많은 기업이 빅데이터 인력을 모집하고 있지만, 아직까지 빅데이터가 무엇인지, 그리고 빅데이터와 관련된 직업과 직무를 어떻게 정의할 지에 대한 논의는 진행형이다. 잘 모른다는 말이다.


책의 표지는 제목이 크게 새겨져 있고 우주가 배경이다. 빅데이터가 여전히 미지의 영역이고 그 잠재력이 무한에 가깝기 때문에 우주를 배경 삼은 것은 아닐까 생각해본다. 표지 아래에는 띠지 형태로 저자를 소개했는데, 이 책을 쓴 이유가 우주를 유영하는 듯 빅데이터를 탐험하는 모험가의 마음으로, 또 후세대를 생각하며 안내자 역할을 강조하기 위한 선택이었으리라 추측한다.

 

저자인 조성준 서울대학교 산업공학 교수는 신경망과 기계학습 연구로 박사 학위를 땄고 데이터 리서처(Data Researcher)로 커리어를 시작했다. 우연히 수강한 ‘연결주의 컴퓨팅’ 수업에서 머신런닝(Mashing Learning)을 접하고 빅데이터의 길에 접어들었다. 데이터를 다루는 직업이 저자가 처음은 아니었지만 이 분야의 선구자 역할을 한 것은 분명하다.

IT업계 전문성 확보는 현재진행형이다. 출처=Unsplash

 

이 분야는 누구나 강자가 될 수 있다.

데이터, IT, 알고리즘 하면 단연 세계적 기업 구글(Google)부터 떠오를 것이다. 구글은 매년 전염병 데이터 분석과 관련한 ‘구글 독감 트렌드(Google Flu Trends, GFT)’를 내놨지만 신종 코로나바이러스 감염증(Covid 19)의 세계적 확산을 예고한 것은 캐나다의 인공지능 스타트업 블루닷(BlueDot)이다. 블루닷은 약 40명의 직원이 있는 작은 회사로 구글에 비하면 다윗 손자 뻘 되는 존재다. (구글과 블루닷을 싸움구도로 보는 것은 아니지만 말이다.)

 

블루닷은 의료 데이터 없이 65개 언어로 된 언론 보도와 항공 데이터, 동식물 질병 데이터 등을 수집했다. 각 데이터를 취합하고 분석한 뒤 연구원이 다시 크로스 체크하는 과정을 통해 코로나 바이러스 대유행을 정확히 예측한 이 사건은 빅데이터의 오만에 빠진 구글에게 한 방 먹이게 된 것이다. 현재 앞선 기업이라고 앞으로도 앞서지 않는 데이터 활용 분야의 또 하나의 사례가 된 것이다.

 

필자가 처음 빅데이터에 관심을 둔 것은 10년 전 대학 교수의 여담에서 였다. “요즘 빅데이터가 뜬다는 데 거기에 한 번 매진 해봐야겠어요.” 교수라는 직업 특성상 향후 연구 과제를 빅데이터로 정했다로만 받아들였다. 그 말을 듣던 당시 필자의 첫 반응은 ‘빅데이터란 말이 나온 지가 언젠데 이제 연구한다고?’였다. 지금 생각해보면 참 어처구니 없는 것 같다. 필자도 그 때 관심을 넘어 매진했다면 하는 아쉬움은 이 책으로 접어둔다.

 

전문가가 없다…여전히

또 몇 해 전 IT업계에 종사하던 지인이 식사자리에서 진지하게 이런 말을 했다. “IT 업계는 전문가가 없다” 이 무슨 말인가. 오랜기간 IT 업계에만 종사하던 분이 술 드시고 하신 말에서 전문가가 여전히 없다니! 이것은 취중진담인가, 양심선언인가. 옆에 계신 다른 분도 “맞다”고 고개를 끄덕였다. 저자가 이 책을 내놓게 된 계기도 여전히 빅데이터라는 분야가 방대하고 업계에 등장한지 십년이 훌쩍 지났지만 (그리고 데이터를 다루는 직업은 그보다 훨씬 더 오래됐지만) 여전히 전문성을 키워 직업을 갖기 충분한 시기라고 판단된다. 흡사 춘추전국시대처럼 말이다.

 

이 책은 너무나 당연하지만 누구나 하는 질문에서 시작한다. “빅데이터는 무엇이고, 빅데이터 전문가는 어떤 일을 할까?”

빅데이터로 사람의 생각과 의견, 욕망까지 분석 가능하다. 출처=픽사베이

 

이 책을 쓴 조성준 교수는 “빅데이터는 기업과 우리 사회 전체를 발전시키는 데 결정적인 역할을 하고 있다”면서 “빅데이터가 등장한 이후 객관적인 데이터를 분석해 도출된 인사이트를 근거로 의사결정하는 추세로 바뀌었다”라고 말했다. 조 교수는 “빅데이터는 전공과는 무관하게 공부해야 하는 미래 지식”이라면서 “빅데이터는 인문, 사회, 경영, 경제, 의료, 과학, 스포츠, 예술 등과 같은 거의 모든 분야에 적용된다”라고 덧붙였다.

 

또 그는 빅데이터 전문가의 일을 소개하며 “컴퓨터 사이언스, 산업공학, 통계학을 전공한 사람들이 데이터 리서처, 데이터 사이언티스트, 데이터 엔지니어가 돼야 한다”면서 “다른 분야 전문가들도 빅데이터 기초를 배워 데이터 애널리스트, 데이터 기획자, 시티즌 데이터 사이언티스트가 될 수 있다”라고 말했다. 이제 패권을 표현하는 말은 바뀌어야겠다.

 

"모든 길은 데이터(Data)로 통한다"

대표적인 데이터 기업들. 출처=trtworld

 

빅데이터란 디지털 환경에서 생성되는 데이터로 규모가 방대하고, 생성 주기가 짧으며, 형태도 수치 데이터 형태뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다.

 

빅데이터 환경은 과거와 비교해 데이터의 양이 폭증했다는 점과 더불어 그것의 종류도 다양해졌다. PC와 인터넷, 모바일 기기 이용이 생활 필수품으로 자리잡으며 사람들이 도처에 남긴 발자국(데이터)으로 행동은 물론 위치정보와 소셜 미디어(SNS)를 통해 얻은 생각과 의견, 욕망까지 분석하고 예측할 수 있게 됐다. 데이터를 알고리즘 화 하면 없던 구매욕도 자극할 수 있는 시대다.

 

책의 특징은?

책 제목 <…커리어 가이드북>에서 알 수 있듯 이 책은 현재 각광받는 직업을 6가지로 세분화한 것이 특징이다. 데이터 엔지니어(Data Engineer), 데이터 애널리스트(Data Analyst), 데이터 사이언티스트(Data Scientist), 데이터 리서처(Data Researcher), 데이터 기획자(Data Project Manager), 그리고 특별히 빅데이터 직무로 분류 하진 않지만 본연의 업무에 빅데이터를 결합하는 인재에 대해 설명하기 위해 저자가 추가한 시티즌 데이터 사이언티스트(Citizen Data Scientist)가 그것들이다. 구직자나 취업 준비생 입장에서 데이터 관련 직무의 성격, 요구되는 스킬, 성향을 구별하기 위해 저자의 직무 소개는 밤바다를 밝히는 등대처럼 느껴질 것이다.

 

책 후반부에는 관련 자료를 연구하거나 독학할 수 있도록 QR코드가 있다. 데이터 사이언티스트와데이터 리서처가 활용할 수 있는 머신러닝 자료는 물론 유튜브와 글로벌 유명 대학의 온라인 수업, 기초 학습과 관련한 내용이 여러 페이지에 걸쳐 제공 돼 독자로 하여금 편리하게 접근할 수 있는 것이 2번째 책의 장점이다.

북 맵을 통해 직무 연관성을 쉽게 파악할 수 있다.

 

또 책을 읽을 독자가 직업별 어떤 내용을 더 중점적으로 읽어야 할지 참고하기 위한 ‘북 맵(Book Map)’도 있다. 저자는 북맵을 제공하면서 이 책에서 다루는 빅데이터 직업과 내용이 광범위하기 때문에 꼭 필요한 지식을 중점적으로 읽는 것이 좋다며 그 이유를 밝혔다. 책 초반부에는 “빅데이터 직업과 상관없이 반드시 읽어야 할 내용입니다”라고 안내하며 후반부로 갈수록 6가지 직무 별 중요성을 가늠하기 좋은 가이드라 생각한다.

 

이외에도 해당 업무 종사자들과의 인터뷰로 재구성된 내용과 성공 요소, 현 기업들의 채용 공고로 비교 분석한 직무 예시, 작업 도구(Tool)들이 여백을 활용해 적절히 제공되는 점도 가이드북으로서 역할을 충분히 한다. 빅데이터 전문가이면서 마인드 마이너로 유명한 송길영 바이브컴퍼니 부사장과 수십 명의 업계 종사자들이 이 책의 출판을 반기는 것은 이 책의 필요성과 필연성을 방증하는 듯 하다.

 

빅데이터라는 새로운 단어가 세상에 나온 지 10년이지만 어쩌면 이제 시작일 수 있다. 문과 이과 구분하지 말고 이 책 한권은 꼭 보기를 권한다.

 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE2