콘텐츠 바로가기
본문 바로가기


데이터를 철학하다

[도서] 데이터를 철학하다

장석권 저

내용 평점 5점

구성 평점 5점


점점 데이터 시대가 되고 있다. 내가 무의식적으로 하는 것도 데이터로 분석하고, 세상 모든 걸 전부 모아 데이터로 만들어 정보가 되는 실정이다. 누가 먼저 더 데이터를 구하고 분석하느냐가 중요한 시점이 되고 있다. 별 생각없이 하는 모든 것도 쌓이고 쌓이면 패턴을 알게 되고 이로 인해 가장 최적의 제안을 할 수 있게 된다. 상대방은 치밀하게 분석해서 나에게 제안하고 나를 이만큼이나 알고 있다니 감동하며 수락한다.


이런 세상이 점점 가까이 오고 있다. 뿐만 아니라 인공지능이 점차적으로 발달하며 인공지능은 수많은 데이터를 즉시 분석해서 가장 최적의 대안을 제공한다. 쓰레기처럼 여기 저리 흩어져있던 자료는 이제는 보석이 되어가는 중이다. 유력 기관이나 대기업은 물론이고 일반인들도 데이터를 가공하여 정보로 만들기도 한다. 데이터를 다루지 못하면 이제는 바보가 되는 것인지도 모르겠다. 데이터를 만들줄 아는 다양한 프로그램도 성행하고 있다.


데이터는 어느 순간 느닷없이 우리 곁에 찾아왔다. 그 전까지 있던 데이터가 갑자기 우리에게 엄청 중요한 무엇인가가 되었다. 너도 나도 데이터를 갖고 이용한다. 여기서 문제가 생긴다. 데이터는 넘치는데 이걸 어떻게 활용할지 여부가 대두된다. 또한 데이터 자체는 아무런 이야기를 하지 않는다. 데이터는 이야기할 수 없다. 인간은 스토리를 좋아한다. 데이터를 보고서 자신이 말을 만든다. 몇 가지 데이터를 모아놓고 그 빈틈을 채우며 이야기한다.


이 과정에서 데이터는 편향이 들어간다. 누구나 똑같이 보는 데이터를 갖고 각자 하는 이야기가 달라진다. 심지어 똑같은 데이터를 갖고도 누구는 긍정을, 누구는 부정을 이야기한다. 이처럼 데이터는 그 자체로는 무가치하다. 그 데이터를 갖고 어떤 이야기를 하는지가 중요하다. 여기서 또 다시 개인에게 집중되며 그 이야기를 하는 회자가 누군인지를 봐야한다. 그 사람이 갖고 있는 철학과 인간에 대한 시선 등이 중요해지는 이유다.


책 제목인 <데이터를 철학하다>처럼 데이터가 중요한 것이 아니라 데이터를 갖고 무엇을 이야기하는지가 중요하다. 이러니 또 다시 인문으로 가는 것인지도 모르겠다. 자신의 철학을 갖고 있지 않다면 데이터는 무용지물이다. 수많은 데이터를 갖고 어떻게 또 다시 조합하고 해석하느냐가 결국 핵심이다. 이 과정에서 자신이 어떤 성향을 갖고 있느냐에 따라 의미는 달라진다. 자신도 모르게 편향이 생기는 것은 너무 당연하고 말이다.

여기서 관찰이 중요하다. 데이터를 관찰하는 사람의 마음이 중요하고. 데이터 자체는 사실이다. 무엇을 보태지도, 빼지도 않은 상태이니 말이다. 데이터를 어떻게 표현하느냐에 따라 예술이 되기도 한다. 이전에 없었고, 생각지도 못했던 걸 데이터를 통해 제시한다. 새로운 깨달음을 알려주기도 한다. 그 부분이 예술이다. 이미 이야기한 것처럼 데이터 자체는 아무 의미도 없는 나열이다. 이를 어떻게 해석하느냐에 따라 의미가 달라진다. 다음처럼 말이다.


1953년부터 2013년까지 미국의 GDP는 약 43배 성장했다. 한국은 동일한 기간 약 2만 9,942배가 성장했다. 한국만큼 성장한 국가는 단 하나도 없다. 여기서 함정은 한국은 1953년에 한국전쟁의 휴전이 된 시기다. 1983년부터 따지면 미국은 4.6배, 한국은 21배가 성장했다. 여기서 또 다시 함정이 있다. 환율을 적용해서 1983년 733원, 2013년 1,095원으로 원화로 환산하면 미국은 6.5백 성장하고, 한국은 3.2배 성장한다.


이건 데이터의 마법일까. 데이터를 제시하는 사람의 의도일까. 분명히 숫자는 변한 것이 단 하나도 없다. 데이터를 제시하고 의견을 내는 사람의 입장에 따라 얼마든지 비교도 할 수 없는 이야기가 나온다. 그만큼 무엇인가 데이터에서 의견을 내고 주장할 때 시간은 물론이고 사실이나 진실마저도 둔갑할 수 있게 된다. 게다가 데이터를 맹신할 때 데이터의 원천소스가 아주 조금만 달라져도 엉뚱한 값이 나온다. 이를 믿고 무엇을 한다면 생각만해도 끔찍하다.


이런 의미에서 데이터를 구축하고 파악하기에 앞 서 나를 먼저 관찰해야 한다. 내가 누군인지 어떤 성향인지, 어떤 편향이 있는지 등등을 알아야 데이터를 보며 올바른 관점을 취득할 수 있고 제시할 수 있다. 이를 위해서 뜻하지 않게 '나는 누군인가'라는 철학적인 질문에 도달하게된다. 책 제목에 데이터와 철학이 함께 나온 이유다. 이게 중요한 이유는 갈수록 엄청나게 많은 데이터가 쏟아질 것이다. 이럴 때 이걸 정보와 데이터로 구분은 어떻게  할 것인가.


수많은 것 중에서 나한테 이용가치가 있다면 정보이고, 그렇지 않으면 데이터에 불과하다. 나에게 의미있는 정보가 되기 위해서는 경제 사회적으로 어떤 영향을 미치는 지 파악하고, 정보가 서로 엇갈릴 때 이를 분석해야 한다. 이런 과정에서 나만이 얻을 수 있는 훌륭한 정보가 나온다. 책이 어렵다보니 리뷰도 어렵다. 갈수록 데이터는 넘쳐나고 정보도 가득한 세상이 될 듯하다. 이럴 때 중요한 것은 무엇보다 내가 아닐까. 모든 것은 나로부터이니.


증정 받아 읽었습니다.


까칠한 핑크팬더의 한 마디 : 굳이 이렇게 길게 쓸 필요가.

친절한 핑크팬더의 한 마디 : 데이터를 제대로 봐야한다.


함께 읽을 책

https://blog.naver.com/ljb1202/220356061224
왜 전문가들은 금융위기를 몰랐나? - 신호와 소음

https://blog.naver.com/ljb1202/220629966673
빅데이터 인간을 해석하다 - 해석당하다

https://blog.naver.com/ljb1202/220702923550
빅데이터 인문학:진격의 서막 - 구글


 
취소

댓글쓰기

저장
덧글 작성
0/1,000

댓글 수 0

댓글쓰기
첫 댓글을 작성해주세요.

PRIDE2