“시각화는 빠르고 싶고 정확한 데이터 분석 과정을 지원해주는 최고의 방법입니다.” 이지은 투이컨설팅 수석은 최근 이그나이트Y 세미나에서 ‘빅데이터, 숫자로 말고 그림으로 보워줘’라는 주제로 발표를 했다. 이 수석은 숫자로 나온 결과를 그림으로 보여준다면 상대방이 쉽게 이해하는데 가장 좋은 방법이라고 소개한다. 그가 예를 든 것은 1954년도 영국에서 일어난 콜레라 질병 사건. 당시 500명 이상이 사망했다. 콜레라를 이길 수 있는 백신이 발견되기 30년 전이니 당연히 더 늘어날 확률이 높았다. 이 문제를 해결한 것이 바로 시각화다. 500명이란 사망자 숫자만 놓고 보면 의미가 없지만 어디에서 사망했는지를 지도에 그림으로 그려봤더니 새로운 사실을 알게 됐다. 공동으로 사용하는 물에서 문제가 있었던 것이다. 500이라는 숫자만 놓고보면 답이 안나오지만 그림을 그려보면 해결책이 나온다는 것. 이지은 수석은 “데이터를 시각화하는 것이 필요하다”며 시각화의 종류를 알고 거기에 맞도록 그림으로 보여주는 것이 필요하다고 말했다. . 그가 예로 든 것은 ‘삼천이십이만천오백삼십이 제곱킬로미터 (30,221,532 km)’라는 숫자다. 도대체가 무엇일까? 아프리카 대륙의 크기다. 이렇게만 놓고 보면 도통 얼마나 큰 것인지, 작은 것인지를 알수 없다. 그러나 그림으로 본다고 하면 아시아, 미국 등 주요 18개 국가를 합친 것과 동일한 크기라는 사실에 놀랄 수 밖에 없다. 이 수석은 여기에서 ‘비교’의 중요성을 든다. 바로 분석의 시작은 비교라는 것. 분석을 하기 위해서는 질문을 잘 만들어야 하는데, ‘어떤 데이터를 비교할 것인지? 데이터를 어떻게 볼 것인지, 분석을 위해 어떤 질문을 할 것인지’ 등에 관해 사전에 준비해야 한다고 강조한다. 이 수석이 마지막으로 제시한 사례는 대한민국 치킨집 수다. ‘2만 9095개’ 라는 숫자가 주는 것은 많다, 적다를 논하기가 쉽지 않다. 이를 점포간 전국 평균반경, 지역별 반경 등 분석 시각화를 통해 보면 쉽게 이해 가능하다. 이 수석은 “분석에 필요한 질문이 무엇인지를 미리 잘 검토하고, 이를 통해 나온 결과를 시각화하게 되면 좀 더 분석도 용이해지고 이해도를 높일 수 있다”고 말했다.
2014/07/28 오전 12:35:01