빅데이터 분석 개요

“분석이라는 단어가 5가지 의미로 쓰이고 있다. 빅데이터 분석이라는 용어를 많이 사용하고 있지만 ‘분석’이라는 의미를 어떻게 이해하느냐에 따라 다른 것이다.”이현종 빅스터 대표는 한양대 오픈소스SW사업단, 서울산업진흥원이 주최한 서울창조전문인력 교육과정에서 빅데이터 분석에 대해 설명했다. 이 대표는 “분석의 의미가 다른데도 상용 솔루션과 연결돼 혼란스럽게 사용되고 있다”면서 “빅데이터 분석 솔루션이라고 모두 동일한 것은 아니다”라고 말했다. 이 대표는 분석이라는 단어에는 일치 여부, 검색, 조회, 연산, 분석 이라는 5가지 의미가 있다고 설명했다. 데이터가 저장되기 이전에 일정한 패턴을 특정값 하고 일치하는지 안하는지를 확인하는 일치여부도 분석이라는 말로 쓰인다. 저장 상태에서 특정 값을 빨리 찾아야 하는 것이 검색인데 여기에도 로그 분석기라는 말처럼 분석이라고 거론된다.특정한 값을 불러와야 하는 조회, 조회된 것을 일정결과로 만들어야 하는 연산을 분석이라고도 한다. 마지막으로 데이터 속에 포함된 의미, 인사이트를 찾아내는 진정한 의미의 분석이 있다. 진정한 분석은 사람의 작용이 들어가서 무엇인가를 찾아내는 것을 뜻한다.이현종 대표는 “현업에서는 빅데이터 검색엔진, 빅데이터 SQL, 하둡 등 모두 빅데이터 분석 제품이라고 하지만, 검색이나 조회, 연산에 최적화된 도구이지 완벽한 빅데이터 솔루션은 아니다”라고 말했다.그는 이어 분석에 쓰이는 툴로는 R이나 파이썬이 있는데, R은 통계 분석적 접근에 유리하고 파이썬은 데이터 마이닝이나 머신러닝쪽에 유리하다고 소개했다. 한편 이 대표는 “통계와 IT쪽으로 동시에 접근 할 수 있는 사람을 데이터 사이언티스트‘라고 소개했다.

2017/01/20 오후 2:28:32

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다