유튜브 영상 번역 도구 소개 및 시연

“빅데이터에서 너무 비정형을 강조하는 경향이 있는데, 실제 현장에서는 정형 데이터 처리가 대부분을 차지한다. 비정형 데이터의 빅데이터 활용은 마케팅 하는 사람들의 억지에 가깝다.”김병곤 클라우다인 대표는 한양대 오픈소스SW사업단, 서울산업진흥원의 하둡 재직자 교육에서 하둡에 대한 패러다임 전환이 있어야 한다고 설명했다. 김 대표는 “현장에서는 비정형 빅데이터는 거의 없다”면서 “국내에서는 검색엔진 회사들이 비정형을 다루고 있는데 그 회사들은 하둡을 하지 않기에 비정형과 정형 데이터 처리 시장은 나눠져 있다”고 말했다.그는 비정형 데이터를 처리할 기업은 하둡에 들어오는 것이 약간 애매하다고 조언했다.대신 공공 프로젝트를 하는 경우는 소셜네트워크서비스, 웹 등의 비정형 데이터에 관심이 많은 만큼 그 부분에 신경을 쓰는 것이 좋다고 덧붙였다.이는 하둡을 바라보는 패러다임을 전환해야 한다는 방증이다. 김 대표는 로직이 데이터에 접근하지 말고 데이터가 있는 것에 로직을 옮겨야 하는 것도 패러다임 전환의 하나라고 설명했다. 하둡은 데이터가 있는 곳에 로직을 옮기는 것이기 때문에 코딩하는 방식이 다르다는 것. 김 대표는 강의에서 데이터베이스와 하둡을 비교하면서 처리하는 규모가 다르고 장단점이 제각각 다르기 때문에 어떤 것을 활용할지에 대해서는 신중히 검토해야 할 것이라고 말했다.김병곤 대표는 “하둡 생태계는 하둡만 순수 개발된 것이고, 다른 것은 모두 온라인 서비스 회사들이 오픈소스를 가져다 사내 프로젝트를 통해서 만든 것을 오픈소스로 공개한 것으로 구성돼 있다”고 말했다. 그는 이어 “그렇기 때문에 하둡 생태계를 기존 오픈소스로만 보면 안되고 정치적인 문제가 섞여 있다는 것을 인지해야 한다”고 덧붙였다.

2016/06/15 오후 5:07:53

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다