요 근자에 스토리 텔링방식의 IT서적을 자주 접하게 되는것 같다. 앞전의 친절한 딥러닝 수학도 그러하였고 이번에 읽어본 [이야기로 배우는 구글 빅쿼리]또한 주인공과 등장인물이 있는 점이 유사하였다. 하지만 이번 책은 각 Chapter 별 도입부의 주요내용을 설명하는 것 이외에 나머지 설명부분은 아래 사진들을 참고해서 보면 아시듯이 일반적인 IT서적과 다르지 않았다. 이 책에 관심있는 분들은 이 점을 참고하시기 바란다.
구글 빅쿼리는 구글의 클라우드 플랫폼(Google Cloud Platform)에서 방대한 데이터를 빠르고 효율적으로 분석하기 위하여 지원하는 데이터 분석 플랫폼이다. 당연히 구글 쿼리에서 실행한 쿼리는 구글이 보유한 방대한 인프라 리소스를 활용하여 병렬,분산처리된다.
다양한 클라이언트 라이브러리나 3rd Party제품을 지원하고 그 결과를 시각화 할 수도 있다. 2011년도에 프리뷰버전이 공개된 이후 대규모 분산쿼리를 서버없이 누구나 손쉽게 처리할 수 있게되었다. 또한 빅쿼리는 표준SQL을 지원하여 DB를 활용해본 사람이면 누구나 빅데이터 분석을 할 수 있다.
특히 이책에서는 빅쿼리를 이용한 데이터분석, 빅쿼리의 기본 구조와 특징, 다양한 데이터의 로딩/가공/시각화, 데이터 수집의 자동화, 스트리밍 데이터 분석까지를 다루고 있다. 또한 실제 업무를 바탕으로 요구사항을 사례로하여 문제를 해결하는 과정을 이야기방식으로 풀어나간다. 실질적으로 빅쿼리를 사용해 보지는 못하였으나 방대한 데이터를 삽시간에 분석결과를 도출해 낸다고 하니 꼭 한번 실무에 적용해 보고 싶다는 생각이 들었다. 다만 이책은 DB, SQL과 리눅스 환경의 기초지식을 가진분들이 읽어야 할 듯하다.