언제부터인가 '데이터 분석'이라는 게 여기저기서 등장합니다. 직접해야하는 상황까지는 안 가더라도 데이터 분석이 필요할 수는 얼마든지 있는 것 같습니다. 데이터 분석이라고 하면 조금 평범함과 거리가 있게 느껴지기도 하지만... 어떤 현상에 대해서 자료를 수집하고, 통계를 내고 이것들을 해석하고 무언가를 추론한다고 생각하면요. 통계와 확률의 영역입니다.
데이터 분석을 하는데 있어서 자주 언급되고 듣게 되는 프로그래밍 언어들이 있죠. [엑셀, R, 파이썬으로 시작하는 데이터 분석] 속의 도구와 기법이 해당됐습니다. 차이점이 있다면 프로그래밍 언어보다 아무래도 더 자주 접했을 엑셀을 활용해 데이터 분석의 기초를 설명했다는 것이고 이를 바탕으로 엑셀에서 R과 파이썬으로 각각 확장합니다.
프로그래밍 언어가 절대적으로 우위에 있다고 주장하는 예의 그 논쟁이 불필요하다는 것이나 '프로그래밍 언어를 사용한 탐색적 데이터 분석과 가설 검정의 수행'이라는 학습 목표 및 집필 의도가 전반부에 다루어졌던 것이 좋았습니다.
“결과가 통계적으로 유의미한가?”
계산 혹은 정리로 사용이 그치는 엑셀인데 이것보다 더 의미를 가질 수 있음을 생각하게 했던 것 같습니다 제겐.
변수와 관측값 그리고 측정값 사이의 관계성, 목적과 상황에 따라 변경할 분류 기준, 관측값이 평균에서부터 얼마나 퍼져 있는지 나타내는 척도인 분산, 비조건부확률과 조건부확률, 통계적 유의성 또는 표본 크기의 변화에 민감함, 패키지와 라이브러리의 적용과 데이터 조작, 통계적 추론과 추리 통계, 시각화 등의 내용이었습니다. 확률과 해석의 중요성이 전반적으로 많이 강조되었다고 느꼈고요. 고급 기술을 연마와 적극적인 연습에 대한 독려까지 함께 있던 [엑셀, R, 파이썬으로 시작하는 데이터 분석]이었습니다!
* 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.