시장 조사, 고객 분석, 매출 예측, 보고서를 한 번에
코드 한 줄, 수식 계산 없이 기초 통계부터 고급 데이터 분석까지!
이 책은 데이터 분석을 경험해 본 적이 없는 사람 또는 데이터 분석에 AI를 적용하려는 사람을 위해 AI를 활용한 데이터 분석의 전 과정을 쉽게 익힐 수 있도록 구성했습니다. 단순히 데이터 분석 과정을 훑는 것이 아니라 실무에서 데이터 분석 프로젝트가 어떻게 시작되고 마무리되는지 체감할 수 있도록 데이터 분석을 시작하는 ‘김대리’와 ‘박차장’이라는 인물을 활용했습니다. 이제 막 데이터 분석을 시작해 데이터의 개념, 챗GPT 사용법부터 고급 데이터 분석과 시각화까지 한 단계씩 나아가는 김대리를 통해 실무에서 흔히 마주치는 데이터 분석 문제를 살펴볼 수 있습니다. 이 과정에서 여러분은 실무에 바로 적용 가능한 지식과 기술을 습득할 수 있는 것은 물론이고 실제 분석 과정에서 자주 부딪치는 문제를 해결하는 방법도 알 수 있습니다.
더불어 누구나 이 책에서 다루는 모든 프로젝트를 직접 실습할 수 있도록 데이터 파일을 제공합니다.
누구나 프로처럼,
나만의 데이터 분석가를 월 20달러로 고용하는 방법
챗GPT는 누가 어떻게 쓰느냐에 따라 무궁무진한 가능성을 가진 도구입니다. 때로는 SNS 콘텐츠를 뽑는 유능한 콘텐츠 기획자였다가, 의뢰인의 상담을 도와주는 변호사면서 막힘 없이 데이터 분석 주제 제안부터 보고서 작성까지 깔끔하게 정리해 주는 똑똑한 분석가가 되기도 합니다. 이 모든 역량을 가진 뛰어난 파트너를 챗GPT라는 하나의 도구로 고용하는 방법을 알려드립니다.
1부 데이터 분석을 위한 도구, 챗GPT & 데이터 애널리스트
01장 데이터 분석 도구로서 생성 AI
챗GPT의 탄생
데이터 분석 GPT, 데이터 애널리스트
회사 데이터 분석도 가능할까?
02장 챗GPT 사용 가이드
챗GPT 시작하기
사용자 맞춤 설정하기
더 나은 대화를 위한 프롬프트 엔지니어링
다양한 GPT 살펴보기
API를 활용한 나만의 GPT 만들기
챗GPT와 음성 대화하는 방법
03장 데이터 애널리스트 사용 가이드
데이터 애널리스트 시작하기
PDF 파일로 PPT 보고서 만들기
코드 파일로 코드 리뷰하기
CSV 파일로 데이터 분석하기
데이터 애널리스트의 한계
2부 데이터 분석의 기초 쌓기
04장 데이터는 어디에 있죠? - 데이터와 데이터베이스
데이터 & 데이터베이스
DBMS와 SQL
원시 데이터
05장 무엇을 분석하나요? - 분석 주제 선정 방법
데이터로 할 수 있는 일
분석 과제 도출 방법
하향식 접근 방법
상향식 접근 방법
원활한 인터뷰를 위한 4단계
06장 어떻게 분석할까요? - 데이터 유형에 따른 분석 방법
정형 데이터와 비정형 데이터
범주형 데이터와 수치형 데이터
07장 데이터가 크면 어떻게 하죠? - 다양한 데이터 분석 환경의 이해
데이터 샘플링
데이터 분석 플랫폼
3부 챗GPT로 데이터 분석 쉽게 하기
08장 분석 주제 질의하기
데이터 파악을 위한 메타 데이터와 ERD
분석 주제 탐색 및 확장
단계별 접근 및 문제 해결 기법 적용
주제를 평가하는 새로운 관점
보고서 초안 작성
09장 데이터 확인 및 검증하기
데이터 애널리스트를 활용한 데이터 확인
분석 창을 활용한 코드 확인
중복 데이터
10장 결측값 처리하기
결측값과 EDA
결측값 처리 방법
결측값 대체하기
결측값 삭제하기
11장 데이터 분포 파악
수치형 데이터 특성 파악하기
데이터 시각화하기
데이터 샘플링하기
12장 이상치 처리 방법
이상치 찾기
이상치 처리하기
13장 범주형 데이터 분석
범주형 데이터 분석하기
범주형 데이터와 수치형 데이터 결합하기
데이터 시각화 패키지
14장 데이터 재범주화
데이터 재범주화란?
데이터 재범주화하기
15장 통계 검정
통계 검정이란?
데이터 분포 시각화하기
통계 검정하기
16장 데이터 변환
데이터 변환이란?
범주형 데이터 변환하기 ①
범주형 데이터 변환하기 ②
데이터 취합하기
4부 챗GPT와 고급 데이터 분석 도전하기
17장 고액 연봉 개발자 예측하기
고급 데이터 분석과 머신러닝 알고리즘
상관관계 분석이란?
예측을 위한 통계 기법, 회귀 분석
회귀 분석으로 모델링하기
스케일링하기
트리 모형으로 모델링하기
18장 멤버십 회원 확대 방안 분석
의사결정나무란?
데이터 처리하기
알고리즘 학습시키기
트리 구조 시각화하기
트리 구조 텍스트화하기
결과 정리하기
19장 이탈 회원 분석
군집 분석과 LDA 알고리즘
데이터 처리하기
알고리즘 학습시키기
의사결정나무로 시각화하기
20장 타기팅 분석
분류 분석과 회귀 분석
타기팅 모델링하기
리프트 게인 차트로 모델 평가하기
앙상블과 부스팅 모델
LightGBM으로 모델링하기
21장 선호하는 채널 분석
챗GPT API란?
오픈AI 플랫폼 둘러보기
챗GPT API 사용하기
배치 사용하기
분석하기
부록 데이터 분석에 필요한 최소한의 파이썬
변수
연산
함수
책 한 권으로 누구나 프로처럼,
챗GPT를 파트너로 활용하는 8단계
이 책의 대상 독자