본문 바로가기

⛴️ Data Analyst

[기초 프로젝트] 프로젝트 회고

✅ 프로젝트 측면

✔️프로젝트 기획 단계

 

① 데이터셋 선택 및 전처리

GOOD

- 정제된 데이터라 EDA에 비교적 많은 시간을 투자할 수 있었음.

 

BAD

- 전처리가 거의 필요없는 아주 작은 데이터셋을 선택해 전처리 과정을 겪지 못한 점 아쉬움

 

 

EDA

GOOD

- 컬럼 별 특성을 파악한 후에 범위를 나누어 EDA 진행 

 

BAD

- EDA 결과를 조금 더 정리한 후 가설 설계로 들어갔어야 할듯


가설 / 분석 모델

GOOD

- [의문 → 가설 → 분석 결과 → 결론 → 액션 플랜 → 기대 효과] 하나의 플로우에 맞춰 분석 진행

 

 

BAD

- 프로젝트 주제를 관통하는 일관성 있고 통일된 가설들은 아니었음. 

- 가설 설계 시 더 명확하고 구체적인 단어를 사용해아 함. 

 

- 가설 별로 파트를 나눠 깊게 파고 들었으면 조금 더 유의미한 결과 얻을 수 있을 듯

- 가설과 분석 모델이 잘 맞지 않았던듯 함. (더 고민이 필요했음)

 

​④ 분석 기준 및 단위

BAD

- 가설을 세운 후 이용자 / 구독자 / (잠재) 이탈자로 가설을 나누어서 가설이 고객 세그먼트화로 딱 맞게 설계되지 못함. 또한 고객 세그먼트화가 효과적으로 작용하지 못함. 

 

⑤ 결론 및 액션 플랜

GOOD

- 예시와 함께 구체적인 액션 플랜 도출

 

BAD

- 각각의 결론이 프로젝트 주제와 어떻게 연관되는지 잘 보이지 않음. 

 

✅ 개인적인 측면

[잘한 점]

  1. 판다스 활용해 시각화 그래프 구현함(기본적인 것 지키려 노력함 - x라벨, y라벨, 타이틀 등)
  2. 데이터 기반으로 수치화하려 노력함(팟캐스트 청취 빈도와 길이/호스트 선호도 추가 분석 진행한 후 액션 플랜 도출)

[문제점]

 

1. 챗GPT 의존도 비교적 높았음

  • error 생기면 챗GPT 사용
  • 시각화 그래프 관련 형식 지정시 도움 많이 받음

 

2. 활용한 함수만 활용 (ex. 피봇 테이블 + .apply(lambda x:)

  • 문제 상황 대처 능력 떨어짐
  • SQL 활용 안함

3. 분석 기법 고려↓

  • 가설-결론 도출 과정에서 논리적 비약을 데이터 부족으로 치부하고 넘어감.
  • 데이터 분석 기법에 대한 고민 부족했음.

4. 모호한 문제 정의

  • 한정된 데이터 안에서 뾰족하게 ‘문제 정의’하는 법 실습 필요
  • 정의한 문제로 무엇을 말하고 싶은지 연습하기

[개선사항]

  1. 학습주차 200% 활용해 SQL, Python, Pandas 기본기 다지기
  2. 분석 기법 공부 + SQL, Python으로 어떻게 구현할 수 있을지 구체화 +실습하기
  3. 챗GPT 의존도 낮추기 > 활용은 좋으나, ‘내꺼화’ 하기
  4. 데이터 문해력 내 ‘문제 정의’, ‘가설 설정’ 실습 연습하기

[발전방향]

  1. 기술부족 채우는데 급급해하지 말고 ‘데이터 분석가’로서 필요한 자질 고민하고 공부하기
  2. 어떤 분석가가 되고 싶은지 고민하기