본문 바로가기

⛴️ Data Analyst

(19)
[기초 프로젝트] 프로젝트 회고 ✅ 프로젝트 측면✔️프로젝트 기획 단계 ① 데이터셋 선택 및 전처리GOOD- 정제된 데이터라 EDA에 비교적 많은 시간을 투자할 수 있었음. BAD- 전처리가 거의 필요없는 아주 작은 데이터셋을 선택해 전처리 과정을 겪지 못한 점 아쉬움  ③ EDAGOOD- 컬럼 별 특성을 파악한 후에 범위를 나누어 EDA 진행  BAD- EDA 결과를 조금 더 정리한 후 가설 설계로 들어갔어야 할듯③ 가설 / 분석 모델 GOOD- [의문 → 가설 → 분석 결과 → 결론 → 액션 플랜 → 기대 효과] 하나의 플로우에 맞춰 분석 진행  BAD- 프로젝트 주제를 관통하는 일관성 있고 통일된 가설들은 아니었음. - 가설 설계 시 더 명확하고 구체적인 단어를 사용해아 함.  - 가설 별로 파트를 나눠 깊게 파고 들었으면 조금 ..
[미니 프로젝트] 프로젝트 회고 (2024.04.19 네이버 블로그 내용 옮긴 것)✅ 프로젝트 회고​✔️프로젝트 기획 단계가설 / 분석 모델 가설을 세워 검증하는 방법을 사용할지, 몇몇 기준을 내에서 분석 모델을 만들지 고민이 있었다. 주제 가이드라인에 주어진 대로 탐색적 데이터 분석(EDA)를 활용했는데, 결론적으로는 탐색적 데이터 분석을 진행한 후에 가설을 세워 검증하는 단계까지 했더라면 더 좋았을 것 같다.​분석 기준 및 단위실력 한계상 자치구/법정동 기준으로 데이터를 분석했다. 서울시 전세 데이터 및 공원/지하철역/유흥업소 데이터를 분석해 스코어링을 한 후, 우리가 설정한 페르소나가 전세 매물을 찾을 수 있는 가장 합리적인 자치구/법정동을 산출하는 걸 프로젝트 목표로 삼았다. 매물 단위로 확인할 수 있었으면 가장 좋았겠지만, 법..
[기초 프로젝트 | Day 4] 데이터 리터러시의 중요성 이번 프로젝트를 하면서 가장 크게 와닿았던 건 '데이터 리터러시'의 중요성이었다.SQL이나 Python을 능수능란하게 다루는 것도 중요하지만, 어떤 목표를 가지고 무엇을 분석해 어떤 결론을 도출할 것인지,이 모든 과정에서 정확한 질문을 던지고 답을 찾는 것이 결국 데이터 분석의 전부라는 생각이 들었다.프로젝트가 끝나면 꼭 이랑 을 완독하고 따로 정리해야겠다.  오늘의 TIL은 데이터 리터러시 강의와 책을 정리해놨던 내용 중,기초 프로젝트를 하며 (정말정말정말) 중요하단 생각이 든 내용을 옮기는 것으로 대신한다.   1. 데이터 리터러시란?데이터를 읽고 이해하며 비판적으로 분석하여 그 결과를 의사소통에 활용할 수 있는 능력→ 데이터 리터러시는 올바른 질문을 던질 수 있도록 도와줌 2. 데이터 분석 접근법..
[기초 프로젝트 | Day 3] 시각화 1. 시각화프로젝트하면서 피봇 테이블과 시각화 차트 구현 부분을 많이 맡았다. Pandas와 Matplotlib, Seaborn을 활용해 피봇 테이블로 컬럼 간의 관계를 확인하고, 이를 시각화하여 표현하고 있다.  1) 컬럼의 순서 바꾸는 법# ['pod_lis_frequency']내 unique값 원하는 순서대로 정렬한 리스트 생성my_order =['Daily', 'Several times a week', 'Once a week', 'Rarely', 'Never']# pd.Categorical 함수를 활용해 spotify['pod_lis_frequency']를 정렬된 범주화 데이터로 변환spotify['pod_lis_frequency']=pd.Categorical(spotify['pod_lis_fre..
[기초 프로젝트 | Day 2] 가설의 중요성 순조롭게 진행되던 프로젝트가 덜컹거렸다. 한 팀원분이 가설에 대한 문제점+제안을 하시면서 우리 가설의 부족함이 드러났다.  안그래도 EDA 쪽을 정리하고 있던 나도 슬금슬금 가설에 의문이 들던 참이었다.EDA를 통해 어떤 가설이 도출됐는지를 보여줘야 하는데 가설이 명확하지 않으니 어떤 EDA 결과를 보여줘야 할지 갈피가 잡히지 않고 있었기 때문이다.  어쩌면 나조차도 납득되지 않은 가설을 증명하기 위해 의미없는 분석을 진행하고 있었다.  다음 프로세스로 가설을 다시 점검했다. EDA 결과 → 의문 → 가설 → 분석/검증 → 결론 → 액션 플랜 제시 멋드러진 분석 방법을 사용해 화려한 시각자료를 내놓는게 중요한 게 아닌데(지금은 할수도 없지만..ㅎㅎ),가장 기본이자 지금의 내가 그나마 잘할 수 있는 부분을..
[기초 프로젝트 | Day 1] 프로젝트 온보딩 - 스포티파이 팟캐스트 서비스가 프리미엄 구독 플랜에 미치는 영향 기초 프로젝트가 시작됐다.  1. 주제 선정1-1) 음악 플랫폼 유저 행동 데이터 분석 선택 다양한 주제가 있었지만 우리 조는 유저 행동 데이터를 분석할 수 있는 음악 플랫폼 '스포티파이' 주제로 결정했다.    1-2) 분석 방향성 잡기주제를 정하기 전 각자 데이터를 핸들링 하면서 가볍게 분석해보는 시간을 가졌다.  나는 데이터 분석에 들어가기 전에 아주 가볍게 스포티파이라는 플랫폼에 대한 자료 조사를 진행했다.  ▶️ 스포티파이 자료 조사글로벌 점유율 약 30% 차지 (2위 애플뮤직과 2배 차이)많은 이용자수에 비해 영업 적자 큼서비스 형태 국가마다 다름 -> 무료 요금제가 글로벌 1위에 큰 기여취향에 맞는 플레이리스트 추천 기능(기업 등과 연계해 플레이리스트 공유)참고 자료: https://www...
🌱 하니까 되긴 되네 - Pandas와 Matplotlib ▶️ 총평- Pandas와 Matplotlib에 집중- 기초 프로젝트 시작- 효율적인 공부 관리 방법 고민 필요 🤓 배운 것- Pandas, Matplotlib 활용해 필요한 데이터를 조회하고 시각화 하는 기본 문법 학습- Pandas 기본 문법 눈에 익히기 ✅ GOOD- SQL 세션 복습👍- Pandas 문법 익숙해지기 ❎ BAD- 알고리즘, SQL 코드 카타 소홀했음- Pandas 문법을 더 능숙하게 다룰 수 있도록 추가 학습 필요(데이터 전처리&시각화 세션 복습 활용하기)- 컨디션 관리 부족 (규칙적인 수면 패턴 만들기)  ❗️부족한 점은 주말을 활용하자1️⃣Pandas 세션 복습 2️⃣ SQL 총 복습⭐️⭐️⭐️- SQL 보충 세션 자료 복습하기- SQL 코드 카타 최소 5문제 복습하기 3️⃣..
🌱 이번 주는 파이썬을 잘하고 싶었다! ▶️ 총평- 파이썬에 집중했던 한 주- 눈에 띄는 성장이 보이지 않았던 한 주- 데이터 전처리 및 시각화에 들어가며 판다스 라이브러리 학습 시작한 한 주 🤓 배운 것- 파이썬 반복문 이해도 ↑- VS CODE 환경 세팅 및 적응하기- Pandas 기본 문법 눈에 익히기 ✅ GOOD- 9 to 9 학습시간 외 자발적인 추가 학습 진행👍- 파이썬 기본 문법 복습 + 알고리즘 코드 카타 풀기(데일리루틴 기준 Lv.3 달성)👍- Pandas 문법 학습 시작 ❎ BAD- 가시적인 성장&학습량 부족 : 시간 투자 대비 아웃풋 부족- 비효율적인 Pandas 학습 방법 : 주어진 강의 퀄리티가 너무 떨어짐 - SQL 복습 못함  ❗️부족한 점은 주말을 활용하자1️⃣Pandas 무료 강의 듣기 (1시간 30분)ht..
데이터 분석가 타입 ❓ 데이터 분석가 타입Business Analyst: ‘비즈니스 관점’에서 업무 프로세스 개선 / 비즈니스 모델 분석 / 요구사항 관리 등을 담당하며 매출, 비용, 가격, 대외적인 이슈 등에 관한 분석을 진행Product Analyst: ‘유저, 제품 관점’에서 제품 경험과 사용자 행동을 분석하고 A/B 테스트, 사용자 경로 분석 등을 진행하며 유입/전환, 결제율, 이탈 등을 관리BI Analyst: 기업의 비즈니스 인텔리전스 플랫폼과 도구를 사용하여 기업 내부 데이터를 시각화하고 의사 결정에 필요한 정보를 제공.✅ 데이터 = “설득”을 위한 도구⇒ 어떤 목적을 가지고 데이터를 분석할 것인가를 정의하는게 중요!! ✅ 고민할 문제“나는 왜 데이터 분석가가 되고 싶은가?”“어떤 데이터 분석가가 되고 싶은가?..