전체 글 (50) 썸네일형 리스트형 [기초 프로젝트 | Day 4] 데이터 리터러시의 중요성 이번 프로젝트를 하면서 가장 크게 와닿았던 건 '데이터 리터러시'의 중요성이었다.SQL이나 Python을 능수능란하게 다루는 것도 중요하지만, 어떤 목표를 가지고 무엇을 분석해 어떤 결론을 도출할 것인지,이 모든 과정에서 정확한 질문을 던지고 답을 찾는 것이 결국 데이터 분석의 전부라는 생각이 들었다.프로젝트가 끝나면 꼭 이랑 을 완독하고 따로 정리해야겠다. 오늘의 TIL은 데이터 리터러시 강의와 책을 정리해놨던 내용 중,기초 프로젝트를 하며 (정말정말정말) 중요하단 생각이 든 내용을 옮기는 것으로 대신한다. 1. 데이터 리터러시란?데이터를 읽고 이해하며 비판적으로 분석하여 그 결과를 의사소통에 활용할 수 있는 능력→ 데이터 리터러시는 올바른 질문을 던질 수 있도록 도와줌 2. 데이터 분석 접근법.. [기초 프로젝트 | Day 3] 시각화 1. 시각화프로젝트하면서 피봇 테이블과 시각화 차트 구현 부분을 많이 맡았다. Pandas와 Matplotlib, Seaborn을 활용해 피봇 테이블로 컬럼 간의 관계를 확인하고, 이를 시각화하여 표현하고 있다. 1) 컬럼의 순서 바꾸는 법# ['pod_lis_frequency']내 unique값 원하는 순서대로 정렬한 리스트 생성my_order =['Daily', 'Several times a week', 'Once a week', 'Rarely', 'Never']# pd.Categorical 함수를 활용해 spotify['pod_lis_frequency']를 정렬된 범주화 데이터로 변환spotify['pod_lis_frequency']=pd.Categorical(spotify['pod_lis_fre.. [기초 프로젝트 | Day 2] 가설의 중요성 순조롭게 진행되던 프로젝트가 덜컹거렸다. 한 팀원분이 가설에 대한 문제점+제안을 하시면서 우리 가설의 부족함이 드러났다. 안그래도 EDA 쪽을 정리하고 있던 나도 슬금슬금 가설에 의문이 들던 참이었다.EDA를 통해 어떤 가설이 도출됐는지를 보여줘야 하는데 가설이 명확하지 않으니 어떤 EDA 결과를 보여줘야 할지 갈피가 잡히지 않고 있었기 때문이다. 어쩌면 나조차도 납득되지 않은 가설을 증명하기 위해 의미없는 분석을 진행하고 있었다. 다음 프로세스로 가설을 다시 점검했다. EDA 결과 → 의문 → 가설 → 분석/검증 → 결론 → 액션 플랜 제시 멋드러진 분석 방법을 사용해 화려한 시각자료를 내놓는게 중요한 게 아닌데(지금은 할수도 없지만..ㅎㅎ),가장 기본이자 지금의 내가 그나마 잘할 수 있는 부분을.. 이전 1 ··· 7 8 9 10 11 12 13 ··· 17 다음