본문 바로가기

분류 전체보기

(50)
[태블로] 날짜 필터 여러 워크시트에 적용하기 1. [필터]에 적용할 날짜 테이블 넣기 - 여기서는 {주문 날짜} 넣어줌 2. 우클릭 후 [워크시트에 적용] - [선택한 워크시트]  3. 날짜 필터를 적용할 워크시트들 선택 선택한 워크시트들에 필터 일괄 적용됨!
[태블로] 동작 넣기 동작 넣느라 엄청 고생했는데,과제 해설을 듣고 나니 세상 간단했던 것... 1. [대시보드] - [동작] 2. [동작추가] - [필터] 3. [필터 동작 추가]이름: {필터1:동작의 이름 바꿔주기}원본 시트: 동작을 적용할, 즉 클릭{선택}할 시트 선택    - 보통 큰 범주의 시트를 선택    - 동작 실행 조건: {선택: 마우스 클릭}대상 시트: 동작이 작동할, 즉 원본 시트를 클릭해 움직일 시트들 선택   - 선택을 해제할 경우의 결과: {모든 값 표시: 필터를 적용하지 않았던 원상태로 초기화} 끝!
[심화 프로젝트] 프로젝트 회고 ✅ 프로젝트 측면✔️프로젝트 기획 단계 ① 데이터셋 선택 및 전처리GOOD머신러닝을 처음 배우는 만큼, 비지도 학습보단 지도 학습 주제를 선택하는 게 나을 거라고 생각했고, 결과적으로 '트위터 사용자 성별 예측 모델'이라는 뚜렷한 주제를 선택해 비교적 명확한 방향성을 가지고 프로젝트를 시작할 수 있게 됐다.  BAD자연어 파트가 중요한 데이터셋이었는데 개인적인 역량 부족으로 자연어 컬럼을 다루지 못했음.  ③ EDAGOOD기본적으로 서로 다른 특징을 갖고 있는 컬럼들을 팀 측면에서 꼼꼼히 살펴봤다고 생각함.  BAD튜터님 피드백대로 컬럼별 특성을 조금 연결 지어 살펴봤으면 어땠을까 싶음.상관계수 살펴본 것 이외에 EDA를 진행하지 않아서, 간단하게 EDA 해봤으면 다른 특징들을 발견할 수 있지 않았을까 ..
[앙상블] 보팅(Voting), 배깅(Bagging), 부스팅(Boosting) 심화 프로젝트를 하면서 '앙상블'이라는 기법을 알게 됐다. 처음엔 단순히 '여러 모델들을 돌려보고 그중에 좋은 모델들의 성능을 합치면(앙상블하면)더 좋은 모델이 나오지 않을까???' 하는 생각에서 찾아봤는데 정말 있었다. 1. 앙상블이란?앙상블 학습은 여러 개의 모델을 생성하고, 훈련시켜예측의 결과를 여러 방식으로 종합하여 좀 더 정확한 예측을 하는 방법 2. 앙상블 모델 종류'여러 방식으로 종합'에서 어떤 방식으로 종합하냐에 따라 모델의 종류가 크게 네 개로 나뉜다고 한다. ① 보팅 (Voting)서로 다른 알고리즘을 가진 분류기를 각각 학습시키고 그 결과를 투표해서 다수결로 결정.즉, 아래 그림처럼 여러 모델들의 예측 결과를 투표해 최종 클래스를 결정하는 것이다. 투표하는 방식은 결과만을 직접적으로 ..
🌱 입력 🤖 출력 - 머신러닝 ▶️ 총평- 머신러닝에 온전히 몰입- SQL 코드 카타도 꾸준히 함- 무엇보다 재밌게 공부했던 주라는 점에서 의미가 크다!  🤓 배운 것- 머신러닝에서 회귀, 분류, 군집의 개념과 알고리즘 모델 사용법, 검정법- 데이터 전처리 - 결측치, 이상치 처리 및 표준화 ✅ GOOD- 머신러닝 강의, 세션 수강 후 직접 실습하고 기록한 것- SQL 코드카타 꾸준히 한 것 - 과제 여러 모델로 실습해본 것 ❎ BAD- TIL 소홀했던 것- 개인 프로젝트 시작하기로 마음먹었는데 실천 못함333 ⇒ 하지만 바빴음- 딥러닝은 시간 관계상 포기 📌주말- 전처리: 스케일링, 표준화, 결측치, 이상치 처리 정리 및 실습- 분석 모델: ipynb 파일 모델 별로 정리하기 (하이퍼파라미터 공식 문서 참고하기)- 책: 데이터 ..
[머신러닝] 선형회귀분석 과제 실습 과제: Boston 주택 가격 Linear Regression 예측Boston 주택 가격 데이터셋을 사용하여 주택 가격을 예측하는 회귀 모델을 만드세요.Linear Regeression을 사용하세요MSE로 성능을 평가하세요아래와 같이 데이터를 불러오세요from sklearn.datasets import fetch_california_housinghousing = fetch_california_housing()X, y = housing['data'], housing['target']   위 과제에선 전처리를 하지 않아도 된다는 조건이 있었으므로 단순히 선형회귀분석 사이클을 돌려보는 연습을 한다는 마음으로 복습부터 시작했다.  1. 데이터 프레임 생성하기# 주어진 데이터housing.datahousing.t..
🌱 다시 집중하기 위해 잘 쉬었다고 생각하자 - 머신러닝 ▶️ 총평- 저번주가 풀어진 마음으로 보낸 한주였다면 이번주는 고삐를 놓아버림😂- 약간 우울해질뻔했지만 다시 달리기 위해 한 주 쉬어간 거라고 생각할래 🤓 배운 것  ✅ GOOD- 머신러닝 강의 들은 것- SQL 코드카타 꾸준히 한 것  ❎ BAD- 프로젝트 후 느슨해진 마음에 몰입하지 못함222- 개인 프로젝트 시작하기로 마음먹었는데 실천 못함222- 현충일이랑 다음날인 오늘(금요일) 날림.. 잘 쉬고 놀았으니까 정신차리기🥹
[머신러닝] 로지스틱회귀 '예측'을 하는 머신러닝(ML)은 다음 두 가지로 나뉠 수 있다. 1. 선형회귀: 연속형 데이터를 예측 2. 로지스틱 회귀: 범주형(이진형 포함) 데이터를 예측 1과 0으로 이루어진 범주형이면서 이진형 데이터값인 Y에서 X가 연속형 변수이고 Y가 특정 값이 될 확률을 표현하기엔선형 회귀 모델인 직선은 한계가 많다.  X가 연속형 변수이고, Y가 특정 값이 될 확률이라고 설정한다면, 왼쪽 그림과 같이 선형으로 설명하긴 쉽지 않아 보인다. 확률은 0과 1사이 인데, 예측 값이 확률 범위를 넘어갈 수 있는 문제가 있다. 하지만 오른쪽 그림처럼 S자 형태의 함수를 적용하면 잘 설명한다고 볼 수 있다.  따라서 S자형 함수를 만들기 위해 '오즈비'라는 개념이 도입됐다고 한다. 오즈비(Odds Ratio): 실패할..
[머신러닝] 선형회귀분석 및 검정 1. 머신러닝 정의 및 탄생 배경  아직도 머신러닝, 딥러닝, AI 등등 용어가 헷갈리는데강의 시작 전에 용어 정리와 역사까지 훑어주셔서 좋았다.  2) 용어 AI: 인간의 지능을 요구하는 업무를 수행하기 위한 시스템Machine Learning: 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘Deep Learning: 인공신경망을 이용한 머신러닝Data science: AI를 포괄하여 통계학과 컴퓨터공학을 바탕으로 발전한 융합학문Data Analysis: 데이터 집계, 통계 분석, 머신러닝을 포함한 행위💡머신러닝(Machine Learning, ML)이란?기술 통계 등을 통하여 집계된 정보로 의사결정을 했던 과거와 달리 데이터 수집과 처리 기술의 발전으로 대용량 데이터의 패턴을 인식하고이를 바..
🌱 통계학과에 가야했어 - 통계학의 기초 ▶️ 총평- 통계학의 기초 강의에 휩쓸려 순식간에 흘러간 한 주...- 풀어진 마음으로 여유롭게 보냈던 한 주 🤓 배운 것- '통계학의 필요성'을 배웠지만 통계학은 배우지 못했다...- SQL 함수들 + 리텐션률 구하는 방법 + 퍼널 설계  ✅ GOOD- 최선을 다해 이해하려고 노력한 것- SQL 베이직, 챌린지 강의 들으면서 기존에 쓰지 못했던 함수(WINDOW 함수, DATE 관련 함수, WITH절, 서브쿼리 등) 익숙해진 것 ❎ BAD- 프로젝트 후 느슨해진 마음에 몰입하지 못함- 개인 프로젝트 시작하기로 마음먹었는데 실천 못함 ❗️부족한 점은 주말을 활용하자(지난주 목표 그대로 가져간다→문제있다😡)1️⃣ 데이터 리터러시- '데이터 문해력' 읽기- '데이터 분석가의 숫자유감' 읽기 2️⃣ SQL..