본문 바로가기

전체 글

(67)
[앙상블] 보팅(Voting), 배깅(Bagging), 부스팅(Boosting) 심화 프로젝트를 하면서 '앙상블'이라는 기법을 알게 됐다. 처음엔 단순히 '여러 모델들을 돌려보고 그중에 좋은 모델들의 성능을 합치면(앙상블하면)더 좋은 모델이 나오지 않을까???' 하는 생각에서 찾아봤는데 정말 있었다. 1. 앙상블이란?앙상블 학습은 여러 개의 모델을 생성하고, 훈련시켜예측의 결과를 여러 방식으로 종합하여 좀 더 정확한 예측을 하는 방법 2. 앙상블 모델 종류'여러 방식으로 종합'에서 어떤 방식으로 종합하냐에 따라 모델의 종류가 크게 네 개로 나뉜다고 한다. ① 보팅 (Voting)서로 다른 알고리즘을 가진 분류기를 각각 학습시키고 그 결과를 투표해서 다수결로 결정.즉, 아래 그림처럼 여러 모델들의 예측 결과를 투표해 최종 클래스를 결정하는 것이다. 투표하는 방식은 결과만을 직접적으로 ..
🌱 입력 🤖 출력 - 머신러닝 ▶️ 총평- 머신러닝에 온전히 몰입- SQL 코드 카타도 꾸준히 함- 무엇보다 재밌게 공부했던 주라는 점에서 의미가 크다!  🤓 배운 것- 머신러닝에서 회귀, 분류, 군집의 개념과 알고리즘 모델 사용법, 검정법- 데이터 전처리 - 결측치, 이상치 처리 및 표준화 ✅ GOOD- 머신러닝 강의, 세션 수강 후 직접 실습하고 기록한 것- SQL 코드카타 꾸준히 한 것 - 과제 여러 모델로 실습해본 것 ❎ BAD- TIL 소홀했던 것- 개인 프로젝트 시작하기로 마음먹었는데 실천 못함333 ⇒ 하지만 바빴음- 딥러닝은 시간 관계상 포기 📌주말- 전처리: 스케일링, 표준화, 결측치, 이상치 처리 정리 및 실습- 분석 모델: ipynb 파일 모델 별로 정리하기 (하이퍼파라미터 공식 문서 참고하기)- 책: 데이터 ..
[머신러닝] 선형회귀분석 과제 실습 과제: Boston 주택 가격 Linear Regression 예측Boston 주택 가격 데이터셋을 사용하여 주택 가격을 예측하는 회귀 모델을 만드세요.Linear Regeression을 사용하세요MSE로 성능을 평가하세요아래와 같이 데이터를 불러오세요from sklearn.datasets import fetch_california_housinghousing = fetch_california_housing()X, y = housing['data'], housing['target']   위 과제에선 전처리를 하지 않아도 된다는 조건이 있었으므로 단순히 선형회귀분석 사이클을 돌려보는 연습을 한다는 마음으로 복습부터 시작했다.  1. 데이터 프레임 생성하기# 주어진 데이터housing.datahousing.t..