본문 바로가기

머신러닝

(4)
[앙상블] 보팅(Voting), 배깅(Bagging), 부스팅(Boosting) 심화 프로젝트를 하면서 '앙상블'이라는 기법을 알게 됐다. 처음엔 단순히 '여러 모델들을 돌려보고 그중에 좋은 모델들의 성능을 합치면(앙상블하면)더 좋은 모델이 나오지 않을까???' 하는 생각에서 찾아봤는데 정말 있었다. 1. 앙상블이란?앙상블 학습은 여러 개의 모델을 생성하고, 훈련시켜예측의 결과를 여러 방식으로 종합하여 좀 더 정확한 예측을 하는 방법 2. 앙상블 모델 종류'여러 방식으로 종합'에서 어떤 방식으로 종합하냐에 따라 모델의 종류가 크게 네 개로 나뉜다고 한다. ① 보팅 (Voting)서로 다른 알고리즘을 가진 분류기를 각각 학습시키고 그 결과를 투표해서 다수결로 결정.즉, 아래 그림처럼 여러 모델들의 예측 결과를 투표해 최종 클래스를 결정하는 것이다. 투표하는 방식은 결과만을 직접적으로 ..
[머신러닝] 선형회귀분석 과제 실습 과제: Boston 주택 가격 Linear Regression 예측Boston 주택 가격 데이터셋을 사용하여 주택 가격을 예측하는 회귀 모델을 만드세요.Linear Regeression을 사용하세요MSE로 성능을 평가하세요아래와 같이 데이터를 불러오세요from sklearn.datasets import fetch_california_housinghousing = fetch_california_housing()X, y = housing['data'], housing['target']   위 과제에선 전처리를 하지 않아도 된다는 조건이 있었으므로 단순히 선형회귀분석 사이클을 돌려보는 연습을 한다는 마음으로 복습부터 시작했다.  1. 데이터 프레임 생성하기# 주어진 데이터housing.datahousing.t..
[머신러닝] 로지스틱회귀 '예측'을 하는 머신러닝(ML)은 다음 두 가지로 나뉠 수 있다. 1. 선형회귀: 연속형 데이터를 예측 2. 로지스틱 회귀: 범주형(이진형 포함) 데이터를 예측 1과 0으로 이루어진 범주형이면서 이진형 데이터값인 Y에서 X가 연속형 변수이고 Y가 특정 값이 될 확률을 표현하기엔선형 회귀 모델인 직선은 한계가 많다.  X가 연속형 변수이고, Y가 특정 값이 될 확률이라고 설정한다면, 왼쪽 그림과 같이 선형으로 설명하긴 쉽지 않아 보인다. 확률은 0과 1사이 인데, 예측 값이 확률 범위를 넘어갈 수 있는 문제가 있다. 하지만 오른쪽 그림처럼 S자 형태의 함수를 적용하면 잘 설명한다고 볼 수 있다.  따라서 S자형 함수를 만들기 위해 '오즈비'라는 개념이 도입됐다고 한다. 오즈비(Odds Ratio): 실패할..
[머신러닝] 선형회귀분석 및 검정 1. 머신러닝 정의 및 탄생 배경  아직도 머신러닝, 딥러닝, AI 등등 용어가 헷갈리는데강의 시작 전에 용어 정리와 역사까지 훑어주셔서 좋았다.  2) 용어 AI: 인간의 지능을 요구하는 업무를 수행하기 위한 시스템Machine Learning: 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘Deep Learning: 인공신경망을 이용한 머신러닝Data science: AI를 포괄하여 통계학과 컴퓨터공학을 바탕으로 발전한 융합학문Data Analysis: 데이터 집계, 통계 분석, 머신러닝을 포함한 행위💡머신러닝(Machine Learning, ML)이란?기술 통계 등을 통하여 집계된 정보로 의사결정을 했던 과거와 달리 데이터 수집과 처리 기술의 발전으로 대용량 데이터의 패턴을 인식하고이를 바..