데이터 분석을 위한 통계 (3) 썸네일형 리스트형 [통계101 x 데이터 분석 | 4장] 추론통계~신뢰구간 4.1 추론통계를 배우기 전에모집단에서 표본의 관계를 확률변수와 실현값의 관계로 바꾸어 보면 “얻은 표본으로 모집단을 추정한다”라는 원래 목표를 “얻은 실현값으로 이 값을 발생시킨 확률분포를 추정한다”라는 목표로 바꾸어 말할 수 있다.현실세계에서의 분포는 수학적으로 다룰 수 없을 때가 대부분이라, 수학적으로 다룰 수 있는 확률분포(모형)에 근사하여 작업을 진행하면, 모집단의 추정이 용이해진다. 이를 모형화라고 한다.만약 정규분포로 근사할 수 있다면, 평균과 표준편차같은 두가지 파라미터만으로 분포를 기술할 수 있게 되며, t분포는 실로 이와 같이 모집단이 정규분포라는 가정하에 이용할 수 있는 분포이다.이처럼 이론적인 확률분포로 근사하는 행위는 모형을 통해 현실 세계를 바라보는 것임을 명심해야 한다.모집단에.. [통계 101 x 데이터 분석 | 3장] 통계분석의 기초 3장 통계분석의 기초3.1 데이터 유형‘변수’는 데이터 중 공통의 측정 방법으로 얻은 같은 성질의 값을 말한다. 예를 들어 ‘키’가 있다.‘키’, ‘몸무게’, ‘성별’ 등 변수가 여러 개인 경우 변수 간의 관계를 밝히고자 데이터를 분석할수도 있다.통계학에서 변수의 개수는 ‘차원’이라 표현되기도 한다. 고차원의 데이터를 해석하는 경우 데이터 분석 난이도가 높아진다.숫자, 범주 등 변수의 유형마다 분석 방법이 달라지기 때문에 데이터를 수집할 때나 분석을 실행할 때 변수가 어떤 유형인지 주의 깊게 고려하는 것이 중요하다.숫자로 나타낼 수 있는 변수를 양적 변수라 한다. 대소 관계가 있으며, 평균값처럼 양을 계산할 수 있다.얻을 수 있는 값이 점점이 있는 변수를 이산형 양적 변수라고 한다.키나 몸무게 같이 간격.. [통계 101 x 데이터 분석 | 1장 ] 통계학이란? 1장 통계학이란?1.1 데이터를 분석하다데이터 분석의 주요 목적은 ‘데이터를 요약하는 것’, ‘대상을 설명하는 것’, ‘새로 얻을 데이터를 예측하는 것’이다.‘대상을 설명한다’라고 하기보다, ‘대상이 가진 성질과 관계성을 명확히 밝히고 이를 이해한다’라고 바꿔 말하면 이해하기 쉬울 것.설명에는 수준이 있다.인과관계란 2가지 중 하나(원인)을 변화시키면, 다른 하나(결과)도 바꿀 수 있는 관계를 말한다. 인과관계를 알면 좋은 점은 원인을 바꿈으로써 원하는 결과를 얻을 수 있다는 것이다. 이때 원인을 바꾸는 것을 ‘개입’이라 한다.상관관계란 한쪽이 크면 다른 한쪽도 큰(또는 한쪽이 크면 다른 한쪽은 작은) 관계를 말한다.선형 상관에 한정원리에 관련된 몇가지 가능성을 구별할 수 없으므로 얕은 이해라 할 수 있.. 이전 1 다음