반응형
공분산
2개의 확률변수의 상관정도
X의 증가 할 때 Y가 감소하는지 증가하는지 정도를 측정하는 방법
cov(X, Y) = E[ (X-E[x]) (Y-E[Y]) ] : x의 분산과 y의 분산을 곱한것의 평균
= E[XY] - E[X]E[Y]
상관계수
두 변수간에 어떤 선형적 또는 비선형적 관계
공분산을 정규화한 값 - 각 표준편차로 나눠줌
cor(X, Y) = cov(X, Y) / 𝜎(𝑋) 𝜎(𝑌)
cov(X, Y) 의 절댓값<=1
절댓값이 1에 가까울수록 직선(상관이 있다)
0에 가까울수록 퍼져있음
+값일 수록 비례
-값일 수록 반비례
증명
상관분석
변순간의 관계의 밀접한 정도(상관관계)를 분석
T분포 사용 t=r 루트 n-2 / 1-r^2
귀무가설 - 두 변수 간에는 상관이 없다.
대립가설 - 두 변수 간에는 상관이 있다.
EX.
plot(attitude)
cov(attitude)
cor(attitude)
cor.test(attitude$rating, attitude$complaints)
p-value가 0.5이상->귀무가설 기각, 대립가설 채택
, 상관계수가 0.825로 1에 가까움
결론: attiude에서 평가가 높을수록 불평이 높다. rating이 높을수록 complaints가 높다.
+회귀분석
독립변수의 변화에 따른 종속변수에 변화를 분석
단순회귀분석: 한개의 독립변수와 한개의 종속변수 간의 관계를 직석으로 표현
다중회귀분석: 2개 이상의 독립변수와 한개의 종속변수 간의 관계를 직선으로 표현
반응형
'R언어' 카테고리의 다른 글
R언어: T분포-단일표본, 독립표본, 대응표본 (0) | 2019.11.23 |
---|---|
R언어: 분산분석 (0) | 2019.11.21 |
R언어: 가설검정, 자유도, 교차분석-카이제곱검정 (0) | 2019.11.19 |
R언어: 상관계수, 확률분포, 표본추출... (0) | 2019.09.28 |
R언어 최대/소값, 최빈값, 사분위범위, 평균, 분산, 표... (0) | 2019.09.22 |
댓글