본문 바로가기
R언어

R언어: 분산분석

by socialcomputer 2019. 11. 21.
반응형

분산분석(ANOVA)

두 개 이상의 다수의 집단을 비교하고자 할때

집단 내의 분산, 총평균과 각 집단의 평균의 차이에 의해 생긴

집단 간 분산의 비교--확률분포 F분포 사용

F분포

두 확률변수가 각각 자유도를 가지고, 서로 독립인 카이제곱 분포를 따른다고 할때

 

분산분석의 종류 : 종속변수와 독립변수의 수에 따라 분산분석 종류바뀜

 

단일변량분산분석

  • 일원분산분석
  • 이원분산분석

다변량분산분석

 

사후분석 : Duncan, Tkey, Bonferroni, Scheffe

 

 

<일원분산분석>

독립변수 1개 + 종속변수 1개

집단간종속변수의 평균차이를 분석

전제조건 -독립성: 각 집단은 서로 독립적

            -정규성: 각 집단은 정규분포

            -불편성: 각 집단은 비슷한 분산

귀무가설: 평균이 모두 같다. 

 

총 편차=관측치-전체평균=집단 간 편차+집단 내 편차

F = 집단간 제곱 평균/집단내 제곱 평균 = SSB/(c-1)  / SSW/(N-c)

SST(총변량sum of squares total)SSB(집단간 변량sum of squares between groups)SSW(집단내 변량sum of squares whitin groups)

 

EX. 각 평균 5 /9 /10

SSB 는 각 평균과 전체 평균을 통해 계산

SSW는 각 자료로 편차의 제곱값 계산, 편차는 집단의 평균과 편차로 계싼

자유도 15=3*(6-1)

반응형

댓글