본문 바로가기
반응형

전체 글96

R언어: 가설검정, 자유도, 교차분석-카이제곱검정 가설검정 대립가설(연구자의 주장), 귀무가설(연구자 주장과 반대되는 모든 가설) 귀무가설에 대응하는 확률분포 설정하고 그것이 기각영역에 속하면 대립가설 채택, 아니면 귀무가설 채택 ex. 대립가설: 165이다. 귀무가설: 165보다 작거나 165보다 크다. 자유도 (df, degree of freedom) 표본을 구성하고 있는 개별 요소 중 통계적 제한을 받지 않고 자유롭게 변화될 수 있는 요소의 수 ex. 자연수 1~10에서 평균이 5되도록 표본 s5개 뽑는다, ->표본 4개는 자유롭게 정할 수 있으나, 마지막은 평균에 밪도록 조절해서 정해진다. 즉, 4개는 독립변수, 1개는 종속변수 ->4의 자유도를 가진다. 교차분석 카이제곱검정 두 질적변수 간의 상관관계를 측정하는 통계적 기법으로 관찰빈도(조사결과.. 2019. 11. 19.
R언어: 상관계수, 확률분포, 표본추출... 공분산(Covariance) 두 변수가 함께 변하는지 정도를 측정하기 위한 것으로 x, y변수에서 x라는 변수가 증가할때 y라는 변수가 함께 증가/감소하는지 정도를 측정하는 것 그러나 공분산의 범위가 무한대라 변형해 범위가 -1 ~ 1인 상관계수를 사용. cov(x변수, y변수) 상관계수(Correlation coefficient) 공분산을 x변수의 표준편차*y변수의 표준편차로 나눠준다. -1 ~ 1사이의 값. +값이 나오면 정적상관(ex.증가시 증가), -값이 나오면 부적상관(ex.증가시 감소) 절댓값 0~0.2 : 약한 상관, 0.3~0.5 : 중간, 0.6~0.9 : 강한 상관 cor(x변수, y변수) skewness-> 분포가 중앙에서 치우친 정도 kurtosis-> 분포의 뾰족한 정도. 중앙에 .. 2019. 9. 28.
R언어 최대/소값, 최빈값, 사분위범위, 평균, 분산, 표... 최소값 min(x) 최대값 max(x) 최소값과 최대값을 나타내줌 range(x) 최빈값 x = c(' a','a','a','b','b','c') table(x) 일떄 중앙값 median(x) 사분위수(quantile) 중앙값이 50% 에 대응 되는 값인 것을 고려하여 25%, 50%, 75% 의 값을 이야기함 type 2의 방식 사분위범위(IQR) 사분위값 중 25%, 75% 값을 활용한 범위로 중앙값을 중심으로 좌우 25% 범위의 데이터를 포함한 구간 이다. 곧 , 전체 중 50% 데이터가 있는 범위를 뜻하며 이 구간의 길이를 말함 7-3=4 평균 mean(x) 분산 var(x) 표준편차 sd(x)=sqrt(vqr(x)) 도수분포표 tanle() 막대그래프 barplot(table()) : 보통 범주.. 2019. 9. 22.
R언어 반복, 조건, 함수 조건문은 if, else if 씀 출력할땐 print('Hello') +) 조건문 ifelse ifelse( 조건, True일때 실행문, False일때 실행문) 반복문 for( index in 반복조건) { 실행문 } while (조건) { 실행문 } repeat { 실행문 if(조건) break-------꼭 조건문을 넣어 반복을 정지 } 내장 함수 exp(x) 는 로그의 역함수이기에 log(exp(x))이렇게 하면, 원래의 x 값이 나옵니다 prod(y) 는 y의 값들을 다 곱한다(y=c(-1, 2, -5, 1, 10) prod(y)는 100이 됨) 도움말 help(sum) / ?prod / help('help') / example('length') 사용자함수 함수명=function(변수) { 실행문.. 2019. 9. 15.
R언어 기초 질적변수(범주형) vs. 양적변수 >>성별, 인종, 학력 vs. 키, 몸무게, 성적 아산형 변수 vs. 연속형 변수 >>나이, 교통사고수(음수가 없음) vs. 키, 몸무게(실수로 표현가능) ls(), objects() : 현재까지 무슨 변수를 저장했는지 나열해줌 rm(x) : x 를 지움, 삭제 백터1 x=c(1,2,3,4,5) x에는 1 2 3 4 5가 저장 y=c(6,7,8,9,10) y에는 6 7 8 9 10가 저장 z=c(x, y) z에는 1 2 3 4 5 6 7 8 9 10이 저장 +) x=c(1,2,3,4,5,6,7,8,9,10), x1=seq(1, 10), x2=1:10는 저장된 것이 같다. x3=seq(1, 10, by=2) 는 1부터 10까지 2씩 건너뛰어 저장된다. >>1 3 5 7 9.. 2019. 9. 15.
피보나치 수 피보나치 수는 0 1 1 2 3 5 8 13 21... 순으로 앞의 두 수를 더한 값이 지금의 수가 되는 수열이다. fib(n)=0 (n=0) fib(n)=1 (n=1) fib(n)=fib(n-1)+fib(n-2) (n>=2) n일 때 fib(n)을 구한다면 T(n)의 시간이 걸린다. T(n)이 구해지는 시간을 구하는 것은 fib(n-1)을 구하는 것과 fib(n-2)를 구하는 것의 시간을 합친것과 같다. 즉, T(n)=T(n-1)+T(n-2) 이것은 유추를 통해서 풀 수 있다. 항상 T(n-2)는 T(n-1)보다 작고, 두배를 해도 T(n)보다 작다. 피보나치를 계속 내려가다 보면 T(0)이 될때까지 내려가면 끝나는데, T(0)은 fib(0)을 한번만 계산하면 끝이라.. 1이다 결국, 맨 마지막 줄을 .. 2019. 9. 11.
반응형