R언어 최대/소값, 최빈값, 사분위범위, 평균, 분산, 표...
최소값 min(x) 최대값 max(x) 최소값과 최대값을 나타내줌 range(x) 최빈값 x = c(' a','a','a','b','b','c') table(x) 일떄 중앙값 median(x) 사분위수(quantile) 중앙값이 50% 에 대응 되는 값인 것을 고려하여 25%, 50%, 75% 의 값을 이야기함 type 2의 방식 사분위범위(IQR) 사분위값 중 25%, 75% 값을 활용한 범위로 중앙값을 중심으로 좌우 25% 범위의 데이터를 포함한 구간 이다. 곧 , 전체 중 50% 데이터가 있는 범위를 뜻하며 이 구간의 길이를 말함 7-3=4 평균 mean(x) 분산 var(x) 표준편차 sd(x)=sqrt(vqr(x)) 도수분포표 tanle() 막대그래프 barplot(table()) : 보통 범주..
2019. 9. 22.
R언어 반복, 조건, 함수
조건문은 if, else if 씀 출력할땐 print('Hello') +) 조건문 ifelse ifelse( 조건, True일때 실행문, False일때 실행문) 반복문 for( index in 반복조건) { 실행문 } while (조건) { 실행문 } repeat { 실행문 if(조건) break-------꼭 조건문을 넣어 반복을 정지 } 내장 함수 exp(x) 는 로그의 역함수이기에 log(exp(x))이렇게 하면, 원래의 x 값이 나옵니다 prod(y) 는 y의 값들을 다 곱한다(y=c(-1, 2, -5, 1, 10) prod(y)는 100이 됨) 도움말 help(sum) / ?prod / help('help') / example('length') 사용자함수 함수명=function(변수) { 실행문..
2019. 9. 15.
R언어 기초
질적변수(범주형) vs. 양적변수 >>성별, 인종, 학력 vs. 키, 몸무게, 성적 아산형 변수 vs. 연속형 변수 >>나이, 교통사고수(음수가 없음) vs. 키, 몸무게(실수로 표현가능) ls(), objects() : 현재까지 무슨 변수를 저장했는지 나열해줌 rm(x) : x 를 지움, 삭제 백터1 x=c(1,2,3,4,5) x에는 1 2 3 4 5가 저장 y=c(6,7,8,9,10) y에는 6 7 8 9 10가 저장 z=c(x, y) z에는 1 2 3 4 5 6 7 8 9 10이 저장 +) x=c(1,2,3,4,5,6,7,8,9,10), x1=seq(1, 10), x2=1:10는 저장된 것이 같다. x3=seq(1, 10, by=2) 는 1부터 10까지 2씩 건너뛰어 저장된다. >>1 3 5 7 9..
2019. 9. 15.