R언어 기초

R언어

socialcomputer 2019. 9. 15. 20:08

질적변수(범주형) vs. 양적변수

>>성별, 인종, 학력 vs. 키, 몸무게, 성적

아산형 변수 vs. 연속형 변수

>>나이, 교통사고수(음수가 없음) vs. 키, 몸무게(실수로 표현가능)

ls(), objects() : 현재까지 무슨 변수를 저장했는지 나열해줌

rm(x) : x 를 지움, 삭제

백터1

x=c(1,2,3,4,5) x에는 1 2 3 4 5가 저장

y=c(6,7,8,9,10) y에는 6 7 8 9 10가 저장

z=c(x, y) z에는 1 2 3 4 5 6 7 8 9 10이 저장

+) x=c(1,2,3,4,5,6,7,8,9,10), x1=seq(1, 10), x2=1:10는 저장된 것이 같다.

x3=seq(1, 10, by=2) 는 1부터 10까지 2씩 건너뛰어 저장된다.

>>1 3 5 7 9가 저장

백터2

x[3] : 3번째 있는 값을 가져옴

x[2:4] : 2번째~4번째 있는 값을 가져옴

x[-2] : 2번째 값만 빼고 가져옴

x[-c(1, 2, 5)] : 1, 2, 5번째 빼고 가져옴

x[x>0] : x에서 0이상인 수만 가져옴

같은 길이의 백터끼리만 더하고 곱할 수 있다. (같은 자리끼리 계산됨)

rep(y, c(3,2)) : y의 첫번째 값은 3번, 두 번째 값은 2번 반복한다.

> y=c("RH+", "RH-") > z=rep(y, c(3, 2)하면 z는 "RH+" "RH+" "RH+" "RH-" "RH-"이 된다.

행렬1

x=matrix( c(1, 2, 3, 4), nrow=2, byrow=F)) 세로로

y=matrix( c(1, 2, 3, 4), nrow=2, byrow=T)) 가로로

rownames(x)=c("math", "science")

colnames(x)=c("Mike", "Molly")

1번째 줄

2번째 컬럼

dim은 dataframe의 길이를 관측할 때 사용하며, 행과 열의 개수를 모두 출력합니다.

2 *2 인 표

dim(x)의 첫번째 값은 2

길이가 같은 행렬끼리 곱하면 같은 자리 수 끼리 곱하거나 더하거나.. 계산됨

길이가 다른 행렬끼린 안됨 대신 c%*%A하면 됨!

t(A)는 행과 열을 바꿈

A가 1 2 3 이면 t(A)는 1 4

4 5 6 2 5

3 6

데이터프레임

total이 이 표의 이름이다.

리스트