R언어 기초
질적변수(범주형) vs. 양적변수
>>성별, 인종, 학력 vs. 키, 몸무게, 성적
아산형 변수 vs. 연속형 변수
>>나이, 교통사고수(음수가 없음) vs. 키, 몸무게(실수로 표현가능)
ls(), objects() : 현재까지 무슨 변수를 저장했는지 나열해줌
rm(x) : x 를 지움, 삭제
백터1
x=c(1,2,3,4,5) x에는 1 2 3 4 5가 저장
y=c(6,7,8,9,10) y에는 6 7 8 9 10가 저장
z=c(x, y) z에는 1 2 3 4 5 6 7 8 9 10이 저장
+) x=c(1,2,3,4,5,6,7,8,9,10), x1=seq(1, 10), x2=1:10는 저장된 것이 같다.
x3=seq(1, 10, by=2) 는 1부터 10까지 2씩 건너뛰어 저장된다.
>>1 3 5 7 9가 저장
백터2
x[3] : 3번째 있는 값을 가져옴
x[2:4] : 2번째~4번째 있는 값을 가져옴
x[-2] : 2번째 값만 빼고 가져옴
x[-c(1, 2, 5)] : 1, 2, 5번째 빼고 가져옴
x[x>0] : x에서 0이상인 수만 가져옴
같은 길이의 백터끼리만 더하고 곱할 수 있다. (같은 자리끼리 계산됨)
rep(y, c(3,2)) : y의 첫번째 값은 3번, 두 번째 값은 2번 반복한다.
> y=c("RH+", "RH-") > z=rep(y, c(3, 2)하면 z는 "RH+" "RH+" "RH+" "RH-" "RH-"이 된다.
행렬1
x=matrix( c(1, 2, 3, 4), nrow=2, byrow=F)) 세로로
y=matrix( c(1, 2, 3, 4), nrow=2, byrow=T)) 가로로
rownames(x)=c("math", "science")
colnames(x)=c("Mike", "Molly")
1번째 줄
2번째 컬럼
dim은 dataframe의 길이를 관측할 때 사용하며, 행과 열의 개수를 모두 출력합니다.
2 *2 인 표
dim(x)의 첫번째 값은 2
길이가 같은 행렬끼리 곱하면 같은 자리 수 끼리 곱하거나 더하거나.. 계산됨
길이가 다른 행렬끼린 안됨 대신 c%*%A하면 됨!
t(A)는 행과 열을 바꿈
A가 1 2 3 이면 t(A)는 1 4
4 5 6 2 5
3 6
데이터프레임
total이 이 표의 이름이다.
리스트