데이터 분석/R
[R] 파생 변수 생성
eunki
2021. 6. 19. 19:25
728x90
1. 파생 변수 생성
df <- data.frame(var1 = c(4, 3, 8),
var2 = c(2, 6, 1))
df$var_sum <- df$var1 + df$var2
df$var_mean <- (df$var1 + df$var2)/2
df
2. 조건문을 활용하여 파생 변수 생성
ifelse(조건문, 조건에 맞을 때 부여할 값, 조건에 맞지 않을 때 부여할 값)
# 통합 연비 변수 생성
mpg$total <- (mpg$cty + mpg$hwy)/2
# 기준값 정하기
mean(mpg$total) # 20.14957
# 통합 연비가 20 이상이면 pass, 그렇지 않으면 fail 부여
mpg$test <- ifelse(mpg$total >= 20, "pass", "fail")
head(mpg, 20)
빈도표로 합격 판정 자동차 수 살펴보기
table(mpg$test)
막대 그래프로 빈도 표현하기
qplot(mpg$test)
3. 중첩 조건문을 활용하여 파생 변수 생성
# total을 기준으로 A, B, C 등급 부여
mpg$grade <- ifelse(mpg$total >= 30, "A",
ifelse(mpg$total >= 20, "B", "C"))
head(mpg, 20)
등급 빈도표 생성
table(mpg$grade)
등급 빈도 막대 그래프 생성
qplot(mpg$grade)
728x90