데이터 분석/R

[R] 파생 변수 생성

eunki 2021. 6. 19. 19:25
728x90

1. 파생 변수 생성

df <- data.frame(var1 = c(4, 3, 8), 
                 var2 = c(2, 6, 1)) 
 
df$var_sum <- df$var1 + df$var2
df$var_mean <- (df$var1 + df$var2)/2

df 




2. 조건문을 활용하여 파생 변수 생성

ifelse(조건문, 조건에 맞을 때 부여할 값, 조건에 맞지 않을 때 부여할 값)

# 통합 연비 변수 생성
mpg$total <- (mpg$cty + mpg$hwy)/2

# 기준값 정하기
mean(mpg$total)  # 20.14957

# 통합 연비가 20 이상이면 pass, 그렇지 않으면 fail 부여 
mpg$test <- ifelse(mpg$total >= 20, "pass", "fail")

head(mpg, 20)

 

 

 

빈도표로 합격 판정 자동차 수 살펴보기 

 table(mpg$test)

 

 

 

막대 그래프로 빈도 표현하기 

 qplot(mpg$test)

 

 

 

3. 중첩 조건문을 활용하여 파생 변수 생성

# total을 기준으로 A, B, C 등급 부여 
mpg$grade <- ifelse(mpg$total >= 30, "A", 
                    ifelse(mpg$total >= 20, "B", "C")) 
                    
head(mpg, 20)

 

 


등급 빈도표 생성 

table(mpg$grade)

 

 

 

등급 빈도 막대 그래프 생성 

qplot(mpg$grade)

728x90