Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- matplotlib
- 데이터 분석
- 실기
- Kaggle
- 튜닝
- 프로그래머스
- 카카오
- 빅데이터 분석 기사
- R
- level 2
- Numpy
- 머신러닝
- seaborn
- 파이썬
- 오라클
- Python
- 빅분기
- Oracel
- pandas
- sklearn
- oracle
- 알고리즘
- 실습
- SQL
- level 1
- python3
- 코딩테스트
Archives
- Today
- Total
라일락 꽃이 피는 날
[R] 파생 변수 생성 본문
728x90
1. 파생 변수 생성
df <- data.frame(var1 = c(4, 3, 8),
var2 = c(2, 6, 1))
df$var_sum <- df$var1 + df$var2
df$var_mean <- (df$var1 + df$var2)/2
df
2. 조건문을 활용하여 파생 변수 생성
ifelse(조건문, 조건에 맞을 때 부여할 값, 조건에 맞지 않을 때 부여할 값)
# 통합 연비 변수 생성
mpg$total <- (mpg$cty + mpg$hwy)/2
# 기준값 정하기
mean(mpg$total) # 20.14957
# 통합 연비가 20 이상이면 pass, 그렇지 않으면 fail 부여
mpg$test <- ifelse(mpg$total >= 20, "pass", "fail")
head(mpg, 20)
빈도표로 합격 판정 자동차 수 살펴보기
table(mpg$test)
막대 그래프로 빈도 표현하기
qplot(mpg$test)
3. 중첩 조건문을 활용하여 파생 변수 생성
# total을 기준으로 A, B, C 등급 부여
mpg$grade <- ifelse(mpg$total >= 30, "A",
ifelse(mpg$total >= 20, "B", "C"))
head(mpg, 20)
등급 빈도표 생성
table(mpg$grade)
등급 빈도 막대 그래프 생성
qplot(mpg$grade)
728x90
'데이터 분석 > R' 카테고리의 다른 글
[R] 그래프 그리기 (0) | 2021.06.25 |
---|---|
[R] 데이터 전처리 (Preprocessing) (0) | 2021.06.25 |
[R] 데이터 수정하기 (0) | 2021.06.19 |
[R] 데이터 파악하기 (0) | 2021.06.19 |
[R] 외부 데이터 불러오기 (0) | 2021.06.19 |