일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- level 2
- SQL
- Numpy
- 튜닝
- Python
- seaborn
- 카카오
- Kaggle
- python3
- 빅데이터 분석 기사
- oracle
- 실습
- 프로그래머스
- 데이터 분석
- Oracel
- R
- 머신러닝
- pandas
- 빅분기
- matplotlib
- 알고리즘
- level 1
- 파이썬
- sklearn
- 오라클
- 실기
- 코딩테스트
- Today
- Total
라일락 꽃이 피는 날
[R] t-test (t 검정) 본문
모집단 : 관심대상 전체 집합
표본 : 모집단의 부분 집합
귀무가설 : 기존에 없던 가설로, 차이가 없거나 영향도 없다.
대립가설 : 분석가가 새롭게 제시한 가설로, 차이가 있거나 영향이 있다.
p-value
귀무가설이 참이라고 했을 때, 표본데이터가 수집될 확률이다.
통상적으로 p-value < 0.05 이면 대립가설을 채택한다.
이때, 0.05를 유의 수준이라고 한다.
1. 데이터 불러오기 (샘플 사이즈=3)(소표본)
rawN3 <- read.csv(file="htest01.csv", header = TRUE)
2. 집단 나누기
$ : 데이터 프레임의 특정 열에 접근할 때 사용
groupA <- rawN3[rawN3$group=='A', 1:2]
groupB <- rawN3[rawN3$group=='B', 1:2]
3. 각 집단의 평균 구해서 비교하기
mean(groupA[,2]) # 170
mean(groupB[,2]) # 181
4-1. 정규성 검정 - 집단 A
귀무가설: 데이터셋이 정규분포를 따른다.
대립가설: 데이터셋이 정규분포를 따르지 않는다.
shapiro.test(groupA[,2])
→ p-value = 1 이므로, 귀무가설을 채택한다.
점들이 직선에 가까울수록 정규분포를 따른다.
qqnorm(groupA[,2])
qqline(groupA[,2])
4-2. 정규성 검정 - 집단B
shapiro.test(groupB[,2])
→ p-value = 0.4173 이므로, 귀무가설을 채택한다.
qqnorm(groupB[,2])
qqline(groupB[,2])
5. 분산 동질성 검정
귀무가설: 두 집단 간 분산이 동일하다.
대립가설: 두 집단 간 분산이 다르다.
var.test(groupA[,2],groupB[,2])
→ p-value = 0.5385 이므로, 귀무가설을 채택한다.
6. T-test
귀무가설: 그룹A, 그룹B 간 평균 키 차이가 없다.
대립가설: 그룹B의 평균 키가 그룹 A의 평균 키보다 크다.
alternative = "less" : 대립가설에서 왼쪽 값이 오른쪽 값보다 작다
var.equal = TRUE : 분산이 동일하다
var.equal = FALSE : 분산이 다르다
t.test(groupA[,2], groupB[,2], alternative = "less", var.equal = TRUE)
→ p-value = 0.1154 이므로, 귀무가설을 채택한다.
'데이터 분석 > R' 카테고리의 다른 글
[R] z-test (z-검정) (0) | 2021.06.27 |
---|---|
[R] 대응표본 t-test (t-검정) (0) | 2021.06.27 |
[R] 이상치 정제하기 (0) | 2021.06.25 |
[R] 데이터 정제하기 (0) | 2021.06.25 |
[R] 그래프 그리기 (0) | 2021.06.25 |