라일락 꽃이 피는 날

[R] t-test (t 검정) 본문

데이터 분석/R

[R] t-test (t 검정)

eunki 2021. 6. 27. 05:50
728x90

모집단 : 관심대상 전체 집합

표본 : 모집단의 부분 집합

 

 

귀무가설 : 기존에 없던 가설로, 차이가 없거나 영향도 없다.

대립가설 : 분석가가 새롭게 제시한 가설로, 차이가 있거나 영향이 있다.

 

 

p-value

귀무가설이 참이라고 했을 때, 표본데이터가 수집될 확률이다.

통상적으로 p-value < 0.05 이면 대립가설을 채택한다.

이때, 0.05를 유의 수준이라고 한다.

 

 

 


1. 데이터 불러오기 (샘플 사이즈=3)(소표본)

rawN3 <- read.csv(file="htest01.csv", header = TRUE)

 

 


2. 집단 나누기

$ : 데이터 프레임의 특정 열에 접근할 때 사용

groupA <- rawN3[rawN3$group=='A', 1:2] 
groupB <- rawN3[rawN3$group=='B', 1:2] 

 



3. 각 집단의 평균 구해서 비교하기

mean(groupA[,2])  # 170
mean(groupB[,2])  # 181

 



4-1. 정규성 검정 - 집단 A

귀무가설: 데이터셋이 정규분포를 따른다.
대립가설: 데이터셋이 정규분포를 따르지 않는다.

shapiro.test(groupA[,2])

 

→ p-value = 1 이므로, 귀무가설을 채택한다.

 



점들이 직선에 가까울수록 정규분포를 따른다. 

qqnorm(groupA[,2]) 
qqline(groupA[,2]) 

 



4-2. 정규성 검정 - 집단B

shapiro.test(groupB[,2])

 

→ p-value = 0.4173 이므로, 귀무가설을 채택한다.

 

 

qqnorm(groupB[,2]) 
qqline(groupB[,2]) 

 

 


5. 분산 동질성 검정

귀무가설: 두 집단 간 분산이 동일하다.
대립가설: 두 집단 간 분산이 다르다.

var.test(groupA[,2],groupB[,2])

 

→ p-value = 0.5385 이므로, 귀무가설을 채택한다.

 



6. T-test

귀무가설: 그룹A, 그룹B 간 평균 키 차이가 없다.
대립가설: 그룹B의 평균 키가 그룹 A의 평균 키보다 크다.

 

alternative = "less" : 대립가설에서 왼쪽 값이 오른쪽 값보다 작다
var.equal = TRUE : 분산이 동일하다

var.equal = FALSE : 분산이 다르다

t.test(groupA[,2], groupB[,2], alternative = "less", var.equal = TRUE)

 

→ p-value = 0.1154 이므로, 귀무가설을 채택한다.

728x90

'데이터 분석 > R' 카테고리의 다른 글

[R] z-test (z-검정)  (0) 2021.06.27
[R] 대응표본 t-test (t-검정)  (0) 2021.06.27
[R] 이상치 정제하기  (0) 2021.06.25
[R] 데이터 정제하기  (0) 2021.06.25
[R] 그래프 그리기  (0) 2021.06.25