가설검정 2

독립표본 T검정

독립표본?

현실적으로 모집단에 대한 전수조사가 어렵기 때문에 표본을 사용하는데, 이 때 표본을 두 개의 각 모집단으로부터 독립적으로 추출해야함

추출한 표본의 차이를 가지고 모집단의 차이를 검정하는것이 ‘독립표본 T검정’임
(서로 다른 두 개의 그룹 간의 평균 비교)

  • 귀무가설(H0) : 두 모평균의 차이가 없음 (M1-M2=0).
  • 대립가설(H1)  : 두 모평균의 차이가 있음 (M1-M2≠0).

독립표본 T검정의 조건

-정규성, 독립성, 등분산성

*등분산성 : 분산분석을 통해 서로 다른 두 개 이상의 집단을 비교하고자 할 때, 기본적으로 해당 집단들이 만족해야되는 조건 중 한가지로 분산이 같음을 의미함.

-독립변수 : 명목척도

-종속변수 : 등간척도(구간척도), 비율척도

※독립표본 T검정 정규성과 등분산성에 대하여

  1. 두 분포가 정규분포를 따르지 않을 때
    두 개의 집단이 정규분포를 따르지 않을때에는 비교하기 어렵기 때문에 비모수적 방법인 Maan-Whitney test를 사용함.
  2. 두 분포가 정규분포를 따르고 같은 분산을 가질 때
    두 분포가 모두 정규분포를 띠고 동일한 분산을 가질 때에는 분포가 동일하다고 가정할 수 있으며 이 둘의 평균을 비교하여 독립표본 T검정을 할 수 있음.
  3. 두 분포가 정규분포를 따르지만 분산이 서로 다를 때

    본래 Levene’s test를 통한 등분산검정을 통해 등분산을 만족할 경우 독립표본 T검정이 수행됨.
    그러나 통계프로그램에서는 두 분포가 정규분포를 따른다면 분산이 조금 다르더라도 평균을 통해 두 집단의 크기를 비교할 수 있음.(자유도를 수정한 독립표본 T검정)

SPSS를 활용한 독립표본 T검정

각각 두 회사의 타이어 30개씩을 무작위로 표본추출하여 조사한 타이어의 수명 자료를 활용하여 두 회사 타이어의 평균수명에 차이가 있는 지를 검정(유의수준 0.05)

  • 귀무가설(H0) : 타이어의 평균수명 차이가 없음.
  • 대립가설(H1)  : 타이어의 평균수명 차이가 있음.

 

[분석] – [평균비교] – [독립표본 T검정] 선택

 

집단을 정의함.(1집단과 2집단 2개의 집단)

 

유의수준을 설정(0.05)

 

 A, B회사 모두 표본크기가 30으로 동일
각 회사들의 평균과 표준편차, 평균의 포준오차를 볼 수 있음

 

모집단을 비교할 경우에는 모집단에서 각 그룹간의 분산이 같음을 전제로 함. 즉, 등분산 검정을 통해 두 모집단의 분산이 동일한 지 판단함.
유의확률이 0.05보다 큰 경우 ‘등분산이 가정됨’행을, 작은경우 ‘등분산이 가정되지 않음’행을 확인
유의확률이 0.522이므로 ‘등분산이 가정됨’행을 확인
T값은 두 집단의 차이를 나타냄 : -2.679
자유도 : n1 + n2 – 2  -> 30 + 30 -2 = 58
T값 : (A회사 평균 – B회사 평균) / 차이의 표준오차 = (48670.59-51377.58)/1010.459

대응표본 T검정

모집단 한개에서 일정한 표본을 대상으로 특정한 사건을 전후로 하여 두 번 측정하여 얻은 값들 간에 유의한 차이가 있는 지를 검정하는 것을 의미함

  • 귀무가설(H0) : 평균의 차이가 없음 (M1-M2=0).
  • 대립가설(H1)  : 평균의 차이가 있음 (M1-M2≠0).

사전 점수와 사후 점수의 평균을 비교할 때 사용
예) 교육이나 치료프로그램 적용 전/후 점수 비교

대응표본 T검정의 조건

– 정규성만 만족하면 가능

SPSS를 활용한 대응표본 T검정

다이어트 된장의 효과를 검증하기 위해 20명의 일반인을 실험대상으로 선정한 후 섭취 전과 후의 체중에 차이가 있는지를 검정(유의수준 0.05)

  • 귀무가설(H0) : 다이어트 된장은 체중감량에 효과가 없음.
  • 대립가설(H1)  : 다이어트 된장은 체중감량에 효과가 있음.

 

[분석] – [평균비교] – [대응표본 T검정] 선택

[옵션] – [유의수준 0.05] 설정

  • 다이어트 된장 섭취 전 평균 체중 73.15
  • 다이어트 된장 섭취 후 평균 체중 70.60
  • 다이어트 된장 섭취전 후 체중 차이의 평균 2.550
  • t값이 3.636 일때의 유의확률은 0.002로, 유의수준 0.05보다 작으므로, 다이어트 된장은 체중변화있음.

답글 남기기