가설검정 Flashcards
통계적 가설 검정
[정의] 모집단의 특성에 대한 통계적 가설을 표본 통계치를 통해 확률적으로 진위를 판정하는 통계적 추론
[구성요소]
- 가설 : 귀무가설,대립가설
- 유의수준 : 검정 시, 1종오류가 발생할 확률에 대한 허용하는 최대값
- 기각역 : 유의 수준에 따라 계산된 모수의 범위
- 검정 통계량 : 표본 평균, 분산, 개수 및 귀무 가설로 계산한 값
- 검정 방법 : 양측 검정, 단측 검정(좌측 검정, 우측 검정)
- 임계치 : 가설기각과 비기각(수용)지역을 구분하는 검정통계량 값
- 기각/수용 : (기각) p-value ≤ 유의수준 or 검정통계량 값 ≥ 임계치
- p-value : 귀무 가설로 정의한 모수에 대하여 해당되는 사건이 발생할 확률로, 귀무가설을 기각하는 것이 잘 못 결정될 확률
가설
[종류]
1. 귀무 가설 : 주로 기각하고 싶은 주장을 모수로 표현한 가설 (점수 평균 = 50)
2. 대립 가설 : 주로 검증하고자 하는 주장을 모수로 표현한 가설 (점수 평균 > 50)
귀무가설(H0)
[정의] 대립가설이 참이라는 확실한 근거가 없는 경우에 받아들이는 가설
[사례] 모수가 특정한 값이다. 두 모수 값이 같다.
[유형] 단순가설, 복합가설
대립가설(H1)
[정의] 표본으로부터 확실한 근거에 의해 입증하고자 하는 개념
[사례] 귀무가설로 지정되지 않는 모든 경우
[유형] 단측대립가설(왼쪽 단측검정, 오른쪽 단측검정), 양측대립가설
유의수준
[정의] P-value를 판단하기 위한 기준이 되는 값
p-value
[정의] 관찰된 데이터가 귀무가설과 양립하는 정도를 0에서 1 사이의 수치로 표현한 것
* 대개 0.05나 0.01 보다 작을 경우 귀무가설을 기각
가설 검정의 오류
1종오류 : 귀무가설이 실제 참이지만, 귀무가설을 기각하는 오류
2종오류 : 귀무가설이 실제 거짓이지만, 귀무가설을 채댁하는 오류
모수검정
[모수검정]
① 표본의 모집단이 정규분포를 이루어야 한다.
② 집단내의 분산은 같아야 한다.
③ 변인은 등간척도나 비율척도로 측정되어야 한다.
* 이 조건이 충족되지 않으면 비모수 통계를 사용
[방법]
- 모평균과 표본평균과의 차이 → z분포, t분포
- 표본평균간의 차이 → z분포, t분포
- 모분산과 표본분산과의 차의 → F분포, 카이제곱분포
- 표본분산간의 차이 → F분포, 카이제곱분포
비모수 검정
[비모수 검정]
① 모집단이 정규분포한다는 가정을 할 수 없는 경우 → 모집단의 분포 유형에 관계없이 적용할 수있는 방법
② 변수가 명목척도나 서열척도로 측정하는 경우 → 분류기준과 분류방법의 독립성 검정 가능
③ 모집단의 특성을 나타내는 모수에 대한 검정의목적이 아닐 경우 → 이론분포와 경험분포간의 적합도(goodness of fit test)를 검정 가능
[종류]
- 1개의 표본 : 콜로고로프-스미르노프 검정
- 2개의 표본 : 맨-휘트니 검정
- 3개 이상의 표본 : 크루스칼-왈리스 검정