표본 Flashcards
모집단
[정의] 관심 있는 연구 대상 전체의 집합
[종류] 유한 모집단, 무한 모집단
[조사기법]
1. 전수조사(Census) : 모집단의 크기가 작은 경우 실시
2. 표본조사 : 표본의 특성을 토대로 모집단의 특성을 추정하는 방법
표본
[정의] 모집단의 일부분으로 원하는 정보를 얻기 위해 관측 과정을 통하여 실제로 얻어진 관측 결과
표본 추출방법
[정의] 전수조사의 비용과 시간 소모를 줄이기 모집단의 일부 원소인 표본을 확률적/비확률적 방식으로 추출하는 방법
[표본추출방법]
- 확률 추출 : 단순확률, 임의확률, 충화확률, 계통확률, 집락확률 이층집계단
- 비확률 추출 : 유의, 판단, 할당추출, 편의추출, 눈덩이추출, 포커스 그룹
* 표본 추출된 자료에 대하여 이상치를 발견하고 적절한 처리 방안을 통해 표본의 편향성 최소화 위한 품질 확보필요
[차별화] 데이터의 Outlier 검출방법 및 처리 방안
1. 데이터의 Outlier 검출 방법
- 통계기반 : 기하평균, Z Score, T-검정, 카이제곱 검정
- 시각화 : 시스토그램, 확률밀도함수, Box Plot
- 알고리즘 : K-Means, 마할라노비스 거리, LOF, iforest
2. 데이터의 Outlier 처리 방안
- 삭제(단일항목 삭제, 일괄삭제), 대체(연역법,평균법,일회성,회귀,핫 데크), 변환(Smoothing,Aggregation, Generalization, Normalization), 분포(분류처리, Box plot)
확률추출
[정의] 모집단에 속하는 모든 추출 단위에 대해 사전에 일정한 추출확률이 주어지는 표본 추출법
[종류] (집단계층)
- 단순확률 추출 : 난수를 이용해 추출, 동일한 확률 조건에서 실시 (난수로 100명 추출)
- 계통확률 추출 : k번째 간격마다 하나씩 표본 (10의 배수 번째마다 추출)
- 층화확률 추출 : 겹치지 않는 여러 개의 층 분할 → 단순임의 추출법을 적용(선거,지역별 인구비례로 추출)
- 집락(군집)확률 추출 : 군집을 만들고, 추출된 군집 내의 일부 또는 전체 (서울대 학생 용돈, 학과별)
비확률추출
[정의] 추출 단위가 표본에 추출될 확률을 객관적으로 나타낼 수 없는 표본 추출법
[종류]
- 유의 추출(포커스 그룹) : 지식 또는 경험을 갖고 있는 집단을 주관적으로 선정하여 추출 (A사 직원)
- 편의(임의)추출 : 연구가 원하는 대상을 임의로 선택하여 추출
- 할당 추출 : 조사 목적과 밀접하게 관계된 기준에 의해 할당하여 추출 (성별, 나이 분류후 임의 추출)
- 눈덩이 추출 : 표본 대상의 소개로 표본 대상자를 확대하여 추출 (희귀병 표본 추출)