본문 바로가기

통계학

2.3 표본분포와 중심극한정리

1. 표본분포

: 표본분포(sample distribution)는 표본에서 도출되는 통계량에 대한 확률분포

-> 표본분포는 모수를 추정하기 위한 표본 통계량의 확률분포 (여러 번 측정)

 

ex) 5일간의 통학시간이 각각 37분, 25분, 49분, 33분, 56분이 소요되었다면, 평균 통학시간은? (37+25+49+33+56)/5=40 이다
 모집단의 구성이 5개로 되어 있으므로 간단히 표본을 2개 추출하는 경우와 3개 추출하는 경우를 비교해보면..

표본추출의 경우

표본을 2개 혹은 3개 추출할 때, 각 경우의 수에 대한 평균을 구해보면..

표본의 평균
그래프로 표현

2. 표본평균의 오차

: 표본으로부터 모수를 추정했을 때, 모수와 통계량 간의 차이

->표본의 개수가 늘어날수록 통계량이 모수와 가까워짐

표본평균 오차
모수와 가까워짐

 

3. 중심극한정리

: 중심극한정리(Central Limit Theorem: CLT)는 표본의 개수(n)가 충분하다면(30이상이다면) 모수를 모르는 상황에서도 표본 통계량의 정규분포를 구성하여 모수를 추정할수 있다는 것이다.

-> 중심극한정리에서는 모집단이 정규분포를 이루지 않아도 표본의 개수가 충분하다면 정규분포를 이루게된다.

  • 중심극한정리를 이용하면 정규분포의 모양으로 확인할 수 있어서 평균을 바로 비교할 수 있다. 
  • 정규분포로 구성하면 그래프의 가장 높은 상단이 평균이 되므로 평균값을 비교할 수 있다.

 

중심극한정리
적절한 표본개수의 기준

 

'통계학' 카테고리의 다른 글

4.1 확률과 의사결정  (1) 2023.02.05
3.32 기초통계량_산포도_왜도_첨도  (0) 2023.02.03
3.1 데이터의 수집  (0) 2023.01.10
2.2 표본의 분포  (0) 2023.01.08
2.1 모집단과 표본 추출  (0) 2023.01.08