기초통계량의 기본
- 통계량은 표본을 분석해서 얻은 결과
-> 기술통계량이라함. - 기술의 대상은 표본이며, 표본이 모집단에 대한 대표성이 있음을 설명
- 통계량은 표본이 갖는 특성을 제시하므로 이를 바탕으로 모수를 추정하더라도 문제가 없음을 설명하는 기초자료가 된다.
기초통계량의 구분
표본을 설명할 때 표본의 중심을 이루는 값이 어느 정도 되는지 나타내며 표본의 중심을 이루는 값은 기준을 어떻게 설정하느냐에 따라 달라진다.
표본의 중심을 설명하므로 대표값이라고도 하며 중심경향화 값 혹은 측정치라고 부른다.
평균, 중간값, 최빈수, 사분위수로 확인할 수 있다.
표본이 구성하는 분포(표본이 퍼진 정도)
-> 이를 산포도라 한다.산포도는 표본의 범위, 분산, 표준편차, 변동계수 등으로 구성
표본이 정규분포를 구성하면 중심경향과 퍼짐 정도를 확인하는 것으로 충분.
표본의 특성을 모두 알려면 표본이 최대값이나 최소값으로 몰려 있는 정도를 파악해야 하며, 이를 비대칭도라 한다.
왜도로 표본의 비대칭도를 파악
첨도로 분초의 뾰족한 정도를 확인
중심경향도
- 중심경향도란 데이터들을 종합하여 그 중심을 이룬느 값이 어느 정도가 될지를 구한 것
ex) 학교까지 가는데 어느 정도의 시간이 걸리는가? - A. 30분정도 소요됩니다.
- B. 30분~40분 정도 소요됩니다.
- 통학 시간 전체라는 집단 특성을 대표적으로 표현하는 값에는 평균, 중간값,최빈수 등이 있음
산술평균
- 산술평균은 통계에서 가장 많이 활용되는 중심경향도
- 모든 통계 분석에서 사용되며 표본의 특성을 제시할 때 가장 먼저 사용되는 수치
산술평균의 특징
- 산술평균으로부터 관찰값 편차의 합은 0.
- 자료의 분포가 좌우대칭이면 산술평균과 중위수는 동일
- 대표값 중에서 가장 많이 사용
기하평균
- 기하평균은 주로 평균변화율이나 평균 성장률, 경제 성장률 등의 비율을 구할 때 이용하는 수치
-> 시계열 자료 변동을 대표하는 값으로 가장 적당
조화평균
- 조화평균은 양수인 n개의 측정치를 역수로 하여 산술평균을 구하고, 이를 다시 역수로 나타낸 평균.
- 조화평균은 가속 형상에서 평균 속도를 구하는 것과 같이 시간 비율의 평균을 나타내거나 표본 측정치의 극단 값을 줄여 균형된 자료를 만들 때 사용
절사평균
- 절사평균은 표본 측정치들 중 편차가 큰 극단치가 존재하는 경우 산술평균을 활용하기 어려우므로 상위와 하위의 일정 부분을 제거하고 계산한 평균
중간값
- 중간값은 관측된 자료의 편중과는 상관없이 가장 작은 값에서 가장 큰 값까지 정렬했을 때 그 가운데 위치한 값
최빈수
- 최빈수는 표본에서 가장 많이 나타나는 관측치.
- 여러 번 확인된다는 특성으로 중심경향도에 있으나, 최소 부분과 최대 부분으로 쏠림 현상이 나타날 수도 있기 때문에 특별히 필요성이 없는 한 잘 사용되지 않음
최빈수의 특징
- 최빈수는 중심경향의 측정치로 1개 이상 존재할 수 있다.
- 측정치 중 가장 많이 나타난 값이며, 도수분포표에서 가장 많이 나타나는 계급 값을 말한다.
- 자료 중 평균이나 중간값을 구하기 어려운 경우에 많이 활용한다.
- 극단치의 영향이 없고, 계급이 존재하는 경우 훨씬 쉽게 구할 수 있다.
(글,사진 출처:https://www.youtube.com/watch?v=VHhWOoM6jm8&list=PLsri7w6p16vtiu-mpViykeFQxzQqIV1gz&index=9)
'통계학' 카테고리의 다른 글
4.1 확률과 의사결정 (1) | 2023.02.05 |
---|---|
3.32 기초통계량_산포도_왜도_첨도 (0) | 2023.02.03 |
3.1 데이터의 수집 (0) | 2023.01.10 |
2.3 표본분포와 중심극한정리 (0) | 2023.01.10 |
2.2 표본의 분포 (0) | 2023.01.08 |