본문 바로가기

통계학

3.31 기초통계량_중심경향도

기초통계량의 기본

  • 통계량은 표본을 분석해서 얻은 결과
    -> 기술통계량이라함.
  • 기술의 대상은 표본이며, 표본이 모집단에 대한 대표성이 있음을 설명
  • 통계량은 표본이 갖는 특성을 제시하므로 이를 바탕으로 모수를 추정하더라도 문제가 없음을 설명하는 기초자료가 된다.

기초통계량의 구분

  • 표본을 설명할 때 표본의 중심을 이루는 값이 어느 정도 되는지 나타내며 표본의 중심을 이루는 값은 기준을 어떻게 설정하느냐에 따라 달라진다.

  • 표본의 중심을 설명하므로 대표값이라고도 하며 중심경향화 값 혹은 측정치라고 부른다.

  • 평균, 중간값, 최빈수, 사분위수로 확인할 수 있다.

  • 표본이 구성하는 분포(표본이 퍼진 정도)
    -> 이를 산포도라 한다.

  • 산포도는 표본의 범위, 분산, 표준편차, 변동계수 등으로 구성

  • 표본이 정규분포를 구성하면 중심경향과 퍼짐 정도를 확인하는 것으로 충분.

  • 표본의 특성을 모두 알려면 표본이 최대값이나 최소값으로 몰려 있는 정도를 파악해야 하며, 이를 비대칭도라 한다.

  • 왜도로 표본의 비대칭도를 파악

  • 첨도로 분초의 뾰족한 정도를 확인

중심경향도

  • 중심경향도란 데이터들을 종합하여 그 중심을 이룬느 값이 어느 정도가 될지를 구한 것
    ex) 학교까지 가는데 어느 정도의 시간이 걸리는가?
  • A. 30분정도 소요됩니다.
  • B. 30분~40분 정도 소요됩니다.
  • 통학 시간 전체라는 집단 특성을 대표적으로 표현하는 값에는 평균, 중간값,최빈수 등이 있음

산술평균

  • 산술평균은 통계에서 가장 많이 활용되는 중심경향도
  • 모든 통계 분석에서 사용되며 표본의 특성을 제시할 때 가장 먼저 사용되는 수치

산술평균의 특징

  • 산술평균으로부터 관찰값 편차의 합은 0.
  • 자료의 분포가 좌우대칭이면 산술평균과 중위수는 동일
  • 대표값 중에서 가장 많이 사용

기하평균

  • 기하평균은 주로 평균변화율이나 평균 성장률, 경제 성장률 등의 비율을 구할 때 이용하는 수치
    -> 시계열 자료 변동을 대표하는 값으로 가장 적당

조화평균

  • 조화평균은 양수인 n개의 측정치를 역수로 하여 산술평균을 구하고, 이를 다시 역수로 나타낸 평균.
  • 조화평균은 가속 형상에서 평균 속도를 구하는 것과 같이 시간 비율의 평균을 나타내거나 표본 측정치의 극단 값을 줄여 균형된 자료를 만들 때 사용

절사평균

  • 절사평균은 표본 측정치들 중 편차가 큰 극단치가 존재하는 경우 산술평균을 활용하기 어려우므로 상위와 하위의 일정 부분을 제거하고 계산한 평균

중간값

  • 중간값은 관측된 자료의 편중과는 상관없이 가장 작은 값에서 가장 큰 값까지 정렬했을 때 그 가운데 위치한 값

최빈수

  • 최빈수는 표본에서 가장 많이 나타나는 관측치.
  • 여러 번 확인된다는 특성으로 중심경향도에 있으나, 최소 부분과 최대 부분으로 쏠림 현상이 나타날 수도 있기 때문에 특별히 필요성이 없는 한 잘 사용되지 않음

최빈수의 특징

  • 최빈수는 중심경향의 측정치로 1개 이상 존재할 수 있다.
  • 측정치 중 가장 많이 나타난 값이며, 도수분포표에서 가장 많이 나타나는 계급 값을 말한다.
  • 자료 중 평균이나 중간값을 구하기 어려운 경우에 많이 활용한다.
  • 극단치의 영향이 없고, 계급이 존재하는 경우 훨씬 쉽게 구할 수 있다.

(글,사진 출처:https://www.youtube.com/watch?v=VHhWOoM6jm8&list=PLsri7w6p16vtiu-mpViykeFQxzQqIV1gz&index=9)

'통계학' 카테고리의 다른 글

4.1 확률과 의사결정  (1) 2023.02.05
3.32 기초통계량_산포도_왜도_첨도  (0) 2023.02.03
3.1 데이터의 수집  (0) 2023.01.10
2.3 표본분포와 중심극한정리  (0) 2023.01.10
2.2 표본의 분포  (0) 2023.01.08