03. 분산과 표준편차 : 흩어져 있는 데이터 상태를 추정하는 통계량
- 평균값은 데이터들이 그 주변에 분포되어 있음(데이터의 분포를 대표하는 수치)
그러나 어느 정도 퍼져 있는지, 흩어져 있는지 알 수 없음
- 평균값보다 불규칙한 상태의 통계량을 아는 것이 중요
- 편차: 평균값과의 차이 (편차의 평균값은 항상 0 )
- 분산 = (편차제곱의 총합) / (데이터의 총 개수)
- 표준편차: 편차의 제곱평균값, 단위가 달라지는 분산의 단점 보완
--> 대표값(평균)을 기준으로 대략 어느정도 멀리 위치해 있는지를 나타내는 통계량
- 도수분포표의 표준편차 :
{(계급값-평균값)^2 X 상대도수}의 합계 = 분산
분산의 제곱근 = 표준편차
[연습문제]
1. 평균 계산
6 | 4 | 6 | 6 | 6 | 3 | 7 | 2 | 2 | 8 |
평균값: 5
2. 편차 계산
+1 | -1 | +1 | +1 | +1 | -2 | +2 | -3 | -3 | +3 |
3. 편차의 제곱과 그 평균(=분산) 계산
1 | 1 | 1 | 1 | 1 | 4 | 4 | 9 | 9 | 9 |
편차 제곱의 평균(분산) : 4
4. 표준편차 : 2
04. 표준편차 : 데이터의 특수성을 평가
- 표준편차를 알면
(1) 데이터 세트 중 한 데이터의 수치가 갖는 의미(특수성)
(2) 여러 데이터 세트를 비교해서 나타나는 차이
를 알 수 있음
- 표준편차로 계산해서 몇 배만큼 평균보다 높다, 낮다 표현하는 방법
--> (데이터 - 평균값) / 표준편차
- 위 식으로 계산한 결과가 ±1배 라면 '평범한 데이터', ±2배로 멀리 있으면 '특수한 데이터'
- [데이터에 일정한 수 a 를 더하면] 평균값은 + a, 분산과 표준편차는 그대로
- [데이터에 일정한 수 k를 곱하면] 평균값은 k를 곱한 값, 분산은 k의 제곱배, 표준편차는 k배
- (데이터 - 평균값) / 표준편차 로 가공하면, 이 데이터로 구한 평균은 0, 표준편차는 1
[연습문제]
* 본 포스팅은 책 <세상에서 가장 쉬운 통계학입문> 을 바탕으로 작성되었습니다.
'통계학' 카테고리의 다른 글
[통계학 기초 스터디] - 도수분포표,히스토그램,평균값 (0) | 2022.06.10 |
---|