제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf ·...

14
5분산도 [ 2기술 통계학 ]

Transcript of 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf ·...

Page 1: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

제 5장 분산도

[ 제 2부 기술 통계학 ]

Page 2: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

목 차

1. 범위

2. 변량

3. 표준편차

4. 사분위편차

Page 3: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험

1. 분산도의 개념과 종류

한 대표치를 중심으로 사례가 어느 정도 밀집 또는 분산되어 있는지를 나타내는 지수

(자료의 흩어진 정도)

분산도를 파악하기 위해서는 범위, 변량(분산), 표준편차, 사분위편차 등을 알아야 한다.

[그림1] 세 학급의 중간고사 점수분포 (p. 72)

분산도

Page 4: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험

1. 범위의 정의

자료의 최고치에서 최저치까지의 거리

장점 : 계산하기 쉬움

단점 : 최고치와 최저치만을 고려, 극단치의 영향을 많이 받기 때문에 분산도로서 이용가치가 떨어짐

사례 수가 다른 두 분포의 분산도를 비교할 때 범위의 계산 및 해석 시 주의를 기울여야 함

범위(range)

R = (H - L) + 1 * H : 최고치

* L : 최저치 정확한계를 고려하기 위하여

Page 5: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험

범위(range)

학급 A

학생 점수

갑돌 90 을만 88 병철 82 영철 40 철수 40 민수 40 영기 40 홍식 20

학급 B

학생 점수

갑순 90 을희 80 병자 70 나희 60 철희 50 민자 40 영희 30 춘자 20

평균: 55, 범위: 71 평균: 55, 범위: 71

Page 6: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험 1. 편차(deviation)

각 점수가 평균으로부터 떨어진 정도

편차의 절대치가 크면 평균에서

멀리 떨어져있음을 의미

편차의 합은 0이다.

변량(분산 variance)

90 80

70 60

50 40

30 20

0

20

40

60

80

100

Page 7: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험

변량(분산 variance)

학생 점수(Χ) 편차(χ) 편차자승(χ2)

갑순 을희 병자 나희 철희 민자 영희 춘자

90 80 70 60 50 40 30 20

35 25 15 5 -5 -15 -25 -35

1125 625 225 25 25 225 625 1125

Σχ2 = 4000

Ѕ2 = 500

Page 8: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험 2. 변량

평균을 중심으로 자료의 값이 얼마나 흩어져 있는가를 나타내는 값 (편차 제곱의 평균)

편차를 모두 제곱한 후 그 수를 모두 더하여 총 사례수로 나눈 값

수치가 커지고 원자료의 단위와 달라지는 문제가 있음

변량(분산 variance)

Page 9: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험 1. 표준편차

자료의 값이 평균을 중심으로 얼마나 밀집되어 있는가를 나태는 값 (분산의 제곱근)

표준편차가 작으면 자료의 값이 평균을 중심으로 밀집

표준편차가 크면 자료의 값이 평균을 중심으로 퍼져있음

표준편차(standard deviation)

Page 10: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험 1. 사분위수(quartiles)

수집된 자료를 크기 순으로 배열하여 4등분한 값 (Q1, Q2, Q3)

2. 사분위간 범위(IQR: interquartile range)

제 3사분위와 제 1사분위의 차이 (Q3 – Q1)

사분위간 범위가 길면 좀 더 흩어진 분포, 짧으면 밀집된 분포

사분위 편차(quartile deviation)

25% 25% 25% 25%

Q1 Q2

(중앙치)

Q3

Page 11: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험

3. 사분위 편차

중앙치(Q2) 를 중심으로 한 분산도

퍼센타일 : 100의 단위를 갖는 척도에서 위치 혹은 위치값

범위 내에 있는 많은 값들을 고려하여 분산도를 측정하기 때문에 범위보다 정밀

빈도분포의 편포 정도를 검토하는데 유용한 기준

사분위 편차와 사분위수에 따라 부적편포, 정적편포인지 파악

사분위 편차(quartile deviation)

Page 12: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험

53 58 68 73 75 76 79 80 85 88 91 99

사분위 간 범위(IQR) = Q3 – Q1 = 86.5 - 70.5 = 16

사분편차 (Q) = (Q3 – Q1)/2 = 8

P25 + Q(70.5+8=78.5) > Q2(중앙치) = 정적편포

사분위 편차(quartile deviation)

Q1 = (68+73) / 2 = 70.5

Q2 = (76+79) / 2 = 77.5

Q3 = (85+88) / 2 = 86.5

Page 13: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험

53 60 70 75 80 82 84 84 87 88 91 99

사분위 간 범위(IQR) = Q3 – Q1 = 87.5 - 72.5 = 15

사분편차 (Q) = (Q3 – Q1)/2 = 7.5

P25 + Q(72.5+8=78.5) < Q2(중앙치) = 부적편포

사분위 편차(quartile deviation)

Q1 = (70+75) / 2 = 72.5

Q2 = (82+84) / 2 = 83

Q3 = (87+88) / 2 = 87.5

Page 14: 제 2부 기술 통계학 - KOCWcontents.kocw.net/KOCW/document/2015/pusan/kimsukwoo/5.pdf · 춘자 90 80 70 60 50 40 30 20 35 25 15 5 -5 -15 -25 -35 1125 625 225 25 25 225 625 1125

실험

감사합니다.