New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013....

18
8/23/2013 1.시작하며 1 표집오차(sampling error) 전수조사가 아니었기 때문에 발생되는 오차 표집조사를 사용하였기 때문에 발생되는 오차 모집단과 표본집단 결과치는 다를 있다 오차가 발생할 있다 비표집오차(non sampling error) 통계조사에서 생기는 오차 중에서 표집오차를 제외한 나머지 오차 오차 = 표집오차(sampling error) + 비표집오차(non sampling error) 오차를 표집오차라고 한다 표집오차는 표본방법과 표본크기에 의존 통계이론(확률법칙)으로 해석 가능

Transcript of New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013....

Page 1: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

8/23/2013 1.시작하며 1

표집오차(sampling error)

전수조사가 아니었기 때문에 발생되는 오차 표집조사를 사용하였기 때문에 발생되는 오차

모집단과 표본집단 결과치는 다를 수 있다 오차가 발생할 수 있다

비표집오차(non sampling error)

통계조사에서 생기는 오차 중에서 표집오차를 제외한 나머지 오차

오차 = 표집오차(sampling error) + 비표집오차(non sampling error)

이 오차를 표집오차라고 한다 표집오차는 표본방법과 표본크기에 의존

통계이론(확률법칙)으로 해석 가능

Page 2: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

8/23/2013 1.시작하며 2

오차, 표집오차, 비표집오차, 신뢰수준에 대하여

오차 =|참값 − 추정값| = |모수 − 통계량|

오차 = 표집오차(sampling error) + 비표집오차(non sampling error)

을신문 : 오차= |−15%| =15%=3.4%+11.6% 표집오차 : 3.4% 비표집오차 : 11.6%

P{|모수−통계량| ≤ 표집오차} = 95%=0.95

신뢰수준 : 0.95 혹은 95%

100번 중 95번은 오차가 표집오차보다 같거나 작다!!

이 수식이 성립하기위해서는 표집이 확률표집이어야 함

100번 중 5번은 표집오차보다 클 수 있다!!

Question) 을 신문은? 병 신문은?

95% 신뢰수준에서 최대표집오차는 1/√n , n은 표집수(표본갯수)

정상

비정상

비표집오차

Page 3: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

8/23/2013 1.시작하며 3

통계조사에서 오류 사례 (제14대 총선, 1992년 3월)

총선에 10일 앞서 신문사들이 투표율을 사전 예측 조사

총선 실제 투표율 신문사들의 예측 투표율

신문사 예측 투표율 오차

P = 71% (모수)

갑신문 p1=71% 0%

을신문 p2=86% −15%

병신문 p3=88% −17%

갑신문 : 꼭 할 것이다(71.2%), 아마 할 것 같다(12.3%)

을신문 : 반드시 하겠다(68.6%), 아마 할 것이다(17.4%)

병신문 : 할 것이다(88.0%)

표집오차(sampling error) : ±3.4% 신뢰수준(confidence level)은? 아마도 95%!!

정확성)예측투표율±표집오차 실제 투표율(P=71%,모수)를 포함하는가?

사회적 요망성 편향 (social desirability bias)

Page 4: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

8/23/2013 1.시작하며 4

Quiz 1 : 95% 신뢰수준에서 확률표집의 수(표본수)가 1,600 이라면 표집오차는 얼마인가?

Quiz 2 : 95% 신뢰수준에서 모수와 추정값의 최대오차가 3%이내로 하려면 표집수를 얼마로 하면 되는가?

Quiz 3 : 95% 신뢰수준에서 2,500명을 조사한 결과, 오차가 6%이었다. 이때 비표집오차가 존재하는가? 존재한다면 얼마인가?

Page 5: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

8/23/2013 1.시작하며 5

조사와 관련한 고려사항들

우편조사에서 설문지 회수율(응답률)을 높이는 방법은?

설문의 어구에 따라 응답에 어떠한 차이가 발생하는가?

전화조사에서 응답률을 높이는 방법과 응답결과의 신뢰성확보 방법은?

면접조사에서 응답률을 높이는 방법은?

Page 6: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

2.TV 시청률조사 - 표집오차와 비표집오차

8/23/2013 1.시작하며 6

표집오차(sampling error)=표본오차 − 표본조사(표집조사)로 인한 오차

확률적 표집(확률표집)인 경우 표집오차는 확률법칙을 이용하여 해석가능

확률표집(probabilistic sampling)

모집단으로 부터 표집할 때, 모집단의 원소가 표본으로 선택될 확률을 계산가능 하도록 표집 확률표집으로 뽑힌 표본을 확률표본(random sample) 혹은 표본(sample)이라고 함

표집오차는 표집방법과 표본크기에 의해 결정

모든 오차 중에서 표집오차를 제외한 다른 모든 유형의 오차

비표집오차

오차 = 표집오차 + 비표집오차

Page 7: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

2.TV 시청률조사 - 표집오차와 비표집오차

8/23/2013 1.시작하며 7

비표집오차의 발생 원인

여러 원인으로 발생 측정도구의 결함

측정과정의 부실

Example ) 설문조사에서는 설문의 결함과 부실한 실사

표집과정의 결함

Page 8: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

2.TV 시청률조사 - 표집오차와 비표집오차

8/23/2013 1.시작하며 8

우리나라 TV 시청률 조사

AGB닐슨미디어 리서치, TNS미디어 코리아

피플미터(people meter)

전국 주요도시 2,000여 가구 : 가구원 중 누가 언제 무엇을 얼마동안 시청?

문제점 1 : 측정의 결함

기계는 정확하나 사용하는 사람의 실수 비표집오차 발생

문제점 2 : 표본크기

1/√2,000 = 0.022 = 2.2% 표집오차 : 2.2%

Page 9: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

2.TV 시청률조사 - 표집오차와 비표집오차

8/23/2013 1.시작하며 9

순위 프로그램 방송사 시청률

1 살맛납니다 MBC 21.0%

2 신데렐라언니 KBS2 19.7%

3 KBS뉴스9 KBS1 19.5%

4 바람불어 좋은 날 KBS1 19.1%

5 아내가 돌아았다 SBS 16.8%

6 분홍립스틱 MBC 14.3%

7 개인의 취향 MBC 13.0%

8 KBS뉴스광장2부 KBS1 12.2%

9 당돌한 여자 SBS 12.2%

10 인간극장 KBS1 11.0%

시청률비교 : 표집오차 2.2%만 사용, 비표집오차는 고려하지 않음

Page 10: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

3.대통령 선거 예측 –통계조사의 성공사례

8/23/2013 1.시작하며 10

선거예측을 위한 통계조사는 정답(모수)을 알 수 있음 오차를 알 수 있음

통계조사가 얼마나 정확했는가를 사후적으로 평가할 수 있음

대통령 선거예측 성공 사례들

1987년 제13대 1992년 제14대 1997년 제15대 2002년 제16대 2007년 제17대

예측치(통계량, 추정치) 결과치(모수)

1987년, 1992년, 1997년 선거예측은 한국갤럽(gallup)이 가구방문조사와 전화조사 2002년 선거예측은 미디어리서치가 출구조사(exit poll) 2007년 선거예측은 미디러리서치와 코리아리서치가 공동으로 출구조사

Page 11: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

3.대통령 선거 예측 –통계조사의 성공사례

8/23/2013 1.시작하며 11

제13대 대통령선거(1987년)

득표율 노태우 김영삼 김대중 김종필 기타

예측치 34.4 28.7 28.0 8.4 0.5

결과치 36.6 28.0 27.1 8.1 0.2

제14대 대통령선거(1992년)

득표율 노태우 김영삼 김대중 김종필 기타

예측치 39.5 31.1 15.7 12.4 1.2

결과치 42.0 33.8 16.3 6.4 1.5

Page 12: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

3.대통령 선거 예측 –통계조사의 성공사례

8/23/2013 1.시작하며 12

제15대 대통령선거(1997년)

득표율 김대중 이회창 이인제 기타

예측치 39.9 38.9 19.7 1.5

결과치 40.3 38.7 19.2 1.8

제16대 대통령선거(2002년)

득표율 노무현 이회창 기타

예측치 49.1 46.8 4.1

결과치 48.9 46.6 4.5

Page 13: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

3.대통령 선거 예측 –통계조사의 성공사례

8/23/2013 1.시작하며 13

제17대 대통령선거(2007년)

득표율 이명박 정동영 이회창 문국현 기타

예측치 50.3 20.0 13.5 6.1 10.1

결과치 48.7 26.1 15.1 5.8 4.3

위의 조사결과들의 오차를 계산하기 위해 필요한 정보는 무엇일까?

위의 조사결과들이 1,600명을 표집했다면 95%신뢰수준에서 정확했던 경우는?

Quiz

Page 14: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

8/23/2013 1.시작하며 14

선거여론조사와 사회심리

Band wagon effect : 우세자가 여론조사결과의 공표로 더 우세하게 되는 것

Underdog effect : 열세자가 동정효과를 얻는 것

침묵의 나선효과(spiral of silence) 예측과 실제 결과간 차이 제1후보와 제2후보간 차이가 실제 결과에서는 상당히 좁혀지는 효과 사회 지배적 압력

선거여론조사가 여러사람의 대결에서 양자 대결구도로 바꾸는 효과 투표자가 자기표가 사표가 되는 것을 원하지 않기 때문

Page 15: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

4.저질조사

8/23/2013 1.시작하며 15

2004년 4월 총선거를 앞둔 시점에서 Y당 지역후보 결정을 위한 여론조사

선거인단 1,000명 전화조사를 시도 인구요인 : 성과 나이(40세)

확보된 선거인 : 995명 투표참석인원:310명 참석률 : 31%

참석자의 대표성에 대한 고려가 없었음

전화표집은 여러 원인에 의해 왜곡될 가능성이 있음 대표성에 문제가 발생

비표집오차가 발생할 가능성 높음 재택률이 인구속성, 가구원수 등에 따라 다름

Page 16: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

8/23/2013 1.시작하며 16

재택률에 영향을 주는 요인들

성별, 나이, 직업, 가구원 수, 유선전화가 없는 경우, 학력, 주택유형, 주거지역

대표성 문제

대표성을 확보하기 위하여

참석하겠다고 응답한 사람들만 선거인단으로 포함시키지 말자.

각종 속성 범주의 모집단 비율을 토대로 선별하자.

대표성 확보 조사의 질 향상 조사의 양 저하

확률표집을 하자.

Page 17: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

4.저질조사

8/23/2013 1.시작하며 17

2004년 4월 총선거를 앞둔 시점에서 Y당 지역후보 결정을 위한 여론조사

선거인단 1,000명 전화조사를 시도 인구요인 : 성과 나이(40세)

확보된 선거인 : 995명 투표참석인원:310명 참석률 : 31%

참석자의 대표성에 대한 고려가 없었음

전화표집은 여러 원인에 의해 왜곡될 가능성이 있음 대표성에 문제가 발생

비표집오차가 발생할 가능성 높음 재택률이 인구속성, 가구원수 등에 따라 다름

Page 18: New 표집오차(sampling error) - KOCWelearning.kocw.net/contents4/document/lec/2013/... · 2013. 9. 17. · 비표집오차(non sampling error) 통계조사에서 생기는 오차

8/23/2013 1.시작하며 18

재택률에 영향을 주는 요인들

성별, 나이, 직업, 가구원 수, 유선전화가 없는 경우, 학력, 주택유형, 주거지역

대표성 문제

대표성을 확보하기 위하여

참석하겠다고 응답한 사람들만 선거인단으로 포함시키지 말자.

각종 속성 범주의 모집단 비율을 토대로 선별하자.

대표성 확보 조사의 질 향상 조사의 양 저하

확률표집을 하자.