Download - Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Transcript
Page 1: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석

모비율추론•데이터가주어진경우에도 n(시행회수), x(성공회수)을

예제 데이터 NOTEBOOK.xls•노트북평가 95% 신뢰구간경 ( 행 ), (성공 )

구하면신뢰구간을구할수 있다.

•가설검정, p-value 계산

모평균 추론

•작년 75점보다높아졌나?

hnu

.ac.

kr Cha

pte•이상치진단

표본크기(?)

tp://

wol

fpa

ck.h er 3. U

sing R (U

이상치진단

대표본 (CLT) n > 20~30 소표본 n≤20

htt niva

riate D

ata

대 본 ( )

(1)이상치 진단 나무상자 그림(이상치 제거)

(1)이상치 진단나무상자 그림

(이상치 제거)

(2)치우침 진단 Ana

lysis)

T d Mi i

( )치우침 진단히스토그램/정규성 검정

(변수변환)

(37)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Today MissionWord 문서: “이름 20081029.doc”

Page 2: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)

이상치 제거 95% 신뢰구간

hnu

.ac.

kr Cha

pte

•이상치 4개를제외하고상자-수염그림을그린다. 이상치가다시나타나면계속제외한다.

tp://

wol

fpa

ck.h er 3. U

sing R (U

치우침 진단•정규성검정

• 귀무가설 정규분포를 따른다 (좌우대칭)

가설검정•귀무가설:작년수준인 75점이다.

•대립가설: 75점 이상이다. 작년보다높다

htt niva

riate D

ata

• 귀무가설: 정규분포를 따른다. (좌우대칭)

• 대립가설: 정규분포를 따르지 않는다. (치우침)

Ana

lysis)

귀무가설 채택 정규분포를 따른다•유의확률=0.000119, 귀무가설기각작년보다높다.

(38)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

• 귀무가설 채택: 정규분포를 따른다.,

Page 3: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)

모분산 추론이상치 제거 및 정규성 검정 이후 실시

데이터 CEO.xls미국 기업 20개 기업 자본, CEO 연봉 데이터이상치 제거 및 정규성 검정 이후 실시

• In Editor window

미국 기업 20개 기업 자본, CEO 연봉 데이터

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

•미국기업 CEO 연봉의 95% 신뢰구간을구하시오.

htt niva

riate D

ata

Upcoming Assignment

공모전 참여 (deadline: 2008.11.21) Ana

lysis)

공모전 참여 (deadline: 2008.11.21)

• http://hnu.kr/new/081024-contest/

학술제 연극 참여?

(39)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Page 4: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)

우로 치우쳐 있다고 가정하고 치우침 해결

• X3, X2, √,Log

•작년 CEO 평균임금은 1,200이었다. 작년에비해 CEO 임급이낮아졌다고할수 있나?

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

•귀무가설(작년과동일하다, 1200이다) 채택, 작년보다낮아졌다고할수없다.

htt niva

riate D

ata

•변수변환한데이터를이용하여가설검정하시오.

2008.10.30 Mission (변수변환의경우)미국기업자본의 95% 신뢰구간을구하시오

Ana

lysis) •신뢰구간이좁아진다. 동일한신뢰수준인데…

•미국기업자본의 95% 신뢰구간을구하시오.

•작년자본이 85,000이었다. 자본이작년에비해낮아졌다고할수있나?

• R 프로그램

(40)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Page 5: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational StatisticsScatterScatter plotplot

HW10 #1ScatterScatter plotplot

산점도•두변수간함수관계를나타내는 2차원그래프

HW10 due 11.05 BLS.xlsHW10 (due 11.05.2008) BLS.xls

• x-축: 설명변수, y-축: 종속변수

선형함수 linear function (일차식 1st order)• Y=a+bx+e, e=오차

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

htt niva

riate D

ata

S=707+0.004815*C

Ana

lysis)

(41)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Page 6: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational StatisticsHWHW#10 more due 20081105#10 more due 20081105

HW10 #2 Quality.XLS

HWHW#10 more due 2008.11.05.#10 more due 2008.11.05.HW10 #3 Auto.XLS

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

htt niva

riate D

ata

Ana

lysis)

4. Can we say actual miles before the transmission failure is greater than 70,000? α=0.05

(42)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Page 7: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational StatisticsHWHW#10 more due 20081105#10 more due 20081105HWHW#10 more due 2008.11.05.#10 more due 2008.11.05. HW10 #4 HW10 #5

The data shows the additional sleeping time gained by using two different sleeping pills, DEXTRO and LAEVO.

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

(1)

htt niva

riate D

ata

(2)

Ana

lysis)

(3) Using the results of (1) and (2), How can you say which one is better for sleeping help?

(f) Draw a Dot plot and star for this data.

(43)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

sleeping help?

Page 8: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational StatisticsDot and Star PlotDot and Star PlotDot and Star PlotDot and Star Plot

점 도표•개체별로관측치의값을출력한다.

Star plot•개체별로관측치의값을스타 형태로출력한다.

•개체값(observation)을 개체이름포함한시각적표현

•개체값(observation)을 개체이름으로시각표현

Anhe ser B sch

CEO Salary

hnu

.ac.

kr Cha

pte1500 

2000 2500 3000 3500 Anheuser‐Busch

AT&TCharles Schwab

Chevron

D P tS  Mi t

Texaco

US WestWalt Disney

tp://

wol

fpa

ck.h er 3. U

sing R (U

0 500 

1000  DuPont

General Elec.

GilletteQualcomm

Schering‐Plough

Sun Microsystems

htt niva

riate D

ata

IBM

Johnson & JohnsonKimberly‐Clark

Merrill LynchMotorola

Philip Morris

Procter & Gamble

Ana

lysis) •엑셀에서그린것임.

•여러분은 R에서그리는방법을아나요? 슬라이드 #4 (f)을

(44)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

( )위해스스로발견하시오.