Informational Statistics 데이터가주어진경우(givendata)(given...

8
Informational Statistics 데이터가 데이터가 주어진 주어진 경우 경우 (given data) (given data) 일변량 일변량 분석 분석 데이터가 데이터가 주어진 주어진 경우 경우 (given data) (given data) 일변량 일변량 분석 분석 모비율 추론 데이터가 주어진 우에도 n(회수), x(성공 회수)예제 데이터 NOTEBOOK.xls 노트북 95% 신뢰구간 구하면 신뢰구간을 구할 수 있다. 가설 검정, p-value 계산 모평균 추론 작년 75점보다 높아졌나? hnu.ac.kr Chapte 이상치 진단 표본 크기(?) tp://wolfpack.h er 3. Using R (U 이상치 진단 (CLT) n > 20~30 소표본 n20 htt nivariate Data (1)이상치 진단 나무상자 그림 (이상치 제거) (1)이상치 진단 나무상자 그림 (이상치 제거) (2)치우침 진단 Analysis) T d Mi i 히스토그램/정규성 검정 (변수변환) (37) Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall Today Mission Word 문서: “이름 20081029.doc”

Transcript of Informational Statistics 데이터가주어진경우(givendata)(given...

Page 1: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석

모비율추론•데이터가주어진경우에도 n(시행회수), x(성공회수)을

예제 데이터 NOTEBOOK.xls•노트북평가 95% 신뢰구간경 ( 행 ), (성공 )

구하면신뢰구간을구할수 있다.

•가설검정, p-value 계산

모평균 추론

•작년 75점보다높아졌나?

hnu

.ac.

kr Cha

pte•이상치진단

표본크기(?)

tp://

wol

fpa

ck.h er 3. U

sing R (U

이상치진단

대표본 (CLT) n > 20~30 소표본 n≤20

htt niva

riate D

ata

대 본 ( )

(1)이상치 진단 나무상자 그림(이상치 제거)

(1)이상치 진단나무상자 그림

(이상치 제거)

(2)치우침 진단 Ana

lysis)

T d Mi i

( )치우침 진단히스토그램/정규성 검정

(변수변환)

(37)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Today MissionWord 문서: “이름 20081029.doc”

Page 2: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)

이상치 제거 95% 신뢰구간

hnu

.ac.

kr Cha

pte

•이상치 4개를제외하고상자-수염그림을그린다. 이상치가다시나타나면계속제외한다.

tp://

wol

fpa

ck.h er 3. U

sing R (U

치우침 진단•정규성검정

• 귀무가설 정규분포를 따른다 (좌우대칭)

가설검정•귀무가설:작년수준인 75점이다.

•대립가설: 75점 이상이다. 작년보다높다

htt niva

riate D

ata

• 귀무가설: 정규분포를 따른다. (좌우대칭)

• 대립가설: 정규분포를 따르지 않는다. (치우침)

Ana

lysis)

귀무가설 채택 정규분포를 따른다•유의확률=0.000119, 귀무가설기각작년보다높다.

(38)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

• 귀무가설 채택: 정규분포를 따른다.,

Page 3: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)

모분산 추론이상치 제거 및 정규성 검정 이후 실시

데이터 CEO.xls미국 기업 20개 기업 자본, CEO 연봉 데이터이상치 제거 및 정규성 검정 이후 실시

• In Editor window

미국 기업 20개 기업 자본, CEO 연봉 데이터

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

•미국기업 CEO 연봉의 95% 신뢰구간을구하시오.

htt niva

riate D

ata

Upcoming Assignment

공모전 참여 (deadline: 2008.11.21) Ana

lysis)

공모전 참여 (deadline: 2008.11.21)

• http://hnu.kr/new/081024-contest/

학술제 연극 참여?

(39)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Page 4: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)

우로 치우쳐 있다고 가정하고 치우침 해결

• X3, X2, √,Log

•작년 CEO 평균임금은 1,200이었다. 작년에비해 CEO 임급이낮아졌다고할수 있나?

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

•귀무가설(작년과동일하다, 1200이다) 채택, 작년보다낮아졌다고할수없다.

htt niva

riate D

ata

•변수변환한데이터를이용하여가설검정하시오.

2008.10.30 Mission (변수변환의경우)미국기업자본의 95% 신뢰구간을구하시오

Ana

lysis) •신뢰구간이좁아진다. 동일한신뢰수준인데…

•미국기업자본의 95% 신뢰구간을구하시오.

•작년자본이 85,000이었다. 자본이작년에비해낮아졌다고할수있나?

• R 프로그램

(40)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Page 5: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational StatisticsScatterScatter plotplot

HW10 #1ScatterScatter plotplot

산점도•두변수간함수관계를나타내는 2차원그래프

HW10 due 11.05 BLS.xlsHW10 (due 11.05.2008) BLS.xls

• x-축: 설명변수, y-축: 종속변수

선형함수 linear function (일차식 1st order)• Y=a+bx+e, e=오차

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

htt niva

riate D

ata

S=707+0.004815*C

Ana

lysis)

(41)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Page 6: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational StatisticsHWHW#10 more due 20081105#10 more due 20081105

HW10 #2 Quality.XLS

HWHW#10 more due 2008.11.05.#10 more due 2008.11.05.HW10 #3 Auto.XLS

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

htt niva

riate D

ata

Ana

lysis)

4. Can we say actual miles before the transmission failure is greater than 70,000? α=0.05

(42)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

Page 7: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational StatisticsHWHW#10 more due 20081105#10 more due 20081105HWHW#10 more due 2008.11.05.#10 more due 2008.11.05. HW10 #4 HW10 #5

The data shows the additional sleeping time gained by using two different sleeping pills, DEXTRO and LAEVO.

hnu

.ac.

kr Cha

pte

tp://

wol

fpa

ck.h er 3. U

sing R (U

(1)

htt niva

riate D

ata

(2)

Ana

lysis)

(3) Using the results of (1) and (2), How can you say which one is better for sleeping help?

(f) Draw a Dot plot and star for this data.

(43)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

sleeping help?

Page 8: Informational Statistics 데이터가주어진경우(givendata)(given …wolfpack.hnu.ac.kr/Fall20080904/INFO/INFO 2008Fall R3... · 2011-07-31 · Informational Statistics 데이터가주어진경우(givendata)(given

Informational StatisticsDot and Star PlotDot and Star PlotDot and Star PlotDot and Star Plot

점 도표•개체별로관측치의값을출력한다.

Star plot•개체별로관측치의값을스타 형태로출력한다.

•개체값(observation)을 개체이름포함한시각적표현

•개체값(observation)을 개체이름으로시각표현

Anhe ser B sch

CEO Salary

hnu

.ac.

kr Cha

pte1500 

2000 2500 3000 3500 Anheuser‐Busch

AT&TCharles Schwab

Chevron

D P tS  Mi t

Texaco

US WestWalt Disney

tp://

wol

fpa

ck.h er 3. U

sing R (U

0 500 

1000  DuPont

General Elec.

GilletteQualcomm

Schering‐Plough

Sun Microsystems

htt niva

riate D

ata

IBM

Johnson & JohnsonKimberly‐Clark

Merrill LynchMotorola

Philip Morris

Procter & Gamble

Ana

lysis) •엑셀에서그린것임.

•여러분은 R에서그리는방법을아나요? 슬라이드 #4 (f)을

(44)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall

( )위해스스로발견하시오.