Informational Statistics 데이터가주어진경우(givendata)(given...
Transcript of Informational Statistics 데이터가주어진경우(givendata)(given...
Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석
모비율추론•데이터가주어진경우에도 n(시행회수), x(성공회수)을
예제 데이터 NOTEBOOK.xls•노트북평가 95% 신뢰구간경 ( 행 ), (성공 )
구하면신뢰구간을구할수 있다.
•가설검정, p-value 계산
모평균 추론
평
•작년 75점보다높아졌나?
hnu
.ac.
kr Cha
pte•이상치진단
표본크기(?)
tp://
wol
fpa
ck.h er 3. U
sing R (U
이상치진단
대표본 (CLT) n > 20~30 소표본 n≤20
htt niva
riate D
ata
대 본 ( )
(1)이상치 진단 나무상자 그림(이상치 제거)
(1)이상치 진단나무상자 그림
(이상치 제거)
(2)치우침 진단 Ana
lysis)
T d Mi i
( )치우침 진단히스토그램/정규성 검정
(변수변환)
(37)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
Today MissionWord 문서: “이름 20081029.doc”
Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)
이상치 제거 95% 신뢰구간
hnu
.ac.
kr Cha
pte
•이상치 4개를제외하고상자-수염그림을그린다. 이상치가다시나타나면계속제외한다.
tp://
wol
fpa
ck.h er 3. U
sing R (U
치우침 진단•정규성검정
• 귀무가설 정규분포를 따른다 (좌우대칭)
가설검정•귀무가설:작년수준인 75점이다.
•대립가설: 75점 이상이다. 작년보다높다
htt niva
riate D
ata
• 귀무가설: 정규분포를 따른다. (좌우대칭)
• 대립가설: 정규분포를 따르지 않는다. (치우침)
Ana
lysis)
귀무가설 채택 정규분포를 따른다•유의확률=0.000119, 귀무가설기각작년보다높다.
(38)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
• 귀무가설 채택: 정규분포를 따른다.,
Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)
모분산 추론이상치 제거 및 정규성 검정 이후 실시
데이터 CEO.xls미국 기업 20개 기업 자본, CEO 연봉 데이터이상치 제거 및 정규성 검정 이후 실시
• In Editor window
미국 기업 20개 기업 자본, CEO 연봉 데이터
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
•미국기업 CEO 연봉의 95% 신뢰구간을구하시오.
htt niva
riate D
ata
Upcoming Assignment
공모전 참여 (deadline: 2008.11.21) Ana
lysis)
공모전 참여 (deadline: 2008.11.21)
• http://hnu.kr/new/081024-contest/
학술제 연극 참여?
(39)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
Informational Statistics데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont)(cont)데이터가데이터가 주어진주어진 경우경우(given data)(given data) 일변량일변량 분석분석 (cont.)(cont.)
우로 치우쳐 있다고 가정하고 치우침 해결
• X3, X2, √,Log
•작년 CEO 평균임금은 1,200이었다. 작년에비해 CEO 임급이낮아졌다고할수 있나?
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
•귀무가설(작년과동일하다, 1200이다) 채택, 작년보다낮아졌다고할수없다.
htt niva
riate D
ata
•변수변환한데이터를이용하여가설검정하시오.
2008.10.30 Mission (변수변환의경우)미국기업자본의 95% 신뢰구간을구하시오
Ana
lysis) •신뢰구간이좁아진다. 동일한신뢰수준인데…
•미국기업자본의 95% 신뢰구간을구하시오.
•작년자본이 85,000이었다. 자본이작년에비해낮아졌다고할수있나?
• R 프로그램
(40)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
Informational StatisticsScatterScatter plotplot
HW10 #1ScatterScatter plotplot
산점도•두변수간함수관계를나타내는 2차원그래프
HW10 due 11.05 BLS.xlsHW10 (due 11.05.2008) BLS.xls
• x-축: 설명변수, y-축: 종속변수
선형함수 linear function (일차식 1st order)• Y=a+bx+e, e=오차
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
htt niva
riate D
ata
S=707+0.004815*C
Ana
lysis)
(41)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
Informational StatisticsHWHW#10 more due 20081105#10 more due 20081105
HW10 #2 Quality.XLS
HWHW#10 more due 2008.11.05.#10 more due 2008.11.05.HW10 #3 Auto.XLS
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
htt niva
riate D
ata
Ana
lysis)
4. Can we say actual miles before the transmission failure is greater than 70,000? α=0.05
(42)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
Informational StatisticsHWHW#10 more due 20081105#10 more due 20081105HWHW#10 more due 2008.11.05.#10 more due 2008.11.05. HW10 #4 HW10 #5
The data shows the additional sleeping time gained by using two different sleeping pills, DEXTRO and LAEVO.
hnu
.ac.
kr Cha
pte
tp://
wol
fpa
ck.h er 3. U
sing R (U
(1)
htt niva
riate D
ata
(2)
Ana
lysis)
(3) Using the results of (1) and (2), How can you say which one is better for sleeping help?
(f) Draw a Dot plot and star for this data.
(43)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
sleeping help?
Informational StatisticsDot and Star PlotDot and Star PlotDot and Star PlotDot and Star Plot
점 도표•개체별로관측치의값을출력한다.
Star plot•개체별로관측치의값을스타 형태로출력한다.
•개체값(observation)을 개체이름포함한시각적표현
형
•개체값(observation)을 개체이름으로시각표현
Anhe ser B sch
CEO Salary
hnu
.ac.
kr Cha
pte1500
2000 2500 3000 3500 Anheuser‐Busch
AT&TCharles Schwab
Chevron
D P tS Mi t
Texaco
US WestWalt Disney
tp://
wol
fpa
ck.h er 3. U
sing R (U
0 500
1000 DuPont
General Elec.
GilletteQualcomm
Schering‐Plough
Sun Microsystems
htt niva
riate D
ata
IBM
Johnson & JohnsonKimberly‐Clark
Merrill LynchMotorola
Philip Morris
Procter & Gamble
Ana
lysis) •엑셀에서그린것임.
•여러분은 R에서그리는방법을아나요? 슬라이드 #4 (f)을
(44)Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University Lecture of 2008 Fall
( )위해스스로발견하시오.