1 Simple Linear Regression Linear regression model Prediction Limitation Correlation.
สมการถดถอยอย่างง่าย Simple Linear Regression
description
Transcript of สมการถดถอยอย่างง่าย Simple Linear Regression
สมการถดถอยอยางงาย สมการถดถอยอยางงายSimple Linear Simple Linear
RegressionRegression
ผ �ชวยศาสตราจารย�น�คม ถนอมเส�ยง ภาคว�ชาช�วสถ�ต�และประชากรศาสตร�
คณะสาธารณส!ขศาสตร� ม.ขอนแกน
สมการถดถอยอยางงายสมการถดถอยอยางงาย : : Simple Linear RegressionSimple Linear Regressionใช�ว�ธ�การทางสถ�ต�น�&เม'(อไร ? ให�พ�จารณาด จากค,าถามตอไปน�&•ระด-บไขม-นในเล'อดม�ความส-มพ-นธ�ก-บความด-นโลห�ต หร'อไม และสามารถท,านายความด-นโลห�ต ได�หร'อไม ?•จ,านวนคร-&งของการล�างหน�าม�ความส-มพ-นธ�ก-บ การเก�ดเม0ดส�วบนใบหน�าหร'อไม และสามารถท,านาย การเก�ดเม0ดส�วบนใบหน�าได�หร'อไม ?
สมการถดถอยอยางงายสมการถดถอยอยางงาย : : ว-ตถ!ประสงค�ว-ตถ!ประสงค�• เพ'(ออธ�บายความส-มพ-นธ�ระหวาง 2 ต-วแปร
•เพ'(อใช�ในการท,านายSystolic BPSystolic BPCHOL
Systolic BPSystolic BPCHOL
ระด-บ CHOLESTEROL (CHOL) จะท,านาย
Systolic BP ได� อยางไร ?Systolic BPSystolic BPCHOL
Systolic BPSystolic BPCHOL
Systolic BPSystolic BPCHOL
น-กว�จ-ยกล!มหน1(งศ1กษาข�อม ลผ �มาตรวจท�(โรงพยาบาล
จ,านวน 7 ราย ข�อม ลปรากฏตามตาราง
idno=คนท�(, chol=ระด-บไขม-นในเล'อด , sysbp = ความด-นโลห�ตแบบ systolic
ว�ธ�ท�(ตรวจสอบงายๆ ค'อการฟล0อตก ราฟแสดงความส-มพ-นธ�ระหวาง ระด-บ
ไขม-นในเล'อดและความด-นโลห�ตชน�ดSystolic เร�ยกกราฟน�&วา“Scatter PlotScatter Plot”
จากการฟล0อตกราฟ ถ�าหาร ปแบบ แสดงความส-มพ-นธ�ระหวาง 2
ต-วแปร ก0สามารถท,านายได� ท,า อยางไร ?
แนวค�ดท�( แนวค�ดท�(11 ใช�คาเฉล�(ยได�หร'อไม เม'(อ
143.4286X
xy
ต-วอยางต-วอยาง ระด-บไขม-นในเล'อดเป7นเทาไร ก0ตาม ท,านายวา
คาความด-นโลห�ตโลห�ตSystolic เทาก-บคาเฉล�(ย ด-งน-&น: สมการค'อ y= 143.4286
การใช�คาเฉล�(ยท,าให�ข�อม ลเบ�(ยงเบนจากคาท,านายส ง
143.4286X
แนวค�ดท�( แนวค�ดท�(22 ถ�าสร�างสมการแสดงความ ส-มพ-นธ�เช�งเส�น
ระหวาง 2 ต-วแปร จากสมการเส�นตรงด-งน�&
= คาต-วแปรตามa = คาคงท�(หร'อจ!ดต-ดบนแกน y (intercept) b = คาความช-น (slope) หร'อส-มประส�ทธ�8 (coefficient)x = คาต-วแปรอ�สระ
ii bxay
y
สมการ เร�ยกวาสมการ สมการ เร�ยกวาสมการถดถอยถดถอยค,านวณคาค,านวณคา a = คาคงท�(หร'อจ!ดต-ดบน
แกน y หร'อ b = คาความช-นหร'อ
ส-มประส�ทธ�8 อยางไร ?
หล-กการค,านวณหล-กการค,านวณ ค'อท,าให�ระยะหาง ระหวางจ!ดก-บเส�นตรงน�อยท�(ส!ด ว�ธ�
การน�&เร�ยกวา “ ” ก,าล-งสองน�อยท�(ส!ด(Least Square)
ii bxay
ว�ธ�ก,าล-งสองน�อยท�(ส!ดว�ธ�ก,าล-งสองน�อยท�(ส!ด: ค'อการท,าให�ผลรวมก,าล-งสอง ของความคลาดเคล'(อนของแตละคาส-งเกต y ก-บคาท�(
อย บนสมการเส�นตรง y
} ie
ว�ธ�ค,านวณว�ธ�ค,านวณ: a, b ท,าได�ด-งน�& xb-ya
n
)x(x
n
)y)(x(yx
b2
i2i
iiii
xx
xy
S
Sb
xงของเบนกำ�ล�งสอส วนเบ��ยง xyงของเบนกำ�ล�งสอส วนเบ��ยง
b
ต-วอยางต-วอยาง: จากข�อม ล ระด-บไขม-นใน เล'อดและระด-บความด-นโลห�ต
Systolic
2x xy 2y x y
7143.2476
1923y 4286.143
61004
x
3115713.7/)1923(569829
7/)1004)(1923(2887602
b
83548.54
ii x54.83548y 3115713.ˆ
สมการถดถอยค'อสมการถดถอยค'อ
(143.4256)(.3115713)-247.7143a
การแปรความหมายจากสมการการแปรความหมายจากสมการถดถอยถดถอย
เม'(อคาไขม-นในเล'อดเปล�(ยนไป เม'(อคาไขม-นในเล'อดเปล�(ยนไป 1 1หนวยท,าให�หนวยท,าให�
คาความด-นโลห�ตส งข1&นเทาก-บ คาความด-นโลห�ตส งข1&นเทาก-บ 3115713. 3115713. หนวยหนวย
ii x54.83548y 3115713.ˆ
การประเม�นสมการถดถอยการประเม�นสมการถดถอย พ�จารณาจากคา coefficient of
determination คาของ coeffic ient of determination
ค,านวณจาก
n
1i)Yi(Y
n
1i
2)YiY(2r
ˆ
yy
xx22
SS
br หร'อหร'อ
r2 ม�คา -0 1 r2 ใกล� 1 สมการถดถอยสามารถอธ�บาย การเปล�(ยนแปลงต-วแปรตามได�มาก
}}
{ด�เบนอธ�บยไส วนเบ��ยง
)YiY( ˆ
ด�อธ�บยไม ไเบนส วนเบ��ยง
)Yi(Y ˆ
)Yi(Y เบนท��งหมดส วนเบ��ยง
สวนเบ�(ยงเบน สวนเบ�(ยงเบน (( ท-&งหมด ท�(อธ�บายได� ท-&งหมด ท�(อธ�บายได�//อธ�บายไมได�อธ�บายไมได�))
ต-วอยางต-วอยาง:: ค,านวณค า coefficient of
determination ด-งน�&
7
1004148994
7
1929569829
3115713.S
Sbr
2
2
2
yy
xx22
8081 r 2
แสดงวาแสดงวา: : สมการถดถอยอธ�บาย ความส-มพ-นธ�ของความด-นโลห�ต
Systolic ก-บระด-บไขม-นในเล'อดได�8081. %
bS
Bbt
xx
2y/x
b S
SS
2n
)(SbSS xx
2yy2
y/x
การทดสอบความส-มพ-นธ�เช�งเส�นการทดสอบความส-มพ-นธ�เช�งเส�น ระหวาง ระหวาง 2 2 ต-วแปรต-วแปร
สถ�ต�ใช�ทดสอบได�แก, d.f.=n-2
เม'(อ
n
2)ix(2ixxxS
n
2)iy(2iyyyS
การทดสอบสมม!ต�ฐานการทดสอบสมม!ต�ฐาน:: จากต-วอยางการทดสอบ ม�ข-&นตอนด-งน�&
1. 1. ต-&งสมม!ต�ฐานต-&งสมม!ต�ฐานH0: ระด-บไขม-นในเล'อดและระด-บความด-นโลห�ต ไมม�ความส-มพ-นธ�เช�งเส�นตอก-น(B=0)HA: ระด-บไขม-นในเล'อดและระด-บความด-นโลห�ต ม�ความส-มพ-นธ�เช�งเส�นตอก-น(B 0)2. 2. ก,าหนดระด-บน-ยส,าค-ญ ก,าหนดระด-บน-ยส,าค-ญ 0.050.05
3. 3. ค,านวณคาทางสถ�ต�ค,านวณคาทางสถ�ต�
bS
Bbt
7
1004148994S
2
yy
7
1929569829S
2
xx
741553.42852-7
57)(41553.428.3115713-64991.71428
S
2
b
589.4.0678983
0-.3115713t
4. 4. ต-ดส�นใจต-ดส�นใจ//สร!ปผลสร!ปผล น,าคา t=4.589 และ d.f. = n-2
= 5 เป<ดตาราง t ได� p-value = 0.005
สร!ปได�วาสร!ปได�วา: : ระด-บไขม-นในเล'อดและระด-บความด-น โลห�ตม�ความ
ส-มพ-นธ�เช�งเส�นตอก-น อยางม�น-ยส,าค-ญทางสถ�ต�อยางม�น-ยส,าค-ญทางสถ�ต� (p-value <0.0005)(p-value <0.0005)
การค,านวณชวงเช'(อม-(นของ การค,านวณชวงเช'(อม-(นของ B :B :ค,านวณจาก
จากต-วอยางค,านวณ95% ชวงเช'(อม-(นของ B เม'(อ b=.3115713
= = . 1370331 4861096, .
bS2)-n,
2(
tb
).0678983(571.2.3115713
การใช�สมการถดถอยในการประมาณการใช�สมการถดถอยในการประมาณคาคาก . ประมาณคาต-วแปรตาม น,าคาX0 ไปแทน
ในสมการ
ต-วอยางต-วอยาง: ถ�า X0 = 200
= 12014975
y
ii bxay
)200(3115713.83548.57y i
ชวงเช'(อม-(นของ ท�( ชวงเช'(อม-(นของ ท�( X = X = X0 ค,านวณจากส ตรค,านวณจากส ตร
ต-วอยางต-วอยาง: : ค,านวณ ค,านวณ9595% CI % CI ของ ของ
y
xxS
2)X0(X)
n
1(1y/xS
2)-n,2
α(
ty
200x ท�� y 0 ˆ
741553.4285
2)4286.143(200
7
1(1)191.5689(571.2120.14975
การประมาณคาเฉล�(ยของต-วแปรการประมาณคาเฉล�(ยของต-วแปร ตาม ตาม
ท�(คาของต-วแปรท�(คาของต-วแปร X0 ค,านวณโดยค,านวณโดยแทนคาแทนคา X0 ในสมการ
และ ชวงเช'(อม-(นของ และ ชวงเช'(อม-(นของค,านวณจากค,านวณจาก
y/xμ
ii bxay
y/xμ
xxS
2)X0(X
n
1(y/xS
2)-n,2
α(
ty
ข�อก,าหนด ข�อก,าหนด (Assumption)(Assumption)1. ท�(แตละคาของ X ต-วแปร Y ม�การแจกแจง แบบปกต�
2. ท�(แตละคาของ Y ต-วแปร X ม�การแจกแจง แบบปกต�
3. ความแปรปรวนของต-วแปรตามY ม�คาเทาก-นท�( แตละคาของ X4. คาเฉล�( ยของต-วแปรตาม Y ท�(
แตละคาของต-วแปร X อย บนเส�นตรงเด�ยวก-น
BXAy/xμ
ข�อก,าหนด ข�อก,าหนด (Assumption)(Assumption)-Normality พ�จารณาจาก
residual iiiii bxay;yye ˆˆ
. regress sysbp chol
Source | SS df MS Number of obs = 7---------+------------------------------ F( 1, 5) = 21.06 Model | 4033.86954 1 4033.86954 Prob > F = 0.0059Residual | 957.844744 5 191.568949 R-squared = 0.8081---------+------------------------------ Adj R-squared = 0.7697 Total | 4991.71429 6 831.952381 Root MSE = 13.841
------------------------------------------------------------------------------ sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- chol | .3115713 .0678983 4.589 0.006 .1370331 .4861096 _cons | 57.83548 19.37235 2.985 0.031 8.037256 107.6337------------------------------------------------------------------------------