Chapter 5 · Chapter 5 Panel regression model Dr. Woraphon Yamaka
Transcript of Chapter 5 · Chapter 5 Panel regression model Dr. Woraphon Yamaka
Chapter 5Panel regression model
Dr. Woraphon Yamakahttps://wyamaka.wordpress.com
Panel regression model
• แบบจ ำลองมีลกัษณะเหมอืนกนักบัแบบจ ำลอง linear regression แต่แทนที่เรำจะใชข้อ้มลู ภำคตดัขวำง(cross section) หรอื อนกุรมเวลำ(Time series) แบบจ ำลองนีเ้รำเลอืกใชข้อ้มลู Panel แทนที่ขอ้มลู 2ประเภท ขำ้งตน้เทำ่นัน้เอง ดงันัน้เรำเลยตัง้ช่ือวำ่
• Panel regression
2
ทบทวน : 1. ลกัษณะภาคตดัขวาง(cross section)
• เป็นขอ้มลูทีเ่กบ็จากหน่วยตวัอยา่ง (entities) หรอื ปัจเจกบุคคล (individuals)ทีแ่ตกต่างหรอืเป็นอสิระต่อกนั ณ จุดเวลาใดเวลาหนึ่ง เช่น
3
ทบทวน : 2. ลกัษณะรวมภาคตดัขวาง(Pooled cross section) • ข้อมูลรวมภาคตดัขวาง (Pooled cross-sectional data) คอื ขอ้มลูทีม่ีลกัษณะเป็นทัง้ภาคตดัขวาง (Cross section) และอนุกรมเวลา (Time series)กล่าวคอื เป็นการรวบรวมขอ้มลูจากหน่วยตวัอยา่งทีเ่ป็นอสิระจากกนั และเกบ็ขอ้มลูในจุดเวลาทีต่่างกนั (รวมหลายๆ Cross sectional data เขา้ดว้ยกนั)
• ขอ้สงัเกต หน่วยตวัอย่างจะตอ้งแตกต่างกนัในแต่ละจดุเวลา
4
5
ข้อมูลจาก 100 หลัง ในปี 2000
ข้อมูลจากอีก 2 หลังใหม่ ในปี 2010
• หน่วยตวัอย่างตอ้งถกูเลอืกแบบสุม่• บา้นทัง้ 102 ถูกเกบ็ขอ้มลูครัง้เดยีว (ปีทีเ่กบ็อาจต่างกนั) โดยในปี 2000 มีจ านวน100 หน่วยตวัอย่าง และในปี 2010 มี 2 หน่วยตวัอย่าง
ทบทวน : 2. ลกัษณะรวมภาคตดัขวาง(Pooled cross section)
• การเลือกใช้ข้อมูลรวมภาคตัดขวางมีวัตถุประสงค์ท่ีส าคัญคือ เพื่อเพิ่มขนาดของตัวอย่าง โดยมีข้อสมมติว่าตัวแปรต้นและตัวแปรตามมีความสมัพันธ์ที่คงที่ในระยะยาว
• โดยทั่วไปแล้วการวิเคราะห์ข้อมูลรวมภาคตัดขวาง จะแก้ปัญหาเรื่องเวลาท่ีแตกต่างกันภายในชุดข้อมูลโดยก าหนดให้ “เวลา” เป็นตัวแปรหุ่น และเพิ่มตัวแปรหุ่นเวลา (time dummy) เข้าในแบบจ าลอง
6
ทบทวน : 2. ลกัษณะรวมภาคตดัขวาง(Pooled cross section)
• คือ ข้อมูลท่ีเก็บจากหน่วยตัวอย่าง i ในช่วงเวลาต่างๆ ท าให้ข้อมูลแต่ละช่วงเวลาไม่เป็นอิสระต่อกัน
• ข้อมูลนี้เป็นการติดตามบุคคล ครัวเรือน หน่วยธุรกิจ จังหวัด ประเทศ ในช่วงเวลาต่าง ๆ โดยเชื่อว่าจะมีพฤติกรรมที่เปลี่ยนแปลงไปเมื่อเวลาเปลีย่นไป
• เช่น - ข้อมูลค่าจ้างของบุคคลคนเดียวกันในปี 2552 และ 2553- ผลประกอบการของบริษัทในปี 2010 และ 2013 เป็นต้น
• เชื่อว่าลักษณะเฉพาะของแต่ละหน่วยข้อมูล หรือ ความแตกต่างระดับปัจเจกบุคคล (Individual) จะมีผลต่อตัวแปรที่สนใจศึกษา แต่ไม่สามารถสังเกตได้ (Unobservable factors)
7
ทบทวน : 3. ลกัษณะพาแนล (Panel data หรือlongitudinal data)
8
• ขอ้มลูของ 3 ประเทศ (i=3) ตัง้แต่ปี 2000 ถงึ 2002 (t=3)
• จ านวนค่าสงัเกต (Observation):𝑛 = 𝑖 × 𝑡 โดย i=1,…,I ,
t=1,…,Tดงันัน้ กรณนีี้ n=9
• หน่วยตวัอย่างตอ้งถูกเลอืกแบบสุ่ม
• แต่ละประเทศถูกตดิตามเกบ็ขอ้มลู 3 ครัง้ คอืในปี 2000, 2001 และ2002
• สมมติว่าเก็บข้อมูลจาก 30 หน่วย และช่วงเวลา 7 ปี น่ันคือ i=30 และ t=7 ดังน้ัน จ านวน Observation จะเท่ากับ 210 หน่วย
• ข้อมูลท่ีมีค่าสังเกตครบท้ัง 210 หน่วย เรียกว่า ข้อมูลช่วงยาวท่ีสมดุล (Balanced panel)
• หากมีค่าสังเกตบางค่าหายไป ไม่ครบ 210 หน่วย (ข้อมูลไม่ครบทุกปี) เรียกว่า ข้อมูลช่วงยาวที่ไม่สมดุล (Unbalanced panel)
9
ทบทวน : 3. ลกัษณะพาแนล (Panel data หรือlongitudinal data)
• ประโยชน์ของ Panel data คือ สามารถสะท้อนการเปลี่ยนแปลงพฤติกรรมของแต่ละหน่วยตัวอย่างเมื่อเวลาเปลี่ยนแปลงไปได้
• โดยพฤติกรรมที่เปลี่ยนแปลง อาจเกิดจากปัจจัยที่ไม่สามารถสงัเกตได้ เช่น วัฒนธรรม ความสามารถของบุคคล วิธีการด าเนินงานของธุรกิจ เป็นต้น รวมถึงปัจจัยอื่นๆ ท่ีเปลี่ยนแปลงไปตลอดเวลา และมีส่วนท าให้ค่าของตัวแปรตาม หรือตัวแปรที่เราสนใจศึกษา เปลี่ยนแปลงไป
• ข้อจ ากัดของ Panel data คือ การจัดเก็บข้อมูลที่ท าได้ยาก โดยเฉพาะ macro panels เช่น ข้อมูลของแต่ละประเทศในกลุ่มใดกลุ่มหนึง่ เป็นต้น ซึ่งต้องมีจ านวนเท่ากัน
10
ทบทวน : 3. ลกัษณะพาแนล (Panel data หรือlongitudinal data)
11
จากตัวอย่างข้อมูล Panel คือมี 3 ประเทศ เก็บข้อมูล 2000-2002 (3ปี) เราสามารถน ามาสร้างแบบจ าลองถดถอยได้เป็น
โดยที่ 𝛼𝑖 แทน individual fixed effect𝛿𝑡 แทน time fixed effect
𝑌𝑖𝑡 = 𝛽1𝑋1𝑖𝑡 + 𝛽2𝑋2𝑖𝑡 + 𝛽3𝑋3𝑖𝑡 + 𝛼𝑖 + 𝛿𝑡 + 𝑢𝑖𝑡
การวิเคราะห์ข้อมูล Panel
• ข้อมูลPanel หมายถึง ข้อมูล i หน่วย ที่สังเกตได้ใน T ช่วงเวลา ดังนั้นการแสดงข้อมูลช่วงยาวจึงท าได้ ดังน้ี
Xit, Yit โดยที่ i = 1,…,I และ t = 1,…,T
• ในหัวบทนี้จะกล่าวถึงวิธีการวิเคราะห์ Panel data regression 2 วิธี ได้แก่ • Fixed effect• Random effect
12
Fixed effects
ตัวอย่าง อุบัติเหตุในท้องถนนกับภาษีแอลกอฮอล์
• เนื่องจากอุบัติเหตุในท้องถนนส่วนใหญ่เกิดจากการดืม่เครือ่งดื่มที่มีแอลกอฮอล์ ดังน้ัน รัฐบาลสหรัฐฯ จึงออกนโยบายที่จะลดอุปสงค์การดื่มแอลกอฮอล์ลง
• สมมติว่ารัฐบาลสนใจศึกษาอัตราการตายจากอุบัติเหตุการจราจรต่อประชากร 10,000 คน ในแต่ละรัฐ และใช้ภาษีเบียร์เป็นเครือ่งมือของนโยบายรัฐบาล
ก าหนดให้ตัวแปร คือo FR (Fatality rate) คือ อัตราการตายจากอุบัติเหตุการจราจรต่อประชากร 10,000 คน
o Beer tax คือ ภาษีเบียร์ (USD per case $1988)
13
• สมมติว่าท าการศึกษาใน 2 ช่วงเวลาคือ ปี 1982 และปี 1988 หากน าข้อมูลแต่ละปี มาท าการประมาณสมการถดถอยจะพบว่า
• ในปี 1982 อัตราการตายเท่ากับFR = 2.01 + 0.15BeerTax
(0.15) (0.13)
• ในปี 1988 อตัรำกำรตำยเทำ่กบัFR = 1.86 + 0.44BeerTax
(0.11) (0.13)
14
Fixed effects
15
รูปที่ 7.1 อตัรำกำรตำยบนทอ้งถนนและภำษีเบียรใ์นปี 1982 และปี 1988
ปี 1982
Fixed effects
16
ปี 1988Fixed effects
• ท้ังสองสมการแสดงให้เห็นว่า การเพิ่มภาษีท าให้อัตราการตายเพิ่มขึ้น
• สาเหตุของ “ผลบวก” เพราะมีการละเลยตัวแปรที่ส าคัญบางตัวไป
เนื่องจากอัตราการตายจากอุบัติเหตุบนท้องถนน ได้รับอิทธิพลจากหลายปัจจัย เช่น คุณภาพรถยนต์ท่ีใช้ในแต่ละรัฐ ลักษณะถนนของแต่ละรัฐ กฎหมายที่เกี่ยวกับการขับรถยนต์และการดื่มแอลกอฮอล์ หรือลักษณะทางสังคมและวัฒนธรรมของแต่ละรัฐ เป็นต้น
• วิธีการแก้ปัญหา => เพิ่มตัวแปรลงไปในแบบจ าลอง
แต่อย่างไรก็ตาม ตัวแปรบางตัวไม่สามารถสังเกตหรือวัดได้ เช่น ลักษณะทางสังคมและวัฒนธรรมของแต่ละรัฐ
• แต่ถ้าปัจจัยท่ีสังเกตไม่ได้น้ัน มีลักษณะคงที่ตลอดช่วงเวลาท่ีศึกษา เช่น วัฒนธรรมไม่เปลี่ยน ก็จะสามารถแก้ปัญหาน้ีได้โดย
1. การท า Differencing (Difference-in-Difference) (ประมาณด้วย OLS)2. การประมาณสมการถดถอย ที่มี Fixed effects (ประมาณด้วย OLS)
17
Fixed effects
1. การท า Differencing (Difference-in-Difference)
• สมมติให้ Zi เป็นตัวแปรอิสระที่มีผลต่ออัตราการตายของรัฐ i แต่ไม่เปลี่ยนแปลงตามเวลา เช่น ค่านิยมทางวัฒนธรรมและสังคม
• แบบจ าลองความสัมพันธ์ระหว่างอัตราการตายและตัวแปรอิสระต่างๆ จะเป็น
FRit = β0 + β1BeerTaxit + β2Zi + uit
• ดังนั้น แบบจ าลองส าหรับท้ัง 2 ปี (t=2; 1982 และ 1988) จะได้ว่าFRi82 = β0 + β1BeerTaxi82 + β2Zi + ui82FRi88 = β0 + β1BeerTaxi88 + β2Zi + ui88
เศรษฐมิติ I 751703 18
Fixed effects
• น าท้ังสองสมการมาลบกัน (ตามวิธี Difference-in-Difference) ได้เป็น
FRi88 − FRi82 = β0 − β0 + β1 BeerTaxi88 − BeerTaxi82 + ui88 − ui82
วธีิน้ีจ ำท ำให ้Zi และ β0 หำยไป เน่ืองจำกเป็นค่ำคงท่ี มีค่ำเท่ำเดิมในแต่ละปี
• สมมุติ ผลการประมาณที่ประมาณได้จากผลต่างของอัตราการตายและผลต่างของภาษีเบียร์ คือ
∆FR = −1.04∆BeerTax
19
-1.04 หมายถึง การเปลี่ยนแปลงภาษีเบียร์จะส่งผลกระทบต่ออัตราการตาย โดยการเพิ่มขึ้นของภาษี 1 USD จะท าให้อัตราการตายลดลง 1.04 คนต่อประชากร 10,000 คน
Fixed effects
20
การเปลี่ยนแปลงอัตราการตายและภาษีเบียรป์ี 1982-1988
Fixed effects
• วิธี Difference-in-Difference เหมาะส าหรับข้อมูลที่มี 2 ช่วงเวลา แต่ในกรณีที่ข้อมูลช่วงยาวมีมากกว่า 2 ช่วงเวลา จะใช้วิธีกการประมาณสมการถดถอยที่มี Fixed effects หรือ Fixed effect regression
• ให้ Zi เป็นตัวแปรที่มีค่าแตกต่างไปตามหน่วย (entities) หรือปัจเจกบุคคล (Individuals) แต่ไม่เปลี่ยนแปลงตามเวลา เช่น วัฒนธรรม ค่านิยม
• แนวคิดของแบบจ าลองนี้ คือ แบบจ าลองจะมีค่า intercept เท่ากับจ านวนหน่วย (i) ซึ่งค่า intercept จะรวมเอาอิทธิพลของ Zi เอาไว้
21
2. Fixed effects (FE) Regression modelFixed effects
• แบบจ าลองของสมการถดถอยท่ีมี Fixed effects สามารถแสดงได้ดังนี้
Yit = β0 + β1Xit + β2Zit + uit
โดย Yit คือ อัตราการตายจากอุบัติเหตุ Xit คือ ภาษีเบียร์ Zit คือ ตัวแปรที่ไม่สามารถสังเกตค่าได้ แต่ไม่เปลี่ยนแปลงไปตามเวลา ในที่น้ี ก าหนดให้เป็น ค่านิยมทางสังคมและวัฒนธรรม𝑖 คือ รัฐในสหรัฐอเมริกา (𝑖 = 1,2, … , 48)t คือ ปี ตั้งแต่ปี 1982-1988 (รวม 7 ปี)ดังนั้น จ านวน Observation (n) เท่ากับ (48)(7) = 336 หน่วย
22
Fixed effects
• การประมาณค่าสัมประสทิธิ์ β1 มีวัตถุประสงค์เพื่อให้ทราบอิทธิพลของตัวแปร X ที่มีต่อตัวแปร Y ก าหนดให้สิ่งอ่ืน ๆ คงท่ี รวมทั้งตัวแปรที่ไม่สามารถสังเกตได้ (Z)
• สมมุติแต่ละรัฐมีความแตกต่างกัน และ ถูกสมมุติให้ไม่มีผล ดังนั้น เราจะค านึงเฉพาะความแตกต่างของแต่ละรัฐใน Z ดังน้ันเราจะเรียกแบบจ าลองนี้ว่า Individual Fixed effect regression และสามารถเขียนใหม่ได้เป็น
Yit = β1Xit + αi + uit
• โดยที่ αi = β0 + β2Zi
oพจน์ αi ท าหน้าท่ีเป็น intercept ของแต่ละรัฐ (แต่ละหน่วยท่ีท าการศึกษา) ซึ่งจะมีค่าแตกต่างกันไปในแต่ละรฐัแต่จะไม่เปลี่ยนแปลงไปตามเวลา
oดังน้ัน พจน์ αi จึงถูกเรียกว่า Entity fixed effects หรือ Individual fixed effects
23
Fixed effects
• ในทางปฏิบัติ การประมาณสมการถดถอยที่มี Fixed effects ท าได้ 2 วิธี
1. ก าหนดตัวแปรหุ่น ส าหรับแต่ละหน่วย (Entity dummy)
2. วิธี Demean
เศรษฐมิติ I 751703 24
Fixed effects
1. Entity dummy • การก าหนดตัวแปรหุ่นส าหรับแต่ละหน่วย จะมีจ านวนตัวแปรหุ่นเท่ากับ i-1 เช่น
ท าการศึกษาใน 48 รัฐ (i=1,2,…,48) ดังน้ัน จ านวนตัวแปรหุ่น (D) เท่ากับ 47 ตัวแปร เป็นต้น
• แบบจ าลองส าหรับ Individual Fixed effect regression จึงเป็น
Yit = β0 + β1Xit + γ2D2i + γ3D3i +⋯+ γID𝐼i + uit
• เมื่อ Yit คือ อัตราการตายจากอุบัติเหตุ (i = entity and t = time)Xit คือ ภาษีเบียร์𝛽𝑘 คือ ค่าสัมประสิทธิ์, (k=0,1)uit คือ error termDI คือ ตัวแปรหุ่น (binary dummies) มีจ านวนเท่ากับ i-1 entities𝛾𝐼 คือ ค่าสัมประสิทธิ์ของ dummies
25
Fixed effects
• การประมาณสมการถดถอยที่มี Fixed effects ยังคงอิงกับหลักการของ OLS ที่มีตัวแปรหุ่นหลายตัว
• แต่ในทางปฏิบัติ การที่จ านวนหน่วยตัวอย่าง (entities) มีมากจะท าให้การประมวลผลมีความยุง่ยาก และอาจเกิดปัญหา Over-parameter
26
Fixed effects
2. วิธี Demean
วิธีนี้ใช้หลักการการ Transform ข้อมูล Y และ X ใหม่ เพื่อขจัด Fixed effect ออกไป ซึ่งท าได้ดังนี้
จากแบบจ าลอง Individal Fixed effect regression
Yit = β1Xit + αi + uit
ขั้นแรก ค านวณค่าเฉลี่ยของตัวแปรทุกตัวส าหรบัแต่ละหน่วย เช่นค่าเฉลี่ยแต่ละปี ของ entity i เราจะได้ ഥYi และ ഥXiขั้นสอง น าค่าเฉลี่ยไปลบออกจากค่าจริง (entity-demeaned) ได้เป็น
Yit − ഥYi ⇒ ෩Yit และ Xit − ഥXi ⇒ ෩Xit
27
Fixed effects
• แบบจ าลอง Fixed effect regression ใหม่ท่ีท าการ Demean แล้ว จะได้เป็น
෩Yit = β1෩Xit + uit
• เมื่อประมาณสมการข้างต้นด้วยวิธี OLS ค่า intercept ท่ีได้จะมีค่าเข้าใกล้ 0 นั่นคือ อิทธิพลของ fixed effect ถูกขจัดออกไปแล้ว
เศรษฐมิติ I 751703 28
Fixed effects
การใช้ Fixed effects regression กับตัวอย่างการตายจากอุบัติเหตุ
• ท าการศึกษา 7 ปี (ปี 1982-1988) วิธีการ Differencing หรือวิธี Before and After ท าให้ต้องเสียข้อมูลตรงกลางไป 5 ปี (ปี 1983-1987) เนื่องจากต้องเลือกใช้เฉพาะข้อมูลของปีแรกและปีสุดท้าย
• แต่วิธีการ Individual Fixed effects regression จะเป็นวิธีท่ีใช้ประโยชน์จากข้อมูลทุกปี ดังน้ัน จ านวนค่าสังเกตท้ังหมดจึงเท่ากับ (48)(7)=336 ค่า
• โดยสมการท่ีประมาณได้คือFRit = −0.66BeerTax + StateFixedEffects
✓ผลของภาษีเบียร์ที่มีต่ออัตราการตายเป็นลบ (เช่นเดียวกับวิธี Differencing) ✓ค่าสัมประสิทธิ์ท่ีได้จากสองวิธีน้ีไม่เท่ากัน เนื่องจากข้อมูลท่ีใช้ในการประมวลผลต่างกัน ✓วิธี Fixed effects regression ให้ค่า Standard error ต่ ากว่า
เศรษฐมิติ I 751703 29
Fixed effects
Time fixed effects Panel regression
• การศึกษาข้อมูล Panel มักมีการตั้งข้อสังเกตว่า ตัวแปรตามอาจมีการเปลี่ยนแปลงไปตามระยะเวลา โดยเป็นอิทธิพลมากจากตัวแปรอิสระที่เปลี่ยนแปลงไปตามเวลาแตม่ีผลต่อทุกหน่วยตวัอย่างเท่าๆ กัน จึงเรียกผลนี้ว่า Time fixed effects
• เช่น ให้อัตราการตายจากอุบัติเหตุบนท้องถนนเป็นตัวแปรตาม ซึ่งถูกกระทบด้วยตัวแปรอิสระที่มีการเปลี่ยนแปลงตามเวลาและเป็น unobserved variables เช่น การพัฒนาระบบความปลอดภัยของยานพาหนะ ท าให้รถยนต์มีคุณภาพดีขึ้น อัตราการตายจากอุบัติเหตุจึงลดลงเมื่อเวลาผา่นไป
• โดย ณ ช่วงเวลาเดียวกัน การพัฒนาระบบความปลอดภัยของรถยนต์น่าจะเท่าเทียมกันในทุกรัฐ
เศรษฐมิติ I 751703 30
Fixed effects
• ดังนั้น แบบจ าลอง Individual and Time Fixed effect regression จึงถูกปรับปรุงเป็น
Yit = β0 + β1Xit + β2Zi + β3St + uit
โดย St คือ ตัวแปรความปลอดภัย ท่ีเปลี่ยนแปลงไปตามเวลา แต่คงท่ีส าหรับแต่ละรัฐ
• ใชต้วัแปรหุน่เวลำ (Time dummy: T) แทนตวัแปรควำมปลอดภยั ซึง่ใชห้ลกักำรเดียวกนักบัตวัแปรหุน่ของหนว่ยตวัอยำ่ง (Entity dummy) เรยีกตวัแปรหุน่เวลำนีว้ำ่ Time fixed effects
Yit = β0 + β1Xit + γ2D2 + γ3D3 +⋯+ γIDI + 𝛿2T2 +⋯+ 𝛿TTT + uit
โดย i=1,…,I , t=1,…,T
31
Fixed effects
Individual effect Time effect
• แบบจ าลอง Individual and Time Fixed effect regression สามารถเขียนใหม่ได้เป็น
Yit = β1Xit + αi + λt + uit
โดยก าหนดให้ oαi เป็นค่า intercept ของแต่ละหน่วยที่ศึกษา (Entity fixed effects หรือ
Individual fixed effects) และ o λt เป็นค่า intercept ของแต่ช่วงเวลา (Time fixed effects)
• การรวม Entity fixed effect และ Time fixed effect จะท าให้แบบจ าลองก าจัดความเอนเอียงอันเนื่องมาจากการละเลยตัวแปรท่ีไม่สามารถสังเกตได้
• วิธีการประมาณแบบจ าลองที่มีท้ัง Entity fixed effect และ Time fixed effect ในทางปฏิบัติท าได้โดยการประมาณ Demean แล้วเพิ่มตัวแปรหุ่นเวลาในแบบจ าลอง
• ในกรณี Demean จะต้องหาค่าเฉลี่ยของ entity ในแต่ละปี ഥYt และ ഥXt จากนั้น
Yit − ഥYt ⇒ ෩Yit และ Xit − ഥXt ⇒ ෩Xit
Fixed effects
ตัวอย่างการใช้ Individual fixed effects และ Time fixed effects กับตัวอย่างการตายจากอุบัติเหตุบนท้องถนน
• เมื่อเพ่ิมตัวแปรหุ่นเวลาแลว้ สมการที่ประมาณไดค้ือ
FRit = −0.64BeerTax + StateFixedEffects + TimeFixedEffects
33
Fixed effects
ข้อสมมติของการใช้ Fixed effect regression
34
ข้อสมมติท่ีส าคัญของการประมาณสมการถดถอยที่มี Fixed Effects มีดังนี้ข้อสมมติที่ 1
ในแบบจ าลองประชากร X และ Y มีความสัมพันธ์เชิงเส้น (linear in parameters)Yit = β1Xit1 + β2Xit2 +⋯+ βkXitk + αi + uit
ข้อสมมติที่ 2มีตัวอย่างท่ีเกิดจากการสุ่ม (Random Sample) ในมิติของภาคตัดขวาง
ข้อสมมติที่ 3error term เป็นอิสระจาก x (zero unconditional mean)
E uit|Xit, αi = 0
Fixed effects
35
ข้อสมมติที่ 4ตัวแปรอิสระที่เปลี่ยนแปลงไปตามเวลาไม่มีความสมัพันธ์เชิงเสน้กันอย่าง
สมบูรณ์ (no perfect multicollinearity) ระหว่างกัน
ข้อสมมติที่ 5Var uit|Xi, αi = Var uit = σu
2 ส าหรับ t = 1,2,...,T
ข้อสมมติท่ี 6Cov uit, uis|Xi, αi = 0 ส าหรับ t ≠ s
ข้อสมมติท่ี 7uit~iidN 0, σu
2 ส าหรับ t ≠ s
Fixed effects
ตัวอย่างการศึกษาผลของภาษีเบียร์ต่อการเสียชีวิตจากอุบัติเหตุบนท้องถนน
36
ตัวแปรตาม: อัตราการตายจากอุบัติเหตุบนท้องถนนต่อประชากร 10,000 คน
Fixed effects
เศรษฐมิติ I 751703 37
Fixed effects
Random Effect Model
• แนวคิดหลักของ Random effects model คือ ความแตกต่างระหว่างหน่วยตัวอย่าง (เช่น รัฐ) จะต้อง random และไม่มีความสัมพันธ์กับตวัแปรอิสระ (X) ท่ีใส่ในแบบจ าลอง
• Random effects model มีลักษณะ ดังนี้
Yit = 𝛽Xit + αi + uit + 휀𝑖𝑡
38
Within-entity error
Between-entity error
Random effects
• ประโยชน์ของ Random effects คือ เราสามารถประมาณผลของตัวแปรที่ไม่เปลี่ยนแปลงตามเวลาแต่มีอิทธิพลต่อ Y ได้ เช่น เพศ เป็นต้น
• แต่ใน Fixed effects model อิทธิพลจากตัวแปรเหล่านี้ท่ีมีต่อ Y จะถูกรวมอยู่ใน intercept term และเมื่อประมาณแล้วจะมีค่าเท่ากับ 0
39
Random effects
Fixed Effect หรือ Random Effect ?
• ใช้ Hausman test ในการตัดสินว่าจะใช้ fixed effect หรือ random effect
• แนวคิดหลักของ Hausman test คือการทดสอบว่า uit (individual effect) มีความสัมพันธ์กับตัวแปรอธิบาย (regressor, X) หรือไม่
• ถ้า individual effects มีความสัมพันธ์กับตัวแปรอธิบายในแบบจ าลอง ->FE model is consistent และ RE model is inconsistent.
• ถ้า individual effects ไม่มีความสัมพันธ์กับตัวแปรอธิบายในแบบจ าลอง ->FE and RE models are consistent และ RE is efficient.
40
• กรณีท่ี individual effect และ regressors ไม่มีความสัมพันธ์กัน ทั้งแบบจ าลอง FE และ RE จะ consistent นั่นคือ ค่า መ𝛽 ท่ีประมาณได้จากทั้งสองแบบจ าลองควรมีค่าใกล้เคียงกัน ไม่ควรแตกต่างกัน
• แต่ถ้าค่าที่ประมาณได้จากสองแบบจ าลองมีความแตกตา่งกัน แสดงว่า RE isinefficient. ดังน้ัน ไม่ควรใช้ RE model
41
Fixed Effect หรือ Random Effect ?
Hausman test
• แนวคิดของ Hausman test จึงเกี่ยวข้องกับ distance หรือความห่างระหว่างค่า መ𝛽 ท่ีประมาณได้จากทั้งสองแบบจ าลอง หรือ ( መ𝛽𝑅𝐸− መ𝛽𝐹𝐸) และ
Covariance ระหว่าง พารามิเตอร์ 2 ตัวนี้
• สมมติฐานของการทดสอบ คือสมมติฐานหลัก (Null hypothesis)
H0 : No difference between estimators (ใช้ Random effect ได้)สมมติฐานรอง (Alternative hypothesis)
Ha : H0 is not true (ไม่ควรใช้ Random effect)
42
• โดยมีสถิติทดสอบ คือ
𝑊 = ( መ𝛽𝑅𝐸− መ𝛽𝐹𝐸)′ Σ−1 ( መ𝛽𝑅𝐸− መ𝛽𝐹𝐸)~𝜒
2(𝑘)
• ถ้า W มีนัยส าคัญทางสถิติ ดังน้ัน เราจะปฎิเสธ H0 และเราไม่ควรใช้ RE model
43
Hausman test
Programming
• Rcode
• Stata
R code: Panel regression
library(plm)
#Step 1 Import Data
data=read.csv(file.choose(),head=TRUE)
#Step 2 Convert file to be Panel data
panel <- pdata.frame(data,c("id","year"))
#Step 3 Run Panel regression (Fixed effect)
# 3.1 (First Difference)
fd<- plm( y ~ x1 + x2, model = "fd", data=panel)
summary(fd)
# 3.2 (Fixed effect)
fe <- plm( y ~ x1 + x2, model = "within", data=panel)
summary(fe)
# 3.3 (Random effect)
re <- plm( y ~ x1 + x2, model = "random", data=panel)
summary(re)# 3.4 (Pooling OLS ปกต)ิpool <- plm( y ~ x1 + x2, model = "pool", data=panel)
summary(pool) 45
R code: Hausman Test
# Hausman Test (Compare only Random and Fixed )
phtest(fe, re)
46
ผลการทดสอบHausman Testdata: y ~ x1 + x2chisq = 31.267, df = 2, p-value = 1.623e-07alternative hypothesis: one model is inconsistent
จำกผลกำรทดสอบ เรำจะพบวำ่ Hausman Test มีนยัส ำคญัทำงสถิติ ดงันัน้เรำตอ้งปฎิเสธ H0 และยอมรบั Ha
H0 : No difference between estimators (ใช้ Random effect ได)้Ha : H0 is not true (ไม่ควรใช้ Random effect)
STATA
• ส ำหรบัโปรแกรมตวันีเ้ป็น ที่นิยมในกำรท ำ Panel อยำ่งมำกในปัจจบุนัและมีกำรทดสอบท่ีคอ่นขำ้งครบถว้นกวำ่ เมื่อเทียบกบั Eview ดงันัน้ เรำจึงสำมำรถใชโ้ปรแกรม STATA ในกำรประมำณกำร Panel Regression
• ในบทท่ี 5 นีเ้รำจะท ำกำรประมำณดงันี ้
5.1 กำรน ำขอ้มลูเขำ้และ set up ขอ้มลู
5.2 กำรประมำณแบบจ ำลอง Fixed effects
5.2 กำรประมำณแบบจ ำลอง Random effects
5.4 Hausman Test
47
STATA: STEP 1 น ำขอ้มูลเขำ้
48
Click
STATA: STEP 1 น ำขอ้มูลเขำ้
49
1) จะปรำกฏหนำ้ต่ำงลงขอ้มลูออกมำคลำ้ยกบั Excel → ให ้copy ขอ้มลูจำก file excel ลงมำวำงในนี้2) Copy→ Paste ใหเ้ลือก Treat first rows as variable name3) ขอ้มลูจะปรำกฎดงัภำพ
STATA: STEP 1 Set up ขอ้มูลใหอ้ยูใ่นรูป Panel
50
Click
STATA: STEP 1 Set up ขอ้มูลใหอ้ยูใ่นรูป Panel
51
เลอืก column ที่แสดง idเลอืก column ที่แสดง Time(year)
Tick ควำมถี่ขอ้มลู
STATA: STEP 1 น ำขอ้มูลเขำ้
52
เลอืก
Click OK
53
STATA: STEP 1 SET UP เสร็จส้ิน
STATA: STEP 2 Run Fixed effects
54
Click
Click
STATA: STEP 2 Run Fixed effects
55
ตวัแปรตำม
Click
ตวัแปรตน้
1 1 2 2it i ity x x = + + +
OK
0 1 1 2 2it i ity x x = + + + +
STATA: Fixed effects results
56
STATA: STEP 3 Run Random effectsท ำเหมือน Fixed effects แต่ขั้นตอนสุดทำ้ย คือดงัน้ี
57
Clickตวัแปรตำม
Click
ตวัแปรตน้
OK
0 1 1 2 2it i ity x x = + + + +
STATA: Random effects results
58***ในบำงกรณีผลออกไมห่มด ใหน้กัศกึษำ click more
STATA: Hausman Test (Stata Code)
59
xtreg y x1 x2, feestimates store fixedxtreg y x1 x2, rehausman random ., constant equations(1:1) df(1)
Command
STATA: Hausman Test Result
60
Pvalue=1.000 , ยอมรบั H0
เพิม่เตมิ Panel Unit root test
61
R-code : Check Unit root test
rm(list=ls(all=TRUE))
library("plm")
#Step 1 Import Data
data=read.csv(file.choose(),head=TRUE)
#Step 2 Convert file to be Panel data
panel <- pdata.frame(data,c("id","year"))
#Step 3 Get each variable
y <- data.frame(split(panel$y, panel$id))
x1 <- data.frame(split(panel$x1, panel$id))
x2 <- data.frame(split(panel$x2, panel$id))
LLC <- purtest(x2,test = "hadri",exo ="intercept", lags = "AIC", pmax = 0)
LLC
62
# ตวัอยา่งผลการประมาณHadri Test (ex. var.: Individual Intercepts) (Heterosked. Consistent)data: yz = -0.1723, p-value = 0.5684alternative hypothesis: at least one series has a unit root
ยอมรบั H0 ดงันัน้ตวัแปร Y ของเรำเลยนิ่ง
STATA: check unit root test
63
Click
Click
STATA: check unit root test
64
Levin Lin and Chu Unit root test
ตวัแปรTick
Ok
ผลกำรทดสอบ Panel unit root test กรณี y
เศรษฐมิติ I 751703 65
ยอมรบั H0 ดงันัน้ตวัแปรของเรำเลยไม่นิ่ง
Assignment 5
1. Panel regression และ Time series regression เหมือนหรอืแตกตำ่งกนัอยำ่งไร
2. จงยกตวัอยำ่งปัญหำงำนวิจยัที่ตอ้งใชแ้บบจ ำลอง Panel regression
3. จงอธิบำยควำมแตกตำ่งระหวำ่ง Fixed และ Random effects
4. individual effect สมัพนัธก์บัตวัแปร X ไดห้รอืไม ่ถำ้ไมไ่ดเ้รำควรท ำอยำ่งไร หรอืถำ้ไดเ้รำจะประมำณ Panel regression ไดห้รอืไม่
66
Assignment 5 Program
จงใชข้อ้มลูจำก ไฟล ์DATA5.csv
1) เช็ค Unit root ทกุตวัแปร2) ประมำณแบบจ ำลอง Fixed effects
3) ประมำณแบบจ ำลอง Random effects
4) เรำควรใชแ้บบจ ำลองใดเพื่อไปแปลผลกำรศกึษำตอ่ไป จงพิสจูน์
67