Post on 27-Nov-2014
บทน ำ - 1
515 201 สถตพนฐาน 1 (Elementary Statistics I)
บทท 1 บทน า
ความหมายของสถต (Statistics) : 2 ความหมาย เชงทวไป : ขอมลทเปนตวเลขใชแทนขอเทจจรงตาง ๆ เชงศาสตร : ระเบยบวธการทางวทยาศาสตรเกยวกบขอมล ไดแก เกบรวบรวมขอมล สถตพรรณนา น าเสนอขอมล (Descriptive Statistics) วเคราะหขอมล สถตอนมาน ตความหมาย + สรปผล (Inferential Statistics)
บทน ำ - 2
ค าศพททเกยวของ ประชากร (Population) : เซตของสงทมลกษณะทเราสนใจศกษา
- ประกอบดวยหนวย และ/หรอ สงของทงหมดทมลกษณะทสนใจศกษา ซงไมไดหมายถง เฉพาะคน เทานน อาจเปน สตว หรอ สงของ ฯลฯ ทผท าการศกษาสนใจ กได
- สงของแตละหนวยทมลกษณะทสนใจศกษาเรยกวา หนวยสงเกต (Observational Unit) หรอ หนวยตวอยาง (Sampling Unit) หรอ หนวยทดลอง (Experimental Unit) - มกจะประกอบดวยหนวยทตองท าการสงเกตจ านวนมาก ยากแกการเกบขอมล จงมการ เลอกเพยงบางหนวยมาศกษา กลมของหนวยทถกเลอก เรยกวา “ตวอยาง” ตวอยาง (Sample) : เซตของสงทเลอกมาจากบางสวนจากประชากร - การเกบรวบรวมขอมลจากหนวยของประชากรเพยงบางหนวย เรยก การส ารวจ (Survey) หรอ การสมตวอยาง (Sampling) - แตถาเกบรวบรวมขอมลจากทกหนวยของประชากรเรยก การส ามะโน (Census)
บทน ำ - 3
พารามเตอร (Parameter) : คาวดเชงตวเลขซงใชอธบายลกษณะของประชากรโดยค านวณจากขอมลทเกบจากหนวยของประชากร ตวสถต (Statistics) : คาวดเชงตวเลขซงใชอธบายลกษณะของตวอยาง โดยค านวณจากขอมลทเกบจากหนวยตวอยาง ซงถกเลอกจากประชากร จากความหมายของค าทง 4 ค าน สามารถสรปเปนแผนภาพไดดงน
ประชากร สมตวอยาง ตวอยาง ขนาด N ขนาด n
ลกษณะ ลกษณะ ประมาณคา
พารามเตอร ตวสถต อางอง
บทน ำ - 4
ตวอยาง 1 บรษทผลตแบตเตอรรถยนตบรษทหนง อางวาอายการใชงานของแบตเตอรมคาเฉลย 54 เดอน และ สวนเบยงเบนมาตรฐาน 6 เดอน ผซอสนคาตองการตรวจสอบค ากลาวขางตน โดยการซอแบตเตอร 25 ลกอยางสม จากขอมลอายการใชงานของแบตเตอร 25 ลกนได คาเฉลยอายการใชงานเปน 52 เดอน และสวนเบยงเบนมาตรฐานเปน 1.5 เดอน จงนยาม หนวยตวอยาง , ประชากร, พารามเตอร, ตวอยาง, ตวสถต วธท า หนวยตวอยาง : แบตเตอรรถยนต ประชากร : แบตเตอรรถยนตทผลตโดยบรษทน พารามเตอร : - คาเฉลยของอายการใชงานของแบตเตอรรถยนตทผลตโดยบรษทน = 54 เดอน - สวนเบยงเบนมาตรฐาน = 6 เดอน ตวอยาง : แบตเตอรรถยนตทซอมา 25 ลก ตวสถต :- คาเฉลยของอายการใชงานของแบตเตอรรถยนต 25 ลก = 52 เดอน - สวนเบยงเบนมาตรฐาน = 1.5 เดอน
บทน ำ - 5
ตวอยาง 2 ในการศกษาการเจรญเตบโตของทารก อาย 1 เดอนวามน าหนกเพมขนจากแรกคลอดอยในชวงใด ผท าการศกษาไดสมทารกจ านวน 100 คน ซงใหคาเฉลยเลขคณต และคาสวนเบยงเบนมาตรฐานของน าหนกทเพมขนจากแรกคลอดเปน 980 กรม และ 60 กรม ตามล าดบ จงนยาม หนวยตวอยาง , ประชากร , พารามเตอร , ตวอยาง , ตวสถต วธท า หนวยตวอยาง : ทารกอาย 1 เดอน แตละคน ประชากร : ทารกอาย 1 เดอน (ไมทราบจ านวน) พารามเตอร : - คาเฉลยเลขคณตของน าหนกทเพมขนจากแรกคลอด (ไมทราบคา) - สวนเบยงเบนมาตรฐานของน าหนกทเพมขนจากแรกคลอด (ไมทราบคา) ตวอยาง : ทารกอาย 1 เดอน จ านวน 100 คน ทสมมา ตวสถต : - คาเฉลยเลขคณตของน าหนกทเพมขนจากแรกคลอดของเดกทารกอาย 1 เดอน จ านวน 100 คน เทากบ 980 กรม - สวนเบยงเบนมาตรฐานของน าหนกทเพมขนจากแรกคลอดของเดกทารกอาย 1 เดอน จ านวน 100 คน เทากบ 60 กรม
บทน ำ - 6
ประเภทของสถต : 2 ประเภท 1. สถตพรรณนา (Descriptive Statistics) : วาดวย การเกบรวบรวมขอมล
- จากประชากร - จากตวอยาง จดระเบยบ + น าเสนอขอมล
- แผนภม , กราฟ , ตาราง - ตวเลข , คาสถตตาง ๆ
2. สถตอนมาน (Inferential Statistics) : วาดวยวธการทน าผลจากขอมลตวอยางไปใช ตดสนใจ , ประมาณคา หรอ สรปเกยวกบ ลกษณะของประชากร ด ตวอยาง 1.4 หนา 1-8 ในเอกสารประกอบการสอนบทท 1
บทน ำ - 7
ขอมล (data) และ ขอมลสถต (Statistics data) ขอมล : ขอเทจจรงซงไดจากหนวยตวอยาง ขอมลสถต : ประกอบดวย ขอมลหลายคาทแสดงขอเทจจรงในเรองเดยวกน ในขอบขายทพจารณา ตวแปร (Variable) : ลกษณะใด ๆ ของสงทสนใจศกษา และท าการสงเกต ประเภทของตวแปร : 2 ประเภท (แบงตามลกษณะของคาของตวแปร) 1. ตวแปรเชงคณภาพ (Qualitative Variable) หรอ ตวแปรเชงกลม (Categorical Variable) : ตวแปรทคาทเปนไปไดใชบอกลกษณะของการแบงเปนกลม หรอเปนประเภท ซงไมอาจวดเปนตวเลขได - ขอมลทถกรวบรวมส าหรบตวแปรเชงคณภาพแตละตวเรยกวา “ขอมลเชงคณภาพ (Qualitative data)” ตวอยาง 3 : ตวแปรเชงคณภาพ - สถานภาพของนกศกษาคณะวทยาศาสตร แบงเปน 5 กลม คอ ชนปท 1 , 2 , 3 , 4 , ปท 5 ขนไป - เพศ : ชาย , หญง - ทศนคต / ระดบความคดเหนทมตอเรองหนง ๆ
บทน ำ - 8
2. ตวแปรเชงปรมาณ (Quantitative Variable) หรอ ตวแปรเชงตวเลข (Numerical Variable) : ตวแปรทคาทเปนไปไดมคาเปนปรมาณทวดไดเปนคาตวเลข เชน รายได, สวนสง, น าหนก , อาย , ยอดขายสนคาตอเดอน ฯลฯ 2.1 ตวแปรไมตอเนอง (Discrete Variable) : ตวแปรทมคาทเปนไปไดเปนจ านวนเตม เชน - จ านวนรถทขายไดตอเดอน ของศนยรวมรถยนตแหงหนง - จ านวนเดกทมอายต ากวา 10 ป ในแตละครวเรอนของ ต าบลพระปฐมเจดย - จ านวนผเขามาใชบรการราน KFC ในชวงเวลา 11.30 – 13.00 น. ของทกวน 2.2 ตวแปรตอเนอง (Continuous Variable) : ตวแปรซงมคาทเปนไปไดเปนจ านวนจรง เชน ความสง, น าหนก, เวลาทใชในการท าแบบฝกหดวชาสถตพนฐานจนเสรจของนกศกษาชนปท 2 ตวอยาง 4 แสดงใหเหนถงความหมายของ หนวยสงเกต, ตวแปร, คาสงเกต ทไดจากขอมล ผลก าไรป 2009 ของ บรษททมชอเสยงจาก 6 ประเทศ
บทน ำ - 9
ตาราง แสดงผลก าไรป 2009 ของบรษททมชอเสยงจาก 6 ประเทศ บรษท ผลก าไร
(ลานเหรยญสหรฐ)
Exxon , United States 4,800 Toyota Motor , Japan 2,222 Daimler – Benz Germany 891 Guinness , Britain 818 Northern Telecom , Canada 548 Fiat Group , Italy 378
ตวแปร
คาสงเกต
หนวยสงเกต หรอ หนวยของประชากร
บทน ำ - 10
การวด (Measurement) : กระบวนการในการก าหนดคาใหกบหนวยทท าการสงเกตเพอใชแทนคณสมบตใดคณสมบตหนงของหนวยทท าการสงเกตนน รวมถง วธการเกบรวบรวมขอมล และกฎเกณฑทใชในการก าหนดคาทเหมาะสมใหกบคณสมบตนน ระดบของการวด : 4 ระดบ (เรยงจากหยาบถงละเอยด) 1. มาตรนามบญญต หรอ มาตราแบงกลม (Nominal Scale) แบงหนวยสงเกตออกเปน ประเภทหรอกลมยอย ตามคณสมบตใด คณสมบตหนง บอกไดแควา ขอมลตวหนงมคา เหมอนหรอตางกบขอมลอกตวหนงเทานน แต บอกไมไดวา ขอมลตวหนงมคามากกวา หรอนอยกวา ขอมลอกตวหนง - อาจก าหนดตวเลขเปนสญลกษณ แทนกลม เชน ให 1 แทน ชาย , 2 แทน หญง
บทน ำ - 11
2. มาตราอนดบ (Ordinal Scale)
มคณสมบตของการ แบงกลม + จดอนดบ สามารถจดอนดบของกลมทแบงไวตามเกณฑใดเกณฑหนง
ได แตไมสามารถบอกขนาดความแตกตางของกลม แตละกลมได ตวอยาง 5 ในการประเมนดานการสอนวชา 515 201 ผวจยไดให นกศกษาตอบแบบสอบถาม โดยมขอถามเกยวกบ ทศนคตของนกศกษาทมตอการจดใหม lab ในวชาน และใหนกศกษาเลอกตอบวาเหนดวย กบ เรองดงกลาว มากนอยเพยงใดซงระดบความคดเหนแบงเปน 5 ระดบ คอ เหนดวยมากทสด 5 เหนดวยมาก 4 เหนดวยปานกลาง 3 เหนดวยนอย 2 เหนดวยนอยทสด 1
บทน ำ - 12
ถานกศกษาเลอก 5 แสดงวา เหนดวยทจะใหม lab ส าหรบวชาน มากกวานกศกษาทเลอก 4 แตบอกไมไดวา กลมทเหนดวยมากทสดกบกลมทเหนดวยมาก จะมระดบแตกตางกนเทาไร 3. มาตราอนตรภาค (Interval Scale)
มคณสมบตของการแบงกลม + จดอนดบ + บอกขนาดความแตกตางระหวางกลม 2 กลมใด ๆ บอกไดแตขนาดความแตกตางระหวางกลมแต บอกไมไดวาเปนกเทา จดศนยทไดจากการวดไมใชจดศนยทแทจรง
4. มาตราอตราสวน (Ratio Scale)
มคณสมบตของ การแบงกลม + จดอนดบ + มหนวยมาตรฐานของความแตกตางระหวางกลม + มจดศนยทแทจรง
สามารถเปรยบเทยบขนาดของสงของวาเปนกเทาของกนและกนได จากความหมายของระดบของการวดทง 4 ระดบ จงแบงขอมลออกไดเปน 2 ประเภท ดงนคอ
บทน ำ - 13
1. ขอมลเชงคณภาพ ( Qualitative data) ไดจากมาตรานามบญญต , อนดบ
2. ขอมลเชงปรมาณ (Quantitative data) ไดจากมาตราอนตรภาค , อตราสวน
Note ในการประมวลผลขอมลทางสถต จะตองเปลยนคาของขอมลเชงคณภาพเปนปรมาณ เสยกอน เชน - ระดบการศกษา แบงเปน
ต ากวา ป. 6 แทนดวย 1 ม.1 – ม.3 แทนดวย 2 ม.4 – ม.6 แทนดวย 3 ปรญญาตร แทนดวย 4 สงกวาปรญญาตร แทนดวย 5
บทน ำ - 14
- ระดบความคดเหน แบงเปน ไมเหนดวยอยางยง แทนดวย 1 ไมเหนดวย แทนดวย 2 ไมออกความคดเหน แทนดวย 3 เหนดวย แทนดวย 4 เหนดวยอยางยง แทนดวย 5
ในการประมวลผลทางสถต จะใชวธการนบจ านวนตวเลขทถกก าหนดใหแกระดบตาง ๆ หรอกลมตางๆ จ านวนทนบได คอ ความถของลกษณะตาง ๆ ทสนใจศกษา
บทน ำ - 15
สรปการแบงประเภทตวแปร ตวแปร
เชงคณภาพ เชงปรมาณ - มาตรานามบญญต - มาตราอนตรภาค -มาตราอนดบ - มาตราอตราสวน
บทน ำ - 16
ตวอยาง 6 จากตวอยาง 1 (แบตเตอรรถยนต) จากตวอยาง 1 ขอมลหรอตวแปรทตองการวดคา คอ อายการใชงาน (เดอน) ซงเปนตวแปรเชงปรมาณ ชนดตอเนอง มมาตราวดชนดอตราสวน ตวอยาง 7 จากตวอยาง 2 จากตวอยาง 2 ขอมลหรอตวแปรทตองการวดคา คอ น าหนกทเพมขนจากแรกคลอด (กรม) ซงเปนตวแปรเชงปรมาณ ชนดตอเนอง มมาตรวดชนดอตราสวน
บทน ำ - 17
ระดบการวดและระเบยบวธทางสถต
มาตราวดระดบทสงกวาจะมคณสมบตของมาตราวดระดบทต ากวาอยครบถวน ดงนน ขอมลทวดมาโดยมาตราวดระดบหนงอาจลดระดบลงเปนมาตราวดอกระดบหนงได การลดระดบการวดของขอมลลงท าใหสญเสยขอสนเทศ
(information) บางสวนของขอมลไป ดงนนจงควรใชวธการทางสถตทเหมาะสมกบมาตราวดทใชรวบรวมขอมลมา วธการทางสถตทพฒนาขน เพอใชกบขอมลทวดในระดบใด
ระดบหนง สามารถน ามาใชกบขอมลทไดจากมาตราวดในระดบทสงกวาได แตจะน าไปใชกบขอมลทวดในระดบต ากวาไมได
บทน ำ - 18
การเกบรวบรวมขอมล 1. การส ารวจ (Survey) สมภาษณ สงแบบสอบถามทางไปรษณย สงเกตการ
2. การทดลอง (Experiment) 3. การรวบรวมจากทะเบยนตางๆ ขอมลอาจแบงตามแหลงทเกดขอมล : 2 ประเภท
1. ขอมลปฐมภม (Primary Data) 2. ขอมลทตยภม (Secondary Data)
บทน ำ - 19
ตารางแสดง ลกษณะ/วธการ ขอด ขอเสยของวธการเกบรวบรวมขอมลโดยการส ารวจ วธ ลกษณะ/วธการ ขอด ขอเสย 1. สมภาษณ สมภาษณผให
ขอมลโดยตรงโดยอาจจะใชแบบสอบถามหรอค าถาม
1. สอความเขาใจตรงกนระหวาง ผถาม-ผตอบ 2.ไดแบบสอบถามคนมาจ านวนมาก
1. ผตอบอาจจะไมกลาใหค าตอบทแทจรง 2. ทาทของผ สมภาษณอาจมอทธพลตอค าตอบ
2.สงแบบสอบถามทางไปรษณย
1.ขอค าถามควรเปนขอความสน ๆ 2.ใชภาษางาย ชดเจน
1. เสยคาใชจายนอย
1. อาจไดรบแบบสอบถามกลบคนมานอย 2. ถาขอค าถามไมชดเจนผตอบ อาจไมสอบถามใครได
3. สงเกตการณ
เฝาสงเกตการณ ,จดขอมล
ทราบพฤตกรรมทแทจรง
เสยเวลา
บทน ำ - 20
การจดกลมขอมลและการน าเสนอขอมลส าหรบขอมลเชงคณภาพ ขอมลเชงคณภาพ ไดแก ขอมลทมมาตราวดเปนแบบมาตราแบงกลม , และมาตราอนดบ 1. การจดกลมขอมล ท าไดโดยการสราง - ตารางแจกแจงความถ - ตารางแจกแจงความถสมพทธ ตวอยาง 8 ในการส ารวจความนยมในการเลอกคณะวชาของนกเรยนชน ม.6 ของโรงเรยนแหงหนง ผท าการศกษาไดสมตวอยางนกเรยนชน ม.6 ทจะสอบเขามหาวทยาลยในปการศกษา 2553 จ านวน 30 คน เพอตอบขอค าถามวา “คณะวชาใดททานตองการเลอกมากทสด”
1. แพทยศาสตร …………………….. 2. วศวกรรมศาสตร …………………….. 3. พาณชย + บญช …………………….. 4. เศรษฐศาสตร …………………….. 5. วทยาศาสตร …………………….. 6. อน ๆ ……………………..
บทน ำ - 21
ผลจากการสอบถาม ไดผลดงน 1 2 1 3 2 1 2 4 5 3 6 2 6 4 4 3 1 1 6 6 5 1 2 1 3 6 3 1 1 2 จากขอมลทไดน ามาสรางตารางแจกแจงความถและความถสมพทธ ไดดงน
บทน ำ - 22
ตาราง แสดงการแจกแจงความถ และความถสมพทธของคณะวชาทนกศกษาตองการเลอก คณะวชา รอยขด ความถ
(f) ความถสมพทธ (= (f / f )*100)
แพทยศาสตร //// //// 9 30.0
วศวกรรมศาสตร //// / 6 20.0 พาณชย + บญช //// 5 16.67 เศรษฐศาสตร /// 3 10.0 วทยาศาสตร // 2 6.67 อนๆ //// 5 16.67 รวม 30 = f 100.00 ขอดของการแปลงขอมลความถ เปนความถสมพทธ คอ ท าใหการแจกแจงความถทไดไมขนกบขอมล ชวยใหเปรยบเทยบการแจกแจงความถของขอมลหลาย ๆ ชดได
บทน ำ - 23
2. การน าเสนอขอมล ท าไดโดยใช Bar Chart Pie Chart
ส าหรบขอมลขางตน แสดง Bar Chart และ Pie Chart ไดดงน
OtherScienceEcon.BusinessEngineerDoctor
9
8
7
6
5
4
3
2
1
0
Faculty
Fre
quency
บทน ำ - 24
Doctor (9, 30.0%)
Science (2, 6.7%)
Economics (3, 10.0%)
Business (5, 16.7%)
Other (5, 16.7%)
Engineer (6, 20.0%)
Pie Chart of C8
บทน ำ - 25
การจดกลมขอมลเพอการวเคราะหส าหรบขอมลเชงปรมาณ 1. การจดกลมขอมล ท าไดโดยการสราง
- ตารางแจกแจงความถ - ตารางแจกแจงความถสมพทธ แนวทางในการสรางตารางแจกแจงความถส าหรบขอมลเชงปรมาณ
จ านวนชนควรอยระหวาง 5 ถง 20 ชน หรอกลาวอยางงายๆ คอ จ านวนชนไมควรจะมากหรอนอยเกนไป
ขอมลแตละตวตองตกอยในชนใดชนหนงเพยงชนเดยวเทานน ทกชนควรมความกวางเทาๆ กน (ถาเปนไปได)
ตวอยาง 9 อาจารยผสอนไดเกบคาคะแนนสอบปลายภาคของวชาสถตพนฐาน 1 ของนกศกษาจ านวน 60 คน ไดผลดงน
บทน ำ - 26
74 63 67 76 82 84 68 69 66 73 67 66 58 72 66 55 79 74 53 80 71 68 73 67 68 69 72 62 66 68 73 59 59 74 70 67 88 53 69 68 78 90 78 72 78 75 72 68 70 73 71 66 72 57 54 68 74 66 68 76 และน าขอมลไปสรางตารางแจกจงความถ ความถสมพทธ ไดผลดงน
บทน ำ - 27
ตาราง แสดงการแจกแจงความถ และความถสมพทธของคะแนนสอบวชาสถตพนฐาน 1 คะแนนสอบ
รอยขด ความถ (f)
ความถสมพทธ (= (f / f )*100)
52.5 – 57.5 //// 5 8.33 57.5 – 62.5 //// 4 6.67 62.5 – 67.5 //// //// 10 16.67 67.5 – 72.5 //// //// //// //// 20 33.33 72.5 – 77.5 //// //// / 11 18.33 77.5 – 82.5 //// 5 10.00 82.5 – 87.5 / 1 1.67 87.5 – 92.5 /// 3 5.00 รวม 60 = f 100.00
บทน ำ - 28
2. การน าเสนอขอมล/สรปขอมล ท าไดโดย - Histogram - Stem-and-leaf
- Dotplot Histogram เปนแผนภาพทสรางขนจากการแจกแจงความถโดยใหแกนนอนแทนชนของขอมลและแกนตงแทนความถ เรยก frequency histogram ถาแกนตงแทนความถสมพทธ เรยก relative frequency histogram หรอหากแกนตงแทนรอยละของความถ เรยก percentage histogram Histogram ใหขอสนเทศเกยวกบ
คากลางของขอมล การกระจายของขอมล
บทน ำ - 29
รปรางการแจกแจงของขอมล ม 3 ลกษณะใหญๆ คอ 3.1 สมมาตร (Symmetric)
3.2 เบขวา (Right – skewed)
3.3 เบซาย (Left - skewed)
หรอ อาจจะม 3.4 Uniform or Rectangular
บทน ำ - 30
ส าหรบขอมลคะแนนสอบวชาสถตพนฐาน 1 เมอน ามาสราง Histogram ปรากฏผลดงน
55 60 65 70 75 80 85 90
0
10
20
score
Fre
quency
บทน ำ - 31
จาก histogram จะเหนวาคะแนนสอบฯ ของนกศกษา 60 คนน มการแจกแจงแบบคอนขางสมมาตร โดยนกศกษาสวนใหญท าขอสอบไดคะแนนโดยเฉลย ระหวาง 67.5 – 72.5 คะแนน Dotplot - มลกษณะคลาย Histogram , plot ขอมลแตละคา - Histogram จะดรปรางการแจกแจงของขอมลดกวา Dotplot - Dotplot มประโยชนในการเปรยบเทยบขอมลตงแต 2 ชดขนไป Stem – and – leaf diagram - คลาย Histogram แตสรางงายกวาและคงขอมลเดมอยในแผนภาพดวย ส าหรบขอมลคะแนนสอบวชาสถตพนฐาน 1 เมอน ามาสราง Dotplot และ Stem – and – leaf diagram ปรากฎผลดงน
บทน ำ - 32
:
: : .
: :: . :: : .
:. . . .: .. : :: ::: :: :. : : .. . . . .
-----+---------+---------+---------+---------+---------+-score
56.0 63.0 70.0 77.0 84.0 91.0
Box – and – whisker diagram ใหขอสนเทศเกยวกบ คากลางของขอมล การกระจายของขอมล รปรางการแจกแจงของขอมล คาผดปกตของขอมล (outlier) outlier : ขอมลทมคานอยกวา Q1 - 1.5 IQR หรอ ขอมลทมคามากกวา Q3 + 1.5 IQR
บทน ำ - 33
ในสวนของการพจารณารปรางการแจกแจงของขอมลจาก Box–and – whisker diagram สรปไดดงน
บทน ำ - 34
1. การแจกแจงแบบเบขวา
Distribution is shifted to the right, the mean should be greater than the median (the exact numbers are: mean = -0.3192, median = -0.4061)
2. การแจกแจงแบบเบซาย
Distribution is shifted to the left, the mean should be less than median (the exact numbers are: mean = 0.3319, median = 0.4124).
บทน ำ - 35
3. การแจกแจงแบบสมมาตร
Distribution is (approximately) normal, mean and median should be similar (the exact numbers are: mean = 0.013 median = 0.041)
บทน ำ - 36
ส าหรบขอมลคะแนนสอบวชาสถตพนฐาน 1 เมอน ามาสราง Box–and – whisker diagram ปรากฏผลดงน
-------------
*-----------------I + I-------------- * *
-------------
------+---------+---------+---------+---------+---------+score
56.0 63.0 70.0 77.0 84.0 91.0
90
80
70
60
50
score
บทน ำ - 37
สถตพรรณนา (Descriptive Statistics)
- การจดระเบยบ + น าเสนอขอมล
ตารางแจกแจงความถ แผนภมแทง,แผนภมรปวงกลม (ส าหรบขอมลเชงคณภาพ) histogram , dotplot , stem – and – leaf (ส าหรบขอมลเชงปรมาณ)
- สรปขอมลเปนตวเลข
การวดแนวโนมสสวนกลาง (Measure of central tendency) การวดการกระจาย (Measure of dispersion) การวดต าแหนงสมพทธของชดขอมล (Measure of relative standing)
บทน ำ - 38
การวดแนวโนมสสวนกลาง (Measure of central tendency) คาวดแนวโนมสสวนกลาง เปนคาวดทใชแสดงคาศนยกลาง หรอคาสวนใหญของขอมลวาอยทใด ตวสถตทใชวดคากลางทส าคญม 3 ตว คอ คาเฉลย (mean) มธยฐาน (median) ฐานนยม (mode)
1. คาเฉลย (mean) คอ ผลรวมของขอมลทกตวในชดขอมล หารดวยจ านวนขอมลทงหมด ใชคาทกคาในชดขอมลมาค านวณ เหมาะส าหรบขอมลในระดบการวดมาตราอนตรภาคและ อตราสวน - เนองจากคาเฉลยใชขอมลทกคามาค านวณ ดงนน ในกรณทขอมลมคาผดปกต (outlier) นนคอ มคาทนอยกวา หรอมากกวาขอมลตวอนๆ มาก คาเฉลยจะไมใชคาวดทดส าหรบขอมลชดนน คาเฉลย แบงได 2 ประเภท คอ
คาเฉลยของขอมลประชากร แทนดวยสญลกษณ N
x
บทน ำ - 39
คาเฉลยของขอมลตวอยาง แทนดวยสญลกษณ n
x
x โดยท x แทน คาวดของแตละหนวยสงเกต N แทน จ านวนขอมลในประชากร n แทน จ านวนขอมลในตวอยาง 2. มธยฐาน (median) คอ คาของขอมลต าแหนงกลางของชดขอมลทมการเรยงล าดบจากนอยไปมาก (หรอมากไปนอย) คามธยฐานจะแบงขอมลเปน 2 สวน โดยมจ านวนขอมลทนอยกวามธยฐานอย 50% และจ านวนขอมลทมากกวามธยฐานอย 50% เชนกน - กรณทจ านวนขอมลเปนจ านวนค มธยฐาน = คาของขอมลตวท )
2
1(
n ของขอมลทเรยงล าดบแลว เมอ n แทน จ านวนของขอมล หากเปนขอมลจากประชากรจะใช N แทน n
บทน ำ - 40
- กรณทจ านวนขอมลเปนจ านวนค มธยฐาน = คาเฉลยของขอมลในต าแหนงกลาง 2 ตว ของชดขอมลทเรยงล าดบแลว นอกจากน ในการอธบายขอมลดวยฮสโตแกรมของความถสมพทธ มธยฐานกคอ คากงกลางทอยบนแกนนอนทแบงขอมลออกเปน 2 สวน คอ ขอมลทมคานอยกวาจดดงกลาว จะใหพนทใตฮสโตแกรมเปน 50% ของทงหมด และ ขอมลทมคามากกวาจดดงกลาว จะใหพนทใตฮสโตแกรมเปน 50% ของทงหมด ขอดของการใชมธยฐานในการวดแนวโนมเขาสสวนกลาง - ไมมอทธพลของคาผดปกตมาเกยวของ เพราะการหาคามธยฐานจะใชล าดบ หรอต าแหนงของขอมลเปนส าคญ - เหมาะกบขอมลทมระดบการวดมาตราอนตรภาคและอตราสวน 3. ฐานนยม (mode) คอ คาของขอมลทเกดบอยทสด (ความถสงสด) ซงอาจมคาเดยวหรอหลายคากได ถาในชดขอมล ไมมขอมลใดเกดมากกวา 1 ครง กลาวไดวา ไมมฐานนยม ถาชดขอมลมฐานนยม 2 คา กลาวไดวา ขอมลชดนนมการแจกแจงแบบ bimodal
บทน ำ - 41
ถาชดขอมลมฐานนยม 3 คา กลาวไดวา ขอมลชดนนมการแจกแจงแบบ trimodal ขอดของการใชฐานนยมในการวดแนวโนมเขาสสวนกลาง - ใชไดกบขอมลทเปนเชงคณภาพ (มาตราแบงกลม) และเชงปรมาณ ความสมพนธระหวางคาเฉลย มธยฐาน และฐานนยม สรปไดตามรปรางการแจกแจงของขอมลดงน 1. ถาขอมลมการแจกแจงแบบสมมาตร :
mean = median = mode
บทน ำ - 42
2. ถาขอมลมการแจกแจงแบบเบขวา : mean > median > mode
3. ถาขอมลมการแจกแจงแบบเบซาย : mean < median < mode
บทน ำ - 43
การเลอกคาวดแนวโนมเขาสสวนกลางทเหมาะสม ควรค านงถง มาตราวดทใชกบตวแปร
- ตวแปรเชงคณภาพ (มาตรานามบญญต, อนดบ) ควรใช ฐานนยม - ตวแปรเชงปรมาณ (มาตราอนตรภาค, อตราสวน) ใชไดทงคาเฉลย มธยฐาน หรอ ฐานนยม รปโคงการแจกแจงความถ
- ถาการแจกแจงของขอมลมความเบมากๆ มธยฐานจะเปนตวทใชวดแนวโนมสสวนกลางทเหมาะสมกวาคาเฉลย - ถาการแจกแจงทสมมาตร คาวดทง 3 จะใกลเคยงกน
บทน ำ - 44
การวดการกระจาย (Measure of Dispersion) คาวดแนวโนมสสวนกลาง ไมใชคาวดทเพยงพอทจะอธบายลกษณะ/หรอรปรางการแจกแจงของชดขอมลได ซงคาวดทจะอธบายการแจกแจงหรอการกระจายของขอมลไดนน เรยก คาวดการกระจายของขอมล ซงในการอธบายลกษณะของขอมลโดยใชคาวดแนวโนมสสวนกลาง และคาวดการกระจายของขอมล จะชวยใหเหนลกษณะของขอมลไดดขน คาวดการกระจายทนยมใช คอ พสย และ สวนเบยงเบนมาตรฐาน 1. พสย (range) = คาสงสดของขอมล – คาต าสดของขอมล เปนคาวดทใชคาของขอมลมาค านวณ ดงนน ถาชดของขอมลมคาทผดปกตกวาคาอนมาก ๆจะท าใหชดของขอมลมการกระจายมาก นอกจากนในการค านวณจะใชคาของขอมล 2 คามาค านวณ คอ คาสงสดและคาต าสด โดยไมสนใจขอมลทอยระหวางขอมล 2 ตวดงกลาว ดงนน พสยจงอาจเปนคาวดการกระจายทไมดนก
บทน ำ - 45
2. สวนเบยงเบนมาตรฐาน (standard deviation) ใชวดความผนแปรโดยดวาคาขอมลแตละคาหางจากคาเฉลยเทาไรโดยเฉลย สวนเบยงเบนมาตรฐาน แบงได 2 ประเภท คอ - สวนเบยงเบนมาตรฐานของขอมลประชากร แทนดวย
2 = N
NX
N
Xn
i
i
N
i
i
2
1
2
1
2
)(
ดงนน 2
- สวนเบยงเบนมาตรฐานของขอมลตวอยาง แทนดวย s
S2 = 1
1
)( 2
1
2
1
2
n
XnX
n
XXn
i
i
n
i
i
ดงนน S = 2s หมายเหต 2 และ S2 แทน ความแปรปรวนของขอมลประชากรและตวอยาง
หนวยของ 2 และ S2 เปน (หนวยของ X)2 และ
n
i
i XX1
)( = 0 เสมอ
บทน ำ - 46
ตวอยาง 10 จงค านวณสวนเบยงเบนมาตรฐานของอตราการเตนของหวใจ (ครง/นาท) ทสมตรวจใน 1 วนจากคนไข A และ B คนไข A : 68 70 69 70 71 72 คนไข B : 6 5 85 90 65 55 60
)727170697068(6
1Ax = 70 ครง/นาท
)605565908565(6
1Bx = 70 ครง/นาท
2222 )7072(...)7070()7068(5
1As = 2 (ครง/นาท)2
ดงนน 2As ครง/นาท 2222 )7060(...)7085()7065(
5
1Bs = 200 (ครง/นาท)2
ดงนน 210As ครง/นาท
บทน ำ - 47
กฏของเชพบเชฟ (Chebyshev’s Rule)
กฏโดยทวไป : ส าหรบ k>1 ใดๆ อยางนอย 2
11
k ของขอมล จะอยหางจากคาเฉลยไมเกน k เทาของ
s.d. นนคอ อยระหวาง skx และ skx
บทน ำ - 48
The Empirical Rule is a rule of thumb that applies to data
sets with frequency distributions that are mound-shaped
and symmetric:
a. Approximately 68% of the measurements will fall
within 1 standard deviation of the mean.
b. Approximately 95% of the measurements will fall
within 2 standard deviations of the mean.
c. Approximately 99.7% (essentially all) of the
measurements will fall within 3 standard deviations
of the mean.
บทน ำ - 49
ตวอยาง กฎของเชพบเชฟ อายของนกศกษาระดบปรญญาตรทสมมา 20 คน มคาเฉลย 21.5 ป และสวนเบยงเบนมาตรฐาน 1.6 ป จงใชกฎของเชพบเชฟ ประมาณรอยละของนกศกษาทมอายระหวาง
1) 18.3 และ 24.7 ป 2) 16.7 และ 26.3 ป
วธท า ก าหนด X แทนอายของนกศกษาระดบปรญญาตร จากโจทย x = 21.5 ป และ s = 1.6 ป 1) เนองจาก sx 23.18 = 21.5-2(1.6) และ sx 27.24 = 21.5+2(1.6) ดงนน โดยกฎของเชพบเชฟ จะไดจ านวนนกศกษาทมอายระหวาง
sx 2 และ sx 2 (หรอ 18.3 – 24.7 ป) มอยางนอยรอยละ 75 ของจ านวนนกศกษาทงหมด = 15 คน 2)
บทน ำ - 50
คะแนน z (z-scores) คะแนน z หรอคะแนนมาตรฐาน ส าหรบคาสงเกตใดๆ คอ จ านวนทบอกวาคาสงเกตนนอยหางจากคาเฉลยของชดขอมลเปน เทาไรในเทอมของสวนเบยงเบนมาตรฐาน
xz ..... คะแนนมาตรฐานส าหรบขอมลประชากร
s
xxz
..... คะแนนมาตรฐานส าหรบตวอยาง
ถา z<0 แสดงวา คาสงเกตนนมคานอยกวาคาเฉลย ถา z>0 แสดงวา คาสงเกตนนมคามากกวาคาเฉลย
บทน ำ - 51
คาวดต าแหนงสมพทธ (Measure of Relative Standing) คะแนน z Quartiles, Deciles, Percentiles พสยระหวางควอไทล (Interquartile range)
IQR = Q3 – Q1 ความสมพนธระหวาง Quartiles, Deciles, Percentiles Q1 = P25, D1 = P10, Q3 = P75
Median = Q2 = D5 = P50