Post on 25-Feb-2020
การเก็บรวบรวมและการวเิคราะหข์อ้มูล
ม ี 4 ขัน้ตอนในการเก็บรวบรวมขอ้มูล
1. การเก็บขอ้มูลดิบ (collection of raw data) 2. การระบุการแจกแจงทางสถิติ (identification of statistical distribut
ion) 3. การประมาณค่าของพารามเิตอร ์ (estimation of parameter)
4. การทดสอบค่าประมาณค่า (testing of estimator)
1. การเก็บขอ้มูลดิบ ในการเก็บขอ้มูลควรพจิารณาดังนี้
11. ทำาการวเิคราะหว์า่ขอ้มูลที่ถกูเลือกวา่พอแก่การทำาการจำาลองหรอืไม่
12. รวบรวมวา่เขา้พวกเป็นขอ้มูลชุดเดียวกัน แล้วทำาการตรวจสอบวา่เป็นอันหนึ่งอันเดียวกันหรอืไม่
13. ตรวจสอบวา่ตัวแปร 2 ตัวมคีวามสมัพนัธก์ันหรอืไม่ โดยการสรา้งแผนภาพการกระจาย (s catter diagram)
14. ความสมัพนัธข์องตัวแปรด้วยกันวา่มอีอโต้คอรเีรชัน่ (autocorrelation)
2. การระบุการแจกแจงทางสถิติ
ในการระบุการแจกแจงทางสถิติ ม ี การแจกแจงความถ ี่ (frequency distributi on) หรอื ฮิสโตแกรม (histogram) เพื่อดรููปรา่งของการกระจายหรอืการแจกแจง
การทำาฮิสโตแกรม มขีัน้ตอนในการทำาดังนี้
1. แบง่ขอ้มูลออกเป็นชว่งๆที่เท่ากัน
2. เขยีนค่าของชว่งบนแกนนอน
3. หาความถ่ีของแต่ละชว่ง
4. เขยีนความถ่ีลงบนแกนตัง้
5. เขยีนกราฟ
ขอ้มูลที่นำามาทำาฮิสโตแกรมมทีัง้ขอ้มูลที่ต่อเนื่องและไมต่่อเนื่อง
ตัวอยา่ง ขอ้มูลของรถบรรทกุที่มาจอดที่สถานีแหง่หนึ่ง ทกุๆ 5 นาทีระหวา่ง 700 705. , . ,... เป็นเวลา 5 วนัต่อสปัดาห ์ และทัง้หมด 20 สปัดาห์
จำานวนครัง้ ความถ่ี จำานวนครัง้ ความถ่ี ของการมาถึงต่อ การมาถึง
1 คาบ 1 คาบ
0 12 6 7
1 10 7 5
2 19 8 5
3 17 9 3
4 10 10 3
5 8 11 1
Y 20
18 16 ความถ ี่ 14
12 10 8 6 4
2 0 0 1 2 3 4 5
6 7 8 9 10 11 X จำานวนครัง้ของการมาถึง
การแจกแจงดังกล่าวมขีอ้ตกลงเบื้องต้น โดยการใชก้ารเขยีนกราฟของความน่าจะเป็น (prob ability plotting)
ขัน้ตอนของการเตรยีมดังนี้
1. เตรยีมกระดาษกราฟความน่าจะเป็น (probability paper) 2. ให ้ X i , i=1,2,..,n เป็นตัวอยา่งขอ้มูล
เรยีงขอ้มูลจากน้อยไปมาก
Y1 Y2 Y 3 ... Yn
3. เขยีนกราฟ Y j และ P j -12
/ nj 100( )
Pn1
50 P P / nj+1 j 100
เมื่อ -X1 2 1
4. ถ้ากราฟเป็นเสน้ตรงถือวา่การแจกแจงนัน้ใชไ้ด้
ตัวอยา่ง เก็บตัวอยา่งขอ้มูลจำานวน 20 จำานวน ซึ่งเป็นขอ้มูลของการติดตัง้ระบบหุน่ยนต ์ โดยนับเป็นจำานวนวนิาที
9979 9956 100. . . 17 10033.
10026 10041 99. . . 98 9983.
10023 10027 10. . 002 10047. .
9955 9962 996. . . 5 9982.
9996 9990 100. . . 06 9985.
วธิทีำา เรยีงขอ้มูลจากน้อยไปมาก ลำาดับ ค่า ลำาดับ ค่า ลำาดับ ค่า
1 9955 8 99. . 85 15 10023.
2 9956 9 99. . 90 16 10026.
3 9962 10 9. 996 17 10027. .
4 9965 11 9. 998 18 10033. .
5 9979 12 10. 002 19 10041. .
6 9985 13 10. 006 20 10047. .
7 9983 14 10. 017
เขยีนกราฟแกนตัง้คือ Yj แกนนอนคือ Pj 99 98
1005. 1004. 1003. 1002. 1001. 1000. 999. 998. 997. 996. 995. 1 2 3 5 10 20 30
40 50 60 70 80 90 96 9
8 99
Y1 9955= . P1 = 5020 2
5
Y2 9956= . P2 25= . + 10020 75= .
: : Y20 10057= . P20 =
975.
3. การประมาณค่าพารามเิตอร ์ ปกติค่าพารามเิตอรจ์ะม ี ค่าเฉล่ีย และความแปรปรวน
ก . การหาค่าเฉล่ียและค่าความแปรปรวน สตูรที่ใชก้รณีขอ้มูลไมแ่จกแจงความถ ี่
ค่าเฉล่ีย xx
N
ค่าแปรปรวน S2 = n x X)n(n -1)
2 2 (
สตูรที่ใชก้รณีขอ้มูลแจกแจงความถ ี่
ค่าเฉล่ีย xfx
N
ค่าแปรปรวน S2 = n fx fX)n(n -1)
2 2 (
ข . ตัวประมาณค่าพารามเิตอร ์ เป็นการที่ค่ามกีารเปล่ียนไปตามตัวอยา่งที่สุม่มาแต่ละครัง้
ตัวอยา่ง จากขอ้มูลของโทรศัพท์ที่กล่าวมาแล้ว เมื่อนำามาเขยีนฮิสโตแกรม และนำาไปเทียบกับการแจกแจง มาตรฐานพบวา่เป็นแบบปัวรซ์อง ซึ่งมพีารามเิตอรค์ือ เป็นค่าประมาณของค่าเฉล่ีย
xfx
N = 0(12) + 1(10)+..11(1)
100364.
S2 = n fx fX)n(n -1)
2 2 ( 763= . นอกจากนี้ยงัมตีัวประมาณค่าพารามเิตอรข์องการแจกแจงอีกดังนี้ แบบการแจกแจง สตูรของความน่าจะเป็น พารามเิตอร ์ ถ้าประมาณค่า พารามิ
เตอร์
ปัวรซ์องe
x! , x = 0,1,...
- -x =x
เอ็กซโ์ป1 e
- X
0, X>
X
เนนเชยีล สมำ่าเสมอ
(ต่อเนื่อง ) 1b - a ,a x b a,b
a =
b =
(ไมต่่อเนื่อง ) 1j - (i -1) X, 1{i,i+ ,..,j} i,j
i =ค่า Xk ตำ่าสดุ
j= ค่า Xk สงูสดุ
ปกติ e - (X- )2 2 /2 -, <X< , 2 X , 2 S2
แกมมา่ , 1X
ค่า Xi ตำ่าสดุ
ค่า X i สงูสดุ
ตัวอยา่ง จากขอ้มูลการมาถึงของรถ พบวา่ ได้ค่า
X 364= . ดังนัน้ ถ้าประมาณเป็นแบบปัวรซ์อง ได ้
364= .
หรอื 364= .
ตัวอยา่ง จากขอ้มูล
1783 1522 920 58
7 3653 146
2937 1492 736 37
2 3104 3535
พบวา่ ถ้าใหก้ารกระจายดังกล่าวเป็นแบบสมำ่าเสมอบนชว่ง (0,b) เมื่อ b เป็นจำานวนจรงิใดๆ
ค่าประมาณของ b คือb = n + 1
n [ค่าสงูสดุ-ค่าตำ่าสดุ] โดยที่ขอ้มูลที่กำาหนดใหค้่าตำ่าสดุคือ 100 จนถึง 100+b
ดังนัน้b = 12 + 1
12 -[3653 100]=3849
ตัวอยา่ง ถ้าการแจกแจงเป็นแบบปกติ
โดยใชข้อ้มูลของหุน่ยนต ์ และใชส้ตูร xx
N
S2 = n x X)n(n -1)
2 2 (
ประมาณค่าเฉล่ีย = X 1000065= .
และประมาณค่าความแปรปรวน 2 S2 00698 ตัวอยา่ง การแจกแจงแบบแกมมา่
ถ้าค่าประมาณคือ และ
= 1
x
โดยม ี M= ln xn
ln X ii=1
n
1 ซึ่งใชข้อ้มูลดังนี้
สัง่ซื้อ เวลาดำาเนิน (วนั ) สัง่ซื้อ เวลาดำาเนิน (วนั) (lead time) (lead
time) 1 70292 11.
30215. 2 10107 12.
17137. 3 48386 13.
44024. 4 20480 14.
10552. 5 13053 15.
37298. 6 25292 16.
16314. 7 14713 17.
28073. 8 39166 18.
39019. 9 17421 19.
32330. 10 13905 2.
0 36547.
xx
n
ii=1
n
564 32
2028 22
...
-M=3.34 120
,1M
( . ) . .63 99 014 7 14
เปิดตารางแกมมา่ 3728= .
= 1
28 22. 0035 ตัวอยา่ง การแจกแจงแบบเอ็กซโ์ปเนนเชยีล
ใชข้อ้มูลจำานวน 50 จำานวนดังนี้
79919 3081 0. . . 062 1961 5845. .
3027 6505 00. . . 21 0013 0123. .
6769 59899 1. . . 192 34760 5009. .
18387 1141 43. . . 565 24420 0433. .
144695 2663 1. . 7967 0091 9003. . .
0941 0878 33. . . 71 2157 7579. .
0624 5380 31. . . 48 7078 23960. .
0590 1928 03. . . 00 0002 0543. .
7004 31764 1. . . 005 0147 0219. .
3219 14382 1. . . 008 2336 0462. .
ได้ค่าประมาณ
1 111 894
0 084X ..
. ตัวอยา่ง การแจกแจงแบบไวบูลล ์
ใชข้อ้มูลของการแจกแจงแบบเอ็กซโ์ปเนนเชยีล ที่มจีำานวนขอ้มูล20
จำานวน มคี่าเฉล่ีย 11894. จงประมาณค่า 0
วธิทีำา X , X = 37,575.8502i
i=1
502141467 .
S
X nX
n -12
2i
i=1
n
2
= 37,575.850 - 50(141.467)49
622 650.
S = 24.453
01189424 953
0 477 XS
..
.
f(
) lnln
n
Xn X X
Xi
i=1
n ii=1
n
i
ii=1
n
นัน่คือ f(
) ln
ln
n X
n X X
Xi
i=1
n ii=1
n
i
ii=1
n0
0
0
= 500 477
38 294 50 292 629115125.
. ( . ).
เมื่อ 0
1189424 953
0 477 XS
..
.
และคำานวณหา f ( 0
) จากสตูร
f (
)
( ) ln )
( )
-n
n X lnX
X
n( X X
X
i ii=1
n
ii=1
n
ii=1
n
i
ii=1
n2
2 2
20
f (-50
(0.477)0 2
)
( . ).
( . )( . )
50 1057 781115125
50 292 629115125
2
2
-356110= . ดังนัน้
คำานวณค่า 1 0 477 0 522 . .
16.024-356.110
หลังจากนัน้ทำาการประมาณโดยการทำาหลายๆครัง้
X j X ii=1
50
j
X Xi ji=1
j ln
50
X Xii=1
50
i j
(ln ) 2 f( j )
0 0477 115125 2. . 92629 1057781. .
16024. 1 0522 129489 3. .
44713 1254111. . 1008.
2 0525 130603 3. . 48769 1269547. .
0004
3 0525 130608 3. . 48789 1269614. .
0.000
f ( j
) j+1
- 0 356110 0522. . - 1 313540 0525. . - 2 310853 0525. . - 3 310841 0525. . หา
= 130 60850.
1/0.525
6227= .
4. การทดสอบรูปแบบของการแจกแจง เพื่อดขูอ้มูลที่เก็บและการแจกแจงที่คิดเอาไวเ้หมาะสมกันดีในเชงิสถิติ
หรอืไม ่ โดยมวีธิกีารทดสอบที่นิยมใชก้ัน 2 วธิคีือ การทดสอบไคสแควร์
การทดสอบโคลโมโกรอ๊ฟ-สมรีน์๊อฟ
41. การทดสอบไคสแควร ์ โดยมขีัน้ตอนในการทดสอบคือ
1. ตัง้สมมติฐาน
X 0 ตัวแปรสุม่เป็นแบบการแจกแจง ...... Ha : ตัวแปรสุม่ไมเ่ป็นแบบการแจกแจง .... 2. คำานวณใชส้ตูร
2 i i2
ii=1
k o ee
( )
เมื่อ oi เป็นความถ่ีของค่าสงัเกตที่พบจรงิ (observed frequency)
e i เป็รความถ่ีคาดคะเนในพวกท ี่ i k จำานวนพวกหรอืจำานวนระดับของค่าสงัเกต
3. เปรยีบเทียบค่าที่คำานวณได้กับค่าในตาราง และสรุปผล ตัวอยา่ง จงทดสอบการแจกแจงปัวรซ์องโดยใชไ้คสแคว์ ขอ้มูลที่เก็ยรวบรวมเป็นดังนี้
0 12
1 10
2 19
3 17
4 10
5 8
6 7
7 5
8 5
9 3
10 3
11 1
0H : การแจกแจงเป็นแบบปัวรซ์อง
Ha : การแจกแจงไมเ่ป็นปังรซ์อง
คำานวนค่า P(X) =e
X!0
- X
คำานวณค่า
= x
0 12 1 10
113 64( ) ( ) ... .
P(0) = 0.026 P(6) =0.085 P(1)=0.096 P(7)=0.044 P(2)=0.174 P(8) = 0.020 P(3)=0.211 P(9)=0.008 P(4)=0.192 P(10)=0.003 P(5)=0.140 P(11)=0.001
X i o i e i ( )o ee
i i
i
2
0 12 26 7. .87
1 10 96. 2 19 174.
015
3 17 211.080.
4 10 192 4.41
5 8 140 2. . 57
,X=0,12,
122.
6 7 85 02. .6
7 5 44. 8 5 20. 9 3 080. 10 3 030. 11 1 01. 2768. ค่า ei = npi เชน่ e 1 = np1 100 0= ( .
026 26) = . ถ้า e i < 5 ดังนัน้จะนำามารวมกัน เชน่ e1+e2 12= .
2
ดังนัน้ ได้ค่า 2 2768= . องศาแหง่ความอิสระ - - - - k s 1 7 1 1 =5 พบวา่ ปฎิเสธ X 0
42. การทดสอบโคลโมโกรอ๊ฟ-สมรนี๊อฟสำาหรบัสาระสนิทรูปดี เหมาะกับกลุ่มตัวอยา่ง ขนาดเล็ก และไมม่พีารามเิตอร์ ตัวอยา่ง จงทำาการทดสอบวา่มกีารแจกแจงที่เป็นเอ็กซโ์ปเนนเชยีลหรอืไมจ่าก ขอ้มูล
04405320427. . . . 4 200 030 254. . .
05220218915. . . . 3 021 280 004. . .
13583223419. . . . 5 010 142 046. . .
00710907655. . . . 5 393 107 226. . .
28806711202. . . . 6 457 537 012. . .
17
7 6. 11.62
31916314610. . . . 8 206 085 083. . .
24421131529. . . . 0 658 064. .
วธิทีำา
X 0 : มกีารแจกแจงแบบเอ็กซโ์ปเนนเชยีล
Xa : ไมม่กีารแจกแจงแบบเอ็กซโ์ปเนนเชยีล
จากขอ้มูลดังกล่าวเป็นการเก็บขอ้มูลจาก 0 ถึง 100T= นาที
ดังนัน้นำามาเขยีนใหมเ่พื่อใหอ้ยูใ่นชว่ง (0,1) สำาหรบัในโคลโมโกรอ๊ฟใช้ 1 1 2T /T ,(T +T )/T , ... ดังนี้
00044000970030. . . 1 00575 00775 0080. . .
5 01147. 01111013130150. . .
2 01655 01676 0195. . . 6 01960.
02095029270316. . . 1 03356 03366 0350. . .
8 03553. 03561036700374. . .
6 04300 04694 0479. . . 6 05027.
05315053820549. . . 4 05520 05977 0651. . .
4 06526. 06845070080715. . .
4 07262 07468 0755. . . 3 07636.
07880079820820. . . 6 08417 08732 0902. . .
2 09680. 09744 D +
max1 i N
iN
R(i)
1054= . D- = max
1
i N
R(i) -i -1N
00080= . D = max(1.054,0.0080) =0.0154 005 50. ,n= , D005. = 136.
n =0.
1923
ซึ่งค่าที่คำานวณได้เป็น 01054. ดังนัน้ ไมป่ฎิเสธ X0