สถิติเพื่องานวิจัยทาง ... · 2012-08-08 ·...

Post on 25-Dec-2019

0 views 0 download

Transcript of สถิติเพื่องานวิจัยทาง ... · 2012-08-08 ·...

สถตเพองานวจยทางรฐประศาสนศาสตร (Statistics for Public Administration Research)

โดย ดร.ถาวร ทนใจ

Ph.D. (Fisheries), MA (Fisheries), MS (Probability and Statistics), พบม.(พฒนาสงคม) เกยรตนยมดมาก, วทบ.(ประมง), รปศ.(บรหารรฐกจ)

2

เอกสารอางอง ภาควชาสถต. หลกสถต 1. คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร.

2547. ภรมย กมลรตนกล. การอบรมการพฒนาศกยภาพคณะกรรมการ

สนบสนนงานวชาการในสวนภมภาคทโลตสปางสวนแกว; 2 ก.ย.45. ส านกงานสถตแหงชาต. การเลอกใชตวทดสอบสถต. กระทรวง

เทคโนโลยสารสนเทศและการสอสาร. Campbell, MJ. Statistic at square Two, BMJ Books. Swinscow, TDV, Campbell, MJ. Statistic at square One, Tenth edition,

BMJ Books.

3

สถตคออะไร ศาสตรวาดวยการเกบรวบรวมขอมล การน าเสนอขอมลและการวเคราะห

ขอมล ตวเลขทรวบรวมไวเพอความมงหมายทแนนอนและเกยวของกบเรองใด

เรองหนง เปนเครองมอของการวจยทอาศยการวเคราะหขอมลเปนหลก

4

Nominal Scale เชน เพศ, ปจจบนพกอาศยกบใคร, ทานเกดทจงหวดไหน Ordinal Scale เชน ชนเรยน, ความเพยงพอของคาใชจาย, พฤตกรรมความรนแรง Interval Scale

arbitrary zero เชน องศาเซลเซยส, ฟาเรนไฮต Ratio Scale true zero เชน อาย, น าหนก, รายได

Scale of Measurement

5

ขอมลระดบ Nominal

เพศ

140 50.0 50.0 50.0

140 50.0 50.0 100.0

280 100.0 100.0

ชาย

หญง

Total

Valid

Frequency Percent Valid Percent Cumulative

Percent

6

ตารางแสดงขอมลระดบ Ordinal

ช นเรยน

22 7.9 7.9 7.9

39 13.9 14.1 22.0

34 12.1 12.3 34.3

61 21.8 22.0 56.3

72 25.7 26.0 82.3

49 17.5 17.7 100.0

277 98.9 100.0

3 1.1

280 100.0

1

2

3

4

5

6

Total

Valid

SystemMissing

Total

Frequency Percent Valid Percent

Cumulat ive

Percent

7

ขอมลระดบ Ratio

อาย

9 3.2 3.2 3.2

24 8.6 8.6 11.8

40 14.3 14.3 26.1

67 23.9 23.9 50.0

58 20.7 20.7 70.7

50 17.9 17.9 88.6

27 9.6 9.6 98.2

5 1.8 1.8 100.0

280 100.0 100.0

12

13

14

15

16

17

18

19

Total

Valid

Frequency Percent Valid Percent

Cumulat ive

Percent

8

การค านวณผดพลาด

Descriptive Statist ics

280 12 19 15.51 1.61

277 131.00 185.00 161.9657 9.0867

277 20.00 85.00 50.3791 9.0772

276

อาย

ความสง

น าหนก

Valid N (listwise)

N Minimum Maximum Mean Std. Deviation

Descriptive Statist ics

280 12 19 15.51 1.61

280 .00 185.00 160.2304 18.9930

280 .00 85.00 49.6500 10.7069

280

อาย

ความสง

น าหนก

Valid N (listwise)

N Minimum Maximum Mean Std. Deviation

9

ความเบ (Skewness)

X

9. 08. 07. 06. 05. 04. 03. 02. 01. 0

X

C ases weighted by F

Freq

uenc

y

30

20

10

0

St d. Dev = 2.16

Mean = 6.4

N = 121. 00

X

9. 08. 07. 06. 05. 04. 03. 02. 01. 0

X

C ases weighted by F

Freq

uenc

y

30

20

10

0

St d. Dev = 2.16

Mean = 3.6

N = 121. 00

Mean Median Mode

ขอมลแจกแจงชนดเบซาย (ขอมลสวนใหญมคาสง)

Mode Median Mean

ขอมลแจกแจงชนดเบขวา (ขอมลสวนใหญมคาต า)

ถา Skewness = 0 แลว เสนโคงจะไมมความเบ

เบซาย เบขวา

10

แบบท 1

X

9. 08. 07. 06. 05. 04. 03. 02. 01. 0

X

C ases weighted by F

Freq

uenc

y

30

20

10

0

St d. Dev = 2.16

Mean = 6.4

N = 121. 00

12 1N =

Analysis weighted by F

X

10

8

6

4

2

0

ขอมลสวนใหญมคาสง มธยฐานชดขอบบนของกลอง

เบซาย เบซาย

2 ภาพนมาจากขอมลชดเดยวกน (แจกแจงเหมอนกน)

11

ขอมลแจกแจงปกต มธยฐานอยตรงกงกลางของกลอง

แบบท 2

X

8. 07. 06. 05. 04. 03. 02. 0

X

C ases weighted by F

Freq

uenc

y

40

30

20

10

0

St d. Dev = 1.17

Mean = 5.0

N = 104. 00

10 4N =

Analysis weighted by F

X

9

8

7

6

5

4

3

2

1

สมมาตร สมมาตร

2 ภาพนมาจากขอมลชดเดยวกน (แจกแจงเหมอนกน)

12

ขอมลสวนใหญมคาต า มธยฐานชดขอบลางของกลอง

แบบท 3

X

9. 08. 07. 06. 05. 04. 03. 02. 01. 0

X

C ases weighted by F

Freq

uenc

y

30

20

10

0

St d. Dev = 2.16

Mean = 3.6

N = 121. 00

121N =

X

10

8

6

4

2

0

เบขวา เบขวา

2 ภาพนมาจากขอมลชดเดยวกน (แจกแจงเหมอนกน)

13

ความโดง(Kurtosis)

X

1 0.09 .08 .07 .06 .05 .04 .03 .02 .0

Frequ

ency

5 0

4 0

3 0

2 0

1 0

0

ขอมลแจกแจงชนดโดงมาก

ความแปรปรวนมคานอย

18.0 16.0 14.0 12.0 10.0 8.0 6.0 4.0 2.0

3.5 3.0 2.5 2.0 1.5 1.0 .5

0.0

ขอมลแจกแจงชนดโดงนอย

ความแปรปรวนมคามาก

ถา Kurtosis = 0 แลว เสนโคงจะมความเปนปกตหรอโดงปกต

โดงมาก โดงนอย

14

ฮสโทแกรม (Histogram)

SATISF

32.030.028.026.024.022.020.018.016.0

HistogramFr

eque

ncy

16

14

12

10

8

6

4

2

0

Std. Dev = 3.59

Mean = 23.0

N = 49.00

คาต าสดคอ 16

อยในชนแรก

คาสงสดคอ 32

อยในชนสดทาย

ขอมลสวนใหญ

ในทนอยในชนท 5

โดยจดกงกลางคอ 24

15

Histogram

¹éÓ˹ѡ

85.0

80.0

75.0

70.0

65.0

60.0

55.0

50.0

45.0

40.0

35.0

30.0

25.0

20.0

70

60

50

40

30

20

10

0

Std. Dev = 9.08

Mean = 50.4

N = 277.00

16

Box Plot 1

49N =

SATISF

40

30

20

10

33

เสน Median

Outlier เสนหนวด แสดงคาสงสดของขอมล ทยงไมสงผดปกต = Q3+1.5(IQR)

ดานบนคอ Q3

ดานลางคอ Q1

ภาพกลองของตวแปร satisf

17

Box Plot

140137N =

à¾È

Ë­Ô§ªÒÂ

¹éÓ

˹Ñ

¡100

80

60

40

20

0

16333157826183

263210

199

5111612942

121

18

ประเภทของสถต

สถตเชงพรรณนา สถตเชงอนมาน

Non Parametric Parametric - Mean - Mode - Variance - sd

- Chi Square - Median Test - Sign Test

- Spearman - Mann-Whitney - Wilcoxon

- t-test - ANOVA - ANCOVA - Factor Analysis - Pearson’s Correlation

Nominal Ordinal

19

สถตเชงพรรณนาและสถตเชงอนมาน

สถตเชงพรรณา (Descriptive Statistics) ใชกบกลมประชากร ไดแก Mean, Mode, Median, Variance, Standard Deviation เปนตน

สถตเชงอนมาน (Inference Statistics) เปนสถตเชงทดสอบสมมตฐาน วา

สมมตฐานทตงไวเปนจรงหรอไม ไดแกการประเมนคาพารามเตอรในประชากร (Estimation) และการทดสอบสมมตฐาน (Hypothesis Testing) แบงออกเปน Parametric และ Non parametric statistics

20

ประเภทของสถต

Parametric

Non-Parametric

RATIO INTERVAL ORDINAL NOMINAL

Geometric Mean Coefficient of Variation

Median, Percentile Spearman Kendall, Kendall W Mode, Frequency Contingency Coefficient

21

Parametric Statistics

กลมประชากรทมการแจกแจงแบบโคงปกต ขอมลทงหมดเรยกวา Population คาทค านวณไดเรยก Parameter แตถาเกบมาเพยงบางสวนจากประชากรจะเรยก Sample คาทไดเรยกวาคาสถต (Statistics) มระดบการวดแบบ Ratio หรอ Interval scale เชน t-test, ANOVA, Correlation, Multiple Regression เปนตน

22

Non Parametric Statistics

คอสถตทใชกบกลมประชากรทไมเขาเงอนไขของ Parametric มระดบการวดแบบ Ordinal และ Nominal

วเคราะหโดยการใชวธ Chi Square, Log Rank Test, Mann Whitney, Wilcoxon เปนตน

23

สมมตฐานการวจย (Research Hypothesis) สมมตฐานทางสถต (Statistical Hypothesis)

สมมตฐานการวจย คอการคาดการณผลวจย สมมตฐานทางสถต คอ H0 และ H1 Null Hypothesis = H0 มกเขยนในรปปฏเสธ หรอไมมความแตกตาง

ไมสมพนธกน Alternative Hypothesis = H1 มกเขยนในรปมความแตกตาง มความสมพนธกน และเขยนใหสอดคลองกบสมมตฐานการวจย

24

p value ยง p value ยงมคานอยกจะเลอนไปทางดานหางของ H0

จงปฏเสธ H0 หรอกคอเลอนเขาไปใน H1 มากขนจงยอมรบ H1 ซงสอดคลองกบสมมตฐานการวจย

25

ตวแปร ขอมลไดจากการสงเกต วด สอบถาม หนวยศกษาอาจเปนคน สตว

สงของ ตวแปรแตกตางกนเพราะ

• คณลกษณะแตกตางกน • เวลาแตกตางกน • สถานทแตกตางกน

26

ประเภทของขอมล

แบงตามทมา • ขอมลปฐมภม (Primary Data) • ขอมลทตยภม (Secondary Data)

27

ขอมลเชงคณภาพ

(Qualitative Data)

ขอมลเชงปรมาณ

(Quantitative Data)

วธการ นบ (Counted)

ชง ตวง วด (Measurement)

ขอมลทได จ านวนเตม (Discrete Variable)

คาตอเนอง (Continuous Variable)

สรปขอมล อตราสวน (Ratio) สดสวน (Proportion) รอยละ (Percentage)

Mean Median Mode

การน าเสนอ ตาราง (Table) แผนภมรปภาพ (Pictogram) แผนภมแทง (Bar diagram) แผนภมแทงชนดสดสวน (Proportional Bar diagram)

Histogram Freq Polygon Cumulative Frequency

สถตทใชในการทดสอบสมมตฐาน

Chi-Square T- test

28

ขอมลเชงคณภาพและขอมลเชงปรมาณ

ขอมลเชงคณภาพ อยรปแบบของขอความ เชน

เชอชาต เพศ สผว Qualitative Variables Categorical Variables Nominal Variables Ordered Variables Coded Variable

ขอมลเชงปรมาณ ไดจากการชง ตวง วด เชน

น าหนก ความดนโลหต Quantitative Variable 1. Discrete Data เชนจ านวน

สงของ จ านวนคน 2. Continuous Data เชน น าหนก

ความกวาง

29

ขอมลเชงคณภาพ ชาย 30 คน หญง 30 คน เปนขอมลไดจากการนบ สบบหร 15 คน ไมสบบหร 45 คน เปนขอมลไดจากการนบ

30

ขอมลเชงคณภาพ

ความเหนตอการใหบรการของศนยคอมพวเตอร

ดมาก ด ปานกลาง ตองปรบปรง ตองปรบปรงอยางมาก

5 4 3 2 1

31

ขอมลเชงคณภาพ-->ขอมลเชงปรมาณ

แตถารวมกนเปน 3 ตาราง ความเหนตอการใหบรการของศนยคอมพวเตอร ความเหนตอการใหบรการของศนยขอมล ความเหนตอการใหบรการของศนยพมพ ต าสด = 3 สงสด = 15 อาจจดเปนขอมลเชงปรมาณ

ดมาก ด ปานกลาง ตองปรบปรง ตองปรบปรงอยางมาก

5 4 3 2 1

32

ขอมลเชงปรมาณ-->ขอมลเชงคณภาพ วดสวนสง = 149 155.5 160 167 169 170.5 172 เปนขอมลเชงปรมาณ แตถาจดกลมให <150 = เตย 150-170=ปานกลาง >170=สง เตย ปานกลาง สง จ านวนอยางละกคน ? เปนขอมลเชงคณภาพ รายละเอยดของขอมลจะสญเสยไป จาก Ratio Scale เปลยนเปน Ordinal Scale

33

การวเคราะห ขอมลเชงคณภาพกบขอมลเชงคณภาพ

Chi-Square

ขอมลเชงคณภาพกบขอมลเชงปรมาณ

Eta

ขอมลเชงปรมาณกบขอมลเชงปรมาณ

T-test

34

เปรยบเทยบ หรอ หาความสมพนธ เปรยบเทยบ 2 ประชากร / ตวแปร ความสมพนธ 2 ประชากร / ตวแปร ตวแปรเชงปรมาณใช คาเฉลย ตวแปรเชงคณภาพใช คาสดสวน

35

Parametric ขอมลเชงปรมาณใชหรอไม แจกแจงแบบปกตหรอไมใช Explore Data

• Mean, Mode, Median, • Box Plot, Histogram • Skewness, Kurtosis

ถาหลายประชากรทดสอบความเทากนของความแปรปรวน

36

Alpha and Beta errors

A = B A = B

Correct B Error

a Error Correct

Accept H0 H0 : A = B Accept H1 H1 : A = B

THE TRUTH CONCLUSION drawn from analysis

37

Normal Distribution Mean= 82 mmHg, SD=10 mmHg

38

Normal Distribution (Mean, SD)

-1 -2 -3 0 +1 +2 +3

mean= 0, SD=1

39

Normal Distribution (Z score)

0 -1 +1 +1.96 +2.576 -2.576 -1.96 Z

40

95% Confidence Interval

95% C.I. = Mean + 2 SD

41

Z distribution

โคงเรมท – Infinity ไปถง + Infinity Mean=0, SD=1

42

t distribution student’s distribution sample < 30 T distribution =

A symmetric distribution with mean zero and a standard deviation larger than that for the normal distribution for small sample sizes.

As n increase t distribution approaches the normal distribution.

43

F distribution A continuous statistical distribution which arises in the testing of

whether two observed samples have the same variance. F distribution=The probability distribution used to test the the equality

of two estimates of the variance. It is the distribution use with the F-test in ANOVA

44

Chi Square

Tests the hypothesis that the row and column variables are independent, without indicating strength or direction of the relationship.

ตรวจสอบวาตางกนหรอไม แตไมบอกวาตางกนมากนอยเทาไรและไมบอกวามากกวาหรอนอยกวา (เงอนไขตวแปรแนวนอนและแนวตงเปนอสระตอกน)

45

The statistical test for comparing a mean with a norm or for comparing two means with small sample size (n =<30).

สถตเพอเปรยบเทยบคาเฉลยกบคาทก าหนดหรอเปรยบเทยบคาเฉลยของ 2 กลม

It is also use for testing whether a correlation coefficient or a regression coefficient is zero.

เพอเปรยบเทยบหาคาสหสมพนธของการทดสอบความสมพนธเชงเสนวามคาเปน 0 หรอไม

t-test

46

t-test (ตวอยาง)

การเปรยบเทยบคาเฉลย 2 กลมตวอยาง Mean1 = 5.6 Mean2 = 5.1 Variance = 10 Variance = 12 Sample Size = 30 Sample Size = 100 เชน Mean1 จะเทากบ Mean2 หรอไม

47

t-test

1 กลม 2 กลม

มความสมพนธกน เปนอสระตอกน

Paired t-test t-test Group

ประเภทของ t-test

Means

Population One Sample

48

The One-Sample t Test procedure tests whether the mean of a single variable differs from a

specified constant. ทดสอบวาคาเฉลยของกลมตวอยางมคาแตกตางจากคาคงททก าหนด

หรอไม

49

procedure compares the means of two variables for a single group. It computes the differences between values of the two variables for each case and tests whether the average differs from 0.

ทดสอบเปรยบเทยบคาเฉลย 2 สงจากกลมตวอยางเดยวโดยทดสอบวาคา

แตกตางเฉลยแตกตางจาก 0 หรอไม

The Paired-Samples t Test

50

procedure compares means for two groups of cases. Ideally, for this test, the subjects should be randomly assigned to two groups, so that any difference in response is due to the treatment (or lack of treatment) and not to other factors.

ทดสอบคาเฉลยตวแปรของ 2 กลมตวอยางโดยการสมซงปจจยทสงผลทเกดความแตกตางตองมาจากปจจยทก าหนดเทานน

The Independent-Samples t Test

51

การวเคราะหหาคาความแตกตาง โดยการใช t-test

Group Stat istics

137 52.8467 9.7783 .8354

140 47.9643 7.6275 .6446

เพศ

ชาย

หญง

น าหนก

N Mean Std. Deviation

Std. Error

Mean

Independent Samples Test

4.465 .035 4.639 275 .000 4.8824 1.0524 2.8106 6.9543

4.627 257.017 .000 4.8824 1.0552 2.8045 6.9604

Equal variances assumed

Equal variances not

assumed

น าหนก

F Sig.

Levene's Test for

Equality of Variances

t df Sig. (2-tailed)

Mean

Difference

Std. Error

Difference Lower Upper

95% Confidence

Interval of the

Difference

t-test for Equalit y of Means

52

Chi-Square Table หาความสมพนธ Cross tab

ท df=1 a=0.05 Chi Square = 3.84 degree of freedom (df) = (Row-1)x(Column-1) เชน ตาราง Contingency table (2x2 table) ม df=1

ปวย ไมปวย Exposure + Exposure -

a b c d

53

Chi-Square Observed1, Observed2 วเคราะหวาตางกนหรอไม

Ho : Observed1 และ Observed2 ไมตางกน

Ha : Observed1 และ Observed2 ตางกน

Expected=(O1+O2)/2 ท df=1 a = 0.05

Chi Square = 3.84 ถา p value < 0.05 หรอ

ถา c2 > 3.84 จะยอมรบ Ha

(O-E)2

E C2 = S

54

Chi Square Distribution ส าหรบตวเลขจาการนบ (Counted)

โคงเรมท 0 ไปท + Infinity มคาเปนบวกเสมอ ท df=1 a=0.05 Chi Square = 3.84 ถา P < 0.05 จะยอมรบ Ha ถา c2 > 3.84 จะยอมรบ Ha

55

Chi-Square วเคราะหความสมพนธ ของ 2x2 table (Crosstabs)

c2 = n (ad-bc)2

efgh

ปวย ไมปวย รวม Exposure + Exposure -

รวม

Ho : Exposure และการปวยไมสมพนธกน Ha : Exposure และการปวยสมพนธกน ท df=1 a = 0.05 Chi Square = 3.84 ถา p value < 0.05 หรอ ถา c2 > 3.84 จะยอมรบ Ha

a b g c d h e f n

56

Association r = Correlation Coefficient

Positive Association Negative Association No Association Except Non-Linear

. . . . . . . . .

. . . .

. . . . . . . .

r = +1 r = -1 r = 0

57

Association r = Correlation Coefficient

. . . . .

. . . .

. .

x และ y มความสมพนธในรปพาราโบลา

y

x

แมวา slope = 0 x และ y กยงมความสมพนธ กนได Mathematics Relationship

58

ความลาดของเสนถดถอย slope=a intercept=b

y

x

y = ax+b a

b

0

59

r = สมประสทธสหสมพนธ

r เปนบวกแสดงวา x เพม y จะเพม ถา x ลด y จะลดดวย r เปนลบแสดงวา x เพม y จะลด ถา x ลด y จะเพม r เขาใกล 1 แสดงวา x และ y มความสมพนธทศทางเดยวกนและม

ความสมพนธกนมาก r = 0 แสดงวา x และ y ไมมความสมพนธกนเลย (ยกเวน Non-Linear)

60

r จะบอกความสมพนธดงน

r = 0.8-1.0 มความสมพนธกนมาก r = 0.5-0.8 มความสมพนธกนปานกลาง r = 0.2-0.5 มความสมพนธกนนอย r = 0-0.2 ไมควรสนใจกบความสมพนธน

61

r Square (r2)

r2 ไมมหนวย ถา r2 มคาเขาใกล 1 แสดงวาเปอรเซนตท x สามารถอธบายการ

เปลยนของ y มคามาก ถา r2 มคาเขาใกล 0 แสดงวาเปอรเซนตท x สามารถอธบายการ

เปลยนของ y มคานอย

62

ความถดถอยชนดอนๆ ทไมใชเสนตรง Polynomial Regression

y=a+bx+cx2+dx3+... Multiple Regression

y=a+ b1x1 + b2x2 + b3x3 +…+bnxn Non-Linear Regression

y=acbx Sigmoid Curves

ขอบคณ

จบการบรรยาย