Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ......
Transcript of Μ Κούτρας ΜΜπούτσικαςΛύση. (α) Ισχύει ότι, ( | ) 1 ( ) 1 (1 ) ......
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 1
Λύσεις Ασκήσεων για το μάθημα Στατιστική ΙΙ – Έλεγχος Υποθέσεων (2010-11)
Πειραιάς, Ιανουάριος 2011,
Μ. Κούτρας – Μ.Μπούτσικας
Λύσεις Ασκήσεων Κεφαλαίου 1 (Παρ. 1.6). Άσκηση 1.1. Έστω X1 = X ένα τυχαίο δείγμα μεγέθους ν = 1 από μια κατανομή με συνάρτηση πυ-κνότητας
1.0,)(1);( <<+= xxxf θθθ
Για τον έλεγχο της υπόθεσης Η0: θ = 1 έναντι της Η1: θ = 2 χρησιμοποιούμε την κρίσιμη περιοχή K : X > c, όπου c κατάλληλη σταθερά. (α). Να υπολογισθούν οι πιθανότητες σφάλματος τύπου Ι και τύπου II στην περίπτωση που επιλέγουμε c =1/2. (β). Να βρεθεί η τιμή της σταθεράς c έτσι ώστε η πιθανότητα εμφάνισης σφάλματος τύπου Ι να είναι ίση με 0.19 . Στη συνέχεια να υπολογι-σθεί η πιθανότητα σφάλματος τύπου ΙΙ. (γ). Αν x = 0.8 να κάνετε τον έλεγχο με a = 0.19 μέσω του p-value. Λύση. (α) Ισχύει ότι,
]1,0[,1)1(1)(1)|( 1
0∈−=+−=−=> +∫ ccdxxcFcXP
c
θθθθθ ,
και επομένως,
4/3)2/1(11)1|(][ 22 =−=−==>= ccXPIP θ ,
8/1)2/1()2|(][ 33 ====≤= ccXPIIP θ .
(β) Θα είναι 9.019.0119.0][ 2 =⇔=−⇔= ccIP και 729.0)9.0(][ 3 ==IIP .
(γ) Η H0 απορρίπτεται όταν Κ: X > c = 0.9. Επειδή εδώ δεν ισχύει η ανισότητα (διότι εδώ η τιμή της Χ από τα δεδομένα είναι x = 0.8) δεν μπορούμε να απορρίψουμε την Η0 σε ε.σ. a. Ισοδύναμα μπορούμε να πάρουμε απόφαση μέσω του p-value. Θα είναι
36.08.011)1|( 22 =−=−==>= xxXPp-value θ ,
το οποίο δεν είναι μικρότερο του a = 0.19 και επομένως, δεν απορρίπτεται η Η0 σε ε.σ. a = 0.19.
Άσκηση 1.2. Έστω X1, X2,..., Xν ένα τυχαίο δείγμα από την κανονική κατανομή N(0,σ2). Για τον έλεγχο της υπόθεσης Η0: σ2 = 1 έναντι της Η1: σ2 = 4 χρησιμοποιούμε την κρίσιμη περιοχή
∑=
>ν
1
2 .:i
i cXΚ
(α). Αφού βρεθεί η σταθερά c ώστε ο έλεγχος να έχει πιθανότητα σφάλματος τύπου Ι ίση με a = 5%, να υπολογισθεί η πιθανότητα σφάλματος τύπου ΙΙ. (β). Αν x1 = 2.3, x2 = –4.1, x3 = 1.8, να κά-νετε τον έλεγχο σε ε.σ. a = 5%.
Λύση. (α) Αν Xi ~ N(0,σ2), η τ.μ.
∑=
=ν
σ1
2)(i
iXT ,
ακολουθεί χ2 κατανομή με ν β.ε. (ως άθροισμα τετραγώνων ν ανεξάρτητων τυπικών κανονικών τ.μ.). Επομένως, για σ = σ0 = 1,
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 2
)(1)~|()|)(()|(][ 20
220
0201
2
00
1
22 σ
χσσσ νχν
νν cFTcTPHcXPHcXPIPi
i
ii −=>=>=>= ∑∑
==
.
Για να είναι P[I] = a, θα πρέπει
),()( 220
220
acacνν χσχ
σ=⇒=
όπου )(2 aνχ είναι το άνω α-σημείο της χ2 κατανομής με ν β.ε. Συνεπώς (σ12 = 4),
))(():|)(()|(][ 221
20
111
221
20
21
2
11
22 aFHaXPHcXPIIP
i
i
ii νχ
ν
ν
ν
χσσσσχ
σσ
σ ν==≤=≤= ∑∑
==
.
(β). Έχουμε δείγμα μεγέθους ν = 3 με
34.258.1)1.4(3.2 2223
1
2 =+−+=∑=i
ix ,
και .81.7)05.0(1)( 23
220 =⋅== χχσ ν ac Επομένως 23
1 ii x=∑ > c, και απορρίπτουμε την Η0: σ = 1, σε ε.σ. a. Ισοδύναμα, χρησιμοποιώντας το p-value θα έχουμε
000013.0)34.25(1)|34.25( 201
2 ≈−=>= ∑=
νχ
ν
FHXPp-valuei
i .
Μπορούμε να πούμε ότι, μόλις στο 0013.0 % των περιπτώσεων που ισχύει η Η0: σ = 1 λαμβάνου-με ένα τέτοιο δείγμα (και ακόμη πιο ακραίο από αυτό). Με άλλα λόγια, το συγκεκριμένο δείγμα θεωρείται απίθανο να προέρχεται υπό την Η0 και συνεπώς απορρίπτουμε την συγκεκριμένη Η0 (τυπικά, εξετάζουμε αν p-value < a).
Άσκηση 1.5. Έστω X1, X2,..., Xν ένα τυχαίο δείγμα από την κατανομή Ν(μ,1). Για τον έλεγχο της υπόθεσης Η0: μ = μ0 έναντι της Η1: μ = μ0+1 χρησιμοποιείται η επόμενη κρίσιμη περιοχή
Κ: X > c,
όπου c κατάλληλη σταθερά. Να δειχθεί ότι το ελάχιστο μέγεθος ν του δείγματος που απαιτείται ώστε οι πιθανότητες σφαλμάτων τύπου Ι και II του ελέγχου να είναι το πολύ ίσες με α και β αντί-στοιχα, δίνεται από τον τύπο
1])[( 210 +−= −βα zzν
όπου το σύμβολο [x] παριστάνει το ακέραιο μέρος του x.
Λύση. Θα είναι,
acHcXPHcXPIP ≤−
Φ−=−
>−
=>= )/
(1)|//
()|(][ 00
000 νσ
μνσμ
νσμ ,
βνσ
μνσ
μνσ
μ≤
−−Φ=
−−>
−−=≤= )
/1()|
/1
/1()|(][ 0
100
1cHcXPHcXPIIP .
Επομένως,
⎪⎪⎩
⎪⎪⎨
⎧
++≤
+≥⇒
⎪⎪⎩
⎪⎪⎨
⎧
≤−−
≥−
−− ββ νσμ
νσμ
νσμνσμ
10
0
10
0
1/
1/
zc
zc
zc
zcaa
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 3
Παρατηρούμε ότι για να υπάρχει το παραπάνω c θα πρέπει,
1]))([(1 211100 +−≥⇒≤−⇒++≤≤+ −−− βββ σννσσ
νσμ
νσμ zzzzzcz aaa .
όπου σύμφωνα με την εκφώνηση σ = 1.
Λύσεις Ασκήσεων Κεφαλαίου 2 (Παρ. 2.3). Άσκηση 2.1 Έστω τυχαίο δείγμα Χ1, Χ2, …, Χν ~ Ν(μ,σ2), όπου ν = 16, σ = 6 και μ είναι άγνωστη παράμετρος. (α). Να βρεθεί η περιοχή απόρριψης Κ για τον έλεγχο της υπόθεσης
Η0: μ = μ0 έναντι της Η0: μ = μ1
για μ0 = 50, μ1 = 55 σε ε.σ. a = 0.05. (β) Να βρείτε την πιθανότητα σφάλματος τύπου ΙΙ και την ισχύ π(μ1) του παραπάνω ελέγχου. Αν μ0 = 0, μ1 = 1, a = 0.01, σ = 1, να βρεθεί το μέγεθος του δείγματος ν ώστε η ισχύς να είναι τουλάχιστον 1 − β = 0.95. (γ) Να διαπιστώσετε ότι ο έλεγχος που προκύπτει από το ερώτημα (α) είναι ομοιόμορφα ισχυρότατος (ΟΙΕ) για την υπόθεση Η0: μ = μ0 έναντι της Η1: μ > μ0 καθώς και για την υπόθεση Η0: μ ≤ μ0 έναντι της Η1: μ > μ0.
Λύση. (α) Γνωρίζουμε ότι, σύμφωνα με το Λήμμα N-P, ο καλύτερος έλεγχος σε επίπεδο σημα-ντικότητας α για την υπόθεση Η0: μ = μ0 έναντι της Η1: μ = μ1, μ1>μ0, θα έχει περιοχή απόρριψης:
Κ: 47.52645.1166/50
σ/μ 0 >⇔=>
−=
−= XzX
vX
T a .
(β) Θα είναι
=)(IIP )μ=μ|+/σμμ
/σμ()μ=μ|z
/σμ( 12
102
112
0aa z
vvXP
vX −
≤−
=≤− )+
/σμμ(Φ
210
azv
−= .
και
π(μ1)= )/σμμ(Φ)+
/σμμ(Φ1)(1
201
210
aa zv
zv
IIP −−
=−
−=− .
Επίσης
8.15)33.2645.1()μ(μ
)()μ(μ
)(+
σ/μμ
1)+σ/
μμ(Φ1)(
22
01
22
201
21
2
110
101
≈+≈−+
=−−
≥⇔≤−
⇔
−≥−
−=
−−
βββ
σσ
βμπ
zzzzvzz
v
zv
aaa
a
(γ) Παρατηρούμε ότι η κρίσιμη περιοχή δεν εξαρτάται από την τιμή μ1 και επομένως η ίδια κρίσι-μη περιοχή μπορεί να χρησιμοποιηθεί και για τον έλεγχο της υπόθεσης
H0: μ = μ0 έναντι της Η1: μ > μ0
(απλή έναντι μονόπλευρης) οδηγώντας και πάλι σε βέλτιστο έλεγχο. Η τιμή της μ1 ωστόσο επη-ρεάζει την P[ΙΙ] καθώς και την ισχύ του ελέγχου. Όταν η μ1 αυξάνεται τότε η P[II] μειώνεται και η ισχύς π(μ1) του ελέγχου αυξάνεται. Επίσης οποιοδήποτε και αν είναι το μ0 παραπάνω, προκύπτει η ίδια κρίσιμη περιοχή Κ: cX > . Επομένως, η ίδια Κ μπορεί να χρησιμοποιηθεί και για τον έλεγ-χο της υπόθεσης
H0: μ ≤ μ0 έναντι της Η1: μ > μ0
(μονόπλευρη έναντι μονόπλευρης) οδηγώντας και πάλι σε βέλτιστο έλεγχο. Το c καθορίζεται :
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 4
av
c
v
c
vc zaaHcXPIP =⇔=Φ−=Φ−⇔=>=
−−−
≤≤/
0/
0/0 )(1))(1(sup)|(sup)(sup
00σ
μ
σ
μ
σμ
μμμμ
(Όμοια κατασκ. Έλεγχο H0: μ = μ0 έναντι της Η1: μ < μ0, και H0: μ ≥ μ0 έναντι της Η1: μ < μ0)
Άσκηση 2.2. Επιθυμούμε να εξετάσουμε αν ο μέσος μ ενός κανονικού πληθυσμού N(μ,σ2) είναι μ = 100 (Η0) ή μ > 100 (Η1). Λαμβάνουμε τ.δ. μεγέθους ν = 10, στο οποίο βρίσκουμε μέσο 102=x . (α) Αν σ = 5 να κάνετε τον συγκεκριμένο έλεγχο σε ε.σ. α = 5% (υπόδ. χρησιμοποιήστε το αποτέ-λεσμα της Άσκ.1). (β) Να υπολογίσετε το p-value του παραπάνω δείγματος και μέσω αυτού να επανελέγξετε την Η0 έναντι της Η1. (γ) Αν ο ίδιος δειγματικός μέσος 102=x προέκυπτε από δείγ-μα ν = 50, τι απόφαση θα παίρναμε; Να βρείτε το αντίστοιχο p-value. (δ) Πόσο πρέπει να είναι το ν ώστε π(101) = 1 − β ≈ 0.95;
Λύση (α) Σύμφωνα με το Λήμμα N-P, ο καλύτερος έλεγχος σε ε.σ. a έχει περιοχή απόρριψης:
Κ: azv
XT >−
=σ/
μ0 .
Ισχύει ότι
6451264911051001020 .z.
/vσ/μxt a =<≈
−=
−=
Επομένως δεν απορρίπτουμε την Η0.
(β) Το p-value είναι
%3.10)26491(1)|( 0 ≈Φ−=>=− .HtTPvaluep
(γ) Τώρα θα είναι 64518282 .z.t a =>= : απορρίπτεται η Η0, με αντίστοιχο p-value:
=− valuep )828.2(1 Φ− %234.0≈
Επίσης, η συνάρτηση ισχύος
π(μ) = )z/σμμ(Φ
20
av−
− ,
για ν = 10 και ν = 50 θα έχει τη μορφή:
102 104 106 108
0.2
0.4
0.6
0.8
1.0
μ
Παρατηρούμε ότι αυξάνεται όσο απομακρύνεται το μ από το μ0.
(δ) Θα πρέπει,
270)μμ(
)(
/σ
μμ)
/σ
μμ(Φ1][ 2
0
22
2
0
2
0 ≈−
+=⇔=−
−⇔=−
−−= β
β
σβ
zzvzz
vz
vIIP a
aa
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 5
Άσκηση 2.3. Η μέση γεωργική παραγωγή ανά στρέμμα ενός συγκεκριμένου προϊόντος σε μια α-γροτική περιοχή είναι 35 τόνοι με τυπική απόκλιση 3 τόνους. Μετά την χρησιμοποίηση ενός νέου λιπάσματος, η μέση παραγωγή σε 100 τυχαία επιλεγμένα στρέμματα ανήλθε στους 35.6 τόνους. Να ελέγξετε σε ε.σ. 5% αν η συγκεκριμένη αύξηση είναι στατιστικά σημαντική, δηλαδή αν το συ-γκεκριμένο λίπασμα ευνοεί την αύξηση της μέσης παραγωγής (θεωρείστε ότι η διασπορά της πα-ραγωγής έχει παραμείνει η ίδια). Να βρείτε το αντίστοιχο p-value του δείγματος.
Λύση. Για μεγάλο δείγμα, η Y = X ακολουθεί προσεγγιστικά κανονική κατανομή Ν(μ,σ2/ν). Θέ-λουμε να ελέγξουμε την Η0: μ = μ0 = 35, έναντι της Η1: μ > μ0 = 35. Η κρίσιμη περιοχή του ελέγ-χου (περιοχή απόρριψης τα Η0) θα έχει τη μορφή Y > c (από λήμμα N-P) και επομένως τελικά
Κ: 645.12100/3
356.35/
0 =>=−
=−
= azv
xtσ
μ
από όπου απορρίπτεται η Η0 σε ε.σ. a. Επίσης,
%.275.22)(1)|( 0 =Φ−=>=− HtTPvaluep
Άσκηση 2.4. Με βάση ένα τ.δ. Χ1, Χ2, …, Χν ~ Ν(μ,82) θέλουμε να ελέγξουμε σε ε.σ. α = 5% την Η0: μ = 80 έναντι της Η1: μ = 76. Να δειχθεί ότι η κρίσιμη περιοχή του IE είναι της μορφής K:
acx < . Να βρεθεί το ελάχιστο ν και το ca έτσι ώστε P[I] ≤ 0.05, P[II] ≤ 0.10.
Λύση Όμοια με την Άσκ. 1 βρίσκουμε ότι η περιοχή απόρριψης είναι acX < . Θα είναι
aHv
cv
XPHcXPIP a
a ≤−
<−
=<= )|/μ
σ/μ
()/(][ 000
0σ
και επειδή, κάτω από την Η0, )/σ,μ(~ 20 vNX , συμπεραίνουμε τελικά ότι
aaaaa z
vczz
vc σμ
/μ
010 −≤⇒−=≤
−−σ
.
Η πιθανότητα σφάλματος τύπου ΙΙ θα είναι ίση με
=][IIP β≤−
≥−
=≥ )μ=μ|σ/
μσ/
μ()μ=μ|( 1
111 v
cv
XPcXP a
a .
Και άρα,
.σμσ/
μ1
1ββ z
vcz
vc
aa +≥⇔≥−
Τελικά,
352225.34)7680645.128.1(46)
μμ(σσμσμ 22
10
201 =⇒=
−+
=−+
≥⇒−≤≤+ vzz
vzv
czv
aaa
ββ
και
.775.77645.13588028.1
35876731.77 =−≤≤+= ac
Αν θέλουμε ελάχιστο P[I] λαμβάνουμε το μικρότερο δυνατό ca.
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 6
Άσκηση 2.5. Έστω ένα τ.δ. Χ1, Χ2, …, Χν ~ Ν(0,σ2). (α) Αν ν = 10, να δοθεί η κρίσιμη περιοχή του ελέγχου σε ε.σ. a=5% της υπόθεσης Η0: σ = 1 έναντι της Η0: σ = 2. Στη συνέχεια να βρεθεί η πιθανότητα σφάλματος τύπου ΙΙ και η ισχύς του παραπάνω ελέγχου. (β) Να βρεθεί το ελάχιστο μέγεθος του δείγματος ν ώστε η ισχύς να ελέγχου σε ε.σ. a=5% της υπόθεσης Η0: σ = 1 έναντι της Η0: σ = 2 να είναι τουλάχιστον 0.95.
Λύση (α) Είναι γνωστό ότι η περιοχή απόρριψης της Η0 έχει γενικά τη μορφή
Κ: )()(1 2
1
220
aXv
ii νχμ
σ>−∑
=
και εδώ,
Κ: .31.18)05.0(1)( 210
220
1
2 ≈⋅=>∑=
χχσ aX v
v
ii
Επίσης,
⎟⎟⎠
⎞⎜⎜⎝
⎛=≤
−=≤−= ∑∑
==
)()|)()(()|)()((][ 221
20
12
21
20
1
2
11
220
1
22 aFHa
XPHaXPIIP vv
v
i
iv
v
ii
vχ
σσ
χσσ
σμ
χσμχ
και άρα
( ) 91756.0082.015775.41)05.0(411)(1)4( 2
10210
2210
221
20 =−=−=⎟
⎠⎞
⎜⎝⎛−=⎟⎟
⎠
⎞⎜⎜⎝
⎛−=
χχχχχ
σσπ FFaF v
v
(β) Θα είναι
)95.0(2)05.0()1()(1)(1)( 222221
202
21
202
1 2 vvvvv aaFv
χχβχχσσβχ
σσσπ
χ≤⇔−≤⇔−≥⎟⎟
⎠
⎞⎜⎜⎝
⎛−=
και κατασκευάζοντας τον πίνακα ν )05.0(2
vχ )95.0(2 2vχ
45 61.6562 61.2245 46 62.8296 62.878 47 64.0011 64.5352 48 65.1708 66.1962 49 66.3386 67.8606 50 67.5048 69.5285
βλέπουμε ότι θα πρέπει ν = 46, και τότε,
95033.0)(1)( 2462
1
202
1 246
=⎟⎟⎠
⎞⎜⎜⎝
⎛−= aF χ
σσσπ
χ
και
83.62)( : 220
1
2 =>∑=
aXK v
v
ii χσ .
Άσκηση 2.6. Επιθυμούμε να ελέγξουμε αν η τιμή πώλησης ενός αγαθού έχει διασπορά ίση με 9 ή μεγαλύτερη από 9. Λαμβάνοντας τ.δ. μεγέθους ν = 30 βρίσκουμε σε αυτό (δειγματική) διασπορά 12 και (δειγματικό) μέσο 101. Να ελέγξετε την παραπάνω υπόθεση σε ε.σ. 1% (μέσω κατάλληλης κρίσιμης περιοχής K και μέσω του αντίστοιχου p-value) θεωρώντας ότι η τιμή του αγαθού ακο-λουθεί κανονική κατανομή με μέσο 100.
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 7
Λύση. Θα είναι H0 : σ = σ0 = 3, Η1: σ > σ0 = 3. Η περιοχή απόρριψης της Η0 έχει τη μορφή
Κ: 89.50)()( 2
1
2
0
=>−
=∑=
aXT v
v
i
i χσ
μ
Έχουμε ότι
3063781229101301210130291
11 2
1
2
1
22
1
222 =⋅+⋅=⇒=⎟⎠
⎞⎜⎝
⎛⋅−=⎟
⎠
⎞⎜⎝
⎛−
−= ∑∑∑
===
v
ii
v
ii
v
ii XXXvX
vs
Άρα
( ) 4210130100210030306378912
91)( 22
1
2
1
2
0
=⋅⋅⋅−⋅+=⎟⎠
⎞⎜⎝
⎛−+=
− ∑∑==
XvvXX v
ii
v
i
i μμσ
μ
από όπου δεν μπορούμε να απορρίψουμε την Η0 σε ε.σ. 1% (42 < 50.89). Εξάλλου,
%15.7)42(1)|42( 230
0 ≈−=>=−χ
FHTPvaluep > a
Άσκηση 2.7. Έστω τ.δ. Χ1, Χ2, …, Χν όπου οι τ.μ. Χi ακολουθούν την κατανομή Poisson με παρά-μετρο λ. (α) Να δείξετε ότι η περιοχή απόρριψης του ισχυρότατου ελέγχου της Η0 : λ = λ0 έναντι της Η1 : λ = λ1 με λ1 > λ0 είναι της μορφής
ai
i cX >∑=
ν
1
.
(β) Να βρείτε ΟΙΕ για την Η0 : λ ≤ λ0 έναντι της Η1 : λ > λ1 (μέσω της ΕΟΚ). (γ) Αν λ0 = 0.3, λ1 = 0.4, α = 0.05, ν = 20, να βρεθεί ο μικρότερος ακέραιος ca που οδηγεί σε P[I] ≤ a (συντηρητικός έλεγχος με P[I] όσο το δυνατό πιο κοντά στο a). Να βρείτε την αντίστοιχη ισχύ. (δ) Αν λ0 = 0.3, λ1 = 0.4, α = 0.05, ν = 20, να κατασκευάσετε έναν τυχαιοποιημένο έλεγχο (ca,γ) ώστε P[I] = α, και να βρείτε την ισχύ του. (ε) Σε ένα σημείο της εθνικής οδού ο μέσος αριθμός ατυχημάτων που συμβαίνουν την περίοδο Μάιο - Σεπτέμβριο είναι λ0 = 0.3 ανά εβδομάδα. Μετά από κάποια έργα που έγιναν στο σημείο αυτό (τα οποία ολοκληρώθηκαν αρχές Μαΐου) καταγράφηκαν τα ακόλου-θα ατυχήματα τις επόμενες 20 εβδομάδες:
1, 1, 1, 2, 0, 0, 1, 0, 0, 0, 0, 1, 2, 0, 0, 0, 1, 0, 1, 2.
Αυξήθηκε η επικινδυνότητα του συγκεκριμένου σημείου; Να δώσετε το p-value του παραπάνω δείγματος.
Λύση. (α) Από το λήμμα Ν-P η περιοχή απόρριψης της H0 θα είναι
ce
xe
xe
xfxfK
v
ii
i
i
xv
i
xvi
i
xvi
ivi
ivi <
∑
⎟⎟⎠
⎞⎜⎜⎝
⎛=
∏
∏=
∏∏ =−−
−=
−=
=
= 101
1
0
1
0)(
11
01
11
01
!
!)λ;()λ;(=)λ(:
λλ
λ
λλλ
λ
λ
x
cxvv
ii lnln)()λ(ln
1
0
101 <⎟⎟
⎠
⎞⎜⎜⎝
⎛∑+−−=⇔= λ
λλλx a
v
ii cx >⇔∑
=1
(β) Η κατανομή Poisson ανήκει στην EOK. Πράγματι,
)()(!
1=);( )()(ln xheβx
eexf xTηxλ λλ λλ =−
όπου η συνάρτηση η(λ) = lnλ είναι αύξουσα και επομένως από το Θεώρημα 2 (ΟΙΕ στην ΕΟΚ) η κρίσιμη περιοχή
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 8
Κ: a
v
ii
v
ii cXXT >= ∑∑
== 11
)(
ορίζει OIE.
(γ) Ισχύει ότι )(~| 001
λvPoHXv
ii∑
=
και
)(1)|(][ )λ(01
0 avPoa
v
ii cFHcXPIP −=>= ∑
= από όπου κατασκευάζουμε τον πίνακα
ca P[I] 6 0.393697 7 0.256020 8 0.152763 9 0.083924
10 0.042621 11 0.020092 12 0.008827
Επιλέγουμε ca = 10 με P[Ι] = 0.042621 και
1841.0)(1)|(][1 )(11
1≈−=>=−= ∑
=avPoa
v
ii cFHcXPIIP λπ
(δ) Θα έχουμε
⎪⎩
⎪⎨
⎧
<∑=∑>∑
=10,010,10,1
)(
i
i
i
xxx
γφ x
με γ = 0.1787 διότι
P[I] = 05.00.0413 04262.0)|10()|10()|)(( 000 =+==∑+>∑= γγφ HXPHXPHE iiX
και
2018.00.09926 1841.0)|10()|10()|)(( 111 =+==∑+>∑== γγφπ HXPHXPHE iiX
(ε) Από το δείγμα βρέθηκε ότι 131
=∑=
v
iix και άρα
008827.0)12(1)|13( )λ(01
0≈−=≥=− ∑
=vPo
v
ii FHXPvaluep
Άσκηση 2.8. Έστω τ.δ. μεγέθους ν από την κατανομή με σ.π.π.
.1],1,0[,)1();( −>∈+= θθθ θ xxxf
Να βρεθεί ΟΙΕ σε ε.σ. a για την υπόθεση Η0: θ = θ0 έναντι της Η1: θ > θ0 και να δοθεί η αντίστοι-χη συνάρτηση ισχύος π(θ).
Λύση. Θα είναι
cxxx
xfxfK i
vi
v
ivi
ivi
ivi
ivi <∏⎟⎟
⎠
⎞⎜⎜⎝
⎛++
=+∏+∏
=∏∏ −
==
=
=
= )(1
1
0
11
01
11
01 10
1
0
11
)1()1(
)θ;()θ;(=)λ(: θθ
θ
θ
θθ
θθx
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 9
a
v
ii
v
ii cxcxv >⇔<−+⎟⎟
⎠
⎞⎜⎜⎝
⎛++
⇔ ∑∑== 11
101
0 lnln)(11ln θθ
θθ
Αν Υ = −lnX, τότε ισχύει ότι 1)(1)(1)()ln()()( +−−− −=−=≥=≤−=≤= θyy
Xy
Y eeFeXPyXPyYPyF και άρα
)1,(~ln11
+=− ∑∑==
θvGammaYXv
ii
v
ii
Επομένως 22
1~)1(2 v
v
iiY χθ ∑
=
+ , από όπου προκύπτει ότι
aHcYPHcXPIP a
v
iia
v
ii =+−<+=−<−= ∑∑
==
)|)1(2)1(2()|ln(][ 001
001
θθ
)1(2)1(
)1()1(20
222
20 +−
−=⇔−=+−⇔θ
χχθ
acac v
ava
Επίσης,
))1(11(
)|)1(11)1(2()|
)1(2)1(ln(
22
0
1
122
0
1
111
0
22
1
22
aF
HaYPHaXP
v
v
v
ii
vv
ii
v−
++
=
−++
<+=+−
<−= ∑∑==
χθθ
χθθθ
θχπ
χ
Άσκηση 2.9. Έστω Χ1, Χ2, …, Χν τ.δ. από την εκθετική κατανομή με σ.π.π.
.0,0,1);( >>=−
θθ
θ θ xexfx
(α) Να βρεθεί ομοιόμορφα ισχυρότατος έλεγχος σε ε.σ. a της
Η0 : θ ≤ θ0 έναντι της Η1 : θ > θ0.
(β) Να βρεθεί η συνάρτηση ισχύος π(θ). (γ) Ο μέσος χρόνος διάρκειας μιας τηλεφωνικής κλήσης σε ένα δίκτυο είναι 2 λεπτά. Μετά από μια μείωση της χρονοχρέωσης των κλήσεων στο δίκτυο αυτό, καταγράφηκε η διάρκεια 300 κλήσεων η οποία ήταν συνολικά 660 λεπτά (δηλ. δειγματική μέση διάρκεια κλήσης 2.2 λεπτά). Υποθέτοντας ότι η διάρκεια μιας κλήσης ακολουθεί εκθετική κατανομή, να ελέγξετε σε ε.σ. α = 0.01 αν η αύξηση αυτή είναι στατιστικά σημαντική (δηλαδή αν επήλθε πραγματική αύξηση της μέσης διάρκειας μιας κλήσης μετά την μείωση της χρέωσης). Να βρεθεί το αντίστοιχο p-value του δείγματος. (δ) Να βρείτε προσεγγιστικά τα ca, P[II], p-value για μεγάλο ν, χρησιμοποιώντας το Κεντρικό Οριακό Θεώρημα.
Λύση. (α) Η συγκεκριμένη κατανομή ανήκει στην EOK. Πράγματι,
)()(1);( )()()/1( xheβexf xTηx θθ θθ
θ == ⋅−
όπου η συνάρτηση η(θ) = –1/θ είναι αύξουσα και επομένως από το Θεώρημα 2 (ΟΙΕ στην ΕΟΚ) η κρίσιμη περιοχή
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 10
Κ: a
v
ii
v
ii cXXT >= ∑∑
== 11
)(
ορίζει OIE. Ισχύει ότι
22
11
~2)1(~ v
v
ii
v
ii X
θv,GammaX χ
θ ∑∑==
⇒
(διότι αν Y ~ Gamma(a,λ) τότε η τ.μ. 2λΥ~ χ2 με 2a β.ε.) και άρα
)(2
)(2)|22()|(][ 22
022
00
0100
1acacaHcXPHcXPIP vavaa
v
iia
v
ii χ
θχ
θθθ=⇔=⇔=>=>= ∑∑
==
(β) Η ισχύς θα είναι ίση με π(θ) = 1 − P[II] όπου
))(()|22()|(][ 22
01
11
122
aFHcXPHcXPIIP va
v
iia
v
ii
vχ
θθ
θθ χ=≤=≤= ∑∑
==
.
(γ) Από τα δεδομένα θα είναι
Κ: 516.683)(2660 22
10
=>= ∑=
ax v
v
ii χ
θ : δεν ισχύει και άρα δεν απορ. Η0
με
.04489.0)660(1)660(1)|660( 220 )/1,(0
1
aFFHXPvaluepv
vG
v
ii >=−=−=>=− ∑
=χθ
(δ) Από ΚΟΘ, για μεγάλο ν (π.χ. >30 ή >100) ισχύει προσεγγιστικά,
),(~ 2
1θθ vvNX
v
ii∑
=
και επομένως,
aaa
v
i ia
v
ii z
vvcaH
vvc
v
vXPHcXPIP ≈
−⇔≈
−>
−≈>= ∑∑ =
=20
002
0
020
010
1)|()|(][
θθ
θθ
θ
θ
δηλαδή, )(0 aa zvvc +≈θ . Επειδή )(2
22
0 ac va χθ= , παρεμπιπτόντως βρίσκουμε ότι, για μεγάλο ν,
)(2)()()(2
220
22
0avav zvvazvva +≈⇔+≈ χθχθ
Τέλος,
..)()|()|(][2122
111
1=
−Φ=
−≤
−≈≤= ∑∑ =
= θ
θ
θ
θ
θ
θ
v
vcH
v
vc
v
vXPHcXPIIP aa
v
i ia
v
ii
και
.04163.0)732.1(1)|660(1)|660( 020
00
1
≈Φ−≈−
Φ−≈>=− ∑=
Hv
vHXPvaluepv
ii
θθ
Άσκηση 2.10. Έστω Χ1, Χ2, …, Χν, τ.δ. από την κατανομή Weibull με σ.π.π.
0,0,1);( /1 >>= −− θθ
βθ θβ xexxfβx , και β > 0 γνωστό.
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 11
(α) Να βρεθεί ομοιόμορφα ισχυρότατος έλεγχος σε ε.σ. a της
Η0 : θ ≤ θ0 έναντι της Η1 : θ > θ0.
(β) Να βρεθεί η συνάρτηση ισχύος π(θ).
Λύση. Παρατηρούμε ότι η συγκεκριμένη κατανομή ανήκει στην EOK. Πράγματι,
)()();( )()(1)/1( xheβxexf xTηx β θβθ θθβθ == −⋅−
όπου η συνάρτηση η(θ) = –1/θ είναι αύξουσα και επομένως από το Θεώρημα 2 (ΟΙΕ στην ΕΟΚ) η κρίσιμη περιοχή
Κ: a
v
ii
v
ii cXXT >=∑∑
== 11
)( β
ορίζει OIE. Αν Χ ~ Weibull (β,1/θ), τότε η τ.μ. Υ = Χβ ~ εκθετική(1/θ). Πράγματι, η σ.π.π. της τ.μ. Y θα είναι
)()()()()()()( /1/1/1/1 βββββ ydydyfyF
dydyXP
dydyXP
dydyF
dydyf XXYY ==≤=≤==
.0,1)(1)( /1/1
/)(1/11/1
/1 /1
>=== −−
−−−
yeyeyyyf yyX
β θβ
θβββ
β
θβθβ
ββ
Επομένως,
)1(~11 θ
v,GammaYXWv
ii
v
ii ∑∑
==
== β
και μπορεί να δειχθεί ότι 22~2
vW χθ
. Άρα τελικά,
)(2
)(2)|22()|(][ 22
022
00
0100
1acacaHcXPHcXPIP vavaa
v
iia
v
ii χθχ
θθθββ =⇔=⇔=>=>= ∑∑
==
και
))((1)2(1)|22()|()(π 22
01
11
122
22
aFcFHcXPHcXP vaa
v
iia
v
ii χ
θθ
θθθθ
νν χχββ −=−=>=>= ∑∑
==
Άσκηση 2.11. Το τυχαίο δείγμα: 0, 0, 0, 1, 2, 0, 1, 0, 2, 1, προέρχεται από την γεωμετρική κατα-νομή με σ.π.
)1,0(,...2,1,0)1();( ∈=−= pxpppxf x
Να ελέγξετε σε ε.σ. a = 5% αν ισχύει η Η0: p ≤ p0 = 1/3 έναντι της Η1: p > p0 = 1/3 μέσω του p-value του δείγματος.
Λύση. Η περιοχή απόρριψης της Η0 είναι της μορφής
cpp
pp
pppp
xfxfK
v
ii
i
ixv
xvi
xvi
ivi
ivi <
∑
⎟⎟⎠
⎞⎜⎜⎝
⎛−−
⎟⎟⎠
⎞⎜⎜⎝
⎛=
−∏−∏
=∏∏ =
=
=
=
= 1
1
0
1
0
111
001
11
01
11
)1()1(
)θ;()θ;(=)λ(: x a
v
ii cx <∑⇔
=1
η οποία προκύπτει και μέσω της ΕΟΚ (Θεώρημα 2). Ισχύει ότι
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 12
027284.0)7(1
=≤=− ∑=
v
iiXPvaluep
το οποίο είναι μικρότερο του a και επομένως απορρίπτουμε την Η0.
Λύσεις Ασκήσεων Κεφαλαίου 3 (Παρ. 3.6). Άσκηση 3.1. Έστω Χ1,Χ2, …, Χν τυχαίο δείγμα από την κανονική κατανομή Ν(μ,σ2) με σ2 γνω-στό. (α). Χρησιμοποιώντας την κρίσιμη περιοχή του ελέγχου της Η0: μ = μ0 έναντι της H1: μ ≠ μ0 να προσδιορίσετε το σύνολο των τιμών του μ0 για τις οποίες η υπόθεση Η0: μ = μ0 δεν απορρίπτε-ται (σε ε.σ. a, έναντι της H1). Να συγκρίνετε το σύνολο αυτό με το γνωστό διάστημα εμπιστοσύ-νης για το μ, συντελεστού 1 – a. Πως μπορούμε να χρησιμοποιήσουμε το δ.ε. για να ελέγξουμε τις παραπάνω υποθέσεις; (β). Να εκφράσετε το p-value ενός δείγματος x1,x2,…,xν για τον έλεγχο της Η0: μ = μ0 έναντι της H1: μ ≠ μ0. (γ) Να βρείτε την συνάρτηση ισχύος του ελέγχου του ελέγχου της Η0: μ = μ0 έναντι της H1: μ ≠ μ0 αν ν = 100, μ0 = 10, σ = 10, α = 5%. Αν ισχύει μ = 12, με τι πιθα-νότητα θα πάρουμε σωστή απόφαση;
Λύση (α) Το σύνολο των τιμών του μ0 για τις οποίες η υπόθεση Η0: μ = μ0 δεν απορρίπτεται είναι
20
0 /: a/z
X≤
−
νσμ
μ
ή ισοδύναμα,
],[ 220 a/a/ zXzXνσ
νσμ +−∈
Το παραπάνω ταυτίζεται με το γνωστό δ.ε. για το μ συντελεστού 1 – a. Επομένως, απορρίπτουμε την H0 μέσω της παραπάνω κρίσιμης περιοχής ⇔ το μ0 δεν ανήκει στο παραπάνω δ.ε. (β) Το p-value δείγματος το οποίο είχε δειγματικό μέσο x είναι
)|||()|||()||||(| 000 HtTPHtTPHtTPvaluep −<+>=>=−
))/
||(1(2|))(|1(2 0
νσμ−
Φ−=Φ−=xt
(γ) Θα είναι
)|()|/
()( 12020120 HzXzPHz
XPIIP a/a/a/ ν
σμνσμ
νσμ
+≤≤−=≤−
=
)νσ/
()νσ/
()|νσ/νσ/νσ/
( 20
20
120
20
a/a/a/a/ zzHzXzP −−
Φ−+−
Φ=+−
≤−
≤−−
=μμμμμμμμμ
και άρα
)10010/1210()96.1
10010/1210()
νσ/()
νσ/()( 22
02
0a/a/a/ zzz −
−Φ+−
−−Φ≈−
−Φ+−
−−Φ=
μμμμμπ
515991.000003.0515953.0)96.12()96.12( ≈+≈−−Φ+−Φ≈ .
Άσκηση 3.2. Ο δειγματικός μέσος από δείγμα μεγέθους ν = 100 από την κανονική κατανομή Ν(μ,σ2) βρέθηκε ίσος με 11, ενώ γνωρίζουμε ότι σ = 4. Να ελέγξετε αν ισχύει η Η0: μ = 10 έναντι της Η1: μ ≠ 10 σε ε.σ. a = 5%: (α) μέσω της κρίσιμης περιοχής Κ, (β) μέσω κατάλληλου δ.ε. για το μ, και (γ) μέσω του p-value (z0.05/2
≈ 1.96).
Λύση (α) Η περιοχή απόρριψης της Η0 είναι
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 13
20
/||: a/z
XTK >
−=
νσμ
⇔ 96.15.2100/41011
: >=−
=TK : ισχύει, απορρίπτεται η Η0
(β) Ισχύει ότι
],z[ 2/20 a/a zXXνσ
νσμ +−∈ ⇔
11.784][10.216, ]1.96100411,1.96
100411[0 =+−∈μ : δεν ανήκει, απορρίπτεται η Η0
(γ) Θα είναι
0.012419 ))5.2(1(2|))(|1(2)||||(| 0 =Φ−=Φ−=>=− tHtTPvaluep < 5% ,
από όπου απορρίπτεται η Η0.
Άσκηση 3.3. Από τυχαίο δείγμα 150 εμπορικών καταστημάτων της πόλεως Α προέκυψε ότι το μέσο ετήσιο ενοίκιο τους είναι 13632 ευρώ, ενώ από απογραφή που έγινε στην πόλη Β προέκυψε ότι το μέσο ετήσιο ενοίκιο όλων των εμπορικών καταστημάτων της είναι 13452 ευρώ με τυπική απόκλιση 1864 ευρώ. (α) Να εξεταστεί αν μπορούμε να δεχθούμε, σε επίπεδο σημαντικότητας 0.10 ότι τα ενοίκια των εμπορικών καταστημάτων της πόλεως Α δε διαφέρουν από εκείνα της πό-λεως Β, όταν είναι γνωστό ότι οι δύο κατανομές έχουν την ίδια διακύμανση. (β) Υπό τις ίδιες πα-ραδοχές και δεδομένα, να εξεταστεί αν τα ενοίκια των εμπορικών καταστημάτων της Α είναι υ-ψηλότερα από εκείνα της Β, σε ε.σ. 0.10 (z0.05 ≈ 1.645, z0.05 ≈ 1.281)
Λύση (α) Η περιοχή απόρριψης της Η0 είναι
20
/||: a/z
XTK >
−=
νσμ
⇔ 645.11827.1150/1864
1345213632||: >=
−=TK
: δεν ισχύει, δεν απορρίπτεται η Η0 έναντι αμφίπλευρης Η1
(β) Η περιοχή απόρριψης της Η0 τώρα είναι
azXTK >−
=νσμ
/: 0 ⇔ 281.11827.1
150/18641345213632: >=
−=TK
: δεν ισχύει, δεν απορρίπτεται η Η0 έναντι μονόπλευρης Η1
Τα παραπάνω γίνονται και μέσω των p-values
(α) 0.2369 ))1827.1(1(2|))(|1(2)||||(| 0 =Φ−=Φ−=>=− tHtTPvaluep > a
(β) 0.1184 )1827.1(1)(1)|( 0 =Φ−=Φ−=>=− tHtTPvaluep > a
Άσκηση 3.4. Να κάνετε και πάλι τα ερωτήματα (α), (β) της Άσκησης 1, αυτή τη φορά θεωρώντας ότι το σ δεν είναι γνωστό.
Λύση (α) Το σύνολο των τιμών του μ0 για τις οποίες η υπόθεση Η0: μ = μ0 δεν απορρίπτεται είναι
)2(/
: 10
0 a/tSX
−≤−
νν
μμ
ή ισοδύναμα,
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 14
)]2
(),2
([ 110atSXatSX −− +−∈ νν νν
μ .
Ταυτίζεται με το γνωστό δ.ε. για το μ συντελεστού 1 – a. Επομένως, απορρίπτουμε την H0 μέσω της παραπάνω κρίσιμης περιοχής ⇔ το μ0 δεν ανήκει στο παραπάνω δ.ε.
(β) Το p-value δείγματος το οποίο είχε Τ = t είναι
|))|(1(2)||||(|10 tFHtTPvaluep t −
−=>=−ν
Άσκηση 3.5. Ο δειγματικός μέσος και η δειγματική διασπορά από δείγμα μεγέθους ν = 20 που προέρχεται από την κανονική κατανομή βρέθηκαν ίσα με 12 και 22.8 αντίστοιχα. Να ελέγξετε αν ισχύει η Η0: μ = 10 έναντι της Η1: μ ≠ 10 σε ε.σ. a = 5%: (α) μέσω της κρίσιμης περιοχής K, (β) μέσω κατάλληλου δ.ε. για το μ, και (γ) μέσω του p-value. (t19(0.05/2)≈ 2.09302)
Λύση (α) Η περιοχή απόρριψης της Η0 είναι
∑=
− −−
=−
=>ν
1
2201 )(
11,
/),2(||:
ii XXS
SXTa/tTK
ννμ
ν
και επειδή,
,093.2)2(873.1|20/8.22
1012|: 1 =>=−
− a/tK ν δεν ισχύει, δεν απορρίπτεται η Η0
(β)
)]2
(),2
([ 110atSXatSX −− +−∈ νν νν
μ = [9.765, 14.234] : ανήκει, δεν απορρίπτεται η Η0
(γ)
0765.0))873.1(1(2|))|(1(2)||||(|1910 ≈−≈−=>=−
− tt FtFHtTPvaluepν
> a
από όπου δεν απορρίπτεται η Η0.
Άσκηση 3.6. Έστω ότι ο αριθμός μηνιαίων πωλήσεων ενός προϊόντος από τους αντιπροσώπους μιας εταιρείας αυτοκινήτων ακολουθεί την Ν(40, 100). Το προσωπικό των αντιπροσώπων της ε-ταιρείας παρακολουθεί κάποια σεμινάρια και έστω Χ1, Χ2,…, Χν οι πωλήσεις των αντιπροσώπων τον επόμενο μήνα. Πως θα ελέγχατε σε ε.σ. a αν μεταβλήθηκαν οι μέσες πωλήσεις ή όχι. Ποια θα ήταν η απάντησή σας στο παραπάνω ερώτημα αν για ν = 5 αντιπροσώπους είχαμε xi = 35, 45, 38, 40, 43. (a = 5%). Να δώσετε το αντίστοιχο p-value.
Λύση. Επιθυμούμε να ελέγξουμε αν Η0: μ = μ0 = 40, Η1: μ ≠ μ0 με σ2 άγνωστο. Απορρίπτουμε την Η0 όταν
νμ
ν /),2(||: 0
1 SXTa/tTK −
=> −
Υπολογίζουμε από τα δεδομένα:
3.96232 ,7.15)(1
1,112867.05/7.15
402.40/
ν
1
220 ==−−
==−
=−
= ∑=
sxxssxt
iiνν
μ
και επομένως,
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 15
7764.2)2/05.0()2/(112867.0 41- ==<= tatt ν
από όπου δεν μπορούμε να απορρίψουμε την Η0. Το p-value θα είναι
915574.0))112867.0(1(2|))|(1(2)||||(|410 ≈−≈−=>=−
− tt FtFHtTPvaluepν
Άσκηση 3.7. Κατά το έτος 2008 η μέση μηνιαία καταναλωτική δαπάνη των οικογενειών μιας πό-λης ήταν μ0 =14.4 εκατοντάδες ευρώ. Κατά το επόμενο έτος συγκεντρώθηκαν στοιχεία μέσης μη-νιαίας καταναλωτικής δαπάνης (Χ, σε εκατοντάδες ευρώ) από τυχαίο δείγμα 10 οικογενειών της πόλεως αυτής, τα οποία έδωσαν τα ακόλουθα αθροίσματα:
2.1531
=∑ =
ν
i ix και 6.24481
2 =∑ =
ν
i ix .
Θεωρώντας ότι μηνιαία καταναλωτική δαπάνη των οικογενειών μια πόλης ακολουθεί N(μ,σ2), μπορούμε να δεχθούμε, σε επίπεδο σημαντικότητας 0.05, ότι κατά το έτος 2009 η μέση μηνιαία καταναλωτική δαπάνη μ όλων των οικογενειών της πόλεως έμεινε, στην πραγματικότητα, αμετά-βλητη σε σχέση με το προηγούμενο έτος; Να θεωρήσετε ως εναλλακτική υπόθεση (α) την μ ≠ μ0, (β) την μ < μ0, και (γ) την μ > μ0.
Λύση Ισχύει ότι
32.1510/2.1531 ν
1=== ∑
=iixx
ν,
( )22ν
1
2ν
1
22 32.15106.244891
11)(
11
⋅−=⎟⎠
⎞⎜⎝
⎛−
−=−
−= ∑∑
==
xxxxsi
ii
i ννν
=11.2862
και
0.866 10/2862.114.1432.15
/0 ≈
−=
−=
νμ
sxt
(α) Ελέγχουμε αν Η0: μ = μ0 = 14.4, Η1: μ ≠ μ0 με σ2 άγνωστο. ( )2(||: 1 a/ttK −> ν ) Θα είναι
26216.2)2/05.0()2/(866.0 91- ==>= tatt ν : δεν ισχύει
από όπου δεν μπορούμε να απορρίψουμε την Η0 έναντι της Η1. Το p-value θα είναι
409.0))866.0(1(2|))|(1(2)||||(|910 ≈−≈−=>=−
− tt FtFHtTPvaluepν
> a
(β) Ελέγχουμε αν Η0: μ = μ0 = 14.4, Η1: μ < μ0 με σ2 άγνωστο ( )(: 1 attK −−< ν ). Θα είναι
83311.1)05.0()(866.0 91- −=−=−<= tatt ν : δεν ισχύει
από όπου δεν μπορούμε να απορρίψουμε την Η0 έναντι της Η1. Το p-value θα είναι
7955.0)866.0()()|(910 ≈≈=<=−
− tt FtFHtTPvaluepν
> a
(γ) Ελέγχουμε αν Η0: μ = μ0 = 14.4, Η1: μ > μ0 με σ2 άγνωστο ( )(: 1 attK −> ν ). Θα είναι
83311.1)05.0()(866.0 91- ==>= tatt ν : δεν ισχύει
από όπου δεν μπορούμε να απορρίψουμε την Η0 έναντι της Η1. Το p-value θα είναι
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 16
2044.0)866.0(1)(1)|(910 ≈−≈−=>=−
− tt FtFHtTPvaluepν
> a
Άσκηση 3.8. Έστω τ.δ. Χ1, Χ2, …, Χν από την Ν(μ,σ2) με σ2 άγνωστο και έστω ότι θέλουμε να ε-λέγξουμε την Η0: μ = μ0. Αν συμβολίσουμε με
>pvalue , <pvalue , και ≠pvalue ,
τα p-values που αντιστοιχούν στον έλεγχο της Η0: μ = μ0 με εναλλακτικές τις Η1: μ > μ0, Η1: μ < μ0, H1: μ ≠ μ0 αντίστοιχα, να δείξετε ότι
⎩⎨⎧
<−≥
=≠
≠> 0,2/1
0,2/tpvalue
tpvaluepvalue και
⎩⎨⎧
≥−<
=≠
≠< 0,2/1
0,2/tpvalue
tpvaluepvalue
όπου sxvt /)( 0μ−= .
Λύση. Σχηματικά:
0
p-value ≠
t
p-value>
H1: μ > μ0 και t ≥ 0
0
p-value ≠
t
p-value>
H1: μ > μ0 και t < 0
Αυστηρά:
)(1)|( 0 tFHtTPpvalue −=>=> , )()|( 0 tFHtTPpvalue =<=<
))(1(2)|( 0 tFHtTPpvalue −=>=≠
και επομένως, αν t > 0,
)1(2))(1(2,2))(1(2 <≠>≠ −=−==−= pvaluetFpvaluepvaluetFpvalue
ενώ αν t < 0,
<≠>≠ ==−==−−= pvaluetFpvaluepvaluetFtFpvalue 2)(2),1(2)(2))(1(2
Άσκηση 3.9. Θεωρώντας ότι η τιμή πώλησης ενός προϊόντος σε μια περιοχή ακολουθεί N(μ,σ2), και προκειμένου να ελεγχθεί η Η0: μ = 1000 ευρώ έναντι της Η1 : μ ≠ 1000 ευρώ, καταγράφηκε η τιμή πώλησης του προϊόντος αυτού σε ένα τ.δ. ν καταστημάτων. Από αυτό το τ.δ. βρέθηκε μέση τιμή πώλησης 1030 ευρώ με p-value = 8%. Αν αντί της εναλλακτικής Η1 : μ ≠ 1000 θέλαμε να ελέγξουμε την Η1 : μ > 1000 ποιο θα ήταν το αντίστοιχο p-value; Ποιο θα ήταν το αντίστοιχο p-value όταν Η1 : μ < 1000;
Λύση Εδώ 0/)10001030(/)( 0 >−=−= svsxvt μ , και
%42/ == ≠> pvaluepvalue και %962/1 =−= ≠< pvaluepvalue
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 17
Άσκηση 3.10. Σε ν = 20 καπνιστές που αποφάσισαν να διακόψουν το κάπνισμα μετρήθηκε το σωματικό τους βάρος λίγο πριν και τρείς μήνες μετά τη διακοπή του καπνίσματος. Βρέθηκε ότι
8.1=x και 8.0=xs όπου xi είναι η διαφορά του σωματικού βάρους (σε κιλά) του i ατόμου μετά – πρίν τη διακοπή του καπνίσματος. Να ελέγξετε αν, με βάση το δείγμα αυτό, μπορούμε να πούμε ότι η διακοπή του καπνίσματος συνδέεται με την μεταβολή του σωματικού βάρους. Να κάνετε τον αμφίπλευρο και τους δύο μονόπλευρους ελέγχους μέσω των p-values.
Λύση Ισχύει ότι 8.1=x , 8.0=s και
10.0623 20/8.008.1
/0 ≈
−=
−=
νμ
sxt
Ελέγχουμε αν Η0: μ = μ0 = 0, Η1: μ ≠ μ0 με σ2 άγνωστο ( )2(||: 1 a/ttK −> ν ). Θα είναι
09.2)2/05.0()2/(0623.10 191- ==>= tatt ν : ισχύει
απορρίπτουμε την Η0 έναντι της Η1. Το p-value θα είναι
00.0))0623.10(1(2|))|(1(2)||||(|910 ≈−≈−=>=−
−≠ tt FtFHtTPvaluepν
00.02/ ≈= ≠> pvaluepvalue και %1002/1 ≈−= ≠< pvaluepvalue
Άσκηση 3.11. Έστω τυχαίο δείγμα Χ1, Χ2, ..., Χν ~ N(μ,σ2) με μ γνωστό. α. Χρησιμοποιώντας το αποτέλεσμα που βρέθηκε για τον έλεγχο της υπόθεσης Η0: σ = σ0 έναντι της Η1: σ ≠ σ0 (σε ε.σ. α) με το κριτήριο του γενικευμένου λόγου πιθανοφανειών, να προσδιορίσε-τε το σύνολο των τιμών του σ0 για τις οποίες δεν απορρίπτεται η Η0 και να το συγκρίνετε με το γνωστό διάστημα εμπιστοσύνης για το σ, συντελεστού 1 – a (όταν μ γνωστό). Λύση. Το σύνολο των τιμών του σ0 για τις οποίες δεν απορρίπτεται η Η0 είναι
)
2(χ)(,)()
21(χ)
2(χ)
21(χ 22
01
2
1
2220
22 axxaaTai
ii
i ν
νν
ννν σμμσ ≤∑ −∑ −≤−⇔≤≤−==
)2/1(χ
)(
)2/(χ
)(21
2
202
1
2
a
x
a
xi
ii
i
−
∑ −≤≤
∑ −⇔ ==
ν
ν
ν
νμ
σμ
το οποίο είναι το γνωστό δ.ε. συντ. 1 – a για το σ2 όταν το μ είναι γνωστό. Επομένως δεν απορρί-πτουμε την Η0 έναντι της αμφίπλευρης Η1 σε ε.σ. a όταν το μ0 ανήκει στο δ.ε. για το μ συντ. 1 – a. Άσκηση 3.12. Να επαναλάβετε την Άσκηση 11, αυτή την φορά θεωρώντας ότι το μ είναι άγνω-στο. Λύση. Το σύνολο των τιμών του σ0 για τις οποίες δεν απορρίπτεται η Η0 είναι
)2
(χ)2
1(χ 21
21
aTa−− ≤≤− νν
)2/1(χ
)(
)2/(χ
)(2
1
1
2
202
1
1
2
a
xx
a
xxi
ii
i
−
∑ −≤≤
∑ −⇔
−
=
−
=
ν
ν
ν
ν
σ
το οποίο συμπίπτει με το γνωστό δ.ε. συντ. 1 – a για το σ2 όταν το μ είναι γνωστό. Επομένως δεν απορρίπτουμε την Η0 έναντι της αμφίπλευρης Η1 σε ε.σ. a όταν το μ0 ανήκει στο δ.ε. για το μ συντ. 1 – a.
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 18
Άσκηση 3.13. Έστω ότι ο χρόνος ζωής ενός τύπου μπαταριών ακολουθεί κανονική κατανομή N(μ,σ2). Ο κατασκευαστής ισχυρίζεται ότι σ2 = 100. Μπορούμε να απορρίψουμε τον ισχυρισμό αυτό έναντι της Η1: σ2 > 100 σε επίπεδο σημαντικότητας 5% αν έχουμε την πληροφορία ότι η δειγματική διασπορά S2 των χρόνων ζωής ενός τυχαίου δείγματος 20 μπαταριών βρέθηκε ίση με 130. Να βρεθεί το p-value του ελέγχου.
Λύση. Πρόκειται για τον έλεγχο της υπόθεσης
Η0: σ σ202= έναντι της Η1: σ σ2
02>
Όπως και στην προηγούμενη άσκηση θα χρησιμοποιήσουμε την σ.σ.
)(χ~σ
)1( 21H2
0
2
0aST −
−= νν
ενώ όταν ισχύει η Η1 η Τ θα λαμβάνει μεγάλες τιμές. Συνεπώς η περιοχή απόρριψης αυτού του ελέγχου θα είναι της μορφής T > c. Για να έχουμε P[I] = a θα πρέπει
Κ: )(χσ
)1( 212
0
2
aS−>
−ν
ν
Αντικαθιστώντας βρίσκουμε ότι
)05.0(χ14.307.24100
13019σ
)1( 2192
0
2
=≤=⋅
=− sν
και επομένως δεν μπορούμε να απορρίψουμε την υπόθεση Η0: σ σ202= =100 σε επίπεδο σημαντι-
κότητας 0.05. Tο p-value του ελέγχου θα είναι η πιθανότητα
17.0)7.24(1)/7.24( 219χ0 ≈−=>=− FHTPvaluep
Παρατηρούμε ότι το p-value είναι αρκετά μεγάλο, μεγαλύτερο του α = 0.05 (και άρα σωστά δε-χτήκαμε την Η0).
Λύσεις Ασκήσεων Κεφαλαίου 4 (Παρ. 4.4). Άσκηση 4.1. Oι χρόνοι συναρμολόγησης ενός προϊόντος από δύο συγκεκριμένους εργάτες, ακο-λουθούν κανονική κατανομή με μέση τιμή μ1 και μ2 αντίστοιχα. Αν
234, 99, 234, 174, 188, 107, 173, 172 και 105, 194, 77, 33, 159, 150, 167, 127, 169, 166
είναι δειγματοληπτικά κάποιοι χρόνοι (σε min) συναρμολόγησης των δύο αυτών εργατών αντί-στοιχα, μπορούμε σε επίπεδο σημαντικότητας α=0.05 να πούμε ότι α) οι δύο εργάτες έχουν δια-φορετική απόδοση; β) ο πρώτος εργάτης έχει χειρότερη απόδοση από το δεύτερο; γ) ο πρώτος ερ-γάτης συναρμολογεί το προϊόν 10 λεπτά αργότερα από το δεύτερο; Θεωρείστε ότι οι τυπικές απο-κλίσεις σ1, σ2 των χρόνων συναρμολόγησης του προϊόντος από τους εργάτες είναι γνωστές και ίσες με σ1 = 50, σ2 = 50.
Λύση. Υπολογίζουμε από τα δύο δείγματα ότι 625.172=x και 7.134=y .
(α) Ζητείται ο έλεγχος της μορφής Η0: μ1 = μ2, H1:μ1 ≠ μ2 όταν σ1,σ2 είναι γνωστά σε ε.σ. α = 0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι
Κ: |Τ | > zα/2 όπου Τ= ( )
2
22
1
21 σσ
vv
YX
+
− .
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 19
Αντικαθιστώντας θα έχουμε ότι
|t| = 6.1225.050
925.37
101
8150
7.134625.172
σσ
2
22
1
21
≈=+
−=
+
−
vv
yx
Ενώ za/2 = z0.025 = 1.96 > 1.6 και άρα δεν απορρίπτουμε την Η0. Επίσης,
11.0))6.1(1(2|))(|1(2)||||(| 0 ≈Φ−≈Φ−=>=− tHtTPvaluep > a.
(β) Ζητείται ο έλεγχος της μορφής Η0: μ1=μ2, H1:μ1>μ2 όταν σ1,σ2 είναι γνωστά σε ε.σ. α=0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι
Τ > zα όπου Τ = ( )
2
22
1
21 σσ
vv
YX
+
− .
Αντικαθιστώντας θα έχουμε ότι
t = 6.1σσ
2
22
1
21
≈
+
−
vv
yx
Ενώ za = z0.05 = 1.645 > 1.6 και άρα δεν απορρίπτουμε και πάλι την Η0. Επίσης,
055.0)6.1(1)(1)|( 0 ≈Φ−≈Φ−=>=− tHtTPvaluep > a.
(γ) Ζητείται ο έλεγχος της μορφής Η0: μ1 − μ2 = 10, H1: μ1 − μ2 > 10 όταν σ1,σ2 είναι γνωστά σε ε.σ. α = 0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι
Κ: |Τ | > zα/2 όπου Τ= ( )
2
22
1
21 σσ
10
vv
YX
+
−− .
Αντικαθιστώντας θα έχουμε ότι
T = 177.1225.050
925.27
101
8150
107.134625.172≈=
+
−− <za = z0.05 = 1.645
οπότε δεν απορρίπτουμε την Η0.
Άσκηση 4.2. Από τυχαίο δείγμα 50 οικογενειών της πόλεως Α προέκυψε ότι το μέσο ετήσιο εισό-δημά τους ήταν 15562 ευρώ. Επίσης από τυχαίο δείγμα 100 οικογενειών της πόλεως Β προέκυψε ότι το μέσο ετήσιο εισόδημά τους ήταν 15126 ευρώ. Μπορούμε να δεχθούμε, σε επίπεδο σημα-ντικότητας 0.01, ότι οι οικογένειες των δύο πόλεων από τις οποίες προέρχονται τα δείγματα έχουν το ίδιο μέσο εισόδημα, αν είναι γνωστό ότι στους δύο αυτούς πληθυσμούς η τυπική απόκλιση εί-ναι ίση με 830;
Λύση. Ελέγχουμε τις υποθέσεις Η0 : μ1 = μ2, Η1 μ1 ≠ μ2. Έχουμε
100,50,15126,15562 21 ==== ννyx και θεωρείται ότι η διακύμανση είναι γνωστή και ίση με σ2 = 688900 και για τους δύο πληθυ-σμούς. Επομένως 22
221 σσσ == και
0329.3
1001
501830
1512615562
2
22
1
21
≈+
−=
+
−=
νσ
νσ
yxT
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 20
Αφού |T| = 3.0329 > z0.01/2 = z0.005 = 2.58, απορρίπτουμε την Η0. Τέλος,
0.0024(3.03))1(2))1,0(~|0329.3|(|)||0329.3||(| 0 ≈Φ−≈>=>=− NTTPHTPvaluep .
Άσκηση 4.3. Μια εταιρεία κατασκευής σκελετών σκαφών βρίσκει ότι τα δένδρα τύπου Α που προμηθεύεται από ένα δάσος αποδίδουν κατά μέσο όρο 64 kgr ξύλα περισσότερο από τα δένδρα τύπου Β. Η διακύμανση της απόδοσης ξύλου βρέθηκε ίση με 115 kgr2. Ένα άλλο δάσος περιέχει και τους δύο τύπους ξύλων. Παίρνοντας δείγμα 100 δένδρων για κάθε τύπο (από το δεύτερο δά-σος) οι αποδόσεις σε ξύλο βρέθηκαν 1390 kgr και 1332 kgr αντίστοιχα ενώ οι διακυμάνσεις έμε-ναν αμετάβλητες. Μπορούμε να δεχθούμε σε ε.σ. 1% ότι η διαφορά των μέσων αποδόσεων ξύλου παραμένει στο ίδιο επίπεδο δηλ. 64 kgr;
Λύση. Θέτουμε
X : απόδοση ξύλου ανά δέντρο τύπου Α στο δεύτερο δάσος Υ : απόδοση ξύλου ανά δέντρο τύπου Β στο δεύτερο δάσος
Υποθέτουμε ότι Χ ~ ),( 211 σμN , Υ ~ ),( 2
22 σμN με 11522
21 ==σσ και ζητάμε να γίνει ο έλεγχος
Η0: μ1 – μ2 = 64 έναντι της Η1: μ1 – μ2 ≠ 64
σε ε.σ. 1%, με βάση δύο δείγματα Χ1, Χ2, … 1νX και Υ1, Υ2, … 2ν
Y (ν1 = ν2 = 100) από τα οποία προέκυψε ότι 1332,1390 == yx . Έχουμε
4
1001152
641332139064
2
22
1
21
−≈−−
=
+
−−=
νσ
νσ
yxt
Αφού |T| = 4 > z0.01/2 = 2.58, απορρίπτουμε την Η0. Επίσης,
0.00006(4))1(2))1,0(~|4|(|)||4||(| 0 ≈Φ−≈>=−>=− NTTPHTPvaluep .
Άσκηση 4.4. Έστω μ1 η μέση τιμή πώλησης ενός προϊόντος σε μία περιοχή Α και μ2 η μέση τιμή πώλησης του ίδιου προϊόντος σε μία περιοχή Β. Επιλέγουμε τυχαία 4 τιμές από την περιοχή Α και 4 τιμές από την περιοχή Β. Αν οι τιμές αυτές είναι
1.12, 1.06, 1.21, 1.1 (περιοχή Α) και 1.07, 0.93, 0.97, 0.99 (περιοχή Β),
μπορούμε, σε επίπεδο σημαντικότητας 5%, να πούμε ότι η μέση τιμή πώλησης στην περιοχή Α είναι υψηλότερη από την αντίστοιχη στην περιοχή Β; (Η0: μ1 = μ2, H1: μ1 > μ2) (υποθέτουμε ότι οι τιμές κατανέμονται κανονικά και με ίση διασπορά στις δύο περιοχές).
Λύση. Υπολογίζουμε ότι 003466.0,004025.0,99.0,1225.1 22
21 ==== ssyx και η κρίσιμη περιοχή
του ελέγχου θα είναι
Κ: Τ > )2/(221at vv −+ και t =
( ) ( )0618.3
244003466.03004025.03
99.01225.144
4
2)1()1(
2
21
222
211
21
21
≈
−+⋅+⋅
−+=
−+−+−
−+
vvsvsv
yxvv
vv
.
ενώ )2/(221at vv −+ = )2/05.0(6t = 2.45 < 3.0618, και άρα απορρίπτουμε την Η0 σε ε.σ. 5%. Επίσης,
01108.0)0618.3(1)|(60 ≈−≈>=− tFHtTPvaluep
Άσκηση 4.5. Από τυχαίο δείγμα 12 εμπορικών καταστημάτων ειδών ενδυμασίας προέκυψε ότι η μέση ημερήσια δαπάνη τους για διαφήμιση είναι 51 ευρώ με δειγματική τυπική απόκλιση 3.6 ευ-ρώ. Επίσης από τυχαίο δείγμα 12 εμπορικών καταστημάτων ειδών υποδήσεως προέκυψε ότι η μέ-
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 21
ση ημερήσια δαπάνη τους για διαφήμιση είναι 48 ευρώ με δειγματική τυπική απόκλιση 4 ευρώ. Μπορούμε να δεχθούμε, σε ε.σ. 1%, ότι οι δύο κατηγορίες καταστημάτων δαπανούν, κατά μέσο όρο το ίδιο ποσόν για διαφήμιση; Υποθέτουμε ότι οι δαπάνες για κάθε κατάστημα κατανέμονται κανονικά και με ίση διασπορά.
Λύση. Zητείται να γίνει ο έλεγχος της Η0: μ1 – μ2 = 0 έναντι της Η1: μ1 – μ2 ≠ 0. Έχουμε
12,12,4,6.3,48,51 2121 ====== ννssyx και
93.1
212124)112(6.3)112(
121
121
4851
2)1()1(11 22
21
222
211
21
≈
−+−+−
+
−=
−+−+−
+
−=
νννν
ννss
yxt
και αφού 819.2)2/01.0(93.1|| 21212 ≈<= −+tt δεν μπορούμε να απορρίψουμε την Η0. Επίσης,
066.0))93.1(1(2)||||(|220 ≈−≈>=− tFHtTPvaluep .
Άσκηση 4.6. (α) Έστω μ1 η μέση τιμή πώλησης ενός προϊόντος σε μία περιοχή Α και μ2 η μέση τιμή πώλησης του ίδιου προϊόντος σε μία περιοχή Β. Η μέση τιμή και η διασπορά ενός τ.δ. 10 τι-μών πώλησης από την περιοχή Α βρέθηκε 100.9 και 8.76667 αντίστοιχα. Επίσης, η μέση τιμή και η διασπορά ενός τ.δ. 20 τιμών πώλησης από την περιοχή Β βρέθηκε 104.45 και 12.9974 αντίστοι-χα. Αν υποθέσουμε ότι οι τιμές κατανέμονται κανονικά και με ίση (αλλά άγνωστη) διασπορά και στις δύο περιοχές, να ελέγξετε σε επίπεδο σημαντικότητας 5% i) Αν η μέση τιμή πώλησης στην Α είναι διαφορετική από την αντίστοιχη στην Β. ii) Αν η μέση τιμή πώλησης στην Α είναι χαμηλότερη από την αντίστοιχη στην Β. (β) Στο (α) υποθέσαμε ότι οι διασπορές 2
1σ και 22σ των τιμών στις περιοχές αυτές είναι ίσες.
Να ελέγξετε σε επίπεδο σημαντικότητας 5% αν όντως οι δύο αυτές διασπορές μπορούν να θεωρη-θούν ίσες.
Λύση. (α)i) Ζητείται ο έλεγχος της μορφής Η0: μ1=μ2, H1:μ1≠μ2 όταν σ1,σ2 είναι άγνωστά αλλά ίσα, σε ε.σ. α = 0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι
Κ: |Τ | > )2/(221at vv −+ όπου Τ =
( )
2)1()1(
21
222
211
21
21
−+−+−
−+
vvSvSv
YXvv
vv.
Αντικαθιστώντας θα έχουμε ότι
|t| = 68.2
2201099.1219766.89
45.1049.10020102010
−=
−+⋅+⋅
−+⋅
Ενώ )2/(221at vv −+ = )025.0(28t = 2.048 < 2.68 και άρα απορρίπτουμε την Η0. Επίσης,
01219.0))68.2(1(2)||||(|280 ≈−≈>=− ≠ tFHtTPvaluep .
ii) Ζητείται ο έλεγχος της μορφής Η0: μ1=μ2, H1:μ1<μ2 όταν σ1,σ2 είναι άγνωστά αλλά ίσα σε ε.σ. α = 0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι
Κ: Τ < − )(221at nn −+ όπου Τ= 68.2− .
Επειδή )(221at nn −+− = )05.0(28t− = −1.701 > −2.68 απορρίπτουμε την Η0. Επίσης,
)2/(0061.0)68.2()|(280 ≠< −=≈−≈<=− valuepFHtTPvaluep t
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 22
(β) Ζητείται ο έλεγχος της μορφής Η0: σ1=σ2, H1:σ1≠σ2 όταν τα μ1, μ2 είναι άγνωστα σε ε.σ. α=0.05. Η κρίσιμη περιοχή του ελέγχου θα είναι
Κ: Τ < )2/1(1,1 21aF vv −−− ή Τ > )2/(1,1 21
aF vv −− όπου Τ= 22
21
1
2
1
2
1
22
1
)(
)(
11
SS
YY
XX
vv
v
jj
v
ii
=−
−
−−
∑
∑
=
= .
Αντικαθιστώντας θα έχουμε ότι t 6748.099.12
766.8== ενώ
273.0)975.0()1( 19,921,1 21==−−− FF a
vv , 84.2)025.0()( 19,921,1 21==−− FF a
vv ,
και επειδή 0.273 < 0.6748 < 2.84 μπορούμε να δεχτούμε την Η0 (δηλ. οι πληθυσμοί είναι ομοσκε-δαστικοί) σε ε.σ. 0.05. Επίσης,
556.00.722}0.278,min{2
))6748.0(1),6748.0(min{2)}|(),|(min{219,919,900
=≈
−=><=− FF FFHtTPHtTPvaluep
Άσκηση 4.7. Έστω ότι οι χρόνοι ζωής δύο τύπων εξαρτημάτων A, B ακολουθούν κανονική κατα-νομή N(μ1, σ1
2) και N(μ2, σ22) αντίστοιχα. Αν σε ένα τ.δ. από εξαρτήματα τύπου Α βρέθηκε ότι S1
= 100 (ν1 = 50) και σε ένα τ.δ. από εξαρτήματα τύπου Β βρέθηκε ότι S2 = 120 (ν2 = 50), μπορούμε σε ε.σ. 5% να ισχυριστούμε ότι οι χρόνοι ζωής των εξαρτημάτων Α παρουσιάζουν μικρότερη με-ταβλητότητα από τους χρόνους του Β; Δίνεται ότι 605.1)05.0(49,49 =F
Λύση. Είναι
Κ: Τ < 6221.0)95.0()1( 49,491,1 21==−−− FaF vv
όπου t = 6944.0120100
2
2
22
21 ==
ss και επομένως δεν μπορούμε να απορρίψουμε την Η0. Επίσης
1026.0)6944.0()|(49,490 ≈=<=− FFHtTPvaluep .
Άσκηση 4.8. Από δύο δείγματα άγαμων και έγγαμων εργατριών συγκεντρώθηκαν τα ακόλουθα στοιχεία που αφορούν ώρες απουσίας από την εργασίας τους λόγω ασθένειας σε ένα έτος:
Άγαμοι: 88, 68, 77, 82, 63, 80, 78, 71, 68, Έγγαμοι : 73, 77, 67, 70, 74, 64, 71, 71, 72
Να ελεγχθεί σε ε.σ. 5% η υπόθεση ότι η διακύμανση των ωρών απουσίας των άγαμων (α) είναι ίση με τη διακύμανση των ωρών απουσίας των έγγαμων εργατριών, έναντι της εναλλακτικής υπο-θέσεως ότι η διασπορά των ωρών απουσίας των άγαμων είναι μεγαλύτερος από εκείνο των έγγα-μων. (β) είναι τετραπλάσια της διακύμανσης των ωρών απουσίας των έγγαμων εργατριών. Δίνεται ότι 44.3)05.0(8,8 =F , 43.4)025.0(8,8 =F .
Λύση. (α). Θέλουμε να ελέγξουμε τις υποθέσεις Η0: σ1 = σ2, Η1 : σ1 > σ2. Έχουμε
9,9,5.14,25.64,719
639,759
67521
22
21 ======== ννssyx
οπότε
43.45.1425.64
22
21 ===
sst
Αφού, 44.3)(43.4 1,1 21
=>= −− aFt νν δεν απορρίπτουμε την Η0. Επίσης
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 23
025.0)43.4(1)|(8,80 ≈−=>=− FFHtTPvaluep
(β). Τώρα έχουμε
1075.122
2
21 ==s
stδ
και επειδή 43326.4)2/()2/1(225568.0 1,11,1 2121=≤≤−= −−−− aFtaF vvvv δεν μπορούμε να απορρί-
ψουμε την Η0. (γενικά, )(/1)1( ,, aFaF nmmn =− ) . Επίσης,
888.00.444}0.555,min{2
))1075.1(1),1075.1(min{2)}|(),|(min{28,88,800
=≈
−=><=− FF FFHtTPHtTPvaluep
Άσκηση 4.9. Από δύο ανεξάρτητους πληθυσμούς παίρνουμε τα τυχαία δείγματα 7, 6, 4, 8, 5, 3, 5 και 6, 5, 3, 7, 8, 3, 6, 3, 4 αντίστοιχα. Να ελεγχθεί σε ε.σ. 5% η υπόθεση ότι οι πληθυσμοί έχουν ίσες διακυμάνσεις έναντι της εναλλακτικής ότι η διακύμανση του πρώτου πληθυσμού είναι μεγα-λύτερη της διακύμανσης του δεύτερου. Δίνεται ότι 28.0)95.0(6,8 =F .
Λύση. Θέλουμε να ελέγξουμε τις υποθέσεις Η0: σ1 = σ2, Η1 : σ1 > σ2. Έχουμε
9,7,5.3,67.4,5,6 2122
21 ====== ννssyx
οπότε
33.122
21 ==
sst
Αφού, 58.3)(33.1 8,6 =<= aFt δεν απορρίπτουμε την Η0 ( )1(/1)( 6,88,6 aFaF −= ). Επίσης
345.0)33.1(1)|33.1(8,60 ≈−=>=− FFHTPvaluep .
Άσκηση 4.10. Για τον έλεγχο της αποτελεσματικότητας ενός σκευάσματος που καταπολεμά την παχυσαρκία, χορηγήθηκε συγκεκριμένη ποσότητά του σε 20 κατάλληλα πειραματόζωα. Σε καθέ-να από αυτά καταγράφηκε το βάρος του αμέσως πριν και μια εβδομάδα μετά την χορήγηση του σκευάσματος. Καταγράφηκαν τα παρακάτω σωματικά βάρη (σε kgr):
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Πριν 81.3 81.7 89.6 85.1 83.3 81.5 80.6 81.9 69.5 80.2 77.3 80.8 71.5 84.7 75.4 81.9 79.8 82 94.3 77 Μετά 81.8 80.1 84.2 82.1 75.8 81.6 76.1 79.9 70.9 81.2 81 83.3 70 75.5 72.4 79.9 79 80.7 91.9 76.3
Υπάρχει θετική μέση επίδραση του συγκεκριμένου σκευάσματος (σε ε.σ. 5%) στο βάρος των πει-ραματόζωων;
Λύση: Πρόκειται για ζευγαρωτές παρατηρήσεις (Χ1,Υ1), (Χ2,Υ2), …, (Χν,Yν) (ν ανεξάρτητα τυχαία διανύσματα). Θεωρούμε ότι το (Χi,Υi) ακολουθεί διδιάστατη κανονική με Ε(Χi) = μi, Ε(Yi) = μi + δ, V(Xi) = σ1
2, V(Υi) = σ22, Corr(Xi,Yi) = ρ, i = 1, 2, …,v. Επιθυμούμε να ελέγξουμε αν η διαφορά δ =
E(Yi) − E(Xi) μεταξύ των μέσων των Xi και των Υi είναι μηδενική (θεωρώντας άγνωστες τις παρα-μέτρους σ1, σ2, ρ). Κάτω από τις παραπάνω υποθέσεις, οι διαφορές
Ζi = Υi − Xi
είναι ανεξάρτητες και ακολουθούν την κανονική κατανομή με μέση τιμή δ και (άγνωστη) διασπο-ρά )2( 21
22
21
2 σρσσσσ −+= . Επομένως, ισοδύναμα μπορούμε να ελέγξουμε αν η μέση τιμή δ των Zi είναι ίση με μ0 = 0 (Η0: δ = 0, Η1: δ ≠ 0). Χρησιμοποιούμε την στατιστική συνάρτηση
2
1
22
1155.3)(
11,785.11,53.2
/0
=−−
====−
= ∑∑==
v
iiZ
v
ii
Z
ZZv
SZv
ZvS
ZT
Απορρίπτουμε την Η0 σε ε.σ. a =5% διότι
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 24
093.2)2/(53.2|| 1 =>= − atT v
ενώ το p-value των τιμών του δείγματος είναι
( ) 02.0)53.2(12)||||(|10 =−=>=−−vt
FHtTPvaluep
Εάν είχαμε ως εναλλακτική υπόθεση την Η1: δ > 0 ⇔ Ε(Χ) > Ε(Υ) θα έπρεπε να πάρουμε
01.02/02.02/ ===− ≠> pvaluevaluep (διότι t > 0).
Άσκηση 4.11. (παράδειγμα του Student) Η επίδραση δύο φαρμάκων Α και Β στο χρόνο ύπνου δοκιμάστηκε σε 10 ασθενείς που έπασχαν από αϋπνία. Και έστω xi, yi η παράταση του ύπνου του ασθενούς (σε ώρες) που οφείλεται στην επίδραση του φαρμάκου Α, Β αντίστοιχα.
xi 1.9 0.8 1.1 0.1 –0.1 4.4 5.5 1.6 4.6 3.4 yi 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0
zi = xi – yi 1.2 2.4 1.3 1.3 0.0 1.0 1.8 0.8 4.6 1.4
Είναι λογικό να δεχτούμε ότι (α) η επίδραση του φαρμάκου Α είναι διαφορετική από την επίδρα-ση του φαρμάκου Β σε ε.σ 1%, (β) η παράταση του ύπνου που προκαλεί το φάρμακο Α είναι κατά 1 ώρα μεγαλύτερη της παράτασης που προκαλεί το φάρμακο Β;
Λύση: (α) Όμοια την προηγούμενη άσκηση, πρόκειται για ζευγαρωτές παρατηρήσεις (Χ1,Υ1), (Χ2,Υ2), …, (Χν,Yν) όπου (Χi,Υi) ~ διδιάστατη κανονική με Ε(Χi) = μi, Ε(Yi) = μi + δ, V(Xi) = σ1
2, V(Υi) = σ2
2, Corr(Xi,Yi) = ρ, i = 1, 2, …,v. Επιθυμούμε να ελέγξουμε αν η διαφορά δ = E(Yi) − E(Xi) = 0. Οι τ.μ. Ζi = Υi − Xi είναι ανεξάρτητες και ακολουθούν Ν(δ, )2σ . Επομένως, για το (α) πρέπει να ελέγξουμε τις υποθέσεις Η0: δ = 0, Η1: δ ≠ 0 με βάση το δείγμα των διαφορών Z1, Z2, …,Zν. Χρησιμοποιούμε την στατιστική συνάρτηση
,06.410/52.1058.1
/0
≈−
=−
=vs
ztZ
Επειδή, t9(0.01/2) = 3.25, απορρίπτουμε την Η0 σε ε.σ. a =1%. Για το (β) πρέπει να ελέγξουμε τις υποθέσεις Η0: δ = 1, Η1: δ ≠ 1. Τώρα έχουμε
,48.110/52.1158.1
/1
≈−
=−
=vs
ztZ
και άρα δεν απορρίπτουμε την Η0 σε ε.σ. a =1%.
Λύσεις Ασκήσεων Κεφαλαίου 5 (Παρ. 5.3). Άσκηση 5.1. Ένας υποψήφιος δήμαρχος μιας μεγάλης πόλης ισχυρίζεται ότι στις εκλογές που έ-γιναν σήμερα θα λάβει ποσοστό μεγαλύτερο του 50%. Έχουμε αρκετά στοιχεία για να απορρί-ψουμε τον παραπάνω ισχυρισμό, αν σε ένα τ.δ. ν = 300 ψηφοφόρων (που ελήφθη με exit poll, δηλαδή οι ψηφοφόροι ρωτήθηκαν αμέσως μετά την έξοδό τους από τυχαία επιλεγμένα εκλογικά τμήματα) μόνο το 44% δήλωσαν ότι ψήφισαν τον συγκεκριμένο υποψήφιο (a = 0.01, Η1: p < p0). Αν βρεθεί ότι δεν έχουμε αρκετά στοιχεία, πόσο θα έπρεπε να είναι το ελάχιστο μέγεθος του δείγ-ματος ώστε, με το ίδιο δειγματικό ποσοστό, να απορρίπταμε τον παραπάνω ισχυρισμό;
Λύση. Στη συγκεκριμένη περίπτωση ζητείται ο έλεγχος της υπόθεσης
H0: p ≥ p0 έναντι της Η1: p < p0
όπου p0 = 50%. Γνωρίζουμε ότι η κρίσιμη περιοχή θα είναι
Κ: azvpp
pX−<
−−
/)1( 00
0 .
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 25
Αντικαθιστώντας βρίσκουμε ότι
33.207.2300/)5.01(5.0
5.044.0/)1( 01.0
00
0 −=−>−=−−
=−− z
vpppx .
Επομένως δεν έχουμε αρκετά στοιχεία για να απορρίψουμε τον παραπάνω ισχυρισμό σε ε.σ. 1%. Εξάλλου,
01922.0)07.2()|( 0 ≈−Φ=<=− HtTPvaluep .
Παρατηρούμε ότι για να απορρίπταμε την Η0: p = 0.5 λαμβάνοντας ένα μεγαλύτερο δείγμα ν΄ θα έπρεπε να ισχύει ότι
azvpp
pX−<
′−−′
/)1( 00
0 δηλαδή 22
0
00
)()1(
azpXppv
−′−
>′
όπου X ′ είναι το αντίστοιχο δειγματικό ποσοστό που θα βρίσκαμε. Βρίσκοντας, σύμφωνα με την εκφώνηση, και πάλι X ′ = 0.44 θα έπρεπε
37733.2)5.044.0()5.01(5.0
)()1( 2
22
20
00 ≈−−
=−′−
>′ azpXppv
Άσκηση 5.2. Σε τ.δ. 400 τηλεθεατών οι 100 δήλωσαν ότι παρακολουθούν μια ορισμένη τηλεοπτι-κή σειρά. Μπορούμε να δεχθούμε σε ε.σ 5% ότι εκείνοι που παρακολουθούν τη σειρά από το σύ-νολο των τηλεθεατών είναι λιγότεροι του 30% (Η1; p < p0);
Λύση. Ζητείται ο έλεγχος της υπόθεσης
H0: p = p0 έναντι της Η1: p < p0
όπου p0 = 30%. Η κρίσιμη περιοχή θα είναι
Κ: azvpp
pXT −<−−
=/)1( 00
0 .
Αντικαθιστώντας βρίσκουμε ότι
645.1183.2/)1( 05.0
00
0 −=−<−=−− z
vpppx .
Επομένως απορρίπτουμε τον παραπάνω ισχυρισμό σε ε.σ. 5%. Εξάλλου,
01451.0)183.2()|( 0 ≈−Φ=<=− HtTPvaluep < a
Άσκηση 5.3. Έστω τ.δ. Χ1,X2,...,Xν με P(Xi = 1) = p, P(Xi = 0) = 1−p. Ποιο θα πρέπει να είναι το μέγεθος του δείγματος ν ώστε για τον έλεγχο της υπόθεσης
Η0: p = p0, Η1: p = p1, p1 > p0
οι πιθανότητες σφάλματος τύπου Ι και ΙΙ να είναι αντίστοιχα α και β (χρησιμοποιήστε προσέγγιση μέσω κανονικής κατανομής).
Λύση. Για τον έλεγχο της συγκεκριμένης υπόθεσης θα έχουμε από τα παραπάνω την κρίσιμη πε-ριοχή
Κ: azvpp
pX>
−−
/)1( 00
0 .
για την οποία ως γνωστό ισχύει ότι P[I] = a. Θα πρέπει και P[II] = β. Δηλαδή
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 26
)=|)1(()|/)1(
()( 100
0100
0 ppzv
pppXPHzvpp
pXPIIP aa−
+≤=≤−−
=
β=−
−+
−−
≤−−
= )|)1()1(
/)1(/)1(( 1
11
00
11
10
11
1 p=pzpppp
vpppp
vpppXP a
και επομένως,
βzzpppp
vpppp
a −=−
−+
−−
)1()1(
/)1( 11
00
11
10
ή ισοδύναμα 2
01
1100 )1()1(⎟⎟⎠
⎞⎜⎜⎝
⎛
−−+−
=pp
zppzppv a β
Άσκηση 5.4. Επιλέγοντας τυχαία 400 προϊόντα από μία μηχανή που τα κατασκευάζει, τα 16 βρέ-θηκαν ελαττωματικά, ενώ επιλέγοντας τυχαία 300 προϊόντα από μία άλλη μηχανή, τα 24 βρέθη-καν ελαττωματικά. Να ελέγξετε σε επίπεδο σημαντικότητας 1% (α) αν υπάρχει διαφορά στην πα-ραγωγή ελαττωματικών μεταξύ των δύο μηχανών και (β) αν η δεύτερη μηχανή είναι «χειρότερη» από την πρώτη. Λύση. (α) Ζητείται ο έλεγχος των υποθέσεων της μορφής Η0: p1 = p2, H1: p1 ≠ p2 σε ε.σ. α = 0.01. Η κρίσιμη περιοχή του ελέγχου θα είναι (ν1, ν2 > 30)
Κ: |Τ | > za/2 όπου ( )21 /1/1)1( vvPP
YXT+−
−= ,
21
21
vvYvXvP
++
=
Αντικαθιστώντας θα έχουμε ότι
0571.0700
2416400300300400 300
2440016
=+
=++
=P και ( )
257.2)0571.01(0571.0 400
13001
30024
40016
−=+−
−=t
Ενώ zα/2 = z0.005 = 2.58 και επειδή 2.257 < 2.58 δεχόμαστε (ή καλύτερα, λέμε ότι δεν έχουμε αρκε-τά στοιχεία ώστε να απορρίψουμε) την Η0. Εξάλλου,
024.0))257.2(1(2)||||(| 0 ≈Φ−=>=− HtTPvaluep (β) Ζητείται ο έλεγχος των υποθέσεων της μορφής Η0: p1 = p2, H1:p1 < p2 σε ε.σ. α = 0.01. Η κρί-σιμη περιοχή του ελέγχου σύμφωνα με τα παραπάνω θα είναι (ν1,ν2 >30)
Κ: Τ < −za όπου από τα δεδομένα, 257.2−=t
ενώ zα = z0.01 = 2.33 και επειδή 33.2257.2 −>−=t δεχόμαστε (ή καλύτερα, λέμε ότι δεν έχουμε αρκετά στοιχεία ώστε να απορρίψουμε) την Η0. Εξάλλου,
012.0)257.2()|( 0 ≈−Φ=<=− HtTPvaluep
(μισό από το p-value του αμφίπλευρου ελέγχου)
Άσκηση 5.5. Ένας δημοσιογράφος σε μία τηλεοπτική συζήτηση ισχυρίζεται ότι συμβαίνει κάτι ύποπτο στην εταιρία μέτρησης τηλεθέασης GBA. Η εταιρία έχει διαθέσει 1150 μηχανάκια σε ισά-ριθμους τηλεθεατές, 150 από τα οποία έχουν δοθεί σε νέους συνεργάτες (τηλεθεατές που έχουν ξεκινήσει τη συνεργασία τους με την GBA το τελευταίο εξάμηνο). Ο δημοσιογράφος διαπιστώνει ότι, σύμφωνα με την GBA, το κανάλι VEGA παρουσιάζει τηλεθέαση 30% στο σύνολο (στους 1000+150 τηλεθεατές) ενώ έχει μόνο 22% στους νέους (στους 150) τηλεθεατές. Ο δημοσιογράφος το θεωρεί αυτό πολύ ύποπτο και μάλιστα κάποιος πολιτικός που βρίσκεται στην συζήτηση δηλώ-νει ότι «οι δύο αυτές τιμές δεν συμφωνούν καθόλου» (πρόκειται για πραγματικό περιστατικό).
Ασκήσεις μαθήματος «Στατιστική ΙΙ», 2010-11 Μ.Κούτρας, Μ.Μπούτσικας 27
Είναι πράγματι αυτό «πολύ ύποπτο»; Θα μπορούσε δηλαδή η διαφορά αυτή να είναι τυχαία; Συ-γκεκριμένα, αν p1, p2 είναι τα ποσοστά της τηλεθέασης του VEGA στους πληθυσμούς από τους οποίους προέρχονται οι δύο ομάδες τηλεθεατών («νέοι» και «παλαιοί» συνεργάτες), ελέγξτε σε ε.σ. α = 0.01 την υπόθεση H0: p1 = p2 έναντι της H1: p1 > p2 (αν απορρίψουμε την Η0 μπορούμε πράγματι να μιλήσουμε για κάτι «ύποπτο», διότι αναμένουμε να ισχύει p1 = p2 αφού και οι δύο ομά-δες συνεργατών προέρχονται από τον ίδιο πληθυσμό).
Λύση. Πρόκειται για δύο ανεξάρτητα δείγματα Χ1,Χ2,..., 1ν
X ~ Β(1,p1) και Υ1,Υ2,..., 2ν
Y ~ Β(1,p2) με ν1 = 1000, ν2 = 150. Θέλουμε να πραγματοποιήσουμε το έλεγχο H0: p1 = p2, H1: p1 > p2 έχοντας δειγματικά ποσοστά 22.0,312.0 == yx διότι
⎪⎩
⎪⎨
⎧
=⋅−⋅
=−+
=
=⇒
⎪⎩
⎪⎨
⎧
=++
=
312.01000
22.015030.01150)(30.022.0
30.0
22.0
1
221
21
21
vyvvvx
y
vvyvxv
y
Η κρίσιμη περιοχή του ελέγχου θα είναι (ν1, ν2 > 30)
Κ: Τ > za όπου ( )21 /1/1)1( vvPP
YXT+−
−= ,
21
21
vvYvXvP
++
=
Αντικαθιστώντας θα έχουμε ότι
3.01150
22.0150312.01000=
⋅+⋅=P και
( )292.2
7.03.022.0312.0
1501
10001
=+⋅
−=t
ενώ zα = z0.01 = 2.33 και επειδή 33.2292.2 <=t δεχόμαστε (ή καλύτερα, λέμε ότι δεν έχουμε αρ-κετά στοιχεία ώστε να απορρίψουμε) την Η0 σε ε.σ. 1%. Εξάλλου,
011.0)292.2(1)|( 0 ≈Φ−=>=− HtTPvaluep .
Άσκηση 5.6. Τον μήνα Ιανουάριο επιλέχθηκαν τυχαία 400 ψηφοφόροι από μία περιοχή και ανά-μεσά τους βρέθηκαν 100 οι οποίοι προτίθενται να ψηφίσουν το κόμμα Α. Τον μήνα Φεβρουάριο, επιλέχθηκαν τυχαία 500 ψηφοφόροι από την ίδια περιοχή και ανάμεσά τους βρέθηκαν τώρα 150 οι οποίοι προτίθενται να ψηφίσουν το κόμμα Α. Να ελέγξετε σε ε.σ. 5% αν το ποσοστό των ψη-φοφόρων του κόμματος Α στην περιοχή αυτή αυξήθηκε κατά τον μήνα Φεβρουάριο. (Η0 : p1 = p2 έναντι της Η1 : p1< p2)
Λύση. Τα δειγματικά ποσοστά των ψηφοφόρων του κόμματος τους δύο μήνες είναι,
25.0=x και 3.0=y
Η κρίσιμη περιοχή θα είναι
Κ: ( )
664.1500/1400/1)2777.01(2777.0
3.025.0−=
+−−
=t < − zα = −1.645
Όπου
=+
⋅+⋅=
5004003.050025.0400P 0.2777
και επομένως απορρίπτουμε την Η0. Υπήρξε στατιστικά σημαντική αύξηση (ε.σ. 5%). Εξάλλου,
048.0)664.1()|( 0 ≈−Φ=<=− HtTPvaluep .