Interval Estimation 區間估計

72
© 蘇蘇蘇 2000 蘇蘇蘇蘇 蘇蘇 () Page 1 Interval Estimation Interval Estimation 蘇蘇蘇蘇 蘇蘇蘇蘇 • 蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇 蘇蘇蘇蘇蘇 (point estimator) 蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇 X 蘇蘇蘇蘇蘇 μ 蘇 蘇蘇蘇蘇蘇蘇蘇 一。 • 蘇蘇蘇蘇蘇蘇X 蘇蘇蘇蘇蘇蘇 μ 蘇蘇蘇 蘇蘇蘇蘇蘇 ,一 X 蘇蘇蘇蘇蘇蘇 μ 蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇蘇 ,: erro sampling X

description

Interval Estimation 區間估計. 觀念. 在前章中我們介紹了各種估計母體參數的方法 (point estimator) 。例如我們發現樣本平均數 X 為母體平均數 μ 的一個不偏估計式。 雖然平均而言, X 能正確的代表 μ ,但每一次觀察到的 X 不會剛好等於 μ ,而是隨著抽到的樣本不同有高有低:. Interval Estimation 區間估計. 觀念. 因此除了 點估計 外,我們還想進一步知道從樣本中得到的估計值有多可靠,由於樣本的估計值本身也是一個 隨機變數 ,不一定會剛好等於母體參數,因此我們問:估計值與母體參數有多接近?. - PowerPoint PPT Presentation

Transcript of Interval Estimation 區間估計

Page 1: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 1

Interval EstimationInterval Estimation 區間估計區間估計

• 在前章中我們介紹了各種估計母體參數的方法 (point estimator) 。例如我們發現樣本平均數 X 為母體平均數 μ 的一個不偏估計式。

• 雖然平均而言, X 能正確的代表 μ ,但每一次觀察到的 X 不會剛好等於 μ ,而是隨著抽到的樣本不同有高有低:

觀念觀念

error sampling X

Page 2: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 2

Interval EstimationInterval Estimation 區間估計區間估計

• 因此除了點估計外,我們還想進一步知道從樣本中得到的估計值有多可靠,由於樣本的估計值本身也是一個隨機變數,不一定會剛好等於母體參數,因此我們問:估計值與母體參數有多接近?

觀念觀念

Page 3: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 3

Interval EstimationInterval Estimation 區間估計區間估計

• 從估計式的抽樣分配中,我們可以建立一套系統性的方法來表達估計式的精確度。

觀念觀念

error) sampling(

ˆ

ˆ

稱為抽樣誤差

為估計的誤差,則

的估計式為假設

Page 4: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 4

Interval EstimationInterval Estimation 區間估計區間估計

• 我們通常以建構信賴區間 (confidence intervals) 來顯示估計式的準確度。

觀念觀念

所形成的區間中。落於

在某種特定的機率下,使母體參數和來建構出兩個數值用

)ˆ,ˆ(

ˆˆˆ

21

21

Page 5: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 5

Interval EstimationInterval Estimation 區間估計區間估計 觀念觀念

1)(

,

),(

21

21

21

P

xxx n

為兩個統計量,使得假設為欲估計的母體參數,

樣本為由某母體抽出的隨機設

)condidence of level(

),()1(

intervals) confidence()%1(100

),(

21

21

的信賴度稱為信賴區間信賴區間的為則稱

Page 6: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 6

Interval EstimationInterval Estimation 區間估計區間估計

• 在估計的問題中,我們希望估計式具有以下兩個性質:

• 1. 估計式為不偏估計 (unbiased estimator) ,即估計式不會系統性的高估或低估母體參數。

• 2. 我們希望估計式的抽樣分配集中於母體參數的周圍,即估計式的變異數愈小愈好。

Page 7: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 7

Interval EstimationInterval Estimation 區間估計區間估計

• 在估計的問題中,我們希望估計式具有以下兩個性質: θ

θ̂

Unbiased

small is )ˆvar(

Page 8: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 8

Value of ZValue of Zαα(( 課本課本 276276 頁)頁)

• Let Z be a standard normal random variable and let αbe any number such that 0<α<1. Then zαdenotes the number for which

• P(Z z≧ α) = α

Page 9: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 9

Value of ZValue of Zαα

• 例題: α=.025 ,求 zα?

• P(Z z≧ α) =.025

0 zα

Area=.025

Area=1-.025=0.975

zα=1.96

Page 10: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 10

Value of ZValue of Zαα

• 例題:求 z.05?

• P(Z z≧ .05) =.05

0 z.05

Area=.05

Area=1-.05=0.95

zα=1.645

Page 11: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 11

Value of ZValue of Zαα

• 例題:求 z.005?

• P(Z z≧ .005) =.005

0 z.005

Area=.005

Area=1-.005=.995

zα=2.58

Page 12: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 12

Value of ZValue of Zαα

• P(Z z≧ α/2) =α/2 • P(Z -z≦ α/2) =α/2 • P(-zα/2 Z z≦ ≦ α/2) =(1-α)

0.399

1.338104

f x( )

44 x4 3 2 1 0 1 2 3 4

0

0.2

0.4

α/2

1-α/2-α/2

=1-α

Page 13: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 13

Confidence intervals for the mean with Confidence intervals for the mean with know population varianceknow population variance

• 假設我們從 N(μ, σ2) 的母體中抽取樣本數為 n 的樣本。其樣本平均數的抽樣分配為 :

),(~2

nNX

)1,0(~

/N

n

uXZ

Page 14: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 14

Confidence intervals for the mean with Confidence intervals for the mean with know population varianceknow population variance

)/

(1

)(1

2/2/

2/2/

zn

uXzP

zZzP

• 根據先前的結果:

)//( 2/2/ nzuXnzP

)//( 2/2/ nzXunzXP

)//( 2/2/ nzXunzXP

Page 15: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 15

Confidence intervals for the mean with Confidence intervals for the mean with know population varianceknow population variance

• 這個結果告訴我們:• 母體參數 μ 落在下列隨機區間

)/,/( 2/2/ nzXnzX

的機率為 (1-α)或者可以說上述隨機區間包含母體參數 μ 的機率為 (1-α)

Page 16: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 16

Level of ConfidenceLevel of Confidence

• The level of confidence (1-α) of a confidence interval measures the probability that a population parameter will be contained in an interval calculated after a random sample has been selected from a population.

• 信賴度衡量從母體中抽取隨機樣本所建構出的信賴區間會含括母體參數的機率。

• α 為誤認母體參數落在信賴區間中的機率。如 α=.05,則信賴度1-α=.95,表示有 5%的機率母體參數會落在信賴區間之外。

Page 17: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 17

Confidence intervals for the mean with Confidence intervals for the mean with know population varianceknow population variance

• Suppose we take random sample of n observations from a normal population with mean u and variance σ2. If σ2is known and the observed sample mean is x, then the confidence interval for the mean with a level of confidence 100(1-α)% is given by:

)/,/( 2/2/ nzXnzX

• Where zα/2is the number for which

• P(Z z≧ α/2) =α/2

Page 18: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 18

例題例題

• 學校想估計去年畢業的學生第一年的年薪。假設薪資分佈為常態分配,且母體的標準差為 $2000 。取隨機樣本 25 名校友得到平均薪資為 $19,500 ,求 95% 的信賴區間。

)25/200096.119500,25/200096.119500(

• σ= $2000, n=25, x=$19500• 1-α=95%, α= .05 , α/2=.025, zα/2=1.96

)20284 ,18716(

Page 19: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 19

例題例題

• 我們之所以計算出 95% 的信賴區間為 (18,716, 20,284) 完全是因為樣本的平均數為$19,500 。如果我們再抽取一個 25 人的樣本,則可能得到不同的區間。

• 如果我們一直不斷的重複取樣本 1000 次,則有 950 次 (95%) 所建構出的信賴區間會含括母體的平均數。

Page 20: Interval Estimation 區間估計

0.399

1.338104

f x( )

44 x4 3 2 1 0 1 2 3 4

0

0.2

0.4

μ

的抽樣分配X母體參數:

Mean = μ

Variance =σ2

每個區間 =

nx

96.1

間為隨機區間變化,所以區的平均值會有因為每個樣本

Page 21: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 21

Page 346, Figure 8.1Page 346, Figure 8.1

Page 22: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 22

Confidence intervals for the mean with Confidence intervals for the mean with know population varianceknow population variance

• 母體參數 u 不是一個隨機函數,不會隨著樣本的不同而有差異。

• X 為會隨著樣本而變的隨機函數,因此信賴區間也會隨著樣本的不同而有差異。

• 100(1-α)% 的機率,上述的隨機區間會含括母體參數 u 。

)//(1 2/2/ nzXunzXP

Page 23: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 23

Confidence intervals for the mean with Confidence intervals for the mean with know population varianceknow population variance

• 一般所謂 95% 的信賴區間估計,乃是表示重複抽取樣本數為 n 的所有可能樣本所建立的全部區間估計中,有 95% 的區間將會包含真正的母體平均數,而僅有 5% 沒有包含母體平均數。

• 但實際上我們通常僅抽取一個樣本,且 u 通常為未知,因此無法確切知道此樣本是否包含 u ,但我們可以說此區間有 95% 的機率會包含 u.

Page 24: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 24

Page 349, Procedure 8.1Page 349, Procedure 8.1

Page 25: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 25

Formula for commonly constructed Formula for commonly constructed confidence intervalsconfidence intervals

• 經常在使用的信賴區間

)96.1 ,96.1(n

xn

x

(1-α) α α/2 zα/2

0.90 0.10 0.050 1.650.95 0.05 0.025 1.960.99 0.01 0.005 2.58

Level of Confidence

)58.2 ,58.2(n

xn

x

)645.1 ,645.1(n

xn

x

Page 26: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 26

Desirable Properties of Confidence Desirable Properties of Confidence IntervalsIntervals

• 好的信賴區間有兩個特性:• 信賴度愈高愈好 The interval should hav

e a high level of confidence (1-)

• 信賴區間愈小愈好 The interval should have narrow width ( precision)

Page 27: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 27

Page 352, Figure 8.3Page 352, Figure 8.3

Page 28: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 28

Margin of Error-Margin of Error-The width of a confidence interval for The width of a confidence interval for uu

• 母體平均數的信賴區間寬度 W :

nzW

2/2

• 信賴區間的寬度 W 決定於幾個因素:• (1) 信賴區間的信賴度 (1-α)

• (2) 母體標準差• (3) 樣本規模 n

Page 29: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 29

Comparing Width of Confidence IntervalsComparing Width of Confidence Intervals

• Suppose we take a random sample of size n from population having known variance 2. Construct 99%, 95%, 90% CI for the population mean and compare their widths.

nW

)58.2(21

nW

)96.1(22

nW

)645.1(23

32.12

1 W

W

19.13

2 W

W

W1 比 W2 的寬度多 32%

W2 比 W3 的寬度多 19%

Page 30: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 30

Comparing Width of Confidence IntervalsComparing Width of Confidence Intervals

• To decrease the width of confidence interval, we must either use a smaller level of confidence (1-), or increase the sample size n.

99%95%90%

80%

50%

n

58.2

n

96.1

n

64.1

n

28.1

n

67.

Confidence coefficient

Width of CI

Page 31: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 31

續例題續例題 10.310.3

• 學校想估計去年畢業的學生第一年的年薪。假設薪資分佈為常態分配,且母體的標準差為 $2000 。取隨機樣本 25 名校友得到平均薪資為 $19,500 ,求 99% 的信賴區間 ,並與 95%CI 做比較。

)25/200058.219500,25/200058.219500(

• σ= $2000, n=25, x=$19500• 1-α=99%, α= .01 , α/2=.005, zα/2=2.58

2064$ )20532 ,18486( 1 W

1568$ )20284 ,18716( 2 W=1.32

Page 32: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 32

Confidence intervals for large Confidence intervals for large samplessamples

• CI 的建構必須有兩個條件:• (1) 母體必須為常態分配。• (2) 母體的變異數為已知數。• 當樣本數 n30 ,根據中央極限定律,樣本平均數的抽樣分配會趨近於常態分配,且樣本標準差會愈來愈趨近於母體標準差,所以條件 (1)(2) 皆能滿足。

Page 33: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 33

例題例題• 郵局的人事部門想要瞭解郵差請病假的情況,取樣 100 人來觀察,母體的分配及標準差皆為未知數,假設樣本平均數為 8.2 , s=2.7天,建構 95% CI 。

05.,95.)1(,7.2,2.8,100 sXn

30,96.1,025.2/ 2/ nz

),( 2/2/n

szx

n

szxCI

)7292.8,6708.7()100

7.296.12.8,

100

7.296.12.8( CI

Page 34: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 34

One-sided confidence intervals for One-sided confidence intervals for the meanthe mean

• Suppose that we wish to find the lower confidence limit (LCL) such that the probability (1-)that u exceeds LCL. The one-sided interval (LCL, ) is a left-sided confidence interval. The lower confidence limit is given by

nzxLCL

• Suppose that we wish to find the upper confidence limit (UCL) such that the probability (1-)that u is less than UCL. The one-sided interval (-, UCL) is a right-sided confidence interval. The upper confidence limit is given by

nzxUCL

Page 35: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 35

One-sided confidence intervals for One-sided confidence intervals for the meanthe mean

• 單邊信賴區間的意義:假設重複取樣本數為 n 的隨機樣本,每次計算 (LCL, ) ,則在所有樣本所建構出的左邊信賴區間中,將有 1- 的機率會包含 u 。

Page 36: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 36

One-sided confidence intervals for One-sided confidence intervals for the meanthe mean

• 郵局的人事部門想要瞭解郵差請病假的情況,取樣100 人來觀察,母體的分配及標準差皆為未知數,假設樣本平均數為 8.2 , s=2.7天,建構母體參數u 的單(左)邊 95% 信賴區間。

05.,95.)1(,7.2,2.8,100 sXn,645.1z

75585.7100

7.2645.12.8

),(

n

szxLCL

我們有 95% 的信心 u 會超過7.7558

Page 37: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 37

Student’s Student’s tt distribution distribution

• 先前透過 Z-score 來建構 CI :• (1) 母體必須為常態分配,母體的變異數為已知數。

• (2) n30

• 當母體標準差為未知數,且樣本數很小時,如何建構 CI ?

Page 38: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 38

Student’s Student’s tt distribution distribution

• 若母體~ N(, 2) ,則

),(~2

nNX

)1,0(~/

Nn

uXZ

• 若母體 2 未知,則以 S 來取代,我們得到 t-score:

nS

uXt

/

• 樣本數愈大, S 愈接近, t 分配愈接近標準常態分配 Z:

Page 39: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 39

tt 分配的一些特性分配的一些特性

• t 分配為中心點為零,介於 - 至的對稱分配 .

• t 分配的形狀為類似標準常態分配的鐘形分配

• t distribution 的平均值為 0.

• t 分配的機率密度函數決定於參數 (nu), 即自由度 (degree of freedom) 。建構平均值的信賴區間時,自由度為樣本數減一 degrees of freedom is =(n-1) 。

Page 40: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 40

Characteristics of Characteristics of tt distribution distribution

• t distribution 的變異數為 /(-2) for >2 ,其值永遠大於 1 。 v 愈大(樣本越大),變異數越接近 1 ,其形狀越接近標準常態分配。

Page 41: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 41

Characteristics of Characteristics of tt distribution distribution

• t 分配是一群機率分配的組合,不同自由度對應不同的 t distribution 的密度函數,由於變異數較標準常態分配大,所以形狀較為矮胖。

0.399

1.338104

f x( )

44 x4 3 2 1 0 1 2 3 4

0

0.2

0.4Standard normal (d.f.=)

d.f. =4

d.f. =2

d.f. =1

Page 42: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 42

Value of tValue of t,,

• The symbol t,denotes the value of t such that the area to its right is and t has degree of freedom. The value t, satisfies the equation:

• P(t > t, )=

• Where the random variable t has the t distribution with degrees of freedom.

Page 43: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 43

Value of tValue of t,,

• P(t > t0.05,13 )=0.05找出 t 值?

Page 44: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 44

例題例題• Consider the t distribution having =9 degrees

of freedom. Find the value t.05, 9 such that the area in the right tail of the t distribution is .05.

0 t.05=1.83

Area = .05

t distribution with d.f. = 9

Page 45: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 45

例題例題• Consider the t distribution having =9 degrees of

freedom. Find the value t.025, 9 and -t.025, 9 such that each tail of the t distribution contains area .025.

0 t.025= 2.262

Area = .025

t distribution with d.f. = 9

-t.025= -2.262

Page 46: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 46

例題例題• Consider the t distribution having =20 degrees

of freedom. Find the value t.025, 20 such that the right tail of the distribution contains area .025.

0 t.025= 2.086

Area = .025

t distribution with d.f. = 20

Page 47: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 47

Confidence intervals for the mean Confidence intervals for the mean with unknown population variancewith unknown population variance• 若母體~ N(, 2) ,則

),(~2

nNX

)1,0(~/

Nn

uXZ

• 若母體 2 未知,則以 S 來取代,我們得到 t-score:

nS

uXt

/

has the t distribution with v = (n-1) degrees of freedom.

Page 48: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 48

Constructing confidence intervals Constructing confidence intervals using the using the tt distribution distribution

• The area to the right of tα/2,υis α/2 for the t distribution having v degrees of freedom. Similarly, the area to the left of -tα/2,υ is α/2 . Thus, we obtain:

)/

(1

)(1

,2/,2/

,2/,2/

vv

vv

tns

uXtP

tttP

Page 49: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 49

Constructing confidence intervals Constructing confidence intervals using the using the tt distribution distribution

)/

(1 ,2/,2/ vv tns

uXtP

)(1 ,2/,2/ nStuX

nStP vv

)(1 ,2/,2/ nStXu

nStXP vv

Page 50: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 50

Constructing confidence intervals Constructing confidence intervals using the using the tt distribution distribution

)(1 ,2/,2/ nStXu

nStXP vv

這個結果告訴我們,如果從常態分配中抽取樣本,則母體 u 在 1-α 的機率下會落於以下區間

),( ,2/,2/ nStX

nStX vv

Page 51: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 51

Confidence interval for the mean of a normal Confidence interval for the mean of a normal population with population with unknown population varianceunknown population variance

Suppose we take a random sample of n observations from a normal population with mean u and unknown variance σ2. If the observed sample mean is x and the observed sample standard deviation is s, the confidence interval for the mean having level of confidence 100(1-α)% is given by

),( ,2/,2/ nStX

nStX vv

定義定義

Page 52: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 52

例題例題一工程師要估計某種鋼鐵的平均強度,假設該鋼條的強度為常態分配,他做了四個試驗,得到的強度如下 844, 847, 845, 844 ,計算該鋼條平均強度的 95% 信賴區間。

例題例題

8454

844845847844

X

2])844845(...)845844[(2

1)(

1

1 2222

i i xxn

S

)42845,4

2845( 3,025.03,025.0 tt

Page 53: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 53

兩種信賴區間的比較兩種信賴區間的比較

由 t 值所建構出的 CI 的區間比由 Z-score 所建構出的 CI 區間要寬,因為母體的變異數必須估計,誤差較大。

樣本數愈大, CI 的寬度愈小。因為(1) n 在分母 (2) t 值隨著 degree of freedom 的增加而減小。

觀念觀念

Page 54: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 54

兩種信賴區間的比較兩種信賴區間的比較

CI 隨著 d.f.增加而減小的情形:

觀念觀念

sample size d.f. 95% CIn n-15 410 920 1930 29

∞ ∞

)/(776.2 nsx

)/(262.2 nsx

)/(093.2 nsx

)/(045.2 nsx

)/(96.1 nsx 當 d.f. 大於 120時,用 t 值所計算的 CI 與用標準常態分配所計算出的 CI 幾乎相同。

Page 55: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 55

例題例題N=121, X = $20,000 S=$4,000 construct two CI, one using t, the other using z.

υ= n-1 =120, t0.025, 120 = 1.984

例題例題

),( ,2/,2/ nStX

nStX vv

)121

4000984.1000,20,121

4000984.120000(

)121

400096.1000,20,121

400096.120000( 值用z

Page 56: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 56

例題例題n=10, we want to construct 95% IC using z and t.

If the variance is known, we use z =1.96

If the variance is unknown, we use t.025, 9 = 2.262

2.262/1.96=15%. The confidence interval based on the t value will be 15% wider than that based on the z value.

例題例題

Page 57: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 57

One-sided confidence intervals for One-sided confidence intervals for the meanthe mean

Take a random sample of n observations from some normal population having unknown mean u and unknown standard deviation σ.

Suppose that we wish to find the lower confidence interval (LCL, ∞) is a left-sided confidence interval.

The lower confidence limit is given by:nstxLCL /

Suppose that we wish to find the upper confidence interval (-∞, UCL) is a right-sided confidence interval

nstxLCL /

Page 58: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 58

One-sided confidence intervals for One-sided confidence intervals for the meanthe mean

n=10, σ = unknown, x=14.5, s = 2.5. Construct 95% left-sided CI for the population mean u.

例題例題

nstxLCL /

The 95% left-sided confidence interval for u is (13.051, ∞)

051.1310

5.2833.15.14

Page 59: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 59

Determining the sample sizeDetermining the sample size 決定樣本大小決定樣本大小

Confidence interval for the mean:

Suppose an individual is interested in estimating the mean of a population having a known variance 2. How large a sample size must be taken if the investigator wants the probability to be (1-) that the sampling error |X - u| is less than some amount D?

Page 60: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 60

Determining the sample sizeDetermining the sample size 決定樣本大小決定樣本大小

信賴區間是以 X 為中心,向左右各伸展:

)/,/( 2/2/ nzXnzX

)//(1 2/2/ nzXunzXP

n

zD

2/

D

zn

2/2

2

22/

D

zn

將 D固定,求 n=?

Page 61: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 61

例題例題An economist wants to estimate the mean annual income of households in a particular congressional district. It is assumed that the population standard deviation is =$4,000. The economist wants the probability to be .95 that the sample mean will be within a D = $500 of the true mean u. How large a sample is required?

500 D4000 96.1 95.1 2/ z

2

2

22/

D

zn

86.245500

)000,4(96.12

2

2

n

Page 62: Interval Estimation 區間估計

x

f x( )

f x( )

x

nXVar

XE

的抽樣分配X

2

)(

)(

複習

母體分配

根據中央極限定律,我們知道樣本夠大時,樣本平均數的抽樣分配為常態分配

Page 63: Interval Estimation 區間估計

0.399

1.338104

f x( )

44 x4 3 2 1 0 1 2 3 4

0

0.2

0.4

μ

的抽樣分配X母體參數:

Mean = μ

Variance =σ2

每個區間 =

nx

96.1

間為隨機區間變化,所以區的平均值會有因為每個樣本

Page 64: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 64

複習複習

設( x1,x2…xn) 為由某母體抽出的隨機樣本,為此母體之參數,假設 T1, T2 為兩個統計量,使得

1)( 21 TTP

則稱( T1, T2) 為的 100(1-)% 信賴區間,而 (1-) 為信賴度。

T1 T2

Page 65: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 65

複習複習

的估計式,為參數設 ˆ n

1))ˆ( Dp n若

(精確度、抽樣誤差)誤差界線的估計為以則稱 )%1(100 ˆ nD

T1 T2n̂

D

Page 66: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 66

複習複習

母體平均數 u 之區間估計:

當母體標準差 σ已知,且 n>30 ,則

)/,/( 2/2/ nzXnzX

為母體平均數 u 的 100(1-)% 的信賴區間

Page 67: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 67

Confidence intervals for the mean Confidence intervals for the mean with unknown population variancewith unknown population variance• 若母體~ N(, 2) ,則

),(~2

nNX

)1,0(~/

Nn

uXZ

• 若母體 2 未知,則以 S 來取代,我們得到 t-score:

nS

uXt

/

has the t distribution with v = (n-1) degrees of freedom.

Page 68: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 68

複習複習

母體平均數 u 之區間估計:

當母體標準差 σ未知則

為母體平均數 u 的 100(1-)% 的信賴區間

)(1 ,2/,2/ nStXu

nStXP vv

),( ,2/,2/ nStX

nStX vv

Page 69: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 69

複習複習

母體平均數 u 之點估計:

一般以 X 來估計 u ,也就是取 X 做為 u 的估計式,因此 X 為 u 之點估計值。

當樣本數 n 已知,且 n>30 ,以 X 估計 u 的 100(1-)%誤差界線為

n

zD

2/

當樣本數未定,但 n>30 ,若誤差界線 D 已知,則樣本數為 2

2

22/

D

zn

Page 70: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 70

複習複習

一個日光燈製造公司生產的燈管壽命近似常態分配,它的標準差為 100 小時。某品管人員隨機抽樣 32燈管,經使用後觀察其壽命,得平均壽命為 1200 小時

(1)求該公司生產的每支燈管的平均壽命之估計值。平均壽命 u 之點估計值為 x=1200 小時

Page 71: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 71

複習複習

(2)求 (1) 中的估計之 95% 誤差界線?

648.3432

10096.1

2

n

ZD

誤差界線

(3)若希望(2)中的 95% 誤差界線為 20 小時,問此題的樣本夠不夠大?若不夠大應再抽多少樣本?

9704.96)100()20

96.1( 22

2

2

22/ 取

D

zn

故應再取 97-32=65支

Page 72: Interval Estimation 區間估計

©蘇國賢 2000社會統計(上) Page 72

複習複習

(4)求該公司生產的每支燈管平均壽命的 90%及 95% 信賴區間

)/,/( 2/2/ nzXnzX

)32/100645.11200,32/100645.11200(

:%90

CIu之

)32/10096.11200,32/10096.11200(

:%95

CIu之