CHAPTER 10 假設檢定

50
CHAPTER 10 CHAPTER 10 假假假假 假假假假 假假假假假 STATISTICS FOR MANAGEMENT AND ECONOMICS

description

CHAPTER 10 假設檢定. 基礎統計學 STATISTICS FOR MANAGEMENT AND ECONOMICS. 目錄. 10.1 導論 10.2 假設檢定的概念 10.3 母體平均數的檢定-當母體標準差已知 10.4 計算型 II 誤差的機率 10.5 未來課題. 10.1 導論. 假設檢定,其目的其為判斷是否存在足夠的統計證據來對母體參數的假設進行合理的推論 假設檢定應用的例子如下: 應用 1 檢定購買此產品的比例是否大於 12% 應用 2 檢定宣稱的療效,以推論新藥是否有效 應用 3 用在評估這些模式的好壞. - PowerPoint PPT Presentation

Transcript of CHAPTER 10 假設檢定

Page 1: CHAPTER 10 假設檢定

CHAPTER 10CHAPTER 10假設檢定假設檢定

基礎統計學STATISTICS FOR MANAGEMENT

AND ECONOMICS

Page 2: CHAPTER 10 假設檢定

目錄目錄

10.1 導論10.2 假設檢定的概念10.3 母體平均數的檢定-當母體標準差已知10.4 計算型 II 誤差的機率10.5 未來課題

Page 3: CHAPTER 10 假設檢定

10.110.1 導論導論假設檢定,其目的其為判斷是否存在足夠的統計證據來對母體參數的假設進行合理的推論

假設檢定應用的例子如下:應用 1

檢定購買此產品的比例是否大於 12%應用 2

檢定宣稱的療效,以推論新藥是否有效應用 3

用在評估這些模式的好壞

Page 4: CHAPTER 10 假設檢定

10.210.2 假設檢定的概念假設檢定的概念罪犯審判實際有二個假設會被檢定

虛無假設 (null hypothesis) ,以符號 H0 表示,即:

H0 :被告無罪

對立假設 (alternative or research hypothesis) ,以符號 H1表示,在罪犯審判時,即:

H1 :被告有罪

Page 5: CHAPTER 10 假設檢定

10.210.2 假設檢定的概念假設檢定的概念假設檢定可能會出現兩種誤差

型 I 誤差 (Type I error) :當我們拒絕一個真的虛無假設時 型 I 誤差以 表示稱為顯著水準 (significance level)

型 II 誤差 (Type II error) :定義為沒有拒絕一個假的虛無假設 以 (beta) 表示

及 之間為反方向的變動關係

Page 6: CHAPTER 10 假設檢定

10.210.2 假設檢定的概念假設檢定的概念假設檢定具有下列重要的概念:

1. 包含兩個假設,一個是虛無假設 (H0 ) ;另一個是對立假設 (H1 )

2. 在檢定的過程中,先假定虛無假設為真3. 進行檢定的目的,是要決定是否有足夠的證

據推論對立假設為真4. 檢定有下列二種可能的結果:1) 拒絕虛無假設,支持對立假設2) 不拒絕虛無假設,沒有足夠的證據來支持對立假設

Page 7: CHAPTER 10 假設檢定

10.210.2 假設檢定的概念假設檢定的概念5. 任何檢定都會發生兩種可能誤差,其機率式

可以寫為:

P (Type I error) P ( 拒絕 H0 ,當 H0 為真 ) P (Type II error) P ( 不拒絕 H0 ,當 H0 為偽 )

Page 8: CHAPTER 10 假設檢定

10.310.3 母體平均數的檢定 母體平均數的檢定 -- 當母體標準差已當母體標準差已知知 例題 10.1

百貨公司經理想針對信用簽帳的顧客建立一套新的帳戶處理系統。經過完整的財務分析,她判斷只有在全部帳戶的平均月消費額超過 $170 時,新系統才會有成本效益。因此她隨機抽出 400 個帳戶 ( 資料儲存在 XM10-01) ,得到樣本平均數為 $178 ,假設經理已知帳戶月消費額符合常態分配,且標準差為 $65 ,該經理是否可由此推論新系統具有成本效益?

Page 9: CHAPTER 10 假設檢定

設立對立假設為:

虛無假設為:

要檢定這個問題有兩種方式1. 拒絕域法 (rejection region method)

2. p 值法 (p-value approach)

1 : 170H

0 : 170H

統計方法確認

Page 10: CHAPTER 10 假設檢定

10.3.110.3.1 拒絕域法拒絕域法

Lx

Lx x

可以拒絕虛無假設的樣本平均數值為 ,則拒絕域為:

Page 11: CHAPTER 10 假設檢定

10.3.110.3.1 拒絕域法拒絕域法

Page 12: CHAPTER 10 假設檢定

10.3.110.3.1 拒絕域法拒絕域法

/170 1.645

65 / 400175.35

L

L

L

xz

nx

x

65 400n

170

0.05 1.645 z z Lx

筆算作答已知 及 ,因為上述所有機率都是建立在虛無假設為真的條件上,所以 。計算拒絕域需要 值,假設該經理選擇顯著水準 () 為 5% ,則 ,我們可以求出 的值

Page 13: CHAPTER 10 假設檢定

175.35x

x

因此拒絕域為:

已知檢定統計量的樣本平均數是 178 ,因為 178

大於 175.35 落在拒絕域內,所以拒絕虛無假設。因此,有足夠的證據推論月平均帳戶消費額大於 170

  前述的計算告訴我們,從 = 170 的母體中,相當不易得到樣本平均數 大於 175.35

的抽樣。也因此讓我們有信心推論假設虛無假設為真是不正確的,應該拒絕虛無假設。

Page 14: CHAPTER 10 假設檢定

10.3.210.3.2 標準化檢定統計量標準化檢定統計量另一種較簡單的方法是將 標準化後的值作為檢定統計量

標準化檢定統計量 (standardized test statistic) :

拒絕域可為:

假設:

x

/

xz

n

z z

0

1

: 170

: 170

H

H

Page 15: CHAPTER 10 假設檢定

10.3.210.3.2 標準化檢定統計量標準化檢定統計量

/

xz

n

檢定統計量:

0.05 1.645z z z 拒絕域:

/178 170 65 / 400

2.46

xz

n

檢定統計量的值:

因為 2.46 大於 1.645 ,所以拒絕虛無假設。有足夠的證據推論月平均帳戶消費額大於 $170

Page 16: CHAPTER 10 假設檢定
Page 17: CHAPTER 10 假設檢定

pp 值法值法 ((pp-value Method)-value Method)

( 178)

178 170 / 65 / 400

( 2.46)

0.0069

p P X

XP

n

P Z

在例題 10.1 中, p 值是當母體平均數為 170 時,觀察樣本平均數至少比 178 大的機率。即:

Page 18: CHAPTER 10 假設檢定

pp 值法值法 ((pp-value Method)-value Method)

因為 p 值 0.0069 < 0.05 ,代表 p 值足夠小到拒絕虛無假設

Page 19: CHAPTER 10 假設檢定

pp 值的解釋值的解釋當母體平均數是 170 時,觀察樣本平均數比 178

大的機率相當的小,其為 0.0069

換句話說,觀察樣本平均數計算所得到的 p 值,此結果對於母體平均數是 170 的假設支持很小,因此,我們應懷疑虛無假設中對母體平均數的假設,所以應拒絕虛無假設而支持對立假設

Page 20: CHAPTER 10 假設檢定

pp 值的解釋值的解釋

Page 21: CHAPTER 10 假設檢定
Page 22: CHAPTER 10 假設檢定
Page 23: CHAPTER 10 假設檢定

10.3.510.3.5 描述 描述 p p 值值統計學家通常使用下列的描述來解釋 p 值若 p 值小於 1% ,有充分證據來推論對立假設為真,亦即該檢定為高度顯著

若 p 值介於 1% 及 5% 之間,有相當強的證據推論對立假設為真,亦即該檢定為顯著

若 p 值介於 5% 及 10% 之間,有薄弱證據顯示對立假設為真,當 p 值大於 5% ,該檢定在統計上不顯著

當 p 值大於 10% ,沒有足夠的證據來推論對立假設為真

Page 24: CHAPTER 10 假設檢定

10.3.510.3.5 描述描述 pp 值值

Page 25: CHAPTER 10 假設檢定

10.3.610.3.6 p p 值法及拒絕域法值法及拒絕域法

Page 26: CHAPTER 10 假設檢定

10.3.610.3.6 p p 值法及拒絕域法值法及拒絕域法

Page 27: CHAPTER 10 假設檢定

例題例題 10.210.2  某政府單位負責督導食物製造商以確保其包裝內容物的重量或數量,符合標籤所標示的內容。例如某品牌瓶裝蕃茄醬標籤標示內容物淨重為 16盎司,所以內容物必須至少淨重 16盎司。要抽檢全國該品牌所有的瓶裝蕃茄醬是不可能的,因此該單位必須使用統計方法。該單位的做法是隨機由該產品中選取一組樣本,並測量其內容物重量,若該樣本平均數提供充分的證據足以推論所有瓶裝的平均重量少於 16盎司,則該產品的標示正確性不可接受。下列數據是一政府檢查員測量 25瓶標示淨重“ 16盎司”的蕃茄醬所得到的數據 ( 資料儲存在延續例題 10.2檔案 XM10-02 中 ) ,從先前的實驗中檢查員已知蕃茄醬瓶裝重量為一標準差 = 0.4 盎司的常態分配,則檢查員可否推論該產品標示不可接受?

Page 28: CHAPTER 10 假設檢定

統計方法確認   本研究目的是要對所有瓶裝蕃茄醬的平均重量作推論,因此要檢定母體平均數 。檢查員想知道是否有足夠的統計證據顯示母體平均數少於 16盎司。因此,對立假設為:

1 : 16H 則虛無假設自然為:

檢定統計量為: 0 : 16H

/

xz

n

Page 29: CHAPTER 10 假設檢定

筆算作答   筆算作答解答本問題,我們需定義拒絕域,所以選擇顯著水準 = 0.05 。  只有當檢定統計量的值足夠小,我們才拒絕虛無假設,所以拒絕域放在抽樣分配的左尾。為什麼呢?記住我們是要決定是否有足夠的統計證據推論平均數小於 16盎司 ( 即對立假設 ) ,但若我們觀察到一個較大的樣本平均數 ( 或一個較大的 z 值 ) ,我們是否會拒絕虛無假設?答案絕對為否定的。例如說樣本平均數是 20卻推論所有瓶裝的平均重量小於 16盎司是非常荒謬的。所以只有當樣本平均數 ( 或 z 值 ) 為小時,我們才拒絕虛無假設。但問題是“到底要到多小”才足夠?答案是依顯著水準及拒絕域而定。因此本題拒絕域設定為:

0.05 1.645z z z

Page 30: CHAPTER 10 假設檢定

注意上述不等式的方向與對立假設 ( 16) 之不等式一致。另因為拒絕域在抽樣分配的左邊 ( 包含小於 0 的 z 值 ) 所以為負號。代入資料得到樣本平均數: 15.90x

母體標準差 = 0.4 為已知, n = 25 ,而 假設為 1

6 ,經計算得到檢定統計量的值為:

/15.90 16 0.4 / 25

1.25

xz

n

Page 31: CHAPTER 10 假設檢定

因其大於 1.645 ,故不拒絕虛無假設,即沒有足夠的證據推論母體平均數小於 16盎司。另外檢定的 p 值為: 也因為 p 值大於 值,故不拒絕虛無假設。

( 1.25) 0.1056p P Z 值

在此類型的假設檢定中,我們計算 P (Z < z) 的機率 p值, z 為檢定統計量的實際值。圖 10.7 中描繪出抽樣分配,拒絕域及 p 值。

Page 32: CHAPTER 10 假設檢定

結果解釋   因為無法拒絕虛無假設,我們可以說沒有足夠證據推論母體平均數小於 16盎司。必需注意本例中仍有些證據指出母體平均數小於 16盎司,因為我們計算出樣本平均數為 15.9 。無論如何,要拒絕虛無假設就必需要有足夠的理由來拒絕虛無假設。在缺乏足夠證據顯示所有瓶裝蕃茄醬平均重量小於16盎司,檢查員無法斷言標籤標示為不正確的。

Page 33: CHAPTER 10 假設檢定

例題例題 10.310.3  自從啟用新的製程以來,負責組裝電腦鍵盤生產線的主管陸續遇到一些問題。他注意到瑕疵品及偶發性停滯的情形增加,某一工作站的產出量不能配合其他工作站的產出量。在檢視製程後,發現當初是以完成關鍵零組件所需的時間平均數 130秒、標準差 15秒、且為一常態分配為假設的前題下,設計出該製程。他相信製程時間是標準差 15秒的常態分配,但不確定平均組裝時間為 130秒。為了確認應否調整生產線,他隨機測量了 100次組裝時間 ( 資料存於在檔案 XM10-03 中 ) ,結果列示於下,請問主管能否推論生產線平均組裝時間為 130秒的假設是不正確的?

Page 34: CHAPTER 10 假設檢定

統計方法確認   在本例題中,我們想知道平均組裝時間是否不同於 130秒。因此設立對立假設為:

1 : 130H 虛無假設則為:

0 : 130H

Page 35: CHAPTER 10 假設檢定

筆算作答   因為當檢定統計量足夠大或足夠小時,便拒絕虛無假設。因此拒絕域分別在抽樣分配的左、右尾上,我們需設立一雙尾拒絕域 (two-tail rejection region) 。拒絕域總面積 需除以 2 ,得到拒絕域範圍為:

因 = 0.05 , /2 = 0.025 ,及 za /2 = z0.025 = 1.96 則拒絕域為:

計算樣本資料得到:

/ 2 / 2z z z z   或 

1.96 1.96z z   或 

126.8x

Page 36: CHAPTER 10 假設檢定

檢定統計量為:

因 2.13小於 1.96 所以拒絕虛無假設。

126.8 130 2.13/ 15/ 100

xz

n

  我們也可計算該檢定的 p 值,因其為雙尾檢定,可分別找出雙尾的面積,則:

或簡單的把單尾的機率乘以 2 即可。

( 2.13) ( 2.13) 0.0166 0.0166 0.0332p P Z P Z 值

Page 37: CHAPTER 10 假設檢定

  通常,雙尾檢定的 p 值可以寫成:

Z 表檢定統計量計算出的實際值, | z | 為該數字的絕對值,圖 10.8展示出檢定統計量的抽樣分配。

2 ( | | )p P Z z 值

Page 38: CHAPTER 10 假設檢定

結果解釋   有證據推論平均組裝時間不等於 130秒,生產作業經理在決定如何進行下一步之前需先考慮幾個因素,首先是平均時間有多大的可能不是 130秒,雖然 p 值顯示出是有統計證據存在,但並非是不容置疑的證據,第二個課題是不良品增加及瓶頸問題可能是其他原因造成的,第三個課題是就算從製程中找到問題,也可能因成本效益或不可行而無法更正製程。但很清楚的是我們需要更多的調查,因此統計分析至少讓經理開始尋找出一解決方案。

Page 39: CHAPTER 10 假設檢定

10.3.710.3.7 假設檢定與區間估計假設檢定與區間估計檢定統計量及區間估計量皆由抽樣分配求出。因此可以利用區間估計量來檢定假設並不意外

信賴區間的估計值為:

在例題 10.1 中, 95% 信賴區間估計值為LCL=171.63 及 UCL= 184.37 ,未包含 170 在其中,所以我們下結論說母體平均數不等於 170

Page 40: CHAPTER 10 假設檢定

10.410.4 計算型計算型 IIII 誤差的機率誤差的機率回想例題 10.1 ,我們以樣本平均數當作檢定統計量,當 得到拒絕域為:

若 小於 $175.35 我們便不會拒絕虛無假設,也不會安裝新的帳戶處理系統。因此例中的型 II誤差發生在當新帳戶系統有成本效益而我們並未予以安裝。這種發生的機率便是型 II 誤差的機率,被定義為:

175.35x x

( 175.35 )P X ,當虛無假設為偽時

Page 41: CHAPTER 10 假設檢定

10.410.4 計算型計算型 IIII 誤差的機率誤差的機率假設實際的平均帳戶消費額至少為 $180 時,裝設新系統可以節省許多費用,即當實際的 ,不是 $170 時,不裝設新系統的機率,也就是型 II 誤差的機率為:

當平均帳戶消費額實際為 $180 時,卻不拒絕虛無假設的機率為 0.0764 ,也就是會推論母體平均數等於 $170 的機率

180

( 175.34 180)P X ,當實際的

175.34 180/ 65 / 400

( 1.43)

0.0764

XP

n

P Z

Page 42: CHAPTER 10 假設檢定

10.4.110.4.1 改變改變 αα 對對 ββ 的影響的影響

Page 43: CHAPTER 10 假設檢定

10.4.110.4.1 改變改變 αα 對對 ββ 的影響的影響假設上例我們以顯著水準 1% 取代 5%未標準化的檢定統計量則為:

當 時,型 II 誤差機率為:177.57x

180

177.57 180/ 65/ 400

( 0.74)

0.2296

xP

n

P Z

Page 44: CHAPTER 10 假設檢定

10.4.110.4.1 改變改變 αα 對對 ββ 的影響的影響比較圖 10.9與圖 10.10 ,你可以看到降低顯著水準從 5% 到 1% ,則拒絕域的臨界值會向右邊移動,不拒絕虛無假設的區域加大,型 II 誤差的機率也從 0.0764增加到0.2296

Page 45: CHAPTER 10 假設檢定

10.4.110.4.1 改變改變 αα 對對 ββ 的影響的影響

Page 46: CHAPTER 10 假設檢定

10.4.310.4.3 大樣本意謂更多的資訊,更好的決大樣本意謂更多的資訊,更好的決策策計算 n = 400 及 n = 1,000 時的型 II 誤差發生機率,告訴我們一個特別重要的觀念,增加樣本大小可以降低型 II 誤差的機率,藉著降低型 II 誤差的機率我們便不易犯下會犯的錯誤

Page 47: CHAPTER 10 假設檢定

10.4.310.4.3 大樣本意謂更多的資訊,更好的決大樣本意謂更多的資訊,更好的決策策

Page 48: CHAPTER 10 假設檢定

10.4.4 10.4.4 檢定力檢定力

另一種衡量檢定好壞的方法是檢定力 (power) -即當虛無假設不為真時,讓我們拒絕虛無假設的機率即為檢定力。因此檢定力為 1-β

Page 49: CHAPTER 10 假設檢定

10.510.5 未來課題未來課題在後續的章節中,我們將介紹多種常被決策者所採用的統計方法。統計方法學習的主要關鍵是知道使用那個公式來進行計算或選用那一組指令於軟體進行操作,但應用時,真正的挑戰會是如何定義問題及選擇那一種統計方法最恰當

Page 50: CHAPTER 10 假設檢定

10.5.310.5.3 公式彙整公式彙整1. 檢定統計量

2. 檢定的 p 值

3. 型 II 誤差的機率

/

xz

n

1 0

1 0

1 0

( ) :

( ) :

2 ( | | ) :

P Z z H

P Z z H

P Z z H

   若   若

   若

( )S LP x x x ,而 是任意一個與虛無假設不同的值