迴歸分析

57
迴迴迴迴

description

迴歸分析. 大綱. 簡單線性迴歸 (1x1Y) 多元迴歸 ( 多 x1Y) 含類別變數的迴歸 ( 某些 x 為分類變數 ). 市場價格. 供給量. 簡單線性迴歸. 主要用於檢定單一的自變數對一個依變數是否具影響力或預測力. 假設的寫法可寫成: 供給量會顯著影響市場價格。 供給量對市場價格具有預測力。 供給量對市場價格具顯著的負向影響。 供給量越大相對市場價格越低。. 簡單線性迴歸模型必須滿足下面的假設 常態性假設 變異數齊一性假設 所有的 x 值所對應 y 的分配,其平均數均落母體迴歸線上。 不同 x 下的 y 彼此獨立。 - PowerPoint PPT Presentation

Transcript of 迴歸分析

Page 1: 迴歸分析

迴歸分析

Page 2: 迴歸分析

大綱 簡單線性迴歸 (1x1Y) 多元迴歸 ( 多 x1Y) 含類別變數的迴歸 ( 某些 x 為分類變數 )

Page 3: 迴歸分析

簡單線性迴歸 主要用於檢定單一的自變數對一個依變數是否具影響力或預測力

供給量 市場價格

假設的寫法可寫成:•供給量會顯著影響市場價格。•供給量對市場價格具有預測力。•供給量對市場價格具顯著的負向影響。•供給量越大相對市場價格越低。

Page 4: 迴歸分析

簡單線性迴歸模型必須滿足下面的假設1. 常態性假設2. 變異數齊一性假設3. 所有的 x值所對應 y的分配,其平均數均落母體

迴歸線上。4. 不同 x下的 y彼此獨立。5. 誤差遵循常態分配彼此獨立且期望值為 0 。

Page 5: 迴歸分析

上機:〔主要分析檔 〕

人格特質積極低焦慮高自尊消極沮喪他人導向

網路成癮

假設:H1 :人格特質會影響網路成癮。H1-1 :積極人格特質對網路成癮具負向影響。H1-2 :低焦慮人格特質對網路成癮具負向影響。H1-3 :高自尊人格特質對網路成癮具負向影響。H1-4 :消極人格特質對網路成癮具正向影響。H1-5 :沮喪人格特質對網路成癮具正向影響。H1-6 :他人導向人格特質對網路成癮具正向影響。

Page 6: 迴歸分析

報表整理

依變數 網路成癮解釋變數 積極 低焦慮 高自尊 消極 沮喪 他人導向

係數 -.279*** -.262*** -.130 .439*** .155*** .360***

R 平方 .078 .069 .017 .192 .207 .130

註: *** 表 p < 0.001

Page 7: 迴歸分析

問題:是否需要將積極、低焦慮、高自尊、消極、沮喪以及他人導向加總起來當作人格特質變數,即:人格特質 = 積極 + 低焦慮 + 高自尊+ 消極 + 沮喪 + 他人導向。再檢定人格特質對網路成癮是否具影響力?

Page 8: 迴歸分析

多元迴歸 多元迴歸主要用在探討一組自變數對一個依變數是否具影響力或預測力

房價

樓層地坪屋齡

停車位數

假設的寫法:樓層、地坪、屋齡與與停車位數可共同預測房價

Page 9: 迴歸分析

多元迴歸的主要目的是為了強化簡單線性迴歸對依變數的預測力或解釋力

多元迴歸主要的目的在驗證一群解釋變數對依變數是否具影響力,並判定個別變數對依變數是否有影響力

多元迴歸的基本假設,除了必須滿足簡單線性迴歸的基本假設外,還多了一個假設:自變數與自變數間必須為獨立變數 ( 很難辦到 )

Page 10: 迴歸分析

多元迴歸方程中有任兩個自變數發生共線性的話,會發生不可預期的錯誤

檢查多元共線性大致有四種方式 利用相關係數 ( 目視法 ) 利用允差 利用變異膨脹因子 (VIF) 利用特徵值

Page 11: 迴歸分析

大部分情況,管理類的研究,多元迴歸的檢定流程如下圖所示

總檢定變異數分析表 停止不顯著

顯著

個別變數檢定 共線性診斷判別係數

結論

顯著或不顯著

Page 12: 迴歸分析

上機〔主要分析檔 〕

電腦遊戲

網路成癮

瀏覽查詢

電子郵件聊天下載

假設:瀏覽查詢、電子郵件、聊天、下載、電腦遊戲可共同預測網路成癮

Page 13: 迴歸分析

報表整理

F=24.237*** , 2 .400R

變數網路成癮

係數 VIF

瀏覽查詢 .052 1.630

電子郵件 .018 1.427

聊天 .207** 1.504

下載 -.147* 1.451

電腦遊戲 .599*** 1.268

註: * 表 p<0.05 , ** 表 p<0.01 , *** 表 p < 0.001

Page 14: 迴歸分析

含類別變數的迴歸 類別變數本身可作為解釋變數 (IV) 也可以當成控制變數 (CV)

當解釋變數的時候,建議以一般線性模式的方式處理

如果當控制變數的時候使用迴歸或者一般線性模式皆可

Page 15: 迴歸分析

虛擬變數的設定 名義量尺本身並沒有數值上的意義 類別變數只有「是」與「不是」兩種情況 對於類別變數而言,只有 0 與 1 把數值區分成「是」與「不是」的過程稱為虛擬化

一般而言名義量尺若有 k個分類,那麼必須設立 k-1 個虛擬變數

若有兩個以上的名義量尺,需設立多少個虛擬變數得看研究設計

Page 16: 迴歸分析

一個類別變數

D1 D2 D3

春 1 0 0

夏 0 1 0

秋 0 0 1

東 0 0 0

Page 17: 迴歸分析

兩個類別變數 情況 I

D1 D2 D3

春 1 0 0

夏 0 1 0

秋 0 0 1

東 0 0 0

D4

男 1

女 0

Page 18: 迴歸分析

情況 II

D1 D2 D3 D4 D5 D6 D7

男春 1 0 0 0 0 0 0

男夏 0 1 0 0 0 0 0

男秋 0 0 1 0 0 0 0

男東 0 0 0 1 0 0 0

女春 0 0 0 0 1 0 0

女夏 0 0 0 0 0 1 0

女秋 0 0 0 0 0 0 1

女東 0 0 0 0 0 0 0

Page 19: 迴歸分析

上機〔主要分析檔〕

休D1

休D2

休D3

休D4

教D1

教D2

教D3

教D4

姓D

室內活動 (1)

1 0 0 0國小

以下 (1)1 0 0 0

男(1)

1

社交活動 (2)

0 1 0 0 國中 (2) 0 1 0 0女(2)

0

文化活動 (3)

0 0 1 0 高中 (3) 0 0 1 0

戶外活動 (4)

0 0 0 1大專

( 學 )(4)0 0 0 1

體能活動 (5)

0 0 0 0研究所以上 (5)

0 0 0 0

Page 20: 迴歸分析

類別變數當控制變數 控制變數

在驗證 x 、 y 的關係時,為了純化兩者之間的關係,把其他對依變數 y 有影響的自變數將它的解釋變異排除,這些被排解釋變異能力的自變數,稱為控制變數

控制源自於實現時排除干擾因素,在實驗室中可提供某種特定環境來排除其他因素影響,但社會科學實驗通常難以照辦。

社會科學的控制變數 : 將 CV 依據理論引入研究模式 迴歸分析可將 CV 對依變數之影響列入考慮

Page 21: 迴歸分析

網路使用行為瀏覽查詢電子郵件聊天下載

電腦遊戲

網路成癮

性別教育程度休閒活動型態

上機:〔主要分析檔(含虛擬變數) 〕

研究假設:H1 :網路使用行為會影響網路成癮。H1-1 :瀏覽查詢對網路成癮具顯著影響力。H1-2 :電子郵件對網路成癮具顯著影響力。H1-3 :聊天對網路成癮具顯著影響力。H1-4 :下載對網路成癮具顯著影響力。H1-5 :電腦遊戲對網路成癮具顯著影響力。

IV

CV

Page 22: 迴歸分析

報表整理變數 係數 VIF 係數 VIF 係數 VIF 係數 VIF 係數 VIF

休閒型態

D1 .071 1.645 .056 1.596 .093 1.607 .057 1.580 .038 1.564

D2 .046 1.149 .042 1.144 .035 1.139 .063 1.165 .057 1.141

D3 .061 1.262 .032 1.260 .061 1.251 .069 1.264 .073 1.250

D4 -.036 1.297 -.059 1.227 -.025 1.242 -.052* 1.226 -.038 1.216

教育程度

D5 .174* 1.389 .169* 1.391 .122 1.424 .174* 1.389 .164 1.390

D6 -.256* 3.285 -.258* 3.283 -.286* 3.283 -.269* 3.279 -.313 3.285

D7 -.108 3.937 -.088 3.953 -.190 4.028 -.154 4.009 -.267 4.014

D8 -.047 2.296 -.049 2.306 -.103 2.343 -.054 2.293 -.114 2.293

性別

D9.154* 1.172 .128 1.126 .135 1.127 .070 1.217 -.076 1.245

瀏覽查詢

.138 1.138

電子郵件

.129 1.143

聊天 .299*** 1.106

下載 .202** 1.176***

電腦遊戲

.624*** 1.147

R 平方 .142** .140** .207*** .160*** .466***註 1 : D1=1 表室內活動, D2=1 表社交活動, D3=1 表文化知性, D4=1 表戶外活動,全部 0 表體能活動;D5=0 表國小以下, D6=0 表國中, D7=0 表高中, D8=0 表大專 ( 學 ) ,全部 0 表研究所以上; D9=1 表男

性, 0 表女性註 2 : * 表 p<0.05 , ** 表 p<0.01 , *** 表 p < 0.001

Page 23: 迴歸分析

類別變數當解釋變數 類別變數本身也可當成解釋變數 如果解釋變數都是類別變數,依變數是連續變項,可採用獨立樣本 T 檢定與變異數分析

當然也可以使用迴歸分析來進行檢定符合同質性的假設即可以使用迴歸進行檢定但必須把類別變數虛擬化

Page 24: 迴歸分析

上機:〔主要分析檔(含虛擬變數) 〕

性別

網路使用行為瀏覽查詢電子郵件聊天下載

H1 :不同性別在網路使用行為上有顯著差異H1-1 :不同性別在瀏覽查詢上有顯著差異。H1-2 :不同性別在電子郵件上有顯著差異。H1-3 :不同性別在聊天上有顯著差異。H1-4 :不同性別在下載上有顯著差異。

情況 I

Page 25: 迴歸分析

情況 II

休閒行為休閒型態休閒時間

內控積極低焦慮高自尊

上機:〔主要分析檔(含虛擬變數) 〕

Page 26: 迴歸分析

情況 III

聊天

下載

電腦遊戲

休閒活動型態

教育程度

性別

網路成癮

上機:〔主要分析檔(含虛擬變數) 〕

Page 27: 迴歸分析

報表整理變數 F 檢定性別 .403

休閒型態 .629

教育程度 6.748***

聊天 9.313**

下載 1.776

電腦遊戲 96.903***

總檢定 F=14.166*** , R 平方 = .493

註: ** 表 p<0.01 , *** 表 p < 0.001

Page 28: 迴歸分析

報表整理變數 係數 VIF

休閒型態

D1 .065

F=.629

1.612

D2 .044 1.169

D3 .071 1.264

D4 -.017 1.244

教育程度

D5 .131*

F=6.748***

1.431

D6 -.324** 3.289

D7 -.296** 4.084

D8 -.148 2.351

性別 D9 -.039 F=.403 1.327

聊天 .192** 1.363

下載 -.089 1.541

電腦遊戲 .607*** 1.311

總檢定 F=14.166*** , R 平方 = .493

註 1 : D1=1 表室內活動, D2=1 表社交活動, D3=1 表文化知性, D4=1 表戶外活動,全部 0 表體能活動; D5=0 表國小以下, D6=0 表國中, D7=0 表高中, D8=0 表大專 ( 學 ) ,全部 0 表研究所以上; D9=1 表男性, 0 表女性註 2 : * 表 p<0.05 , ** 表 p<0.01 , *** 表 p < 0.001

Page 29: 迴歸分析

類別變數當調節 (干擾 )變數 當自變數與依變數間的關係,若在不同的文獻結論中有顯著正向或顯著負向影響兩種論點時,表示在這兩個變數間可能存在第三個變數干擾兩者間的關係

干擾變數會影響 x 與 y 的方向或者強度 干擾變數也有人稱為調節變數,兩者是同一個英文單字,只是翻譯上的不同

調節變數本身也是解釋變數

Page 30: 迴歸分析

上機:〔主要分析檔 〕

網路使用行為瀏覽查詢電子郵件聊天下載

網路成癮

性別

H1 :性別對網路使用行為與網路成癮間具調節作用。H1-1 :性別對瀏覽查詢與網路成癮間具調節作用。H1-2 :性別對電子郵件與網路成癮間具調節作用。H1-3 :性別對聊天與網路成癮間具調節作用。H1-4 :性別對下載與網路成癮間具調節作用。

Page 31: 迴歸分析

報表整理

變數 F 檢定統計量性別 .580 .037 .372 1.110

瀏覽查詢 4.162*

電子郵件 . 4.061*

聊天 23.421***

下載 5.579*

性別 * 瀏覽查詢 .140

性別 * 電子郵件 .051

性別 * 聊天 1.271

性別 * 下載 .609

R 平方 .041 .040 .131*** .055*

註: * 表 p<0.05 , ** 表 p<0.01 , *** 表 p < 0.001

Page 32: 迴歸分析

問題:可否直接將兩個變數相乘之後在利用迴歸或層級式迴歸進行調節變數的檢定?

Page 33: 迴歸分析

干擾變數的檢定 干擾變數就是調節變數,檢定是否具有干擾,在統計上相當於檢定兩變數是否存在交互作用。

干擾變數在檢定時若不考慮干擾變數的類型,可分成含有控制變數與沒有控制變數兩類

Page 34: 迴歸分析

不含控制變數的干擾變數檢定

使用一般線性模式或雙因子變異數分析進行檢定

使用一般線性模式進行檢定

類別變數

類別變數

連續變項

連續變項

類別變數

連續變項

連續變項

類別變數 連續變項

Page 35: 迴歸分析

使用迴歸分析或一般線性模式進行檢定 建議把連續變項區分成高、低兩組類別

連續變項

連續變項連續變項

Page 36: 迴歸分析

上機:直接交乘,檔案〔主要分析檔 〕

家庭幸福

網路成癮

網路使用行為瀏覽查詢電子郵件聊天下載電腦遊戲

研究假設:H1 :家庭幸福對網路使用行為與網路成癮間具調節效果。H1-1 :家庭幸福對瀏覽查詢與網路成癮間具調節效果。H1-2 :家庭幸福對電子郵件與網路成癮間具調節效果。H1-3 :家庭幸福對聊天與網路成癮間具調節效果。H1-4 :家庭幸福對下載與網路成癮間具調節效果。H1-5 :家庭幸福對電腦遊戲與網路成癮間具調節效果。

Page 37: 迴歸分析

報表整理

變數 係數 VIF 係數 VIF 係數 VIF 係數 VIF 係數 VIF

家庭幸福 -.232 29.266 .071 18.532 .020 15.129 -.281 15.497 .162 5.001

瀏覽查詢 -.083 58.052

電子郵件 .373 56.779

聊天 .498 53.390

下載 -.306 75.900

電腦遊戲 1.132* 54.038

家庭幸福 * 瀏覽查詢 .302 103.627

家庭幸福 * 電子郵件 -.260 77.849

家庭幸福 * 聊天 -.194 71.374

家庭幸福 * 下載 .580 93.239

家庭幸福 * 電腦遊戲 -.550 55.225

R 平方 .022 .026 .112*** .051* .355***註: * 表 p<0.05 , ** 表 p<0.01 , *** 表 p < 0.001

Page 38: 迴歸分析

內控

網路使用行為 網路成癮

上機:高低分組

假設:內控人格特質對網路使用行為與網路成癮間的影響力具顯著的調節效果,且高內控人格特質會加強網路使用對網路成癮的影響效果。

Page 39: 迴歸分析
Page 40: 迴歸分析

一些調節作用圖形說明低高

低高

Page 41: 迴歸分析

低高

低高

Page 42: 迴歸分析

含控制變數的干擾變數檢定

網路使用行為瀏覽查詢電子郵件聊天下載電腦遊戲

家庭幸福

網路成癮

休閒型態教育程度性別 研究假設:

H1 :家庭幸福對網路使用行為與網路成癮間具調節效果。H1-1 :家庭幸福對瀏覽查詢與網路成癮間具調節效果。H1-2 :家庭幸福對電子郵件與網路成癮間具調節效果。H1-3 :家庭幸福對聊天與網路成癮間具調節效果。H1-4 :家庭幸福對下載與網路成癮間具調節效果。H1-5 :家庭幸福對電腦遊戲與網路成癮間具調節效果。

Page 43: 迴歸分析

報表整理 變數 係數 係數 係數 係數 係數

休閒型態

D1 .068 .051 .086 .058 .046

D2 .044 .039 .031 .059 .063

D3 .063 .030 .058 .070 .077

D4 -.039 -.061 -.029 -.052 -.034

教育程度

D5 .168* .166* .117 .171* .172**

D6 -.264* -.260* -.293* -.269* -.298**

D7 -.108 -.086 -.193 -.151 -.258*

D8 -.055 -.053 -.109 -.055 -.104

性別 D9 .149 .125 .131 .072 -.066

家庭幸福 -.270 .024 -.070 -.216 .127

瀏覽查詢 -.184

電子郵件 .216 .

聊天 .231

下載 -.250

電腦遊戲 .918*

家庭幸福 * 瀏覽查詢 .444

家庭幸福 * 電子郵件 -.100

家庭幸福 * 聊天 082

家庭幸福 * 下載 .503

家庭幸福 * 電腦遊戲 -.296

R 平方 .145** .141** .208*** .613** .469***

註 1 : D1=1 表室內活動, D2=1 表社交活動, D3=1 表文化知性, D4=1 表戶外活動,全部 0 表體能活動; D5=0 表國小以下, D6=0 表國中, D7=0 表高中, D8=0 表大專 ( 學 ) ,全部 0 表研究所以上; D9=1 表男性, 0 表女性註 2 : * 表 p<0.05 , ** 表 p<0.01 , *** 表 p < 0.001

Page 44: 迴歸分析

層級式迴歸 統計學上稱為部分項的檢定 目的

檢查對原有迴歸模型,增加數個自變數,或者減少數個自變數,此增加的自變數或減少的自變數,是否為有效的解釋變數

Page 45: 迴歸分析

沒有控制變數的層級式迴歸 上機

聊天

下載

電腦遊戲

休閒活動型態

教育程度

性別

網路成癮

Page 46: 迴歸分析

報表整理

變數 模式 1 模式 2 模式 3 模式 4 模式 5

係數 VIF 係數 VIF 係數 VIF 係數 VIF 係數 VIF

瀏覽查詢 .125 1.000 .065 1.369 -.061 1.557 -.072 1.575 .052 1.630

電子郵件 .116 1.369 .053 1.417 .046 1.424 .018 1.427

聊天 .335*** 1.335 .303*** 1.471 .207** 1.504

下載 .096 1.242 -.147* 1.451

電腦遊戲 .599*** 1.268

R 平方 .016 .026 .110*** .117*** .400***

R 平方改變量 .016 .010 .084*** .007 .283***

Page 47: 迴歸分析

含控制變數的層級式迴歸 名義量尺的控制變數必須虛擬化,連續變項的控制變數則直接置入即可

上機

網路使用行為瀏覽查詢電子郵件聊天下載

電腦遊戲

網路成癮

性別教育程度休閒活動型態

Page 48: 迴歸分析

報表整理變數 模式 1 模式 2 模式 3 模式 4 模式 5 模式 6

係數 係數 係數 係數 係數 係數

休閒型態 D1 .034 .071 .056 .093 .057 .038

D2 .034 .046 .042 .035 .063 .057

D3 .045 .061 .032 .061 .069 .073

D4 -.074 -.036 -.059 -.025 -.052* -.038

教育程度 D5 .175* .174* .169* .122 .174* .164

D6 -.266* -.256* -.258* -.286* -.269 -.313

D7 -.103 -.108 -.088 -.190 -.154 -.267

D8 -.026 -.047 -.049 -.103 -.054 -.114

性別 D9 .126 .154* .128 .135 .070 -.076

瀏覽查詢 .138

電子郵件 .129

聊天 .299***

下載 .202**

電腦遊戲 .624***

R 平方 .126** .142** .140 .207*** .160*** .466***

R 平方改變量 .126** .017 .014 .081*** .034** .34***

註 1 : D1=1 表室內活動, D2=1 表社交活動, D3=1 表文化知性, D4=1 表戶外活動,全部 0 表體能活動; D5=0 表國小以下, D6=0 表國中, D7=0 表高中, D8=0 表大專 ( 學 ) ,全部 0 表研究所以上; D9=1 表男性, 0 表女性註 2 : * 表 p<0.05 , ** 表 p<0.01 , *** 表 p < 0.001

Page 49: 迴歸分析

以層級式迴歸進行調節檢定

家庭幸福

網路成癮

網路使用行為瀏覽查詢電子郵件聊天下載電腦遊戲

情況 I :不含控制變數

Page 50: 迴歸分析

報表整理

變數 模式 1 模式2

模式1

模式2

模式 1 模式 2 模式 1 模式2

模式 1 模式 2

係數 係數 係數 係數 係數 係數 係數 係數 係數 係數家庭幸福 -.074 -.232 -.052 .071 -.067 .020 -.052 -.281 .162 .223

瀏覽查詢 .141 -.083 .373 .498

電子郵件 .153*

聊天 .331***

下載 .214** -.306*

電腦遊戲 1.132* .010

家庭幸福*瀏覽查詢

.302

家庭幸福*電子郵件

-.260

家庭幸福*聊天 -.194

家庭幸福*下載 .580*

家庭幸福*電腦遊戲 -.550

.213

R 平方 .021 .022 .025 .026 .111*** .112***

.047* .051* .350***

.355***

R 平方改變量 .021 .001 .025 .001 .111*** .001 .047* .004 .350***

.005

Page 51: 迴歸分析

情況 II :含控制變數

網路使用行為瀏覽查詢電子郵件聊天下載

電腦遊戲

網路成癮

性別教育程度休閒活動型態

Page 52: 迴歸分析

變數 模式 1 模式 2 模式 3 模式 1 模式 2 模式 3 模式 1 模式 2 模式 3

係數 係數 係數 係數 係數 係數 係數 係數 係數

休閒型態 D1 .034 .065 .068 .034 .051 .051 .034 .087 .086

D2 .034 .042 .044 .034 .039 .039 .034 .031 .031

D3 .045 .059 .063 .045 .030 .030 .045 .059 .058

D4 -.074 -.039 -.039 -.074 -.062 -.061 -.074 -.028 -.029

教育程度 D5 .175* .169* .168* .175* .166* .166* .175* .117 .117

D6 -.266* -.262* -.264* -.266* -.262* -.260* -.266* -.292* -.293*

D7 -.103 -.110 -.108 -.103 -.088 -.086 -.103 -.192 -.193

D8 -.026 -.054 -.055 -.026 -.053 -.053 -.026 -.109 -.109

性別 D9 .126 .150* .149 .126 .125 .125 .126 .131 .131

家庭幸福 -.039 -.270 -.023 .024 -.033 .070

瀏覽查詢 .145 -.184

電子郵件 .131 .216

聊天 .302 .231

家庭幸福*瀏覽查詢 .444

家庭幸福*電子郵件 -.100

家庭幸福*聊天 .082

R 平方 .126** .144** .145** .354** .375** .375** .126** .208*** .208***

R 平方改變量 .126** .018 .002 .126** .015 .000 .126** .082*** .000

報表整理

Page 53: 迴歸分析

中介變數的檢定 中介變數檢定有兩派理論

只要檢定 xz , zy 成立那麼 z 即具有中介效果第二派區分成部分中介與完全中介

步驟 1 :檢定 xy 成立。 步驟 2 :檢定 xzy

第二派理論需注意共線性問題

Page 54: 迴歸分析

上機:〔檔案:主要分析檔 〕 第一套理論

網路易得性 電腦遊戲 網路成癮

假設:電腦遊戲對網路易得性與網路成癮間具中介效果。

Page 55: 迴歸分析

執行結果

網路易得性 電腦遊戲 網路成癮.377*** .591***

Page 56: 迴歸分析

第二套理論

網路易得性 網路成癮

網路易得性 電腦遊戲 網路成癮

Page 57: 迴歸分析

執行結果

網路易得性 網路成癮.379***

網路易得性 電腦遊戲 網路成癮.377*** 523***

.181**