なぜ今GLMMなのか - socialpsychology.jp · 分散分析、重回帰分析、ロジスティック回帰、多項ロジット、 対数線形モデル…などが1つでできる"
回帰分析 重回帰 (1)
-
Upload
wynter-graham -
Category
Documents
-
view
132 -
download
0
description
Transcript of 回帰分析 重回帰 (1)
回帰分析重回帰 (1)
項目• 重回帰モデルの前提• 最小二乗推定量の性質
– 仮説検定(単一の制約)– 決定係数
• Eviews での回帰分析の実際• 非線形効果• ダミー変数
– 定数項ダミー– 傾きのダミー– 3 つ以上のカテゴリー
重回帰モデル multiple regression model
• 説明変数が 2 個以上
uxxxy kk 2211
ii x
y
他の説明変数を一定に保っておいて, xi だけを 1 単位増加させたときに y が何単位増えるか
他の要因をコントロールした xi 固有の影響
重回帰モデル前提
1. 線型モデル(パラメータに関し)2. 誤差項の期待値は 0
3. 誤差項は互いに独立4. 誤差項の分散は一定(分散均一性)5. 誤差項は正規分布に従う
– BLUE の成立のためにはこの条件は不要
ikikiii uxxxy 2211
最小二乗法• 残差平方和を最小にするようにパラメータを決
定– a,b1,b2,..,bk : 未知パラメータ a,b1,b2,..bk の推定値– ei : 残差
n
ikikiii
n
iik
xbxbxbay
ebbbaS
1
22211
1
221 ),..,,,(
最小二乗推定量
n
iie
knRSS
kns
1
22
)1(
1
)1(
1
誤差項の分散の推定量
k+1は説明変数の個数(定数項と x)SER (standard error of the regression)
jxx
jjj
jj
Sab
bE2
2)var(
)(
Sxxj : 説明変数 xj の平
方和( xj を他の説明変数に回帰したときの残差の平方和)
仮説の検定
1,0~2
NS
bj
xx
)1(~).(. 2
00
kntSs
b
bes
bj
xx
jj
j
jj
H0: bj=bj0
k+1は説明変数の個数(定数項とx )
当てはまりの良さ• TSS=ESS+RSS
TSS
RSS
TSS
ESSR 12
)1/(1
)1/(
)1/(1
22
nTSS
s
nTSS
knRSSR
決定係数
自由度修正済み決定係数 adjusted R2
説明変数の数 k を増やしていけば, R2 は単調に増加する
説明変数の増加にペナルティーを課すように修正した R2
単回帰での結果 wage1.raw
重回帰での結果
重回帰での結果 (2)
-8
-4
0
4
8
12
16
0 4 8 12 16 20
EDUC
RE
SID
-8
-4
0
4
8
12
16
0 10 20 30 40 50
TENURE
RE
SID
-8
-4
0
4
8
12
16
0 10 20 30 40 50 60
EXPER
RE
SID
-8
-4
0
4
8
12
16
-4 0 4 8 12 16
WAGEHAT
RE
SID
被説明変数を ln(wage) にした場合
• Educ が 1 年増加すると賃金は 9.2%上昇
• Exper が 1 年増加すると賃金は 0.4%増加
• Tenure が 1 年増加すると賃金は 2.2%増加
ここをクリックすると, RepresentationEstimation outputCoefficient DiagnosticsResidual Diagnosticsなどのメニューが表れる(この画面はEstimation Output)
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
0 4 8 12 16 20
EDUC
RE
SID
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
0 10 20 30 40 50
TENURE
RE
SID
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
0 10 20 30 40 50 60
EXPER
RE
SID
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
0.4 0.8 1.2 1.6 2.0 2.4 2.8
LWAGEHAT
RE
SID
非線形効果
ezbxbxbay 32
21
xbbx
y21 2
説明変数 x の 2 次の項を説明変数として加える
係数の意味
x が 1 単位増加したとき y に与える効果x の水準に依存する
係数の意味の直感的な把握の仕方• b1,b2 の値をもとに x が与えられた場合の ∂ y/∂x の大きさを計算する( Excel
の活用)• Eviews の中では,例えば, x が平均値をとる場合の効果についてはコマンド
ラインで scalar dydx = @coefs(i) + @coefs(i+1)* @mean(x)
とするとスカラー変数 dydx が作成される( @coefs(i) 直前の回帰の i 番目の係数( x の係数:定数項は 1 番目とする) , @coefs(i+1): x^2 の係数, @mean(x) 変数 x の平均値)
tenure の 2 乗項を加えた回帰
Eviews での回帰分析の統計量• スカラー変数
@regobs オブザベーション数, @f F 統計量, @ssr 残差平方和その他 @aic, @coefs(i), @stderrs(i), @tstats(i), @dw, @r2, @rbar2
• ベクトル変数@coefs 係数ベクトル @coefs(i) で i 番目の説明変数の係数(定数項が 1 番目), @stderrs 係数の標準誤差, @tstats t値
コマンド行で scalar var1 = @ssr
vector var2 = @coefs
とタイプすると var1 や var2@ssr, @coefs の中身が保存される
問題 (1)
• ln(wage) を被説明変数にし, educ, exper, tenure, tenure の 2 乗を説明変数にして回帰分析を行え。– wage1.raw のデータを用いる
• tenure の範囲を調べよ。• tenure が 1 年増加したとき, wage は何 % 増加
するか– tenure=0, 5, 10, 20, 30, 40 のそれぞれの場合につい
て• 上の回帰分析の係数の値を用い, tenure と
wage の関係をグラフで表せ。• educ の2乗を説明変数に加えるとどうなるか。
ダミー変数
• 質を表す変数– 女性ならば 1 ,そうでなければ 0– 結婚していれば 1 .そうでなければ 0– 大学卒ならば 1 ,そうでなければ 0
• educ, wage, exper はこれに対し連続変数• 一般に, 0 または 1 をとるような変数を
ダミー変数と呼ぶ
ダミー変数 (2)
• 定数項ダミー• 傾きに関するダミー• 3 つ以上のカテゴリーを持つ変数の場合
– 学歴• 中卒または高校中退• 高卒,大卒未満• 大卒以上
– 職業• 事務職• 研究職• 営業• 現場
educbfemalebawage 21)ln(
educ
ln(wage)female=0 の場合
female=1 の場合
educbawage 2)ln(
educbbawage 21)ln(
b2
b2a
a+b1
図は b1<0の場合
定数項ダミー
educfemalebeducbfemalebawage 321)ln(
educ
ln(wage)female=0 の場合
female=1 の場合
educbawage 2)ln(
educbbbawage )()ln( 321
b2
b2+b3a
a+b1 図は b1<0, b3>0の場合
傾きのダミー
問題 (2)
• female ダミー変数を説明変数に加えた回帰を行え– 被説明変数 ln(wage)– 説明変数 educ, exper, tenure, female
• 賃金の男女格差は存在するか• 学歴の効果に男女格差が存在するか
– educ と female の交差項を作成する• exper, tenure の効果に男女格差が存在す
るか
問題 (3)• 次の回帰を行う• 被説明変数 ln(wage)• 説明変数 educ, tenure, exper, female,
female*educ, female*tenure, female*exper• 男女別に回帰分析を行う
– EViews のメニューで sample を選択 If condition..のボックスに条件式を記入
– female=0 とすれば男性のみ, female = 1 とすれば女性のみ ; 戻すときは sample で条件式を消す
– 説明変数を educ, tenure, exper として回帰– ダミー変数を用いた回帰と結果を比較せよ。
3 つ以上のカテゴリー
• 例)学歴– 中卒 , 高卒(短大卒を含む) , 大卒 の 3 つのカテゴリー
• この場合, 2 つのダミー変数をつくる– 中卒をベースにした効果– D1: 中卒とした比較した高卒の効果– D2: 中卒と比較した大卒の効果– 高卒と大卒の比較は ?– 3 つダミー変数を作るとどうなるか?
• N種類のカテゴリー N-1 個のダミー変数
中卒 高卒 大卒
D1 0 1 0
D2 0 0 1
問題 (4)• 結婚ダミーが賃金に与える影響を調べよ
– married (結婚していれば 1 )• 結婚が賃金に与える影響は男女間で異なるかもしれない
– 結婚 × 男女 の組み合わせで 4通り– married と female のそれぞれの組合せの観測度数を調べよ
• 二つの変数 (married と female) を選択して,グループとして開く
• Menu から View/N way tabulation クロス集計票– 被説明変数 ln(wage), 説明変数 female, married,
female*married, + educ, exper, tenure として回帰 – female*married 適当な名前で新しい変数を作る– female, married, female*married の係数の意味は– 定数項の大きさは?
• 男性既婚,男性独身,女性既婚,女性独身
問題( 5 )• 教育年数の影響は,連続変数で捉えるのではなく,
学歴別に調べた方がよいかもしれない
• 教育年数の分布を調べよ• 教育年数から次のような学歴ダミー変数を作れ
• 高卒未満 ( educ < 12)• 高卒以上 大卒未満 (12 <= educ <16)• 大卒 以上 (16 <= educ)
• 次の回帰分析を行え– 被説明変数: ln(wage) ,説明変数:学歴ダミー,そ
の他の変数 (exper, tenure, female)
変数の作成方法メニューの Genr ボタンをクリック新変数を作成する画面で次のように記述
ED1 = (educ<16) and (educ>=12)ED2 = (educ>=16)
ED1は高卒ダミー, ED2 は大卒ダミー(中卒がベース)(educ<16)等は論理式
( ) の中が真なら 1 ,偽なら 0and / or
ED1 は educ が 12 年以上かつ 16 年未満の時に限り 1 ,それ以外は 0 。ED2 は educ が 16 年以上の時に限り 1 ,それ以外は 0 。