Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA...

18
RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPR´ ETATION DE LA M´ ETHODE IV Introduction ` a l’´ econom´ etrie Variables Instrumentales (2) Sylvain Catherine HEC Paris 11 Mars, 2015

Transcript of Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA...

Page 1: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

Introduction a l’econometrieVariables Instrumentales (2)

Sylvain CatherineHEC Paris

11 Mars, 2015

Page 2: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

VARIABLE INSTRUMENTALE

I La methode des variables instrumentales consiste a isoler des variations exogenesde X et etudier leur effet sur Y grace a une variable Z

I qui est correlee avec XI qui est independante du residu ε . C’est-a-dire sans rapport avec

I une potentielle variable manquante cause d’endogeneiteI les erreurs de mesure de XI l’effet causal que peut avoir Y sur X

Variableexpliquee (Y)

Variations de Xindependantes de ε

Variations de Xpotentiellement

dependantes de ε

VariableInstrumentale Z Residu du

modele (ε)

I Mathematiquement, on doit avoir Cov(Z,X) 6= 0 et Cov(Z, ε) = 0

Page 3: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

TWO STAGES LEAST SQUARES (2SLS) – PRINCIPE

I La disponibilite d’une variable instrumentale Z permet d’eliminer le problemed’endogeneite en effectuant deux regressions a la suite

I Premiere regression : prediction de la variable explicative X en fonction del’instrument Z

Xi = γ0 + γ1 × Zi + ui

I Deuxieme regression : prediction de la variable expliquee Y en fonction desvaleurs de X predites par la premiere etape, c’est-a-dire X

Yi = β0 + βIV × Xi + εi

I Interpretation : en utilisant X plutot que X, on restreint notre analyse auxvariations de X qui, etant causees par Z, respectent la condition d’exogeneite.

I Si Z respecte les conditions d’une variable instrumentale, alors le coefficient βIVn’est pas biaise.

I En francais, on parle de methode des “doubles moindres carres”

Page 4: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

CROISSANCE & CONFLITS (1)

I Question : quel est l’effetd’une variation de lacroissance economique surla probabilite d’un conflitviolent en Afrique ?

I Variable instrumentale :variation dans le volumeannuel des pluies.

I Etape 1 : methode OLS pourpredire la croissanceeconomique en fonction despluies (cf. droite)

Page 5: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

CROISSANCE & CONFLITS (2)

I Etape 2 : methode OLS danslaquelle la croissanceeconomique observee estremplacee par la croissanceeconomique predite par lavariable instrumentale,c’est-a-dire les pluies.

I Dans le tableau a droite, lescolonnes (5) et (6)representent cette etape 2. Lescolonnes (2) a (4) represententles resultats obtenus par unemethode OLS standard.

I Le modele OLS standard ((2)a (4)) conclut que lacroissance economique estsans effet sur les conflits. Lamethode instrumentale ((5) &(6)) conclut que la croissanceeconomique reduit le risquede conflit.

Page 6: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

BIAIS DU MODELE OLS

I On considere un modele lineaire simple. La methode des moindres carres estimeles coefficient β0 et β1 tel que la somme des residus

S =N∑

i=1

r2i =

N∑i=1

(yi − β1xi − β0)2

est minimisee. C’est-a-dire (β0, β1) = arg minβ0,β1

S(β). Montrez que :

β1 =

∑Ni=1(xi − x)(yi − y)∑N

i=1(xi − x)2

I En utilisant le fait que yi = β1xi + β0 + εi, on obtient

E(β1

)= β1 +

Cov(x, ε)Var(x)

= β1 + Corr(x, ε)σε

σx

I Ce qui implique que l’estimateur est sans biais ssi Corr(x, ε) = 0

Page 7: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

BIAIS DU MODELE 2SLS ET INSTRUMENT FAIBLE (1)

I Similairement, on peut montrer que βIV,1 converge en probabilite tel que

plim βIV,1 = β1 +corr(z, ε)corr(z, x)

σε

σx

I Pour que la methode 2SLS fonctionne correctement, il faut faire attention a ce queI z soit exogene corr(z, ε) = 0I z soit correle a x : corr(z, x) 6= 0

I Notez que si vous avez corr(z, x) ≈ 0, votre biais risque d’etre tres fort meme avecun probleme original d’endogeneite faible.

I Si la correlation entre l’instrument et la variable explicative est petite, on dit quel’instrument est faible (weak instrument).

I Pour tester la force de l’instrument, on peut regresser y sur z pour voir sil’instrument a un effet plausible sur y On parle de forme reduite (reduced form)

Page 8: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

BIAIS DU MODELE 2SLS ET INSTRUMENT FAIBLE (2)

Premiere etape (a gauche) et forme reduite dans l’exemple de l’effet des etudes sur lesalaire

Source :Angrist, J. D. & Krueger, A. B. (1991). Does Compulsory School Attendance Affect Schooling and Earnings?, The Quarterly Journal of

Economics, MIT Press, vol. 106(4), pages 979-1014, November.

I Ici, l’instrument semble valide pour les generations nees avant la fin de la SecondeGuerre Mondiale.

Page 9: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

BIAIS DU MODELE 2SLS ET INSTRUMENT FAIBLE (3)

I On veut estimer l’effet de la consommation de cigarette des femmes enceintes surle poids a la naissance (birth weight : bwght) (Source : Woolridge, Introductory Econometrics, 4th Edition)

ln(bwght) = β0 + β1packs + ε

I On propose d’instrumenter la consommation journaliere de paquets de cigarettespar le prix du paquet (cigprice).

I Etape 1 : on predit la consommation de cigarette en fonction du prix(ecart-types en dessous des coefficients)

ˆpacks = 0.067(0.103)

+ 0.0008(0.0003)

× cigprice

N = 1388, R2 = 0.0000

I Etape 2 : on predit estime le poids a la naissance en fonction de laconsommation predite de cigarettes dans l’etape 1)

ˆln(bwght) = 4.45(0.91)

+ 2.99(8.70)

× ˆpacks

I Un paquet supplementaire permet d’accroıtre d’environ 3% le poids de l’enfant.Le resultat absurde de cette regression vient de la faiblesse de l’instrument : leprix des cigarettes n’est pas correlee a la consommation (cf. le R2 de l’etape 1 )

Page 10: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

CONTREFACTUEL

I On cherche a estimer l’effet d’avoir fini le lycee sur le revenu. On definit unevariable binaire Di = 1 si i a fini le lycee, et Di = 0 sinon.

I la variable d’interet est le log du salaire, notee wi.I Pour mesurer l’effet d’avoir ete jusqu’au lycee pour l’individu i, il faut comparer

deux valeursI w1,i le log de son salaire dans le scenario ou il a fini le lyceeI w0,i le log de son salaire dans le scenario contraire.

I Si la personne i a fini le lycee, alors on observe la valeur w1,i = wi. On ignore enreva

Page 11: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

EFFET MOYEN OBSERVE ET BIAIS (1)

I L’effet moyen observe du fait d’avoir fini le lycee est la difference de salairemoyenne entre le groupe des bacheliers et des non bacheliers.

E[wi|Di = 1]− E[wi|Di = 0]

I Cette difference peut se reecrire

E[wi|Di = 1]− E[wi|Di = 0] = E[w1,i|Di = 1]− E[W0,i|Di = 0]

I Ou encore

E[wi|Di = 1]− E[wi|Di = 0] =E[w1,i|Di = 1]− E[w0,i|Di = 1]

+E[w0,i|Di = 1]− E[w0,i|Di = 0]

I E[w1,i|Di = 1]− E[w0,i|Di = 1] represente ce qui nous interesse, l’effet qu’a eu lelycee sur le revenu des individus qui l’ont termine.

I E[w0,i|Di = 1]− E[w0,i|Di = 0] represente un biais

Page 12: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

EFFET MOYEN OBSERVE ET BIAIS (2)

I Derniere formule :

E[wi|Di = 1]− E[wi|Di = 0] =E[w1,i|Di = 1]− E[w0,i|Di = 1]

+E[w0,i|Di = 1]− E[w0,i|Di = 0]

I E[w1,i|Di = 1]− E[w0,i|Di = 1] represente ce qui nous interesse, l’effet qu’a eu lelycee sur le revenu des individus qui l’ont termine.

I E[w0,i|Di = 1]− E[w0,i|Di = 0] represente un biais

I Positif si E[w0,i|Di = 1] > E[w0,i|Di = 0] : ceux qui ont fini le lycee auraienteu un salaire superieur a ceux qui ne l’ont pas fini de toutes facons.

I Negatif si E[w0,i|Di = 1] < E[w0,i|Di = 0]

Page 13: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

INTRODUCTION D’UNE VARIABLE INSTRUMENTALE

I On introduit desormais une variable instrumentale qui affecte la probabilited’avoir fini le lycee, par exemple le moment de la naissance.

I Zi = 1 si l’individu i est ne apres le premier trimestre, et Zi = 0 s’il est ne aupremier trimestre.

I On definit D1,i et D2,i tels queI D1,i = 1 si l’individu i aurait ete bachelier s’il etait ne apres le premier

trimestre, et D1,i = 0 s’il ne l’aurait pas ete.I D0,i = 1 si l’individu i aurait ete bachelier s’il etait ne au premier trimeste, et

D0,i = 0 s’il l’aurait ete.I A nouveau, on n’observe soit D1,i soit D0,i, mais jamais les deux en meme

temps vu qu’un individu a une seule date d’anniversaire.I Enfin, on definit ce qu’aurait ete le log du salaire de l’individu i dans les 4

scenarios envisageable.I w1,1,i aurait ete le log du salaire de l’individu i s’il etait ne apres le premier

trimestre et avait ete bachelier.I w0,1,i ... s’il etait ne au premier trimestre et avait ete bachelier.I w1,0,i ... s’il etait ne apres le premier trimestre et n’avait pas ete bachelier.I w0,0,i ... sinon.

Page 14: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

HYPOTHESES POUR L’INTERPRETATION DU MODELE IV (1)

I 1. Independance de la variable instrumentale : le fait d’etre ne le premiertrimestre ou non

I est independant de D1,i ou D0,i. Par exemple, un enfant ne le premiertrimestre aurait eu la meme probabilite de reussite scolaire qu’un enfant neplus tard dans l’annee, s’il etait lui-meme ne plus tard.

I est independant de wq,d,i pour tous q et d. Par exemple, un enfant ne lepremier trimestre aurait eu la meme esperance de salaire, s’il etait ne plustard dans l’annee, et ce quelqu’il eut ou non obtenu le baccalaureat.

I Contre-exemple :I si les parents de differentes classes sociales font des enfants a differents

moments de l’annee, un enfant de janvier n’aurait pas eu le meme destinqu’un enfant de septembre, meme s’il etait ne en meme temps.

Page 15: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

HYPOTHESES POUR L’INTERPRETATION DU MODELE IV (2)

I 2. Exclusion : l’instrument modifie x et y, mais ne modifie pas y pour un x donne.

w0,d,i = w1,d,i ∀d

I ici, le trimestre de naissance modifie la probabilite d’etre bachelier. Enrevanche, par exemple, un individu i qui aurait ete bachelier quelque soit sadate de naissance ne voit pas son salaire influence par sa date de naissance.

I Contre-exemple :I La loterie aleatoire pour choisir les volontaires de la guerre du Vietnam. La

loterie peut paraıtre un bon instrument pour evaluer l’effet du statut deveteran sur le salaire.

I En effet, la loterie est un instrument Z qui modifie la probabilite d’etre unancien soldat X et permet donc d’etudier l’effet de X sur W, le salaire.

I Cependant, les jeunes choisissant de continuer leurs etudes obtenaient unedispense. Dans ce cas, un jeune selectionne par la loterie peut avoir un salairedifferent d’un jeune non selectionne, et ce meme si aucun des deux n’est partiau combat. La raison est que le jeune selectionne a recu une incitation acontinuer ses etudes.

I La loterie affecte donc le salaire, meme chez un individu pour laquelle ellen’a pas affecte la conscription.

Page 16: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

HYPOTHESES POUR L’INTERPRETATION DU MODELE IV (3)

I 3. Premiere Etape : l’instrument est correlee a la variable explicative

E[D1,i − D0,i

]6= 0

sans quoi l’instrument n’est pas valide.

I 4. Monotonicite : le sens de l’effet de l’instrument sur la variable explicative est lememe pour tous les individus

D1,i − D0,i ≥ 0 ∀i ,ou l’inverse

Page 17: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

LOCAL AVERAGE TREATMENT EFFECT (LATE) THEOREM (1)

I LATE theorem : sous les hypotheses 1 a 4,

E [wi|Zi = 1]− E [wi|Zi = 0]E [Di|Zi = 1]− E [Di|Zi = 0]

= E[w1,i − w0,i|D1,i > D0,i

]I Interpretation :

I Le numerateur est l’effet moyen de l’instrument sur le salaire : c’est-a-dire ladifference de remuneration entre les personnes nees apres le premiertrimestre et les autres.

I Le denominateur est l’effet moyen de l’instrument sur le niveau d’education(ici d’avoir fini le lycee)

I Le ratio des deux est l’effet moyen d’avoir fini le lycee sur le niveau desalaire.

I Le theoreme LATE nous dit que ceci est vrai pour les individus pour lesquelsetre ne au premier trimestre a (aurait) conduit a ne pas finir le lycee(D1,i > D0,i)

I Preuve au tableau

Page 18: Introduction a l’` econom´ etrie´RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA M´ETHODE IV VARIABLE INSTRUMENTALE I La m´ethode des variables instrumentales consiste

RAPPELS BIAIS ET INSTRUMENTS FAIBLES INTERPRETATION DE LA METHODE IV

LOCAL AVERAGE TREATMENT EFFECT (LATE) THEOREM (2)

I On peut distinguer quatre groupes d’individus

1. Compliers : les personnes qui ont (auraient) fini le lycee si elles etaient neesapres le premier trimestre, et seulement dans ce cas (D1,i = 1 et D0,i = 0).

2. Always-takers : les personnes qui ont et auraient fini le lycee de toutesfacons (D1,i = D0,i = 1).

3. Never-takers : les personnes qui n’ont et n’auraient pas fini le lycee de toutesfacons (D1,i = D0,i = 0).

4. Defiers : les personnes pour qui l’instrument fonctionne a l’envers : qui ont(auraient) fini le lycee seulement si elles etaient ne au premiertrimestre(D1,i = 0 et D0,i = 1).

I Le theoreme nous dit que la methode IV mesure l’effet moyen d’avoir fini le lyceepour le groupe des compliers.

I Corrolaire : differentes variables instrumentales peuvent permettre d’evaluerl’effet d’une variable explicative sur differents sous-groupes de la population, acondition qu’elles aient des compliers differents.