La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

60
La régression La régression multiple multiple Econométrie appliquée Econométrie appliquée Cours de M1 deuxième partie Cours de M1 deuxième partie Armand Taranco Armand Taranco

Transcript of La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Page 1: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

La régression multipleLa régression multiple

Econométrie appliquéeEconométrie appliquée

Cours de M1 deuxième partieCours de M1 deuxième partie

Armand TarancoArmand Taranco

Page 2: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Quand utiliser la régression Quand utiliser la régression multiplemultiple

Pour estimer la relation entre une variable Pour estimer la relation entre une variable dépendante (dépendante (YY ) et plusieurs variables ) et plusieurs variables indépendantes (indépendantes (XX11,, XX22, …, …))Exemples Exemples Expliquer le prix d’un appartement par la Expliquer le prix d’un appartement par la

superficie, les prestations, l’emplacement,… superficie, les prestations, l’emplacement,… Expliquer les ventes d’un magasin par le Expliquer les ventes d’un magasin par le

marché total, le prix, l’investissement, la marché total, le prix, l’investissement, la publicité,… publicité,…

Expliquer la consommation des véhicules par Expliquer la consommation des véhicules par le prix, la cylindrée, la puissance et le poids.le prix, la cylindrée, la puissance et le poids.

Page 3: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le modèle linéaire de régression Le modèle linéaire de régression multiplemultiple

Equation de régression multipleEquation de régression multipleCette équation précise la façon dont la variable Cette équation précise la façon dont la variable dépendante est reliée aux variables explicatives :dépendante est reliée aux variables explicatives :

où où 001122ppsont les paramètres et et est est un bruit aléatoire représentant le terme d’erreur.un bruit aléatoire représentant le terme d’erreur.

pp XXXY ...22110

Page 4: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le modèle linéaire de régression Le modèle linéaire de régression multiplemultiple

Les termes de l’équationLes termes de l’équation

ipipiii xxxy ...22110

ième observation de Y

Terme constant

Influence de la variable X1

Influence de la variable Xp

Résidu de la ième observation

Page 5: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le modèle linéaire de régression Le modèle linéaire de régression multiplemultiple

Ecriture matricielle du modèleEcriture matricielle du modèle

Xy

xx

xx

y

y

np

pnn

p

n

11

0

,,1

,11,11

1

1

Page 6: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le modèle linéaire de régression Le modèle linéaire de régression multiplemultiple

Les hypothèses du modèleLes hypothèses du modèle Les hypothèses de nature probabilisteLes hypothèses de nature probabiliste

Les variables Les variables XXii sont aléatoires sont aléatoires

E(E(ii)=)=0 0 pour tout pour tout ii

V(V(ii)=)=22 pour tout 1≤pour tout 1≤ii≤≤pp (homoscédasticité des (homoscédasticité des erreurs)erreurs)

Cov(Cov(ii , , ii )=0 pour tout )=0 pour tout ii≠≠jj

Le vecteur aléatoire Le vecteur aléatoire suit une loi normale à n suit une loi normale à n dimensions N(0, dimensions N(0, 22IInn))

Les hypothèses structurellesLes hypothèses structurellesDet(Det(XXTTXX))≠≠00 (absence de colinéarité entre les variables (absence de colinéarité entre les variables explicatives).explicatives).

nn>>pp+1+1

Page 7: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le modèle linéaire de régression Le modèle linéaire de régression multiplemultiple

Interprétation géométriqueInterprétation géométriqueLe modèle général définit un hyperplan de dimension Le modèle général définit un hyperplan de dimension pp. Nous illustrons le cas . Nous illustrons le cas pp==22..

X1

X2

Y

0

(X1i, X2i)

EE((YYii|X|X1i1i, X, X2i2i) =) = 00++11XX1i1i++22XX2i2i

i

Yi : observation

Page 8: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le processus d’estimationLe processus d’estimation

Modèle de régression multipleModèle de régression multiple

YY = = 00 ++ 11XX11 ++ 22XX22 +. . .++. . .+ ppXXpp ++ Hyperplan de régression multipleHyperplan de régression multiple

EE((Y|XY|X11,…,X,…,Xpp) =) = 00 ++ 11XX11 + + 22XX22 +. . .++. . .+ ppXXpp Paramètres inconnusParamètres inconnus

00, , 11, , 22, . . . ,, . . . , pp

Données:Données:xx11 x x22 . . . x . . . xpp y y

. . . .. . . .

. . . .. . . .

EstimateursEstimateurs dede0, 1, 2, . . . , p

p ˆ,...,ˆ,ˆ,ˆ210

p ˆ,...,ˆ,ˆ,ˆ210

pp XXXY ˆ...ˆˆˆˆ22110

Equation estiméeEquation estimée

EstimateursEstimateurs

Page 9: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le processus d’estimationLe processus d’estimation

Interprétation géométriqueInterprétation géométriqueIllustration du cas p=2.Illustration du cas p=2.

X1

X2

Y

(X1i, X2i)

yi : observation

iii XXy 22110ˆˆˆˆ

0

iii yy ˆˆ

Page 10: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le processus d’estimationLe processus d’estimation

Estimation des coefficients de régressionEstimation des coefficients de régression La méthode : les moindres carrés ordinairesLa méthode : les moindres carrés ordinaires

Le principe de l’estimation des coefficients de Le principe de l’estimation des coefficients de régression :régression :

consiste à minimiser la somme des carrés des consiste à minimiser la somme des carrés des résidus : résidus :

Le calcul numérique lui-même (calcul matriciel) Le calcul numérique lui-même (calcul matriciel) peut s’effectuer à l’aide de logiciels statistiques peut s’effectuer à l’aide de logiciels statistiques (SAS, SPSS, S+, R, Gretl,…).(SAS, SPSS, S+, R, Gretl,…).

n

iii

n

ii yy

1

2

1

2 )ˆ(

p ,...,,, 210

Page 11: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le processus d’estimationLe processus d’estimation

Estimation des coefficients du modèleEstimation des coefficients du modèleLa méthode des moindres carrés donne pour La méthode des moindres carrés donne pour résultat :résultat :

suit une loi suit une loi

est sans biais :est sans biais :

Parmi les estimateurs de Parmi les estimateurs de linéaires par rapport à linéaires par rapport à

XX, sans biais, les éléments de ont la plus petite , sans biais, les éléments de ont la plus petite variance.variance.

YXXX TT 1ˆ

12,0N

XX T

)ˆ(E

Page 12: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le processus d’estimationLe processus d’estimation

Interprétation des coefficients de Interprétation des coefficients de régression estimésrégression estimés La pente (La pente (kk≠≠00) )

L’estimée de L’estimée de YY varie d’un facteur égal à varie d’un facteur égal à

lorsque lorsque XXkk augmente d’une unité, les autres augmente d’une unité, les autres

variables étant maintenues variables étant maintenues constantesconstantes.. L’ordonnée à l’origineL’ordonnée à l’origine

C’est la valeur moyenne de C’est la valeur moyenne de YY lorsque toutes les lorsque toutes les XXii sont nulles. sont nulles.

k

k

0

Page 13: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le processus d’estimationLe processus d’estimation

Estimation de la variance des résidusEstimation de la variance des résidus

1ˆ 1

2

2

pn

n

ii

Page 14: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le processus d’estimationLe processus d’estimation

Les intervalles de confianceLes intervalles de confianceOn peut calculer pour chaque coefficient du On peut calculer pour chaque coefficient du modèle un intervalle de confiance de niveau (1-modèle un intervalle de confiance de niveau (1-) ) donné par :donné par :

où où tt/2/2 se calcule à partir de : se calcule à partir de :

TT suivant une de Student à suivant une de Student à nn--pp-1 d.d.l.-1 d.d.l.

1)ˆˆ( ˆ2/ˆ2/ii

ststP iii

2/1)( 2/ tTP

Page 15: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Le processus d’estimationLe processus d’estimation

Les donnéesLes données Taille de l’échantillonTaille de l’échantillon

Les données doivent être suffisamment Les données doivent être suffisamment nombreuses : 15 à 20 par variable au moins.nombreuses : 15 à 20 par variable au moins.

La nature des variablesLa nature des variables

Dans la pratique, Dans la pratique, YY est une variable est une variable quantitative et les quantitative et les XXii peuvent être quantitatives peuvent être quantitatives ou binaires.ou binaires.

Page 16: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

Décomposition de la somme des carrés Décomposition de la somme des carrés totaletotale

SCT : somme des carrés totaleSCT : somme des carrés totale

SCR : somme des carrés des résidusSCR : somme des carrés des résidus

SCE : somme des carrés expliqués par le modèleSCE : somme des carrés expliqués par le modèle

n

iii

n

ii

n

ii yyYyYy

1

22

1

2

1

)ˆ(ˆ

SCT = SSE + SCRSCT = SSE + SCR

Page 17: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

Interprétation géométrique de la Interprétation géométrique de la décomposition en somme de carrésdécomposition en somme de carrés

y y

y222

ˆˆ yyyyyy

Théorème de Pythagore

ny

y

y 1

Y

Y

y

ny

y

y

ˆ

ˆ

ˆ1

Page 18: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

Les coefficients de déterminationLes coefficients de détermination Le coefficient de détermination Le coefficient de détermination RR22

Il exprime le pourcentage de la variance de Il exprime le pourcentage de la variance de YY expliquée par le modèle. Il donne une idée expliquée par le modèle. Il donne une idée globale de l'ajustement du modèle.globale de l'ajustement du modèle.

Le Le RR22 ajusté se calcule en fonction du ajusté se calcule en fonction du RR22 : :

Il traduit à la fois la qualité de l’ajustement Il traduit à la fois la qualité de l’ajustement (liaison entre (liaison entre YY et les et les XXii) et la complexité du ) et la complexité du modèle (nombre de variables explicatives).modèle (nombre de variables explicatives).

RR22 = SCE/SCT = SCE/SCT

)1(1

11 22 R

pn

nRa

Page 19: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

Remarques sur le Remarques sur le RR22

0≤0≤RR22 ≤1 ≤1 Lorsque le Lorsque le RR22 est proche de 1, cela se signifie que la est proche de 1, cela se signifie que la

variable dépendante variable dépendante YY est bien expliquée par les est bien expliquée par les variables variables XXii..

La racine carrée de La racine carrée de RR22, , RR, porte le nom de coefficient de , porte le nom de coefficient de corrélation multiple entre corrélation multiple entre YY et les et les XXii..

Lorsque l’on ajoute de nouvelles variables explicatives Lorsque l’on ajoute de nouvelles variables explicatives au modèle, le au modèle, le RR22 augmente (même dans le cas où les augmente (même dans le cas où les nouvelles variables explicatives sont très liées à la nouvelles variables explicatives sont très liées à la variable dépendante).variable dépendante).

C’est la raison pour laquelle on introduit le C’est la raison pour laquelle on introduit le RR22 ajusté. ajusté.

Page 20: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

Le test global de FisherLe test global de FisherIl permet de répondre à la question : la liaison Il permet de répondre à la question : la liaison globale entre globale entre YY et les et les XXii est-elle significative ? est-elle significative ? HypothèsesHypothèses

H0: H0: 1 1 = = 22 = ... = = ... = pp = 0 = 0

YY ne dépend pas des variables ne dépend pas des variables XXi i ..

H1: Au moins un coefficient est non nulH1: Au moins un coefficient est non nul

YY dépend d’au moins une variable dépend d’au moins une variable XXi i ..

Page 21: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

Statistique utiliséeStatistique utilisée

Règle de décisionRègle de décision

Au risque Au risque , on rejette H0 si : , on rejette H0 si : ≥ p-value≥ p-value

(calculée avec une (calculée avec une loi de Fisher à loi de Fisher à pp et et nn--pp-1 -1 degrés de liberté)degrés de liberté)

1SCR

SCE

MSR

MSEF

pn

p

Page 22: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

RR22 et test de Fisher et test de Fisher

F bon, R² mauvais F bon, R² bon

Page 23: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

Le test de Student sur un coefficient de Le test de Student sur un coefficient de régressionrégressionIl permet de répondre à la question suivante :Il permet de répondre à la question suivante :

l’apport marginal d’une variable l’apport marginal d’une variable XXjj est-il est-il significatif ?significatif ? HypothèsesHypothèses

HH00 : : j j = 0 (= 0 (jj≠0)≠0)

On peut supprimer la variable On peut supprimer la variable XXjj

HH11 : : jj 0 0

Il faut conserver la variable Il faut conserver la variable XXjj

Page 24: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Qualité de la régressionQualité de la régression

Statistique utilisée sous Statistique utilisée sous l’hypothèse H0l’hypothèse H0

Règle de décisionRègle de décision

Au risque Au risque , on rejette H0 si : , on rejette H0 si : ≥ p-value≥ p-value (calculée à partir d’une loi de Student loi de Student

àà nn--pp-1-1 degrés de liberté). degrés de liberté).

ii

ii

i

ss

t

ˆdeestimétype-écart:,ˆ

ˆˆ

Page 25: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Analyse des résidusAnalyse des résidus

NormalitéNormalité QQ plotQQ plot Tests de normalitéTests de normalité

HomoscédasticitéHomoscédasticité La variance des résidus n’est pas stable.La variance des résidus n’est pas stable. Transformation des donnéesTransformation des données

Indépendance des résidusIndépendance des résidus Test de Durbin-Watson Test de Durbin-Watson

Détection des valeurs atypiquesDétection des valeurs atypiques

Page 26: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Les variables indicatricesLes variables indicatrices

Variable muette ou indicatrice (dummy Variable muette ou indicatrice (dummy variable)variable)Variable prenant les valeurs 0 ou 1 pour indiquer Variable prenant les valeurs 0 ou 1 pour indiquer que l’observation présente une certaine que l’observation présente une certaine caractéristique, par exemple une périodicité caractéristique, par exemple une périodicité (trimestre, mois,…).(trimestre, mois,…).

Exemple : la consommation de fuel trimestrielleExemple : la consommation de fuel trimestrielle

ddii = 1 pour le = 1 pour le iiémeéme trimestre trimestre

ddii = 0 sinon = 0 sinon

tt dddtX 44231210

Page 27: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

MulticolinéaritéMulticolinéarité

DéfinitionDéfinitionC’est l’existence de corrélations élevées (au delà C’est l’existence de corrélations élevées (au delà de 0.70) entre les variables indépendantes de 0.70) entre les variables indépendantes (variables explicatives).(variables explicatives).La multicolinéarité a notamment pour La multicolinéarité a notamment pour conséquences :conséquences :

- de fausser la précision de l’estimation des - de fausser la précision de l’estimation des coefficients de régressioncoefficients de régression- de rendre sensible l’estimation des coefficients - de rendre sensible l’estimation des coefficients à de petites variations des données.à de petites variations des données.

Page 28: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

MulticolinéaritéMulticolinéarité

X1

Variables indépendantes

X3

X2

Variables colinéaires

X2

Page 29: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

MulticolinéaritéMulticolinéarité

DétectionDétection Examen de la matrice de variance covariance Examen de la matrice de variance covariance

ou de corrélation.ou de corrélation. RR22 élevé mais peu de variables significatives. élevé mais peu de variables significatives. Fortes corrélations entre les Fortes corrélations entre les XXii

Fortes corrélations partielles entre les variables Fortes corrélations partielles entre les variables indépendantes.indépendantes.

Page 30: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Sélection des variablesSélection des variables

ProblématiqueProblématiqueComment choisir le modèle comportant la Comment choisir le modèle comportant la meilleure combinaison de variables indépendantes meilleure combinaison de variables indépendantes expliquant la variable dépendante ?expliquant la variable dépendante ?

StratégiesStratégies Examiner tous les modèles possiblesExaminer tous les modèles possibles Sélection progressiveSélection progressive Régression pas à pas descendanteRégression pas à pas descendante Régression pas à pas ascendanteRégression pas à pas ascendante

Page 31: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Sélection des variablesSélection des variables

Examiner tous les modèles possiblesExaminer tous les modèles possiblesCette stratégie consiste à envisager tous les Cette stratégie consiste à envisager tous les modèles et à retenir le meilleur.modèles et à retenir le meilleur. Inconvénients Inconvénients

Lenteur (2Lenteur (2pp modèles si p est le nombre de variables modèles si p est le nombre de variables explicatives) et coût de cette approcheexplicatives) et coût de cette approche

C’est quoi le meilleur modèle ?C’est quoi le meilleur modèle ?

Page 32: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Sélection des variablesSélection des variables

Le test de FisherLe test de FisherIl permet de tester si le fait d’ajouter une variable Il permet de tester si le fait d’ajouter une variable indépendante à un modèle comportant déjà une indépendante à un modèle comportant déjà une variable (ou de supprimer une variable d’un variable (ou de supprimer une variable d’un modèle comportant deux variables) est modèle comportant deux variables) est statistiquement significatif.statistiquement significatif.

La p-value correspondante est utilisée comme La p-value correspondante est utilisée comme critère de décision pou ajouter ou supprimer une critère de décision pou ajouter ou supprimer une variable.variable.

)1/(),(

),()(

21

211

pnXXSCE

XXSCEXSCEF

Page 33: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Régression pas à pasRégression pas à pas

Calcul de Calcul de FF et de la et de lapp-value pour chaque X-value pour chaque Xii

du modèledu modèle

DébutDébut

pp-value > seuil-value > seuil

??

ArrêtArrêt

La variable La variable XXii ayant la ayant la plus grande plus grande pp-value est-value estsupprimée du modèlesupprimée du modèle

Calcul de Calcul de FF et de la et de la pp-value pour chaque -value pour chaque XXii

ne se trouvant pas ne se trouvant pas Dans le modèleDans le modèle

pp-value < seuil-value < seuil

??

La variable La variable XXii ayant la ayant la

plus petite plus petite pp-value est-value estentrée dans le modèleentrée dans le modèle

NonNon

NonNon OuiOui

OuiOui

Page 34: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Régression pas à pas descendanteRégression pas à pas descendante

ArrêtArrêt

Calcul Calcul de F et de la de F et de la pp-value pour chaque -value pour chaque XXii

pp-value > -value > seuilseuil ??

La variable La variable XXii ayant ayant la plus grande la plus grande pp-value est-value est

supprimée du modèlesupprimée du modèle

NonNon

OuiOui

Au départAu départtoutes les variables toutes les variables XXii

sont dans le modèlesont dans le modèle

Page 35: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

ExemplesExemples

Deux exemples sont traités en cours

à l’aide du logiciel SPSS :à l’aide du logiciel SPSS :

l’un d’entre eux illustre la mise en œuvre l’un d’entre eux illustre la mise en œuvre d’une régression multiple et l’autre la d’une régression multiple et l’autre la sélection des variables dans un modèle à sélection des variables dans un modèle à l’aide de la méthode de régression l’aide de la méthode de régression descendante.descendante.

Page 36: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Titre de l’article : Reliving the 50s: the Big Titre de l’article : Reliving the 50s: the Big Push, Poverty Traps, and Take-offs in Push, Poverty Traps, and Take-offs in Economic Development, William Easterly Economic Development, William Easterly (2005)(2005)

Données utilisées : Maddison, Angus. The Données utilisées : Maddison, Angus. The World Economy : Historical Statistics. World Economy : Historical Statistics. OECD 2003.OECD 2003.

Page 37: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

L’auteur William EasterlyL’auteur William Easterly Expert reconnu du développement économique Expert reconnu du développement économique

et de l'Afriqueet de l'Afrique Professeur à l’Université de New YorkProfesseur à l’Université de New York Chercheur au Center for Global Development Chercheur au Center for Global Development

(Washington) (Washington) Il a travaillé en tant qu’économiste pendant 16 Il a travaillé en tant qu’économiste pendant 16

ans à la Banque Mondiale. Il a dû quitter ans à la Banque Mondiale. Il a dû quitter l’institution à la suite de la parution de son l’institution à la suite de la parution de son ouvrage : « ouvrage : « Les pays pauvres sont-ils Les pays pauvres sont-ils condamnés à le rester ? » (juin 2006).condamnés à le rester ? » (juin 2006).

Page 38: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Termes importants dans le titre de l’articleTermes importants dans le titre de l’article Économie du développementÉconomie du développement Big PushBig Push Poverty trapsPoverty traps Take-offsTake-offs

Page 39: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Economie du développementEconomie du développement

Qu’est ce que l’économie du développement ?Qu’est ce que l’économie du développement ?

Branche de l‘économie qui applique les méthodes Branche de l‘économie qui applique les méthodes macroéconomiques et microéconomiques à l’étude macroéconomiques et microéconomiques à l’étude des problèmes économiques, sociaux, des problèmes économiques, sociaux, environnementaux et institutionnels rencontrés par environnementaux et institutionnels rencontrés par les PVD (Pays en Voie de Développement). les PVD (Pays en Voie de Développement).

Points focauxPoints focaux Déterminants de la pauvreté et du sous Déterminants de la pauvreté et du sous

développementdéveloppement Politiques à mettre en œuvre pour sortir les PVD Politiques à mettre en œuvre pour sortir les PVD

de leur sous-développement. de leur sous-développement.

Page 40: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Le « big push »Les économistes du développement des années 50 préconisaient la théorie du "Big Push": les pays les plus pauvres se trouvent enfermés dans une trappe à pauvreté. D’après eux, seul un effort massif d'investissement financé par l'aide internationale peut leur permettre de décoller.

Page 41: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

La problématique de l’articleLa problématique de l’article Le rapport des Nations unies sur les objectifs du Le rapport des Nations unies sur les objectifs du millénaire de janvier 2005 et celui de la millénaire de janvier 2005 et celui de la Commission britannique pour l'Afrique de mars Commission britannique pour l'Afrique de mars 2005 sont marqués par le retour de l’idée qu’une 2005 sont marqués par le retour de l’idée qu’une combinaison d’investissements peut permettre combinaison d’investissements peut permettre aux économies africaines de sortir des trappes à aux économies africaines de sortir des trappes à pauvreté.pauvreté.William Easterly a voulu tester cette approche du William Easterly a voulu tester cette approche du « big push » comme réponse aux trappes à « big push » comme réponse aux trappes à pauvreté en utilisant des régressions sur le taux pauvreté en utilisant des régressions sur le taux de croissance. de croissance.

Page 42: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Comment tester l’existence de trappes à Comment tester l’existence de trappes à pauvreté ?pauvreté ? Revue de la littératureRevue de la littérature Les pays pauvres ont-ils une croissance par Les pays pauvres ont-ils une croissance par

tête significativement inférieure à celle des tête significativement inférieure à celle des autres pays et cette croissance est-elle nulle ?autres pays et cette croissance est-elle nulle ?

Données : revenu par tête de 1950 à 2001 Données : revenu par tête de 1950 à 2001 pour 137 pays.pour 137 pays.

Page 43: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Test de stationnarité sur le taux de Test de stationnarité sur le taux de croissance par têtecroissance par tête

Page 44: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Que signifie la stationnarité ?Que signifie la stationnarité ?Si l’hypothèse d’une trappe à pauvreté est vraie, Si l’hypothèse d’une trappe à pauvreté est vraie, alors le Log du revenu par tête pour les pays les alors le Log du revenu par tête pour les pays les plus pauvres doit être stationnaire. Le revenu va plus pauvres doit être stationnaire. Le revenu va fluctuer d’une façon aléatoire autour de son fluctuer d’une façon aléatoire autour de son niveau moyen.niveau moyen.

Page 45: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Formulation d’un test de stationnaritéFormulation d’un test de stationnarité

Hypothèse H0 : le Log du revenu par tête Hypothèse H0 : le Log du revenu par tête est stationnaire.est stationnaire.

Hypothèse H1 : le Log du revenu par tête Hypothèse H1 : le Log du revenu par tête n’est pas stationnaire.n’est pas stationnaire.

Page 46: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

« Divergence Big Time » (Pritchett,1996)« Divergence Big Time » (Pritchett,1996) Le creusement considérable de l’écart de revenu Le creusement considérable de l’écart de revenu

entre les pays les plus riches et les plus pauvres entre les pays les plus riches et les plus pauvres du monde.du monde.

Le ratio de revenu par habitant entre le pays le Le ratio de revenu par habitant entre le pays le plus riche et le plus pauvre du monde a été plus riche et le plus pauvre du monde a été multiplié par 6 au cours du dernier demi-siècle.multiplié par 6 au cours du dernier demi-siècle.

Selon la Banque Mondiale, le revenu moyen Selon la Banque Mondiale, le revenu moyen dans les 20 pays les plus riches est 37 fois plus dans les 20 pays les plus riches est 37 fois plus élevé que le revenu moyen dans les 20 pays les élevé que le revenu moyen dans les 20 pays les plus pauvres, et ce ratio a doublé depuis 1960.plus pauvres, et ce ratio a doublé depuis 1960.

Page 47: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Big time divergenceBig time divergenceUtilisation d’une régression :Utilisation d’une régression :

pour expliquer le taux de croissance par tête par pour expliquer le taux de croissance par tête par le revenu initial et des indicateurs de démocratie le revenu initial et des indicateurs de démocratie des institutions politiques.des institutions politiques.

Page 48: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Page 49: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Les indicateurs de démocratieLes indicateurs de démocratie L’indicateur de Freedom House (ONG) attribue:L’indicateur de Freedom House (ONG) attribue:

deux notes, l’une relative aux droits politiques et deux notes, l’une relative aux droits politiques et l’autre aux droits civils. l’autre aux droits civils.

une lettre dépendant de la moyenne des deux notes une lettre dépendant de la moyenne des deux notes précédentes. précédentes.

L’indicateur Polity IVL’indicateur Polity IVCe coefficient (qui va de 1, niveau de contrainte le plus Ce coefficient (qui va de 1, niveau de contrainte le plus faible, à 7) rend compte de la faible, à 7) rend compte de la qualité initiale des qualité initiale des institutions politiquesinstitutions politiques, mesurée par les contraintes , mesurée par les contraintes pesant sur le pouvoir exécutif.pesant sur le pouvoir exécutif.

Page 50: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Take-off (décollage)Take-off (décollage) Une suite continue de régimes à croissance Une suite continue de régimes à croissance

nulle suivie d’une suite continue de régimes à nulle suivie d’une suite continue de régimes à croissance positive.croissance positive.

La croissance sera considérée comme nulle La croissance sera considérée comme nulle dès que le taux de croissance se trouve dans dès que le taux de croissance se trouve dans l’intervalle [-0.5%,0.5%].l’intervalle [-0.5%,0.5%].

La croissance par tête est considérée comme La croissance par tête est considérée comme positive et stable lorsqu’elle est au-dessus de positive et stable lorsqu’elle est au-dessus de 1.5% su une période suffisamment longue.1.5% su une période suffisamment longue.

Page 51: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Situation de décollageSituation de décollage

t

Taux de croissance

0.5%

-0.5%

1.5%

Page 52: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Take-offs dans les pays richesTake-offs dans les pays riches

Take-offs in rich countries (data from Maddison 2003)1600-1700 1700-1820- 1820-1870 1870-1913 1913-1960 1960-2001 1820-2001

Australia 3.7% 0.9% 1.1% 1.8% 2.1%Austria 0.2% 0.2% 0.8% 1.4% 1.3% 2.8% 1.6%Belgium 0.2% 0.1% 1.4% 1.0% 1.1% 2.7% 1.5%Canada 0.6% 1.3% 2.2% 1.4% 2.3% 1.6%Denmark 0.2% 0.2% 0.9% 1.6% 1.7% 2.4% 1.8%Finland 0.2% 0.2% 0.8% 1.4% 2.3% 2.9% 1.6%France 0.1% 0.2% 1.0% 1.4% 1.6% 2.5% 1.6%Germany 0.1% 0.1% 1.1% 1.6% 1.6% 2.2% 1.6%Greece 0.1% 0.2% 0.6% 1.4% 1.4% 3.4% 1.8%Ireland 0.2% 0.2% 1.4% 1.0% 1.0% 4.1% 1.6%Italy 0.0% 0.0% 0.6% 1.2% 1.8% 2.9% 1.9%Japan 0.1% 0.1% 0.2% 1.5% 2.2% 4.0% 1.4%Netherlands 0.4% -0.1% 0.8% 0.9% 1.5% 2.4% 1.7%New Zealand 1.2% 1.4% 1.2%Norway 0.2% 0.2% 0.5% 1.3% 2.3% 3.0% 1.5%Portugal 0.1% 0.1% 0.1% 0.6% 1.8% 3.8% 1.5%Spain 0.0% 0.1% 0.4% 1.2% 0.9% 4.0% 1.6%Sweden 0.2% 0.2% 0.7% 1.4% 2.2% 2.1% 1.7%United Kingdom 0.2% 0.3% 1.3% 1.0% 1.2% 2.1% 1.4%United States 0.7% 1.3% 1.8% 1.5% 2.3% 1.7%

median growth of richcountries 0.2% 0.2% 0.8% 1.3% 1.6% 2.7% 1.6%

Page 53: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Take-offs dans les pays richesTake-offs dans les pays riches Parmi les pays riches, seul le Japon répond à la Parmi les pays riches, seul le Japon répond à la

définition donnée du décollage.définition donnée du décollage. Pour tous les autres pays on observe plutôt Pour tous les autres pays on observe plutôt

une accélération graduelle de la croissance une accélération graduelle de la croissance plutôt qu’un décollage.plutôt qu’un décollage.

Cela n’est pas compatible avec la notion d’un Cela n’est pas compatible avec la notion d’un

« big push » entraînant une transition soudaine « big push » entraînant une transition soudaine d’une stagnation vers une croissance d’une stagnation vers une croissance vigoureuse.vigoureuse.

Page 54: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Take-offs dans les régions en Take-offs dans les régions en développementdéveloppement

RégionRégion 1820-18701820-1870 1870-19131870-1913 1913-19501913-1950 1950-19751950-1975 1975-20011975-2001

AfricaAfrica 0.3%0.3% 0.6%0.6% 0.9%0.9% 1.8%1.8% 0.2%0.2%

Caribbean Caribbean countries (24)countries (24)

-0.3%-0.3% 1.8%1.8% 1.4%1.4% 3.2%3.2% 1.0%1.0%

East Asian East Asian countries (16 )countries (16 )

-0.1%-0.1% 0.5%0.5% -0.1%-0.1% 3.5%3.5% 3.4%3.4%

East European East European Countries (7)Countries (7)

0.6%0.6% 1.4%1.4% 0.6%0.6% 3.7%3.7% 0.4%0.4%

Latin AmericaLatin America 0.0%0.0% 1.8%1.8% 1.4%1.4% 2.5%2.5% 0.8%0.8%

West Asian West Asian countries (15)countries (15)

0.4%0.4% 0.9%0.9% 1.3%1.3% 4.4%4.4% 0.2%0.2%

Page 55: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Take-offs dans les régions en développementTake-offs dans les régions en développement Seule la région du sud est asiatique satisfait à la Seule la région du sud est asiatique satisfait à la

définition proposée du take-off. définition proposée du take-off. L’Amérique latine et les Caraïbes ont connu L’Amérique latine et les Caraïbes ont connu

pendant la période 1870-1913 un pré-décollage pendant la période 1870-1913 un pré-décollage mais il n’a pas été soutenu.mais il n’a pas été soutenu.

Page 56: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Take-offs dans les paysTake-offs dans les pays Sur les 44 pays étudiés, seuls 5 d’entre eux Sur les 44 pays étudiés, seuls 5 d’entre eux

satisfont à la définition d’Easterly d’un take-off.satisfont à la définition d’Easterly d’un take-off.

Page 57: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Sur l’existence des trappes à pauvretéSur l’existence des trappes à pauvretéEasterly rejette l’hypothèse de l’existence des Easterly rejette l’hypothèse de l’existence des trappes à pauvreté sur la base des deux trappes à pauvreté sur la base des deux arguments suivants :arguments suivants :

- il y a très peu de pays à taux de croissance sur - il y a très peu de pays à taux de croissance sur l’intervalle [-0.5, 0.5] pour la période 1950 – 2000l’intervalle [-0.5, 0.5] pour la période 1950 – 2000

- le logarithme du revenu par tête n’est pas - le logarithme du revenu par tête n’est pas stationnaire.stationnaire.

Cependant sur le premier point, on peut Cependant sur le premier point, on peut argumenter que cette conclusion est dépendante argumenter que cette conclusion est dépendante des périodes ou sous périodes considérées. des périodes ou sous périodes considérées.

Page 58: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Conclusions de l’articleConclusions de l’article AAucun des pays testés dans l’étude n’est dans ucun des pays testés dans l’étude n’est dans

une trappe à pauvreté (définie par une une trappe à pauvreté (définie par une absence totale et durable de croissance). absence totale et durable de croissance).

L'influence de l'aide sur l'investissement et la L'influence de l'aide sur l'investissement et la croissance n’est pas évidente. Il ne semble pas croissance n’est pas évidente. Il ne semble pas non plus que l'aide soit un facteur déterminant non plus que l'aide soit un facteur déterminant pour les rares pays à avoir décollé. pour les rares pays à avoir décollé.

Pour Easterly, la qualité des institutions Pour Easterly, la qualité des institutions politiques est un facteur bien plus important politiques est un facteur bien plus important pour le développement que l’apport d’une pour le développement que l’apport d’une d'aide massive et soudaine.d'aide massive et soudaine.

Page 59: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Remarque importante Remarque importante Ce working paper est controversé sur un certain Ce working paper est controversé sur un certain nombre de points par d’autres économistes. Donc nombre de points par d’autres économistes. Donc prudence dans les conclusions qu’en tire l’auteur. prudence dans les conclusions qu’en tire l’auteur.

Dans ce cours, cela a surtout servi à introduire Dans ce cours, cela a surtout servi à introduire une problématique de recherche et à mettre en une problématique de recherche et à mettre en évidence un certain nombre de méthodes et évidence un certain nombre de méthodes et outils.outils.

Page 60: La régression multiple Econométrie appliquée Cours de M1 deuxième partie Armand Taranco.

Une étude empiriqueUne étude empirique

Méthodes et outilsMéthodes et outilsCet article montre la nécessité d’utiliser, entre Cet article montre la nécessité d’utiliser, entre autres, des méthodes de régression et des tests autres, des méthodes de régression et des tests pour valider des hypothèses dans les études pour valider des hypothèses dans les études empiriques.empiriques.

La régression et les tests d’hypothèses sont deux La régression et les tests d’hypothèses sont deux outils fondamentaux dans les études empiriques.outils fondamentaux dans les études empiriques.