Chap_1_2_6

5/16/2018 Chap_1_2_6 - slidepdf.com

http://slidepdf.com/reader/full/chap126 1/14

Introduction à l’économétrie

Philippe Polomé, Prof. U. Lyon 2

www.gate.cnrs.fr/perso/polome

Année 2010

Objectifs du cours

Introduction à l’économétrie

Acquérir une compréhension permettant

de poser un regard critique sur des résultats d’obtenir quelques résultats

Acquérir un minimum de maniement de logiciels (au moins dansla compréhension des sorties logicielles)

Tableur (OO calc, MS excel) Gretl

Organisation

Cours magistraux

Pas de TD mais démonstration de pratique en cours 2 ou 3 devoirs sur logiciel à rendre dans la semaine (avant le

cours suivant) via le FORUM Toutes les communications passent par le forum (voir ma page)

Evaluation Les devoirs valent +/- 5 points

Les devoirs ne seront pas corrigés

Le reste (15 points) à l’examen

Examen de compréhension, sans calcul, sans logiciel Dont une partie sur les devoirs

Logiciels

Logiciels économétriques installés en salle info :

Stata (le plus populaire actuellement?) SAS (ne développe plus guère l’économétrie, apparemment) Gretl

Avantages de Gretl

Gratuit et open source, peut être téléchargé et installé sur vos

ordinateurs personnels Gretl @ gretl.sourceforge.net/ S’installe dans la langue de votre système opérationnel (anglais,

français, italien, espagnol, polonais, allemand et portugais). Extras (= jeux de données) Maniement similaire à Stata et sorties “standards” Bonne interface graphique Connecte avec divers autres logiciels pour analyse plus poussée

ou sorties de présentation



Références

Econométrie, Régis Bourbonnais, Dunod, 2002

Bonne vision très synthétique en français

A Guide to Modern Econometrics, Marno Verbeek, Wiley, 2000

Plus avancé, nombreux exemples à données réelles, toutesdisponibles dans Gretl

Introductory econometrics for finance, Chris Brooks, CambridgeUniversity Press, 2002-2005

Pas trop avancé, orienté finance

Wooldridge, J. Introductory Econometrics

Beaucoup d’exemples, large public

Chapitre 1Ce qu’on a et ce qu’on veut faire

Une introduction intuitive

Un exemple Ce qu’on a et ce qu’on veut faire

On a un modèle causal stochastique

S’il fait plus chaud (X : la température), la consommation decrème glacée (Y ) augmente, toutes autres choses égales

Y t = !1 +!2X t + "t

pour chaque t = 1...T avec erreurs aléatoires non-observables "t

On a des données La variable Y dite endogène ou expliquée Une ou plusieurs variables X 1...X k explicatives

On veut

Quantifier l’influence de X surY Prédire Y conditionnellement à certaines valeurs pour X

Comment faire ?



Intuition 1 : Droite qui « passe au mieux » Intuition 1 : Droite qui « passe au mieux »

Y t = !1 +!2X t + "t pour chaque t = 1...T

Y = X ! + " en notation matricielle

On suppose que c’est la relation réelle

" s’interprète comme un événement aléatoire

non-mesuré

non-systématique On cherche une estimation ! de ! telle que la droite

Y t = !1 + !2X t + "t “passe au mieux” dans le nuage de points

soit l’erreur " = Y −X !

On cherche le vecteur de nombres ! tel que la somme des carrés

des erreurs #T t =1

Y y −X t !

2

soit minimale

Réponse ! =X X −1

X Y

Compliqué à calculer donc logiciel ! est un ESTIMATEUR, dit « des moindres carrés »

Intuition 2 : « Inversion » de Y = X ! +"

Imaginons que " = 0 et que X soit carrée et inversible

Alors X −1 telle que X −1X = I existe ! = X −1Y s’obtient par inversion (système d’équations linéaires)

Mais " = 0 et X n’est pas carrée→ « Généralisation » del’inverse

Prémultiplier par X , on a X

Y = X

X ! +X

"

X X est carrée et “souvent” inversible (à une condition) Hypothèse : " n’est pas corrélé à X , c’est-à-dire X

" = 0.

Alors X Y = X

X ! et donc ! =

X X −1

X Y

En général, X " = 0 mais si on peut supposer que X

" ≈ 0 en un

sens stochastique, alors on peut écrire ! =X X −1

X Y dans le

sens où ! est une approximation de !

Estimateur « méthode des moments »

L’inversion est une intuition d’un autre estimateur, dit “méthodedes moments”

Soit A un estimateur de ! , alors on peut écrire Y −XA = " .

On veut que A soit tel que X " ≈ 0

Alors A = (X

X )−1

X

Y =ˆ! :

Estimateur MM = estimateur MCO pour le modèle linéaireY = X ! +"

Mais la méthode des moments s’applique pareillement à desmodèles non linéaires Y = g (X ,! ) + "



L’exemple de la crème glacée

L’exemple calculé dans Excel

L’exemple calculé dans Gretl

La prédiction

Un objectif était de prédire au mieux les ventes de crème glacéeen fonction de la température

La prédiction se trouve sur la droite : Y = X !

Un second objectif était la quantification de l’influence de X surY

$ Y /$ X 1 = !1 = coefficient de X 1 = pente de la droite

Se vérifie dans la prédiction

Exemple dans Excel et Gretl

/ U s er s / p ol om e / D o c um en t s / T e a ch

&

O r g / M 1

F i n

E cn t x

i n t r o / S l i d e s

2 0 1 0 / p a

Exemples à données réelles Exemples à données réelles

Trois types de données

Séries temporelles (Time series) : un agent, beaucoup de périodes Coupe transversale (Cross-section) : beaucoup d’agents, une

période Panel : beaucoup d’agents, quelques périodes (MCO peu

adaptés!) Gretl contient de nombreuses bases de données réelles, utilisées

dans des textes de références (dont Verbeek)

Exemple consommation de crèmes glacées icecream.gdt dansVerbeek dataset



Séries temporelles dans Gretl

Macroeconomics data, several decades, trimestriel, Australia,Europe, Danemark, UK... dont : prix, déflateurs, emplois,population, croissance, investissement, éducation...

Daily percentage nominal returns for the DM/British £ exchange

rate – 03/01/84 : 31/12/91 Monthly data on international airline passengers, 1949-1960

Daily/Weekly stock price data (closing value of the Dow-Jonesor NYSE) for several periods

Consumption and rate of return on portfolios, mensuel, 1959-97

...

Coupes transversales dans Gretl

Strike duration data, in days

Votes on ratification of Microsoft’s "Office Open XML" as anISO standard, September 2007

Choix de plan de pension en fonction de caractéristiquessocio-économiques

Dégâts à des bateaux

Nombre de visites chez le médecin

...

Panel dans Gretl

140 U.K. manufacturing companies over the period 1976-1984

Employment and schooling history for a sample of men for the

years 1981 to 1987 ...

Où trouver des données réelles ? Finance

What Was the Exchange Rate Then ? - historical exchange rates :http ://www.measuringworth.org/exchangeglobal/

Bond Market Association - material on this important market :http ://www.bondmarkets.com/

Center for Research in Security Prices (CRSP) - key securityprice data set : http ://www.crsp.com/

CRSP Data Access and Analysis - suggestions on using CRSP :http ://web.mit.edu/doncram/www/crsp.html

Financial Data Finder (FDF) - lists numerous financial data sets :http ://fisher.osu.edu/cgi-bin/DB_Search/db_search.cgi?setup_file=finance.setup.cgi

Global Financial Data - historical finance, price, and foreignexchange data : https ://www.globalfinancialdata.com/

OSU Virtual Finance Library - nice listing of finance sites foracademics : http ://fisher.osu.edu/fin/overview.htm

SEC EDGAR - electronic filings with the SEC (U.S. Securitiesand Exchange Commission) : http ://www.sec.gov/edgar.shtml

TickPlus Data - very detailed financial market data :http ://www.regisdata.co.uk/tickdata.htm



Où trouver des données réelles ?

En France : données des grandes enquêtes publiques(consommation, logement, revenu,...)

Centre Quételet : http ://www.centre.quetelet.cnrs.fr/ Plateforme de diffusion de données SHS :

http ://www.ish-lyon.cnrs.fr/DATA_SHS/index_fr.php INSEE : http ://www.insee.fr/fr/default.asp

Autres : voir mon sitehttp ://www.gate.cnrs.fr/spip.php ?article205

Distribution d’échantillonnage & Propriétés

Distribution d’échantillonnage

Chaque échantillon est aléatoire

Exemple de la vente de crème glacée sur la plage

Un autre vendeur sur autre plage aurait récolté des donnéesdifférentes

La méthodologie présentée auparavant est applicablequand-même

Le modèle est le même ... mais les valeurs des coefficients serontdifférentes dans les deux cas ! !

Echantillon aléatoire => ! aléatoire alors que ! ne l’est pas !

Quel est le ! correct ? Tous les deux sont corrects Tous les deux sont entachés d’une marge d’erreur par rapport au

« vrai » coefficient !

Distribution d’échantillonnage Exemples dans OpenOffice / Excel : simulation de

Monte-Carlo

Dans une simulation de Monte-Carlo, on génère (crée) desdonnées artificielles afin d’illustrer certains outils théoriques dansun cadre contrôlé

Fonction alea() (si vous avez une version anglaise : rand()) : créeune valeur tirée d’une variable aléatoire de distribution uniformeentre 0 et 1

SQRT(-2*LN(alea()))*SIN(2*PI()*alea()) crée une valeur d’unenormale de moyenne 0 et d’écart-type 1

Avec ces fonctions, on génère X et le terme d’erreur Ce qui permet de calculer Y = 2-3X+erreur (ou tout autre choix

de coefficient) On répète l’opération 10 lignes (par exemple) En utilisant Y et X on estime ! , on voit bien que ! = !

En recommencant l’opération, on crée des vecteurs !i qui sonttous différents les uns des autres et tous différents de ! : les !i sont tous aléatoires (alors que ! ne l’est pas, mais l’erreur et X lesont)



Distribution d’échantillonnage

! aléatoire : conséquences

Il n’y a pas de garantie d’être proche des vrais valeurs On caractérise un estimateur en fonction de ses propriétés

Un estimateur sera jugé meilleur qu’un autre si ses propriétéssont meilleures

Biais Consistence (cohérence) Efficience

Propriété désirable 1 : absence de biais La moyenne des coefficients estimés (sur l’ensemble des

échantillons dans Excel) tend à se rapprocher des vrais

valeurs Estimateur moindres carrés est dit non-biaisé

« En moyenne, cet estimateur ne se trompe pas » (pour autant quele modèle choisi soit le bon)

E !

= E

X X −1X Y = E

X X

−1X (X ! + ")

= E

X

X −1

X X !

+E

X

X −1

X "

= E (! ) +E

X

X −1

X E (") = !

pour autant que X et " soient indépendants (alors l’espérance de leur produit = le

produit des espérances) E (") = 0 (on verra plus tard que c’est toujours vrai)

E

!

≈moyenne

!

lorsqu’il y a beaucoup d’échantillons

Propriété désirable 2 : consistence

Plus la taille de l’échantillon grandit, plus les coefficients

estimés tendent à se rapprocher des vrais valeurs

L’estimateur moindres carrés est dit consistent

Lorsque la taille de l’échantillon tend vers l’infini, les coefficientsestimés convergent vers les vrais valeurs On écrit : Plim

!

= !

Propriété désirable 3 : efficience

L’efficience d’un estimateur est sa précision (l’inverse desavariance)

On verra la mesure précise plus tard

On ne s’intéresse à l’efficience que des estimateurs :

Non-biaisés pour les petits échantillons Consistents pour les grands (on parle de : “asymptotiquement

efficient”)

L’efficience est comparative : un estimateur par rapport à unautre

L’estimateur MCO est le plus efficient des estimateurs linéairesnon-biasés / consistents



Devoir #1

Réaliser votre propre exemple de Monte Carlo dans Excel (ouOpenOffice ou NéoOffice ou Gretl ou Stata)

Avec 2 régresseurs, un distribué uniformément dans [0,1] etl’autre distribué normalement n(0,1), une constante et un termed’erreur distribué n(0,1)

Choisissez les valeurs des coefficients

Tout le monde devrait avoir des chiffres différents Calculez les coefficients avec les formules

X X sera 3x3 et ! sera 3x1

Poster le devoir sur le forum avant le prochain cours (jeudi auplus tard) sous forme d’un seul fichier Excel (ou OpenOffice ouNéoOffice ou Gretl ou Stata) par personne

Je ne prends pas en compte les fichiers envoyés autrement

On ne corrigera pas le devoir

Chapitre 2 :Le modèle classique de régression linéaire

Causalité contre corrélation Modèle causal : X cause Y , X influence Y

Pas le contraire

Ce n’est pas la même chose qu’une corrélation X corrélé àY ⇔ Y corrélé à X

Dans l’exemple des ventes de crème glacée, la température causeles ventes

Un accroissement de température provoque un accroissement dedemande

Évidemment, ce n’est pas parce que les gens mangent plus deglaces que la température va augmenter

Dans des modèles plus sophistiqués, cette causalité est loind’être évidente

En macro, le taux de change agit-il sur la balance commerciale ouest-ce l’inverse ?

En marketing, au niveau de la firme, les ventes et les dépensesdepublicité sont dites simultanées : chacune est cause de l’autre

La demande d’un produit (quantité) dépend du prix, maisl’inverse est vrai aussi (simultanéité)

Causalité contre corrélation

La régression ne mesure que des corrélations

Elle n’a de sens causal que pour confirmer ou infirmer un modèle (Il est existe des tests de causalité applicables dans certaines

circonstances)

Exemple de régression inverse dans le cas des crèmes glacées :X 1 = % 1 + % 2Y + "

Excel et Gretl

Ce que ça veut dire : une régression ne dit à elle seule riend’autre que des corrélations

Pour y voir des relations économiques, il est nécessaire qu’ellesoit accompagnée d’une théorie

Exemple des cigognes



Les moyennes conditionnelles

Exemple de tableau croisé dynamique

Les moyennes conditionnelles sont des moyennes (arithmétiquessimples) calculées sur un groupe particulier dans l’échantillon

Par exemple : les ventes moyennes du vendeur Smith dans uneentreprise

Il est possible de croire que les différences entre moyennesconditionnelles sont dues aux “conditionneurs”

Par exemple, les ventes de Smith sont plus élevées que celles deGonzález parce que Smith est meilleur vendeur que González

Mais il ne s’agit que d’une corrélation, pas d’une causalité

Par exemple, les ventes de Smith sont plus élevées parce que il estsur un plus grand territoire

Causalité : conclusion

L’économétrie, les moyennes conditionnelles, les corrélations neservent qu’à quantifier, pas à expliquer.

De telles quantifications peuvent confirmer ou infirmer une

théorie (parfois) Par exemple, si la théorie est “les hommes sont meilleurs

vendeurs que les femmes”, on peut comparer les ventes deshommes et des femmes pour infirmer cette théorie

Mais il ne faut pas accepter n’importe quel résultat juste parcequ’il a été obtenu par des méthodes sophistiquées

Le modèle économétrique formel

Une section de nomenclature


Y t = !0 +!1X 1t + ...+!k X kt + "t

t = 1...T indexe les observations Y est la variable endogène, expliquée, dépendante Chaque X i avec i = 1...k est une variable explicative ou causale,

un régresseur (pas nécessairement exogène)

Y t = !0 +!1X 1t + ...+!k X kt est une théorie

Chaque !i mesure quantitativement l’influence de X i sur Y !i est la pente de la droite selon X i !0 est dit constante, terme indépendant ou intercept du modèle

! est le vecteur de coefficients du modèle

Le terme d’erreur s’écrit souvent " ou µ

Il a p lusieurs interprétations : erreurs de mesures, régresseursinobservables ou manquants, facteurs a léatoires...




En notation matricielle Y = X ! + "

On observe Y et X L’économétrie est un ensemble de techniques pour estimer !

Chaque technique donne lieu à une formule, qu’on appelle« estimateur » et qu’on note avec un chapeau

Par exemple « Moindres carrés ordinaire » ! =X X −1

X −1Y Il existe également des estimateurs « maximum de

vraisemblance », « méthode des moments », « variablesinstrumentales », « moindres carrés généralisés »...


La prédiction s’écrit Y = X !

Il y a bien sûr toujours une erreur de prédiction

On n’observe jamais le terme d’erreur "

Par contre, on calcule le résidu " = Y − Y = Y −X !

Ce résidu s’écrit parfois e et peut se nommer « erreur » (mais çaporte à confusion)

Exemple Excel

Modèle classique de régression linéaire : 7 hypothèses

Les circonstances dans lesquelles MCO est un “bon”estimateur

Modèle classique de régression linéaire : 7 hypothèses

Le Modèle Classique de Régression Linéaire (MCRL) est lemodèle qu’on a utilisé jusqu’à présent, soit, en notationmatricielle

Y = X ! + "

Ce modèle s’accompagne de 7 hypothèses classiques

Lorsqu’elles sont vérifiées, l’estimateur MCO possède de trèsbonnes propriétés

On va examiner ces hypothèses

Voir dans quels cas elles ne sont pas satisfaites Voir si les conséquences sur l’estimateur sont graves Voir si on peut “réparer”



MCRL Y = X ! +" : 7 hypothèses

1. E ("t ) = 0 ∀t : les erreurs ont une espérance nulle

Cette propriété est toujours satisfaite pour autant qu’il y ait uneconstante !0 dans la régression (commande MC dans excel)

2. var ("t ) = & 2

∀t : la variance de chaque erreur est la même et est

réelle = Homoscédasticité

3. cov ("t ,"s ) = 0 ∀t = s : les erreurs sont indépendantes entre elles= Pas d’auto-corrélation

1+2+3 = “Sphéricité des erreurs”

4. E ("t x t ) = 0 ∀t : il n’y a pas de corrélation contemporaine(même t) entre l’erreur et chaque régresseur = Exogénéité

FIGURE: MCRL Y = X ! +" : Illustration graphique des 4 hyp. sur l’erreur

® Wooldridge

MCRL Y = X ! +" : 7 hypothèses

5. La matrice X est de plein rang

Aucun régresseur ne peut s’écrire comme une combinaisonlinéaire des autres régresseurs

Dans le cas contraire, on parle de colinéarité parfaite desrégresseurs

Dans ce cas, X X n’est pas inversible

6. Le modèle est correctement spécifié

La réalité est effectivement linéaire en les coefficients (formefonctionnelle) Il ne manque aucun régresseur pertinent

7. La variable dépendante Y est continue

Pas qualitative : 0/1 ou bien A, B, C, D Pas discrète : 0,1,2,3... Pas tronquée/censurée: [3,12] ou [-1,+1]

Hypothèses pas respectées => MCO perd certaines de ses propriétés(Chap 4)

MCRL Y = X ! +" : 3 Propriétés de l’estimateur MCOSi toutes les hypothèses du MCRL sont respectées, l’estimateur MCOpossède les propriétés suivantes

Non-biaisé E !

= !

La moyenne sur suffisamment d’échantillons des estimationsMCO est égale à la vrai valeur des coefficients

Consistent : A mesure que l’échantillon grandit, l’estimationMCO se rapproche de la vrai valeur des coefficients

En abrégé Plim!

= !

Efficient (précision)

Un estimateur linéaire est dit efficient si sa variance est la pluspetite de tous les estimateurs linéaires

Théorème de Gauss-Markov : cette variance est la plus petite detous les estimateurs linéaires non-biaisés : ! est BLUE

De plus, ! est le plus efficient de tous les estimateurs consistents :! est asymtotiquement efficient



Chap 6 Variables dépendantes limitées 6.1 Modèles dichotomiques

Dans beaucoup de situations économiques, on souhaite expliquerune variable endogène dichotomique

Acheter ou non, Être employé, Voter Aller à l’université, quelle orientation...

Souvent il s’agit de situations micro (individus, ménages, firmes)

Le modèle linéaire n’est pas approprié Y i = X i ! + "i avecY i ∈ {0,1}

implique qu’il faudrait contraindre les ! de telle sorte à ce queY i ∈ {0,1}∀i

pas à priori possible (trop de contraintes)

Modèle de probabilité

Au lieu “d’expliquer” une variable endogène dichotomique, onpropose un modèle d’estimation de la probabilité que la variableendogène soit =1 en fonction de variables explicatives

Pr{Y i = 1|X i } = F (X i !) où

F est une fonction de distribution X i ! est dit fonction index

Pr{Y i = 0|X i } = 1

−F (X i !)

2 principaux exemples

Logit F (X i ! ) = Λ (X i !) =exp (X i !)

1+ exp(X i !) Probit, basé sur la normale standard

F (X i !) = Φ(X i !) =

ˆ X i !

−'

1√2(

exp−t 2/2dt

Remarque : argument linéaire des fonctions = Modèle linéairegénéral

Interprétation

Le signe du coefficient d’un régresseur x j indique le sens de lavariation de Pr{Y i = 1} lorsque ce régresseur s’accroît.

Pour avoir une idée quantitative de cette variation, on doit avoirrecours aux dérivées :

Probit$ Φ(X i ! )

$ x ji

= ) (X i !)! j où ) () est la fonction de densité

normale standard (dans tous les tableurs)

Logit$ Λ(X i !)

$ x ij = Λ(X i !)

! j

1+ exp(X i ! ) Attention : le modèle est non-linéaire, les effets sont individuels ! Gretl calcule les effets à la moyenne des régresseurs, ce n’est pas

la même chose que l’effet moyen !



Modèle sous-jacent

Il est souvent utile, pour l’interprétation et la compréhension,d’obtenir le modèle de choix dichotomique à partir d’hypothèsescomportementales

Exemple de l’achat d’un bien

Soit l’utilité individuelle Y ∗i = X i ! + "i de l’achat de ce bien

X représente des caractéristiques observables individuelles oubien des caractéristiques observables du bien (selon les cas, pasles deux)

" représente les caractéristiques inobservables Y ∗ est dit variable latente car elle ne peut être observée, on

n’observe que la décision Y ∈ {0,1} On fait l’hypothèse que l’individu achète le bien si son utilité

dépasse un certain seuil, normalisé à zéro – donc :

Pr{Y i = 1} = Pr{Y ∗i > 0} = Pr{X i ! + "i > 0} =Pr{−"i < X i !} = F (X i !)

Estimation Le modèle est non-linéaire en ! et la variable endogène n’est pas

continue MCO n’est pas approprié

Principes du maximum de vraisemblance On suppose connue la distribution du terme d’erreur, p.e. " ∼ n () Hypothèse : l’échantillon observé est le p lus probable Principe : on veut ! t.q. la probabilité estimée de l’échantillon est

maximale Quelle est la probabilité de l’échantillon ?

Hypothèse : les observations sont indépendantes entre elles Donc : la probabilité de l’échantillon est le produit des

probabilités de chaque observation, c’est la fonction devraisemblance :

*Y i =0

Pr{Y i = 0} *Y i =1

Pr{Y i = 1}

On réécrit souvent pour plus de simplicité

*i

(Pr{Y i = 0})1−y i (Pr{Y i = 1})y i

Maximum de vraisemblance

Généralement on prend le ln car la forme est plus simple àoptimiser

lnL(! ) =#i

(1− y i ) ln (1−F (X i ! )) + y i ln (F (X i ! ))

Résolution numérique par ordinateur, essentiellement

À partir de valeurs de départ pour ! , l’ordinateur calcule la valeurde la fonction

Puis, prend un autre vecteur de valeurs selon une certaine règle etrecalcule la valeur de la fonction

Il poursuit ainsi tant que F croît C’est un algorithme

Commande Gretl LOGIT et PROBIT, même maniement que OLS

Propriétés de MV

Si les hypothèses du MRL sont satisfaites sauf pour la continuitéde Y

Si la fonction de distribution est correctement choisie

Hypothèse pas nécessairement critique (pseudo-maximum devraisemblance)

Généralement impossible à vérifier)

Alors l’estimateur MV est consistent et asymptotiquementefficient

Mais généralement biaisé

Dans la pratique, la seule différence substantielle entre Logit etProbit c’est que Logit est plus facile à calculer

Les coefficients sont différents mais pas les pentes



Exemple Gretl

Greene 19_1 : un certain programme d’enseignement del’économie (PSI) est évalué par l’augmentation ou non des notesdes étudiants

Grade = 1 si la note a augmenté, = 0 sinon GPA : Grade Point Average TUCE : score sur un test de connaissance de cette matière PSI = 1 si l’étudiant a reçu le programme spécial PSI

Dans les sorties Gretl

Tableau prédiction

Pseudo-R 2 de McFadden = 1− lnL

lnL0où L0 est la vraisemblance

du modèle sans variable explicative (seulement une constante)

Si les variables introduites n’expliquent rien, L0 = L etPseudo-R 2 = 0

Si le modèle explique parfaitement L= 1 et Pseudo-R 2 = 1

Entre les 2, on interprête comme le R 2 du modèle linéaire

Pas de différence importante entre logit & probit

6.2 Choix multinomial

Lorsque la variable endogène présente p catégoriesnon-ordonnées, on se trouve dans un cas multinomial

Par extension du cas dichotomique, on va vouloir estimer laprobabilité de choisir une parmi ces p

Plusieurs modèles sont possibles, on ne verra que le plus simple :logit multinomial

Pr{Y i = k |x i } =exp (x i !k )p

# j =0

exp(x i ! j )

Les coefficients sont différents par alternative j ! Lorsque p −1 catégories n’ont pas été sélectionnées, la catégorie

p sera forcément choisie

cfr. p = 2 : dichotomique On doit donc normaliser, on va prendre habituellement qu’une des

catégories est la référence Ses coefficients sont alors 0

Choix multinomial Catégorie référence 0 : Pr{Y i = 0|x i } =

1

1+p

# j =1

exp (x i ! j )

Les autres catégories k : Pr{Y i = k |x i } =exp (x i !k )

1+p

# j =1

exp (x i ! j )

Interprétation

Tous les résultats s’interprête relativement à la catégorie deréférence Un coefficient positif de x m pour la catégorie k indique un effet

positif de x m sur la probabilité de sélection de k par rapport à lacatégorie 0

La somme des probabilités doit faire 1, donc avec 3 catégories 0, 1,2 si x m a un signe positif pour les catégories 1 et 2, alors unaccroissement de x m implique une baisse de la probabilité dechoisir la catégorie 0

Il faut calculer les effets marginaux, de façon similaire auxmodèles dichotomiques

Exemple dans Gretl

Kean & Wolpin [keane dans Gretl]

Choix de carrière (0 = étude; 1 = ni étude ni travail ; 2 = travail) Variables explicatives : education, experience du travail (linéaire

et carré), dichotomique “noir” Échantillon d’homme, originellement sur un panel, on ne prend

que 1987

Menu modèles non-linéaires logit multinomial

Chap_1_2_6

Documents

Transcript of Chap_1_2_6