Chap_1_2_6
Transcript of Chap_1_2_6
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 1/14
Introduction à l’économétrie
Philippe Polomé, Prof. U. Lyon 2
www.gate.cnrs.fr/perso/polome
Année 2010
Objectifs du cours
Introduction à l’économétrie
Acquérir une compréhension permettant
de poser un regard critique sur des résultats d’obtenir quelques résultats
Acquérir un minimum de maniement de logiciels (au moins dansla compréhension des sorties logicielles)
Tableur (OO calc, MS excel) Gretl
Organisation
Cours magistraux
Pas de TD mais démonstration de pratique en cours 2 ou 3 devoirs sur logiciel à rendre dans la semaine (avant le
cours suivant) via le FORUM Toutes les communications passent par le forum (voir ma page)
Evaluation Les devoirs valent +/- 5 points
Les devoirs ne seront pas corrigés
Le reste (15 points) à l’examen
Examen de compréhension, sans calcul, sans logiciel Dont une partie sur les devoirs
Logiciels
Logiciels économétriques installés en salle info :
Stata (le plus populaire actuellement?) SAS (ne développe plus guère l’économétrie, apparemment) Gretl
Avantages de Gretl
Gratuit et open source, peut être téléchargé et installé sur vos
ordinateurs personnels Gretl @ gretl.sourceforge.net/ S’installe dans la langue de votre système opérationnel (anglais,
français, italien, espagnol, polonais, allemand et portugais). Extras (= jeux de données) Maniement similaire à Stata et sorties “standards” Bonne interface graphique Connecte avec divers autres logiciels pour analyse plus poussée
ou sorties de présentation
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 2/14
Références
Econométrie, Régis Bourbonnais, Dunod, 2002
Bonne vision très synthétique en français
A Guide to Modern Econometrics, Marno Verbeek, Wiley, 2000
Plus avancé, nombreux exemples à données réelles, toutesdisponibles dans Gretl
Introductory econometrics for finance, Chris Brooks, CambridgeUniversity Press, 2002-2005
Pas trop avancé, orienté finance
Wooldridge, J. Introductory Econometrics
Beaucoup d’exemples, large public
Chapitre 1Ce qu’on a et ce qu’on veut faire
Une introduction intuitive
Un exemple Ce qu’on a et ce qu’on veut faire
On a un modèle causal stochastique
S’il fait plus chaud (X : la température), la consommation decrème glacée (Y ) augmente, toutes autres choses égales
Y t = !1 +!2X t + "t
pour chaque t = 1...T avec erreurs aléatoires non-observables "t
On a des données La variable Y dite endogène ou expliquée Une ou plusieurs variables X 1...X k explicatives
On veut
Quantifier l’influence de X surY Prédire Y conditionnellement à certaines valeurs pour X
Comment faire ?
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 3/14
Intuition 1 : Droite qui « passe au mieux » Intuition 1 : Droite qui « passe au mieux »
Y t = !1 +!2X t + "t pour chaque t = 1...T
Y = X ! + " en notation matricielle
On suppose que c’est la relation réelle
" s’interprète comme un événement aléatoire
non-mesuré
non-systématique On cherche une estimation ! de ! telle que la droite
Y t = !1 + !2X t + "t “passe au mieux” dans le nuage de points
soit l’erreur " = Y −X !
On cherche le vecteur de nombres ! tel que la somme des carrés
des erreurs #T t =1
Y y −X t !
2
soit minimale
Réponse ! =X X −1
X Y
Compliqué à calculer donc logiciel ! est un ESTIMATEUR, dit « des moindres carrés »
Intuition 2 : « Inversion » de Y = X ! +"
Imaginons que " = 0 et que X soit carrée et inversible
Alors X −1 telle que X −1X = I existe ! = X −1Y s’obtient par inversion (système d’équations linéaires)
Mais " = 0 et X n’est pas carrée→ « Généralisation » del’inverse
Prémultiplier par X , on a X
Y = X
X ! +X
"
X X est carrée et “souvent” inversible (à une condition) Hypothèse : " n’est pas corrélé à X , c’est-à-dire X
" = 0.
Alors X Y = X
X ! et donc ! =
X X −1
X Y
En général, X " = 0 mais si on peut supposer que X
" ≈ 0 en un
sens stochastique, alors on peut écrire ! =X X −1
X Y dans le
sens où ! est une approximation de !
Estimateur « méthode des moments »
L’inversion est une intuition d’un autre estimateur, dit “méthodedes moments”
Soit A un estimateur de ! , alors on peut écrire Y −XA = " .
On veut que A soit tel que X " ≈ 0
Alors A = (X
X )−1
X
Y =ˆ! :
Estimateur MM = estimateur MCO pour le modèle linéaireY = X ! +"
Mais la méthode des moments s’applique pareillement à desmodèles non linéaires Y = g (X ,! ) + "
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 4/14
L’exemple de la crème glacée
L’exemple calculé dans Excel
L’exemple calculé dans Gretl
La prédiction
Un objectif était de prédire au mieux les ventes de crème glacéeen fonction de la température
La prédiction se trouve sur la droite : Y = X !
Un second objectif était la quantification de l’influence de X surY
$ Y /$ X 1 = !1 = coefficient de X 1 = pente de la droite
Se vérifie dans la prédiction
Exemple dans Excel et Gretl
/ U s er s / p ol om e / D o c um en t s / T e a ch
&
O r g / M 1
F i n
E cn t x
i n t r o / S l i d e s
2 0 1 0 / p a
Exemples à données réelles Exemples à données réelles
Trois types de données
Séries temporelles (Time series) : un agent, beaucoup de périodes Coupe transversale (Cross-section) : beaucoup d’agents, une
période Panel : beaucoup d’agents, quelques périodes (MCO peu
adaptés!) Gretl contient de nombreuses bases de données réelles, utilisées
dans des textes de références (dont Verbeek)
Exemple consommation de crèmes glacées icecream.gdt dansVerbeek dataset
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 5/14
Séries temporelles dans Gretl
Macroeconomics data, several decades, trimestriel, Australia,Europe, Danemark, UK... dont : prix, déflateurs, emplois,population, croissance, investissement, éducation...
Daily percentage nominal returns for the DM/British £ exchange
rate – 03/01/84 : 31/12/91 Monthly data on international airline passengers, 1949-1960
Daily/Weekly stock price data (closing value of the Dow-Jonesor NYSE) for several periods
Consumption and rate of return on portfolios, mensuel, 1959-97
...
Coupes transversales dans Gretl
Strike duration data, in days
Votes on ratification of Microsoft’s "Office Open XML" as anISO standard, September 2007
Choix de plan de pension en fonction de caractéristiquessocio-économiques
Dégâts à des bateaux
Nombre de visites chez le médecin
...
Panel dans Gretl
140 U.K. manufacturing companies over the period 1976-1984
Employment and schooling history for a sample of men for the
years 1981 to 1987 ...
Où trouver des données réelles ? Finance
What Was the Exchange Rate Then ? - historical exchange rates :http ://www.measuringworth.org/exchangeglobal/
Bond Market Association - material on this important market :http ://www.bondmarkets.com/
Center for Research in Security Prices (CRSP) - key securityprice data set : http ://www.crsp.com/
CRSP Data Access and Analysis - suggestions on using CRSP :http ://web.mit.edu/doncram/www/crsp.html
Financial Data Finder (FDF) - lists numerous financial data sets :http ://fisher.osu.edu/cgi-bin/DB_Search/db_search.cgi?setup_file=finance.setup.cgi
Global Financial Data - historical finance, price, and foreignexchange data : https ://www.globalfinancialdata.com/
OSU Virtual Finance Library - nice listing of finance sites foracademics : http ://fisher.osu.edu/fin/overview.htm
SEC EDGAR - electronic filings with the SEC (U.S. Securitiesand Exchange Commission) : http ://www.sec.gov/edgar.shtml
TickPlus Data - very detailed financial market data :http ://www.regisdata.co.uk/tickdata.htm
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 6/14
Où trouver des données réelles ?
En France : données des grandes enquêtes publiques(consommation, logement, revenu,...)
Centre Quételet : http ://www.centre.quetelet.cnrs.fr/ Plateforme de diffusion de données SHS :
http ://www.ish-lyon.cnrs.fr/DATA_SHS/index_fr.php INSEE : http ://www.insee.fr/fr/default.asp
Autres : voir mon sitehttp ://www.gate.cnrs.fr/spip.php ?article205
Distribution d’échantillonnage & Propriétés
Distribution d’échantillonnage
Chaque échantillon est aléatoire
Exemple de la vente de crème glacée sur la plage
Un autre vendeur sur autre plage aurait récolté des donnéesdifférentes
La méthodologie présentée auparavant est applicablequand-même
Le modèle est le même ... mais les valeurs des coefficients serontdifférentes dans les deux cas ! !
Echantillon aléatoire => ! aléatoire alors que ! ne l’est pas !
Quel est le ! correct ? Tous les deux sont corrects Tous les deux sont entachés d’une marge d’erreur par rapport au
« vrai » coefficient !
Distribution d’échantillonnage Exemples dans OpenOffice / Excel : simulation de
Monte-Carlo
Dans une simulation de Monte-Carlo, on génère (crée) desdonnées artificielles afin d’illustrer certains outils théoriques dansun cadre contrôlé
Fonction alea() (si vous avez une version anglaise : rand()) : créeune valeur tirée d’une variable aléatoire de distribution uniformeentre 0 et 1
SQRT(-2*LN(alea()))*SIN(2*PI()*alea()) crée une valeur d’unenormale de moyenne 0 et d’écart-type 1
Avec ces fonctions, on génère X et le terme d’erreur Ce qui permet de calculer Y = 2-3X+erreur (ou tout autre choix
de coefficient) On répète l’opération 10 lignes (par exemple) En utilisant Y et X on estime ! , on voit bien que ! = !
En recommencant l’opération, on crée des vecteurs !i qui sonttous différents les uns des autres et tous différents de ! : les !i sont tous aléatoires (alors que ! ne l’est pas, mais l’erreur et X lesont)
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 7/14
Distribution d’échantillonnage
! aléatoire : conséquences
Il n’y a pas de garantie d’être proche des vrais valeurs On caractérise un estimateur en fonction de ses propriétés
Un estimateur sera jugé meilleur qu’un autre si ses propriétéssont meilleures
Biais Consistence (cohérence) Efficience
Propriété désirable 1 : absence de biais La moyenne des coefficients estimés (sur l’ensemble des
échantillons dans Excel) tend à se rapprocher des vrais
valeurs Estimateur moindres carrés est dit non-biaisé
« En moyenne, cet estimateur ne se trompe pas » (pour autant quele modèle choisi soit le bon)
E !
= E
X X −1X Y = E
X X
−1X (X ! + ")
= E
X
X −1
X X !
+E
X
X −1
X "
= E (! ) +E
X
X −1
X E (") = !
pour autant que X et " soient indépendants (alors l’espérance de leur produit = le
produit des espérances) E (") = 0 (on verra plus tard que c’est toujours vrai)
E
!
≈moyenne
!
lorsqu’il y a beaucoup d’échantillons
Propriété désirable 2 : consistence
Plus la taille de l’échantillon grandit, plus les coefficients
estimés tendent à se rapprocher des vrais valeurs
L’estimateur moindres carrés est dit consistent
Lorsque la taille de l’échantillon tend vers l’infini, les coefficientsestimés convergent vers les vrais valeurs On écrit : Plim
!
= !
Propriété désirable 3 : efficience
L’efficience d’un estimateur est sa précision (l’inverse desavariance)
On verra la mesure précise plus tard
On ne s’intéresse à l’efficience que des estimateurs :
Non-biaisés pour les petits échantillons Consistents pour les grands (on parle de : “asymptotiquement
efficient”)
L’efficience est comparative : un estimateur par rapport à unautre
L’estimateur MCO est le plus efficient des estimateurs linéairesnon-biasés / consistents
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 8/14
Devoir #1
Réaliser votre propre exemple de Monte Carlo dans Excel (ouOpenOffice ou NéoOffice ou Gretl ou Stata)
Avec 2 régresseurs, un distribué uniformément dans [0,1] etl’autre distribué normalement n(0,1), une constante et un termed’erreur distribué n(0,1)
Choisissez les valeurs des coefficients
Tout le monde devrait avoir des chiffres différents Calculez les coefficients avec les formules
X X sera 3x3 et ! sera 3x1
Poster le devoir sur le forum avant le prochain cours (jeudi auplus tard) sous forme d’un seul fichier Excel (ou OpenOffice ouNéoOffice ou Gretl ou Stata) par personne
Je ne prends pas en compte les fichiers envoyés autrement
On ne corrigera pas le devoir
Chapitre 2 :Le modèle classique de régression linéaire
Causalité contre corrélation Modèle causal : X cause Y , X influence Y
Pas le contraire
Ce n’est pas la même chose qu’une corrélation X corrélé àY ⇔ Y corrélé à X
Dans l’exemple des ventes de crème glacée, la température causeles ventes
Un accroissement de température provoque un accroissement dedemande
Évidemment, ce n’est pas parce que les gens mangent plus deglaces que la température va augmenter
Dans des modèles plus sophistiqués, cette causalité est loind’être évidente
En macro, le taux de change agit-il sur la balance commerciale ouest-ce l’inverse ?
En marketing, au niveau de la firme, les ventes et les dépensesdepublicité sont dites simultanées : chacune est cause de l’autre
La demande d’un produit (quantité) dépend du prix, maisl’inverse est vrai aussi (simultanéité)
Causalité contre corrélation
La régression ne mesure que des corrélations
Elle n’a de sens causal que pour confirmer ou infirmer un modèle (Il est existe des tests de causalité applicables dans certaines
circonstances)
Exemple de régression inverse dans le cas des crèmes glacées :X 1 = % 1 + % 2Y + "
Excel et Gretl
Ce que ça veut dire : une régression ne dit à elle seule riend’autre que des corrélations
Pour y voir des relations économiques, il est nécessaire qu’ellesoit accompagnée d’une théorie
Exemple des cigognes
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 9/14
Les moyennes conditionnelles
Exemple de tableau croisé dynamique
Les moyennes conditionnelles sont des moyennes (arithmétiquessimples) calculées sur un groupe particulier dans l’échantillon
Par exemple : les ventes moyennes du vendeur Smith dans uneentreprise
Il est possible de croire que les différences entre moyennesconditionnelles sont dues aux “conditionneurs”
Par exemple, les ventes de Smith sont plus élevées que celles deGonzález parce que Smith est meilleur vendeur que González
Mais il ne s’agit que d’une corrélation, pas d’une causalité
Par exemple, les ventes de Smith sont plus élevées parce que il estsur un plus grand territoire
Causalité : conclusion
L’économétrie, les moyennes conditionnelles, les corrélations neservent qu’à quantifier, pas à expliquer.
De telles quantifications peuvent confirmer ou infirmer une
théorie (parfois) Par exemple, si la théorie est “les hommes sont meilleurs
vendeurs que les femmes”, on peut comparer les ventes deshommes et des femmes pour infirmer cette théorie
Mais il ne faut pas accepter n’importe quel résultat juste parcequ’il a été obtenu par des méthodes sophistiquées
Le modèle économétrique formel
Une section de nomenclature
Le modèle économétrique formel
Y t = !0 +!1X 1t + ...+!k X kt + "t
t = 1...T indexe les observations Y est la variable endogène, expliquée, dépendante Chaque X i avec i = 1...k est une variable explicative ou causale,
un régresseur (pas nécessairement exogène)
Y t = !0 +!1X 1t + ...+!k X kt est une théorie
Chaque !i mesure quantitativement l’influence de X i sur Y !i est la pente de la droite selon X i !0 est dit constante, terme indépendant ou intercept du modèle
! est le vecteur de coefficients du modèle
Le terme d’erreur s’écrit souvent " ou µ
Il a p lusieurs interprétations : erreurs de mesures, régresseursinobservables ou manquants, facteurs a léatoires...
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 10/14
Le modèle économétrique formel
En notation matricielle Y = X ! + "
On observe Y et X L’économétrie est un ensemble de techniques pour estimer !
Chaque technique donne lieu à une formule, qu’on appelle« estimateur » et qu’on note avec un chapeau
Par exemple « Moindres carrés ordinaire » ! =X X −1
X −1Y Il existe également des estimateurs « maximum de
vraisemblance », « méthode des moments », « variablesinstrumentales », « moindres carrés généralisés »...
Le modèle économétrique formel
La prédiction s’écrit Y = X !
Il y a bien sûr toujours une erreur de prédiction
On n’observe jamais le terme d’erreur "
Par contre, on calcule le résidu " = Y − Y = Y −X !
Ce résidu s’écrit parfois e et peut se nommer « erreur » (mais çaporte à confusion)
Exemple Excel
Modèle classique de régression linéaire : 7 hypothèses
Les circonstances dans lesquelles MCO est un “bon”estimateur
Modèle classique de régression linéaire : 7 hypothèses
Le Modèle Classique de Régression Linéaire (MCRL) est lemodèle qu’on a utilisé jusqu’à présent, soit, en notationmatricielle
Y = X ! + "
Ce modèle s’accompagne de 7 hypothèses classiques
Lorsqu’elles sont vérifiées, l’estimateur MCO possède de trèsbonnes propriétés
On va examiner ces hypothèses
Voir dans quels cas elles ne sont pas satisfaites Voir si les conséquences sur l’estimateur sont graves Voir si on peut “réparer”
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 11/14
MCRL Y = X ! +" : 7 hypothèses
1. E ("t ) = 0 ∀t : les erreurs ont une espérance nulle
Cette propriété est toujours satisfaite pour autant qu’il y ait uneconstante !0 dans la régression (commande MC dans excel)
2. var ("t ) = & 2
∀t : la variance de chaque erreur est la même et est
réelle = Homoscédasticité
3. cov ("t ,"s ) = 0 ∀t = s : les erreurs sont indépendantes entre elles= Pas d’auto-corrélation
1+2+3 = “Sphéricité des erreurs”
4. E ("t x t ) = 0 ∀t : il n’y a pas de corrélation contemporaine(même t) entre l’erreur et chaque régresseur = Exogénéité
FIGURE: MCRL Y = X ! +" : Illustration graphique des 4 hyp. sur l’erreur
® Wooldridge
MCRL Y = X ! +" : 7 hypothèses
5. La matrice X est de plein rang
Aucun régresseur ne peut s’écrire comme une combinaisonlinéaire des autres régresseurs
Dans le cas contraire, on parle de colinéarité parfaite desrégresseurs
Dans ce cas, X X n’est pas inversible
6. Le modèle est correctement spécifié
La réalité est effectivement linéaire en les coefficients (formefonctionnelle) Il ne manque aucun régresseur pertinent
7. La variable dépendante Y est continue
Pas qualitative : 0/1 ou bien A, B, C, D Pas discrète : 0,1,2,3... Pas tronquée/censurée: [3,12] ou [-1,+1]
Hypothèses pas respectées => MCO perd certaines de ses propriétés(Chap 4)
MCRL Y = X ! +" : 3 Propriétés de l’estimateur MCOSi toutes les hypothèses du MCRL sont respectées, l’estimateur MCOpossède les propriétés suivantes
Non-biaisé E !
= !
La moyenne sur suffisamment d’échantillons des estimationsMCO est égale à la vrai valeur des coefficients
Consistent : A mesure que l’échantillon grandit, l’estimationMCO se rapproche de la vrai valeur des coefficients
En abrégé Plim!
= !
Efficient (précision)
Un estimateur linéaire est dit efficient si sa variance est la pluspetite de tous les estimateurs linéaires
Théorème de Gauss-Markov : cette variance est la plus petite detous les estimateurs linéaires non-biaisés : ! est BLUE
De plus, ! est le plus efficient de tous les estimateurs consistents :! est asymtotiquement efficient
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 12/14
Chap 6 Variables dépendantes limitées 6.1 Modèles dichotomiques
Dans beaucoup de situations économiques, on souhaite expliquerune variable endogène dichotomique
Acheter ou non, Être employé, Voter Aller à l’université, quelle orientation...
Souvent il s’agit de situations micro (individus, ménages, firmes)
Le modèle linéaire n’est pas approprié Y i = X i ! + "i avecY i ∈ {0,1}
implique qu’il faudrait contraindre les ! de telle sorte à ce queY i ∈ {0,1}∀i
pas à priori possible (trop de contraintes)
Modèle de probabilité
Au lieu “d’expliquer” une variable endogène dichotomique, onpropose un modèle d’estimation de la probabilité que la variableendogène soit =1 en fonction de variables explicatives
Pr{Y i = 1|X i } = F (X i !) où
F est une fonction de distribution X i ! est dit fonction index
Pr{Y i = 0|X i } = 1
−F (X i !)
2 principaux exemples
Logit F (X i ! ) = Λ (X i !) =exp (X i !)
1+ exp(X i !) Probit, basé sur la normale standard
F (X i !) = Φ(X i !) =
ˆ X i !
−'
1√2(
exp−t 2/2dt
Remarque : argument linéaire des fonctions = Modèle linéairegénéral
Interprétation
Le signe du coefficient d’un régresseur x j indique le sens de lavariation de Pr{Y i = 1} lorsque ce régresseur s’accroît.
Pour avoir une idée quantitative de cette variation, on doit avoirrecours aux dérivées :
Probit$ Φ(X i ! )
$ x ji
= ) (X i !)! j où ) () est la fonction de densité
normale standard (dans tous les tableurs)
Logit$ Λ(X i !)
$ x ij = Λ(X i !)
! j
1+ exp(X i ! ) Attention : le modèle est non-linéaire, les effets sont individuels ! Gretl calcule les effets à la moyenne des régresseurs, ce n’est pas
la même chose que l’effet moyen !
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 13/14
Modèle sous-jacent
Il est souvent utile, pour l’interprétation et la compréhension,d’obtenir le modèle de choix dichotomique à partir d’hypothèsescomportementales
Exemple de l’achat d’un bien
Soit l’utilité individuelle Y ∗i = X i ! + "i de l’achat de ce bien
X représente des caractéristiques observables individuelles oubien des caractéristiques observables du bien (selon les cas, pasles deux)
" représente les caractéristiques inobservables Y ∗ est dit variable latente car elle ne peut être observée, on
n’observe que la décision Y ∈ {0,1} On fait l’hypothèse que l’individu achète le bien si son utilité
dépasse un certain seuil, normalisé à zéro – donc :
Pr{Y i = 1} = Pr{Y ∗i > 0} = Pr{X i ! + "i > 0} =Pr{−"i < X i !} = F (X i !)
Estimation Le modèle est non-linéaire en ! et la variable endogène n’est pas
continue MCO n’est pas approprié
Principes du maximum de vraisemblance On suppose connue la distribution du terme d’erreur, p.e. " ∼ n () Hypothèse : l’échantillon observé est le p lus probable Principe : on veut ! t.q. la probabilité estimée de l’échantillon est
maximale Quelle est la probabilité de l’échantillon ?
Hypothèse : les observations sont indépendantes entre elles Donc : la probabilité de l’échantillon est le produit des
probabilités de chaque observation, c’est la fonction devraisemblance :
*Y i =0
Pr{Y i = 0} *Y i =1
Pr{Y i = 1}
On réécrit souvent pour plus de simplicité
*i
(Pr{Y i = 0})1−y i (Pr{Y i = 1})y i
Maximum de vraisemblance
Généralement on prend le ln car la forme est plus simple àoptimiser
lnL(! ) =#i
(1− y i ) ln (1−F (X i ! )) + y i ln (F (X i ! ))
Résolution numérique par ordinateur, essentiellement
À partir de valeurs de départ pour ! , l’ordinateur calcule la valeurde la fonction
Puis, prend un autre vecteur de valeurs selon une certaine règle etrecalcule la valeur de la fonction
Il poursuit ainsi tant que F croît C’est un algorithme
Commande Gretl LOGIT et PROBIT, même maniement que OLS
Propriétés de MV
Si les hypothèses du MRL sont satisfaites sauf pour la continuitéde Y
Si la fonction de distribution est correctement choisie
Hypothèse pas nécessairement critique (pseudo-maximum devraisemblance)
Généralement impossible à vérifier)
Alors l’estimateur MV est consistent et asymptotiquementefficient
Mais généralement biaisé
Dans la pratique, la seule différence substantielle entre Logit etProbit c’est que Logit est plus facile à calculer
Les coefficients sont différents mais pas les pentes
5/16/2018 Chap_1_2_6 - slidepdf.com
http://slidepdf.com/reader/full/chap126 14/14
Exemple Gretl
Greene 19_1 : un certain programme d’enseignement del’économie (PSI) est évalué par l’augmentation ou non des notesdes étudiants
Grade = 1 si la note a augmenté, = 0 sinon GPA : Grade Point Average TUCE : score sur un test de connaissance de cette matière PSI = 1 si l’étudiant a reçu le programme spécial PSI
Dans les sorties Gretl
Tableau prédiction
Pseudo-R 2 de McFadden = 1− lnL
lnL0où L0 est la vraisemblance
du modèle sans variable explicative (seulement une constante)
Si les variables introduites n’expliquent rien, L0 = L etPseudo-R 2 = 0
Si le modèle explique parfaitement L= 1 et Pseudo-R 2 = 1
Entre les 2, on interprête comme le R 2 du modèle linéaire
Pas de différence importante entre logit & probit
6.2 Choix multinomial
Lorsque la variable endogène présente p catégoriesnon-ordonnées, on se trouve dans un cas multinomial
Par extension du cas dichotomique, on va vouloir estimer laprobabilité de choisir une parmi ces p
Plusieurs modèles sont possibles, on ne verra que le plus simple :logit multinomial
Pr{Y i = k |x i } =exp (x i !k )p
# j =0
exp(x i ! j )
Les coefficients sont différents par alternative j ! Lorsque p −1 catégories n’ont pas été sélectionnées, la catégorie
p sera forcément choisie
cfr. p = 2 : dichotomique On doit donc normaliser, on va prendre habituellement qu’une des
catégories est la référence Ses coefficients sont alors 0
Choix multinomial Catégorie référence 0 : Pr{Y i = 0|x i } =
1
1+p
# j =1
exp (x i ! j )
Les autres catégories k : Pr{Y i = k |x i } =exp (x i !k )
1+p
# j =1
exp (x i ! j )
Interprétation
Tous les résultats s’interprête relativement à la catégorie deréférence Un coefficient positif de x m pour la catégorie k indique un effet
positif de x m sur la probabilité de sélection de k par rapport à lacatégorie 0
La somme des probabilités doit faire 1, donc avec 3 catégories 0, 1,2 si x m a un signe positif pour les catégories 1 et 2, alors unaccroissement de x m implique une baisse de la probabilité dechoisir la catégorie 0
Il faut calculer les effets marginaux, de façon similaire auxmodèles dichotomiques
Exemple dans Gretl
Kean & Wolpin [keane dans Gretl]
Choix de carrière (0 = étude; 1 = ni étude ni travail ; 2 = travail) Variables explicatives : education, experience du travail (linéaire
et carré), dichotomique “noir” Échantillon d’homme, originellement sur un panel, on ne prend
que 1987
Menu modèles non-linéaires logit multinomial