ECONOMETRIE SPATIALE

download ECONOMETRIE SPATIALE

of 45

Transcript of ECONOMETRIE SPATIALE

  • 8/7/2019 ECONOMETRIE SPATIALE

    1/45

    n 2000-05

    ECONOMETRIESPATIALE

    1. Autocorrlation spatiale

    Julie Le Gallo*

    Juin 2000

    * Universit de BourgogneLATEC UMR 5118

    Ple dEconomie et de Gestion,B.P. 26611,21066 Dijon Cedex

    FRANCE

    e-mail : [email protected]

  • 8/7/2019 ECONOMETRIE SPATIALE

    2/45

    - 2 -

    ECONOMETRIESPATIALE

    1. Autocorrlation spatiale

    Julie Le Gallo

    Rsum

    Les mthodes de lconomtrie spatiale visent traiter les deux grandes particularits des

    donnes spatiales : lautocorrlation spatiale qui se rfre labsence dindpendance entreobservations gographiques et lhtrognit spatiale qui est lie la diffrenciation dans

    lespace des variables et des comportements. Ces techniques ont connu de nombreuxdveloppements depuis une dizaine dannes et sont de plus en plus appliques dans lestudes empiriques ncessitant lutilisation de donnes gographiques.

    Lobjectif de cet article est de prsenter les diverses faons permettant de modliserlautocorrlation et lhtrognit spatiales ainsi que les procdures destimation et

    dinfrence adaptes aux modles incorporant ces deux effets.Larticle est divis en deux parties. Cette premire partie est consacre au problme delautocorrlation spatiale (document de travail n 2000-05) alors que la seconde portera sur le

    problme de lhtrognit spatiale.

    Mots-cls : conomtrie spatiale, autocorrlation spatiale, htrognit spatiale

    Abstract

    Spatial econometric methods aim at taking into account the two special characteristics of

    spatial data: spatial autocorrelation, which is the lack of independence between geographicalobservations, and spatial heterogeneity, which is related to the differentiation of variables andbehaviors in space. These techniques have been mostly developed the last ten years and are

    more often applied in empirical studies with geographical data.The aim of this article is to present the way spatial autocorrelation and spatial heterogeneity

    can be incorporated in regression relationships and to present the estimation and inferenceprocedures adapted to the models incorporating these two effects.

    This article is divided in two parts. This first part deals with spatial autocorrelation (workingpaper NN 22000000--0055) and the second part will deal with spatial heterogeneity.

    Key-words : spatial econometrics, spatial autocorrelation, spatial heterogeneity

    Classification JEL : C51, C52, R15

    Lauteur remercie C. Baumont, M.-C. Pichery et L. Bertinelli pour leurs commentaires et suggestions. Lauteur

    reste seule responsable des insuffisances que pourrait comporter ce texte.

  • 8/7/2019 ECONOMETRIE SPATIALE

    3/45

    - 3 -

    ECONOMETRIESPATIALE

    INTRODUCTION GENERALE

    Depuis une vingtaine dannes, les mthodologies en gographie et en science rgionaleont connu de nombreux dveloppements destins traiter les particularits des donnesgographiques, c'est--dire les observations d'une variable mesure pour des localisationsparticulires rparties dans l'espace. En effet, l'introduction de l'espace dans les modles

    conomtriques n'est ni neutre, ni immdiate, et les techniques de lconomtrie spatialevisent prcisment prendre en compte les deux grandes spcificits des donnes

    gographiques : l'autocorrlation spatiale qui se rfre l'absence d'indpendance entreobservations gographiques et l'htrognit spatiale qui est lie la diffrenciation desvariables et des comportements dans lespace.

    C'est Cliff et Ord qu'on doit, aprs une srie d'articles la fin des annes 60 et au dbut

    des annes 70, un ouvrage prsentant de manire synthtique l'tat des savoirs en statistique eten conomtrie spatiales (1973). Aprs cette phase initiale de reconnaissance, on assiste lafin des annes 70 et au dbut des annes 80 au raffinement du cadre original d'analyse de Cliff

    et Ord et plus particulirement au dveloppement de la thorie de l'estimation et des tests(Ord, 1975 ; Haining, 1978 ; Anselin, 1988a). Un certain nombre d'ouvrages rendent compte

    de ces dveloppements : Cliff et Ord (1981), Upton et Fingleton (1985), Griffith (1988a),Haining (1990), Cressie (1993), Jayet (1993), Bailey et Gatrell (1995), Fotheringham,Brundson et Charlton (2000).

    Lobjectif de cet article est de prsenter les diverses faons permettant de modliser

    lautocorrlation et lhtrognit spatiales ainsi que les procdures destimation et

    dinfrence adaptes aux modles incorporant ces deux effets.Larticle est divis en deux parties. Cette premire partie est consacre au problme de

    lautocorrlation spatiale alors que la seconde portera sur le problme de lhtrognitspatiale.

  • 8/7/2019 ECONOMETRIE SPATIALE

    4/45

    - 4 -

    Data of geographic units are tied together, like bunches of grapes, notseparate, like balls in an urn. Of course, mere contiguity in time and spacedoes not of itself indicate lack of independence between units in a relevantvariable or attribute, but in dealing with social data, we know that by virtue of

    their very social character, persons, groups and their characteristics areinterrelated and not independent. Sampling error formulas may yet bedeveloped which are applicable to these data, but until then the older formulasmust be used with great caution. Likewise, other statistical measures must be

    carefully scrutinized when applied to these data (Stephan, 1934)

    ECONOMETRIESPATIALE

    1. Autocorrlation spatiale

    INTRODUCTION

    Jusqu rcemment, les techniques permettant de spcifier, destimer et de tester laprsence de lautocorrlation spatiale dans les modles conomtriques taient principalement

    exposes dans les revues spcialises et appliques des problmes dconomie rgionale,spatiale ou urbaine. Par exemple, Griffith (1981), Anselin et Can (1986), Griffith et Can

    (1996), ont abord le traitement de lautocorrlation spatiale dans ltude des fonctions dedensit urbaines. Lintrt de sa prise en compte dans les modles hdoniques de priximmobiliers a t prsent par Can (1990, 1992), Can et Megboluge (1997), Pace et Gilley

    (1997) alors que Florax (1992), Anselin, Varga et Acs (1997, 1998) et Varga (1998) onttudi les externalits spatiales dinformation dues la recherche universitaire et la R&D.

    Plus rcemment cependant, les mthodes de lconomtrie spatiale ont t appliques

    dautres sujets tels que lanalyse de la demande (Case, 1991), lconomie internationale(Aten, 1996, 1997), lconomie publique (Case et al., 1993 ; Brueckner, 1998), lconomie

    rurale (Benirschka et Binkley, 1994), ou encore les phnomnes de croissance et deconvergence (Rey and Montouri 1999 ; Fingleton 1999 ; Baumont et al., 2000a, 2000b). Cesmthodes sont en effet potentiellement applicables toutes les tudes empiriques ncessitant

    lutilisation de donnes spatiales.

    Deux raisons principales peuvent tre attribues au regain dattention port la prise encompte de lautocorrlation spatiale. La premire, d'ordre thorique, est le dveloppement denouveaux courants prenant en compte les interactions conomiques. Ainsi la Nouvelle

    Economie Gographique met laccent sur les externalits spatiales, les conomiesdagglomration ou toutes autres formes deffets de dbordement. Les techniques de

    lconomtrie spatiale peuvent galement tenir compte dautres types dinteractions entre lesagents telles que les normes sociales ou les effets de voisinage. La deuxime raison, d'ordreempirique, est la disponibilit croissante des donnes spatialises et le fort dveloppement

    actuel des logiciels de Systmes dInformation Gographiques (SIG).

  • 8/7/2019 ECONOMETRIE SPATIALE

    5/45

    - 5 -

    Plusieurs aspects sont abords dans cet article. Lautocorrlation spatiale est formalise partir de la notion de matrice de poids et donne lieu des coefficients d'autocorrlationdtectant la prsence de dpendance spatiale dans une srie statistique (section 1). Sa

    modlisation conomtrique seffectue grce diverses formes fonctionnelles (section 2) quincessitent des mthodes d'estimation et d'infrence adaptes. Les mthodes d'estimation les

    plus utilises sont la mthode du maximum de vraisemblance, la mthode des variablesinstrumentales ou celle des moments gnraliss (section 3). Les mthodes d'infrence, engnral bases sur le principe du maximum de vraisemblance, servent tester la prsence de

    lautocorrlation spatiale dans les modles et dterminer la forme de cette dernire. Uneillustration de ces techniques est fournie travers lexemple de la convergence entre les

    rgions europennes (section 4).

    1. L'AUTOCORRELATION SPATIALE : DE QUOI SAGIT-IL ?

    Ds 1914, Student suspectait la prsence d'une relation entre diffrentes observations

    gographiques, une ide qui entrane l'abandon de l'hypothse statistique fondamentaled'observations indpendantes. Ce phnomne, appel autocorrlation spatiale, peut tre reli diffrentes sources (paragraphe 11). La spcification de lautocorrlation spatiale ncessite

    des outils destins modliser linterdpendance entre les rgions, savoir la matrice depoids et les oprateurs spatiaux (paragraphe 12), ces outils permettant alors de tester la

    prsence dautocorrlation spatiale dans une srie spatiale univarie, laide de la statistiqueglobale de Moran (paragraphe 13).

    11. Dfinition et sources de l'autocorrlation spatiale

    L'autocorrlation spatiale a pour point de dpart la constatation selon laquelle lesobservations spatialises en coupes transversales ne sont pas indpendantes. On dfinitl'autocorrlation spatiale comme la corrlation, positive ou ngative, d'une variable avec elle-

    mme provenant de la disposition gographique des donnes. Sur une carte :1/ une autocorrlation spatiale positive se traduit par le regroupement gographique

    d'observations de classe voisine : des lieux proches se ressemblent davantage que les lieuxloigns.2/ une autocorrlation spatiale ngative se traduit par le regroupement gographique

    dobservations dissemblables : des lieux proches sont plus diffrents que des lieux loigns.3/ une absence dautocorrlation spatiale indique que la rpartition spatiale des

    observations est alatoire : aucune relation nexiste entre la proximit des lieux et leur degr

    de ressemblance.Dtecter de l'autocorrlation spatiale dans une srie spatiale donne alors une information

    supplmentaire par rapport aux statistiques traditionnelles (telles que la moyenne ou lcart-type) sur la faon dont les diffrentes valeurs sont disposes gographiquement et permet de

    dcrire la nature et le degr de linterdpendance spatiale de la structure (Griffith, 1992b).

    Lorsquil y autocorrlation spatiale pour une variable, cela signifie quil y a une relation

    fonctionnelle entre ce qui se passe en un point de l'espace et ce qui se passe ailleurs. Tobler(1979) l'avait dj soulign en suggrant la premire loi de la gographie suivante :

    Everything is related to everything else, but closer things more so

  • 8/7/2019 ECONOMETRIE SPATIALE

    6/45

    - 6 -

    Les concepts de proximit et de distance traduisant cette ide seront pris en compte travers lutilisation de matrices de poids. Lautocorrlation spatiale diffre donc delautocorrlation temporelle. Cette dernire est en effet unidirectionnelle puisque seul le pass

    influence le futur. En revanche, lautocorrlation spatiale est multidirectionnelle puisque tout est reli tout . Cette interdpendance gnralise a en particulier pour consquence

    de complexifier les mthodes de traitement de lautocorrlation spatiale. Par exemple,certaines mthodes destimation valables pour les sries temporelles ne sont pas directementtransposables au cas spatial (voir section 3).

    Lautocorrlation spatiale a deux sources principales.

    1/ L'autocorrlation spatiale peut provenir du fait que les donnes sont affectes par desprocessus qui relient des lieux diffrents et qui sont lorigine dune organisation particuliredes activits dans lespace.

    Par exemple, la diffusion dun phnomne (comme la diffusion technologique) partir d'unou de plusieurs lieux d'origine implique que la frquence ou l'intensit de la mesure de ce

    phnomne dpend de la distance l'origine. Aux localisations proches les unes des autres, et

    donc des distances comparables de l'origine, seront donc associes des frquences similairespour le phnomne tudi. Les processus dinteractions peuvent galement tre la source de

    lautocorrlation spatiale : les vnements ou les circonstances en un lieu donn affectent lesconditions en d'autres lieux si ces derniers interagissent d'une manire ou d'une autre, par des

    mouvements de biens, de personnes, de capitaux, des externalits spatiales ou toutes lesformes de comportements o un acteur conomique ragit aux actions d'autres acteurs.2/ Lautocorrlation spatiale peut galement provenir d'une mauvaise spcification du

    modle, comme des variables omises spatialement autocorrles d'une forme fonctionnelleincorrecte, de donnes manquantes ou d'erreurs de mesure. Elle est alors considre commeun outil de diagnostic et de dtection dune mauvaise spcification du modle.

    Finalement, lautocorrlation spatiale mesure donc le degr auquel un attribut en unelocalisation est similaire aux attributs des localisations voisines. Il est noter que leslocalisations dans lespace se divisent en trois catgories. Il peut sagir tout dabord de pointsreprsentant par exemple des localisations de magasins, daires urbaines Ces points sont

    souvent mesurs par leur latitude et leur longitude. Ensuite, ces localisations peuvent tre deslignes, connectes entre elles ou non, comme un rseau routier ou fluvial. Enfin, les donnes

    sont parfois fournies pour des aires gographiques comme des rgions ou des pays. Dans tousles cas, le nombre de ces points, de ces lignes ou de ces zones est fini. Cette caractristiquepermet de distinguer entre les techniques de lconomtrie spatiale et celles de la

    gostatistique (Cressie, 1993 ; Griffith et Layne, 1999). Lconomtrie spatiale estprincipalement utilise lorsquon est en prsence d'un ensemble fini (rgulier ou non) de

    points ou de zones relis entre eux par des relations de voisinage. La gostatistique concerneessentiellement les donnes issues dun processus spatial sous-jacent continu sur lespacetudi et est donc dun intrt moindre pour ltude de donnes socio-conomiques. Cet

    article porte uniquement sur les techniques de lconomtrie spatiale.

    12. Les matrices de poids et les oprateurs spatiaux

    Puisque les units spatiales sont en gnral interdpendantes, il faut considrer les

    positions relatives des observations les unes par rapport aux autres en plus de leursdimensions et de leurs structures. Pour cela, on doit spcifier la topologie du systme spatial

    en construisant une matrice de poids. Ces matrices sont exognes, elles sont dfinies a prioripar le modlisateur compte tenu de sa connaissance sur les relations et interactions entre les

  • 8/7/2019 ECONOMETRIE SPATIALE

    7/45

    - 7 -

    units spatiales. Elles ne contiennent donc pas dlments estimer. Les matrices de poids seclassent en deux grandes catgories : les matrices de contigut (paragraphe 121) et lesmatrices de poids gnralises (paragraphe 122). Les matrices de poids permettent alors de

    dfinir la notion doprateur spatial ou de variable spatiale dcale, notion principale utilisepour la modlisation conomtrique (paragraphe 123).

    121. Les matrices de contigut

    Dfinissons la contigut entre deux rgions par le fait qu'elles ont une frontirecommune. Une matrice de contigut d'ordre 1 est une matrice carre, symtrique, ayant

    autant de lignes et de colonnes qu'il y a de zones gographiques (N) et o chaque terme wij estdfini comme suit :

    wij =

    sinon0

    1ordrel'contigussontetrgionslessi1 ji[1.1]

    Par convention, une rgion n'est pas contigu avec elle-mme : wii = 0 i. Si l'on dsireconnatre le nombre de rgions contigus une rgion i, il suffit de calculer la somme deslments de la ligne i de la matrice de contigut soit :

    =

    =N

    j

    iji wL1

    [1.2]

    Le nombre total de liens existant dans le systme rgional est alors gal :

    ==N

    j

    iLA12

    1 [1.3]

    Cette notion de contigut peut tre gnralise : on dira que deux rgions i et j sontcontigus l'ordre k si k est le nombre minimal de frontires traverser pour aller de i j. Il

    est noter que la matrice de contigut lordre k nest pas gale la matrice de contigut lordre 1 leve la puissance k. Cette opration produirait en effet des routes circulaires (des routes qui passent plusieurs fois par une mme rgion) et des chemins redondants

    (des rgions qui sont dj contigus lordre k 1 sont encore comptabiliss lordre k).Blommestein (1985), Blommestein et Koper (1992) et Anselin et Smirnov (1996) ont

    dvelopp des algorithmes permettant de passer dune matrice de contigut lordre 1 une

    matrice de contigut dordre quelconque.

    122. Les matrices de poids gnrales

    Dans les matrices de poids gnrales, chaque lment reprsente l'intensit del'interaction entre les deux rgions, intensit qui nest plus forcment relie la contigut.Dans ce cas, les matrices de poids ne sont pas ncessairement symtriques, ce qui est

    davantage appropri lorsque les relations tudies sont des relations de diffusion ou desrelations de type centre - priphrie. Les proprits de certaines matrices de poids ont t

    systmatiquement tudies par Bavaud (1998).

  • 8/7/2019 ECONOMETRIE SPATIALE

    8/45

    - 8 -

    Une premire possibilit consiste utiliser des matrices de distance. On suppose dans cecas que lintensit de linteraction entre 2 rgions i et j dpend de la distance entre lescentrodes de ces rgions ou entre les capitales de ces rgions1. Plusieurs indicateurs peuvent

    tre utiliss selon la dfinition de la distance : distance vol doiseau, distance par routesOn peut bien sr gnraliser aux temps de transport ou des indices daccessibilit plus

    gnraux. Diverses formes fonctionnelles sont galement disponibles, les plus utilises tantla fonction exponentielle inverse [1.4] ou une fonction de linverse de la distance [1.5]. Si dijdsigne la distance entre la rgion i et la rgion j, les lments de la matrice de distance pour

    ces deux diffrents cas sont dfinis par :

    ijd

    ijew

    = [1.4]

    wij =

    = v et

    22 / vu = .Linteraction spatiale implique par [2.15] est encore plus limite que dans [2.14] car elle ne

    concerne que les voisins de premier et de second ordre contenus dans les lments non nuls deWW. Lhtroscdasticit est toujours une consquence sauf si toutes les localisations ont lemme nombre de voisins et des poids identiques. Toutefois, il sagit dune situation exclue

    par les hypothses ncessites pour une tude asymptotique du modle (Kelejian et Robinson,1993).

  • 8/7/2019 ECONOMETRIE SPATIALE

    15/45

    - 15 -

    23. Autres processus

    Les modles prsents dans les paragraphes prcdentes nincluent quun seul type de

    dpendance spatiale (variable endogne dcale ou autocorrlation des erreurs) et quun seulordre de dpendance. Diffrents auteurs ont propos des processus beaucoup plus gnraux

    combinant tous ces aspects. La forme la plus gnrale est la forme autorgressive moyennemobile (Spatial AutoRegressive Moving Average ou SARMA(p,q)) propose par Huang(1984) :

    uuWuWuW

    yWyWyWy

    qq

    ppi

    ++++=++++=

    ...

    ...

    2211

    221

    [2.16]

    Wi est la matrice de poids associe au ime ordre de contigut. On pourrait envisager de la

    mme un processus o les erreurs suivent un processus spatial autorgressif dordre q

    ( Spatial AutoRegressive AutoRegressive) ou SARAR(p,q)).Les matrices W

    ine se rfrent pas forcment diffrents ordres de contigut. Ainsi, pour les

    rgions europennes, Rietveld et Wintershoven (1999) cherchent savoir si linterdpendance

    entre rgions dun mme pays est diffrente de linterdpendance entre rgions de paysdiffrents. Ils estiment donc un SARAR (2,2) o les lments de la matrice W1 sont gaux 1

    si les rgions dun mme pays sont contigus et 0 sinon et o les lments de la matrice W2sont gaux 1 si les rgions de pays diffrents sont contigus et 0 sinon.

    Anselin (1980, 1988a) a tudi les proprits du processus SARAR(1,1) contenant unevariable endogne dcale et une autocorrlation des erreurs. Formellement, le modle

    sexprime comme une combinaison de [2.2] et de [2.7], avec des poids diffrents :

    uWXyWy

    +=++=

    2

    1 [2.17]

    Le premier terme multipli par W2 donne : W2y =W2W1y + W2X+ W2. Il reste soustraire l'quation obtenue de l'quation initiale :

    uXWXyWWyWyWy +++= 21221 [2.18]

    Il sagit dun modle de Durbin spatial tendu avec des contraintes linaires supplmentaires.

    Lorsque W1= W2= W, le modle devient :

    uWXXyWWyy +++= )( [2.19]

    Comme le modle est suridentifi pour , Anselin (1980) a donn les conditions et restrictionspermettant une identification de tous les paramtres3.

    Thoriquement, ce problme didentification est important mais pratiquement, il est

    dune porte moindre car en gnral, on retient rarement un modle avec les deux typesd'effets spatiaux, on cherche modliser la dpendance spatiale, soit par l'autocorrlation des

    erreurs, soit par une variable spatiale autorgressive, et non les deux. Anselin et Bera (1998)considrent dailleurs que ces processus dordre suprieur sont le rsultat dune matrice de

    3 Le modle SARMA (1, 1) ne souffre pas de ce problme.

  • 8/7/2019 ECONOMETRIE SPATIALE

    16/45

    - 16 -

    poids mal spcifie et non de processus gnrateurs des donnes ralistes. Par exemple, si lamatrice de poids du modle autorgressif sous-estime la vraie interaction spatiale dans lesdonnes, il y aura une autocorrlation spatiale rsiduelle des erreurs. Cela peut mener

    estimer un processus dordre suprieur alors que seule une matrice de poids bien spcifieserait ncessaire.

    24. Extensions : spcification de lautocorrlation spatiale dans les modles de panel etdans les modles variables qualitatives

    Rcemment, les dveloppements en conomtrie spatiale ont particulirement port sur

    lincorporation de lautocorrlation spatiale dans les modles de panel et les modles variables qualitatives.

    241. Les modles spatio-temporels

    L'introduction de la dimension temporelle accrot considrablement le nombre de cas qui

    peuvent tre pris en compte dans les modles conomtriques spatiaux. Supposons quil y aitN rgions, T priodes de temps et donc NT observations yit. Considrons tout dabord le

    modle le plus simple (rgression ordinaire) o lon suppose des comportements uniformespour tous les individus :

    itit

    K

    k

    itkitkitxxy +=+=

    =

    '

    1

    , [2.20a]

    it iid(0,) i,t [2.20b]

    x'it est le vecteur-ligne des observations pour une unit i au temps tde dimension (1,K) et est

    le vecteur des K paramtres inconnus. Les rgresseurs exognes peuvent tre retards dans letemps ou dcals dans lespace.

    Ces observations peuvent tre regroupes par priode temporelle. Notons yt le vecteur de lavariable explique, de dimension N qui regroupe les Nobservations de yit pour la priode t. Xt

    dsigne la matrice (N,K) des observations des variables explicatives au temps t. t est levecteur des Nerreurs au temps t. Le modle se rcrit alors de la faon suivante :

    ttt Xy += [2.21]

    Un modle gnral incorporant les dpendances spatiale et temporelle dans la variable

    explique pourrait scrire de la faon suivante :

    ttttttXWyWyyy ++++= 11 [2.22]

    Dans cette spcification, pour une rgion i une priode t, la variable explique dpend de savaleur la priode prcdente (yt-1), de la valeur des variables expliques des rgions voisines

    la mme priode (Wyt) et de la valeur des variables expliques des rgions voisines la

    priode prcdente (Wyt-1). Des structures similaires peuvent tre spcifies pour lerreur t.Des modles plus simples peuvent tre drivs de [2.22]. Un cas particulier intressant est

    le modle o = = 0 (Upton et Fingleton, 1985) :

    tttt XWyy ++= 1 [2.23]

  • 8/7/2019 ECONOMETRIE SPATIALE

    17/45

    - 17 -

    Au contraire des modles prcdents, lestimation des paramtres de [2.23] peut tre base surles moindres carrs ordinaires et cest un modle qui a t utilis pour modliser la diffusiondun phnomne. Par exemple, Dubin (1995, 1997) tudie la diffusion dune innovation dans

    le cadre dun modle LOGIT en donnes de panel : la probabilit dadoption dune innovationpar une firme dpend entre autres de la proximit de firmes qui ont adopt cette innovation

    la priode prcdente.

    La dpendance spatiale sous la forme dune variable endogne dcale ou sous la forme

    dune autocorrlation spatiale des erreurs peut aussi tre introduite dans dautres modles depanel, tels que le modle SUR ou le modle erreurs composes. En revanche, la

    combinaison des effets fixes et de lautocorrlation spatiale nest pas possible. En effet,lestimation de modles spatiaux ncessite le caractre asymptotique dans le domaine spatial

    ( N ) alors que les effets fixes (c'est--dire une variable muette pour chaque localisation)ncessitent lestimation de N paramtres. Il ny a donc pas destimateurs convergents et leseffets fixes sont incompatibles avec les processus spatiaux ; une spcification erreurs

    composes doit tre considre.

    Considrons par exemple le modle SUR spatial dans lequel N > T(Arora et Brown,1977 ; Hordijk, 1979, Anselin, 1988a, 1988c). Les paramtres sont constants dans l'espacemais variables pour chaque priode. Le modle s'crit alors de la faon suivante :

    ittititxy += ' [2.24]

    Dans ce modle, x'it est le vecteur-ligne des observations pour une unit i au temps t de

    dimension (1,Kt) et t est le vecteur des Kt paramtres. Si lon regroupe les N individus pour lapriode t, le modle devient :

    tttt Xy += [2.25]

    Regroupons prsent les T priodes, le nombre total de paramtres devient K* = Kt et lemodle scrit :

    += XY [2.26]

    o Y est le vecteur (NT,1) des observations de la variable dpendante, X est la matrice bloc-

    diagonale de dimension (NT,K*) contenant les Xt, est le vecteur (K*,1) des paramtres et est le vecteur (NT,1) des erreurs. Pour chaque quation, il est possible dtre confront unproblme dautocorrlation spatiale des erreurs :

    ttttuW += [2.27]

    Les hypothses suivantes sont poses sur les erreurs rsiduelles ut:

    E(ut) = 0 t [2.28]

    E(utut') = tIN [2.29a]E(uit,ujs) = 0 t,s i j (absence d'autocorrlation croise) [2.29b]

    E(uit,uis) = tsi E(utus') =tsIN t, s (covariance temporelle) [2.29c]

  • 8/7/2019 ECONOMETRIE SPATIALE

    18/45

    - 18 -

    Les erreurs compltes u ont donc les proprits suivantes : E(u) = 0 et E(uu) = NI , o est la matrice d'lment gnrique : [ts]. Une application rcente de ce modle est celle deRey et Montouri (1999) qui ont estim un modle SUR spatial pour tudier la convergence

    entre les rgions amricaines pour 2 sous-priodes.

    242. Les modles variables qualitatives

    La prise en compte de lautocorrlation spatiale dans les modles de choix discrets, dans

    les modles censurs ou slection dchantillon constitue aujourdhui un thme de rechercheactif, aprs avoir longtemps t ignor, compte tenu de la complexit des procduresdestimation de ces modles. Les problmes impliqus par la prise en compte de

    lautocorrlation spatiale dans les modles variables qualitatives peuvent tre illustrs

    partir du modle de choix discret avec la variable latente *iy :

    iiixy += '* [2.30]

    o i est une variable alatoire pour laquelle une distribution donne est suppose (normale

    pour le modle PROBIT, logistique pour un modle LOGIT). *i

    y nest pas observe mais on

    observe :

    iy = 1 lorsque*

    iy 0 [2.31a]

    iy = 0 lorsque *iy < 0 [2.31b]

    Lautocorrlation spatiale peut tre introduite dans ce modle sous la forme dune

    variable endogne dcale ou dune autocorrlation spatiale pour le terme derreur i . Desproblmes similaires apparaissent pour ces deux cas. Considrons par exemple uneautocorrlation spatiale des erreurs :

    uWI1

    )(= [2.32a]

    =j

    jiji u [2.32b]

    o ij est un lment de (I - W)-1. Pour pouvoir calculer la probabilit que iy = 1 pour

    chaque observation : )()1( ' iii xPyP

  • 8/7/2019 ECONOMETRIE SPATIALE

    19/45

    - 19 -

    dimensions, dont la matrice des variances-covariances contient le paramtre autorgressif (McMillen, 1992 ; Jayet, 1993). Des problmes similaires apparaissent ds lors que

    lautocorrlation spatiale est introduite dans un modle TOBIT 2 (McMillen, 1995a).

    3. ESTIMATION DES MODELES SPATIAUX

    Lorsque lautocorrlation spatiale est modlise, la mthode des moindres carrsordinaires (MCO) nest plus adapte : les estimateurs obtenus par cette mthode ne sont pasconvergents lorsquil y a une variable endogne dcale et ils sont inefficients en prsence

    dune autocorrlation spatiale des erreurs (paragraphe 31). Dautres mthodes destimationsont alors ncessaires pour trouver des estimateurs convergents et efficients. La mthode la

    plus couramment utilise est celle du maximum de vraisemblance information complte(paragraphe 32) mais il est galement possible davoir recours la mthode des variablesinstrumentales ou celle des moments gnraliss (paragraphe 33).

    31. La non-convergence des MCO et ses consquences

    Prenons le modle spatial le plus gnral, incluant la fois une variable endogne dcaleet une autocorrlation spatiale des erreurs (modle [2.17]) :

    uW

    yWXy

    +=++=

    2

    1

    u iid(0,I)

    De cette criture, il sensuit que 111

    1 )()( += WIXWIy et que uWI 12 )(

    = .Par consquent, la matrice des variances-covariances de lerreur est :

    ( ) 1'21

    2 )()(')( == WIWIEV [3.1]

    La corrlation entre la variable explicative W1y et lerreur scrit :

    ')(')()'( 1111

    111 += WIWXWIWEyWE [3.2a]

    )'()()'( 1111 EWIWyWE= [3.2b]

    1'

    2

    1

    2

    1

    111 )()()()'( = WIWIWIWyWE [3.2c]

    Cette dernire expression est non nulle en gnral, les lments de la variable endogne

    dcale sont corrls avec ceux des erreurs et les paramtres du modle [2.17] ne peuventdonc pas tre estims dune faon convergente par les MCO (Kelejian et Prucha, 1998). Cersultat contraste avec une proprit de sries temporelles o les estimateurs des MCO restent

    convergents en prsence dune ou de plusieurs variables retardes tant que les erreurs ne sontpas corrles.

    En revanche, pour le modle spatial autorgressif [2.2], les estimateurs des MCO ne sont

    pas convergents car la variable endogne dcale Wy est corrle avec lerreur , quelle que

    soit la distribution de cette erreur : si 0= et W1 = W dans [3.2c], alors1

    )()'(

    = WIWWyE . La matrice ( )1

    WI tant une matrice pleine et nontriangulaire, le dcalage spatial pour une observation donne i, (Wy)i, nest pas seulement

  • 8/7/2019 ECONOMETRIE SPATIALE

    20/45

    - 20 -

    corrl avec le terme derreur en i, mais aussi avec tous les termes derreurs de toutes leslocalisations.

    Si lon considre prsent le modle erreurs autorgressives, lestimateur de par les

    MCO est sans biais mais inefficient puisque les erreurs ne sont pas homoscdastiques. Il faut

    donc utiliser une autre mthode destimation que les MCO. La solution thorique dans ce casconsiste dans lapplication des moindres carrs quasi-gnraliss (MCQG). Cette procdure

    nest pas applicable au cas spatial puisque lestimateur de par les MCO nest pasconvergent (Anselin, 1988a, chap.6). Sous des hypothses similaires celles utilises ici,

    Kelejian et Prucha (1997) montrent de plus que les estimateurs obtenus par la mthode desvariables instrumentales non linaire applique au modle spatial de Durbin [2.11] nest pas

    non plus convergente, lune des conditions donnes par Amemiya (1985) ntant pas vrifie.

    Finalement, pour aboutir des estimateurs convergents et efficients des paramtres des

    modles spatiaux, il faut donc utiliser dautres mthodes destimation, la plus utiliseaujourdhui restant la mthode destimation par le maximum de vraisemblance.

    32. Estimation par le maximum de vraisemblance

    La premire tude de lestimation des modles spatiaux par le maximum devraisemblance a t donne par Ord (1975). Les conditions pour la convergence, lefficience

    et la normalit asymptotique des estimateurs du maximum de vraisemblance peuvent tredrives du cadre gnral de Heijmans et Magnus (1986a, 1986b) pour le modle spatialautorgressif et de celui de Magnus (1978) pour le modle erreurs autorgressives. Mises

    part les restrictions habituelles sur la variance et les moments dordre suprieur des variablesdu modle, ces conditions se traduisent par des contraintes sur les poids spatiaux et sur

    lespace des paramtres des coefficients spatiaux (Anselin et Kelejian, 1997 ; Kelejian etPrucha, 1998, 1999a, 1999b ; Pinkse et Slade, 1998 ; Pinkse, 1998, 1999). En pratique, cesconditions sont largement satisfaites par les poids bass sur la contigut mais pas

    ncessairement pour les poids gnraux.Sous lhypothse de normalit des rsidus, on peut driver la fonction de log-

    vraisemblance dans le cas gnral [2.17] ce qui permet de dterminer lespace des paramtres

    de et de . Les mmes principes permettent de dterminer la forme de la fonction de log-vraisemblance pour les diffrents modles de panel (paragraphe 321). Les procduresdestimation faisant appel la fonction de vraisemblance concentre peuvent tre illustres partir de deux cas particuliers : modle autorgressif et erreurs autocorrles (paragraphe

    322). Dans tous les cas cependant, lvaluation du jacobien pose problme (paragraphe 323)

    321. La fonction de vraisemblance dans le cas gnral

    Pour le modle gnral [2.17], le point de dpart est lhypothse de normalit des termes

    derreur. La fonction de vraisemblance pour le vecteur normal multivari u Nid(0,I) est :

    = uuuL N '

    2

    1exp)2()(

    2

    2/2

    [3.3]

    Dans le modle gnral, ))(( 12 XyWyWIu = , le jacobien de la transformation est :

    ( )21/det WIWIyuJ == [3.4]

  • 8/7/2019 ECONOMETRIE SPATIALE

    21/45

    - 21 -

    La fonction de log-vraisemblance de y scrit donc :

    uuWIWINN

    yL '2

    1lnln)ln(

    2)2ln(

    2),,(ln

    221

    2

    ++= [3.5]

    De cette expression, on dduit lespace des paramtres de et . Soient max la valeur propre

    positive maximale et min la valeur propre ngative la plus grande en valeur absolue de W.

    Alors 1WI et 2WI sont positifs si lingalit suivante est respecte :

    maxmin 11 -1 (Anselin,1982 ; Anselin, 1988a, chap.6). Si les erreurs suivent un processus moyenne mobile [2.12],

    doit tre compris dans lintervalle : ] [minmax 1;1 .

    On trouvera dans Anselin (1988a, 1988b), les expressions du score et de la matricedinformation pour le modle gnral comportant une variable endogne dcale, une

    autocorrlation spatiale des erreurs et des rsidus htroscdastiques. Le systme dquationsrsultant des conditions du premier ordre nadmet pas dans ce cas de solution analytique. Enrevanche, les systmes correspondant aux modles plus simples [2.2] et [2.7] admettent des

    solutions issues des conditions du premier ordre permettant de construire une fonction de log-vraisemblance concentre.

    Dans le cadre des modles de panel, les mmes principes peuvent tre mobiliss pourdterminer la forme de la fonction de vraisemblance. Considrons ainsi le modle SUR spatial

    avec autocorrlation spatiale des erreurs [2.25] :

    yt= Xtt+tt= tWt+ ut

    avec : E(utut') = t.INet E(utus') =ts.IN. Notons Bt= (I - tW)1 pour simplifier les critures.

    On a alors : t= Btut. Par consquent :

    E(ts') = E(Btutus'Bs') =tsBtBs' [3.7] = E(') = B(I)B'. [3.8]

    Dans ces dernires expressions, est le vecteur d'erreur complet de dimension (NT,1) et B estla matrice bloc-diagonale carre de dimension (NT,NT) contenantles Bt.

    L'estimation de ce modle ne peut se faire partir de la mthode des MCQG car cette

    mthode n'est pas efficiente. En effet, il n'existe pas d'estimateurs convergents pour les

    paramtres t. La solution consiste donc en l'application de la mthode du maximum devraisemblance, sous l'hypothse de normalit des erreurs rsiduelles ut. La fonction de log-vraisemblance pour Yest :

    LnL(Y1,...,T,1,...,T)= -(NT/2)ln(2) - (1/2)ln - (1/2)(y - X)'-1(y - X) [3.9]

    Avec : = B( IN)B' = NB; ln = Nln+2lnB. L'annulation desdrives premires forme un systme non linaire n'admettant pas de solutions analytiques.Ce systme doit donc tre rsolu par des mthodes numriques.

  • 8/7/2019 ECONOMETRIE SPATIALE

    22/45

    - 22 -

    De la mme faon, on pourra trouver dans Anselin (1988a), les expressions des fonctionsde log-vraisemblance pour le modle SUR spatial avec variable endogne dcale et pour lemodle avec erreurs composes et autocorrlation spatiale.

    322. Deux cas particuliers

    En pratique, lestimation des modles spatiaux peut seffectuer partir de lamaximisation de la fonction de log-vraisemblance complte grce diverses techniques

    doptimisation non-linaires. Dans le cas de modles plus simples pourtant, comme le modleautorgressif et le modle erreurs autocorrles, lestimation seffectue partir de la

    fonction de log-vraisemblance concentre. Le principe de la mthode est de rsoudre unepartie des quations associes aux conditions du premier ordre et dintroduire ensuite lessolutions obtenues dans la fonction de log-vraisemblance. On obtient une fonction de log-

    vraisemblance simplifie, concentre qui ne dpend plus que de quelques paramtres, un dansle meilleur des cas. Ds lors, on peut trouver des estimations de ces paramtres par balayage,

    cest--dire en valuant la fonction de log-vraisemblance pour un petit intervalle de ces

    paramtres. On trouve alors un maximum local qui correspond la solution (Upton etFingleton, 1985).

    1/ Dans le cas du modle autorgressif [2.2], la fonction de log-vraisemblance est construite

    en appliquant ce cas particulier la formule gnrale :

    2

    )'()'()ln(

    2)2ln(

    2ln

    XWyyXWyyNNWIL

    = [3.10]

    A partir des conditions de premier ordre usuelles, les estimateurs pour et 2sont obtenuscomme :

    yWIXXXML

    )(')'( 1 = [3.11]

    N

    XWyyXWyyMLML

    ML

    )()'( 2

    = [3.12]

    Conditionnellement , [3.11] et [3.12] sont les estimateurs des MCO appliqus aumodle filtr [2.3]. La substitution de ces estimateurs dans la fonction de log-vraisemblance

    aboutit la fonction de log-vraisemblance concentre qui ne dpend plus alors que de :

    WIN

    NCL LL

    c

    +

    =)()'(

    ln[2

    ln 00 [3.13]

    O )2/()2ln()2/( NNC = et oL et0 sont respectivement les rsidus des rgressions

    de y sur X et de Wy sur X. Une estimation pour est alors obtenue par une optimisationnumrique de la fonction de log-vraisemblance concentre.La matrice des variances-covariances asymptotique est donne par linverse de la matrice

    dinformation :

    ( )1

    4

    '

    20

    )(

    0

    ''

    )(

    ''

    ][]'[)()(

    ),,(AsyV

    ++

    =

    NWtr

    XXXWX

    WtrXWXXWXWWWtrWtr

    A

    A

    AAAAAAA

    [3.14]

  • 8/7/2019 ECONOMETRIE SPATIALE

    23/45

    - 23 -

    Dans [3.14], WA = W(I - W)-1. On note que la covariance entre et la variance est nulle

    comme dans le modle standard, mais pas entre et la variance, la matrice nest donc pasbloc-diagonale.

    2/ Dans le cas de lautocorrlation spatiale des erreurs, la fonction de log-vraisemblance

    prend la forme suivante :

    2

    )()()''()ln(

    2)2ln(

    2lnln

    1

    XyXyNNWIL

    =

    [3.15]

    )( est tel que 122 )]()'[()'()( == WIWIE .Les conditions de premier ordre fournissent donc lestimateur des MCG pour et 2 ,

    conditionnellement :

    yXXXML

    111 )('])('[ = [3.16]

    N

    XyXymlml

    ML

    ][)(]'[

    12

    =

    [3.17]

    Si est connu, lestimateur du maximum de vraisemblance est quivalent celui des MCOappliqu aux variables filtres de [2.10]4.

    La substitution de [3.16] et [3.17] dans la fonction de log-vraisemblance [3.15] aboutit la fonction de log-vraisemblance concentre suivante :

    WIN

    XyXyNCL mlml

    c

    +

    =

    )()()'(ln

    2ln

    1

    [3.18]

    La matrice des variances-covariances asymptotique pour les estimateurs est similaire la

    forme gnrale de Magnus (1978) et Breusch (1980) et est bloc-diagonale pour et :

    +

    =

    42

    2

    2

    '2

    2

    20

    )(

    0)()'('

    0

    )(0)()(

    ),,(Asy

    NWtr

    XWIWIX

    WtrWWtrWtr

    V

    B

    B

    BBB

    [3.19]

    o 1)( = WIWWB .

    323. Problmes pratiques lis lestimation par le maximum de vraisemblance

    Lestimation des modles spatiaux par le maximum de vraisemblance ncessite la

    manipulation de matrices dont la dimension est gale au nombre dobservations. Par exemple,pour le modle autorgressif et le modle erreurs autorgressives, le calcul de la matrice des

    variances-covariances ncessite lvaluation respectivement des matrices WA = W(I - W)-1 et

    WB = W(I - W)-1 qui sont des matrices carres, de dimension N, pleines et qui ne se prtent

    4 Si lon considre la forme moyenne mobile de lautocorrlation spatiale, lexpression de lestimateur des MCG

    [3.16] ncessite linversion dune matrice des variances-covariances de dimension (N,N) :121

    ]')'([)(

    +++= WWWWI . Cette complication a sans doute contribu limiter lapplication pratiquede ce modle (Sneek et Rietveld, 1998).

  • 8/7/2019 ECONOMETRIE SPATIALE

    24/45

    - 24 -

    donc pas lapplication des algorithmes de traitement des matrices contenant beaucoupdlments nuls. La taille de lchantillon dpend alors de la plus grande inverse de matricequi peut tre calcule avec une prcision numrique suffisante, prcision variable selon les

    logiciels5.

    Le problme principal de lestimation par le maximum de vraisemblance est la prsencedu jacobien dans la fonction de log-vraisemblance. Le jacobien est de la forme WI pour

    un modle autorgressif ou WI pour un modle erreurs autocorrles. Par consquent,la maximisation de la fonction de log-vraisemblance ncessite une optimisation non-linaire

    qui ncessite lvaluation du terme jacobien pour chaque nouvelle valeur de ou de .

    Mme pour des chantillons de taille modre, cela peut tre une opration lourde puisquil

    sagit de calculer le dterminant dune matrice carre de dimension N, N tant le nombredobservations. Plusieurs solutions ont t proposes dans la littrature.1/ La solution la plus ancienne pour lestimation de modles autorgressifs par le maximum

    de vraisemblance a t propose par Ord (1975). Elle consiste exploiter la dcomposition du

    jacobien en termes des Nvaleurs propres de la matrice de poids W:

    =

    =N

    i

    iWI1

    )1( [3.20]

    soit : ( )=

    =N

    i

    iWI

    1

    1lnln [3.21]

    Lavantage de cette forme simplifie apparat lors de la maximisation de la fonction de log-

    vraisemblance complte ou de la procdure de balayage de la fonction de log-vraisemblance

    concentre. Si lon utilise la formulation WI

    , il faut calculer le dterminant de WI

    chaque tape. En revanche, si lon utilise la formulation simplifie, il nest besoin de calculerquune fois pour toutes les valeurs propres de W et lvaluation chaque tape devient plusfacile. Cette proprit permet alors dcrire la fonction de log-vraisemblance complte en une

    somme dlments correspondant aux observations individuelles. Ainsi, des pseudo-

    observations sont construites pour les lments du jacobien, chaque termei1 tant

    reli une pseudo-variable i . Par exemple, pour le modle autorgressif, la fonction de log-

    vraisemblance peut tre exprime comme :

    { }

    =

    i

    iiii

    xWyyL

    2

    )(

    2

    )ln()1ln(ln

    [3.22]

    Cette formulation additive pour chaque observation est conforme bon nombre de routinesdoptimisation non-linaires. Certains auteurs fournissent ainsi des codes pour quelques

    5Pour les trs grands chantillons, mme si le calcul du ratio des coefficients leurs carts -types est impossible,linfrence asymptotique reste ralisable dans le cas derreurs autocorrles. Dans ce dernier cas en effet, la

    matrice des variances-covariances asymptotique est bloc-diagonale et les statistiques asymptotiques pour

    peuvent donc tre calcules sans connatre la prcision du paramtre autorgressif (Benirschka et Binkley,1994 ; Pace et Barry, 1996), linfrence du paramtre autorgressif tant alors base sur le test du ratio de

    vraisemblance. Cette approche nest pas applicable pour le modle autorgressif pour lequel la matrice des

    variances-covariances asymptotique nest pas bloc-diagonale. Des tests du ratio de vraisemblance doivent donctre considrs pour tout sous-ensemble de coefficients (Pace et Barry, 1997).

  • 8/7/2019 ECONOMETRIE SPATIALE

    25/45

    - 25 -

    logiciels conomtriques bass sur cette proprit (Bivand, 1992 ; Griffith, 1988b, 1993 ;Anselin et Hudak, 1992 ; Anselin et al., 1993 ; Li, 1996).Si le calcul des valeurs propres pour une matrice de poids Wasymtrique pose problme, Ord

    (1975) a donn une proprit intressante lorsque West le rsultat dune standardisation dunematrice de poids symtrique W*. Les valeurs propres de Wpeuvent se trouver en calculant les

    valeurs propres de la matrice symtrique, D1/2

    W*D1/2

    o D est une matrice diagonale, chaquelment de la diagonale principale tant gal linverse de la somme des lments de la lignecorrespondante de W.

    Cette mthode est trs largement utilise mais pour de trs grands chantillons, le calculdes valeurs propres peut devenir numriquement instable. Une variante de cette procdure a

    t propose par Anselin et Smirnov (1999) qui consiste valuer directement les coefficientsde la fonction caractristique. Les simulations effectues par les auteurs indiquent que cettemthode est la seule mthode directe capable de calculer les estimations du maximum de

    vraisemblance pour de trs grands chantillons (plus dun million dobservations).2/ Dautres techniques exploitent la structure particulire des matrices de poids contenant

    beaucoup dlments nuls. Il sagit des mthodes de factorisation de matrices qui savrent

    trs puissantes pour valuer rapidement le jacobien : la dcomposition de Cholesky pour unematrice symtrique et la dcomposition de LU sinon. Pace (1997) et Pace et Barry (1997a et

    1997b) ont dmontr que ces approches donnent des temps de calcul raisonnables pour deschantillons de dizaines de milliers dobservations. Par exemple, pour une matrice

    symtrique, la factorisation de Cholesky consiste rsoudre :

    'LLWI = [3.23]

    o L est une matrice triangulaire infrieure, le facteur de Cholesky de la matrice. Le jacobien

    est alors2

    ' LLLWI == . Puisque le dterminant dune matrice triangulaire ncessite

    uniquement les lments de la diagonale, le jacobien en forme logarithmique est :

    =

    =N

    i

    iilWI1

    )ln(2 [3.24]

    o lii sont les lments de la diagonale de L.3/ Enfin, certains auteurs approximent le jacobien par des fonctions polynomiales ou par lespuissances successives de la matrice de poids (Griffith, 1992a ; Martin, 1993 ; Griffith et

    Sone, 1995). Une approche plus rcente suggre par Barry et Pace (1999) est base sur dessimulations de Monte-Carlo et est capable de traiter des chantillons de plus dun million

    dobservations.

    33. Autres mthodes d'estimation

    Dans le modle autorgressif, le problme principal est la corrlation entre la variable

    endogne dcale et le terme derreur. Dans ce cas, la mthode des variables instrumentales at propose par Anselin (1980, 1988a), Land et Deane (1992), Kelejian et Robinson (1993)ou Kelejian et Prucha (1998). Pour le modle autorgressif, les estimateurs sont convergents

    compte tenu dun choix appropri dinstruments, ce choix dterminant aussi lefficience desestimateurs. En pratique, les variables explicatives X, stochastiques ou non, indpendantes des

    erreurs doivent ncessairement figurer dans les instruments puisquelles ne sont pas corrles

    avec les erreurs. Pour la variable endogne dcale, on pourra prendre WX comme instrumentou des dcalages dordre suprieurs.

  • 8/7/2019 ECONOMETRIE SPATIALE

    26/45

    - 26 -

    En notant Z la matrice (N,P) des instruments (avec P K + 1), lestimateur des variablesinstrumentales scrit :

    yZZZZXXZZZZXVI ')'('

    ~]

    ~')'('

    ~[ 111 = [3.25]

    avec NXyXyXZZZZXXWyXIVIV

    /)~()'~(et]~')'('~[)AsyV(,][~ 11IV === .

    Cette approche peut facilement tre tendue des structures derreurs plus complexes(Anselin, 1988a) ou un modle SUR avec variable endogne dcale. Sous des hypothsesraisonnables satisfaites lorsque les poids sont bass sur la contigut, les estimateurs des

    variables instrumentales sont convergents et asymptotiquement normaux.

    Comme la mthode des variables instrumentales ne fournit pas des estimateursconvergents pour le coefficient spatial dans le modle erreurs autocorrles, Kelejian etPrucha (1998, 1999a) ont rcemment dvelopp une approche par la mthode des moments

    gnraliss (GMM). Ils dveloppent un ensemble de conditions sur les moments permettant

    lestimation des quations pour les paramtres dans le modle erreurs autocorrles [2.7] : siu iid(0,I), les trois conditions sont les suivantes :

    0]/'[

    )'()/1(]/''[

    ]/'[

    ==

    =

    NWuuE

    WWtrNNWuWuE

    NuuE

    [3.26]

    Remplacer u par W ( tant le vecteur des rsidus des MCO), donne un systme detrois quations pour les paramtres et, .

    Les deux mthodes destimation peuvent tre combines pour estimer les paramtres du

    modle gnral [2.17] contenant la fois une variable autorgressive et une autocorrlation

    spatiale des erreurs (Kelejian et Prucha, 1998) pour obtenir des estimateurs convergents.

    Dautres mthodes destimation ont t proposes dans la littrature. Lune dentre ellesest la mthode spatiale de filtrage (Getis, 1990, 1995) qui consiste filtrer les variablesspatialement dpendantes pour les transformer en variables indpendantes. Ce filtrage

    seffectue partir des statistiques dautocorrlation spatiale locale proposes par Getis et Ord(1992, 1995). Il est alors possible d'utiliser les moindres carrs ordinaires ainsi que toutes les

    autres mesures de rgression qui sont biaises lorsqu'on utilise le maximum de vraisemblance(comme par exemple, le R). Cette approche suppose nanmoins que lautocorrlation spatialesoit systmatiquement une nuisance quil convient dliminer.

    Le cas des modles variables qualitatives incorporant de lautocorrlation spatiale a t

    abord par Case (1992), McMillen (1992, 1995a, 1995b) et Pinkse et Slade (1998). Cesmodles posent problme dans la mesure o linterdpendance implique par lautocorrlationspatiale produit une fonction de vraisemblance avec de multiples intgrales, rendant

    lestimation directe pratiquement impossible. De plus, lhtroscdasticit des erreurs estinduite lorsquon spcifie lautocorrlation spatiale par une variable endogne dcale ou une

    autocorrlation spatiale des erreurs (sauf dans un cas particulier abord par Case, 1992), lesmthodes destimation pour les modles PROBIT avec des observations dpendantes maisdes erreurs homoscdastiques proposes par Avery et al. (1983) ou Poirier-Ruud (1988) ne

    sont donc pas convergentes.

  • 8/7/2019 ECONOMETRIE SPATIALE

    27/45

    - 27 -

    Dans le cadre des modles de choix discrets, McMillen (1992, 1995b) propose dutiliser lamthode destimation EM ou Esprance - Maximisation pour les modles PROBITavec autocorrlation spatiale des erreurs ou variable endogne dcale. Cette procdure

    destimation remplace la variable discrte dpendante par lesprance de la variable latentecontinue. Le modle est ensuite estim par maximum de vraisemblance en considrant la

    variable construite comme une variable standard continue et dpendante. La procduredestimation calcul de lesprance de la variable dpendante et estimation du modle parmaximum de vraisemblance est rpte jusqu convergence et les estimations des

    paramtres obtenues sont les estimations du maximum de vraisemblance. Des simulations deMonte-Carlo effectues par McMillen (1995b) suggrent cependant quil ny a pas de

    prcision supplmentaire apporte par cette mthode pour les petits chantillons. De plus,cette mthode pose problme dans la mesure o la matrice dinformation ne peut pas tredtermine analytiquement (la fonction de vraisemblance comporte N intgrales). LeSage

    (1999) propose alors lutilisation de mthodes destimation baysiennes qui fournissent lesmmes estimations que celles donnes par la mthode du maximum de vraisemblance mais ne

    souffrent pas de ce problme. Ces mthodes ont par ailleurs t appliques aux modles avec

    variable endogne dcale [2.2] et avec autocorrlation spatiale des erreurs [2.7] par Hepple(1995a, 1995b) et LeSage (1997).

    4. LES TESTS EN ECONOMETRIE SPATIALE

    La modlisation des donnes spatialises peut seffectuer de diffrentes faons : on peutinclure des variables dcales (endognes ou exognes), une autocorrlation spatiale des

    erreurs ou estimer les modles avec diffrentes matrices de poids. Le choix entre cesdiffrentes alternatives passe par la mise en uvre de tests de spcification dont les origines

    remontent jusquau test de Moran (1950a, 1950b). Ce test est rest dans lobscurit jusqu saredcouverte par Cliff et Ord (1972) et Burridge (1980).

    Les trois grands principes de tests en conomtrie standard sont le test du multiplicateur

    de Lagrange (ou test du score de Rao (1947)), le test du ratio de vraisemblance et le test deWald. Ces tests ont galement t mis contribution dans la recherche de la spcification du

    modle. Au dbut, la littrature en conomtrie spatiale a t domine par les deux dernierstypes de tests (Brandsma et Kelletaper, 1979 ; Anselin, 1980 ; Cliff et Ord, 1981). Cependant,ils ncessitent lestimation du modle non-contraint qui doit tre estim par des mthodes

    non-linaires. Au contraire, le test du score est bas uniquement sur les rsultats du modlesous lhypothse nulle et il sagit la plupart du temps du modle linaire standard estim par

    les MCO (paragraphe 41). Durant les 15 dernires annes, de tels tests ont t dvelopps en

    particulier par Anselin (Anselin, 1988a, 1988b, 1998) et ils constituent la premire tape dansla recherche de la spcification du modle (paragraphe 42).

    41. Le test de l'autocorrlation spatiale

    Les tests de lautocorrlation spatiale peuvent se diviser en plusieurs catgories. Toutdabord, le test de Moran est le test le plus ancien et encore le plus utilis. Il vise tester

    lautocorrlation spatiale des rsidus lorsque les erreurs suivent un processus autorgressif,moyenne mobile ou la spcification de Kelejian et Robinson (paragraphe 411). Plus

    rcemment, les tests du multiplicateur de Lagrange ont t dvelopps et ils peuvent tre soitunidirectionnels lorsquune hypothse simple est teste en supposant une spcification

    correcte pour le reste du modle (paragraphe 412) , soit multidirectionnels lorsqueplusieurs types de dpendance spatiale sont tests (paragraphe 413) . La puissance et la

  • 8/7/2019 ECONOMETRIE SPATIALE

    28/45

    - 28 -

    robustesse de ces tests ont t tudies dans quelques simulations de Monte-Carlo (paragraphe414).

    411. Le test de Moran

    Le test I a t dvelopp par Moran (1950a, 1950b) comme une extension deuxdimensions du test de corrlation temporelle dans les sries temporelles univaries. Il a tadapt aux rsidus dune rgression et se prsente formellement de la faon suivante en

    notation matricielle :

    =

    ~'~

    ~'~

    0

    W

    S

    NI [4.1]

    o ~~ Xy = est le vecteur des rsidus estims des MCO ( ( ) yXXX ''~ 1= ) et S0 est un

    facteur de standardisation gal la somme de tous les lments de W. Cette statistique se

    simplifie pour une matrice standardise : S0 = N.Sous lhypothse nulle dindpendance spatiale, le test I de Moran est un test localement

    meilleur invariant (King, 1981) et est asymptotiquement un test du ratio de vraisemblance de

    = 0 dans [2.7] ou de = 0 dans [2.12] (Burridge, 1980). Sous lhypothse nulle, Cliff et Ord(1972) ont driv les deux premiers moments de I:

    KN

    MWtrIE

    =

    )()( [4.2]

    et{ }

    [ ]2)()2)((

    )()()'()( IE

    KNKN

    MWtrMWtrMWMWtrIV

    +++

    = [4.3]

    o ')''( 1 XXXXIM = .Le test se base alors sur la statistique de Moran centre et rduite : Z(I) = [I E(I)] / V(I).

    Pour des rsidus normalement distribus et une matrice de poids bien leve , Z(I) suit

    asymptotiquement une loi normale centre et rduite. Pinkse (1998) et Kelejian et Prucha(1999b) donnent ainsi des conditions formelles et des preuves pour la normalit asymptotique

    du test de Moran dans plusieurs types de modles. Linfrence statistique peut galement trebase sur la distribution exacte de I en chantillon fini. Tiefelsdorf et Boots (1995) et Hepple(1998) ont driv un test exact en utilisant les rsultats sur les ratios de formes quadratiques

    de variables normales (une prsentation complte de ces mthodes se trouve dans Tiefelsdorf,1998, 2000). Le test de Moran a par ailleurs t tendu aux modles comportant des variables

    explicatives endognes par Anselin et Kelejian (1997) et aux modles PROBIT par Pinkse(1998, 1999).

    412. Tests unidirectionnels

    1/ On considre tout dabord le cas o les erreurs suivent un processus spatial autorgressif

    [2.7) : uW += et pour lequel on teste Ho : 0= . Sous lhypothse nulle, on retrouve lemodle linaire classique [2.1]. Dune faon gnrale, la statistique du test du multiplicateurde Lagrange se calcule de la faon suivante :

    )~

    ()~

    ()~

    ('1

    dIdML

    = [4.4]

  • 8/7/2019 ECONOMETRIE SPATIALE

    29/45

    - 29 -

    Dans [4.4], )~

    (d et )~

    (I sont respectivement le vecteur score et la matrice dinformation

    valus sous lhypothse nulle. Pour le modle erreurs autorgressives, )',,'( 2 = et lafonction de log-vraisemblance est donne en [3.15]. Quelques dveloppements matricielspermettent de trouver lexpression suivante (Burridge, 1980) :

    [ ]T

    WLMERR

    22~/~'~ = [4.5]

    avec [ ]WWWtrT )'( += . ~ et 2~ sont les estimations obtenues sous lhypothse nulle.

    Puisquil ny a quune seule contrainte : 21D

    ERRLM .La statistique de test est la mme si on spcifie comme hypothse alternative le processus

    moyenne mobile [2.12] et comme test Ho : 0= . ERRLM est donc localement optimal pour lesdeux alternatives (autorgressive et moyenne mobile) et lorsque lhypothse nulle est rejete,

    le test ne donne pas dindications quant la nature du processus des erreurs.

    On trouvera dans Anselin (1988a, 1988c) une extension de ce test appliqu au modleSUR avec autocorrlation des erreurs [2.25] et au modle erreurs composes et erreurs

    spatialement autocorrles. Par ailleurs, pour des processus spatiaux dordre suprieur, ongnralise facilement la statistique ERRLM . Par exemple, si lon considre un processus

    autorgressif dordre q :

    uWWWqq

    ++++= ...2211 [4.6]

    Pour le test H0 : 0...21 ==== q , la statistique devient :

    [ ]=

    =q

    l l

    lERR

    T

    WLM

    q

    1

    2

    ,...,,

    ~/~'~21

    [4.7]

    o : 2'tr llll WWWT += , l = 1, 2, , q. Sous lhypothse nulle2

    ,...,, 21 q

    D

    ERRq

    LM . Il sagit

    simplement de la somme des tests individuels (Anselin et Bera, 1998). La mme statistique de

    test reste valable si on prend le moyenne mobile [2.12] au lieu de [2.7].

    2/ Pour la spcification de lerreur propose par Kelejian et Robinson (1995), un test du

    multiplicateur de Lagrange peut tre driv suivant le mme principe.

    En reprenant les notations du modle [2.14] et pour le test de lhypothse nulle Ho : = 0,Anselin (1998) montre que la statistique de test scrit :

    =

    N

    TTT

    WWKR 12

    2

    122/~

    ~''~

    [4.8]

    o )'(1 WWtrT = et )''(2 WWWWtrT = . Sous H0 :2

    1D

    KR .

    3/ Finalement, le test dune variable endogne dcale a t propos par Anselin (1988b).

    Soit lhypothse nulle H0 : = 0 dans [2.2] en utilisant la fonction de vraisemblance de[3.10].

  • 8/7/2019 ECONOMETRIE SPATIALE

    30/45

    - 30 -

    On trouve la statistique de test suivante :

    [ ]1

    22

    ~

    ~/'~

    T

    WyLMLAG

    = [4.9]

    avec ( )( )[ ] 2211 ~/~)~

    (')'(~~

    TWXXXXXIWXT += . Sous H0 : 21D

    LAGLM .

    413. Les tests en prsence dune autocorrlation des erreurs et dune variable dcale

    Il est utile de savoir si le modle correct contient la fois une autocorrlation des erreurset une variable autorgressive. Par exemple, Anselin et Bera (1998) remarquent que ERRLM

    est la statistique de test correspondant H0 : = 0 en supposant que = 0. En revanche, si0 , ce test nest plus valide, mme asymptotiquement et il nest plus distribu selon un 2

    central 1 degr de libert. Pour une infrence statistique valide, il est donc ncessaire de

    prendre en compte la possible variable endogne dcale lorsquon teste lautocorrlationspatiale des erreurs et vice-versa. Face ce problme, plusieurs stratgies sont possibles. Onpeut dj effectuer un test joint de prsence dune variable dcale et dune autocorrlation

    des erreurs mais si lhypothse nulle est rejete, on ne connat pas la nature exacte de ladpendance spatiale. Une autre solution consiste alors estimer un modle avec une variableendogne dcale et tester ensuite sil y a encore une autocorrlation des erreurs et vice-versa

    (Anselin, 1988b). Dans ce cas, il faut estimer les modles par le maximum de vraisemblance.Anselin et al. (1996) ont finalement propos des tests bass sur les rsidus des MCO dans le

    modle simple (2.1) mais qui sont capables de prendre en compte une autocorrlation deserreurs lorsquon teste la prsence dune variable endogne dcale et vice-versa.

    1/ La premire approche consiste tester lhypothse nulle jointe H0 : = = 0 dans lemodle [2.17] grce au principe du multiplicateur de Lagrange. Ainsi, le test peut tre effectu

    partir des rsidus des MCO dans le modle simple [2.1). La statistique qui en rsulte est lasuivante :

    ( ) ( )

    += 1222

    2

    2

    21 ~~2

    ~~

    ~~~

    TddTdD

    dESARMA

    [4.10]

    o d~

    et d~

    sont respectivement les scores par rapport et valus sous lhypothse

    nulle,jijiij

    WWWWtrT'+= , 21111 )()'( TXWMXWD += ,

    2

    1222

    2 )()/( TTDE = . Si W1 =

    W2 = Walors T11 = T21 = T22 = T= tr[(W + W)] et [4.10] se simplifie :

    ( ))~

    ~(~

    ~~~

    22

    22

    TD

    dd

    T

    dSARMA

    +=

    [4.11]

    Sous H0 : = = 0, SARMA converge vers un2

    deux degrs de liberts.

    2/ La deuxime approche consiste faire un test du multiplicateur de Lagrange pour uneforme de dpendance spatiale lorsque lautre forme nest pas contrainte. Par exemple, cela

    consiste tester lhypothse nulle H0 : = 0 en prsence de . Sous lhypothse nulle, onretrouve le modle autorgressif [2.2] alors que sous lhypothse alternative, on retrouve le

  • 8/7/2019 ECONOMETRIE SPATIALE

    31/45

    - 31 -

    modle gnral [2.17]. Le test est alors bas sur les rsidus de lestimation par le maximum devraisemblance dans le modle autorgressif [2.2]. La statistique est :

    ( ) )(

    2

    2122

    2

    *

    VTT

    dLM

    A

    ERR = [4.12]

    o 11'

    2

    1

    1221 tr += AWWAWWT A , 1WIA = et o le chapeau dsigne les estimateurs valus

    par le maximum de vraisemblance dans le modle [2.2]obtenus par optimisation non linaire,

    )( V est la variance de dans le modle [2.2]. Sous H0 : = 0, 21*

    D

    ERRLM .

    On peut galement tester lhypothse nulle H0 : = 0 en prsence de , le test est alorsbas sur les rsidus de lestimation par le maximum de vraisemblance dans le modle avec

    autocorrlation des erreurs [2.7]. La statistique est :

    [ ]'

    2

    1*

    )(

    ''

    HVHH

    yBWB

    LMLAG = [4.13]

    o est le vecteur des rsidus estims par le maximum de vraisemblance dans le modle

    avec erreurs autorgressives [2.7], ( )',,' 2 = , 2WIB = . Les autres termes sont :

    2

    111

    1

    1

    1

    2

    1

    )()'()()'(tr

    XBWXBWBBWBBWtrWH ++= [4.14]

    et :

    +=

    0

    tr)'(tr

    )'(

    1

    12

    1

    1

    1

    2

    2

    1

    'BWWBBWBW

    XBWBX

    H

    [4.15]

    et )( V est la matrice des variances-covariances estime de dans le modle [2.7]. Sous H0 :*

    LAGLM converge vers un

    2 un degr de liberts.

    Ces tests ncessitent donc une estimation par le maximum de vraisemblance. Une

    dernire approche de ces tests ncessite uniquement une estimation du modle simple [2.1]par les MCO.

    3/ La dernire approche est celle de Bera et Yoon (1993) qui a t reprise par Anselin et al.(1996). Elle consiste utiliser des tests robustes une mauvaise spcification locale. Par

    exemple, on ajuste ERRLM pour que sa distribution asymptotique reste un 2 central, mme

    en prsence locale de . Ce test seffectue partir des rsidus des MCO du modle simple[2.1]. La statistique modifie pour le test de H0 : = 0 est :

    [ ]( ) DTT

    dDTdRLMERR ~~

    ~~~~

    22

    1222

    212

    12

    =

    [ ]

    ( )DTTdDTd

    RLMERR ~~1

    ~~~~

    2

    212

    =

    si W1 = W2 = W[4.16]

  • 8/7/2019 ECONOMETRIE SPATIALE

    32/45

    - 32 -

    De la mme faon, les rsidus du modle [2.1] servent au test de H0 : = 0 dans la prsencelocale de . La statistique de ce test est :

    [ ]1

    22

    2

    12

    2

    21

    2212

    )(

    ~~

    ~~

    =

    TTD

    dTTdRLMLAG

    [ ]

    TD

    ddRLMLAG

    =

    ~~

    ~~

    2

    2

    si W1 = W2 = W [4.17]

    414. Puissance et robustesse des tests

    Des simulations rcentes de Monte-Carlo effectues en particulier par Anselin et Rey

    (1991), Florax et Rey (1995) et Anselin et Florax (1995) fournissent quelques indicationsquant aux performances de ces tests asymptotiques en chantillon fini.

    Anselin et Rey (1991) et Anselin et Florax (1995) ont compar les performances des testsde Moran, ER RLM , LAGLM , ERRRLM et LAGRLM pour diffrentes matrices de poids (sur zonage

    rgulier ou non), diffrentes distributions des erreurs et diffrentes tailles dchantillon.

    Plusieurs rsultats ressortent.- Dune manire gnrale, les puissances des tests diminuent dans les petits chantillons etaugmentent avec des valeurs plus fortes des paramtres spatiaux, LAGLM tant le test le plus

    puissant et robuste la non-normalit des erreurs.

    - Le test Ide Moran apparat puissant pour les deux alternatives, variable endogne dcale ouautocorrlation des erreurs, ce test devient ainsi un indicateur gnral dune mauvaise

    spcification du modle, quelle que soit la forme de la dpendance spatiale omise.- Les tests du score ERRLM et LAGLM ont les plus grandes puissances pour leur alternative

    respective.- Les tests ajusts ERRRLM et LAGRLM ont galement de bonnes performances en termes de

    puissance et de taille empiriques, le prix payer pour la correction est faible ( LAGRLM

    reste plus performant que ERRRLM ).

    Florax et Rey (1995) ont tudi les consquences dune mauvaise spcification de lamatrice de poids sur la puissance des tests prcdents. Ils distinguent entre une sur-

    spcification et une sous-spcification . Dans le premier cas, des liens spatiaux sontrajouts tort (par exemple lorsquon utilise une matrice de distance au lieu dune matrice de

    contigut) alors que dans le deuxime cas, des liens spatiaux sont omis tort. Les simulationseffectues par ces auteurs suggrent quune sur-spcification cause une baisse de puissancealors quune sous-spcification augmente la puissance des tests en prsence dautocorrlation

    spatiale positive et la diminue en cas dautocorrlation spatiale ngative. Le coefficient de

    Moran est moins affect que les autres tests par une mauvaise spcification de la matrice depoids.

    42. A la recherche de la spcification du modle

    Dans le paragraphe 41 sont dvelopps des tests de spcification permettant de dtecter

    une omission de lautocorrlation spatiale et la forme prise par cette dernire dans le modle.Dautres tests de spcification ont pour but de tester la prsence de variables exognesdcales (paragraphe 421) et de dterminer la structure de la dpendance spatiale, reflte par

    le choix de la matrice de poids (paragraphe 422). Tous ces tests peuvent alors servir tablirdes rgles de dcision permettant de rechercher la meilleure spcification du modle

    (paragraphe 423) et une tude de la convergence entre les rgions europennes fournit uneillustration de ces techniques (paragraphe 424).

  • 8/7/2019 ECONOMETRIE SPATIALE

    33/45

    - 33 -

    421. Le test du facteur commun

    Le test du facteur commun permet de choisir entre un modle avec autocorrlation des

    erreurs et un modle avec l'ensemble des variables explicatives dcales. Rappelons quensries temporelles, l'approche en termes de facteur commun est base sur l'quivalence de

    deux spcifications de modles, l'une exprime en termes des erreurs et l'autre en termes devariables endognes retardes. Si certaines contraintes sont respectes sur les coefficients dudernier modle, la spcification se rduit une forme plus simple avec des erreurs

    autocorrles. En effet, soit le modle comportant une variable endogne dcale :

    tttttuxxyy +++= 1211 [4.18]

    o les ut sont indpendants de X et des valeurs passes de u, alors, si 2 = -1, le modledevient un modle avec autocorrlation des erreurs :

    yt= 1xt+ v t [4.19]

    v t=vt-1 + ut

    En conomtrie spatiale, l'approche est similaire et prend pour point de dpart laformulation de Durbin (Burridge, 1980 ; Bivand, 1984). Nous avons vu dans le paragraphe

    221 que les deux modles suivants taient quivalents :

    += Xy [4.20]uW +=

    uWXXWyy ++= [4.21]

    Le modle (4.21) est estim par :

    y = Wy + X+ WX+ u [4.22]

    Par consquent, pour savoir si le modle [4.22] peut se rduire au modle [4.20], il faut tester

    l'hypothse suivante : H0 :+ = 0.Au contraire des sries temporelles, un modle avec erreurs autocorrles n'est pas plus

    facile estimer qu'un modle avec une variable endogne dcale puisqu'il faut utiliser dans

    les deux cas la mthode du maximum de vraisemblance. Le seul avantage de la forme [4.20]sur la forme [4.22] est qu'il y a moins de paramtres estimer : K + 1 au lieu de 2K + 1.

    Le test sur les contraintes des paramtres se fait avec l'un des trois tests traditionnels : testde Wald, test du rapport de vraisemblance ou test du multiplicateur de Lagrange. Tous trois

    sont distribus selon une loi du K-1 degrs de libert (en ignorant le terme constant). Parexemple, le test de Wald est de la forme :

    W= g'[G'VG]-1g

    o : g = + ; G = g'/ ; '= ['] ; Vest la matrice estime des variances-covariancesdu modle [4.22].

    Le test du facteur commun part donc d'un modle gnral sur lequel des tests sont faitspour voir si un modle plus simple est plus pertinent ou non. Cette manire de faire peut

  • 8/7/2019 ECONOMETRIE SPATIALE

    34/45

    - 34 -

    constituer un dsavantage lorsqu'il y a peu d'observations : les degrs de libert risquent dedevenir trop faibles. Ce test a t tendu plusieurs dcalages spatiaux et retards temporelspar Blommestein (1983) et Blommestein et Nijkamp (1986).

    22. La dtermination de la structure spatiale

    Lorsque deux modles concurrents sont formuls comme des hypothses alternatives etlorsquun des modles ne peut pas tre exprim comme un cas particulier de l'autre modle

    (comme c'tait le cas jusqu' prsent), les modles non-embots ncessitent des procduresspciales de tests. Par exemple, deux modles autorgressifs peuvent tre en comptition

    (Anselin, 1984) :

    H0 : y = 0W0y + X00 + 0 [4.24a]

    H1 : y = 1W1y + X11 + 1 [4.24b]

    Dans ces expressions [4.24a) et [4.24b), les matrices de poids, les variables explicatives sont

    diffrentes et les erreurs n'ont pas forcment la mme distribution. Au contraire des testsprcdents, l'hypothse alternative ne peut pas tre considre comme un modle contraint parrapport l'hypothse nulle. Il faut donc trouver des procdures de tests permettant de tester

    ces hypothses non-embotes. Diffrentes procdures ont t listes par Anselin (1984) dontle test J.

    Le test J a t propos par Davidson et MacKinnon (1981) dans un cadre aspatial. Deux

    modles sont en comptition :

    H0 : y = X+ [4.25a]

    H1 : y = Z+ u [4.25b]

    y est le vecteur de la variable explique de dimension (N,1). X et Z sont des matrices de

    variables explicatives de dimensions respectives (N,k1) et (N,k2). et sont des vecteurs de

    paramtres de dimensions respectives (k1,1) et (k2,1). et u sont des vecteurs d'erreurs dedimension (N,1) avec :

    E(') = [4.26a]

    E(uu') = u [4.26b]

    L'ide est de construire un modle enveloppe qui contient les deux modles prcdents pourpouvoir tester l'un ou l'autre des modles de dpart contre le modle reconstruit suivant :

    y = (1 -)X+ Z+ v [4.27]

    est un paramtre inconnu. On voit que si = 0, on obtient le modle [4.25a] et on rejette

    l'hypothse alternative. En revanche, si = 1, on obtient le modle [4.25b] et on rejettel'hypothse nulle. L'ide est donc de dvelopper le test : H0 : = 0. Pourtant, les paramtres

    , et du modle [4.27] ne sont pas identifiables. Par consquent, la procdure de test va

    s'effectuer en deux tapes. Premirement, est estim par les MCO dans le modle [4.25b].On en dduit l'estimation . Deuximement, on rgresse par les MCO y sur Xet Z :

    y = X+ Z+ u [4.28]

  • 8/7/2019 ECONOMETRIE SPATIALE

    35/45

    - 35 -

    On teste alors H0 : = 0 et si lhypothse nulle nest pas rejete, cest le modle [4.25a] quiest acceptable. Le ratio du coefficient son cart-type associe suit asymptotiquement uneloi normale desprance nulle et de variance unitaire.

    Anselin (1986) a montr que les rsultats prcdents pouvaient inclure des variables

    dpendantes dcales sous des conditions assez gnrales : une variance borne (ce qui estvrifi lorsque le paramtre spatial est inclus dans son espace des paramtres) et une structurede dpendance spatiale qui dcrot lorsque la distance entre les observations augmente (ce quiest vrifi avec le choix d'une matrice de poids approprie).

    423. Les rgles de dcision

    Les diffrents tests de spcification peuvent tre combins afin de choisir la meilleurespcification du modle (tableau 1).

    1/ La premire tape consiste estimer le modle simple [2.1] par les MCO et effectuer le

    test de Moran [4.1] et le test SARMA [4.11] (test joint dune prsence de prsencedautocorrlation des erreurs et dune variable autorgressive). Le rejet de lhypothse nulleindique une mauvaise spcification du modle et une omission de lautocorrlation spatiale.

    Les tests ERRLM [4.5], L ALM [4.9] et leurs versions robustes [4.16] et [4.17] permettent despcifier la forme de lautocorrlation spatiale (voir 3/)

    2/ Si les rsultats des tests indiquent une prsence de dpendance spatiale, il est souventutile de commencer par inclure dans le modle, si possible, des variables supplmentaires. Ilpeut s'agir de variables exognes supplmentaires qui sont susceptibles d'liminer la

    dpendance spatiale (si cette dernire provient d'une mauvaise spcification) ou des variablesexognes dcales spatialement (Florax et Folmer, 1992).

    3/ Si lajout de variables exognes supplmentaires na pas limin lautocorrlationspatiale, il faut alors estimer un modle incorporant une variable autorgressive ou une

    autocorrlation des erreurs. Le choix entre ces deux formes de la dpendance spatiale encomparant les niveaux de significativit des tests du multiplicateur de Lagrange s'effectue

    selon les valeurs relatives des tests du multiplicateur de Lagrange ERRLM [4.5], L ALM [4.9]et leurs versions robustes [4.16] et [4.17].

    * Si lon ne considre que ERRLM et L ALM , Anselin et Rey (1991) et Florax et Folmer(1992) proposent de choisir lune ou lautre forme fonctionnelle [2.2] ou [2.7] en appliquant

    la rgle de dcision simple suivante :- Si le test du modle autorgressif naboutit pas au rejet de lhypothse nulle alors que le testde lautocorrlation des erreurs rejette lhypothse nulle, ou si les deux tests aboutissent au

    rejet de lhypothse nulle et que le deuxime test est plus significatif que le premier, onchoisit le modle avec autocorrlation des erreurs.

    - Si le test du modle autorgressif aboutit au rejet de lhypothse nulle, ou si les deux testsaboutissent au rejet de lhypothse nulle et que le premier test est plus significatif que le testde lautocorrlation des erreurs, on choisit le modle autorgressif.

    Les simulations de Monte-Carlo effectues par Florax et Folmer (1992) indiquent que laprobabilit de trouver le vrai modle laide de cette stratgie est plus leve si le vrai modle

    est un modle autorgressif et non un modle o les erreurs sont autocorrles. Il est aussi

    noter que les probabilits sont plus leves lorsque le paramtre spatial est positif.

  • 8/7/2019 ECONOMETRIE SPATIALE

    36/45

    - 36 -

    * Anselin et Florax (1995) affinent cette rgle de dcision en la compltant par

    lutilisation des tests robustes : si L ALM est plus significatif que ERRLM et L A GRLM estsignificatif mais pas ERRRLM , on inclut une variable endogne dcale. Dune faon similaire,la prsence dune autocorrlation des erreurs peut tre identifie travers ERRRLM . Dans ce

    dernier cas, le test du facteur commun doit encore tre effectu pour vrifier que le modle

    avec autocorrlation des erreurs est le meilleur.

    4/ Une fois que le modle spatial adquat a t estim ([2.2] ou [2.7]), trois testssupplmentaires peuvent tre mobiliss.

    * Pour un modle autorgressif [2.2], le test *ERRLM permet de savoir si une

    autocorrlation spatiale des erreurs est encore ncessaire.

    * Pour un modle avec autocorrlation des erreurs [2.7], le test *LAG

    LM permet de savoir

    si une variable endogne dcale est encore ncessaire. Le test du facteur commun (voir

    section 421) indique si la restriction + = 0 peut tre rejete ou non. Si elle ne lest pas, lemodle [4.22] se rduit au modle avec autocorrlation des erreurs [4.20].

    5/ Si plusieurs modles restent encore en comptition, le test J sert comparer des modles

    spatiaux comportant des matrices de poids diffrentes. Le choix entre modles peut aussi sefaire avec les critres traditionnels tels que les critres d'information :

    INF= -2lnL + q(K) [4.29]

    lnL est la valeur de la fonction de log-vraisemblance l'optimum, K le nombre de paramtresinconnus et q un facteur de correction qui varie selon les formulations : q = 2K pour le critredAkake ou q = logNK pour le critre de Schwartz. Lorsqu'on compare deux modles selon

    leur critre d'information, on choisit celui qui minimise ce coefficient.

    424. Illustration : Convergence des rgions europennes

    Aujourdhui, les logiciels conomtriques les plus courants nintgrent pas

    spcifiquement des options permettant destimer les modles spatiaux et deffectuer lesdiffrents tests. Ceci contraste avec le grand nombre de logiciels disponibles pour lanalyse dedonnes spatiales dans les sciences physiques, avec une attention particulire accorde aux

    donnes gostatistiques. Par exemple, il y a une librairie pour GSLIB (Deutsch et Journel,1992) et un module S+SpatialStat pour S+plus (Mathsoft, 1996). Ce module contient

    quelques-unes des procdures exposes ici. Il existe en revanche un logiciel conomtriquedestin spcifiquement lanalyse des donnes spatiales : SpaceStat (Anselin, 1999), qui

    contient les mthodes destimation par le maximum de vraisemblance, par les variablesinstrumentales, ou la mthode GMM pour les modles spatiaux et htroscdastiques. Ilcontient galement un grand nombre de tests de spcification et de nombreuses fonctions

    destines lanalyse exploratoire des donnes spatiales.

    Dans Baumont et al. (2000b), le logiciel SpaceStat a t utilis afin dappliquer les

    techniques de lconomtrie spatiale ltude de la convergence des rgions europennes.Lhypothse de convergence est base sur les modles de croissance noclassiques et

    implique quune rgion pauvre tend crotre plus rapidement quune rgion riche , detelle sorte que la rgion pauvre rattrape long terme le niveau de revenu ou de production

    par tte de la rgion riche . Cette proprit correspond au concept de -convergence (Barro

    and Sala-I-Martin, 1995). La -convergence est absolue lorsquelle est indpendante des

  • 8/7/2019 ECONOMETRIE SPATIALE

    37/45

    - 37 -

    conditions initiales et cette hypothse est habituellement teste sur le modle en coupestransversales suivantes :

    ii

    i

    Ti yy

    y

    T ++=

    )ln(ln

    10,

    0,

    , i ),0(2

    iid [4.30]

    o yi,t est le produit par tte de la rgion i ( N,...,1i = ) la date t, T est la longueur de lapriode, et sont les paramtres inconnus et le terme derreur. Il y a convergence

    lorsque est ngatif et statistiquement significatif puisque dans ce cas le taux de croissance

    moyen entre les dates 0 et Test ngativement corrl avec le niveau initial du produit par tte.Pour dtecter une ventuelle autocorrlation spatiale des observations, divers modles

    conomtriques spatiaux ont t estims sur un chantillon comprenant les PIB par tte de122 rgions europennes pour la priode 1980-19956.

    Les rsultats de lestimation par les MCO de [4.30] et des diffrents tests sont prsentsdans le tableau 2. Le coefficient associ au niveau du PIB initial est significatif et ngatif, cequi confirme lhypothse de convergence pour les rgions europennes. Les rsultats des tests

    appellent plusieurs remarques. Tout dabord, le test de Jarque-Bera ne rejette pas lhypothsede normalit. Par consquent, la validit de lestimation par le maximum de vraisemblance et

    le calcul des tests du multiplicateur de Lagrange sont assurs. Ensuite, le test de Moran et letest SARMA conduisent au rejet de lhypothse nulle dabsence dautocorrlation spatiale. Lemodle est donc mal spcifi. Enfin, pour dterminer la forme qui doit tre prise par

    lautocorrlation spatiale, on tudie la significativit des tests du multiplicateur de Lagrange :

    ERRLM , LAGLM , ERRRLM et LAGRLM . ER RLM et LAGLM sont tous les deux significatifs mais

    ERRRLM est significatif alors que LAGRLM ne lest pas. Ces tests indiquent donc la prsencedune autocorrlation spatiale des erreurs plutt quune variable endogne dcale. Pour

    confirmer ce rsultat, les diffrents modles conomtriques spatiaux sont estims.Pour vrifier que lautocorrlation spatiale des erreurs nest pas le rsultat dune variable

    spatiale dcale omise, le modle rgressif crois a t estim par les MCO. Le coefficient

    associ la variable mesurant linfluence des PIB initiaux des rgions voisines nest passignificatif. De plus, les tests indiquent la prsence dune variable endogne dcale omise et

    ce modle est infrieur au modle prcdent en termes des critres dinformation. Parconsquent, il est ncessaire destimer un modle incorporant explicitement lautocorrlationspatiale.

    Dans le modle avec variable endogne dcale, tous les coefficients sont significatifs.

    Lestimation du paramtre autorgressif est hautement significatif et positif ( 635,0 = ) etindique un effet de dbordement gographique : la croissance du PIB par tte est influence

    par celle des rgions voisines. Le test *ERRLM indique quune autocorrlation des erreurs

    supplmentaire nest pas ncessaire. Ce modle est meilleur que les modles prcdents en

    termes des critres dinformation. On remarque galement que la variance estime a diminu.Les rsultats de lestimation du modle avec erreurs autocorrles font apparatre

    nouveau des coefficients tous significatifs : le coefficient associ au niveau du PIB initial est

    plus grand que dans le modle [4.30] et lautocorrlation spatiale des erreurs est positive

    ( 702,0 = ). Ce modle est correctement spcifi. En effet, le test *LAGLM indique quunevariable endogne supplmentaire dans ce modle nest pas ncessaire. De plus, le test du

    6

    Les donnes sont tires de la base de donnes EUROSTAT-REGIO. Lchantillon est compos de rgions auniveau NUTS1 (Danemark, Luxembourg, Royaume-Unis) et au niveau NUTS2 (Belgique, Espagne, France,

    Allemagne, Italie, Pays-Bas et Portugal).

  • 8/7/2019 ECONOMETRIE SPATIALE

    38/45

    - 38 -

    facteur commun indique que la restriction 0=+ ne peut pas tre rejete dans le modle[4.22] : le modle [4.22] se rduit donc bien au modle avec autocorrlation des erreurs

    [4.20]. Ce modle est le meilleur en termes des critres dinformation et la variance estimeest la plus basse. Il apparat donc bien que le modle avec autocorrlation spatiale des erreursest la spcification la plus adquate.

    CONCLUSION

    Lobjectif de cet article tait dexaminer la faon dont lautocorrlation spatiale pouvait

    tre introduite dans les modles conomtriques. L'autocorrlation spatiale se rfre ladpendance des observations provenant de la disposition gographique des donnes. Elle se

    modlise grce aux matrices de poids et diffrents coefficients sont destins dtecter laprsence de l'autocorrlation spatiale dans une srie. Lorsquelle est dtecte, diffrentsmodles conomtriques permettent den tenir compte : introduction dune variable endogne

    dcale et/ou dune autocorrlation spatiale des erreurs. La caractristique principale de cesmodles, qui dtermine l'ensemble des dveloppements suivants, est la corrlation des erreurs

    et des variables explicatives, et ce, quelle que soit la forme et la distribution des erreurs. Parconsquent, les moindres carrs ordinaires et les moindres carrs quasi-gnraliss ne sont pasdes mthodes adaptes et il faut se tourner vers dautres mthodes destimation telle la

    mthode du maximum de vraisemblance, celle des variables instrumentales ou celle desmoments gnraliss. Les tests de spcification permettent enfin de dterminer la forme prise

    par lautocorrlation spatiale.

    Longtemps ignores dans les articles contenant des applications empiriques, les

    techniques de l'conomtrie spatiale sont de plus en plus appliques dans la littrature,

    spcialise ou non. Les dveloppements les plus nouveaux, l'incorporation des effets spatiauxdans les modles variables qualitatives et les modles spatio-temporels, sont en revancheencore relativement peu utiliss car beaucoup de progrs relatifs la thorie conomtriquedans ces deux domaines restent encore faire, au contraire des modles linaires variables

    quantitatives autour desquels un consensus s'est tabli. Les principales avances faire encoreen conomtrie spatiale sont donc la systmatisation de l'introduction des effets spatiaux dans

    les modles variables qualitatives et les modles spatio-temporels.

  • 8/7/2019 ECONOMETRIE SPATIALE

    39/45

    - 39 -

    BIBLIOGRAPHIE

    Amemiya T., 1985, Advanced Econometrics, Harvard University Press, Cambridge.

    Ancot J.P., Kuiper J.H., Paelinck J.H.P., 1983, Economtrie spatiale : une synthse dcennale, in J.H.P.

    Paelinck et A. Sallez (Eds.), Espace et Localisation, Economica, Paris.

    Anselin L., 1980, Estimation Methods for Spatial Autoregressive Structures, Cornell University, Regional

    Science Dissertation and Monograph Series #8, Ithaca, NY.Anselin L., 1982, A note on small sample properties of estimators in a first-order spatial autoregressive

    model, Environment and PlanningA, 14, 1023-1030.

    Anselin L., 1984, Specification tests on the structure of interaction in spatial econometric models, Papers of

    the Regional Science Association, 54, 165-182.

    Anselin L., 1986, Non-tested tests on the weight structure in spatial autoregressive models : some Monte-

    Carlo results, Journal of Regional Science, 26, 267-284.

    Anselin L., 1988a, Spatial Econometrics : Methods and Models, Kluwer Academic Publishers, Dordre