Vitesse de Convergence et Technologiet2m.univ-paris1.fr/fr/activites/attach/speed.pdf · ¡–...

Vitesse de Convergence et Technologie

Stephane Adjemian∗

Fevrier, 2002(Version incomplete)

Resume

Ce papier propose d’estimer, sur une large coupe d’economies, la vi-tesse de convergence (ou de divergence) du produit par travailleur et dustock de capital par tete. On interprete une difference entre ces deux me-sures comme le signe qu’un phenomene de rattrapage technologique est al’oeuvre et que l’accumulation de facteur ne peut a elle seule expliquer ladynamique de croissance. Nous utilisons la theorie des processus presqueintegre pour estimer la vitesse de convergence en utilisant la dimensionpanel de notre echantillon.

Abstract

This paper intends to estimate, on a large cross-section of economies, thespeed of convergence of output per worker and of capital per worker. Thedifference between these two measures allows us to pin down the role oftechnology in growth dynamics and confirms that capital accumulationcan’t be the only engine of growth. We use local to unity asymptotic inorder to estimate the speed of convergence, exploiting the panel dimensionof our sample.

Keywords : Local to unity asymptotic, Linear panel data, Speed of conver-gence, Neoclassical versus technological catch-up.JEL codes : C31, C32, C33, O4 and O5.

Introduction

Ce papier propose une procedure d’estimation de la vitesse de convergence

pour une large coupe d’economies. Differentes strategies peuvent etre empruntees.

Une approche classique essentiellement liee aux regressions en coupes. Ou de,

facon plus naturelle, une approche qui utilise pleinement la dimension tempo-

relle des donnees. Ce papier exploite cette derniere voie.

Meme si les discussions sur la mesure de la vitesse de convergence semblent

∗EPEE, Universite d’Evry, Departement d’economie, 4 Bld. Francois Mitterrand,91025 Evry cedex. Tel : (33) 01-69-47-71-68. Fax : (33) 01-69-47-70-50. E-mail :[email protected]

1

souvent peu interessantes, la recherche d’une juste mesure paraıt essentielle

dans la confrontation des constructions theoriques aux donnees. La motivation

de l’introduction du capital humain dans le modele de croissance neoclassique

(Mankiw, Romer et Weil [9], MRW) est basee sur l’incoherence constatee entre

une vitesse generalement proche de deux pour cent (obtenue par des regressions

en coupe) et la vitesse de convergence obtenue en calibrant le modele de crois-

sance neoclassique (approximativement huit pour cent).

Ce papier montre comment la comparaison de la vitesse de convergence

du stock de capital par tete et du produit par tete peut donner des elements

de reflexion dans le debat sur les sources de la dynamique de croissance (ou

de convergence). Si la vitesse de convergence du stock de capital intensif est

differente de celle du produit par tete, alors cela indique que le mecanisme

neoclassique (lie a l’accumulation du capital physique) ne peut a lui seul cau-

ser la convergence et cela laisse une place a l’explication technologique de la

convergence (Cf Abramovitz [1]). La vitesse de convergence est un moment de

la dynamique de croissance qui peut nous aider a discriminer entre des alterna-

tives theoriques.

La section [1], decrit l’ensemble des hypotheses implicitement formulees par

l’approche adoptee ici en expliquant pourquoi il peut etre interessant de com-

parer la vitesse de convergence du produit par tete et celle du capital par tete.

La section [2] motive et presente la strategie utilisee pour mesurer la vitesse

de convergence. On montre en particulier que l’approche classique, meme si

l’on admet les hypotheses qu’elle pose sur les donnees, ne peut fournir un test

convergent de la vitesse de convergence ni a fortiori une mesure de la vitesse de

convergence. La section [3] propose des applications empiriques.

1 Un cadre theorique

On se donne un modele de croissance optimal neo-classique augmente d’une

dynamique de rattrapage technologique exogene. Ceci nous permet de montrer

que, sous certaines conditions, la comparaison de la vitesse de convergence du

2

capital par tete et celle du produit par tete peut mettre en evidence l’exis-

tence, au cote de l’explication neoclassique, d’une explication technologique de

la convergence.

La technologie de production est de type neoclassique, le produit, Y (t),

est obtenu a partir du capital, K(t) et du travail efficace T (t)L(t) : Y (t) =

A(t)F (K(t), T (t)L(t)). T (t) represente le progres technologique Harrod-neutre,

on pose T (t) = ext avec x > 0 le taux de croissance technologique exogene.

L(t) represente le nombre de travailleurs a l’instant t, on pose L(t) = ent avec

n > 0 le taux de croissance exogene de la force de travail. Le terme A(t) ∈]0, 1]

represente la productivite, assimilee ici a la distance a la frontiere technologique

definie par F (•, •). Ce terme de productivite est caracterise par une dynamique

de rattrapage exogene, ie A = φ(1−A(t)). Le parametre φ > 0 defini la vitesse

de rattrapage technologique, Une plus grande valeur de ce parametre se traduit

par une reduction du temps que mettra l’economie pour combler son retard tech-

nologique. Pour caracteriser la technologie de production on pose α(t) et ε(t)

respectivement la part du capital dans la valeur ajoutee et l’elasticite entre ca-

pital et travail (voir l’annexe [A] pour une definition formelle de ces parametres).

L’utilite intertemporelle est definie par,

∫ ∞

0

e−(ρ−n)tu(c(t))dt

ou u(•) est une fonction d’utilite instantanee verifiant les proprietes habituelles

et c(t) et la consommation par travailleur. Pour caracteriser les preferences on

pose σ(t) l’inverse de l’elasticite de substitution intertemporelle.

Le programme du planificateur social associe a ce modele est defini par,

Max{c(t),t∈R}

∫ ∞

0

e−(ρ−n)tu(c(t))dt (1.1)

sc k(t) = A(t)F (k(t), T (t))− (δ + n)k(t)− c(t) (1.2)

A(t) = φ(1−A(t)) (1.3)

k(0), A(0) et T (0) donnes. (1.4)

3

ou k(t) et δ sont respectivement le stock de capital par travailleur a l’instant t et

le taux de depreciation du capital. Ce modele est caracterise par deux variables

d’etats (A(t) et k(t)) et une variable de controle (c(t)). La dynamique linearisee

autour de l’etat stationnaire de cette economie doit donc etre caracterisee par

deux valeurs propres negatives et une valeur propre explosive. Les deux valeurs

propres negatives sont liees a la vitesse de convergence neoclassique (λ1) et la

vitesse de convergence technologique (λ2). Comme le processus de convergence

technologique est independant du processus de convergence neoclassique, il est

assez naturel de trouver,

λ1 = −ξ

2+

12

√ξ2 +

4(1− α)σε

(ρ + σx + δ)[ρ + σx + δ

α− δ − x− n

](1.5)

ou ξ ≡ ρ− n− (1− σ)x, et

λ2 = φ (1.6)

Autour de l’etat stationnaire, la dynamique des variables d’etat est decrite par,

A(t) = e−λ2tA(0) et k(t) = e−λ1tk(0) (1.7)

ou A(t) ≡ A(t)− 1 et k(t) = logk(t)− logk∗ representent respectivement l’ecart

a l’etat stationnaire de la productivite et du stock de capital par unite de travail

efficace. On deduit la dynamique du produit dans un voisinage de l’etat station-

naire a partir de la dynamique des variables d’etat. La vitesse de convergence du

produit, notee β, va etre comprise entre la vitesse de convergence neoclassique

(λ1) et la vitesse de convergence technologique (λ2). Toujours en linearisant la

dynamique autour de l’etat stationnaire, on a

y(t) = A(t) + α(t)k(t)

⇐⇒ y(t) = α(t)e−λ1tk(0) + e−λ2tA(0) (1.8)

On ne peut definir la vitesse d’ajustement du produit a sa cible independamment

raisons qui expliquent l’ecart initial entre le produit et sa cible de long terme

(cette distance doit-elle s’expliquer par un niveau de capital trop faible ou par

4

une incapacite a exploiter efficacement la technologie ?). Ce point apparaıt deja

dans Den Haan [6] qui utilise un modele de croissance stochastique. Le parametre

β, la vitesse de convergence du produit, est une combinaison non lineaire de λ1

et λ2. Par definition on a,

y(t) = e−βty(0)

⇐⇒ y(t) = e−βt{

α(0)k(0) + A(0)}

On a donc, pour tout instant t,

e−βt{

α(0)k(0) + A(0)}

= α(t)k(0)e−λ1t + A(0)e−λ2t

En particulier, pour t = 1, on a

e−β =α(1)k(0)e−λ1 + A(0)e−λ2

α(0)k(0) + A(0)

Soit encore,

β = −log

(α(1)k(0)e−λ1 + A(0)e−λ2

α(0)k(0) + A(0)

)(1.9)

Si l’ecart initial du produit a sa cible de long terme s’explique exclusivement par

un niveau de capital insuffisant (A(0) = 0) et si la technologie est Cobb-Douglas

(ce qui assure que la part du capital dans la valeur ajoutee est constante) alors

la vitesse de convergence de l’output correspond a la vitesse de convergence

neo-classique. On verifie que β est compris entre λ1 et λ2.

Pour la calibration du modele decrite dans le tableau [1] avec α = 1/3 on ob-

tient une vitesse de convergence neo-classique de 8,9%, il faudrait poser α = 3/4

pour obtenir une vitesse de 2,1% coherente avec les estimations regulierement

reportees dans les regressions en coupe. Mais ici la vitesse de convergence du

produit ne correspond pas a la vitesse de convergence du capital. Avec α = 1/3

on peut obtenir une vitesse de convergence du produit de 2,1% si A(0) = 0, 19

et k(0) = 0, 1. La figure [1] represente, pour la calibration avec α = 1/3, la

vitesse de convergence du produit contre les conditions initiales associees aux

deux variables predeterminees du modele.

5

Pour la suite, on retient trois points remarquables,

1. La vitesse de convergence du produit ne correspond plus a la vitesse de

convergence du capital des lors que l’on a une dynamique de productivite.

Si nous mesurons une difference entre ces deux vitesses de convergence

alors cela laisse une place pour le mecanisme de convergence technologique.

Ce resultat apparaıt des lors que la dynamique du modele est augmentee

d’une variable predeterminee (endogene ou exogene).

2. Dans ce cadre il n’est pas necessaire d’introduire du capital humain pour

obtenir une vitesse de convergence du produit autour de 2% compatible

avec une part du capital dans la valeur ajoutee de 1/3. Il suffit d’avoir

une dynamique de la productivite assez persistante (φ proche de zero). Ce

point a deja ete observe par [6].

3. Meme si les fondamentaux sont identiques dans la coupe des economies,

le modele predit une heterogeneite sur la vitesse de convergence du pro-

duit, a cause de l’heterogeneite sur les sources de la deviation initiale du

produit a sa cible. Supposer que la vitesse de convergence du produit est

constante dans la coupe des economies, comme nous le ferons par la suite,

c’est supposer que l’ecart initial du produit a sa cible s’explique de facon

semblable pour toutes les economies (au regard de la figure [1] cela revient

a supposer que toutes les economies sont reparties le long de la courbe de

niveau associee a une vitesse de convergence particuliere.

2 Approche empirique

2.1 Limites de l’approche classique

L’approche classique suppose que le produit par tete relatif en logarithme,

yi,t = log(Yi,t) − N−1∑

i log(Yi,t), de l’economie i (= 1, . . . , N) a la date t

6

(= 1, . . . , T ) est determine par le processus generateur de donnees suivant,

yi,t = (1− β)yi,t−1 + ui,t (2.1)

ui,t ∼ iid(0, σ2u) dans la coupe et dans la chronologie (2.2)

yi,0 ∼ iid(0, σ2y) et E[yi,0uj,t] = 0 ∀(i, j, t) ∈ {1, . . . , N}2 × N (2.3)

β ≥ 0 (2.4)

Le parametre β s’interprete comme la vitesse de convergence. Avec ce proces-

sus generateur de donnees on se limite au cas de la convergence absolue1. Les

promoteurs de l’approche classique proclament que l’on peut estimer la vitesse

de convergence en estimant une equation en coupe de la forme2,

gi,T = byi,0 + vi,T (2.5)

ou gi,T ≡ yi,T−yi,0 est le taux de croissance du produit relatif. On note bT,N l’es-

timateur des moindres carres ordinaires dans l’equation [2.5]. Cette procedure

ne peut fournir un estimateur non biaise de la vitesse de convergence que si

les economies croissent le long du sentier de croissance equilibree mondiale a la

date T . Nous savons qu’une economie ne rejoint son etat stationnaire qu’asymp-

totiquement, si on veut montrer que la regression en coupe [2.5] fournit une

estimation convergente de la vitesse de convergence alors on doit se donner

une asymptotique dans les dimensions individuelle (N → ∞) et chronologique

(T →∞).

Proposition 2.1. Si β 6= 0 et si les donnees sont generees conformement

a [2.1], [2.2], [2.3] et [2.4], alors bT,N fournit un estimateur convergent du

parametre β lorsque (T,N) → ∞. Sous ces memes conditions, on a le resultat

asymptotique suivant,

√N (bT,N − b) =⇒

(T,N)→∞N

(0,

σ2u/σ2

y

1− (1− β)2

)(2.6)

Preuve. Voir l’annexe [B]

Cette proposition nous dit qu’il est possible d’estimer le parametre autoregressif

dans [2.1] de facon convergente en resumant la dynamique du produit relatif par

7

son taux de croissance. La regression en coupe nous permet d’estimer la vitesse

de convergence si les economies convergent. Ce resultat est extremement fragile

car les hypotheses formulees sur le processus generateur des donnees sont fortes.

Par exemple, une version stochastique linearisee du modele presente en section

[1] viole ces conditions (voir [6]). Enfin, l’ecriture de la distribution asympto-

tique nous permet de voir que l’estimation est d’autant moins precise que la

vitesse de convergence est faible. Dans l’annexe [B] on voit que l’estimateur en

panel ne partage pas cette propriete asymptotique (il est d’autant plus precis

que la vitesse de convergence est faible

Quelques auteurs se sont attaches a comparer les merites respectifs du pa-

nel et de la cross-section. Shioji [16] affirme que l’approche par la regression

en coupe est preferable dans le sens ou elle permet, contrairement a une ap-

proche en panel (on note bT,N l’estimateur associe), de controler l’effet du cycle

caracterisant les donnees (et qui est sans rapport avec la definition de la vi-

tesse de convergence d’une economie vers son etat stationnaire). Cet argument

est plutot deconcertant. En effet, si les donnees sont caracterisees par du cycle

alors il y a incoherence avec le processus generateur des donnees [2.1] a [2.4]

suppose par l’approche classique, car un processus autoregressif d’ordre un ne

saurait reproduire du cycle. Shioji assimile, de facon contestable d’un point de

vue statistique, cette erreur de specification a une erreur de mesure et montre

que l’estimateur en panel est d’autant moins biaise face a des erreurs de mesure

que l’on retire des observations dans la chronologie du panel. Ainsi, la regression

en coupe, qui ne considere que les conditions initiale et terminale du panel, ap-

paraıt moins influencee par cette source de biais. La proposition suivante etablit

un resultat asymptotique qui confirme l’idee, mal fondee, de Shioji. Avant d’ex-

poser ce resultat nous posons les hypotheses suivantes sur la perturbation {ui,t},

H1 (i) ui,t = Ci(L)εi,t =∑∞

i=1 Ci,jεi,t−j , (ii) εi,t sont identiquement et

independamment distribues dans la coupe et la chronologie, avec E[εi,t] =

0, E[ε2i,t] = 1 et E[ε4i,t] = σ4, (iii) {Ci,j} est une suite de reels verifiant

Cj ≡ supi |Ci,j | < ∞ et∑∞

j=0 jbCj < ∞ pour b ≥ 0.

H2 (i) ω2 = limN→0

N−1∑N

i=1 ω2i < ∞, ou ω2

i = Ci(1)2 est la variance de

8

long terme, (ii) Φ = limN→0

N−1∑N

i=1 ω2i < ∞ mesure la variabilite dans la

coupe des variances de long terme, (iii) λ2 = limN→0

N−1∑N

i=1 λ2i < ∞, ou

λ2i =

∑∞h=1 E[ui,0ui,h]. La variance associee a la perturbation {ui,t} s’ecrit

alors ω2i − 2λ2

i .

Ces hypotheses sont assez generales pour autoriser la presence de cycle (contrai-

rement a la modelisation proposee par [16]).

Proposition 2.2. Si β 6= 0, si les donnees sont generees conformement a [2.1],

[2.3] et [2.4], et si la perturbation {ui,t} verifie les hypotheses H1 et H2 alors

bT,N fournit un estimateur convergent du parametre β mais pas bT,N .


La difference asymptotique obtenue face a la distance entre le DGP de l’ap-

proche classique et les donnees s’explique par le fait que la regression en coupe

n’exploite pas reellement la structure AR(1) contrairement a l’estimateur en

panel et n’est donc pas directement soumis au biais de mauvaise specification.

Au total la regression en coupe pourrait sembler interessante. Cependant sa

facon grossiere de resumer la dimension temporelle caracterisant la dynamique

de la distribution du produit par tete ne permet pas de mettre en oeuvre un

test de convergence. La proposition suivante etablit ce point,

Proposition 2.3. Si β = 0 et si les donnees sont generees conformement a

[2.1], [2.2], [2.3] et [2.4], alors bT,N ne fournit un estimateur convergent du

parametre β lorsque (T, N) →∞, contrairement a bT,N . Sous ces memes condi-

tions, on a le resultat asymptotique suivant,

√N

TbT,N =⇒ N

(0,

σ2u

σ2y

)(2.7)


Lorsque les economies divergent l’estimateur bT,N ne converge pas vers zero.

Puisque bT,N ∼ Op(T12 ), il est possible d’estimer une vitesse de convergence

strictement positive alors que les economies divergent. Ce resultat est evidemment

lie au phenomene de regression specieuse (Phillips [10]). La strategie exploitant

9

pleinement le panel ne souffre pas du defaut caracterisant la regression en coupe,

on a meme un resultat de super-convergence (dans la dimension temporelle) de

l’estimateur de la vitesse de convergence.

Finalement, l’approche par la regression en coupe pour mesurer la vitesse de

convergence des economies n’est pertinente que dans la mesure ou l’on a un a

priori fort : les economies doivent effectivement converger. Pour cette raison il

ne semble pas raisonnable de travailler sur cette base. L’usage de l’estimateur

en panel, dans le cadre de l’approche classique, ne semble pas preferable car

meme s’il fournit une estimation convergente (pour toutes les valeurs de β), il

faut poser des hypotheses importantes sur le processus generateur des donnees

(les perturbations doivent etre iid).

2.2 Une approche alternative

Evans [4] propose une autre procedure pour estimer la vitesse de conver-

gence. Il exploite pleinement la dimension temporelle et suppose que les donnees

sont generees par un processus autoregressif d’ordre p. Dans cette section nous

montrons en quoi son approche n’est pas totalement satisfaisante et proposons

quelques modifications. En particulier nous montrons que l’objet mesure par

Evans ne peut s’interpreter comme une vitesse de convergence.

Pour Evans et karras [5] ou Evans [4], les economies convergent absolument

si elles gravitent (ou ont tendance a graviter) autour d’une unique tendance

commune. Ainsi l’hypothese de convergence d’un ensemble de N economies

peut s’ecrire sous la forme de N − 1 relations de cointegration lineairement

independantes. Par exemple en considerant les ecarts de produit par tete entre

N − 1 economies et une economie leader (les Etats unis). [5], [4] considerent

les deviations du produit par tete (en log) au produit par tete (en log) moyen

dans la coupe des economies. Ils associent la convergence des N economies a la

stationnarite du produit par tete relatif. Ainsi on voit que cette definition de la

convergence generalise la definition donnee dans la section [2.2].

Il est important de noter que, par construction, pour un echantillon de N

economies on ne peut avoir stationnarite du produit relatif pour N−p economies

10

et non stationnarite pour p economies (0 < p < N). Il suffit qu’une seule

economie diverge pour que le produit relatif soit non stationnaire pour toutes

les economies. Cette representation contraint les N−1 relations de cointegration

a etre simultanement realisees.

Si E [yi,t] 6= E [yi′,t] alors la convergence est qualifiee de conditionnelle, un choc

sur l’ecart de log Yi,t a sa cible de long terme log Y .,t + E [yi,t] n’a pas d’effet

permanent. La vitesse de convergence correspond a la vitesse de retour de yi,t

a son niveau de long terme E [yi,t].

Evans [4] caracterise parametriquement le processus {yi,t; i = 1, . . . , N et

t = 1, . . . , T} en supposant qu’il s’agit d’un processus AR(p) specifique a chaque

economie. Il montre que la plus grande racine du polynome retard correspond

a la vitesse de convergence et propose donc l’estimateur suivant de la vitesse de

convergence,

(1− (1− βi))Ai(L)yi,t = δi + εi,t (2.8)

ou Ai(L) est un polynome autoregressif d’ordre (p − 1), δi/Ai(1) correspond

au niveau de long terme de l’economie i, εi,t est un choc iid(0,σ2i ) dans les di-

mensions temporelle et individuelle. Dans ce cadre la vitesse de convergence est

specifique a chaque economie. Evans reporte des estimations ou, au sein d’un

meme echantillon, certaines economies ont une vitesse de convergence negative

(divergence), d’autres une vitesse de convergence positive. Ces resultats contre-

disent la representation de la convergence employee ici (Cf infra). Des estima-

tions reportees par Evans il ressort que log Y .,t ne peut s’interpreter comme la

tendance commune dirigeant la dynamique de croissance mondiale (ou regionale

dans le cas des etats americains). Ainsi les parametres βi ne peuvent pas s’in-

terpreter comme des vitesses d’ajustement (ou de convergence) vers des sentiers

de croissance reguliere paralleles. L’approche proposee par Evans aurait plus de

sens si elle reposait sur un espace de cointegration coherent avec l’approche indi-

viduelle qu’elle adopte. Plutot que de tester individuellement la presence d’une

racine unitaire dans le produit par tete relatif, on pourrait tester la presence

d’une racine unitaire dans les deviations du produit par tete a celui des Etats

Unis (c’est-a-dire ne pas contraindre les N − 1 relations de cointegration a tenir

simultanement). Les N − 1 economies convergent si pour les N − 1 ecarts aux

11

Etats Unis on rejette la presence d’une racine unitaire. Dans ce cas on peut

conclure a la divergence (relativement aux Etats unis) de certaines economies,

mais le parametre βi s’interprete toujours comme une vitesse de convergence

(pour les economies qui convergent).

Dans ce papier nous choisissons plutot une approche en panel en supposant

que la plus grande racine (lie a la vitesse de convergence) est commune dans

la coupe des economies. Comme Evans [4] on utilise l’asymptotique des proces-

sus presque integre pour corriger l’estimateur de la vitesse de convergence des

biais asymptotiques qui l’affecte eventuellement et construire un intervalle de

confiance (voir l’annexe [C] pour une introduction a l’asymptotique des proces-

sus presque integre et pour une description de la methode utilisee ici).

Nous adoptons un processus generateur des donnees plus general que celui

envisage par Evans (a part l’hypothese sur la vitesse de convergence) en ne

specifiant pas une forme parametrique pour le produit par tete relatif,

yi,t = δi + γit + zi,t (2.9)

zi,t = αzi,t−1 + εi,t (2.10)

ou α = ecT ≈ 1 + c

T ∼ 1 + o(1), εi,t est un processus lineaire stationnaire

verifiant les hypotheses H1 et H2. On suppose de plus que supi E[z2i,0] < ∞.

Les economies convergent si c < 0 et γi = γj = 0. Le parametre δi s’interprete

comme le niveau de long terme relatif de l’economie i. La vitesse de convergence

est donnee par β = 1 − α. Phillips et Moon [14] montrent comment estimer le

parametre de localisation c de facon convergente, comment associer un intervalle

de confiance a ce parametre Tβ = −c et comment construire un intervalle de

confiance pour chaque parametre de la partie deterministe du processus (Cf

annexe C).

12

3 Applications

Dans cette section nous mettons en oeuvre la strategie d’estimation de la

vitesse de convergence. On commence par etudier le cas des etats americains

afin de comparer notre approche avec celle proposee par Evans [4]. Puis nous

travaillons sur un echantillon de 50 economies observees de 1965 a 1990 (les

donnees dont extraites des Penn World Tables de Summers et Heston [17])

pour lesquelles nous disposons d’informations sur le produit par travailleur et

le stock de capital par travailleur.

3.1 Vitesse de convergence des etats americains

< A completer >

3.2 Un role pour la technologie

< A completer >

13

Notes

1Cette restriction simplifie l’expose, plus generalement cela revient a sup-poser que l’economiste qui adopte l’approche classique de la convergence peutparfaitement controler l’heterogeneite des etats stationnaires. Il s’agit d’une hy-pothese assez peu vraisemblable, si elle n’est pas verifiee alors les estimateursenvisages par cette approche sont biaises (biais de variable omise).

2Il est inutile d’inclure une constante dans la regression puisque par construc-tion les variables explique et explicative somment a zero. Notons que cette pro-priete entraıne une correlation artificielle, dans la dimension individuelle, entreles perturbations (qui elles aussi doivent sommer a zero). Cette propriete nenous gene pas ici car la correlation disparaıt lorsque N tend vers l’infini et n’adonc pas d’influence asymptotiquement.

References

[1] Moses Abramovitz. Catching-up, forging ahead and falling behind. Journalof Economic History, 46 :385–406, 1986.

[2] Stephane Adjemian. Convergence des productivites europeennes : Tran-sition, rupture et racine unitaire. mimeo, EPEE, Universite d’Evry - Vald’Essonne, Janvier 2002.

[3] In Choi and Byung Chul Ahn. Testing the null of stationarity for multipletime series. journal of Econometrics, 88 :41–77, 1999.

[4] Paul Evans. How do fast economies converge. Review of Economics andStatistics, 79 :219–225, 1997.

[5] Paul Evans and Georgio Karras. Convergence revisited. Journal of Mone-tary Economics, 37 :249–265, 1996.

[6] Wouter J. den Haan. Convergence in stochastic growth models : the im-portance of understanding why income levels differs. Journal of MonetaryEconomics, 35 :65–85, 1995.

[7] Ioannis Karatzas and Steven E. Shreve. Brownian Motion and StochasticCalculus. Springer, New York, 1991.

[8] Daniel Kwiatkowski, Peter C.B. Phillips, Peter Schmidt, and YoungcheolShin. Testing the null hypothesis of stationarity against the alternative ofa unit root : How sure are we that economic time series have a unit root ?Journal of Econometrics, 54 :159–178, 1992.

[9] N.Gregory Mankiw, David Romer, and David N. Weil. A contribution tothe empirics of economic growth. Quaterly Journal of Economics, 107 :407–437, 1992.

[10] Peter C.B. Phillips. Understanding spurious regressions in econometrics.Journal of Econometrics, 33 :311–340, 1986.

[11] Peter C.B. Phillips. Time series regression with a unit root. Econometrica,55 :277–301, 1987.

[12] Peter C.B. Phillips. Towards a unified asymptotic theory of autoregression.Biometrica, 74 :535–548, 1987.

14

[13] Peter C.B. Phillips. Regression theory for near-integrated time series. Eco-nometrica, 56 :1021–1043, 1988.

[14] Peter C.B. Phillips and Hyungsik Moon. Estimation of autoregression rootsnear unity using panel data. Discussion paper, Yale University, January1999.

[15] Peter C.B. Phillips, Hyungsik Moon, and Zhijie Xiao. How to estimateautoregressive roots near unity. Discussion paper, Yale University, July1998.

[16] Etsuro Shioji. Convergence in panel data : Evidence from the skippingestimation. Working paper, Department of Economics and Business, Uni-versitat Pompeu Fabra, August 1997.

[17] Robert Summers and Alan Heston. Penn world tables (mark 5) : An ex-panded set of international comparisons, 1950-1988. Quaterly Journal ofEconomics, 2(106) :327–368, May 1991.

0

0.05

0.1

0

0.05

0.1

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

A(0)K(0)

β

0.02 0.04 0.06 0.08 0.10.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.1

K(0

)

A(0)

0.02

0.02

0.03

0.03

0.03

0.04

0.04

0.04

0.05

0.05

0.06

0.06

Fig. 1 – Vitesse de convergence du produit et conditions initiales. Surla gauche on peut voir la vitesse de convergence du produit en fonction desconditions initiales sur l’efficience et sur le capital. Le graphique sur la droiterepresente les courbes de niveau associees.

15

n x φ σ α ε δ ρ0,01 0,02 0,01 1,5 ? 1 0,05 0,02

Tab. 1 – Valeurs des parametres pour la calibration. Pour ces valeurs onobtient un taux d’interet reel de 5% a l’etat stationnaire.

16

Annexes

A Resolution et linearisation du modele

En ecrivant le Hamiltonien associe au programme du planificateur social etles conditions de Pontryagin, on obtient rapidement la dynamique des variablespar travailleur sous la forme d’une systeme de trois equations,

c(t) = c(t)σ(t)−1 [A(t)F1(k(t), T (t))− δ − ρ]k(t) = A(t)F (k(t), T (t))− (δ + n)k(t)− c(t)A(t) = φ(1−A(t))

(A.1)

En posant k(t) = k(t)/T (t) et c(t) = c(t)/T (t) les variables “detrendees” duprogres technologique, on peut reecrire la dynamique [A.1] de la facon suivante,

˙c(t) = c(t){

σ(t)−1[A(t)F1(k(t), 1)− δ − ρ

]− x

}

˙k(t) = A(t)F (k(t), 1)− (δ + n + x)k(t)− c(t)A(t) = φ(1−A(t))

(A.2)

L’etat stationnaire de cette dynamique est defini par,

c∗ = F(k∗, 1

)− (δ + n + x)k∗

F1

(k∗, 1

)= σx + ρ + δ

A∗ = 1

(A.3)

On verifie facilement que la contrainte de transversalite est verifiee des lors quel’inegalite suivante est verifiee,

ρ− n > (1− σ)x (A.4)

La dynamique linearisee autour de l’etat stationnaire s’ecrit sous forme matri-cielle de la facon suivante,

˙k(t)˙c(t)˙A(t)

=

ρ− n− (1− σ)x − c∗

k∗1k∗

F2

(k∗, 1

)

k∗σ−1F11

(k∗, 1

)0 σ−1F12

(k∗, 1

)

0 0 −φ

k(t)c(t)A(t)

(A.5)

Le polynome caracteristique associe a la dynamique linearisee peut s’ecrire dela facon suivante,

χ(κ) = (κ + φ)P (κ) (A.6)

avecP (κ) = κ2 − κξ + c∗σ−1F11

(k∗, 1

)

et ξ defini dans la section [1]. On note κ2 la racine negative liee a la convergencetechnologique, κ2 = −φ. On montre que les racines du polynome P (κ) sont designes opposes, κ0 > 0 et κ1 < 0. En effet, on a,

κ0 + κ1 = ρ− n− (1− σ)x > 0 (A.7)

κ0κ1 = c∗σ−1F11

(k∗, 1

)< 0 (A.8)

17

L’inegalite [A.7] est necessaire, sinon on viole la condition de transversalite (par[A.4]). L’inegalite [A.8] vient de la convexite de l’ensemble de production. κ1

correspond donc a la vitesse de convergence neo-classique liee a l’accumulationdu capital. Le discriminant associe au polynome du second degre est donne par,

∆ = ξ2 − 4c∗σ−1F11

(k∗, 1

)> 0

En adoptant les notations suivantes pour la part du capital dans la valeur ajouteeet l’elasticite capital–travail,

α(t) =k(t)F1

(k(t), 1

)

F(k(t), 1

)

ε(t) =F1

(k(t), 1

) [F

(k(t), 1

)− k(t)F1

(k(t), 1

)]

k(t)F(k(t), 1

)F11

(k(t), 1

)

On peut alors reecrire le determinant de facon equivalente,

∆ = ξ2 + 4c∗

k∗1− α

σε(r∗ + δ)

ou r∗ est le taux d’interet a l’etat stationnaire. En notant que le ratio consom-mation – capital verifie l’egalite suivante,

c∗

k∗=

r∗ + δ

α− (δ + n + x)

On a finalement,

κ1 =ξ

2− 1

2

√ξ2 +

4(1− α)σε

(ρ + σx + δ)[ρ + σx + δ

α− δ − x− n

](A.9)

La vitesse de convergence neo-classique est donnee par λ1 = −κ1. Notons qu’ellecorrespond a la vitesse de convergence que nous obtiendrions dans un modelede croissance optimale sans dynamique de la productivite.

B Preuves & autres considerations

Preuve de la proposition 2.1 L’estimateur des moindres carres ordinairesdans la regression en coupe est donne par,

bT,N =∑N

i=1 yi,0gi,T∑Ni=1 y2

i,0

= b +∑N

i=1 yi,0εi,T∑Ni=1 y2

i,0

(B.1)

avec b = (1 − β)T − 1 et εi,T =∑T−1

h=0 (1 − β)hui,T−h. Puisque β > 0, onsait que lorsque T tend vers l’infini εi,T tend en loi vers une variable aleatoire

18

εi = limT→∞∑T−1

h=0 (1 − β)hui,T−h de moyenne nulle et de variance finie (=σ2

u/(1− (1− β)2)). On a donc lorsque T tend vers l’infini,

bT,N − b =⇒ N−1∑N

i=1 yi,0εi

N−1∑N

i=1 y2i,0

(B.2)

Puisque ui,t est une innovation, εi est necessairement independant de la condi-tion initiale yi,0. Ainsi l’esperance de yi,0εi doit etre nulle. Par la loi faible desgrands nombres on a finalement le resultat asymptotique suivant,

bT,N − bproba−−−−→N→∞

0 (B.3)

Asymptotiquement l’estimateur des MCO est normalement distribue d’esperancenulle et de variance

V∞[√

NbT,N

]=

σ2u/σ2

y0

1− (1− β)2(B.4)

D’ou le resultat annonce dans la proposition 2.1.

On montre tout aussi facilement que l’estimateur en panel, bT,N , est lui aussiasymptotiquement normalement distribue. Puisque dans ce cas on profite de ladimension temporelle, on a

√NT bT,N − b =⇒

(T,N)→∞N (

0, 1− (1− β)2)

(B.5)

On note que la variance asymptotique est maintenant une fonction croissantede la vitesse de convergence.

Preuve de la proposition 2.2 Le biais asymptotique de l’estimateur en panels’explique evidemment par le probleme d’endogeneite induit par la dependancedans la perturbation. L’absence de biais asymptotique de l’estimateur associe ala regression en coupe s’explique quant a lui par l’hypothese d’exogeneite de lacondition initiale sur le produit relatif.

On remarque que sous les memes conditions que la proposition 2.2, l’estimateurassocie a la regression en coupe est sans biais a distance finie. Ceci n’est valableque si la condition initiale est exogene, sinon l’absence de biais n’est qu’unresultat asymptotique (dans la dimension temporelle).

Preuve de la proposition 2.3 Lorsque β = 0 le taux de croissance du produitrelatif est une marche aleatoire pure. On a

bT,N =∑N

i=1 yi,0

∑T−1t=1 ui,t∑N

i=1 y2i,0

(B.6)

Ainsi lorsque la dimension temporelle tend vers l’infini,

T−12 bT,N =⇒

∑Ni=1 yi,0

∫ 1

0dWi(r)∑N

i=1 y2i,0

≡ N−1∑N

i=1 yi,0W (1)

N−1∑N

i=1 y2i,0

(B.7)

19

ou Wi(r) est le processus de Wiener obtenu en cumulant le processus ui,t. Parhypothese on a donc independance entre Wi(1) et la condition initiale, d’ou parla loi forte des grands nombre,

T−12 bT,N

proba−−−−→N→∞

0 (B.8)

et on a aussi le resultat asymptotique suivant,√

N

TbT,N =⇒ N

(0,

σ2u

σ2y

)(B.9)

par le theoreme central limit. La strategie exploitant pleinement le panel nesouffre pas du defaut caracterisant la regression en coupe, on a meme un resultatde super-convergence (dans la dimension temporelle) de l’estimateur de la vitessede convergence. En effet, on a3

bT,N =∑N

i=1

∑Tt=1 yi,t−1ui,t∑N

i=1

∑Tt=1 y2

i,t−1

T bT,N =∑N

i=1 T−1∑T

t=1 yi,t−1ui,t∑Ni=1 T−2

∑Tt=1 y2

i,t−1

=⇒ N−1∑N

i=1

∫ 1

0Wi(r)dWi(r)

N−1∑N

i=1

∫ 1

0Wi(r)2dr

(B.10)

proba−−−−→N→∞

0 (B.11)

on obtient la limite en probabilite par la loi faible des grands nombres, en notant

que E[∫ 1

0Wi(r)dWi(r)

]= 0 et E

[(∫ 1

0Wi(r)dWi(r)

)2]

= 12 .

D’ou la proposition 2.3.

C Asymptotique des processus presque integres

La litterature concernee par l’approche en serie temporelle de la conclutregulierement a la divergence, en acceptant la presence d’une racine unitaire(voir [2]). Or on sait que les tests de racine unitaire (meme si on utilise la di-mension panel) sont generalement peu puissant lorsque la plus grande racine estproche de l’unite (l’inversion de la nulle et de l’alternative, proposee par exemplepar Kwiatkowski, Phillips, Schmidt et Shin [8], n’arrange pas necessairementchoses, voir Choi et Ahn [3, page 52]). Ainsi il est possible de conclure a ladivergence des economies a tort alors que les processus de, par exemple, pro-duit en deviation au produit moyen sont stationnaires mais caracterises parune dependance importante. Phillips [12] developpe une theorie asymptotiquepour les processus presque integre, celle-ci peut s’averer utile a plus d’un titre.Premierement elle permet de faire le pont entre les theories asymptotiques desprocessus stationnaires et des processus a racine unitaire (dans le sens ou il n’ya pas de discontinuite). Deuxiemement, elle nous permet de construire un inter-valle de confiance pour la plus grande racine (supposee d’autant plus proche del’unite que la taille de l’echantillon augmente) de la dynamique. Ainsi, meme si

20

l’on accepte la presence d’une racine unitaire car un appartient a l’intervalle deconfiance, on peut observer l’etendue des autres valeurs que pourrait prendre laplus grande racine.L’objet de cette annexe est (i) de brievement presenter cette theorie en reprenantpour cela les elements donnes par Phillips [13], (ii) de presenter la procedured’estimation en panel proposee par Phillips et Moon [14].

C.1 Rappels sur les processus presque integres

Soit {ut}∞0 une suite stationnaire de variables aleatoires reelles. On definitla somme partielle St =

∑tτ=1 uτ , avec S0 = 0. On suppose que le processus

stochastique {ut}∞0 est tel que l’on puisse appliquer un theoreme central limitfonctionnel qui assure le resultat asymptotique suivant

YT (r) ≡ T−12 S[rT ] =⇒ ωW (r) ≡ B(r) (C.1)

ou r ∈ [0, 1], [x] designe la partie entiere de x, W (r) est un processus de Wienerstandard et ω2 ≡ limT→∞T−1E

[S2

T

]est la variance de long terme associee au

processus {ut}∞0 . =⇒ designe la convergence en loi lorsque T tend vers l’infini.

On s’interesse au processus defini de la facon suivante,

yt = αyt−1 + ut (C.2)

α = ecT ≈ 1 +

c

T(C.3)

ou T est la taille de l’echantillon. On voit que lorsque T tend vers l’infini, leparametre auto-regressif α tend vers l’unite, ie on se rapproche de la marchealeatoire. Le parametre c, nomme parametre de localisation, ne depend pas dela taille de l’echantillon. Si c = 0 on retrouve l’hypothese de racine unitaire.Lorsque c 6= 0, le parametre de localisation peut etre positif ou negatif, nousinteressons essentiellement au cas c < 0, car il n’y a aucune raison de penserque les processus nous interessant soient explosifs.Dans cette litterature on retrouve regulierement la fonctionnelle de processusde Wiener suivante,

Jc(r) ≡∫ r

0

e(r−s)cdW (s) ≡ W (r) + c

∫ r

0

e(r−s)cW (s)ds (C.4)

Il s’agit d’un processus gaussien d’esperance nulle et de variance∫ r

0e2(r−s)cds

(cela correspond a un processus d’Ornstein–Uhlenbeck, defini comme la solutionde l’equation differentielle stochastique dJc(r) = cJc(r)dr+dW (r), Voir [7, page358]). Par exemple, on montre facilement que T−

12 y[rT ] tend en loi vers ωJc(r)

lorsque T tend vers l’infini. En effet, nous avons,

yt = ecT yt−1 + ut

= e2cT yt−2 + ut + e

cT ut−1

= etcT y0 +

t−1∑

j=0

ejcT ut−j

= etcT y0 +

t∑

j=1

e(t−j)c

T uj (C.5)

21

Ainsi,

T−12 yt = T−

12

t∑

j=1

e(t−j)c

T uj + op(1)

=t∑

j=1

e(t−j)c

T

∫ jT

j−1T

dYT (s) + op(1)

=∫ r

0

e(r−s)cdYT (s) + op(1) (C.6)

On peut reecrire [C.6] de facon equivalente en utilisant l’integration par partie,

T−12 yt = YT (r) + c

∫ r

0

e(r−s)cYT (s)ds + op(1)

=⇒ ωW (r) + cω

∫ r

0

e(r−s)cW (s)ds ≡ ωJc(r) (C.7)

Bien sur, a la limite on retrouve le processus de wiener ωW (r) lorsque le pa-rametre de localisation est nul (il suffit de poser c = 0 dans l’equation [C.4]).Il faut se reporter a Phillips [13] pour une presentation generale des resultatsasymptotiques lies au processus presque integre. On peut alors obtenir la dis-tribution asymptotique de l’estimateur par les moindres carres ordinaires duparametre α dans le modele [C.6]. En utilisant les points (c) et (e) du lemme3.1 dans [13], on a

T (α− α) =T−1

∑Tt=1 yt−1ut

T−2∑T

t=1 y2t−1

=⇒ ω2∫ 1

0W (r)dJc(r) + λ2

ω2∫ 1

0Jc(r)2dr.

(C.8)

ou λ2 est defini comme dans H2. On retrouve donc la propriete de super-convergence du parametre autoregressif. En rappelant que α ≈ 1+ c

T on presente[C.8] de facon equivalente,

T (α− 1) =⇒ c +ω2

∫ 1

0W (r)dJc(r) + λ2

ω2∫ 1

0Jc(r)2dr

(C.9)

On a donc, de facon intuitive puisque lorsque la taille de l’echantillon augmenteon se rapproche de la racine unitaire, une tendance en probabilite de α vers un.L’equation [C.9] montre aussi qu’il n’est pas possible d’estimer simplement (iepar les MCO) le parametre de localisation c de facon convergente, puisque ceparametre peut aussi s’ecrire sous la forme T (α − 1). Phillips, Moon et Xiao[15] donnent l’intuition de cette difficulte. Ils notent que nous pourrions ob-tenir un estimateur du parametre de localisation en regressant ∆yt sur xt ≡T−1yt−1. Puisque T−

12 y[rT ] =⇒ ωJc(r), par le continuous mapping theorem on

a∑T

t=1 x2t =⇒ ω2

∫ 1

0Jc(r)2. Ainsi la variance de la variable explicative xt tend

vers zero lorsque la taille de l’echantillon tend vers l’infini, ie cette variable emetun signal nul asymptotiquement, on ne peut donc estimer de facon convergentele parametre c.

22

Dans la section suivante nous presentons comment Phillips et Moon [14] ex-ploitent la dimension panel pour obtenir une estimation convergente du pa-rametre de localisation (et, ce qui nous interesse plus, comment ils construisentun intervalle de confiance pour le parametre autoregressif commun dans la di-mension individuel).

C.2 Une strategie d’estimation en panel

L’usage de la dimension panel permet d’obtenir une estimation convergentedu parametre de localisation. On considere le modele suivant,

yi,t = αyi,t−1 + ui,t

avec α = ecT et ui,t un processus lineaire stationnaire qui verifie les hypotheses

H1 et H2. On suppose de plus que supi E[yi,0] < ∞.L’intuition est la suivante. En considerant une asymptotique sequentielle (onfait d’abord tendre T vers l’infini, pour N fixe, puis N), on a,

T (α− α) =⇒(

1N

N∑

i=1

ω2i

∫ 1

0

Jc,i(r)2dr

)−1

×

1N

N∑

i=1

(ω2

i

∫ 1

0

Jc,i(r)dWi(r) + λ2i

)(C.10)

Ceci suggere l’utilisation, comme dans Phillips [11], d’un estimateur des MCOmodifie (que nous notons α) pour corriger du biais lie a la dependance tempo-relle. Ainsi, on a

T (α− α) =⇒(

1N

N∑

i=1

∫ 1

0

Jc,i(r)2dr

)−1

×

1N

N∑

i=1

(∫ 1

0

Jc,i(r)dWi(r))

(C.11)

En notant que l’esperance du numerateur est nulle et que sa variance est finie,on sait (par la loi des grands nombres) que le numerateur tend vers zero enprobabilite. Ainsi T (α− α) tend vers zero en probabilite et donc c converge enprobabilite vers c. L’exploitation de la variabilite dans la dimension individuellenous permet d’identifier le parametre de localisation.La procedure d’estimation convergente paraıt relativement simple. Mais ce modelen’est pas assez generale, en particulier il n’autorise pas en l’etat la prise encompte d’une partie deterministe. L’introduction d’une tendance polynomialequ’il faudra estimer, va entraıner une source de biais supplementaire (l’extrac-tion de la tendance estimee introduit une correlation entre le processus filtre etla perturbation stationnaire du modele). Phillips et Moon [14] proposent unecorrection asymptotique de ce biais. Ils considerent le modele suivant,

zi,t = βi,0 + βi,1t + yi, t (C.12)yi,t = αyi,t−1 + ui,t (C.13)

23

avec toujours α = ecT et ui,t un processus lineaire stationnaire. Le residu ob-

tenu en regressant, pour chaque individu, le processus zi,t sur une constanteet une tendance lineaire constitue une filtration du processus de sa tendancedeterministe, on notera zi,t. Les deux auteurs calculent le biais asymptotiquede l’estimateur de α corrige de la dependance temporelle dans la perturbationstationnaire. Cet estimateur est donne par

α+ =

(N∑

i=1

T∑t=1

z2i,t−1

)−1 N∑

i=1

T∑t=1

(zi,t−1zi,t − T λ2

i

)(C.14)

ou λ2i est un estimateur non parametrique de λ2

i . En faisant tendre T vers l’infini,on a

T (α+ − α) =⇒(

N−1N∑

i=1

∫ 1

0

J2c,i(r)

)−1

N−1N∑

i=1

∫ 1

0

Jc,idWi(r) (C.15)

ou Jc,i est une fonctionnelle du processus d’Ornstein–Uhlenbeck, obtenu commela limite de T−

12 zi,t−1. Phillips et Moon calculent l’esperance du numerateur

puis du denominateur de cette expression asymptotique et appliquent la loifaible des grands nombres (les variances sont finies) pour obtenir,

T (α+ − α)proba−−−−→N→∞

w2(c)w1(c)

(C.16)

c+ proba−−−−→N→∞

c +w2(c)w1(c)

≡ F (c) (C.17)

L’estimateur du parametre de localisation, comme attendu, est asymptotique-ment biaise. En notant que le biais asymptotique ne depend que du parametre delocalisation, Phillips et Moon montrent que celui-ci est asymptotiquement iden-tifiable si on suppose qu’il est negatif. Pour cela il suffit d’evaluer numeriquementle biais asymptotique, ou de facon equivalente la fonction reciproque de F.Enfin, Phillips et Moon montrent que

c+ − F (c) =⇒ N (0, N−1ΦVbc+(c)) (C.18)

Vbc+(c) = w1(c)−4(−w2(c) w1(c)

)V (c)

(−w2(c)w1(c)

)(C.19)

Φ = limN→∞

N∑

i=1

ω4i (C.20)

et ou V (c) est une matrice 2× 2 dont l’expression analytique donnee dans [14,pages 28-30]. En pratique on obtient cette matrice de variance-covariance avecdes methodes d’integration numerique.Ces derniers resultats nous permettent de construire des intervalles de confianceasymptotiques pour le parametre de localisation.

24

Vitesse de Convergence et Technologiet2m.univ-paris1.fr/fr/activites/attach/speed.pdf · ¡–...

Documents

Transcript of Vitesse de Convergence et Technologiet2m.univ-paris1.fr/fr/activites/attach/speed.pdf · ¡–...