cap3 Modelul unifactorial

3 Modelul unifactorial

3.1 Specificarea şi definirea modelului unifactorial

Specificarea unui model econometric se face pe baza teoriei economice a fenomenului observat şi constă în precizarea variabilei endogene şi a variabilei exogene.

Un model unifactorial se prezintă astfel:

uxfy += )( (3.1.1)

unde:

y = - variabila endogenă sau rezultativă; ( nyyy ,,, 21 K )

)

)x = - variabila exogenă sau factorială sau cauzală; ( nxxx ,,, 21 K

u= - variabila reziduală, aleatoare sau eroare. ( nuuu ,,, 21 K

Relaţia (3.1.1) reprezintă o ipoteză construită pe baza teoriei

economice şi presupune că fenomenul economic y este rezultatul acţiunii unui complex de factori: fenomenul economic x este factorul principal, esenţial, ce determină fenomenul y, restul factorilor fiind consideraţi neesenţiali, cu acţiune întâmplătoare, ei fiind specificaţi în modelul econometric cu ajutorul variabilei aleatoare u. Ca orice ipoteză teoretică, ea poate fi adevărată sau falsă – x este sau nu este factorul hotărâtor al fenomenului y – iar validarea sau invalidarea unei astfel de ipoteze se face în urma unui „experiment” statistic.

Modele econometrice

Teoria economică a folosit şi foloseşte în numeroase cazuri modelul unifactorial pentru a fundamenta şi descrie mecanismul de formare şi de manifestare a legilor economice. În acest sens, pot fi menţionate:

- legea cererii C = f(P) + u ; f’(P) < 0 cererea (C) unui anumit produs creşte sau se reduce, dacă preţul (P) acestuia se micşorează sau se măreşte;

- legea ofertei O = g(P) + u ; g’(P) > 0 oferta (O) unui produs creşte sau se diminuează, dacă preţul (P) acestuia se măreşte sau scade;

- funcţia de producţie a cheltuielilor totale ale unei firme: Ch = f(Q) + u; f’(Q) > 0 cheltuielile de producţie cresc sau scad, dacă volumul producţiei creşte sau scade (în situaţia în care productivitatea rămâne constantă);

- legile consumului – formulate de Engel şi descrise de funcţiile lui Tornqvist – consideră venitul (V) consumatorului ca principal factor al consumului (C) unui produs sau grupe de produse C = f(V) + u; f’(V)>0.

De asemenea, foarte multe analize economice utilizează modelul unifactorial pentru a explica şi prospecta dependenţa dintre două fenomene, cum ar fi:

- corelaţia dintre creşterea preţurilor şi creşterea salariilor;

- corelaţia dintre creşterea preţurilor şi rata şomajului – curba lui Philips;

- corelaţia dintre creşterea salariilor şi productivitatea muncii etc.

3.2 Identificarea modelului unifactorial

Identificarea modelului constă în alegerea unei funcţii (sau a unui grup de funcţii) matematice, cu ajutorul căreia se urmăreşte să se descrie (să se aproximeze) valorile variabilei endogene y numai în funcţie de variaţia variabilei exogene x. Funcţiile matematice care se pot utiliza în acest sens – funcţii liniare sau neliniare – sunt numeroase şi de forme diverse, printre acestea figurând şi cele prezentate în continuare.

Modelul unifactorial

1. Funcţia liniară 2. Funcţia semilogaritmică

- a

a,b >0

a<0, b>0

a>0, b<0

x0

a

a

y y

x 0

b>0

b<0

y = a + b x + u y = a + b log x + u

b<0

b>0 nivel de saturaţie

y y

0 < b <1

b > 1

b < 0

b = 1

x

a 0

x 0

3. Funcţia putere şi funcţia logaritmică 4. Funcţia inversă (hiperbola)

y = axb + u uxbay ++=

log y = log a + b log x + u sau log y = a + b log x + u

Modele econometrice

5. Funcţia loginversă

uxbaylog ++=

exp (a)

b<0

x 0

nivel de saturaţie

0

yM

cb2

−

b>0

y y

y

yM

ym

0

7. Parabola debxay ++=

6. Fun

ylog

130262

−cb,

b, c >0

a<0 c>0 b>0

gradul II ucx +2

cţia log-loginversă

uxlogcxba +++=

cb3026,2 x

b, c >0

x

a, c < 0, b > 0

a, c > 0, b < 0


y

ym

yM

0 xc

b,

e 230262−

a, c < 0,b > 0

a, c > 0,b < 0

8. Parabola logaritmică ( ) uxcxbay +++= 2loglog

I

x

II

III

Nivel de saturaţie

Nivel de saturaţie

0

y a II a I

C

9. Funcţiile lui Tornquist

cx;cb;c,a;ubxcxaxy.III

cx;cb;c,a;ubxcxay.II

b,a;ubx

xay.I

≥−>>++−

=

≥−>>++−

=

>++

=

0

0

0

Modele econometrice

a > 0, b > 0

a > 0, b < 0

y yM

0

⎟⎠⎞

⎜⎝⎛ +−

ab,

e302621

10. Funcţia lui Konius ( ) uxlogbaxy ++=

(2)Nivel de saturaţie b<0

b<0

b>0

(1)(3)y

(

(

(

c

x0

11. Funcţia logistică

Alegerea unei anumite funcţii matematice ca

unui model econometric – Y = f(x) – se face pe bazempirice ale celor două fenomene economice, sistespaţiale (yi, xi,), ni ,1= , n = numărul unităţilor statiss-au înregistrat, într-o anumită perioadă de timp, fenomene y şi x, fie în serii de timp (yt, xt ), nt ,1= , n =

x

1) uecy xba +

+=

+1

2) ue

cy xba ++

=+ log1

3) u

e

cyxba+

+

=+

1

funcţie de regresie a a valorilor reale sau

matizate, fie în serii tice omogene la care valorile celor două numărul perioadelor


de timp în care s-au înregistrat valorile celor două fenomene y şi x la aceeaşi unitate statistică.

Dispunând de o serie statistică privind variaţia, în timp sau în spaţiu, a celor două variabile economice (vezi tabelul 3.2.1), problema identificării constă în a alege o funcţie matematică, Yt = f(xt), cu ajutorul căreia, cunoscând valorile fenomenului economic xt, să se aproximeze (să se estimeze) cât mai bine (cu erori cât mai mici) valorile empirice ale fenomenului yt = (y1, y2, _ _ _, yn) prin valorile teoretice.

Tabelul 3.2.1 xt yt

1

1

−

−

−−

=tt

tti xx

yycm 1

1

1

1

−

−

−

−

−−

⋅=tt

tt

t

ti xx

yyyxce

x1 y1 -- -- x2 y2

212

12 cmxxyy

=−−

12

12

1

12 xx

yyyxce

−−

⋅=

M M M M xn yn

nnn

nn cmxxyy

=−−

−

−

1

1 1nn

1nn

1n

1nn xx

yyyxce

−

−

−

−

−−

⋅=

Această operaţie se poate face, în general, utilizând următoarele

procedee de lucru: a) procedeul grafic; b) procedeul conservării ariilor; c) procedeul calculelor algebrice.

Modele econometrice

a) Procedeul grafic constă în construirea corelogramei dintre cele două variabile:

ymax

y1

L

y

x 0 L

S

Figura 3.2.1

La construirea corelogramei, scala pe cele două axe, Oy şi Ox, trebuie să se calculeze pe baza următoarei reguli:

Lxx

LA

cm 1 :Ox maxx 1−= ≈

Lyy

LA

cm 1 :Oy maxy 1−=≈

adică variaţia fiecărei variabile, exprimată prin amplitudinea acesteia, Ax şi Ay, este reprezentată printr-un un segment de dreaptă având aceeaşi lungime, L, pe cele două axe. În acest mod, intensitatea legăturii dintre cele două variabile, exprimată prin amplitudinea acestora, nu este viciată de grafic – prin aplatizarea sau alungirea acestuia.

Prin unirea cu segmente de dreaptă a punctelor N(xt, yt) se obţine graficul punctelor empirice – vezi Figura 3.2.1. În funcţie de forma graficului punctelor empirice se alege o funcţie matematică al cărei grafic aproximează cel mai bine graficul punctelor empirice.


În urma acestei operaţii se va alege: - funcţia liniară: Yt = a + b xt – dacă curba empirică poate fi

aproximată cu o dreaptă; - funcţia putere: Yt = a xt

b – dacă curba empirică poate fi aproximată cu curba acestei funcţii;

sau ln Yt =ln a + b ln xt – dacă curba empirică poate fi aproximată cu o dreaptă pe un grafic dublu logaritmic;

0 ln x

ln y

- funcţia exponenţială: Yt = ea+bxt - dacă curba empirică poate fi aproximată cu graficul acestei funcţii,

sau ln Yt = a + b xt – dacă curba empirică poate fi aproximată cu o dreaptă pe un grafic semilogaritmic;

0 x

ln y

e Yt = a b xt Yt = ln a + b ln xt

Modele econometrice

0 ln x

y

b) Procedeul conservării ariilor continuă procedeul grafic şi constă în a compara suprafaţa curbei empirice „S” – vezi figura 3.2.1 – cu suprafeţele teoretice Sj, ale celor h, hj ,1= , funcţii matematice: j = 1 funcţia liniară, j = 2 funcţia putere etc.

Suprafaţa aferentă curbei empirice „S” se va calcula prin însumarea suprafeţelor trapezelor al căror număr, (n-1), depinde de numărul punctelor empirice N(xt, yt), nt ,1= , iar suprafeţele teoretice ale funcţiilor matematice, acceptate în urma vizualizării curbei empirice, se vor calcula cu ajutorul formulei:

( )∫=max

1

x

xjj dxxfS

În final, alegerea celei mai adecvate funcţii de regresie se poate face cu ajutorul următoarei reguli:

j

j

j SSS −

min

c) Procedeul calculelor algebrice se fundamentează pe proprietăţile pe care le posedă funcţiile matematice y = f(x) privind următorii indicatori:

- xyCm∂∂

= – viteza de variaţie absolută a funcţiei sau coeficientul

marginal;

- xxfy )(

= – viteza medie de variaţie a funcţiei (valoarea medie);


- xlnyln

xx:

yyCe

∂∂

=∂∂

= – viteza de variaţie relativă a funcţiei sau

coeficientul de elasticitate. În acest sens, vom exemplifica proprietăţile acestor indicatori pentru

câteva categorii de funcţii de regresie. Deoarece x şi y descriu fenomene economice valorile lor trebuie să

fie pozitive. Deci funcţiile de regresie sunt definite pe intervalul [0;+∞] →[0;+∞]. Variabila y reprezintă variabila efect, iar variabila x variabila cauză.

1. y = a + bx

În cazul în care parametrul b este pozitiv se spune că există o dependenţă directă între cauză şi efect, iar când parametrul b este negativ se spune că există o dependenţă inversă între cauză şi efect.

Parametrul a reprezintă valoarea efectului atunci când cauza este egală cu zero.

Parametrii a şi b nu pot fi în acelaşi timp negativi deoarece s-ar obţine pentru y doar valori negative.

În funcţie de valorile parametrilor a şi b există trei cazuri: y y

a, b≥ 0

x

a

x

ba

−

y

x

ba

−

a<0 b>0

a>0 b<0

a

Modele econometrice

x

b<0 Cm

b1. a) byCm x =′= b

b>0 Cm

x

În cazul în care b>0, la o creştere cu o unitate a lui x îi va corespunde

o creştere cu b unităţi a lui y. În cazul în care b>0, la o creştere cu o unitate a lui x îi va corespunde o scădere cu b unităţi a lui y. y

1. b) xab

xyy +==

bylimx

=∞→

;

∞=→

ylimx 0

, pentru a> 0

−∞=→

ylimx 0

, pentru a< 0 b

y

x b

y

a>0, b<0

a>0, b>0

b

x a<0, b>0 x

b

y x

a<0, b<0

În cazul în care cauza este maximă, aceasta tinde spre infinit, efectul mediu fiind egal cu b. Atunci când cauza tinde către zero, iar parametrul a este pozitiv, efectul mediu (efectul pe fiecare unitate de cauză) va tinde să fie maxim, spre infinit, iar dacă parametrul a este negativ, efectul mediu tinde să fie minim, spre minus infinit.


1

x

Ce

1. c) bxa

bxyxyCe x +=⋅′=

; 0Celim0x

=→

1Celimx

=∞→

Coeficientul de elasticitate exprimă cu câte procente se modifică

efectul atunci când cauza se modifică cu un procent. Se observă că, la o modificare cu un procent a cauzei, pentru valori mici ale acesteia, tinzând către zero, efectul nu se modifică cu nici un procent. În cazul valorilor mari ale cauzei, modificarea cu un procent a acesteia implică o modificare cu un procent a efectului. Indiferent de valorile cauzei, unei modificări de un procent a acesteia îi vor corespunde modificări ale efectului cuprinse între zero şi unu.

2. xbay += ; a, b>0

a

x

y +∞=>→

ylim0x0x

aylimx

=∞→

⇒<−=′ 0xby

2 y este

descrescător

Modele econometrice

2. a) 2x

bCm −=

Cm

x −∞=

>→

Cmlim0x0x

; 0Cmlimx

=∞→

( ) ( ) ( )( )

⇒=⋅⋅−=′322

xx2b2x

x

1-bCm

Cm e crescător pe (0, +∞)

cauzevalorcauzevaria

y

pe unfiecadeci,

Deci, la creşteri ale cauzei, efectul scade. Pentru valori mici ale i modificările efectului sunt foarte mari, tinzând spre infinit, iar pentru i foarte mari ale cauzei, modificările efectului, ca urmare a modificării i, tind spre zero. Cu cât valorile cauzei sunt mai mari, cu atât efectul

ză mai puţin la variaţiile cauzei.

2. b) 2x

bxay +=

+∞=>→

ylimxx

00

0ylimx

=∞→

⎟⎠⎞

⎜⎝⎛ +

−=⋅−−=′x

baxx12x

)(xb

xa)y(

2222x

Deoarece x>0, a, b>0 0)y( x <′⇒

y⇒ descrescător x

În cazul în care cauza tinde spre infinit, efectul mediu, adică efectul itatea de cauză este zero. Atunci când cauza tinde către zero, efectul pe

re unitate de cauză tinde spre infinit. Efectul mediu este descrescător, cu cât cauza este mai mare, efectul pe unitatea de cauză este mai mic.


2. c) bax

byxyCe x +

−=⋅′=

1Celim

0x0x

−=>→

0Celimx

=∞→

⇒>+

=⋅+−

⋅−=′ 022x b)(ax

abab)(ax

1b)()(Ce

Ce este crescător

-1

Ce

x

Se observă că, la o modificare cu un procent a cauzei, pentru valori

mici ale acesteia, tinzând către zero, efectul se modifică (scade) cu un procent. În cazul valorilor mari ale cauzei, modificarea cu un procent a acesteia nu implică nici o modificare a efectului. Indiferent de valorile cauzei, la modificări (creşteri) cu un procent ale acesteia le corespund modificări (scăderi) ale efectului cuprinse între zero şi unu. Cu cât valorile cauzei sunt mai mari, cu atât modificările relative ale efectului sunt mai mici.

3. y = a + bx + cx2 , a, b şi c nu sunt toţi egali cu zero. Graficul acestei funcţii depinde de parametrii a, b şi c. De exemplu,

pentru a>0, b<0, c>0 se obţine următorul grafic:

2cbx0b2cxy x −=⇒=+=′

⇒>=′′ 02cy x x corespunde lui y minim

⎭⎬⎫

⎩⎨⎧

−⎟⎠⎞

⎜⎝⎛−

4c∆;

2cby min

3. a) b2cxyCm x +=′=

2cb

− a x1

x2

4c

∆−

y

x

Modele econometrice

Dacă c este negativ, atunci Cm este descrescător, deci variaţiile efectului ca răspuns la variaţia cauzei sunt din ce în ce mai mici. Dacă b este pozitiv, înseamnă că, pentru o cauză mai mică decât –b/2c, efectul creşte ca urmare a creşterii cauzei. Pentru o cauză mai mare decât –b/2c efectul scade ca urmare a creşterii cauzei. Dacă b este negativ, efectul va scădea ca urmare a creşterii cauzei.

În cazul în care c este pozitiv, Cm este crescător, deci variaţiile efectului ca urmare a variaţiilor cauzei sunt din ce în ce mai mari. Dacă b este negativ, înseamnă că, pentru o cauză mai mică decât –b/2c efectul scade ca urmare a creşterii cauzei. Pentru o cauză mai mare decât –b/2c, efectul creşte ca urmare a creşterii cauzei. Dacă b este pozitiv, efectul va creşte ca urmare a creşterii cauzei.

b<0

b>0

b

Cm c>0

x

2cb

−

3. b) x

cxbxay2++

=

- pentru a, c>0: +∞=

∞→ylim

x

+∞==+

>→ 0

aylim0x0x

c

a

y

ac2b +

xcax

xacx)y( 1,2

0x

2

2

x =⇒−

=′≥

bac2ca)y( +=⎟⎟⎠

⎞⎜⎜⎝

⎛


x 0 ca

+ +∞

x)y( ′ ------------- 0 + + + + + + +

y | +∞ ac2b + +∞

3.c) 2

2

cxbxa2cxbx

yxyCe

+++

=⋅′=

0 x

2

Ce

2Celimx

=∞→

0Celim0x

=→

4. y = axb, a>0 deoarece y trebuie să fie pozitiv, iar fucţia putere este

o funcţie pozitivă şi b≠1, deoarece altfel s-ar obţine o funcţie liniară.

4. a) Cm = abxb-1 grafic similar cu cel al funcţiei iniţiale ⇒

4. b) ⇒⋅== −1bxaxyy grafic similar cu cel al funcţiei iniţiale

4. c) bxax.xba

yxyCe

b1b =

⋅⋅⋅=⋅= −

Modele econometrice

b

b b<0

b>0Ce

x

Dacă b este cuprins între zero şi unu, atunci cauza variază în acelaşi

sens cu efectul, dar coeficientul marginal fiind descrescător, înseamnă că variaţiile efectului sunt din ce în ce mai mici. De asemenea, şi efectul pe unitatea de cauză este cu atât mai mic cu cât cauza este mai mare. Totuşi, dacă există o variaţie de un procent a cauzei, efectul va varia cu b procente, indiferent de mărimea cauzei.

Dacă b este mai mic decât unu, atunci cauza variază în sens invers efectului. Coeficientul marginal fiind descrescător, înseamnă că variaţiile efectului sunt din ce în ce mai mici. De asemenea, şi efectul pe unitatea de cauză este cu atât mai mic cu cât cauza este mai mare. Dacă există o variaţie de un procent a cauzei, efectul va varia cu b procente, indiferent de mărimea cauzei.

Dacă b este mai mare decât unu, atunci cauza variază în acelaşi sens cu efectul. Coeficientul marginal fiind crescător, înseamnă că variaţiile efectului sunt din ce în ce mai mari. De asemenea, şi efectul pe unitatea de cauză este cu atât mai mare cu cât cauza este mai mare. Dacă există o variaţie de un procent a cauzei, efectul va varia cu b procente, indiferent de mărimea cauzei.

Prin compararea proprietăţilor indicatorilor teoretici ai funcţiilor de regresie – variaţie continuă – cu indicatorii empirici – variaţie discretă – ai celor două variabile, calculaţi pe baza seriei statistice –

1

1

1

1

1

1 :;−

−

−

−

−

− −−=

−−

=t

tt

t

tti

tt

tti x

xxy

yyce

xxyy

cm – se va putea alege acea

funcţie de regresie ai cărei indicatori au proprietăţi apropiate cu indicatorii empirici.


De exemplu, dacă coeficienţii marginali ai variabilei y în raport de variabila x, calculaţi pe baza seriei statistice sunt aproximativ egali:

;1

1

23

23

12

12 n1, t ctxxyy

xxyy

xxyy

nn

nn =∀≈−−

≈≈−−

≈−−

−

−K se va alege

funcţia liniară - Yt = a + b xt, sau funcţia putere - Yt = axtb - în cazul în care

coeficienţii empirici de elasticitate vor fi aproximativ egali:

1

1

1

1

23

23

2

2

12

12

1

1

−

−

−

−−−

⋅≈≈−−

⋅≈−−

⋅nn

nn

n

nxxyy

yx

xxyy

yx

xxyy

yx

K

De reţinut că, în economia reală, datele statistice relevă corelaţii

diverse şi contradictorii, care nu pot fi descrise cu o singură funcţie matematică. În astfel de cazuri se recomandă ca identificarea modelului econometric să se facă cu ajutorul mai multor funcţii de regresie, urmând ca, în final – în etapa de verificare a modelului –, să se decidă asupra unei singure forme a modelului.

3.3 Estimarea parametrilor unui model econometric unifactorial

Parametrii unui model econometric sunt reprezentaţi de coeficienţii funcţiei de regresie acceptată în etapa de identificare a acestuia. Aceşti parametrii fiind necunoscuţi, ei vor trebui estimaţi (aproximaţi) pe baza datelor experimentale sistematizate în seriile statistice ale celor două variabile y şi x, prin valorile yt, xt, nt ,1= .

Funcţiile de regresie ale unui model econometric unifactorial pot fi funcţii linare, Y= a + bx, sau funcţii neliniare, ca de exemplu:

- funcţia putere – Yt = a xtb ;

- funcţia exponenţială – Yt = ea+bxt ; - funcţia de gradul doi – Yt = a + bxt + cxt

2 ;

- funcţia logistică –tbxat

ecY++

=1

.

Modele econometrice

Deoarece, în numeroase cazuri, funcţiile neliniare (curbilinii) pot fi liniarizate, estimarea parametrilor unui model econometric se va axa numai pe cazul modelelor liniare. Liniarizarea unui model neliniar se poate face prin mai multe procedee, cum ar fi: logaritmarea modelului econometric, schimbări de variabilă, stabilirea arbitrară a valorii unor parametri etc.

De exemplu:

Liniarizarea prin logaritmare

1) Fie modelul neliniar exprimat prin funcţia putere – yt = a xtb ut.

Prin transformare logaritmică acesta devine: ln yt = ln a +b ln xt + ln ut,

sau yt

* = A + b xt* + ut

* unde:

yt* = ln yt;

A = ln a; xt

* = ln xt;

ut*= ln ut.

2) Cazul modelului neliniar exponenţial – yt = ea+bxt ut Prin logaritmare acesta devine: ln yt = a + b xt + ln ut yt

* = a + b xt + ut*

Liniarizarea prin schimbare de variabile Fie modelul neliniar – yt = b0 + b1x + b2xt

2 + _ _ _ + bkxtk + ut

Notând cu: x1t = xt; x2t = xt2;…, xkt = xt

k, se obţine modelul liniar multifactorial:

yt = b0 + b1 x1t + b2 x2t + … + bk xkt + ut

Liniarizarea prin fixarea arbitrară a valorii unor parametri Acest model poate fi aplicat atunci când, pe baza unei analize

economice a fenomenelor studiate, se poate evalua valoarea unui parametru.


De exemplu, funcţia logistică se pretează foarte bine la descrierea evoluţiei consumului (y) unui anumit produs în funcţie de venitul consumatorului (x). Dar, consumul unui anumit produs are anumite limite raţionale, respectiv un nivel de saturaţie, nivel estimat prin parametrul „e” al funcţiei logistice. Stabilind valoarea parametrului prin constanta „c” – acest lucru se poate face, fie prin calcule statistice de specialitate, fie prin preluarea valorii acestuia de la o ţară dezvoltată unde consumul acelui produs s-a stabilizat – funcţia logistică se poate transforma într-o funcţie liniară:

⇒+=⎟⎠

⎞⎜⎝

⎛ −⇒=⎟⎠

⎞⎜⎝

⎛ −⇒+

= ++ t

t

bxa

tbxat bxa

yclne

yc

ecy t

t11

1

yt* = a + b xt, unde:

yclny

tt ⎟

⎠

⎞⎜⎝

⎛ −=∗ 1

Revenind la problema estimării parametrilor unui model

econometric, aceştia pot fi calculaţi cu ajutorul mai multor metode cum ar fi:

a) metoda punctelor empirice (M.P.E.); b) metoda punctelor medii (M.P.M.); c) metoda celor mai mici pătrate (M.C.M.M.P.); d) metoda celor mai mici pătrate generalizată; e) metoda verosimilităţii maxime (M.V.M) cu informaţie limitată

sau completă. Metodele a) şi b) se folosesc atunci când nu se urmăreşte o rigoare

statistică a calculelor, datorită simplităţii şi rapidităţii calculelor, sau când aplicarea M.C.M.M.P. este anevoioasă, necesitând calcule complicate.

Metodele d) şi e) au mai mult valoare teoretică deoarece, în economie, ipotezele pe care se fundamentează pot fi acceptate cu multă reţinere, în plus, calculele complicate pe care le solicită, măresc mult costul estimării parametrilor, fără a genera o creştere pe măsură a preciziei estimaţiilor.

Modele econometrice

Estimarea parametrilor unui model liniar unifactorial presupune: - existenţa seriei statistice a celor două variabile economice

Tabelul 3.3.1

xt yt xt2 xt yt tt xbay += ttt yyu −= 2)ˆ( tu

x1

|

||

xn

y1

|

||

yn

x12

|

||

xn2

x1 y1

|

||

xn yn

11 xbay +=

|

||

nn xbay +=

111 yyu −=

|

||

| nnn yyu −=

21)ˆ(u

|

|| 2)ˆ( nu

Σ xt Σ yt Σ xt2 Σ xt yt ∑ ty 0ˆ =∑ tu ∑ 2)ˆ( tu

- modelul econometric liniar: yt = a + bxt + ut (3.3.1)

tt xbay += (3.3.2)

ttt yyu −= (3.3.3)

unde:

yt, xt = valorile empirice ale variabilelor; a, b = parametrii modelului;

b ,a = estimaţiile parametrilor modelului;

ut = variabila eroare;

tu = estimaţia lui ut.

- utilizarea unei metode de estimare pentru a calcula estimatorii parametrilor modelului.

În acest sens ne referim la: a) Metoda punctelor empirice (M.P.E.) - constă în alegerea unui

număr de puncte empirice, M(xt, yt), egal cu numărul parametrilor modelului. Coordonatele acestor puncte se introduc în funcţia de regresie a modelului şi va rezulta un sistem de ecuaţii egal cu numărul acestora. De


exemplu, în cazul modelului liniar -vezi relaţia (3.3.1) - vor trebui alese două puncte. Fie acestea, M3(x3, y3) şi M8(x8, y8):

8

3

8

3

8

3

88

33

88

33

1111

b ;

11

ˆˆˆ

ˆˆ

xxyy

xxxyxy

axbay

xbay==⇒

⎪⎭

⎪⎬⎫

+=

+=

De regulă, alegerea punctelor empirice se face, fie pe baza

reprezentării grafice a celor două serii statistice, în sensul că acestea ar trebui să fie foarte aproape de dreapta virtual trasată sau să fie intersectate de aceasta, fie prin aprecierea că aceste puncte sunt reprezentative pentru caracterizarea variaţiilor celor două fenomene şi nu sunt rezultatul unor condiţii speciale.

b) Metoda punctelor medii (M.P.M.) – presupune ca cele două serii

statistice să fie împărţite într-un număr de subserii egal cu numărul estimatorilor. Pentru fiecare subserie se vor calcula mediile aritmetice ale celor două variabile. Aceste valori medii se vor introduce în funcţia de regresie şi se va continua procedura ca în cazul M.P.E. Dacă numărul termenilor seriilor statistice nu este divizibil cu numărul parametrilor, se va renunţa la un număr de termeni – cei mai îndepărtaţi în timp sau de media celor două variabile. De exemplu, în cazul modelului liniar, numărul parametrilor este egal cu doi. Dacă seriile de timp ale celor două variabile se referă la nouă perioade, 9,1=t , se va renunţa la valorile primei perioade, respectiv la x1 şi y1. În acest caz, cele două serii vor fi:

( )

( )54321

54321

5

5

4

4

3

3

2

2

4141

yyyyy

xxxxx

yx

yx

yx

yx

+++=

+++=⇒⎟⎟⎠

⎞⎜⎜⎝

⎛ ;

Modele econometrice

( )

( )98762

98762

9

9

8

8

7

7

6

6

4141

yyyyy

xxxxx

yx

yx

yx

yx

+++=

+++=⇒⎟⎟⎠

⎞⎜⎜⎝

⎛

Prin introducerea acestor valori în relaţia (3.3.2) rezultă:

2

1

2

1

2

1

22

11

22

11

1111

ˆ;

11

ˆˆˆ

ˆˆ

xxyy

b

xxxyxy

ayxba

yxba==⇒

⎪⎭

⎪⎬⎫

=+

=+

c) Metoda celor mai mici pătrate (M.C.M.M.P.) – este tehnica de

lucru cea mai des folosită la estimarea parametrilor unui model econometric. Utilizarea acestei metode porneşte de la următoarele relaţii:

yt = a + bxt + ut

tt xbay +=

ttttt xbayyyu −−=−=

unde:

yt, xt = valorile reale ale celor două fenomene economice existente în seriile statistice ale acestora;

ty = valorile teoretice ale variabilei y, obţinute numai în funcţie de valorile factorului esenţial xt şi de valorile estimatorilor

parametrilor a şi b, respectiv ; ba ˆ şi ˆ

tu = estimaţiile valorilor variabile reziduale ut.

Practic, M.C.M.M.P. constă în a minimiza funcţia:

( ) ( ) ( )∑ −−=∑ −===

n

ttt

n

ttt xbayminyyminb,aF

1

2

1

2 (3.3.4)


adică a minimiza suma pătratelor distanţelor, faţă de axa OY, dintre valorile reale, yt, şi valorile teoretice, . ty

Condiţia de minim a funcţiei (3.3.4) rezultă din:

( )( ) ( 0ˆˆ01ˆˆ20ˆ

)ˆ,ˆ(

1

=−−⇒=−−−⇒=∂

∂ ∑∑=

tt

n

ttt xbayxbay

abaF ) (3.3.5)

( )( ) ( ) 0ˆˆ0ˆˆ20ˆ)ˆ,ˆ( 2

1

=−−⇒=−−−⇒=∂

∂ ∑∑=

ttttt

n

ttt xbxaxyxxbay

bbaF (3.3.6)

sistem de ecuaţii ce devine în final:

⎪⎪⎩

⎪⎪⎨

⎧

∑=∑⋅+∑⋅

∑=∑⋅+

=

==

n

ttttt

n

tt

n

tt

xyxbxa

yxban

1

2

11 (3.3.7)

din care se vor calcula valorile estimatorilor:

- estimaţia parametrului a

xbyany

nx

ban

*yxban tttt −=⇔∑=∑+⇔∑=∑+

1 (3.3.8)

- estimaţia parametrului b

( ) 2222

2 xnx

y*xn

xy

xxn

xyxyn

xxxnxyx

yn

bt

tt

tt

tttt

tt

t

ttt

t

−∑

−∑

=∑−∑

∑ ∑−∑=

∑∑∑

∑∑∑

= (3.3.9)

- dispersia variabilei x

( ) ( )=+∑−∑=∑ +−

=∑ −=σ 2

22222 2

2x

nx

xnx

nxxxx

nxx ttttt

x

Modele econometrice

22

222

2 xnx

xxnx tt −∑=+−∑=

2x

tt y*xn

xy

bσ

−∑

=⇒

- covarianţa dintre variabilele y şi x

( ) ( )( ) ( )−∑=∑ ⋅+−−

=∑ −−=

nyx

nyxyxyxyx

nyyxx

x,ycov tttttttt

yxn

yxyxyxxy

nyx

yxny

xnx

y titttt ⋅−∑

=⋅+⋅−⋅−∑

=⋅+∑

−∑

−

( ) ( )( )( )∑ −

∑ −−=

σ=⇒

22 xx

yyxxx,ycovbt

tt

x

(3.3.10)

- coeficientul de corelaţie liniară a celor două variabile

x

y

y

x

yxxyrbbxyrxyyxrxyr

σσ

σσ

σσ⋅=⇒⋅=⇒== ),(ˆˆ),(),cov(),(),( (3.3.11)

unde: σy, σx = abaterile medii pătratice ale variabilelor y şi x.

Sistemul de ecuaţii, format din relaţiile (3.3.5) şi (3.3.6), rezultat în urma aplicării M.C.M.M.P., poartă numele şi de sistem de ecuaţii normale. Acest sistem de ecuaţii posedă câteva proprietăţi cum ar fi:

Din ecuaţia (3.3.5) se deduce că:

1) ( ) 0)ˆ(0ˆˆˆ =⇒=∑=∑ −− tt

tt

tt uMuxbay – variabila aleatoare ut

este de sumă nulă şi, evident, de medie zero;


2) ( ) ( ) ∑=∑⇒=∑ −=∑ −−t

tt

tt

ttt

tt yyyyxbay 0 – suma

valorilor empirice (∑ ) este egală cu suma informaţiilor teoretice ( )

– principiul conservării informaţiilor. t

ty ∑t

ty

Din rezolvarea sistemului de ecuaţii rezultă că:

3) xbya ˆˆ −= – dreapta de regresie, tt xbay += , trasată pe baza

M.C.M.M.P., trece prin punctul ),( yxM – vezi figura 3.3.1;

4) ( )( )

( )

( )( )[ ] ( )( )

( )=

∑ −

∑−−

⋅−−=

∑ −

∑ −−=

22ˆ

xx

xxxx

xxyy

xx

xxyyb

t

t

ttt

t

ttt

( )

( )

( )[ ]( )

⇒∑ −

∑ −=

∑ −

∑ ⎥⎦⎤

⎢⎣⎡ −⋅

−−

=

tt

ttt

t

tt

t

t

xx

xxb

xx

xxxxyy

2

2

2

2

panta dreptei de regresie,

, este o medie aritmetică a pantelor dreptelor ce pot fi trasate

prin punctele

tt xbay ˆˆˆ +=

),( yxM şi , respectiv ),( ttt yxMxxyy

bt

tt −

−= , ponderate

cu pătratul abaterilor, 2)( xx t − , variabilei factoriale x – vezi figura 3.3.1.

Modele econometrice

x

xxyyb

−−

=1

11

xxyyb

−−

=2

22 bxay +=ˆ

M

2M

1M

x xn x2 x1

y yn

y

y2

y1

0

Figura 3.3.1

( ) ( ) ( )( ) ( ) ( )22

22

1

2222

211

xxxxxxxxbxxbxxbb

n

nn

−++−+−−++−+−

=K

K

După estimarea parametrilor a şi b prin valorile se vor

putea calcula valorile teoretice ale fenomenului explicat y,

ba ˆ şi ˆ

tt xbay += , şi

apoi estimaţiile variabilei aleatoare u, prin ttt yyu −= (vezi tabelul 3.3.1,

coloanele 5 şi 6). 3.4 Verificarea modelului econometric

Întrucât modelul econometric, în etapele de specificare, identificare

şi estimare, se fundamentează pe acceptarea unor ipoteze de lucru, cât şi pe date experimentale de sondaj, este necesar ca, înainte de utilizarea sa ca instrument pertinent scopului urmărit, acesta să fie verificat (testat, filtrat). În această etapă se pune problema similitudinii dintre modelul economic real, descris de seriile statistice ale fenomenelor analizate, şi modelul teoretic, de natură econometrică, construit şi rezolvat.


În economie, spre deosebire de domeniul tehnic, de exemplu, nu putem vorbi de o similitudine absolută între modelul teoretic şi modelul real (cum poate să existe între macheta unei clădiri şi clădirea construită), ci de o similitudine statistică între cele două modele, în sensul că modelul econometric posedă şi descrie în mare (în medie) principalele caracteristici ale modelului economic real.

Practic, acceptarea econometrică a modelului teoretic ca model similar, ca aproximaţie statistică echivalentă cu modelul real, presupune:

3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea parametrilor unui model econometric

3.4.2 Verificarea semnificaţiei estimatorilor pararametrilor modelului econometric

3.4.3 Verificarea similitudinii modelului econometric

3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea parametrilor unui model econometric

În general, estimatorul sau estimaţia este o aproximaţie a unei

dimensiuni privind un anumit fenomen. Această dimensiune (volum, suprafaţă, valoare etc.) exactă, stabilă şi repetabilă, adică constantă, reprezintă parametrul (măsura) unei caracteristici, al unei însuşiri a unităţilor statistice.

Statistica calculează parametrii caracteristicilor unităţilor statistice ale unei populaţii în urma unei observări totale asupra colectivităţii statistice. Dacă datele privind valorile caracteristicilor provin dintr-o observare selectivă (sondaj), indicatorii calculaţi din aceste date reprezintă estimaţiile statistice ale parametrilor, adică ale indicatorilor care s-ar fi obţinut din prelucrarea datelor provenite dintr-o observare totală. Dar statistica nu foloseşte orice fel de aproximaţii, de estimaţii ale parametrilor, ci numai estimaţii de maximă verosimilitate1.

1 Vezi teorema 2 şi 3.

Modele econometrice

Din acest motiv, estimarea parametrilor unui model econometric se fundamentează pe câteva ipoteze pe care trebuie să le posede modelul econometric – yt = a + bxt + ut.

Aceste ipoteze se referă la: I1: Cele două variabile yt şi xt sunt observate fără erori de măsură. ut

este o variabilă aleatoare, iar variabila xt este un fenomen cu valori predeterminate => variabila explicată yt este la rândul ei o variabilă aleatoare;

I2: Variabila aleatoare ut este de medie nulă, M(ut) = 0, şi de dispersie constantă, n1, t ,)()()( 22

22

12 =∀==== unuDuDuD σK .

Ipoteza I2 presupune că erorile ut sunt homoscedastice şi nu

heteroscedastice ; 222

21

2un )u(D)u(D)u(D σ≠≠≠≠ K

I3: Valorile variabilei reziduale sunt independente (nu sunt corelate), adică nu există fenomenul de autocorelare a erorilor:

teautocorela sunt erorile ji 0,teindependen sunt erorile ji 0,

)u,ucov( ji⎩⎨⎧

⇒≠≠⇒≠

=

I4: Variabila aleatoare ut urmează distribuţia normală, de medie zero şi de abatere medie pătratică constantă şi egală cu

ctuu == 2σσ , respectiv L(ut) = N(0, σu)

Dacă aceste ipoteze pot fi acceptate, iar estimarea parametrilor

modelului liniar unifactorial – yt = a + bxt + ut – , atunci se pot demonstra următoarele:

Se efectuează o selecţie de volum n, adică se observă valorile caracteristicii x şi, pentru fiecare valoare observată, valorile caracteristicii

. Se obţine astfel selecţia: (xt,yt)t=1,….,n. Pe baza acestei selecţii

se estimează parametrii a şi b din modelul de regresie liniară -yt =a+bxt+ut.. txx yy

t==/


Parametrii a şi b pot fi estimaţi prin: - metoda celor mai mici pătrate prin care se minimizează suma

pătratelor erorilor, adică funcţia:

( ) ( )∑ −−=∑===

n

ttt

n

tt xbayminuminb,aF

1

2

1

2

- metoda verosimilităţii maxime prin care se maximizează funcţia

de verosimilitate, adică:

( ) ( ) ( ) ( ) n1tyfyfyfbayL n21t ,;...,; =⋅⋅⋅= , unde f este

repartiţia caracteristicii y.

Teorema 1 Dacă variabila reziduală ut este repartizată normal, având media

egală cu zero şi abaterea medie pătratică σu, atunci metoda verosimilităţii maxime este echivalentă cu metoda celor mai mici pătrate.

Demonstraţie În cazul modelului liniar ubxay ++= , u este repartizată N(0, σu),

ceea ce este echivalent cu y repartizată N(a+bx, σ). Funcţia de verosimilitate a caracteristicii y este:

( ) ( ) ( ) ( )nt yf...yfyfb,a;yL ⋅⋅⋅= 21

( )( ) ( )

⇒⋅⋅=−−−−−−

2

2

2112 2

12

1

21

21 nn xbayxbay

t e...eb,a;yL σσ

σπσπ

⇒ ( ) ( )∑⋅⎟

⎠

⎞⎜⎝

⎛= =

−−−n

ttt xbayn

t ebayL 1

22

ˆˆ2

1

21ˆ,ˆ; σ

σπ

Modele econometrice

Metoda verosimilităţii maxime presupune maximizarea funcţiei de verosimilitate:

( )⎥⎥⎦

⎤

⎢⎢⎣

⎡−−−⎟⎟

⎠

⎞⎜⎜⎝

⎛=⇔ ∑

=

n

ttt

n

bat

bat

baxbaybayLbayL

1

2

2,,,ˆˆ

21

21lnmax)ˆ,ˆ,(lnmax)ˆ,ˆ,(max

σσπ

Deoarece σ este constant, =⎟⎟⎠

⎞⎜⎜⎝

⎛n

lnσπ2

1 k = constant.

( ) ( )

( ) ( )baFkxbayk

xbaykxbay

ba

n

tttba

n

ttt

ba

n

ttt

n

ba

ˆ,ˆmin2

1ˆˆmin2

1

ˆˆ2

1maxˆˆ2

121lnmax

,21

2

,2

1

2

2,1

2

2,

⎟⎠

⎞⎜⎝

⎛−+=⎥⎥⎦

⎤

⎢⎢⎣

⎡−−⎟

⎠

⎞⎜⎝

⎛−+=

=⎥⎥⎦

⎤

⎢⎢⎣

⎡−−−+=

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡−−−⎟⎟

⎠

⎞⎜⎜⎝

⎛

∑

∑∑

=

==

σσ

σσσπ

În concluzie, a determina maximul funcţiei de verosimilitate este

echivalent cu a determina minimul sumei pătratelor erorilor.

Observaţie Se ştie că estimatorii de verosimilitate maximă sunt estimatori

nedeplasaţi, consistenţi şi eficienţi, adică: - b)b(M ,a)a(M == (estimatorii sunt nedeplasaţi);

- (estimatorii sunt consistenţi); bb ,aa pp ⎯→⎯⎯→⎯

- orice alt estimator pentru a şi b are dispersia mai mare decât dispersia lui a şi b (estimatorii sunt eficienţi).

În cazul repartiţiei normale a variabilei reziduale, estimatorii obţinuţi prin metoda celor mai mici pătrate sunt nedeplasaţi, consistenţi şi eficienţi. În consecinţă, aceşti estimatori pot fi consideraţi drept cei mai buni în procesul de decizie sau de modelare econometrică.


Teorema 2 Dacă variabila reziduală este repartizată normal, având media egală

cu zero şi dispersia , atunci b.ctu =2σ ˆ este repartizat ( ) ⎟

⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −=

n

tt

u

xx,bN

1

2

2σ.

Demonstraţie

( )( )( )

( ) ( )( )

( )( )

∑=∑ −

∑ −=

∑ −

∑ −−∑ −=

∑ −

∑ −−=

=

=

=

=

==

=

= n

tttn

tt

n

ttt

n

tt

n

tt

n

ttt

n

tt

n

ttt

yxx

xxy

xx

xxyxxy

xx

xxyyb

1

1

21

1

211

1

21 α

unde:

( )∑ −

−=

=

n

tt

tt

xx

xx

1

2α

( ) ( )uttut ,bxaN~y,N~u σσ +⇒0 , t = 1, … , n

În concluzie, b fiind combinaţie liniară de variabile aleatoare repartizate normal, este şi el repartizat normal.

∑+∑=∑ +=∑=====

n

ttt

n

tt

n

ttt

n

ttt xba)bxa()y(M)b(M

1111αααα

∑=∑===

n

ttu

n

ttt )y(D)b(D

1

22

1

222 ασα

Se calculează:

0)(

)(

1

1

21=

−

−= ∑

∑∑

=

=

=

n

tn

tt

tn

tt

xx

xxα

Modele econometrice

( )( ) ( ) ( )

12

1

2

2

11

2

1

1

211

2

1

21=

∑ −

+∑−∑=∑

∑ −

∑−∑=

∑ −

−=∑

=

==

=

=

==

=

= n

tt

n

tt

n

ttn

t n

tt

n

tt

n

tt

n

tt

ttt

n

tt

xx

xnxxx

xx

xxx

xx

xxxxα

( )( ) ( )∑ −

=∑

⎥⎦⎤

⎢⎣⎡∑ −

−=∑

=

=

=

= n

tt

n

t n

tt

tn

tt

xxxx

xx

1

21 2

1

2

2

1

2 1α

Deci:

b)b(M =

( )∑ −=

=

n

tt

u

xx)b(D

1

2

22 σ


cu zero şi dispersia , atunci a este repartizat .ctu =2σ ˆ

( ) ⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −+⋅

=

n

tt

uxx

xn

,aN

1

2

22 1σ .

Demonstraţie

∑=∑ ⎟⎠⎞

⎜⎝⎛ −=∑−

∑=−=

===

= n

ttt

n

ttt

n

ttt

n

tt

yyxn

yxn

yxbya

111

1 1 βαα

unde:

tt xn

αβ −=1 , t =1,…., n



În concluzie, a fiind combinaţie liniară de variabile aleatoare repartizate normal, este şi el repartizat normal.

∑+∑=∑ +=∑=====

n

ttt

n

tt

n

ttt

n

ttt xba)bxa()y(M)a(M

1111ββββ

∑=∑===

n

ttu

n

ttt )y(D)a(D

1

22

1

222 βσβ

Se calculează:

111111

=∑−=∑ ⎥⎦⎤

⎢⎣⎡ −=∑

===

n

tt

n

tt

n

tt xx

nααβ

011 11

=∑ ∑−=⎥⎦⎤

⎢⎣⎡ −=∑

= ==

n

t

n

tttttt

n

tt xxxxx

nx ααβ

( )∑ −+=∑ ∑+∑−=⎥⎦

⎤⎢⎣⎡ −=∑

=

= === n

tt

n

t

n

tt

n

ttt

n

tt

xx

xn

xnx

nx

n1

2

2

1 1

22

1

2

1

2 1211 αααβ

Deci:

( ) ⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −+=

=

=

n

tt

uxx

xn

)a(D

a)a(M

1

2

222 1σ

Teorema 4 Dacă x0 este fixat, iar variabila reziduală este repartizată normal,

având media egală cu zero şi dispersia , atunci .ctu =2σ 0xbay += este

repartizat ( )( ) ⎟

⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−++

=

n

tt

uxx

xxn

,bxaN

1

2

202

01σ .

Modele econometrice

Demonstraţie

( ) ( )

( ) ∑=∑ ⎥⎦⎤

⎢⎣⎡ −+=

=∑−+∑

=−+=+=

==

=

=

n

ttt

n

ttt

n

ttt

n

tt

yyxxn

yxxn

yxxbyxbay

110

10

100

1 γα

α

unde:

( ) tt xxn

αγ −+= 01 , t = 1, …, n


Deci, fiind combinaţie liniară de variabile aleatoare repartizate

normal, este şi el repartizat normal. y

∑+∑=∑ +=∑=====

∧ n

ttt

n

tt

n

ttt

n

ttt xba)bxa()y(M)y(M

1111γγγβ

( ) ( ) ( )∑ −−=∑ −===

n

ttt

n

ttt xbayminyyminb,aF

1

2

1

2

Se calculează:

( ) ( ) 1111

01

01

=∑−+=∑ ⎥⎦⎤

⎢⎣⎡ −+=∑

===

n

tt

n

tt

n

tt xxxx

nααγ

( ) ( ) ( ) 001 1

001

1 xxxxxxxxxxxn

xn

t

n

tttttt

n

tt =−+=∑ ∑−+=⎥⎦

⎤⎢⎣⎡ −+=∑

= ==ααγ

( ) ( ) ( ) ( )( )∑ −

−+=∑ ∑−+∑

−+=⎥⎦

⎤⎢⎣⎡ −+=∑

=

= ===n

tt

n

t

n

tt

n

ttt

n

tt

xx

xxn

xxn

xxn

xxn

1

2

20

1 1

220

1

02

01

2 1211 αααγ


Deci:

( )( ) ⎟

⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−+=

+=

=

n

tt

uxx

xxn

)y(D

bxa)y(M

1

2

2022

0

1σ


cu zero şi dispersia , atunci eroarea previziunii, ,

t = 1, .., n, este repartizată

.ctu =2σ ttt yyu −=

( )( ) ⎟

⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−−−

=

n

tt

tu

xx

xxn

,N

1

2

22 110 σ .

Demonstraţie

ttttt xbayyyu −−=−=

unde:

a , b sunt repartizaţi normal ˆ


În concluzie, fiind combinaţie liniară de variabile aleatoare

repartizate normal, este şi ea repartizată normal. tu

0=−−+=+−=−= ttttttt bxabxa)xba(M)y(M)yy(M)u(M

( ) ( ) ( ) ( )( ) ( ) ( ) ( )2222222 ˆˆ2ˆ)ˆ(ˆˆˆ tttttttttt yMyyMyMyyMuMuMuMuD +−=−==−= 22222 )()()()( tuttt bxayMyDyM ++=+= σ

( )2

1

2

22222 1

tn

tt

tuttt bxa

)xx(

)xx(n

)y(M)y(D)y(M ++⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−+=+=

=

σ

Modele econometrice

))ˆˆ(()(

))ˆˆ(())ˆˆ)(((())ˆˆ)((()ˆ(2

ttt

ttttttttt

xbauMbxa

xbauMxbabxaMxbaubxaMyyM

+++=

++++=+++=

⇒⎪⎭

⎪⎬

⎫

∑=

+−=+

=

n

kkk

tttt

yb

))xbxby(u(M))xba(u(M

1α

)uyx(M)uyx(M)yu(M

yxyxyuM))xba(u(M

n

ktkkt

n

ktkkt

n

kkkt

n

kkkttt

∑+∑−=

=⎥⎦

⎤⎢⎣

⎡⎟⎠⎞

⎜⎝⎛ ∑+∑−=+

==

==

11

11

αα

αα

22

1

111utt

n

kkt n

)u(Mn

)uy(Mn

)yu(M σ==∑==

(deoarece erorile sunt necorelate între ele)

)()()(111∑∑∑===

==n

ktkk

n

ktkk

n

ktkk uyMxuyMxuyxM ααα

)()()(111∑∑∑===

==n

ktkkt

n

ktkkt

n

ktkkt uyMxuyMxuyxM ααα

2

1

2

111

11

)(

)(

)()()()())((

))(()(

σ

αααα

αα

∑

∑∑∑

∑∑

=

===

==

−

−=

++=++=

=++=

n

tt

t

ttt

n

ktkk

n

ktkk

n

ktkk

n

ktkkk

n

ktkk

xx

xx

uuMuMbxauuMubxaM

uubxaMuyM

Deci:

∑ −

−+=+

=

n

tt

tutt

)xx(

)xx(n

))xba(u(M

1

2

221 σ


Din relaţiile anterioare rezultă că:

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−−−=+−

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−+−

−++⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−+⋅+++=

==

=

n

tt

tutn

tt

tu

tn

tt

tutut

)xx(

)xx(n

)bxa()xx(

)xx(n

)bxa()xx(

)xx(n

)bxa()u(D

1

2

222

1

2

22

2

1

2

22222

11212

1

σσ

σσ


cu zero şi dispersia , atunci .ctu =2σ ∑=

∧

−

n

ttu

n 1

2

21 este un estimator

nedeplasat pentru dispersia variabilei reziduale . 2uσ

Demonstraţie Trebuie demonstrat că:

2

1

2

21

un

ttu

nM σ=⎟

⎠⎞

⎜⎝⎛

∑− =

Folosind teorema anterioară rezultă că:

22

1

2

1

2

2

1

1

2

2

1

2

1

2

1

2

12

1112

1

21

21

21

uun

tt

n

tt

un

t n

tt

t

n

tt

n

tt

n

tt

)xx(

)xx(n

n)xx(

)xx(nn

)u(Dn

)u(Mn

un

M

σσσ =⋅⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

∑ −−−

−=⋅∑

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−−−

−=

=∑−

=∑−

=⎟⎠⎞

⎜⎝⎛

∑−

=

=

=

=

===

Modele econometrice


cu zero şi dispersia , atunci eroarea previziunii .ctu =2σ τττ +++ −= nnn yyu ,

este repartizată ( )( ) ⎟

⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−++

=

+n

tt

nu

xx

xxn

,N

1

2

22 110 τσ , pentru orice τ.

Demonstraţie Se reia demonstraţia teoremei 5, unde t se înlocuieşte cu τ+n şi,

deoarece τ+n este mai mare ca n, pentru orice k = 1,.., n, ,

rezultă că: şi

0)( =+τnkuuM

0)(1

=∑=

+

n

knkk uyM τα 0)( =+ yuM n τ .

Deci 0=+ ++ ))xba(u(M nn ττ

În final, rezultă că:

( ) ( ) ( )( )

( ) −++⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

∑ −

−+++++= +

=

+++

2

1

2

22222 11 τ

τττ σσ nn

tt

nunun bxa

xx

xxn

bxauD

( ) ( )( ) ⎟⎟

⎟⎟

⎠

⎞

⎜⎜⎜⎜

⎝

⎛

−

−++=+−

∑=

++ n

tt

nun

xx

xxn

bxa

1

2

222 112 τ

τ σ

Demonstraţia pentru normalitate şi valoarea medie este identică cu cea de la teorema 5.

Deoarece, cele patru ipoteze, I1, I2, I3 şi I4, au fost acceptate a priori în etapa de estimare a parametrilor, în această etapă urmează ca ele să fie testate, iar eventualele abateri de la cerinţele lor să fie corectate prin utilizarea unor proceduri econometrice adecvate fiecărei abateri.


De regulă, în cazul unui număr mare al observaţiilor efectuate nt ,1= , α→n , ipoteza de normalitate a variabilei eroare ut se acceptă fără

rezerve. Verificarea ipotezelor de fundamentare a M.C.M.M.P. I1 Variabilele x şi y nu sunt afectate de erori de măsură. Această ipoteză se poate verifica cu regula celor trei sigma, regulă

care constă în verificarea următoarelor relaţii: ( ) xtxxt 3xx3x3xx σσσ +<<−⇔±∈ ( ) ytyyt 3yy3y3yy σσσ +<<−⇔±∈

unde:

( )n

xx 2t

x∑ −

=σ

( )n

yy 2t

y∑ −

=σ

Dacă valorile acestor variabile aparţin intervalelor ( )xt 3xx σ±∈ şi

( )yt 3yy σ±∈ , ipoteza de mai sus poate fi acceptată fără rezerve. Această ipoteză, referitoare la calitatea datelor înregistrate, se

consideră rezolvată în etapa de prelucrare a datelor observate statistic sau, cel mai târziu, în etapa de identificare a modelului.

I2 Ipoteza de homoscedasticitate a variabilei reziduale – Variabila aleatoare (reziduală) u este de medie nulă , iar

dispersia ei este constantă şi independentă de X.

( ) 0=uM2us

Pe baza acestei ipoteze se poate admite că legătura dintre Y şi X este relativ stabilă. Contrariul acestei ipoteze este heteroscedasticitatea.

În cazul modelului liniar ttt ubxay ++= , reziduurile

ttttt xbayyyu −−=−= sunt homoscedastice dacă dispersiile lor sunt

constante şi egale cu dispersiile teoretice, pentru orice t şi sunt independente de variabila exogenă x.

Modele econometrice

ntuMs utu ,1)(,)ˆ( 222ˆ =∀== σ

Contrariul homoscedasticităţii este heteroscedasticitatea, care

înseamnă că erorile nu au dispersiile egale ci diferite: . 222

22

1 un )u(M...)u(M)u(M σ≠≠≠≠

Dacă dispersiile nu mai sunt egale, estimatorii rămân nedeplasaţi, dar nu mai sunt eficace, M.C.M.M.P. conducând la o subestimare a parametrilor modelului, influenţând sensibil şi calitatea diferitelor teste statistice aplicate acestuia.

Depistarea heteroscedasticităţii se poate realiza prin mai multe procedee:

I2.1) Procedeul grafic - care constă în construirea corelogramei privind valorile variabilei factoriale x şi ale variabilei reziduale u. Dacă, pe măsura creşterii (scăderii) valorilor variabilei factoriale x, se observă o creştere (scădere) a valorilor variabilei reziduale u, înseamnă că cele două variabile sunt corelate şi nu independente.

x

u

x

u

Figura 3.4.1 Corelare pozitivă Figura 3.4.2 Corelare negativă

I2.2) Procedeul dispersiilor variabilei reziduale Acest procedeu se poate aplica atunci când se dispune de serii lungi

de date. În acest caz, seria valorilor variabilei reziduale se împarte în două sau mai multe grupe, pentru fiecare grupă calculându-se dispersiiile corespunzătoare ( ). Dacă se acceptă ipoteza că dispersiile acestor

grupe nu diferă semnificativ, se acceptă ipoteza de homoscedasticitate şi se utilizează testul Fisher-Snedecor.

,...s,s uu22

21


- dacă , atunci se acceptă ipoteza I2; 2221 uu ss ≈

- dacă , atunci se respinge ipoteza I2. 2221 uu ss ≠

Testul Fisher-Snedecor constă în calcularea raportului dintre cele

două dispersii (dispersia având valoarea cea mai mare fiind plasată la numărător; iar dacă numărul de termeni ai seriei este impar se recomandă eliminarea termenului din mijlocul seriei, astfel încât să se ajungă la subeşantioane egale):

∑

∑

+=

=

⎟⎠⎞

⎜⎝⎛ −−

⎟⎠⎞

⎜⎝⎛ −−

== n

nt

n

t

u

uc knu

knu

s

sF

12

22

2/

1

21

2

2

21/

21/

2

1 (3.4.1)

- dacă

⎟⎠⎞

⎜⎝⎛ −−

⎟⎠⎞

⎜⎝⎛ −−>

21

;2

1;

knknc FFα

, atunci ipoteza de homoscedasticitate este

infirmată, deci erorile sunt heteroscedastice, eliminarea acestui fenomen făcându-se cu ajutorul metodei regresiei ponderate; - dacă

⎟⎠⎞

⎜⎝⎛ −−

⎟⎠⎞

⎜⎝⎛ −−≤

21

;2

1;

knknc FFα

atunci se acceptă ipoteza de

homoscedasticitate.

I2.3) Calculul coeficientului de corelaţie liniară simplă ( ) ( )( ) ( )

xu

tt

xu

tt

xuxu n

xxun

xxuuxurσσσσσσ

∑ −=∑ −−

==,cov

/ (3.4.2)

- dacă valoarea coeficientului de corelaţie liniară este aproximativ egală cu zero – ru/x ≅ 0, atunci se acceptă ipoteza de homoscedasticitate, variabilele u şi x fiind independente;

- dacă valoarea coeficientului de corelaţie liniară este diferită de zero – ru/x ≠ 0, atunci se respinge ipoteza de homoscedasticitate.

Modele econometrice

I2.4) Acceptarea sau respingerea ipotezei de homoscedasticitate se mai poate realiza şi cu ajutorul metodei analizei variaţiei.

Cele două restricţii enunţate mai sus se realizează dacă variabila reziduală u şi variabila explicativă x sunt independente. Pe această premisă se fundamentează utilizarea metodei analizei variaţiei la acceptarea sau respingerea ipotezei de homoscedasticitate.

Metoda analizei variaţiei porneşte de la relaţia:

yyyyyy tttt −+−=−

( ) ( )22 yyyyyy tttt −+−=−

[ ]∑ −+−=∑ −==

n

tttt

n

tt )yy()yy()yy(

1

2

1

2 (3.4.3)

( ) ( ) ( )[ ] ( ) ( ) ( )( ) (3.4.4) ∑ −−+∑ −+∑ −=∑ −+−=∑ −=====

n

tttt

n

ttt

n

tt

n

tttt

n

tt yyyyyyyy)yyyyyy

11

2

1

2

1

2

1

2 2

Dar ttt ubxay ++= ;

xbayxbay tt +=⇒+=

ttt yyu −=

),cov(ˆ2)(ˆ2

ˆ)ˆˆˆˆ(2)ˆ)(ˆ(21

tttt

tt

n

tttt

xubnnnuxxb

uxbaxbaYyyY

=−=

=−−+=−−⇒

∑

∑∑=

Dacă împărţim relaţia (3.4.4) la n ),cov(ˆ22

ˆ22

0 xubux ++=⇒ σσσ

Pentru ca egalitatea să se verifice este necesar ca: Acceptarea ipotezei I2 pe baza analizei variaţiei constă

în efectuarea următoarelor calcule:

)0(0),cov( ≠= bxu


-

-⎪⎪⎭

⎪⎪⎬

⎫

=∑ −

=∑ −

=∑ −

CYy

ByY

Ayy

2tt

2t

2t

)ˆ(

)ˆ(

)(

Dacă se constacesta trebuie eliminaparametrilor modeluluiestimatorilor, aceştia ne

I2.5) Estimarea

estimatorilor paramecazul unui model conţin

Heteroscedasticcorespunzătoare eroriloparametrilor modeluluiaplicarea M.C.M.M.Pmodelului, influenţând modelului.

În cazul unuparametrilor modelulu

( ) ( )YXXXB ′⋅′= −1ˆ . M

acestuia este de form

matricei varianţelor şiaplicarea M.C.M.M.Pconvergenţi şi nedeplasfost verificate în preaformă este, în general, regresiei ponderate în vse obţină estimatori con 1 Conform Wiliam H. Green

p. 384-392

dacă A=B+C, atunci variabilele ut şi xt sunt independente şi se acceptă I2;

dacă A≠B+C atunci ut şi xt sunt corelate şi se respinge I2

ată existenţa fenomenului de heteroscedasticitate, t deoarece prezenţa lui determină subestimarea

şi obţinerea de valori viciate, fiind afectată calitatea maifiind eficienţi (dispersie minimă).

unei matrici a covarianţelor corespunzătoare trilor modelului1 adecvată aplicării M.C.M.M.P. în ând erori heteroscedastice.

itatea erorilor implică faptul că dispersiile r nu mai sunt egale, ci diferite, caz în care estimatorii rămân nedeplasaţi, dar nu mai sunt eficace. Astfel, . va conduce la o subestimare a parametrilor sensibil şi calitatea diferitelor teste statistice aplicate

i model multifactorial, vectorul estimatorilor i se calculează, matriceal, cu ajutorul relaţiei: atricea varianţelor şi covarianţelor corespunzătoare

a: ( ) ( ) 12 −′⋅= XXBV uσ 2. Acest mod de calcul al

covarianţelor este valabil doar în cazul în care . conduce la obţinerea de estimatori eficienţi, aţi, deci ipotezele corespunzătoare acestei metode au labil. În cazul unor erori heteroscedastice, a căror necunoscută, este posibil, ca prin aplicarea metodei ederea eliminării heteroscedasticităţii erorilor, să nu sistenţi. White a arătat că este posibil să se calculeze

e, Econometric Analysis, 2d ed., Macmillan, New York, 1993,

Modele econometrice

un estimator adecvat al matricei covarianţelor corespunzătoare estimatorilor parametrilor modelului, chiar dacă există o relaţie de dependenţă între erorile heteroscedatice şi variabilele exogene incluse în model, pe care a denumit-o matricea covarianţelor estimatorilor consistenţi heteroscedastici (HCCME), de forma:

( ) ( ) ( ) 1

1

21 −

=

− ′⎟⎠

⎞⎜⎝

⎛ ′′−

= ∑ XXxxuXXkn

nBVn

ttttW (3.4.5)

unde:

n = numărul de observaţii; k = numărul regresorilor; ut = variabila reziduală.

Prin aplicarea acestei matrici, estimaţiile punctuale ale parametrilor nu vor suferi modificări, ci doar abaterile standard corespunzătoare parametrilor. Utilizarea acestei matrici va permite observarea mai rapidă a prezenţei fenomenului de heteroscedasticitate a erorilor. Astfel, abaterile standard vor putea fi mai mari sau mai mici comparativ cu cele obţinute în cazul modelului iniţial, iar valorile mai mici înregistrate de testul Student, t, vor semnaliza faptul că estimatorii parametrilor sunt nesemnificativi, deci posibila prezenţă a erorilor heteroscedastice.

I2.6) Testul Goldfeld-Quandt3 Acest test se poate aplica atunci când se dispune de serii lungi de

date şi când una dintre variabile reprezintă cauza heteroscedasticităţii (între dispersia variabilei reziduale heteroscedastică şi variabila exogenă există o relaţie de dependenţă pozitivă), şi presupune parcurgerea următoarelor etape:

• ordonarea crescătoare a observaţiilor în funcţie de variabila exogenă x;

2 vezi demonstraţie op. cit., p.182 3 Conform D. N. Gujarati, Basic Econometrics, 3rd ed., New York, Mc Graw-Hill, 1995,

p 374-375.


• eliminarea a c observaţii centrale, c fiind specificat a priori. În privinţa numărului de observaţii omise, c, au fost emise diverse opinii. În cazul unui model unifactorial, Goldfeld şi Quandt, în urma efectuării experimentelor Monte-Carlo, au propus ca c să fie aproximativ egal cu 8 în cazul în care mărimea eşantionului este de aproximativ 30 de observaţii şi 16, dacă eşantionul cuprinde 60 de observaţii. Judge şi colaboratorii săi menţionează faptul că, în cazul în care c=4 pentru n=30 şi c=10 pentru n≈60, se obţin rezultate mai bune. În general, se consideră că c trebuie să reprezinte o treime sau un sfert din numărul total de observaţii.

• efectuarea de regresii aplicând M.C.M.M.P. asupra celor două sub-eşantioane de dimensiune (n-c)/2 şi calcularea sumei pătratelor erorilor pentru fiecare subeşantion în parte;

• calcularea raportului dintre sumele pătratelor erorilor sau dispersiilor acestora, corespunzătoare celor două subeşantioane (suma pătratelor erorilor având valoarea cea mai mare fiind plasată la numărător):

( ) ( )( )

( ) ( )( )∑

∑

+−

=

−

=

⎟⎠⎞

⎜⎝⎛ +−

−

⎟⎠⎞

⎜⎝⎛ +−

−

== n

cnt

cn

t

u

u

kcnu

kcnu

s

sF

12

22

2/

1

21

2

2*

12

/

12

/

2

1 (3.4.6)

unde: k = numărul variabilelor exogene.

Presupunând că erorile sunt normal distribuite, atunci raportul F*

urmează o distribuţie F cu ( ) ( 1221 +− )−

== kcnvv grade de libertate.

- dacă ( ) ( ) ( ) ( )⎟⎠⎞

⎜⎝⎛ +−

−⎟⎠⎞

⎜⎝⎛ +−

−>1

2;1

2;

*

kcnkcnFFα

, atunci ipoteza de

homoscedasticitate este infirmată, deci erorile sunt heteroscedastice;

Modele econometrice

- dacă ( ) ( ) ( ) ( )⎟⎠⎞

⎜⎝⎛ +−

−⎟⎠⎞

⎜⎝⎛ +−

−≤1

2;1

2;

*

kcnkcnFFα

ipoteza de homoscedasticitate

este acceptată.

I2.7) Testul Park4 Testul propus de Park se bazează pe existenţa unei relaţii de

dependenţă între dispersia corespunzătoare erorilor heteroscedastice şi variabila exogenă x de forma:

tt

exbtu

ωσσ 22 = (3.4.7)

Acest model neliniar poate fi transformat într-un model liniar prin logaritmare:

ttu xbt

ωσσ ++= lnlnln 22 (3.4.8)

unde: ωt = variabila reziduală, ce verifică ipotezele corespunzătoare

M.C.M.M.P.

Ca urmare a faptului că valoarea dispersiei erorilor heteroscedastice este necunoscută, aceasta a fost înlocuită cu pătratul erorilor, , în cadrul

modelului liniarizat prin logaritmare:

2ˆ iu

ttttt xbxbu ωβωσ ++=++= lnlnlnˆln 22 (3.4.9)

În situaţia în care parametrul b corespunzător variabilei exogene este nesemnificativ ipoteza de homoscedasticitate a erorilor este verificată, cazul contrar indicând existenţa heteroscedasticităţii.

I2.8) Testul Glejser5 Acest test se bazează pe bazează pe relaţia dintre erorile estimate în

urma aplicării M.C.M.M.P. asupra modelului iniţial şi variabila explicativă, presupusă a fi cauza heteroscedasticităţii. 4 cf. op. cit., p. 369-370 5 cf. op. cit., p. 371-372


Testul Glejser prezintă o serie de puncte comune cu testul precedent, respectiv, după calcularea erorilor în urma aplicării M.C.M.M.P., valoarea absolută a acestora este regresată în funcţie de valorile variabilei exogene utilizându-se în acest scop următoarele forme de exprimare corespunzătoare celor două variabile:

I. ttt bxau ω++=ˆ

În această situaţie heteroscedasticitatea este de tipul: , caz

în care va fi aplicată regresia ponderată asupra datelor iniţiale, care vor fi

împărţite la , rezultând astfel un model de forma:

222tu x

tλσ =

ixt

t

tt

t

xu

bxa

xy

++= 11

II. ttt xbau ω++=ˆ

În această situaţie heteroscedasticitatea este de tipul: , caz

în care va fi aplicată regresia ponderată asupra datelor iniţiale, care vor fi împărţite la

tu xi

22 λσ =

tx , rezultând astfel un model de forma:

.11

t

tt

tt

t

xu

xbx

ax

y++=

III. tt

t xbau ω++=

1ˆ

În această situaţie heteroscedasticitatea este de tipul: . 222 −= tu xi

λσ

IV. tt

tx

bau ω++=1ˆ

V. ttt bxau ω++=ˆ

VI. ttt bxau ω++= 2ˆ

Modele econometrice

Verificarea homoscedasticităţii erorilor presupune, ca şi în cazul testului precedent, verificarea semnificaţiei parametrului corespunzător variabilei exogene. Aplicarea acestui test conduce la rezultate semnificative în cazul unor eşantioane de dimensiuni mari, iar, în cazul celor de dimensiuni mici, este pur teoretică, aşa cum menţionează însuşi autorul.

De menţionat faptul că ultimele două modele nu pot fi estimate cu ajutorul M.C.M.M.P.

I2.9) Testul Breusch-Pagan-Godfrey (BPG)6 Acest test are în vedere modelul multifactorial liniar de forma: yi = b0 + b1 x1t + b2 x2t + …+ bk x kt + ut (3.4.10)

plecând de la ipoteza potrivit căreia dispersia corespunzătoare erorilor heteroscedastice este dependentă de o serie de variabile factoriale zi. În locul acestor variabile pot fi utilizate câteva sau toate variabilele exogene ce intervin în modelul iniţial. Se presupune, de asemenea, că între dispersia corespunzătoare erorilor heteroscedastice şi variabilele factoriale zi există o relaţie de dependenţă liniară, respectiv:

mtmttu zzzt

ββββσ ++++= K221102 (3.4.11)

Verificarea homoscedasticităţii dispersiei presupune verificarea

ipotezei nulităţii parametrilor corespunzători variabilelor factoriale, caz în care .0

2 cttu == βσ

Aplicarea acestui test constă în: - calculul valorilor variabilei reziduale prin aplicarea M.C.M.M.P.

asupra modelului iniţial; - calculul estimatorului de maximă verosimilitate corespunzător

dispersiei variabilei reziduale homoscedastice: nut

ut

∑=2

2 ˆσ ;

6 cf. op. cit., p. 377-378


- construirea unei variabile de forma: 2

2

ˆˆ

tu

tt

uσ

θ = şi regresarea

acesteia în funcţie de variabilele factoriale zt, ce pot fi înlocuite cu variabilele exogene xi din modelul original, respectiv:

tmtmttt xxx ωββββθ +++++= K22110 (3.4.12) unde:

ωt = variabila reziduală. - calculul sumei pătratelor explicată de model, notată cu SSR, şi

calculul unei variabile H de forma: 2

SSRH = .

Presupunând că erorile sunt normal distribuite, şi că ne aflăm în

situaţia unui eşantion de volum mare, variabila H este asimptotic distribuită sub forma unui χ , pentru care numărul gradelor de libertate este egal cu:

, unde m = numărul parametrilor modelului, respectiv: H~ χ .

2;vα

1−= mv 2;vα

Dacă >H χ , erorile sunt heteroscedastice, în caz contrar, sunt

homoscedastice.

2;vα

I2.10) Testul White7 Aplicarea testului White în cazul modelului unifactorial presupune

parcurgerea următoarelor etape: - estimarea parametrilor modelului iniţial şi calculul valorilor

estimate ale variabilei reziduale, u; - construirea unei regresii auxiliare, bazată pe prespunerea

existenţei unei relaţii de dependenţă între pătratul valorilor erorii, variabila exogenă inclusă în modelul iniţial şi pătratul valorilor acesteia:

tttt xxu ωααα +++= 2210

2ˆ (3.4.13)

7 cf. op. cit., p. 379

Modele econometrice

şi calcularea coeficientului de determinare, R2, corespunzător acestei regresii auxiliare;

- verificarea semnificaţiei parametrilor modelului nou construit, iar dacă unul dintre aceştia este semnificativ diferit de zero, atunci ipoteza de heteroscedasticitate a erorilor este acceptată.

Există două variante de aplicare a testului White: - utilizarea testului Fisher-Snedecor clasic, bazat pe ipoteza

nulităţii parametrilor, respectiv: H0: 0210 === ααα ;

Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt nesemnificative ( ), este acceptată, atunci ipoteza de

homoscedasticitate se verifică, cazul contrar semnificând prezenţa heteroscedasticităţii erorilor.

21;; vvc FF α≤

- utilizarea testului LM, calculat ca produs între numărul de

observaţii corespunzătoare modelului, n, şi coeficientul de determinare, R2, corespunzător acestei regresii auxiliare. În general, testul LM este asimptotic distribuit sub forma unui χ , pentru care numărul gradelor de

libertate este egal cu: , unde k = numărul variabilelor exogene, respectiv:

2;vα

kv =

2RnLM ⋅= ~ χ (3.4.14) 2

;vα

Dacă >LM χ , erorile sunt heteroscedastice, în caz contrar, sunt

homoscedastice, respectiv ipoteza nulităţii parametrilor,

2;vα

0210 === ααα ,

este acceptată.

Eliminarea fenomenului de heteroscedasticitate se poate realiza prin următoarele procedee:

a) Construirea modelului pe baza abaterilor centrate ale variabilelor Fie ttt ubxay ++= (3.4.15)


tt xbay += (3.4.16)

uxbay ++= (3.4.17) ________________

(3.4.15) – (3.4.17) ⇒ ttt uxxbyy +−=− )( (3.4.18)

Notând cu: ⎪⎩

⎪⎨⎧

=

+=⇒

⎪⎭

⎪⎬⎫

−=

−=**

**

*

*

ˆˆ tt

ttt

tt

tt

xby

uxby

xxx

yyy

Estimarea parametrului b presupune minimizarea funcţiei:

( ) ( ) ( )∑∑==

−=−=n

ttt

n

ttt xbyyybF

1

2**

1

2** ˆminˆminˆ

şi calculul derivatei parţiale a funcţiei:

( ) ( ) ( ) ( ) 0,cov00ˆ20)ˆ(' *** =⇒=−⇔=−⋅−⇒= ∑ ∑ ttttttt xuxxuxxbybF

b) Metoda regresiei ponderate Fie modelul iniţial ttt ubxay ++=

Heteroscedasticitatea presupune , ceea ce înseamnă: 22)( utuM σ≠2

121 uu σλσ =

22

22 uu σλσ =

……………. (3.4.19) 22unun

σλσ =

unde: λt este un coeficient de ponderare.

Estimarea parametrilor modelului presupune minimizarea funcţiei:

∑=

−−=n

ttt

u

xbaybaF1

22 )ˆˆ(1min)ˆ,ˆ(min

σ

Modele econometrice

Conform relaţiei (3.4.19): ∑=

−−=n

ttt

t

xbaybaF1

2)ˆˆ(1min)ˆ,ˆ(minλ

(3.4.20)

În relaţia (3.4.20) cantităţile şi 2uσ tλ sunt, în general, necunoscute.

S-a constatat însă că, în practică, abaterile standard, tuσ , sunt aproximativ

proporţionale cu valorile variabilei exogene x, adică:

11xuu σσ =

22xuu σσ =

…………… (3.4.21)

nuu xn

σσ =

Corelând relaţiile (3.4.19) şi (3.4.21), rezultă că relaţia (3.4.20)

devine:

∑∑

∑

==⎟⎟⎠

⎞⎜⎜⎝

⎛−−=⎟

⎟⎠

⎞⎜⎜⎝

⎛ −−=

−−=

n

t tt

t

u

n

t t

tt

u

n

ttt

tu

bx

axy

x

xbay

xbayx

baF

1

2

21

2

2

222

ˆ1ˆmin1ˆˆmin1

)ˆˆ(1min1)ˆ,ˆ(min

σσ

σ (3.4.22)

Dar relaţia (3.4.22) este echivalentă cu aplicarea M.C.M.M.P.

modelului iniţial, după ce, în prealabil, a fost împărţit la xt:

t

t

tt

ttttt x

ub

xa

xy

xubxay ++=⇒++=1|:

∑ ⎟⎠

⎞⎜⎝

⎛ −−=∑ ⎟⎠

⎞⎜⎝

⎛===

n

t tt

tn

t t

t bx

axy

minxu

min)b,a(Fmin1

2

1

2 1 (3.4.23)


Calculând derivatele parţiale în raport cu şi ale funcţiilor (3.4.22) şi (3.4.23) şi anulându-le se ajunge la acelaşi sistem de ecuaţii pe baza căruia se determină cei doi estimatori:

a b

⇒=

⇒=

0)ˆ('

0)ˆ('

bF

aF

⎪⎪⎩

⎪⎪⎨

⎧

=+

=+

∑∑

∑∑∑

t

t

t

t

t

tt

xy

bnx

a

xy

xb

xa

ˆ1ˆ

1ˆ1ˆ22

(3.4.24)

⎪⎪⎪⎪⎪⎪

⎩

⎪⎪⎪⎪⎪⎪

⎨

⎧

−=

⎟⎟⎠

⎞⎜⎜⎝

⎛−

−

=

⇒

∑

∑

∑

∑

∑∑

∑∑∑∑

22

2

2

2

22

1

1

ˆ1

ˆ

11

11

ˆ

t

t

t

t

t

tt

t

t

tt

t

t

x

xb

x

xy

a

xxn

xy

xxy

xb

(3.4.25)

Un caz concret de utilizare a acestei metode o constituie situaţia în

care se urmăreşte modelarea investiţiilor unor intreprinderi de dimensiuni diferite în funcţie de capital, cifra de afaceri şi venit: I = f (K, CA, V) + u.

O altă metodă constă în segmentarea eşantionului în subcolectivităţi omogene din punct de vedere al nivelelor factorilor, urmată de o respecificare a modelului pentru fiecare segment în parte.

În mod curent, acest procedeu se utilizează la estimarea parametrilor unui model econometric privind cererea sau consumul populaţiei faţă de un produs de folosinţă curentă, deoarece s-a constatat că dispersia corespunzătoare consumului creşte pe măsura creşterii nivelului venitului.

I3 Valorile variabilei reziduale u sunt necorelate, respectiv nu există fenomenul de autocorelare a erorilor.

ktnktuuMuu ktkt <=∀== ,,1,)(0),(),cov(

Modele econometrice

Deoarece aplicaţiile practice au arătat că acest fenomen e frecvent în special în cazul seriilor cronologice interdependente, verificarea acestuia este necesară, mai ales în cazul calculelor de prognoză.

M.C.M.M.P., în cazul existenţei fenomenului de autocorelaţie, , nu mai permite obţinerea de estimatori eficienţi, aceştia

prezentând totodată distorsiuni de la valorile reale. Se păstrează însă calitatea acestora de a fi consistenţi, fapt ce impune introducerea în calcul a unor serii de date suficient de lungi (eşantion de valori cât mai mare).

0),( ≠kt uuM

Autocorelarea erorilor se datorează analizei în timp a legăturii dintre variabile, respectiv a unui efect inerţial în evoluţia variabilelor sau o altă cauză ar constitui – o eroare de specificare a modelului, respectiv omiterea unei variabile explicative, xt, cu influenţă puternică asupra variabilei endogene y.

Depistarea autocorelării erorilor se poate face utilizând următoarele procedee:

1) Procedeul grafic – se realizează corelograma între valorile estimate ale variabilei endogene şi valorile variabilei reziduale . ty tu

tu

ty

Figura 3.4.3

Grafic, autocorelaţia erorilor se manifestă fie printr-un număr foarte mic sau foarte mare de schimbări ale semnului variabilei aleatoare, fie ca urmare a unor schimbări simetrice (o oscilaţie regulată a valorilor variabilei reziduale faţă de valorile lui ). y


2) Calculul coeficientului de autocorelaţie de ordinul 1

∑

∑=

∑

∑=

=−

=−

−

=

=−

n

tt

n

ttt

n

tt

n

ttt

u

uu

u

uur

2

21

21

1

1

2

21

1 (3.4.26)

Acesta este definit în intervalul [ ]11;− , având următoarea

semnificaţie:

⎪⎩

⎪⎨

⎧

+

−=

văpozitistrictţieautocorela,ţăindependen,

vănegatistrictţieautocorela,r )(

101

1

3) Testul Durbin-Watson constă în calcularea valorii:

( )

∑

∑ −=

=

=−

n

tt

n

ttt

u

uud

1

2

2

21

(3.4.27)

Această valoare empirică, „d”, se compară cu două valori teoretice,

d1 şi d2, preluate din tabelul distribuţiei Durbin-Watson (vezi Anexa 3) în funcţie de un prag de semnificaţie α, arbitrar ales, (α = 0,05 sau α = 0,01), de numărul de variabile exogene (k) şi de valorile observate ( )n n, ≥ 15 .

Regula de decizie a aplicării testului se prezintă în tabelul următor:

0 < d < d1 d1 ≤ d ≤ d2 d2 < d< 4-d2 4-d2 ≤ d ≤ 4-d1 4-d1 < d <4

Autocorelare pozitivă

Indecizie ←

Erorile sunt independente

Indecizie →

Autocorelare negativă

Cei doi autori, acceptând ipoteza de normalitate a variabilei

reziduale, au demonstrat că distribuţia variabilei aleatoare d este cuprinsă

Modele econometrice

între două distribuţii limită, d1 şi d2, ale căror mărimi depind de pragul de semnificaţie (α), de numărul de variabile exogene (k) şi de numărul de valori observate (n, n ≥ 15).

Dezvoltând relaţia lui d, aceasta devine:

∑

∑∑∑

=

=−

=−

=

−+= n

tt

n

ttt

n

tt

n

tt

u

uuuud

1

2

21

2

21

2

2

ˆ

ˆˆ2ˆˆ

Pentru un n suficient de mare, cele trei sume, , , ,

fiind aproximativ egale, relaţia lui d va fi egală cu:

∑=

n

ttu

2

2ˆ ∑=

−

n

ttu

2

21ˆ ∑

=

n

ttu

1

2ˆ

∑

∑−

=

=−

−= 1

1

2

21

ˆ

ˆˆ22 n

tt

n

ttt

u

uud

Se notează cu: ∑

∑−

=

=−

= 1

1

2

21

1

ˆ

ˆˆ

n

tt

n

ttt

u

uur coeficientul de autocorelaţie de ordinul

1 a reziduurilor ut.

( )( ) ( ) 2112 11

drrd −=⇒−=⇒ (3.4.28)

]4,0[∈⇒ d


cu semnificaţia:

⎪⎪⎪

⎩

⎪⎪⎪

⎨

⎧

↓

↑=⇒

⎪⎪⎪

⎩

⎪⎪⎪

⎨

⎧

⇒⇒⇒⇒⇒

↓

↑−

=

0

2

4

1

0

1

1 d

văpoziti

vănegati

strict

strict

reautocorelaindecizie

ţăindependenindecizie

reautocorela

r

4) Un alt procedeu de verificare a ipotezei de independenţă a erorilor constă în aplicarea testului Breusch-Godfrey8, acest test fiind utilizat în vederea depistării unei autocorelaţii de ordin superior. Ca urmare a presupunerii existenţei unei autocorelaţii de ordin superior se construieşte următorul model:

tptpttt zurururu ++++= −−− K2211 (3.4.29)

unde: zt = variabilă reziduală de medie zero şi dispersie constantă.

Ipoteza nulă care stă la baza testului este aceea potrivit căreia toţi coeficienţii corespunzători valorilor decalate ale variabilei reziduale sunt simultan egali cu zero, fapt ce implică non-existenţa fenomenului de autocorelaţie a erorilor.

În vederea utilizării testului sunt estimate valorile variabilei reziduale ut, obţinute în urma aplicării M.C.M.M.P. asupra modelului iniţial. Variabila reziduală ut este regresată apoi în funcţie de variabilele exogene iniţiale ale modelului şi de valorile sale decalate, respectiv ut-1, ut-2, …, ut-p. În cazul acestei regresii este calculată valoarea coeficientului de determinare R2 şi a unei variabile de forma:

BG = (n-p)·R2 (3.4.30)

8 cf. op. cit., p. 425

Modele econometrice

Presupunând că ne aflăm în situaţia unui eşantion de volum mare, variabila BG este asimptotic distribuită sub forma unui χ , pentru care

numărul gradelor de libertate este egal cu:

2;vα

pv = , unde p = mărimea

decalajului , respectiv: BG~ χ . 2;vα

Dacă χ , ipoteza nulă este respinsă, ceea ce presupune că

există cel puţin un coeficient de autocorelaţie nenul.

>BG 2;vα

În general, autocorelaţia erorilor este provocată de două cauze: • fie că variabila endogenă y se autocorelează în evoluţia sa (ca

urmare a unui efect inerţial) generând o autocorelare în timp a erorilor; • fie datorită omiterii unei variabile exogene x, cu influenţă

semnificativă asupra lui y, adică a unei erori de specificare a modelului econometric.

Eliminarea fenomenului de autocorelare a variabilei reziduale ut – în cazul depistării sale – se fundamentează pe evitarea cauzelor care îl generează.

O modalitate directă de a evita consecinţele statistice pe care le generează acest fenomen o constituie utilizarea următoarelor procedee:

a) Aplicarea M.C.M.M.P. generalizate în vederea estimării parametrilor modelului care, în cazul autocorelării reziduurilor, permite obţinerea de estimatori nedeplasaţi, consistenţi şi eficienţi. Această metodă este recomandată în situaţia în care numărul variabilelor cauzale este superior lui unu (modele multifactoriale). Estimatorii modelului se obţin

astfel: unde V = matricea varianţelor şi covarianţelor reziduurilor.

)YV'X()XV'X(B 111 −−−=

b) Un alt procedeu este următorul: Fie modelul liniar unifactorial: ttt ubxay ++= . Se estimează

parametrii acestuia, a şi b, cu ajutorul M.C.M.M.P. Se calculează valorile ajustate ale variabilei endogene - tt xbay += şi reziduurile -

ttttt xbayyyu −−=−= (3.4.31) şi se aplică testul “d”. Dacă ipoteza de


independenţă a variabilelor reziduale, I3, nu poate fi acceptată ( , 01 ≠r

211

dr −= ), aceasta presupune o autocorelare de ordinul întâi a erorilor,

respectiv:

ttt zuru += −1)1( ˆˆ (3.4.32)

unde: zt este variabila aleatoare ce verifică ipotezele I2, I3 şi I4.

Ştiind că:

11111 −−−−− −−=−= ttttt xbayyyu (3.4.33)

Înlocuind relaţiile (3.4.31)şi (3.4.33) în relaţia (3.4.32) se obţine:

ttttt zxbayrxbay +−−=−− −− )ˆˆ(ˆˆ 11)1(

ttttt zxrxbrayry +−+−=− −− )(ˆ)1(ˆ 1)1()1(1)1( (3.4.34)

În ecuaţia (3.4.34) variabilele yt şi xt sunt cunoscute, iar valoarea coeficientului de autocorelaţie se va calcula cu relaţia:

∑

∑−

=

=−

= 1

1

2

21

)1( n

tt

n

ttt

u

uur

Se introduce valorile acestuia în relaţia (3.4.34) şi se vor estima parametrii şi prin aplicarea din nou a M.C.M.M.P. Fie şi a b α

β estimaţiile parametrilor a şi b, calculate pe baza diferenţelor de ordinul întâi ale variabilelor y şi x.

Se ajunge astfel la modelul:

)()1()( 1)1()1(1)1( −− −+−=− tttt xrxryry βα (3.4.35)

Modele econometrice

unde: )( 1)1( −− tt yry reprezintă diferenţele teoretice (ajustate) de ordinul întâi

ale variabilei endogene y, calculate pe baza funcţiei de regresie (3.4.34).

c) Procedeul prin baleiaj (Hildreth-Lu) Dacă există corelaţie se ajunge la relaţia:

ttttt zxrxbrayry +−+−=− −− )(ˆ)1(ˆ 1)1(0)1(01)1( ⇒ ttt zxbay ++= *11

*

Procedeul prin baleiaj constă în atribuirea de valori lui r(1) în

intervalul [0,1] ⇒ autocorelare pozitivă, sau în intervalul [-1,0] ⇒ autocorelare negativă.

De exemplu, în cazul unei autocorelări pozitive, i se atribuie lui r(1)

următoarele valori:

r(1) = 0,1 ⇒ ∑zt2 = 1,75;

r(1) = 0,2 ⇒ ∑zt2 = 2,75;

r(1) = 0,3 ⇒ ∑zt2 = 3,75.

Deci minimul se situează în intervalul [0,2; 0,3]. Se dau apoi valori lui r = ⎨0,21; 0,22;…0,27⎬, oprindu-ne la

valoarea pentru care se obţine min ∑zt2. Pentru această valoare se păstrează

estimatorii a şi bˆ ˆ obţinuţi în acest caz.

d) Procedeul iterativ al lui D. Cochran şi C. Orcutt Se consideră modelul ttt ubxay ++= . Se estimează parametrii

modelului, se aplică testul D-W, se calculează coeficientul de autocorelaţie de ordinul întâi şi se înlocuieşte valoarea sa în ecuaţia iniţială, (3.4.34), obţinându-se modelul - . În cazul acestui model se

verifică dacă s-a eliminat sau nu autocorelaţia erorilor. În caz contrar, se continuă procedeul până când se atinge acest deziderat.

t*t

* zxbayt

++= 11


e) Procedeul Durbin

ttttt zxbayrxbay +−−=−− −− )ˆˆ(ˆˆ 11)1(

Se calculează r(1), se introduce în relaţia (3.4.34) şi rezultă estimatorii parametrilor, . Această metodă dă rezultate bune numai în cazul existenţei unei autocorelaţii de ordinul întâi şi este aplicabilă în cazul în se lucrează cu un număr mare de date.

11ˆ,ˆ ba

f) Uneori, eliminarea autocorelaţiei se poate realiza şi prin construirea modelului pe baza diferenţelor de ordinul întâi ale variabilelor:

tttttttt zbxayzxxbayy ++=⇒+−+=− −−**

11 )(

g) Pentru eliminarea autocorelaţiei se poate construi un model nou în care se introduce o variabilă fictivă suplimentară. Această metodă porneşte de la ideea că variabila reziduală u nu este influenţată numai de factori aleatori, ci există cel puţin un factor sistematic care provoacă autocorelaţia.

I4 Legea de probabilitate a variabilei reziduale ut este legea normală, de medie nulă şi abatere medie pătratică σu, ut → Ν(0,σu).

Se ştie că, dacă erorile urmează legea normală de medie zero şi de abatere medie pătratică (consecinţa ipotezelor I1, I2, I3), atunci are loc relaţia:

su$

( ) αα −=≤ 1ˆ ut stuP

Pe baza acestei relaţii, în funcţie de diferite praguri de semnificaţie α , din tabela distribuţiei normale sau a distribuţiei Student se vor prelua valorile corespunzătoare lui . tα

Verificarea ipotezei de normalitate se poate face pe baza unui grafic în cadrul căruia pe axa Ox se vor reprezenta valorile ajustate ale variabilei y

Modele econometrice

- , iar pe axa Oy se vor trece valorile variabilei reziduale - . Dacă

valorile empirice ale variabilei reziduale se înscriu în banda ty tu

ust ˆ⋅± α , cu un

anumit prag de semnificaţie α , ipoteza de normalitate a variabilei reziduale poate fi acceptată cu acest prag de semnificaţie – vezi figura 3.4.4:

y

u ust ⋅+ α

ust ⋅− α

0

Figura 3.4.4

O altă modalitate de verificare a ipotezei de normalitate a erorilor o constituie testul Jarque-Berra9, care este şi el un test asimptotic (valabil în cazul unui eşantion de volum mare), ce urmează o distribuţie hi pătrat cu un număr al gradelor de libertate egal cu 2, având următoarea formă:

( )⎥⎥⎦

⎤

⎢⎢⎣

⎡ −+=

243

6

22 KSnJB ~ χ 2 (3.4.36) 2;α

unde: n = numărul de observaţii;

S = coeficientul de asimetrie (skewness), ce măsoară simetria distribuţiei erorilor în jurul mediei acestora, care este egală cu zero, având următoarea relaţie de calcul:

( )3

1

31

σ

∑=

−=

n

tt yy

nS (3.4.37)

9 cf. EViews, User Guide, Version 2.0, QMS Quantitative Micro Software, Irvine, California,

1995, p. 140-141


K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce măsoară

boltirea distribuţiei (cât de „ascuţită” sau de aplatizată este distribuţia comparativ cu distribuţia normală), având următoarea relaţie de calcul:

( )4

1

41

σ

∑=

−=

n

tt yy

nK (3.4.38)

Testul Jarque-Berra se bazează pe ipoteza că distribuţia normală are

un coeficient de asimetrie egal cu zero, S = 0, şi un coeficient de aplatizare egal cu trei, K = 3.

Dacă probabilitatea, p(JB), corespunzătoare valorii calculate a testului este suficient de scăzută, atunci ipoteza de normalitate a erorilor este respinsă, în timp ce, în caz contrar, pentru un nivel suficient de ridicat al probabilităţii ipoteza de normalitate a erorilor este acceptată, sau dacă

χ , atunci ipoteza de normalitate a erorilor este respinsă. >JB 22;α

3.4.2. Verificarea semnificaţiei estimatorilor parametrilor modelului econometric

Dacă cele patru ipoteze pot fi acceptate, se poate demonstra (vezi

Teorema 1) că M.C.M.M.P. este echivalentă cu M.V.M. (metoda verosimilităţii maxime) şi, deci, estimatorii obţinuţi în acest caz sunt nedeplasaţi, convergenţi şi eficienţi.

De asemenea (vezi Teorema 2 şi 3), cei doi estimatori, , sunt variabile aleatoare repartizate normal:

b şi a

)s,a(N)a(L a= ; )s,b(N)b(L b=

Modele econometrice

unde:

( ) ⎟⎟⎟

⎠

⎞

⎜⎜⎜

⎝

⎛

∑ −+=

tt

uaxx

xn

ss2

22 1 = abaterea medie pătratică a estimatorului a ; ˆ

( )∑ −=

tt

ub xx

ss 2

2

ˆ = abaterea medie pătratică a estimatorului b ;

∑−

∑ −=

−=

t

ttt

tu n

)yy()u(

ns

221

2

22 = dispersia variabilei reziduale (vezi

teorema 6)

Verificarea semnificaţiei estimatorilor constă în a accepta, sau a respinge, una din cele două ipoteze:

⎩⎨⎧

==

00

:0 ba

H

⎩⎨⎧

≠≠

00

:1 ba

H

Testul adecvat acestui scop, b şi a fiind variabile normale, este

testul “t”. Prin centrarea şi normarea estimaţiilor b şi a , în cazul ipotezei

H0: L(a )=N(0, ) şi L(bˆ as ˆ )=N(0, ), se obţin valorile calculate: bs

acal s

at 01 −= şi

bcal s

bt 02 −= . Aceste valori calculate sau empirice se compară

cu valoarea teoretică: • tα = variabilă normală, dacă n,t 1= , n>30, preluată din tabela

distribuţiei normale, în funcţie de o valoare arbitrar aleasă a probabilităţii


„p“ sau a pragului de semnificaţie „α”, p+ α = 1; aceste valori, de regulă fiind: p = 0,9 => α = 0,1; p = 0,95 => α = 0,05; p = 0,99 => α = 0,01;

• - tα;n-(k+1) = variabilă Student, dacă n,t 1= , n≤30, preluată din tabela distribuţiei Student, în funcţie de valoarea stabilită pentru α şi de numărul gradelor de libertate, n-(k+1); n = numărul observaţiilor; k = numărul variabilelor exogene xj, k,j 1= (k+1 = numărul parametrilor modelului econometric).

Pe baza celor două valori, tcal şi tα;v , regula de decizie a testului este:

• dacă

⎪⎪

⎭

⎪⎪

⎬

⎫

≤=

≤=

vb

cal

va

cal

tsbt

tsat

;ˆ

2

;ˆ

1

ˆ

ˆ

α

α

=> se acceptă H0 => estimatorii nu sunt

semnificativ diferiţi de zero, se renunţă la ei şi la model => se revine la prima etapă cu o nouă specificare;

• dacă

⎪⎪

⎭

⎪⎪

⎬

⎫

>=

>=

vb

cal

va

cal

tsbt

tsat

;ˆ

2

;ˆ

1

ˆ

ˆ

α

α

=> se acceptă H1 => modelul a fost corect

specificat, identificat şi estimat şi se continuă discuţia econometrică;

• dacă

⎪⎪

⎭

⎪⎪

⎬

⎫

>=

≤=

vb

cal

va

cal

tsbt

tsat

;ˆ

2

;ˆ

1

ˆ

ˆ

α

α

=> se reţine modelul y = f(x) + u = bx + u şi

se continuă discuţia econometrică.

În practică, deoarece t0,05 > 2, economiştii acceptă ipoteza H1 - estimatorii sunt semnificativi dacă:

2ˆ

2ˆ

ˆ

2

ˆ

1

≥=

≥=

bcal

acal

sbt

sat

Modele econometrice

În acelaşi timp, ştiind că şi sunt repartizaţi normal, se poate estima intervalul de încredere al parametrilor acestora:

a b ˆ

( ) ααα −==⋅+≤≤⋅− 1ˆˆ ˆ;ˆ; pstaastaP avav

( ) ααα −==⋅+≤≤⋅− 1ˆˆˆ;ˆ; pstbbstbP bvbv

Parametrii a şi b vor fi consideraţi semnificativ diferiţi de zero dacă: ( ) αα −==>⋅±= 10ˆ ˆ; pstaaP av

( ) αα −==>⋅±= 10ˆˆ; pstbbP bv

3.4.3 Verificarea similitudinii modelului econometric

Modelul econometric, tt xbay += , este expresia formală a

modelului economic real, yt = f(xt) + ut = a + bxt + ut, conceput pe baza teoriei economice şi rezultat pe baza unui singur experiment, unui singur sondaj statistic.

Ca atare, în această etapă se urmăreşte să se verifice: 1) dacă ipoteza de pornire – x = principalul factor de influenţă a

fenomenului y – este corectă sau nu; 2) dacă legitatea economică dintre cele două variabile este de forma

- y = a + bx; 3) dacă rezultatele obţinute pot fi considerate sistematice – în sensul

că se vor obţine aproape aceleaşi rezultate dacă se va repeta experienţa cu alte sondaje, de volum şi structură (alte unităţi statistice) diferite – sau întâmplătoare, adică rezultate diferite pentru sondaje diferite.

În general, scopurile urmărite în această etapă se rezolvă cu ajutorul metodei analizei variaţiei, cunoscută şi sub numele de metoda ANOVA.

Metoda analizei variaţiei porneşte de la identitatea:

yyyyyy tttt −+−=− → ( ) ( )22 ˆˆ yyyyyy tttt −+−=−

[∑∑==

−+−=−n

tttt

n

tt yyyyyy

1

2

1

2 )ˆ()ˆ()( ]

(3.4.3)


unde10: omenului y; y = valorile reale ale fent

ˆ = valorile teoretice ale fenomenului y; ty

tt xbay +=

( ) xbaxban

yn

yn

y ttt +=∑ +=∑=∑=111

Prin ridicarea la pătrat a binomului din partea dreaptă a relaţiei (3.4.3) rezultă:

∑∑∑∑====

−−+−+−==−n

tttt

n

ttt

n

tt

n

tt yyyyyyyyyy

11

2

1

2

1

2 )ˆ)(ˆ(2)ˆ()ˆ()( (3.4.4)

Termenii relaţiei (3.4.4) se definesc prin:

( )∑=

−=n

2

tt yyV

1

20 = variaţia totală a variabilei y provocată de toţi

factorii săi de influenţă;

( )∑ −==

n

ttx yyV

1= variaţia fenomenului y provocată numai de variaţia

factorului x, considerat factorul principal al variabilei y, adică variaţia lui y

tttu yyV

1= variaţia reziduală, sau variaţia fenomenului y

generată de către factorii nespecificaţi în model, aceşti factori fiind

22

explicată de modelul econometric; n 22 ( )∑ −==

consideraţi – în etapa de specificare – drept factori cu influenţă întâmplătoare, neesenţiali pentru a explica variaţia fenomenului y;

10 Relaţia (3.4.3) rămâne valabilă în toate cazurile de modele liniare sau liniarizabile. În

cazul acestora din urmă, se va ţine cont de semnificaţia simbolurilor. De exemplu: - modelul putere: yt = a xt

b ut => ln yt = ln a +b ln xt + ln ut, În acest caz, semnificaţiile simbolurilor vor fi: yt

* = ln yt; = ln ; *ty ty

∑=∑= tt ylnn

ylnn

y 11 ;u *t = ln yt - ln ; ty

- modelul exponenţial yt = ea+bxt ut => ln yt = a + b xt + ln ut,=> yt* = ln yt;

= ln ; *ty ty y = media geometrică a termenilor.

Modele econometrice

0),cov(ˆ2)(ˆ2ˆ)ˆˆˆˆ(2)ˆ)(ˆ(21

==−=−−+=−− ∑∑∑=

tttttt

n

tttt xubn

nnuxxbuxbaxbayyyy

cov (xt, ut) = 0, adică xt şi ut sunt variabile independente. Această condiţie se realizează dacă erorile sunt homoscedastice ( vezi ipoteza I2).

De regulă, rezultatele aplicării metodei ANOVA se prezintă într-un tabel de forma:

Tabelul 3.4.1 Valoarea testului „F” Sursa de

variaţie Măsura variaţiei

Numărul gradelor de

libertate

Dispersii corectate cF F v vα ; ;1 2

Varianţa explicată de

model ( )∑

=

−=n

ttx yyV

1

22 ˆ 1=k

kV

s xxy

22

/ = 2ˆ

2/

u

xyc s

sF =

Varianţa reziduală ( )∑

=

−=n

tttu yyV

1

22 ˆ

1−− kn 1

22ˆ −−=

knV

s uu

-

Varianţa totală ( )∑

=

−=n

tt yyV

1

220

1−n

-

-

.

Pe baza datelor din tabel se pot testa următoarele ipoteze: 22

0 ux/y ss:H = => cele două dispersii sunt aproximativ egale, adică

influenţa factorului x nu diferă de influenţa factorilor întâmplători; 22

1 ux/y ss:H ≠ => influenţa factorului x şi a factorilor întâmplători

– măsurată prin cele două dispersii – diferă semnificativ şi, deci, se poate trece la discuţia similitudinii, a verosimilităţii modelului teoretic în raport cu modelul real.

După cum se ştie, testarea semnificaţiei dintre două dispersii se face cu ajutorul distribuţiei teoretice Fisher-Snedecor, respectiv cu testul „F”. Cunoscând cele două valori:

1:

22

2

2/

−−==

knV

kV

s

sF ux

u

xycal = valoarea calculată a variabilei „F”

pe baza rezultatelor modelului econometric; Fα,v1,v2

= valoarea teoretică a variabilei „F”, preluată din tabela

repartiţiei Fisher – Snedecor, în funcţie de un prag de semnificaţie α


(α = 0,1 sau α = 0,05 sau α = 0,01) şi de numărul gradelor de libertate v1 = k; v2 = n-k-1;

Regula de decizie este următoarea: - se acceptă H0 şi se respinge H1 dacă:

Fcal≤ Fα,v1,v2

- se acceptă H1 şi se respinge H0 dacă:

Fcal >Fα,v1,v2

Dacă se acceptă H1 şi dacă variabila u este independentă de fenomenul x, cov(x,u)=0, atunci ecuaţia analizei variaţiei este:

2220 ux VVV += (3.4.39)

ecuaţie care, prin împărţirea la , se transformă în: 2

0V

10010010012

0

2

20

2

20

2

20

2

⋅+⋅=⇒+=VV

VV

VV

VV uxux (3.4.40)

Termenul 2

0

22

VV

R xx/y = se numeşte coeficient de determinare şi are

următoarele semnificaţii:

}

}⎪⎪⎪

⎩

⎪⎪⎪

⎨

⎧

⇒=⇒⇒+=⇒

⇒+=⇒⇒+≠⇒

=

y. ifenomenulu a influenta defactor singurul este x )(1y; ifenomenulu al esentialfactor un este x )(

0,5esential;factor estenu dar y, i variabilealfactor este x )(

y; ifenomenulu al (cauza)factor estenu x )(0

2/

xfyuxfy

uxfyuxfy

R xy

Modele econometrice

Pe baza afirmaţiilor de mai sus, se deduce uşor că un model econometric este cu atât mai performant cu cât valoarea lui se

apropie mai mult de unu, respectiv cu cât se apropie mai mult de 100(%).

2x/yR

Statistic, intensitatea legăturii dintre cele două variabile se măsoară cu ajutorul indicatorului , denumit raport de corelaţie: x/yR

20

2

20

22 1

VV

VV

RR uxx/yx/y −===

}

}⎪⎪⎪

⎩

⎪⎪⎪

⎨

⎧

⇒⇒

⇒⇒

=

x cu strict corelat este y-tădeterminis corelatie 1puternică corelatie

0,5slabă corelatie

teindependen sunt y şi x

R x/y

0

În cazul unei legături liniare între cele două variabile – y = a + bx +

u, ln y = ln a + b ln x + ln u, ln y = a + bx + ln u, estimatorii parametrilor fiind obţinuţi cu ajutorul M.C.M.M.P., se poate demonstra că raportul de corelaţie, , este egal cu coeficientul de corelaţie liniară, : xyR / xyr /

( )

( )

( )( )

( )( )∑

∑∑

∑∑

∑−

−=

−

−−+=

−

−=

=

=2

22

2

2

1

2

1

2ˆˆˆˆˆˆ

yy

xxb

yy

xbaxba

yy

yyR

t

t

t

tn

tt

n

tt

xy

( )( ) y

x

t

txy b

yy

xxbR

σσˆˆ

2

2

=−

−=

∑∑

⎪⎩

⎪⎨⎧

=+

=+

∑∑ ∑∑∑

tttt

tt

xyxbxa

yxban2ˆˆ

ˆˆ


( ) 2222

2

ˆ

xnx

yxn

xy

xxn

yxxyn

xxxn

xyxyn

bt

tt

tt

tttt

tt

t

ttt

t

−

⋅−=

−

−==

∑

∑

∑∑∑∑∑

∑∑∑∑∑∑

( ) ( )

=+−=+−

=−

= ∑∑∑∑ 22222

2 22

xnx

xnx

nxxxx

nxx ttttt

xσ

22

222

2 xnx

xxnx tt −=+−= ∑∑

2ˆ

x

tt yxn

xy

bσ

⋅−=⇒

∑

( ) ( )( ) ( )

=⋅+−−−=

⋅+−−=

−−=

∑∑∑

∑∑

yxny

xnx

yn

yxn

yxyxyxyxn

yyxxxy

tttt

tttttt,cov

yxn

yxyxyxxy

nyx tttt ⋅−=⋅+⋅−⋅−= ∑∑

( )

⇒ =$cov ,

by x

xσ 2

( ) ( )

xyy

x

y

x

xyxxy Rbxyxyr =⋅=⋅==

σσ

σσ

σσσˆ,cov,cov

2/

De asemenea, testarea semnificaţiei unui model econometric se poate face tot cu testul „F”, dar, pornind de la valoarea raportului de corelaţie, , sau a coeficientului de determinare, : x/yR 2

x/yR

kkn

RR

knV

:k

Vs

sF ux

u

x/ycal

111 2

222

2

2−−

⋅−

=−−

==

Modele econometrice

Astfel:

- dacă ⇒=⇒≤−

⋅−−

= −−== 01

112

2

21 x/yknv;kv;cal RFR

RkknF α

se renunţă la modelul econometric obţinut;

- dacă ⇒≠⇒>−

⋅−−

= −−== 01

1/1;;2

2

21 xyknvkvcal RFR

RkknF α se trece la

discuţia econometrică a ecuaţiei analizei variaţiei – – vezi

relaţia (3.4.25).

2220 ux VVV +=

3.5 Utilizarea modelului econometric unifactorial

În practica economică, un model econometric se utilizează pentru explicarea variaţiei fenomenului rezultativ y în raport de variaţia factorului său x, pentru estimarea valorilor probabile ale fenomenului y (simularea acestuia) în funcţie de posibilele valori pe care economic le poate înregistra factorul x, şi, în final, prognoza fenomenului y în funcţie de valorile fenomenului x, pe intervalul de prognoză v, v = 1, 2, ..., h.

Pentru a permite ca utilizatorii să verifice proprietăţile (performanţele) unui model econometric obţinut, acesta trebuie prezentat cu următoarele informaţii:

tt xbay ˆˆˆ += ; R ( ) ( ) d as bs

us

Dispunând de aceste informaţii se poate testa: - independenţa erorilor testul „d” – Durbin – Watson; - semnificaţia estimatorilor testul „t”; - similitudinea modelului testul „F”. În anumite cazuri, când s-au estimat două modele pentru spaţii

diferite (două judeţe, sau două pieţe diferite) sau pentru perioade de timp diferite, ale aceloraşi două fenomene y şi x, de exemplu: şi xbayM 111 : +=


xbayM 222 : += , se poate testa ipoteza omogenităţii sau stabilităţii relative a legităţii dintre cele două fenomene:

⇒= 210 : bbH cele două modele sunt relativ omogene, sau legătura este relativ stabilă în timp;

⇒≠ 211 : bbH cele două modele nu sunt omogene (legătura nu este relativ stabilă).

Astfel,

- dacă: ⇒≤+

−= αt

ss

bbt

bb

cal 2221

21

se acceptă H0;

- dacă: ⇒>+

−= αt

ss

bbt

bb

cal 2221

21

se acceptă H1.

De reţinut că ipoteza H0 este folosită în special în domeniul

prognozei, deoarece acceptarea ei presupune existenţa unei legături relativ stabile în timp, premisă ce justifică previziunea fenomenului y pe baza valorilor viitoare ale fenomenului x. În acelaşi timp, în toate cele trei direcţii în care poate fi folosit un model econometric, valorile fenomenului pot fi estimate, fie pe baza estimaţiei punctuale, tt xbay += , fie pe baza

unui interval de încredere:

( ) ααα −==⋅+≤≤⋅− 1pstyystyPtt yttyt (3.5.1)

De regulă, prognoza fenomenului y dacă se cunosc valorile variabilei

factoriale x pentru momentul (n+v) se realizează pe baza unui interval de încredere, deoarece y este o variabilă aleatoare normală de medie şi de

abatere medie pătratică (vezi ipotezele I1 şi I4 ale M.C.M.M.P.):

vny +

vnys+

Modele econometrice

( ) ααα −==⋅+≤≤⋅−++ +++ 1pstyystyP

vnvn yvnvnyvn (3.5.2)

unde:

y n +v = valoarea reală a variabilei y în momentul de prognoză ( n ); v+

=+ vny estimaţia punctuală a valorii de prognoză pentru variabila y,

care se calculează cu ajutorul relaţiei:

vnvn xbay ++ += (3.5.3)

vnys+

= abaterea medie pătratică a erorii de previziune, calculată cu

relaţia:

( )( ) ⎟

⎟⎟⎟⎟

⎠

⎞

⎜⎜⎜⎜⎜

⎝

⎛

−

−++⋅==

∑=

+

++ n

tt

vnuy

xx

xxn

sssvny

1

2

222

ˆ11

ˆvn (3.5.4)

Din relaţia de mai sus rezultă că eroarea de previziune ( ) este

cu atât mai mică cu cât numărul de observaţii va fi mai mare, cu cât valorile variabilelor în momentul de prognoză (n+v) vor fi mai apropiate de media lor, cu cât dispersia variabilei exogene x va fi mai mare şi cu cât dispersia variabilei reziduale ( ) este mai mică, iar aceasta va fi cu atât mai mică cu

cât modelul econometric va explica o parte tot mai mare din variaţia variabilei prognozate , sau cu cât raportul de corelaţie (

vnys+

2us

y xyR ) va avea o

valoare mai apropiată de unu. Aprecierea prognozei unui fenomen y pe baza unui model

econometric, tt xbay += , se poate face cu ajutorul a două noţiuni,

siguranţa prognozei şi precizia prognozei, noţiuni care se află în relaţie invers proporţională.


Siguranţa prognozei este dată de probabilitatea (p) cu care este estimat intervalul de încredere, iar precizia prognozei de relaţia:

- eroarea absolută: vnyvnvna styye

+⋅=−= ++ α (3.5.5)

- eroarea relativă: 100100 ⋅⋅

=⋅=++

+

vn

y

vn

ar y

stye

(%)e vnα (3.5.6)

Dar, dacă p 1 rezultă că siguranţa prognozei creşte, iar dacă t α

rezultă că eroarea creşte, iar precizia se diminuează. Din acest motiv, estimarea valorilor probabile ale fenomenului y se face pe baza unor valori prestabilite privind siguranţa şi precizia prognozei. De exemplu, se poate preciza că prognozele vor trebui acceptate cu o probabilitate dată, p = 0,95 => α = 0,05, iar eroarea de prognoză – pe un anumit orizont al prognozei – trebuie să fie:

(%)Ey

st(%)e

vn

yr

vn ≤⋅⋅

=+

+ 100α E(%) = 5, 10,...

Analiza capacităţii de prognoză a unui model poate fi realizată pe

baza indicatorilor statistici propuşi de H. Theil (Pindyck, Rubinfeld, 1981, p. 364-366). Aceşti indicatori sunt calculaţi pe baza următoarelor relaţii:

• coeficientul Theil

( )

∑∑

∑

==

=

+

−=

n

tt

n

tt

n

ttt

yn

yn

yynT

1

2

1

2

1

2

1ˆ1

ˆ1

(3.5.7)

ale cărui valori sunt cuprinse în intervalul [0, 1].

Semnificaţia acestui indicator este invers proporţională cu mărimea lui, respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu atât capacitatea de prognoză a modelului este mai bună.

Modele econometrice

• ponderea abaterii

( )( )

( )2

2

1

2

2ˆ

ˆ1ˆ

un

ttt

A yy

yyn

yyTσ−

=−

−=

∑=

(3.5.8)

unde:

=y media valorilor teoretice ale variabilei endogene;

=y media valorilor reale ale variabilei endogene; =2

uσ dispersia variabilei reziduale necorectată cu numărul gradelor de

libertate.

Interpretarea acestui indicator, care evidenţiază existenţa unor erori sistematice, este aceea că, în cazul ideal11, valoarea sa este egală cu zero, aceasta tinzând către unu în cazul unor erori de estimare de-a lungul întregii serii de timp.

• ponderea dispersiei

( )( )

( ) ( )2

2

1

2

1

2

1

2

2ˆ

1ˆˆ1

ˆ1 u

n

tt

n

ttt

n

ttt

yyD

yyn

yyn

yyn

T tt

σσσ ⎥

⎥⎦

⎤

⎢⎢⎣

⎡−−−

=−

−=

∑∑

∑==

=

(3.5.9)

care este definită tot în intervalul [0, 1], aceasta măsurând evoluţia oscilantă a celor două serii, respectiv seria ajustată şi seria empirică a variabilei endogene. Acest indicator are aceeaşi semnificaţie ca şi cei precedenţi, respectiv o valoare scăzută indică o capacitate bună de prognoză, în timp ce o valoare apropiată de unu exprimă o eroare de specificare a modelului.

11 Demn de menţionat este faptul că, în cazul estimării parametrilor unui model statistic cu ajutorul

metodei celor mai mici pătrate, valoarea acestui indicator este egală cu zero, acesta fiind discriminant numai în cazul utilizării altor procedee de estimare cum ar fi, de exemplu, metoda grafică, metoda punctelor empirice sau metoda punctelor medii.


• ponderea covarianţei

( )

( )∑=

−

−= n

ttt

yyC

yyn

rT tt

1

2

ˆ

ˆ112 σσ

(3.5.10)

unde:

r = coeficientul de corelaţie liniară dintre valoarea estimată a variabilei endogene, , şi cea reală, yt. ty

( )( )tt yy

n

ttt

n

yyyyr

σσ ˆ

1

ˆˆ∑=

−−= (3.5.11)

Se poate observa uşor că semnificaţia acestui indicator este analogă

cu a celor menţionaţi anterior. De altfel cei patru indicatori se regăsesc în următoarea ecuaţie

propusă de Theil:

( ) ( ) ( ) ( )tttt yyyy

n

ttt ryyyy

nσσσσ ˆ

2ˆ

2

1

2 12ˆˆ1−+−+−=−∑

=

(3.5.12)

a cărei interpretare se realizează prin intermediul semnificaţiei acestor indicatori.

În cazul în care modelul econometric se utilizează în special la prognoza fenomenelor economice este necesară verificarea stabilităţii în timp a legităţii de evoluţie a fenomenului analizat în funcţie de evoluţia factorilor săi. Acest lucru se poate realiza cu ajutorul testului Chow, care se aplică astfel:

- fie modelul unifactorial iniţial:

- y0t = a + b x0t + u0t ( n,t 1= ); ∑=

=n

ttu uV

1

20

20

(3.5.13)

Modele econometrice

pe care îl împărţim în două modele:

- y1t = a1 + b1 xt + u1t ( 11 n,t = ); ∑=

=1

1 1

21

2n

ttu uV (3.5.14)

y2t = a2 + b2 xt + u2t ( n,nt 11+= ); ∑+=

=

n

nttu uV

1

22

2

12

(3.5.15)

222

1

22

1

21

1

221

1

1

uuun

ntt

n

tt

n

tt VVVuuu +=⇔+= ∑∑∑

+=== (3.5.16)

n = n 1 + n 2, n = numărul de observaţii.

Testarea ipotezei de stabilitate constă în alegerea uneia din următoarele ipoteze:

H0: Dacă 220

uu VV ≅ rezultă că legitatea de evoluţie a fenomenului

este stabilă în timp, iar modelul poate fi utilizat în vederea efectuării prognozei;

H1: Dacă 220

uu VV ≠ rezultă că legitatea de evoluţie a fenomenului

nu este stabilă în timp, iar modelul nu va putea fi utilizat în vederea efectuării prognozei.

Aplicarea testului Fisher-Snedecor constă în:

- dacă ( )21

0

112

2

22

v;v;u

uuc F

kkn

V

VVF α≤

++−

⋅−

= (3.5.17)

se alege ipoteza H0, în caz contrar se alege ipoteza H1 ( numărul gradelor de libertate este: v1= k + 1, v2 = n – 2 ( k + 1 ), k = numărul variabilelor exogene).


Exemplu de aplicare a modelului unifactorial

Se cunosc următoarele date privind consumul final real al gospodăriilor populaţiei şi PIB-ul real în România, în perioada 1990-2003, exprimate în preţuri comparabile (1990=100).

Tabelul 3.5.1

Anul

Consumul final real al gospodăriilor populaţiei

(mild.lei preţuri comparabile) (1990=100)

PIB (mild.lei preţuri comparabile)

(1990=100)

0 1 2 1990 557,7 857,9 1991 467,4 746,8 1992 432,1 681 1993 435,9 691,3 1994 447,3 718,2 1995 505,3 769,3 1996 545,7 799,5 1997 525,7 750,7 1998 586,2 714,8 1999 579,8 706,1 2000 582,3 720,7 2001 610,7 761,7 2002 629,1 799,1 2003 673,7 838,3

Notă: Ambii indicatori sunt calculaţi conform metodologiei de calcul a Sistemului European al Conturilor Economiei Integrate - SEC 1979. Consumul final al populaţiei a fost deflaţionat cu ajutorul deflatorului consumului final al populaţiei exprimat în preţuri constante (1990 = 100), datele provenind de la Ministerul Prognozei şi Dezvoltării, iar PIB-ul a fost deflaţionat cu ajutorul deflatorului PIB exprimat în preţuri constante (1990 = 100), obţinut în urma prelucrării datelor din Raportul Anual BNR. Sursa: Date prelucrate pe baza Anuarului Statistic al României 2003, INS, Bucureşti, 2004-CD, Raportului Anual 2000, BNR, Bucureşti, 2001, p. 6*-7*, Raportului Anual 2002 BNR, Bucureşti, 2003, p. 4*-5*, Comunicatului de Presă al INS nr.11/26.02.2004.

Se cere: a) Să se construiască modelul econometric ce descrie legătura dintre

cele două variabile şi să se interpreteze semnificaţia parametrilor modelului;

Modele econometrice

b) Să se estimeze parametrii modelului şi să se verifice semnificaţia acestora;

c) Ştiind că în anul 2004, valoarea PIB-ului real12 a fost egală cu 907,8 mild lei preţuri comparabile (1990=100), să se estimeze valoarea consumului final real al gospodăriilor populaţiei în anul 2004 şi să se verifice capacitatea de prognoză a modelului utilizat.

Rezolvare:

a) Notând cu y = consumul final real al gospodăriilor populaţiei; x = PIB-ul real;

modelul econometric va fi de forma: ( )y f x u= + .

Pentru alegerea funcţiei matematice ( )f x se recurge la reprezentarea

grafică a celor două şiruri de valori.

430450470490510530550570590610630650670

670 685 700 715 730 745 760 775 790 805 820 835 850

x

y

Figura 2.3.1. Legătura dintre consumul final real al gospodăriilor populaţiei

şi PIB-ul real al României

12 Valoare estimată pe baza informaţiilor furnizate în cadrul Comunicatului de Presă al INS

nr. 12/11.03.2005, privind principalii indicatori conjuncturali în anul 2004 şi luna ianuarie 2005


Deoarece graficul punctelor empirice indică faptul că distribuţia poate fi aproximată cu o dreaptă, modelul econometric devine:

14,1; =++= tubxay ttt

Semnificaţia economică a celor doi parametrii şi , ţinând cont de semnificaţia celor două variabile (y - consumul final real al gospodăriilor populaţiei şi x - PIB-ul real) este:

a b

- parametrul reprezintă în acest caz autoconsumul, deoarece pentru

ax y a= ⇒ =0 ; - parametrul reprezintă panta dreptei sau coeficientul de regresie al

consumului în funcţie de PIB, care măsoară creşterea consumului dacă PIB-ul se modifică cu un miliard de lei.

b

b) Estimarea parametrilor modelului econometric de la punctul a) se face cu ajutorul M.C.M.M.P.:

( ) ( ) ( )∑∑==

−−=−=14

1

214

1

2 ˆˆminˆminˆ,ˆt

ttt

tt xbayyybaF

( )′ = ⇒ + =∑ ∑F a na b x yt t$ $ $0

( )′ = ⇒ + =∑ ∑ ∑F b a x b x y xt t$ $ $0 2

⎪⎩

⎪⎨⎧

=+

=+⇒

t t

07,5744734ˆ14,7996163ˆ4,10555

9,7578ˆ4,10555ˆ14

ba

ba

(vezi tabelul 3.5.2., coloanele 2, 3, 4, 5).

Modele econometrice

Tabelul 3.5.2 Nr. crt.

Anul xt yt xt2 x yt t 1ˆ −tu 2

1ˆ

−tu 1ˆˆ −ttuu

0 1 2 3 4 5 6 7 8 1 1990 857,9 557,7 735992,41 478450,83 - - - 2 1991 746,8 467,4 557710,24 349054,32 -67,6095 4571.0382 4608,8583 3 1992 681 432,1 463761,00 294260,10 -68,1688 4646.9914 3430,1977 4 1993 691,3 435,9 477895,69 301337,67 -50,3191 2532.0160 2759,4477 5 1994 718,2 447,3 515811,24 321250,86 -54,8389 3007.3080 3573,7049 6 1995 769,3 505,3 591822,49 388727,29 -65,1673 4246.7772 3156,9084 7 1996 799,5 545,7 639200,25 436287,15 -48,4431 2346.7374 1571,3535 8 1997 750,7 525,7 563550,49 394642,99 -32,4371 1052.1637 422,3000 9 1998 714,8 586,2 510939,04 419015,76 -13,0191 169.4958 -995,6848

10 1999 706,1 579,8 498577,21 409396,78 76,4790 5849.0429 5897,0252 11 2000 720,7 582,3 519408,49 419663,61 77,1064 5945.4012 5228,8438 12 2001 761,7 610,7 580186,89 465170,19 67,8133 4598.6481 4278,7321 13 2002 799,1 629,1 638560,81 502713,81 63,0957 3981.0719 3235,9296 14 2003 838,3 673,7 702746,89 564762,71 51,2860 2630.2565 3293,7103

Total 10555,4 7578,9 7996163,14 5744734,07 - 45576,9481 40461,3270

Tabelul 3.5.2 (continuare)

1

*

8878,0 −−−=

t

tt

yyy

1

*

8878,0 −−−=

t

tt

xxx

1

*

9016,0 −−−=

t

tt

yyy

1

*

9016,0 −−−=

t

tt

xxx

9 10 11 12 - - - -

-27,7030 -14,8081 -35,4029 -26,6527 17,1616 18,0219 10,7085 7,7112 52,2995 86,7364 46,3337 77,3342 60,3260 104,4925 54,3078 94,9481

108,2056 131,7118 102,0299 121,7959 97,1156 116,5473 90,1392 105,9260 41,2501 40,9370 33,7159 29,8987

119,5053 48,3596 112,2472 37,9951 59,3959 71,5302 51,3025 61,6613 67,5776 93,8537 59,5726 84,1049 93,7582 121,8924 85,7186 111,9420 86,9458 122,8943 78,5142 112,3779

115,2111 128,8921 106,5254 117,8593

891,0494 1071,0611 795,7127 936,9018


Utilizând pachetul de programe EViews în vederea estimării parametrilor modelului au fost obţinute următoarele rezultate: Dependent Variable: Y Method: Least Squares Sample: 1990 2003 Included observations: 14

Variable Coefficient Semnif. ind. Std. Error Semnif. ind. t-

StatisticSemnif. ind. Prob.

C -67,6561 a 250,0188 asˆ -0,2706 at ˆ 0,7913 ( )ap ˆ

X 0,8077 b 0,3308 bs ˆ 2,4416 b

t ˆ 0,0311 ( )bp

R-squared 0,3319 2R Mean dependent var 541,35 y

Adjusted R-squared 0,2762 2

cR S.D. dependent var 75,6474 ys

S.E. of regression 64,3567 us ˆ Akaike info criterion 11,2983 AIC

Sum squared

resid 49701,46

( )∑∑=

=−2

2

ˆ

ˆ

t

tt

u

yySchwarz criterion 11,3896 SC

Log likelihood -77,0883 L F-statistic 5,9615 Fc

Durbin-Watson

stat 0,1969 d Prob(F-statistic) 0,0311 p(F)

Semnificaţia indicatorilor necunoscuţi pe care-i calculează pachetul

de programe EViews este următoarea:

( ) ( )=bpap ˆ,ˆ probabilitatea asociată parametrului â, respectiv . O valoare cât mai apropiată de zero a acestei probabilităţi va indica o semnificaţie ridicată a parametrului respectiv, în caz contrar, aceasta confirmând, împreună cu testul t, faptul că parametrul respectiv este nesemnificativ.

b

2cR = coeficientul de deteminare corectat sau ajustat. Acesta este

utilizat în vederea evidenţierii numărului de variabile factoriale cuprinse în model, precum şi a numărului de observaţii pe baza cărora au fost estimaţi parametrii modelului. În cazul unui model multifactorial acesta va înregistra

Modele econometrice

valori inferioare coeficientului de deteminaţie. Expresia acestui indicator este următoarea:

( )22 111 Rkn

nRc −⋅−−

−=

L= logaritmul funcţiei de verosimilitate (presupunând că erorile sunt

normal distribuite), funcţie ce este determinată ţinând seama de valorile estimate ale parametrilor. Relaţia de calcul a acestui indicator, utilizată de către pachetul de programe EViews, este următoarea:

( )⎟⎟

⎠

⎞

⎜⎜

⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛++= ∑

nunL t

2ˆln2ln1

2π

unde:

=∑ 2ˆtu suma pătratelor erorilor;

k = numărul variabilelor exogene; n = numărul de observaţii.

Acest indicator este utilizat în vederea elaborării unor teste statistice destinate depistării variabilelor omise dintr-un model econometric, precum şi a unor teste destinate depistării variabilelor redundante dintr-un model econometric, ca, de exemplu, testul LR sau raportul verosimilităţilor (Likelihood Ratio).

y = media variabilei dependente sau endogene, având următoarea relaţie de calcul:

n

yy

n

t∑== 1

t


ys = abaterea medie pătratică (standard) corespunzătoare variabilei

dependente, a cărei relaţie de calcul este următoarea:

( )1

1

2

−

−=∑=

n

yys

n

tt

y

AIC = criteriul Akaike este utilizat în cazul comparării a două sau

mai multe modele econometrice. Relaţia de calcul a acestuia, utilizată de către pachetul de programe EViews, este următoarea:

nk

nLAIC 22+−=

Regula de decizie utilizată în cazul aplicării acestui test este aceea potrivit căreia este ales acel model econometric pentru care s-a obţinut valoarea cea mai mică corespunzătoare acestui indicator.

SC = criteriul Schwartz este, de asemenea, utilizat pentru a compara două sau mai multe modele econometrice. Relaţia de calcul a acestuia, utilizată de către pachetul de programe EViews, este următoarea:

nnk

nLSC ln2+−=

Şi în acest caz, este ales acel model econometric pentru care s-a

obţinut valoarea cea mai mică corespunzătoare acestui indicator. p(F) = probabilitatea asociată statisticii F. O valoare cât mai apropiată de zero a acestei probabilităţi va indica o semnificaţie ridicată a rezultatelor estimării, respectiv a modelului.

Pe baza estimatorilor parametrilor au fost calculate valorile estimate ale variabilei y, tt xy 8077,06561,67ˆ +−= şi ale variabilei reziduale,

. Valorile acestora sunt prezentate în cadrul tabelului 3.5.3

(utilizând pachetul de programe EViews). ttt yyu ˆˆ −=

Modele econometrice

Tabelul 3.5.3 Actual

ty

Fitted

ty

Residual

ttt yyu ˆˆ −= Residual Plot

(graficul reziduurilor)

557,7 625,3095 -67,6095 | * | . | 467,4 535,5688 -68,1688 | *. | . | 432,1 482,4191 -50,3191 | . * | . | 435,9 490,7389 -54,8389 | .* | . | 447,3 512,4673 -65,1673 | * | . | 505,3 553,7431 -48,4431 | . * | . | 545,7 578,1371 -32,4371 | . * | . | 525,7 538,7191 -13,0191 | . * | . | 586,2 509,7210 76,4790 | . | . *| 579,8 502,6936 77,1064 | . | . *| 582,3 514,4867 67,8133 | . | * | 610,7 547,6043 63,0957 | . | * | 629,1 577,8140 51,2860 | . | * . | 673,7 609,4776 64,2224 | . | * |

- dispersia variabilei reziduale

( )7884,4141

2144613,49701

1ˆ 2

2ˆ

=−

=−−−

= ∑kn

yys tt

u

unde: k = numărul variabilelor exogene. (vezi tabelul afişat de programul EViews)

- abaterea medie pătratică a variabilei reziduale, : us ˆ

( )3567,647884,4141

1ˆ 2

ˆ ==−−−

= ∑kn

yys tt

u

(vezi tabelul afişat de programul EViews)

- abaterile medii pătratice ale celor doi estimatori:

( )0188,2501

2

22ˆˆ =

⎥⎥⎦

⎤

⎢⎢⎣

⎡

−+=∑ xx

xn

sst

ua


( )3308,02

2ˆ

ˆ =−

=∑ xx

sst

ub


- raportul de corelaţie:

( )

( )

( )

( )

5761,03319,0875,743924613,497011

1

ˆ1

ˆ1 2

14

1

2

14

1

2

14

1

2

2

==−=

−⋅

−−=

−

−−==

∑

∑

∑=

=

=

R

ns

yy

yy

yyRR

y

ttt

tt

ttt


- variabila Durbin-Watson, d:

( )20,0

4613,497017173,9784

ˆ

ˆˆ

14

1

2

14

2

21

==−

=

∑

∑

=

=−

tt

ttt

u

uud


Astfel, modelul estimat devine:

( ) ( )3567,64

20,03308,00188,250576,0;8077,06561,67ˆ

ˆ ===+−=

u

tt

sdRxy

Verificarea semnificaţiei modelului necesită: - verificarea ipotezei de independenţă a erorilor; - verificarea ipotezei de homoscedasticitate a erorilor; - verificarea semnificaţiei estimatorilor; - verificarea semnificaţiei raportului de corelaţie.

Modele econometrice

Verificarea ipotezei de independenţă a erorilor, care presupune , se realizează cu ajutorul testului Durbin-Watson, constând

în calcularea variabilei şi compararea sa cu două valori teoretice şi

, preluate din tabela distribuţiei Durbin-Watson în

funcţie de un prag de semnificaţie

( )cov ,u ut t− =1 0

d d1

d 2 ( 36,1;08,1 21 == dd )α ( )05,0=α , de numărul variabilelor

explicative k şi de numărul observaţiilor (k = 1) n ( )n ≥ 15 . Observaţie:

tabela Durbin-Watson este construită pentru un număr de observaţii ; pentru valori inferioare se va lucra cu valorile calculate pentru n . adică .

n ≥ 15= 15

36,1,08,1 21 == ddDeoarece valoarea calculată 2,0=d este cuprinsă în intervalul

, aceasta indică existenţa unei autocorelări pozitive. 08,12,00 1 =<=< ddDin acest motiv, nu mai are sens testarea celorlalte ipoteze, a semnificaţiei estimatorilor şi a raportului de corelaţie, estimatorii nemaifiind eficienţi, deci se impune mai întâi eliminarea fenomenului de autocorelaţie a erorilor.

Un alt procedeu de verificare a ipotezei de independenţă a erorilor constă în aplicarea testului Breusch-Godfrey, acest test fiind utilizat în vederea depistării unei autocorelaţii de ordin superior. Ca urmare a presupunerii existenţei unei autocorelaţii de ordin superior se construieşte următorul model:

tptpttt zurururu ++++= −−− K2211

unde:

zt = variabilă reziduală de medie zero şi dispersie constantă.

Ipoteza nulă care stă la baza testului este aceea potrivit căreia toţi coeficienţii corespunzători valorilor decalate ale variabilei reziduale sunt simultan egali cu zero, fapt ce implică non-existenţa fenomenului de autocorelaţie a erorilor.

În vederea aplicării testului sunt estimate valorile variabilei reziduale ut în urma aplicării M.C.M.M.P. asupra modelului iniţial. Variabila


reziduală ut este regresată apoi în funcţie de variabilele exogene iniţiale ale modelului şi de valorile decalate ale sale, respectiv ut-1, ut-2,…, ut-p. În cazul acestei regresii este calculată valoarea coeficientului de determinare R2 şi a unei variabile de forma: BG = (n-p) R2. Presupunând că ne aflăm în situaţia unui eşantion de volum mare, variabila BG este asimptotic distribuită sub forma unui χ , pentru care numărul gradelor de libertate este egal cu: 2

;vα

pv = , unde p = mărimea decalajului , respectiv: BG~ χ . 2;vα

Dacă χ , ipoteza nulă este respinsă, ceea ce presupune că

există cel puţin un coeficient de autocorelaţie nenul.

>BG 2;vα

Aplicarea testului Breusch-Godfrey s-a realizat utilizând pachetul de

programe EViews (presupunând ca mărimea decalajului este p = 2): Breusch-Godfrey Serial Correlation LM Test:

F-statistic 16,6537 Probability 0,0007 Obs*R-squared 10,7673 Probability 0,0046

Test Equation: Dependent Variable: RESID Method: Least Squares

Variable Coefficient Std. Error t-Statistic Prob. C 166,6378 146,9445 1,1340 0,2832 X -0,2158 0,1935 -1,1154 0,2908

RESID(-1) 1,0098 0,2999 3,3669 0,0072 RESID(-2) -0,0880 0,3298 -0,2667 0,7951

R-squared 0,7691 Mean dependent var -3,45E-14 Adjusted R-squared 0,6998 S.D. dependent var 61,8319 S.E. of regression 33,8769 Akaike info criterion 10,1183 Sum squared resid 11476,43 Schwarz criterion 10,3009 Log likelihood -66,8281 F-statistic 11,1025 Durbin-Watson stat 1,4994 Prob(F-statistic) 0,0016

Modele econometrice

În cazul utilizării pachetului de programe EViews există două

variante de aplicare a testului Breusch-Godfrey: - utilizarea testului Fisher–Snedecor aplicat în vederea verificării

existenţei unor variabile absente (omise) în model, având următoarea relaţie de calcul:

( ) ( )mnRpRFc −−

= 2

2

1

unde:

p = numărul de variabile noi adăugate în model, respectiv ut-1, ut-2,…, ut-

p ; m = numărul total de parametri corespunzători noului model.

Dacă , unde v1 = p şi v2 = n-m, ipoteza conform căreia

estimatorii corespunzători noilor parametri adăugaţi în model sunt nuli este verificată, respectiv, în cazul nostru, fenomenul de autocorelare a erorilor nu este prezent, cazul contrar implicând existenţa cel puţin a unei autocorelaţii de ordinul întâi. Cum

21;; vvc FF α<

10,46537,16 10;2;05,0 =>= FFc , rezultă că noul model

este incorect specificat, indicând astfel prezenţa unei autocorelaţii de ordinul întâi.

- utilizarea testului LM, calculat ca produs între numărul de observaţii corespunzătoare modelului, n, şi coeficientul de determinare, R2, corespunzător acestei regresii auxiliare. În general, testul LM este asimptotic distribuit sub forma unui χ , pentru care numărul gradelor de libertate este

egal cu:

2;vα

pv = , unde p = mărimea decalajului, respectiv:

2RnLM ⋅= ~ χ 2;vα

Dacă >LM χ , erorile sunt autocorelate, în caz contrar, sunt

independente, respectiv ipoteza nulităţii parametrilor,

2;vα

021 == rr , este


acceptată. Se constată astfel că pachetul de programe nu utilizează relaţia clasică de calcul a testului Breusch-Godfrey, respectiv: BG = (n-p)·R2.

Deoarece χ , aceasta implică existenţa

a cel puţin unei autocorelaţii de ordinul întâi, ce poate fi remarcată şi pe baza semnificaţiei parametrului corespunzător valorii decalate cu o perioadă a variabilei reziduale.

>= 7673,10LM 99147,522;05,0 =

În cazul calculării în varianta clasică a testului Breusch-Godfrey, respectiv: >=⋅= 2291,97691,012BG χ , se ajunge la aceleaşi

concluzii menţionate anterior.

99147,522;05,0 =

Eliminarea fenomenului de autocorelare a erorilor presupune efectuarea următoarelor operaţii:

- erorile fiind corelate, adică:

( )u r u zt t= +−1 1 t (1)

se va estima valoarea coeficientului de autocorelaţie de ordinul 1:

( ) 89,09481,45576327,40461

ˆ

ˆˆ

14

2

21

14

21

1 ===

∑

∑

=−

=−

tt

ttt

u

uur

(vezi tabelul 2.3.2., coloanele 6, 7, 8)

- ştiind că: y a bx u u y a bxt t t t t= t+ + ⇒ = − − y a bx u u y a bxt t t t t− − − − −= + + ⇒ t−= − −1 1 1 1 1 1

− − = − − +− −1 1 1

expresiile obţinute pentru şi vor fi înlocuite în relaţia (1) şi se obţine:

ut ut−1

( ) ( )y a bx r y a bx zt t t t t

( ) ( )( ) ( )( )y r y a r b x r x zt t t t− = − + − +− −1 1 1 1 11 t

Modele econometrice

Notând cu: ( )y y r yt t t* = − −1 1

( )x x r xt t t* = − −1 1

( )( )a a r1 11= −

b b1 =

se obţine:

*11

**11

* ˆˆˆ ttttt xbayzxbay +=⇒++= (2)

În vederea estimării parametrilor şi se aplică M.C.M.M.P.: $a1$b1

( ) (∑=

−−=14

2

2*11

*11

ˆˆminˆ,ˆt

tt xbaybaF )

( ) ( )′ = ⇒ − + =∑ ∑F a n a b x yt t1 1 10 1 $ $ * *

( ) ( )′ = ⇒ + =∑ ∑∑F b a x b x y xt t1 1 1

20 $ $* *

t t* *

În urma aplicării programului EViews, rezultatele estimării noului

modelului au fost următoarele: Dependent Variable: *

tyMethod: Least Squares Sample: 1991 2003 Included observations: 13

Variable Coefficient Std. Error t-Statistic Prob.

C 9,5845 15,4322 0,6211 0,5472 *tx 0,7156 0,1645 4,3505 0,0012

R-squared 0,6324 Mean dependent var 68,5423 Adjusted R-squared 0,5990 S.D. dependent var 42,0350 S.E. of regression 26,6176 Akaike info criterion 9,5417 Sum squared resid 7793,4860 Schwarz criterion 9,6286 Log likelihood -60,0208 F-statistic 18,9270 Durbin-Watson stat 1,7216 Prob(F-statistic) 0,0012


Ca şi în cazul modelului iniţial se vor calcula valorile estimate ale

variabilei , şi ale variabilei reziduale,

. Valorile acestora sunt prezentate în cadrul tabelului 3.5.4

(utilizând pachetul de programe EViews).

*ty ** 7156,05845,9ˆ tt xy +=⇒

** ˆˆ ttt yyz −=

Tabelul 3.5.4

Actual *ty

Fitted *ˆ ty

Residual ** ˆˆ ttt yyz −=

Residual Plot (graficul reziduurilor)

-27,7030 -1,0121 -26,6909 | * | . | 17,1616 22,4810 -5,3194 | . *| . | 52,2995 71,6530 -19,3535 | .* | . | 60,3260 84,3593 -24,0332 | * | . | 108,2056 103,8374 4,3682 | . |* . | 97,1156 92,9857 4,1299 | . |* . | 41,2501 38,8790 2,3711 | . * . | 119,5053 44,1907 75,3147 | . | . *| 59,3959 60,7715 -1,3755 | . * . | 67,5776 76,7461 -9,1686 | . *| . | 93,7582 96,8106 -3,0525 | . *| . | 86,9458 97,5276 -10,5818 | . * | . | 115,2111 101,8196 13,3914 | . | * . |

Pe baza calculelor prezentate mai sus rezultă modelul:

( ) ( )6176,26

72,11645,04322,15795,0;7156,05845,9ˆ

ˆ

**

==′=′+=

z

tt

sdRxy

(3)

Utilizând testul Durbin-Watson pentru a verifica dacă fenomenul de

autocorelaţie a fost eliminat - pentru un prag de semnificaţie 1513,1,05,0 ≅=== nkα valorile teoretice ale variabilei Durbin-Watson

sunt . În comparaţie cu acestea, valoarea empirică

se situează astfel:

36,1,08,1 21 == dd

72,1=′d 64,2472,136,1 22 =−<=′<= ddd , ceea ce indică fenomenul de independenţă a erorilor, deci fenomenul de autocorelaţie a fost eliminat.

Modele econometrice

Verificarea ipotezei de homoscedasticitate a erorilor în cazul acestui model se va realiza cu ajutorul testului White. Utilizând programul EViews au fost obţinute următoarele rezultate: White Heteroskedasticity Test:


Test Equation: Dependent Variable: RESID^2 Method: Least Squares Sample: 1991 2003 Included observations: 13


C 927,8680 1016,2720 0,9130 0,3827 *tx 18,3437 32,0687 0,5720 0,5799

2*tx -0,2090 0,2342 -0,8925 0,3931

R-squared 0,1418 Mean dependent var 599,4989 Adjusted R-squared -0,0299 S.D. dependent var 1542,118 S.E. of regression 1564,9870 Akaike info criterion 17,7483 Sum squared resid 24491851 Schwarz criterion 17,8787 Log likelihood -112,3641 F-statistic 0,8259 Durbin-Watson stat 2,7426 Prob(F-statistic) 0,4656

Analizând rezultatele afişate de programul EViews se constată că

10,48259,0 10;2;05,0 =<= FFc şi <= 843,1LM χ , iar estimatorii parametrilor modelului sunt nesemnificativi pentru un prag de semnificaţie

99147,522;05,0 =

05,0=α ( 228,210;05,0 =t ), deci ipoteza de homoscedasticitate se verifică.

Estimatorii modelului sunt semnificativ diferiţi de zero dacă:

( ) 11;ˆ

1

11ˆ

ˆ−−−≥= kn

a

tsa

ta α


6211,04322,155845,9

1ˆ==

at

( ) 11;ˆ

1

ˆ

1

1

ˆ−−−≥= kn

bb

ts

bt α

3505,41645,07156,0

1ˆ==

bt

Lucrând cu un prag de semnificaţie α ( )05,0=α , din tabela distribuţiei Student se preia valoarea 201,211;05,0 =t . Comparând această

valoare cu valorile calculate pentru cei doi estimatori, se constată că:

- ⇒=<= 201,26211,0 11;05,01ˆtt

a parametrul nu este semnificativ

diferit de zero;

$a1

- ⇒=>= 201,23505,4 11;05.01ˆ

ttb

parametrul este semnificativ

diferit de zero.

$b1

Raportul de corelaţie este semnificativ diferit de zero dacă se verifică inegalitatea: , unde valoarea empirică a variabilei

Fisher-Snedecor este:

F Fc v≥ α ; ;1 2v

( )( ) 9615,53319,01

3319,0*111

21 2

2

=−

=−

−−=R

RnFc

Din tabela distribuţiei Fisher-Snedeckor, cu un prag de semnificaţie de 5% şi în funcţie de numărul gradelor de libertate şi

se preia valoarea teoretică . Se

constată că

v k1 1= =

( ) 11112 =−−−= knv 84,411;1;05,0 =F

84,49615,5 11;1;05,0 =>= FFc , deci pentru un prag de

semnificaţie de 5%, valoarea raportului de corelaţie este semnificativ diferită de zero.

Modele econometrice

În concluzie, modelul poate fi apreciat ca

reprezentativ pentru descrierea dependenţei dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real.

** 7156,05845,9ˆ tt xy +=

O altă variantă a metodei de eliminare a fenomenului de autocorelare

a erorilor prezentate mai sus constă în determinarea coeficientului de autocorelaţie de ordinul 1 pe baza variabilei Durbin-Watson, d, pentru a facilita utilizarea pachetului de programe EViews în vederea eliminării autocorelaţiei erorilor (utilizând programul autocorelaţie.prg):

( ) 90,0220,01

211 =−=−=

dr

Rezultatele estimării modelului (2), utilizând pachetul de programe

EViews3, sunt următoarele: Dependent Variable: DY Method: Least Squares Sample(adjusted): 1991 2003 Included observations: 13 after adjusting endpoints


C 10,1602 13,8505 0,7336 0,4786 DX 0,7083 0,1628 4,3506 0,0012

R-squared 0,6325 Mean dependent var 61,2087 Adjusted R-squared 0,5990 S.D. dependent var 41,9044 S.E. of regression 26,5346 Akaike info criterion 9,5354 3 Pentru a elimina autocorelaţia erorilor cu ajutorul pachetului de programe EViews a fost

utilizat următorul program (conform http://www.cip.dauphine.fr/bourbonnaise/eco.html) denumit autocorelatie.prg:

Estimarea directa a coeficientului de autocorelatie notat cu rau plecand de la statistica DW' Equation eq1.ls y c x genr res = resid scalar rau1=1-@dw/2 genr dy=y-rau1*y(-1) 'Se genereaza qvasi-diferentele.' genr dx=x-rau1*x(-1) equation eqm1.ls dy c dx 'Régresie denumita eqm1' scalar am1=c(1)/(1-rau1) 'Coef de reg.'


Sum squared resid 7744,9060 Schwarz criterion 9,6223 Log likelihood -59,9802 F-statistic 18,9279 Durbin-Watson stat 1,75 Prob(F-statistic) 0,0012

Valorile estimate ale variabilei şi ale variabilei reziduale,

sunt prezentate în cadrul tabelului 3.5.5 (utilizând pachetul de

programe EViews).

*ty

** ˆˆ ttt yyz −=

Tabelul 3.5.5

Actual *ty

Fitted *ˆ ty

Residual ** ˆˆ ttt yyz −=

Residual Plot (graficul reziduurilor)

-35,2893 -8,5948 -26,6945 | * | . | 10,8036 15,7300 -4,9263 | . *| . | 46,4217 65,0361 -18,6144 | .* | . | 54,3965 77,5139 -23,1174 | * | . | 102,1210 96,5348 5,5862 | . |* . | 90,2420 85,3011 4,9410 | . |* . | 33,8270 31,4535 2,3735 | . * . | 112,3543 37,1813 75,1730 | . | . *| 51,4219 53,9395 -2,5176 | . * . | 59,6906 69,8356 -10,1449 | . * | . | 85,8372 89,5554 -3,7182 | . *| . | 78,6385 89,8700 -11,2314 | . * | . | 106,6535 93,7580 12,8955 | . | * . |

Pe baza calculelor prezentate mai sus rezultă modelul:

( ) ( )5346,26

75,11628,08505,13795,0;7083,01602,10ˆ

ˆ

**

==′=′+=

z

tt

sdRxy

(4)

Utilizând testul Durbin-Watson pentru a verifica dacă fenomenul de

autocorelaţie a fost eliminat - pentru un prag de semnificaţie 1513,1,05,0 ≅=== nkα valorile teoretice ale variabilei Durbin-Watson

Modele econometrice

sunt . În comparaţie cu acestea, valoarea empirică

se situează astfel:

36,1,08,1 21 == dd

75,1=′d 64,2475,136,1 22 =−<=′<= ddd , ceea ce indică fenomenul de independenţă a erorilor, deci fenomenul de autocorelaţie a fost eliminat.

Verificarea ipotezei de homoscedasticitate a erorilor în cazul acestui model se va realiza cu ajutorul testului White. Utilizând programul EViews au fost obţinute următoarele rezultate: White Heteroskedasticity Test:


Test Equation: Dependent Variable: RESID^2 Method: Least Squares Sample: 1991 2003 Included observations: 13


C 1108,2070 824,2150 1,3446 0,2085 *tx 13,6436 26,6751 0,5115 0,6201 2*

tx -0,2067 0,2293 -0,9013 0,3886

R-squared 0,1424 Mean dependent var 595,7620 Adjusted R-squared -0,0291 S.D. dependent var 1535,4140 S.E. of regression 1557,6090 Akaike info criterion 17,7389 Sum squared resid 24261469,0 Schwarz criterion 17,8692 Log likelihood -112,3026 F-statistic 0,8302 Durbin-Watson stat 2,7474 Prob(F-statistic) 0,4639

Analizând rezultatele afişate de programul EViews se constată că

10,48302,0 10;2;05,0 =<= FFc şi <= 8512,1LM χ , iar

estimatorii parametrilor modelului sunt nesemnificativi pentru un prag de semnificaţie

99147,522;05,0 =

05,0=α ( 228,210;05,0 =t ), deci ipoteza de homoscedasticitate

se verifică.


Pentru a verifica semnificaţia estimatorilor parametrilor modelului, lucrând cu un prag de semnificaţie α ( )05,0=α , din tabela distribuţiei Student se preia valoarea 201,211;05,0 =t . Comparând această valoare cu valorile calculate pentru cei doi estimatori, se constată că:

- ⇒=<= 201,27336,0 11;05,01ˆtt

a parametrul nu este semnificativ

diferit de zero;

$a1

- ⇒=>= 201,23506,4 11;05.01

ttb

parametrul este semnificativ

diferit de zero.

$b1

Pentru a verifica semnificaţia raportului de corelaţie, din tabela distribuţiei Fisher-Snedecor, cu un prag de semnificaţie de 5% şi în funcţie de numărul gradelor de libertate v k1 1= = şi ( ) 11112 =−−−= knv se preia valoarea teoretică 84,411;1;05,0 =F . Se constată că

, deci pentru un prag de semnificaţie de 5%, valoarea raportului de corelaţie este semnificativ diferită de zero.

84,49279,18 11;1;05,0 =>= FFc

În concluzie, şi acest model, , poate fi apreciat ca reprezentativ pentru descrierea dependenţei dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real.

** 7083,01602,10ˆ tt xy +=

c) Analiza capacităţii de prognoză a modelului privind dependenţa dintre dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real în România în perioada 1981-2003 poate fi realizată pe baza indicatorilor statistici propuşi de H. Theil.

Aceşti indicatori, adaptaţi modelui supus analizei, au fost calculaţi pe baza următoarelor relaţii:

• coeficientul Theil

( )

∑∑

∑

==

=

+

−=

n

tt

n

tt

n

ttt

yn

yn

yyn

T

1

2*

1

2*

1

2**

1ˆ1

ˆ1

ale cărui valori sunt cuprinse în intervalul [0, 1]. Semnificaţia acestui indicator este invers proporţională cu mărimea

lui, respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu atât capacitatea de prognoză a modelului este mai bună.

Modele econometrice

• ponderea abaterii

( )2

1

ˆ z

ttt yy

nσ

−∑=

unde:

2**

2** ˆˆ

Ayyyy ⎟⎠⎞⎜

⎝⎛ −⎟

⎠⎞⎜

⎝⎛ −

2**1 nT ==

=*

y media valorilor teoretice ale variabilei endogene;

=*

y media valorilor reale ale variabilei endogene; ărul gradelor de

libertate.

sistematta t estimare de-a lungul întregii

serii de

=2zσ dispersia variabilei reziduale necorectată cu num

Interpretarea acestui indicator, care evidenţiază existenţa unor erori ice, este aceea că, în cazul ideal∗, valoarea sa este egală cu zero, inzând către unu în cazul unor erori deaceas

timp. • ponderea dispersiei

( )( )

2

2⎤⎡

1

2**

1

2**

1

2**

1ˆˆ1

ˆ1 z

n

tt

n

tt

n

ttt

yyn

yyn

yyn

Tσ

⎥⎥

⎦

⎢ ⎟⎠⎞⎜

⎝⎛ −−⎟

⎠⎞⎜

⎝⎛ −

−

∑∑

∑==

=

care este definită tot în intervalul [0, 1], aceasta măsurând evoluţia oscilantă a celor două serii, respectiv seria ajustată şi seria empirică a variabilei

şi semnificaţie ca şi cei precedenţi,

2ˆ ** yyD tt

σσ ⎢⎣=

−=

endogene. Acest indicator are aceearespectiv o valoare scăzută indică o capacitate bună de prognoză, în timp ce o valoare apropiată de unu exprimă o eroare de specificare a modelului.

• ponderea covarianţei

( )

( )∑ − tt yyn

2**ˆ1

−= n

yyCr

T ttˆ12 **σσ

=t 1

∗ Demn de menţionat este faptul că, în cazul estimării parametrilor unui model statistic cu ajutorul

metodei celor mai mici pătrate, valoarea acestui indicator este egală cu zero, acesta fiind discriminant numai în cazul utilizării altor procedee de estimare cum ar fi, de exemplu, metoda grafică, metoda punctelor empirice sau metoda punctelor medii.


unde: r = coeficientul de co el ie liniară dintre valoarea estimată a variabilei

endogene, , şi cea reală : r aţ

*ˆty , *ty

( )( )**ˆ tt yy

rσ

1

**** ˆˆn

ttt

n

yyyy

σ

∑=

Se poate observa uşor că semnificaţia acestui indicator este analogă cu a celor menţionaţi anterior.

De altfel cei patru indicatori se regăsesc în următoarea ecuaţie ropus

−−=

p ă de Theil:

( ) (21 n ) ( ) **** ˆˆ**

1

** 12ˆˆttttt yyyy

tt ryyyy

nσσσσ −+⎟

⎠⎞⎜

⎝⎛ −+−=−∑

22

=

cărei interpretare se realizează prin intermediul semnificaţiei acestor indicatori.

În urma calculelor efectuate cu ajutorul pachetului de programe

6 De

a

EViews în vederea testării capacităţii de prognoză a modelului privind dependenţa dintre dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real în perioada 1981-2003 au rezultat următoarele informaţii:

Rezultatele testării capacităţii de prognoză a modelului privind dependenţa dintre consumul final real al gospodăriilor populaţiei

şi PIB-ul real în România în perioada 1981-2003

Tabelul 3.5.numirea indicatorului Simbolul indicatorului Valoarea indicatorului

0 1 2 Coeficientul Theil 0,15T 77 Ponderea abaterii TA 0,0000 Ponderea dispersiei TD 0,1140 Ponderea c rianţei 0,8 0 ova TC 86

nalizei rezultatelor o ă că l posedă o de prognoză, ca urmare a valorilor mic strate în ca Theil, a ponderii terii şi a covarianţe ci, poate

În urma a bţinute se constat modelu bună capacitate i înregizul coeficientului aba i şi, de

Modele econometrice

fi acceptat în vederea realizării unei prognoze a consumului final real al gospod

l modelului (3) este egală cu:

abile e baza ipotezei formulate la punctele precedente, consumul final

real al gospodăriilor populaţiei, y*, urmează o distribuţie no u ă

ăriilor populaţiei. Astfel, dacă valoarea PIB-ului real în anul 2004 a fost egală cu 907,8

mild. lei preţuri comparabile (1990=100), atunci:

8388,907* −=x 6272,16389,03,2004 =⋅ mild. lei preţuri comparabile Valoarea estimată a consumului final real al gospodăriilor populaţiei

în anul 2004, utilizând rezultatele estimării obţinute în cazu

676,1266272,1637156,05845,9ˆˆˆ *200411

*2004 =⋅+=+= xbay mild.lei

preţuri comparP

rmală (sadistribuţia Student, dac n ≤ 30 ), de medie şi de abatere m*

2004y edie

pătratică *2004y

s , ( ) ( )*2004ˆ

*2004

* ,ˆy

syNyL = .

Pentru 676,126ˆ6272,163 *

2004*2004 == yx ⇒

( )( )

( )

6848,30

7452,261863893,826272,163

13114988,70811

*2004

*2004

ˆ

2

2**

2**20042

ˆ

=

⎟⎟⎠

⎞⎜⎜⎝

⎛ −++⋅=⎟

⎟

⎠

⎞

⎜⎜

⎝

⎛

−

−+′

+=∑

y

t

zy

s

xx

xxn

ss

Estimarea consumului final real al gospodăriilor populaţiei, pe baza

unui interval de încredere, se calculează cu relaţia:

( ) ααα *2004

*2004 ˆ20042004ˆ2004 yy

−=+≤≤− 1ˆˆ *** styystyP

Pentru 05,0=α şi 111=−−= knv201,211;05,0;

, din tabela distribuţiei Student se preia valoarea variabilei == tt vα .


Deci, cu de ,05 sau cu o probabilitate egală cu 0,95, valoarea estimată a

un prag semnificaţie de 0consumului final real al gospodăriilor populaţiei

omâniei în anul 2004 va fi cuprinsă în intervalul: R

[ ]( ) 95,005,016848,30201,2676,126*2004 =−=⋅±∈yP

[ ]( ) 95,021,194;14,59*2004 =∈yP

cap3 Modelul unifactorial

Documents

Transcript of cap3 Modelul unifactorial