cap3 Modelul unifactorial
-
Upload
lilian-hancu -
Category
Documents
-
view
1.588 -
download
4
Transcript of cap3 Modelul unifactorial
3 Modelul unifactorial
3.1 Specificarea şi definirea modelului unifactorial
Specificarea unui model econometric se face pe baza teoriei economice a fenomenului observat şi constă în precizarea variabilei endogene şi a variabilei exogene.
Un model unifactorial se prezintă astfel:
uxfy += )( (3.1.1)
unde:
y = - variabila endogenă sau rezultativă; ( nyyy ,,, 21 K )
)
)x = - variabila exogenă sau factorială sau cauzală; ( nxxx ,,, 21 K
u= - variabila reziduală, aleatoare sau eroare. ( nuuu ,,, 21 K
Relaţia (3.1.1) reprezintă o ipoteză construită pe baza teoriei
economice şi presupune că fenomenul economic y este rezultatul acţiunii unui complex de factori: fenomenul economic x este factorul principal, esenţial, ce determină fenomenul y, restul factorilor fiind consideraţi neesenţiali, cu acţiune întâmplătoare, ei fiind specificaţi în modelul econometric cu ajutorul variabilei aleatoare u. Ca orice ipoteză teoretică, ea poate fi adevărată sau falsă – x este sau nu este factorul hotărâtor al fenomenului y – iar validarea sau invalidarea unei astfel de ipoteze se face în urma unui „experiment” statistic.
Modele econometrice
Teoria economică a folosit şi foloseşte în numeroase cazuri modelul unifactorial pentru a fundamenta şi descrie mecanismul de formare şi de manifestare a legilor economice. În acest sens, pot fi menţionate:
- legea cererii C = f(P) + u ; f’(P) < 0 cererea (C) unui anumit produs creşte sau se reduce, dacă preţul (P) acestuia se micşorează sau se măreşte;
- legea ofertei O = g(P) + u ; g’(P) > 0 oferta (O) unui produs creşte sau se diminuează, dacă preţul (P) acestuia se măreşte sau scade;
- funcţia de producţie a cheltuielilor totale ale unei firme: Ch = f(Q) + u; f’(Q) > 0 cheltuielile de producţie cresc sau scad, dacă volumul producţiei creşte sau scade (în situaţia în care productivitatea rămâne constantă);
- legile consumului – formulate de Engel şi descrise de funcţiile lui Tornqvist – consideră venitul (V) consumatorului ca principal factor al consumului (C) unui produs sau grupe de produse C = f(V) + u; f’(V)>0.
De asemenea, foarte multe analize economice utilizează modelul unifactorial pentru a explica şi prospecta dependenţa dintre două fenomene, cum ar fi:
- corelaţia dintre creşterea preţurilor şi creşterea salariilor;
- corelaţia dintre creşterea preţurilor şi rata şomajului – curba lui Philips;
- corelaţia dintre creşterea salariilor şi productivitatea muncii etc.
3.2 Identificarea modelului unifactorial
Identificarea modelului constă în alegerea unei funcţii (sau a unui grup de funcţii) matematice, cu ajutorul căreia se urmăreşte să se descrie (să se aproximeze) valorile variabilei endogene y numai în funcţie de variaţia variabilei exogene x. Funcţiile matematice care se pot utiliza în acest sens – funcţii liniare sau neliniare – sunt numeroase şi de forme diverse, printre acestea figurând şi cele prezentate în continuare.
Modelul unifactorial
1. Funcţia liniară 2. Funcţia semilogaritmică
- a
a,b >0
a<0, b>0
a>0, b<0
x0
a
a
y y
x 0
b>0
b<0
y = a + b x + u y = a + b log x + u
b<0
b>0 nivel de saturaţie
y y
0 < b <1
b > 1
b < 0
b = 1
x
a 0
x 0
3. Funcţia putere şi funcţia logaritmică 4. Funcţia inversă (hiperbola)
y = axb + u uxbay ++=
log y = log a + b log x + u sau log y = a + b log x + u
Modele econometrice
5. Funcţia loginversă
uxbaylog ++=
exp (a)
b<0
x 0
nivel de saturaţie
0
yM
cb2
−
b>0
y y
y
yM
ym
0
7. Parabola debxay ++=
6. Fun
ylog
130262
−cb,
b, c >0
a<0 c>0 b>0
gradul II ucx +2
cţia log-loginversă
uxlogcxba +++=
cb3026,2 x
b, c >0
x
a, c < 0, b > 0
a, c > 0, b < 0
Modelul unifactorial
y
ym
yM
0 xc
b,
e 230262−
a, c < 0,b > 0
a, c > 0,b < 0
8. Parabola logaritmică ( ) uxcxbay +++= 2loglog
I
x
II
III
Nivel de saturaţie
Nivel de saturaţie
0
y a II a I
C
9. Funcţiile lui Tornquist
cx;cb;c,a;ubxcxaxy.III
cx;cb;c,a;ubxcxay.II
b,a;ubx
xay.I
≥−>>++−
=
≥−>>++−
=
>++
=
0
0
0
Modele econometrice
a > 0, b > 0
a > 0, b < 0
y yM
0
⎟⎠⎞
⎜⎝⎛ +−
ab,
e302621
10. Funcţia lui Konius ( ) uxlogbaxy ++=
(2)Nivel de saturaţie b<0
b<0
b>0
(1)(3)y
(
(
(
c
x0
11. Funcţia logistică
Alegerea unei anumite funcţii matematice ca
unui model econometric – Y = f(x) – se face pe bazempirice ale celor două fenomene economice, sistespaţiale (yi, xi,), ni ,1= , n = numărul unităţilor statiss-au înregistrat, într-o anumită perioadă de timp, fenomene y şi x, fie în serii de timp (yt, xt ), nt ,1= , n =
x
1) uecy xba +
+=
+1
2) ue
cy xba ++
=+ log1
3) u
e
cyxba+
+
=+
1
funcţie de regresie a a valorilor reale sau
matizate, fie în serii tice omogene la care valorile celor două numărul perioadelor
Modelul unifactorial
de timp în care s-au înregistrat valorile celor două fenomene y şi x la aceeaşi unitate statistică.
Dispunând de o serie statistică privind variaţia, în timp sau în spaţiu, a celor două variabile economice (vezi tabelul 3.2.1), problema identificării constă în a alege o funcţie matematică, Yt = f(xt), cu ajutorul căreia, cunoscând valorile fenomenului economic xt, să se aproximeze (să se estimeze) cât mai bine (cu erori cât mai mici) valorile empirice ale fenomenului yt = (y1, y2, _ _ _, yn) prin valorile teoretice.
Tabelul 3.2.1 xt yt
1
1
−
−
−−
=tt
tti xx
yycm 1
1
1
1
−
−
−
−
−−
⋅=tt
tt
t
ti xx
yyyxce
x1 y1 -- -- x2 y2
212
12 cmxxyy
=−−
12
12
1
12 xx
yyyxce
−−
⋅=
M M M M xn yn
nnn
nn cmxxyy
=−−
−
−
1
1 1nn
1nn
1n
1nn xx
yyyxce
−
−
−
−
−−
⋅=
Această operaţie se poate face, în general, utilizând următoarele
procedee de lucru: a) procedeul grafic; b) procedeul conservării ariilor; c) procedeul calculelor algebrice.
Modele econometrice
a) Procedeul grafic constă în construirea corelogramei dintre cele două variabile:
ymax
y1
L
y
x 0 L
S
Figura 3.2.1
La construirea corelogramei, scala pe cele două axe, Oy şi Ox, trebuie să se calculeze pe baza următoarei reguli:
Lxx
LA
cm 1 :Ox maxx 1−= ≈
Lyy
LA
cm 1 :Oy maxy 1−=≈
adică variaţia fiecărei variabile, exprimată prin amplitudinea acesteia, Ax şi Ay, este reprezentată printr-un un segment de dreaptă având aceeaşi lungime, L, pe cele două axe. În acest mod, intensitatea legăturii dintre cele două variabile, exprimată prin amplitudinea acestora, nu este viciată de grafic – prin aplatizarea sau alungirea acestuia.
Prin unirea cu segmente de dreaptă a punctelor N(xt, yt) se obţine graficul punctelor empirice – vezi Figura 3.2.1. În funcţie de forma graficului punctelor empirice se alege o funcţie matematică al cărei grafic aproximează cel mai bine graficul punctelor empirice.
Modelul unifactorial
În urma acestei operaţii se va alege: - funcţia liniară: Yt = a + b xt – dacă curba empirică poate fi
aproximată cu o dreaptă; - funcţia putere: Yt = a xt
b – dacă curba empirică poate fi aproximată cu curba acestei funcţii;
sau ln Yt =ln a + b ln xt – dacă curba empirică poate fi aproximată cu o dreaptă pe un grafic dublu logaritmic;
0 ln x
ln y
- funcţia exponenţială: Yt = ea+bxt - dacă curba empirică poate fi aproximată cu graficul acestei funcţii,
sau ln Yt = a + b xt – dacă curba empirică poate fi aproximată cu o dreaptă pe un grafic semilogaritmic;
0 x
ln y
e Yt = a b xt Yt = ln a + b ln xt
Modele econometrice
0 ln x
y
b) Procedeul conservării ariilor continuă procedeul grafic şi constă în a compara suprafaţa curbei empirice „S” – vezi figura 3.2.1 – cu suprafeţele teoretice Sj, ale celor h, hj ,1= , funcţii matematice: j = 1 funcţia liniară, j = 2 funcţia putere etc.
Suprafaţa aferentă curbei empirice „S” se va calcula prin însumarea suprafeţelor trapezelor al căror număr, (n-1), depinde de numărul punctelor empirice N(xt, yt), nt ,1= , iar suprafeţele teoretice ale funcţiilor matematice, acceptate în urma vizualizării curbei empirice, se vor calcula cu ajutorul formulei:
( )∫=max
1
x
xjj dxxfS
În final, alegerea celei mai adecvate funcţii de regresie se poate face cu ajutorul următoarei reguli:
j
j
j SSS −
min
c) Procedeul calculelor algebrice se fundamentează pe proprietăţile pe care le posedă funcţiile matematice y = f(x) privind următorii indicatori:
- xyCm∂∂
= – viteza de variaţie absolută a funcţiei sau coeficientul
marginal;
- xxfy )(
= – viteza medie de variaţie a funcţiei (valoarea medie);
Modelul unifactorial
- xlnyln
xx:
yyCe
∂∂
=∂∂
= – viteza de variaţie relativă a funcţiei sau
coeficientul de elasticitate. În acest sens, vom exemplifica proprietăţile acestor indicatori pentru
câteva categorii de funcţii de regresie. Deoarece x şi y descriu fenomene economice valorile lor trebuie să
fie pozitive. Deci funcţiile de regresie sunt definite pe intervalul [0;+∞] →[0;+∞]. Variabila y reprezintă variabila efect, iar variabila x variabila cauză.
1. y = a + bx
În cazul în care parametrul b este pozitiv se spune că există o dependenţă directă între cauză şi efect, iar când parametrul b este negativ se spune că există o dependenţă inversă între cauză şi efect.
Parametrul a reprezintă valoarea efectului atunci când cauza este egală cu zero.
Parametrii a şi b nu pot fi în acelaşi timp negativi deoarece s-ar obţine pentru y doar valori negative.
În funcţie de valorile parametrilor a şi b există trei cazuri: y y
a, b≥ 0
x
a
x
ba
−
y
x
ba
−
a<0 b>0
a>0 b<0
a
Modele econometrice
x
b<0 Cm
b1. a) byCm x =′= b
b>0 Cm
x
În cazul în care b>0, la o creştere cu o unitate a lui x îi va corespunde
o creştere cu b unităţi a lui y. În cazul în care b>0, la o creştere cu o unitate a lui x îi va corespunde o scădere cu b unităţi a lui y. y
1. b) xab
xyy +==
bylimx
=∞→
;
∞=→
ylimx 0
, pentru a> 0
−∞=→
ylimx 0
, pentru a< 0 b
y
x b
y
a>0, b<0
a>0, b>0
b
x a<0, b>0 x
b
y x
a<0, b<0
În cazul în care cauza este maximă, aceasta tinde spre infinit, efectul mediu fiind egal cu b. Atunci când cauza tinde către zero, iar parametrul a este pozitiv, efectul mediu (efectul pe fiecare unitate de cauză) va tinde să fie maxim, spre infinit, iar dacă parametrul a este negativ, efectul mediu tinde să fie minim, spre minus infinit.
Modelul unifactorial
1
x
Ce
1. c) bxa
bxyxyCe x +=⋅′=
; 0Celim0x
=→
1Celimx
=∞→
Coeficientul de elasticitate exprimă cu câte procente se modifică
efectul atunci când cauza se modifică cu un procent. Se observă că, la o modificare cu un procent a cauzei, pentru valori mici ale acesteia, tinzând către zero, efectul nu se modifică cu nici un procent. În cazul valorilor mari ale cauzei, modificarea cu un procent a acesteia implică o modificare cu un procent a efectului. Indiferent de valorile cauzei, unei modificări de un procent a acesteia îi vor corespunde modificări ale efectului cuprinse între zero şi unu.
2. xbay += ; a, b>0
a
x
y +∞=>→
ylim0x0x
aylimx
=∞→
⇒<−=′ 0xby
2 y este
descrescător
Modele econometrice
2. a) 2x
bCm −=
Cm
x −∞=
>→
Cmlim0x0x
; 0Cmlimx
=∞→
( ) ( ) ( )( )
⇒=⋅⋅−=′322
xx2b2x
x
1-bCm
Cm e crescător pe (0, +∞)
cauzevalorcauzevaria
y
pe unfiecadeci,
Deci, la creşteri ale cauzei, efectul scade. Pentru valori mici ale i modificările efectului sunt foarte mari, tinzând spre infinit, iar pentru i foarte mari ale cauzei, modificările efectului, ca urmare a modificării i, tind spre zero. Cu cât valorile cauzei sunt mai mari, cu atât efectul
ză mai puţin la variaţiile cauzei.
2. b) 2x
bxay +=
+∞=>→
ylimxx
00
0ylimx
=∞→
⎟⎠⎞
⎜⎝⎛ +
−=⋅−−=′x
baxx12x
)(xb
xa)y(
2222x
Deoarece x>0, a, b>0 0)y( x <′⇒
y⇒ descrescător x
În cazul în care cauza tinde spre infinit, efectul mediu, adică efectul itatea de cauză este zero. Atunci când cauza tinde către zero, efectul pe
re unitate de cauză tinde spre infinit. Efectul mediu este descrescător, cu cât cauza este mai mare, efectul pe unitatea de cauză este mai mic.
Modelul unifactorial
2. c) bax
byxyCe x +
−=⋅′=
1Celim
0x0x
−=>→
0Celimx
=∞→
⇒>+
=⋅+−
⋅−=′ 022x b)(ax
abab)(ax
1b)()(Ce
Ce este crescător
-1
Ce
x
Se observă că, la o modificare cu un procent a cauzei, pentru valori
mici ale acesteia, tinzând către zero, efectul se modifică (scade) cu un procent. În cazul valorilor mari ale cauzei, modificarea cu un procent a acesteia nu implică nici o modificare a efectului. Indiferent de valorile cauzei, la modificări (creşteri) cu un procent ale acesteia le corespund modificări (scăderi) ale efectului cuprinse între zero şi unu. Cu cât valorile cauzei sunt mai mari, cu atât modificările relative ale efectului sunt mai mici.
3. y = a + bx + cx2 , a, b şi c nu sunt toţi egali cu zero. Graficul acestei funcţii depinde de parametrii a, b şi c. De exemplu,
pentru a>0, b<0, c>0 se obţine următorul grafic:
2cbx0b2cxy x −=⇒=+=′
⇒>=′′ 02cy x x corespunde lui y minim
⎭⎬⎫
⎩⎨⎧
−⎟⎠⎞
⎜⎝⎛−
4c∆;
2cby min
3. a) b2cxyCm x +=′=
2cb
− a x1
x2
4c
∆−
y
x
Modele econometrice
Dacă c este negativ, atunci Cm este descrescător, deci variaţiile efectului ca răspuns la variaţia cauzei sunt din ce în ce mai mici. Dacă b este pozitiv, înseamnă că, pentru o cauză mai mică decât –b/2c, efectul creşte ca urmare a creşterii cauzei. Pentru o cauză mai mare decât –b/2c efectul scade ca urmare a creşterii cauzei. Dacă b este negativ, efectul va scădea ca urmare a creşterii cauzei.
În cazul în care c este pozitiv, Cm este crescător, deci variaţiile efectului ca urmare a variaţiilor cauzei sunt din ce în ce mai mari. Dacă b este negativ, înseamnă că, pentru o cauză mai mică decât –b/2c efectul scade ca urmare a creşterii cauzei. Pentru o cauză mai mare decât –b/2c, efectul creşte ca urmare a creşterii cauzei. Dacă b este pozitiv, efectul va creşte ca urmare a creşterii cauzei.
b<0
b>0
b
Cm c>0
x
2cb
−
3. b) x
cxbxay2++
=
- pentru a, c>0: +∞=
∞→ylim
x
+∞==+
>→ 0
aylim0x0x
c
a
y
ac2b +
xcax
xacx)y( 1,2
0x
2
2
x =⇒−
=′≥
bac2ca)y( +=⎟⎟⎠
⎞⎜⎜⎝
⎛
Modelul unifactorial
x 0 ca
+ +∞
x)y( ′ ------------- 0 + + + + + + +
y | +∞ ac2b + +∞
3.c) 2
2
cxbxa2cxbx
yxyCe
+++
=⋅′=
0 x
2
Ce
2Celimx
=∞→
0Celim0x
=→
4. y = axb, a>0 deoarece y trebuie să fie pozitiv, iar fucţia putere este
o funcţie pozitivă şi b≠1, deoarece altfel s-ar obţine o funcţie liniară.
4. a) Cm = abxb-1 grafic similar cu cel al funcţiei iniţiale ⇒
4. b) ⇒⋅== −1bxaxyy grafic similar cu cel al funcţiei iniţiale
4. c) bxax.xba
yxyCe
b1b =
⋅⋅⋅=⋅= −
Modele econometrice
b
b b<0
b>0Ce
x
Dacă b este cuprins între zero şi unu, atunci cauza variază în acelaşi
sens cu efectul, dar coeficientul marginal fiind descrescător, înseamnă că variaţiile efectului sunt din ce în ce mai mici. De asemenea, şi efectul pe unitatea de cauză este cu atât mai mic cu cât cauza este mai mare. Totuşi, dacă există o variaţie de un procent a cauzei, efectul va varia cu b procente, indiferent de mărimea cauzei.
Dacă b este mai mic decât unu, atunci cauza variază în sens invers efectului. Coeficientul marginal fiind descrescător, înseamnă că variaţiile efectului sunt din ce în ce mai mici. De asemenea, şi efectul pe unitatea de cauză este cu atât mai mic cu cât cauza este mai mare. Dacă există o variaţie de un procent a cauzei, efectul va varia cu b procente, indiferent de mărimea cauzei.
Dacă b este mai mare decât unu, atunci cauza variază în acelaşi sens cu efectul. Coeficientul marginal fiind crescător, înseamnă că variaţiile efectului sunt din ce în ce mai mari. De asemenea, şi efectul pe unitatea de cauză este cu atât mai mare cu cât cauza este mai mare. Dacă există o variaţie de un procent a cauzei, efectul va varia cu b procente, indiferent de mărimea cauzei.
Prin compararea proprietăţilor indicatorilor teoretici ai funcţiilor de regresie – variaţie continuă – cu indicatorii empirici – variaţie discretă – ai celor două variabile, calculaţi pe baza seriei statistice –
1
1
1
1
1
1 :;−
−
−
−
−
− −−=
−−
=t
tt
t
tti
tt
tti x
xxy
yyce
xxyy
cm – se va putea alege acea
funcţie de regresie ai cărei indicatori au proprietăţi apropiate cu indicatorii empirici.
Modelul unifactorial
De exemplu, dacă coeficienţii marginali ai variabilei y în raport de variabila x, calculaţi pe baza seriei statistice sunt aproximativ egali:
;1
1
23
23
12
12 n1, t ctxxyy
xxyy
xxyy
nn
nn =∀≈−−
≈≈−−
≈−−
−
−K se va alege
funcţia liniară - Yt = a + b xt, sau funcţia putere - Yt = axtb - în cazul în care
coeficienţii empirici de elasticitate vor fi aproximativ egali:
1
1
1
1
23
23
2
2
12
12
1
1
−
−
−
−−−
⋅≈≈−−
⋅≈−−
⋅nn
nn
n
nxxyy
yx
xxyy
yx
xxyy
yx
K
De reţinut că, în economia reală, datele statistice relevă corelaţii
diverse şi contradictorii, care nu pot fi descrise cu o singură funcţie matematică. În astfel de cazuri se recomandă ca identificarea modelului econometric să se facă cu ajutorul mai multor funcţii de regresie, urmând ca, în final – în etapa de verificare a modelului –, să se decidă asupra unei singure forme a modelului.
3.3 Estimarea parametrilor unui model econometric unifactorial
Parametrii unui model econometric sunt reprezentaţi de coeficienţii funcţiei de regresie acceptată în etapa de identificare a acestuia. Aceşti parametrii fiind necunoscuţi, ei vor trebui estimaţi (aproximaţi) pe baza datelor experimentale sistematizate în seriile statistice ale celor două variabile y şi x, prin valorile yt, xt, nt ,1= .
Funcţiile de regresie ale unui model econometric unifactorial pot fi funcţii linare, Y= a + bx, sau funcţii neliniare, ca de exemplu:
- funcţia putere – Yt = a xtb ;
- funcţia exponenţială – Yt = ea+bxt ; - funcţia de gradul doi – Yt = a + bxt + cxt
2 ;
- funcţia logistică –tbxat
ecY++
=1
.
Modele econometrice
Deoarece, în numeroase cazuri, funcţiile neliniare (curbilinii) pot fi liniarizate, estimarea parametrilor unui model econometric se va axa numai pe cazul modelelor liniare. Liniarizarea unui model neliniar se poate face prin mai multe procedee, cum ar fi: logaritmarea modelului econometric, schimbări de variabilă, stabilirea arbitrară a valorii unor parametri etc.
De exemplu:
Liniarizarea prin logaritmare
1) Fie modelul neliniar exprimat prin funcţia putere – yt = a xtb ut.
Prin transformare logaritmică acesta devine: ln yt = ln a +b ln xt + ln ut,
sau yt
* = A + b xt* + ut
* unde:
yt* = ln yt;
A = ln a; xt
* = ln xt;
ut*= ln ut.
2) Cazul modelului neliniar exponenţial – yt = ea+bxt ut Prin logaritmare acesta devine: ln yt = a + b xt + ln ut yt
* = a + b xt + ut*
Liniarizarea prin schimbare de variabile Fie modelul neliniar – yt = b0 + b1x + b2xt
2 + _ _ _ + bkxtk + ut
Notând cu: x1t = xt; x2t = xt2;…, xkt = xt
k, se obţine modelul liniar multifactorial:
yt = b0 + b1 x1t + b2 x2t + … + bk xkt + ut
Liniarizarea prin fixarea arbitrară a valorii unor parametri Acest model poate fi aplicat atunci când, pe baza unei analize
economice a fenomenelor studiate, se poate evalua valoarea unui parametru.
Modelul unifactorial
De exemplu, funcţia logistică se pretează foarte bine la descrierea evoluţiei consumului (y) unui anumit produs în funcţie de venitul consumatorului (x). Dar, consumul unui anumit produs are anumite limite raţionale, respectiv un nivel de saturaţie, nivel estimat prin parametrul „e” al funcţiei logistice. Stabilind valoarea parametrului prin constanta „c” – acest lucru se poate face, fie prin calcule statistice de specialitate, fie prin preluarea valorii acestuia de la o ţară dezvoltată unde consumul acelui produs s-a stabilizat – funcţia logistică se poate transforma într-o funcţie liniară:
⇒+=⎟⎠
⎞⎜⎝
⎛ −⇒=⎟⎠
⎞⎜⎝
⎛ −⇒+
= ++ t
t
bxa
tbxat bxa
yclne
yc
ecy t
t11
1
yt* = a + b xt, unde:
yclny
tt ⎟
⎠
⎞⎜⎝
⎛ −=∗ 1
Revenind la problema estimării parametrilor unui model
econometric, aceştia pot fi calculaţi cu ajutorul mai multor metode cum ar fi:
a) metoda punctelor empirice (M.P.E.); b) metoda punctelor medii (M.P.M.); c) metoda celor mai mici pătrate (M.C.M.M.P.); d) metoda celor mai mici pătrate generalizată; e) metoda verosimilităţii maxime (M.V.M) cu informaţie limitată
sau completă. Metodele a) şi b) se folosesc atunci când nu se urmăreşte o rigoare
statistică a calculelor, datorită simplităţii şi rapidităţii calculelor, sau când aplicarea M.C.M.M.P. este anevoioasă, necesitând calcule complicate.
Metodele d) şi e) au mai mult valoare teoretică deoarece, în economie, ipotezele pe care se fundamentează pot fi acceptate cu multă reţinere, în plus, calculele complicate pe care le solicită, măresc mult costul estimării parametrilor, fără a genera o creştere pe măsură a preciziei estimaţiilor.
Modele econometrice
Estimarea parametrilor unui model liniar unifactorial presupune: - existenţa seriei statistice a celor două variabile economice
Tabelul 3.3.1
xt yt xt2 xt yt tt xbay += ttt yyu −= 2)ˆ( tu
x1
|
||
xn
y1
|
||
yn
x12
|
||
xn2
x1 y1
|
||
xn yn
11 xbay +=
|
||
nn xbay +=
111 yyu −=
|
||
| nnn yyu −=
21)ˆ(u
|
|| 2)ˆ( nu
Σ xt Σ yt Σ xt2 Σ xt yt ∑ ty 0ˆ =∑ tu ∑ 2)ˆ( tu
- modelul econometric liniar: yt = a + bxt + ut (3.3.1)
tt xbay += (3.3.2)
ttt yyu −= (3.3.3)
unde:
yt, xt = valorile empirice ale variabilelor; a, b = parametrii modelului;
b ,a = estimaţiile parametrilor modelului;
ut = variabila eroare;
tu = estimaţia lui ut.
- utilizarea unei metode de estimare pentru a calcula estimatorii parametrilor modelului.
În acest sens ne referim la: a) Metoda punctelor empirice (M.P.E.) - constă în alegerea unui
număr de puncte empirice, M(xt, yt), egal cu numărul parametrilor modelului. Coordonatele acestor puncte se introduc în funcţia de regresie a modelului şi va rezulta un sistem de ecuaţii egal cu numărul acestora. De
Modelul unifactorial
exemplu, în cazul modelului liniar -vezi relaţia (3.3.1) - vor trebui alese două puncte. Fie acestea, M3(x3, y3) şi M8(x8, y8):
8
3
8
3
8
3
88
33
88
33
1111
b ;
11
ˆˆˆ
ˆˆ
xxyy
xxxyxy
axbay
xbay==⇒
⎪⎭
⎪⎬⎫
+=
+=
De regulă, alegerea punctelor empirice se face, fie pe baza
reprezentării grafice a celor două serii statistice, în sensul că acestea ar trebui să fie foarte aproape de dreapta virtual trasată sau să fie intersectate de aceasta, fie prin aprecierea că aceste puncte sunt reprezentative pentru caracterizarea variaţiilor celor două fenomene şi nu sunt rezultatul unor condiţii speciale.
b) Metoda punctelor medii (M.P.M.) – presupune ca cele două serii
statistice să fie împărţite într-un număr de subserii egal cu numărul estimatorilor. Pentru fiecare subserie se vor calcula mediile aritmetice ale celor două variabile. Aceste valori medii se vor introduce în funcţia de regresie şi se va continua procedura ca în cazul M.P.E. Dacă numărul termenilor seriilor statistice nu este divizibil cu numărul parametrilor, se va renunţa la un număr de termeni – cei mai îndepărtaţi în timp sau de media celor două variabile. De exemplu, în cazul modelului liniar, numărul parametrilor este egal cu doi. Dacă seriile de timp ale celor două variabile se referă la nouă perioade, 9,1=t , se va renunţa la valorile primei perioade, respectiv la x1 şi y1. În acest caz, cele două serii vor fi:
( )
( )54321
54321
5
5
4
4
3
3
2
2
4141
yyyyy
xxxxx
yx
yx
yx
yx
+++=
+++=⇒⎟⎟⎠
⎞⎜⎜⎝
⎛ ;
Modele econometrice
( )
( )98762
98762
9
9
8
8
7
7
6
6
4141
yyyyy
xxxxx
yx
yx
yx
yx
+++=
+++=⇒⎟⎟⎠
⎞⎜⎜⎝
⎛
Prin introducerea acestor valori în relaţia (3.3.2) rezultă:
2
1
2
1
2
1
22
11
22
11
1111
ˆ;
11
ˆˆˆ
ˆˆ
xxyy
b
xxxyxy
ayxba
yxba==⇒
⎪⎭
⎪⎬⎫
=+
=+
c) Metoda celor mai mici pătrate (M.C.M.M.P.) – este tehnica de
lucru cea mai des folosită la estimarea parametrilor unui model econometric. Utilizarea acestei metode porneşte de la următoarele relaţii:
yt = a + bxt + ut
tt xbay +=
ttttt xbayyyu −−=−=
unde:
yt, xt = valorile reale ale celor două fenomene economice existente în seriile statistice ale acestora;
ty = valorile teoretice ale variabilei y, obţinute numai în funcţie de valorile factorului esenţial xt şi de valorile estimatorilor
parametrilor a şi b, respectiv ; ba ˆ şi ˆ
tu = estimaţiile valorilor variabile reziduale ut.
Practic, M.C.M.M.P. constă în a minimiza funcţia:
( ) ( ) ( )∑ −−=∑ −===
n
ttt
n
ttt xbayminyyminb,aF
1
2
1
2 (3.3.4)
Modelul unifactorial
adică a minimiza suma pătratelor distanţelor, faţă de axa OY, dintre valorile reale, yt, şi valorile teoretice, . ty
Condiţia de minim a funcţiei (3.3.4) rezultă din:
( )( ) ( 0ˆˆ01ˆˆ20ˆ
)ˆ,ˆ(
1
=−−⇒=−−−⇒=∂
∂ ∑∑=
tt
n
ttt xbayxbay
abaF ) (3.3.5)
( )( ) ( ) 0ˆˆ0ˆˆ20ˆ)ˆ,ˆ( 2
1
=−−⇒=−−−⇒=∂
∂ ∑∑=
ttttt
n
ttt xbxaxyxxbay
bbaF (3.3.6)
sistem de ecuaţii ce devine în final:
⎪⎪⎩
⎪⎪⎨
⎧
∑=∑⋅+∑⋅
∑=∑⋅+
=
==
n
ttttt
n
tt
n
tt
xyxbxa
yxban
1
2
11 (3.3.7)
din care se vor calcula valorile estimatorilor:
- estimaţia parametrului a
xbyany
nx
ban
*yxban tttt −=⇔∑=∑+⇔∑=∑+
1 (3.3.8)
- estimaţia parametrului b
( ) 2222
2 xnx
y*xn
xy
xxn
xyxyn
xxxnxyx
yn
bt
tt
tt
tttt
tt
t
ttt
t
−∑
−∑
=∑−∑
∑ ∑−∑=
∑∑∑
∑∑∑
= (3.3.9)
- dispersia variabilei x
( ) ( )=+∑−∑=∑ +−
=∑ −=σ 2
22222 2
2x
nx
xnx
nxxxx
nxx ttttt
x
Modele econometrice
22
222
2 xnx
xxnx tt −∑=+−∑=
2x
tt y*xn
xy
bσ
−∑
=⇒
- covarianţa dintre variabilele y şi x
( ) ( )( ) ( )−∑=∑ ⋅+−−
=∑ −−=
nyx
nyxyxyxyx
nyyxx
x,ycov tttttttt
yxn
yxyxyxxy
nyx
yxny
xnx
y titttt ⋅−∑
=⋅+⋅−⋅−∑
=⋅+∑
−∑
−
( ) ( )( )( )∑ −
∑ −−=
σ=⇒
22 xx
yyxxx,ycovbt
tt
x
(3.3.10)
- coeficientul de corelaţie liniară a celor două variabile
x
y
y
x
yxxyrbbxyrxyyxrxyr
σσ
σσ
σσ⋅=⇒⋅=⇒== ),(ˆˆ),(),cov(),(),( (3.3.11)
unde: σy, σx = abaterile medii pătratice ale variabilelor y şi x.
Sistemul de ecuaţii, format din relaţiile (3.3.5) şi (3.3.6), rezultat în urma aplicării M.C.M.M.P., poartă numele şi de sistem de ecuaţii normale. Acest sistem de ecuaţii posedă câteva proprietăţi cum ar fi:
Din ecuaţia (3.3.5) se deduce că:
1) ( ) 0)ˆ(0ˆˆˆ =⇒=∑=∑ −− tt
tt
tt uMuxbay – variabila aleatoare ut
este de sumă nulă şi, evident, de medie zero;
Modelul unifactorial
2) ( ) ( ) ∑=∑⇒=∑ −=∑ −−t
tt
tt
ttt
tt yyyyxbay 0 – suma
valorilor empirice (∑ ) este egală cu suma informaţiilor teoretice ( )
– principiul conservării informaţiilor. t
ty ∑t
ty
Din rezolvarea sistemului de ecuaţii rezultă că:
3) xbya ˆˆ −= – dreapta de regresie, tt xbay += , trasată pe baza
M.C.M.M.P., trece prin punctul ),( yxM – vezi figura 3.3.1;
4) ( )( )
( )
( )( )[ ] ( )( )
( )=
∑ −
∑−−
⋅−−=
∑ −
∑ −−=
22ˆ
xx
xxxx
xxyy
xx
xxyyb
t
t
ttt
t
ttt
( )
( )
( )[ ]( )
⇒∑ −
∑ −=
∑ −
∑ ⎥⎦⎤
⎢⎣⎡ −⋅
−−
=
tt
ttt
t
tt
t
t
xx
xxb
xx
xxxxyy
2
2
2
2
panta dreptei de regresie,
, este o medie aritmetică a pantelor dreptelor ce pot fi trasate
prin punctele
tt xbay ˆˆˆ +=
),( yxM şi , respectiv ),( ttt yxMxxyy
bt
tt −
−= , ponderate
cu pătratul abaterilor, 2)( xx t − , variabilei factoriale x – vezi figura 3.3.1.
Modele econometrice
x
xxyyb
−−
=1
11
xxyyb
−−
=2
22 bxay +=ˆ
M
2M
1M
x xn x2 x1
y yn
y
y2
y1
0
Figura 3.3.1
( ) ( ) ( )( ) ( ) ( )22
22
1
2222
211
xxxxxxxxbxxbxxbb
n
nn
−++−+−−++−+−
=K
K
După estimarea parametrilor a şi b prin valorile se vor
putea calcula valorile teoretice ale fenomenului explicat y,
ba ˆ şi ˆ
tt xbay += , şi
apoi estimaţiile variabilei aleatoare u, prin ttt yyu −= (vezi tabelul 3.3.1,
coloanele 5 şi 6). 3.4 Verificarea modelului econometric
Întrucât modelul econometric, în etapele de specificare, identificare
şi estimare, se fundamentează pe acceptarea unor ipoteze de lucru, cât şi pe date experimentale de sondaj, este necesar ca, înainte de utilizarea sa ca instrument pertinent scopului urmărit, acesta să fie verificat (testat, filtrat). În această etapă se pune problema similitudinii dintre modelul economic real, descris de seriile statistice ale fenomenelor analizate, şi modelul teoretic, de natură econometrică, construit şi rezolvat.
Modelul unifactorial
În economie, spre deosebire de domeniul tehnic, de exemplu, nu putem vorbi de o similitudine absolută între modelul teoretic şi modelul real (cum poate să existe între macheta unei clădiri şi clădirea construită), ci de o similitudine statistică între cele două modele, în sensul că modelul econometric posedă şi descrie în mare (în medie) principalele caracteristici ale modelului economic real.
Practic, acceptarea econometrică a modelului teoretic ca model similar, ca aproximaţie statistică echivalentă cu modelul real, presupune:
3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea parametrilor unui model econometric
3.4.2 Verificarea semnificaţiei estimatorilor pararametrilor modelului econometric
3.4.3 Verificarea similitudinii modelului econometric
3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea parametrilor unui model econometric
În general, estimatorul sau estimaţia este o aproximaţie a unei
dimensiuni privind un anumit fenomen. Această dimensiune (volum, suprafaţă, valoare etc.) exactă, stabilă şi repetabilă, adică constantă, reprezintă parametrul (măsura) unei caracteristici, al unei însuşiri a unităţilor statistice.
Statistica calculează parametrii caracteristicilor unităţilor statistice ale unei populaţii în urma unei observări totale asupra colectivităţii statistice. Dacă datele privind valorile caracteristicilor provin dintr-o observare selectivă (sondaj), indicatorii calculaţi din aceste date reprezintă estimaţiile statistice ale parametrilor, adică ale indicatorilor care s-ar fi obţinut din prelucrarea datelor provenite dintr-o observare totală. Dar statistica nu foloseşte orice fel de aproximaţii, de estimaţii ale parametrilor, ci numai estimaţii de maximă verosimilitate1.
1 Vezi teorema 2 şi 3.
Modele econometrice
Din acest motiv, estimarea parametrilor unui model econometric se fundamentează pe câteva ipoteze pe care trebuie să le posede modelul econometric – yt = a + bxt + ut.
Aceste ipoteze se referă la: I1: Cele două variabile yt şi xt sunt observate fără erori de măsură. ut
este o variabilă aleatoare, iar variabila xt este un fenomen cu valori predeterminate => variabila explicată yt este la rândul ei o variabilă aleatoare;
I2: Variabila aleatoare ut este de medie nulă, M(ut) = 0, şi de dispersie constantă, n1, t ,)()()( 22
22
12 =∀==== unuDuDuD σK .
Ipoteza I2 presupune că erorile ut sunt homoscedastice şi nu
heteroscedastice ; 222
21
2un )u(D)u(D)u(D σ≠≠≠≠ K
I3: Valorile variabilei reziduale sunt independente (nu sunt corelate), adică nu există fenomenul de autocorelare a erorilor:
teautocorela sunt erorile ji 0,teindependen sunt erorile ji 0,
)u,ucov( ji⎩⎨⎧
⇒≠≠⇒≠
=
I4: Variabila aleatoare ut urmează distribuţia normală, de medie zero şi de abatere medie pătratică constantă şi egală cu
ctuu == 2σσ , respectiv L(ut) = N(0, σu)
Dacă aceste ipoteze pot fi acceptate, iar estimarea parametrilor
modelului liniar unifactorial – yt = a + bxt + ut – , atunci se pot demonstra următoarele:
Se efectuează o selecţie de volum n, adică se observă valorile caracteristicii x şi, pentru fiecare valoare observată, valorile caracteristicii
. Se obţine astfel selecţia: (xt,yt)t=1,….,n. Pe baza acestei selecţii
se estimează parametrii a şi b din modelul de regresie liniară -yt =a+bxt+ut.. txx yy
t==/
Modelul unifactorial
Parametrii a şi b pot fi estimaţi prin: - metoda celor mai mici pătrate prin care se minimizează suma
pătratelor erorilor, adică funcţia:
( ) ( )∑ −−=∑===
n
ttt
n
tt xbayminuminb,aF
1
2
1
2
- metoda verosimilităţii maxime prin care se maximizează funcţia
de verosimilitate, adică:
( ) ( ) ( ) ( ) n1tyfyfyfbayL n21t ,;...,; =⋅⋅⋅= , unde f este
repartiţia caracteristicii y.
Teorema 1 Dacă variabila reziduală ut este repartizată normal, având media
egală cu zero şi abaterea medie pătratică σu, atunci metoda verosimilităţii maxime este echivalentă cu metoda celor mai mici pătrate.
Demonstraţie În cazul modelului liniar ubxay ++= , u este repartizată N(0, σu),
ceea ce este echivalent cu y repartizată N(a+bx, σ). Funcţia de verosimilitate a caracteristicii y este:
( ) ( ) ( ) ( )nt yf...yfyfb,a;yL ⋅⋅⋅= 21
( )( ) ( )
⇒⋅⋅=−−−−−−
2
2
2112 2
12
1
21
21 nn xbayxbay
t e...eb,a;yL σσ
σπσπ
⇒ ( ) ( )∑⋅⎟
⎠
⎞⎜⎝
⎛= =
−−−n
ttt xbayn
t ebayL 1
22
ˆˆ2
1
21ˆ,ˆ; σ
σπ
Modele econometrice
Metoda verosimilităţii maxime presupune maximizarea funcţiei de verosimilitate:
( )⎥⎥⎦
⎤
⎢⎢⎣
⎡−−−⎟⎟
⎠
⎞⎜⎜⎝
⎛=⇔ ∑
=
n
ttt
n
bat
bat
baxbaybayLbayL
1
2
2,,,ˆˆ
21
21lnmax)ˆ,ˆ,(lnmax)ˆ,ˆ,(max
σσπ
Deoarece σ este constant, =⎟⎟⎠
⎞⎜⎜⎝
⎛n
lnσπ2
1 k = constant.
( ) ( )
( ) ( )baFkxbayk
xbaykxbay
ba
n
tttba
n
ttt
ba
n
ttt
n
ba
ˆ,ˆmin2
1ˆˆmin2
1
ˆˆ2
1maxˆˆ2
121lnmax
,21
2
,2
1
2
2,1
2
2,
⎟⎠
⎞⎜⎝
⎛−+=⎥⎥⎦
⎤
⎢⎢⎣
⎡−−⎟
⎠
⎞⎜⎝
⎛−+=
=⎥⎥⎦
⎤
⎢⎢⎣
⎡−−−+=
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡−−−⎟⎟
⎠
⎞⎜⎜⎝
⎛
∑
∑∑
=
==
σσ
σσσπ
În concluzie, a determina maximul funcţiei de verosimilitate este
echivalent cu a determina minimul sumei pătratelor erorilor.
Observaţie Se ştie că estimatorii de verosimilitate maximă sunt estimatori
nedeplasaţi, consistenţi şi eficienţi, adică: - b)b(M ,a)a(M == (estimatorii sunt nedeplasaţi);
- (estimatorii sunt consistenţi); bb ,aa pp ⎯→⎯⎯→⎯
- orice alt estimator pentru a şi b are dispersia mai mare decât dispersia lui a şi b (estimatorii sunt eficienţi).
În cazul repartiţiei normale a variabilei reziduale, estimatorii obţinuţi prin metoda celor mai mici pătrate sunt nedeplasaţi, consistenţi şi eficienţi. În consecinţă, aceşti estimatori pot fi consideraţi drept cei mai buni în procesul de decizie sau de modelare econometrică.
Modelul unifactorial
Teorema 2 Dacă variabila reziduală este repartizată normal, având media egală
cu zero şi dispersia , atunci b.ctu =2σ ˆ este repartizat ( ) ⎟
⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −=
n
tt
u
xx,bN
1
2
2σ.
Demonstraţie
( )( )( )
( ) ( )( )
( )( )
∑=∑ −
∑ −=
∑ −
∑ −−∑ −=
∑ −
∑ −−=
=
=
=
=
==
=
= n
tttn
tt
n
ttt
n
tt
n
tt
n
ttt
n
tt
n
ttt
yxx
xxy
xx
xxyxxy
xx
xxyyb
1
1
21
1
211
1
21 α
unde:
( )∑ −
−=
=
n
tt
tt
xx
xx
1
2α
( ) ( )uttut ,bxaN~y,N~u σσ +⇒0 , t = 1, … , n
În concluzie, b fiind combinaţie liniară de variabile aleatoare repartizate normal, este şi el repartizat normal.
∑+∑=∑ +=∑=====
n
ttt
n
tt
n
ttt
n
ttt xba)bxa()y(M)b(M
1111αααα
∑=∑===
n
ttu
n
ttt )y(D)b(D
1
22
1
222 ασα
Se calculează:
0)(
)(
1
1
21=
−
−= ∑
∑∑
=
=
=
n
tn
tt
tn
tt
xx
xxα
Modele econometrice
( )( ) ( ) ( )
12
1
2
2
11
2
1
1
211
2
1
21=
∑ −
+∑−∑=∑
∑ −
∑−∑=
∑ −
−=∑
=
==
=
=
==
=
= n
tt
n
tt
n
ttn
t n
tt
n
tt
n
tt
n
tt
ttt
n
tt
xx
xnxxx
xx
xxx
xx
xxxxα
( )( ) ( )∑ −
=∑
⎥⎦⎤
⎢⎣⎡∑ −
−=∑
=
=
=
= n
tt
n
t n
tt
tn
tt
xxxx
xx
1
21 2
1
2
2
1
2 1α
Deci:
b)b(M =
( )∑ −=
=
n
tt
u
xx)b(D
1
2
22 σ
Teorema 3 Dacă variabila reziduală este repartizată normal, având media egală
cu zero şi dispersia , atunci a este repartizat .ctu =2σ ˆ
( ) ⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −+⋅
=
n
tt
uxx
xn
,aN
1
2
22 1σ .
Demonstraţie
∑=∑ ⎟⎠⎞
⎜⎝⎛ −=∑−
∑=−=
===
= n
ttt
n
ttt
n
ttt
n
tt
yyxn
yxn
yxbya
111
1 1 βαα
unde:
tt xn
αβ −=1 , t =1,…., n
( ) ( )uttut ,bxaN~y,N~u σσ +⇒0 , t = 1, … , n
Modelul unifactorial
În concluzie, a fiind combinaţie liniară de variabile aleatoare repartizate normal, este şi el repartizat normal.
∑+∑=∑ +=∑=====
n
ttt
n
tt
n
ttt
n
ttt xba)bxa()y(M)a(M
1111ββββ
∑=∑===
n
ttu
n
ttt )y(D)a(D
1
22
1
222 βσβ
Se calculează:
111111
=∑−=∑ ⎥⎦⎤
⎢⎣⎡ −=∑
===
n
tt
n
tt
n
tt xx
nααβ
011 11
=∑ ∑−=⎥⎦⎤
⎢⎣⎡ −=∑
= ==
n
t
n
tttttt
n
tt xxxxx
nx ααβ
( )∑ −+=∑ ∑+∑−=⎥⎦
⎤⎢⎣⎡ −=∑
=
= === n
tt
n
t
n
tt
n
ttt
n
tt
xx
xn
xnx
nx
n1
2
2
1 1
22
1
2
1
2 1211 αααβ
Deci:
( ) ⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −+=
=
=
n
tt
uxx
xn
)a(D
a)a(M
1
2
222 1σ
Teorema 4 Dacă x0 este fixat, iar variabila reziduală este repartizată normal,
având media egală cu zero şi dispersia , atunci .ctu =2σ 0xbay += este
repartizat ( )( ) ⎟
⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−++
=
n
tt
uxx
xxn
,bxaN
1
2
202
01σ .
Modele econometrice
Demonstraţie
( ) ( )
( ) ∑=∑ ⎥⎦⎤
⎢⎣⎡ −+=
=∑−+∑
=−+=+=
==
=
=
n
ttt
n
ttt
n
ttt
n
tt
yyxxn
yxxn
yxxbyxbay
110
10
100
1 γα
α
unde:
( ) tt xxn
αγ −+= 01 , t = 1, …, n
( ) ( )uttut ,bxaN~y,N~u σσ +⇒0 , t = 1, … , n
Deci, fiind combinaţie liniară de variabile aleatoare repartizate
normal, este şi el repartizat normal. y
∑+∑=∑ +=∑=====
∧ n
ttt
n
tt
n
ttt
n
ttt xba)bxa()y(M)y(M
1111γγγβ
( ) ( ) ( )∑ −−=∑ −===
n
ttt
n
ttt xbayminyyminb,aF
1
2
1
2
Se calculează:
( ) ( ) 1111
01
01
=∑−+=∑ ⎥⎦⎤
⎢⎣⎡ −+=∑
===
n
tt
n
tt
n
tt xxxx
nααγ
( ) ( ) ( ) 001 1
001
1 xxxxxxxxxxxn
xn
t
n
tttttt
n
tt =−+=∑ ∑−+=⎥⎦
⎤⎢⎣⎡ −+=∑
= ==ααγ
( ) ( ) ( ) ( )( )∑ −
−+=∑ ∑−+∑
−+=⎥⎦
⎤⎢⎣⎡ −+=∑
=
= ===n
tt
n
t
n
tt
n
ttt
n
tt
xx
xxn
xxn
xxn
xxn
1
2
20
1 1
220
1
02
01
2 1211 αααγ
Modelul unifactorial
Deci:
( )( ) ⎟
⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−+=
+=
=
n
tt
uxx
xxn
)y(D
bxa)y(M
1
2
2022
0
1σ
Teorema 5 Dacă variabila reziduală este repartizată normal, având media egală
cu zero şi dispersia , atunci eroarea previziunii, ,
t = 1, .., n, este repartizată
.ctu =2σ ttt yyu −=
( )( ) ⎟
⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−−−
=
n
tt
tu
xx
xxn
,N
1
2
22 110 σ .
Demonstraţie
ttttt xbayyyu −−=−=
unde:
a , b sunt repartizaţi normal ˆ
( ) ( )uttut ,bxaN~y,N~u σσ +⇒0 , t = 1, … , n
În concluzie, fiind combinaţie liniară de variabile aleatoare
repartizate normal, este şi ea repartizată normal. tu
0=−−+=+−=−= ttttttt bxabxa)xba(M)y(M)yy(M)u(M
( ) ( ) ( ) ( )( ) ( ) ( ) ( )2222222 ˆˆ2ˆ)ˆ(ˆˆˆ tttttttttt yMyyMyMyyMuMuMuMuD +−=−==−= 22222 )()()()( tuttt bxayMyDyM ++=+= σ
( )2
1
2
22222 1
tn
tt
tuttt bxa
)xx(
)xx(n
)y(M)y(D)y(M ++⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−+=+=
=
σ
Modele econometrice
))ˆˆ(()(
))ˆˆ(())ˆˆ)(((())ˆˆ)((()ˆ(2
ttt
ttttttttt
xbauMbxa
xbauMxbabxaMxbaubxaMyyM
+++=
++++=+++=
⇒⎪⎭
⎪⎬
⎫
∑=
+−=+
=
n
kkk
tttt
yb
))xbxby(u(M))xba(u(M
1α
)uyx(M)uyx(M)yu(M
yxyxyuM))xba(u(M
n
ktkkt
n
ktkkt
n
kkkt
n
kkkttt
∑+∑−=
=⎥⎦
⎤⎢⎣
⎡⎟⎠⎞
⎜⎝⎛ ∑+∑−=+
==
==
11
11
αα
αα
22
1
111utt
n
kkt n
)u(Mn
)uy(Mn
)yu(M σ==∑==
(deoarece erorile sunt necorelate între ele)
)()()(111∑∑∑===
==n
ktkk
n
ktkk
n
ktkk uyMxuyMxuyxM ααα
)()()(111∑∑∑===
==n
ktkkt
n
ktkkt
n
ktkkt uyMxuyMxuyxM ααα
2
1
2
111
11
)(
)(
)()()()())((
))(()(
σ
αααα
αα
∑
∑∑∑
∑∑
=
===
==
−
−=
++=++=
=++=
n
tt
t
ttt
n
ktkk
n
ktkk
n
ktkk
n
ktkkk
n
ktkk
xx
xx
uuMuMbxauuMubxaM
uubxaMuyM
Deci:
∑ −
−+=+
=
n
tt
tutt
)xx(
)xx(n
))xba(u(M
1
2
221 σ
Modelul unifactorial
Din relaţiile anterioare rezultă că:
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−−−=+−
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−+−
−++⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−+⋅+++=
==
=
n
tt
tutn
tt
tu
tn
tt
tutut
)xx(
)xx(n
)bxa()xx(
)xx(n
)bxa()xx(
)xx(n
)bxa()u(D
1
2
222
1
2
22
2
1
2
22222
11212
1
σσ
σσ
Teorema 6 Dacă variabila reziduală este repartizată normal, având media egală
cu zero şi dispersia , atunci .ctu =2σ ∑=
∧
−
n
ttu
n 1
2
21 este un estimator
nedeplasat pentru dispersia variabilei reziduale . 2uσ
Demonstraţie Trebuie demonstrat că:
2
1
2
21
un
ttu
nM σ=⎟
⎠⎞
⎜⎝⎛
∑− =
Folosind teorema anterioară rezultă că:
22
1
2
1
2
2
1
1
2
2
1
2
1
2
1
2
12
1112
1
21
21
21
uun
tt
n
tt
un
t n
tt
t
n
tt
n
tt
n
tt
)xx(
)xx(n
n)xx(
)xx(nn
)u(Dn
)u(Mn
un
M
σσσ =⋅⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
∑ −−−
−=⋅∑
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−−−
−=
=∑−
=∑−
=⎟⎠⎞
⎜⎝⎛
∑−
=
=
=
=
===
Modele econometrice
Teorema 7 Dacă variabila reziduală este repartizată normal, având media egală
cu zero şi dispersia , atunci eroarea previziunii .ctu =2σ τττ +++ −= nnn yyu ,
este repartizată ( )( ) ⎟
⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−++
=
+n
tt
nu
xx
xxn
,N
1
2
22 110 τσ , pentru orice τ.
Demonstraţie Se reia demonstraţia teoremei 5, unde t se înlocuieşte cu τ+n şi,
deoarece τ+n este mai mare ca n, pentru orice k = 1,.., n, ,
rezultă că: şi
0)( =+τnkuuM
0)(1
=∑=
+
n
knkk uyM τα 0)( =+ yuM n τ .
Deci 0=+ ++ ))xba(u(M nn ττ
În final, rezultă că:
( ) ( ) ( )( )
( ) −++⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
∑ −
−+++++= +
=
+++
2
1
2
22222 11 τ
τττ σσ nn
tt
nunun bxa
xx
xxn
bxauD
( ) ( )( ) ⎟⎟
⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
−
−++=+−
∑=
++ n
tt
nun
xx
xxn
bxa
1
2
222 112 τ
τ σ
Demonstraţia pentru normalitate şi valoarea medie este identică cu cea de la teorema 5.
Deoarece, cele patru ipoteze, I1, I2, I3 şi I4, au fost acceptate a priori în etapa de estimare a parametrilor, în această etapă urmează ca ele să fie testate, iar eventualele abateri de la cerinţele lor să fie corectate prin utilizarea unor proceduri econometrice adecvate fiecărei abateri.
Modelul unifactorial
De regulă, în cazul unui număr mare al observaţiilor efectuate nt ,1= , α→n , ipoteza de normalitate a variabilei eroare ut se acceptă fără
rezerve. Verificarea ipotezelor de fundamentare a M.C.M.M.P. I1 Variabilele x şi y nu sunt afectate de erori de măsură. Această ipoteză se poate verifica cu regula celor trei sigma, regulă
care constă în verificarea următoarelor relaţii: ( ) xtxxt 3xx3x3xx σσσ +<<−⇔±∈ ( ) ytyyt 3yy3y3yy σσσ +<<−⇔±∈
unde:
( )n
xx 2t
x∑ −
=σ
( )n
yy 2t
y∑ −
=σ
Dacă valorile acestor variabile aparţin intervalelor ( )xt 3xx σ±∈ şi
( )yt 3yy σ±∈ , ipoteza de mai sus poate fi acceptată fără rezerve. Această ipoteză, referitoare la calitatea datelor înregistrate, se
consideră rezolvată în etapa de prelucrare a datelor observate statistic sau, cel mai târziu, în etapa de identificare a modelului.
I2 Ipoteza de homoscedasticitate a variabilei reziduale – Variabila aleatoare (reziduală) u este de medie nulă , iar
dispersia ei este constantă şi independentă de X.
( ) 0=uM2us
Pe baza acestei ipoteze se poate admite că legătura dintre Y şi X este relativ stabilă. Contrariul acestei ipoteze este heteroscedasticitatea.
În cazul modelului liniar ttt ubxay ++= , reziduurile
ttttt xbayyyu −−=−= sunt homoscedastice dacă dispersiile lor sunt
constante şi egale cu dispersiile teoretice, pentru orice t şi sunt independente de variabila exogenă x.
Modele econometrice
ntuMs utu ,1)(,)ˆ( 222ˆ =∀== σ
Contrariul homoscedasticităţii este heteroscedasticitatea, care
înseamnă că erorile nu au dispersiile egale ci diferite: . 222
22
1 un )u(M...)u(M)u(M σ≠≠≠≠
Dacă dispersiile nu mai sunt egale, estimatorii rămân nedeplasaţi, dar nu mai sunt eficace, M.C.M.M.P. conducând la o subestimare a parametrilor modelului, influenţând sensibil şi calitatea diferitelor teste statistice aplicate acestuia.
Depistarea heteroscedasticităţii se poate realiza prin mai multe procedee:
I2.1) Procedeul grafic - care constă în construirea corelogramei privind valorile variabilei factoriale x şi ale variabilei reziduale u. Dacă, pe măsura creşterii (scăderii) valorilor variabilei factoriale x, se observă o creştere (scădere) a valorilor variabilei reziduale u, înseamnă că cele două variabile sunt corelate şi nu independente.
x
u
x
u
Figura 3.4.1 Corelare pozitivă Figura 3.4.2 Corelare negativă
I2.2) Procedeul dispersiilor variabilei reziduale Acest procedeu se poate aplica atunci când se dispune de serii lungi
de date. În acest caz, seria valorilor variabilei reziduale se împarte în două sau mai multe grupe, pentru fiecare grupă calculându-se dispersiiile corespunzătoare ( ). Dacă se acceptă ipoteza că dispersiile acestor
grupe nu diferă semnificativ, se acceptă ipoteza de homoscedasticitate şi se utilizează testul Fisher-Snedecor.
,...s,s uu22
21
Modelul unifactorial
- dacă , atunci se acceptă ipoteza I2; 2221 uu ss ≈
- dacă , atunci se respinge ipoteza I2. 2221 uu ss ≠
Testul Fisher-Snedecor constă în calcularea raportului dintre cele
două dispersii (dispersia având valoarea cea mai mare fiind plasată la numărător; iar dacă numărul de termeni ai seriei este impar se recomandă eliminarea termenului din mijlocul seriei, astfel încât să se ajungă la subeşantioane egale):
∑
∑
+=
=
⎟⎠⎞
⎜⎝⎛ −−
⎟⎠⎞
⎜⎝⎛ −−
== n
nt
n
t
u
uc knu
knu
s
sF
12
22
2/
1
21
2
2
21/
21/
2
1 (3.4.1)
- dacă
⎟⎠⎞
⎜⎝⎛ −−
⎟⎠⎞
⎜⎝⎛ −−>
21
;2
1;
knknc FFα
, atunci ipoteza de homoscedasticitate este
infirmată, deci erorile sunt heteroscedastice, eliminarea acestui fenomen făcându-se cu ajutorul metodei regresiei ponderate; - dacă
⎟⎠⎞
⎜⎝⎛ −−
⎟⎠⎞
⎜⎝⎛ −−≤
21
;2
1;
knknc FFα
atunci se acceptă ipoteza de
homoscedasticitate.
I2.3) Calculul coeficientului de corelaţie liniară simplă ( ) ( )( ) ( )
xu
tt
xu
tt
xuxu n
xxun
xxuuxurσσσσσσ
∑ −=∑ −−
==,cov
/ (3.4.2)
- dacă valoarea coeficientului de corelaţie liniară este aproximativ egală cu zero – ru/x ≅ 0, atunci se acceptă ipoteza de homoscedasticitate, variabilele u şi x fiind independente;
- dacă valoarea coeficientului de corelaţie liniară este diferită de zero – ru/x ≠ 0, atunci se respinge ipoteza de homoscedasticitate.
Modele econometrice
I2.4) Acceptarea sau respingerea ipotezei de homoscedasticitate se mai poate realiza şi cu ajutorul metodei analizei variaţiei.
Cele două restricţii enunţate mai sus se realizează dacă variabila reziduală u şi variabila explicativă x sunt independente. Pe această premisă se fundamentează utilizarea metodei analizei variaţiei la acceptarea sau respingerea ipotezei de homoscedasticitate.
Metoda analizei variaţiei porneşte de la relaţia:
yyyyyy tttt −+−=−
( ) ( )22 yyyyyy tttt −+−=−
[ ]∑ −+−=∑ −==
n
tttt
n
tt )yy()yy()yy(
1
2
1
2 (3.4.3)
( ) ( ) ( )[ ] ( ) ( ) ( )( ) (3.4.4) ∑ −−+∑ −+∑ −=∑ −+−=∑ −=====
n
tttt
n
ttt
n
tt
n
tttt
n
tt yyyyyyyy)yyyyyy
11
2
1
2
1
2
1
2 2
Dar ttt ubxay ++= ;
xbayxbay tt +=⇒+=
ttt yyu −=
),cov(ˆ2)(ˆ2
ˆ)ˆˆˆˆ(2)ˆ)(ˆ(21
tttt
tt
n
tttt
xubnnnuxxb
uxbaxbaYyyY
=−=
=−−+=−−⇒
∑
∑∑=
Dacă împărţim relaţia (3.4.4) la n ),cov(ˆ22
ˆ22
0 xubux ++=⇒ σσσ
Pentru ca egalitatea să se verifice este necesar ca: Acceptarea ipotezei I2 pe baza analizei variaţiei constă
în efectuarea următoarelor calcule:
)0(0),cov( ≠= bxu
Modelul unifactorial
-
-⎪⎪⎭
⎪⎪⎬
⎫
=∑ −
=∑ −
=∑ −
CYy
ByY
Ayy
2tt
2t
2t
)ˆ(
)ˆ(
)(
Dacă se constacesta trebuie eliminaparametrilor modeluluiestimatorilor, aceştia ne
I2.5) Estimarea
estimatorilor paramecazul unui model conţin
Heteroscedasticcorespunzătoare eroriloparametrilor modeluluiaplicarea M.C.M.M.Pmodelului, influenţând modelului.
În cazul unuparametrilor modelulu
( ) ( )YXXXB ′⋅′= −1ˆ . M
acestuia este de form
matricei varianţelor şiaplicarea M.C.M.M.Pconvergenţi şi nedeplasfost verificate în preaformă este, în general, regresiei ponderate în vse obţină estimatori con 1 Conform Wiliam H. Green
p. 384-392
dacă A=B+C, atunci variabilele ut şi xt sunt independente şi se acceptă I2;
dacă A≠B+C atunci ut şi xt sunt corelate şi se respinge I2
ată existenţa fenomenului de heteroscedasticitate, t deoarece prezenţa lui determină subestimarea
şi obţinerea de valori viciate, fiind afectată calitatea maifiind eficienţi (dispersie minimă).
unei matrici a covarianţelor corespunzătoare trilor modelului1 adecvată aplicării M.C.M.M.P. în ând erori heteroscedastice.
itatea erorilor implică faptul că dispersiile r nu mai sunt egale, ci diferite, caz în care estimatorii rămân nedeplasaţi, dar nu mai sunt eficace. Astfel, . va conduce la o subestimare a parametrilor sensibil şi calitatea diferitelor teste statistice aplicate
i model multifactorial, vectorul estimatorilor i se calculează, matriceal, cu ajutorul relaţiei: atricea varianţelor şi covarianţelor corespunzătoare
a: ( ) ( ) 12 −′⋅= XXBV uσ 2. Acest mod de calcul al
covarianţelor este valabil doar în cazul în care . conduce la obţinerea de estimatori eficienţi, aţi, deci ipotezele corespunzătoare acestei metode au labil. În cazul unor erori heteroscedastice, a căror necunoscută, este posibil, ca prin aplicarea metodei ederea eliminării heteroscedasticităţii erorilor, să nu sistenţi. White a arătat că este posibil să se calculeze
e, Econometric Analysis, 2d ed., Macmillan, New York, 1993,
Modele econometrice
un estimator adecvat al matricei covarianţelor corespunzătoare estimatorilor parametrilor modelului, chiar dacă există o relaţie de dependenţă între erorile heteroscedatice şi variabilele exogene incluse în model, pe care a denumit-o matricea covarianţelor estimatorilor consistenţi heteroscedastici (HCCME), de forma:
( ) ( ) ( ) 1
1
21 −
=
− ′⎟⎠
⎞⎜⎝
⎛ ′′−
= ∑ XXxxuXXkn
nBVn
ttttW (3.4.5)
unde:
n = numărul de observaţii; k = numărul regresorilor; ut = variabila reziduală.
Prin aplicarea acestei matrici, estimaţiile punctuale ale parametrilor nu vor suferi modificări, ci doar abaterile standard corespunzătoare parametrilor. Utilizarea acestei matrici va permite observarea mai rapidă a prezenţei fenomenului de heteroscedasticitate a erorilor. Astfel, abaterile standard vor putea fi mai mari sau mai mici comparativ cu cele obţinute în cazul modelului iniţial, iar valorile mai mici înregistrate de testul Student, t, vor semnaliza faptul că estimatorii parametrilor sunt nesemnificativi, deci posibila prezenţă a erorilor heteroscedastice.
I2.6) Testul Goldfeld-Quandt3 Acest test se poate aplica atunci când se dispune de serii lungi de
date şi când una dintre variabile reprezintă cauza heteroscedasticităţii (între dispersia variabilei reziduale heteroscedastică şi variabila exogenă există o relaţie de dependenţă pozitivă), şi presupune parcurgerea următoarelor etape:
• ordonarea crescătoare a observaţiilor în funcţie de variabila exogenă x;
2 vezi demonstraţie op. cit., p.182 3 Conform D. N. Gujarati, Basic Econometrics, 3rd ed., New York, Mc Graw-Hill, 1995,
p 374-375.
Modelul unifactorial
• eliminarea a c observaţii centrale, c fiind specificat a priori. În privinţa numărului de observaţii omise, c, au fost emise diverse opinii. În cazul unui model unifactorial, Goldfeld şi Quandt, în urma efectuării experimentelor Monte-Carlo, au propus ca c să fie aproximativ egal cu 8 în cazul în care mărimea eşantionului este de aproximativ 30 de observaţii şi 16, dacă eşantionul cuprinde 60 de observaţii. Judge şi colaboratorii săi menţionează faptul că, în cazul în care c=4 pentru n=30 şi c=10 pentru n≈60, se obţin rezultate mai bune. În general, se consideră că c trebuie să reprezinte o treime sau un sfert din numărul total de observaţii.
• efectuarea de regresii aplicând M.C.M.M.P. asupra celor două sub-eşantioane de dimensiune (n-c)/2 şi calcularea sumei pătratelor erorilor pentru fiecare subeşantion în parte;
• calcularea raportului dintre sumele pătratelor erorilor sau dispersiilor acestora, corespunzătoare celor două subeşantioane (suma pătratelor erorilor având valoarea cea mai mare fiind plasată la numărător):
( ) ( )( )
( ) ( )( )∑
∑
+−
=
−
=
⎟⎠⎞
⎜⎝⎛ +−
−
⎟⎠⎞
⎜⎝⎛ +−
−
== n
cnt
cn
t
u
u
kcnu
kcnu
s
sF
12
22
2/
1
21
2
2*
12
/
12
/
2
1 (3.4.6)
unde: k = numărul variabilelor exogene.
Presupunând că erorile sunt normal distribuite, atunci raportul F*
urmează o distribuţie F cu ( ) ( 1221 +− )−
== kcnvv grade de libertate.
- dacă ( ) ( ) ( ) ( )⎟⎠⎞
⎜⎝⎛ +−
−⎟⎠⎞
⎜⎝⎛ +−
−>1
2;1
2;
*
kcnkcnFFα
, atunci ipoteza de
homoscedasticitate este infirmată, deci erorile sunt heteroscedastice;
Modele econometrice
- dacă ( ) ( ) ( ) ( )⎟⎠⎞
⎜⎝⎛ +−
−⎟⎠⎞
⎜⎝⎛ +−
−≤1
2;1
2;
*
kcnkcnFFα
ipoteza de homoscedasticitate
este acceptată.
I2.7) Testul Park4 Testul propus de Park se bazează pe existenţa unei relaţii de
dependenţă între dispersia corespunzătoare erorilor heteroscedastice şi variabila exogenă x de forma:
tt
exbtu
ωσσ 22 = (3.4.7)
Acest model neliniar poate fi transformat într-un model liniar prin logaritmare:
ttu xbt
ωσσ ++= lnlnln 22 (3.4.8)
unde: ωt = variabila reziduală, ce verifică ipotezele corespunzătoare
M.C.M.M.P.
Ca urmare a faptului că valoarea dispersiei erorilor heteroscedastice este necunoscută, aceasta a fost înlocuită cu pătratul erorilor, , în cadrul
modelului liniarizat prin logaritmare:
2ˆ iu
ttttt xbxbu ωβωσ ++=++= lnlnlnˆln 22 (3.4.9)
În situaţia în care parametrul b corespunzător variabilei exogene este nesemnificativ ipoteza de homoscedasticitate a erorilor este verificată, cazul contrar indicând existenţa heteroscedasticităţii.
I2.8) Testul Glejser5 Acest test se bazează pe bazează pe relaţia dintre erorile estimate în
urma aplicării M.C.M.M.P. asupra modelului iniţial şi variabila explicativă, presupusă a fi cauza heteroscedasticităţii. 4 cf. op. cit., p. 369-370 5 cf. op. cit., p. 371-372
Modelul unifactorial
Testul Glejser prezintă o serie de puncte comune cu testul precedent, respectiv, după calcularea erorilor în urma aplicării M.C.M.M.P., valoarea absolută a acestora este regresată în funcţie de valorile variabilei exogene utilizându-se în acest scop următoarele forme de exprimare corespunzătoare celor două variabile:
I. ttt bxau ω++=ˆ
În această situaţie heteroscedasticitatea este de tipul: , caz
în care va fi aplicată regresia ponderată asupra datelor iniţiale, care vor fi
împărţite la , rezultând astfel un model de forma:
222tu x
tλσ =
ixt
t
tt
t
xu
bxa
xy
++= 11
II. ttt xbau ω++=ˆ
În această situaţie heteroscedasticitatea este de tipul: , caz
în care va fi aplicată regresia ponderată asupra datelor iniţiale, care vor fi împărţite la
tu xi
22 λσ =
tx , rezultând astfel un model de forma:
.11
t
tt
tt
t
xu
xbx
ax
y++=
III. tt
t xbau ω++=
1ˆ
În această situaţie heteroscedasticitatea este de tipul: . 222 −= tu xi
λσ
IV. tt
tx
bau ω++=1ˆ
V. ttt bxau ω++=ˆ
VI. ttt bxau ω++= 2ˆ
Modele econometrice
Verificarea homoscedasticităţii erorilor presupune, ca şi în cazul testului precedent, verificarea semnificaţiei parametrului corespunzător variabilei exogene. Aplicarea acestui test conduce la rezultate semnificative în cazul unor eşantioane de dimensiuni mari, iar, în cazul celor de dimensiuni mici, este pur teoretică, aşa cum menţionează însuşi autorul.
De menţionat faptul că ultimele două modele nu pot fi estimate cu ajutorul M.C.M.M.P.
I2.9) Testul Breusch-Pagan-Godfrey (BPG)6 Acest test are în vedere modelul multifactorial liniar de forma: yi = b0 + b1 x1t + b2 x2t + …+ bk x kt + ut (3.4.10)
plecând de la ipoteza potrivit căreia dispersia corespunzătoare erorilor heteroscedastice este dependentă de o serie de variabile factoriale zi. În locul acestor variabile pot fi utilizate câteva sau toate variabilele exogene ce intervin în modelul iniţial. Se presupune, de asemenea, că între dispersia corespunzătoare erorilor heteroscedastice şi variabilele factoriale zi există o relaţie de dependenţă liniară, respectiv:
mtmttu zzzt
ββββσ ++++= K221102 (3.4.11)
Verificarea homoscedasticităţii dispersiei presupune verificarea
ipotezei nulităţii parametrilor corespunzători variabilelor factoriale, caz în care .0
2 cttu == βσ
Aplicarea acestui test constă în: - calculul valorilor variabilei reziduale prin aplicarea M.C.M.M.P.
asupra modelului iniţial; - calculul estimatorului de maximă verosimilitate corespunzător
dispersiei variabilei reziduale homoscedastice: nut
ut
∑=2
2 ˆσ ;
6 cf. op. cit., p. 377-378
Modelul unifactorial
- construirea unei variabile de forma: 2
2
ˆˆ
tu
tt
uσ
θ = şi regresarea
acesteia în funcţie de variabilele factoriale zt, ce pot fi înlocuite cu variabilele exogene xi din modelul original, respectiv:
tmtmttt xxx ωββββθ +++++= K22110 (3.4.12) unde:
ωt = variabila reziduală. - calculul sumei pătratelor explicată de model, notată cu SSR, şi
calculul unei variabile H de forma: 2
SSRH = .
Presupunând că erorile sunt normal distribuite, şi că ne aflăm în
situaţia unui eşantion de volum mare, variabila H este asimptotic distribuită sub forma unui χ , pentru care numărul gradelor de libertate este egal cu:
, unde m = numărul parametrilor modelului, respectiv: H~ χ .
2;vα
1−= mv 2;vα
Dacă >H χ , erorile sunt heteroscedastice, în caz contrar, sunt
homoscedastice.
2;vα
I2.10) Testul White7 Aplicarea testului White în cazul modelului unifactorial presupune
parcurgerea următoarelor etape: - estimarea parametrilor modelului iniţial şi calculul valorilor
estimate ale variabilei reziduale, u; - construirea unei regresii auxiliare, bazată pe prespunerea
existenţei unei relaţii de dependenţă între pătratul valorilor erorii, variabila exogenă inclusă în modelul iniţial şi pătratul valorilor acesteia:
tttt xxu ωααα +++= 2210
2ˆ (3.4.13)
7 cf. op. cit., p. 379
Modele econometrice
şi calcularea coeficientului de determinare, R2, corespunzător acestei regresii auxiliare;
- verificarea semnificaţiei parametrilor modelului nou construit, iar dacă unul dintre aceştia este semnificativ diferit de zero, atunci ipoteza de heteroscedasticitate a erorilor este acceptată.
Există două variante de aplicare a testului White: - utilizarea testului Fisher-Snedecor clasic, bazat pe ipoteza
nulităţii parametrilor, respectiv: H0: 0210 === ααα ;
Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt nesemnificative ( ), este acceptată, atunci ipoteza de
homoscedasticitate se verifică, cazul contrar semnificând prezenţa heteroscedasticităţii erorilor.
21;; vvc FF α≤
- utilizarea testului LM, calculat ca produs între numărul de
observaţii corespunzătoare modelului, n, şi coeficientul de determinare, R2, corespunzător acestei regresii auxiliare. În general, testul LM este asimptotic distribuit sub forma unui χ , pentru care numărul gradelor de
libertate este egal cu: , unde k = numărul variabilelor exogene, respectiv:
2;vα
kv =
2RnLM ⋅= ~ χ (3.4.14) 2
;vα
Dacă >LM χ , erorile sunt heteroscedastice, în caz contrar, sunt
homoscedastice, respectiv ipoteza nulităţii parametrilor,
2;vα
0210 === ααα ,
este acceptată.
Eliminarea fenomenului de heteroscedasticitate se poate realiza prin următoarele procedee:
a) Construirea modelului pe baza abaterilor centrate ale variabilelor Fie ttt ubxay ++= (3.4.15)
Modelul unifactorial
tt xbay += (3.4.16)
uxbay ++= (3.4.17) ________________
(3.4.15) – (3.4.17) ⇒ ttt uxxbyy +−=− )( (3.4.18)
Notând cu: ⎪⎩
⎪⎨⎧
=
+=⇒
⎪⎭
⎪⎬⎫
−=
−=**
**
*
*
ˆˆ tt
ttt
tt
tt
xby
uxby
xxx
yyy
Estimarea parametrului b presupune minimizarea funcţiei:
( ) ( ) ( )∑∑==
−=−=n
ttt
n
ttt xbyyybF
1
2**
1
2** ˆminˆminˆ
şi calculul derivatei parţiale a funcţiei:
( ) ( ) ( ) ( ) 0,cov00ˆ20)ˆ(' *** =⇒=−⇔=−⋅−⇒= ∑ ∑ ttttttt xuxxuxxbybF
b) Metoda regresiei ponderate Fie modelul iniţial ttt ubxay ++=
Heteroscedasticitatea presupune , ceea ce înseamnă: 22)( utuM σ≠2
121 uu σλσ =
22
22 uu σλσ =
……………. (3.4.19) 22unun
σλσ =
unde: λt este un coeficient de ponderare.
Estimarea parametrilor modelului presupune minimizarea funcţiei:
∑=
−−=n
ttt
u
xbaybaF1
22 )ˆˆ(1min)ˆ,ˆ(min
σ
Modele econometrice
Conform relaţiei (3.4.19): ∑=
−−=n
ttt
t
xbaybaF1
2)ˆˆ(1min)ˆ,ˆ(minλ
(3.4.20)
În relaţia (3.4.20) cantităţile şi 2uσ tλ sunt, în general, necunoscute.
S-a constatat însă că, în practică, abaterile standard, tuσ , sunt aproximativ
proporţionale cu valorile variabilei exogene x, adică:
11xuu σσ =
22xuu σσ =
…………… (3.4.21)
nuu xn
σσ =
Corelând relaţiile (3.4.19) şi (3.4.21), rezultă că relaţia (3.4.20)
devine:
∑∑
∑
==⎟⎟⎠
⎞⎜⎜⎝
⎛−−=⎟
⎟⎠
⎞⎜⎜⎝
⎛ −−=
−−=
n
t tt
t
u
n
t t
tt
u
n
ttt
tu
bx
axy
x
xbay
xbayx
baF
1
2
21
2
2
222
ˆ1ˆmin1ˆˆmin1
)ˆˆ(1min1)ˆ,ˆ(min
σσ
σ (3.4.22)
Dar relaţia (3.4.22) este echivalentă cu aplicarea M.C.M.M.P.
modelului iniţial, după ce, în prealabil, a fost împărţit la xt:
t
t
tt
ttttt x
ub
xa
xy
xubxay ++=⇒++=1|:
∑ ⎟⎠
⎞⎜⎝
⎛ −−=∑ ⎟⎠
⎞⎜⎝
⎛===
n
t tt
tn
t t
t bx
axy
minxu
min)b,a(Fmin1
2
1
2 1 (3.4.23)
Modelul unifactorial
Calculând derivatele parţiale în raport cu şi ale funcţiilor (3.4.22) şi (3.4.23) şi anulându-le se ajunge la acelaşi sistem de ecuaţii pe baza căruia se determină cei doi estimatori:
a b
⇒=
⇒=
0)ˆ('
0)ˆ('
bF
aF
⎪⎪⎩
⎪⎪⎨
⎧
=+
=+
∑∑
∑∑∑
t
t
t
t
t
tt
xy
bnx
a
xy
xb
xa
ˆ1ˆ
1ˆ1ˆ22
(3.4.24)
⎪⎪⎪⎪⎪⎪
⎩
⎪⎪⎪⎪⎪⎪
⎨
⎧
−=
⎟⎟⎠
⎞⎜⎜⎝
⎛−
−
=
⇒
∑
∑
∑
∑
∑∑
∑∑∑∑
22
2
2
2
22
1
1
ˆ1
ˆ
11
11
ˆ
t
t
t
t
t
tt
t
t
tt
t
t
x
xb
x
xy
a
xxn
xy
xxy
xb
(3.4.25)
Un caz concret de utilizare a acestei metode o constituie situaţia în
care se urmăreşte modelarea investiţiilor unor intreprinderi de dimensiuni diferite în funcţie de capital, cifra de afaceri şi venit: I = f (K, CA, V) + u.
O altă metodă constă în segmentarea eşantionului în subcolectivităţi omogene din punct de vedere al nivelelor factorilor, urmată de o respecificare a modelului pentru fiecare segment în parte.
În mod curent, acest procedeu se utilizează la estimarea parametrilor unui model econometric privind cererea sau consumul populaţiei faţă de un produs de folosinţă curentă, deoarece s-a constatat că dispersia corespunzătoare consumului creşte pe măsura creşterii nivelului venitului.
I3 Valorile variabilei reziduale u sunt necorelate, respectiv nu există fenomenul de autocorelare a erorilor.
ktnktuuMuu ktkt <=∀== ,,1,)(0),(),cov(
Modele econometrice
Deoarece aplicaţiile practice au arătat că acest fenomen e frecvent în special în cazul seriilor cronologice interdependente, verificarea acestuia este necesară, mai ales în cazul calculelor de prognoză.
M.C.M.M.P., în cazul existenţei fenomenului de autocorelaţie, , nu mai permite obţinerea de estimatori eficienţi, aceştia
prezentând totodată distorsiuni de la valorile reale. Se păstrează însă calitatea acestora de a fi consistenţi, fapt ce impune introducerea în calcul a unor serii de date suficient de lungi (eşantion de valori cât mai mare).
0),( ≠kt uuM
Autocorelarea erorilor se datorează analizei în timp a legăturii dintre variabile, respectiv a unui efect inerţial în evoluţia variabilelor sau o altă cauză ar constitui – o eroare de specificare a modelului, respectiv omiterea unei variabile explicative, xt, cu influenţă puternică asupra variabilei endogene y.
Depistarea autocorelării erorilor se poate face utilizând următoarele procedee:
1) Procedeul grafic – se realizează corelograma între valorile estimate ale variabilei endogene şi valorile variabilei reziduale . ty tu
tu
ty
Figura 3.4.3
Grafic, autocorelaţia erorilor se manifestă fie printr-un număr foarte mic sau foarte mare de schimbări ale semnului variabilei aleatoare, fie ca urmare a unor schimbări simetrice (o oscilaţie regulată a valorilor variabilei reziduale faţă de valorile lui ). y
Modelul unifactorial
2) Calculul coeficientului de autocorelaţie de ordinul 1
∑
∑=
∑
∑=
=−
=−
−
=
=−
n
tt
n
ttt
n
tt
n
ttt
u
uu
u
uur
2
21
21
1
1
2
21
1 (3.4.26)
Acesta este definit în intervalul [ ]11;− , având următoarea
semnificaţie:
⎪⎩
⎪⎨
⎧
+
−=
văpozitistrictţieautocorela,ţăindependen,
vănegatistrictţieautocorela,r )(
101
1
3) Testul Durbin-Watson constă în calcularea valorii:
( )
∑
∑ −=
=
=−
n
tt
n
ttt
u
uud
1
2
2
21
(3.4.27)
Această valoare empirică, „d”, se compară cu două valori teoretice,
d1 şi d2, preluate din tabelul distribuţiei Durbin-Watson (vezi Anexa 3) în funcţie de un prag de semnificaţie α, arbitrar ales, (α = 0,05 sau α = 0,01), de numărul de variabile exogene (k) şi de valorile observate ( )n n, ≥ 15 .
Regula de decizie a aplicării testului se prezintă în tabelul următor:
0 < d < d1 d1 ≤ d ≤ d2 d2 < d< 4-d2 4-d2 ≤ d ≤ 4-d1 4-d1 < d <4
Autocorelare pozitivă
Indecizie ←
Erorile sunt independente
Indecizie →
Autocorelare negativă
Cei doi autori, acceptând ipoteza de normalitate a variabilei
reziduale, au demonstrat că distribuţia variabilei aleatoare d este cuprinsă
Modele econometrice
între două distribuţii limită, d1 şi d2, ale căror mărimi depind de pragul de semnificaţie (α), de numărul de variabile exogene (k) şi de numărul de valori observate (n, n ≥ 15).
Dezvoltând relaţia lui d, aceasta devine:
∑
∑∑∑
=
=−
=−
=
−+= n
tt
n
ttt
n
tt
n
tt
u
uuuud
1
2
21
2
21
2
2
ˆ
ˆˆ2ˆˆ
Pentru un n suficient de mare, cele trei sume, , , ,
fiind aproximativ egale, relaţia lui d va fi egală cu:
∑=
n
ttu
2
2ˆ ∑=
−
n
ttu
2
21ˆ ∑
=
n
ttu
1
2ˆ
∑
∑−
=
=−
−= 1
1
2
21
ˆ
ˆˆ22 n
tt
n
ttt
u
uud
Se notează cu: ∑
∑−
=
=−
= 1
1
2
21
1
ˆ
ˆˆ
n
tt
n
ttt
u
uur coeficientul de autocorelaţie de ordinul
1 a reziduurilor ut.
( )( ) ( ) 2112 11
drrd −=⇒−=⇒ (3.4.28)
]4,0[∈⇒ d
Modelul unifactorial
cu semnificaţia:
⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
↓
↑=⇒
⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
⇒⇒⇒⇒⇒
↓
↑−
=
0
2
4
1
0
1
1 d
văpoziti
vănegati
strict
strict
reautocorelaindecizie
ţăindependenindecizie
reautocorela
r
4) Un alt procedeu de verificare a ipotezei de independenţă a erorilor constă în aplicarea testului Breusch-Godfrey8, acest test fiind utilizat în vederea depistării unei autocorelaţii de ordin superior. Ca urmare a presupunerii existenţei unei autocorelaţii de ordin superior se construieşte următorul model:
tptpttt zurururu ++++= −−− K2211 (3.4.29)
unde: zt = variabilă reziduală de medie zero şi dispersie constantă.
Ipoteza nulă care stă la baza testului este aceea potrivit căreia toţi coeficienţii corespunzători valorilor decalate ale variabilei reziduale sunt simultan egali cu zero, fapt ce implică non-existenţa fenomenului de autocorelaţie a erorilor.
În vederea utilizării testului sunt estimate valorile variabilei reziduale ut, obţinute în urma aplicării M.C.M.M.P. asupra modelului iniţial. Variabila reziduală ut este regresată apoi în funcţie de variabilele exogene iniţiale ale modelului şi de valorile sale decalate, respectiv ut-1, ut-2, …, ut-p. În cazul acestei regresii este calculată valoarea coeficientului de determinare R2 şi a unei variabile de forma:
BG = (n-p)·R2 (3.4.30)
8 cf. op. cit., p. 425
Modele econometrice
Presupunând că ne aflăm în situaţia unui eşantion de volum mare, variabila BG este asimptotic distribuită sub forma unui χ , pentru care
numărul gradelor de libertate este egal cu:
2;vα
pv = , unde p = mărimea
decalajului , respectiv: BG~ χ . 2;vα
Dacă χ , ipoteza nulă este respinsă, ceea ce presupune că
există cel puţin un coeficient de autocorelaţie nenul.
>BG 2;vα
În general, autocorelaţia erorilor este provocată de două cauze: • fie că variabila endogenă y se autocorelează în evoluţia sa (ca
urmare a unui efect inerţial) generând o autocorelare în timp a erorilor; • fie datorită omiterii unei variabile exogene x, cu influenţă
semnificativă asupra lui y, adică a unei erori de specificare a modelului econometric.
Eliminarea fenomenului de autocorelare a variabilei reziduale ut – în cazul depistării sale – se fundamentează pe evitarea cauzelor care îl generează.
O modalitate directă de a evita consecinţele statistice pe care le generează acest fenomen o constituie utilizarea următoarelor procedee:
a) Aplicarea M.C.M.M.P. generalizate în vederea estimării parametrilor modelului care, în cazul autocorelării reziduurilor, permite obţinerea de estimatori nedeplasaţi, consistenţi şi eficienţi. Această metodă este recomandată în situaţia în care numărul variabilelor cauzale este superior lui unu (modele multifactoriale). Estimatorii modelului se obţin
astfel: unde V = matricea varianţelor şi covarianţelor reziduurilor.
)YV'X()XV'X(B 111 −−−=
b) Un alt procedeu este următorul: Fie modelul liniar unifactorial: ttt ubxay ++= . Se estimează
parametrii acestuia, a şi b, cu ajutorul M.C.M.M.P. Se calculează valorile ajustate ale variabilei endogene - tt xbay += şi reziduurile -
ttttt xbayyyu −−=−= (3.4.31) şi se aplică testul “d”. Dacă ipoteza de
Modelul unifactorial
independenţă a variabilelor reziduale, I3, nu poate fi acceptată ( , 01 ≠r
211
dr −= ), aceasta presupune o autocorelare de ordinul întâi a erorilor,
respectiv:
ttt zuru += −1)1( ˆˆ (3.4.32)
unde: zt este variabila aleatoare ce verifică ipotezele I2, I3 şi I4.
Ştiind că:
11111 −−−−− −−=−= ttttt xbayyyu (3.4.33)
Înlocuind relaţiile (3.4.31)şi (3.4.33) în relaţia (3.4.32) se obţine:
ttttt zxbayrxbay +−−=−− −− )ˆˆ(ˆˆ 11)1(
ttttt zxrxbrayry +−+−=− −− )(ˆ)1(ˆ 1)1()1(1)1( (3.4.34)
În ecuaţia (3.4.34) variabilele yt şi xt sunt cunoscute, iar valoarea coeficientului de autocorelaţie se va calcula cu relaţia:
∑
∑−
=
=−
= 1
1
2
21
)1( n
tt
n
ttt
u
uur
Se introduce valorile acestuia în relaţia (3.4.34) şi se vor estima parametrii şi prin aplicarea din nou a M.C.M.M.P. Fie şi a b α
β estimaţiile parametrilor a şi b, calculate pe baza diferenţelor de ordinul întâi ale variabilelor y şi x.
Se ajunge astfel la modelul:
)()1()( 1)1()1(1)1( −− −+−=− tttt xrxryry βα (3.4.35)
Modele econometrice
unde: )( 1)1( −− tt yry reprezintă diferenţele teoretice (ajustate) de ordinul întâi
ale variabilei endogene y, calculate pe baza funcţiei de regresie (3.4.34).
c) Procedeul prin baleiaj (Hildreth-Lu) Dacă există corelaţie se ajunge la relaţia:
ttttt zxrxbrayry +−+−=− −− )(ˆ)1(ˆ 1)1(0)1(01)1( ⇒ ttt zxbay ++= *11
*
Procedeul prin baleiaj constă în atribuirea de valori lui r(1) în
intervalul [0,1] ⇒ autocorelare pozitivă, sau în intervalul [-1,0] ⇒ autocorelare negativă.
De exemplu, în cazul unei autocorelări pozitive, i se atribuie lui r(1)
următoarele valori:
r(1) = 0,1 ⇒ ∑zt2 = 1,75;
r(1) = 0,2 ⇒ ∑zt2 = 2,75;
r(1) = 0,3 ⇒ ∑zt2 = 3,75.
Deci minimul se situează în intervalul [0,2; 0,3]. Se dau apoi valori lui r = ⎨0,21; 0,22;…0,27⎬, oprindu-ne la
valoarea pentru care se obţine min ∑zt2. Pentru această valoare se păstrează
estimatorii a şi bˆ ˆ obţinuţi în acest caz.
d) Procedeul iterativ al lui D. Cochran şi C. Orcutt Se consideră modelul ttt ubxay ++= . Se estimează parametrii
modelului, se aplică testul D-W, se calculează coeficientul de autocorelaţie de ordinul întâi şi se înlocuieşte valoarea sa în ecuaţia iniţială, (3.4.34), obţinându-se modelul - . În cazul acestui model se
verifică dacă s-a eliminat sau nu autocorelaţia erorilor. În caz contrar, se continuă procedeul până când se atinge acest deziderat.
t*t
* zxbayt
++= 11
Modelul unifactorial
e) Procedeul Durbin
ttttt zxbayrxbay +−−=−− −− )ˆˆ(ˆˆ 11)1(
Se calculează r(1), se introduce în relaţia (3.4.34) şi rezultă estimatorii parametrilor, . Această metodă dă rezultate bune numai în cazul existenţei unei autocorelaţii de ordinul întâi şi este aplicabilă în cazul în se lucrează cu un număr mare de date.
11ˆ,ˆ ba
f) Uneori, eliminarea autocorelaţiei se poate realiza şi prin construirea modelului pe baza diferenţelor de ordinul întâi ale variabilelor:
tttttttt zbxayzxxbayy ++=⇒+−+=− −−**
11 )(
g) Pentru eliminarea autocorelaţiei se poate construi un model nou în care se introduce o variabilă fictivă suplimentară. Această metodă porneşte de la ideea că variabila reziduală u nu este influenţată numai de factori aleatori, ci există cel puţin un factor sistematic care provoacă autocorelaţia.
I4 Legea de probabilitate a variabilei reziduale ut este legea normală, de medie nulă şi abatere medie pătratică σu, ut → Ν(0,σu).
Se ştie că, dacă erorile urmează legea normală de medie zero şi de abatere medie pătratică (consecinţa ipotezelor I1, I2, I3), atunci are loc relaţia:
su$
( ) αα −=≤ 1ˆ ut stuP
Pe baza acestei relaţii, în funcţie de diferite praguri de semnificaţie α , din tabela distribuţiei normale sau a distribuţiei Student se vor prelua valorile corespunzătoare lui . tα
Verificarea ipotezei de normalitate se poate face pe baza unui grafic în cadrul căruia pe axa Ox se vor reprezenta valorile ajustate ale variabilei y
Modele econometrice
- , iar pe axa Oy se vor trece valorile variabilei reziduale - . Dacă
valorile empirice ale variabilei reziduale se înscriu în banda ty tu
ust ˆ⋅± α , cu un
anumit prag de semnificaţie α , ipoteza de normalitate a variabilei reziduale poate fi acceptată cu acest prag de semnificaţie – vezi figura 3.4.4:
y
u ust ⋅+ α
ust ⋅− α
0
Figura 3.4.4
O altă modalitate de verificare a ipotezei de normalitate a erorilor o constituie testul Jarque-Berra9, care este şi el un test asimptotic (valabil în cazul unui eşantion de volum mare), ce urmează o distribuţie hi pătrat cu un număr al gradelor de libertate egal cu 2, având următoarea formă:
( )⎥⎥⎦
⎤
⎢⎢⎣
⎡ −+=
243
6
22 KSnJB ~ χ 2 (3.4.36) 2;α
unde: n = numărul de observaţii;
S = coeficientul de asimetrie (skewness), ce măsoară simetria distribuţiei erorilor în jurul mediei acestora, care este egală cu zero, având următoarea relaţie de calcul:
( )3
1
31
σ
∑=
−=
n
tt yy
nS (3.4.37)
9 cf. EViews, User Guide, Version 2.0, QMS Quantitative Micro Software, Irvine, California,
1995, p. 140-141
Modelul unifactorial
K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce măsoară
boltirea distribuţiei (cât de „ascuţită” sau de aplatizată este distribuţia comparativ cu distribuţia normală), având următoarea relaţie de calcul:
( )4
1
41
σ
∑=
−=
n
tt yy
nK (3.4.38)
Testul Jarque-Berra se bazează pe ipoteza că distribuţia normală are
un coeficient de asimetrie egal cu zero, S = 0, şi un coeficient de aplatizare egal cu trei, K = 3.
Dacă probabilitatea, p(JB), corespunzătoare valorii calculate a testului este suficient de scăzută, atunci ipoteza de normalitate a erorilor este respinsă, în timp ce, în caz contrar, pentru un nivel suficient de ridicat al probabilităţii ipoteza de normalitate a erorilor este acceptată, sau dacă
χ , atunci ipoteza de normalitate a erorilor este respinsă. >JB 22;α
3.4.2. Verificarea semnificaţiei estimatorilor parametrilor modelului econometric
Dacă cele patru ipoteze pot fi acceptate, se poate demonstra (vezi
Teorema 1) că M.C.M.M.P. este echivalentă cu M.V.M. (metoda verosimilităţii maxime) şi, deci, estimatorii obţinuţi în acest caz sunt nedeplasaţi, convergenţi şi eficienţi.
De asemenea (vezi Teorema 2 şi 3), cei doi estimatori, , sunt variabile aleatoare repartizate normal:
b şi a
)s,a(N)a(L a= ; )s,b(N)b(L b=
Modele econometrice
unde:
( ) ⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛
∑ −+=
tt
uaxx
xn
ss2
22 1 = abaterea medie pătratică a estimatorului a ; ˆ
( )∑ −=
tt
ub xx
ss 2
2
ˆ = abaterea medie pătratică a estimatorului b ;
∑−
∑ −=
−=
t
ttt
tu n
)yy()u(
ns
221
2
22 = dispersia variabilei reziduale (vezi
teorema 6)
Verificarea semnificaţiei estimatorilor constă în a accepta, sau a respinge, una din cele două ipoteze:
⎩⎨⎧
==
00
:0 ba
H
⎩⎨⎧
≠≠
00
:1 ba
H
Testul adecvat acestui scop, b şi a fiind variabile normale, este
testul “t”. Prin centrarea şi normarea estimaţiilor b şi a , în cazul ipotezei
H0: L(a )=N(0, ) şi L(bˆ as ˆ )=N(0, ), se obţin valorile calculate: bs
acal s
at 01 −= şi
bcal s
bt 02 −= . Aceste valori calculate sau empirice se compară
cu valoarea teoretică: • tα = variabilă normală, dacă n,t 1= , n>30, preluată din tabela
distribuţiei normale, în funcţie de o valoare arbitrar aleasă a probabilităţii
Modelul unifactorial
„p“ sau a pragului de semnificaţie „α”, p+ α = 1; aceste valori, de regulă fiind: p = 0,9 => α = 0,1; p = 0,95 => α = 0,05; p = 0,99 => α = 0,01;
• - tα;n-(k+1) = variabilă Student, dacă n,t 1= , n≤30, preluată din tabela distribuţiei Student, în funcţie de valoarea stabilită pentru α şi de numărul gradelor de libertate, n-(k+1); n = numărul observaţiilor; k = numărul variabilelor exogene xj, k,j 1= (k+1 = numărul parametrilor modelului econometric).
Pe baza celor două valori, tcal şi tα;v , regula de decizie a testului este:
• dacă
⎪⎪
⎭
⎪⎪
⎬
⎫
≤=
≤=
vb
cal
va
cal
tsbt
tsat
;ˆ
2
;ˆ
1
ˆ
ˆ
α
α
=> se acceptă H0 => estimatorii nu sunt
semnificativ diferiţi de zero, se renunţă la ei şi la model => se revine la prima etapă cu o nouă specificare;
• dacă
⎪⎪
⎭
⎪⎪
⎬
⎫
>=
>=
vb
cal
va
cal
tsbt
tsat
;ˆ
2
;ˆ
1
ˆ
ˆ
α
α
=> se acceptă H1 => modelul a fost corect
specificat, identificat şi estimat şi se continuă discuţia econometrică;
• dacă
⎪⎪
⎭
⎪⎪
⎬
⎫
>=
≤=
vb
cal
va
cal
tsbt
tsat
;ˆ
2
;ˆ
1
ˆ
ˆ
α
α
=> se reţine modelul y = f(x) + u = bx + u şi
se continuă discuţia econometrică.
În practică, deoarece t0,05 > 2, economiştii acceptă ipoteza H1 - estimatorii sunt semnificativi dacă:
2ˆ
2ˆ
ˆ
2
ˆ
1
≥=
≥=
bcal
acal
sbt
sat
Modele econometrice
În acelaşi timp, ştiind că şi sunt repartizaţi normal, se poate estima intervalul de încredere al parametrilor acestora:
a b ˆ
( ) ααα −==⋅+≤≤⋅− 1ˆˆ ˆ;ˆ; pstaastaP avav
( ) ααα −==⋅+≤≤⋅− 1ˆˆˆ;ˆ; pstbbstbP bvbv
Parametrii a şi b vor fi consideraţi semnificativ diferiţi de zero dacă: ( ) αα −==>⋅±= 10ˆ ˆ; pstaaP av
( ) αα −==>⋅±= 10ˆˆ; pstbbP bv
3.4.3 Verificarea similitudinii modelului econometric
Modelul econometric, tt xbay += , este expresia formală a
modelului economic real, yt = f(xt) + ut = a + bxt + ut, conceput pe baza teoriei economice şi rezultat pe baza unui singur experiment, unui singur sondaj statistic.
Ca atare, în această etapă se urmăreşte să se verifice: 1) dacă ipoteza de pornire – x = principalul factor de influenţă a
fenomenului y – este corectă sau nu; 2) dacă legitatea economică dintre cele două variabile este de forma
- y = a + bx; 3) dacă rezultatele obţinute pot fi considerate sistematice – în sensul
că se vor obţine aproape aceleaşi rezultate dacă se va repeta experienţa cu alte sondaje, de volum şi structură (alte unităţi statistice) diferite – sau întâmplătoare, adică rezultate diferite pentru sondaje diferite.
În general, scopurile urmărite în această etapă se rezolvă cu ajutorul metodei analizei variaţiei, cunoscută şi sub numele de metoda ANOVA.
Metoda analizei variaţiei porneşte de la identitatea:
yyyyyy tttt −+−=− → ( ) ( )22 ˆˆ yyyyyy tttt −+−=−
[∑∑==
−+−=−n
tttt
n
tt yyyyyy
1
2
1
2 )ˆ()ˆ()( ]
(3.4.3)
Modelul unifactorial
unde10: omenului y; y = valorile reale ale fent
ˆ = valorile teoretice ale fenomenului y; ty
tt xbay +=
( ) xbaxban
yn
yn
y ttt +=∑ +=∑=∑=111
Prin ridicarea la pătrat a binomului din partea dreaptă a relaţiei (3.4.3) rezultă:
∑∑∑∑====
−−+−+−==−n
tttt
n
ttt
n
tt
n
tt yyyyyyyyyy
11
2
1
2
1
2 )ˆ)(ˆ(2)ˆ()ˆ()( (3.4.4)
Termenii relaţiei (3.4.4) se definesc prin:
( )∑=
−=n
2
tt yyV
1
20 = variaţia totală a variabilei y provocată de toţi
factorii săi de influenţă;
( )∑ −==
n
ttx yyV
1= variaţia fenomenului y provocată numai de variaţia
factorului x, considerat factorul principal al variabilei y, adică variaţia lui y
tttu yyV
1= variaţia reziduală, sau variaţia fenomenului y
generată de către factorii nespecificaţi în model, aceşti factori fiind
22
explicată de modelul econometric; n 22 ( )∑ −==
consideraţi – în etapa de specificare – drept factori cu influenţă întâmplătoare, neesenţiali pentru a explica variaţia fenomenului y;
10 Relaţia (3.4.3) rămâne valabilă în toate cazurile de modele liniare sau liniarizabile. În
cazul acestora din urmă, se va ţine cont de semnificaţia simbolurilor. De exemplu: - modelul putere: yt = a xt
b ut => ln yt = ln a +b ln xt + ln ut, În acest caz, semnificaţiile simbolurilor vor fi: yt
* = ln yt; = ln ; *ty ty
∑=∑= tt ylnn
ylnn
y 11 ;u *t = ln yt - ln ; ty
- modelul exponenţial yt = ea+bxt ut => ln yt = a + b xt + ln ut,=> yt* = ln yt;
= ln ; *ty ty y = media geometrică a termenilor.
Modele econometrice
0),cov(ˆ2)(ˆ2ˆ)ˆˆˆˆ(2)ˆ)(ˆ(21
==−=−−+=−− ∑∑∑=
tttttt
n
tttt xubn
nnuxxbuxbaxbayyyy
cov (xt, ut) = 0, adică xt şi ut sunt variabile independente. Această condiţie se realizează dacă erorile sunt homoscedastice ( vezi ipoteza I2).
De regulă, rezultatele aplicării metodei ANOVA se prezintă într-un tabel de forma:
Tabelul 3.4.1 Valoarea testului „F” Sursa de
variaţie Măsura variaţiei
Numărul gradelor de
libertate
Dispersii corectate cF F v vα ; ;1 2
Varianţa explicată de
model ( )∑
=
−=n
ttx yyV
1
22 ˆ 1=k
kV
s xxy
22
/ = 2ˆ
2/
u
xyc s
sF =
Varianţa reziduală ( )∑
=
−=n
tttu yyV
1
22 ˆ
1−− kn 1
22ˆ −−=
knV
s uu
-
Varianţa totală ( )∑
=
−=n
tt yyV
1
220
1−n
-
-
.
Pe baza datelor din tabel se pot testa următoarele ipoteze: 22
0 ux/y ss:H = => cele două dispersii sunt aproximativ egale, adică
influenţa factorului x nu diferă de influenţa factorilor întâmplători; 22
1 ux/y ss:H ≠ => influenţa factorului x şi a factorilor întâmplători
– măsurată prin cele două dispersii – diferă semnificativ şi, deci, se poate trece la discuţia similitudinii, a verosimilităţii modelului teoretic în raport cu modelul real.
După cum se ştie, testarea semnificaţiei dintre două dispersii se face cu ajutorul distribuţiei teoretice Fisher-Snedecor, respectiv cu testul „F”. Cunoscând cele două valori:
1:
22
2
2/
−−==
knV
kV
s
sF ux
u
xycal = valoarea calculată a variabilei „F”
pe baza rezultatelor modelului econometric; Fα,v1,v2
= valoarea teoretică a variabilei „F”, preluată din tabela
repartiţiei Fisher – Snedecor, în funcţie de un prag de semnificaţie α
Modelul unifactorial
(α = 0,1 sau α = 0,05 sau α = 0,01) şi de numărul gradelor de libertate v1 = k; v2 = n-k-1;
Regula de decizie este următoarea: - se acceptă H0 şi se respinge H1 dacă:
Fcal≤ Fα,v1,v2
- se acceptă H1 şi se respinge H0 dacă:
Fcal >Fα,v1,v2
Dacă se acceptă H1 şi dacă variabila u este independentă de fenomenul x, cov(x,u)=0, atunci ecuaţia analizei variaţiei este:
2220 ux VVV += (3.4.39)
ecuaţie care, prin împărţirea la , se transformă în: 2
0V
10010010012
0
2
20
2
20
2
20
2
⋅+⋅=⇒+=VV
VV
VV
VV uxux (3.4.40)
Termenul 2
0
22
VV
R xx/y = se numeşte coeficient de determinare şi are
următoarele semnificaţii:
}
}⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
⇒=⇒⇒+=⇒
⇒+=⇒⇒+≠⇒
=
y. ifenomenulu a influenta defactor singurul este x )(1y; ifenomenulu al esentialfactor un este x )(
0,5esential;factor estenu dar y, i variabilealfactor este x )(
y; ifenomenulu al (cauza)factor estenu x )(0
2/
xfyuxfy
uxfyuxfy
R xy
Modele econometrice
Pe baza afirmaţiilor de mai sus, se deduce uşor că un model econometric este cu atât mai performant cu cât valoarea lui se
apropie mai mult de unu, respectiv cu cât se apropie mai mult de 100(%).
2x/yR
Statistic, intensitatea legăturii dintre cele două variabile se măsoară cu ajutorul indicatorului , denumit raport de corelaţie: x/yR
20
2
20
22 1
VV
VV
RR uxx/yx/y −===
}
}⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
⇒⇒
⇒⇒
=
x cu strict corelat este y-tădeterminis corelatie 1puternică corelatie
0,5slabă corelatie
teindependen sunt y şi x
R x/y
0
În cazul unei legături liniare între cele două variabile – y = a + bx +
u, ln y = ln a + b ln x + ln u, ln y = a + bx + ln u, estimatorii parametrilor fiind obţinuţi cu ajutorul M.C.M.M.P., se poate demonstra că raportul de corelaţie, , este egal cu coeficientul de corelaţie liniară, : xyR / xyr /
( )
( )
( )( )
( )( )∑
∑∑
∑∑
∑−
−=
−
−−+=
−
−=
=
=2
22
2
2
1
2
1
2ˆˆˆˆˆˆ
yy
xxb
yy
xbaxba
yy
yyR
t
t
t
tn
tt
n
tt
xy
( )( ) y
x
t
txy b
yy
xxbR
σσˆˆ
2
2
=−
−=
∑∑
⎪⎩
⎪⎨⎧
=+
=+
∑∑ ∑∑∑
tttt
tt
xyxbxa
yxban2ˆˆ
ˆˆ
Modelul unifactorial
( ) 2222
2
ˆ
xnx
yxn
xy
xxn
yxxyn
xxxn
xyxyn
bt
tt
tt
tttt
tt
t
ttt
t
−
⋅−=
−
−==
∑
∑
∑∑∑∑∑
∑∑∑∑∑∑
( ) ( )
=+−=+−
=−
= ∑∑∑∑ 22222
2 22
xnx
xnx
nxxxx
nxx ttttt
xσ
22
222
2 xnx
xxnx tt −=+−= ∑∑
2ˆ
x
tt yxn
xy
bσ
⋅−=⇒
∑
( ) ( )( ) ( )
=⋅+−−−=
⋅+−−=
−−=
∑∑∑
∑∑
yxny
xnx
yn
yxn
yxyxyxyxn
yyxxxy
tttt
tttttt,cov
yxn
yxyxyxxy
nyx tttt ⋅−=⋅+⋅−⋅−= ∑∑
( )
⇒ =$cov ,
by x
xσ 2
( ) ( )
xyy
x
y
x
xyxxy Rbxyxyr =⋅=⋅==
σσ
σσ
σσσˆ,cov,cov
2/
De asemenea, testarea semnificaţiei unui model econometric se poate face tot cu testul „F”, dar, pornind de la valoarea raportului de corelaţie, , sau a coeficientului de determinare, : x/yR 2
x/yR
kkn
RR
knV
:k
Vs
sF ux
u
x/ycal
111 2
222
2
2−−
⋅−
=−−
==
Modele econometrice
Astfel:
- dacă ⇒=⇒≤−
⋅−−
= −−== 01
112
2
21 x/yknv;kv;cal RFR
RkknF α
se renunţă la modelul econometric obţinut;
- dacă ⇒≠⇒>−
⋅−−
= −−== 01
1/1;;2
2
21 xyknvkvcal RFR
RkknF α se trece la
discuţia econometrică a ecuaţiei analizei variaţiei – – vezi
relaţia (3.4.25).
2220 ux VVV +=
3.5 Utilizarea modelului econometric unifactorial
În practica economică, un model econometric se utilizează pentru explicarea variaţiei fenomenului rezultativ y în raport de variaţia factorului său x, pentru estimarea valorilor probabile ale fenomenului y (simularea acestuia) în funcţie de posibilele valori pe care economic le poate înregistra factorul x, şi, în final, prognoza fenomenului y în funcţie de valorile fenomenului x, pe intervalul de prognoză v, v = 1, 2, ..., h.
Pentru a permite ca utilizatorii să verifice proprietăţile (performanţele) unui model econometric obţinut, acesta trebuie prezentat cu următoarele informaţii:
tt xbay ˆˆˆ += ; R ( ) ( ) d as bs
us
Dispunând de aceste informaţii se poate testa: - independenţa erorilor testul „d” – Durbin – Watson; - semnificaţia estimatorilor testul „t”; - similitudinea modelului testul „F”. În anumite cazuri, când s-au estimat două modele pentru spaţii
diferite (două judeţe, sau două pieţe diferite) sau pentru perioade de timp diferite, ale aceloraşi două fenomene y şi x, de exemplu: şi xbayM 111 : +=
Modelul unifactorial
xbayM 222 : += , se poate testa ipoteza omogenităţii sau stabilităţii relative a legităţii dintre cele două fenomene:
⇒= 210 : bbH cele două modele sunt relativ omogene, sau legătura este relativ stabilă în timp;
⇒≠ 211 : bbH cele două modele nu sunt omogene (legătura nu este relativ stabilă).
Astfel,
- dacă: ⇒≤+
−= αt
ss
bbt
bb
cal 2221
21
se acceptă H0;
- dacă: ⇒>+
−= αt
ss
bbt
bb
cal 2221
21
se acceptă H1.
De reţinut că ipoteza H0 este folosită în special în domeniul
prognozei, deoarece acceptarea ei presupune existenţa unei legături relativ stabile în timp, premisă ce justifică previziunea fenomenului y pe baza valorilor viitoare ale fenomenului x. În acelaşi timp, în toate cele trei direcţii în care poate fi folosit un model econometric, valorile fenomenului pot fi estimate, fie pe baza estimaţiei punctuale, tt xbay += , fie pe baza
unui interval de încredere:
( ) ααα −==⋅+≤≤⋅− 1pstyystyPtt yttyt (3.5.1)
De regulă, prognoza fenomenului y dacă se cunosc valorile variabilei
factoriale x pentru momentul (n+v) se realizează pe baza unui interval de încredere, deoarece y este o variabilă aleatoare normală de medie şi de
abatere medie pătratică (vezi ipotezele I1 şi I4 ale M.C.M.M.P.):
vny +
vnys+
Modele econometrice
( ) ααα −==⋅+≤≤⋅−++ +++ 1pstyystyP
vnvn yvnvnyvn (3.5.2)
unde:
y n +v = valoarea reală a variabilei y în momentul de prognoză ( n ); v+
=+ vny estimaţia punctuală a valorii de prognoză pentru variabila y,
care se calculează cu ajutorul relaţiei:
vnvn xbay ++ += (3.5.3)
vnys+
= abaterea medie pătratică a erorii de previziune, calculată cu
relaţia:
( )( ) ⎟
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
−
−++⋅==
∑=
+
++ n
tt
vnuy
xx
xxn
sssvny
1
2
222
ˆ11
ˆvn (3.5.4)
Din relaţia de mai sus rezultă că eroarea de previziune ( ) este
cu atât mai mică cu cât numărul de observaţii va fi mai mare, cu cât valorile variabilelor în momentul de prognoză (n+v) vor fi mai apropiate de media lor, cu cât dispersia variabilei exogene x va fi mai mare şi cu cât dispersia variabilei reziduale ( ) este mai mică, iar aceasta va fi cu atât mai mică cu
cât modelul econometric va explica o parte tot mai mare din variaţia variabilei prognozate , sau cu cât raportul de corelaţie (
vnys+
2us
y xyR ) va avea o
valoare mai apropiată de unu. Aprecierea prognozei unui fenomen y pe baza unui model
econometric, tt xbay += , se poate face cu ajutorul a două noţiuni,
siguranţa prognozei şi precizia prognozei, noţiuni care se află în relaţie invers proporţională.
Modelul unifactorial
Siguranţa prognozei este dată de probabilitatea (p) cu care este estimat intervalul de încredere, iar precizia prognozei de relaţia:
- eroarea absolută: vnyvnvna styye
+⋅=−= ++ α (3.5.5)
- eroarea relativă: 100100 ⋅⋅
=⋅=++
+
vn
y
vn
ar y
stye
(%)e vnα (3.5.6)
Dar, dacă p 1 rezultă că siguranţa prognozei creşte, iar dacă t α
rezultă că eroarea creşte, iar precizia se diminuează. Din acest motiv, estimarea valorilor probabile ale fenomenului y se face pe baza unor valori prestabilite privind siguranţa şi precizia prognozei. De exemplu, se poate preciza că prognozele vor trebui acceptate cu o probabilitate dată, p = 0,95 => α = 0,05, iar eroarea de prognoză – pe un anumit orizont al prognozei – trebuie să fie:
(%)Ey
st(%)e
vn
yr
vn ≤⋅⋅
=+
+ 100α E(%) = 5, 10,...
Analiza capacităţii de prognoză a unui model poate fi realizată pe
baza indicatorilor statistici propuşi de H. Theil (Pindyck, Rubinfeld, 1981, p. 364-366). Aceşti indicatori sunt calculaţi pe baza următoarelor relaţii:
• coeficientul Theil
( )
∑∑
∑
==
=
+
−=
n
tt
n
tt
n
ttt
yn
yn
yynT
1
2
1
2
1
2
1ˆ1
ˆ1
(3.5.7)
ale cărui valori sunt cuprinse în intervalul [0, 1].
Semnificaţia acestui indicator este invers proporţională cu mărimea lui, respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu atât capacitatea de prognoză a modelului este mai bună.
Modele econometrice
• ponderea abaterii
( )( )
( )2
2
1
2
2ˆ
ˆ1ˆ
un
ttt
A yy
yyn
yyTσ−
=−
−=
∑=
(3.5.8)
unde:
=y media valorilor teoretice ale variabilei endogene;
=y media valorilor reale ale variabilei endogene; =2
uσ dispersia variabilei reziduale necorectată cu numărul gradelor de
libertate.
Interpretarea acestui indicator, care evidenţiază existenţa unor erori sistematice, este aceea că, în cazul ideal11, valoarea sa este egală cu zero, aceasta tinzând către unu în cazul unor erori de estimare de-a lungul întregii serii de timp.
• ponderea dispersiei
( )( )
( ) ( )2
2
1
2
1
2
1
2
2ˆ
1ˆˆ1
ˆ1 u
n
tt
n
ttt
n
ttt
yyD
yyn
yyn
yyn
T tt
σσσ ⎥
⎥⎦
⎤
⎢⎢⎣
⎡−−−
=−
−=
∑∑
∑==
=
(3.5.9)
care este definită tot în intervalul [0, 1], aceasta măsurând evoluţia oscilantă a celor două serii, respectiv seria ajustată şi seria empirică a variabilei endogene. Acest indicator are aceeaşi semnificaţie ca şi cei precedenţi, respectiv o valoare scăzută indică o capacitate bună de prognoză, în timp ce o valoare apropiată de unu exprimă o eroare de specificare a modelului.
11 Demn de menţionat este faptul că, în cazul estimării parametrilor unui model statistic cu ajutorul
metodei celor mai mici pătrate, valoarea acestui indicator este egală cu zero, acesta fiind discriminant numai în cazul utilizării altor procedee de estimare cum ar fi, de exemplu, metoda grafică, metoda punctelor empirice sau metoda punctelor medii.
Modelul unifactorial
• ponderea covarianţei
( )
( )∑=
−
−= n
ttt
yyC
yyn
rT tt
1
2
ˆ
ˆ112 σσ
(3.5.10)
unde:
r = coeficientul de corelaţie liniară dintre valoarea estimată a variabilei endogene, , şi cea reală, yt. ty
( )( )tt yy
n
ttt
n
yyyyr
σσ ˆ
1
ˆˆ∑=
−−= (3.5.11)
Se poate observa uşor că semnificaţia acestui indicator este analogă
cu a celor menţionaţi anterior. De altfel cei patru indicatori se regăsesc în următoarea ecuaţie
propusă de Theil:
( ) ( ) ( ) ( )tttt yyyy
n
ttt ryyyy
nσσσσ ˆ
2ˆ
2
1
2 12ˆˆ1−+−+−=−∑
=
(3.5.12)
a cărei interpretare se realizează prin intermediul semnificaţiei acestor indicatori.
În cazul în care modelul econometric se utilizează în special la prognoza fenomenelor economice este necesară verificarea stabilităţii în timp a legităţii de evoluţie a fenomenului analizat în funcţie de evoluţia factorilor săi. Acest lucru se poate realiza cu ajutorul testului Chow, care se aplică astfel:
- fie modelul unifactorial iniţial:
- y0t = a + b x0t + u0t ( n,t 1= ); ∑=
=n
ttu uV
1
20
20
(3.5.13)
Modele econometrice
pe care îl împărţim în două modele:
- y1t = a1 + b1 xt + u1t ( 11 n,t = ); ∑=
=1
1 1
21
2n
ttu uV (3.5.14)
y2t = a2 + b2 xt + u2t ( n,nt 11+= ); ∑+=
=
n
nttu uV
1
22
2
12
(3.5.15)
222
1
22
1
21
1
221
1
1
uuun
ntt
n
tt
n
tt VVVuuu +=⇔+= ∑∑∑
+=== (3.5.16)
n = n 1 + n 2, n = numărul de observaţii.
Testarea ipotezei de stabilitate constă în alegerea uneia din următoarele ipoteze:
H0: Dacă 220
uu VV ≅ rezultă că legitatea de evoluţie a fenomenului
este stabilă în timp, iar modelul poate fi utilizat în vederea efectuării prognozei;
H1: Dacă 220
uu VV ≠ rezultă că legitatea de evoluţie a fenomenului
nu este stabilă în timp, iar modelul nu va putea fi utilizat în vederea efectuării prognozei.
Aplicarea testului Fisher-Snedecor constă în:
- dacă ( )21
0
112
2
22
v;v;u
uuc F
kkn
V
VVF α≤
++−
⋅−
= (3.5.17)
se alege ipoteza H0, în caz contrar se alege ipoteza H1 ( numărul gradelor de libertate este: v1= k + 1, v2 = n – 2 ( k + 1 ), k = numărul variabilelor exogene).
Modelul unifactorial
Exemplu de aplicare a modelului unifactorial
Se cunosc următoarele date privind consumul final real al gospodăriilor populaţiei şi PIB-ul real în România, în perioada 1990-2003, exprimate în preţuri comparabile (1990=100).
Tabelul 3.5.1
Anul
Consumul final real al gospodăriilor populaţiei
(mild.lei preţuri comparabile) (1990=100)
PIB (mild.lei preţuri comparabile)
(1990=100)
0 1 2 1990 557,7 857,9 1991 467,4 746,8 1992 432,1 681 1993 435,9 691,3 1994 447,3 718,2 1995 505,3 769,3 1996 545,7 799,5 1997 525,7 750,7 1998 586,2 714,8 1999 579,8 706,1 2000 582,3 720,7 2001 610,7 761,7 2002 629,1 799,1 2003 673,7 838,3
Notă: Ambii indicatori sunt calculaţi conform metodologiei de calcul a Sistemului European al Conturilor Economiei Integrate - SEC 1979. Consumul final al populaţiei a fost deflaţionat cu ajutorul deflatorului consumului final al populaţiei exprimat în preţuri constante (1990 = 100), datele provenind de la Ministerul Prognozei şi Dezvoltării, iar PIB-ul a fost deflaţionat cu ajutorul deflatorului PIB exprimat în preţuri constante (1990 = 100), obţinut în urma prelucrării datelor din Raportul Anual BNR. Sursa: Date prelucrate pe baza Anuarului Statistic al României 2003, INS, Bucureşti, 2004-CD, Raportului Anual 2000, BNR, Bucureşti, 2001, p. 6*-7*, Raportului Anual 2002 BNR, Bucureşti, 2003, p. 4*-5*, Comunicatului de Presă al INS nr.11/26.02.2004.
Se cere: a) Să se construiască modelul econometric ce descrie legătura dintre
cele două variabile şi să se interpreteze semnificaţia parametrilor modelului;
Modele econometrice
b) Să se estimeze parametrii modelului şi să se verifice semnificaţia acestora;
c) Ştiind că în anul 2004, valoarea PIB-ului real12 a fost egală cu 907,8 mild lei preţuri comparabile (1990=100), să se estimeze valoarea consumului final real al gospodăriilor populaţiei în anul 2004 şi să se verifice capacitatea de prognoză a modelului utilizat.
Rezolvare:
a) Notând cu y = consumul final real al gospodăriilor populaţiei; x = PIB-ul real;
modelul econometric va fi de forma: ( )y f x u= + .
Pentru alegerea funcţiei matematice ( )f x se recurge la reprezentarea
grafică a celor două şiruri de valori.
430450470490510530550570590610630650670
670 685 700 715 730 745 760 775 790 805 820 835 850
x
y
Figura 2.3.1. Legătura dintre consumul final real al gospodăriilor populaţiei
şi PIB-ul real al României
12 Valoare estimată pe baza informaţiilor furnizate în cadrul Comunicatului de Presă al INS
nr. 12/11.03.2005, privind principalii indicatori conjuncturali în anul 2004 şi luna ianuarie 2005
Modelul unifactorial
Deoarece graficul punctelor empirice indică faptul că distribuţia poate fi aproximată cu o dreaptă, modelul econometric devine:
14,1; =++= tubxay ttt
Semnificaţia economică a celor doi parametrii şi , ţinând cont de semnificaţia celor două variabile (y - consumul final real al gospodăriilor populaţiei şi x - PIB-ul real) este:
a b
- parametrul reprezintă în acest caz autoconsumul, deoarece pentru
ax y a= ⇒ =0 ; - parametrul reprezintă panta dreptei sau coeficientul de regresie al
consumului în funcţie de PIB, care măsoară creşterea consumului dacă PIB-ul se modifică cu un miliard de lei.
b
b) Estimarea parametrilor modelului econometric de la punctul a) se face cu ajutorul M.C.M.M.P.:
( ) ( ) ( )∑∑==
−−=−=14
1
214
1
2 ˆˆminˆminˆ,ˆt
ttt
tt xbayyybaF
( )′ = ⇒ + =∑ ∑F a na b x yt t$ $ $0
( )′ = ⇒ + =∑ ∑ ∑F b a x b x y xt t$ $ $0 2
⎪⎩
⎪⎨⎧
=+
=+⇒
t t
07,5744734ˆ14,7996163ˆ4,10555
9,7578ˆ4,10555ˆ14
ba
ba
(vezi tabelul 3.5.2., coloanele 2, 3, 4, 5).
Modele econometrice
Tabelul 3.5.2 Nr. crt.
Anul xt yt xt2 x yt t 1ˆ −tu 2
1ˆ
−tu 1ˆˆ −ttuu
0 1 2 3 4 5 6 7 8 1 1990 857,9 557,7 735992,41 478450,83 - - - 2 1991 746,8 467,4 557710,24 349054,32 -67,6095 4571.0382 4608,8583 3 1992 681 432,1 463761,00 294260,10 -68,1688 4646.9914 3430,1977 4 1993 691,3 435,9 477895,69 301337,67 -50,3191 2532.0160 2759,4477 5 1994 718,2 447,3 515811,24 321250,86 -54,8389 3007.3080 3573,7049 6 1995 769,3 505,3 591822,49 388727,29 -65,1673 4246.7772 3156,9084 7 1996 799,5 545,7 639200,25 436287,15 -48,4431 2346.7374 1571,3535 8 1997 750,7 525,7 563550,49 394642,99 -32,4371 1052.1637 422,3000 9 1998 714,8 586,2 510939,04 419015,76 -13,0191 169.4958 -995,6848
10 1999 706,1 579,8 498577,21 409396,78 76,4790 5849.0429 5897,0252 11 2000 720,7 582,3 519408,49 419663,61 77,1064 5945.4012 5228,8438 12 2001 761,7 610,7 580186,89 465170,19 67,8133 4598.6481 4278,7321 13 2002 799,1 629,1 638560,81 502713,81 63,0957 3981.0719 3235,9296 14 2003 838,3 673,7 702746,89 564762,71 51,2860 2630.2565 3293,7103
Total 10555,4 7578,9 7996163,14 5744734,07 - 45576,9481 40461,3270
Tabelul 3.5.2 (continuare)
1
*
8878,0 −−−=
t
tt
yyy
1
*
8878,0 −−−=
t
tt
xxx
1
*
9016,0 −−−=
t
tt
yyy
1
*
9016,0 −−−=
t
tt
xxx
9 10 11 12 - - - -
-27,7030 -14,8081 -35,4029 -26,6527 17,1616 18,0219 10,7085 7,7112 52,2995 86,7364 46,3337 77,3342 60,3260 104,4925 54,3078 94,9481
108,2056 131,7118 102,0299 121,7959 97,1156 116,5473 90,1392 105,9260 41,2501 40,9370 33,7159 29,8987
119,5053 48,3596 112,2472 37,9951 59,3959 71,5302 51,3025 61,6613 67,5776 93,8537 59,5726 84,1049 93,7582 121,8924 85,7186 111,9420 86,9458 122,8943 78,5142 112,3779
115,2111 128,8921 106,5254 117,8593
891,0494 1071,0611 795,7127 936,9018
Modelul unifactorial
Utilizând pachetul de programe EViews în vederea estimării parametrilor modelului au fost obţinute următoarele rezultate: Dependent Variable: Y Method: Least Squares Sample: 1990 2003 Included observations: 14
Variable Coefficient Semnif. ind. Std. Error Semnif. ind. t-
StatisticSemnif. ind. Prob.
C -67,6561 a 250,0188 asˆ -0,2706 at ˆ 0,7913 ( )ap ˆ
X 0,8077 b 0,3308 bs ˆ 2,4416 b
t ˆ 0,0311 ( )bp
R-squared 0,3319 2R Mean dependent var 541,35 y
Adjusted R-squared 0,2762 2
cR S.D. dependent var 75,6474 ys
S.E. of regression 64,3567 us ˆ Akaike info criterion 11,2983 AIC
Sum squared
resid 49701,46
( )∑∑=
=−2
2
ˆ
ˆ
t
tt
u
yySchwarz criterion 11,3896 SC
Log likelihood -77,0883 L F-statistic 5,9615 Fc
Durbin-Watson
stat 0,1969 d Prob(F-statistic) 0,0311 p(F)
Semnificaţia indicatorilor necunoscuţi pe care-i calculează pachetul
de programe EViews este următoarea:
( ) ( )=bpap ˆ,ˆ probabilitatea asociată parametrului â, respectiv . O valoare cât mai apropiată de zero a acestei probabilităţi va indica o semnificaţie ridicată a parametrului respectiv, în caz contrar, aceasta confirmând, împreună cu testul t, faptul că parametrul respectiv este nesemnificativ.
b
2cR = coeficientul de deteminare corectat sau ajustat. Acesta este
utilizat în vederea evidenţierii numărului de variabile factoriale cuprinse în model, precum şi a numărului de observaţii pe baza cărora au fost estimaţi parametrii modelului. În cazul unui model multifactorial acesta va înregistra
Modele econometrice
valori inferioare coeficientului de deteminaţie. Expresia acestui indicator este următoarea:
( )22 111 Rkn
nRc −⋅−−
−=
L= logaritmul funcţiei de verosimilitate (presupunând că erorile sunt
normal distribuite), funcţie ce este determinată ţinând seama de valorile estimate ale parametrilor. Relaţia de calcul a acestui indicator, utilizată de către pachetul de programe EViews, este următoarea:
( )⎟⎟
⎠
⎞
⎜⎜
⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛++= ∑
nunL t
2ˆln2ln1
2π
unde:
=∑ 2ˆtu suma pătratelor erorilor;
k = numărul variabilelor exogene; n = numărul de observaţii.
Acest indicator este utilizat în vederea elaborării unor teste statistice destinate depistării variabilelor omise dintr-un model econometric, precum şi a unor teste destinate depistării variabilelor redundante dintr-un model econometric, ca, de exemplu, testul LR sau raportul verosimilităţilor (Likelihood Ratio).
y = media variabilei dependente sau endogene, având următoarea relaţie de calcul:
n
yy
n
t∑== 1
t
Modelul unifactorial
ys = abaterea medie pătratică (standard) corespunzătoare variabilei
dependente, a cărei relaţie de calcul este următoarea:
( )1
1
2
−
−=∑=
n
yys
n
tt
y
AIC = criteriul Akaike este utilizat în cazul comparării a două sau
mai multe modele econometrice. Relaţia de calcul a acestuia, utilizată de către pachetul de programe EViews, este următoarea:
nk
nLAIC 22+−=
Regula de decizie utilizată în cazul aplicării acestui test este aceea potrivit căreia este ales acel model econometric pentru care s-a obţinut valoarea cea mai mică corespunzătoare acestui indicator.
SC = criteriul Schwartz este, de asemenea, utilizat pentru a compara două sau mai multe modele econometrice. Relaţia de calcul a acestuia, utilizată de către pachetul de programe EViews, este următoarea:
nnk
nLSC ln2+−=
Şi în acest caz, este ales acel model econometric pentru care s-a
obţinut valoarea cea mai mică corespunzătoare acestui indicator. p(F) = probabilitatea asociată statisticii F. O valoare cât mai apropiată de zero a acestei probabilităţi va indica o semnificaţie ridicată a rezultatelor estimării, respectiv a modelului.
Pe baza estimatorilor parametrilor au fost calculate valorile estimate ale variabilei y, tt xy 8077,06561,67ˆ +−= şi ale variabilei reziduale,
. Valorile acestora sunt prezentate în cadrul tabelului 3.5.3
(utilizând pachetul de programe EViews). ttt yyu ˆˆ −=
Modele econometrice
Tabelul 3.5.3 Actual
ty
Fitted
ty
Residual
ttt yyu ˆˆ −= Residual Plot
(graficul reziduurilor)
557,7 625,3095 -67,6095 | * | . | 467,4 535,5688 -68,1688 | *. | . | 432,1 482,4191 -50,3191 | . * | . | 435,9 490,7389 -54,8389 | .* | . | 447,3 512,4673 -65,1673 | * | . | 505,3 553,7431 -48,4431 | . * | . | 545,7 578,1371 -32,4371 | . * | . | 525,7 538,7191 -13,0191 | . * | . | 586,2 509,7210 76,4790 | . | . *| 579,8 502,6936 77,1064 | . | . *| 582,3 514,4867 67,8133 | . | * | 610,7 547,6043 63,0957 | . | * | 629,1 577,8140 51,2860 | . | * . | 673,7 609,4776 64,2224 | . | * |
- dispersia variabilei reziduale
( )7884,4141
2144613,49701
1ˆ 2
2ˆ
=−
=−−−
= ∑kn
yys tt
u
unde: k = numărul variabilelor exogene. (vezi tabelul afişat de programul EViews)
- abaterea medie pătratică a variabilei reziduale, : us ˆ
( )3567,647884,4141
1ˆ 2
ˆ ==−−−
= ∑kn
yys tt
u
(vezi tabelul afişat de programul EViews)
- abaterile medii pătratice ale celor doi estimatori:
( )0188,2501
2
22ˆˆ =
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−+=∑ xx
xn
sst
ua
Modelul unifactorial
( )3308,02
2ˆ
ˆ =−
=∑ xx
sst
ub
(vezi tabelul afişat de programul EViews)
- raportul de corelaţie:
( )
( )
( )
( )
5761,03319,0875,743924613,497011
1
ˆ1
ˆ1 2
14
1
2
14
1
2
14
1
2
2
==−=
−⋅
−−=
−
−−==
∑
∑
∑=
=
=
R
ns
yy
yy
yyRR
y
ttt
tt
ttt
(vezi tabelul afişat de programul EViews)
- variabila Durbin-Watson, d:
( )20,0
4613,497017173,9784
ˆ
ˆˆ
14
1
2
14
2
21
==−
=
∑
∑
=
=−
tt
ttt
u
uud
(vezi tabelul afişat de programul EViews)
Astfel, modelul estimat devine:
( ) ( )3567,64
20,03308,00188,250576,0;8077,06561,67ˆ
ˆ ===+−=
u
tt
sdRxy
Verificarea semnificaţiei modelului necesită: - verificarea ipotezei de independenţă a erorilor; - verificarea ipotezei de homoscedasticitate a erorilor; - verificarea semnificaţiei estimatorilor; - verificarea semnificaţiei raportului de corelaţie.
Modele econometrice
Verificarea ipotezei de independenţă a erorilor, care presupune , se realizează cu ajutorul testului Durbin-Watson, constând
în calcularea variabilei şi compararea sa cu două valori teoretice şi
, preluate din tabela distribuţiei Durbin-Watson în
funcţie de un prag de semnificaţie
( )cov ,u ut t− =1 0
d d1
d 2 ( 36,1;08,1 21 == dd )α ( )05,0=α , de numărul variabilelor
explicative k şi de numărul observaţiilor (k = 1) n ( )n ≥ 15 . Observaţie:
tabela Durbin-Watson este construită pentru un număr de observaţii ; pentru valori inferioare se va lucra cu valorile calculate pentru n . adică .
n ≥ 15= 15
36,1,08,1 21 == ddDeoarece valoarea calculată 2,0=d este cuprinsă în intervalul
, aceasta indică existenţa unei autocorelări pozitive. 08,12,00 1 =<=< ddDin acest motiv, nu mai are sens testarea celorlalte ipoteze, a semnificaţiei estimatorilor şi a raportului de corelaţie, estimatorii nemaifiind eficienţi, deci se impune mai întâi eliminarea fenomenului de autocorelaţie a erorilor.
Un alt procedeu de verificare a ipotezei de independenţă a erorilor constă în aplicarea testului Breusch-Godfrey, acest test fiind utilizat în vederea depistării unei autocorelaţii de ordin superior. Ca urmare a presupunerii existenţei unei autocorelaţii de ordin superior se construieşte următorul model:
tptpttt zurururu ++++= −−− K2211
unde:
zt = variabilă reziduală de medie zero şi dispersie constantă.
Ipoteza nulă care stă la baza testului este aceea potrivit căreia toţi coeficienţii corespunzători valorilor decalate ale variabilei reziduale sunt simultan egali cu zero, fapt ce implică non-existenţa fenomenului de autocorelaţie a erorilor.
În vederea aplicării testului sunt estimate valorile variabilei reziduale ut în urma aplicării M.C.M.M.P. asupra modelului iniţial. Variabila
Modelul unifactorial
reziduală ut este regresată apoi în funcţie de variabilele exogene iniţiale ale modelului şi de valorile decalate ale sale, respectiv ut-1, ut-2,…, ut-p. În cazul acestei regresii este calculată valoarea coeficientului de determinare R2 şi a unei variabile de forma: BG = (n-p) R2. Presupunând că ne aflăm în situaţia unui eşantion de volum mare, variabila BG este asimptotic distribuită sub forma unui χ , pentru care numărul gradelor de libertate este egal cu: 2
;vα
pv = , unde p = mărimea decalajului , respectiv: BG~ χ . 2;vα
Dacă χ , ipoteza nulă este respinsă, ceea ce presupune că
există cel puţin un coeficient de autocorelaţie nenul.
>BG 2;vα
Aplicarea testului Breusch-Godfrey s-a realizat utilizând pachetul de
programe EViews (presupunând ca mărimea decalajului este p = 2): Breusch-Godfrey Serial Correlation LM Test:
F-statistic 16,6537 Probability 0,0007 Obs*R-squared 10,7673 Probability 0,0046
Test Equation: Dependent Variable: RESID Method: Least Squares
Variable Coefficient Std. Error t-Statistic Prob. C 166,6378 146,9445 1,1340 0,2832 X -0,2158 0,1935 -1,1154 0,2908
RESID(-1) 1,0098 0,2999 3,3669 0,0072 RESID(-2) -0,0880 0,3298 -0,2667 0,7951
R-squared 0,7691 Mean dependent var -3,45E-14 Adjusted R-squared 0,6998 S.D. dependent var 61,8319 S.E. of regression 33,8769 Akaike info criterion 10,1183 Sum squared resid 11476,43 Schwarz criterion 10,3009 Log likelihood -66,8281 F-statistic 11,1025 Durbin-Watson stat 1,4994 Prob(F-statistic) 0,0016
Modele econometrice
În cazul utilizării pachetului de programe EViews există două
variante de aplicare a testului Breusch-Godfrey: - utilizarea testului Fisher–Snedecor aplicat în vederea verificării
existenţei unor variabile absente (omise) în model, având următoarea relaţie de calcul:
( ) ( )mnRpRFc −−
= 2
2
1
unde:
p = numărul de variabile noi adăugate în model, respectiv ut-1, ut-2,…, ut-
p ; m = numărul total de parametri corespunzători noului model.
Dacă , unde v1 = p şi v2 = n-m, ipoteza conform căreia
estimatorii corespunzători noilor parametri adăugaţi în model sunt nuli este verificată, respectiv, în cazul nostru, fenomenul de autocorelare a erorilor nu este prezent, cazul contrar implicând existenţa cel puţin a unei autocorelaţii de ordinul întâi. Cum
21;; vvc FF α<
10,46537,16 10;2;05,0 =>= FFc , rezultă că noul model
este incorect specificat, indicând astfel prezenţa unei autocorelaţii de ordinul întâi.
- utilizarea testului LM, calculat ca produs între numărul de observaţii corespunzătoare modelului, n, şi coeficientul de determinare, R2, corespunzător acestei regresii auxiliare. În general, testul LM este asimptotic distribuit sub forma unui χ , pentru care numărul gradelor de libertate este
egal cu:
2;vα
pv = , unde p = mărimea decalajului, respectiv:
2RnLM ⋅= ~ χ 2;vα
Dacă >LM χ , erorile sunt autocorelate, în caz contrar, sunt
independente, respectiv ipoteza nulităţii parametrilor,
2;vα
021 == rr , este
Modelul unifactorial
acceptată. Se constată astfel că pachetul de programe nu utilizează relaţia clasică de calcul a testului Breusch-Godfrey, respectiv: BG = (n-p)·R2.
Deoarece χ , aceasta implică existenţa
a cel puţin unei autocorelaţii de ordinul întâi, ce poate fi remarcată şi pe baza semnificaţiei parametrului corespunzător valorii decalate cu o perioadă a variabilei reziduale.
>= 7673,10LM 99147,522;05,0 =
În cazul calculării în varianta clasică a testului Breusch-Godfrey, respectiv: >=⋅= 2291,97691,012BG χ , se ajunge la aceleaşi
concluzii menţionate anterior.
99147,522;05,0 =
Eliminarea fenomenului de autocorelare a erorilor presupune efectuarea următoarelor operaţii:
- erorile fiind corelate, adică:
( )u r u zt t= +−1 1 t (1)
se va estima valoarea coeficientului de autocorelaţie de ordinul 1:
( ) 89,09481,45576327,40461
ˆ
ˆˆ
14
2
21
14
21
1 ===
∑
∑
=−
=−
tt
ttt
u
uur
(vezi tabelul 2.3.2., coloanele 6, 7, 8)
- ştiind că: y a bx u u y a bxt t t t t= t+ + ⇒ = − − y a bx u u y a bxt t t t t− − − − −= + + ⇒ t−= − −1 1 1 1 1 1
− − = − − +− −1 1 1
expresiile obţinute pentru şi vor fi înlocuite în relaţia (1) şi se obţine:
ut ut−1
( ) ( )y a bx r y a bx zt t t t t
( ) ( )( ) ( )( )y r y a r b x r x zt t t t− = − + − +− −1 1 1 1 11 t
Modele econometrice
Notând cu: ( )y y r yt t t* = − −1 1
( )x x r xt t t* = − −1 1
( )( )a a r1 11= −
b b1 =
se obţine:
*11
**11
* ˆˆˆ ttttt xbayzxbay +=⇒++= (2)
În vederea estimării parametrilor şi se aplică M.C.M.M.P.: $a1$b1
( ) (∑=
−−=14
2
2*11
*11
ˆˆminˆ,ˆt
tt xbaybaF )
( ) ( )′ = ⇒ − + =∑ ∑F a n a b x yt t1 1 10 1 $ $ * *
( ) ( )′ = ⇒ + =∑ ∑∑F b a x b x y xt t1 1 1
20 $ $* *
t t* *
În urma aplicării programului EViews, rezultatele estimării noului
modelului au fost următoarele: Dependent Variable: *
tyMethod: Least Squares Sample: 1991 2003 Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 9,5845 15,4322 0,6211 0,5472 *tx 0,7156 0,1645 4,3505 0,0012
R-squared 0,6324 Mean dependent var 68,5423 Adjusted R-squared 0,5990 S.D. dependent var 42,0350 S.E. of regression 26,6176 Akaike info criterion 9,5417 Sum squared resid 7793,4860 Schwarz criterion 9,6286 Log likelihood -60,0208 F-statistic 18,9270 Durbin-Watson stat 1,7216 Prob(F-statistic) 0,0012
Modelul unifactorial
Ca şi în cazul modelului iniţial se vor calcula valorile estimate ale
variabilei , şi ale variabilei reziduale,
. Valorile acestora sunt prezentate în cadrul tabelului 3.5.4
(utilizând pachetul de programe EViews).
*ty ** 7156,05845,9ˆ tt xy +=⇒
** ˆˆ ttt yyz −=
Tabelul 3.5.4
Actual *ty
Fitted *ˆ ty
Residual ** ˆˆ ttt yyz −=
Residual Plot (graficul reziduurilor)
-27,7030 -1,0121 -26,6909 | * | . | 17,1616 22,4810 -5,3194 | . *| . | 52,2995 71,6530 -19,3535 | .* | . | 60,3260 84,3593 -24,0332 | * | . | 108,2056 103,8374 4,3682 | . |* . | 97,1156 92,9857 4,1299 | . |* . | 41,2501 38,8790 2,3711 | . * . | 119,5053 44,1907 75,3147 | . | . *| 59,3959 60,7715 -1,3755 | . * . | 67,5776 76,7461 -9,1686 | . *| . | 93,7582 96,8106 -3,0525 | . *| . | 86,9458 97,5276 -10,5818 | . * | . | 115,2111 101,8196 13,3914 | . | * . |
Pe baza calculelor prezentate mai sus rezultă modelul:
( ) ( )6176,26
72,11645,04322,15795,0;7156,05845,9ˆ
ˆ
**
==′=′+=
z
tt
sdRxy
(3)
Utilizând testul Durbin-Watson pentru a verifica dacă fenomenul de
autocorelaţie a fost eliminat - pentru un prag de semnificaţie 1513,1,05,0 ≅=== nkα valorile teoretice ale variabilei Durbin-Watson
sunt . În comparaţie cu acestea, valoarea empirică
se situează astfel:
36,1,08,1 21 == dd
72,1=′d 64,2472,136,1 22 =−<=′<= ddd , ceea ce indică fenomenul de independenţă a erorilor, deci fenomenul de autocorelaţie a fost eliminat.
Modele econometrice
Verificarea ipotezei de homoscedasticitate a erorilor în cazul acestui model se va realiza cu ajutorul testului White. Utilizând programul EViews au fost obţinute următoarele rezultate: White Heteroskedasticity Test:
F-statistic 0,8259 Probability 0,4656 Obs*R-squared 1,8430 Probability 0,3979
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Sample: 1991 2003 Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 927,8680 1016,2720 0,9130 0,3827 *tx 18,3437 32,0687 0,5720 0,5799
2*tx -0,2090 0,2342 -0,8925 0,3931
R-squared 0,1418 Mean dependent var 599,4989 Adjusted R-squared -0,0299 S.D. dependent var 1542,118 S.E. of regression 1564,9870 Akaike info criterion 17,7483 Sum squared resid 24491851 Schwarz criterion 17,8787 Log likelihood -112,3641 F-statistic 0,8259 Durbin-Watson stat 2,7426 Prob(F-statistic) 0,4656
Analizând rezultatele afişate de programul EViews se constată că
10,48259,0 10;2;05,0 =<= FFc şi <= 843,1LM χ , iar estimatorii parametrilor modelului sunt nesemnificativi pentru un prag de semnificaţie
99147,522;05,0 =
05,0=α ( 228,210;05,0 =t ), deci ipoteza de homoscedasticitate se verifică.
Estimatorii modelului sunt semnificativ diferiţi de zero dacă:
( ) 11;ˆ
1
11ˆ
ˆ−−−≥= kn
a
tsa
ta α
Modelul unifactorial
6211,04322,155845,9
1ˆ==
at
( ) 11;ˆ
1
ˆ
1
1
ˆ−−−≥= kn
bb
ts
bt α
3505,41645,07156,0
1ˆ==
bt
Lucrând cu un prag de semnificaţie α ( )05,0=α , din tabela distribuţiei Student se preia valoarea 201,211;05,0 =t . Comparând această
valoare cu valorile calculate pentru cei doi estimatori, se constată că:
- ⇒=<= 201,26211,0 11;05,01ˆtt
a parametrul nu este semnificativ
diferit de zero;
$a1
- ⇒=>= 201,23505,4 11;05.01ˆ
ttb
parametrul este semnificativ
diferit de zero.
$b1
Raportul de corelaţie este semnificativ diferit de zero dacă se verifică inegalitatea: , unde valoarea empirică a variabilei
Fisher-Snedecor este:
F Fc v≥ α ; ;1 2v
( )( ) 9615,53319,01
3319,0*111
21 2
2
=−
=−
−−=R
RnFc
Din tabela distribuţiei Fisher-Snedeckor, cu un prag de semnificaţie de 5% şi în funcţie de numărul gradelor de libertate şi
se preia valoarea teoretică . Se
constată că
v k1 1= =
( ) 11112 =−−−= knv 84,411;1;05,0 =F
84,49615,5 11;1;05,0 =>= FFc , deci pentru un prag de
semnificaţie de 5%, valoarea raportului de corelaţie este semnificativ diferită de zero.
Modele econometrice
În concluzie, modelul poate fi apreciat ca
reprezentativ pentru descrierea dependenţei dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real.
** 7156,05845,9ˆ tt xy +=
O altă variantă a metodei de eliminare a fenomenului de autocorelare
a erorilor prezentate mai sus constă în determinarea coeficientului de autocorelaţie de ordinul 1 pe baza variabilei Durbin-Watson, d, pentru a facilita utilizarea pachetului de programe EViews în vederea eliminării autocorelaţiei erorilor (utilizând programul autocorelaţie.prg):
( ) 90,0220,01
211 =−=−=
dr
Rezultatele estimării modelului (2), utilizând pachetul de programe
EViews3, sunt următoarele: Dependent Variable: DY Method: Least Squares Sample(adjusted): 1991 2003 Included observations: 13 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 10,1602 13,8505 0,7336 0,4786 DX 0,7083 0,1628 4,3506 0,0012
R-squared 0,6325 Mean dependent var 61,2087 Adjusted R-squared 0,5990 S.D. dependent var 41,9044 S.E. of regression 26,5346 Akaike info criterion 9,5354 3 Pentru a elimina autocorelaţia erorilor cu ajutorul pachetului de programe EViews a fost
utilizat următorul program (conform http://www.cip.dauphine.fr/bourbonnaise/eco.html) denumit autocorelatie.prg:
Estimarea directa a coeficientului de autocorelatie notat cu rau plecand de la statistica DW' Equation eq1.ls y c x genr res = resid scalar rau1=1-@dw/2 genr dy=y-rau1*y(-1) 'Se genereaza qvasi-diferentele.' genr dx=x-rau1*x(-1) equation eqm1.ls dy c dx 'Régresie denumita eqm1' scalar am1=c(1)/(1-rau1) 'Coef de reg.'
Modelul unifactorial
Sum squared resid 7744,9060 Schwarz criterion 9,6223 Log likelihood -59,9802 F-statistic 18,9279 Durbin-Watson stat 1,75 Prob(F-statistic) 0,0012
Valorile estimate ale variabilei şi ale variabilei reziduale,
sunt prezentate în cadrul tabelului 3.5.5 (utilizând pachetul de
programe EViews).
*ty
** ˆˆ ttt yyz −=
Tabelul 3.5.5
Actual *ty
Fitted *ˆ ty
Residual ** ˆˆ ttt yyz −=
Residual Plot (graficul reziduurilor)
-35,2893 -8,5948 -26,6945 | * | . | 10,8036 15,7300 -4,9263 | . *| . | 46,4217 65,0361 -18,6144 | .* | . | 54,3965 77,5139 -23,1174 | * | . | 102,1210 96,5348 5,5862 | . |* . | 90,2420 85,3011 4,9410 | . |* . | 33,8270 31,4535 2,3735 | . * . | 112,3543 37,1813 75,1730 | . | . *| 51,4219 53,9395 -2,5176 | . * . | 59,6906 69,8356 -10,1449 | . * | . | 85,8372 89,5554 -3,7182 | . *| . | 78,6385 89,8700 -11,2314 | . * | . | 106,6535 93,7580 12,8955 | . | * . |
Pe baza calculelor prezentate mai sus rezultă modelul:
( ) ( )5346,26
75,11628,08505,13795,0;7083,01602,10ˆ
ˆ
**
==′=′+=
z
tt
sdRxy
(4)
Utilizând testul Durbin-Watson pentru a verifica dacă fenomenul de
autocorelaţie a fost eliminat - pentru un prag de semnificaţie 1513,1,05,0 ≅=== nkα valorile teoretice ale variabilei Durbin-Watson
Modele econometrice
sunt . În comparaţie cu acestea, valoarea empirică
se situează astfel:
36,1,08,1 21 == dd
75,1=′d 64,2475,136,1 22 =−<=′<= ddd , ceea ce indică fenomenul de independenţă a erorilor, deci fenomenul de autocorelaţie a fost eliminat.
Verificarea ipotezei de homoscedasticitate a erorilor în cazul acestui model se va realiza cu ajutorul testului White. Utilizând programul EViews au fost obţinute următoarele rezultate: White Heteroskedasticity Test:
F-statistic 0,8302 Probability 0,4639 Obs*R-squared 1,8512 Probability 0,3963
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Sample: 1991 2003 Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 1108,2070 824,2150 1,3446 0,2085 *tx 13,6436 26,6751 0,5115 0,6201 2*
tx -0,2067 0,2293 -0,9013 0,3886
R-squared 0,1424 Mean dependent var 595,7620 Adjusted R-squared -0,0291 S.D. dependent var 1535,4140 S.E. of regression 1557,6090 Akaike info criterion 17,7389 Sum squared resid 24261469,0 Schwarz criterion 17,8692 Log likelihood -112,3026 F-statistic 0,8302 Durbin-Watson stat 2,7474 Prob(F-statistic) 0,4639
Analizând rezultatele afişate de programul EViews se constată că
10,48302,0 10;2;05,0 =<= FFc şi <= 8512,1LM χ , iar
estimatorii parametrilor modelului sunt nesemnificativi pentru un prag de semnificaţie
99147,522;05,0 =
05,0=α ( 228,210;05,0 =t ), deci ipoteza de homoscedasticitate
se verifică.
Modelul unifactorial
Pentru a verifica semnificaţia estimatorilor parametrilor modelului, lucrând cu un prag de semnificaţie α ( )05,0=α , din tabela distribuţiei Student se preia valoarea 201,211;05,0 =t . Comparând această valoare cu valorile calculate pentru cei doi estimatori, se constată că:
- ⇒=<= 201,27336,0 11;05,01ˆtt
a parametrul nu este semnificativ
diferit de zero;
$a1
- ⇒=>= 201,23506,4 11;05.01
ttb
parametrul este semnificativ
diferit de zero.
$b1
Pentru a verifica semnificaţia raportului de corelaţie, din tabela distribuţiei Fisher-Snedecor, cu un prag de semnificaţie de 5% şi în funcţie de numărul gradelor de libertate v k1 1= = şi ( ) 11112 =−−−= knv se preia valoarea teoretică 84,411;1;05,0 =F . Se constată că
, deci pentru un prag de semnificaţie de 5%, valoarea raportului de corelaţie este semnificativ diferită de zero.
84,49279,18 11;1;05,0 =>= FFc
În concluzie, şi acest model, , poate fi apreciat ca reprezentativ pentru descrierea dependenţei dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real.
** 7083,01602,10ˆ tt xy +=
c) Analiza capacităţii de prognoză a modelului privind dependenţa dintre dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real în România în perioada 1981-2003 poate fi realizată pe baza indicatorilor statistici propuşi de H. Theil.
Aceşti indicatori, adaptaţi modelui supus analizei, au fost calculaţi pe baza următoarelor relaţii:
• coeficientul Theil
( )
∑∑
∑
==
=
+
−=
n
tt
n
tt
n
ttt
yn
yn
yyn
T
1
2*
1
2*
1
2**
1ˆ1
ˆ1
ale cărui valori sunt cuprinse în intervalul [0, 1]. Semnificaţia acestui indicator este invers proporţională cu mărimea
lui, respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu atât capacitatea de prognoză a modelului este mai bună.
Modele econometrice
• ponderea abaterii
( )2
1
ˆ z
ttt yy
nσ
−∑=
unde:
2**
2** ˆˆ
Ayyyy ⎟⎠⎞⎜
⎝⎛ −⎟
⎠⎞⎜
⎝⎛ −
2**1 nT ==
=*
y media valorilor teoretice ale variabilei endogene;
=*
y media valorilor reale ale variabilei endogene; ărul gradelor de
libertate.
sistematta t estimare de-a lungul întregii
serii de
=2zσ dispersia variabilei reziduale necorectată cu num
Interpretarea acestui indicator, care evidenţiază existenţa unor erori ice, este aceea că, în cazul ideal∗, valoarea sa este egală cu zero, inzând către unu în cazul unor erori deaceas
timp. • ponderea dispersiei
( )( )
2
2⎤⎡
1
2**
1
2**
1
2**
1ˆˆ1
ˆ1 z
n
tt
n
tt
n
ttt
yyn
yyn
yyn
Tσ
⎥⎥
⎦
⎢ ⎟⎠⎞⎜
⎝⎛ −−⎟
⎠⎞⎜
⎝⎛ −
−
∑∑
∑==
=
care este definită tot în intervalul [0, 1], aceasta măsurând evoluţia oscilantă a celor două serii, respectiv seria ajustată şi seria empirică a variabilei
şi semnificaţie ca şi cei precedenţi,
2ˆ ** yyD tt
σσ ⎢⎣=
−=
endogene. Acest indicator are aceearespectiv o valoare scăzută indică o capacitate bună de prognoză, în timp ce o valoare apropiată de unu exprimă o eroare de specificare a modelului.
• ponderea covarianţei
( )
( )∑ − tt yyn
2**ˆ1
−= n
yyCr
T ttˆ12 **σσ
=t 1
∗ Demn de menţionat este faptul că, în cazul estimării parametrilor unui model statistic cu ajutorul
metodei celor mai mici pătrate, valoarea acestui indicator este egală cu zero, acesta fiind discriminant numai în cazul utilizării altor procedee de estimare cum ar fi, de exemplu, metoda grafică, metoda punctelor empirice sau metoda punctelor medii.
Modelul unifactorial
unde: r = coeficientul de co el ie liniară dintre valoarea estimată a variabilei
endogene, , şi cea reală : r aţ
*ˆty , *ty
( )( )**ˆ tt yy
rσ
1
**** ˆˆn
ttt
n
yyyy
σ
∑=
Se poate observa uşor că semnificaţia acestui indicator este analogă cu a celor menţionaţi anterior.
De altfel cei patru indicatori se regăsesc în următoarea ecuaţie ropus
−−=
p ă de Theil:
( ) (21 n ) ( ) **** ˆˆ**
1
** 12ˆˆttttt yyyy
tt ryyyy
nσσσσ −+⎟
⎠⎞⎜
⎝⎛ −+−=−∑
22
=
cărei interpretare se realizează prin intermediul semnificaţiei acestor indicatori.
În urma calculelor efectuate cu ajutorul pachetului de programe
6 De
a
EViews în vederea testării capacităţii de prognoză a modelului privind dependenţa dintre dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real în perioada 1981-2003 au rezultat următoarele informaţii:
Rezultatele testării capacităţii de prognoză a modelului privind dependenţa dintre consumul final real al gospodăriilor populaţiei
şi PIB-ul real în România în perioada 1981-2003
Tabelul 3.5.numirea indicatorului Simbolul indicatorului Valoarea indicatorului
0 1 2 Coeficientul Theil 0,15T 77 Ponderea abaterii TA 0,0000 Ponderea dispersiei TD 0,1140 Ponderea c rianţei 0,8 0 ova TC 86
nalizei rezultatelor o ă că l posedă o de prognoză, ca urmare a valorilor mic strate în ca Theil, a ponderii terii şi a covarianţe ci, poate
În urma a bţinute se constat modelu bună capacitate i înregizul coeficientului aba i şi, de
Modele econometrice
fi acceptat în vederea realizării unei prognoze a consumului final real al gospod
l modelului (3) este egală cu:
abile e baza ipotezei formulate la punctele precedente, consumul final
real al gospodăriilor populaţiei, y*, urmează o distribuţie no u ă
ăriilor populaţiei. Astfel, dacă valoarea PIB-ului real în anul 2004 a fost egală cu 907,8
mild. lei preţuri comparabile (1990=100), atunci:
8388,907* −=x 6272,16389,03,2004 =⋅ mild. lei preţuri comparabile Valoarea estimată a consumului final real al gospodăriilor populaţiei
în anul 2004, utilizând rezultatele estimării obţinute în cazu
676,1266272,1637156,05845,9ˆˆˆ *200411
*2004 =⋅+=+= xbay mild.lei
preţuri comparP
rmală (sadistribuţia Student, dac n ≤ 30 ), de medie şi de abatere m*
2004y edie
pătratică *2004y
s , ( ) ( )*2004ˆ
*2004
* ,ˆy
syNyL = .
Pentru 676,126ˆ6272,163 *
2004*2004 == yx ⇒
( )( )
( )
6848,30
7452,261863893,826272,163
13114988,70811
*2004
*2004
ˆ
2
2**
2**20042
ˆ
=
⎟⎟⎠
⎞⎜⎜⎝
⎛ −++⋅=⎟
⎟
⎠
⎞
⎜⎜
⎝
⎛
−
−+′
+=∑
y
t
zy
s
xx
xxn
ss
Estimarea consumului final real al gospodăriilor populaţiei, pe baza
unui interval de încredere, se calculează cu relaţia:
( ) ααα *2004
*2004 ˆ20042004ˆ2004 yy
−=+≤≤− 1ˆˆ *** styystyP
Pentru 05,0=α şi 111=−−= knv201,211;05,0;
, din tabela distribuţiei Student se preia valoarea variabilei == tt vα .
Modelul unifactorial
Deci, cu de ,05 sau cu o probabilitate egală cu 0,95, valoarea estimată a
un prag semnificaţie de 0consumului final real al gospodăriilor populaţiei
omâniei în anul 2004 va fi cuprinsă în intervalul: R
[ ]( ) 95,005,016848,30201,2676,126*2004 =−=⋅±∈yP
[ ]( ) 95,021,194;14,59*2004 =∈yP