Met Hulumtuese L09 Metodat Kuantitative-OLS, Probit, Tobit etc · Qëllimiiligjëratës •...

36
1 (Master) Ligjerata 9 Metodologjia hulumtuese Metodat kuanitative në hulumtimet shkencore (disa modele ekonometrike) Prof.asc. Avdullah Hoti

Transcript of Met Hulumtuese L09 Metodat Kuantitative-OLS, Probit, Tobit etc · Qëllimiiligjëratës •...

1

(Master)

Ligjerata 9

Metodologjia hulumtuese

Metodat kuanitative në hulumtimet shkencore

(disa modele ekonometrike)

Prof.asc. Avdullah Hoti

Literatura1. Gujarati, D. (2005) Essentials of Econometrics,

McGraw Hill Higher Education.

2. Studenmund, A. (2001): Using Econometrics: A

practical Guide; Addison Wesley, Longman, Inc.

3. Verbeek, M. (2004): A guide to modern

econometrics; John Wiley & Sons LTD, Chichester

4. Wooldridge, J. (2006): Introductory econometrics: A

modern approach; Thompson South-Western, 3rd

edition, Mason, Ohio

2

Qëllimi i ligjëratës

• Specifikat e vlerësimit kuantiativ të dukurive

• Aplikimi i modeleve kuantitative në kërkime

• Modelet kryesore ekonometrike nëhulumtimet kuantitative– OLS

– Probit

• Njoftim me disa modelet të tjera ekonometrike– Tobit model

– Ordered Probit

– Unordered Probit

– Interval regression models

Regresionet ekonometrike

• Ekonometria - verifikim empirik i teorisë

• Pse të studiojmë ekonometrinë?

– Vlerësimi kuantitativ i hipotezave

– Identitikimi dhe kuantifikimi i efekteve/lidhjeve në mes të

dukurive

– Shumë e fuqishme për predikime (inference)

• Për shembull: Parashikimi i efektit të barit X në kurimin e sëmundjes Y

• Ekonometria shërbehet nga:

– Teoria: definimi i hipotezave

– Matematika: definimi matematikor i lidhjes së

variablave

– Statistika: lidhjet statistikore në mes të variblave

Metodologjia ekonometrike

Procedura standarde:1. Teoria

2. Të dhënat

3. Specifikimi i modelit matematik

4. Specifikimi i modelit ekonometrik

5. Vlerësimi i parametrave

6. Testimi sa adekuat është modeli

7. Testimi i hipotezave

8. Shfrytëzimi i rezultateve

Metodologjia ekonometrike: Teoria

• Formulimi i hipotezave

• Shembull:

– Pyetja hulumtuese:

• A ndikon arsimi në nivelin e pagës?

– Hipoteza:

• Arsimi ndikon pozitivisht në nivelin e pagës

• Diskutim për 5 minuta

– Mendoni për pyetjet e juaj hulumtuese dhe ktheni ato në

hipoteza

6

Metodologjia ekonometrike:

Sigurimi i të dhënave

• Llojet e të dhënave:

– Të dhëna primare (anketat, intervistat)

– Sekondare (raporte, internet, etj.)

– Të dhëna kuantitative: çmimet, të hyrat, shpenzimet, etj.

– Të dhëna kualitative: gjinia, statusi martesor, shkollimi etj.

– Regjistrimet (census)

• Problem: Mostra adekuate

– Gjithmonë sigurohuni që të dhënat vijnë nga një mostër adekuate

– Cila është mostra adekuate?

• Ajo mostër që më së miri i përfaqëson cilësitë dhe tiparet e popullacionit

7

Metodologjia ekonometrike: Specifikimi i

modelit matematik• Paraqitja e variablave në diagrame për të zbuluar lidhjen

statistikore në mes tyre

– Lidhje pozitive: me rritjen e nivelit të arsimit rritet edhe paga

• Parametrat:β1 = konstantja që tregon pagën nëse personi nuk ka arsim.

β2 = pjerrësia që tregon normën e ndryshimit të pagës për një njësi ndryshimi në nivelin e arsimit

• Shenja e parametrave:

(+) me rritjen e nivelit të arsimit rritet paga mesatare

(-) me rritjen e nivelit të arsimit bie paga mesatare

• Shenja e pritur derivohet nga teoria

– Çfarë thotë hipoteza në rastin konkret?

• (arsimi ndikon pozitivisht në pagë, prandaj shenja e pritur është pozitive)

ArsimiPaga21

ββ +=

8

Metodologjia ekonometrike: Specifikimi i

modelit matematik

• Konstantja:

– Zakonisht nuk ka kuptim ekonomik

– është një ‘grumbullues mbeturinash’ si rezultat i

mospërfshirjes së faktorëve tjerë në model

– Tregon mesataren e variables se varur kur faktoret e

tjere kane vleren zero.

9

Metodologjia ekonometrike:

Specifikimi i modelit ekonometrik

• Përveç arsimit, ka edhe forca të tjera që përcaktojnë pagën

• Prandaj specifikohet modeli:

• ‘μ’ lejon ndikimin e faktorëve të tjerë në pagë:– përfshin të gjitha forcat e tjera që mund të ndikojnë në madhësinë e pagës, e që nuk janë

përfshirë në model,

– gabimet ne matje

– Si dhe faktorët e tjerë që nuk mund të shpjegohen (sjellja e njeriut është jo gjithmonë e parashikuar).

• Në model:– Në anën e majtë: variabla e varur

– Në anën e djathtë: variablat shpjeguese (të pavarura)

• Por, kjo nuk nënkupton shkakun - duhet mbështetur me teori

iii ArsimiPaga µββ ++=21

10

Metodologjia ekonometrike: Të dhënat

11

Metodologjia ekonometrike:

Vlerësimi i parametrave (1)• Pas regresionit kemi:

• Definimi i njësisë matëse të vairablave:Paga = paga mesatare e shprehur në Euro për një orë punë.

Arsimi = i matur me vitet e arsimit të kryera

• Interpretimi i parametrave të modelit: β2 = 0.55 Nëse niveli i arsimit rritet për një vit, në mesatare

paga për orë rritet për 0.55 Euro

Shenja ‘+’ nënkupton efekt pozitiv të arsimit në pagë

β1 = 1.5 Nëse punëtori është pa arsim, paga mesatare

për orë pune është 1.5 Euro.

ArsimiPaga 55.05.1 +=

12

Metodologjia ekonometrike: Vlerësimi i

parametrave (2)

Tri çështje me interes në diskutimin e parametrave:

1. Drejtimi i ndikimit të variablës së pavarur në atë të varur:

– Shiko shenjën e koeficientit: pozitiv/negativ

– Bazohu në teori (hipotezat e ngritura)

2. A ka ‘Arsimi’ ndikim statistikisht signifikant në ‘Pagë’?

– Duhet parë ‘t-statistics’ të koeficientit të arsimit në regresion

– ‘t-statistics’ = vlera e koeficientit / devijimi standard

– Nëse ‘t-statistics’≥|2| atëherë ‘Arsimi’ ka ndikim signifikant në ‘Pagë’

• Në këtë rast: refuzo H0: β2 = 0 (Arsimi nuk ka ndikim në nivelin e pagës)

3. Madhësia e ndikimit të variablës së pavarur në atë të varur

përcaktohet nga:

– madhësia e koeficientit

13

Signifikanca: Ndikimi i variablave

shpjeguese në variablën e varur

• Hipoteza zero (null hypothesis)– hipoteza të cilën nuk e dëshiron hulumtuesi

• Hipoteza alternative (alternative hypothesis)– hipoteza për vlerat e dëshiruara nga hulumtuesi

• Gabimi i llojit të parë (Type I error)– refuzon hipotezën kur është e saktë

• Gabimi i llojit të dytë (Type II error)– nuk refuzon hipotezën që nuk është e saktë

• T-statistic: nëse është ≥2 në vlerë absolute– refuzo Ho se parametrat βs=0

• P-values (probability values): niveli i saktë i signifikancës– tregon nivelin më të ulët të signifikancës në të cilën mund të

refuzojmë Ho

– për të refuzuar Ho kërkohen vlera sa më të ulta të ‘p-values’

(1,5 dhe 10%).

– Tregon fuqinë relative me të cilën mund të refuzojnë Ho

• Niveli i signifikancës prej 10% nënkupton se vetëm në

10% të rasteve hipoteza zero do të ishte e vërtetë.

15

16

• Modelet pa konstante

– Regresioni nga origjina (pa konstante) shembull: nëse të hyrat janëzero (x) atëherë tatimi në të ardhura (y) është zero.

– Megjithatë rregull mos elimino konstantenedhe nëse teoria sygjeron ngase:

•Mbivlerëson vlerat e parametrave tëtjerë dhe i tregon signifikante edhe kurrnuk janë.

• Standard errors (s.e.): udhëzojnë se sa tësakta vlerësimet janë: me rritjen e numrit tëobservimeve s.e. jane më të vegjël d.m.th mëpreciz janë koeficientët e vlerësuar.

Metodologjia ekonometrike:

Specifikimi i modelit

• Por, sa adekuat është modeli në shpjegimin e lidhjes në mes

të pagës dhe nivelit arsimor?

– Ka edhe variabla tjera që ndikojnë në pagë

• Kalimi prej regresionit të thjeshtë në atë të shumëfishtë.

• Ky model implikon vlenë brenda parimit ‘ceteris paribus’:

1. duke mbajtur konstant nivelin e arsimit,

• me rritjen e përvojës në punë për një vit, në mesatare paga për një orë

pune rritet për 0.10 njësi (Euro).

2. duke mbajtur konstant përvojën në punë

• me rritjen e nivelit të arsimit për një vit, në mesatare paga për një orë

pune rritet për 0.40 njësi (Euro).

PervojaArsimiPaga 10.040.05.1 ++=

17

Metodologjia ekonometrike: Testimi i hipotezave (1)

• A është i pranueshëm ky model?

• A janë rezultatet në pajtueshmëri me teorinë?

– Shikoni shenjën e koeficientëve

• Cilin model duhet përdorur? • Të thjeshtë apo të shumfishtë?

• Koeficienti i determinacionit R2

• Sa më shumë variabla në ekuacion, koeficioni është

më i lartë

• Por, multikolineariteti në mes të variablave të pavarura

– Shembulli i arsimit me pagën

18

KOEFICIENTI I DETERMINACIONIT

� Tregon se sa mirë vija e regresionit i përshtatet vlerave aktuale të variablëssë varur.

TSS = variacioni i vlerave aktuale të Y nga mesatarja

ESS = shpjeguar nga variablat shpjeguese

RSS = pjesa e pashpjeguar e variacionit të vlerave të Y në vijën

e regresionit

TSS=ESS+RSS

R2 = ESS / TSS

� R2 merr vlera në mes 0 dhe 1Sa më afër 1, ndryshimi në variablën e varur shpjegohet më mirë me

modelin e zgjedhur

� Në shembullin e pagës:R2 = 0.86

Spjegimi: variablat e arsimit dhe përvojës në punë shpjegojnë rreth 86% tëvariacionit të pagës.

Metodologjia ekonometrike: Testimi i hipotezave (2)

Metodologjia ekonometrike: Shfrytëzimi i rezultateve

• Testimi i teorisë

• Parashikimi– Sa do të ishte paga mesatare për orë pune duke ditur

nivelin e arsimit dhe përvojën në punë.

• Propozimi i politikave/masave

• Por: Cetersi paribus– Nënkupton mbajtjen fiks të faktorëve tjerë

20

Dy modele që përdoren më së shpeshti

• Regresioni OLS:

– metoda e katrorëve më të vegjël

• Probit/Logit

21

Modeli OLS

22

OLS

µββ ++=121

XY

23

• OLS përdoret kur variabla e varur (Y) është:

– sasiore dhe

– vazhduese

• Regresioni i thjeshtë (një faktorë)

• Regresioni i shumëfishtë (shumë faktorë)µβββ +++=

22!21XXY

OLS: Variablat dummy (1)• Disa variabla të pavarura mund të jenë

‘Variablat dummy’– kategorike, binare, kualitative.

• Tregojnë praninë ose mospraninë e një ‘kualiteti’

• Kuantifikimi i efektit të këtyre variablave përmes krijimit të një variable ‘dummy’ që merr vlerën:

0 = mungesën e atij atributi (mashkull; papunësuar)

1= praninë e atij atributi (femër; punësuar)

• Shembulli i ekuacionit të pagës:– Shtimi edhe i këtyre karakteristikave që përcaktojnë

pagën:• Sektori industrial

• Qyteti

• Anëtarësimi në sindikatë

OLS: Variablat dummy (2)

• Futja e variablave dummy në regresion - vlenë rregulli:

– Nëse variabla kuantiative ka m kategori, atëherë në

regresion futen m-1 kategori:

• Shembull:

– Gjinia: 2 kategori (mashkull/femër), në regresion futet 1 kategori

– Sektorët: 3 kategori (tregti, prodhim, shërbime) në regresion 2 prej

kategorive

– Katëgoria që nuk hyn në regresion: kategoria bazë;

referencë; kontrolluese; krahasuese.

OLS: Shembull me vairablat dummy

• Vlerësimi i ‘Pagës së profesorit’Y= paga vjetore e një profesori (në mijëra euro)

Di=1 nëse profesori është mashkull

Di=0 nëse është femër

• Vlerësimi i ‘Shtypjes së gjakut’Y= niveli i shtypjes së gjakut (në njësi matëse)

Di=1 nëse personi konsumon produktin X

Di=0 nëse personi nuk konsumon produktin X

• Rezultatet (për pagën e profesorit): • Paga mesatare vjetore për femra është 18,000 euro

• Ndërsa e meshkujve për 3,280 euro më ë lartë = 21, 280 euro

• Paga mesatare për femra është më e vogël se e meshkujve.

iii DY µββ ++=21

ii DY 28.300.18 +=

26

Modeli Probit

Modeli Probit: Kur përdoret?• Variabla e varur si variabël dummy

• Përdoret për të spjeguar probabilitetin që një ngjarje të ndodhë

• Shembuj: Matja e probabilitetit për:- të qenit i punësuar

- për të investuar

- paraqitjen e fatalitetit tek personat me sëmundjen X

- paraqitjen e një sëmundjeje

Modeli Probit: Probabiliteti• Hudhja e parasë: probabiliteti për të rënë koka

ose pjesa e pasme:

– koka/totali i mundësive = 1/2

• Nëse hedhim një domino:

– Mundësia për të qëlluar 1 është 1/6, për të qëlluar 2

është 1/6 e kështu me radhë

• Probabiliteti është gjithmonë pozitiv dhe sillet

prej 0 (nuk ka gjasë të ndodhë) deri në 1 (ngjarja

ndodh me siguri të plotë)

Modeli probit: Specifikimi empirik

iiXY 1021.09457.0 +−=

Y = 1 nëse familja ka shtëpi private

= 0 nëse familja nuk ka shtëpi private

X = të ardhurat familjare (në mijëra euro)

β1 = -0.9457 tregon ‘probabilitetin’ që familja të ketë shtëpi kur tëardhurat e saj janë zero. Pasi probabiliteti nuk mund të jetënegativ atëherë e trajtojmë këtë vlerë si zero.

β2 = 0.1021 tregon se për një njësi ndryshimi (kur të ardhurat e familjes rriten për 1,000 euro) probabiliteti që familja të ketështëpi rritet për 0.1021 ose për 10.21%.

P.sh. Familja me të ardhura mesatare prej 12,000 (pra X=12) ka probabilitet probabilitet për të pasur shtëpi prej:-0.9457+12(0.1021)=0.2795=28% për të pasur shtëpi

iii XY µββ ++=21

30

Modelet e tjera ekonometrike

31

Modelet e tjera ekonometrike: Tobit

• Tobit:

– Parashikimi i shpenzimeve qeveritare për ilaçe të

diabetit gjatë 3 viteve të ardhshme:

• Shpenzimet për ilaçe të diabetit të të gjithë personave

– Së pari matet probabiliteti që personi të jetë me diabet

– Pastaj, maten shpenzimet për diabet

• Ky model involvon vlerësimin e dy ekuacioneve

– Probabiliteti për të qenë me diabet:

– Shpenzimet për diabet, kur personi është me diabet:

32

Modelet e tjera ekonometrike:

Regresioni i intervaleve

• Regresioni interval

– Numri i vizitave tek dentisiti që bëjnë personat

brenda vitit

– Numri i padive nga shkelja e rregullave të trafikut

• Variabla e varur merr vlera diskrete, por të

kufizuara në disa alternativa

33

Modelet e tjera ekonometrike:

Ordered/unordered

• Regresioni ‘ordered’ (i rënditur)

– ka hierarki në paraqitjen e gjendjes:

• Niveli i shëndetit të personit (i dobët, i mirë, shumë i mirë)

• Regresioni ‘unordered’ (jo i rënditur)

– nuk ka hierarki, gjendjet janë ‘kualitativisht’ të

ndryshme:

• Statusi i punësimit: i punësuar, i papunë, jashtë forcës

punëtore

34

Përmbledhje e ligjëratës

• Modelet kuantiative – aplikimi i ekonometrisë

• Modelet kryesore ekonometrike

• Kush e përcakton se cili model përdoret

• Karakteristikat kryesore të modeleve

– OLS

– Probit/Logit

– Tobit

– Interval regression

– Ordered/unordered35

Detyrë

• Siguroni të dhëna për një çështje që është me

interes për ju

• Identifikoni modelin ekonometrik që është

adekuat

• Zhvilloni fazat e procesit hulumtues duke

aplikuar modelin ekonometrik që keni

zgjedhur

• Interpretoni parametrat e modelit dhe

signifikancën e modelit

36