Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

28
Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007. __________________________________________________________________________ _____________________________________________________________________1 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable Sadržaj poglavlja: 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable 6.3.1. Kvalitativne varijable kao nezavisne varijable u regresijskom modelu 6.3.1.1. Regresijski modeli s jednom kvalitativnom nezavisnom varijablom 6.3.1.2. Regresijski modeli s dvije ili više kvalitativnih nezavisnih varijabli 6.3.1.3. Usporedba k regresija upotrebom indikator varijabli 6.3.1.4. Interakcijski efekt 6.3.1.5. Upotreba indikator varijabli u modelima sezonskih pojava 6.3.1.6. "Piecewise" linearna regresija 6.3.1.7. Testiranje strukturalnih promjena

Transcript of Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Page 1: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________1 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Sadržaj poglavlja:

6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable 6.3.1. Kvalitativne varijable kao nezavisne varijable u regresijskom modelu

6.3.1.1. Regresijski modeli s jednom kvalitativnom nezavisnom varijablom

6.3.1.2. Regresijski modeli s dvije ili više kvalitativnih nezavisnih varijabli 6.3.1.3. Usporedba k regresija upotrebom indikator varijabli 6.3.1.4. Interakcijski efekt 6.3.1.5. Upotreba indikator varijabli u modelima sezonskih pojava 6.3.1.6. "Piecewise" linearna regresija 6.3.1.7. Testiranje strukturalnih promjena

Page 2: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________2 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Pored kvantitativnih varijabli u regresijski model se mogu uvesti i kvalitativne varijable. Vrlo se često događa da na zavisnu varijablu, pored varijabli koje se mogu kvantificirati numerički definiranom ljestvicom, kao npr. prihod, cijene, troškovi, temperatura, utječu i varijable koje su esencijalno kvalitativne po prirodi pa se u regresijskim modelima definiraju varijable koje predstavljaju sociodemografske fenomene, kao što su spol, obrazovanje, nacionalnost, etnička pripadnost, religijska pripadnost, zatim političko stanje, promjene u ekonomskoj politici, regionalne lokacije i slično. Isto tako, može se javiti potreba otkrivanja utjecaja kako kvalitativnih tako i kvantitativnih varijabli na određenu kvalitativnu varijablu koja se u tom slučaju pojavljuje u funkciji zavisne varijable. Pored toga vrlo je važna uporaba kvalitativnih varijabli u sezonskim prilagođavanjima, kada uporabljujemo kvartalne podatke te pri testiranju strukturalnih razlika. Dakle, kvalitativne varijable se u regresijskom modelu mogu pojaviti kao: 1. nezavisne varijable 2. zavisne varijable Kvalitativne varijable, bilo da su definirane kao zavisne ili kao nezavisne, u regresijski se model uključuju uporabom binarnih varijabli koje se još nazivaju indikator ili “dummy” varijablama. Broj indikator varijabli ovisi o broju modaliteta kvalitativne varijable. Ako kvalitativna varijabla ima m modaliteta, definirat će se (m-1) indikator varijabli kako bi se kvalitativna varijabla uključila u regresijski model. Indikator varijable mogu poprimiti dvije vrijednosti: 1) 1 za prisutnost kvalitativnog atributa za koji se pretpostavlja da ima utjecaj na

zavisnu varijablu 2) 0 za odsutnost kvalitativnog atributa Regresijski model s indikator varijablama kao nezavisnim varijablama analizira se na isti način kao i standardni regresijski model, a o njihovim specifičnostima treba voditi računa prilikom interpretacije rezultata. Kada se indikator varijable koriste u regresijskom modelu, rezultat je skup regresijskih koeficijenata za sve individualne indikator varijable. Regresija na indikator varijablama omogućuje mjerenje odnosa između jednog aspekta originalne nezavisne varijable X i zavisne varijable Y.1

1 Eisinga R., Scheepers P., van Snippenburg L., Determing the Effect of a Compound of Dummy Variables or

Polynomial Terms

Page 3: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________3 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

6.3.1. Kvalitativne varijable kao nezavisne varijable u regresijskom modelu

U regresijskom modelu u kojemu je zavisna varijabla numerička, pored numeričkih nezavisnih varijabli u svojstvu nezavisne varijable može se nalaziti jedna, dvije ili više kvalitativnih odnosno indikator varijabli. Neke od takvih regresijskih modela primjenjuju se u analizi plaća djelatnika s obzirom na sate rada i spol djelatnika, zatim u analizi godišnjih troškova poduzeća s obzirom na godišnji prihod, stupanj obrazovanja i spol djelatnika, u analizi štednje s obzirom na prihod i to u dva ili više vremenskih razdoblja, pri analizi profita po kvartalnim razdobljima, pri analizi godišnje stope rasta odnosno pada u poduzeću s obzirom na proces kreiranja strategije u poduzeću i slično.

6.3.1.1. Regresijski modeli s jednom kvalitativnom nezavisnom varijablom

Neka je neograničeni regresijski model, koji sadrži jednu zavisnu i jednu nezavisnu varijablu, s različitim konstantnim članovima i zajedničkim regresijskim koeficijentom prkazan na sljedeći način:

y

y

i 0 x

0 i xu

1

2

1 1

2 2

1

2

(4.1.1.1)

gdje indeksi 1 i 2 označavaju dva modaliteta kvalitativne varijable. Ovaj se model može napisati i na sljedeći način:

Y D D X ut t t t t 1 1 2 2 t=1,2,…,n (4.1.1.2)

Dt1 i Dt2 su indikator varijable. Dt1 = 1 ako t označava prvi modalitet kvalitativne varijable = 0 ako t označava drugi modalitet kvalitativne varijable Dt2 = 0 ako t označava prvi modalitet kvalitativne varijable = 1 ako t označava drugi modalitet kvalitativne varijable Ako bi se pokrenula regresija Y na D1 i D2, nastala bi zamka indikator varijable što je objašnjeno dalje u ovom poglavlju.

Page 4: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________4 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Kako bi se to izbjeglo model pod (4.1.1.2) je potrebno napisati na sljedeći način:

Y D X ut t t 1 2 2 (4.1.1.3)

te na toj jednadžbi pokrenuti regresiju. Dakle, ako se želi uključiti u regresijski model jedna kvalitativna varijabla koja ima dva modaliteta, potrebno je napraviti jednu indikator varijablu, a prema pravilu: broj indikator varijabli koje treba uključiti u model = broj modaliteta kvalitativne varijable - 1. Pretpostavimo da prihod djelatnika ovisi o satima rada i spolu djelatnika. Regresijska jednadžba koja opisuje takvu ovisnost može se napisati na sljedeći način:

Y X X X ui 1 2 2 3 3 4 4 (4.1.1.4)

gdje je: Y - prihod djelatnika X2 - sati rada djelatnika X3 - spol djelatnika = 1 ako je djelatnik muškarac = 0 ako je djelatnik žena X4 - spol djelatnika = 1 ako je djelatnik žena = 0 ako je djelatnik muškarac

Budući da je prema metodi najmanjih kvadrata ( ' ) ' X X X y1 2, važno je ispitati

karakter matirice (X’X). Postavlja se pitanje da li uporaba tehnike indikator varijable izaziva neki specijalni problem. Pretpostavimo da je zadan uzorak od 5 djelatnika:

Djelatnici X1 3 X2

sati rada X3

žena X4

muškarac

A 1 X12 1 0

B 1 X22 0 1

D 1 X32 0 1

E 1 X42 1 0

F 1 X52 1 0

Slijedi:

( ' )X X

X X X X X X X

X X X X X X X

X X X X X X X

X X X X X X X

1

2

1 2 1 3 1 4

1 2 2

2

2 3 2 4

3 1 3 2 3

2

3 4

4 1 4 2 4 3 4

2

(4.1.1.5)

2 Vidi poglavlje 3.1. ovog rada

3 X1 pretpostavlja konstantnu vrijednost 1 radi postizanje konstane vrijednosti 1

Page 5: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________5 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Nadalje4:

( ' )X X

1 1 1

1 1 0

1 0 1

12

1 1 1

21

2

2

12

12

1

12

1 1

12

1 1

j

W NW

j

W NW

j

W

j

NW

j

W NW

j

W NW

j

W

j

NW

j

W

j

W

j

W

j

NW

j

NW

j

NW

X

X X X X

X

X

(4.1.1.6)

Konačno:

( ' )X X

5 3 2

3 3 0

2 0 2

21

5

21

5

2

2

1

5

21

3

21

2

21

3

21

2

X

X X X X

X

X

j

j j j j

j

j

(4.1.1.7)

Valja primijetiti da je prva kolona gornje matrice jednaka zboju kolone 3 i kolone 4. Ako je jedna kolona matrice jednaka sumi dvije druge kolone, uvijet nesingularnosti nije ispunjen i matrica ne može biti invertirana. Ako se matrica (X’X) ne može

invertirati, nije moguće izračunati k . Takav se slučaj naziva zamka indikator

varijable. Problem može biti rješen pisanjem spomenutog regresijskog modela na sljedeći način:

Y X X ui 1 2 2 3 3 (4.1.1.8)

Valja primijetiti da regresijska jednadžba (4.1.1.4) ima 3 varijable, dok jednadžba (4.1.1.8) dvije, jednu indikator i jednu kvantitativnu varijablu. Radi se o tome da je za uključivanje jedne kvalitativne varijable koja ima dva modaliteta, u ovom primjeru spol djelatnika, potrebno u model uvesti jednu varijablu.5 Ako se pak u model uvedu dvije varijable, za svaki modalitet po jedna, nastaje zamka indikator varijable.

4 Simbol Z

j

W NW

1

upućuje da je varijabla Z sumirana kroz sve podatke u uzorku; simbol Zj

W

1

ukazuje da je

varijabla sumirana kroz W; simbol Zj

NW

1

kazuje da je varijabla sumirana kroz NW

5 broj modaliteta varijable-1

Page 6: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________6 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Kvalitativne varijable se uporabljuju u regresijskim modelima gotovo na isti način kao i kvantitativne varijable. Regresijski model koji sadrži nazavisne varijable koje su ekskluzivno indikator varijable, odnosno kvalitativne po svojoj prirodi, nazivaju se modelima analize varijance (AOV6 modeli).7 Takvi su modeli više primijenjeni pri analizi pojava u sociologiji, psihologiji, pedagogiji, istraživanju tržišta, a nešto manje u ekonometriji. AOV regresijski model:

Y D ui i i (4.1.1.9)

Yi - zavisna kvantitativna varijabla Di - nezavisna kvalitativna varijabla ui - greška relacije

- konstantni član, vrijednost regresijske funkcije za X=0

- regresijski koeficijent Primjer AOV modela8: Yi - broj djelatnika koje upošljava poduzeće (IP30) Di - spol (DSPOL) 1 - muškarac poduzetnik 0 - žena poduzetnik

Y D ui i i

Y Di i 18 056 20 043, , (4.1.1.10)

(7,700) (8,513) t=(2,345) (2,354) Ovako postavljen model trebao bi dati odgovor na pitanje da li s obzirom na spol poduzetnika postoji razlika u broju zaposlenih djelatnika u poduzeću. Prosječan broj zaposlenih ako je žena poduzetnik:

E Y Di i( , ) 0 0 (4.1.1.11)

6 Analysis-of-variance

7 Gujarati, D.N., Basic Econometrics, McGraw-Hill. Inc., New York, 1988, str. 432

8 podaci iz ankete o poduzetništvu, poglavlje 5. ovog rada

Page 7: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________7 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Prosječan broj zaposlenih ako je muškarac poduzetnik:

E Y Di i( , ) 1 1 (4.1.1.12)

= prosječan broj zaposlenih kada je žena poduzetnik

= za koliko se prosječan broj zaposlenih kada je muškarac poduzetnik razlikuje od prosječnog broja zaposlenih u poduzeću kada je žena poduzetnik

+ = prosječan broj zaposlenih u poduzeću kada je muškarac poduzetnik Ukoliko regresijski modeli sadrže i kvantitativne i kvalitativne nezavisne varijable, tada se nazivaju modelima analize kovarijance (ACOV modeli). Oni se uporabljuju u većini ekonomskih istraživanja. Regesijski model koji sadrži jednu kvantitativnu i jednu kvalitativnu varijablu koja ima dvije kategorije, tzv. ACOV9 model10, ima slijedeći oblik:

Y D X ui i i i 1 2 (4.1.1.13)

Yi - zavisna kvantitativna varijabla Xi - nezavisna kvantitativna varijabla Di - nezavisna kvalitativna varijabla s dvije kategorije Primjer ACOV modela11: Prethodno postavljenom modelu priključena je jedna nezavisna kvantitativna varijabla - Godine radnog iskustva poduzetnika (IP20). Yi - broj djelatnika koje upošljava poduzeće (IP30) Xi - godine radnog iskustva poduzetnika (IP20) Di - spol (DSPOL) 1 - muško 0 - žensko

Y D X ui i i i 1 2

Y D Xi i i 3317 18100 0866, , , (4.1.1.14)

(9,799) (8,578) (0,357)

t=(0,339) (2,110) (2,423)

Postavlja se pitanje koje je značenje i kako se tumači navedeni regresijski model?

9 Analysis-of-covariance

10 Gujarati, D.N., Basic Econometrics, McGraw-Hill. Inc., New York, 1988, str. 434

11 podaci iz ankete o poduzetništvu, poglavlje 5. ovog rada

Page 8: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________8 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Broj djelatnika koje zapošljava poduzeće ako je žena poduzetnik:

E Y D X

E Y D X

i i i

i i i

( , )

( , )

0 0

0

1 2

1

(4.1.1.15)

Broj djelatnika koje zapošljava poduzeće ako je muškarac poduzetnik:

E Y D X

E Y D X

i i i

i i i

( , )

( , ) ( )

1 1

1

1 2

1 2

(4.1.1.16)

Grafikon 3. Grafički prikaz ACOV modela broj djelatnika koje upošljava poduzeće (Y) muškarac poduzetnik žena poduzetnik

2

1

godine radnog iskustva poduzetnika (X) Regresijski model u kojemu je broj djelatnika koje upošljava poduzeće u relaciji s godinama radnog iskustva i spolom poduzetnika pokazuje da obje funkcije broja

uposlenih djelatnika imaju isti koeficijent smjera , ali različite koeficijente (1 i 2). To znači da je prosječan broj djelatnika poduzeća kada je žena poduzetnik različit od

prosječnog broja djelatnika kada je muškarac poduzetnik i to za 2, uz stopu promjene u prosječnom broju djelatnika prema godinama radnog iskustva koja ista za oba spola. Da bi se razlikovale dvije kategorije, muškarci i žene, potrebno je u regresijski model uključiti samo jednu dummy odnosno indikator varijablu Di (Di=1 za muškarce, Di=0 za žene). No, napišimo taj model tako da uključimo dvije indikator varijable, jednu za žene, a jednu za muškarce:

Y D D X ui i i i i 1 2 2 3 3 (4.1.1.17)

Yi - broj djelatnika koje upošljava poduzeće (IP30) Xi - godine radnog iskustva poduzetnika (IP20)

Page 9: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________9 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Di2 -1 ako je poduzetnik muškarac -0 ako je poduzetnik žena Di3 -1 ako je poduzetnik žena -0 ako je poduzetnik muškarac U tom slučaju model se ne može procijeniti zbog potpune kolinearnosti između D2 i

D3. Naime, D2=1-D3 ili D3=1-D2 između D2 i D3 postoji potpuna kolinearnost12. Da je indikator varijabla Di definirana obrnuto nego što je prethodno navedeno, dakle, da je Di=1 za ženu, a Di=0 za muškarca, tada bi dvije regresijske funkcije bile slijedeće: prosječan broj djelatnika koje upošljava poduzeće ako je muškarac poduzetnik:

E Y D X

E Y D X

i i i

i i i

( , )

( , )

0 0

0

1 2

1

(4.1.1.18)

prosječan broj djelatnika koje upošljava poduzeće ako je žena poduzetnik:

E Y D X

E Y D X

i i i

i i i

( , )

( , ) ( )

1 1

1

1 2

1 2

(4.1.1.19)

Ovdje 2 kaže koliko se prosječan broj uposlenih kada je žena poduzetnik razlikuje od prosječnog broja uposelnih kada je muškarac poduzetnik. Ako postoji spolna

razlika 2 će u ovom slučaju biti negativan ako je u prethodnom slučaju bio pozitivan. Prilikom određivanja koja će kategorija biti 1, a koja 0, obično se 0 odnosi na kategoriju koja je bazna, kontrolna ili uspoređujuća. Koja će kategorija biti bazna pitanje je izbora koji je ponekad određen prijašnjim razmišljanjima i spoznajama.13

Koeficijent 2 koji je uz indikator varijablu naziva se diferencijalni koeficijent. On govori za koliko će se vrijednost konstantnog člana kategorije koja poprima vrijednost 1 razlikovati od konstantnog člana bazne kategorije.14 Pretpostavimo da je potrebno ispitati prosječnu godišnju stopu rasta zaposlenosti u ovisnosti o stupnju obrazovanja poduzetnika i godinama radnog iskustva poduzetnika. Stupanj obrazovanja je kvalitativna varijabla koja u anketi o poduzetništvu15 ima pet modaliteta odnosno kategorija: nezavršena srednja škola, završena srednja škola, položen stručni ili tehnički ispit, nezavršen fakultet i završen fakultet. Te je modalitete moguće sažeti u tri modaliteta: manje od položenog stručnog ili tehničkog ispita, položen stručni ili tehnički ispit i završen fakultet. Pošto je to onda varijabla s tri kategorije, u model se može uvesti tako da se kreiraju dvije indikator varijable.

12

Gujarati, D.N., Basic Econometrics, McGraw-Hill. Inc., New York, 1988, str. 436. 13

Gujarati, D.N., Basic Econometrics, McGraw-Hill. Inc., New York, 1988, str. 437. 14

Gujarati, D.N., Basic Econometrics, McGraw-Hill. Inc., New York, 1988, str. 437 15

poglavlje 5. ovog rada

Page 10: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________10 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Dakle, Yi - prosječna godišnja stopa rasta zaposlenosti (IP31C) Xi - godine radnog iskustva poduzetnika (IP20) D2 - stupanj stručne spreme = 1 ako je položen stručni ili tehnički ispit = 0 ostalo D3 - stupanj stručne spreme = 1 ako je završen fakultet = 0 ostalo Na ovakav način definirana dummy varijabla pokazuje da je bazna kategorija “manje od položenog stručnog ili tehničkog ispita”. Prema tome, konstantni član odnosno

pomak po Y osi za tu kategoriju bit će 1. 2 i 3 kazuju koliko se pomaci po osi Y druge dvije kategorije razlikuju od pomaka po Y osi bazne kategorije. Da bi se mogle analizirati navedene varijable, potreban je slijedeći regresijski model:

Y D D X ui i i i i 1 2 2 3 3 (4.1.1.20)

Y D D Xi i i i 67 477 20102 22 736 13972 3, , , , (4.1.1.21)

(11,989) (16,656) (9,347) (0,473) t=(5,628) (-1,207) (-2,432) (-2,952)

Prosječna godišnja stopa rasta zaposlenosti za baznu kategoriju “manje od položenog stručnog ili tehničkog ispita”, D2=0, D3=0:

E Y D D X

E Y D D X

i i

i i

( , , )

( , , )

2 3 1 2 3

2 3 1

0 0 0 0

0 0

(4.1.1.22)

Prosječna godišnja stopa rasta zaposlenosti za kategoriju “položen stručni ili tehnički ispit”, D2=1, D3=0:

E Y D D X

E Y D D X

i i

i i

( , , )

( , , ) ( )

2 3 1 2 3

2 3 1 2

1 0 1 0

1 0

(4.1.1.23)

Prosječna godišnja stopa rasta zaposlenosti za kategoriju “završen fakultet”, D2=0, D3=1:

E Y D D X

E Y D D X

i i

i i

( , , )

( , , ) ( )

2 3 1 2 3

2 3 1 3

0 1 0 1

0 1

(4.1.1.24)

Specifičnost ovoga modela je u tome što je stopa promjene prosječnog broja godina

radnog iskustva poduzetnika ista za sve stupnjeve stručne spreme.

Page 11: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________11 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

6.3.1.2. Regresijski modeli s dvije ili više kvalitativnih nezavisnih varijabli

Tehnika indikator varijabli može se primijeniti i na slučajeve kada postoji više kvalitativnih nezavisnih varijabli. Za razliku od prethodnih slučajeva sada će u regresijski model biti uključene dvije kvalitativne varijable, uz pretpostavku da ne postoji međusobna interakcija između varijabli uključenih u model. Ei - kvalitativna varijabla s tri modaliteta i Sj - kvalitativna varijabla s dva modaliteta kako sljedi16: Ei = 1 ako varijabla zauzima i-ti modalitet i=1,2,3 = 0 ostalo Sj = 1 ako se varijabla odnosi na j-ti modalitet j=1,2 = 0 ostalo U regresijskom modelu bit će tri indikator varijable, dvije koje će predstavljati kvalitativnu varijablu Ei i jedna za varijablu Sj:

Y E E S u 2 2 3 3 2 2 (4.1.2.1)

Očekivane vrijednosti prikazane su u tablici 4. Tablica 4. Očekivane vrijednosti za (4.1.2.1)

E1 E 2 E 3

S1 + 2 + 3

S 2 + 2 + 2 + 2 + 3 + 2

Parametar predstavlja očekivanu vrijednost zavisne kvantitativne varijable za

kategoriju (E1,S1). 2 i 3 parametri mjere diferencijalne efekte za E2 i E3 u odnosu na

E1. 2 predstavlja diferencijalni efekt za S2 u odnosu na S1. Ukoliko se želi analizirati prosječna godišnja stopa rasta zaposlenosti s obzirom na godine radnog iskustva poduzetnika, stručnu spremu i spol poduzetnika, u model je potrebno uključiti tri indikator varijable. Jednu za spol (m-2=1) i dvije za stručnu spremu (m-3=2). Model: Yi - prosječna godišnja stopa rasta zaposlenosti (IP31C) Xi - godine radnog iskustva poduzetnika (IP20)

16

Johnson,J., Econometrics Methods, McGraw-Hill Book Company, New York, 1972, str. 228-231

Page 12: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________12 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

D2 - stupanj stručne spreme = 1 ako je položen stručni ili tehnički ispit = 0 ostalo D3 - stupanj stručne spreme = 1 ako je završen fakultet = 0 ostalo D4 - spol = 1 ako je poduzetnik muškarac = 0 ako je poduzetnik žena Valja primijetiti da je bazna kategorija “žena poduzetnik čija je stručna sprema manja od položenog stručnog ili tehničkog ispita”.

Y D D D Xi i i i i 1 2 2 3 3 4 4 (4.1.2.2)

Y D D D Xi i i i i 78 779 23224 23472 15781 12912 3 4, , , , , (4.1.2.3)

(14,288) (16,734) (9,326) (10,948) (0,477) t=(5,514) (-1,388) (-2,517) (-1,442) (-2,707) Prosječna godišnja stopa rasta zaposlenosti za baznu kategoriju “žena sa stručnom spremom manjom od položenog stručnog ili tehničkog ispita” (D2=0, D3=0, D4=0):

E Y D D D X

E Y D D D X

i i

i i

( , , , )

( , , , )

2 3 4 1 2 3 4

2 3 4 1

0 0 0 0 0 0

0 0 0

(4.1.2.4)

Prosječna godišnja stopa rasta zaposlenosti za muškarca sa stručnom spremom manjom od položenog stručnog ili tehničkog ispita (D2=0, D3=0, D4=1):

E Y D D D X

E Y D D D X

i i

i i

( , , , )

( , , , ) ( )

2 3 4 1 2 3 4

2 3 4 1 4

0 0 1 0 0 1

0 0 1

(4.1.2.5)

Prosječna godišnja stopa rasta zaposlenosti za fakultetski obrazovanu ženu poduzetnika (D2=0, D3=1, D4=0):

E Y D D D X

E Y D D D X

i i

i i

( , , , )

( , , , ) ( )

2 3 4 1 2 3 4

2 3 4 1 3

0 1 0 0 1 0

0 1 0

(4.1.2.6)

Prosječna godišnja stopa rasta zaposlenosti za fakultetski obrazovanog muškarca poduzetnika (D2=0, D3=1, D4=1):

E Y D D D X

E Y D D D X

i i

i i

( , , , )

( , , , ) ( )

2 3 4 1 2 3 4

2 3 4 1 3 4

0 1 1 0 1 1

0 1 1

(4.1.2.7)

Page 13: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________13 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Prosječna godišnja stopa rasta zaposlenosti za ženu poduzetnika s položenim stručnim ili tehničkim ispitom (D2=1, D3=0, D4=0):

E Y D D D X

E Y D D D X

i i

i i

( , , , )

( , , , ) ( )

2 3 4 1 2 3 4

2 3 4 1 2

1 0 0 1 0 0

1 0 0

(4.1.2.8)

Prosječna godišnja stopa rasta zaposlenosti za muškarca poduzetnika s položenim stručnim ili tehničkim ispitom (D2=1, D3=0, D4=1):

E Y D D D X

E Y D D D X

i i

i i

( , , , )

( , , , ) ( )

2 3 4 1 2 3 4

2 3 4 1 2 4

1 0 1 1 0 1

1 0 1

(4.1.2.9)

Valja primijetiti da je regresijski koeficijent konstantan što znači da je stopa promjene prosječnog broja godina radnog iskustva poduzetnika ista za sve stupnjeve stručne spreme i za oba spola. Svim slučajevima uporabe indikator varijabli koji su obrađeni do sada zajedničko je to

što je regresijski koeficijent koji se nalazi uz nezavisnu kvantitativnu varijablu uvijek bio konstantan, dakle ostajao je isti bez obzira na promjene nezavisnih kvalitativnih varijabli, čiji su se koeficijenti mijenjali. Linerani regresijski model se može definirati i na način da su uočljive promjene kako u regresijskim koeficijentima uz kvalitativne varijable tako i u regresijskim koeficijentima uz kvantitativne varijable. Model: Yi - broj djelatnika koje upošljava poduzeće (IP30) Xi1 - godine radnog iskustva poduzetnika (IP20) Di2 - Da li je poduzetnik sam osnovao poduzeće (VLPOD) = 1 ako poduzetnik nije sam(a) osnovao(la) poduzeće = 0 ako je poduzetnik sam(a) osnovao(la) poduzeće Di3 - Spol (DSPOL) = 1 ako poduzetnik muškarac = 0 ako je poduzetnik žena Xi2 - Xi1Di2 (DD1)17 godine radnog iskustva i kako je poduzetnik osnovao poduzeće Xi3 - Xi1Di3 (DD2)18 godine radnog iskustva i spol poduzetnika

Y D D X X X ui i i i i i i 1 2 2 3 3 1 1 2 2 3 3 (4.1.2.10)

Y D D X X Xi i i i i i 11178 2 392 6 609 0 331 1408 05092 3 1 2 3, , , , , , (4.1.2.11)

(17,257) (14,604) (18,571) (0,893) (0,682) (0,956)

17

kreirana je nova varijabla DD1=IP20VLPOD 18

kreirana je nova varijabla DD2=IP20DSPOL

Page 14: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________14 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Xi2=0 kada je Di2=0 Xi3=0 kada je Di3=0

Xi2=Xi1 kada je Di2=1

Xi3=Xi1 kada je Di3=1 Prosječan broj djelatnika poduzeća kada je poduzetnik poduzeća žena koja nije sama osnovala/kupila svoje vlastito poduzeće (Di2=1,Di3=0):

E Y D D X X X

E Y D D X

i i i i i i

i i i i

( , , )

( , , ) ( ) ( )

2 3 1 2 3 1 1 2 1 3 1

2 3 1 2 1 2 1

1 0 1 0 1 0

1 0

(4.1.2.12)

Prosječan broj djelatnika poduzeća kada je poduzetnik poduzeća muškarac koji nije sam osnovao/kupio svoje vlastito poduzeće (Di2=1,Di3=1):

E Y D D X X X

E Y D D X

i i i i i i

i i i i

( , , )

( , , ) ( ) ( )

2 3 1 2 3 1 1 2 1 3 1

2 3 1 2 3 1 2 3 1

1 1 1 1 1 1

1 1

(4.1.2.13)

Prosječan broj djelatnika poduzeća kada je poduzetnik poduzeća žena koja je sama osnovala/kupila poduzeće (Di2=0,Di3=0):

E Y D D X X X

E Y D D X

i i i i i i

i i i i

( , , )

( , , )

2 3 1 2 3 1 1 2 1 3 1

2 3 1 1 1

0 0 0 0 0 0

0 0

(4.1.2.14)

Prosječan broj djelatnika poduzeća kada je poduzetnik poduzeća muškarac koji je sam osnovao/kupio svoje vlastito poduzeće (Di2=0,Di3=1):

E Y D D X X X

E Y D D X

i i i i i i

i i i i

( , , )

( , , ) ( ) ( )

2 3 1 2 3 1 1 2 1 3 1

2 3 1 3 1 3 1

0 1 0 1 0 1

0 1

(4.1.2.15)

Specifičnost ovakvog regresijskog modela je u tome što postoji otklon odnosno

promjena i kod , koji su uz indikator varijable, i kod koeficijenata, koji su uz kvantitativne varijable.

6.3.1.3. Usporedba k regresija upotrebom indikator varijabli Ponekad se javlja potreba za usporedbom podataka koji su podjeljeni u dva ili više vremenskih perioda ili pak postoje dva ili više različitih skupova podataka od kojih svaki ima posebnu regresijsku jednadžbu. U oba ta slučaja postavlja se zahtjev da se usporede dvije ili više regresija. Analiza odvojenih regresijskih jednadžbi može biti primjenjena na cross-section19 podatke i na podatke vremenske serije. Ozbiljni

19

podaci koji izražavaju brojčane vrijednosti pojava odnosno varijabli u jednom vremenskom intervalu ili

vremenskoj točki

Page 15: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________15 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

problemi se mogu pojaviti u veza među varijablama kada se koriste pooled20 podaci. U analizi takvih problema koriste se indikator varijable. Pri usporedbi dviju ili više

regresija potrebno je otkriti postoji li razlika u koeficijentima, u koeficijentima ili i u jednom i u drugom. Pod pretpostavkom da postoji k regresijskih funkcija:

Y X X X u

Y X X X u

Y X X X u

k k

k k

N N N Nk k N

1 11 1 12 2 1 1

2 21 1 22 2 2 2

1 1 2 2

.................................................................... (4.1.3.1)

moguća su 4 slučaja odnosa između regresija21: 1. Podudarajuća regresija 1 2 N i 1 2k k Nk dakle, regresije su identične.

2. Paralelna regresija 1 2 N i 1 2k k Nk regresije se razlikuju samo u konstantnim

članovima 3. Regresije koje se sijeku u istoj točki 1 2 N i 1 2k k Nk regresije imaju iste konstantne članove, ali

različite regresijske koeficijente 4 . Različite regresije 1 2 N i 1 2k k Nk regresije su potpuno različite.

Potrebno je usporediti pooled podatke u dva vremenska perioda. Zadana je jedna kvantitativna nezavisna varijabla te jedna kvantitativna zavisna varijabla. Regresijska jednadžba je slijedeća:

Y D X D X ui i i i i i 1 2 1 2 ( ) (4.1.3.2)

Di - vremenski period = 1 za prvi vremenski period = 0 za drugi vremenski period Kako izgleda regresijski model za drugi vremenski period Di=0 (bazni):

E Y D X

E Y D X

i i i

i i i

( , )

( , )

0 0 0

0

1 2 1 2

1 1

(4.1.3.3)

20

kombinacija cross-section i podataka vremenskih serija 21

Gujarati, D.N., Basic Econometrics, McGraw-Hill. Inc., New York, 1988, str. 443

Page 16: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________16 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Kako izgleda regresijski model za drugi vremenski period Di=1:

E Y D X X

E Y D X

i i i i

i i i

( , )

( , ) ( ) ( )

1 1 1

1

1 2 1 2

1 2 1 2

(4.1.3.4)

Na taj način dobile su se dvije regresijske funkcije. Kada je nezavisna varijabla Xi=0,

u drugom odnosno baznom vremenskom periodu konstantni član iznosi 1, a u

prvom vremenskom periodu 1+2. Dakle, 2 pokazuje za koliko se konstatni član prvog perioda razlikuje od konstantnog člana drugog perioda. Kada se nezavisna varijabla Xi promjeni za 1, u drugom odnosno baznom

vremenskom periodu u prosjeku će se zavisna varijabla promijeniti za 1, a u prvom

vremenskom periodu za 1+2. Dakle, regresijski koeficijent 2 kazuje za koliko se u prosjeku vrijednost zavisne varijable Yi za prvi period razlikuje od vrijednosti zavisne varijable za drugi period uz jediničnu promjenu nezavisne varijable Xi.

6.3.1.4. Interakcijski efekt Razmotrimo sljedeći model: Yi - godišnji prihod od prodaje (IP29) Xi1 - broj djelatnika koje upošljava poduzeće (IP30) Di2 - Spol (DSPOL) = 1 ako je poduzetnik muškarac = 0 ako je poduzetnik žena Di3 - Da li poduzetnik ima visoku stručnu spremu (FAKS) = 1 završen fakultet = 0 ostalo Ako se u navedenom modelu pretpostavi: 1. indikator varijabla Di2 konstantna je za oba stupnja obrazovanja, što znači da je

prosječan godišnji prihod od prodaje veći ako poduzetnik muškarac nego li ako je poduzetnik žena bez obzira na stupanj obrazovanja.

2. indikator varijabla Di3 je konstantna za varijablu Di2, što znači da je prosječan godišnji prihod od prodaje veći ako poduzetnik ima visoku stručnu spremu nego ako nema bez obzira na spol poduzetnika.

3. regresijski koeficijent uz kvantitativnu nezavisnu varijablu (broj djelatnika koje

upošljava poduzeće) je konstantan Dakle, potrebno je analizirati slijedeći model:

Y D D X ui i i i i 1 2 2 3 3 (4.1.4.1)

No, međutim, u mnogim aplikacijama spomenute dvije pretpostavke su neodržive. To zapravo znači da može postojati mogućnost da je prosječan godišnji prihod od

Page 17: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________17 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

prodaje veći kada je npr. poduzetnik muškarac koji ima visoku stručnu spremu nego li kada je poduzetnik muškarac koji nema visoku stručnu spremu. Drugim riječima, može postojati interakcijski efekt između dviju indikator varijabli, između spola Di2 i stručne spreme Di3, te u u tom slučaju Y neće biti aditivan kao što je to u modelu (4.1.4.1), već multiplikativan kao u slijedećem modelu:

Y D D D D X ui i i i i i i 1 2 2 3 3 4 2 3( ) (4.1.4.2)

Y D D D D Xi i i i i i 4401431 27453 172572 7 36259 3 3062 82 3 2 3, , , ( ) , (4.1.4.3)

Prosječan godišnji prihod od prodaje izražen u DEM kada je poduzetnik žena koja

nema visoku stručnu spremu (Di2=0, Di3=0 Di2Di3=0):

Y X

Y X

i i

i i

1 2 3 4

1

0 0 0 (4.1.4.4)

Prosječan godišnji prihod od prodaje izražen u DEM kada je poduzetnik žena s

visokom stručnom spremom (Di2=0, Di3=1 Di2Di3=0):

Y X

Y X

i i

i i

1 2 3 4

1 3

0 1 0

( ) (4.1.4.5)

Prosječan godišnji prihod od prodaje izražen u DEM kada je poduzetnik muškarac

koji nema visoku stručnu spremu (Di2=1, Di3=0 Di2Di3=0):

Y X

Y X

i i

i i

1 2 3 4

1 2

1 0 0

( ) (4.1.4.6)

Prosječan godišnji prihod od prodaje izražen u DEM kada je poduzetnik muškarac

koji ima visoku stručnu spremu (Di2=1, Di3=1 Di2Di3=1):

Y X

Y X

i i

i i

1 2 3 4

1 2 3 4

1 1 1

( ) (4.1.4.7)

Valja primijetiti da je regresijski koeficijent konstantan, što je i bila pretpostavka modela.

6.3.1.5. Upotreba indikator varijabli u modelima sezonskih pojava Mnoge ekonomske vremenske serije bazirane na mjesečnim ili kvartalnim podacima pokazuju oscilatorna kretanja: prodaja za vrijeme Božića, potražnja za novcima u vrijeme praznika i blagdana, potražnja za hladnim napicima za vrijeme ljeta itd. Vrlo je često poželjno otkloniti sezonski utjecaj odnosno sezonsku komponentu kako bi se istraživač mogao koncentrirati na istraživanje drugih komponenti. Proces uklanjanja

Page 18: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________18 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

sezonske komponente iz vremenske serije naziva se desezonalizacija ili sezonsko prilagođavanje, a vremenska serija dobivena na taj način naziva se sezonski prilagođena vremenska serija.22 Indikator varijable imaju važnu ulogu u problemima sezonskih prilagođavanja. Postoje dva problema23: 1. problem sezonskih prilagođavanja za kvartalne ili mjesečne vremenske serije 2. problem procjene ekonometrijskih veza između varijabli koje su dostupne i u

sezonski neprilagođenoj i u prilagođenoj formi Pretpostavimo da je na raspolaganju 4n kvartalnih razdoblja s observacijama na Y,

kao što je npr. nezaposlenost, uvoz, cijene roba, itd. Takve varijable, naime, pokazuju izražena sezonska kretanja te je na njima potrebno proizvesti seriju podataka iz koje je uklonjen taj sezonski utjecaj pošto se iz takvih podataka može bolje ocijeniti postoji li nekakvo stvarno povećanje odnosno smanjenje analizirane pojave. Jedan od načina provođenja desezonalizacije odnosno “čišćenja” podataka je uporaba indikator varijabli.

Definirana je 4n4 matrica D:

D

1 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1

1 0 0 0

0 1 0 0

0 0 0 1

(4.1.5.1)

Matrica D je matrica uzorka četri indikator varijable definirane kao: Dit = 1 ako se t nalazi u kvartalnom razdoblju i , i=1,2,3,4 = 0 ostalo Regresija y na D daje sljedeće:

y D y (4.1.5.2)

22

Gujarati, D.N., Basic Econometrics, McGraw-Hill. Inc., New York, 1988, str. 452 23

Johnson,J., Econometrics Methods, McGraw-Hill Book Company, New York, 1972, str. 234

Page 19: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________19 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

gdje je: vektor procijenjenih koeficijenata

y vektor reziduala

y My (4.1.5.3)

M D D D D I ( ' ) '1 (4.1.5.4)

Vidljivo je da je D simetrično idempotentna i da je MD=0.

y se ne može upotrijebiti direktno kao sezonski prilagođena vremenska serija iz dva

razloga24: 1. jednaka je nuli, gdje je moguće zahtijevati prilagođenu vremensku seriju ako se

želi ista suma kao kod nekorigirane, originalne vremenske serije 2. iz prirode matrice D vidi se da je:

1

1

1

1

11

21

31

41

nY

nY

nY

nY

ii

n

ii

n

ii

n

ii

n

(4.1.5.5)

a, y se sastoji od odstupanja Y vrijednosti od kvartalnih aritmetičkih sredina. Ako

originalna serija sadrži trend i/ili cikličke komponente, elementi bit će udruženi s

trendom, cikličkim i sezonskim utjecajima. Prema tome, odbijanjem godinu po godinu od aktualne vrijednosti Y neće se postići zadovoljavajuća procjena serije očišćene od tih utjecaja. Jedan od načina poboljašanja je uvođenje polinoma u regresiju koji bi predstavljao trend i cikličke komponenete, tako da D može biti bolja procjena sezonske komponente.25 Dakle, potrebno je izračunati sljedeću regresiju:

y P X e (4.1.5.6)

24

Johnson,J., Econometrics Methods, McGraw-Hill Book Company, New York, 1972, str. 234 25

Johnson,J., Econometrics Methods, McGraw-Hill Book Company, New York, 1972, str. 235

Page 20: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________20 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

gdje je:

P

1 1 1

2 2 2

3 3 3

4 4 4

4 4 4

2

2

2

2

2

p

p

p

p

pn n n( ) ( )

(4.1.5.7)

Sezonski prilagođena vremenska serija bila bi, dakle, definirana na način:

y y D (4.1.5.8)

Prema Jorgensonu ako su matrice P i D odgovarajuće specificirane, tada će i biti najbolje linearne nepristrane procjene sistematskih i sezonskih komponenti, pošto je (4.1.5.6) jednostavan primjer metode najmanjih kvadrata.26

Procjene za i :

' '

' '

'

'

P P P X

X P X X

P y

X y

1

(4.1.5.9)

( ' ) ' D ND D Ny1 (4.1.5.10)

gdje je:

N P P P P I ( ' ) '1 (4.1.5.11)

Supstitucijom u (4.1.5.8) dobije se:

y Ty (4.1.5.12)

gdje je:

T D D ND D N I ( ' ) '1 (4.1.5.13)

tako da sezonski prilagođena vremenska serija može biti izražena kao linearna transformacija y. Valja primijetiti da matrica T nije simetrična, ali je idempotentna i zadovoljava uvjet TD=0.

26

Jorgenson,D.,W., Minimum Variance, Linear, Unbiased Seasonal Adjustment of Economic Time Series,

Am.Statist.Assoc., vol. 59,1964, str. 681-724

Page 21: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________21 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

6.3.1.6. "Piecewise" linearna regresija Indikator varijable se mogu uporabiti za izgradnju regresijskog modela s

isprekidanom promjenom regresijskog koeficijenta . Kada je promjena regresijskog

koeficijenta postepena27, moguće je odrediti produkt interakciju kako bi se zadržao takav efekt. No, kada je promjena regresijskog koeficijenta isprekidana, uporaba indikator varijabli pomaže u procjeni magnitude i signifikantnosti takve promjene. Situacije u kojima je takva tehnika korisna pojavljuje se kada je moguće definirati početnu vrijednost u distribuciji kvantitativne nezavisne varijable Xi gdje se može očekivati da će se odnos između varijabli Xi i Yi razlikovati sa svake strane definirane početne vrijednosti, npr. trgovci koji rade u maloprodaji primaju nagradu za posredovanje kod prodaje i to, do određenog nivoa jednu, a preko toga drugu. Na taj se način dobije “piecewise” linearna regresija koja se sastoji iz dva dijela ili segmenta. Definirane su dvije distribucije28 - jedna predstavlja ukupnu proizvodnju (X), a druga ukupne troškove (Y). Nadalje, očekuje se da će troškovi po jednici pasti kada volumen proizvodnje dostigne 5000, te je to početna vrijednost X*. Kako bi se procijenila promjena u regresijskom koeficijentu (troškovi po jedinici) koji nastaju kada je X*=5000, potrebno je: 1. izračunati odstupanja za svaki stupanj prihoda od početne vrijednosti (Xi-X*)

2. definirati indikator varijablu Di = 1 ako prihod premašuje 5000, XiX*

= 0 XiX* Na taj se način definira model:

Y X X X D ui i i i i 1 1 2 ( *) (4.1.6.1)

Prosječni troškovi kada je proizvodnja manja od 5000 (Di=0):

E Y D X

E Y D X

i i i

i i i

( , )

( , )

0 0

0

1 1 2

1 1

(4.1.6.2)

Prosječni troškovi kada je proizvodnja veća od 5000 (Di=1):

E Y D X X X

E Y D X X X

E Y D X X

i i i i

i i i i

i i i

( , ) ( *)

( , ) *

( , ) * ( )

1

1

1

1 1 2

1 1 2 2

1 2 1 2

(4.1.6.3)

Prema tome, 1 je regresijski koeficijent za razinu proizvodnje manju od 5000

proizvoda, (1+2) je regresijski koeficijent za razinu proizvodnje iznad 5000 proizvoda.

27

kada je veza između Yi i Xi raste ili pada linearno 28

Hardy,M.A., Regression with Dummy Variables, Sage Publications, Inc., London, 1993, str.81.

Page 22: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________22 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Indikator varijable se, u kontekstu “piecewise” regresije, mogu upotrijebiti pri rješavanju problema nelinearnosti.29 Pretpostavka je da je Y u nelinearnoj relaciji s X, ali se ne može sa sigurnošću reći kakva je specifična priroda funkcije. U takvim slučajevima potrebno je nezavisnu varijablu podijeliti u k razreda i zatim od razreda napraviti k-1 indikator varijablu. Na taj se način dobije klasičan višestruki regresijski

model čiji je rezultat Y za svaku nezavisnu varijablu. Svaki se Y može nacrtati u odnosu prema odgovarajućoj srednjoj vrijednosti svakog razreda kako bi se dobila ideja o kakvoj je vezi riječ.

6.3.1.7. Testiranje strukturalnih promjena Indikator varijable se mogu uporabiti u analiziranju stabilnosti regresijskih koeficijenata kroz vrijeme ili za testiranje strukturalnih promjena. Prošireni sustav regresijskih jednadžbi promatra se kada su na raspolaganju podaci koji izražavaju brojčane vrijednosti pojava odnosno varijabli u jednom vremenskom intervalu ili vremenskoj točki i kroz vrijeme. Cilj je analizirati konstantnost veza između varijabli kroz vrijeme. U poglavlju 3 opisana je procedura za testiranje hipoteze - H0:R r . Ako nul-

hipoteza nije odbačena, istraživač može ponovo procijeniti model uključivši određena ograničenja u proces procjene. Razlog takve ponovne procjene leži u tome

što će se na taj način poboljšati efikasnost procjenitelja čija je oznaka * a koji

zadovoljava sljedeće:

R * r (4.1.7.1)

Način izračunavanja procjenitelja * :

( ' ) ' ( ' ) ' ( )*

X X X X r1 1 1

R R R R (4.1.7.2)

Formula (4.1.7.2) predstavlja ograničeni procjenitelj, metodom najmanjih kvadrata, koji zadovoljava skup od q restrikcija.30

S obzirom na * , može se definirati rezidualni vektor:

e y X* * (4.1.7.3)

29

Green, Paul E., Analyzing Multivariate Data, The Dryden Press Hinsdale, Illinois, 1978, str. 204

30

Johnson,J., Econometrics Methods, McGraw-Hill Book Company, New York, 1972, str. 205

Page 23: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________23 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Dakle, kada raspolažemo s * i e*, F test je31:

Fq

N k

( )' ' ( ) /

' / ( )

* * X X

e e (4.1.7.4)

ili

Fq

N k

( ' ) /

' / ( )

*

'

*e e e e

e e (4.1.7.5)

Jedna od najkorisnijih aplikacija ovih formula je pri testiranju strukturalnih promjena. Testiranje strukturalnih promjena (k-varijabli, 2 perioda) Neograničeni model za testiranje strukturalnih promjena k varijabli u dva vremenska perioda:

y

y

X 0

0 Xu

1

2

1

2

1

2

(4.1.7.6)

gdje je X1 reda n1 x k, X2 je reda n2 x k, 1 2 označavaju vektore k koeficijenata. (n1

predstavlja podatke prvog perioda, a n2 podatke drugog perioda). Razdijelimo X1 i X2 prema prvoj koloni jedinica i preostalim (k-1) kolonama observacija nezavisnih varijabli kako sljedi:

X i X

X i X

1 1 1

2 2 2

*

* (4.1.7.7)

Sada se mogu konstruirati modeli32: I zajednička regresija za oba perioda

y

y

i X

i Xu

1

2

1 1

2 2

*

* (4.1.7.8)

II različitost konstantnih članova, zajednički vektor regresijskih koeficijenata

y

y

i 0 X

0 i Xu

1

2

1 1

2 2

1

2

*

*

(4.1.7.9)

31

Johnson,J., Econometrics Methods, McGraw-Hill Book Company, New York, 1972, str. 207 32

Johnson,J., Econometrics Methods, McGraw-Hill Book Company, New York, 1972, str. 217-219

Page 24: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________24 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

III različitost konstantnih članova i različitost regresijskih koeficijenata

y

y

i 0 X 0

0 i 0 Xu

1

2

1 1

2 2

1

2

1

2

*

* *

*

(4.1.7.10)

Primjena metode najmanjih kvadrata, kao metode procjene, na svaki model dati će rezidualnu sumu kvadrata s odgovarajućim stupnjevima slobode: Model I SR1 N-k Model II SR2 N-k-1 Model III SR3 N-2k gdje je N=n1+n2 Konačno, testovi hipoteza: H0: 1 2 : Test različitosti konstantnih članova

FSR SR

SR N kF N k

1 2

2 11 1

/ ( )~ ( , ) (4.1.7.11)

H0: 1 2

* * : Test različitosti vektora regresijskih koeficijenata

FSR SR k

SR N kF k N k

( ) / ( )

/ ( )~ ( , )

2 3

3

1

21 2 (4.1.7.12)

H0: 1 2 : Test različitosti regresija (konstantnih članova i regresijskih koeficijenata)

FSR SR k

SR N kF k N

( ) /

/ ( )~ ( , )

1 3

3 22 (4.1.7.13)

Test strukturalnih promjena (k varijabli, p perioda) Ponekada se može javiti potreba za testiranjem strukturalnih promjena za k varijabli u više od dva perioda. No, testiranje se može odnositi i na ispitivanje stabilnosti veza između zemalja, industrija, socijalnih grupa i sl. što također predstavlja p. Hijerarhija tri modela u takvim slučajevima je33:

33

Johnson,J., Econometrics Methods, McGraw-Hill Book Company, New York, 1972, str. 221

Page 25: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________25 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

I zajednički konstantni član, zajednički vektor regresijskih koeficijenata u svih p klasa

y

y

y

i X

i X

i X

u

1

2

1 1

2 2

p p p

*

*

*

*

(4.1.7.14)

stupnjevi slobode = N-k

II različitost konstantnih članova, zajednički vektor regresijskih koeficijenata

y

y

y

i 0 0 X

0 i 0 X

0 0 i X

u

1

2

1 1

2 2

1

2

p p p

p

*

*

*

*

(4.1.7.15)

stupnjevi slobode = N-p-k+1 III različitost konstantnih članova i različitost regresijskih koeficijenata

y

y

y

i 0 0 X 0 0

0 i 0 0 X 0

0 0 i 0 0 X

u

1

2

1 1

2 2

1

2

1

p p p

p

*

*

*

*

(4.1.7.16)

stupnjevi slobode = N-pk Hipoteze kao i njihovo testiranje istovjetno je onima navedenima kod testiranja strukturalnih promjena (k-varijabli, 2 perioda).

Page 26: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________26 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Pretpostavimo da postoje dvije regresijske jednadžbe34:

y x z u period

y x z u period

1 1 1 1 1 1 1

2 2 2 2 2 2 2

1

2

.

. (4.1.7.17)

Moguće je testirati hipotezu da se između dva perioda nije promijenio niti jedan koeficijent, ili da se promijenio konstantni član, ili koeficijent x varijable. Indikator varijable su definarane na slijedeći način: D1 = 1 za period 2 = 0 za period 1 D2 = x2 odgovarajuća vrijednost x za observacije u periodu 2 = 0 za sve observacije u periodu 1 D3 = z2 odgovarajuća vrijednost z za sve observacije u periodu 2 = 0 za sve obeservacije u periodu 1 Jednadžba za dva perioda može se zapisati na slijedeći način:

y D x D z D u 1 2 1 1 1 2 1 2 1 2 1 3( ) ( ) ( ) (4.1.7.18)

Ukupna rezidualna suma kvadrata dobije se iz procjene (4.1.7.18). Parcijalna suma kvadrata dobije se brisanjem indikator varijabli s obzirom na odgovarajuću hipotezu35. Tablica 5. Postavljene hipoteze i odgovarajuće indikator varijable koje je potrebno obrisati36

Hipoteza Indikator varijable koje je potrebno obrisati

Svi su koeficijenti jednaki

1=2, 1=2, 1=2

D1,D2,D3

Mijenja su samo konstantni članovi

1=2, 1=2

D2,D3

Mijenja se samo konstantan član i koeficijent uz z

1=2

D2

34

Maddala,G.,S., Introduction to Econometrics, MacMillan Publishing Company, Inc., New York, 1992, str.

263-266 35

vidi tablicu 4. Postavljene hipoteze i odgovarajuće indikator varijable koje je potrebno obrisati 36

Maddala,G.,S., Introduction to Econometrics, MacMillan Publishing Company, Inc., New York, 1992, str. 264

Page 27: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________27 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Sljedeći model37 određuje da troškovi se za obrazovanje po glavi stanovnika - Y, mogu objasniti s pomoću tri nezavisne varijable: X1 - osobni prihod po glavi stanovnika, X2 - proporcija populacije iznad 18 godina starosti i X3 - proporcija populacije koja stanuje u urbanim područjima. U analizi se treba fokusirati na stabilnost troškova u odnosu na vrijemenski period od tri godine (1965, 1970 i 1975) za koje su dani podaci. Vrijedi pretpostavka da veza može biti identično određena u sve tri godine što znači da se iste varijable pojavljuju u svakoj jednadžbi te da se svaka uporabljena transformacija primjenjuje u svakoj jednadžbi. Koristeći podatke koji izražavaju brojčane vrijednosti pojava odnosno varijabli u jednom vremenskom intervalu ili vremenskoj točki i podatke vremeskih serija, definiraju se dvije indikator varijable: Di1 = 1 ako je i-ti slučaj iz perioda 1965 = 0 ostalo Di2 = 1 ako je i-ti slučaj iz perioda 1970 = 0 ostalo Model je slijedeći:

Y X X X D D D X D X D X

D X D X D X u

0 1 1 2 2 3 3 1 1 2 2 1 1 1 2 1 2 3 1 3

1 2 1 2 2 2 3 2 3

(4.1.7.19) Prosječni troškovi za obrazovanje po glavi stanovnika za 1965 godinu (D1=1, D2=0): E Y D D X X X X X

X X X X

E Y D D X X X

i

i

( , , )

( , , ) ( ) ( ) ( ) ( )

1 2 0 1 1 2 2 3 3 1 2 1 1 2 2

3 3 1 1 2 2 3 3

1 2 0 1 1 1 1 2 2 2 3 3 3

1 0 1 0 1 1

1 0 0 0

1 0

(4.1.7.20) Prosječni troškovi za obrazovanje po glavi stanovnika za 1970 godinu (D1=0, D2=1): E Y D D X X X X X

X X X X

E Y D D X X X

i

i

( , , )

( , , ) ( ) ( ) ( ) ( )

1 2 0 1 1 2 2 3 3 1 2 1 1 2 2

3 3 1 1 2 2 3 3

1 2 0 2 1 1 1 2 2 2 3 3 3

0 1 0 1 0 0

0 1 1 1

0 1

(4.1.7.21) Prosječni troškovi za obrazovanje po glavi stanovnika za 1975 godinu (D1=0, D2=0): E Y D D X X X X X

X X X X

E Y D D X X X

i

i

( , , )

( , , )

1 2 0 1 1 2 2 3 3 1 2 1 1 2 2

3 3 1 1 2 2 3 3

1 2 0 1 1 2 2 3 3

0 0 0 0 0 0

0 0 0 0

0 0

(4.1.7.22)

37

Chatterjee,S., Price,B., Regression Analysis by Example, John Wiley & Sons, Inc., New York, 1988, str. 117-

121

Page 28: Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Predavanja za kolegij 'Analiza poslovnih podataka' Šarlija, 2007.

__________________________________________________________________________

_____________________________________________________________________28 6.3. Regresijski modeli koji uključuju kvantitativne i kvalitativne varijable

Kao što je ranije napomenuto, analiza nužno podrazumijeva da je varijabilnost regresijske funkcije jednaka kroz sve tri godine. S obzirom na to, hipoteza koju je potrebito testirati glasi:

H: 1 2 1 2 3 1 2 3 0 (4.1.7.23)

što zapravo znači da regresijski sustav ostaje nepromijenjen kroz cijeli period istraživanja - od 1965 do 1975.