MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2) · Razvoj procedura kojima se novi predmeti...
Transcript of MARKETINŠKO ISTRAŽIVANJE IX. Analiza podataka (2) · Razvoj procedura kojima se novi predmeti...
1
MARKETINŠKO ISTRAŽIVANJE
• Decembar 2014
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
2
IX. Analiza podataka (2) 1. Diskriminaciona analiza 2. Kanonička korelaciona analiza 3. Faktorska analiza 4. Analiza skupina 5. Multidimenzionalno skaliranje 6. Analiza združenih efekata
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
3
IX.1. Diskriminaciona analiza
• Koncept diskriminacione analize • Diskriminaciona analiza za dve grupe • Višestruka diskriminaciona analiza
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
4
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
2
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
5
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na varijablama
Fokus na objektima
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA - Višestruka regresija - Diskriminaciona anal. - Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
6
Koncept diskriminacione analize
• Ciljevi diskriminacione analize • Koncept diskriminacione analize • Metodologija diskriminacione analize
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
7
Šta je diskriminaciona analiza? • Diskriminaciona analiza je tehnika koja se koristi
za klasifikaciju jedinica posmatranja u jednu od dve ili više alternativnih grupa (populacija) na osnovu određenog skupa merenja
• Razgraničenje po kome se jedinice posmatranja dodeljuju grupama definiše diskriminaciona funkcija
• Diskriminacionom analizom se identifikuju varijable kojima se vrše diskriminacija (razgraničenje, razlikovanje) između jedinica posmatranja deleći ih u dve ili više grupa.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
8
Ciljevi diskriminacione analize 1. Određivanje linearne kombinacije nezavisnih varijabli
kojima bi se odvojile grupe tako da se maksimizira varijabilitet između grupa, u odnosu na varijabilitet unutar grupa (t.j. predmeti posmatranja u različitim grupama su maksimalno razdvojeni)
2. Razvoj procedura kojima se novi predmeti posmatranja sa poznatim profilima dodeljuju jednoj od dve (ili više) grupa
3. Testiranje značajnosti razlika između dve grupe na osnovu centroida grupe
4. Određivanje koje varijable imaju najznačajniji uticaj u objašnjavanju razlike između grupa.
3
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
9
Tačka razdvajanja, C
Procenat članova populacije 1 pogrešno klasifikovanih u
populaciju 2
Procenat članova populacije 2 pogrešno klasifikovanih u
populaciju 1
X2 X1
Populacija 2 Populacija 1
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
10
Koncept diskriminacione analize • Potrebno je razdvojiti dve populacije po
promenljivoj X, čija je srednja vrednost jednaka za populaciju 1 i za populaciju 2
• Ako obe populacije imaju istu varijansu, onda je C obično dato sa:
• Tada su verovatnoće obe greške jednake • U praksi se populacije odvajaju po više od jedne
varijable, odnosno treba da se formira linearna kombinacija tih varijabli.
1X2X
2X X 21 +=C
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
11
Metodologija diskriminacione analize
• Traži se linearna kombinacija nezavisnih varijabli kako bi se na najbolji način razdvojile unapred definisane grupe
• Odgovarajući kriterijum je da se varijansa između grupa maksimizira u odnosu na varijanse unutar grupa
• Tako se dobija: Z = b1X1 + b2X2 + b3X3 + . . . + bnXn
Z → diskriminacioni skor (diskriminaciona funkcija ili osa) b → diskriminacioni ponderi X → nezavisne varijable (prediktori).
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
12
Centroidi • Za testiranje hipoteze o jednakosti sredina grupa za
dve ili više grupa koriste se diskriminaciona analiza i ANOVA
• U diskriminacionoj analizi se računa diskriminacioni skor za svaku jedinicu posmatranja u svakoj grupi, a zatim računa prosečna vrednost skora za svaku grupu
• Sredina grupe, definisana kao vektor čiji su elementi srednje vrednosti grupe za svaku od opserviranih promenljivih, se naziva centroid grupe
• Poređenje centroida grupa pokazuje koliko su grupe međusobno udaljene od diskriminacione funkcije.
4
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
13
Diskriminaciona analiza za dve grupe
• Diskriminaciona funkcija • Skor odsecanja za dve grupe • Ocenjivanje diskriminacione funkcije • Testiranje značajnosti • Tumačenje diskriminacionih pondera
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
14
Pregled postupka diskriminacione analize
• Za sprovođenje diskriminacione analize treba preduzeti sledeće postupke: 1. Formirati grupe 2. Oceniti diskriminacionu funkciju 3. Odrediti značajnost funkcije i varijabli 4. Interpretirati diskriminacionu funkciju, i 5. Izvesti klasifikaciju i validaciju.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
15
Diskriminaciona funkcija • Diskriminacione funkcija se određuje
korišćenjem generalizovane mere udaljenosti između centroida grupa
• Ova mera se izračunava poređenjem raspodele diskriminacionih skorova za dve ili više grupa
• Diskriminaciona funkcija dobro odvaja grupe ako je preklapanje raspodela diskriminacionih skorova malo, i obrnuto
• Primer sa dve grupe, A i B, i dve mere, X1 i X2 za svakog člana ove dve grupe, čime se dobija...
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
16
5
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
17
Skor odsecanja za dve grupe • Na osnovu diskriminacione funkcije formulišu se
(jednodimenzioni) Z-diskriminacioni skorovi i dobija jednodimenzionalna raspodela na Z-osi
• Njihova srednja vrednost za svaku grupu je centroid grupe
• Proporcija pogotka, t.j. procenat pravilno klasifikovanih slučajeva se određuje računanjem jedinstvenog skora odsecanja
• Vrednosti ispod skora odsecanja idu u prvu grupu, a one iznad se klasifikuju u drugu grupu
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
18
Dodeljivanje grupama za dve jednake grupe
AZ BZKlasifikuje se kao grupa A
Klasifikuje se kao grupa B
2Z Z BA +=odseZ
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
19
Dodeljivanje grupama za dve grupe različite veličine
AZ BZ
Optimalna,
poderisana tačka odsecanja
Neponderisana tačka odsecanja
nn
Zn Zn
BA
BAABsecod +
+=Z
Klasifikovano u grupu A Klasifikovano u
grupu B Decembar 2014 Istraživanje tržišta
Ekonomski fakultet, Beograd 20
Poređenje regresione i diskriminacione analize
• Posmatrano kao skup simbola, ove dve tehnike izgledaju isto. Ipak, razlike su koceptualno suštinske: – Cilj regresione analize je da oceni populacijsku srednju
vrednost zavisne varijable na osnovu poznatih vrednosti nezavisnih varijabli. Na osnovu određenih pretpostavki se ocenjuju parametri koji imaju željene karakteristike
– Cilj diskriminacione analize je da se pronađe linearna kombinacija nezavisnih varijabli kojom se maksimizira diskriminacija između dve grupe i minimizira verovatnoća pogrešnog klasifikovanja u odgovarajuće grupe. Formuliše se strategija za precizno klasifikovanje predmeta posmatranja u odgovarajuće grupe
6
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
21
Ocenjivanje diskriminacione funkcije
• Broj diskriminacionih funkcija koje se mogu izvesti je min (m – 1, p), gde je m broj modaliteta zavisne varijable, a p broj nezavisnih promenljivih
• Kod direktne metode ocenjivanja sve nezavisne varijable su uključene u diskriminacionu funkciju
• Parametri - diskriminacioni ponderi - se ocenjuju tako da se maksimizira varijabilitet između grupa, u odnosu na varijabilitet unutar grupa
• Time se obezbeđuje maksimalna razdvojenost grupa
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
22
Testiranje značajnosti
• Statistički se testira značajnost razlike centroida H0: µA = µB Ha: µA ≠ µB
– Vilksovo λ predstavlja proporciju varijabiliteta unutar grupe u odnosu na ukupan varijabilitet
– Vrednost Vilksovog λ se nalazi u intervalu (0,1) – Veće vrednosti λ ukazuju da se sredine grupa ne
razlikuju i obrnuto – Značajnost se testira korišćenjem F-rasporeda – Ako se odbaci nulta hipoteza, rezultat se interpretira.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
23
Tumačenje diskriminacionih pondera
• Mogu se tumačiti slično kao regresioni koeficijenti, i govore o jačini uticaja odgovarajuće varijable
1. Visoke standardizovane vrednosti diskriminacionih pondera znače da odgovarajuće varijable više doprinose diskriminacionoj snazi funkcije
2. Relativni značaj nezavisnih varijabli proizilazi i iz koeficijenata korelacije strukture (prosta korelacija između svakog prediktora i diskriminacione funkcije), koji se zovu i kanonička opterećenja ili diskriminaciona opterećenja
• Obe vrednosti su osetljive na veličinu uzorka u odnosu na broj nezavisnih varijabli (min. 20:1)
Da li uspevate da položite sve ispite u roku? Mean
Std. Deviation
Valid N (listwise) Unweighted Weighted
da Starost studenta 20.5455 .73855 22 22.000 Prosek ocena na studijama
8.2523 .82720 22 22.000
ne Starost studenta 21.4638 1.71995 69 69.000 Prosek ocena na studijama
7.3125 .57859 69 69.000
Total Starost studenta 21.2418 1.58704 91 91.000 Prosek ocena na studijama
7.5397 .75914 91 91.000
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
24
Deskriptivne mere za primer iz diskriminacione analize
7
Ocena diskriminacione funkcije – nestandardizovani diskriminacioni koeficij.
Function
1 Starost studenta -.398 Prosek ocena na studijama 1.387 (Constant) -1.877
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
25
Canonical Discriminant Function Coefficients
Unstandardized coefficients
⇒ Diskriminaciona funkcija glasi: Z= -1,877 - 0,398⋅starost studenta +
1,387⋅prosek ocena na studijama
Testiranje značajnosti varijabli • Za svaku od dve zavisne varijable (prediktore) testiramo
sledeću nultu hipotezu: H0: µda = µne; Ha: µda ≠ µne.
• Odbacujemo nultu hipotezu u oba slučaja. • Obe nezavisne varijable su statistički značajne u
objašnjavanju razlike između posmatranih grupa Decembar 2014 Istraživanje tržišta
Ekonomski fakultet, Beograd 26
Wilks' Lambda F df1 df2 Sig. Starost studenta .938 5.889 1 89 .017 Prosek ocena na studijama .716 35.313 1 89 .000
Tests of Equality of Group Means
Testiranje znajajnosti ocenjene diskriminacione funkcije
• Nakon testiranja značajnosti varijabli, potrebno je testirati i značajnost diskriminacione funkcije,
• Testiramo nultu hipotezu: H0: ocenjena diskriminaciona funkcija nije
značajna u diskriminaciji grupa; Ha: ocenjena diskriminaciona funkcija je značajna
u diskriminaciji grupa.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
27
Test of Function(s) Wilks' Lambda Chi-square df Sig. 1 .648 38.154 2 .000
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
28
Wilks' Lambda
• Pošto je p-vrednost 0, što je manje od α=0,05, zaključujemo da imamo dovoljno dokaza da odbacimo nultu hipotezu,
⇒ Ocenjena diskriminaciona funkcija dobro razdvaja ispitanike u dve grupe.
8
Interpretacija rezultata
• Karakteristične vrednosti pokazuju relativnu efikasnost svake ocenjene diskriminacione funkcije
• Pošto imamo samo dve grupe, ovde nas zanima jedino koeficijent kanoničke korelacije, jer:
0,5932 = 0,3516, ⇒ 35,16% varijanse zavisne varijable da li položite
sve ispite u roku? je objašnjeno modelom
Novembar 201 Istraživanje tržišta Ekonomski fakultet, Beograd
29
Function Eigenvalue % of Variance Cumulative % Canonical Correlation 1 .543(a) 100.0 100.0 .593
Eigenvalues
(a) First 1 canonical discriminant functions were used in the analysis.
Z = -1,877 - 0,398⋅starost studenta+1,387⋅prosek ocena na studijama • Ako se prosek ocena na studijama poveća za
jednu jedinicu onda će se diskriminacioni skor povećati za 1,387 jedinica, pod uslovom da je starost studenata konstantna.
• Ako se starost studenata poveća za jednu godinu, tada će se diskriminacioni skor smanjiti za 0,398 jedinica, pod uslovom da je prosek ocena na studijama nepromenjen.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
30
Ocena diskriminacione funkcije – standardizovani diskriminacioni koeficijenti
Function
1 Starost studenta -.649 Prosek ocena na studijama .883
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
31
Standardized Canonical Discriminant Function Coefficients
• Prosek ocena na studijama više doprinosi razdvajanju grupa, odnosno ima veći uticaj na to da li će student uspeti da položi sve ispite u roku.
Nestandardizovani, standardizovani koeficijenti i diskriminaciona opterećenja • Osnovni nedostatak nestandardizovanih koeficijenata je
to što na njihovu vrednost utiče merna skala, odnosno jedinice mere
• Osnovni nedostatak standardizovanih diskriminacionih koeficijenata je što na njihovu vrednost može uticati multikolinearnost
• Ovo se može prevazići tako što se umesto standardizovanih koeficijenata koriste diskriminaciona opterećenja i poredi njihova apsolutna vrednost da se vidi čiji je uticaj veći.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
32
9
Ocena diskriminacione funkcije –diskriminaciona opterećenja
Function
1 Prosek ocena na studijama .769 Starost studenta -.494
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
33
Structure Matrix
Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.
Poređenje redosleda uticaja standardizovanih koeficijenata i opterećenja
• Korelacija između proseka ocena na studijama i diskriminacione funkcije iznosi 0,769; između starosti studenata i diskriminacione funkcije -0,494
• Poređenje apsolutnih vrednosti opterećenja pokazuje da prosek ocena na studijama najviše doprinosi diskriminaciji.
• Kako i opterećenja i standardizovani koeficijenti pokazuju isti redosled uticaja prediktora, sledi da u ovom zadatku ne postoji multikolinearnost
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
34
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
35
Diskriminacija i validacija (1) Metoda zadržavanja: • Uzorak se deli na dva poduzorka. Jedan poduzorak se koristi
za ocenu pravila za klasifikaciju, a drugi, koji se zadržava, se koristi za validaciju.
• Klasifikaciona (diskriminaciona) matrica se sastoji iz brojeva koji otkrivaju moć predviđanja diskriminacione funkcije. Na glavnoj dijagonali se nalaze ispravne klasifikacije, a brojevi van dijagonale pokazuju pogrešne klasifikacije.
• Proporcija pogotka, t.j. procenat ispravno klasifikovanih slučajeva, je suma sa glavne dijagonale podeljena sa ukupnim brojem elemenata
• U postupku validacije, diskriminacioni ponderi ocenjeni prvim poduzorkom se primenjuju na nezavisne varijable drugog poduzorka i dobija ocena zavisne promenljive za drugi poduzorak koja se poredi sa realizacijama.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
36
Diskriminacija i validacija (2)
U-metod, t.j. unakrsna validacija: • U svakom trenutku se, sukcesivno, zadržava po jedna
opservacija, dok se diskriminaciona funkcija ocenjuje na osnovu preostalih n1 + n2 – 1 opservacija i zadržana opservacija klasifikuje na osnovu upravo ocenjene diskriminacione funkcije
• Postupak se ponavlja sve dok se ne klasifikuju sve opservacije. Ako označimo sa m1 i m2 broj pogrešno klasifikovanih opservacija iz prvog i drugog uzorka, onda je ocenjena stopa greške klasifikacije (diskriminacije) data sa
• P1 = m1/n1 i P2 = m2/n2.
10
Diskriminacioni skorovi centroida grupa
Da li uspevate da polozite sve ispite u roku?
Function 1
da 1.290 ne -.411
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
37
Skor odsecanja za dve grupe se računa prema sledećem obrascu:
Zodsec =nneZda + ndaZne
nda + nne
Klasifikacija u diskriminacionoj analizi
• Diskriminacioni skor za svaki predmet posmatranja se računa na osnovu običnih (nestandardizovanih) diskriminacionih koeficijenata i konkretnih vrednosti prediktora
• Centroid je prosek diskriminacionih skorova za sve predmete posmatranja u toj grupi
• Klasifikacija se odnosi na dodeljivanje predmeta posmatranja unapred definisanim grupama
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
38
Klasifikacija pomoću diskriminacionog skora
• Ako je diskriminacioni skor studenta veći od skora odsecanja, on se klasifikuje u grupu sa višim centroidom
• Ako je diskriminacioni skor niži od skora odsecanja, takav student bi se klasifikovao u grupu sa niži centroidom
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
39
Klasifikacija pomoću funkcije klasifikacije
Da li uspevate da polozite sve ispite u roku?
da ne Starost studenta 7.308 7.889 Prosek ocena na studijama 16.501 13.988 (Constant) -143.851 -136.501
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
40
Classification Function Coefficients
Fisher's linear discriminant functions
11
• Odnosno:
• Za konkretnog ispitanika se računaju vrednosti ovih funkcija i on svrstava u grupu čija je vrednost klasifikacione funkcije veća.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
41
Zda = -143,851 + 7,308 ⋅starost studenta + + 16,501 ⋅prosek ocena na studijama
Zne = -136,501 + 7,889 ⋅ starost studenta + + 13,988 ⋅ prosek ocena na studijama
Validacija diskriminacione funkcije
• Proporcija pogotka pokazuje u kom procentu je izračunata diskriminaciona funkcija ispravno klasifikovala predmete posmatranja
• Ona se može izračunati i uz pomoć matrice klasifikacije
• Za dve grupe proporcija pogotka se računa kao:
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
42
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
43
Prva klasifikaciona matrica
Da li uspevate da polozite sve ispite u roku?
Predicted Group Membership Total
da ne da
Original Count
da 17 5 22 ne 10 59 69
% da 77.3 22.7 100.0 ne 14.5 85.5 100.0
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
44
• Ovde posmatramo rezultate klasifikacije na uzorku na kome je ocenjena diskriminaciona funkcija
• Proporcija pogotka iznosi:
12
Druga klasifikaciona matrica
Da li uspevate da polozite sve ispite u roku?
Predicted Group Membership Total
da ne da
Cross-validated
Count da 16 6 22 ne 10 59 69
% da 72.7 27.3 100.0 ne 14.5 85.5 100.0
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
45
• Ovde su prikazani rezultati klasifikacije ispitanika metodom unakrsne validacije
• Proporcija pogotka sada iznosi:
Treća klasifikaciona matrica
Da li uspevate da polozite sve ispite u roku?
Predicted Group Membership Total
da ne da
Original Count
da 6 3 9 ne 2 22 24
% da 66.7 33.3 100.0 ne 8.3 91.7 100.0
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
46
• Ovde vidimo rezultate klasifikacije primenom metode zadržavanja
• Proporcija pogotka sada iznosi:
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
47
Višestruka diskriminaciona analiza
• Diskriminacione funkcije • Statistička značajnost
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
48
Diskriminacione funkcije kod višestruke diskriminacije
• Isto se traži osa sa osobinom da se maksimizira odnos varijabiliteta između grupa i varijabiliteta unutar grupa, a koji su projektovani na ovu osu
• Komplikovanije je ovo obaviti sa tri i više grupa, te značajan potencijal diskriminacije ostaje neiskorišćen
• Za m grupa i p nezavisnih varijabli ukupan broj mogućih diskriminacionih funkcija je min (m – 1, p)
• Od, obično, m-1 diskriminacionih funkcija neće sve biti statistički značajne
• Tada se postiže ušteda u broju dimenzija.
13
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
49
Značajnost i interpretacija diskriminacionih funckija
• Ako se nekoliko funkcija testira istovremeno, Vilksovo λ se dobija kao proizvod jednodimenzionih λ svake pojedinačne funkcije
• Postupak interpretacije se ne menja • Određivanje pripadnosti grupi se komplikuje
kada postoji više diskriminacionih funkcija i grupa.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
50
IX.2. Kanonička korelaciona analiza
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
51
Tehnike za analizu podataka
Univarijacione tehnike
Multivarijacione tehnike
Posmatra se samo jedna promenljiva
Posmatra se više promenljivih istovremeno
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
52
Multivarijacione tehnike
Tehnike zavisnosti
Fokus na varijablama
Fokus na objektima
- Faktorska analiza
- Analiza skupina
- Višedimen-zionalno skaliranje
Jedna zavisna varijabla
Više zavisnih varijabli
- ANOVA i ANCOVA - Višestruka regresija - Diskriminaciona anal. - Analiza združenih
efekata
- MANOVA i MANCOVA
- Kanonička korelacija
Tehnike međuzavisnosti
14
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
53
Kanonička korelaciona analiza
• Primenjuje se kada postoje dve ili više varijabli kriterijuma (zavisnih) i više prediktora (nezavisnih varijabli)
• Predstavlja proširenje koncepta višestruke regresije
• Posmatra se povezanost između dva skupa varijabli (skupa zavisnih varijabli i skupa nezavisnih varijabli) definisanih na intervalnoj skali
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
54
Postupak kanoničke korelacione analize (1)
Kanonička korelacija može da se definiše kao korelacija između linearne kombinacije zavisnih varijabli i linearne kombinacije
nezavisnih varijabli. – Maksimizira se korelacija dve linearne kombinacije varijabli – Skup kanoničkih koeficijenata ili pondera se određuje za
skup nezavisnih varijabli (prediktora): U = a1X1 + a2X2 + ... + aqXq,
– Skup kanoničkih koeficijenata ili pondera se određuje i za skup kriterijuma (zavisnih varijabli) V = b1Y1 + b2Y2 + ... + bpYp
– Korelacija između U i V se naziva kanoničkom korelacijom.
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
55
Postupak kanoničke korelacione analize (2)
Kanonička korelacija može da se definiše kao korelacija između linearne kombinacije zavisnih varijabli i linearne kombinacije
nezavisnih varijabli. – Dakle, prva kanonička korelacija se dobija tako što se
maksimizira korelacija između U i V, po koeficijentima a i b – Pošto se izračuna prva kanonička korelacija i odrede prvi
kanonički par (U1 i V1), na isti način se određuje sledeći, uz uslov da su nekorelirani (ortogonalni) na prethodno određene kanonike
– Ukupan broj kanoničkih funkcija je određen sa min (p, q)
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
56
Tumačenje kanoničkih funkcija • Da bi video da li postoji smislena interpretacija, istraživač
ispituje relativnu vrednost i znake nekoliko pondera koji određuju svaku jednačinu
• Svaki kanonički faktor, odnosno kanonici (U-ovi i V-ovi) se tumači na osnovu – Nivoa značajnosti faktora, – Veličine kanoničke korelacije, i – Dela varijabiliteta jednog skupa varijabli koji je objašnjen drugim skupom
varijabli. • Osim toga, kanonička opterećenja (a-ovi i b-ovi), koja
predstavljaju korelaciju između originalnih varijabli i kanoničkih faktora, mogu se koristiti da bi se interpretirala ova funkcija.
15
Decembar 2014 Istraživanje tržišta Ekonomski fakultet, Beograd
57