Met Hulumtuese L05 Analiza e te dhenave · PDF fileLigjerata 5 Metodologjia hulumtuese ......
Transcript of Met Hulumtuese L05 Analiza e te dhenave · PDF fileLigjerata 5 Metodologjia hulumtuese ......
1 11
(Master)
Ligjerata 5
Metodologjia hulumtuese
Analiza e të dhënave
Prof.asc. Avdullah Hoti
Literatura për këtë ligjëratë
� ‘Research methods for Business Students’, Saunder, M., Lewis, P. And Thornill, A., Pearson Education Limited, Essex, 2009� Kapitulli 12, faqe 414-479
Përmbatja
Analiza e të dhënave statistikore
1. Mesatarja
2. Treguesit e pozicionit: moda dhe mediana
3. Treguesit e variacionit: varianca; devijimistandard; koeficienti i variacionit
4. Indekset
5. Matësit e ndërlidhjeve në mes të variablave: kovarianca dhe koeficienti i korelacionit
a) Analiza e të dhënave
4.4
� Analiza e të dhënave: � Për të prodhuar tregues statistikor përmes të cilëve
nxjerren përfundime cilësore për dukurinë e studiuar.
� Analiza statistikore statike: � hulumtimi i dukurisë në një moment të caktuar.
� Analiza dinamike: � hulumtimi i dukurisë nëpër kohë; ndryshimi i
variablave/ndryshoreve nëpër kohë
Analiza e të dhënave
1. Mesatarja
1. Mesatarja aritmetike e thjeshtë
� për të dhënat e pagrupuara
2. Mesatarja aritmetike e ponderuar
�për të dhënat e grupuara/frekuenca
3. Mesatarja aritmetike nga të dhënat e shprehura në interval
Mesatarja aritmetike e thjeshtë
Popullacioni Mostra
6;_1
6
654321
==
+++++=
nnderii
xxxxxxx
� Është adekuate për të përshkruar të dhënat sasiore
� Është e ndikuar nga vlerat ekstreme (outliers). � Shembull:
� Nëse nr mesatar i punëtorëve për firmë është 20.
� në sektor hynë një firmë e re që punëson 1000 punëtorë menjëherë,
� rritet numri mesatar i punëtorëve për firmë
Mesatarja aritmetike e ponderuar
Raporti i shumës së fituar nga shumëzimi i të dhënave me frekuencat e tyre, pjestuar me numrin total të frekuencave
frekuencatf
ffffff
fxfxfxfxfxfxx
=
+++++
+++++=
654321
665544332211
Mesatarja aritmetike nga të dhënat interval
� Të dhënat shprehen në intervale ngase:
� Më praktike: � mosha; vitet në shkollimi
� Konfidencialiteti: � për të mbrojtur privatësinë sot ligje për formën e pyetjeve të
shtruara në pyetësor: shitjet, të ardhura personale
� Mesatarja llogaritet si mesi i intervalit
� Për kufirin e ultë dhe të lartë merret vlera e shënuar ose inspektohen të dhënat.
Cilësitë e mesatares aritmetike
� Renditja e të dhënave nuk ndikon në mesataren aritmetike
� Shuma e shmangieve të të dhënave individuale nga mesatarja është baraz me zero
� Barazohen shmangjet pozitive me ato negative të observimeve individuale ndaj mesatares
� Zvogëlimi, zmadhimi, shumëzimi apo pjestimit i të
gjtha observimeve me një madhësi konstante (a),
rezulton me të njejtin efekt në madhësinë e mesatares
aritmetike.
2. Treguesit e pozicionit� Dy tregues të pozicionit
� Moda: observimi me frekuencën më të lartë (që paraqitet më së shpeshti)� Nota më e shpeshtë, sëmundja më e shpeshtë, lloji më i shpeshtë i
aksidenteve
� Mediana: mesi i serisë� Observimet ‘tek’: {35,34,38,40,37,33,28,36,39}, N=9, (N+1)/2
� Listo min-to-max: {28, 33, 34, 35, 36, 37, 38, 39, 40} = (9 + 1)/2=5
� i pesti vrojtim në renditje = 36
� Observimet ‘qift’: {19,12,19,26,28,22}, N=6, (N+1)/2� Listo min-to-max: {12,16,19,22,26,28}=(6+1)/2=3.5
� Vrojtimet 3 dhe 4 = 19 dhe 22
� mediana = (19+22)÷2 = 41/2=20.5
2. Treguesit e pozicionit
� Mesi i serisë: (min+max)/2
� Por, problem kur ka vlera ekstreme (outliers)� Shembull:
� 90% e të punësuarve kanë pagë prej 200-500 euro në muaj,
� 7% kanë pagë 501-800 euro në muaj
� 2% kanë pagë 801-1100 euro në muaj
� 1% kanë pagë 10,000 euro në muaj
� Mesatarja trimmed
� E dizajnuar për të evituar efektin e vlerave ekstreme
� Gjendet mesatarja aritmetike pas heqjes së vleraveekstreme
3.Treguesit e variacionit
4.12
� Matësit e lokacionit mesatar nuk tregojnë gjendjen e pltoë për shpërndarjen e të dhënave rreth qendrës/mesatares
Shembull:
• Dy grupe studentësh me nga 50 studentë
• Rezultati mesatar në testin A = 50% për të dy grupet:
• Pra mesatarja e kalueshmërisë është e njëjtë për dy grupet
• Por klasa me të kuqe ka mëshumë variacion në rezultatse klasa me të kaltër.
3.Treguesit e variacionit…
Gjërësia e variacionit
� Treguesi me i thjeshtë i variacionit
= vrojtimi me vlerën më të lartë (maksimale) – vrojtimime vlerën më të vogël (minimale)
� Shembull� Të dhënat: {4, 4, 4, 4, 50} Range = 46
� Të dhënat : {4, 8, 15, 24, 39, 50} Range = 46
� Lehtë llogaritet
� E metë kryesore: pamundësia për të ditur shpërndarjen etë gjitha vrojtimeve në mes min dhe max
� Andaj më informues matësi i variacionit që përfshin tëgjitha të dhënat e jo vetëm vlerat minimale dhemaksimale.
3. Treguesit e variacionit
4.14
Varianca (shmangia mesatare kuadratike)
� paraqet madhesine mesatare te diferencave absolute ne mes te mesatares aritmetike dhe vlerave individuale te serise statistikore.
� Llogarit mesataren aritmetike
� Seritë e thjeshta:
� Llogarit devijimin e secilit vrojtim nga mesatarja,
� të gjitha në katror, dhe
� shumën e devijimeve e pjeston me numrin e vrojtimeve.
� Seritë e ponderuara:
� Llogarit devijimin e secilit vrojtim nga mesatarja,
� të gjitha në katror,
� shumëzo me numrin e frekeuncave përkatëse dhe
� shumën pjesto me numrin e frekuencave.
2
2 1
( )n
i
i
X X
nσ =
−
=∑
2
2 1
( )n
i
i
i X X
iσ =
ƒ −
=ƒ
∑
∑
3. Treguesit e variacionit
4.15
Devijimi standard
� Është rrënja katrore e variancës
� Përdoret për të krahasuar variacionin e distribuimeve dheformën e distribuimit.
� Nëse histogrami ka formën e ziles atëherë, rregulla empirike:
� Rreth 68% e të gjitha observimeve gjinden brenda 1 devijimistandard nga mesatarja.
� Rreth 95% e të gjitha observimeve gjinden brenda 2 devijimeve standarde nga mesatarja.
� Rreth 99.7% e të gjitha observimeve gjinden brenda 3 devijimive standarde nga mesatarja.
3. Treguesit e variacionit
4.16
� Devijimi standard: Interpretimi
� Sa më i vogël, observimet janë më afër
mesatares aritmetike.
� Rreth 68% e të gjitha observimeve gjinden
brenda 1 devijimi standard nga mesatarja.
� Rreth 95% e të gjitha observimeve gjinden
brenda 2 devijimeve standarde nga mesatarja.
� Rreth 99.7% e të gjitha observimeve gjinden
brenda 3 devijimeve standarde nga mesatarja.
3. Treguesit e variacionit
Devijimi standard: Interpretimi
� Mesatarja e shpenzimeve telefonike 14 euro
� Devijimi standard 4 euro
� Bazuar në “Rregullën empirike”� rreth 68% e personave shpenzojnë në mes të (14-4) dhe
(14+4)=10-18 euro
� Rreth 95% e personave shpenzojnë në mes të (14-4*2) dhe (14+4*2)=6-22 euro
� Rreth 98% e personave shpenzojnë në mes të (14-4*3) dhe (14+4*3)=2-26 euro
3. Treguesit e variacionit
Koeficienti i varicionit:
� Devijimi standard pjestuar me mesataren:
� Shpreh shmangiet mesatare të vrojtimeve në % ngamesatarja aritmetike.
� Sa më homogjene të dhënat, aq më i vogël Kv
� Devijimi standard prej 10 mund të konsiderohet ilartë kur mestarja është 100,� por jo shumë i lartë nëse mesatarja është 500,
� andaj koeficienti i variacionit eshte tregues më i qartë
100KvX
σ=
4. Indekset
� Për studimin e dinamikës së dukurive dhe krahasimin në mes tyre përdoren treguesit relativ� indekset
� Llojet e indekseve� Indekset bazë
� Indekset zinxhir
4. Indekset:
Bazë
� Raporti i nivelit të serisë kohore ndaj nivelit apo madhësisë së asaj serie të zgjedhur si bazë konstante.
� Baza: Seria bazë N1
� I1={(N2/N1)*100}-100
� I2={(N3/N1)*100}
� Mbetja pozitive nënkupton rritje në krahasim me serinë bazë
� Mbetja negative nënkupton rënie në krahasim me serinë bazë
4. Indekset
Zinxhirore� Shprehin raportin e secilës seri raportuese ndaj
madhësisë/serisë paraprake si bazë
� Vargore-zinxhirore ngase nivelet e serisë kalojnë prej pozitës raportuese në pozitën e bazës së indeksit pasardhës
� Baza e llogaritjes së indekseve ndryshonI1=(N2/N1)*100; I2=(N3/N2)*100; I3=(N4/N3)*100
� Interpretimi në raport me periudhën paraprake� =100 i pandryshuar;
� mbi 100 rritje dhe
� nën 100 rënie
5. Treguesit e ndërlidhjeve në mes të
variablave
4.22
� Fuqia dhe drejtimi i lidhjeve lineare në mes tëdy variablave (nëse egziston ndërlidhja).
� Kovarianca – a egziston ndonjë ndërlidhje nëlëvizjen e dy variablave?
� Koeficienti i korelacionit – sa e fortë ështëndërlidhja në mes dy variablave?
5. Matësit e ndërlidhjeve në mes të variablave:
Kovarianca
4.23
Mesatarja e variablës X dhe e Y
�Kur dy variabla lëvizin në të njejtin drejtim,�kovarianca është pozitive.
�Kur dy variabla lëvizin në drejtime të kundërta, �kovarianca është negative.
�Kur nuk egziston kurrfarë lidhje �kovarianca është numër i vogël.
4.24
• Tri sete: X dhe Y të njejta, ndryshon renditja e YSet 1: me rritjen e X rritet Y, Sxy pozitive dhe e lartëSet 2: me rritjen e X bie Y, Sxy negative dhe e lartëSet 3: me rritjen e X nuk ndyrshon Y, Sxy ulët
5. Matësit e ndërlidhjeve në mes të variablave:
Kovarianca
4.25
Definohet si kovariancë pjestuar me devijimin standard të të dy variablave:
• Koeficienti tregon sa e fortë është ndërlidhja në mes të
X and Y?
• Nëse mbi 0.5 lidhja e fortë
• Merr vlera nga 0 deri 1
• Nëse dy variabla janë të lidhura pozitivisht,
koeficienti do të marrë vlerë afër +1
• Nëse dy variabla janë të lidhura negativisht,
koeficienti do të marrë vlerë afër -1
5. Matësit e ndërlidhjeve në mes të variablave:
Koeficienti i korelacionit
4.26
ρ ose r =
+1
0
-1
Lidhje pozitive
Nuk egziston ndonjë lidhje
Lidhje negative
5. Matësit e ndërlidhjeve në mes të variablave:
Koeficienti i korelacionit
4.27
Shembull
� Kovarianca 26.16
� koeficienti i korelacionit 0.5365
� Shpjegimi: � Egziston lidhje pozitive në mes të dy
variablave të studiuara (kovarianca)
� Ndërlidhja e variablave është mesatarisht e fortë (koeficienti i korelacionit)
5. Matësit e ndërlidhjeve në mes të variablave:
Koeficienti i korelacionit
Simbolet në statistikë
4.28
Popullacioni Mostra
Madhësia N n
Mesatarja
Varianca S2
Devijimi
StandardS
Koeficienti i
variacionitCV cv
Kovarianca Sxy
Koeficienti i
korelacionitr
Shembull.1
Duke përdorur të dhëna për një problem hulumtues me interes për ju, llogaritni:
a) Mesatarën
b) Moda dhe mediana
c) Gjeresia e variacionit
d) Shmangia mesatare absolute
e) Variacioni
f) Devijimi satandard,dhe
g) Koeficienti i variances