Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
Transcript of Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
1/40
1 11
(Master)
Ligjerata 5
Metodologjia hulumtuese
Analiza e të dhënave
Prof.asc. Avdullah Hoti
2013/14
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
2/40
Literatura për këtë ligjëratë
‘Research methods for Business Students’, Saunder,M., Lewis, P. And Thornill, A., Pearson EducationLimited, Essex, 2009 Kapitulli 12, faqe 414-479
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
3/40
Përmbatja
a) Analiza e të dhënave statistikore1. Mesatarja
2. Treguesit e pozicionit: moda dhe mediana
3. Treguesit e variacionit: varianca; devijimistandard; koeficienti i variacionit
4. Indekset
5. Matësit e ndërlidhjeve në mes të variablave:kovarianca dhe koeficienti i korelacionit
b) Teknikat përshkruese të të dhënavec) Interpretimi i të dhënave
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
4/40
a) Analiza e të dhënave
4.4
Analiza e të dhënave: Për të prodhuar tregues statistikor përmes të cilëve
nxjerren përfundime cilësore për dukurinë e studiuar.
Analiza statistikore statike: hulumtimi i dukurisë në një moment të caktuar.
Analiza dinamike: hulumtimi i dukurisë nëpër kohë; ndryshimi i
variablave/ndryshoreve nëpër kohë
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
5/40
Analiza e të dhënave
1. Mesatarja
1. Mesatarja aritmetike e thjeshtë për të dhënat e pagrupuara
2. Mesatarja aritmetike e ponderuar
për të dhënat e grupuara/frekuenca
3. Mesatarja aritmetike nga të dhënat eshprehura në interval
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
6/40
Mesatarja aritmetike e thjeshtë
Popullacioni Mostra
6; _ 16
654321
nnderii
x x x x x x x
Është adekuate për të përshkruar të dhënat sasiore
Është e ndikuar nga vlerat ekstreme (outliers). Shembull:
Nëse nr mesatar i punëtorëve për firmë është 20.
në sektor hynë një firmë e re që punëson 1000 punëtorë menjëherë,
rritet numri mesatar i punëtorëve për firmë
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
7/40
Mesatarja aritmetike e ponderuar
Raporti i shumës së fituar nga shumëzimi i të dhënaveme frekuencat e tyre, pjestuar me numrin total tëfrekuencave
frekuencat f
f f f f f f
f x f x f x f x f x f x x
654321
665544332211
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
8/40
Mesatarja aritmetike nga të dhënat interval
Të dhënat shprehen në intervale ngase: Më praktike:
mosha; vitet në shkollimi
Konfidencialiteti:
për të mbrojtur privatësinë sot ligje për formën e pyetjeve tështruara në pyetësor: shitjet, të ardhura personale
Mesatarja llogaritet si mesi i intervalit
Për kufirin e ultë dhe të lartë merret vlera e shënuar ose
inspektohen të dhënat.
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
9/40
Cilësitë e mesatares aritmetike
Renditja e të dhënave nuk ndikon në mesatarenaritmetike
Shuma e shmangieve të të dhënave individuale nga
mesatarja është baraz me zero Barazohen shmangjet pozitive me ato negative të
observimeve individuale ndaj mesatares
Zvogëlimi, zmadhimi, shumëzimi apo pjestimit i të
gjtha observimeve me një madhësi konstante (a),rezulton me të njejtin efekt në madhësinë e mesatares
aritmetike.
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
10/40
2. Treguesit e pozicionit Dy tregues të pozicionit
Moda: observimi me frekuencën më të lartë (që paraqitet më sëshpeshti) Nota më e shpeshtë, sëmundja më e shpeshtë, lloji më i shpeshtë i
aksidenteve
Mediana: mesi i serisë Observimet ‘tek’: {35,34,38,40,37,33,28,36,39}, N=9, (N+1)/2
Listo min-to-max: {28, 33, 34, 35, 36, 37, 38, 39, 40} = (9 + 1)/2=5
i pesti vrojtim në renditje = 36
Observimet ‘qift’: {19,12,19,26,28,22}, N=6, (N+1)/2 Listo min-to-max: {12,16,19,22,26,28}=(6+1)/2=3.5
Vrojtimet 3 dhe 4 = 19 dhe 22
mediana = (19+22)÷2 = 41/2=20.5
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
11/40
2. Treguesit e pozicionit
Mesi i serisë: (min+max)/2
Por, problem kur ka vlera ekstreme (outliers) Shembull:
90% e të punësuarve kanë pagë prej 200-500 euro në
muaj, 7% kanë pagë 501-800 euro në muaj
2% kanë pagë 801-1100 euro në muaj
1% kanë pagë 10,000 euro në muaj
Mesatarja trimmedE dizajnuar për të evituar efektin e vlerave ekstreme
Gjendet mesatarja aritmetike pas heqjes së vleraveekstreme
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
12/40
3.Treguesit e variacionit
4.12
Matësit e lokacionit mesatar nuk tregojnë gjendjen e pltoë
për shpërndarjen e të dhënave rreth qendrës/mesatares
Shembull:
• Dy grupe studentësh me
nga 50 studentë• Rezultati mesatar në testin
A = 50% për të dy grupet:
• Pra mesatarja ekalueshmërisë është
e njëjtë për dy grupet• Por klasa me të kuqe ka më
shumë variacion në rezultatse klasa me të kaltër.
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
13/40
3.Treguesit e variacionit…
Gjërësia e variacionit
Treguesi me i thjeshtë i variacionit= vrojtimi me vlerën më të lartë (maksimale) – vrojtimi
me vlerën më të vogël (minimale)
Shembull Të dhënat: {4, 4, 4, 4, 50} Range = 46
Të dhënat : {4, 8, 15, 24, 39, 50} Range = 46
Lehtë llogaritet
E metë kryesore: pamundësia për të ditur shpërndarjen etë gjitha vrojtimeve në mes min dhe max
Andaj më informues matësi i variacionit që përfshin tëgjitha të dhënat e jo vetëm vlerat minimale dhe
maksimale.
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
14/40
3. Treguesit e variacionit
4.14
Varianca (shmangia mesatare kuadratike)
paraqet madhesine mesatare te diferencave absolute ne mes temesatares aritmetike dhe vlerave individuale te serise statistikore.
Llogarit mesataren aritmetike
Seritë e thjeshta:
Llogarit devijimin e secilit vrojtim nga mesatarja,
të gjitha në katror, dhe
shumën e devijimeve e pjeston me numrin e vrojtimeve.
Seritë e ponderuara:
Llogarit devijimin e secilit vrojtim nga mesatarja,
të gjitha në katror,
shumëzo me numrin e frekeuncave përkatëse dhe
shumën pjesto me numrin e frekuencave.
2
2 1
( )n
i
i
X X
n
2
2 1
( )n
i
i
i X X
i
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
15/40
3. Treguesit e variacionit
4.15
Devijimi standard
Është rrënja katrore e variancës Përdoret për të krahasuar variacionin e distribuimeve dhe
formën e distribuimit.
Nëse histogrami ka formën e ziles atëherë, rregulla empirike:
Rreth 68% e të gjitha observimeve gjinden brenda 1 devijimistandard nga mesatarja.
Rreth 95% e të gjitha observimeve gjinden brenda 2devijimeve standarde nga mesatarja.
Rreth 99.7% e të gjitha observimeve gjinden brenda 3devijimive standarde nga mesatarja.
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
16/40
3. Treguesit e variacionit
4.16
Devijimi standard: Interpretimi
Sa më i vogël, observimet janë më afërmesatares aritmetike.
Rreth 68% e të gjitha observimeve gjinden
brenda 1 devijimi standard nga mesatarja.
Rreth 95% e të gjitha observimeve gjinden
brenda 2 devijimeve standarde nga mesatarja.
Rreth 99.7% e të gjitha observimeve gjinden
brenda 3 devijimeve standarde nga mesatarja.
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
17/40
3. Treguesit e variacionit
Devijimi standard: Interpretimi Mesatarja e shpenzimeve telefonike 14 euro
Devijimi standard 4 euro
Bazuar në “Rregullën empirike” rreth 68% e personave shpenzojnë në mes të (14-4) dhe
(14+4)=10-18 euro
Rreth 95% e personave shpenzojnë në mes të (14-4*2)
dhe (14+4*2)=6-22 euro Rreth 98% e personave shpenzojnë në mes të (14-4*3)
dhe (14+4*3)=2-26 euro
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
18/40
3. Treguesit e variacionit
Koeficienti i varicionit:
Devijimi standard pjestuar me mesataren:
Shpreh shmangiet mesatare të vrojtimeve në % ngamesatarja aritmetike.
Sa më homogjene të dhënat, aq më i vogël Kv
Devijimi standard prej 10 mund të konsiderohet i
lartë kur mestarja është 100, por jo shumë i lartë nëse mesatarja është 500,
andaj koeficienti i variacionit eshte tregues më i qartë
100 Kv X
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
19/40
4. Indekset
Për studimin e dinamikës së dukurive dhekrahasimin në mes tyre përdoren treguesitrelativ indekset
Llojet e indekseve Indekset bazë
Indekset zinxhir
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
20/40
4. Indekset:
Bazë
Raporti i nivelit të serisë kohore ndaj nivelit apomadhësisë së asaj serie të zgjedhur si bazë konstante.
Baza: Seria bazë N1
I1
={(N2
/N1
)*100}-100
I2={(N3/N1)*100}
Mbetja pozitive nënkupton rritje në krahasim me serinëbazë
Mbetja negative nënkupton rënie në krahasim me serinëbazë
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
21/40
4. Indekset
Zinxhirore Shprehin raportin e secilës seri raportuese ndaj
madhësisë/serisë paraprake si bazë
Vargore-zinxhirore ngase nivelet e serisë kalojnë prejpozitës raportuese në pozitën e bazës së indeksit
pasardhës Baza e llogaritjes së indekseve ndryshon
I1=(N2/N1)*100; I2=(N3/N2)*100; I3=(N4/N3)*100
Interpretimi në raport me periudhën paraprake =100 i pandryshuar;
mbi 100 rritje dhe
nën 100 rënie
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
22/40
5. Treguesit e ndërlidhjeve në mes të
variablave
4.22
Fuqia dhe drejtimi i lidhjeve lineare në mes tëdy variablave (nëse egziston ndërlidhja).
Kovarianca – a egziston ndonjë ndërlidhje në
lëvizjen e dy variablave? Koeficienti i korelacionit – sa e fortë është
ndërlidhja në mes dy variablave?
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
23/40
5. Matësit e ndërlidhjeve në mes të variablave:
Kovarianca
4.23
Mesatarja e variablës X dhe e Y
Kur dy variabla lëvizin në të njejtin drejtim,kovarianca është pozitive.
Kur dy variabla lëvizin në drejtime të kundërta,kovarianca është negative.
Kur nuk egziston kurrfarë lidhjekovarianca është numër i vogël.
5 M ë i dë lidhj ë ë i bl
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
24/40
4.24
• Tri sete: X dhe Y të njejta, ndryshon renditja e YSet 1: me rritjen e X rritet Y, Sxy pozitive dhe e lartëSet 2: me rritjen e X bie Y, Sxy negative dhe e lartë
Set 3: me rritjen e X nuk ndyrshon Y, Sxy ulët
5. Matësit e ndërlidhjeve në mes të variablave:
Kovarianca
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
25/40
4.25
Definohet si kovariancë pjestuar me devijimin standard tëtë dy variablave:
• Koeficienti tregon sa e fortë është ndërlidhja në mes të
X and Y?
• Nëse mbi 0.5 lidhja e fortë
• Merr vlera nga 0 deri 1
• Nëse dy variabla janë të lidhura pozitivisht,
koeficienti do të marrë vlerë afër +1
• Nëse dy variabla janë të lidhura negativisht,
koeficienti do të marrë vlerë afër -1
5. Matësit e ndërlidhjeve në mes të variablave:
Koeficienti i korelacionit
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
26/40
4.26
r ose r =
+1
0
-1
Lidhje pozitive
Nuk egziston ndonjë lidhje
Lidhje negative
5. Matësit e ndërlidhjeve në mes të variablave:
Koeficienti i korelacionit
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
27/40
4.27
Shembull Kovarianca 26.16
koeficienti i korelacionit 0.5365
Shpjegimi: Egziston lidhje pozitive në mes të dy
variablave të studiuara (kovarianca)
Ndërlidhja e variablave është mesatarisht efortë (koeficienti i korelacionit)
5. Matësit e ndërlidhjeve në mes të variablave:
Koeficienti i korelacionit
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
28/40
Simbolet në statistikë
4.28
Popullacioni Mostra
Madhësia N n
Mesatarja
Varianca S2
Devijimi
StandardS
Koeficienti i
variacionit CV cvKovarianca Sxy
Koeficienti i
korelacionitr
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
29/40
b) Teknikat përshkruese të tëdhënave
Statistika është mënyrë e përfitimit tëinformacioneve nga të dhënat
Përshkrimi i të dhënave për: Për raportime
Udhëzojnë për analiza të mëtutjeshme
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
30/40
Paraqitja tabelare dhe grafike
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
31/40
Paraqitja e statistikave të dy variablave
Cross tabulation-tabulimi për të shpjeguar marrëdhënien në mes
dy variablaveNjë mostër e lexuesve të gazetave të pyetur se cilat gazeta ata lexojnë: Globe andMail (1), Post (2), Star (3), ose Sun (4), dhe të shënojnë nëse ata janë punëtorë të
pashkolluar (1), të shkolluar (2), ose professional (3).
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
32/40
Grafiket per lidhjen ne mës te dy variablave
2.32
Profesionalistet
tentojne te lexojne
me shume Globe &
Mail dy here me
shume sesa Star ose
Sun…
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
33/40
Diagramet
Sa më e madhe shtëpia më i shtrenjtë cmimi i shtëpisë…
Zakonisht dukuritë dinamike
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
34/40
Diagramet scatter
2.34
Lidhje pozitive Lidhje negative
Lidhje e dobet ose nuk egziston lidhje
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
35/40
c) Interpretimi i të dhënave
Përmbledh çështjet kyçe që dalin ngatabela (ne vend te shih Tabelen X)Evito tendencën për të raportuar të
gjitha shifrat në tabelë ose grafikë
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
36/40
36
Në vitin 1986, eksplodimi i anijes kozmike, ku 7
astronautë kanë vdekur, është shembulli më i mirë ikomunikimit të dobët të numrave. Një natë para se tënisej, u udhëzua të mos nisej anija për shkak tëtemperaturave të ulta që do të dëmtonin disa pjesë të
anijes. Grafikët e pregatitur në nxitim u fokusuan nëinformata selektive (ndikimi i temperaturave të ulta)duke harruar informata të rëndësishme. NASA (The
National Aeronautics and Space Administration) nuk u
bind nga argumentet dhe anija u lëshua duke eksploduar brenda 7 sekondave.
c) Interpretimi i të dhënave
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
37/40
2.37
Prej vitit 1993 deri ne vitin 2001 në Amerikë kishte rritje të
madhe të të hyrave nga tatimet, kur edhe filloi rënia.
c) Interpretimi i të dhënave
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
38/40
Reth gjysma e faturave (71+37=108)Janë të “vogla”, Më pak se $30
Janë vetëm disa faturatelefonike të madhësisë
mesatare.
Rretj 1/3 e telfonatave janë$90 e më shumë
c) Interpretimi i të dhënave
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
39/40
Disa rregulla për paraqitjen e të dhënave
në tabela dhe grafikë
39
Para tabelës ose diagramëve njofto lexuesin me tabelë: konkludimin e nxjerrë nga tabela
Seksioni/kapitulli nuk përfundohet me tabelë
Titulli i tabelës: periudha, njësia matëse Burimi i të dhënave Rrumbullakso vlerat (249,567 sheno si 250,000) Të dhënat që krhasohen vendosi afër
Vijat nëpër tabelë pengojnë krahasimin. Vendos vlerat në të djathtë Evitoni shkurtesat Totali
-
8/19/2019 Ligjerata e 5 Me Titull Analiza e Te Dhenave Nga l
40/40
Shembull.1
Duke përdorur të dhëna për një problemhulumtues me interes për ju, llogaritni:
a) Mesatarën
b) Moda dhe medianac) Gjeresia e variacionit
d) Shmangia mesatare absolute
e) Variacionif) Devijimi satandard,dhe
g)