spss_12_testeneparametrice.pdf

download spss_12_testeneparametrice.pdf

of 9

Transcript of spss_12_testeneparametrice.pdf

  • 8/9/2019 spss_12_testeneparametrice.pdf

    1/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    1/20Actualizat la: 07.05.2006/21:01:37

    Teste neparametrice cu SPSS

    Testele neparametrice se utilizează în următoarele situaţii:-  atunci când variabila dependentă este măsurată pe scală nominală sau

    ordinală;-  atunci când variabila dependentă este de tip categorial, indiferent de

    scala de măsurare;-  atunci când, deşi variabila dependentă este măsurată pe scală

    cantitativă (interval sau raport), nu întruneşte condiţiile impuse detestele parametrice: distribuţie care se abate grav de la forma normală –asimetrie sau boltire mari, valori excesive:

    -  volumul eşantionului este foarte mic.

    Tipurile de teste care vor fi tratate în continuare sunt următoarele:

    Teste neparametrice pentru date nominale:-  testul z pentru proporţia unui singur eşantion;-  testul z pentru diferenţa dintre proporţiile a două eşantioane;-  testul semnului;-  testul chi-pătrat al asocierii (independenţei);-  testul chi-pătrat pentru gradul de corespondenţă ( goodness of fit ).

    Teste neparametrice pentru date ordinale:-  testul Mann-Whitney (U) pentru două eşantioane independente;-  testul Wilcoxon pentru două eşantioane perechi ;-  testul Kruskal-Wallis pentru mai mult de două eşantioane independente ;-  testul Friedman pentru măsurări repetate;

    teste de corelaţie pentru date ordinale (Spearman, Kendall).

    A. Teste neparametrice pentru date nominale

    A. 1 Testul z  al proporţiei pentru un singur eşantion

    Utilizare

    Testul  z   pentru proporţii pentru un eşantion, este utilizat în cazul variabilelordihotomice, pentru a testa diferenţa dintre proporţiile valorilor în eşantion prin comparaţie cu proporţia la nivelul populaţiei.

    Exemplu: La întrebarea „cine se uită la telenovele?” răspund DA 7 subiecţi, dintrecare 5 femei şi 2 bărbaţi. Întrebarea cercetării este dacă femeile se uită într-o proporţie maimare decât bărbaţii la telenovele.

    Condiţii

    Cunoaşterea proporţiei la nivelul populaţiei pentru valorile variabilei testate. În cazulnostru, raportul femei/bărbaţi este cunoscut din studiile demografice (51%-49%)

    Aranjarea datelor

    Se creează variabila dihotomică cu valori numerice. Variabilele de tip „string” nu

    sunt acceptate de procedura SPSS. În cazul nostru, valorile sunt 1 pentru feminin şi 2 pentrumasculin.

  • 8/9/2019 spss_12_testeneparametrice.pdf

    2/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    2/20Actualizat la: 07.05.2006/21:01:37

    Procedura: Statistics-Non Parametric Tests-Binomial...

    •  Variabila testată este trecută în lista Test Variable List :• 

    În zona  Define Dichotomy  se alege Get from data, dacă variabila estedihotomică, sau Cut point , dacă variabila este continuă, prin fixarea uneivalori care împarte distribuţia în două categorii.

    •  În zona Test proportion se introduce proporţia primei categorii.•  Butonul Options  permite solicitarea statisticii descriptive pentru variabila

    testată.

    Rezultate 

    Rezultatul în cazul exemplului dat cuprinde frecvenţa pe categorii, procentul şisemnificaţia testului în raport cu proporţia la nivelul populaţiei (p=0.243).

    În acest caz, se acceptă ipoteza de nul şi se respinge ipoteza cercetării. Proporţiafemeilor care se uită la telenovele nu diferă semnificativ de proporţia bărbaţilor, prin raportarela proporţia lor în populaţia generală. 

  • 8/9/2019 spss_12_testeneparametrice.pdf

    3/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    3/20Actualizat la: 07.05.2006/21:01:37

    A. 2 Testul z al diferenţei dintre două proporţii independente

    Utilizare

    Acest test se utilizează atunci când se doreşte compararea a două proporţii obţinute

     pentru o variabilă dihotomică.Exemplu: În urma unui studiu cu privire la interesul faţă de fenomenele paranormale,efectuat în rândul studenţilor de la Universitate, comparativ cu studenţii de la Politehnică, seînregistrează următoarele rezultate1:

    •  La psihologie: 25 studenţi „nu cred” în fenomenele paranormale, iar 175„cred”

    •  La politehnică: 124 „nu cred” în fenomenele paranormale, iar 32 „cred”Problema cercetării este dacă diferenţa dintre cei „cred” în fenomenele paranormale

    din cele două categorii de studenţi este semnificativă.

    Aranjarea datelor

    Datele pot fi introduse fie caz cu caz, existând o variabilă pentru opinia faţă defenomenele paranormale şi una pentru tipul de instituţie de învăţământ, fie ca în imaginea demai jos, care presupune o prealabilă sintetizare a datelor:

    •  o variabilă ( paranorm) pentru codificare „credinţei” în fenomenele

     paranormale;• 

    o variabilă ( stud_la) pentru apartenenţa la una din cele două instituţii deînvăţământ superior;

    •  o variabilă ( frecv) pentru frecvenţa cazurilor.

      Este important de reţinut faptul că toate variabilele trebuie să fie numerice. În baza dedate de mai sus, variabila  paranorm ia valoarea 1 pentru „cred” şi valoarea 2 pentru„nu cred”, iar variabila  stud_la  are valoarea 1 pentru Universitate şi 2 pentruPolitehnică.

      Valorile variabilelor au fost etichetate corespunzător, iar afişarea etichetelor în loculvalorilor, în celulele tabelului de date, a fost obţinută cu setarea View-Value labels din meniul SPSS Data Editor . De reţinut că, deşi afişează etichetele, SPSS va opera în

    calcule cu valorile.

    Procedura:  SPSS nu dispune de o procedură specifică pentru calcularea directă adiferenţei dintre două procente. În acest scop se utilizează procedura Crosstabs şi testul chi- pătrat.

      În prealabil, se execută procedura Weight   pentru variabilele categoriale( paranorm şi stud_la) în funcţie de variabila frecv, care contorizează numărulcazurilor.

    1 Datele nu sunt reale

  • 8/9/2019 spss_12_testeneparametrice.pdf

    4/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    4/20Actualizat la: 07.05.2006/21:01:37

    Operaţia asociază valorile variabilelor categoriale ( paranorm  şi  stud_la) cu valorilevariabile  frecv. Efectul ei este unul „invizibil” pe ecran, dar se va reflecta în analizelestatistice ulterioare.

      Efectul de ponderare (weight ) a unei variabile rămâne activ atâta timp cât nu se ponderează o altă variabilă sau nu se anulează ponderarea efectuată. La salvareafişierului se salvează şi variabila ponderată. Includerea variabilei ponderate în diverse proceduri de analiză are efecte specifice.

      Dacă datele ar fi fost introduse în baza de date caz cu caz, operaţia Wheight  nu ar maifi fost necesară.

     

    Se execută procedura Statistics-Summarize-Crosstabs...  pentru variabilele paranorm şi  stud_la, cu selectarea Chi-Square din caseta Statistics. (nu mai prezentăm imaginile, acestea fiind identice cu cele de la testul chi-pătrat).

    Rezultate

    SPSS Viewer   prezintă mai întâi tabelul de corespondenţă dintre variabilelecategoriale, cu valorile variabilei ponderate prin procedura Wheight .

    Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161.598).

    Testul z  pentru diferenţa proporţiilor se calculează prin extragerea radicalului dinvaloarea lui chi-pătrat:

    71.12598.161   == z   

    Semnul lui z  se află din diferenţa proporţiilor testate, astfel:

  • 8/9/2019 spss_12_testeneparametrice.pdf

    5/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    5/20Actualizat la: 07.05.2006/21:01:37

    67.0205.0875.015632

    200175

    +=−=−=− ba  p p  

    Decizia statistică se ia prin raportarea valorii calculate a lui  z   la valorile critice aleacestuia de pe curba normală, pentru test unilateral sau bilateral. În cazul nostru, pentru test

     bilateral, cu alfa=0.05, z  calculat (12.71) este mai mare decât  z  critic (1.96), fapt care permiterespingerea ipotezei de nul şi confirmarea ipotezei că studenţii de la Universitate „cred” într-omăsură semnificativ mai mare în fenomenele paranormale decât studenţii de la Politehnică. 

    A. 3 Testul semnului

    Utilizare

    Testul semnelor este utilizat pentru a testa diferenţa dintre valori, utilizându-sesemnul diferenţei şi nu valoarea acesteia, atunci când ambele valori sunt măsurate pentruaceiaşi subiecţi. Dacă nu ar exista nici o diferenţă între valorile perechi, atunci număruldiferenţelor pozitive ar trebui să fie egal cu cel al diferenţelor negative. Cu cât număruldiferenţelor de un anumit semn este mai mare, comparativ cu cel al diferenţelor de semn opus,cu atât creşte probabilitatea ca diferenţa dintre variabile să fie statistic semnificativă.

    Exemplu: Într-un experiment cu privire la efectul motivării asupra memorării,subiecţilor (N=8) li se cere să memoreze cuvinte dintr-o listă, înainte si după introducereaunui factor motivant. Dat fiind faptul că numărul subiecţilor este prea mic pentru asumareanormalităţii distribuţiei de eşantionare, se alege testul semnului în locul testului t   pentrueşantioane dependente.

    Condiţii

    Variabilele vor fi de tip numeric, iar valorile exprimate în aceeaşi unitate de măsură, pentru a se putea face diferenţa lor.

    Aranjarea datelor

    Imaginea de mai jos conţine variabilele „inainte” şi „dupa”, care vor fi analizate.

    Variabila „dif” conţine rezultatul diferenţei „dupa-inainte”.Variabila „semn”, conţine semnul diferenţei. Ambele sunt prezentate numai pentru a

    face mai evident baza de calcul a testului deoarece, în fapt, nu sunt relevante sub aspectul procedurii SPSS.

    Dacă nu se dispune de valorile variabilelor, ci numai de semnul diferenţei, testulsemnului va fi calculat manual, pe baza formulei 4.7.

  • 8/9/2019 spss_12_testeneparametrice.pdf

    6/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    6/20Actualizat la: 07.05.2006/21:01:37

    Procedura: Statistics-Nonparametric Tests-2 Related Samples... 

    În prima fază, cele două variabile suntselectate, pe rând, prin clic de mouse pefiecare, constituindu-se în pereche. Acest faptse observă în partea de jos a casetei, în zonaCurrent Selections.Se bifează Sign în zona Test Type.

    Apoi, perechea de variabile este trecută înlista Test Pair(s) List: prin acţionarea butonului ►.

    Dacă este necesar, se pot testa simultan maimulte perechi de variabile.

    Rezultate

    Tabelul Sign Test  cuprinde numărul diferenţelor pozitive, respectiv negative, pentrucazurile din baza de date. În cazul nostru, există 7 diferenţe pozitive şi nici o diferenţănegativă. 

    Tabelul Test Statistics, prezintă semnificaţia testului (p=0.016). Ipoteza de nul serespinge dacă valoarea lui p este mai mică decât pragul fixat şi care, implicit, este 0.05. Înexemplul dat, ipoteza de nul se respinge, acceptându-se ipoteza cercetării (motivareastimulează memorarea). 

  • 8/9/2019 spss_12_testeneparametrice.pdf

    7/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    7/20Actualizat la: 07.05.2006/21:01:37

    A.4 Testul Chi-pătrat al asocierii (independeţei)

    Utilizare

    Testul chi-pătrat este utilizat pentru evidenţierea gradului de asociere între două

    variabile categoriale.Exemplu: Să presupunem că am evaluat numărul femeilor şi al bărbaţilor, pasageriîntr-un avion care a suferit un accident la aterizare, fără victime, diagnosticaţi cu sindrom destres posttraumatic (PTSD). Datele sunt cele din următorul tabel de corespondenţă:

    Problema cercetării este dacă incidenţa PTSD este în legătură cu caracteristica de sex.

    Condiţii

    • 

    Variabile categoriale, care pot fi exprimate, fie prin valori numerice, fie prinvalori de tip string  (caracter tipăribil)•  Cele două variabile nu trebuie să se „intersecteze” (să nu existe subiecţi care

    să fie incluşi în mai mult de o celulă de tabel).•  Este recomandabil ca frecvenţa aşteptată să nu ia valori mai mici de 5 (sau,

    cel puţin, în nu mai mult de 20% din celule).•   Nici o celulă nu trebuie să aibă frecvenţa aşteptată 0.. 

    Aranjarea datelor

    Datele pot fi incluse în Data Editor  în două moduri:a.

     

    Sub forma unor înregistrări distincte pentru fiecare caz

    Acest mod poate fi extrem de dezavantajos atunci când sunt multe cazuri sau cândexistă deja o statistică globală a fenomenului PTSD în raport cu sexul.

     b.  Sub forma unor înregistrări distincte pentru valorile caracteristicii de sex:

    Femei Bărbaţi

    PTSD 20 10 Non-PTSD 30 40

  • 8/9/2019 spss_12_testeneparametrice.pdf

    8/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    8/20Actualizat la: 07.05.2006/21:01:37

    În această situaţie, se introduc frecvenţele PTSD pentru toate combinaţiile valorilorcelor două variabile analizate şi frecvenţele asociate fiecăreia. Pentru a se realizacorespondenţa dintre variabilele  sex  şi  PTSD  cu variabila  frecv, se apelează la procedura Data-Wheight Cases...:

    Facem precizarea că în tabelele de date din imaginile de mai sus variabilele au fostcodificate numeric cu 1 respectiv 2, atât pentru sex cât şi pentru PTSD, valorile fiindetichetate. Faptul că în celule apar etichetele şi nu valorile, se obţine prin setarea  Data-Value Labels.

      Procedura chi-pătrat acceptă şi variabile de tip caracter ( string ), dar reamintim

    recomandarea de principiu ca toate variabilele să fie declarate de tip numeric.

    Procedura: Statistics-Summarize-Crosstabs... 

    Casetele de configurare sunt următoarele:

    •  În caseta principală Crosstabs  se trec variabilele analizate în lista  Row(s), respectivColumns(s). Pot fi analizate mai multe perechi de variabile simultan. Rezultatulanalizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloană. Dacăde doreşte crearea unui grafic al corespondenţei dintre variabile, se va bifa şi Displayclustered bar charts.

    •  În caseta Statistics se bifează Chi-Square.•  În caseta Cell Display se bifează Counts-Observed ; Percentages-Row, Column, Total  

    şi Residuals-Unstandardized  (bifarea opţiunilor este în funcţie de informaţiile pe carele doreşte analistul).

    Rezultate

    Imaginea prezintă tabelul de corespondenţă, având pe linii valorile caracteristicii desex iar pe coloane valorile aferente variabilei PTSD. În celulele tabelului se află valorilesolicitate prin configurarea casetelor. Vom exemplifica pentru celula „feminin/da”:

  • 8/9/2019 spss_12_testeneparametrice.pdf

    9/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    9/20Actualizat la: 07.05.2006/21:01:37

    •  Count  40 indică numărul femeilor cu PTSD•  %within Sex  80.0% indică procentul femeilor care au manifestat PTSD din totalul

    femeilor•  %within PTSD  66.7% indică procentul femeilor cu PTSD din totalul celor care au

    manifestat PTSD•  % of Total  40% indică procentul femeilor cu PTSD din totalul subiecţilor  •   Residual 10% indică diferenţa dintre numărul de femei cu PTSD (frecvenţa

    observată) şi frecvenţa aşteptată (în cazul nostru, +10) 

    În tabelul Chi-Square Tests citim valoarea testului  Pearson Chi-Square (16.66) şi, înspecial, pragul de semnificaţie al acestuia (p=0.000 care va fi citit ca p

  • 8/9/2019 spss_12_testeneparametrice.pdf

    10/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    10/20Actualizat la: 07.05.2006/21:01:37

    Graficul de tip bară permite vizualizarea relaţiei dintre variabile:

    A.5 Testul chi-pătrat pentru gradul de corespondenţă ( goodness of fit )

    Utilizare

    Testul chi-pătrat pentru gradul de corespondenţă se utilizează atunci când dorim săcomparăm frecvenţele observate ale unei singure variabile categoriale, cu frecvenţeleaşteptate ale acesteia, dinainte cunoscute.

    Exemplul 1: Avem evaluarea nivelului de inteligenţă pe cinci categorii valorice, de lafoarte slab, la foarte bun şi dorim să ştim dacă distribuţia acestor calificative se supune curbeinormale, procentele aferente pe curba normală fiind cunoscute (2.5%, 14%, 67%, 14%,2.5%).

    Exemplul 2: Am solicitat unui grup de tineri să îşi exprime genul muzical preferat şi

    am obţinut frecvenţe diferite pentru mai multe genuri de muzică. Problema cercetării estedacă diferenţele dintre aceste frecvenţe sunt semnificative. Ipoteza de nul în acest caz este că preferinţele se distribuie egal între genurile muzicale (adică, dacă ar fi trei genuri, fiecare artrebui să întrunească un procent de 33.33%).

    Aranjarea datelor

    Vom exemplifica pe o situaţie corespunzătoare celui de-al doilea exemplu. Baza dedate se poate constitui fie prin înregistrarea fiecărui caz în parte (având o variabilă pentrugenul muzical şi o alta pentru exprimarea preferinţei faţă de acesta), fie, ca în exemplulanterior, prin înregistrarea rezultatelor sintetice şi ponderarea variabilei  gen_muz  cu variabila frecv prin operaţia Data-Weight cases...:

  • 8/9/2019 spss_12_testeneparametrice.pdf

    11/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    11/20Actualizat la: 07.05.2006/21:01:37

    Procedura: Statstics-NonParametric-Tests-Chi-Square...

    •  În caseta Chi-Square Test   se trece variabila analizată în zona Test Variable List .

    •  Se bifează All categories equal , acesta fiind modelul în raport cu care dorimsă testăm frecvenţele variabilei analizate

    •  Dacă am fi dorit să le testăm în raport cu alte frecvenţe cunoscute, am fi bifat

    Values şi, apoi, am fi introdus pe rând acele frecvenţe (scriindu-le în dreptullui Values şi înregistrându-le prin butonul Add )

    Rezultate

    Cele două tabele cu rezultate din Viewer  prezintă:•  Frecvenţele observate, frecvenţele aşteptate şi valorile reziduale (diferenţa

    dintre frecvenţe) pentru cele trei genuri muzicale•  Valoarea testului chi-pătrat al corespondenţei (12.17), df(2) şi p=0.002

    Acest rezultat justifică respingerea ipotezei de nul şi acceptarea concluziei căsubiecţii diferenţele dintre preferinţele pentru cele trei genuri muzicale sunt semnificative şinu se datorează variaţiei întâmplătoare de eşantionare.

    B. Teste neparametrice pentru date ordinale

    B. 1 Testul Mann-Whitney (U) pentru două eşantioane independente

    Utilizare

    Testul Mann-Whitney este utilizat pentru testarea diferenţei dintre grupuriindependente pentru care variabila dependentă este exprimată în valori ordinale (de rang) sauatunci când, chiar dacă este de tip cantitativ, nu suportă un test parametric (testul t).

    Exemplu: La ieşirea dintr-un club de noapte, un psiholog interesat de efectul depresival drogurilor a efectuat interviuri în legătură cu acest aspect şi a identificat un număr de 10

    tineri care au consumat câte o pastilă de Ecstasy şi un număr de 10 tineri care au consumatdoar alcool. Apoi i-a convins să ia parte la un experiment şi le-a administrat un chestionar de

  • 8/9/2019 spss_12_testeneparametrice.pdf

    12/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    12/20Actualizat la: 07.05.2006/21:01:37

    evaluare a depresiei. Acelaşi chestionar a fost aplicat din nou, peste trei zile. Obiectivelestudiului sunt:

    a.  verificarea ipotezei că cele două tipuri de drog (Ecstasy şi alcool) au efectedepresante diferite între ele;

     b.  Ecstazi are un efect depresant pe termen lung, mai mare decât alcoolul.În acest scop vor trebui comparate valorile la depresie ale celor două grupuri. Această

    analiză va fi efectuată atât pentru valorile depresiei de la prima măsurare cât şi pentru cele dela a doua evaluare a depresiei (după trei zile).

    Aranjarea datelor

    Variabilele din baza de date sunt următoarele:•  cod_sub, un cod numeric de identificare a fiecărui subiect (deşi exemplele

    anterioare nu au cuprins această variabilă, ea nu trebuie să lipsească din nici o baza de date)

    •  drog , pentru tipul de drog utilizat (sunt afişate etichetele, iar valorile sunt

    1=Ecstasy, 2=Alcool)•  depr_1, scorul la depresie la prima evaluare•  depr_2, scorul la depresie la a doua evaluare

      Variabilele dependente din exemplul nostru au valori măsurate pe scală cantitativă.

    Testarea lor cu un test ordinal nu presupune o prealabilă transformare de rang, programul efectuând automat această transformare. Procedura se aplică în acelaşimod şi direct pe valori ordinale de rang.

    Procedura: Statistics-Non Parametric Tests-2 Independent Samples...

    Se cuvine să precizăm că, în mod normal, datele de acest tip ar conduce la utilizareatestului t  pentru eşantioane independente. Cu toate acestea, având în vedere volumul foartemic al eşantionului, utilizarea unui test neparametric este de preferat.

  • 8/9/2019 spss_12_testeneparametrice.pdf

    13/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    13/20Actualizat la: 07.05.2006/21:01:37

    În caseta Two-Independent Samples Tests  variabilele analizate sunt trecute în listaTest Variable List .

    Rezultate

    Tabelul  Ranks  oferă informaţii sintetice despre cele două variabile: volumulgrupurilor, media rangurilor şi suma rangurilor.

    Tabelul Test Statistics  include valorile testului Mann-Whitney pentru cele douăvariabile testate simultan, depresia imediată şi remanentă. Valorile de interes din tabel sunt

    cele ale lui Z şi nivelul de încredere  p. În cazul nostru, se observă că depresia imediată nudiferă semnificativ în funcţie de tipul de drog utilizat, în timp ce depresia remanentă estesemnificativ diferită, mai mare la utilizatorii de Ecstasy decât la utilizatorii de alcool(conform datelor din tabelul anterior).

    B. 2 Testul Wilcoxon pentru două eşantioane perechi

    Utilizare

    În exemplul anterior, pentru testul Mann-Whitney, psihologul a testat diferenţaintensităţii depresiei între consumatorii de Ecstasy şi alcool, imediat şi după trei zile.Rezultatul a fost acela că efectul depresiv nu este diferit pe termen imediat, dar este

    semnificativ diferit după trei zile. Datele pot fi analizate însă şi separat, pe fiecare grup de

  • 8/9/2019 spss_12_testeneparametrice.pdf

    14/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    14/20Actualizat la: 07.05.2006/21:01:37

    consumatori (Ecstasy, respectiv alcool) în cele două momente diferite (imediat şi după treizile).

    Dacă testul Mann-Whitney a verificat ipoteza diferenţei dintre categorii deconsumatori (eşantioane independente), testul Wilcoxon va permite testarea ipotezei cădepresia este diferită de la un moment la altul în cadrul fiecărei categorii de consumatori în parte (eşantioane dependente).

    Facem precizarea că aceste două teste nu trebuie întotdeauna utilizate împreună,succesiv, ca în exemplul acestui studiu. Dacă facem aici acest lucru, este numai pentru că ne-am propus două obiective distincte, fiecare fiind testat cu o procedură diferită, în funcţie denatura eşantioanelor comparate.

    Aranjarea datelor

    Este identică cu cea prezentată pentru testul Mann-Whitney.În acest caz, deoarece analiza trebuie efectuată separat pe grupurile de consum

    Ecstasy/Alcool, există două soluţii. Prima ar fi selectarea (cu  Data-Select Cases) a primuluigrup şi efectuarea testului, apoi selectarea celui de-al doilea grup şi efectuarea testului. O

    soluţie mai elegantă este însă aceea de a declara împărţirea bazei de date în funcţie degrupurile definite prin tipul de drog. În acest scop se va utiliza procedura Data-Split File...

    În locul setării implicite  Analyze all cases, do not create groups, se bifează opţiuneaCompare groups şi se declară variabila ale cărei valori vor servi drept criteriu de împărţire a bazei de date în grupuri de analiză separată (în cazul nostru, tipul de drog) prin trecerea ei înzona Groups Based on:. Efectul acestei acţiuni este acela că toate prelucrările care vor fiefectuate din acest moment se vor aplica, separat, pe fiecare grup identificat prin valorilevariabilei.

      Operaţiunea de împărţire a bazei de date nu are semne vizibile pe ecran, fapt care poate face să fie uitată şi, astfel, atunci când se revine la prelucrări care ar trebui săimplice toată baza de date rezultatele vor fi incorecte. De aceea, se va avea în vedererevenirea la setarea  Analyze all cases, do not create groups  atunci prelucrarea pe

    grupuri a bazei de date nu mai este becesară.

  • 8/9/2019 spss_12_testeneparametrice.pdf

    15/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    15/20Actualizat la: 07.05.2006/21:01:37

    Procedura: Statistics-Non Parametric Tests-2 Related Samples... 

    Setarea procedurii în caseta Two-Related-Samples tests se face în doi timpi:1. Se selectează prin clic de mouse fiecarevariabilă, constituindu-se perechea supusăanalizei

    2. Se acţionează butonul ► pentru a setransfera perechea de variabile în zona Test Pair(s) list .

    Se bifează opţiunea pentru testul Wilcoxon (care este, de fapt, cea implicită)

    Rezultate

    Tabelul  Ranks oferă informaţii sintetice despre rangurile pozitive şi negative pentrucele două grupuri, numărul subiecţilor, media rangurilor şi suma lor.

    Tabelul Test Statistics  prezintă valorile comparative ale depresiei pentru cele douăgrupuri. Aşa cum se observă, diferenţa este semnificativă (p=0.007) în cazul consumatorilorde Ecstasy şi nesemnificativă (p=0.053), în cazul consumatorilor de alcool. Concluziagenerală a studiului este aceea că Ecstasy, comparativ cu alcoolul, are un efect depresiv maimare (testul Mann-Whitney) şi mai accentuat cu trecerea timpului (testul Wilcoxon).

    Aducem aminte că testul Wilcoxon presupune calcularea a două valori, T(+) pentrudiferenţa pozitivă a rangurilor şi T(-) pentru diferenţa negativă a rangurilor, cea mai micădintre ele fiind considerată valoarea testului. În exemplul nostru, testul Wilcoxon pentruEcstazy a fost calculat "pe baza rangurilor negative" (vezi nota a. de sub tabel), ceea ceînseamnă că acestea au fost mai puţine, iar cele pozitive au fost mai multe. Ori, diferentele

     pozitive de rang exprima valori ale depresiei mai mari după trei zile decât după o zi. Asta,deoarece SPSS atribuie rangul 1 valorii celei mai mici, şi rangul cel mai mare valorii celei

  • 8/9/2019 spss_12_testeneparametrice.pdf

    16/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    16/20Actualizat la: 07.05.2006/21:01:37

    mai mari din distribuţie. Ca urmare, este corect să concluzionăm că rezultatul testului indică ovaloare semnificativ mai mare a depresiei după trei zile decât după o zi.B. 3 Testul Kruskal-Wallis pentru mai mult de două eşantioane independente

    Utilizare

    Testul Kruskal-Wallis este utilizat atunci când avem ovariabilă dependentă ordinală, măsurată pentru mai mult de douăgrupuri independente (formate din subiecţi diferiţi), şi dorim sătestăm diferenţa dintre acestea. Acest test pentru date ordinaleeste analog testului ANOVA pentru date cantitative.

    Exemplu: A fost studiată relaţia dintre condiţiilefamiliale (familie armonioasă, mamă singură, familieconflictuală) şi frecvenţa reacţiilor emoţionale pozitive la copiiide vârstă preşcolară, pe durata unei săptămâni. Problemacercetării este dacă diferenţele sunt semnificative iar mediulfamilial are legătură conduita emoţională a copiilor.

    Aranjarea datelor se face ca în imaginea alăturată:

    În baza de date, variabila  familie  a fost codificată şi etichetată astfel: 1=familiearmonioasă, 2=mamă singură, 3=familie conflictuală. Etichetele sunt afişate ca urmare aopţiunii  Data-Value Labels. Rezultatele vor fi identice dacă variabila dependentă esteexprimată şi direct în valori de rang.

    Procedura: Statistics-Non Parametric tests- k Independent Samples... 

    În caseta principală se trecevariabila testată în zona TestVariable List : iar variabilaindependentă în zonaGouping Variable. Seactivează comanda Define Range...

    Se defineşte domeniulvalorilor variabileiindependente, în cazul nostru:minim 1, maxim 3.

    Forma finală a casetei esteaceasta.Testul Kruskal-Wallis este bifat implicit.

  • 8/9/2019 spss_12_testeneparametrice.pdf

    17/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    17/20Actualizat la: 07.05.2006/21:01:37

    Rezultate

    Primul tabel include informaţii descriptive cu privire la variabila testată: numărulsubiecţilor din fiecare grup şi media rangurilor pentru fiecare grup. De precizat că programulacordă rangul 1valorii celei mai mici. Datele din tabel indică descreşterea mediei rangurilor(expresii emoţionale pozitive numeroase) de la familia armonioasă la cea conflictuală.

    Rezultatul testului, afişat în tabelul Test Statistics  se exprimă printr-o valoare chi-

     pătrat (6.33) cu două grade de libertate şi p=0.042. Ca urmare, ipoteza de nul poate firespinsă. Datele confirmă ipoteza că mediul familial (exprimat prin cele trei tipuri de familie)îşi pune amprenta asupra expresivităţii emoţionale a copiilor de vârstă preşcolară. 

    B. 4 Testul Friedman pentru măsurări repetate

    Utilizare

    Testul Friedman se utilizează pentru testarea diferenţei de rang în cazul unei variabilemăsurate repetat, de mai mult de două ori, pe acelaşi grup de subiecţi. El este echivalentultestului ANOVA pentru măsurări repetate, pentru date parametrice. Dacă este utilizat pentrudoar două măsurări repetate, rezultatul său este echivalent cu al testului Wilcoxon.

    Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpinişti.Capacitatea de memorare de cuvinte este măsurată la trei înălţimi diferite: 1000m, 3000m şi6000m. Problema cercetării este dacă diferenţa de performanţă de memorare corespunzătoarecelor trei înălţimi este semnificativă. Dat fiind volumul extrem de mic am eşantionului (N=5),efectuarea unui test parametric (ANOVA RM) ar fi nesigură iar apelul le testul Friedman este pe deplin justificat.

    Aranjarea datelor

  • 8/9/2019 spss_12_testeneparametrice.pdf

    18/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    18/20Actualizat la: 07.05.2006/21:01:37

    Variabilele mem_1000, mem_3000 şi mem_6000 conţin numărul cuvintelor memorate pentru fiecare dintre cei 5 alpinişti. Nu este necesară transformarea lor în valori de rang,deoarece acest lucru va fi efectuat automat de program. Dacă datele primare sunt sub formăde ranguri, ele vor fi introduse ca atare, rezultatul fiind identic.

    Procedura: Statistics-Non Parametric Tests-K related Samples...

    Se setează opţiunea  Friedman, iar variabilele testate sunt trecute în lista TestVariables: 

    Rezultate

    Primul tabel prezintă media rangurilor pe înălţimi (rangul 1 este atribuit valorii celeimai mici). În al doilea tabel găsim valoarea testului Friedman exprimată în valori chi-pătrat(8.40), având un nivel de semnificaţie p=0.015. Acest rezultat permite respingerea ipotezeide nul şi confirmă ipoteza că memoria cuvintelor este în legătură cu înălţimea (pe cele treiniveluri avute în vedere). 

    B. 5 Corelaţia datelor ordinale (Spearman, Kendall)

    Utilizare

    Testul de corelaţie a rangurilor (Spearman) este echivalentul pentru date ordinaletestului de corelaţie Pearson. Rezultatul său variază pe aceeaşi plajă de valori (-1/+1) şi seinterpretează în mod similar cu rezultatul testului Pearson.

    Exemplu: Să luăm în considerare studiul aceluiaşi grup de alpinişti, care auefectuat, la aceleaşi înălţimi descrise mai sus, şi un test de viteză de decizie (măsurată înzecimi de secundă). Problema cercetării este dacă între performanţa de memorare şi timpul dedecizie este o relaţie (variaţie concomitentă) semnificativă.

    Aranjarea datelor

  • 8/9/2019 spss_12_testeneparametrice.pdf

    19/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    19/20Actualizat la: 07.05.2006/21:01:37

    Alături de variabilele „memorie” pentru cele trei înălţimi, avem acum şivariabilele pentru timpul de decizie.

    Procedura: Statistics-Corelation-Bivariate 

    Variabilele supuse testului de corelaţie se trec în lista Variables: Se anulează setarea pentru testul  Pearson  şi se bifează Spearman  (aici am ales şi

    testul  Kendal tau-b, care este echivalent lui Spearman, doar pentru a le putea compara. În practică, se va utiliza doar unul dintre acestea două).

    Această configurare a casetei de dialog produce o matrice de corelaţii cu şase linii şişase coloane pentru fiecare dintre cele două teste alese. În fiecare celulă a matricii se vor afla,aşa cum vom vedea, mai multe numere. Din acest motiv citirea ei nu este tocmai comodă.Pentru a obţine un format mai convenabil de prezentare a rezultatelor, recomandăm o procedură suplimentară, prezentată anterior la corelaţia Pearson: Se acţionează butonul Paste care deschide fereastra Syntax, unde găsim comenzile procedurii. Aici se introduce clauzaWITH între primul grup de variabile (memorie) şi al doilea grup de variabile (decizie):

    Mai departe, procedura de corelaţie se lansează cu butonul ► de pe bara decomenzi a ferestrei Syntax.

    Această variantă de lucru nu este obligatorie. Se poate efectua corelaţia şi direct

    din caseta principală, dar, aşa cum am spus, rezultatele vor fi prezentate într-o formă mai puţin „ergonomică” la citire.

    Rezultate

  • 8/9/2019 spss_12_testeneparametrice.pdf

    20/20

    M. Popa – Aplicaţii SPSS (teste neparametrice)

    20/20

    Tabelul cu rezultate cuprinde pe linii variabilele „memorie” şi pe coloane, variabilele„decizie”. Deoarece am cerut calcularea simultană a ambilor coeficienţi de corelaţie, datelesunt dublate. Este de la sine înţeles că în practică nu vom utiliza decât unul dintre aceşticoeficienţi de corelaţie a rangurilor.

    Din celulele tabelului de mai sus nu ne interesează decât cele care cuprind corelaţiadintre memorie şi decizie la acelaşi palier de înălţime. Pentru a fi mai vizibile, am îngroşatvalorile utile analizei. În jumătatea de sus a tabelului, avem corelaţiile pentru testul Kendalliar în jumătatea de jos pe cele ale testului Spearman.

    Testul Kendall al corelaţiei dintre memorie şi decizie la 1000 de metri are valoarea-0.94, semnificativ la p=0.023. La interpretarea coeficienţilor de corelaţie este extrem deimportant să se ia în considerare, simultan, semnul şi semnificaţia variaţiei valorilor. În cazulnostru, valori mari ale memoriei, înseamnă o capacitate de memorare mai bună iar valori mariale timpului de decizie înseamnă capacitate de decizie mai proastă (sub aspectul vitezei,

    desigur). În consecinţă, un coeficient de corelaţie negativ între aceste variabile indică, de fapt,o variaţie concomitentă pozitivă a memoriei şi vitezei deciziei (când capacitatea de memorarescade, şi decizia este mai lentă, timpul de decizie fiind mai mare).

    Analiza coeficienţilor din tabelul de mai sus arată existenţa unei corelaţii de rangsemnificative (p