Post on 02-Mar-2016
description
Msurarea n psihologie
Aspecte cheie
Definitie si Scop Evaluarea psihologica (psychological assessment) reprezinta o ramura a stiintelor
comportamentale
Scop:
identificarea asemanarilor si deosebirilor dintre caracteristicile personale si capacitatileindivizilor (Weiner, Naglieri, 2004) diferentele individuale
clasificarea functionarii individuale
predictia comportamentala (Niolon, 2005)
Evaluarea Psihologica vs Testare Psihologica
Evaluarea proces general de colectare de informatii
Testele reprezinta o modalitate standardizata de adunare a informatiilor.
Alte metode de adunare a informatiilor interviul, observatii, istoric personal, date biografice
Metodele pot fi combinate, impreuna un aport informational mai consistent
Psihologia este o stiinta si de aceea, evaluarea psihologica ... ... trebuie tratata ca un proces stiintific
argumentele care se accepta pentru a argumenta daca un proces de evaluare se desfasoara corect, sunt argumente stiintifice:
si altii fac asta
toti specialistii de resurse umane fac asta
la noi asa se face
10.000 de clienti utilizeaza aceasta abordare
eu asa am invatat
am dovezi empirice ca asa functioneaza
Incisivitatea masurarii
calitativ vs. cantitativ
observatie & interviu vs. test/chestionar
peak performance measures vs. average performance measures
test vs. chestionar?
sarcina de rezolvat vs. raportare despre comportamentul propriu
Relatii intre variabile: ecuatia structurala (1: determinism)
CRITERIUPREDICTOR
Cauza Efect
Variabila independenta Variabila dependenta
Ex: Inteligenta (GMA) Ex: Performanta profesionala
Ex: Constiinciozitate Ex: Accidente de munca (-)
Ex: Extraversie Ex: Eficienta in vanzari
Despre teste psihologice
Un test reprezinta o colectie de mostre de comportament utilizate pentru a extrage inferente generale cu privire la comportamentul unui individ
mostre de comportament = Itemi = Intrebari = Am multi prieteni
Item1 + item2 + item3 +.itemx = o scala (Sociabilitate, Extraversie, Responsabilitate etc)
Despre teste psihologice
Raspunsurile la un test sunt de obicei colectate in tabele statistice care permit specialistului sa compare scorul obtinut de un individ cu cele obtinute de un anumit grup de referinta
obtinute de un anumit grup de referinta = etalonul sau normele
cea mai frecventa eroare in Romania Sisteme Normative Americane/ Internationale
Domenii de evaluare
Evaluarea personalitatii : NEO PI R, CPI, EPQ etc
Evaluarea functionarii intelectuale: SB, GAMA, WAIS, MAB, Woodcock-Johnson
Evaluarea intereselor: JVIS, HOLLAND
Evaluarea motivatiei: AMI
Evaluare stres, neuropsihologica etc
Metaanalize: Hunter & Hunter (1984); Schmidt & Hunter (1998)
Concepte de Baza
Scoruri Standardizate:
z,
T,
Centile,
IQ
Caracteristici Psihometrice:
Fidelitate;
Validitate.
Interpretarea Scorurilor
Scala de evaluare a responsabilitatii
A: - 80
B: - 38
Scorul maxim ce poate fi obtinut 100
Care dintre cei doi poate fi caracterizat ca fiind un individ, constiincios care isi finalizeaza sarcinile si care manifesta un comportament etic?
Norm reference
Un scor brut nu are o semnificatie individuala
Semnificatia acestuia este desprinsa prin raportarea la un anumit grup
De ex: In Romania media populatiei se afla la valoarea 80 pt scala de Responsabilitate
Prin raportarea scorului la media unui grup desprinderea interpretarilor - A manifesta un comportament etic in aceeasi masura ca majoritatea indivizilor din populatia generala
Evaluarea cu doua instrumente
Instrumentul x scorul maxim 50
Instrumentul y scorul maxim 100
2 persoane evaluate
A: obtine 37
B: obtine 60
Cum comparam cele doua scoruri ??
Scoruri Standardizate
Cel mai frecvent scoruri T (media 50 , ab st. 10)
Alte tipuri de scoruri:
Percentile
Stanine
Z Scores
IQ Scores
Scoruri T & Percentile
Scoruri IQ
Fidelitatea: Definitie n orice msurare a fidelitii, referirea se face la consistena i
reproductibilitatea unei observaii (cot, scor, not) sau set de observaii (distribuia scorurilor). Dac cu acelai instrument de msur se fac determinri n timpi succesivi i de fiecare dat se ajunge la aceleai valori, spunem c am obinut o msurare cu o fidelitate mare.
Prin fidelitate se nelege fineea cu care testul msoar constructele sale componente, respectiv gradul de exactitate i lipsa greelilor de msurare.
Fidelitatea indic utilizatorului gradul n care poate avea ncredere n rezultatele testului.
Fidelitatea este gradul n care scorurile testului sunt consistente sau repetabile, adic gradul n care ele nu sunt afectate de erorile de msur (APA Standards, 1985).
Fidelitatea: Problematica
Asadar, fidelitatea vorbeste despre
exactitate
lipsa de eroare
repetabilitate
...
In teoria clasica a testarii (CTT), rezultatul unei masurari psihologice este definit drept:
True score = Observed score + Error
Deci, cu cat eroarea este mai mica, cu atat scorul observat (masurat in mod efectiv) este mai corect, mai apropiat de realitate (scorul adevarat)
Fidelitatea: Masurare
Pentru determinarea fidelitii, sunt posibile mai multe proceduri i se pot folosi metode diferite de evaluare sau chiar de msurare ale acesteia.
masurare: (empirical correlational methods, multiple measurement)
test-retest
forme echivalente
estimare: (multivariate methods, single measurement: internal consistency)
split-half
Cronbachs alpha
Guttmans lambda
Kuder Richardsons KR-20 & KR-21
Fidelitatea: Test-retest metoda foarte puternica, de masurare a fidelitatii (nu estimare)
se administreaza acelasi test de 2 ori, la o oarecare distanta intre administrari
distanta este dependenta de tipicul testului (aptitudini generale, aptitudini specifice, personalitate etc.)
probleme:
esantioane mici, de obicei
esantioane necontrolate, de obicei (dropouts)
efectele invatarii (mai ales la distante de retest mici si la anumite tipuri de teste)
efectele dezvoltarii/evolutiei (mai ales la distante de retest mari)
se raporteaza:
rtt, coeficientul de corelatie intre seturile de date obtinute in test si retest
distanta de retest (2 saptamani, 5 zile etc.)
Fidelitatea: Forme echivalente
metoda foarte puternica, de masurare a fidelitatii (nu estimare)
probleme
este posibila doar la acele teste unde exista forme echivalente
efort foarte mare pentru autor sa genereze forme echivalente
echivalenta nu este niciodata perfecta
se raporteaza:
rab, coeficientul de corelatie intre seturile de date obtinute cu Forma A si Forma B
Exemplu:
TTCT, Torrance Tests for Creative Thinking, Verbal & Figural, Forms A and B
Fidelitatea: Split-half
metoda mai slaba, de estimare a fidelitatii (nu masurare)
metoda:
se imparte testul in 2 subteste, esantionand itemii sai
esantionarea poate fi facuta ori aleator, ori dupa o regula,
de obicei itemi pari vs. impari
se raporteaza
rxy, coeficientul de corelatie intre cele 2 subteste, de obicei rpar-impar
Fidelitatea: Consistenta interna metoda mai slaba, de estimare a fidelitatii (nu masurare)
cea mai populara metoda de raportare a fidelitatii
coeficientul Alpha, (Lee Cronbach)
coeficientii KR 20 si KR 21 (Kuder & Richardson)
coeficientii Lambda (1-6) ai lui Guttman, 3 este similar cu Alpha-Cronbach
metoda:
multivariata
se raporteaza media deviatiilor fiecarui item de la valoarea medie, la deviatia scorului total
NU UITATI SA INVERSATI ITEMII SCORATI INVERS!!!
se raporteaza
/ x /KR20/KR21=[0.00-1.00]
praguri (Bernstein & Nunnaly): .70 / .90
Fidelitatea: Wrap it up
In concluzie:
fidelitatea se poate masura sau estima
metodele de masurare sunt mai puternice decat cele de estimare
indicele de fidelitate e cuprins intre 0 si 1
operam cu praguri de .70 si de .90 pentru fidelitate, atunci cand o aplicam unor probleme de masurare
Insa fidelitate nu are un sens direct in masurare
daca ne intoarcem la ecuatia din CTT (Observed score = True score + Error), cum este relationata fidelitatea cu Error Term?
prin intermediul conceptului de Standard Error of Measurement
Cum variaza fidelitatea testelor?
De obicei fidelitatea unui test creste odata cu numarul de itemi
Spearman-Brown prophecy (demonstratia clasica: Guilford, 1954)
true variance increases more rapidly than error variance
rnn = n rtt / (1+ (n-1) rtt )
Fidelitatea unor metode de evaluare diferite
in aceasta evaluare de obicei metodele sunt impartite in calitative vs. cantitative
observatie
acord interevaluatori, de obicei pe acelasi behavioral sample
= .05 - .25
interviu
acord interevaluatori
= .05 - .50
test/chestionar
toate metodele discutate
= .50 - .90
SEM: Standard Error of Measurement Eroarea de msurare standard (se) se calculeaz potrivit Formulei (1), unde se = eroarea de
msurare standard, sx = abaterea standard, rtt = coeficientul de fidelitate.
se = sx (1- alpha)
Atunci cand in locul fidelitatii consistenta interna se foloseste fidelitatea test-retest, masura se numeste SEP: Standard Error of Prediction
Intervalul de confidenta de 90% (+ - SEM): intervalul in care pica scorul real al subiectului, cu o probabilitate de 90%
Exemplu:
Scala staninelor are o medie de 5 i o abatere standard de 1.96
Fidelitatea unui test este rtt= .70
se = 1.96 (1- .70) = 1.07
Scala QI are media de 100 si abaterea standard de 15
Fidelitatea unui teste este rtt= .95
se = 3.35
SEM: la ce ne foloseste?
Estimarea erorii de masurare
la fidelitati sub .70, se creste foarte mult si scala nu mai poate fi utilizata pentru decizii majore
la fidelitati de peste .90, se scade la un nivel la care putem spune ca se poate lucra coerent cu scala
Probleme de comparatie
comparatia scorului unui individ cu scorul altui individ
comparatia scorului unui individ cu un prag
Test de inteligenta: cu 90% confidence interval pentru rtt=.50, .70 si .95
Chestionar de personalitate: NPQ (Ce ar fi daca fidelitatile ar fi la .50)
Chestionar de personalitate (contd.)
Chestionar de personalitate (contd.)
Chestionar de personalitate (contd.)
Test de aptitudini (Performanta aritmetica): confidence interval pentru rtt=.50 (cu rosu) si pentru rtt=.75 (cu gri)
Test de aptitudini (Vanzari): confidence interval pentru rtt=.50 (cu rosu) si pentru rtt=.90 (cu verde)
Concluzie
A test cannot be valid if it is not reliable
Fidelitatea este considerata o conditie a validitatii
Exista mai multe tipuri de validitate:
Validitatea predictiva So/Devianta (Gough, 1996)
Validitatea de criteriu Cs/AHS
Validitatea convergenta (Interviu Do/ Scala Do)
Validitatea de construct
Validitatea
A. Validitatea predictiva singura pe baza careia se pot face predictii valide (verificate)
B. Validitatea de criteriu asigura ca metoda de evaluare face adecvat distinctia intre mai multe persoane raportat la un anumit criteriu
C. Validitatea convergenta metoda folosita masoara acelasi construct masurat si de alte metode
D. Valididtatea de Construct se va masura Dominanta, iar nu Sociabilitatea
De ce este relevanta ???
Face Validity & Distorsiune
Validitatea de Aspect sau de fatada
Relevanta in Distorsiune
Face Validity mare = mai usor de distorsionat
Validitatea: Definitie
Concepia actual despre validitate spune c aceasta reprezint un corpus complex i integrat de demonstraii i cunotine tiinifice care examineaz variabilele psihologice msurate de test (AERA, APA, NCME, 1999).
Aceste demonstraii ne parvin ntr-o varietate de forme, iar nelegerea validitii unui test necesit examinarea lor atent.
Validitatea este conceptul central pe care se bazeaz psihodiagnosticul, att n cazul aptitudinilor ct i al personalitii.
Ea ne permite formularea de aseriuni privind gradul de dezvoltare al unei caracteristici care ne intereseaz sau emiterea de predicii n ceea ce privete comportamentul viitor al persoanei evaluate.
Validitatea se definete prin intermediul metodelor utilizate n verificarea ei: validarea de criteriu i validarea de construct.
Validitatea: Tipuri de validitate
Validitate de continut (content validity):
construct validity (verificare a operationalizarii)
face validity
translation validity
validitate de criteriu (criterion-related validity)
validitate predictiva (predictive validity): prezice ce ar trebuie sa prezica
validitate concurenta (concurrent validity): distinge intre grupuri intre care ar trebui sa distinga
validitate convergenta (convergent validity): coreleaza cu alte operationalizari ale conceptului (sau masuri ale acestuia)
validitate discriminanta/divergenta (discriminant/divergent validity): operationalizarea diferentiaza fata de alte concepte similare
Validitatea: clarificari / exemple n linii generale, validitatea exprim gradul n care un test msoar ceea ce i
propune s msoare.
La aceast calitate se mai poate aduga i o alta, dac testul poate fi utilizat n luarea unor decizii corecte.
Cu alte cuvinte (exemplu), dac noi cunoatem performanele unei persoane la un test (predictor), ct de precis vom putea estima ce performane profesionale va obine?
Validitatea poate fi definit n termeni operaionali ca i corelaia dintre predictor i criteriu (de ex. performanele profesionale ale unui eantion de indivizi).
Rezultatul este cunoscut ca i coeficient de validitate.
Un test poate avea mai muli coeficieni de validitate, n funcie de numrul de dimensiuni profesionale (calitatea muncii, disciplina, categoria profesional etc.) care coreleaz cu el.
Validitatea de continut / construct pune probleme legate de gradul n care dimensiunile msurate sunt cu adevrat relevante
pentru conceptul pe care se concentreaz testul daca sunt prezente toate dimensiunile relevante (daca nu s-au pierdut unele care
trebuiau sa fie) daca nu sunt prezente dimensiuni nerelevante (care contribuie la eroare, dpdv al
constructului evaluat)
Exemple: Personalitate:
masuram sociabilitate si responsabilitate; este testul valid (de construct)? masuram extraversie si stabilitate emotionala; este testul valid (de construct)?
Sociabilitate: masuram fluenta verbala, numarul de glume pe care il poate face; este valid?
(include toti indicatorii relevanti) Usurinta aritmetica:
masuram capacitatea de a transpune o problema matematica in ecuatie, de a face calculele si de a explica verbal semnificatia rezultatului la care s-a ajuns; este valid? (surprinde constructul corect?)
Validitatea de construct (contd.) Care este perioada asociata cu filosoful Epicur?
a. 341-270 BC b. 331-232 BC c. 280-207 BC d. Nici una din aceste optiuni
Cand s-a nascut fondatorul Microsoft, William Gates? a. 1949 b. 1953 c. 1957 d. Nici una din aceste optiuni
Care din urmatoarele enunturi sunt corecte cu referire la ANOVA? a. A fost inventata de Fisher in 1914 b. A fost inventata de Fisher in 1920 c. A fost inventata de Pearson in 1920 d. Nici una din aceste optiuni
Completitudinea dimensiunilor, Ex.: High Impact Leadership Cum construim un test care sa masoare capacitatea unui individ
de a fi un lider de mare impact?
Ce face un leader de succes?
actiuni:
deleaga
monitorizeaza
controleaza
etc intr-un cuvant: face tranzactii eficiente
Validitatea de criteriu: explicatie
un indicator al faptului ca testul poate fi utilizat ca predictor pentru un anumit comportament (criteriu)
ca urmare a existentei acestui tip de validitate putem spune, daca testul are un scor mare, ca X e probabil si cand testul are scor mic, ca X este improbabil (sau X e probabil)
validitatea de criteriu spune ce predictii sunt valide deci cum se interpreteaza scorurile testului
de principiu este corelaional la nivel comportamental, ns se admit i alte indicii, de exemplu experimentale sau de comparaie inter-grupuri
Validitatea de criteriu: Principii si metoda Principiu:
cat mai voluminos corpus de cunostinte despre felul in care se comporta o anumita scala sau test: in relatie cu anumite criterii in anumite situatii (ar putea fi generalizabil, in functie de explicatia teoretica oferita)
de ex. experimentul Sy vs. Do in CPI, explicatia e coerenta, deci e probabil generalizabila pe anumite esantioane (ar putea fi generalizabil, in functie de explicatia teoretica oferita)
de ex. legatura dintre Re si ceasornicari, explicatia e coerenta, deci generalizabila de ex. scorurile la STAI-Y pentru adulti in SUA vs. Romania (desi coerent si aparent
generalizabil, s-a infirmat)
Metoda: date continue: corelatie intre criteriu si predictor (validitate predictiva)
se raporteaza drept coeficient de validitate r grupuri contrastante sau puternic contrastante (validitate concurenta)
high vs low scorers pe predictor coincid cu high vs. low scorers pe criteriu se raporteaza testul T, al semnificatiei diferentei intre doua medii (p
Exemplu validare de criteriu: Scala Do din CPI (1)
Obiectivele scalei
Scala Dominan (Do, Dominance) a fost dezvoltat iniial n cadrul unui proiect de studiu al participrii politice (Gough, McClosky & Meehl, 1951) cu scopul explicit de a identifica indivizii puternici, dominani, influeni, cu ascendent asupra celorlali i care preiau conducerea i i exercit autoritatea (Megargee, 1972).
Exemplu validare de criteriu: Scala Do din CPI (2)Constructia scalei
Scala Do a fost construit prin compararea empiric a conceptului de dominan cu scorurile obinute de ctre un numr de subieci pe baza unui set de itemi, construit special n acest scop.
Gough, McClosky & Meehl (1951) au construit un set de itemi care putea descrie o persoan dominant i au selectat din acesta, pe baza unui procedeu experimental-comparativ itemii cu puterea cea mai mare de discriminare.
Procedeul este numit peer nomination i const, n forma sa clasic, din aceea c, ntr-un eantion de subieci care sunt familiarizai unul cu altul (de exemplu o clas de elevi, un grup de munc), persoanele care compun eantionul sunt rugate s-i numeasc pe aceia dintre ei care se potrivesc cel mai bine cu un anumit criteriu.
Ulterior, acestor persoane selectate li se aplic un set de itemi sau un chestionar i pe baza analizei statistice sunt reinui itemii care au putere de discriminare.
Exemplu validare de criteriu: Scala Do din CPI (3)
Cateva studii importante sunt:
Gough (1969b): comparatie de peer-nominated cu normele nationale
Gough (1969b): comparatie de high si low nominated intre ei
Hase & Goldberg (1967): comparatie auto-evaluare globala si auto-evaluare cu CPI
Megargee, Bogart & Anderson (1966): validare predictiva
Gough (2003): studiu longitudinal peste 40 de ani, cadeti din West Point
Dicken (1960): studiu cu Gi vs. Do (arata semnificatia prosociala a Do)
Gough (1954); studiu cu Sy si Do (militari marsaluind)
Exemplu validare de criteriu: Scala Do din CPI (4) 4 factori in interpretare
Primul factor este compus n principal din itemi care descriu persoana evaluat drept un leader, cruia i place s conduc, s vorbeasc n faa altor oameni i care are talent pentru organizarea i controlarea celorlali. Exemple de astfel de itemi sunt Am un talent nnscut de a influena oamenii (adevrat), Cred c mi-ar plcea s am putere asupra altora (adevrat).
Al doilea factor este descriptiv pentru un puternic sentiment al auto-controlului, fiind compus din itemi precum mi este greu s m concentrez pe activitatea pe care trebuie s o fac (fals), Renun cu uurin atunci cnd lucrurile devin dificile (fals) i Am greuti mai mari dect ceilali oameni cu concentrarea (fals).
Al treilea factor ine de controlul i dirijarea celorlali, coninnd itemi precum mi place s dau ordine i s pun lucrurile la punct, Mi-ar plcea s am autoritate asupra altor oameni i mi place s planific lucrurile i s stabilesc ce are fiecare persoan de fcut.
Al patrulea factor poate fi descris drept factorul normei sociale; conine doar doi itemi, ns ambii afirm obligativitatea fiecrei persoane de a participa la activitile grupului sau naiunii sale i de a se supune consensului comun.
Exemplu validare de criteriu: Scala Do din CPI (5)
Adjective asociate
Exemplu validare de criteriu: Scala Do din CPI (6) Comportamente asociate
i-a asumat controlul grupului (.33);
A vorbit mult la ntlnire (.33);
A avut mai multe de spus dect oricine altcineva (.32);
A acordat sprijin celui care a avut o idee bun (.32);
A nvat numele tuturor celorlali din grup (.29);
A vorbit doar dac i s-a adresat altcineva nti (-29);
Nu a intrat n conversaie pn nu i s-a pus o ntrebare (-.19);
A dat doar rspunsuri monosilabice la ntrebri personale (-.19);
A ateaptat ca cealalt persoan s aleag tema conversaiei (-.18);
A devenit tcut atunci cnd au intrat oameni noi n ncpere (-.17);
Exemplu validare de criteriu: Scala Do din CPI (7)
Descrieri din anamneza
Neobinuit de sigur pe sine, se simte n stare s fac fa aproape oricrei situaii. (.27, .24);
Las o impresie bun, are tehnici interpersonale eficiente. (.24, .20);
Folosete un vocabular vast i variat. (.14, .23);
Plin de haz i de via, face o conversaie interesant. (.16, .26);
Este nesigur pe sine, are ndoieli privind propriile abiliti. (-.22, -.24);
Are multe griji i probleme. (-.18, -.20);
Este reticent i taciturn. (-.19, -.14);
Are dificulti n a-i exprima ideile. (-.16, -.20);
Exemplu validare de criteriu: Scala Do din CPI (8) Concluzii
Pentru a concluziona asupra scalei de dominan din CPI, putem spune c indivizii cu scoruri mari la Do sunt ncreztori n propriile fore, ambiioi, asertivi, vorbrei, centrai pe sarcin, ntreprinztori i persuasivi. Dominana lor este n primul i primul rnd prosocial, prin faptul c i exercit influena asupra celorlali, urmrind scopuri demne de a fi urmate, consensuale i acceptate social, i nu doar de dragul mplinirii propriilor ambiii. Ceilali le recunosc abilitile de leadership i sunt dispui s accepte sfaturile i chiar controlul lor.
Spre deosebire de persoanele care au scoruri mari la Do, persoanele cu scoruri mici sunt reticente, lipsite de ncredere n propriile fore, submisive, neambiioase, lipsite de aptitudini sociale, defetiste, se ruineaz uor, sunt retrase n cadre sociale, ngrijorate i cu probleme.
Pentru persoanele cu scoruri foarte mari la Do, este posibil adoptarea unor comportamente excesiv de dominante i axate spre controlul extrem al celorlali, ceea ce echivaleaz cu un abuz al capacitilor lor de persuadare a celor din jur. Aceast posibilitate de uz antisocial a caracteristicii de dominan crete progresiv n condiiile n care persoana respectiv cupleaz scorul foarte mare la Do, cu scoruri mici la scale precum Re sau To. Studii de caz ilustrative din acest punct de vedere pot fi gsite n Meyer & Davis (1992) i McAllister (1996).
Validitatea de criteriu: Exemple (1) Responsabilitatea (CPI)
Este o persoan responsabil i serioas (.23, .30); Este productiv, i atinge obiectivele, rezolv lucrurile (.16, .30); Valorizeaz aspectele intelectuale i cognitive (.26, .33); Are un nivel nalt de aspiraie pentru sine (.27, .18); ... Este neprevizibil i schimbtor n comportamente i atitudini (-.15, -.27); Diverse nevoi ale sale tind s fie exprimate ntr-o manier relativ direct i necontrolat, nu
poate amna gratificaiile (-.20, -.31); mpinge i testeaz limitele, ncearc sp stabileasc n continuu ce anume i poate
permite i ce nu (-.31, -.22); Este indulgent cu sine (-.25, -.30);
Perseverenta (AMI) caracterizat drept luptator (.62), tenace (.51), competitiv (.44), fricos (-.23), timid (-.50),
cedeaza usor (-.59) Lucreaza energic la sarcinile pe care le are (.36) Nu se lasa intimidat de obstacole (.32) Trece de obstacole prin depunerea unui efort mai mare (.29) Nu renunta la sarcini, nici chiar cand sunt indemnati (.27)
Validitatea de criteriu: Exemple (2)
dovezi experimentale:
experiment pentru Sy
comparatii intergrupuri:
AMI; motivatie pentru performanta pe esantioane de sportivi, artisti, someri
CPI, To; toleranta comparata pe esantioane de hipioti, neonazisti, calugari
SWS, TABP comparat pe esantioane de bolnavi
uneori aceasta abordare iti documenteaza scala (adica aduce la lumina noi utilizari sau semnificatii):
CPI, Re: ceasornicari, slefuitori de diamante, controlori de zbor etc.
Validitatea de criteriu: Exercitiu avem de ales intre doua scale de dominanta, fiecare cu urmatoarele corelatii, care e mai valida?
1 Propensiunea spre comportamente expresive spontane (.38); Manifesta aceste comportamente chiar n situaiile n care acestea nu se impun (.33); Manifesta furie si comportamente agresive fizic, fa de persoane sau obiecte (.26); Tendina de a rzbuna nedreptile suferite de sine sau de prieteni (.30); Ruminare privind pedepsele cuvenite inamicilor (.29); Tendina de a avea comportamente agresive din punct de vedere verbal, atunci cnd se crede
ndreptit (.42); Competitiv n a demonstra c propriul punct de vedere este cel corect (.36).
2 i-a asumat controlul grupului (.33); A vorbit mult la ntlnire (.33); A avut mai multe de spus dect oricine altcineva (.32); A acordat sprijin celui care a avut o idee bun (.32); A nvat numele tuturor celorlali din grup (.29); Se comport ntr-o manier asertiv. (.42); Are prezen social, este n largul su n situaii sociale. (.36); Este un individ vorbre. (.32); Tinde s i ofere sfatul. (.34);
Validitatea predictiva
cea mai puternica, dar si cea mai rara
se bazeaza pe studii longitudinale, care prezic evolutii sau comportamente pentru populatii largi, pe perioade de timp relativ lungi
Exemple:
CPI, modelul cuboid, ca predictor al succesului militar: absolventi de West Point, promotiile anilor 60 si 70
EPQ: studiu longitudinal pe probabilitatea de recidiva a detinutilor
STAXI: studiu longitudinal pe probabilitatea de a avea un accident auto, studiu pe accidente de munca
SWS: studiu longitudinal pe probabilitatea de a avea un infarct miocardic
Raven: prezice succesul scolar
Validitatea divergenta
Este importanta mai ales in acele conditii in care conceptul-tinta este foarte aporpiat de alte concepte
Exemplu:
test de depresie
exista comorbiditate intre depresie si anxietate
ar trebui sa demonstram
nu doar ca testul nostru diferentiaza depresivi de nondepresivi
ci si ca nu coreleaza cu teste de anxietate
si ca diferentiaza mai bine intre high si low scorers de depresie decat intre high si low scorers de anxietate
Validitatea de aspect o modalitate (gresita) de a infera validitatea de criteriu (sau validitate in general) este bazata pe itemii scalei sau pe natura problemei
personalitate: 27. Cnd m contrazic cu cineva am tendina s vorbesc mai tare dect de obicei. 86. Clocotete sngele n mine cnd sunt luat de prost. 105. Deseori nu mi pot stpni suprarea i furia. 113. Am deseori tendina s fiu grbit i repezit, chiar i atunci cnd nu e cazul. 115. Se ntmpl des s m enervez prea repede pe cineva. 135. Pot fi uor scos din srite dac sunt agresat. -30. Dac ceva mi merge ru, nu m enervez pentru mult timp. -52. Chiar i atunci cnd sunt prea multe lucruri de fcut, prefer s le fac n ritmul meu. -60. Chiar dac ceva m scoate din srite, de cele mai multe ori m calmez repede. -93. Nu sunt multe lucrurile care reuesc s m irite sau s m enerveze. -102. n general sunt o persoan linitit i greu de enervat. -108. Exist o mulime de mici neplceri ale vieii pe care nu le las s m tulbure.
aptitudini mentale: mai usor de hotarat, caci sarcina descrie constructul exemplu:
cerem subiectilor sa si aminteasca spontan sau sa recunoasca informatie verbala, vizuala sau numerica; subiectilor li se prezinta, de exemplu, informatie grupata n anumite categorii si li se cere apoi sa reproduca respectivele categorii.
ce test e?
uneori insa e complicat: test cu final deschis, care cere subiectilor sa genereze un numar ct mai mare de cuvinte sau de idei asupra unei teme date, ntr-o
perioada specificata de timp; se masoara numarul ideilor este acest test valid ca test de originalitate?
Validitatea trebuie judecata atat general cat si situational general:
un test care nu a fost validat nu ar trebui utilizat
poate nu au fost culese date de validare exact in situatia care ma intereseaza, dar faptul ca ele exista, ma face sa am mai multa incredere
exemplu:
un test de persuasiune a fost validat in contextul unui studiu experimental (elevi care trebuiau sa convinga clasa sa actioneze intr-un anumit fel) poate fi utilizat pentru a evalua agenti de vanzari?
situational
daca a fost validat pe situatii similare cu cea la care e folosit
daca e UTIL (uneori e evident)
trebuie sa selectez dintr-o clasa de copii pe cei care sunt susceptibili sa faca sport de performanta, am la dispozitie un test care masoara Extraversie, Nevrotismul si Psihotismul e valid?
Validitatea metodelor Evident, validitatea se refera mai degraba la masuratori specifice (de ex. teste specifice)
mai specific chiar, vorbim de validitatea scorurilor (adica a informatiilor obtinute)
Totusi se vorbeste despre faptul ca unele metode sunt mai valide decat sunt altele Cum se poate evalua validitatea unei metode?
evident, prin prisma potentialului sau de a genera informatie valida
De principiu, metodele sunt diferite din acest punct de vedere:
Assessment Center (multiple measures) .65 Interviu comportamental .40-.60 Teste de performanta directa (work sample) .54 Teste de abilitate .53 Teste de integritate .51 Chestionare de personalitate .39 Date biografice .38 Referinte .23 Interviu traditional (nestructurat / semistructurat) .05-.19
ionut.ionescuHighlight
ionut.ionescuHighlight
Validitatea metodelor ca functie a intinderii numarul de itemi (de instante comportamentale care sunt esantionate) determina validitatea,
nu doar fidelitatea testului; de aceea un test mai lung (sau interviu mai lung) este mai valid (presupunand ca este bine construit)
tinand orice alta variabila constanta, testele mai lungi sunt mai valide
pentru GAMA (test de abilitati cognitive), validitatea creste daca este administrat pentru perioada intreaga (N=270, criteriul performanta academica la scolari din an terminal al liceului):
1 minut .21
2 minute .30
3 minute .36
5 minute .39
10 minute .41
15 minute .45
20 minute .48
25 minute .51