Sunteți pe pagina 1din 71

METODE DE

CERCETARE CANTITATIV

1. IPOTEZELE DE CERCETARE
VALIDITATEA UNEI CERCETRI EXPERIMENTALE
1. Ipotezele de cercetare
Chiar dac Richelle1 regreta faptul c noiunea de ipotez a czut oarecum n dizgraie, n
favoarea cuvintelor teorie sau model, care nu au aceeai conotaie de pruden i scepticism, noi
mprtim mai degrab opinia lui Fraisse, potrivit cruia elaborarea ipotezei este cea mai
important i mai creativ faz dintr-un experiment sau cercetare. Aceasta datorit rolului ei de
cheie de bolt, de inim sau de nucleu al ntregii cercetri, elementul care leag teoria de
practic i pe amndou de metodologia statistic a demersului explicativ, mpingnd efectiv
cunoaterea tiinific nainte.
1.1. Definire: ce este o ipotez?
- Dup Reber, ea este orice afirmaie, propoziie sau presupunere care servete drept tentativ n
explicarea anumitor fapte.2 Prin extensie, o ipotez este i o strategie adoptat cu scopul de a
rezolva o anumit problem (perspectiv cognitivist).
- Este o atitudine individual care determin sensul unei alegeri (Piron3).
- Ipoteza este o propoziie supus verificrii prin proba faptelor (Richelle), o etap iniial a
demersului tiinific care declaneaz proceduri specifice de cutare (observaie sau experiment).
Fiind formulat la nceputul cercetrii, ipoteza se deosebete de teorie prin caracterul provizoriu
al explicaiilor date, n msura n care teoria reunete sintetic doar datele confirmate.
1.2. Genez: cum se nate o ipotez de cercetare?
Houser4 identific trei surse ale ipotezelor: experiena personal, cercetrile anterioare i teoria
tiinific. n prima accepiune Piaget a dezvoltat un punct de vedere revendicat i dezvoltat
ulterior de psihologia cognitiv: orice rezolvare de probleme pleac de la tatonri anticipative ale
soluiilor prin emiterea de ipoteze de rezolvare, n ceea ce se va numi spaiul
1 M. Richelle, n Doron, R., Parot, F. (1999). Dicionar de psihologie. Bucureti: Editura Humanitas, p. 426 i
urm.
2 Reber, A.S. (1985). The Penguin Dictionary of Psychology. London: Penguin Books, p. 336.
3 Piron, H. (2001). Vocabularul Psihologiei. Bucureti: Univers Enciclopedic, p. 182.
4 Houser, R. (1998). Counseling and Educational Research. Evaluation and Application. Thousand Oaks, London,
New Delhi: Sage Publications, p. 83 i urm.
3
problemei sau cmpul problemei. Pe de alt parte, personologul Kelly (1995) sugera c
fiecare persoan este un om de tiin, n msura n care fiecare ne angajm cu regularitate n a
formula i testa ipoteze, rezultatele acestor condensri tiinifice spontane i empirice fiind
chiar constructele personale.
n aceeai problem Zlate5 distinge ntre dou tipuri de ipoteze: cele integrate teoriei i cele
ncorporate cercetrii tiinifice. Dac ntr-o teorie ipoteza postuleaz existena unor entiti sau a
unor relaii ntre entiti sau fapte, ntr-o cercetare ipoteza este mult mai concret i clar
specificat. Ipoteza, n cadrul teoriei, este totdeauna speculativ, conjunctural i
provizorie, afirm autorul, care identific drept ipoteze toate enunurile, axiomele, postulatele,
legile sau teoremele acesteia.
Asimilnd cercetarea tiinific verificrii de relaii dintre variabile, Rateau6 vede sensul acestei
experiene doar n raport cu o problem bine definit i de interes pentru comunitatea tiinific.
Aceasta nseamn c orice cercetare are nevoie de un cadru de referin teoretic, cercettorul
trebuind s se intereseze n permanen asupra teoriilor existente, a evoluiei i a contradiciilor
lor. Aceast interaciune permanent dintre planul experienei i al teoriei ar permite rafinarea
simultan a ambelor planuri.
Pentru a sublinia legtura special pe care o opereaz ipotezele ntre planurile empirice i cele
teoretice, Charboneau (1988)7 subliniaz caracterul progresiv i procesual al elaborrii
ipotezelor, deoarece punctul de plecare este integrarea informaiilor deja disponibile, apoi
conceptualizarea i operaionalizarea acestora sub form de ipoteze.
- n prima etap se emit ipoteze generale, care sunt de fapt refleciile cercettorului rezultate din
lecturile sale, ghidate de cunotinele generale i modelele (paradigmele) pe care el le are.
- Deoarece ipotezele generale nu sunt direct verificabile, el trebuie s le operaionalizeze pentru
a deveni ipoteze de cercetare, ceea ce va permite tuturor cercettorilor s le neleag ntr-un
acelai mod.
- O a treia etap este cea n care ipotezele de cercetare sunt puse la prob prin intermediul
aparatului statistic i a ipotezelor statistice, ceea ce permite s se precizeze limita de valabilitate
a msurtorilor, pentru a distinge dac ele reflect o regularitate sau sunt doar un efect al
hazardului.
5 Zlate, M. (2000). Introducere n psihologie. Iai: Editura Polirom, p. 391.
6 Rateau, P. (2004). Metodele i statisticile experimentale n tiinele umane. Iai: Editura Polirom, p.
16.
7 Charboneau, C. (1988). n Robert, M. (coord.). Foundements et tapes de la recherche scientifique en psychologie.
Paris, Quebec: Maloine S.A. Edisan.
4
1.3.Tipuri de ipoteze de cercetare
Moore (1983)8 propune o tipologie simpl i larg accesibil pentru clasificarea ipotezelor.
- ntreaga investigaie pleac de la ipoteza de nul, deoarce scopul oricrei cercetri const n
infirmarea acesteia, faptul putnd fi formulat verbal astfel: nu exist diferene semnificative ntre
grupurile studiate, cele care apar datorndu-se hazardului. Matematic, exprimarea este
urmtoarea:
Ho1 = 2
n care Ho este ipoteza de nul, iar (miu, simbol grec) indic media populaiei. i totui, n
literatura de specialitate rareori vom ntlni formulat ca atare aceast ipotez, din cauza
caracterului ei universal i implicit.
- Atunci cnd teoriile i cercetrile anterioare las s se ntrevad c este posibil s existe o
diferen ntre grupurile studiate, dar datele sunt nc insuficiente pentru a prezice direcia exact
a acesteia, avem o ipotez alternativ bidirecional, ce poate fi redat simbolic astfel:
H11 2
n care H1 reprezint ipoteza specific (alternativ) bidirecional, iar 1 i 2 sunt mediile celor
dou grupuri.
- Cea mai precis dintre ipoteze este cea unidirecional, cnd se compar mediile a dou grupuri
i, folosind o variabil independent ca stimul, se anticipeaz un scor mai mare sau mai mic la
variabila dependent. Formula matematic este:
H11 < 2 sau H11 > 2
n afara acestei tipologii simple i elegante se pot invoca multe alte dihotomii.
- Ipoteze simple versus ipoteze complexe: unele ipoteze permit trecerea rapid de la propoziia
sau asumpiunea care servete ca tentativ n explicarea unor fapte (ipoteza de cercetare) la
instrumentarea demersului necesar dovedirii valabilitii ei. Relaia dintre zgomot i eficiena n
munc este curent operaionalizat n cercetrile despre stres n munc; palierele de echilibru,
care sunt stadiile dezvoltrii psihogenetice postulate de Piaget, sau stadialitatea afectiv i cea
psihomoral, propuse de Freud, respectiv de Kohlberg, sunt ns mult mai greu de dovedit
experimental. Alegerea situaiilor
8 Ap. Houser, op. cit., p. 84.
5
concludente care probeaz ideea de stadiu poate fi att de nuanat nct este posibil ca o alt
centrare sau selecie s poat da rezultate diferite.9 De aceea pare a fi foarte pertinent opinia lui
Richelle care nu vede o legtur direct ntre gradul de elaborare/completitudine al unei ipoteze
i valoarea concluziilor care decurg din ea: O ipotez foarte complicat poate s duc la
rezultate nesemnificative, dup cum o ipotez foarte simpl poate s deschid drumul spre fapte
de o mare importan.10
- Ipoteze inductive (izvorte din fapte izolate) versus ipoteze deductive (cu origine n cercetri
sau teorii deja recunoscute) fac trimiterea la o dihotomie i mai util, i anume ipoteze empirice -
care sunt generalizri integrate ntr-o teorie, dar care pleac de la fapte i experien -, versus
ipoteze teoretice - care nu au o inciden empiric evident, deoarece pleac de la consecinele
testabile ale unei teorii.
- Ipoteze exploratorii versus ipoteze explicativ-interpretative: primele abordeaz categorii noi de
fapte sau de probleme, au conexiuni mai slabe cu teoria i de aceea sunt mai vagi i mai puin
riguroase, pe cnd cele din a doua categorie depesc cadrul cercetrii n care au aprut,
ncercnd s refac legtura cu conceptele i legile mai generale ale teoriei de la care a plecat
cercetarea. Deoarece nu exist sigurana c interpretarea dat este i cea mai bun, ori singura
posibil, acestea au nevoie ele nsele de alte verificri ulterioare pentru a le determina mai exact
limitele de valabilitate, deci ele relanseaz practic ntregul ciclu al cercetrii.
- Ipoteze cauzale i ipoteze de covarian: uneori regularitatea semnalat de cercetare indic
o evoluie paralel (direct sau invers) a unui fapt cu alt fapt, fr a se putea face o inferen
sigur privitoare la cauzalitatea relaiei, i atunci ipotezele vor fi de covariaie. Este i cazul
cvasi-experimentului unde, neputnd manipula variabila independent de tipul apartenenei de
gen, mediu geografic sau vrst, cercettorul nu poate da statut de cauzalitate relaiei desprinse.
n ipotezele cauzale, din contr, se anticipeaz relaii de acest tip ntre variaii exterioare
subiectului (variabila independent) i efectele lor asupra subiectului (variabila dependent). Ele
sunt tipice doar metodei experimentale i sunt singurele care permit postularea de legi, de unde i
valoarea lor metodologic special.
La toate acestea se mai pot aduga i alte categorii, cum ar fi ipotezele ad-hoc i ipotezele
aleatorii. Atunci cnd ipotezele de baz ale unei cercetri nu sunt confirmate, ori
9 Cercetrile transculturale au evideniat deja limitele de generalitate ale acestor teorii pentru alte contexte dect cel
n care ele au aprut (cultura vest european, versus alte tipuri de culturi).
10 Parot, F., Richelle, M. (1995). op. cit., p. 192.
6
cnd efectul scontat nu apare, cercettorul ncearc s le apere invocnd alte ipoteze, construite
ad-hoc care - atunci cnd sunt probate ulterior de alte cercetri - pot fi utile, deoarece pot preciza
mai bine condiiile n care efectele anticipate pot aprea. Ipotezele aleatorii nu au ns nici mcar
aceast valoare euristic, ele neavnd nici un rol n progresul cunoaterii, deoarece cel mai
adesea sunt elaborate fr parcurgerea atent a domeniului teoretic i de cercetare, dnd o
pondere mult prea mare elementului hazard, inspiraie de moment etc.
Aceste tipuri de clasificri ridic automat o alt problem, cea a valorii ipotezelor i a criteriilor
de identificare a acesteia. Cerinele unei bune ipoteze sunt urmtoarele:
- Ea trebuie s fie testabil: putem afirma c exist via n univers, dar afirmaia nu poate
deveni o ipotez valoroas atta vreme ct nu dispunem de mijloacele tehnice necesare testrii ei.
- Ca i n cazul unei teorii, o ipotez bun trebuie s fie falsificabil (Popper), ceea ce
nseamn c cineva poate aduna dovezi asupra falsitii sau incorectitudinii ei. Putem susine
ipoteza discontinuitii faliilor spaio-temporale n producerea fenomenelor paranormale de tipul
fantomelor, dar deoarece nu suntem nc n posesia instrumentelor cu care s nregistrm i s
msurm fenomenele de aceste tip, rezult implicit c nu avem n nici un fel posibilitatea de a
dovedi validitatea sau invaliditatea unei asemenea ipoteze.
- O ipotez trebuie s fie raional (plauzibil), rezultnd din faptul c exist o
probabilitate suficient de mare ca ea s fie adevrat (este verosimil). De exemplu, dac a face o
legtur ntre performana colar i inteligen este rezonabil, a face legtura ntre performana
colar i unii indicatori antropometrici (perimetrul cranian) nu mai este rezonabil.
- O ipotez trebuie s fie parcimonioas (economicoas) n sensul c dintre dou ipoteze de
aceeai valoare explicativ este preferabil ipoteza cea mai simpl i care se potrivete cel mai
bine cu teoriile curente din domeniu.
- Moore (1983)11 adaug la aceste condiii nc dou elemente de apreciere a valorii unei ipoteze,
i anume scurtimea (ipoteza trebuie formulat n termenii cei mai concii posibili) i claritatea
(proprietate care se refer la uurina cu care altcineva poate nelege acea ipotez).
11 Ap. Houser, op. cit., p. 87.
7
- O ipotez are i rolul de a ne ghida n alegerea celor mai potrivite metode statistice pentru a o
proba: Trebuie s existe consisten (potrivire) ntre ipotezele identificate i tipurile de statistici
utilizate, afirm Houser.
Sumariznd, valoarea unei ipoteze const n fecunditatea ei, adic n capacitatea de a oferi
explicaii unui ansamblu semnificativ de fapte, asigurnd astfel progresul cercetrii.
2. Validitatea unei cercetri experimentale
2.1. Validitatea intern
Validitatea intern presupune faptul c schimbrile survenite la nivelul variabilei dependente
sunt datorate efectului schimbrii la nivelul variabilei independente, i nu ca urmare a altor
variabile strine, explicaii alternative sau ipoteze rivale. Cnd aceste variabile externe cercetrii
pot fi controlate se poate aprecia c rezultatele sunt datorate tratamentului experimental i n
acest caz cercetarea are validitate intern.
Iat variabilele externe semnalate de Campbell i Stanley (1963)12 care pot amenina validitatea
intern a unei cercetri:
- Istoria: se refer la evenimentele specfice, provenite din mediul exterior, aprute ntre prima i
a doua msurtoare i care devin surse de distorsiune, deoarece se supra-adaug la variabilele
experimentale. Istoria poate fi controlat prin existena grupului de control, care este supus pe
parcursul studiului la aceleai evenimente ca i grupul experimental, exceptnd bineneles
tratamentul experimental.
- Maturaia: sunt procese ce opereaz n interiorul subiectului ca funcie a trecerii timpului:
cretere, mbtrnire, oboseal, nfometare etc., procese care pot fi simultan biologice i
psihologice. Creterea forei musculare, a coordonrilor de finee, dar i a oboselii pot n mod
egal aprea ntre cele dou faze ale cercetrii, genernd schimbri de tip maturaional, care pot fi
contrabalansate prin grupul de control, ca i n cazul precedent.
- Testarea: prin faptul c n ambele faze (pretest i posttest) se administreaz acelai tip de teste
poate aprea aa-numita deteptciune n testare care afecteaz rezultatul la posttest, n sensul
creterii lui. Subiectul nva din faza de pretest s se acordeze pe acel tip de informaie sau
comportament ateptat de la el, aa cum a vzut n pretest. De aceea este important ca toi
subiecii s parcurg faza de pretest i de posttest, ceea ce duce la efectul de balansare a efectului
de nvare pentru ambele grupe experimentale.
12 Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs for research and teaching.
Chicago: Rand McNally, pp. 171-246.
8
- Instrumentaia: atunci cnd exist faz de pretest i de posttest, schimbrile survenite la
nivelul variabilei dependente pot fi datorate instrumentului n sine, n cazul n care el se schimb
de la o faz a cercetrii la alta i cnd el nu este echivalent pn la identitate n faza a doua
comparativ cu prima. Uneori schimbrile apar la nivelul observatorilor sau judectorilor celor
dou tipuri de performane, aici instrumentul fiind substituit cercettorilor nii.
- Regresia statistic: apare atunci cnd grupurile au fost selecionate pe baza scorurilor extreme
(aa-numitele grupuri de contrast, cum ar fi studeni foarte buni i foarte slabi, subieci foarte
inteligeni i non-inteligeni etc.). Semnalat nc de ctre Galton, regresia statistic const din
tendina scorurilor extreme de a regresa spre medie. Selectnd subieci de la extremele curbei lui
Gauss, scorurile la teste vor tinde n timp spre nivelare, adic spre valoarea medie, scderea lor la
faza de posttest avnd aceast cauz, i nu una ce rezult din manipularea experimental.
- Erorile de selecie: selecia difereniat (non-aleatoare) intervine atunci cnd participani cu
particulariti diferite (cum ar fi factorii vrst, instrucie sau sex) se afl n grupul de control i
n cel experimental, rezultatele constatate putndu-se datora nu tratamentului experimental, ci
tocmai acestor particulariti difereniatoare. Aceste variabile incluse sau confundate pot fi deci
sursa real a variaiei VD, mascnd sau distorsionnd efectul real al VI. Dac, de exemplu,
grupul experimental are elevi cu o medie de vrst mai mare, rezultatele lor superioare la probele
de citit-scris s-ar putea datora unor elemente care se confund cu factorul vrst (maturitate
global mai mare, expunere mai ndelungat la experiena citit-scrisului sau pur i simplu
prezena mai multor oportuniti de nvare). Pentru a combate aceast surs de eroare putem
proceda astfel: mprim participanii dup criteriile reperate a avea importan (vrst, sex,
clas, studiile prinilor etc.) i apoi le repartizm randomizat (aleator) n grupurile de control i
experimental, pentru a produce efectul de balansare / echilibrare ntre grupuri.
- Mortalitatea experimental: se refer la subiecii care sunt prezeni n faza iniial a cercetrii,
dar dispar pe parcurs, din grupul martor sau - i mai ru! - chiar din grupul experimental. Aceast
ameninare a validitii studiului poate fi totui contracarat prin introducerea unei faze de pretest
pentru a determina dac cei care au disprut din cercetare sunt sistematic diferii de cei care au
urmat-o pn la capt.
9
- Interaciunea selecie-maturaie: combin ameninrile la adresa validitii din cele dou
surse, selecia i maturaia, dei trebuie spus c maturaia este caracteristica mai definitorie care
face ca cele dou grupuri s difere.
Cook i Campbell (1979)13 mai adaug la aceste surse de distorsiune nc patru categorii:
- Difuziunea tratamentului experimental: atunci cnd grupul de control este ntr-o strns
proximitate cu cel experimental, este posibil ca cei din grupul de control s fi identificat idei
interesante aprute n cursul comunicrii dintre participani i s le utilizeze ca rspuns la
variabila independent. Pericolul contaminrii prin difuziunea tratamentului poate fi evitat prin
selecia grupului de control din coli sau locaii diferite, ori prin alegerea de secvene temporare
diferite, ceea ce reduce drastic posibilitatea de contact i de comunicare ntre cele dou grupuri.
- Rivalitatea compensatorie a grupului de control (efectul J ohn Henry): atunci cnd vechiul
mod de lucru este ameninat de noua procedur experimental propus, unii subieci se vor
strdui din rsputeri s dovedeasc faptul c vechiul lor procedeu lor este mai bun. Cel mai bine
ar fi ca participanii nici s nu tie din ce grup fac parte - experimental sau de control - pentru a
nu produce acest tip nedorit de competiie.
- Egalizarea compensatorie a tratamentului: membrii grupului de control s-ar putea simi
nedreptii dac vor crede c celor din grupul experimental li se aloc mai mult interes i resurse
i - pentru a-i mulumi - conducerea le-ar putea aloca resurse suplimentare neprevzute, ceea ce
ar putea atenua efectul tratamentului experimental.
- Demoralizarea ofensat a grupului de control: afectai de faptul c ei nu le afl printre cei
alei (n grupul experimental) i c nu vor primi tratamentul experimental, grupul de control va
avea performane mult mai sczute, n principal dintr-o motivaie mult mai slab.
2.2. Validitatea extern i generalizabilitatea rezultatelor
Se refer la msura n care relaiile desprinse n laborator pot fi extinse i generalizate la alte
situaii similare, ceea ce ne-ar permite s afirmm c ele sunt valide extern. Pentru acest acpect,
Brach i Glass (1968) au propus un termen care a fost ulterior preluat i consacrat de psihologia
cognitiv, i anume validitatea ecologic, care accentueaz asupra valabilitii generalizrii
datelor de laborator n condiii de mediu natural. Ei au identificat zece catagorii de factori care
afecteaz acest tip de validitate.
13 Cook, T.D., Campbell, D.T. (1979). Quasi-experimentation. Design and analys issues for field settings. Chicago:
Rand MacNally.
10
- Descrierea explicit a tratamentului experimental: variabila independent trebuie descris
suficient de amnunit, astfel nct cel care va relua i replica experimentul s o poat reproduce,
dei trebuie menionat c n interveniile terapeutice sau educaionale acest lucru este unul foarte
greu de realizat.
- Interferenele tratamentelor multiple: dac participanii primesc mai mult dect un tratament,
este foarte greu de dovedit care tratament, sau care combinaie de tratamente, a dus la rezultatul
aprut. Mai ales atunci cnd mai multe tratamente sunt aplicate simultan, se dovedete a fi foarte
greu de stabilit ponderea cu care fiecare component a participat la obinerea rezultatului final.
- Efectul Hawthorne: o cercetare din anii '40 la Western Electric Company a artat c indiferent
de condiiile de iluminare - slabe sau bune - productivitatea lucrtorilor a crescut, n principal din
cauza faptului c simpla lor includere n studiu a generat o puternic motivaie, ceea ce a dus la
creterea productivitii i la grupul martor, cel care avea o iluminare mai sczut.
- Efectul disruptiv al noutii: un tratament poate s creeze o perturbare a activitii dar, odat
asimilat, poate s aib consecine benefice n mod constant.
- Efectul de examinator: eficiena tratamentului nu este aceeai dac cel care l administreaz
este cercetror sau student, psiholog sau profesor, diriginte sau o persoan neutr. Deoarece
efectul experimental nu va mai aprea n condiiile absenei celui care a administrat tratamentul,
acesta nu poate fi generalizat.
- Sensibilizarea la pretestare: mai ales atunci cnd subiecilor li cere s reflecteze sau s-i
exprime atitudinea fa de un fenomen, cei care au avut n prealabil o faz de pretest vor fi mai
sensibili la tratamentul experimental dect ceilali.
- Sensibilizarea posttest: ca i n cazul precedent, faptul de a administra un test (n orice faz a
experimentului) ajut subiectul s colecteze informaii utile ntr-o manier n care cei care nu au
participat la testare nu o pot face.
- Interaciunea istoriei cu efectul tratamentului: se produce deoarece anumii factori
contextuali n care se desfoar cercetarea nu pot fi replicai exact ntr-o faz ulterioar a
cercetrii i de aceea efectele tratamentului nu mai pot fi generalizate i la alte situaii.
- Msurarea variabilei dependente: cnd VD este msurat printr-un test cu alegere multipl
sau printr-o gril de observaie perceptiv concluziile reieite din cele dou metode pot fi destul
de divergente.
11
- Interaciunea dintre timpul msurtorii i efectele comportamentului: atunci cnd posttestul
este administrat imediat, el poate s dea rezultate diferite fa de administrarea lui ntrziat, la
distan de sptmni sau de luni/ani.
La toate aceste probleme ale validitii externe, oarecum universale, cercetarea psiho-pedagogic
ridic n plus i probleme specifice. Un experiment care ar urma s dovedeasc ct de eficace
este o nou tehnic de predare, de evaluare sau de consiliere, ar trebui s aib n vedere c nu
este rezonabil s se atepte schimbri rapide n planul formrii atitudinilor, cunotinelor sau
deprinderilor. Studiul va produce deci schimbri nesemnificative pentru perioade scurte de timp
(de zile sau sptmni), dar ar putea s dea bune rezultate dup trecerea unor perioade de timp
mai lungi (de luni, semestre). Interveniile destinate schimbrilor importante n cunoatere,
personalitate sau comportament nu se pot realiza prin experimente scurte i nici prin una-dou
edine. Pe de alt parte, cel care administreaz tratamentul (profesor, consilier colar sau
psiholog) ar putea s nu respecte aceleai proceduri n aplicarea lui (standardizarea
tratamentului) de unde i necesitatea de a fi antrenai sau chiar supervizai n acest sens.
Autoevaluare
1. Definii n ce const o ipotez de cercetare i care este rolul ei n acest proces.
2. Care este geneza unei ipoteze de cercetare valoroas? (Indicai cinci criterii de valoare).
3. Din tipologia ipotezelor de cecetare propuse n curs analizai cuplurile ipotez de nul - ipotez
specific i ipotez unidirecional - ipotez bidirecional.
4. Analizai rolul istoriei, maturaiei i al morii experimentale n problematica validitii interne
a unei cercetri experimentale.
5. Selectai pentru o analiz mai detaliat trei dintre elementele cele mai importante care pot
distorsiona semnificativ validitatea extern a unei cercetri experimentale psihopedagogice i
indicai modul n care acestea pot fi controlate sau contracarate.
Bibliografie
1. Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs for
research and teaching. Chicago: Rand McNally.
2. Doron, R., Parot, F. (1999). Dicionar de psihologie. Bucureti: Editura Humanitas.
12
3. Houser, R. (1998). Counseling and Educational Research. Evaluation and Application.
Thousand Oaks, London, New Delhi: Sage Publications.
4. Piron, H. (2001). Vocabularul Psihologiei. Bucureti: Univers Enciclopedic.
5. Rateau, P. (2004). Metodele i statisticile experimentale n tiinele umane. Iai:
Ed. Polirom.
6. Reber, A.S. (1985). The Penguin Dictionary of Psychology. London: Penguin Books.
7. Robert, M. (coord.). (1988) Foundements et tapes de la recherche scientifique en
psychologie. Paris, Quebec: Maloine S.A. Edisan.
8. Zlate, M. (2000). Introducere n psihologie. Iai: Editura Polirom.
13
2. TIPURI DE DESIGN AL CERCETRILOR
EXPERIMENTALE I NONEXPERIMENTALE
2.1. Definirea design-ului experimental
Design-urile de cercetare indic decizia luat n legtur cu grupurile utilizate i de cte ori (cine
i cnd) li se administreaz variabila independent, innd sub control variabilele interne i
externe care ar putea amenina validitatea demersului. Pentru a simplifica problema i a-i da o
expresie simbolic, prezentm cteva notaii utile care se refer la elementele incluse ntr-un
design experimental:
R = distribuia randomizat a subiecilor pe condiiile i grupurile experimentale;
X = tratamentul experimental (VI);
O = observaii sau msurtori ale variabilei dependente (VD) n faza de pretest, posttest sau
interimar).
Design-ul de cercetare constituie i o cale de a controla principalele surse de distorsiuni pentru
validitatea intern a cercetrii: maturarea i istoria sunt controlate prin prezena grupului de
control, aa cum am artat deja, selecia difereniat prin distribuia randomizat a condiiilor i
criteriilor etc. n acelai timp ns el poate fi gndit i ca o structur a cercetrii, deoarece el este
elementul de legtur al tuturor celorlalte elemente implicate n proiectul de cercetare.
Relund notaiile, pentru a le face mai explicite, R se refer la grupurile implicate n cercetare,
fiecare grup avnd propria sa linie n structura design-ului. Principalele tipuri de construcie a
grupurilor sunt prin randomizare (de aceea selecia aleatorie este notat cu R), grupuri ne-
echivalente (N) sau grupuri balansate (B), ori grupuri apariate (A), astfel costruite nct s
realizeze echivalena simultan dup mai multe criterii, ca vrst, sex, pregtire profesional,
vechime etc.
O se refer la observaiile sau msurtorile care pot fi unice (de exemplu nalimea), alctuite din
scale omogene, alctuite din mai muli itemi reunii ntr-o scal (de anxietate, de exemplu), sau
din mai multe subscale, reunite ntr-o scal compozit sau ntr-o baterie (sentimente anxioase,
gnduri anxioase plus simptome fizice ale anxietii, reunite toate n
14
scala de anxietate a lui Burns). Cnd vrem s difereniem ntre msurtori specifice putem folosi
indici: O1, O2, O3.
X se refer la tratamente sau intervenii, care pot fi simple sau complexe (aplicarea de stimuli
auditivi sau luminoi, prin comparaie cu o metod nou de formare sau de training educaional).
Cnd dorim s difereniem ntre intervenii, putem de asemenea s utilizm indici (X1, X2, X3
etc.).
Timpul este o component de baz dintr-un design de cercetare experimental, dei el este mai
greu de figurat ca atare. De regul, ordinea n care apar celelalte simboluri sugereaz i secvena
temporal, care de fapt nu apare explicit n design.
R O1 X O2
R O1 O2
Figura 2.1. Design experimental pe grupuri randomizate,
cu grup experimental i grup de control i cu msurtori pretest i posttest14.
n care: - R reprezint selecia randomizat a grupurilor;
- X reprezint intervenia (manipularea experimental) asupra variabilei independente;
- O1 i O2 reprezint etapele msurrii;
- pretestul i posttestul sunt simultane pentru ambele grupe (experimental i de control);
- exist dou linii ale design-ului, cte una pentru fiecare grup.
Prezentm mai jos cteva tipuri de design experimental, indicnd scopul lor, gradul de control al
variabilelor i cteva caracteristici definitorii.
Tip de design
Scopul su
Grad de control al variabilei strine
Caracteristici
Experimentul real (veritabil, adic cu grupuri de pretest i post test, sau numai posttest).
Comparaia tratamentelor grupurilor asupra controlului ori a abordrilor tradiionale.
Mare cantitate a controlului.
- Manipularea variabilei independente;
- Distribuia randomizat a grupurilor.
Cvasi-experimental (serii temporale de genul AB AB).
Comparaia ntre grupuri ori a aceluiai grup n diferite momente temporale.
Cantitate moderat a controlului.
- Manipularea variabilei independente;
- Distribuire nerandomizat a subiecilor n grupuri;
- Multiple evaluri ale variabilei dependente.
Pre-experimental (de
Comparaii ntre grupuri
Control minim.
- Manipularea variabilei
14 Prelucrare dup Hohn, M., Vrg, D. (2000). Ghid practic de psihologie experimental. Timioara:
Tipografia Universitii de Vest, p. 33.
15
exemplu o singur secven pretest - posttest).
sau n cadrul aceluiai grup, dar n general nu la o mare distan temporal.
independente sau msurarea unui eveniment care a aprut doar pentru un grup, pentru care examinatorul
nu are nici un control;
- Distribuire nerandomizat a subiecilor n grupuri.
Descriptiv (de exemplu studiu cauzal - comparativ -observaional).
__________A descrie un eveniment sau un fenomen.
Nici un control asupra evenimentelor sau fenomenelor.
- Nici o manipulare a variabilei independente;
- Distribuire nerandomizat a subiecilor n grupuri.
Figura 2.2. Categorii de design-uri de cercetri cantitative (Sursa: R. Houser15).
2.2. Planuri experimentale de baz16
Design 1. Un singur grup cu pretest i posttest
O1 X O2
Scopul: de a determina dac o metod de predare va crete calitatea scrierii.
A. Procedura
1. Se administreaz pretestul i se msoar (O1) scorul la un test grafometric pentru un singur
grup, nainte de a-l expune la o nou metod de predare.
2. Se expune (X) grupul la noua metod de predare pentru o perioad de timp, de exemplu un
semestru.
3. Se d posttestul i se msoar (O2) scorul la acelai test grafometric dup expunerea la
tratament.
4. Se compar semnificaia statistic a diferenei mediilor (testul t Student) pentru a vedea dac
diferena atinge pragul semnificaiei statistice i la ce nivel (p = .05 sau p = .01).
B. Validitatea
Validitatea intern
Avantaje: deoarece se refer la aceiai subieci, care sunt msurai n dou situaii - nainte i
dup tratamentul experimental X - selecia i mortalitatea experimental sunt uor de controlat.
Dezavantaje: nesigurana c diferena dintre O2 i O1 este datorat doar tratamentului. Ipoteze
rivale, i deci erori posibile sunt foarte multe: istoria (ntre timp unii subieci i-au pus
15 Houser, R. (1998). Counseling and Educational Research. Evaluation and Application. Thousand Oaks, London,
New Delhi: Sage Publications, p. 22.
16 Adaptat dup Campbell, D.T., Stanley, J.C. (1966). Experimental and Cvasi-experimental Designs for Research.
Rand McNally and Company.
16
ochelari), maturaia (pot fi mai obosii la O2 pentru c elevii sunt la sfrit de semestru sau poate
de an colar), efectul testrii (la a doua testare apare o motivaie mai bun sau este indus efectul
nvrii), regresia statistic (dac comparaia se face splitnd clasa n cei buni i cei slabi),
moartea experimental (muli subieci nu au primit i pe O1 i pe O2).
Design 2. Design cu dou grupuri - de control i experimental,
ambele randomizate - cu fazele de pretest i de posttest
Pretest Tratament Posttest
Grupul experimental R O1 X O2
Grupul de control R O1 O2
A. Procedura
1. Se selecteaz subiecii aleator (randomizat) dintr-o populaie.
2. Acetia se distribuie tot randomizat n grupul experimental i n cel de control.
3. Se msoar la ambele grupuri variabila dependent (O1), apoi se determin media i abaterea
standard, pentru a se constata echivalena grupurilor (testul t, testul Levene).
4. Se pstreaz toate condiiile identice pentru ambele grupuri, cu excepia expunerii gupului
experimental la tratamentul X, prin variabila independent, pentru o perioad de timp specificat.
5. Se testeaz i se msoar variabila dependent (O2) pentru ambele grupuri, pentru a li se
determina media i abaterea standard.
6. Se determin diferena O2 - O1 pentru ambele grupuri, separat.
7. Se compar aceste diferene pentru a concluziona dac aplicarea tratamentului experimental X
se asociaz cu o schimbare semnificativ care apare la grupul de experimental, comparativ cu
grupul martor, pentru a se putea astfel respinge ipoteza de nul (Ho1 2).
Design-ul 2 ar putea fi extins cu una sau mai multe linii experimentale, caz n care ar arta astfel:
Pretest Tratament Posttest
Grupul experimental 1 R O1 X (Metoda a) O2
Grupul experimental 2 R O1 X (Metoda b) O2
Grupul de control R O1 O2
17
B. Validitatea
a. Validitatea intern
1. Validitatea intern devine mult mai puternic n acest tip de design, deoarece variabilele
strine ce pot aprea ntre O1 i O2 pot fi considerate ca balansate i sub control, n msura n care
ele afecteaz n mod egal ambele grupuri.
2. Deoarece tratarea difereniat a grupurilor experimental i de control (profesor diferit, clase
diferite, atmosfer diferit) poate crea un tip de eroare constnd din dezamgirea grupului de
control, subiecii vor fi testai individual ori n grupuri mici, prin distribuirea randomizat a
timpului, a locului i a condiiilor experimentale.
3. Atunci cnd sunt implicai observatori sau evaluatori, este bine ca ei s nu tie crui grup
(experimental sau de control) sunt asignai subiecii.
4. Selecia difereniat este controlat prin metoda randomizat de selecie iar maturarea, efectele
de pretestare i regresia statistic apar n mod egal pentru ambele grupuri. Mortalitatea
experimental difereniat poate fi evaluat pentru pattern-uri atipice, nealeatorii, deoarece exist
faza de pretest.
b. Validitatea extern
Pot fi generalizate, i pn la ce limit, concluziile acestui tip de demers?
1. n acest tip de design validitatea extern poate fi compromis doar n situaia n care pretestul
ar sensibiliza sau ar altera doar rspunsurile subiecilor care sunt supui tratamentului
experimental (interaciunea pretestrii cu X).
2. Interaciunea seleciei cu X: pot aprea destorsiuni semnificative atunci cnd subiecii
selecionai pentru tratament difer ntr-un fel oarecare de cei pe care vrem s generalizm
concluziile, de exemplu elevi din coli profesionale versus elevi din liceele obinuite, elevi din
clase de elit (sau de recuperare, n nvmntul inclusiv) versus cei din clasele obinuite.
3. Efectele de reactivitate la procedurile experimentale apar doar dac subiecii tiu c fac parte
din grupul experimental sau din cel de control. Soluia pentru acest caz este ca ei s nu tie din
start i s nu afle nici pe parcurs din care grup fac parte, msurtorile O1 i O2 putnd aprea ca
unele de rutin ale evalurii colare, iar tratamentul X ca fcnd parte din programul colar
normal.
Design 3. Design-ul cu patru grupe randomizate al lui Solomon
Grup Pretest Tratament Posttest Diferen
1. Pretestat R O1 X O2 1D O1, X, M, I
18
2. Pretestat R O1 O2 2D O1, M, I
3. Nepretestat R X O2 3D X, M, I
4. Nepretestat R O2 4D M, I
A. Procedura
Deoarece efectele msurate O2 reprezint expresia unor variate combinaii de variabile
(pretestarea O1, variabila independent X, maturarea M sau istoria I), pentru a determina doar
efectul tratamentului X, vom face diferena dintre 3D i 4D; doar efectul pretestrii O1, scdem
4D din 2D, iar pentru a determina efectul interaciunii dintre pretestarea O1 i X se adun 2D cu
3D, iar rezultatele se scad din 1D.
Raiunea acestui tip de design este aceea c prin adugarea n cercetare a liniilor 3 i 4 (subieci
nepretestai), validitatea extern ctig mult, deoarece se extinde posibilitatea generalizrii.
Aceasta ns doar n cazul n care pretestarea determin sensibilizarea celor care sunt expui la
tratamentul experimental. Pentru aceasta ns, condiia obligatorie este distribuirea randomizat
pentru toate cele patru grupuri, i aceasta deoarece doar aa putem presupune c scorurile la
pretestare din grupurile 3 i 4 ar fi fost echivalente cu grupurile 1 i 2. Nefiind pretestate ns,
efectul acestora nu va aprea n scorurile lor (O2), ceea ce ne ndreptete s facem diferena 4D
- 2D pentru a evidenia rolul pretestrii (O1).
B. Validitate
Acest design permite determinarea simultan a principalelor efecte ale pretestrii, ca i al
interaciunii efectelor pretestrii cu tratamentul experimental X. Comparnd grupul 1 cu grupul 4
se poate determina efectul combinat al maturrii i istoriei. De fapt, design-ul de tip Solomon
presupune o experimentare dubl, cu i fr pretest, iar atunci cnd ntre ele exist o bun
congruen a rezultatelor, se poate acorda o mare ncredere acestora, oricare ar fi ele.
Design 4. Design cu grup de control randomizat, doar cu faz de posttest
Pretest Tratament Posttest
Grupul experimental R X O2
Grupul de control R O2
A. Procedura
Aa cum se poate observa, design-ul 4 preia chiar ultimele dou coloane ale design-ului lui
Solomon. i aici repartizarea pe cele dou grupuri se face randomizat, ceea ce permite
cercettorului s tie ca la momentul respectiv cele dou grupuri erau egale. Dup aceasta
urmeaz expunerea X la tratamentul experimental, apoi cele dou grupuri sunt testate pentru
prima dat. Prin comparaia lor printr-un test statistic corespunztor se determin dac efectul
19
constatat la grupul experimental a aprut prin ans (hazard), sau se datoreaz tratamentului X,
adic variabilei independente.
B. Validitatea
Autorii apreciaz c design-ul 4 este superior design-ului 2, deoarece aici nu poate aprea nici o
interaciune dintre pretestare i tratament. Este un tip de demers care este deosebit de util atunci
cnd pretestarea este neconvenabil sau prea costisitoare, ori atunci cnd subiecii trebuie s-i
apere anonimatul. Pe de alt parte, atunci cnd mrimea eantioanelor este mic - i de aceea se
impune verificarea echivalenei - design-ul 2 este de preferat design-ului 4.
Design-ul 5. Design cu grup de control nerandomizat,
cu fazele de pretest i de posttest
Pretest Tratament Posttest
Grupul experimental O1 X O2
Grupul de control O1 O2
A. Procedur
Dei mai puin valoros ca design-ul 2, de care difer doar prin distribuia nerandomizat a
subiecilor, design-ul 5 este unul deosebit de util n cercetarea psihopedagogic, unde adesea
grupurile experimental i cel de control se iau n calitatea lor de grupuri natural constituite
(clasele de elevi), astfel selecionate nct s fie ct mai mai similare atunci cnd li se
administreaz pretestul. Aceasta nseamn c cele dou grupuri au medii i abateri standard
foarte asemntoare i c testul de semnificaie t nu respinge ipoteza de nul.
B. Validitate
Validitate intern
- Satisfctoare, dac cele dou grupuri au media i abaterea standard similare la faza de pretest.
- Pentru a sesiza n principal efectul tratamentului X, controlul trebuie s aib n vedere efectele
pretestrii, istoriei, al maturaiei i al instrumentrii.
- Dintre acestea, istoria i instrumentarea pot fi surse importante de distorsiune sau contaminare.
- Mortalitatea experimental este una foarte uor de dedus prin comparaia nregistrrilor din
faza pretest-posttest.
20
- n absena randomizrii, este probabil s apar posibilitatea unor diferene critice, influenate
de scorurile la pretest, cum ar fi motivaia mai mare a voluntarilor, fundalul cultural diferit etc.,
care pot afecta datele la faza de posttest.
- Regresia statistic poate fi evitat, dar numai prin control. Dac dou coli sunt fundamental
diferite dup un criteriu (s zicem dup QI-ul elevilor) i echivalente dup celelalte criterii
importante, atunci cele dou grupuri trebuie construite prin apariere (matched = potrivire), astfel
nct coala mai slab s nu fie penalizat.
Validitatea extern
Design-ul 5 are cteva nsemnate avantaje practice, n msura n care are n vedere clase intacte
i nu dezorganizeaz programul colar. Implicnd o larg varietate de clase din diverse locuri,
validitatea extern poate crete semnificativ, mai ales prin controlul interaciunii seleciei cu al
tratamentului X. n plus, este mult mai uor s conduci un experiment autorizat, fr ca subiecii
s tie crui grup aparin (experimental sau de control), prin clase intacte, natural constituite.
Design-ul 6. Design contrabalansat
Atunci cnd design-ul precedent nu poate fi aplicat din cauza numrului prea mic de subieci
dintr-o clas i atunci cnd distribuirea subiecilor nu se poate face aleator se utilizeaz design-ul
de mai jos, care nu presupune faza de pretest, ci doar pe cea de posttest, dup expunerea la
tratamentul experimental X. De remarcat faptul c X poate avea n acest caz mai multe
intensiti, notate cu indicii a, b, c i d.
Replicri
Xa
Xb
Xc
Xd
1
A
B
C
D
2
B
D
A
C
3
C
A
D
B
4
D
C
B
A
Media scoruri coloane
A. Procedur
1. Fiecare subiect din grupele A, B, C, D este expus la fiecare variaie a lui X (ca i la absena lui
X, dac se folosesc grupurile de control), n diferitele etape ale experimentului. Cnd se aplic la
4 grupe, tratamentul X este prezentat fiecrui grup n fiecare etap, astfel nct fiecare dintre
modalitile lui X este precedat i urmeaz de un numr egal de ori.
21
2. La sfritul experimentului este calculat media fiecrei coloane, care este de fapt scorul
mediu pentru toate grupele expuse la una din strile lui X. Comparaia dintre coloane ajut la
evidenierea efectului pe care aceste stri sau intensiti ale lui X le au asupra performanei
grupului.
B. Validitate
1. Design-ul 6 l compenseaz pe precedentul pe linia posibilitii ca nerandomizarea grupurilor
s le fac neechivalente din mai multe perspective, introducnd diferene care sunt tot attea
surse de distorsiune pentru X. Design-ul contrabalansat rotete aceste diferene dintre subieci,
expunnd toate grupurile la toate variaiile lui X, controlnd n acelai timp i efectul de ordine.
Dac un grup este mai inteligent, fiecare stare a lui X profit n mod egal de acest fapt.
2. Efectul de contaminare a interaciunii (selecie-maturaie de exemplu) poate s se repercuteze
asupra datelor dac o stare a lui X obosete mult grupul. Slbiciunea de baz a design-ului 6 este
aceea c dac aplicarea unei forme a lui X are efecte remanente (reziduale) - ca n cazul
medicamentelor sau al substanelor chimice de tipul cofeinei - trebuie lsat s treac destul de
mult timp pentru a administra starea urmtoare a lui X.
Design 7. Design cu grup experimental seriat n timp
Pretest Tratament Posttest
O1, O2, O3, O4 X O5, O6, O7, O8
A. Procedur
Unica diferen dintre design-ul 1 i acesta este aceea c acum sunt efectuate mai multe
msurtori, nainte i dup introducerea tratamentului X.
Validitate intern
Prelevarea mai multor msurtori procur mai mult control asupra unor surse de distorsiune a
validitii interne dect o poate face design-ul 1. Dac, de exemplu, nu exist diferene nsemnate
ntre cele 4 scoruri O iniiale, diferena dintre O5 i O6 nu va putea fi pus pe seama efectelor de
maturaie, testare sau regresie statistic. De aceea schimbrile de instrumentaie sau efectele de
selecie i de mortalitate experimental pot fi mai bine controlate. Singura surs de afectare a
validitii interne este doar istoria contemporan, ca schimbrile de mediu (vreme, cataclism,
scandal public etc.) sau variaiile ciclice (weekend-ul, examinrile sumative .a.).
22
Validitate extern
1. Generalizarea datelor acestui demers depinde de condiiile experimentale, n msura n care
pretestarea modific subiecii, astfel nct ei pot s nu mai fie reprezentativi pentru ntreaga
populaie.
2. Poate aprea interaciunea dintre selecia difereniat i X (tratament), atunci cnd aceasta nu
este evitat cu grij, ca n cazul subiecilor voluntari, care nu mai reprezint ntreaga populaie.
Design 8. Design cu grup de control seriat n timp
Pretest Tratament Posttest
Grup experimental O1, O2, O3, O4 X O5, O6, O7, O8
Grup de control O1, O2, O3, O4 O5, O6, O7, O8
Acesta este un design foarte similar cu cel precedent dar, prin introducerea grupului de control,
se poate controla i efectul istoriei contemporane: dac ambele grupuri au fcut experiena unui
eveniment particular i grupul experimental nregistreaz o cretere de la O4 la O5, pe cnd cel de
control nu, ctigul poate fi pus mai ferm pe seama procedeului experimental X aplicat i mai
puin pe eveniment. Design-ul 8 este superior i lui 5 n privina controlului efectului de selecie-
maturare: dac un grup are o rat de cretere mai mare dect a celuilalt, acest ctig accelerat va
aprea i n faza de pretest, la acelai grup.
Posttestul multiplu, utilizat n design-urile 7 i 8, relev informaii pe care cele cu un singur
posttest nu o pot face. De exemplu, dac X are o influen de scurt durat, ce tinde s dispar cu
vremea, aceste tipuri de design vor putea surprinde acest trend. Ori, variaia lui X poate fi
puternic, dar i de scurt durat, sau moderat ca intensitate, dar de lung durat. Atunci cnd
mai multe grupuri sunt pretestate simultan, dar pretestul se face la intervale difereniate de timp,
apare ca posibil design-ul de mai jos, care ncepe cu mai multe grupuri testate n acelai timp, dar
la care posttestul are loc la diferite intervale de timp (T1,T2 ...Tn).
Pretest tratament postteste
Grup A O1 X O2
Grup B O1 X O2
Grup C O1 X O2
Grup D O1 X O2
Grup D O1 X O2
T1 T2 T3 T4 T5
23
Aceast strategie este deosebit de util atunci cnd apar factori maturaionali i cnd efectul
testrii seriale n interiorul unui grup trebuie minimizat. Mai mult, prin adugarea unui grup de
control, cu acelai pattern de pretest-posttest, dar fr tratamentul X, poate fi evaluat i efectul
acestuia.
Sumarizm n tabelul de mai jos sursele de distorsiune (invaliditate) al celor opt tipuri de design
experimental prezentate anterior ca fiind definitorii pentru planurile de baz.
Surse de distorsiune
Design-uri experimentale
Control
redus
Control
riguros
Control
parial
1
2
3
4
5
6
7
8
Validitate intern
Istoria contemporan
-
+
+
+
+
+
-
+
Proces maturaional
-
+
+
+
+
+
+
+
Proceduri de pretestare
-
+
+
+
+
+
+
+
Instrumente de msur
-
+
+
+
+
+
?
+
Regresie statistic
?
+
+
+
?
+
+
+
Selecia difereniat a subiecilor
+
+
+
+
+
+
+
+
Moartea experimental
+
+
+
+
+
+
+
+
Interaciunea selecie-maturaie
-
+
+
+
-
?
+
+
Validitate extern
Interaciunea seleciei cu X
-
?
?
?
?
?
?
-
Interaciunea pretestrii cu X
-
-
+
+
-
?
-
-
Proceduri experimentale reactive
?
?
?
?
?
?
?
?
Interferenele multiple ale tratamentului
-
Figura 2.3. Factori care prejudiciaz validitatea design-urilor experimentale.17
Not: Semnul + nseamn controlul unui factor, - absena controlului, ? sugereaz c poate exista o
oarecare surs de ngrijorare iar blancul ( ) indic faptul c factorul este nerelevant.
3. Design-urile cvasi-experimentale
Designurile cvasi-experimentale sunt cele care sunt aproape experimentale, exceptnd faptul
c participanii nu sunt distribuii randomizat n grupuri. n studiile cvasi-experimentale
cercettorul studiaz efectele tratamentului pe grupuri intacte, nestnd n puterea sa distribuirea
participanilor n grupul experimental i n cel de control.
Stevens i Salvin18 au condus un studiu privind efectul nvrii prin cooperare n coli, dezvoltat
pe dou niveluri:
X = coli elementare cu nvare prin cooperare
Control = coli tradiionale elementare.
17 Prelucrare dup Van Dalen & Meyer (1996). Understanding Educational Research. New York: McGraw Hill, p.
291.
18 Apud D. Mertens, 1998, p. 77.
24
Deoarece pentru implementarea tratamentului a fost necesar cooperarea colii, cercettorul nu a
avut posibilitatea de a asigura participarea randomizat. Studiul este deci cvasi-experimental
pentru c s-a lucrat cu grupuri intacte, putndu-se determina numeroase msurtori ale
achiziiilor, atitudinilor sau relaiilor sociale.
a. Design-ul cu grup de comparaie static
Acesta presupune administrarea tratamentului la grupul experimental i compararea
performanelor sale la posttest cu grupul de control dup schema:
Grup experimental X O2
Grup de control O2
Trsturile principale ale acestui demers sunt dou:
a. selecia difereniat, deoarece grupurile trebuie s difere de la nceput printr-o caracteristic;
b. moartea experimental, atunci cnd participanii ies din studiu.
b. Design-ul cu grup de control neechivalent
Este similar cu design-ul precedent, adugndu-se n plus doar faza de pretest, schema devenind
urmtoarea:
O1 X O2
O1 O2
Utilizarea pretestului se face n scopul de a controla cumva selecia difereniat i moartea
experimental.
4. Design-uri descriptive
Cercetrile descriptive includ 4 tipuri de abordri: ancheta (studiul), abordarea
observaional, corelaional i cauzal-comparativ, asupra primelor trei existnd un mai
mare acord al cercettorilor. Design-urile descriptive implic nedistribuirea aleatorie n grupuri i
nici manipularea vreunei variabile independente. Scopul acestor cercetri este acela de a descrie
evenimentele ori caracteristicile unei populaii identificate. O anchet dintr-un design descriptiv
implic utilizarea unei forme de auto-raportare (ancheta pe baz de interviu sau pe baz de
chestionar) pentru a putea clarifica percepiile, atitudinile sau comportamentul grupului int
studiat. Scopul anchetei nu este deci acela de a msura efectele unei intervenii sau ale unui
tratament.
Cercetarea descriptiv observaional evit autoraportrile i clarific caracteristicile personale
prin observaia altora sau prin ratinguri. Singurul domeniu de interes vizeaz comportamentul
grupului int. Cercettorii care apeleaz la acest tip de metode sunt interesai
25
de identificarea sistematic a variabilelor de interes, metoda bazndu-se doar pe observaii
efectuate de observatori antrenai.
Un alt tip de design descriptiv este cel corelaional. Deoarece comportamentul uman are o mare
variabilitate situaional i contextual, se pune problema separrii variabilelor care influeneaz
la exterior percepiile, atitudinile sau comportamentele noastre. n consecin, cercettorii
utilizeaz metodele corelaionale pentru a identifica i nelege relaiile dintre o multitudine de
variabile sau modul cum covariaz ele. m acest tip de design de cercetare variabila independent
este prezent, dar nu se pune problema manipulrii sale, ci a identificrii sale dup ce faptele
deja s-au produs. Dup ce ea a fost identificat, grupurile sunt comparate ntre ele n virtutea
experienelor sau a structurii diferite pe care ele le-au avut, ceea ce ar putea conduce la inferene
valide cu privire la variabila independent. Cu alte cuvinte, design-urile corelaionale le
amorseaz i le pregtesc pe cele veritabil-experimentale, singurele care surprind relaiile de
cauzalitate.
Sumar
- Metodele de cercetare cantitative se numesc astfel pentru c ele convertesc rezultatele n uniti
de msur cuantificabile, n scopul analizei statistice.
- Adiional, cercettorul are cel mai adesea controlul asupra variabilelor de care el se intereseaz.
- n astfel de cercetri exist patru tipuri de variabile: independente, dependente, externe
(controlate i necontrolate) i interne (sau explanatorii).
- Design-urile de cercetare cele mai strns asociate cu demersurile cantitative sunt: design-urile
real-experimental, cvasi-experimentul, design-urile pre-experimental i cel descriptiv.
- Design-ul experimental real implic asigurarea distribuiei aleatoare (randomizate) a subiecilor
n grupuri i manipularea variabilei independente.
- Design-ul cvasi-experimental manipuleaz variabila independent, dar nu asigneaz
distribuirea randomizat a subiecilor n grupuri, pe care le ia deja constituite.
- Design-ul pre-experimental implic asignarea nerandomizat, cu manipulare, dar controlul
cercettorului asupra variabilelor externe este cel mai mic din toate cele patru tipuri de design.
- Design-urile descriptive includ ancheta, observaia, studiul corelaional i cel cauzal-
comparativ. Aceste demersuri nu implic nici repartizarea aleatorie i nici manipularea
26
variabilei independente. Ele constituie doar ncercri ale cercettorului de a caracteriza
evenimente ori condiii ale populaiei identificate.
Aprofundare
Trei probleme de interes n legtur cu design-ul de cercetare
a. Tipul de tratament al variabilelor: inima design-ului experimental sunt variabilele pe care cercettorul
le poate manipula, adic variabilele independente (VI), care se i afl de fapt sub controlul su. Exist
ns o multitudine de alte variabile de interes i care nu sunt manipulabile: apartenena de gen, de ras, de
condiii socio-economice, de nivel cultural etc. De aceea s-au dezvoltat unele tipuri de abordri, cum ar fi
cele comparative sau cercetrile corelaionale. Cu siguran c aceste variabile non-manipulabile
(etichet) pot fi combinate cu cele manipulabile n aa-numitele studii experimentale cu design
factorial.
b. Efectele de ordine: n asemenea studii cercettorii sunt preocupai de faptul c expunerea la un
tratament naintea altuia are anumite efecte, diferite atunci cnd tratamentul se administreaz n ordine
invers. Pentru a contrabalansa efectul de ordine se utilizeaz mprirea grupurilor n care tratamentul se
aplic ntr-o anumit ordine (AB) i - dup msurarea efectelor - se inverseaz ordinea (BA).
c. Aparierea (matching-ul): acolo unde randomizarea nu este posibil (de exemplu n cvasi-experiment),
cercettorul poate alege s potriveasc participanii dup un numr de variabile care prezint importan
(gen, vrst, nivel de inteligen sau de studii, dizabiliti etc.). Potrivindu-i n perechi (de unde i
cuvntul apariere) ntre grupul de control i cel experimental cercettorul poate controla cteva variabile
externe, dar problema care apare este chiar potrivirea n sine, care niciodat nu poate realiza o echivalen
perfect. Participanii pentru care nu s-a gsit o pereche potrivit i aproximativ echivalent vor trebui
eliminai din cercetare. Aparierea de mai mult de una-dou variabile este deja generatoare de foarte mari
probleme tehnice.
Bibliografie
1. Aniei, M. (2000). Introducere n psihologia experimental. Bucureti: Casa de
Editur i Pres Viaa Romneasc.
2. Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs for
research and teaching. Chicago: Rand McNally.
3. Chelcea, S. (1982). Experimentul n psihosociologie. Bucureti: Editura tiinific i
Enciclopedic.
4. Cook, T.D., Campbell, D.T. (1979). Quasi-experimentation. Design and analys issues for field
settings. Chicago: Rand MacNally.
5. Hohn, M., Vrg, D. (2000). Ghid practic de psihologie experimental. Timioara:
Tipografia Universitii de Vest.
6. Houser, R. (1998). Counseling and Educational Research. Evaluation and Application.
Thousand Oaks, London, New Delhi: Sage Publications.
7. Van Dalen & Meyer (1996). Understanding Educational Research. New York: McGraw Hill.
27
REZUMAT
Planuri experimentale de baz
R O1 X O2
R O1 O2
Design 1. Un singur grup cu pretest i posttest
O1 X O2
Design 2. Design cu dou grupuri - de control i experimental, ambele randomizate - cu fazele
de pretest i de posttest
Pretest Tratament Posttest
Grupul experimental R O1 X O2
Grupul de control R O1 O2
Pretest Tratament Posttest
Grupul experimental 1 R O1 X (Metoda a) O2
Grupul experimental 2 R O1 X (Metoda b) O2
Grupul de control R O1 O2
Design 3. Design-ul cu patru grupe randomizate al lui Solomon
Grup Pretest Tratament Posttest Diferen
1. Pretestat R O1 X O2 1D O1, X, M, I
2. Pretestat R O1 O2 2D O1, M, I
3. Nepretestat R X O2 3D X, M, I
4. Nepretestat R O2 4D M, I
Design 4. Design cu grup de control randomizat, doar cu faz de posttest
Pretest Tratament Posttest
Grupul experimental R X O2
Grupul de control R O2
Design-ul 5. Design cu grup de control nerandomizat, cu fazele de pretest i de posttest
Pretest Tratament Posttest
Grupul experimental O1 X O2
Grupul de control O1 O2
Design-ul 6. Design contrabalansat
Replicri
Xa
Xb
Xc
Xd
1
A
B
C
D
2
B
D
A
C
3
C
A
D
B
4
D
C
B
A
Media scoruri coloane
28
Design 7. Design cu grup experimental seriat n timp
Pretest Tratament Posttest
O1, O2, O3, O4 X O5, O6, O7, O8
Design 8. Design cu grup de control seriat n timp
Pretest Tratament Posttest
Grup experimental O1, O2, O3, O4 X O5, O6, O7, O8
Grup de control O1, O2, O3, O4 O5, O6, O7, O8
Pretest tratament postteste
Grup A O1 X O2
Grup B O1 X O2
Grup C O1 X O2
Grup D O1 X O2
Grup D O1 X O2
T1 T2 T3 T4 T5
Design-urile cvasi-experimentale
a. Design-ul cu grup de comparaie static
Grup experimental X O2
Grup de control O2
b. Design-ul cu grup de control neechivalent
O1 X O2
O1 O2
29
3. DEZVOLTAREA SCALELOR
3.1. Introducere
O bun parte din activitatea practic a psihologului se sprijin pe diagnoza unor aspecte
cantitative ale aptitudinilor i dimensiunilor definitorii pentru personalitate. n acest scop el
utilizeaz instrumente ale cror caliti psihometrice trebuie construite i evaluate n cunotin
de cauz. n plus, pentru unele dimensiuni psihologice, pedagogice sau sociologice specialistul
trebuie s dezvolte singur scale destinate msurrii constructelor respective. Mai mult, literatura
domeniului face adesea referiri la aceste caracteristici, considerndu-se implicit valabil c
psihologul este avizat n legtur cu aspectele tehnice implicate de construcia i dezvoltarea
scalelor psihodiagnostice.
Pe de alt parte, dei se recunoate tacit c statistica este printre cele mai importante instrumente
al profesiunii de psiholog, ea determin nc o reacie de rezisten, sau chiar de respingere din
partea studenilor sau a novicilor, din cauza caracterului ei abstract i formalizat, sau a evoluiei
sale foarte rapide, prin care demersul matematic devine tot mai sofisticat, parc anume rezervat
unei elite capabile s in pasul cu ceea ce s-a numit imperialismul metodologic al tiinei.
Capitolul pe care l deschidem prin aceste rnduri indic la modul clar cum o cunoatere
psihologic abstract, de tip statistico-matematic, devine extrem de util n contextul psihologic
foarte concret al construciei de scale. El este destinat a oferi reperele pe care psihologul,
pedagogul sau sociologul trebuie s le aib n dezvoltarea scalelor de msur a unor constructe
specifice domeniului de activitate propriu.
3.2. Paii de urmat n dezvoltarea scalelor
3.2.1. Pasul unu: determinm cu claritate ceea ce dorim s msurm
a. Recursul la o teorie valabil
Ne putem imagina efortul psihologului de a asambla un set semnificativ de mare de itemi
presupui a avea legtur cu constructul msurat, de a-l aplica unei populaii destul de
numeroase, de a introduce item cu item datele ntr-un program de prelucrare statistic, de a
desfura o analiz factorial exploratorie pentru a determina care itemi bat n direcia
constructului presupus a fi msurat i care n alte direcii, de a-i selecta i reuni pe cei mai
reprezentativi ntr-o scal uni- sau multidimensional, de a determina gradul de consisten
30
intern (de omogenitate) al fiecrei subscale, stabilitatea ei n timp sau legtura cu constructul
msurat prin corelare cu alte scale presupuse a msura aceeai dimensiune. Un astfel de demers
tipic pentru dezvoltarea unei scale presupune un mare consum de energie i el ar putea s nu fie
rspltit cu rezultate corespunztoare. Aceasta deoarece specialistul trebuie s aib o cunoatere
i o conceptualizare prealabil a domeniului care urmeaz s fie investigat, fie din parcurgerea
literaturii i a teoriilor n legtur cu problema/ dimensiunea respectiv, fie dintr-o experien
prealabil, fie i este cazul cel mai fericit din amndou direciile. Prin aceasta dorim s
afirmm c aspectele tehnice care vor fi invocate n paginile care urmeaz nu trebuie
supraestimate n detrimentul nelegerii naturii reale a conceptului sau faptului psihologic care
urmeaz a fi msurat.
Recursul la teoriile cele mai consistente referitoare la acest construct este fundamental pentru c
aceasta ne ajut i ne ghideaz n selectarea elementelor sale eseniale, care vor fi ulterior
transformate n itemii scalei sau ai chestionarului. Multe dintre dimensiunile i constructele care
definesc aspecte psihice, comportamentale sau sociale sunt subtile, ambigue i nu i gsesc o
expresie direct sau deplin n experiena de practician. De aceea este foarte important s ne
facem o idee ct mai clar despre ceea ce urmeaz a fi msurat. n acest sens teoria este de cel
mai mare ajutor, pentru c ea ne ajut s ne facem o idee clar asupra aspectului ce va fi abordat
psihometric. Corobornd mai multe puncte de vedere teoretice despre o problem se degaj
elementele sale eseniale, dar i neclaritile sau ambiguitile, fapt care ajut specialistul s
decid dac este necesar o nou direcie de abordare i s construiasc o prim schi a acesteia.
De exemplu, suntem preocupai de o problem practic, cum ar fi cea a tulburrilor de citit-scris,
i observm c aceast este mult mai frecvent la biei dect la fete. Am remarcat de asemenea
faptul c printre disgrafici i dislexici proporia stngacilor este de cteva ori mai mare dect n
restul populaiei, ceea ce ne ndreptete s credem c aceste tulburri sunt asociate cu probleme
de lateralizare (manual i/sau cortical) a unor funcii importante. De aceea am dori s crem un
instrument care s fie utilizat ca adjuvant n tulburrile instrumentale i care s diagnosticheze
gradul de lateralizare manual.
Literatura domeniului dominanei manuale ne atrage atenia asupra ctorva aspecte eseniale:
- stngcia poate fi ereditar sau non-ereditar, adic produs prin alte mecanisme, cum ar fi
excesul de testosteron din primele luni de sarcin, care inhib dezvoltarea emisferei stngi, cel
mai adesea dominant n populaia de baz, sau stngcia accidental, prin scoaterea din uz a
minii dominante un interval mai lung de 8 luni;
31
- mecanismul asimetriei cerebrale are o transmitere genetic, gena LRRTM1 avnd o mare
contribuie la aceasta, ea fiind ns implicat i n producerea schizofreniei;
- exist o gen (rs dup expresia lui Annett, 197219) care controleaz orientarea levogir sau
dextrogir a unei persoane;
- lateralizarea manual se asociaz strns cu lateralizarea cortical a limbajului i cu dominana
cerebral;
- lateralizarea manual este impus i de presiunile socio-culturale enorme pentru utilizarea
minii drepte, presiuni evideniabile la aproape toate popoarele, din toate timpurile, n unele
culturi ea avnd i importante conotaii religioase;
- rata stngacilor este aproximativ constant (10% din populaie) de-a lungul timpurilor, dei de-
a lungul vieii nuei singure persoane ea pare a fi ntr-o descretere accentuat spre vrstele
adulte, datorit mortalitii mai accentuate a stngacilor, de unde i sperana de via mai redus
a acestora;
- bolile autoimune, alergiile, tulburrile de somn, depresiile i tentativele de suicid, alturi de
problemele de nvat, balbism i enurezis nocturn sunt mult mai frecvente pentru stngaci;
- problema lateralizrii nu se pune doar pentru utilizarea preferenial a unei mini, ci i pentru
picior, hemicorp sau pentru organele de sim cele mai performante (ochi i urechi), putndu-se
vorbi de o lateralizare omogen sau eterogen (ncruciat);
- problemele de citit-scris-vorbit apar mai frevent la anumite categorii de stngaci (lateralizare
ncruciat, nefamilial, patologic etc.);
- s-a avansat ideea c modul de tratare cerebral a informaiei de ctre stngaci este mai curnd
integrat-holistic i nu analitic-discursiv ca la dreptaci, de unde i plusul lor de creativitate;
- stngacii se ntlnesc mult mai frecvent printre cei care urmeaz meserii vizuale, i foarte rar n
cele dependente de limb;
- msurarea gradului de lateralizare cunoate cteva metode20 de tip chestionar, dar pot fi gndite
i metode bazate pe aciune i observare (Annett, 1972);
- dincolo de stngcia tare sau dreptcia tare, exist variantele lor mai moi, o multitudine de
probleme fiind asociate mai curnd cu lipsa unei lateralizri ferme, dect cu stngcia n sine;
19 Annett, M. (1992). Spatial ability in subgroups of left- and right-handers. In British Journal of Psyuchology, 83,
pp. 493-515.
20 Oldfield, 1971: Edinburgh Handedness Questionnaire; Annett, 1970: Laterality tests and interests.
32
- stngcia pare s aib efecte dezadaptative colar mult mai mari printre elevii de gen masculin
dect printre cei de gen feminin.
Din toat aceast mas de informaii i din altele de acelai tip trebuie extras cea de interes
pentru scopurile scalei ce va fi construit i apoi conceptualizat. Operaionalizarea enormei
mase de informaii despre stngai i stngcie nseamn traducerea acesteia ntr-o form care s
poat fi msurat, n cazul nostru sub forma itemilor unui chestionar sau a unor probe practice
care vor compune itemii unui test de lateralitate. Aa cum se observ, unele dintre informaiile de
mai sus par a fi mai importante dect altele, avnd rolul de a ghida ntregul demers de construcie
a scalei. Mergnd de exemplu pe modelul genetic al lui Annett vom putea determina opt
categorii referitoare la lateralitatea manual. Dac avem n vedere problema
omogenitii/eterogenitii lateraliztii va trebui s generm i s includem n scal itemi legai
de preferina pentru membrele inferioare, pentru ochi, ureche, hemicorp. Dac lum n calcul
dimensiunea ereditar a stngciei vom avea itemi legai de frecvena acestei particulariti
printre rudele apropiate, iar dac avem n vedere dimensiunea ei evolutiv pe scala vrstelor vom
avea itemi care s disting ntre manifestrile timpurii i cele ulterioare ale stngciei.
b. Nivelul de specificitate al scalei
Din exemplul de mai sus se poate vedea c problema lateralizrii poate fi abordat ntr-un cadru
mai larg i mai general sau ntr-un cadru mai restrns i mai specific. Faptul de a fi mai global
poate fi un avantaj, dar preul pltit este o lungime mai mare a scalei i o consisten intern mai
sczut. Se tie c, cu ct nivelul de specificitate este mai ridicat, itemii se coreleaz mai strns
ntre ei i cu constructul sau variabila latent msurat. De exemplu, dac chestionarul de
lateralitate construit este unul antropologic, el va include itemi care privesc atitudinea cultural
fa de dextralitate, cum ar fi dac ai prefera s fii operat de un chirurg dreptaci sau stngaci
(Holder, 1992, Hand Preference Questionnaire21); dac scala este destinat vrstei de peste 14
ani, ea poate fi una care doar ntreab oamenii despre mna cu care scriu, deseneaz, taie, arunc,
se perie, mtur, deschid o cutie etc. (Edinburgh Handedness Inventory, EHI, Oldfield, 197122);
dac este destinat determinrii obiective a minii dominante, se vor folosi itemi acionali,
grupai ntr-o scal ca cea a lui Annett, unde se
21 Holder, M.K. (1992). Hand Preference Questionnaire: One Gets What one Asks For. M. Phil thesis, Department
of Antropology, Rutgers University, New Jersey, USA.
22 Oldfield, R.C. (1971). The assessment and analysis of hanhdedness: The Edinburgh Inventory. Neuropsychologia,
9, pp. 77-114.
33
folosesc n aciune efectiv cocoloae de hrtie, foarfece, chibrituri, periu de dini, ciocan de
jucrie etc. Copiii pot fi examinai i n clas, cerndu-li-se s se joace n perechi pentru a exersa
aciunile care vor fi observate, fapt ce va face posibil completarea grilei de observaie sau a
chestionarului acional de ctre observator.
ntr-o abordare de tip obiectiv noi23 am propus determinarea unui indice de lateralitate prin dou
probe de tip aciune, cronometrate: tapping (puncte btute rapid pe o foaie de hrtie cu creionul,
cu mna dreapt, apoi cu mna stng, cte 10 secunde pentru fiecare, singura constrngere fiind
numrul de puncte) i trasaj (linii verticale, drepte, apropiate, executate rapid, cte 6 secunde cu
mna dreapt, apoi cu cea stng, dup o execuie demonstrativ prealabil a examinatorului).
Gradele de specificitate i de obiectivitate cele mai ridicate sunt n ultimul exemplu, deoarece
probele sunt simple, clare, uor de testat, iar dispozitivul de nregistrare este unul precis. Mai
mult, se operaionalizeaz bine problema lateralizrii pentru sarcinile motrice grosiere i pentru
cele de finee, ambele fiind agregate ntr-un concludent Indice motric.
De aceast cerin a specificitii se leag i problema a ce includem n scal pentru a fi msurat.
n cazul de mai sus distincia este evident: itemii sunt de tip autoraportare (primul exemplu),
rezultai din observaie (al doilea exemplu) sau rezultai din msurarea efectiv a unor
comportamente induse (al treilea exemplu).
Dac am alctui o scal care amestec cele trei maniere de obinere a itemilor ar rezulta probabil
un instrument compozit, eterogen, mai puin maniabil. Problema se refer ns nu numai la cum
sunt produi itemii, ci i la coninutul lor. De exemplu, dac concepem anxietatea ca pe un
fenomen psihic (o team difuz, fr obiect) nu are rost s amestecm elemente somatice ntr-o
fenomenologie psiho-comportamental. Dar dac am relevat conotaiile psihosomatice ale
acesteia, putem concepe i operaionaliza anxietatea mult mai nuanat, dintr-o parte afectiv, una
cognitiv i una somatic, cum a procedat Burns n chestionarul su. Acesta i-a construit
Inventarul de anxietate astfel nct indicele global obinut s fie o expresie a sentimentelor
anxioase, a gndurilor anxioase i a simptomelor anxioase de ordin fiziologic. Aceast
perspectiv asupra anxietii este mult mai nuanat i mai util ntr-o cercetare despre stres dect
una care ar evalua doar aspectele cognitive sau afective ale acesteia.
23 Clinciu, A.I. (2003). Vizual i auditiv n structura cognitiv uman. Tez de doctorat nepublicat.
Universitatea Bucureti, Facultatea de Psihologie i tiinele Educaiei.
34
Pe de alt parte, ntr-un chestionar de scheme cognitive anxioase ar trebui respectat reeta
cognitivist de abordare, fiind eliminate referirile somatice la anxietate, n favoarea cogniiilor
patologice.
3.2.2. Pasul al doilea: generarea unui set mare de itemi
a. Lungimea i redundana setului iniial de itemi
Pasul acesta presupune crearea efectiv a unui mare numr de itemi, posibili candidai la forma
final a scalei. Acetia trebuie s fie gndii astfel nct s fie efectiv n legtur cu constructul
latent msurat, dei dovezile n acest sens vor fi culese mai trziu. Scopul de ansamblu al scalei
va fi cel care ne ghideaz n procesul de generare al itemilor, care sunt proiectai fiecare ca un
mic test separat, corelat cu variabila latent msurat. Dac fiecare item este sensibil asociat cu
aceast variabil, prin agregarea unui numr mare de itemi se sper ca scala rezultat s fie o
expresie mult mai concludent a variabilei sau a constructului respectiv. Un test/scal bun() este
aa datorit celor mai mici uniti care l compun i care sunt itemii si.
Universul itemilor care descriu un construct psihologic este foarte larg i deschis, de aceea nu se
pot stabili cu precizie graniele sale. Vom fi de acord ns c putem asambla un numr mare de
itemi, c acetia pot corela ridicat ntre ei la un nivel ridicat, scala fiind una omogen, fr ca
doar prin aceasta ea s fi prins esena constructului respectiv. Fericire, sens existenial, satisfacie
n munc, adaptare colar sau la locul de munc, complian, identitate sexual, satisfacie
marital etc. sunt concepte vagi, care au nevoie de un cadru teoretic care s le clarifice, dar i de
o bun experien pentru a genera itemii care s le surprind esena.
O problem important a acestei faze de construcie a scalei este cea a redundanei: trebuie ea
evitat, trebuie admis, i pn la ce nivel? Teoreticienii admit c, atunci cnd vrem s construim
o scal, redundana nu este deloc un lucru ru, aceasta deoarece itemii redundani sunt i
intercorelai, prezena lor ducnd la creterea consistenei interne a scalei. Singura problem este
s avem o redundan bun, folositoare, care se refer la constructul msurat, i nu la aspecte
incidentale ale itemilor, cum ar fi acelea legate de detalii minore de formulare. Cnd exprimi
aceeai idee n dou moduri distinct diferite redundana respectiv poate fi util, pentru c nu
putem ti cu suguran care dintre formulri este mai diagnostic i mai bine acceptat de
subieci. De exemplu Nu am nici un fel de jen n a aborda persoane necunoscute i mi vine
uor s intru n vorb cu persoane necunoscute sunt enunuri foarte similare, deoarece au n
vedere dimensiunea inhibiiei, definitorie pentru fobia social. Diferenele nu sunt ns pe sensul
principal al enunurilor, ci pe conotaiile rezultate din
35
modul de exprimare al ideii: n prima situaie propoziia ncepe negativ, n a doua afirmativ; n
prima cuvntul jen are i conotaii etice (fr ruine), ceea ce nu este cazul n a doua; n
prima formulare a aborda este mai pretenios dect mai familiarul a intra n vorb. Nu tim
ns care dintre cele dou formulri este cea mai bun i de aceea le putem include n forma
iniial a scalei, urmnd s amnm decizia legat de selecia celui mai bun item pn la
prelucrarea datelor rezultate din aplicarea instrumentului.
O regul spune c putem tolera o oarecare redundan i n faza final de construcie a unei scale,
dei teoretic este permis mai mult redundan n faza iniial dect n cea final, pentru a da
ocazia constructorului scalei s-i manifeste preferinele i s selecteze forma mai bun a
itemilor redundani.
Problema redundanei angajeaz direct o problem la fel de important, cea a numrului de
itemi care compun setul iniial. Noi tim c un atribut fundamental al scalei este consistena sa
intern i c aceasta este dependent de dou lucruri: de gradul de corelare al fiecrui item cu
scorul final la constructul msurat i de numrul de itemi ai scalei. De aceea putem afirma c, cu
ct un set iniial de itemi este mai larg, cu att este mai bine, deoarece avem de unde selecta.
Trebuie tiut ns foarte bine c un set de itemi prea extins, dintre care muli se repet, poate
genera consumuri de timp suplimentare, sau chiar plictiseal, putnd compromite sinceritatea i
autenticitatea rspunsurilor. De aceea cercettorul poate elimina din start itemii neclari, cu
relevan sczut sau cu prea mult similaritate, pentru a rmne n final la un set iniial
rezonabil, pe care s-l aplice ntr-o singur edin, pentru a nu avea prea mult moarte
experimental.
Dei nu exist reguli fixe, paritatea dintre lotul iniial de itemi i cel final poate fi de de 4/1 sau
3/1 (30-40 de itemi iniiali pentru o scal de 10 itemi) sau, cel mai adesea de 2/1, atunci cnd
itemii sunt construii cu grij i cu o bun cunoatere a constructului msurat. Deoarece forma
iniial depinde de cea final, ct de lung trebuie s fie o scal pentru a avea caliti
psihometrice bune? Este un rspuns dificil de furnizat, deoarece fiecare item poate fi considerat
ca o singur scal i exist chiar scale alctuite dintr-un singur item.24 n mod
24 Torque Test este o prob cu un singur item care i propune s determine simultan preferina
manual i dominana cerebral. Subiectul i scrie numele cu o mn i apoi l ncercuiete,
dup care face acelai lucru cu cealalt mn. Mna care produce cea mai frumoas scriere este
cea preferat; dac ambele cercuri sunt orientate n sensul acelor de ceasornic, dominana
cerebral este de dreapta; dac ambele cercuri sunt orientate n sensul invers acelor de ceasornic,
dominana cerebral este de stnga; dominana cerebral este mixt n situaia n care un cerc are
o orientare i cellalt orientarea invers.
Testul pare seductor prin simplitate i acuratee, dar are multe inconveniente. Asfel, mai ales n
cazul scrierii, preferina manual poate fi impus prin educaie, subiectul efectund multe alte
aciuni cu cealalt mn. La o singur aplicare poate interveni cu o oarecare probabilitate
hazardul; nu tim nimic de faptul dac preferina pentru mn se extinde i asupra piciorului etc.
(Vezi Molly Kalafut, Left-handedness. Nature or Nurture, Blessing or Course?).
36
obinuit, cu ct o scal are mai muli itemi, cu att mai mult ea poate dispune de caliti
psihometrice (fidelitate, validitate, sensibilitate) mai bune; 50-60 de itemi pentru o scal
unidimensional reprezint limita de sus, iar 10-20 de itemi limita de jos. Scalele sub 10 itemi
pot fi utile instrumente de screening, dar nu difereniaz dect grosier ntre subieci, pe cnd
scalele lungi dau diferenieri de mai mare finee.
b. Reguli de scriere a itemilor unei scale
Dei procesul cel mai delicat, mai creativ i interesant din toat ciclicitatea descris aici, scrierea
itemilor nu este strict normat, lsnd loc masiv inspiraiei, creativitii i experienei n
domeniu. Scopul acestei etape este pur i simplu acela de a identifica o multitudine de maniere n
care constructul se leag de viaa real sau de comportament. Pentru aceasta recursul la
instrumente similare, la literatura (adnotat) a problemei pot fi foarte utile (itemi de import),
dar la ce bun s ncerci s compui o scal cnd deja exist altele similare? Motivul pentru care
ncercm altceva este pentru c sperm s o facem mai bine dect alii sau pentru c mergem pe
o cale nou i nebttorit. A scrie repede, la inspiraie i relaxnd spiritul critic poate fi cel mai
recomandat, dei personal cred c aceast faz este cu att mai productiv cu ct creativitatea i
spontaneitatea ei sunt mai bine pregtite prin faza de documentare teoretic (parcurgerea
literaturii aferente pentru a ne face o idee cuprinztoare i nuanat despre constructul n cauz)
i prin faza de incubaie/gestaie, cnd lsm informaia s dospeasc i s se decanteze.
Un creator avizat tie c nainte de a se aterne pe scris itemi el trebuie s aib o reprezentarea
complex i nuanat a constructului de msurat; c a notat determinrile eseniale ale acestuia pe
o foaie de hrtie, pe care le-a studiat ncercnd s le pun mental n legtur cu tema scalei sale,
pentru a-l orienta ca un fel de ghid. De exemplu, fericirea conjugal depinde ea doar de calitatea
vieii sexuale a cuplului, sau i de implicarea soilor n responsabilitile casnice (creterea
copiilor, elaborarea bugetului i a modului de cheltuire a banilor, implicarea n curenie), de
calitatea comunicrii dintre soi, de gradul de independen reciproc acordat, de valorile
comune, de tolerana fa de profesia celuilalt, de acceptarea prietenilor partenerului, de
multitudinea de proiecte i interese comune, de jocurile comune, de aspectele hedonice i
nonhedonice ale relaiei etc.?
Dei este foarte greu de fixat reguli, dm mai jos cteva caracteristici ale itemilor buni i ri,
indicnd i cele mai frecvente erori care pot aprea n scrierea acestora.
- Dei nu este indicat s sacrificm nelesul itemilor n favoarea scurtimii lor se recomand ca
itemii s fie scuri i clari. Putem formula acelai item astfel: La o
37
petrecere rein cu uurin chipurile i numele musafirilor; mi trebuie destul de mult timp i
am adesea mari probleme n a memora de la prima tnire numele sau chipurile invitailor la o
petrecere mai mare. Al doilea enun este de evitat pentru c este lung i neclar, pentru c
introduce termenii destul de mult i mai mare care sunt vagi.
- Nivelul de dificultate al citirii la care sunt scrii itemii este de asemenea important. Iat doi
itemi din Miller Marital Locus of Control: Adesea gsesc comportamentul soului meu
nepredictibil; Cnd suntem n conflict, soul meu este acela care reconciliaz cel mai adesea
situaia. Cuvintele nepredictibil i reconciliaz in de un nivel mai ridicat de cultur, fiind
pretenioase n raport cu omul comun. Dei exist o mulime de metode de a determina vrsta
lecturii, s-a czut de acord c nivelul de lectur al omului care citete ziarul este corespunztor
clasei a asea (12 -13 ani). Multe chestionare de personalitate (MMPI, CPI) presupun o vrst a
lecturii tipic acestui nivel, fenomen de care dac nu inem seama, reducem spectrul de utilizare
al unui instrument doar la anumite categorii de persoane. O propoziie de lungime medie pentru
clasa a asea are ntre 14 - 18 cuvinte i 24 de silabe; pentru clasa a aptea ea are 18 cuvinte i 24
de silabe. Pentru majoritatea instrumentelor care aspir spre o utilizare extensiv n populaie
nivelul de lectur anticipat este ntre clasa a cincea i a asea. Dificultatea citirii i nelegerii
unui text provine nu numai din lungimea sa, ci i din caracteristicile sintactice i semantice ale
itemului.
- Cele mai frecvente erori de evitat sunt negaia, dubla negaie i enunurile dublu ncapsulate
(cu dubl determinare). De exemplu formularea Nu-mi place s nu-mi fac temele trebuie
evitat, pentru c rspunsul solicit un efort de analiz mare iar rezultatul final este nesigur. De
fapt i negaia simpl creeaz probleme de claritate: la itemul Nu-mi plac rromii rspunsul Nu
poate s semnifice simultan acordul (nu, nu-mi plac) sau dezacordul (nu sunt de acord cu
propoziia respectiv). Dubla determinare este mai greu de sesizat. M enerveaz la culme
invidia i dorina de rzbunare a oamenilor pune respondentul n dificultate atunci cnd sursa
enervrii sale este ori numai invidia, ori numai dorina de rzbunare. Scorul pozitiv la acest item
nu distinge dac prima, a doua sau ambele determinri trebuie s fie prezente pentru a rspunde
afirmativ la itemul respectiv. Alt exemplu: Sprijin drepturile rromilor pentru c discriminarea
este un pcat pedepsit de Dumnezeu. Pot s sprijin drepturile rromilor pentru c discriminarea
este mpotriva valorilor democraiei, pe care eu le apr, i nu pentru ea c este un pcat pedepsit
de instana divin.
38
- Trebuie evitate pe c se poate erorile de formulare care produc ambiguitate. Reprezentanii
notri din guvern ar trebui s susin cu mai muli bani cercetarea tiinific induce confuzie din
cauza pronumelui notri: se refer la noi ca popor, la noi ca grup de partid sau la noi, cei din
sistemul de nvmnt? Alteori confuzia pleac de la utilizarea formei adjectivale n locul
substantivului: Tratamentul diabetului trebuie s fie o prioritate a sistemului de sntate sun
mai bine i mai clar dect Tratamentul diabeticilor trebuie s fie o prioritate a sistemului de
sntate, pentru c un sistem de sntate se lupt cu boala la modul cel mai general, i abia n
secundar cu cei care i-au czut deja victim. La aceste surse de ambiguitate se mai adaug i
propoziiile cu dublu neles. Guvernul N. a dat n primire corect gestiunea rii poate produce
mult ilaritate i confuzie printre respondeni din cauza sintagmei a da n primire care n jargon
nseamn a muri.
- Propoziii cu coninut pozitiv i negativ prezente n aceeai scal constituie o
precauie necesar pentru a evita distorsionarea rspunsurilor subiectului prin nevoia de
conformism, de a fi de acord sau de a consimi. n chestionarul de Stim de sine (RSE) al lui
Rosenberg (1965) propoziia A vrea s am mai mult respect pentru mine este urmat de
Uneori m simt inutil, ambele afirmative ca form, dar una cu coninut pozitiv iar celalt
negativ. Acest lucru oblig respondentul s evalueze cu atenie fiecare item nainte de a da un
rspuns, ceea ce duce la evitarea tendinelor de contaminare pe care l-ar produce formularea
exclusiv pozitiv a itemilor. DeVellis i Callahan (1993)25 remarc faptul c aceast precauiune
de a introduce itemi cu polaritate invers, negativ, are un pre, deoarece se poate produce o
confuzie (mai ales n cazul chestionarelor lungi) ntre gradul de acord al respondentului i
coninutul itemului, fr a mai ine cont de polaritatea negativ i de exprimarea triei atributului
de msurat. Concluzia ar fi c itemii formulai n direcie opus au performane mai slabe dect
cei cu orientare direct i c dezavantajele includerii lor n scal atrn mai greu dec
presupusele beneficii. Soluia ar fi, mai ales pentru chestionarele mai lungi, ca numrul acestor
itemi s fie mai mic dect cei formulai pozitiv, dar s fie diseminai printre acetia.
25 DeVellis, R.F., Callahan, L.F. (1993). A brief measure of helplesness: The helplesness subscale
of Rheumatology Attitude Index. Journal of Rheumatology, 20, pp. 866-869.
39
3.2.3. Pasul al treilea: determinarea tipului de format al msurtorii
Aceast chestiune are n vedere mai puin itemul i mai mult formatul tipului de scal pe care
subiectul va rspunde. Dei muli autori nu fac distincia ntre o scal i un index aceasta exist i
trebuie luat n considerare. O scal difer de un index prin aceea c ntr-un index itemii nu au
nevoie s fie pui ntr-o anumit ordine, fiecare item avnd aceeai pondere i importan, ceea
ce permite nsumarea lor cu scoruri egale, rezultatul fiind chiar indexul. n sens foarte larg, o
scal este un set de numere ori de alte simboluri utilizate pentru a desemna caracteristici ale unei
variabile i care este utilizat pentru msurare. Numerele de pe un termometru sau cuvintele
mic mediu i mare de pe cutia de aer condiionat sunt scale. Vogt (1999, p. 256) distinge i
un neles mai special al cuvntului scal care este un grup de msuri relaionate cu o variabil.
Itemii dintr-o scal sunt aranjai ntr-o anumit ordine a intensitii sau a importanei lor.26
a. Scalele Likert sau de tip Likert
Sunt cele mai larg utilizate n tiinele sociale pentru determinarea atitudinilor datorit faptului c
sunt uor de construit i tind s aib o mare fidelitate, ele fiind potrivite i pentru cosntrucute
multidimensionale. Rspunsurile respondentului sunt gradate de la Puternic de acord, De acord,
Nici acord, nici dezacord, Dezacord, Dezacord puternic. Tipul de expresii verbale pentru a
msura intensitatea poate varia considerabil, subiecii putnd fi chestionai dac aprob n
totalitate, aprob parial, dezaprob uor, dezaprob n totalitate. Deoarece scalele
Likert sunt destinate opiniilor, credinelor i atitudinilor, este o problem alegerea rspunsurilor
potrivite pentru categoriile extreme, care nu trebuie s fie de genul ntotdeauna sau niciodat,
pentru c aceste situaii se ntlnesc destul de rar n viaa real. n consecin ele vor fi alese ct
mai rar, pentru a nu contribui prin aceasta la descreterea variabilitii scorurilor pentru itemul
respectiv.
De fapt, scalele Likert au o interesant caracteristic, rezultat din faptul c ele au dou
modaliti de a grada intensitatea constructului respectiv pentru populaia studiat. Una ine chiar
de modalitile de gradare a acordului/dezacordului din variantele de rspuns propuse, fapt de
care am vorbit deja.
O a doua modalitate ine de tria/slbiciunea modului cum este exprimat itemul nsui. De
exemplu, opinia despre politicienii romi post-decembriti ar putea fi exprimat la trei niveluri
de trie (duritate):
26 Vogt, W.P. (1999). Dictionary of Statistics and Methodology. A Nontechnical Guide for the
Social Sciences. Sec. edition. Thousand Oaks, London, New Delhi: Sage Publications, p. 256.
40
1. Dezastrul moral i economic din Romia post-revoluionar este integral opera politicienilor
incompeteni pe care i-am avut.
2. Deoarece nu am avut o clas politic constituit n timp, liderii politici ai Romniei post-revoluionare
au ntrziat evoluia economico-social a rii din cauza greelilor provocate de lipsa lor de experien.
3. n pofida unor greeli cauzate de lipsa de experien, politicienii romni sunt pe cale s construiasc o
democraie real n Romnia post-revoluionar.
Cum tendina obinuit a majoritii oamenilor este aceea de nu fi din bun sim prea ofensiv-
agresivi, prima afirmaie ar putea discrimina doar printre cazurile extreme, deoarece este una
foarte tare. Ultima afirmaie, care este cea mai moale i mai mpciuitorist are un caracter mai
agreabil, ar putea conveni majoritii oamenilor, dar ar putea indica mai mult lipsa opiniei, dect
prezena ei. Ori o cercetare caut mai curnd ceea ce este i se manifest (prezena), dect ceea
ce nu este (absena). Aadar este o iluzie s credem c un item poate baleia ntreg spectrul unei
opinii n uniti de lungime egal. Avem doar posibilitatea ca, din combinarea triei/slbiciunii
modului de formulare a itemilor i din tipurile de gradaii de pe scala de rspuns folosit s
centrm itemul pentru zona populaional i pe problema care ne intereseaz. Itemul trebuie s
rspund la ntrebarea: Cum sunt dispui s rspund oamenii la diferitele intensiti sau trii
ale constructului msurat prin acest item?. Iat i dou exemple de itemi construii pe scala
Likert:
Prin sistemul reformei de la Bologna, nvmntul romnesc s-a integrat bine nvmntului european.
1. Dezacord 2. Dezacord 3. Dezacord 4. Acord 5. Acord 6. Acord
puternic moderat uor uor moderat puternic
Combaterea consumului de igri este o prioritate naional de vrf.
1. Complet 2. Mai curnd 3. Aa i aa 4. Mai curnd 5. Complet
adevrat adevrat neadevrat neadevrat
b. Scalele Thurstone
Modalitate complex, rafinat i dificil de a construi itemii unei scale, iniiat de Thurstone,
acest tip de scal i-a pierdut mult din relevan n favoarea scalelor Likert. n principiu elegana
i dificultatea metodei vine din pre-calibrarea itemilor i asamblarea lor pentru a rspunde la
diferite niveluri de prezen n item a atributului sau a constructului msurat. De regul, n acest
tip de scal rspunsurile nu mai au o multitudine de nuane, deoarece gradarea intensitii este pe
vertical (mai muli itemi asamblai pe o aceeai coloan
41
n funcie de mrimea progresiv a atributului msurat), i nu pe orizontal (modaliti din ce n
ce mai accentuate ale intensitii atributului la un singur item, tipic pentru scala Likert). Astfel,
pentru aceeai idee se genereaz mai muli itemi (care au formulri diferite) care s reprezinte
intervale egale de-a lungul unui continuum vertical, ceea ce confer scalei proprieti matematice
remarcabile, pentru c se preteaz la tratamente statistice tipice scalelor de intervale. Nunaly
(1978) susine c este incomparabil mai uor s explici principul unei scale Thurstone dect s o
construieti. A gsi itemi care s rezoneze la intervale egale cu constructul msurat (ca un
diapazon acordat pe o anumit frecven) este destul de dificil. Acest deziderat exprimat de
scalele Thurstone i-a gsit totui o manier de rezolvare prin Teoria rspunsului la itemi,
unde calibrarea acestora urmrete totui un cu totul alt demers.
Prezentm mai jos dou rspunsuri tipice pentru scala Thurstone.
Exemplul 1.
Cnd un elev are dificulti de nvare, profesorii:
Adevrat
Fals
l insult
l critic sau ironizeaz
i ntrerup rspunsul
Nu au nici o reacie
i explic suplimentar
l ncurajeaz
Fac cu el pregtire dup ore
Exemplul 2.
a. Faptul de a termina cu medie mare coala i de a prinde un liceu bun este tot ce-mi doresc ca rsplat
de la copilul meu. Acord ........................ Dezacord ...................
b. Pentru mine ca printe cea mai mare rsplat din partea copilului este s fie sntos i s mearg la
coal. Acord ........................ Dezacord ....................
c. Fericirea copilului meu nu are nimic de-a face cu ceea ce el dobndete prin educaia colar sau cu
scopurile materiale. Acord ........................ Dezacord ....................
Modalitatea de gradare pe vertical i de construire a ierarhiei nu este o operaiune foarte simpl.
Metoda utilizat de Thurstone (1929) a fost cea a comparrii perechilor de rspunsuri, deoarece
ea presupune ca subiecii-observatori s judece de exemplu enunurile A, B, C luate cte dou (A
cu B, A cu C i B cu C), s evalueze din frecvena aprecierilor ordinea ierarhic a celor trei
enunuri, dup care s construiasc un indice pentru distana dintre ele, care va fi exprimat
termeni de probabilitate prin raportarea la curba lui Gauss. Scala
42
obinut n felul acesta va putea fi verificat: pornind de la valorile ei trebuie s se poat face
predicii asupra viitoarelor alegeri ale indivizilor.27
c. Scalele Guttman
Acestea sunt un tip de scal creat de Louis Guttman. Original ea a fost destinat s fie utilizat
dup ce datele au fost colectate, pentru a vedea dac ietemii dintr-un index pot fi aranjai ntr-o
scal n funcie de tria sau de puterea lor. De exemplu, ntr-o cercetare despre avorturi itemii
unui chestionar pot fi aranjai ierarhic ca intensitate astfel:
Ai fi de acord ca femeile s fac avort dac:
1. A nu face avort i-ar periclita viaa proprie?
2. Ftul este malformat?
3. Este prea srac pentru a se putea ocupa n mod adecvat de copil?
4. Ea nu mai dorete s aib copii?
Cine ar rspunde la aceast ntrebare ar face-o tr-o manier scalar: persoanele care au rspuns
afirmativ la ntrebarea 4 ar fi rspuns afirmativ i la ntrebrile 1, 2, 3; cele care au rspuns la
ntrebarea 3 ar fi rspuns i la ntrebrile 1 i 2, dar nu obligatoriu i la 4, i aa mai departe.
Dac scala nu ar fi de tip Guttman, nu ar exista un astfel de pattern i rspunsul afirmativ la
numrul 4 nu ar implica rspunsurile afirmative i la celelalte 3 ntrebri.
Scalele Guttman sunt foarte utile i indicate pentru informaiile obiective sau n situaiile n care
este logic necesar ca, dac ai rspuns afirmativ la un anumit nivel dintr-o ierahie, aceasta
nseamn s faci acelai lucru i pentru nivelurile inferioare ale ierarhiei. De exemplu, la
ntrebarea dac fumai, variantele de rspuns pot fi organizate ierarhic astfel: nu fumez deloc;
fumez sub 10 igri pe zi; fumez sub 20 de igri pe zi; fumez sub 30 de igri pe zi; fumez mai
mult de 30 de igri pe zi. Variantele de rspuns sunt aranjate astfel c nivelul la care este prezent
atributul este indicat de cel mai de sus item la care subiectul a dat un rspuns afirmativ, cei de
sub el fiind i ei implicit afirmativi (deoarece reprezint niveluri mai sczute ale atributului).
Deci aceast scal presupune o gradaie i decelarea punctului critic n care rspunsul afirmativ
devine negativ.
Dac pentru informaiile obiective scala Guttman este foarte indicat, pentru alte categorii de
fenomene este dificil de ordonat rspunsurile ntr-o manier uniform pentru toi indivizii, fapt
care limiteaz utilizarea acestui tip de scal. Pentru situaiile n care ordonarea itemilor este
important, modelele bazate pe teoria rspunsului la itemi par a oferi soluii mai
27 Vezi Laurens, S., Moscovici, S. (2007). Construirea scalelor. In S. Moscovici, F. Bruschini
(coord.), Metodologia tiinelor socioumane. Iai: Polirom, pp. 482-414.
43
adecvate. Prezent mai jos doi dintre itemii scalei de depresie Beck, asamblai pe o scal
Guttman:
A. TRISTEE
1. Nu m simt trist.
2. M simt trist.
3. Sunt trist tot timpul i nu pot scpa de tristee.
4. Sunt att de trist i de nefericit nct nu mai pot suporta.
B. PESIMISM
1. Viitorul nu m descurajeaz.
2. M simt descurajat cnd m gndesc la viitor.
3. Simt c nu am ce atepta de la viitor.
4. Simt c viitorul este fr speran i nimic nu se mai poate drepta.
d. Scala de distan social Bogardus
Acest tip de scal a aprut n 1923, fiind destinat s msoare distana social, adic distana care
separ un grup de altul. De aici rezult posibilitatea de a da o expresie msurabil raporturilor de
discriminare social dintre grupurile etnice, naionale sau religioase. Scala Bogardus poate fi
considerat n acelai timp i o scal de proximitate deoarece indic cea mai mic proximitate
acceptabil pentru un individ fa de grupul luat considerare. Individul este chestionat dac ar
fi dispus, de exemplu, s triasc n aceeai ar cu rromi; s triasc n aceeai localitate cu
acetia; s aib vecini rromi; s locuiasc n aceeai cas cu rromi; s aib prieteni de etnie
rrom; s aib rude rromi; s aib un copil care se cstorete cu o persoan de etnie rrom.
Populaiile pot fi comparate simultan trecnd pe vertical categoriile de proximitate iar pe
orizontal populaiile ce vor fi comparate: negri, latino, europeni, asiatici, sau turci, evrei,
polonezi, spanioli etc., pentru America. Sau romni, maghiari, sai, igani, ruteni etc. perntru
Romnia. Evident, distanele studiate sunt unele sociale i nu fizice, dar exprimarea n termeni
fizici a acestora este judicioas. Acest tip de scal permite compararea atitudinilor grupurilor fa
de alte grupuri deoarece enunurile despre obiectul social studiat pot s fie astfel clasate pentru a
indica fie proximitatea, fie distana. Scalele construite n acest fel dau rezultate n acelai timp
interesante i valide apreciaz Laurens i Moscovici (op. cit., p. 391).
e. Numrul optim al categoriilor de rspuns
Cei mai muli dintre itemii scalelor se prezint sub forma unui trunchi comun care este enunul
de baz al itemului, i o categorie de descriptori care s indice gradul de
44
acord/dezacord al respondentului cu enunul respectiv. Atenia noastr ce centreaz acum pe
aceast a doua categorie. Statistica ne nva c o caracteristic important a unui item sau set de
itemi este variabilitatea/variana. Teoria rspunsului la itemi determin tocmai relaia existent
ntre variabilitatea itemului i a scalei ca ntreg. Cu ct este mai mare aceast variabilitate cu att
este mai bine, deoarece variabilitatea itemilor contribuie la creterea variabilitii de ansamblu a
ntregii scale. Cu ct ea este mai mare, cu att se pot determina mai multe categorii de scor i
deci scala este mai discriminativ.
Variabilitatea unei scale depinde de doi factori: de numrul itemilor (cu ct mai muli itemi, cu
att mai mult variabilitate) i de numrul variantelor de rspuns pe care acetia le prezint (cu
ct mai multe, cu att mai mare este i variabilitatea itemului). De aici i interesul pentru
problema abordat n acest paragraf. Vom distinge deci existena unor itemi cu o manier de
scorare srac. Deoarece sunt necesare cel puin dou posibiliti de rspuns, acest mod de
operare poart numele de scorare binar. n msura n care exist posibilitatea de a avea o
multitudine de clase de scor, s zicem 100, cum se poate distinge fr fals precizie ntre
nivelurile 66 i 67 de anxietate, de exemplu? Cu ct mai multe clasele de rspuns, cu att
posibilitatea de a diferenia realmente ntre valorile de scor apropiate descrete. n practic
rareori se folosesc mai mult de 7-11 clase de scor i foarte frecvent ntre 3 i 7.
Opiunea binar de scorare este frecvent utilizat, cci, dei au cea mai mic variabilitate a
scorurilor per item, scalele de acest tip se completeaz extrem de facil i rapid, lsnd deschis
posibilitatea de a introduce un numr mai mare de itemi pentru a crete variabilitatea de
ansamblu a scalei sau pentru a vedea cum noi categorii de fapte coroboreaz cu constructul
msurat. Aceast manier de scorare este tipic dar nu exclusiv! scalelor Thurstone i
Guttman datorit complexitii de construcie a itemului, care agreg pe vertical mai multe
enunuri gradate ierarhic. De asemenea, acest tip de itemi este numit i cu alegere forat28.
Datorita uurinei cu care se lucreaz, opiunea binar este extrem de util n completarea listelor
de adjective prin care se investigheaz trsturile de personalitate (modelele Big Five).
Dac la un pol sunt opiunile binare, la celallalt pol este numrul mare sau foarte mare de clase
de scor care pot aduce, cum am artat anterior, o fals precizie, adic o fals variabilitate. Din
statistic tim c variabilitatea poate fi descompus ntr-o parte bun, numit i sistematic,
deoarece este strns legat de oscilaiile reale ale prezenei constructului
28 Atenie, itemii cu alegere forat nu sunt numai cei binari, de tipul Adevrat/Fals sau Da/Nu, ci
i unii itemi pari pentru care, neexistnd varianta ehivoc din mijloc (aa i aa), subiectul
trebuie s opteze clar ntr-o direcie sau n alta.
45
msurat n item, i dintr-o parte rea, de eroare. Deoarece cretarea variabilitii pe scalele cu
numr mare de variante de rspuns se face n contul erorii, i nu al variabilitii sistematice, nu
este indicat s avem prea multe valori de scor. Numrul acestora este impus finalmente de
abilitatea respondenilor de a discrimina semnificativ ntre variantele de scor propuse pentru
fiecare item. Aceast capacitate depinde i de aranjarea n pagin a variantelor de rspuns asfel
nct acestea s sugereze un continuum. Astfel secvena:
Aproape niciodat Rareori Din cnd n cnd Deseori Aproape mereu
sugereaz bine un continuu temporal, divizat n uniti discrete de tipul frecvenei de apariie.
O problem important este dac optm pentru un numr impar de categorii de rspuns, ceea ce
n principiu este bine, pentru c se creeaz o anumit simetrie n jurul unui punct zero natural.
Acest fapt ofer ns de multe ori indeciilor posibilitatea refugierii n rspunsul evaziv din
mijloc. Numrul par sau impar de opiuni este mai puin important dect modul cum sunt
aranjate variantele de rspuns astfel ca distanele dintre ele s fie aproximativ egale pentru a
exprima gradul de acord sau de dezacord. Aceasta pentru c datele vor fi codificate numeric prin
cifre (1, 2, 3, 4, 5 pentru cinci variante de rspuns, de la foarte puin sau deloc, la foarte mult
sau n ntregime, ori invers 7, 6, 5, 4, 3, 2, 1 pentru o scal care cepe de exemplu cu totdeauna
i se termin cu niciodat). Se poate construi astfel un continuum divizat tr-un numr de
trepte (3-7 trepte), de la dezacordul total, la acordul deplin sau invers.
n legtur cu punctul de simetrie din mijloc, el poate avea semnificaii diferite. Astfel nici
acord, nici dezacord indic mai curnd o atitudine apatic, pe cnd la fel de mult acord i
dezacord sugereaz o atracie egal fa de ambele variante de rspuns. Deci n cazul numrului
impar de variante de rspuns trebuie s controlm ca subiectul s nu selecteze varianta neutr
doar pentru a evita o alegere, oferind astfel un rspuns echivoc, cu o valoare discutabil. n
majoritatea situaiilor cercettorul ncearc s evite echivocul punctului central i s foreze o
alegere clar, dar trebuie spus c opiunea pentru variante pare/impare de rspuns este funcie de
ntrebare, de rspus i de scopul investigaiei. ntr-o cercetare cu dou variante extreme de
rspuns (ce situaii preferi: pe cele plicticoase?; pe cele primejdioase?) introducerea variantei de
rspuns ntre cele dou poate fi pe deplin justificat, subiecii neputnd alege ntotdeauna ntre
situaii att de tranant delimitate.
Ca tip de format al rspunsurilor amintim i diferenialul semantic al lui Osgood i
Tannenbaum (1955). Utilizat studierea atitudinilor de grup, acest mod de scalare presupune
identificarea unui grup ce este studiat (s zicem avocai) i a unei liste de perechi de adjective.
46
Onest __ __ __ __ __ __ __ __ __ Neonest
Competent __ __ __ __ __ __ __ __ __ Incompetent
Vorbre __ __ __ __ __ __ __ __ __ Taciturn
Liniuele (de regul 7 sau 9) reconstituie un continuu ntre polii definii de cele dou adjective,
subiectul marcnd cu un X punctul de pe acest continuu pe care el crede c se afl membrii
categoriei respective, dup care trece la ratingul urmtoarei perechi de adjective, pn la
epuizarea ntregii liste. Prin prelucrarea separat pe fiecare pereche de adjective se poate obine
un portret robot al grupului respectiv. Deoarece acest tip de scal are foarte multe din
caracteristicile necesare unor prelucrri matematice riguroase, finalmente itemii valoroi care au
fost selectai pot fi asamblai ntr-o scal omogen (de onestitate, de competen, de moralitate
etc.).
Analogul vizual reprezint un format foarte similar cu cel precedent, cu o singur diferen
major: continuumul nu mai este segregat ntr-un numr discret de categorii de rspuns, ci
subiectul marcheaz efectiv un semn pe linia continu dintre cele dou adjective, exact n locul
unde crede c s-ar plasa opinia, credina sau experiena sa. Ceea ce se nregistreaz i se
prelucreaz este distana msurat fa de unul dintre poli (se pornete de regul de la cel care
nseamn absena).
Nici urm de fric _____________________________x_____________ Fric paralizant
Dei pare seductor, acest tip de scal are destul de multe dezavantaje. De multe ori precizia sa
este o fals precizie, marcarea punctului pe linie implicnd i o doz de hazard sau de
circumstanialitate. Un subiect va distinge cu greu ntre o fric de 6,7 cm de una de 6,5 cm. Mai
mult, asignarea valorilor scalei poate fi una idiosincratic, adic distanele marcate s aib
semnificaii diferite de la un subiect la altul sau la acelai subiect la perioade de timp diferite.
i totui, aceasta poate fi un tip de msurtoare foarte util atunci cnd cercetrile se fac pe
acelai subiect pentru a msura diferenele pe care tratamentul experimental le poate aduce n
tratarea fobiilor, n creterea nivelului de motivaie sau n alte direcii. Astfel, dac scala Likert
parte un continuu tr-un numr finit i mic de categorii, fiind foarte maniabil, dar mai puin
sensibil, scala analogului vizual poate fi sensibil la diferene mici: dac rspunsurile la post-
manipulare se deprteaz semnificativ i n aceeai direcie n raport cu faza de pre-manipulare,
se pot detecta diferenele mici pe care le-a adus tratamentul
47
experimental. Scala poate fi folosit i ca una alctuit dintr-un singur item, caz care nu se
mai poate distinge cu claritate tre instabilitatea msurtorii i instabilitatea fenomenului
msurat. Prin urmare, cea mai bun strategie ar fi aceea de a dezvolta mai multe msurtorii de
tipul analogului vizual pentru acelai fenomen, de a le asambla ntr-o scal i de a-i determina
consistena intern (stabilitatea).
O ultim problem este cea legat de cadrul temporal la care pot face sau nu referire itemii unei
scale. Prelund distincia pe care a fcut-o Cattell n legtur cu unele dispoziii de personalitate
care au un caracter situaional, n timp ce altele reprezint structuri stabile de personalitate
numite trsturi, Spielberger a dezvoltat scala STAI, n fapt o msur a anxietii ca stare
(conjunctural) i ca trstur de personalitate (stabil). Se tie de asemenea c multe
componente ale personalitii au mai mult sau mai puin stabilitate pe axa timpului:
fenomenologia afectiv de exemplu (emoie, anxietate, depresie) este mai fluctuant dect cea
cognitiv (inteligen, memorie).
O scal trebuie s fac referine i la dimensiunea temporal? Rspunsul este nuanat: dac
constructul msurat are o variabilitate temporal mare rspunsul este Da, dac el este stabil n
timp (cazul trsturilor de personalitate) rspunsul este Nu. Astfel, chestionarul de depresie
Burns se aplic periodic pacienilor depresivi pentru a monitoriza evoluia depresiei lor n timp.
Multe chestionare care urmresc aspecte fluctuante menioneaz n instructaj formule de tipul n
ultima lun, n ultima sptmn, n ultimele zile, n ultimul timp etc. Unele chestionare
includ itemi destinai detectrii modificrilor de dispoziie aprute recent (un eveniment stresant)
sau pe perioade mai lungi de timp (reforma post-revoluie, intrarea rii n NATO etc.). Chiar
formatul de rspuns al itemilor poate avea n vedere decuparea continuumului temporal n uniti
mai mici (uneori, din cnd n cnd, des, n ultimul timp etc.).
nainte de a supune judecii experilor forma preliminar a unei scale, constructorul trebuie s
aib n vedere dac include sau nu i scale de validare, care s diminueze sau s controleze
tendina respondenilor la dezirabilitate social sau la fraud. De exemplu Sandra Bem (BSRI,
1976), a inclus o scal de dezirabilitate social ca tampon tre itemii care msoar
masculinitatea i cei care msoar feminitatea. Eysenck a inclus EPI (Eysenck Personality
Inventory) o scal de minciun, devenit ulterior o scal de dezirabilitate social EPQ
(Eysenck Personality Questionnaire).
48
n forma veche, dar i n cea revizuit a MMPI (Minnesota Multiphasic Personality Inventory)
Hathaway i McKinley au propus mai multe scale de validare, care sunt primele ce vor fi
evaluate de psiholog pentru a determina de c credit se poate bucura profilul unui respondent.
Problema validrii se poate rezolva fie construind scale anume destinate acestui scop, fie
prelund unele deja existente pentru a le insera n chestionar pe post de distractor i de mijloc de
control.
3.2.4. Pasul al patrulea: revizia setului iniial de itemi de ctre experi
Avizul experilor este foarte necesar n legtur cu cteva probleme, sfatul lor scutindu-ne de
cheltuieli mari de resurse pentru obinerea de rezultate discutabile ca valoare. Expertiza acestora
este necesar pentru a determina:
- faptul dac definiia i operaionalizarea fenomenului sau a constructului ce va fi msurat sunt
bune sau n acord cu ceea ce i ei tiu despre acestea;
- ct de relevani sunt itemii selecionai pentru a fi inclui n formatul iniial al scalei, n raport
cu constructul msurat;
- claritatea, conciziunea i alte elemente legate de modul de formulare al itemilor;
- evidenierea fenomenelor sau a caracteristicilor importante asociate cu constructul ce va fi
msurat care nu s-au materializat n itemi corespunztori, setul iniial trebuind deci augmentat cu
noi itemi.
Prin revizuirea multitudinii de demersuri prin care vrem s surprindem constructul ce ne
intereseaz i prin examenul critic al itemilor destinai acestui scop experii ne pot ajuta la
maximizarea validitii de construct i de coninut a scalei. Trebuie ns precizat c cel care ia
deciziile finale este cel care construiete efectiv scala, i nu experii. Este posibil ca faza
pregtitoare pe care constructorul de scal a parcurs-o s-i fi dat un grad de cuprindere i de
nelegere a problemei mai bun dect al fiecrui expert n parte, aadar solicitarea lor de a fi
eliminai anumii itemi trebuie examinat cu atenie pentru a vedea dac ea are sau nu temei. n
al doilea rnd, cel mai adesea experii vor tinde s elimine itemii redundani, eliminnd astfel
posibilitatea constructorului de scal de a alege i de a pstra dintre cele dou formulri aparent
echivalente ale unor itemi, pe cea care se impune din analiza datelor rezultate din aplicarea
instrumentului.
3.2.5. Pasul al cincilea: administrarea setului iniial de itemi
49
Prima aplicare a unui instrument nou creat se face pe un lot suficient de larg pentru a da rezultate
stabile referitoare la universul itemilor. Ct de mare i de reprezentativ trebuie s fie aceste
eantion este n continuare obiect de dezbatere printre specialiti. Pentru o scal unidimensional,
250-300 de subieci sunt suficieni pentru a desfura o analiz factorial, urmat de o analiz de
itemi i de scal, tehnici care vor ghida procesul de selecie a itemilor ce evideniaz cel mai bine
constructul msurat. Eantionul iniial se va mri n funcie i de numrul de subscale care vor fi
extrase.
Dac eantionul este mic din punct de vedere numeric pot aprea erori prin ans sau hazard,
erori ce se vor repercuta asupra corelaiilor dintre itemi i scal, astfel c unii itemi, iniial
promitori, s fie descoperii la retestare a fi de fapt unii slabi. Mai mult, loturile mici au o
probabilitate mai mare de a elimina anumite categorii de indivizi crora li se adreseaz scala
respectiv. Pe de alt parte, dac n eantionul extras caracteristica msurat este slab distribuit,
valorile parametrilor obinui (media i abaterea standard n principal) sunt mai greu de
extrapolat la populaia general. Gradul de generalizabilitate al acestora este cazul de fa
unul redus.
De multe ori populaiile la care avem acces (elevi de liceu, studeni din campusuri etc.) sunt
destul de diferite n privina caracteristicii msurate fa de populaia int a scalei. Unele
diferene majore pot aprea din cauza conotaiilor particulare pe care anumite cuvinte sau
expresii le au tr-o anumit categorie populaional, genernd sensuri care nu au fost avute n
vedere intenionat de ctre constructorul scalei sau care nu se regsesc ca atare i n populaia
int mai larg.
3.2.6. Pasul al aselea: evaluarea itemilor din setul iniial
Operaiunile descrise la acest nivel sunt cele mai tehnice i constituie inima ntregului proces de
construcie al scalelor.
a. Examinarea iniial a performanei itemilor
Cea mai important calitate pe care o cutm n aceast faz la un item este corelaia sa ridicat
cu variabila latent pe care dorim s o evideniem prin constructul msurat. Dar, cum aceast
corelaie nu poate fi determinat (dac am ti valoarea ei nu ar mai avea rost s dezvoltm o
scal), noi putem face inferene n legtur cu aceasta plecnd de la corelaia dintre itemi i de la
corelaia acestora cu scorul final la scal. Ca principiu, cu ct corelaia dintre itemi este mai
mare, cu at mai mare este i fidelitatea itemilor; cu ct itemii sunt mai fideli, cu at mai mare
este fidelitatea tregii scale.
50
Deci, prima calitate a unei scale este aceea de a fi una nalt intercorelat, lucru care se poate pune
n eviden prin matricea de intercorelaii. Un examen atent al acesteia relev existena
unor itemi care au corelaii negative cu majoritatea celorlali itemi. Aceasta se poate ntmpla din
mai multe cauze. De exemplu, itemii cu coninut negativ care au fost scorai invers; itemii care,
dei scorai n acelai mod, msoar constructe diferite (dominan vs. supunere, stabilitate
emoional vs. emotivitate). n principiu, acetia ar putea fi reunii ntr-o scal supraordonat
unidimensional, dar cu doi poli (bipolar). Pentru aceast categorie exist mai multe soluii.
Prima ar fi aranjarea i numerotarea descriptorilor invers n text, n funcie de coninutul itemilor,
soluie care nu este recomandabil, pentru c nu este comod pentru subiect. n timpul
completrii, regularitatea dispunerii itemilor n scal creeaz respondentului o anumit rutin
prin care administrarea acesteia devine mai facil. Inversarea distruge aceast regularitate,
oblignd respondentul la mai mult efort. A doua i cea mai practic soluie este aceea de a
construi separat grile de corecie pentru fiecare dintre dimensiunile msurate de scal, prin care
anumii itemi vor fi scorai direct iar alii invers.
Pentru datele introduse n calculator n format de scal Likert, cea mai convenabil soluie este
scorarea invers a itemilor care ne intereseaz dup formula: Nou = (x+1) - vechi. De exemplu,
aplicnd formula de mai sus pentru o scal cu 7 trepte, 7 devine 1, 6 devine 2 etc., iar 1 devine 7.
n SPSS exist i opiunea Recode into the same variable, prin care vechea variabil este
nlocuit cu cea rezultat dup scorarea invers. Avantajul este acela c se poate face
transformarea simultan, n bloc, a tuturor variabilelor de acelai format (cu acelai numr de
categorii de rspuns, definite n acelai fel).
Pentru c nu suntem ntotdeauna siguri dac rezultatul obinut prin scorare invers este mai bun
dect cel precedent, este bine s lucrm pe o copie a fiierului surs, copie numit de exemplu
Itemi inversai. Nu ntotdeauna inversarea scorrii, urmat de refacerea matricii de
intercorelaii, rezolv problema unui item. Este posibil ca el s fie corelat pozitiv cu unii dintre
itemi i negativ cu alii, deoarece el poate fi expresie a unui alt construct. n acest caz soluia
potrivit este eliminarea itemului respectiv, pentru a nu periclita omogenitatea de ansamblu a
scalei.
b. Corelaia item-scal
n SPSS procedeul de lucru pentru acest tip de analiz este relativ simplu, deoarece se urmeaz
urmtoarea secven: AnalyseScaleReliabilityAlphaStatistics, de unde se
activeaz Item, Scale; Scale if item deleted (scala, dac itemul ar fi nlturat). Dac dorim s
obinem i o matrice de intercorelaii sau o matrice de covariane, n dreapta-sus avem panoul
51
Inter-Item, de unde selectm Correlations sau Covariances (vezi imaginea de mai jos).
Finalmente dm Continue pentru fereastra Reliability Analysis: Statistics i apoi OK din
fereastra Reliability Analysis, dup ce vom fi introdus n panoul de lucru din dreapta-sus
(Items:) toi itemii care vor fi supui analizei.
Figura 3.1. Ferestrele de dialog pentru Relyability Analysis i Statstics.
Rezultatele arat n felul ca fragmetele de output prezentate mai jos.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean Std Dev Cases
1. CEDA001 .1500 .3601 60.0
2. CEDA002 .1833 .3902 60.0
3. CEDA003 .1167 .3237 60.0
4. CEDA004 .3833 .4903 60.0
5. CEDA005 .1667 .3758 60.0
6. CEDA006 .5333 .5031 60.0
7. CEDA007 .3500 .4810 60.0
8. CEDA008 .3167 .4691 60.0
9. CEDA009 .4667 .5031 60.0
10. CEDA010 .1500 .3601 60.0

Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted
CEDA001 28.7500 133.4788 .2944 .8785
CEDA002 28.7167 133.4607 .2712 .8787
CEDA003 28.7833 135.0879 .1149 .8799
CEDA004 28.5167 133.4065 .2128 .8793
CEDA005 28.7333 133.1141 .3231 .8782
CEDA006 28.3667 136.6429 -.0713 .8825
CEDA007 28.5500 132.9975 .2550 .8788
CEDA008 28.5833 132.4845 .3105 .8782
CEDA009 28.4333 132.6226 .2746 .8786
52
CEDA010 28.7500 131.9534 .4804 .8770
................................................
Reliability Coefficients
N of Cases = 165 N of Items = 112
Alpha = .8800

Figura 3.2. Outputurile rezultate din comenzile prezentate mai sus.
Fiecare dintre fragmentele de output de mai sus trebuie examinate cu mare atenie. Primul
element investigat este variana itemilor, pentru c de aceasta depinde finalmente variabilitatea
ntregii scale. Dac toi indivizii investigai ar rspunde doar ntr-un singur fel la un item,
variana (variabilitatea) sa ar fi zero, el nefiind de nici un folos n surprinderea constructului de
msurat. Cum unii subieci rspund ntr-un fel, iar alii n altul, fiecare item are variabiliti mai
mari sau mai mici: cei mai dezirabili sunt cei cu variabilitate mare. n cazul de mai sus, itemii cu
cea mai mare variabilitate sunt ordine 6, 9, 4, 7 i 8, care au o abatere standard jur de 0,50.
Experiena statistic ne arat c este mai bine s nu examinm abaterea standard separat, fcnd
abstracie de medie. n principiu, cu ct aceasta este mai apropiat de centrul intervalului de
rspuns, cu att este mai bine, pentru c ea va face posibil mai mult variabilitate a itemului. n
condiiile n care la stnga au fost plasai descriptorii pentru dezacord i la dreapta pentru acord,
dac media este asimetric spre dreapta (negativ) seamn c majoritatea respondenilor au
inut s fie de acord cu coninutul itemului respectiv, deci el a fost formulat moale; dac
asimetria este spre stnga (pozitiv) nseamn c majoritatea i-a exprimat dezacordul cu
coninutul itemului (formulare sa a fost cam tare).
n cazurile de asimetrie se tie de asemenea faptul c puterea discriminativ a itemului este mai
mare pe coada (creoda) curbei gaussiene i mai mic pe ramura sa mai scurt. Cum o
distribuie simetric (cu media pe centrul seriei de variaie) are dou cozi lungi, nseamn c
puterea discriminativ a unui item de acest fel este maxim, el putnd distinge la fel de bine n
ambele direcii.
n cazul nostru, deoarece numrul itemilor destinai depistrii dezordinilor alimentare a fost
foarte mare 112 am folosit scorarea dihotomic, deci valoarea medie optim ar trebui s cad
la jumtatea intervalului 0 1, adic n jurul lui 0,50, ceea ce se ntmpl doar pentru itemii 6 i
9.29 Verificarea simultan a mediei i abaterii standard este o condiie
29 Trebuie menionat c ipoteza rspndirii gaussiene a simptomelor tulburrilor alimentare n
populaia de baz este una care nu poate fi susinut, deoarece o mulime de itemi care determin
anorexia i bulimia sunt relativ rar ntlnii la persoanele obinuite. Acetia itemi vor avea
probabil o alt distribuie pentru populaiile speciale pe care scala va fi validat.
53
prealabil obligatorie pentru o tentativ de selecie a itemilor care se bazeaz n principal pe
corelaie. Din aceast analiz reiese c, la prima vedere, itemii 7 i 9 au simultan cele mai bune
variane i valori medii.
Decizia final se ia ns dup ce se analizeaz atent datele din panoul Item-total Statistics care
are urmtoarea structur: primele dou coloane dau valorile medii i abaterile standard pentru
valorile totale ale scalei, n situaia n care itemul nu particip la scorul total. Pentru scalele cu
numr mare de itemi corecia adus la parametrii scalei prin absena unei singure valori de scor
este neglijabil, dar ea devine cu att mai important cu ct numrul itemilor scalei este mai mic,
fiind important de exemplu pentru scala de 10 itemi. Coloana Corrected Item-Total
Correlation este de maxim importan n luarea deciziei de selecie deoarece ea indic gradul
de asociere a fiecrui item cu scorul total, adic saturaia sa n variabila latent msurat. n cazul
nostru itemul 10 are o corelaie excelent cu scala (.48), n timp ce itemii 3, 4 i mai ales 6 au
corelaii slabe (itemul 6 chiar negativ) cu scorul total.
Dac scala noastr ar fi unidimensional (adic ar msura doar un singur construct i nu mai
multe) o valoare a corelaiei item-scal n jur de .30 ar fi suficient pentru includerea itemului n
scal, iar una de .40 aproape c ne foreaz s facem acest lucru. Aici este cazul s spunem c nu
ne vom concentra atenia doar pe numerele de cod ale itemilor, fapt care ne mpiedic s tim
care este coninutul lor. Cu foaia de test n mn, dup ce am identificat itemii cu formulri
foarte asemntoare (redundani), lum n cunotin de cauz decizia de a-i pstra pe cei cu
calitile psihometrice cele mai bune i de a-i elimina pe cei mai slabi.
Ultima coloan are de asemenea un rol important n luarea deciziei relative la selecia itemilor
deoarece ne indic ct ar fi fost coeficientul de consisten intern alpha dac itemul analizat ar fi
fost eliminat. Prin compararea cu scorul de referin al acestui coeficient (.88 pentru toat scala
iniial, adic foarte mare) putem vedea dac absena itemului amelioreaz valoarea lui alpha
(caz n care el trebuie eliminat) sau dimpotriv, o scade (semn c este unul util). n cazul nostru
itemul 6 este sigur unul condamnat, deoarece el d o corelaie uor negativ cu scala i nu este
consistent cu aceasta (absena lui din scal l mrete pe alpha).
i totui nu suntem nc n msur s lum decizia final pentru c nu am rspuns clar la
ntrebarea fundamental dac itemii testului msoar sau bat n direcia unei singure variabile
(scal unidimensional) sau a mai multora (scal multidimensional, neomogen). Supoziia
implicit pentru indicele de consisten intern alpha al lui Cronbach este aceea c toi itemii
msoar o singur variabil latent, fapt ce nu este dat prin definiie, ci trebuie atent verificat.
54
c. Analiza factorial exploratorie
n aceast faz a procesului de construcie analiza factorial exploratorie devine
obligatorie. Aa cum se va observa cnd se parcurge pn la capt cursul de Statistic avansat, o
analiz factorial este o tehnic pretenioas, pentru c are nevoie de un numr mare de subieci,
de ordinul sutelor, pentru a furniza o soluie stabil i bine adecvat datelor. Am solicitat din start
un numr cel puin mediu de subieci (250-300) pentru a efectua o analiz factorial corect
deoarece cnd este desfurat pe prea puine cazuri, ea poate s dea valori instabile, ce
compromit uneori iremediabil ntregul proces de construcie a scalei. S reinem deci c, n
aceast faz de construcie a scalei, determinarea prin analiz factorial a variabilei latente care
st n spatele unui set de itemi este un fapt crucial.
Mergnd mai departe cu exerciiul nostru prezentm secvena de lucru pentru a efectua analiza
factorial exploratorie: AnalyseDataReductionFactor, care produce deschiderea
urmtoarei fereastre de lucru, n care vom introduce (prima fereastr, panoul din dreapta-sus)
toate datele de analizat, adic toi itemii chestionarului nostru.
Figura 3.3. Ferestrele de dialog pentru lansarea analizei factoriale exploratorii.
Pentru un numr aa de mare de itemi nu vom efectua nici o rotaie (butonul din mijloc de la
figura din stga de mai sus), dar de la Options putem s selectm Supress absolute values less
than: (suprimarea valorilor mai mici dec:) pentru a pune valoarea de .30 n ferestruica
respectiv, care are din setare valoarea .10, dar neactivat (vezi fereastra din dreapta-jos). n
felul acesta valorile ce indic saturaii mici i nesemnificative n factorii descoperii nu vor mai fi
afiai, fapt ce uureaz inspecia vizual, selecia i luarea deciziilor.
Trebuie precizat c metoda componentelor principale care este opiunea de baz a programului
este util mai ales pentru a vedea dac exist un factor general (cu o varian mai mare de
50%) ce definete variabil latent, sau dac nu cumva exist mai muli factori
55
de magnitudine mai mic, ce acoper ntreaga varian a scorurilor scalei studiate. Vom putea
vedea deci dac avem de-a face cu o scal uni- sau multi-dimensional.
Atragem de asemenea atenia asupra faptului c dac o singur variabil inclus n panoul de
lucru are variana zero, analiza factorial nu mai poate fi efectuat. Deoarece acesta este i cazul
chestionarului nostru, identificm variabila sau variabilele cu varian zero prin Frequencies ori
Descriptives. n cazul nostru itemul 66 trebuie eliminat din analiz (i din scal deoarece, avnd
variana zero, el nu are nici o utilitate), dup care relum analiza factorial. Aceasta va produce
mai multe output-uri, din care dou sunt eseniale.
Figura 3.4. Unul dintre outputurile analizei factoriale
indicnd factorii selecionai i valorile lor eigen.
Outputul de mai sus indic faptul c itemii iniiali nu produc un singur factor general, ci cteva
zeci (fapt curent n construcia de scale cu numr mare de itemi), din care primul acoper doar
13,36% din varian (deci este foarte departe de a fi un factor general), al doilea 8,21%, al treilea
4,96% etc. Chiar i al aisprezecelea factor produce o valoare eigen peste 2 (2,08%), ceea ce
poate prea un adevrat comar statistic. Lucrurile nu stau ns chiar aa. Dac analizm cu
atenie outputul al doilea din figura 1.4, observm c acesta devine o adevrat gril de selecie
pentru factorii mai importani care vor fi reinui. Astfel, itemii vor fi alocai la acei factori pentru
care ei au cele mai mari corelaii (saturaii n factorul respectiv). Atunci cd se poate, itemii cu
saturaii negative se aloc la factorul cu care coreleaz pozitiv mai semnificativ, pentru a nu
schimba maniera de scorare; la valori foarte apropiate ale saturaiilor, un item se aloc scalei mai
scurte pentru a o fortifica, deoarece tim c puterea unei scale depinde i de numrul itemilor
care o compun.
56
Observm c, dup ce ncep s fie alocai la primii trei factori, mai rmn foarte puini itemi sau
deloc pentru factorii urmtori, i aceast deoarece muli itemi i mpart variana tre mai muli
factori (nu sunt foarte specifici). Alocnd itemii factorului pentru care ei au cea mai mare
saturaie, celorlali factori le rmn tot mai puini itemi, aceasta deoarece primii factori dau
corelaii mai mari cu itemii, avnd deci prioritate n selecia acestora. De fapt afiarea n tabel a
factorilor de la stnga la dreapta se face n ordinea magnitudii lor, dat de mrimea corelaiilor
cu itemii, dar i de numrul acestor corelaii. Itemii care nu se repartizeaz n primele 3-4
categorii vor putea defini i ei nite factori de magnitudine mai redus, dar reunindu-i n scale i
studiind alpha pentru acestea vom observa c consistena intern este din ce n ce mai mic
pentru factorii extrai ultimii.
Figura 3.5. Unul dintre outputurile analizei factoriale
indicnd factorii selecionai i valorile lor eigen.
Cum o scal trebuie s aib o consisten intern de peste .70 (aceasta fiind foarte bun peste .80
i excelent peste .90) scalele mici neatingnd aceste valori trebuie n principiu abandonate,
pentru c ele sunt expresia unor construncte ce au o valoare ndoielnic. n cazul de mai sus,
itemii 5, 7, 8, 10, 13, 16, 17, 20, 21, 22 etc. vor fi alocai primei scale; itemii 3, 9, 19 etc. celei de
a doua, iar itemii 15, 24, 43 etc. celei de a treia. O atenie special impune itemul 3, care poate fi
distribuit i la factorul 2 i la 3 (decizia o lum ulterior, cnd evalum care dintre cele dou
subscale are mai mare nevoie de el) sau la itemul 22, care coreleaz semnificativ i cu factorul 1
(pozitiv) i cu factorul 3 (negativ). n aceste situaii se observ ct
57
de important este mrimea lotului pentru luarea unei decizii corecte, bazat pe analiza
factorial.
Hotrrea de a aloca itemii ntr-o scal sau alta poate fi irevocabil, chiar dac datele ulterioare
nu confirm deciziile noastre de acum. Prin mrirea semnificativ a numrului de subieci,
soluia factorial poate s aduc o mulime de diferene, ceea ce relanseaz practic ntreg
procesul de reconstrucie a scalei. Din aceast cauz vom cuta s lum decizii importante i
definitive doar dac eantionul pe care s-a efectuat analiza factorial este unul sufiucient de mare
i de reprezentativ.
Finalmente, scala desemnnd factorul 1 arat ca n figura de mai jos.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean Std Dev Cases
1. CEDA005 .2000 .4031 65.0
2. CEDA007 .3231 .4713 65.0
3. CEDA008 .3231 .4713 65.0
4. CEDA010 .1538 .3636 65.0
5. CEDA013 .4154 .4966 65.0
6. CEDA016 .5385 .5024 65.0
7. CEDA017 .4154 .4966 65.0
8. CEDA020 .1231 .3311 65.0
9. CEDA021 .4462 .5010 65.0
10. CEDA022 .3385 .4769 65.0
...................................................................................................................................................................
Statistics for Mean Variance Std Dev N of Variables
SCALE 11.9846 86.4841 9.2997 50
Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted
CEDA005 11.7846 84.0154 .3121 .9203
CEDA007 11.6615 83.3212 .3418 .9202
CEDA008 11.6615 83.4462 .3270 .9204
CEDA010 11.8308 83.3928 .4456 .9192
CEDA013 11.5692 81.3115 .5500 .9180
CEDA016 11.4462 82.5635 .4018 .9197
CEDA017 11.5692 81.7178 .5034 .9185
CEDA020 11.8615 83.4337 .4862 .9190
CEDA021 11.5385 83.8149 .3636 .9202
CEDA022 11.6462 83.1385 .3586 .9201
.................................................................................................................... ...............................................
Reliability Coefficients
N of Cases = 165.0 N of Items = 50
Figura 3.6. Unul dintre outputurile analizei factoriale
indicnd factorii selecionai i valorile lor eigen.
58
d. Scurt raport despre scal
Se pare c scala 1 obinut de noi este una foarte bun deoarece la ea contribuie 50 de itemi ce-i
dau o consisten intern extrem de mare (alpha = 0,92). Fiecare item d corelaii de peste 0,30
cu scala, dar i mai mari. Scorul mediu la aceast scal este de 11,98, cu o abatere standard de
9,30. Totui valorile medii ale itemilor nu sunt centrate majoritar pe valoarea mijlocie de scor
(0,50), ci sunt mai mici, fapt ce indic o asimetrie rezultat din cauza caracterului mai curnd
clinic al testului. Aceti itemi discrimineaz bine printre subiecii care au valori mai mari ale
scorurilor, dar mai slab pentru cei cu valori submedii. Scala urmeaz a fi verificat i validat
contra criteriul extern pe populaii clinice care prezint realmente dezordinile alimentare
diagnosticate.
Studiind itemii care compun, primul factor a fost numit Stim de sine negativ legat de
aspectul fizic (50 de itemi), al doilea Propensiune anorexic (12 itemi) i al treilea
Propensiune bulimic (12 itemi). Deoarece cei trei factori sunt mediu-slab corelai ntre ei,
scorurile lor separate pot fi agregate tr-un scor global, adic ntr-un Index al tulburrilor
alimentare, definit de preocuparea pentru aspectul fizic i pentru pierderea controlului asupra
ingestiei de alimente.
Numrul relativ mic de subieci pe care s-a desfurat analiza factorial (N = 165) ridic totui
semne de ntrebare n legtur cu stabilitatea soluiilor gsite, care trebuie verificate i
definitivate pe populaii mai largi.
3.3. Criterii de selecie a itemilor pentru optimizarea lungimii scalei
P n acest stadiu de dezvoltare al scalelor de tulburri alimentare cercettorul are un numr
bun de itemi (72), distribuii pe trei subscale n raport cu care acetia au o fidelitate destul de
ridicat. i totui, se observ diferene relativ semnate tre acestea: prima are un alpha de
.92, a doua de doar de .70, iar a treia de .58. Alpha pentru toat scala este de .94. Se pare deci c
scalele 2 i 3 nu sunt suficient de fidele, aceasta probabil i din cauza scurtimii lor. Se admite c
scalele scurte sunt bune, pentru c se completeaz uor i nu pun prea mare presiune pe subieci.
Prin opoziie, scalele mai lungi creeaz mai mult stres la completare, dar au caracteristici
psihometrice mai bune (consisten intern, alte forme de fidelitate i de validite, putere de
discriminare mai mari). Este deci de dorit gsirea unui echilibru ntre scurtimea scalei i calitile
sale psihometrice.
Atunci cnd fidelitatea unei scale este prea mic, scurtimea ei nu este o calitate n sine. Dac
cercettorul nu poate asigura nici un neles unei scale scurte, nu s-a ctigat nimic prin scurtimea
ei. n cazul de fa exist o satisfacie legat de calitatea primei scale. Pentru cea de
59
a doua i de a treia ar putea rencepe travaliul de a genera itemi suplimentari, care s surprind
mai specific bulimia i anorexia i care vor trebui aplicai unor populaii clinice identificate a
avea aceste afeciuni.
n rezumat, pentru a clarifica criteriile dup care pstrm unii itemi n scal i-i eliminm pe alii,
furnizm n sintez cele mai importante repere orientative:
- sunt preferabili itemii care au valori medii apropiate de valoarea central, au varian mare, se
coreleaz bine cu ceilali itemi i mai ales coreleaz la un nivel ridicat (peste .30, sau chiar
peste .40) cu scorul total la scal;
- vor fi primii eliminai itemii care dau variana zero, corelaii slabe sau negative cu scala (chiar
dup scorarea invers);
- itemii care coreleaz slab cu scala vor fi de asemenea printre primii eliminai;
- vor fi eliminai i itemii a cror prezen n scal nu numai c nu amelioreaz consistena sa
intern, ci chiar o coboar;
- itemii care coreleaz slab cu dimensiunea/dimensiunile latente msurate, dar coreleaz bine cu
ali factori secundari, vor fi i ei eliminai din scal, dar vor fi analizai pentru a dezvolta
eventual noi scale, dac ei par s sugereze existena altor constructe valide;
- dintre itemii foarte similari ca i formulare i coninut se pstreaz doar aceia care dau cea mai
bun corelaie cu scorul total la scal.
Nu putem omite o ntrebare legitim: ct de mic trebuie s fie pragul corelaiei item-scal pentru
a reine un item n scal? Rspunsul depinde i de inteniile autorului: dorete el o scal scurt i
relativ puternic, sau o scal mai lung, dar care d mai multe nuane, fiind mai stabil i mai
fidel? n primul caz pragul de selecie este mai ridicat (n principiu peste r = .40), n al doilea
ceva mai sczut (dar rareori sub r = .30).
Efectul eliminrii sau includerii unor itemi n scal trebuie i el bine tiut. Dac cunoatem
corelaia medie a scalei rezultate putem aplica o formul care ne ajut s anticipm care va fi
efectul adugrii sau eliminrii unui item. Aceast formul este:
n care N este numrul de itemi i r corelaia medie inter-itemi. Putem astfel determina ce se
ntmpl dac la o scal cu corelaia iter-itemi de .30 adugm sau scoatem un item: alpha = [10
.30]/[1+9.30] = .81 pentru 10 itemi; alpha = [11.30]/[1+10.30] = .83 pentru 11 itemi;
rNrNalpha+=)1(1
60
alpha = [9.30]/[1+8.30] = .79 pentru 9 itemi. Vedem c diferena de doar doi itemi ridic
consistena intern de la .79 la. 83, ceea ce este important. n general, dac corelaia inter-itemi a
unui item este egal sau cu puin sub corelaia inter-itemi medie, pstrarea itemului n scal are
un efect de cretere a lui alpha; cnd aceast corelaie este mult sub medie, ea poate s duc la
descreterea lui alpha i deci itemul ru trebuie eliminat.
O soluie interesant pentru a verifica stabilitatea caracteristicilor unei scale este propus de
DeVellis (2003, pp. 99-100), ea constd splitarea lotului. Cd lotul este unul suficient de
mare el poate fi mprit n jumti. Cnd lotul nu este suficient de mare, mprirea se poate
face n pri inegale, partea cea mai mare fiind rezervat pentru determinrile principale, pe cnd
cea de a doua pentru verificarea constanei rezultatelor gsite. Deci prima parte din lot folosete
la evaluarea i selecia itemilor, la construcia scalelor i la determinarea lui alpha pentru fiecare
subscal; cea de a doua parte este util pentru replicarea datelor i pentru a verifica dac ele se
regsesc pe un lot foarte similar.
Avantajele acestei metode care oblig din start la abordarea unui numr mare de subieci, de
peste 500-600 de persoane sunt semnate. n primul rnd mprirea se poate face aleatoriu,
ceea ce asigur echivalena grupurilor, randomizarea genernd dou eantioane echivalente.
Dac acestea ar fi abordate n dou momente temporale diferite exist probabilitatea ca factorul
timp s aduc modificri (fie i discrete) la cel de al doilea grup, sau ca el s difere prin alte
caracteristici de primul grup. Apoi, un nou grup presupune expunerea subiecilor la alt personal
de cercetare, n alt perioad a anului, cu instrumente care pot diferi uor de primele (forma
iniial i forma definitiv a scalei), ceea ce poate introduce alte distorsiuni nedorite. Dar cel mai
nsemnat avantaj al splitrii grupului original este acela c la ambele subgrupuri vom avea forma
original a instrumentului, ceea ce permite revenirea la decizia eliminrii unor itemi dac grupul
de control indic necesitatea schimbrii acestei decizii. Dac pentru primul grup, cel pe care s-a
fcut selecia itemilor, exist posibilitatea ca factori de ans s fie confundai cu covariaia
itemilor, la al doilea unde itemii sunt deja selectai o asemenea posibilitate nu mai exist.
Finalmente, prin reunirea celor dou grupuri n unul singur se obin caracteristici psihometrice
mai sigure i mai aproape de realitate dect pentru fiecare grup luat separat.
3.4. Alte analize utile pentru determinarea fidelitii scalei
Ideea c prin coeficientul alpha al lui Cronbach se rezolv problema fidelitii unui test/scale este
una eronat deoarece n esen acesta indic doar msura n care itemii formeaz un set omogen,
bine sau satisfctor corelat cu scorul total la test. Alpha nu ne
61
spune totui dac scala nou creat surprinde sau nu cu adevrat estena constructului cutat,
pentru aceasta trebuind desfurate nenumrate studii de validare, pentru oricare nou extensie
legat de utilizarea scalei. Chiar fidelitatea presupune determinarea prin test-retest a stabilitii n
timp a rezultatelor obinute, corelaia dintre o form a testului i forma sa paralel etc. Cum
fidelitatea este cea mai important precondiie a validitii, trebuie spus c programul SPSS ofer
alturi de alpha i posibilitatea determinrii fidelitii prin metoda jumtirii (split-half).
Demersurile necesare acestui tip de analiz sunt foarte asemnroare cu cele presupuse de
determinarea lui alpha (AnalyseScaleReliabilitySplit-halfStatistics), doar c
de la Statistics acum se dezactiveaz Descriptives for (Item, Scale, Scale if item deleted), deja
determinate anterior.
Figura 3.7. Ferestrele de dialog pentru Split-half i Statistics.
Output-ul acestei serii de comenzi este un indicator al consistenei interne care ia n calcul o
jumtate a testului comparat cu cealalt, prin dou metode: cea a lui Spearman-Brown i cea a
lui Guttman. Echivalena jumtilor se stabilete i prin compararea coeficientului alpha pentru
fiecare jumtate n parte. Cele dou jumti comparate sunt luate de computer ca atare, dar dac
vrem s determinm split-half pentru numerele pare i cele impare, introducem panoul de
lucru t itemii pari, apoi pe cei pari, dm OK i vom obine analiza dorit.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (S P L I T)
Reliability Coefficients
N of Cases = 165 N of Items = 112
Correlation between forms = .80 Equal-length Spearman-Brown = .89
Guttman Split-half = .89 Unequal-length Spearman-Brown = .89
56 Items in part 1 56 Items in part 2
Alpha for part 1 = .85 Alpha for part 2 = .87
Figura 1.6. Rezultatele outputului pentru Split-half.
62
Corelaiile obinute prin splitare sunt identice prin cele dou metode (.89) iar valorile alpha
pentru prima parte (.85) i pentru cea de a doua (.87) sunt extrem de asemntoare, de unde
deducem c exist o foarte bun consisten intern pentru fiecare jumtate a testului.30
Procesul de construciei a unei scale nu se oprete aici. Destinul acesteia depinde doar parial de
calitile psihometrice identificarte preliminar i mai mult de utilitatea ei real, de posibilitatea
implicrii ei ntr-o multitudine de aplicaii practice sau de cercetri. Cel mai adesea validitatea
este cea care impune n timp o scal i aceasta poate fi probat ntr-o multitudine de maniere.
Prezentm mai jos o matrice de intercorelaii dintre cei trei factori rezultai pentru Scala de
tulburri alimentare i cele trei categorii de mecanisme de aprare decelate de DSQ (The
Defense Style Questionnaire) creat de Andrews, Singh i Bond.
FACTOR1
FACTOR2
FACTOR3
DSQ Mec. mature
DSQ Mec. nevrotice
FACTOR1
-
FACTOR2
.38**
-
FACTOR3
.32**
.28**
-
DSQ Mec. mature
-.09
.16
.01
-
DSQ Mec. nevrotice
.23*
.10
.18
.19*
-
DSQ Mec. imature
.51**
.31**
.29**
.21*
.53**
Not: ** Correlaia este semnificativ la pragul de 0,01 (bidirecional).
* Correlaia este semnificativ la pragul de 0,05 (bidirecional.
Figura 3.8. Matrice de intercorelaii dintre cei trei factori identificai i DSQ.
Din tabelul de mai sus rezult c factorul 1 se valideaz la un nivel foarte ridicat prin corelare cu
mecanismele de aprare imature (r = .53) i la un nivel mai sczut cu cele nevrotice (r = .23).
Aceasta atrage atenia asupra faptului c factorul 1 are un coninut negativ i c ar trebui s se
numeasc Stim de sine negativ legat de aspectul fizic. Factorii 2 i 3 se valideaz i ei
concurent cu mecanismele de aprare imature, dar la niveluri mai sczute (r = .31, respectiv r =
.29). Evident c aceast prim confirmare are nevoie de o mulime de alte studii, dar aceasta
presupune ca instrumentul s fie publicat i lansat pentru a-i ndeplini rolurile pentru care el a
fost proiectat.
30 Not: Aceste determinri au fost fcute pe tot setul de itemi doar ca exerciiu, nainte de
selecia i sortarea pe scale a itemilor, ele trebuind reluate pentru subscalele obinute n finalul
procesului de construcie, ca i pentru scala global care le include pe toate trei. Dublarea
numrului de subieci pentru a obine o soluie factorial stabil relanseaz practic ntreg
procesul de reconstrucie al scalelor.
63
4. FIDELITATEA TESTELOR
4.1. Problematica general a fidelitii testelor
Testele sunt concepute ca instrumente de msur perfecionate, n consecin ele trebuie s aib
calitile psihometrice presupuse de acest fapt. Dac pentru lungime, mas, volum, timp sau
temperatur exist att instrumente perfecionate de msur, ct i uniti metrice bine definite,
inteligena, memoria, personalitatea, motivaia, iubirea sau sntatea, agresivitatea, tolerana la
frustrare sunt caracteristici psihologice foarte complexe, ce nu pot fi vzute i atinse n sens fizic,
deci greu cuantificabile.
Cu toate problemele pe care msurarea le pune n psihologie, preocuparea pentru acurateea
instrumentelor utilizate n sens metric a generat standarde extrem de exigente i de sofisticate.
Plecnd de la Spearman (1904), Thorndike (1904), Kuder i Richardson (1937) i pn la
Cronbach (1972, 1989) i Bentler (1990, 1991), a existat o linie de evoluie continu
dezvoltarea unor teorii tot mai elaborate despre fidelitatea probelor psihometrice. Teoria clasic
asupra fidelitii testelor este construit n jurul erorii de msurare care plec de la ideea c
fiecare persoan testat ar avea un scor adevrat, care ar fi obinut dac aceast eroare nu ar
exista. Deci scorul observat (O) este alctuit din scorul adevrat (A), la care se adaug eroarea de
msurare (E):
O = A + E
O alt supoziie a teoriei clasice a testului este c aceast eroare este aleatoare, deci scorul
adevrat va fi media unei distribuii n care dispersia reprezint erorile aleatoare de msurare.
Cum aceste distribuii pot avea dispersii largi sau nguste, nseamn c i erorile de msurare vor
fi mai mari sau mai mici. n felul acesta teoria clasic a folosit abaterea standard a erorilor ca
msur de baz a erorii de msurare, numit i SEM31.
Fidelitatea unui set de scoruri este exprimat de un numr zecimal cuprins ntre 0,00 i 1,00,
indicnd absena, respectiv fidelitatea perfect. Deoarece nu poate fi determinat direct,
fidelitatea se estimeaz prin analiza efectelor variatelor condiii de administrare i a coninutului
testului asupra scorurilor finale. Ea va fi influenat doar de schimbrile nesistematice care vor
avea diferite efecte asupra celor examinai. Fiecare din multiplele metode de estimare a fidelitii
va lua n calcul diferitele condiii ce pot produce asemenea
31 Standard Error of Measurement, adic eroarea standard a msurtorii.
64
schimbri nesistematice n scorul testului, ce vor afecta n consecin mrimea erorii de
msurare. n funcie de condiiile concrete n care a fost administrat testul i n funcie de ceea ce
acesta msoar, se calculeaz unul sau mai muli coeficieni de corelaie ca o aproximare a
fidelitii testului.
4.2. Fidelitatea test-retest
Numit i coeficient de stabilitate, acesta este obinut prin corelarea scorurilor obinute de un grup
de persoane la o administrare a testului cu scorurile registrate la o administrare ulterioar a
acestuia, dup un interval de timp. Procedeul ncearc determinarea erorilor legate de condiiile
de aplicare. Cum testul aplicat este acelai, inconstana scorurilor nu poate fi imputat itemilor
si, ci diferenei dintre condiiile de aplicare, cu att mai mari cu ct intervalul dintre testretest
este mai lung (luni sau ani). Aceasta presupune ns c trstura msurat este ea nsi stabil n
timp, deci procedeul nu este adecvat pentru unele probe (pentru testele proiective de exemplu,
dar nici pentru chestionarele de motivaii, opinii, dispoziii afective sau sntate).
Deoarece pot interveni efectele practicii (unele abiliti se mbuntesc prin exerciiu) sau ale
nvrii (coninuturile testului pot fi memorate spre a fi rezolvate ulterior), se pune problema
alegerii atente a intervalului dintre cele dou examinri. Aceste efecte sunt mai accentuate pentru
intervalele scurte (ore sau zile), dar un interval mai lung are dezavantajul de a produce modificri
chiar n structura aptitudinii (efectul de cretere sau de maturare, foarte evident mai ales la testele
educaionale). Intervalul optim pentru retest pare a fi de cteva sptmni pn la o lun sau,
unde este posibil, se pot calcula coeficieni de fidelitate pentru intervale de timp diferite
(sptmni, luni sau ani).
4.3. Coeficientul formelor parale
Memorarea testelor nu d o eroare sistematic, deoarece proporia itemilor pe care subiecii i-i
reamintesc dup o perioad este diferit de la individ la individ, ceea ce produce descreterea
corelaiei test-retest. Pentru depirea acestei surse de eroare se poate utiliza procedeul formelor
paralele prin calcularea aa-numitului coeficient de echivalen, un alt indicator al
fidelitii. Pentru a msura acelai atribut o form paralel a unui test trebuie s fie construit n
acelai mod ca i prima variant. Ele vor fi considerate forme paralele doar pentru c utilizeaz
itemi formulai diferit, dar procedeul de generare i selecie a acestora
65
pentru un anumit nivel de dificultate este acelai, deoarece ambele trebuie s msoare acelai
construct, n aceeai manier. Formele paralele pot fi aplicate chiar i n aceeai zi, caz n care
singura surs de diferen dintre scorurile la cele dou forme este eroarea aleatoare a
diferenei dintre itemii testului.
O procedur mai rafinat utilizat este aceea de a aplica unei jumti din populaie
forma A a testului i celeilalte forma paralel B, urmnd ca dup o perioad de timp aceluiai
eantion s i se aplice tot ambele forme, dar de data aceasta primei jumti forma B iar celei
de a doua jumti forma A. Coeficientul de corelaie ce rezult se numete coeficient de
stabilitate i echivalen, pentru c ia simultan calcul, ca surse de eroare, itemii
testului i
factorul timp.
4.4. Coeficienii de consisten intern
Din cauza costurilor de construcie ridicate, nu toate testele au forme echivalente, de
aceea se folosete o cale mai puin direct de determinare a fidelitii: cea a consistenei
interne, ce include metoda njumtirii (splithalf) a lui Spearman, formulele Kuder-
Richardson i coeficientul alpha (o ) al lui Cronbach, care nu trebuie considerai echivaleni
cu coeficienii de fidelitate obinui prin testretest sau prin forme paralele.
a. Metoda splithalf
n englez, to split nseamn a despica, iar half, jumtate, de unde i numele
metodei, care poate fi tradus prin njumtire. ntr-un test omogen, toi itemii msoar (n
diverse grade) acelai construct, deci este posibil s construim dou jumti relativ
echivalente pentru a le pune ulterior n corelaie. Cele dou jumti pot fi obinute n diverse
maniere, cum ar fi: prima parte a testului i a doua sa parte, sau subteste ce ar rezulta din
reunirea tuturor itemilor cu numr par i cu numr impar (tehnica parimpar), sau oricare alt
procedeu, chiar i aleator, de a genera jumti. Problema tehnic spinoas este c acestea
trebuie s fie echivalente, ceea ce n primul exemplu nu se ntmpl: n cele mai multe teste
de aptitudini, itemii dificili sunt plasai n a doua parte a probei. Chiar i tehnica parimpar
este aplicabil doar parial pentru c, dei n multe teste itemii sunt aranjai n ordinea
cresctoare a dificultii, sunt greu de gsit cte doi itemi perfect echivaleni din acest punct
de vedere, pentru a putea compune cele dou jumti. n plus, n unele teste, anumii itemi
sunt folosii pentru a-i introduce pe alii, adic nu sunt independeni (itemi legai).
66
Deci metoda splithalf presupune analiza de itemi i calculul mediei i a abaterii
standard, valori care trebuie s fie aproximativ egale pentru fiecare jumtate, pentru a verifica
faptul c ele sunt echivalente. Cum corelaia dintre dou seturi de scoruri este mai mic pentru
seturile mai scurte, fidelitatea ce rezult pentru testul n ansamblul su, plecnd de la
jumtile sale, poate fi estimat prin corecia pe care formula de profeie a lui Spearman-
Brown o propune:
R =
r
r
1+
2
De exemplu, dac corelaia dintre jumti este de r = 0,64, fidelitatea testului ansamblul
su va fi R = 2 0,64/(1+0,64) = 0,78. Aceast formul are un efect substanial pentru
corelaiile medii, dar unul mai mic pentru cele extreme.
b. Metoda Kuder-Richardson
n 1937, Kuder i Richardson au dezvoltat metode de evaluare a fidelitii dintr-o
singur aplicare a unui test, ceea ce a nsemnat un mare progres, deoarece aceasta nu mai
depindea de maniera arbitrar n care se fcea njumtirea testului. Scorarea separat a
jumtilor crea o alt problem, pe lng cea legat de dificultatea obinerii unor forme
realmente echivalente. Formula de mai jos se poate aplica doar testelor ai cror itemi sunt
scorai dihotomic (zero sau unu, adic fals sau adevrat):
| |
.
|

\
|

= =
2
2
20 1 s
s pq
N
N
KR R
unde KR sunt iniialele celor doi psihologi, R este fidelitatea estimat, N numrul de itemi ai
testului, s2 variana scorului la test n ansamblul su, p este proporia (calculat pentru fiecare
item parte) care un item este rezolvat corect, q este complementul acestei proporii, adic
(1 p), pq este suma produselor pq pentru fiecare item al testului. Studiind formula, vom
vedea c partea ei din dreapta comport o analiz din care rezult c pentru a avea o fidelitate
mai mare ca zero, variana testului trebuie s fie mai mare ca suma varianelor individuale ale
fiecrui item (s2 > pq). Acest lucru este posibil doar cazul care itemii, calitatea lor de
msur a aceluiai construct, sunt intercorelai.
Pentru situaia cnd itemii celor dou jumti sunt aproximativ egali ca nivel de
dificultate (cazul echivalenei), cei doi autori au propus o alt formul, mai uor de calculat,
dar care nu se poate aplica jumtilor neechivalente, ntruct le va subevalua fidelitatea:
67
(
(
(
(
(

(







| |
.
|

\
|



= 21 2
1
1
1 s
N
x
x
N
N
KR
unde toate notaiile sunt aceleai ca n formula precedent, iar x reprezint media scorurilor
totale la test.
c. Coeficientul alpha (o ) al lui Cronbach
Formula 20 KR este o foarte valoroas procedur de estimare a consistenei interne a
unui test. Cu toate acestea, exist situaii n care ea nu este potrivit, iar acestea apar atunci
cnd testul nu a fost scorat n termeni de adevratfas, sau zerounu, deoarece formula se
bazeaz pe cunoaterea proporiei n care subiecii au rezolvat corect fiecare item. Unele
chestionare de opinii, atitudini sau valori sunt elaborate nu termeni dihotomici, ci presupun
o scar a gradului de acorddezacord sau atracierespingere. n aceast situaie, Cronbach
(1951) a elaborat o procedur mai general de estimare a fidelitii, aa-numitul coeficient
alpha, a crui formul este:
| |
.
|

\
|

= =
2
2 2
1 s
s s
N
N
R i o
Se observ o mare similitudine cu formula 20 KR chiar i n notaii, termenul nou fiind 2
i s .
Termenul si
2 nlocuiete n aceast formul pq i el reprezint suma varianelor individuale
ale fiecrui item. Singura diferen const deci n maniera n care este exprimat variana.
Deoarece 2
i s exprim variana itemilor care nu sunt rezolvabili doar prin da/nu, coeficientul
alpha este considerat a fi soluia cea mai general pentru determinarea fidelitii pentru
consistena intern.
Kaplan i Saccuzzo (1993) sesizeaz foarte ntemeiat c toate msurile care evalueaz
consistena intern, determin de fapt gradul n care fiecare item diferit msoar aceeai
trstur sau abilitate. Acest lucru presupune implicit c testul este omogen, n caz contrar
acesta neavnd consisten intern. Pentru testele neomogene, procedeul cel mai indicat este
analiza factorial, prin care se vor putea submpri itemii pe grupe omogene, subtestele ce
rezult avnd fiecare o consisten intern ridicat, dar fiind relativ independente unul n
raport cu celelalte, ca cazul subscalelor testului de prsonalitate 16PF Cattell.
Aiken (1997) sesizeaz de asemenea c cele trei procedee de determinare a fidelitii,
amintite anterior, supraestimeaz valoarea acesteia pentru testele n care este implicat viteza.
68
n acest caz procedurile de apreciere a fidelitii trebuie modificate, recomandarea fcut fiind
aceea de a administra cele dou jumti ale testului n momente diferite, dar cu limit de timp
egal. Dup aceasta se calculeaz fidelitatea, operdu-se corecia ei prin formula Spearman
Brown.
d. Fidelitatea interscoreri
Majoritatea testelor de aptitudini, de performan i de personalitate au proceduri de scorare
standardizate, aa c nu va fi nici o problem n privina scorurilor obinute de ctre persoane
diferite, devreme ce aceste proceduri de apreciere pot fi ncredinate mainilor automate de
scorare sau computerului. Tehnicile proiective, judecile evaluativapreciative, evaluarea unor
produse complexe ale activitii (desene, mostre de scris, obiecte manufacturate etc.) sau ratingul
personalitii include, prin natura lucrurilor, o doz crescut de subiectivitate. n acest caz trebuie
s determinm gradul de intervenie n apreciere al subiectivitii, determinnd fidelitatea
interscoreri sau interevaluatori prin calculul corelaiei dintre dou seturi de scoruri acordate de
evaluatori diferii, unui numr determinat de examinai. Se poate apela i la metoda mai muli
examinatori un singur examinat, sau mai muli examinatori mai muli examinai, procedee
care culeg coeficieni de fidelitate intraclas, sau de concordan (cum ar fi
coeficientul tau al lui Kendall, vezi Radu et al., 1991), pentru care exist programe speciale de
calculator, cum ar fi SPSS.
4.5. Factorii care intervin n determinarea fidelitii
Pentru ca estimarea fidelitii s fie ct mai precis, trebuie ndeplinite cteva condiii (Traub,
1944, apud Albu, 1998):
- Eantionul s fie ct mai mare, pentru a reduce eroarea standard a repartiiei, care este invers
proporional cu rdcina ptrat din numrul subiecilor ce compun eantionul.
- Eantionul s fie reprezentativ pentru populaia creia i este destinat testul, avnd acelai grad
de eterogenitate, deoarece omogenitatea diminueaz valoarea coeficientului de fidelitate.
- Msurtorile s fie independente ntre ele, astfel nct msurtoarea de la un examinator s nu o
influeneze pe a altuia, iar dac examenul este colectiv, s nu se poat tria prin copiere.
Independena cere ca persoanelor supuse la testretest s nu li se dea informaii despre rezultatele
examinrii precedente, iar itemii s nu se condiioneze reciproc.
- Toate aspectele de procedur n test i retest sau la formele paralele trebuie s fie identice.
69
Creterea nivelului de fidelitate a unui test p la limita dorit sau cerut de situaia
de utilizare concret este posibil prin creterea numrului de itemi (care trebuie s fie de acelai
format i s msoare aceeai trstur sau acelai construct)32. Decizia aceasta angajeaz un
proces lung i costisitor, pentru c testul nou generat trebuie reevaluat de la nceput i uneori se
dovedete a fi sub nivelul de fidelitate ateptat. De asemenea, crescndu-i lungimea, testul devine
mai greu de aplicat i de scorat. Manipulnd formula de profeie a lui SpearmanBrown se
calculeaz un indice de multiplicare a numrului de itemi pentru a atinge fidelitatea dorit: un
test de 20 de itemi trebuie s ajung la 56 de itemi pentru a-i crete fidelitatea de la 0,87 la 0,95
(Kaplan i Saccuzzo, op. cit., p. 127).
Ca o concluzie a acestor consideraii despre fidelitatea testelor, se relev faptul c aceasta este
mai bun pentru teste unidimensionale i cu numr mai mare de itemi, ct i pentru testele
cognitive i c ea angajeaz un studiu analitic al itemilor (analiza de itemi) pentru a le determina
fora de discriminare. n multe situaii analiza factorial este metoda cea mai eficient prin care
se pot construi subteste omogene i unidimensionale. Fidelitatea este una din fundamentrile de
baz ale cercetrilor asupra comportamentului. Dac un test nu este fidel, nu va fi posibil s
demonstrm c el are vreun neles, afirm Kaplan i Saccuzzo (op. cit., p. 131). Deci, dei
validitatea pare a fi o caracteristic psihometric mai important, din punct de vedere tehnic
studiul ei nu poate ncepe cu teste care nu i dovedesc o fidelitate minim, acceptabil, care
depinde de scopul n care acestea vor fi utilizate.
32 Vezi capitolul urmtor.
70
5. FACTORI CARE AFECTEAZ FIDELITATEA TESTELOR
5.1. ntinderea diferenelor individuale
Deoarece estimarea fidelitii rezult din calculul corelaiei r Pearson limitele statistice
ale acestuia se repercuteaz i asupra coeficientului de fidelitate. Astfel, r este calculat pentru
variana total a testului ceea ce este o condiie necesar, dar nu i suficient pentru a
determina fidelitatea. Atunci cnd se produce o reducere sau o cretere a ambitusului
scorurilor individuale, corelaia dintre variabile (i implicit fidelitatea testului) scade sau
crete n mod artificial, diminund ansa de a determina corect fidelitatea sa. Astfel, dac n
faza de studiu pilot se utilizeaz un eantion care are o varian mai mic dect populaia
general, fidelitatea testului va fi subestimat (va fi mai mic dect dac eantionul ar fi fost
reprezentativ). Aplicarea testului pe o categorie populaional foarte omogen (clase de elit
sau de subdotai intelectual, clase vocaionale etc.) ar putea furniza o corelaie mai mic dect
cea existent la clasele normale, unde extremele (subdotai, supradotai intelectual) sunt
reprezentate normal.
Variana i implicit fidelitatea poate fi crescut artificial prin folosirea de
eantioane cu grad mare de eterogenitate. Agregarea ntr-un eantion comun a unor clase de
elit (supradotai), normale i de integrare (subdotai) accentueaz mrimea corelaiei, ca i
reunirea n acelai eantion a unor niveluri de pregtire colar aflate la mare distan unele de
altele. Pentru situaia n care eantionul a fost prea omogen, diminund astfel variana tot al a
scorurilor la test, i deci fidelitatea sa, Magnuson a propus o formul de corecie:
ruu =
( )
2
'
1 2 1
u
x xx r
o
o
care ruu este fidelitatea estimat pentru noul eantion, x este variana noului eantion iar
u este fidelitatea calculat ntre vechiul i noul eantion. Pentru utilizatorul unui test
precauiile legate de ntinderea diferenelor individuale sunt dou:
- utilizarea tabelelor de norme, care aduc distribuiile la un numitor comun prin raportarea
la notele standardizate z;
- studiul pilot al fidelitii pe propriul eantion de lucru pentru a ne asigura c populaia
noastr corespunde ca raport de omogenitate/eterogenitate populaiei pe care s-a
determinat fidelitatea raportat n manualul testului.
71
5.2. Lungimea unui test
Teoria eantionajului demonstreaz faptul c, cu ct un eantion este mai mare, cu att
mai mult estimarea caracteristicilor populaiei din care acesta a fost extras este mai exact. n
mod similar, cu ct numrul de itemi ai unui test este mai mare, cu att mai bine este msurat
constructul sau domeniul investigat, i aceasta deoarece suma erorilor aleatorii tinde tot mai
mult spre zero.
Relaia dintre fidelitatea i lungimea testului este exprimat de formula de profeie a
lui Spearman-Brown, care ne va arta cu ct crete precizia estimarii prin modificarea
numrului itemilor ntr-o anumit proporie K:
xx' r =
( ) '
'
1 1 jj
jj
K r
K r
+

care rxx' este fidelitatea expectat prin lungirea testului, iar rjj' este fidelitatea calculat
pentru testul iniial. Aceast formul poate fi utilizat n dou feluri:
- dac iniial testul avea 20 de itemi i dorim s-l aducem la 45 de itemi, K reprezint
raportul 45/20 = 2,25. Plecd de la fidelitate iniial de 0,83, fidelitatea expectat prin
lungirea testului va ajunge la: (2,250,83)/[(1+2,25-1)0,83] = 1,8675/(1+1,0375) =
1,8675/2,0375 = 0,92;
- invers, dac vrem s tim ci itemi trebuie s adugm pentru a atinge valoarea dorit a
fidelitii, de exemplu creterea de la 0,83 la 0,95 (pentru a putea ajunge zona care
putem lua decizii care privesc destinul unei persoane), maniera de lucru presupune mai
nti izolarea lui K, plecnd de la formula anterioar.
K =
( )
( ) ' '
' '
1
1
jj xx
xx jj
r r
r r


n cazul nostru: K= 3,89
0,04 5
0,16 5
0,83 0,05
0,95 0,17
0,83(1 0,95)
0,95(1 0,83)
=


=


=


- aceasta seamn c, pentru a avea creterea de fidelitate expectat, testul trebuie mrit de
3,89 ori i deci de la 20 de itemi el va ajunge la 78 (20 3,89 = 77,8).
Formulele de mai sus pot fi folosite i n sensul scurtrii unui test prea lung (cu
scderea de rigoare a fidelitii sale) dar fie ntr-o situaie, fie n alta, itemii trebuie s aib
acelai coninut i acelai grad de dificultate, fiind consisteni cu itemii de plecare. Ori aceasta
nseamn parcurgerea prealabil a fazei analizei de itemi, cci itemii foarte diferii ca nivel de
72
dificultate sau ca i coninut nu vor avea o bun corelaie cu cea deja existeni, scznd
omogenitatea de ansamblu a testului.
Metoda Spearman-Brown nu poate preciza care sunt caracteristicile itemilor ce vor fi adugai
__________ termeni de format i de coninut al acestora pentru a face s creasc fidelitatea
testului pn la o precizie antecalculat acceptabil. Dac n testele de aptitudini itemii ce vor fi
adugai vor fi definii n acelai fel ca i ceilali, pentru a fi corelai cu constructul msurat, n
testele educaionale ei vor viza aceleai obiective pedagogice ca i testul iniial. Acesta nu este
un lucru dificil, cci itemii paraleli se creeaz uor dac am folosit din start tehnica specificrii
domeniului. Principalul inconvenient al metodei este utilizarea unui demers empiric n crearea
setului de itemi. Fidelitatea poate fi mai bine ameliorat atunci cnd un test a fost construit dup
demersul criterial, n care caracteristicile itemilor trebuie s fie bine cunoscute.
5.3. Dificultatea testului
Corelaia dintre dou teste tinde s fie maxim doar atunci cnd distribuiile celor dou variabile
au acelai tip de asimetrie. Aa cum am artat n paginile anterioare, n fazele testrii formrii
unei deprinderi aceasta poate avea o asimetrie pozitiv n faza iniial (testul este prea greu) i
una negativ n faza final (testul devine prea uor), trecnd printr-o faz intermediar unde
exist simetrie a distribuiei scorurilor. Asimetriile fiind n direcii opuse, cea mai mic fidelitate
a testului va fi corelarea dintre faza iniial i faza final, dup care corelarea dintre faza
intermediar i celelalte dou faze, iniial sau final.
Schimbarea formei distribuiei poate fi principala cauz a unei fidelitai mici, prin faptul c un
test a devenit mai uor la o a doua aplicare, dnd o curb asimetric negativ, ceea ce presupune
contaminarea rezultatelor ca efect al nvrii. n consecin, verificarea formei distribuiei
scorurilor pentru acele dou aplicri devine obligatorie.
5.4. Testele cu limit de timp
Multe teste de cunostine sau de aptitudini conserv primatul gradrii dificultii itemilor, de la
cei mai uori la nceputul testului (pentru creterea ncrederii n sine), la cei mai dificili spre
sfritul acestuia (pentru a crete puterea diagnostic a instrumentului n zona vrstelor mari ori a
supradotrii). Dac ele au o limit de timp, itemii dificili nici mcar nu vor fi abordai de
majoritatea subiecilor, fiind scorai cu zero i la prima aplicare, i la cea de a
73
doua. Acest fapt va crea o cretere artificial a corelaiei prin care se pune n eviden fidelitatea,
deoarece vor intra n corelaie multe perechi identice de rezultate (0 - 0). Inflaia fidelitii
poate crea imaginea distorsionat a unui test cu itemi ce vor aprea ca mai omogeni dect sunt de
fapt n realitate. De fapt, la testele de vitez nu toate formele de determinare a fidelitii sunt
afectate. n timp ce n cazul jumtii vii (split-half) aceasta va fi afectat (itemii scorai zero se
distribuie aproximativ egal n cele dou jumti ale testului, crescnd artificial fidelitatea),
consistena intern prin indicele alpha al lui Cronbach sau prin metoda test-retest nu va fi
afectat semnificativ n acest caz.
Pentru a determina totui i celelalte forme de fidelitate se dau testul i retestul cu limita de timp
convenit de autor, se marcheaz ultimul item (de aceea itemii trebuie pasai n ordine, i nu pe
srite) apoi se continu pn la capt testul, fr limit de timp. Scorurile din prima categorie
vor servi pentru determinarea mediilor, a abaterilor standard i a formei distribuiei, necesare
scopurilor avute n vedere (cercetare, crearea de etaloane), n timp ce scorurile brute obinute fr
limit de timp vor da o mai bun expresie a fidelitii prin metodele split-half i alpha al lui
Cronbach.
5.5. Fidelitatea i eroarea de msurtoare
Deoarece fidelitatea nu exprim valoarea preciziei msurtorii n aceleai uniti ca i scorul total
la test (exprimat note standard), uneori ea este mai greu de interpretat. Acesta este motivul
pentru care precizia msurtorii poate fi indicat i sub forma unei erori de interpretare a scorului
la test, care va fi cu att mai mic cu ct eroarea de msurare va fi i ea mai mic. Aceast zon
de ncredere poate fi determinat n dou maniere:
a) se determin eroarea de msurtoare (interval de ncredere nuntrul cruia se afl
adevratul scor al unui subiect, pentru niveluri de ncredere specificate);
b) se determin eroare de estimare (nivelul de ncredere al scorului observat dac subiectul ar fi
retestat).
5.5.1. Eroarea standard a msurtorii (SEM)
Conform teoriei clasice a testului, scorul adevrat al unui subiect se distribuie normal n jurul
unei valorii medii, dnd o distribuie pentru care putem determina abaterea standard. Abaterea
standard a diferitelor distribuii rezultate pentru toi subiecii grupului n cauz se numete SEM
(e) adic Eroarea Standard a Msurtorii i se determin astfel:
74
SEM = e o = x o
1 rxx'
care: rxx' este coeficientul de fidelitate iar x este abaterea standard de la care s-a plecat
calculul coeficientului de fidelitate rxx'. De exemplu, pentru o fidelitate de 0,93 i o abatere
standard de 12, =12 1 0,93 = 3,17 e o . Plecnd de la premisa c eroarea de msurtoare este
normal distribuit, 68% din scoruri se vor situa ntre un interval de 1e jurul scorului
adevrat, 95% la 1,96e iar 99% la 2,58e. Nu ne rmne dect s definim aceste
intervale. Cum noi nu cunoatem adevratul scor al subiectului, este preferabil s construim
intervalul de ncredere n jurul a ceea ce deja cunoatem, adic nota observat x (obinut de
subiect) i eroarea standard a msurtorii:
x - zce x + zce
care:
x = scorul observat;
zc = valoarea critic a lui z pentru p 0,05 (z = 1,96) sau p 0,01 (z = 2,58);
e = eroarea standard a msurtorii;
A = scorul adevrat.
Exemplu: scorul x al unui subiect la un test de inteligen este de 121, eroarea standard
a msurtorii este de 3,17 i vrem s construim intervalul de ncredere pentru p 0,05 i p
0,01. Pentru prima situaie avem 121 1,96 3,17 = 121 6,21. Deci pentru un p 0,05,
intervalul este [115; 127], adic sunt 95% anse ca scorul adevrat al subiectului s cad ntre
115 i 127.
Pentru a doua situaie avem: 121 2,58 3,17 = 121 8,18, deci pentru un prag de
ncredere p 0,01, intervalul definit este [113; 129], existnd 99% anse ca scorul subiectului
s cad ntre aceste limite. Se observ de aici faptul c: a. cu ct fidelitatea este mai mare, cu
at mai mult limitele intervalelor de credere pentru orice nivel de credere calculat sunt
mai mici (mai strnse) i b. cu ct vrem s tim cu o precizie mai mare n ce zon cad
scorurile cuiva, cu att mai larg va fi intervalul de ncredere rezultat, i reciproc.
Aceste intervale de ncredere fie sunt adesea neluate n seam de pracricieni, fie sunt
ru interpretate. De fapt noi nu avem nicicum certitudinea c scorul adevrat al subiectului va
cdea n intervalul de ncredere determinat, cci exist doar o probabilitate de a fi aa i, n al
doilea rnd, (i aceasta pare a fi defieciena major a acestei metode) intervalele de ncredere
astfel determinate se sprijin pe postulatul homoscedasticitii, adic pe prezumia c eroarea
tip este aceeai pe toat scara nivelurilor successive ale performanei. n al treilea rand,
corelaia dintre scorul observat i cel estimat nu este niciodat una perfect (Nunnally &
75
Bernstein, 1994) i n consecin prezicerea scorului adevrat plecnd de la cel observat
produce fenomenul de regresie spre medie al scorurilor adevrate. Lund n consideraie
aceast problem, Glutting, McDermott i Stanley (1987) au propus o modalitate de
construcie a intervalului de ncredere mult mai riguroas, dup formula:
( ) ' x r x x xx

= +
n care este scorul adevrat estimat, x scorul observat, x

media scorurilor observate, iar rxx'
este coeficientul de fidelitate.
Eroarea tip a estimrii se va calcula i ea dup o formul modificat:
' ' ( 1 ) eu x xx xx o = o r r
care x este eroarea standard a distribuiei de la care s-a calculat rxx' iar rxx' este chiar
coeficientul de fidelitate calculat. Pentru exemplul nostru, care un subiect obinea 121 la un
test de inteligen cu media 100 i cu abaterea standard de 15, testul avnd fidelitatea de 0,93,
determinarea scorului adevrat devine: 100 + 0,93(121 - 100) = 100 + 0,9321 = 100 + 19,53
= 119,53, rotunjit 120. Calculul erorii standard a estimaiei este urmtoarea: (151-0,93)0,93
= 150,260,93 = 3,69. Intervalul de credere pentru p = 0,05 este egal cu 1,963,69 = 7,23
jurul scorului adevrat estimat, adic 120 7. Acesta este intervalul [113-127]. Pentru pragul
de p 0,01, eroarea va fi 7,58 - 3,69 = 9,52, iar intervalul va fi 120 9,52, adic [110-130].
Aa cum se observ n raport cu scorul observat de 121 intervalul nu mai este unul simetric n
jurul valorii obinute de subiect: n prima situaie de la 121 113 = 8 puncte de scor, pentru
limita inferioar, i n a doua situaie sunt 127 121 = 6 puncte, pentru limita superioar.
Aceast asimetrie provine din centrarea intervalelor de ncredere diferite nu pe scorul
observat, ci pe cel estimat ca adevrat, ceea ce face din aceast procedur cea mai riguroas
metod de determinare a intervalelor de ncredere.
5.5.2. Eroarea tip a estimrii
Eroarea tip a estimrii se regsete de fiecare dat cnd dorim s calculm intervalul
de credere a valorii prezise plecd de la o ecuaie de regresie liniar. Acest tip de eroare se
obine extrgnd rdcina ptrat din variana rezidual, adic acea varian a scorurilor care
se regsete la al doilea test atunci cnd se ine cont de primul test. Cum metoda de calcul i
interpretarea erorii de estimaie sunt mai laborioase, ele nu au fost incluse n capitolul de fa.
Menionm de asemenea faptul c n corelaia liniar pe care se bazeaz de regul
determinarea fidelitii homoscedasticitatea este presupus ca o condiie implicit. Deoarece
eroarea de msurtoare este mai mic la cei care au preponderant reuite sau nereuite
76
(extremele seriei de variaie a performanelor), comparai cu cei de pe poriunea de mijloc, Keats
i Lord au propus un model fundamentat pe distribuia binominal, care permite estimarea erorii
tip a msurtorii indiferent de nivelul scorului subiecilor. Nici aceast procedur nu a fost
inclus aici.
5.5.3. Interpretarea fidelitii
Rspunsul la ntrebarea ct de mare trebuie s fie fidelitatea unui test? depinde de utilitatea
practic care se d acestuia.
- O fidelitate de 0,70 0,80 este suficient de bun atunci cnd testul este folosit n scopuri de
cercetare.
- Se accept niveluri sczute ale fidelitii atunci cnd testele se utilizeaz pentru a lua decizii
preliminare i ridicate pentru decizii finale, sau cnd ele sunt folosite pentru mprirea grupului
n subgcategorii, pe baza unor diferene interidividuale mari.
- Dac testul servete la compararea grupurilor de persoane ntre ele, coeficienii de fidelitate de
0,60 0,70 sunt suficieni, dar cnd testul devine o baz de comparaie ntre persoane
individuale, fidelitatea lui trebuie s fie de la 0,85 n sus.
- Cnd se iau decizii importante pe baz de teste, prin care se mpart persoanele n categorii,
virtutea unor diferene mici (ca n selecia profesional), fidelitatea acestora trebuie s fie de
peste 0,90.
- Cnd decizia privete destinul unei persoane individuale, fidelitatea testului trebuie s fie de cel
puin 0,95.
Testele cognitive, i n special cele de inteligen, au de regul o fidelitate foarte mare (peste
0,90), n timp ce chestionarele de personalitate rareori depesc 0,80. Aplicate colectiv, chiar i
testele cognitive furnizeaz coeficieni de fidelitate mai sczui (n jur de 0,80). Testele cotate
subiectiv, ce msoar aptitudini, i testele de cunotine (educaionale) rareori depesc valori ale
fidelitii de 0,80 (Traub, 1944). Testele cu alegere multipl, utilizate colectiv, sunt considerate a
avea o fidelitate bun cnd aceasta atinge 0,75.
5.5.4. Generalizabilitatea
Potrivit paradigmei clasice relativ la fidelitate, O = A + E, descris n partea introductiv a
capitolului de fa, fidelitatea unui instrument psihometric este n funcie de ntinderea spectrului
diferenelor individuale, de lungimea testului nsui, de limita de timp acordat i de dificultatea
testului. Cu toate acestea condiiile de observare i de msurtoare
77
sunt mult mai complexe dec cele enumerate anterior, ceea ce a condus la conturarea unei
noiuni noi i anume cea de generalizabilitate. Aceasta presupune studiul fidelitii n familii de
situaii similare, ceea ce face ca scorul adevrat (A, din formula de mai sus) s fie nlocuit cu
termenul de univers al scorului ateptat de la un subiect, ntr-un anumit ansamblu de condiii de
observare i de msurtoare.
Teoria generalizabilitii a fost elaborat n 1963 de Cronbach, Gleser i Rajaratnam cu scopul de
a reuni tr-un concept unic diferitele definiii ale fidelitii. Astfel, pentru a cuantifica
importana fiecrei surse de varian dintr-o situaie de msurtoare ei au folosit analiza de
varian. Scorul adevrat i lrgete nelesul pentru c ia n calcul toate observaiile posibile,
mpreun cu erorile aferente rezultate din fluctuaiile de eantionaj legate de momentele de
evaluare, de forma itemilor sau de ecuaia personal a fiecrui evaluator n parte. Din aceast
cauz generalizabilitatea este un concept mai cuprinztor dect cel de fidelitate, cci el descrie
situaia de msurare ntr-un cadru mai complex i mai apropiat de realitate. n esen aceasta
indic msura n care se poate generaliza un rezultat obinut n anumite condiii.
Noiunea de univers al scorului se cheam astfel pentru c are n vedere fidelitatea scorurilor
tr-un treg univers de condiii care alctuiesc sau definesc tot attea faete ale planului de
observaie. Iat definiia dat de Cardinet i Turneur (1985, p. 23) universului scorului:
Universul scorului unei persoane p, dat ideal, reprezint media scorurilor persoanei p calculat
pe toate observaiile admisibile. Ori observatorul utilizeaz scorul observat, sau o funcie a
scorului observat pentru a estima valoarea universului scorului. El generalizeaz astfel de la
eanion ctre populaia de ansamblu.
O paralel cu fidelitatea se impune i pentru generalizabilitate. Dac n primul caz, cu ct
corelaia dintre scorul observat i cel adevrat este mai mare, i fidelitatea este mai bun,
generalizabilitate aceasta este cu at mai mare cu c scorul observat la un subiect este mai
asemntor cu cel pe care el l-ar fi obinut n ansamblul de condiii pentru care vrem s
generalizm. Cum universul scorului nu poate fi obinut direct, ceea ce ne rmne de fcut este
eantionarea sa. Aici problema cheie este cea legat de rezolvarea unei contradicii:
generalizabilitatea este cu atat mai mare cu ct ine sub control mai multe faete ale
dispozitivului de msurare, ceea ce nseamn sporirea numrului de itemi (de teme) investigate,
al numrului de corectori i de grile de corecie, dispozitivul devenind astfel foarte costisitor. Ar
trebui gsit deci un echilibru ntre economicitatea i eficacitatea dispozitivului de msurare, ori
pentru aceasta ar trebui determinat ponderea fiecrei faete a examinrii, doar astfel putnd s le
reunim ntr-un model eficace.
78
Pentru a ine cont de multitudinea variaiilor ce se produc ntre diversele faete ale unui
dispozitiv de msurare, ca i de diversele interaciuni posibile dintre acestea, studiul
generalizabilitii are n mod expres nevoie de analiza de varian.
5.5.5. Analiza de varian i planul de optimizare
Studiul generalizabilitii permite un control crescut al surselor de eroare dintr-un dispozitiv de
msurare (sau dispozitiv observaional). Dincolo de calculul unui indice de fidelitate al unui
univers al scorului, cercettorul poate detrmina n ce condiii sau situaii dispozitivul su va
prezenta caracteristicile cele mai bune ale msurtorii. n forma iniial a teoriei
generalizabilitii Cronbach, Gleser, Nanda i Rajaratnam (1971) s-au interesat doar de
stabilitatea scorurilor subiecilor. n psihologie i pedagogie merit tot atta interes un numai
subiecii, ci i itemii testuluo, cci se poate estima stabilitatea diferitelor modaliti de prezentare
sau de evaluare a lor, ca i diferitele coninuturi ce fac obiectul testului (msurtorii) respective.
Cardinet i Tourneur (1985) au definit un procedeu de calcul care permite s se in cont n
dispozitivul de msurare respectiv att de subieci, ct i de itemii utilizai. n consecin ei au
indicat cei patru pai ai procesului, primii doi fiind o analiz de varian, faza a treia studiaz
diferenierea iar faza a patra optimizarea.
Mai jos facem o succint prezentare a acestei proceduri:
1. Plan de observaie: se procedeaz la alegerea faetelor i a numrului de niveluri ale fiecrei
faete, precizndu-se i interrelaiile dintre ele.
2. Plan de estimare: se determin care faete reprezint un ansamblu de niveluri finite i care
dintre ele sunt eantionate aleator sau exhaustiv.
3. Plan de msurare: se identific ce faete sunt legate de planul de msurare (faete ale
diferenierii) i care sunt sursele de eroare ale msurrii (faetele de instrumentaie). Cu alte
cuvinte abia acum variana calculat n faza a doua se atribuie fie varianei adevrate, fie
varianei erorii, permind calculul coeficientului de generalizabilitate i calculul marjei de
eroare aplicabil scorurilor observate.
4. Plan de optimizare: acesta permite modificarea oricruia din planurile precedente, ca i a
combinaiilor dintre ele, cu scopul de a maximiza generalizabilitatea observaiilor
(msurtorilor). Este faza n care cercettorul caut acel echilibru dintre precizia msurtorii i
ntinderea universului generalizrii: cu ct acesta este mai restrns, este mai uor de obinut
msurtori adecvate ale acestuia, fapt care este mai dificil n situaia invers.
79
6. VALIDITATEA
Spre deosebire de fidelitate, care este influenat numai de erorile de msurare nesistematice,
validitatea unui test este afectat att de erorile nesistematice, ct i de cele sistematice
(constante). Din aceast cauz, un test poate s fie fidel, fr a fi valid, dar nu poate fi valid fr
s fie fidel, afirm Aiken (1993, p. 94).
Accepiunea clasic a validitii se refer la gradul n care un test msoar ceea ce i-a propus,
ceea ce sugereaz c ar exista doar un singur tip de validitate. Actualmente este unanim acceptat
faptul c un test poate avea diferite forme de validitate, dependente de scopurile specifice care
el a fost utilizat. De aceea ni se pare de mare actualitate afirmaia Ursulei chiopu (1974, p. 156)
potrivit creia un test este bidimensional, axat pe doi factori, adic pe diagnoz i pe validarea ei,
concepui ca axele unui sistem de coordonate: n acest sistem axa X reprezint o diagnoz
cuantificabil (test comportament), axa Y reprezint criteriul de valabilitate al diagnozei.
n acest sens poate fi neleas sintagma c un test se valideaz continuu. Fcnd o
analogie cu justiia, unde opereaz prezumia de nevinovie (fr dovezi concrete, cel trimis n
instan este nevinovat), psihologul trebuie s se supun unor reguli specifice de probare, n
stabilirea faptului c un anumit test are o nsemntate special pentru un scop specific (Aiken,
op. cit., p. 133). Deci validitatea ar putea fi definit mai corect ca o extindere progresiv, pe
msur ce testul primete noi utilizri, a cunoaterii noastre n legtur cu ceea ce msoar el de
fapt.
6.1. Validitatea de faad
Este mai mult o aparen de validitate dect o form de validitate n sens strict, deoarece ea
indic ce pare a msura o prob, i nu ceea ce msoar ea efectiv. Uneori psihologii raporteaz
exact ceea ce observ, fr a interpreta sau generaliza, i atunci intervine tot validitatea de faad.
Chiar dac tehnic ea este slab definit (i de aceea uneori nici nu este analizat de muli autori),
validitatea de faad pare a avea o important funcie practic, deoarece motiveaz subiecii s
accepte mai uor un test nou, sau permite extensia utilizrii instrumentelor spre alte zone dec
cele care le-au consacrat: adesea spunem c un test are validitate de faad dac itemii lui sunt
relaionai rezonabil cu scopurile percepute ale
80
testului (Kaplan i Saccuzzo, op. cit., p. 135). Uneori acest tip de validitate poate da o mai bun
valoare de pia unui test.
6.2. Validitatea relativ la coninut
Aa cum reprezentativitatea eantionului de populaie ales permite generalizri asupra
populaieiint pe care o reprezint, itemii testului prin maniera lor de construcie i de
selecie pot acoperi tr-o mai mare sau mai mic msur domeniul sau universul trsturii sau
al aptitudinii msurate. n felul acesta rspunsurile la un eantion de itemi dintr-un test cu
validitate de coninut sunt reprezentative pentru rspunsurile pe care subiectul le-ar fi dat dac
ntreg universul trsturii ar fi fost msurat. Acest tip de validitate este decisiv n testele
educaionale i de achiziii, ridicnd probleme specifice evaluatorului. Se va genera deci o banc
sau set de itemi care s acopere bine ntregul domeniu investigat (cunotinele la un obiect colar,
gradul de elaborare a unor deprinderi, nivelul de cristalizare a unor atitudini), din care vor fi
selecionai i agregai ntr-un test doar un numr limitat de itemi, reprezentativi pentru tregul
domeniu.
Unele date de personalitate, obinute prin chestionare (de opinii, atitudini, interese, motivaii sau
valori), beneficiaz mai mult de acest tip de validitate dect celelalte. n testele de achiziii itemii
sunt creai innd cont simultan de obiectivele, finalitile procesului instructiv, dar i de
mecanismele proceselor cognitive la care se face apel n elaborarea rspunsului la itemi. Aceasta
presupune nc din start prezena experilor care vor judeca i hotr care itemi vor fi inclui n
test. De aceea putem spune c dintre formele fundamentale de validitate, cea de coninut este
singura care are o susinere mai degrab logic dect statistic.
Pentru a da validitate de coninut unui test, constructorul se angajeaz ntr-un proces de durat,
ce presupune o foarte bun cunoatere a domeniului, raionament logic, intuiie i perseveren,
cci itemii trebuie continuu revizuii. Pentru a face generalizri ntemeiate plecd de la scorurile
la test, constructorul trebuie s cunoasc bine toi factorii care ar putea afecta performana
subiecilor.
6.3. Validitatea relativ la criteriu
n acord cu aceast faet a validitii, un test este valid relativ la criteriu dac pe baza lui se pot
lua decizii corecte sau se pot face predicii/ prognoze asupra persoanelor examinate. Un test este
valid dac poate nlocui variabila criteriu n virtutea unor corelaii mari ntre test
81
i aceasta, astfel nct cunoscnd scorul la test s deducem valoarea variabilei criteriu pentru
persoana examinat. Dup maniera n care sunt colectate datele la test i cele la criteriu
distingem dou situaii, care produc dou subcategorii ale validitii relative la criteriu:
- cnd scorurile la test i la criteriu se obin simultan, este vorba de validitate concurent;
- cnd ntre obinerea scorurilor la test i cele la criteriu se interpune o perioad de timp, vorbim
de validitate predictiv.
Fiecare dintre aceste tipuri presupune strategii de validare diferite33, care vor fi detaliat analizate
n capitolul urmtor. De exemplu, un test de anxietate (Cattell) are validitate concurent dac
scorurile la testul psihologic i gsesc confirmarea, n aceeai perioad de timp, prin
diagnosticul psihiatric. Atunci cd criteriul se matureaz dup un timp (luni sau ani) i
scorurile lui nu pot fi determinate simultan cu cele la test, folosim o a doua strategie de validare,
cea predictiv. n selecia profesional, de exemplu, se va calcula coeficientul de corelaie liniar
dintre scorurile la testul aplicat iniial i msuri (exprimate prin note sau calificative) ale
performanelor obinute de aceleai persoane n activitatea sau profesia pentru care au fost
selecionate. Deoarece o funcie fundamental a testului este aceea de a face diagnoza scopul
unei prognoze (deci faptul de prezice), validitatea predictiv capt o importan special
n acest context.
ntruct msurile la test i cele la criteriu intr n corelaie, pentru a determina cu exactitate
limitele prediciei, aceasta impune ca ambele elemente corelate s satisfac standarde nalte de
fidelitate i de validitate. Cu alte cuvinte, o msur criteriu este pertinent dac este i ea fidel i
valid, fapt ce introduce problema validitii ntr-o relaie circular cu criteriul ales. Aceasta
nseamn c factorii de eroare care afecteaz criteriul vor fi controlai n aceeai manier ca i
predictorii (testele). Atunci cnd controlul lor nu d rezultatele scontate, putem spori fidelitatea
criteriului fie lund mai multe eantioane de msurtori ale acestuia (msuri mai dese), fie
adugnd noi tipuri de msuri, incluse ntr-un criteriu compozit, pentru a spori fidelitatea lui n
aceeai manier n care procedm cu un test cruia i adugm itemi suplimentari.
O caracteristic important a criteriului este absena contaminrii, adic necunoaterea
rezultatelor la test de ctre cel care evalueaz msurilecriteriu. Un psiholog va obine,
independent de diagnosticul medicului psihiatru, scorurile la testul su de anxietate,
33 Vezi capitolul urmtor.
82
deci va face o analiz oarb. Prin efectul de halo, indulgen, predicia pentru sine sau profeia
care se automplinete, rezultatele prezise pot fi produse ntr-o oarecare msur de predictorul
nsui, caz n care comparaia nu mai este valid. Havrneanu apreciaz c cele mai bune
msuricriteriu sunt cele care prezint ct mai multe avantaje practice, care sunt mai simplu de
folosit, disponibile i mai puin costisitoare (op. cit., p. 113). Dintre acestea enumerm:
- msurarea direct a produciei sau a randamentului;
- evalurile performanelor angajailor fcute de ctre efii lor sau de ctre serviciile de personal
ale treprinderilor;
- msuracriteriu poate aparine unui grup, n sensul c testul care reuete s clasifice
persoanele grupuri bine precizate, sunt valide.
Strategiile de validare predictiv cele mai utilizate calculeaz fie un indice de eficacitate, fie
scoruri de separare a categoriilor, indici de separare a grupurilor sau indicele de utilitate (vezi
Havneanu, op. cit., pp. 113-126).
Dintre factorii care afecteaz validitatea relativ la criteriu, Aiken indic diferenele de
omogenitate ale grupurilor (validitatea tinde s fie cu att mai mic cu ct grupurile sunt mai
eterogene), lungimea testului (testele mai lungi sunt mai valide) i contaminarea criteriului, de
care am vorbit deja. Creterea validitii unui test, n calitatea lui de instrument diagnostic sau
prognostic, presupune costuri ce trebuie atent evaluate, cci uneori metode mai puin costisitoare
(observaia, interviul sau inventarul biografic) pot aduce plusul de informaie necesar
atingerea scopurilor propuse.
6.4. Validitatea relativ la construct
Multe dintre testele de personalitate msoar dimensiuni ale acesteia (anxietate, depresie,
nevrotism, motivaie, introversie-extraversie), mai slab definite iniial, dar din ce n ce mai bine
circumscrise, pe msur ce teoriile n domeniu au avansat. Conceptualizrile progresive ale
acestora (dar i ale inteligenei, memoriei, creativitii etc.) au dus la apariia de constructe tot
mai evoluate.
Unele teste sunt construite plecd de la date empirice (ca MMPI sau Inventarul de
Personalitate California al lui Gough), altele se origineaz n teorii anterior elaborate oricrei
cercetri empirice (Chestionarele de personalitate Cattell sau Indicatorul Tipologic Myers-
Briggs). Validitatea relativ la construct verific, pe de o parte, dac testul se refer realmente la
constructul pe care vrea s-l msoare, i apoi dac scorurile subiecilor testai reflect corect
mrimea acestui construct la persoanele n cauz. Strategia determinrii acestui tip de validitate
impune un algoritm (vezi Albu, 1998, pp. 165-166):
83
- Descrierea amnunit a domeniului constructului respectiv (adic a tuturor atributelor ce au
legtur cu acesta i specificarea relaiilor dintre ele), printr-o reea nomologic, pe care un grup
de experi o va evalua pentru a determina nivelul la care ea acoper constructul. Apoi se
realizeaz un model al rezolvrii testului, cu mecanismele teoretice implicate, pentru a
vedea legtura acestuia cu constructul, dar i cu rspunsurile posibile la test. Este posibil s se
constate o bun reprezentare a constructului n test, dar i diverse grade de subreprezentare (mai
ales cnd sarcinile sunt prea grele sau prea uoare).
- Se analizeaz consecvena rspunsurilor la itemii testului, adic dac procesele
implicate n rezolvarea acestora acioneaz similar la toi itemii, pe parcursul ntregului test.
- Se urmrete dac structura global a scorului la test reflect structura domeniului constructului
msurat. Pentru aceasta se apeleaz la analiza factorial (de unde i numele de validare
factorial), care determin cteva variabile latente numite factori, alctuii din itemi ce dau
scoruri care coreleaz ntre ele, ce acoper variana ntregului test. Se caut semnificaia acestor
variabile, reinndu-se cele care au o mai mare legtur cu constructul, asigurdu-se o
coresponden ntre importana avut n definirea constructului respectiv i ponderea lor ca itemi
n testul final.
- Se extind generalizrile acestor prime etape, schimbnd fie populaiile examinate, fie
examinatorul sau contextele de examinare, pentru a vedea dac relaiile sesizate rmn constante.
- n final se caut stabilirea relaiilor dintre testul cercetat i alte tipuri de msurtori sau de
observaii. Testul poate avea o validitate convergent (ntre scorurile sale i alte tipuri de
teste ce msoar acelai construct exist o relaie liniar), sau discriminant (cd scorurile la
teste nu coreleaz cu teste care se tie c nu msoar constructul respectiv).
84
ALTE FEE ALE VALIDITII
Orice student la psihologie tie c meritele unui test psihologic ncep s fie judecate prin
fidelitate dar sfresc prin aprecierea validitii sale. Aceasta i datorit faptului c, timp ce
fidelitatea se judec simplu, prin sumarizarea unor coeficieni de corelaie, validitatea presupune
demersuri interpretative mai complicate i de mai lung durat. nsui conceptul de validitate
este unul evolutiv, aflat n plin dezvoltare i de aceea strnete mult mai mult controvers
dect mai stabilul i mai bine aezatul su vr, fidelitatea (Cronbach, apud Gregory, op. cit., p.
106). Acesta este motivul pentru care ceva aspecte legate de validitate, abia schiate n
capitolul anterior, sunt abordate mai pe larg n capitolul de fa.
7.1. Validitatea relativ la construct (conceptual)
Este cu siguran tipul de validitate care necesit cea mai mare cantitate de efort n vederea
validrii unui instrument psihometric. Dei se admite faptul c soarta unei tiine este dependent
de nivelul cuantificrilor sale, adic de capacitatea sa de a msura adecvat ceea ce intr n
domeniul obiectului su de studiu, i reciproca este valabil. Astfel, nu am putea spune nimic
concret despre variabile complexe ca inteligena, memoria, stilurile de evaluare sau cele
cognitive dac nu am avea i posibilitatea s le testm, adic s le supunem msurrii. Dar, pe de
alt parte, msurarea lor este departe de a fi posibil fr o cunoatere teoretic prealabil a
acestor constructe.
Raportul dintre teorie i msurare este cel mai bine surprins prin conceptul de validitate de
construct sau conceptual, care este chiar inima operaionalizrii variabilelor. A operaionaliza
nseamn de fapt a aduce un construct teoretic n situaia de putea fi surprins i evideniat prin
msurare. n cazul n care operaionalizarea unei teorii bune a fost fcut corect, printr-un
instrument corect, capabil s o surprind, atunci putem formula predicii sub forma ipotezelor ce
rezult din teoria respectiv. Dac ipotezele se verific, atunci i teoria, dar i operaionalizarea
ei sub forma instrumentului de msur respectiv sunt n regul.
Dac ipotezele nu se verific, sunt posibile dou explicaii alternative:
- instrumentul este bun, dar deoarece teoria nu se verific, aceasta trebuie schimbat;
85
- teoria este una valabil, dar instrumentul nu o operaionalizeaz corespunztor i
atunci nu putem dovedi ce ne-am propus i deci trebuie schimbat chiar instrumentul de
msur.
De exemplu, cercetrile lui Witkin i ale colaboratorilor si au evideniat mai mult
difereniere i mai mult independen de cmp pentru genul masculin. Studiile
neuropsihologice actuale despre lateralizarea emisferelor cerebrale indic de asemenea o
specializare emisferic mai accentuat pentru genul masculin, ca i un acces bicerebral la
limb pentru genul feminin, de unde superioritatea brbailor pentru sarcinile spaiale i a
femeilor pentru cele legate de limb i comunicare. Faptul c la un test spaial ca i Cuburile
Kohs, de exemplu, bieii obin performane superioare comparativ cu fetele, n timp ce
acestea au performane superioare la un test de inteligen verbal, este consistent cu teoriile
anterior menionate.
n alte situaii se ateapt ca itemii unui test s se organizeze ntr-o ordine progresiv,
ceea ce ar corespunde unei structuri ierarhice, rezultat din chiar dezvoltarea funciei sau
abilitii respective. De exemplu, dac vom operaionaliza teoria psihogenetic piagetian
tr-o scal de itemi, aceasta va fi una ierarhic, pentru c orice stadiu l nglobeaz pe cel
precedent, facdu-l posibil pe cel care urmeaz. Validitatea conceptual va fi serios pus la
ndoial n cazul n care un subiect paseaz itemii pentru stadiul operaiilor formale i nu-i
trece pe cei din stadiul operaiilor concrete, fapt care ar contrazice chiar ideea de dezvoltare
stadial i ierarhic. n mod sporadic s-ar putea ntmpla s existe i itemi de acest fel, care
vor constitui ns erori.
Se poate deci afirma c rezultatele la acest tip de test sunt reproductibile, adic
pornind de la scorul total la test putem s prezicem care itemi vor fi pasai i care vor fi
euai. Pentru aceasta ns trebuie s tim ordinea de dificultate a itemilor, iar aceast ordine
s fie aceeai la toi subiecii. Cazurile (ct mai puine!) n care ierarhia itemilor este nclcat
produc erori de reproductibilitate, cci ele limiteaz posibilitatea prediciei corecte a itemilor
care vor fi pasai i al celor ce vor fi euai. Guttman (1950) a propus ca rezultatele la un test
s fie considerate ierarhice atunci cnd mai puin de 10% din rezultate nu sunt reproductibile
i a propus o formul de calculul al unui coeficient de reproductibilitate:
CR =
j p
e
N N
N
1
care CR = coeficientul de reproductibilitate;
86
Ne = numrul erorilor de reproductibilitate (numrul de itemi care ncalc ierarhia, adic
furnizeaz rezultate n dezacord cu scorul total obinut i cu ordinea de dificultate a ansamblului
itemilor);
Nj = numrul de itemi;
Np = numrul de persoane (subieci).
Aceasta poate fi considerat o bun metod de validitate conceptual pentru probele piagetiene,
condiia recomandat de Guttman fiind un CR de peste 0,90, deoarece peste aceast valoare
invariana ordinii de reuit se consider a fi bine demonstrat.
Alte metode de demonstare a validitii conceptuale o constituie metoda corelaiilor simple,
metoda multitrstur-multimetod i studiul trsturilor latente.
7.1.1. Metodele corelaionale simple
Acestea permit evidenierea faptului dac un test msoar acelai lucru cu un alt test despre care
se tie deja c este o msur valid a constructului respectiv. Acest tip de validitate se numete
validitate convergent. Cnd ns testul respectiv este pus n corelaie cu un alt test care
msoar o aptitudine complet diferit, aceast corelaie trebuie s fie foarte mic i atunci vom
pune n eviden validitatea divergent (sau discriminant). De exemplu, este cu totul de
ateptat ca un test de inteligen s coreleze puternic cu randamentul colar la 12 ani, aa cum
menioneaz i literatura de specialitate, cci cele dou variabile sunt nvecinate. Cnd ns testul
nostru coreleaz puternic cu motivaia, cu locus of control sau cu alte variabile ndeprtate apar
mari suspiciuni n legtur cu ce msoar de fapt acest test.
7.1.2. Matricile multitrstur-multimetod34
Procedeul descris aici a fost inventat nc din 1959 de Campbell i Fiske, el fiind n acelai timp
i o metodologie important pentru nelegerea procesului de validare. Acesta este un design ce
ia simultan n considerare validitatea convergent i pe cea divergent (discriminant). Se
cheam multidimensional pentru c ia n evaluare dou sau mai multe trasturi, prin dou sau
mai multe metode.
n exemplul dat de Gregory n figura de mai jos, trei trsturi A, B i C (Interesele, Creativitatea
i Dominana) sunt msurate cu metodele 1, 2 i 3 (inventar autoaplicat, evaluarea covrstnicilor
i un test proiectiv). Deoarece fiecare dintre cele 3 trsturi sunt msurate prin toate cele 3
metode, rezult de fapt 9 teste, exprimate prin coeficienii de
34 Multitrait-Multimethod Matrix n limba englez.
87
corelaie din triunghiurile cu linie continu de pe diagonala mare. Cnd fiecare dintre aceste teste
este administrat a doua oar aceluiai grup de subieci i scorurile fiecrei perechi de teste
rezultate prin test-retest sunt corelate, rezult matricea multitrstur-multimetod care devine o
surs extrem de bogat de informaii, att pentru fidelitate, ct i pentru validitatea convergent
i divergent.
Metoda
Trsturile
Metoda 1 Metoda 2 Metoda 3
A1 B1 C1 A2 B2 C2 A3 B3 .C3
Metoda 1
Metoda 2
Metoda 3
A1
B1
C1
A2
B2
C2
A3
B3
C3
(.89)
.51 (.89)
.38 .37 (.76)
.57 .22 .09 (.93)
.22 .57 .10 .68 (.94)
.11 .11 .46 .59 .58 (.84)
.56 .22 .11 .67 .42 .33 (.94)
.23 .58 .12 .43 .66 .34 .67 (.92)
.11 .11 .45 .34 .32 .58 .58 .60 (.85)
Not: - literele A, B i C se refer la trsturi iar cifrele 1, 2, i 3 subscrise se refer la metode.
- matricile const din coeficieni de corelaie.
Surs: Gregory, R.J. (1996). Psychological Testing. History, Principles, and Applications. Boston,
London, Toronto, Sidney, Tokio, Singapore: Allyn and Bacon, p. 122.
Figura 7.1. Modul de raportare a validitii prin Matricea multimetod-multitrstur.
Orientarea tabelul de mai sus se face astfel:
- coeficienii dintre paranteze de pe diagonala mare sunt coeficienii de fidelitate pentru fiecare
test n parte: cu ct este mai mare, cu att fidelitatea este mai bun, dei n realitate ne mulumim
cu r cuprini ntre 0,80 i 0,90;
- coeficienii boldai de pe cele trei diagonale mici reprezint dovezi ale validitii convergente:
aceeai trstur fiind msurat prin diferite metode, corelaia trebuie s fie una pozitiv i
puternic;
- n triunghiurile cu linie continu sunt incluse corelaiile dintre diferitele trsturi msurate cu
aceeai metod: acestea trebuie s aib valori medii sau ridicate;
- cele 6 triunghiuri din linii punctate includ corelaiile dintre diferitele trsturi msurate cu
diferite metode; acestea trebuind s fie ct mai mici n fiecare triunghi, deoarece ele sunt dovezi
importante despre validitatea discriminant (divergent).
88
Aceast metodologie este o contribuie important la nelegerea procesului de validare, dar
reclam un efort de cercetare uria. De aceea cei mai muli creatori de teste prefer s culeag
informaii separate, pe buci despre fidelitate i validitate, pe care s le reuneasc ulterior ntr-
un tabel compozit, dect o matrice care s le integreze din capul locului pe toate deodat
simultan.
7.1.3. Studiul trsturilor latente
Ne ateptm ca itemii care msoar un acelai construct sau caracteristic s fie puternic corelai
ntre ei, ceea ce ar putea primi o reprezentare grafic de tip scatter, care evideniaz norul de
puncte dintre o abscis i o ordonat reprezentnd cele dou variabile intercorelate. Analiza
factorial este o tehnic special care permite s se mearg mult mai departe dect simpla
inspecie vizual a matricilor de intercorelaii sau a norului de puncte. Scopul metodei este acela
de a determina numrul minim de determinani numii factori, dar i trsturi latente,
necesari explicrii intercorelaiilor din matricile respective.
Demersul tipic al analizei factoriale const din a administra o baterie de teste ctorva sute de
subieci i apoi de a calcula intercorelaiile dintre toate perechile posibile de teste, ceea ce va
produce o matrice de intercorelaii. Deoarece fiecare test nu este o trstur independent (caz n
care intercorelaiile din matrice ar tinde spre zero) i deoarece mai multe teste msoar n diverse
grade o aceeai trstur, formnd clusteri (ciorchini), analiza factorial tinde s descopere un
numr mai mic de factori dect numrul testelor intercorelate i apoi s produc un tabel care s
indice ncrctura (saturaia) fiecrei variabile n factorul respectiv. Aceasta poate varia, ca orice
coeficient de corelaie, ntre -1,00 i +1,00. Rezultatul cel mai important al analizei factoriale
este un tabel cu factorii i saturaia fiecrei variabile n factorii respectivi, ceea ce ne ajut s
descriem structura factorial i s producem astfel dovezi despre validitatea de construct a unei
baterii de teste sau de variabile reunite.
Creatorul analizei factoriale, Charles Spearman (1907) a dezvoltat o metod capabil s pun n
eviden existena unui factor general al inteligenei, prezent n orice tip de sarcin mintal (i de
aceea numit i factor g), n combinaii diferite cu un factor specific numit s. Procedeul dezvoltat
de el, numit metoda componentelor principale, i-a permis s produc dovezi n favoarea
ipotezei sale, numit modelul bifactorial al inteligenei.
n 1928, un creator american domeniul analizei factoriale, Thurstone, a utilizat aceeai
metod ortogonal (dou axe aflate n unghi drept, adic independente ntre ele) dar cu un mic
amendament: n loc ca o ax s explice variana factorului major i cealalt variana rezidual
(variana rmas neexplicat de factorul major) el a propus rotirea celor dou axe
89
ortogonale pn la obinerea structurii celei mai simple, ameliornd astfel gradul de adaptare al
datelor la structura factorial. Metoda se mai numete i Varimax deoarece ea caut ca pe fiecare
dintre cele dou axe ortogonale variana explicat s fie una maximal. Aceasta face ca fiecare
factor s explice un grup de rezultate i doar att, cci cu aceast metod nu mai poate fi
identificat factorul general, ceea ce pune n discuie modelul propus de Spearman pentru a defini
inteligena uman. Din punct de vedere matematic ambele metode sunt valide, dar fiecare are
propriile posibiliti i limite: una ajut la identificarea factorului general pe care cealalt l
neag, dar cealalt ajut la mai buna identificare, nelegere i numire a factorilor rezultai. De
aceea utilizarea lor este corelativ. Analiza factorial permite doar verificarea faptului dac
datele sunt consistente cu structura factorial postulat. Cnd datele sunt compatibile cu mai
multe structuri latente, analiza factorial nu ne poate ajuta s alegem una singur, aceast alegere
fundamentndu-se pe baza unei teorii prealabil elaborat. ntr-un demers de validare, analiza
factorial ne va aduce deci informaiile necesare, dar nu i suficiente lurii unei decizii.
Analiza factorial se sprijin pe dou postulate de baz:
- postulatul cauzalitii factoriale: variabilele observate sunt combinaii lineare de
variabile cauzale subiacente;
- postulatul parcimoniei: dintre dou soluii factoriale trebuie s o alegem pe cea mai simpl.
Dei larg acceptat de majoritatea cercettorilor, nu este posibil de demonstrat c acest postulat
este bine fundamentat i nici nu este valabil faptul c ntotdeauna structura cea mai simpl s fie
mai plauzibil dect cea mai complex.
Oricum, n funcie de tipul de analiz ales ajungem la soluii factoriale diferite, iar soluia final
pe care o alegem nu este una de natur matematic, ci de natur teoretic. n plus, analiza
factorial pune nu numai probleme de interpretere, ci i cteva importante probleme
metodologice, rezumate mai jos.
- Mrimea eantionului: cu ct eantionul pe care se face analiza factorial este mai mic, cu att
mai mult coeficienii de corelaie din matrice pierd din semnificaia statistic, soluiile factoriale
obinute trebuind examinate cu mai mult pruden. Dei nu poate fi indicat o mrime ideal,
cercettorii au czut de acord cu raportul de 5 la 1 ntre numrul subiecilor din eantion i
numrul variabilelor supuse factorizrii. Dar i acest lucru trebuie luat cu rezerv, pentru c
corelaiile mici (sub 0,30) pun n discuie nu mrimea eentionului, ci chiar necesitatea
desfurrii unei analize factoriale, dup cum corelaiile mai mari de 0,50 se pot desfura cu
rezultate bune i pe eantioane mai mici dect cele ce
90
ar rezulta din raportul 5/1. Deci, nainte de a efectua o analiz factorial, obligatoriu vom
inspecta cu atenie matricea de intercorelaii a variabilelor factorizate.
- Normalitatea multivariat: aceasta semnific faptul c toate variabilele i toate combinaiile
lor se distribuie normal. Cum nu putem testa toate combinaiile de variabile, ceea ce ne rmne
de fcut este faptul de a aprecia normalitatea fiecrei variabile n parte din coeficientul de
asimetrie i de boltire (skewness i kurtosis).
- Liniaritatea: relaia dintre variabile trebuie s fie liniar, n caz de curbiliniaritate rezultatele
analizei factoriale fiind de pus la ndoial. Liniaritatea dintre variabile se poate verifica prin
scatter-ul cu norul de puncte pentru fiecare combinaie de cte 2 variabile.
7.2. Validitatea diferenial
Validitatea unui test este determinat pe ansamblul populaiei pe care el a fost aplicat. Aceasta ar
putea s nsemne c c validitatea astfel determinat este una valabil pentru toi subiecii acestei
populaii, postulat care afost tot mai mult pus la ndoial dup anii 70. n felul acesta s-a ajuns la
concluzia c validitatea unui test poate varia nuntrul aceleiai populaii prin faptul c unii
subieci pot aprine unor subgrupuri speciale. De exeemplu, validitatea determinat pentru un test
de lectur poate fi diferit pentru stngaci, ca subpopulaie a grupului total. Validitatea pentru un
test de matematic poate fi afectat n cazul unui grup special, care obine performane sistematic
mai sczute, nu din cauza capacitii de raionament mai sczut a membrilor acestui subgrup, ci
ca urmare a faptului c acetia au o tulburare specific de citit (dislexie) i neleg cu mai mare
dificultatea enunurile itemilor testului.
Aceste constatri conduc la lrgirea cadrului conceptual al validitii nu numai la diferitele
utilizri care se dau unui test, ci i pentru diferitele subgrupuri populaionale pe care se aplic, n
raport cu care el este mai mult sau mai puin valid. Pentru acest tip de validitate termenul care s-a
ncetenit este acela de validitate diferenial iar populaiile care se abat de la regula
general se cheam c sunt biasate (distorsionate).
Studiul acestei forme de validitate este i el foarte complex i rmne ca orice alt form de
validitate un demers doar parial mplinit, adic neterminat. Pentru orice utilizare a unui test pe
un grup nou trebuie s se aduc dovezi c el nu este unul biasat. Simpla constatare a diferenei
dintre dou grupuri nu nseman neaprat c unul dintre ele este neaprat biasat. Performanele
mai slabe la un test de vocabular ar putea avea ca explicaie i oportunitile de nvare diferite
pentru cele dou grupuri.
91
Testele ce ar putea pune n eviden diferenele dintre cele dou grupuri pot avea i o utilitate
social, pentru c pot pune n micare aciuni de remediere pentru a da membrilor fiecrui grup
anse egale. Ca i validitatea n general, cea diferenial se determin tot prin trei procedee, ce au
i acelai nume: validitatea de coninut, validitatea relativ la criteriu i validitatea relativ la
construct (sau conceptual). Pentru a nu ngusta prea mult problematica validitii difereniale,
nu vom intra n detalii cu prezentarea sa.
7.3. Teoria deciziei aplicat la testele psihologice, asociat validitii
predictive
Muli psihologi susin c scopul testrii psihologice nu este msurarea n sine, ci msurarea n
serviciul lurii unei decizii optime. Astfel, managerul vrea s tie pe cine s angajeze,
examinatorul pe cine s admit iar psihiatrul pe cine s interneze. Testele psihologice joac n
mod frecvent un rol important n aceste tipuri de decizii instituionale. Dei n luarea unei decizii
adesea sunt luate n considerare mai multe puncte de separaie a grupurilor, numite i puncte de
tietur (cutoff), pentru a simplica lucrurile noi vom pleca de la exemplul unui singur test. n
realitate, scorurile la un test se dispun pe ceea ce n statistic numim amplitudinea mprtierii (R
= range). Cu toate acestea este posibil s identificm punctul care desparte jumtatea creia i se
prezice succes de cea creia i se prezice nereuit.
S presupunem de asemena c cei crora li s-a prezis succes au fost i selectai sau angajai ntr-o
oarecare proporie, ce poate varia de la 0 la 1, dup numrul de persoane considerate a fi
susceptibile s reueasc n funcie de criteriul de msur adoptat. Dac procedm foarte
reducionist, succesul poate fi mprit ntr-o variabil dihotomic predicie succes versus
predicie eec timp ce criteriul prin care se va determina succesul ulterior poate fi mprit
la rndul su n a reuit i a avut eec. Aadar, orice studiu de validitate predictiv poate
produce o matrice cu dou intrri de tipul celei de mai jos.
Predicia la test
Performana la criteriu
A avut succes
A avut eec
Va avea succes
Predicie corect
Fali pozitivi
Va avea eec
Fali negativi
Predicie corect
Figura 7.2. Rezultatele posibile ale unui test de selecie
92
utilizat pentru a preciza un criteriu-msur.
Dac un test a avut o bun validitate predictiv, atunci diagonala stnga-sus dreapta-jos se
maximizeaz: cele mai multe persoane crora li s-a prezis succes au i avut succes iar cele mai
multe persoane crora li s-a prezis eec au i euat, deci ambele predicii s-au adeverit. Dar cum
nici un test de selecie nu este un predictor perfect, sunt posibile i celelalte dou situaii: s-a
prezis succes unor persoane care au euat (falii pozitivi) ori s-a prezis eec i acesta nu a
avut loc (falii negativi). Ambele categorii de fali, pozitivi i negativi, sunt considerate n
egal msur eecuri ale prediciei, deoarece ambele au fcut predicii inacurate. Se poate astfel
calcula urmtoarea proporie:
Rata de reuit = reuite / (reuite + eecuri)
n lumea real fals-pozitivii i fals-negativii sunt evitai, dar nu pn la eliminare, pentru c
aceasta ar presupune un test care are o corelaie perfect (r = + 1,00) cu criteriul prezis. Cum
acest lucru nu este posibil, ceea ce rmne de fcut pentru a minimiza erorile de decizie este
dezvoltarea de teste cu o mare valoare predictiv.
n luarea deciziilor, adepii teoriei deciziei se sprijin pe dou asumpiuni:
- Dezvoltarea unei scale de utilitate, astfel nct indicatori importani ai instituiei s poat fi
exprimai n profituri sau pierderi. De exemplu, dac dup un chestionar de tipul EPI al lui
Eysenck, prin care se poate determina i introversia/extraversia, o companie poate identifica
pierderile asociate cu vnztorul de maini introvert, comparativ cu ctigurile aduse de
vnztorul extravert. Astfel, falii pozitivi sunt cei ce aduc pierderi instituiei (vnd mai puine
maini dect ar fi necesar pentru plata propriului salariu), ca i falii negativi (cei care, dac ar fi
fost ncadrai, ar fi contribuit la creterea profiturilor companiei). Acesta este un exemplu de
operaionalizare a testului i a seleciei pe o scal de utilitate.
- n deciziile de selecie instituional strategia cea mai satisfctoare este aceea de a maximiza
ctigul scalei de utilitate i de a minimiza pierderile. Ea trebuie s rspund la ntrebarea la
ce proporie de selecie se produce cel mai mare ctig mediu al scalei?
Tabelele Taylor-Russell, publicate prima dat de aceti autori americani n 1939, permit unui
utilizator de teste s determine proporia expectat pentru aplicanii selectai dac se specific
trei elemente: 1. validitatea predictiv a testului, 2. rata (proporia) seleciilor i 3. proporia
bazal pentru aplicanii de succes.
93
Ce sunt aceste elemente?
- validitatea predictiv este determinat anterior prin studii i se exprim printr-o corelaie
de tipul rxy;
- proporia selecionailor este cea rezultat din numrul de alei supra numrul de
aplicani, nmulit cu 100;
- rata de baz este proporia celor ce ar fi fost selecionai prin metodele curente, fr
beneficiul adus de noul test. Cum acest lucru este mai greu de determinat, la extrem se folosete
pentru rata de baz proporia aplicanilor de succes, dac ei ar fi fost alei aleator.
Cunoaterea celor trei factori de mai sus face posibil utilizarea unor tabele special construite
prin care se determin cu ct mbuntete noul test selecia, comparativ cu metoda anterioar.
Pe lng faptul c leag testul psihologic de aspecte economice foarte pragmatice, determinnd
efectiv valoarea practic a unui test, tabelele Taylor-Russell evideniaz i aspecte care intrig,
cum ar fi creteri substaniale ale acurateei seleciei, chiar i la validiti foarte mici, n anumite
condiii.
7.4. Precauii legate de evaluarea coeficienilor de validitate predictiv
Standards for Educational and Psychological Testing din SUA atrag atenia asupra ctorva
probleme importante i precauii legate de interpretarea coeficienilor de validitate:
- Cercetai schimbrile aprute n sensul cauzalitii test-criteriu: de regul
presupunem implicit c relaia dintre test i criteriu este nc n funciune atunci cnd aplicm noi
testul. De exemplu, testul s-a dovedit util selecia de supraveghetori femini, ceea ce s-a soldat
cu succes tr-o prim faz, cnd grupul era demixtat (numai femei), dar nu ia n consideraie
situaia actual n care grupul de munc este unul mixt.
- Ce nseman criteriul ales? Coeficientul de validitate contra criteriului obinut poate s
nu nsemne nimic dac criteriul nu este el nsui fidel i valid. A corela un test cu un altul despre
care nu tim prea multe lucruri sub aspectul validitii nu ne ajut prea mult n determinarea
validitii convergente a primului test.
- Luai ntotdeauna n consideraie populaia pe care s-a obinut o anume validitate: o
validitate ridicat pe o populaie de albi se pstreaz ea oare i pe o populaie de negri?
94
- Asigurai-v c mrimea eantionului populaional este suficient i adecvat: cu
c este
mai mare grupul iniial pe care s-a studiat validitatea, cu att mai bun este validitatea
ncruciat.
- Niciodat s nu confundai criteriul cu predictorul.
- Verificai spectrul de valabilitate att pentru predictor, ct i pentru criteriu: deoarece
corelaia depinde de mrimea variabilitii, ea este subestimat sever atunci cnd
predictorul sau criteriul au un spectru de variabilitate foarte gust.
- Generalizai cu pruden o validitate gsit: cu alte cuvinte trebuie demonstrat c
validitatea descoperit ntr-un studiu nu este dependent de situaie.
- Luai n calcul i validitatea diferenial: relaiile descoperite pentru o populaie
demografic s-ar putea s nu fie deloc aceleai pentru toate subgrupurile care o compun.
7.5. Interpretarea coeficienilor de validitate
Pentru c strategiile de validare a unui test sunt att de diverse, nu exist o interpretare
uniform a acestora. n practic ntlnim destul de rar coeficieni mai mari de 0,60, cei mai
muli (considerai satisfctori sau chiar mari) oscilnd ntre 0,30 0,40.
Un coeficient de validitate este semnificativ statistic cnd ansele de a-l obine din
ntmplare sunt sub 5 procente. Pentru a fi mai specifici, vom arta c ptratul unui coeficient
de validitate (coeficientul de determinare) indic procentajul din variabilitatea criteriului pe
care ateptm s o tim n avans prin cunoaterea scorurilor la test. La o corelaie de 0,60
dintre o baterie de teste i media colar anual, vom ti c 2 0,60 = 0,36, adic 36% din
variabilitatea mediei colare depinde de inteligen, aa cum am msurat-o cu bateria noastr,
restul depinznd de alte cauze, printre care i de factorii de eroare.
Uneori o validitate de 0,30 ar putea seamna economii de milioane de dolari
orientarea i selecia profesional, alteori o validitate de 0,40 poate fi nesatisfctoare. Chiar
dac Ursula chiopu (1974) apreciaz c o validitate de peste 0,25 face ca testul s dea
predicii superioare oricrei sondri empirice, asociaiile profesionale ale psihologilor din
America au dat 1985, prin Standards for Educational and Psychological Testing o list de
probleme ce pot aprea n interpretarea coeficienilor de validitate. Redm cteva din ele:
- Validitatea nu se msoar, ci se deduce. Dei autorul testului trebuie s dea mai muli
coeficieni de validitate, indicnd procedura urmat, utilizarea lui pe alte grupuri, sau n
alte scopuri, necesit studii de validare suplimentare. Aceasta deoarece validitatea testului
95
depinde simultan de scopul testrii i de populaia creia i se administreaz. Toate aceste
determinri ale validitii care vin din studii ulterioare, desfurate n scopuri specifice i pe alte
eantioane de populaie, vor fi considerate doar dovezi ale unui anumit tip de validitate.
- Studierea validitii testelor angajeaz metode elaborate de analiz (analiza de itemi,
calculul corelaiei, analiza factorial, regresia simpl i multipl) care combinate, dau strategii de
validare mai bine definite. Utilizarea lor se face n funcie de scopul i de exigenele
beneficiarului.
- Strategiile de validare se aplic odat cu construirea testului i se repet de
cte ori este nevoie pentru a obine un test bun ca lungime, mod de aplicare, for
discriminativ, uurin n administrare, cotare i interpretare, care alturi de fidelitate i
validitate, dau o imagine mai adecvat despre valoarea sa.
Utilizarea testului impune procesul repetrii periodice a cercetrii validitii, ntruct
validarea unui test nu se cheie niciodat, datele nou acumulate din diverse domenii conducnd
la ameliorarea i rafinarea sa, dar nu i la o soluie definitiv. Cu att mai mult se pune problema
relurii studiului validitii unui test cnd i se schimb formatul (prin aplicarea pe calculator, de
exemplu), coninutul, instructajul sau modul de cotare.__