Documente Academic
Documente Profesional
Documente Cultură
TIINELE SOCIO-UMANE
Analiza asocierilor i a diferenelor statistice
Cristian Opariuc-Dan
Cristian Opariuc-Dan
Cuprins
Cuprins ............................................................................................................. 4
Prefa .............................................................................................................. 7
Cuvntul autorului ......................................................................................... 11
I.
I.1.1
I.1.2
I.1.3
I.1.4
Coeficientul de asociere (phi), coeficientul V Cramer i
coeficientul de contingen (cc), derivai din 2 .................................... 42
I.1.5
I.1.6
I.1.7
I.1.8
I.1.9
I.2
I.2.1
I.2.2
I.2.3
I.3
I.3.1
I.3.2
I.3.3
I.4
Cristian Opariuc-Dan
I.4.1
I.4.2
I.4.3
I.5
II.
I.5.1
I.5.2
I.5.3
II.1.1
II.1.2
II.2
II.2.1
II.2.2
II.2.3
II.3
II.3.1
II.3.2
II.3.3
II.4
II.4.1
II.4.2
II.5
II.5.1
II.6
II.6.1
II.6.2
II.6.3
III.
III.1
III.1.1
III.1.2
III.1.3
III.1.4
III.1.5
III.1.6
III.2
III.2.1
III.2.2
III.2.3
III.2.4
III.2.5
III.2.6
Cristian Opariuc-Dan
Prefa
Cartea domnului Cristian Opariuc-Dan, intitulat Statistic aplicat
n tiinele socio-umane. Analiza asocierilor i diferenelor statistice este o
continuare fireasc a primului volum aprut, nu cu mult timp n urm, la editura ASCR din Cluj-Napoca. Continuarea realizat n lucrarea de fa este
semnului unei perseverene ludabile, dovad a pasiunii domniei sale fa de
coninutul acestei onorabile discipline. Continuitatea se manifest i n partea
stilului nvalnic, care parc vrea s spun totul dintr-o suflare, care vrea s
epuizeze ultimele rezerve fa de disciplina statisticii din sufletul cititorului
dornic de iniiere. Ca atare, exemplele sunt foarte numeroase i ct se poate
de adecvate.
Nu sunt aa de ndeprtate vremurile n care cunotinele statistice
erau o raritate n arealul specialitilor din domeniul tiinelor socio-umane. n
rndul psihologilor, acestea erau pstrate i rspndite de o elit intelectual,
din care amintim numele lui Nicolae Mrgineanu ca fiind cel mai reprezentativ. ntre 1950 i 1989, pregtirea n sfera metodelor cantitative din domeniul
psihologiei era destul de sumar, delimitat strict la prezentarea ctorva noiuni fundamentale i, mai ales, a distribuiei normale Gauss Laplace, n aspectul figurativ, nu de coninut. O bun parte dintre psihologii practicieni nu
au terminat sau aprofundat studii de psihologie, ca atare, chiar construcia
etaloanelor li se prea o tain de neptruns. Analizele multivariate preau
realiti galactice, greu accesibile pentru psihologul practician care nu avea o
ambian profesional de pregtire continu. ncercarea de lichidare a psihologiei din ultimii ani ai dictaturii comuniste prea s extind ignorana n privina metodelor tiinifice de abordare a acestui domeniu.
Dup anul de cotitur 1989, nvmntul romnesc de psihologie s-a
revigorat i a evoluat rapid, cred eu mai mult extensiv, situaie care s-a reper7
cutat i asupra domeniul statisticii aplicate. Au aprut o serie de autori competeni, cu deosebit potenial, cu stagii de pregtire n strintate, care au elaborat lucrri n domeniu comparabile cu cele din rile cu tradiie n cercetarea psihologic. Dintre aceti autori amintim pe Ilie Puiu Vasilescu, practic
un deschiztor de drumuri n domeniu, dup 1989, Florin Sava, Mihai Hohn,
Filaret Sntion, regretatul coleg Horia Pitariu, Drago Iliescu, Marian Popa,
Adrian Viceniu Labr, Monica Albu. n acest cerc select cred c a reuit s
intre i Cristian Opariuc-Dan.
Ne putem ntreba: care este motivul pentru care autorul d dovad de
pedantism n cursul lucrrii, care face coninutul comprehensibil i pentru
persoane cu o slab pregtire academic? Pentru cineva care nu lucreaz n
domeniul pe care l-a mbriat autorul crii, suprasaturarea cu explicaii
pare de neneles. Adevrul este c statistica se prezint ca o disciplin greu
asimilabil de ctre studenii de la psihologie. Venind s studieze psihologia,
o disciplin prin excelen umanist, o parte dintre ei cred c au scpat definitiv de tabelele, ecuaiile i demonstraiile din anii de liceu, dar, constat c,
chiar din primul an, rencep o disciplin matematizat pentru care nu au pasiune i nclinaii. n rile cu tradiie n studiul psihologiei au aprut articole
care explic de ce studenii au aversiune fa de statistic i tratamente matematice. Strict vorbind, statistica nu este chiar matematic, ci mai mult o colecie de metode i teorii care vizeaz modul de gestionare a ansamblurilor
de date rezultate din cercetarea i practica profesional, care implic parial
tratament matematic. n plus, s nu uitm, exist n psihologie i n varii domenii un curent de gndire anti-statistic care exagereaz n ideea inadecvrii
metodelor cantitative n abordarea unor areale ale preocuprilor academice
caracterizate de hiper-complexitate structural i suplee funcional. Un exponent al unui astfel de mod de gndire este cuprins n bestsellerul libanezului Nassim Nicholas Taleb, intitulat Lebda Neagr. Impactul foarte puin
probabilului, aprut la Curtea Veche Publishing n 2010. La pagina 265 a
acestei cri, el spune: Uitai tot ce ai auzit n facultate despre statistic sau
8
Cristian Opariuc-Dan
teoria probabilitilor. Dac nu ai urmat niciodat astfel de cursuri, e foarte
bine. Ce putem s spunem despre astfel de reacii? A constata inadecvarea
modelului gaussian, cum a fcut-o Taleb, nu i d dreptul s negi importana
unei discipline tiinifice aflat n extindere rapid n aproape toate ndeletnicirile omeneti.
Pentru psihologi, absena disciplinei Statistic din programul de pregtire universitar de baz ar nseamn lipsirea de un instrument absolut necesar de comunicare i de verificare a cercetrilor tiinifice. Contientiznd
importana predrii acestei discipline pentru viitorul cercettor sau profesionist practician, cei care au proiectat curriculumul facultilor de psihologie au
nregistrat statistica n rndul disciplinelor fundamentale, alturi de introducere n psihologie, psihologia dezvoltrii, psihologia social, fundamentele
tiinifice ale psihoterapiei, psihodiagnostic, metodele de cercetare i psihologia diferenial. O anchet efectuat n Statele Unite ale Americii n rndul
fotilor absolveni de psihologie, referitoare la importana disciplinelor tiinifice predate n facultate asupra succesului profesional, indic statistica pe
locul al treilea, dup psihologia social i psihoterapie.
Lucrarea domnului Opariuc-Dan are ca baz de pornire dificultile
ntmpinate de studeni n nelegerea statisticii. Experiena n predarea disciplinei Statistic aplicat n psihologie, m-a ajutat s detectez dou puncte
eseniale ale acestor dificulti: clara nelegere a noiunilor predate i aplicarea robotic a unor formule pentru a evidenia semnificaia rezultatelor
cercetrii. Insuficienta insistare asupra acestor dou aspecte duce la formarea
unor deprinderi procustiene, care vor avea drept consecin simplismul interpretativ. La aceiai concluzie pare s fi ajuns i autorul crii atunci cnd insist, precum Cato n senatul Romei, asupra combaterii proastelor deprinderi
n practicarea statisticii.
Imensa mainrie statistic numit SPSS este o invenie minunat, care ajut studenii, cercettorii i practicienii s scurteze la minimum timpul
9
acordat pentru realizarea unor activiti rutiniere, ns care nu poate fi utilizat fr cunoaterea suficient specificului aplicativ al unor proceduri. Nu ntmpltor, autorul insist att de mult pe corectitudinea unor aplicaii statistice i pe oportunitatea lor. n aplicarea unor tipuri de analize factoriale, realizatorii unor studii trebuie s cunoasc bine exigene referitoare dimensiunea
scalar a datelor, la liniaritatea relaiilor ntre variabile i la numrul minim
de subieci care trebuie s fie prezeni n cercetare. Dac nu suntem ateni la
astfel de aspecte, riscm s fim catalogai drept creatori de artefacte n activitatea tiinific i de folosire abuziv, incompetent a unor creaii tehnice de
excepie. Cristian Opariuc-Dan a relevat bine deficienele de nelegere ale
statisticii de ctre studeni, i ne ofer o lucrare de un impresionant efort analitic i sintetic.
10
Cristian Opariuc-Dan
Cuvntul autorului
Bine v-am regsit! Dup ce am aprofundat aspectele referitoare la
analiza unei singure variabile statistici pe care le-am numit statistici
univariate , a venit timpul s ne concentrm asupra analizei relaiilor dintre
dou sau mai multe variabile. Lucrurile nu sunt deloc complicate, n comparaie cu cele prezentate n prima lucrare. Avem i aici algoritmi clari de lucru,
i ne ajut acelai pachet binecunoscut de programe, SPSS.
De data aceasta, nu vom mai analiza n detaliu o singur variabil, ci
ne vom concentra asupra legturilor care exist ntre variabile. Vom ncerca
s aflm care este legtura dintre lungimea prului i coeficientul de inteligen, sau dac pletoii sunt, ori nu sunt, mai inteligeni n comparaie cu cei
care au prul scurt. De asemenea, vom ncerca s vedem n ce mod o variabil poate fi influenat de alte variabile; dac inteligena unui copil poate fi
apreciat n baza notelor pe care acesta le are la matematic, fizic, chimie,
limba romn ori alte discipline. Pornind tot de la relaiile dintre variabile,
vom ncerca s aflm dac din rspunsurile la ntrebrile unui chestionar putem afla un element comun, i ct de precis este acesta.
n limbaj tehnic, vom studia elemente legate de corelaii, diferene
i studiul fidelitii, toate cu referire la date parametrice i neparametrice.
Unii vor spune c analiza fidelitii prezint un grad mai ridicat de dificultate, iar aceste elemente nu trebuie tratate mpreun. S vedem dac este
chiar aa.
Nu-i voi uita pe cei care m-au ajutat s scriu acest volum i care au
contribuit, ntr-o form sau alta, la apariia crii.
i mulumesc soiei mele, Iulia-Laura, pentru rbdarea pe care a avut-o
cu mine, n lungile zile n care nu m-am desprit de computer, scriind aceste
11
Cristian Opariuc-Dan
n general, ntr-o cercetare tiinific, nu ne putem rezuma doar la studiul unei singure variabile, dei acest pas este important pentru stabilirea
normalitii distribuiei. Faptul c notele obinute de ctre candidai la un
examen de admitere la facultate sunt sau nu sunt distribuite normal, este de
mare importan, att pentru aflarea nivelului candidailor respectivi, ct i n
vederea stabilirii procedurilor ulterioare de analiz. Nu ne putem, ns, rezuma doar la acest lucru. Ne-ar interesa, poate, s aflm dac exist vreo legtur ntre aceste note i coeficientul de inteligen, s vedem dac, ntr-adevr,
cei cu medii mari la admitere au i un coeficient de inteligen ridicat, sau din
contra.
Aceasta este o problem specific, ce poate fi abordat printr-un studiu corelaional. Ca n orice studiu tiinific, ncepem de la un fapt de observaie. De exemplu, constatm n ultimii ani o reducere a calitii sistemului
de nvmnt universitar. Problema poate fi la nivelul cadrelor didactice, al
13
14
Cristian Opariuc-Dan
metode reunite sub numele de analize multivariate. Ai observat c prefer
folosirea termenului de relaie i nu a celui de corelaie. Care ar fi diferena?
ntregul concept al investigrii gradului de asociere ntre dou variabile se bazeaz pe covarian. Ce este, ns, covariana? V mai amintii de
termenul de varian folosit n prima lucrare? Am definit atunci acest element
ca fiind media abaterilor scorurilor fa de tendina central (Opariuc-Dan,
2009). Lucram atunci doar cu o singur variabil. Dac am include nc o
variabil, am spune c cele dou covariaz dac scorurile celei de-a doua se
abat n acelai sens de la medie, chiar dac magnitudinile abaterilor pot fi
altele.
+1,4
+0,4
+0,4
Var. X
-0,6
-1,6
+0,8
+0,5
+2,3
Var Y
-0,2
-0,6
Figura 1.1 Diferenele dintre scorul observat i
medie pentru dou variabile, n cazul unui singur
subiect examinat
15
16
Cristian Opariuc-Dan
(formula 1.1)
Cele dou variabile din exemplul de mai sus covariaz pozitiv (adic
dac scorul la o variabil se afl peste medie, scorul la cealalt variabil se
afl i el peste medie i invers), valoarea acestei covariaii fiind de 1,20.
Marea problem a covarianei este aceea c relaiile dintre cele dou
variabile depind de scala de msur. Dac avem dou instrumente ce msoar, fiecare, o singur variabil, unul cu 100 de itemi i unul cu 10 itemi, n
condiiile n care itemii sunt cotai la fel, modul n care se vor abate scorurile
individuale de la medie difer extrem de mult, coeficientul de covarian fiind foarte mare n comparaie cu situaia analog n care cele dou instrumente ar avea, fiecare, 10 itemi. n realitate acest coeficient nu ne spune, practic,
nimic. Avem nevoie, aadar, de o msur standardizat a covarianei, iar
aceast msur o regsim sub denumirea de corelaie.
Corelaia exprim, practic, sub form numeric, gradul de asociere
dintre variabile. Dou variabile sunt asociate, n situaia n care comportamentul uneia este legat de comportamentul celeilalte, cu alte cuvinte, dac nu
sunt independente. Dou variabile independente arat c modificarea valorilor ntr-o variabil nu are niciun efect asupra valorilor din cealalt variabil.
(Gibbons, 1993).
n teorie e simplu. n practica tiinific din domeniul socio-uman, am
artat c variabilele pot fi dificil msurate la un nivel de interval, majoritatea
lor fiind, strict vorbind, la o scal de msur ordinal. Este greu s gsim o
17
18
Cristian Opariuc-Dan
n acest sens, exist mai muli indici ai relaiilor dintre variabile, utilizabili n funcie de tipul variabilelor.
(formula 1.2)
19
d2
0
0,25
0,25
0
0,25
0,25
1
4
0
0
6
Dup calculul rangurilor, facem diferena dintre rangul primei variabile (matematic) i rangul celei de-a doua variabile (fizic). Valoarea d va fi,
aadar, d=RangMatematic RangFizic.
n urmtoarea etap, ridicm la ptrat diferena rangurilor, pentru a
elimina problemele generate de semnul diferenelor, i facem suma ptratelor
diferenelor.
Rezultatele acestor etape sunt prezentate n tabelul 1.2. Avem acum
toate datele necesare nlocuirii n formul.
20
Cristian Opariuc-Dan
Iat i coeficientul de corelaie a rangurilor, n valoare de 0,96. Am
obinut o corelaie pozitiv i puternic ntre notele obinute de ctre cei 10
elevi la matematic i fizic. Putem spune c cei care obin note mari la matematic, obin note mari i la fizic; cei cu note mici la matematic au note
mici i la fizic.
Calculul dup aceast formul poate fi efectuat numai n situaia n
care nu exist ranguri egale. Atunci cnd apar ranguri egale (cum se poate
observa i n cazul nostru), se folosete o formul uor diferit, formul de
corecie pentru ranguri egale. Aceast formul se aplic n cazul n care ambele variabile au ranguri egale, sau atunci cnd ntlnim ranguri egale doar n
situaia unei singure variabile.
)
(formula 1.3)
Mate
2
3
4
5
6
6
7
8
9
10
21
R F2
1
6,25
6,25
16
25
36
36
36
81
100
=343,5
Acest coeficient de corelaie, foarte uor de calculat, are, ns, o problem. Ai observat c cele dou variabile utilizate se situeaz la un nivel
scalar de msur. Dup unii autori (Vasilescu, 1992, apud Yule i Kendall,
1969; Lohse, Kudwig i Rohr, 1986), acest coeficient de corelaie este inadecvat pentru ranguri, deoarece presupune c datele au, toate, proprietile
necesare pentru calcularea coeficienilor parametrici. Indicatorul reduce, de
fapt, datele de la un nivel scalar la un nivel ordinal. n acest sens, mai adecvat ar fi calcularea altor coeficieni, specifici pentru rang (Vasilescu, 1992).
Totui, datorit uurinei calculrii acestui coeficient i a faptului c
poate fi folosit pentru date parametrice care nu ndeplinesc condiiile aplicrii
de teste parametrice, coeficientul Spearman are o larg utilizare. n general,
folosim acest coeficient de corelaie atunci cnd ambele variabile se afl la un
nivel de msur ordinal, cnd o variabil se afl la un nivel ordinal, iar cealalt la un nivel scalar, ori cnd ambele se afl la nivel scalar, dar cel puin una
dintre ele nu prezint o distribuie normal.
22
Cristian Opariuc-Dan
ce anse avem ca indicatorul obinut s rezulte n urma unor erori de eantionare. Putem accepta semnificaia acestui indicator i respinge ipoteza nul,
doar dac aceast ans este mai mic de 5%, cu alte cuvinte, dac ne situm
la un prag de semnificaie mai mic de 0,05.
Cea mai simpl metod de a determina semnificaia coeficientului de
corelaie a rangurilor este aceea n care putem compara valoarea acestuia cu
valoarea de referin pentru nivelul de semnificaie dorit, valoare publicat n
tabele speciale. Stabilirea modului n care au fost construite aceste tabele nu
face obiectul prezentei lucrri, deoarece calculele sunt mai complicate i s-au
realizat n decursul anilor pe eantioane de diferite dimensiuni, folosindu-se
distribuii teoretice de probabiliti. n anexa 1 am furnizat un asemenea tabel. Dac relum exemplul nostru, am obinut un coeficient de corelaie a
rangurilor de 0,96, studiind un lot de cercetare de 10 elevi. n prima coloan
avem mrimea eantionului. Dac nu gsim numrul exact de cazuri, vom lua
valoarea inferioar cea mai apropiat. n situaia noastr, avem 10 subieci,
iar rndul care ne intereseaz este al aselea rnd din acel tabel, unde avem
numrul 10 pe coloana n. Observm c pentru a fi semnificativ la un prag de
semnificaie mai mic de 0,05, coeficientul trebuie s aib cel puin valoarea
0,64. Dac dorim s fim mai riguroi, la un prag de semnificaie mai mic de
0,02, valoarea acestui coeficient trebuie s fie mai mare de 0,74 iar la un prag
mai mic de 0,01, coeficientul trebuie s depeasc valoarea 0,794. Coeficientul nostru de corelaie a rangurilor este de 0,96 i constatm c ne aflm la
un prag de semnificaie mai mic de 0,01. Putem spune c exist o legtur
puternic ntre cele dou variabile, la un prag de semnificaie mai mic de
0,01.
n condiiile n care numrul de subieci este mai mare de 10, putem
testa semnificaia coeficientului de corelaie a rangurilor Spearman i n alt
mod, folosind distribuia t, deoarece am artat faptul c acest coeficient nu
23
este altceva dect o variant ordinal a coeficientului r Bravais-Pearson, despre care vom discuta mai trziu.
(formula 1.4)
(formula 1.5)
n situaia noastr, statistica z va fi 2,88. Raportat la distribuia z, coeficientul arat o valoare puternic semnificativ a corelaiei, la un prag de
semnificaie mai mic de 0,01.
Cristian Opariuc-Dan
u variabile, n timp ce valorile apropiate de -1 indic existena unei asocieri
inverse (negative). Cu ct valorile se apropie mai mult de 1 (indiferent de
semn), cu att asocierea este mai puternic, variabilele fiind mai legate
ntre ele.
Un coeficient de corelaie cu valoarea 0 semnific lipsa oricrei legturi ntre cele dou variabile i spunem c cele dou
variabile sunt necorelate liniar ntre ele.
n practic nu gsim aproape niciodat aceste extreme (-1; 0; +1), dect n cazul n care copiem, pur i simplu, datele dintr-o variabil ntr-o alt
variabil i apoi calculm coeficientul de corelaie, ceea ce, fiind vorba ntre
noi, s-a mai vzut pe la unii studeni n lucrrile lor tiinifice. Cu ct valorile coeficientului de corelaie se apropie mai mult de zero, cu att variabilele
sunt necorelate, fr legtur ntre ele; cu ct sunt mai apropiate de 1, cu att
sunt mai asociate, mai strns legate, au elemente comune. ntre aceste dou
extreme, independen i covarian, se situeaz ntreaga filozofie i ntreaga putere a coeficienilor de corelaie.
25
26
Cristian Opariuc-Dan
bazeaz pe numrarea inversiunilor (cazul n care un element care are un
rang mai mare pentru o variabil, se situeaz n faa unui element cu un rang
mai mic, datele fiind ordonate dup cealalt variabil) i a opusului acestora,
numit i proversiuni (Vasilescu, 1992).
Ca s nelegem mai bine cum stau lucrurile, s lum un exemplu. S
presupunem c ntr-o clas au fost evaluai un numr de patru elevi la limba
romn i la chimie, obinndu-se rezultatele din tabelul 1.4. Aceste date nu
pot fi asociate unor date la un nivel scalar, fiind n mod cert date ordinale.
Dac notm calificativul nesatisfctor cu 1, satisfctor cu 2, bine cu
3, foarte bine cu 4 i excepional cu 5, putem obine expresia numeric a
acestor evaluri. V reamintesc faptul c aceste cifre nu reprezint dect nite
coduri asociate calificativelor i nu au valoare n sine. La acest nivel putem
doar ordona elevii n funcie de calificative (de la nesatisfctor la excepional) i nu putem preciza cu ct un elev este mai bun dect cellalt (vezi referinele la scale de msur din lucrarea anterioar).
Calcularea numrului de inversiuni se face prin ordonarea datelor dup prima variabil. Ordonnd datele, tabelul se prezint n felul urmtor (tabelul 1.5).
Tabelul 1.5 Ordonarea dup variabila Romn
A doua linie nu presupune inversiuni, toate comparaiile fiind n ordinea natural (att comparaia rangului 1 cu rangului 4 ct i comparaia rangului 1 cu rangului 2), lucru evident, deoarece rangul acestei linii este 1 i nu
exist nici un rang mai mic dect 1. A treia linie presupune compararea rangului 4 cu rangul 2 (liniile 3 i 4). Observm, n sfrit, o ultim inversiune
sub forma perechii 4 2.
Aadar, n irul determinat de variabila chimie, avem un numr de 3
inversiuni (perechile 3 1, 3 2 i 4 2) i un numr de 3 proversiuni (perechile 3 4, 1 4 i 1 2). Calculul coeficientului Kendall se face diferit, n
funcie de existena sau inexistena elementelor cu acelai rang. n cazul nostru, observm c nu exist elemente cu acelai rang, situaie n care putem
aplica prima formul de calcul a coeficientului Kendall:
(formula 1.6)
unde I reprezint numrul de inversiuni, iar n numrul de subieci
nlocuind n formula noastr, unde au fost 3 inversiuni i 4 subieci, obinem urmtorul coeficient de corelaie a
rangurilor:
Cristian Opariuc-Dan
pe care nu le vom discuta aici. Menionm numai ca b se folosete n cazul
variabilelor cu un numr egal de modaliti de realizare (tabele ptratice), iar
c se folosete n cazul variabilelor cu un numr inegal de modaliti de realizare (tabele rectangulare).
Dac exist elemente cu acelai rang n cazul celei de-a doua variabile, lucrurile se complic puin. Vom relua exemplul anterior pentru 5 subieci,
la aceleai discipline (tabelul 1.6).
Observm c n cazul primei variabile nu avem ranguri care se repet,
n timp ce pentru variabila chimie avem dou cazuri n care se repet calificativul foarte bine. n aceste situaii, ordonm datele dup variabila care nu are
elemente cu acelai rang n cazul nostru, dup variabila romn. tim c
dac dou sau mai multe elemente ocup aceeai poziie, rangul lor devine
media poziiilor pe care se afl. Cele dou elemente cu calificativul foarte
bine ocup poziiile 4 i 5, rangul lor fiind acelai, 4,5. Aceste elemente poart numele de ambiversiuni i reprezint un nou concept n calculul coeficientului de corelaie, alturi de inversiuni i proversiuni.
n condiiile n care nu sunt elemente cu ranguri egale, atunci putem
spune c numrul inversiunilor i cel al proversiunilor este egal cu suma primelor n-1 numere naturale. Adic
duce un alt element, numit suma lui Kendall i notat cu S. Suma lui Kendall
se definete dup formula
adic I=0, atunci s-ar obine valoarea maxim a acestei sume, astfel nct
n baza acestor sume, formula generalizat a coeficientului de corelaie a rangurilor Kendall devine:
(formula 1.7)
29
(formula 1.8)
2; 3; 5; 5; 5; 6; 7;
7; 8; 9; 10;
10; 11; 12
Poziie:
1; 2; 3; 4; 5; 6; 7;
Rang
.
Existena acestor ambiversiuni reduce att numrul maxim de legturi
ierarhice, ct i suma lui Kendall, cu valoarea inversiunilor (Vasilescu, 1992).
Astfel,
i, de asemenea,
. Cu-
noscnd acum aceste date i formula generalizat pentru coeficientul Kendall de corelaie a rangurilor, putem deduce cu uurin noua formul pentru
cazul n care una dintre variabile are elemente de acelai rang.
30
Cristian Opariuc-Dan
(
(formula 1.9)
)(
cele dou variabile, iar S- i S+ sunt sumele calculate numai din rangurile ce-
31
(formula 1.10)
)(
Pentru a nu intra n detalii teoretice inutile, s considerm c un numr de 8 elevi au obinut urmtoarele calificative la limba romn i la chimie (tabelul 1.7).
Datele din tabelul 1.7 nu sunt ordonate dup nicio variabil i putem
observa cu uurin c att calificativele la limba romn, ct i cele de la
chimie, vor conine elemente cu ranguri egale.
Pentru a calcula S+, se ordoneaz cresctor elementele dup prima variabil (romn). n cazul n care ntlnim ranguri egale ale primei variabile
(romn), elementele vor fi aranjate cresctor, n funcie de a doua variabil
(chimie). Obinem, astfel, un nou ir numit n termeni de specialitate Y+, pe
baza cruia calculm ambiversiunile Ay i inversiunile, dup care putem afla
suma S+, n mod similar sumei prezentate n capitolul anterior. Vom rearanja
tabelul de mai sus pentru a putea calcula mai uor aceste elemente.
Tabelul 1.8 Rearanjarea rangurilor n vederea calculului S+
Numr elev
7
2
1
3
8
4
6
Calificativ romn
1 NS
2S
2S
3B
3B
4 FB
4 FB
Poziie
1
2
3
4
5
6
7
Rang romn
1
2,5
2,5
4,5
4,5
6,5
6,5
Calificativ chimie
2S
1 NS
3B
3B
4 FB
2S
3B
Rang chimie
2,5
1
5
5
7,5
2,5
5
32
5
5E
8
8
4 FB
7,5
Cristian Opariuc-Dan
Suma S+ se va calcula innd cont doar de rangurile celei de-a doua
variabile, n cazul nostru, chimia. Din tabelul 1.8 observm c apare de dou
ori rangul 2,5, de trei ori rangul 5 i de 2 ori rangul 7,5. Numrul de legturi
legtur cu 3 elemente.
Perechile de inversiuni n variabila chimie vor fi (2,5 1), (5 2,5),
(5 2,5), (7,5 2,5), (7,5 5), (5 7,5), vorbind, astfel, de un numr de 6
inversiuni. Cu toate aceste elemente putem acum calcula suma S+, aplicnd
formula de mai sus i obinem valoarea 11.
(
5
5E
8
8
4 FB
7,5
Avnd valorile pentru S+ i S-, putem acum calcula suma lui Kendall
Pentru a putea calcula Smax ,va trebui s aflm doar numrul de legturi ambiverte din prima variabil (Ax), n cazul nostru limba romn. Avem
trei legturi de cte 2 elemente, 2,5 4,5 i 6,5. tim acum formula de calcul i
)(
)(
34
Cristian Opariuc-Dan
Acest coeficient de corelaie se poate utiliza n condiiile n care ambele variabile sunt ordinale sau o variabil este ordinal, iar cealalt este scalar.
35
Statistica z a coeficientului de corelaie Kendall se raporteaz la distribuia z, pe baza tabelelor de distribuie z prezentate n anexa 8.
36
Cristian Opariuc-Dan
La aceast cercetare au participat un numr de 206 persoane, 99 brbai i 107 femei. Dintre acetia, 58 sunt fumtori, iar 148 nefumtori.
Ipoteza nul de la care pleac 2 este aceea conform creia nu exist
nicio asociere ntre aceste dou variabile. Cu alte cuvinte, frecvenele de apariie ale cazurilor nu sunt diferite de situaia n care toate cele patru variante
ar avea o frecven de apariie teoretic (frecvena corespunztoare situaiei
n care cele dou variabile ar fi independente). Datorit acestui fapt, atunci
cnd lucrm cu 2, ne putem exprima n frecvene relative sau n frecvene
absolute. Ideea testului 2 este aceea a comparrii acestor frecvene observate
cu situaia n care celulele ar avea frecvenele teoretice estimate, prin frecvene teoretice estimate nelegnd frecvenele pentru cazul n care cele dou
variabile ar fi independente. Dac diferenele ntre frecvenele observate i
cele estimate (teoretice) sunt mari, atunci vorbim de un 2 semnificativ, fapt
care indic existena unei asocieri ntre cele dou variabile. Dar cum se obine practic acest lucru? Primul pas este acela al calculrii frecvenelor estimate
pentru fiecare dintre cele patru celule care ne intereseaz. Acest lucru se face
foarte simplu pe baza formulei:
(formula 1.12)
Pentru prima coloan (brbai fumtori) vom avea o frecven estimat de
n cazul n care cel puin una dintre cele dou variabile are mai
mult de dou categorii (de exemplu o variabil de tipul ocupa37
(formula 1.13)
(formula 1.14)
Noi ne aflm n cea de-a doua situaie, astfel nct vom aplica, pentru
fiecare dintre cele patru celule, formula corectat i vom obine valoarea 4,2
pentru coeficientul de contingen 2.
|
|
38
Cristian Opariuc-Dan
Coeficientul de contingen 2, dup cum ai putut constata, este simplu de neles i de calculat. De aceea, voi risca s abordez, n cele ce urmeaz, o perspectiv ceva mai matematizat asupra datelor neparametrice,
deoarece un stil asemntor l putei ntlni n cele mai multe lucrri din acest
domeniu.
Tabelele de contingen (asociere) sunt intens folosite atunci cnd lucrm cu date discrete. n momentul n care reprezentm, folosind un asemenea tabel, doar dou variabile, vorbim de tabele de contingen bidimensionale, deoarece exist posibilitatea reprezentrii mai multor variabile n acelai tabel, caz n care ne vom referi la tabele de contingen multidimensionale.
n tabelul 1.11 v-am furnizat reprezentarea general a unui tabel de
contingen bidimensional. Putem observa c variabila X are un numr de i
categorii (unde, spre exemplu, i poate fi 2, n cazul variabilei sex masculin
i feminin, ori 4 n cazul culorii ochilor albastru, verde, negru, cprui), iar
variabila Y are un numr de j categorii. Prin nsumarea datelor, la nivelul
fiecrei categorii, obinem un nou tip de rubric, numit seciunea datelor
marginale. Coloana Total X, respectiv linia Total Y se refer exact la
acest tip de date.
Tabelul 1.11 Reprezentarea general a unui tabel de contingen bidimensional
Categorie 1
Categorie 2
Variabila
X
.
.
Categorie i
Total Y
Categorie 1
n11
e11
n21
e21
.
.
ni1
ei1
nY1
eY1
Variabila Y
Categorie 2
Categorie j
n12
n1j
e12
e1j
n22
n2j
e22
e2j
.
.
.
.
ni2
nij
ei2
eij
nY2
nYj
eY2
eYj
39
Total X
nX1
eX1
nX2
eX1
.
.
nXi
eX1
n
e
40
(formula 1.15)
Cristian Opariuc-Dan
Nu s-a schimbat nimic n logica aplicrii formulei. S-a schimbat doar
notaia i modul n care s-au abstractizat conceptele. Formula 1.15 este valabil doar dac cel puin una dintre variabile are mai mult de dou categorii.
Desigur, intuiesc ntrebarea care v vine n minte n acest moment.
Probabil c v gndii la ce folosete complicarea lucrurilor. Nu era suficient
o singur formul? Nu ajunge prezentarea modalitii efective de calcul? De
ce avem nevoie de formule generalizate i alte asemenea lucruri care in mai
mult de o abordare matematic? Rspunsul comport o serie de aspecte. n
primul rnd, formule de acest tip, i altele, mult mai complexe, gsii n lucrri de specialitate, comunicri tiinifice i articole. Este bine s le putei
nelege i s putei lucra cu ele. n al doilea rnd, cel mai probabil c n carier vei fi pus n situaia de a redacta un articol tiinific. Normele de acceptare i de publicare ale unor asemenea lucrri impun prezentarea formulelor
generalizate, folosindu-se notaii universale. n al treilea rnd, v dezvoltai,
pas cu pas, gndirea matematic i v familiarizai cu limbajul. Vrem nu
vrem, statistica este totui o ramur a matematicii, iar noi nu putem face abstracie de acest lucru.
Cristian Opariuc-Dan
Tabelul 1.12 Schema general de calcul a coeficientului
Variabila X
Absen X
Prezen X
Absent X
Prezent X
Prezen Y
Prezent Y
Prezent Y
Variabila Y
Prezent X
Absent X
Absen Y
Absent Y
Absent Y
Aceast formul nu este, practic, altceva dect rdcina ptrat din raportul dintre 2 i numrul de cazuri. Putem spune c
43
Total blonzi
(80+54)
(n=134)
Acest coeficient de corelaie se folosete doar ntr-un singur caz, respectiv cel n care ambele variabile sunt dihotomice. n cazul n care una dintre variabile nu mai este dihotomic, acest coeficient devine nerelevant.
Pearson, autorul acestui coeficient, a sesizat aceast dificultate n utilizarea lui; dac dimensiunea tabelului de contingen crete (dac una dintre
variabile nu mai este dihotomic), amplitudinea acestui coeficient crete i ea
(Liebetrau, 1983). Pentru a contracara acest efect, s-a propus o variant ajustat, numit ajustarea Sakoda, rezultnd coeficientul de contingen Pearson.
Coeficientul de contingen Pearson reprezint o alt variant derivat din 2, de fapt fiind vorba despre coeficientul ajustat, i se calculeaz
n baza formulei urmtoare:
(formula 1.17)
44
Cristian Opariuc-Dan
Nu intrm n detalii legate de acest coeficient, simplitatea lui excluznd orice fel de comentarii. Vom nlocui doar n formul datele utilizate n
exemplul anterior.
(formula 1.18)
dintre variabile prezint mai mult de dou categorii, fiind o versiune mai precis a coeficientului de contingen Pearson.
Coeficientul de asociere v Cramer se folosete n cazul n care cel
puin una dintre variabile are mai mult de dou modaliti de realizare i poate fi definit dup formula urmtoare:
(formula 1.19)
unde l reprezint minimum dintre numrul liniilor i numrul coloanelor, iar n numrul subiecilor.
Dac o variabil are 3 categorii i una 2 categorii, atunci l va lua valoarea 2, valoarea variabilei cu cele mai puine categorii.
Relund exemplul utilizat la analiza coeficientului ce contingen 2,
am avut fumtorii i genul biologic, variabile cu dou categorii fiecare, deci l
va avea valoarea 2. n acelai timp, numrul total a fost de 206 subieci pentru care am obinut valoarea 4,2 pentru 2. nlocuind n formul, obinem 0,14
valoarea coeficientului de asociere v Cramer.
46
Cristian Opariuc-Dan
Dac lum exemplul coeficientului de contingen, acesta are valoarea
0,14. Am artat deja c aceast valoare este semnificativ la un prag de semnificaie mai mic de 0,05 (2 avea valoarea 4,2; pragul de semnificaie la un
numr de 1 grade de libertate fiind mai mic de 0,05). Din coeficientul de contingen putem deduce faptul c asocierea dintre cele dou variabile este slab (vom vedea imediat ce nseamn acest lucru), ns semnificativ. Iat c
pe baza acestor coeficieni derivai, putem stabili acum i intensitatea contingenei.
Toi coeficienii sunt nedirecionali. Aceasta nseamn c pot lua valori cuprinse ntre 0 i 1, unde apropierea de zero indic lipsa asocierii dintre
variabile, iar valorile apropiate de 1 arat puterea asocierii acestora.
O singur observaie se mai impune la acest capitol. M vei ntreba,
desigur, cum stabilesc semnificaia pentru coeficientul , dac aplic direct
prima formul de calcul, fr s mai ajung la 2? Nu ntmpltor am dat a
doua formul. Dac tii puin matematic, vei descoperi c:
47
(
(
(formula 1.20)
unde nMi este cea mai mare frecven de pe rndul i i Max(Cj) este
frecvena cea mai mare dintre frecvenele coloanelor, iar n se refer la numrul subiecilor.
tii ce m bucur acum cel mai tare? Faptul c nu v mai speriai de
formule. Ai observat c ele devin din ce n ce mai stufoase i, totui, n realitate, aplicarea lor este foarte simpl. S lum un nou exemplu. Presupunem
c am desfurat o cercetare n cadrul creia dorim s studiem asocierea ntre
dou variabile: preferina pentru un partid politic (1 PSD; 2 PNL; 3
PDL; 4 PC i 5 PRM) i nivelul de stres al subiecilor pe o scal Likert de
la 1 la 5 (1 Foarte slab; 2 Slab; 3 Mediu; 4 Ridicat; 5 Foarte ridicat).
Suntem n situaia asocierii dintre o variabil nominal (preferina pentru
partide) i o variabil ordinal (nivelul de stres). Vom construi tabelul de
contingen pentru cele dou variabile.
48
Cristian Opariuc-Dan
Structura tabelului este clar. Dintre cei care prefer PSD, 12 persoane au un nivel de stres foarte sczut, 9 un nivel de stres sczut, 7 un nivel de
stres mediu, 4 ridicat i o persoan prezint nivelul stresului foarte ridicat.
Situaia este analog n cazul celorlalte partide.
Avem partidele afiate pe linii i nivelul de stres pe coloane. n primul
rnd, va trebui s stabilim, pentru fiecare linie, celula cu frecvena cea mai
mare. Pentru PSD, categoria cu frecvena cea mai mare este reprezentat de
nivelul de stres foarte sczut (12 persoane). Pentru PNL ntlnim categoria cu
nivelul de stres sczut (45 de persoane), pentru PDL nivelul de stres mediu
(42 de persoane), pentru PC tot nivelul de stres mediu (10 persoane), iar pentru PRM nivelul de stres sczut (5 persoane).
Tabelul 1.14 Tabelul de contingen pentru calculul coeficientului
Nivelul de stres
1
2
3
4
Foarte
Sczut
Mediu
Ridicat
sczut
1 PSD
9
7
4
12
2 PNL
8
21
6
45
3 PDL
7
19
13
Partidul
42
4 PC
8
4
7
10
5 - PRM
1
1
3
5
36
81
33
Total coloane
82
5
Foarte
ridicat
1
5
1
3
2
12
( )
( )
Am obinut acum valoarea 0,19 pentru acest coeficient, valoare pe care o vom analiza din punctul de vedere al semnificaiei.
49
50
Cristian Opariuc-Dan
valori mici de referin, de 10%, 5%, 3% sau 1%. Exprimat sub form de
proporii, valori de 0,10, 0,05, 0,03 sau 0,01 pentru ref.
Dac avem motive suficiente s credem c exist legturi ntre cele
dou variabile, atunci putem aborda soluii optimiste, n sensul c vom considera o mare parte dintre informaiile unei variabile ca fiind dependente de
informaiile din cealalt variabil. n acest sens, putem alege valori de 50%,
60%, 70% pentru ref.
Nu exist o regul de atribuire n acest sens. Personal, v recomand s
fii sceptici i s nu considerai valori mai mari de 0,10 0,15 pentru ref.
Evident, cu ct valorile lui ref se apropie cu zero, cu att legtura trebuie s
fie mai puternic pentru a fi semnificativ.
n exemplul nostru, am plecat de la presupunerea c doar 10% din nivelul de stres poate determina preferine pentru un anumit partid politic. Valoarea pentru ref va fi, aadar, 0,10 i vom analiza dac la acest nivel putem
vorbi despre o legtur semnificativ.
Urmtorul aspect din formula 1.21 se refer la variana coeficientului
. Aceast varian poate fi calculat n baza relaiei urmtoare:
(
)(
(
))
(formula 1.22)
unde nMi este cea mai mare frecven de pe rndul i, Max(Cj) cea mai
mare frecven dintre frecvenele calculate pe coloane i
este suma
tuturor frecvenelor maxime asociate coloanei cu frecvena cea mai mare, m
reprezentnd numrul de rnduri.
Aceasta este chiar complicat, nu-i aa? Oare cum o calculm? Poate
v gndii s o nvai pe de rost pentru examene. Sau poate o memorai s
impresionai prietenul ori prietena. Nu are rost. n condiii de examen, ar trebui s vi se dea formula, iar dumneavoastr s tii s o aplicai. Pentru prie51
ten ori prieten, cred c putei s impresionai i altfel. Dac vei scrie formula asta ntr-o scrisoare de amor, n mod sigur nu vei reui dect s ndeprtai
partenerul. Haidei totui s vedem ce ne cere formula i dac e att de complicat calculul. Vom relua tabelul de contingen.
Numrul total de persoane este 244. l avem, aadar, pe n. Suma celor
mai mari frecvene de pe rnduri o tim deja. Este 114 i nu reprezint altceva dect valoarea
. Cea mai mare frecven dintre frecvenele calculate pe coloane este situat n a doua coloan i are valoarea 82. Iat c avem
i rezultatul pentru
( ).
5
Foarte
ridicat
1
5
1
3
2
12
Ce trebuie s mai facem? Trebuie s calculm suma tuturor frecvenelor maxime asociate coloanei cu frecvena cea mai mare. Am stabilit deja
care este aceasta. Este a doua coloan. Care sunt frecvenele maxime din
aceast coloan? Pe primul rnd avem frecvena 9, pe al doilea rnd frecvena
45, pe al treilea rnd frecvena 19, pe al patrulea rnd frecvena 4 i pe al cincilea rnd frecvena 5. Care este frecvena cea mai mare? Evident, cea de pe
al doilea rnd, frecvena 45. Mai vedei i alte cifre de 45 acolo? Nu. Ei bine,
aceasta este i suma mult cutat. Dac aveai 45 pe rndul 2 i 45 pe rndul
4, atunci suma frecvenelor maxime ar fi fost 90 (45+45). n cazul nostru,
avem o singur frecven maxim, 45, i aceea reprezint valoarea pentru
52
Cristian Opariuc-Dan
dect prin modalitatea de calcul. Acum haidei s nlocuim i s gsim variana coeficientului .
)(
(
( )
( ))
Am gsit variana coeficientului. Nu trebuie dect s calculm statistica z dup formula de mai sus i obinem scorul z de 1,5.
53
(formula 1.23)
n care Pc reprezint numrul perechilor concordante, iar Pd numrul
perechilor discordante.
Vom considera un exemplu, astfel nct s lmurim rapid bazele acestui coeficient. S presupunem c efectum un studiu n mai multe orae, pentru a vedea dac exist o legtur ntre nivelul intelectual al primarilor i mrimea oraelor. Cele dou variabile au fost operaionalizate astfel: oraele pot
fi considerate orae mici, medii i mari n funcie de numrul de locuitori,
iar nivelul intelectual al primarilor poate fi considerat superior sau inferior.
Ambele variabile se afl la un nivel ordinal de msur i pot fi ierarhizate.
Menionez faptul c toate datele din lucrri sunt date fictive i nu au
nicio legtur cu fapte sau persoane reale. De aceea, nimeni nu are niciun
motiv s se simt lezat n vreun fel. Exemplele au fost alese astfel nct s se
refere la fapte sociale de actualitate, n vederea unei nsuiri mai bune a informaiei. Fac aceast precizare deoarece mi s-a sugerat c prin demersul
meu mi exprim preferine politice sau de alt natur. Departe de mine acest
gnd. Nu intenionez dect s redactez o lucrare pe nelesul tuturor, indiferent de specificul formrii iniiale umanist sau realist. i, ca s folosesc un
stereotip verbal, orice asemnare cu realitatea este pur ntmpltoare. Cine se
simte lezat de aceste exemple, l asigur c nu a fost intenia mea, iar concluziile care decurg sunt rezultatul unor date absolut fictive i nu au nicio legtur
cu vreo realitate politic, economic sau social.
Tabelul 1.16 Tabelul de contingen pentru calculul coeficientului
Dimensiune ora
Mic
Mediu
Mare
A
B
C
Superior
10
15
20
Intelect
primari
D
E
F
Inferior
10
5
3
54
Cristian Opariuc-Dan
Acum s revenim. Convenim s reprezentm rezultatul acestei cercetri sub forma unui nou tabel de contingen.
Avem 10 primari cu un intelect superior n oraele mici, 15 n oraele
medii i 20 n oraele mari. De asemenea, avem 10 primari cu un intelect
inferior n oraele mici, 5 n oraele medii i 3 n oraele mari. n total cercetarea a cuprins un numr de 63 de orae. Cum calculm perechile? V voi
prezenta o procedur foarte simpl, fr a mai intra n detalii matematice,
deoarece acestea implic anumite cunotine de combinatoric. n cazul nostru, perechile reprezint suma produselor nmulirii frecvenei unei celule de
la un nivel superior cu suma frecvenelor celulelor succesive de la un nivel
inferior, datele fiind ordonate ascendent pentru perechile concordante i descendent pentru perechile discordante. Aa-i c nu ai neles nimic? Iat, poate, prima situaie n care lucrurile transpar mult mai clar din formule.
Pc=A(E+F)+BF;
Pd=C(D+E)+BD
]
]
[
[
]
]
56
(formula 1.24)
Cristian Opariuc-Dan
n cadrul acestei formule, coloanele A, B, C, D reprezint proporii i
nu frecvene absolute. Coeficientul este folosit mai ales n situaiile n care se
dorete msurarea gradului de acord ntre doi evaluatori. S presupunem c
doi psihologi evalueaz un lot de subieci n vederea depistrii prezenei sau
absenei anxietii. Rezultatele pot fi sistematizate n tabelul de mai jos:
Tabelul 1.18 Tabelul de calcul a coeficientului tetrachoric
Psiholog X
Absent
Prezent
A
B
Prezent
40%
10%
Psiholog Y
C
D
Absent
20%
30%
57
n cazul n care anxietatea ar fi fost evaluat, s presupunem, pe o scal de la 1 la 5, unde 1 ar nsemna foarte puin anxios iar 5 foarte anxios, coeficientul tetrachoric nu poate fi folosit. n acest scop se utilizeaz coeficientul
polichoric, bazat pe acelai principiu. Din nefericire, algoritmul de calcul este
unul iterativ, presupune mai multe etape i are un grad ridicat de complexitate, motiv pentru care nu-l vom prezenta aici. Pachetul de programe SPSS for
Windows nu conine aceti doi coeficieni. Dac dorii s efectuai analize
bazate pe coeficienii de corelaie tetrachoric, polichoric sau poliserial (o variant a coeficientului polichoric n care se asociaz o variabil scalar i o
variabil ordinal), v recomand utilizarea pachetului LISREL i a componentei PRELIS, pachet software produs de SSI Scientific Software Internaional (http://www.ssicentral.com).
n general, analizele bazate pe aceti coeficieni intr n componena
ecuaiilor structurale i a modelelor de ecuaii structurale (SEM).
I.1.8
58
Cristian Opariuc-Dan
Nu putem lucra direct cu aceste note, fiind necesare, pentru calculul
acordului dintre evaluatori, rangurile la care se situeaz notrile fiecrui evaluator. Notele acordate de ctre fiecare evaluator vor fi transformate n ranguri i introduse ntr-un
Tabelul 1.20 Rangurile acordate celor 6 studeni de
tabel asemntor cu tabectre fiecare evaluator
lul 1.20. Nu trebuie s
Evaluator 1 Evaluator 2 Evaluator 3
uitm faptul c ne refe3,5
4
2,5
Student 1
1,5
1
4,5
Student 2
rim la evaluatori i nu la
6
6
4,5
Student 3
studeni.
5
4
2,5
Student 4
Student 5
Student 6
1,5
3,5
2
4
1
6
Despre modul n
care putem calcula rangurile nu mai discutm, subiectul fiind epuizat cu alt ocazie. n urma stabilirii rangurilor, vom obine tabelul 1.20. Se poate observa c profesorii au
acordat aceeai not mai multor studeni, fapt obinuit. Ne amintim c rangul
pe care l ocup dou scoruri identice este reprezentat de media poziiilor pe
care se afl scorurile respective.
n urmtoarea etap vom calcula suma rangurilor pentru fiecare dintre
cei ase studeni i vom ridica la ptrat fiecare sum.
Tabelul 1.21 Calculul coeficientului de concordan W Kendall
Evaluator 1 Evaluator 2 Evaluator 3 rang
SR2
3,5
4
2,5
10
100
Student 1
1,5
1
4,5
7
49
Student 2
6
6
4,5
16,5
272,25
Student 3
5
4
2,5
11,5
132,25
Student 4
1,5
2
1
4,5
20,25
Student 5
3,5
4
6
13,5
182,25
Student 6
63
SR2=756
59
(formula 1.22)
unde SR2 se refer la totalul ptratelor sumelor rangurilor, toate celelalte elemente fiind cunoscute.
De fapt, am putea scrie cel mai simplu formula coeficientului de concordan W Kendall astfel:
(formula 1.26)
60
Cristian Opariuc-Dan
61
62
Cristian Opariuc-Dan
poate fi asociat unei variabile dihotomice (este sau nu este brbat), n relaie
cu o variabil ordinal (gradele militare cu valorile 1 locotenent; 2 cpitan; 3 maior; 4 locotenent colonel; 5 colonel; 6 general). Colectm
datele de la un numr de 15 persoane din unitatea militar respectiv,
centralizndu-le ntr-un tabel.
Sex
0
1
1
1
2
1
14
15
mr
2,42
3,25
Cristian Opariuc-Dan
Nu conta c variabilele erau la nivel ordinal, uneori chiar nominal, sau c
analiza univariat scotea n eviden asimetrii evidente. Se aplica, peste tot,
coeficientul de corelaie r Bravais-Pearson. Cnd, timid i cu prietenie, am
ncercat s explic c acest coeficient se folosete numai n anumite condiii,
c exist i ali coeficieni ce pot fi utilizai, c statisticile neparametrice sunt
i ele, acolo, un capitol de studiu, am fost privit cu nencredere, cu ostilitate
chiar. Dei majoritatea crilor de statistic ncep studiul corelaiilor cu acest
coeficient, eu am preferat s nu procedez aa. Nu de alta, dar poate dac scriu
la nceput despre statistici neparametrice, vor nelege unii c i acestea au un
rol. Dac prezenta carte va ajunge n minile profesorilor i ale fotilor studeni la care m refer, sper c vor ti s se identifice perfect cu situaia. Avei
dreptate, am fost ru aici i am profitat de situaie pentru a plti o poli. V
rog s nu m judecai prea aspru, ns diletantismul nu cred c are ce cuta n
lumea tiinific i universitar. Acum, s trecem la treab.
Avnd dou variabile, X i Y, distribuite normal i, evident, aflate cel
puin la un nivel de interval, putem analiza relaia dintre ele pe baza coeficientului de corelaie r Bravais-Pearson, dup formula:
(formula 1.29)
unde x barat reprezint media scorurilor pentru variabila X, iar y barat reprezint media scorurilor pentru variabila y.
Sunt deja convins c formula nu v mai sperie deloc. Acum privii la
ea ca la un tablou de Picasso i ateptai cu mult drag exemplele concrete de
calcul. Vom prezenta, n cele ce urmeaz, cteva modaliti de calcul ale
acestui coeficient, pentru date luate ca atare sau grupate n interval, folosind
att formula de definiie (formula 1.29), ct i alte formule derivate.
S considerm c un psiholog a evaluat un numr de 10 subieci cu
dou inventare de personalitate, reinnd scorurile pentru scala anxietate i
65
Anxietate
22
12
6
21
16
15
13
10
6
14
Depresie
24
9
5
18
20
16
11
10
7
17
xanx-manx
8,5
-1,5
-7,5
7,5
2,5
1,5
-0,5
-3,5
-7,5
0,5
xdep-mdep
10,3
-4,7
-8,7
4,3
6,3
2,3
-2,7
-3,7
-6,7
3,3
(xanx-manx)( xdep-mdep)
87,55
7,05
65,25
32,25
15,75
3,45
1,35
12,95
50,25
1,65
=277,5
(xanx-manx)2
72,25
2,25
56,25
56,25
6,25
2,25
0,25
12,25
56,25
0,25
=264,5
(xdep-mdep)2
106,09
22,09
75,69
18,49
39,69
5,29
7,29
13,69
44,89
10,89
=344,1
Cristian Opariuc-Dan
rene i n final s le adunm. Numrtorul fraciei din formul va avea valoarea 277,5. Pentru numitor, va trebui s ridicm diferenele la ptrat, s facem
suma acestor ptrate pentru fiecare variabil, s nmulim aceste sume i apoi
s extragem radicalul din rezultat. Cele dou sume sunt de 264,5 pentru anxietate i 344,1 pentru depresie. Produsul lor este 91014,45 iar rdcina ptrat
din acest produs devine 301,68, valoarea numitorului. Nu avem acum dect
s calculm fracia pentru a obine coeficientul de corelaie r BravaisPearson. Prin urmare, r=277,5/301,68=0,91, un coeficient de corelaie ridicat,
care indic o relaie puternic i pozitiv ntre cele dou variabile. Dac este
sau nu semnificativ, vom vedea imediat.
Dac avem un volum mare de date, formula de definiie devine ineficient. Ne-a fost destul de dificil s lucrm cu 10 subieci, darmite cu 100
sau 1000. Pentru volume mari de date, lucrurile sunt mai simple dect credei
i se rezum la a efectua 3-4 clicuri de maus n SPSS for Windows. Dar probabil c suntei, totui, curioi s aflai cum am face pe hrtie o asemenea
corelaie. Sper c v mai aducei aminte de datele grupate n interval. Vom
relua exemplul, de data aceasta cu intervale de grupare.
Metoda se bazeaz pe aa-numita operaie de codare, fiind descris de
Ioan Radu i colaboratorii (Radu, i alii, 1993), drept pentru care o vom prelua cu adugirile noastre. Cele dou variabile vor fi grupate n intervale, fiind
prezentate simultan n tabelul de analiz.
Prima etap n operaia de codare este stabilirea mediei de lucru, valoare situat de obicei n mijlocul irului. Dac numrul de clase este par (ca
n situaia noastr), vom alege media de lucru din clasa cu frecvena cea mai
mare. n general, media de lucru o vom nota prin ml. Avnd dou variabile,
evident, vom avea dou medii de lucru: mla i mld.
67
Depresie
13-16
17-20
3
8
3
3
17
2
5
1
1
1
2
-1
0
15
31
8-11
12-15
16-19
20-23
24-27
28-31
udep
fdep
5-8
3
1
2
-3
6
9-12
2
5
10
11
13
12
-2
53
21-24
3
2
2
1
7
1
15
25-28
7
9
9
6
3
1
2
35
fdep udep
-18
-106
-15
15
70
fdepx udep2
54
212
15
15
280
-33
-128
22
-16
uanx
-2
-1
0
1
2
3
fanx
12
28
41
29
20
25
Valori de calcul
fanx uanx
-24
-28
0
29
40
75
fanxxuanx2
48
28
0
29
80
225
n=155
anx=92
dep=-54
fu2anx=410
fu2dep=576
g
-154
68
Cristian Opariuc-Dan
(formula 1.30)
unde x reprezint valoarea, ml se refer la media de lucru, iar i este
intervalul de clas
Vom avea, n mod evident, dou variabile codate: variabila anxietate
i variabila depresie. Codarea este foarte simpl. Pentru fiecare dintre variabile se acord valoarea 0 n dreptul intervalului care conine media de lucru.
Apoi, succesiv, se scade sau se adaug o unitate pentru intervalele situate
sub, respectiv peste intervalul care conine media de lucru. Intervalul care
conine media de lucru n cazul variabilei anxietate este intervalul 16-19.
Acesta va primi valoarea 0 pentru coloana u. Intervalul 12-15 primete valoarea -1 i intervalul 8-11 primete valoarea -2. Similar, intervalul 20-23 primete valoarea 1, intervalul 24-27 primete valoarea 2, iar intervalul 28-31
primete valoarea 3. Analog, se procedeaz i n cazul celeilalte variabile.
Urmtorul pas este reprezentat de calculul frecvenei absolute pentru
fiecare dintre cele dou variabile. Pentru intervalul 8-11 al variabilei anxietate, avem 2 subieci care au depresia n intervalul 9-12, 3 subieci cu depresia
n intervalul 17-20, 7 subieci cu depresia n intervalul 25-28. n total avem
12 subieci, noua valoare pentru frecvena absolut a acestui interval. Procedm similar pentru celelalte intervale ale anxietii i pentru intervalele depresiei. n final, suma frecvenelor absolute pentru variabila depresie trebuie
s fie egal cu suma frecvenelor absolute pentru variabila anxietate i reprezint, practic, numrul total de subieci. Avem, n cazul nostru, un numr de
155 de subieci evaluai cu cele dou probe (n=155).
Urmtorul pas este reprezentat de nmulirea valorii codate u cu frecvena absolut pentru fiecare dintre cele dou variabile analizate i efectuarea
sumelor acestor produse. Suma pentru anxietate va fi de 92, iar suma pentru
depresie va fi de -54.
69
Cristian Opariuc-Dan
depresie cu 20-23 anxietate genernd (-2)x11x1=-22, 13 subieci la intersecia intervalului 9-12 depresie cu 24-27 anxietate i (-2)x13x2=-52. n final, 12
subieci la intersecia intervalului 9-12 depresie cu 28-31 anxietate, calculul
fiind (-2)x12x3=-72. Valoarea g pentru aceast coloan va deveni 8+10+022-52-72=-128. Cred c ai prins deja ideea. Desigur, intervalul n care variabila codat are valoarea 0, va avea i aici tot valoarea 0. n restul intervalelor,
vom proceda ca mai sus. La sfrit, efectum suma acestor valori obinute.
Finaliznd tabelul necesar calculului coeficientului de corelaie r
Bravais-Pearson, probabil c v ntrebai acum ce formul aplicm. Iat, mai
jos, formula necesar n acest caz:
)(
(formula 1.31)
)
) (
)(
71
ceva concentrare. Iat motivul pentru care s-au inventat programele de analiz statistic.
n cazul n care dorii s calculai direct coeficientul de corelaie r
Bravais-Pearson, fr a mai calcula, n prealabil, mediile, putei aplica urmtoarea formul:
(formula 1.32)
) ][
) ]
Anxietate
22
12
6
21
16
15
13
10
6
14
135
Anx2
484
144
36
441
256
225
169
100
36
196
2087
Depresie
24
9
5
18
20
16
11
10
7
17
137
Dep2
576
81
25
324
400
256
121
100
49
289
2221
AnxDep
528
108
30
378
320
240
143
100
42
238
2127
Operaiile nu sunt
complicate deloc. Trebuie
s efectum ridicarea la
ptrat a valorilor celor dou
variabile i apoi nmulirea
valorilor celor dou variabile (nu a valorilor variabilelor ridicate la ptrat). n final, efectum suma scorurilor pentru valorile cele
dou variabile, pentru ptratul acestora, i suma produsului lor. Acestea sunt
toate datele necesare aplicrii formulei.
][
72
Cristian Opariuc-Dan
Observm c am obinut exact acelai coeficient de corelaie BravaisPearson, 0,91, cele dou formule fiind echivalente.
V lsm dumneavoastr plcerea de a alege ntre cele trei metode de
calcul propuse. Metoda a doua, dei mai complicat la prima vedere, v asigur posibilitatea calculrii acestui coeficient pentru volume mari de date.
Aceasta este situaia. Analiza statistic a datelor nu este complicat, ns presupune calcule laborioase i mult atenie. Iar dac acestea vi se par calcule
complexe, stai s vedei analiza factorial cum se prezint. Glumeam! Nu v
speriai i nu aruncai cartea din mn. Vom discuta acum despre semnificaia
acestui coeficient.
(formula 1.33)
n primul exemplu am obinut un coeficient de corelaie r BravaisPearson de 0,91 pe un lot de 10 subieci. Valoarea testului de semnificaie t
va fi de 6,198
| |
73
74
Cristian Opariuc-Dan
caie mai mic de 0,01. Aadar, coeficientul de corelaie este semnificativ la
un prag de semnificaie mai mic de 0,01.
Sigur c cea mai simpl metod este aceea de a compara valoarea coeficientului de corelaie Bravais-Pearson cu pragurile critice din tabelul special
(anexa 6). Coeficientul de corelaie -0,41 obinut n urma studiului unui eantion de 155 de subieci va fi comparat cu pragul critic pentru un numr de
155-2=153 grade de libertate. Tabelul conine valori doar pentru 100 de grade
de libertate, acesta fiind i rndul pe care-l vom lua n calcul. Pentru a fi
semnificativ la un prag de semnificaie mai mic de 0,05, coeficientul de corelaie trebuie s depeasc valoarea 0,195, iar la un prag de semnificaie mai
mic de 0,01 trebuie s depeasc valoarea 0,25. Desigur, valoarea noastr
(0,41) este mai mare dect aceste praguri critice, corelaia fiind semnificativ.
M-am tot gndit dac s m opresc aici sau s v mai prezint un element important referitor la acest coeficient de corelaie. Pn la urm am decis s v mai bombardez cu o informaie. tim deja c scopul unei cercetri
efectuate pe un eantion este acela de a extinde cunotinele dobndite la nivelul ntregii populaii. Stabilind c ntre anxietate i depresie exist un coeficient de corelaie de 0,411 i observnd c aceast corelaie este semnificativ
lucrnd pe un eantion de 155 de persoane (presupunnd c vorbim de un
eantion i nu de un lot de cercetare), am putea extinde aceast informaie la
nivelul ntregii populaii, spunnd c ntre nivelul de anxietate i cel al depresiei exist o corelaie pozitiv, semnificativ i de nivel mediu. Lund un alt
eantion de 150 sau 200 de persoane, vom obine cam aceleai rezultate, coeficientul de corelaie fiind, s spunem, de 0,51. Pe un alt eantion am obine
un coeficient de corelaie de 0,38 i aa mai departe. Ideea este aceea dac
putem gsi o msur a acestei corelaii la nivelul populaiei. Care ar fi oare
1
Nu am mai menionat c este negativ. n realitate corelaia exist, ntr-adevr, i este pozitiv. Noi am obinut o corelaie negativ, deoarece am lucrat cu date la ntmplare care nu au
rezultat din cercetri. M i mir c a rezultat o corelaie semnificativ.
75
(formula 1.35)
unde n este numrul de subieci, iar z1- reprezint valoarea distribuiei z la pragul 1- ales.
76
Cristian Opariuc-Dan
n baza acestor formule putem acum stabili modalitile de calcul ale
limitelor intervalului de ncredere:
(formula 1.36)
77
Cristian Opariuc-Dan
nc de la nceput, menionm faptul c acest coeficient de corelaie
(biserial) are un frate geamn. Este vorba despre coeficientul de corelaie
punct biserial care face exact acelai lucru, diferena dintre ele fiind una de
nuan subtil i innd de variabila dihotomic. n cazul coeficientului de
corelaie punct biserial, variabila dihotomic are o aa numit dihotomie discret, n timp ce coeficientul de corelaie biserial prezint o variabil cu o
dihotomie continu (Field, 2000). Ce nseamn acest lucru?
Relund exemplul candidailor la coala de aviaie, statutul de admis
i respins reprezint o dihotomie continu. De ce? Foarte simplu, deoarece
variabila dihotomic provine dintr-o variabil continu (media de admitere).
n definitiv, exist o continuitate n categoria admiilor i a respinilor,
acetia avnd medii diferite. Eecul unui candidat poate fi la cteva sutimi de
ultima medie de admitere sau la cteva puncte. Un alt exemplu ar fi dihotomia btrni-tineri sau dihotomia gras-slab. Toate aceste variabile, dei evident dihotomice i nominale, provin din variabile continui, de aceea se folosete termenul de dihotomie continu.
n cazul dihotomiei discrete, aceast continuitate nu mai este prezent.
Dihotomia brbat-femeie este o dihotomie discret, deoarece ntre brbai nu
se poate spune c unii sunt mai mult brbai, iar alii mai puin, unii sunt mai
brbai, iar alii mai femei (dect, eventual, din punct de vedere comportamental, ar spune unii mai mucalii). Dei transsexualul X se d femeie, ntro asemenea clasificare, strict pe criterii biologice, X este n definitiv brbat.
Alte exemple ar fi: dihotomia viu-mort, nu poi fi mai mort sau mai puin
mort, dihotomia nsrcinat-nensrcinat i lista poate continua.
Sper c ai neles aceste dou tipuri de dihotomii. n condiiile n care
avem o dihotomie continu, se folosete coeficientul de corelaie biserial, iar
pentru variabila cu o dihotomie discret, utilizm coeficientul de corelaie
punct biserial. Aceasta este diferena subtil dintre cei doi coeficieni de corelaie.
79
(formula 1.37)
80
Cristian Opariuc-Dan
Rezultat
Admis
Respins
Total
0
0
0
0
10
8
1
9
Total
43
37
80
. n reali-
tate, avem 53,7% candidai admii i 46,3% candidai respini. Adunnd procentele (53,7+46,3=100%), obinem expresia ntregului volum de subieci
studiat.
Singurul lucru care ne lipsete este ordonata punctului de separaie
(z). De fapt nici nu avem nevoie de aceast valoare, deoarece raportul
se
citete dintr-un tabel special (tabel prezentat n anexa 7), lund ca referin
valoarea p sau valoarea q. Nu conteaz dac ne raportm la proporia candidailor admii sau la proporia candidailor respini, deoarece ntotdeauna
p=1-q i q=1-p, fapt evident. De obicei se ia n considerare valoarea cea mai
mic, tabelul fiind conceput pn la o proporie de 0,500, altminteri ar fi fost
redundant.
n tabelul din anexa 7, lund ca referin q=0,463, obinem valoarea
raportului 0,6259. Urmeaz calculul mediilor pentru subiecii admii i pentru subiecii respini. Media se calculeaz nsumnd produsele obinute prin
81
Coeficientul de corelaie biserial are valoarea 0,55, lucru care ne indic posibilitatea ca testul de inteligen s prevad succesul sau eecul la examenul de admitere. Urmeaz doar s verificm semnificaia acestui coeficient
de corelaie.
n cazul unei variabile dihotomice discrete, coeficientul de corelaie
biserial devine inadecvat. Situaia impune calculul coeficientului de corelaie
punct biserial dup relaia:
(formula 1.38)
82
Cristian Opariuc-Dan
cele dou situaii, iar sigma se refer la abaterea standard a datelor variabilei continui.
Formula nu se mai bazeaz pe proporii, ci pe frecvene absolute, fiind
mai uor de calculat n comparaie cu coeficientul biserial. Vom relua exemplul anterior, considernd de data aceasta c testul de inteligen dorete s
prezic diferena, sub acest aspect, dintre brbai i femei.
Variabila dihotomic are acum o dihotomie discret, calculul coeficientului biserial nu mai are sens, prin urmare vom aplica formula coeficientului de corelaie punct biserial.
Sex
Brbai
Femei
Total
10
8
1
9
Total
43
37
80
83
(formula 1.39)
Valoarea raportului
. n acelai ta-
(formula 1.40)
se citete din
84
Cristian Opariuc-Dan
ta, avem o variabil trihotomic derivat dintr-o variabil continu (vrsta),
care mparte subiecii n subieci tineri, maturi i vrstnici.
Vrsta
Tineri
Maturi
Vrstnici
Total
0
0
0
0
0
10
5
3
1
9
Total
29
26
25
80
Abaterea standard are tot valoarea 2, media scorurilor obinute de tineri este 6,82, media scorurilor obinute de vrstnici este de 5,80, proporia
clasei tineri este de 0,362 (36,2%) iar proporia clasei vrstnice este de 0,312
(31,2%). Nu am intrat n detalii legate de calculul acestor valori, noiunile
fiind bine cunoscute.
n tabelul din anex, pentru proporia clasei tinere (0,362) gsim ra, iar pentru proporia clasei vrstnice (0,312) gsim rapor-
portul
85
(formula 1.41)
86
Cristian Opariuc-Dan
Valorile testului t vor fi verificate n tabelul din anexa 4, la pragul de
semnificaie de 0,05 i 0,01, pentru un numr de 78 grade de libertate n cazul
coeficienilor biserial i punct biserial i 52 de grade de libertate pentru coeficientul triserial.
Nu avem o valoare exact pentru 78 de grade de libertate i vom lua
valoarea imediat inferioar, cea de 60 de grade de libertate. Pentru a fi semnificativ la un prag de semnificaie mai mic de 0,05, testul t trebuie s fie mai
mare de 2,00, iar pentru a fi semnificativ la un prag de semnificaie mai mic
de 0,01, va fi mai mare de 2,66. Valorile testului t pentru coeficienii biserial
i punct biserial sunt mai mari dect aceast valoare, prin urmare corelaia
este semnificativ la un prag de semnificaie mai mic de 0,01.
Pragurile critice pentru 52 de grade de libertate le gsim, analog, la 50
de grade de libertate. Semnificaia pentru un p<0,05 este de 2,00, iar pentru
un p<0,01 este de 2,67. Valoarea testului t n cazul coeficientului de corelaie
triserial este de 1,78, valoare situat sub valoarea prag, aadar coeficientul de
corelaie triserial nu este semnificativ.
2
4
T3
5
TB
11
TOTAL
8
TD
3
1
T2
8
TA
5
TC
88
n
88
Cristian Opariuc-Dan
Un alt element este reprezentat de frecvena extremelor. Subiecii
foarte tineri cu inteligen foarte slab (T4=1 subiect), subiecii foarte tineri
cu o inteligen foarte bun (T1=7 subieci), subiecii foarte vrstnici cu o
inteligen foarte slab (T3=4 subieci) i subiecii foarte vrstnici cu o inteligen foarte bun (T2=1 subiect). Bineneles, ultimul aspect considerat are n
vedere volumul lotului de cercetare (n=88 subieci).
Toate aceste informaii rezult din tabelul de distribuie n baza unor
simple adunri. Calculul coeficientului eneahoric nu mai presupune dect
aplicarea formulei:
(
)(
(formula 1.42)
(
)(
)(
)(
)(
90
Cristian Opariuc-Dan
i grbim s publicm rezultatele, ba chiar desenm i grafic relaia gsit.
tiu c v-ai fi ateptat la un tip de grafic mai serios. Coninutul figurii
1.2, explic, de fapt, printr-un coeficient de corelaie, cantitatea de varian
din nota obinut la examen, care se poate regsi n emotivitate. Grosier vorbind2, dac am fi obinut un coeficient de corelaie de 0,342 ntre nota obinut la examen i emoiile din timpul acestuia, practic 11,6% din variana
contra-performanei de la examen se poate explica prin variana emotivitii
(zona de intersecie a celor dou figuri). Suntem, aadar, n pragul unei descoperiri epocale: 11,6% din variana notelor la examen este reprezentat, de
fapt, de variana emotivitii. n sfrit am gsit i demonstrat statistic
motivul pentru care se obin note proaste. Iat-l! Emoiile de la examen.
Cnd credeai i dumneavoastr c vei obine premiul Nobel, iat c
apare cineva i face o afirmaie: Excelent, ns ai luat n calcul relaia dintre
timpul de studiu la o disciplin
i performana la examen?.
Ce-ai mai putea spune? Nu,
Timp studiu
ns promitem c vom efectua
o alt cercetare.. Pentru c
Emoii examen
suntei oameni de cuvnt, ai i
demarat un studiu analog. De
aceast dat obinei o corelaie pozitiv ntre timpul de
Variana explicat de
timpul de studiu
studiu i nota de la examen,
coeficientul de corelaie fiind
Figura 1.4 Variana din emoiile de examen explicat
de timpul de studiu
de 0,651. Desigur c vei ilus-
91
tra acest lucru folosind un grafic asemntor celui din figura 1.3. Am rspuns, iat, la ntrebarea anterioar. Tipul de studiu explic 42,3% din variana
notei obinute la examen. Mult mai mult n comparaie cu emotivitatea. Dorind s fim i mai riguroi, putem acum asocia chiar timpul de studiu cu emoiile din timpul examenului. Desigur, surpriza nu va ntrzia s apar. Obinem un coeficient de corelaie negativ, s spunem 0,410. Iat c timpul de
studiu se regsete, i el, n procent de 16,8%, n variana emoiilor din timpul examenului. Cu ct un student aloc mai mult timp studiului unei discipline, cu att performana sa la examen va fi mai mare i emoiile din timpul
examenului mai mici. Nu prea v convine. Cnd credeai i dumneavoastr c
v vei putea justifica notele mici la examene prin emoii, iat c vi se spulber teoria.
Cu un oarecare sentiment de tristee, vei reprezenta acest lucru n figura 1.4.
Problema, totui, nu s-a rezolvat. Nu am artat dect c timpul de studiu contribuie la scderea emoiilor din timpul examenelor i la creterea notelor obinute la
examene. Dup o
Variana pur explicat
Not examen
logic
simpl,
de timpul de studiu
emoiile duc la
scderea
notei
obinute la examen, iar timpul de
Timp de studiu
studiu determin
Emoii examen
creterea acestora.
Totui, cum arVariana comun explicat de
Variana pur
tm relaia dintre
timpul de studiu i emoii
explicat de emoii
emoii i perforFigura 1.5 Variana comun explicat de timpul de studiu i emoii
mana n timpul
92
Cristian Opariuc-Dan
examenului? Lucrurile ar fi simple n condiiile n care varianele explicate de
timpul de studiu i de emoiile din timpul examenului ar fi independente. Am
artat c, totui, o parte din variana emoiilor din timpul examenului este
explicat i de timpul de studiu. Logic, aceast varian comun va influena
performana de la examene. De fapt, ne intereseaz ct din variana pur a
performanei de la examene poate fi regsit n emoiile din timpul acestora.
Rspunsul poate fi gsit intuitiv n figura 1.5. Practic, dac meninem constant timpul de studiu, putem stabili care este legtura pur dintre nota obinut la un examen i emoiile din timpul examenului. Observai deja c variana acoperit este mult mai mic, cea mai mare parte fiind explicat prin
intermediul timpului de studiu. Soluia unui asemenea design de cercetare
poate s rezulte numai n baza corelaiilor pariale.
Am prezentat acest exemplu, pe care l-am dezvoltat dup A. Fields
(Field, 2000), din dou motive. Pe de o parte, am dorit s avei o imagine
clar asupra corelaiilor pariale i s v introduc n problema complex a
corelaiilor multiple, iar pe de alt parte, s nelegei la ce poate duce un plan
de cercetare greit conceput. De cele mai multe ori, o asemenea eroare se
pltete destul de scump, cu invalidarea ntregii cercetri.
Coeficientul de corelaie parial nu este altceva dect o variant a coeficientului de corelaie r Bravais-Pearson i poate fi obinut dup formula:
(
)(
(formula 1.43)
93
Nu cred c mai rmne ceva de explicat n aceast formul. Tot calculul se rezum la aflarea unui numr de 3 coeficieni de corelaie r BravaisPearson. Modalitatea de realizare efectiv a acestui lucru a fost tratat pe larg
anterior i nu vom reveni.
Avnd datele fictive din exemplul de mai sus, s procedm la aflarea
corelaiei dintre performana la examen i emoiile din timpul examenului, n
condiiile n care inem sub control timpul alocat studiului. Prima variabil va
fi performana la examen, a doua variabil emoiile din timpul examenului,
iar variabila controlat, timpul alocat examenului. Coeficientul de corelaie
dintre performana la examen i emoiile n timpului examenului (r12) este de
0,342. Coeficientul de corelaie dintre performana la examen i timpul alocat studiului (r13) este de 0,651 iar coeficientul de corelaie dintre emoiile
din timpul examenului i timpul alocat studiului este de 0,410 (r23). Coeficientul de corelaie parial r12.3 va fi 0,109.
Iat c, meninnd sub control timpul de studiu, corelaia dintre performana la examen i emoiile din timpul examenului este una negativ, de
doar 0,109. Variana performanei la examen nu este acoperit n procent de
11,6%, cum credeam iniial, ci ntr-un procent de doar 1,18%.
Un asemenea tip de corelaie parial poart numele de corelaie parial de rang I, deoarece exist o singur variabil pe care dorim s o controlm din punctul de vedere al efectului. Putem s controlm efectul unui numr de dou variabile, caz n care vorbim despre corelaie parial de rang
II, efectul a trei variabile corelaie parial de rang III i aa mai departe.
Coeficientul de corelaie se va scrie r12.3 n cazul unei corelaii pariale de
94
Cristian Opariuc-Dan
ordin I, r12.34 pentru o corelaie parial de rang II, r12.345 pentru corelaiile
pariale de ordin III i aa mai departe.
Algoritmul de lucru este unul analog, bazat pe formula anterioar, extins pentru un ordin mai mare. Calculele pot deveni ns laborioase, de aceea
pentru corelaii pariale de ranguri mari se prefer utilizarea unui computer i
a unui program specializat.
(formula 1.45)
n primul caz avem de a face cu o corelaie semi-parial n care controlm doar efectul exercitat de a treia variabil asupra primei variabile, n
timp ce efectul exercitat asupra celei de-a doua variabile este ignorat, iar n al
doilea caz, controlm efectul exercitat de a treia variabil asupra celei de-a
doua, ignornd efectul asupra primei.
95
Pentru a fixa cunotinele, v invit s aplicai dumneavoastr cele dou formule, folosind datele din exemplul anterior, i s calculai cei doi coeficieni de corelaie semi-parial.
Se poate observa c acest coeficient de corelaie nu face dect diferena dintre perechile concordante i cele discordante, n condiiile n care se
elimin orice influen a celei de-a treia variabile. Similar datelor parametrice, i acest coeficient se rezum la calcului unui numr de coeficieni de corelaie Kendall, aa cum rezult i din formula detaliat:
96
Cristian Opariuc-Dan
(formula 1.48)
Memorie (Y)
0
1
2
3
4
4,1
4,5
5
7
8
care ne vom rezuma doar s o prezentm, fr vreun exemplu, deoarece calculul se realizeaz identic, lsndu-v dumneavoastr plcerea gsirii i rezolvrii unui exerciiu n baza acestei relaii.
(
)(
(formula 1.49)
Rang
Var. 2 > Rang Var. 3
AB
CD
AC
BD
Rang
Var. 1 > Rang Var. 3
Rang
Var. 1 < Rang Var. 3
98
Cristian Opariuc-Dan
Tabelul 1.33 Scorurile i rangurile obinute de subieci
Atenie (Z)
Inteligen (X)
Memorie (Y)
Clasa
1-1
7 -1
0 -1
3-2
15 - 3
1-2
7-6
25 - 8
2-3
A
4-3
26 - 9
3-4
B
5-4
20 - 6
4-5
B
6-5
19 - 5
4,1 - 6
8-7
22 - 7
4,5 - 7
8,5 - 8
17 - 4
5-8
8,8 - 9
10 2
7-9
9 - 10
27 - 10
8 - 10
-
Am reluat exemplul celor 10 subieci de mai sus, n acest caz incluznd, alturi de scoruri, i rangurile (cele scrise ngroat n tabelul 1.33). Modalitatea de calcul este de o simplitate uluitoare. Ne intereseaz corelaia parial ntre inteligen i memorie, n condiiile n care meninem constant
efectul ateniei. Prima variabil este inteligena iar a doua variabil este
memoria. Comparnd scorurile la probele de inteligen i memorie, pentru
primul subiect, observm c au ranguri egale, deci cazul va fi exclus din analiz. i al doilea subiect va fi exclus din analiz, deoarece rangul scorului la
proba de memorie este egal cu rangul scorului la ateniei. Pentru al treilea
subiect, rangul scorului la proba de inteligen este mai mare dect rangul
scorului la proba de ateniei (X1>X3) i rangul scorului la proba de memorie
este mai mic dect rangul scorului la proba de atenie (X2<X3), fiind inclus n
categoria A. Al patrulea subiect prezint ambele variabile memoria i inteligena la un rang mai mare dect atenia i va fi inclus n categoria B. Al
cincilea subiect este inclus tot n categoria B, n timp ce toi ceilali subieci
sunt exclui din cauza egalitii. n final, avem un singur caz n categoria A i
2 cazuri n categoria B, restul categoriilor neavnd nicio valoare.
99
Iat un caz n care obinem coeficientul de corelaie al rangurilor nedefinit. Desigur, nici coeficientul xy.z Kendall nu a indicat o corelaie parial
ntre cele dou variabile, ns chiar s nu obinem nimic? Care ar fi explicaia? Nu este greu s v dai seama c acest coeficient se bazeaz pe un numr de doar trei cazuri din zece, un volum de date extrem de mic. Poate i
acesta este un motiv pentru care popularitatea coeficientului Johnson este att
de redus. Dac volumul de date este mare iar numrul de ranguri egale relativ mic, se poate apela cu ncredere la indicatorul de mai sus.
(formula 1.51)
100
Cristian Opariuc-Dan
Raportnd valoarea testului t (- 1,09) la un numr de 103-2-2=99 grade de libertate, observm c acest coeficient de corelaie obinut nu este semnificativ (pentru a fi semnificativ la un prag de semnificaie mai mare de
0,05, testul t trebuie s depeasc valoarea 1,990). Aadar, nu exist nicio
legtur ntre performana la examen i emotivitatea din timpul examenului.
V-ai fcut iluzii degeaba.
Pentru a v veni n ajutor, am furnizat n anexa 9 tabelul pragurilor de
semnificaie pentru coeficientul de corelaie parial Kendall, n cazul n
care v este mai comod s privii un tabel dect s efectuai propriile calcule.
n privina coeficientului de corelaie parial Johnson, analiza semnificaiei se face n funcie de estimatorul 2, dup relaia urmtoare:
(formula 1.52)
n aceast situaie, semnificaia coeficientului de corelaie este dat de
semnificaia lui 2. Acest estimator poate fi folosit numai dac numrul total
de cazuri este mai mare de 40, iar frecvena minim ntr-o categorie (A, B, C
sau D) este de 10.
Cea de-a treia variabil, variabila controlat, o vei putea ntlni n literatura de specialitate i sub numele de variabil supresoare deoarece efectul controlului acesteia determin, dup cum ai vzut deja, reducerea coeficientului de corelaie bivariat ntre cele dou variabile (numit, n general, coeficient de corelaie de rang zero). Din aceleai motive rezultate n urma
faptului c a treia variabil mediaz coeficientul de corelaie de rang zero ,
aceast variabil se mai poate numi i variabil mediatoare. Totui, cel mai
frecvent, aceast variabil se numete variabil de control.
101
Cristian Opariuc-Dan
mila mai multe cunotine, n timp ce subiecii n vrst vor asimila cunotine mai puine.
Tabelul 1.34 Utilizarea coeficienilor de corelaie
Variabila Y
Nominal
Ordinal
Dihotomic
Dihotomic
- 2
-
- cc
- tetrachoric
- 2
- V Cramer
- cc
-
- polichoric
- rang biserial
Nominal
- 2
- V Cramer
- cc
-
- 2
- V Cramer
- cc
-
- 2
- V Cramer
- cc
-
Ordinal
- polichoric
- rang biserial
- 2
- V Cramer
- cc
-
- Spearman
- Kendall
-
- polichoric
- W Kendall
- 2
- V Cramer
- cc
- (grupat n
clase)
- triserial (provine
din
variabila
continu)
- Spearman
(dac lotul este
mai mic de 30
sau dac cel
puin o variabil
nu se distribuie
normal)
- Kendall
(dac cel puin
o una dintre
variabile nu se
distribuie
normal)
- (date grupate
n clase ierarhice)
- poliserial
Variabila X
Scalar
- poliserial
- biserial
- punct biserial
103
Scalar
- poliserial
- biserial
- punct biserial
- 2
- V Cramer
- cc
- (grupat n
clase)
- triserial (provine din variabila
continu)
- Spearman
(dac lotul este
mai mic de 30
sau dac cel
puin o variabil
nu se distribuie
normal)
- Kendall (dac
cel puin o una
dintre variabile
nu se distribuie
normal)
- (date grupate
n clase ierarhice)
- poliserial
- r Pearson
- eneahoric (variabile
categorizate)
Cristian Opariuc-Dan
Valorile absolute situate ntre 0,21 i 0,40 arat o corelaie slab ntre cele dou variabile;
n sfrit, coeficieni de corelaie cu valori absolute situate ntre 0,81 i 1,00 arat existena unei legturi foarte puternice ntre cele dou variabile;
Desigur, aceste repere sunt orientative. Coeficienii de corelaie depind de volumul eantionului sau a lotului de cercetare studiat, dar i de ali
factori, dup cum vom vedea n continuare. Este mult mai uor s obinem
coeficieni de corelaie ridicai atunci cnd studiem 10 persoane, n comparaie cu situaia analizei unui numr de 1000 de persoane.
Trebuie, de asemenea, s tii c, nu ntotdeauna valoarea unei cercetri este dat de respingerea ipotezei nule. Exist o tendin printre studeni,
i chiar printre anumii cercettori, de a respinge, prin orice mijloace, ipoteza
nul. Unii merg pn acolo nct afirm c dac un studiu nu respinge ipoteza
nul, i dac nu se accept una dintre ipotezele alternative, acel studiu nu are
valoare. Complet fals! Aceasta este o stereotipie a cercetrii tiinifice, ntlnit frecvent printre debutani. De multe ori, lipsa de respingere a ipotezei
nule are o valoare la fel de mare ca i respingerea acesteia. Dac, de exemplu,
se realizeaz un studiu n care se verific relaia dintre puterea mainii i riscul de accident, credei c lipsa de respingere a ipotezei nule nseamn un
studiu invalid? n nici un caz. Faptul c nu exist nicio legtur ntre puterea
mainii i riscul de accident nu reprezint o invalidare a studiului, din contra,
ofer informaii preioase. Probabil c nu maina puternic crete riscul accidentului de circulaie, ci lipsa de experien sau teribilismul oferului. Se cre105
eaz astfel premisele unei noi cercetri pe alte teme. S nu v mai fie fric,
aadar, de ne-respingerea ipotezei nule. Valoarea unui studiu tiinific nu este
dat de respingerea sau nu a ipotezei nule, ci de informaiile noi pe care le
aduce cercetarea. Am fcut aceast meniune, deoarece mi s-a ntmplat s
cunosc studeni n licen, disperai c nu obineau corelaii semnificative, i
crora profesorii coordonatori le spuneau c dac nu se obine o corelaie
semnificativ, lucrarea de licen nu este bun. Dincolo de tragi-comicul situaiei, a trebuit s petrec ceva timp lmurind persoanele n cauz c lucrurile
nu stau chiar aa.
Cristian Opariuc-Dan
ans de a alege. n cazul ultimului angajat, aceast ans nu mai exist. Care
a fi, aadar, soluia? Fie mrim numrul de premii (11), caz n care i cel deal zecelea angajat poate alege ntre dou obiecte de mbrcminte, fie renunm la al zecelea angajat i ne limitm la ultimul care a putut s fac o alegere
(al noulea, care a ales unul dintre cele dou obiecte rmase). Aceast ultim
situaie reflect exact principiul gradelor de libertate.
S nuanm puin lucrurile. Presupunem c cele 10 articole de mbrcminte sunt formate din 5 rochii i 5 costume brbteti. ntrebarea care se
pune este cte persoane pot accesa aceste articole, n condiia n care fiecare
persoan va trebui s aib o ans de a alege? Probabil c cele 5 rochii vor fi
alese de femei. Ca s poat alege, vom avea nevoie de cel mult 4 femei. Similar, cele 5 costume brbteti pot fi alese de maximum 4 brbai, ultimul
avnd posibilitatea de a alege ntre dou costume. Aadar, putem lua n calcul
maximum 8 persoane, i nu 10 cte aveam iniial.
n orice analiz multivariat, numrul total de subieci se reduce n
funcie de nivelurile unei variabile. Gradele de libertate exprim numrul de
cazuri luat n calcul pentru a obine indicatorul statistic dorit, n condiiile n
care se poate vorbi de probabiliti.
0,00 < r < 0,10 efecte reduse, explicnd pn la 1% din variana total;
0,31 < r < 0,50 efecte mari, explicnd ntre 9% i 25% din
variana total;
r > 0,51 efecte foarte mari, explicnd peste 25% din variana
total.
Ar fi destul de multe lucruri de discutat aici, inclusiv aspecte referitoare la puterea indicatorilor statistici. Nu le vom aborda acum. Acestea vor fi
tratate pe larg n capitolul dedicat statisticilor infereniale. Cunotinele dumneavoastr n domeniul planurilor de cercetare de tip corelaional sunt, deocamdat, suficiente.
108
Cristian Opariuc-Dan
109
Cea mai fericit situaie este aceea n care colectm date aflate la un
nivel scalar (sau asimilate unui nivel scalar). Dar, i n acest caz, se pun anumite probleme. n primul rnd, existena unui numr suficient de cazuri. Nu
are sens c calculm coeficientul de corelaie r Pearson sau corelaii seriale
ori pariale dac numrul de cazuri este foarte mic, n general sub 50 de scoruri. n aceast situaie, o msur mai stabil ar fi calculul coeficientului de
corelaie Spearman. n al doilea rnd, datele sunt distribuite normal? Iat un
motiv foarte serios pentru a proceda la analiza normalitii distribuiei. Dac
numrul de subieci este mare, iar datele nu se distribuie normal, nu putem
lucra cu un coeficient de corelaie bazat pe medii, cum este r Pearson. Se prefer, n acest caz, Spearman sau Kendall. Unii autori (Liebetrau, 1983)
interzic chiar utilizarea coeficientului Spearman n aceste situaii, recomandnd doar analizele bazate pe Kendall.
2. Ce tip de ipoteze au fost formulate?
Tipul ipotezei formulate are o mare importan, ndeosebi sub aspectul distinciei ntre ipotezele unilaterale i bilaterale. Stabilirea semnificaiei
unui coeficient se va face doar n strict concordan cu acest aspect. Raportarea pragului de semnificaie bilateral n condiiile unei ipoteze unilaterale i
invers, constituie o eroare. Din fericire, acest lucru poate fi uor remediat.
3. Care este motivul pentru care s-a analizat relaia dintre dou variabile?
Iat o ntrebare care, la prima vedere, s-ar putea s v surprind. Desigur, rspunsul l putei gsi studiind obiectivele i ipotezele cercetrii. Cercetarea urmrete analiza legturii (corelaiei) dintre dou variabile? Ori, poate, dorete s precizeze gradul de acord ntre mai multe persoane referitor la o
anumit problem sau la un anumit grup de subieci. Sau, de ce nu, pentru a
efectua o predicie i a stabili o relaie cauzal.
110
Cristian Opariuc-Dan
Datele nu pot fi tratate mecanic, fr referire la scopul cercetrii.
Dac se urmrete simpla legtur ntre variabile (msurtori numite i analize simetrice), se pot folosi coeficieni de corelaie cum ar fi r Pearson,
Spearman, Kendall i alii. Gradul de acord ntre mai multe persoane (analize asimetrice) se poate investiga, mai curnd, prin coeficieni de concordan. Prediciile sunt mai adecvate pentru coeficienii de asociere, cum ar fi
cei Goodman-Kruskal ori coeficientul d Somers.
4. Dorim s facem inferene pe baza datelor analizate?
Desigur! Altfel pentru ce mai cercetm ceva, dac nu pentru a extinde
cunotinele la nivelul populaiei. Doar c, acest lucru nu este chiar att de
simplu cum pare la prima vedere. Ne-ar interesa, n acest sens, s tim cum se
distribuie parametrul la nivelul populaiei. Din fericire, majoritatea parametrilor se distribuie normal la nivelul unei populaii (sau cel puin aa se presupune matematic), ns, i n acest caz, se pune problema unei corecte estimri
a varianei. Nu ne mai putem rezuma doar la analiza coeficientului i a pragului de semnificaie. Suntem obligai s furnizm intervalele de ncredere ale
estimrilor, erorile de estimare i alte date care pot da valoare i pertinen
inferenei.
Tehnic, n analiza i interpretarea corelaiilor sunt importante trei aspecte (Urdan, 2005):
Orice corelaie presupune existena unei relaii ntre cele dou variabile, fie pozitiv, fie negativ, monoton, liniar, etc.
n figura 1.6 este reprezentat diagrama
de corelaie n cazul unei corelaii pozitive
ntre variabilele X i Y. Observm liniaritatea
relaiei i traseul ascendent (pozitiv) al acesteia.
Subiecii cu scoruri mici la variabila X, au scoruri mici i la variabila Y. Pe msur ce scorurile subiecilor cresc la variabila X, cresc i la
variabila Y. Intuii deja existena unui coeficiFigura 1.7 Corelaie negativ
puternic ntre dou variabile
ent de corelaie ridicat ntre cele dou variabile,
corelaia fiind, de asemenea, semnificativ.
n figura 1.7 avei norul de puncte n cazul unei corelaii negative ntre variabilele X i Y. Asocierea dintre variabile este, de asemenea, liniar,
ns subiecii care au scoruri mici la variabila X, au scoruri mari la variabila
Y. Pe msur ce scorurile subiecilor cresc la variabila X, scad la variabila Y.
112
Cristian Opariuc-Dan
n acest caz, putem anticipa existena unui coeficient de corelaie ridicat,
semnificativ i negativ.
Analiza norului de puncte, ne permite s apreciem forma relaiei dintre dou variabile (relaia liniar, neliniar sau absena relaiei), direcia acestei relaii (ascendent sau pozitiv, ori descendent, negativ) i intensitatea
legturii dintre variabile (legtur puternic, punctele fiind apropiate de
dreapta de evoluie liniar sau legtur slab, punctele fiind mai deprtate de
aceast dreapt).
Analiza formei norului de puncte poate
releva aspecte importante, ndeosebi n situaia
n care coeficientul de corelaie are valori mici.
S nu ne grbim s afirmm c nu exist nicio
legtur ntre variabile, ci s analizm grafic
semnificaia acestei valori. S presupunem c,
Figura 1.9 Existena unui scor
ntr-un studiu, am obinut un coeficient de coreextrem
laie r Bravais-Pearson de 0,15, corelaia nefiind
semnificativ. Cei mai muli se vor grbi s afirme c nu exist nicio legtur
ntre cele dou variabile. Desigur, acest lucru poate fi valabil dac norul de
puncte arat ca n figura 1.8.
113
Acelai coeficient de corelaie se poate obine i n cazul datelor reprezentate n figura 1.9. Putem spune c nu exist nicio legtur ntre cele
dou variabile? Sigur c nu. Legtura exist, este pozitiv i puternic. Elementul care conduce la scderea valorii coeficientului de corelaie este tocmai scorul extrem, pe care l putei remarca
foarte uor. Iat c, n absena analizei grafice,
ne putem pcli. Nu ne rmne dect s eliminm acel scor extrem, i vom observa modificarea radical a coeficientului de corelaie.
Un alt element important, se refer la
constana grosimii norului de puncte. n studiile
Figura 1.10 Relaie
de tip corelaional, plecm de la presupunerea c
homoscedastic ntre variabile
norul de puncte are o grosime constant pe ntreaga distribuie. Aceast grosime constant poart numele de
homoscedasticitate, i se poate observa n figura 1.10.
ntr-o corelaie homoscedastic, un coeficient de corelaie are valori mari. Semnificaia
este aceea c, pe ntreaga amplitudine a distribuiei celor dou variabile, relaia liniar se pstreaz.
Un coeficient de corelaie mic, poate fi
obinut i pe baza unei relaii heteroscedastice,
Figura 1.11 Relaie
heteroscedastic ntre variabile
ca n figura 1.11. Acest caz ne poate induce n
eroare, ne poate face s considerm c nu exist nicio legtur ntre cele dou
variabile. n realitate, legtura exist, ns norul de puncte nu mai este omogen, ca n primul caz, ci eterogen. n figura 1.11 observm existena unei corelaii pozitive ntre cele dou variabile. Corelaia este, ns, mai puternic n
cazul scorurilor mici, i mai slab sau inexistent la scorurile mari. Per ansamblu, coeficientul de corelaie va avea valori mici, fapt care nu reflect nici
114
Cristian Opariuc-Dan
pe departe realitatea. De exemplu (Sava, 2004), dac vom studia relaia dintre
coeficientul de inteligen i creativitate, vom obine un nor de puncte
heteroscedastic. Corelaia dintre aceste dou dimensiuni este puternic la
valori mici ale inteligenei i creativitii. Pe msur ce coeficientul de inteligen crete, intensitatea legturii scade, datorit
interveniei unor factori intelectuali i nonintelectuali. Problema care se pune este aceea a
stabilirii punctului pn la care relaia se pstreaz, iar interpretarea va ine seama de aceste
aspecte.
Dac vom studia relaia dintre venituri i
Figura 1.12 Existena seturilor de date
cheltuieli pe articole de mbrcminte, s-ar putea
s avei surpriza obinerii unui coeficient de corelaie mic. Acceptarea ipotezei conform creia nu exist nicio legtur ntre
venituri i cheltuieli pe articole de mbrcminte s-ar putea s fie eronat, n
condiiile n care norul de puncte arat ca n figura 1.12.
Remarcm, n acest caz, existena a dou seturi distincte de date.
Putem suspecta existena unei variabile moderatoare, n acest caz genul biologic al persoanei. Relaia poate exista n cazul femeilor (norul de puncte
compact din partea de stnga-sus a graficului), pentru brbai nefiind semnificativ (norul de puncte din dreapta-jos). Dac
vom trata compact lotul de cercetare, sigur c
vom obine un coeficient de corelaie foarte mic.
n acest caz, analiza se realizeaz separat pentru
brbai i pentru femei, rezultatele raportndu-se
n consecin.
Figura 1.13 Relaiile neliniare ntre variabile
Cristian Opariuc-Dan
Figura 1.15 arat norul de puncte al unei corelaii negative slabe de
0,28. Putem intui dreapta de evoluie a celor dou variabile, ns observai c
datele sunt mult mai mprtiate n jurul acesteia. Legtura, evident, exist,
ns nu are puterea celeia din figura 1.14. Variabilitatea datelor n acest caz
este mult mai mare.
Fcnd aceast incursiune prin analiza graficelor, am dorit s subliniem importana studiului diagramei de corelaie. Interpretarea exclusiv pe
baza coeficientului de corelaie nu se recomand, deoarece, foarte uor putem
cdea n capcana unei relaii neliniare sau specifice. Primul pas n interpretarea coeficientului de corelaie este analiza diagramei de corelaie. n funcie
de aspectul datelor, se ajusteaz procedurile de calcul i de raportare.
Analiza datelor prin utilizarea creionului i a hrtiei reprezint un proces laborios, care presupune o important investiie de timp i este susceptibil
de a genera erori. Din fericire, programele specializate de analiz statistic
pot face aceste operaii n cteva fraciuni de secund. Iat c a venit timpul
s studiem corelaiile folosind cunoscutul pachet de programe, SPSS for
Windows.
Eticheta
Nivel de msur
Tip
Timp
Timp de studiu
Scalar
Numeric
Emotii
Emotii examen
Scalar
Numeric
3.2
Gen
Gen biologic
Nominal
Numeric
Nota
Nota examen
Scalar
Numeric
3.2
Caractere
Pentru acest studiu, am investigat un numr de 103 subieci, nregistrnd timpul de studiu (n ore) necesar susinerii examenului de statistic,
media obinut la examenul de statistic (nota la examen i activitatea de se-
118
Cristian Opariuc-Dan
minar), genul biologic i scorul obinut la un instrument de evaluare a emotivitii n condiii de examen3.
Nu este cazul s v mai explic modul n care vei introduce datele n
SPSS. Mai jos avei ntreaga baz de date, pe care v invit s o realizai. Nu
v speriai, nu v ia mai mult de 10 minute. Dup ce ai introdus datele, salvai fiierul sub numele de Corelaii parametrice.
Timp
4
11
27
53
4
22
16
21
25
18
18
16
13
18
98
1
14
29
4
23
14
12
22
84
23
26
24
72
37
10
3
36
43
Emotii
86,30
88,72
70,18
61,31
89,52
60,51
81,46
75,82
69,37
82,27
79,04
80,66
70,18
75,01
34,71
95,16
75,82
79,04
91,13
64,54
80,66
77,43
65,34
0,06
71,79
81,46
63,73
27,46
73,40
89,52
89,52
75,01
43,58
Gen
2
1
2
1
2
1
1
2
2
1
2
1
2
1
2
1
2
2
1
2
1
1
2
2
1
2
1
2
2
1
1
2
2
Nota
7,00
4,00
8,00
1,00
2,00
4,00
4,00
7,00
5,20
5,00
6,00
8,00
6,00
6,50
1,50
8,50
2,00
8,00
10,00
10,00
8,00
1,00
7,00
10,00
7,00
7,00
6,50
7,50
8,50
3,00
0,50
1,00
9,00
Datele sunt fictive i nu corespund unui studiu real. Ele au fost manipulate n aa fel nct
s corespund necesitilor didactice.
119
82,27
79,04
79,04
37,13
81,46
83,07
50,83
82,27
78,24
72,60
74,21
75,82
70,98
97,58
67,76
75,01
73,40
62,12
1
1
2
1
1
2
1
1
2
1
2
2
1
1
1
1
2
1
3,00
8,00
1,00
8,50
0,70
0,50
8,50
2,00
4,50
6,00
7,00
5,00
2,50
5,00
4,00
8,00
5,00
19
2
19
11
15
23
13
14
1
9
20
0
52
38
19
23
11
27
17
73,40
87,91
71,79
86,30
84,69
75,82
70,98
78,24
82,27
79,04
91,13
93,55
58,89
53,25
84,69
89,52
71,79
82,27
69,37
1
2
1
1
2
1
2
2
1
1
2
2
2
2
1
2
2
1
1
7,00
2,00
8,50
3,50
3,00
7,00
5,50
7,50
0,20
4,00
5,00
3,50
8,00
5,00
4,90
7,50
2,50
6,50
8,00
Cristian Opariuc-Dan
figura 1.18.
Formularul conine dou liste, separate prin butonul de transfer n
form de sgeat. Cu ajutorul acestuia, putem transfera variabilele din baza
de date (fereastra din stnga) n lista variabilelor supuse analizei (fereastra
din dreapta). n cazul nostru, am inclus spre analiz, variabilele Nota examen i Emoii examen, n conformitate cu planul de cercetare.
Sub aceste dou liste se afl seciunea Correlation Coefficients, care conine trei casete de bifare, corespunztoare celor trei coeficieni de corelaie ce pot fi calculai: coeficientul de corelaie r Bravais-Pearson (Pearson),
coeficientul de corelaie Kendall (Kendalls tau-b) i coeficientul de corelaie a rangurilor Spearman (Spearman). Situaia noastr este clar; vom calcula coeficientul de corelaie r Bravais-Pearson.
Urmtoarea seciune, Test of Significance are n vedere stabilirea
tipului de ipotez cu care lucrm. Putem alege ntre o ipotez nedirecional
(Two-tailed) i o ipotez direcional (One-tailed). Presupunem c ipoteza
noastr vizeaz stabilirea unei relaii ntre performana la examen i emoiile
din timpul examenului. tii deja c aceasta este o ipotez nedirecional,
corelaia fiind semnificativ att n cazul unei legturi pozitive, ct i n cazul
unei legturi negative.
ntrebare
Cum ai formula o ipotez direcional n acest design de cercetare?
Ce opiune ai alege n seciunea testelor de semnificaie?
Caseta
de
bifare
Flag
significant
correlations comunic programului SPSS s marcheze, n mod distinct, corelaiile semnificative. Aplicaia
va marca, folosind un asterisc pentru corelaiile semnificative la un prag de semnificaie mai mic de 0,05, i
Figura 1.19 Fereastra
opiunilor avansate
121
Cristian Opariuc-Dan
OK. n cteva fraciuni de secund, rezultatele analizei vor fi afiate n
fereastra de rezultate (Output).
Tabelul 1.37 Rezultatele corelaiei bivariate r Bravais-Pearson
Correlations
Nota examen
Pearson Correlation
Nota examen
Sig. (2-tailed)
-,441**
,000
N
Pearson Correlation
Emotii examen
Emotii examen
1,000
103,000
103
**
1,000
-,441
Sig. (2-tailed)
,000
103
103,000
123
Ce concluzii putem extrage de aici? Desigur, avem de a face cu o corelaie semnificativ, deoarece pragul de semnificaie este mai mic de 0,01.
Totodat, corelaia este negativ i moderat, aspecte rezultate din semnul
coeficientului de corelaie i din valoarea acestuia. Mrimea efectului acestei
relaii este de 0,194, sau 19,4% din variana unei variabile poate fi explicat
prin cealalt variabil, intensitatea efectului fiind una
medie. Putem, aadar, afirma c exist o corelaie
moderat, negativ i semnificativ ntre performana
la examen i emoiile din timpul examenului; persoanele cu note slabe la examen prezint i un nivel
semnificativ mai mare al emoiilor.
Iat, n figura 1.20, diagrama de corelaie. Se observ clar sensul negativ al legturii, precum i intensitatea acesteia. n acelai timp, putem suspecta o relaie heteroscedastic. Corelaia pare puternic doar n situaia notelor mici obinute la examen. Pentru notele mari, este posibil s nu existe niciun fel de legtur ntre cele dou variabile (vedei grosimea norului de puncte
n cele dou cazuri. De asemenea, ar fi posibil existena unei alte variabile
care s modereze aceast corelaie (cred c tii deja despre ce variabil este
vorba).
ntrebarea pe care mi-o vei pune acum
va fi una referitoare la modul n care am ajuns la
acest grafic. Puin rbdare.
Toate elementele grafice din SPSS se regsesc n meniul Graphs. Exist, aici, dou
posibiliti: fie utilizarea unui expert de creare a
124
Cristian Opariuc-Dan
graficelor (opiunea Chart Builder, fie crearea manual a acestora (opiunea Legacy Dialogs). Pentru moment, vom avea n vedere a doua situaie,
urmnd ca pe parcursul acestui volum s detaliem i expertul n grafice
SPSS.
Graficul care ne intereseaz este Scatter/Dot. Accesarea acestui
meniu permite lansarea unei ferestre simple, de selecie a tipului de grafic,
aa cum se poate observa n figura 1.22.
Exist, n acest formular, un numr de 5 variante de grafice. Varianta
Simple Scatter este opiunea care ne intereseaz pe noi. n acest caz, graficul va desena
cele dou variabile pe ordonat i abscis, permind eventual intervenia unei a treia variabila
categoriale (de exemplu sexul). Overlay Scatter este o versiune a graficului simplu, permind afiarea, pe aceeai diagram, a mai multor
perechi de variabile, fiecare variabil fiind indiFigura 1.23 Grafic tip Overlay Scatter cu dou perechi de
cat printr-un element de marcaj distinct. Vom
variabile
folosi acest grafic dac, de exemplu, intenionm
s reprezentm pe acelai grafic corelaia dintre performana la examen i
emoiile din timpul examenului (nor de puncte reprezentat prin cercuri) i
corelaia dintre timpul de studiu i performana la examen (nor de puncte reprezentat
prin ptrate).
bile. Pentru a nu desena mai multe grafice, se poate folosi aceast form.
Observm n figura 1.24 reprezentarea tuturor celor trei diagrame de
corelaie. Pe ambele axe sunt incluse variabilele. La
intersecia a dou variabile se afieaz norul de
puncte corespunztor. Putei remarca, pe al doilea
rnd, ultimul cadran, graficul din figura 1.20.
Aceasta este o modalitate ideal de a vizualiza ansamblul legturilor dintre variabile.
Graficul 3-D Scatter este util n reprezentarea tridimensional a corelaiilor ntre mai multe
perechi de variabile. Este o diagram de corelaie
mai dificil de analizat i presupune o oarecare experien n analiza datelor,
folosindu-se frecvent n analiza factorial i n corelaii
pariale. n figura 1.25, reprezentnd
tridimensional
cele trei variabile, putem
observa uor lipsa efectului
emoiilor din timpul examenului. Norul de puncte este
concentrat preponderent n
zona variabilelor nota examen i timp de studiu, cu
orientare ctre scoruri mici
ale dimensiunii emoiei din
timpul examenelor.
Figura 1.25 Grafic tip 3D Scatter
126
Cristian Opariuc-Dan
de puncte propriu-zis ci o variant a graficului cu bare, prin care reprezentm
observaiile individuale ale unei singure variabile.
Acum s trecem la treab. Am ales norul de puncte simplu, am apsat
butonul Define pentru a intra n modul de definiie a graficului, acum privim la noua fereastr care ne ocup ecranul.
n partea stng, avem de acum obinuita list a variabilelor din baza
de date. n partea dreapt regsim butoanele de transfer, corespunztoare seciunilor care trebuie definite. Seciunea Y-Axis permite includerea variabilei ce va fi reprezentat pe abscis (axa OY). n cazul nostru, am inclus emoiile din timpul examenului. X-Axis va conine variabila reprezentat pe ordonat (axa OX). Nota obinut la examen a fost selectat n vederea reprezentrii pe aceast ax. Caseta Set Markers by se folosete n cazul n care
dorim s includem o variabil categorial, ce va diferenia datele. De exemplu, dac dorim s reprezentm diferit norul de puncte al brbailor n comparaie cu cel al femeilor, vom include variabila Gen biologic n aceast seciune. Graficul va reprezenta datele femeilor cu cercuri i datele brbailor cu
ptrate. Seciunea Label cases by reprezint un alt element deosebit de util
n condiiile n care dorim s identificm fiecare element din grafic. De
exemplu, dac am include genul biologic n aceast caset, deasupra fiecrui
cerc de pe grafic, se va afia genul biologic al subiectului respectiv. Desigur,
dac am dori s reprezentm datele separat pentru brbai i pentru femei,
vom prefera varianta Set Markers by, deoarece Label Cases by poate
duce la o supra-aglomerare a graficului. Alternativ, am putea include n
aceast caset variabila timp de studiu. ntr-o asemenea situaie, deasupra
fiecrui cerc de pe grafic, va fi afiat valoarea timpului petrecut de ctre
fiecare subiect n vederea pregtirii pentru examen.
Seciunea Panel by permite separarea graficului n funcie de o variabil categorial. Dac dorim s afim separat norul de puncte pentru brbai i pentru femei, putem include n aceast seciune variabila gen biolo127
Cristian Opariuc-Dan
formana studenilor la examen i emoiile acestora n timpul examenului, s-a
bazat pe un plan corelaional. Cele dou variabile (Nota examen i Emoii examen) se situeaz la un nivel de msur scalar, analiza distribuiei
acestora permind utilizarea statisticilor parametrice. n consecin, a fost
folosit coeficientul de corelaie r Bravais-Pearson, rezultnd o valoare a
corelaiei de r=-0,441, la un prag de semnificaie p<0,01. ntr-o prim etap, putem respinge ipoteza nul i putem afirma c exist o corelaie medie,
negativ i semnificativ ntre cele dou variabile. Astfel, studenii cu note
mici la examen sunt caracterizai prin niveluri ridicate ale emoiilor n timpul examenului. Cei care obin performane la acest examen, pot fi considerai ca fiind puin emotivi. Mrimea efectului acestei corelaii este de 0,194,
corespunztoare unei variane explicate de 19,4%. Putem considera c, lipsa
de performan n condiii de examen, se datoreaz, n procent de 19,4%,
emoiilor din timpul examenului. Totui, studiind diagrama de corelaie, se
remarc imediat existena unei legturi heteroscedastice. Asocierea negativ
ntre cele dou variabile pare a exista doar n cazul notelor mici la examen,
corespunztoare scorurilor mari la emoii n timpul examenului. Pentru studenii cu note mari, relaia nu se mai respect. Se poate suspecta existena
unei variabile moderatoare, care s influeneze att performana la examen, ct i emoiile din timpul examenului, ori existena
unui optim emoional pn la care aceast
atitudine poate corela cu o contraperforman, n situaii de evaluare. n mod cert,
planul de cercetare este incomplet i urmeaz a fi optimizat.
Iat cam cum putei prezenta rezultatele unui studiu de acest tip. n
mod cert vor exista diferene ntre ceea ce tiai pn acum i ceea ce ai gsit
mai sus. Ai observat c nu m-am hazardat s ofer vreo explicaie psihologi-
129
c, sociologic sau economic a faptelor constatate. Nici nu este cazul. Statistica se bazeaz pe datele existente i ofer un raport constatativ i nu explicativ a fenomenelor. Interpretarea statistic nu se poate confunda cu un alt tip
de interpretare. Dei sunt psiholog de profesie, nu m-a hazarda s fac aprecieri asupra acestor fapte, n condiiile unei lucrri destinate nsuirii tehnicilor
de analiz a datelor. Avnd la dispoziie aceste date, un sociolog i poate
exprima punctul de vedere, un psiholog poate avea viziune proprie, la fel i
un economist sau un medic psihiatru. Reinei c metodele de analiz a datelor ofer fapte. Interpretarea faptelor cade n sarcina analistului.
Exerciii:
Studiai legtura care exist ntre performana la examen i timpul
alocat studiului, precum i ntre emoiile din timpul examenului i timpul
alocat studiului. Stabilii ipotezele, precizai tipul acestora, analizai cifric i
grafic coeficienii de corelaiei, elaborai raportul.
Presupunnd existena unei a treia variabile, care s modereze att
performana la examen, ct i emoiile din timpul examenului, ne gndim la
timpul de studiu. Automat, vom avea n vedere o corelaie
parial. Meniul din care putem lansa calculul corelaiilor
pariale l regsim n aceeai locaie. De data aceasta, nu
mai apelm opiunea Bivariate ci vom folosi ParPartial.
Figura 1.27 Lansarea
corelaiilor pariale
130
Cristian Opariuc-Dan
tipul alocat studiului, astfel nct fereastra dumneavoastr va trebui s arate
ca n figura 1.28.
Butonul Options va deschide
o alt fereastr, de configurare a opiunilor avansate. Formularul este asemntor cu cel de la corelaiile bivariate.
Figura 1.28 Configurarea corelaiilor
Singura diferen const n dispariia
pariale
produsului ncruciat al abaterilor i
apariia casetei de bifare Zero-order correlations, a crei selectare comunic programului calcularea corelaiilor r Bravais-Pearson, ntre perechile
formate din cele trei variabile, fr moderare. Facilitatea este foarte util,
scutindu-ne de a efectua corelaii repetate, prin urmare am bifat-o i noi.
Apsarea butonului Continue nchide aceast fereastr i se revine n primul formular.
Dup ce am introdus cu atenie variabile care
urmeaz a fi calculate, putem lansa operaiunea prin
apsarea butonului OK. n scurt timp, vei obine, n
fereastra de rezultate, tabelul 1.38.
Figura 1.29 Opiuni
avansate de configurare
Nota examen
Correlation
1,000
-,441
,397
Significance (2-tailed)
,000
,000
Df
101
101
-,441
1,000
-,709
,000
,000
Timp de studiu
Df
101
101
Correlation
,397
-,709
1,000
Significance (2-tailed)
,000
,000
.
0
Df
Timp de studiu Nota examen
101
101
1,000
-,247
Significance (2-tailed)
,012
Df
100
-,247
1,000
Correlation
,012
Df
100
Cristian Opariuc-Dan
menului, n condiiile controlului exercitat de
timpul de studiu, precum i traseul descendent al norului de puncte.
S-ar putea s fim interesai, la un moment dat, de relaia existent ntre genul biologic i timpul alocat studiului, pentru a vedea n ce msur sexul subiecilor determin efecte asupra timpului de studiu. Suntem n situaia
asocierii unei variabile dihotomice cu o dihotomie discret, real, cu o variabil continu. Ce tip de corelaie folosim? Ai ghicit, corelaie punct biserial.
n SPSS, coeficientul de corelaie punct biserial nu este altceva dect coeficientul de corelaie r Bravais-Pearson, n condiiile n care una dintre variabile
este dihotomic. Unii autori (Field, 2000), (Bakeman, i alii, 2004),
(Swinscow, i alii, 2002) recomand codarea variabilei dihotomice cu valorile zero i unu pentru a nu exista niciun fel de dubiu referitor la calculul
acestui coeficient. n realitate, SPSS realizeaz automat conversia. n cazul
nostru, variabila gen biologic este o variabil dihotomic codat cu unu i
doi, iar calculul coeficientului de corelaie punct biserial nu pune probleme.
Calculai coeficientul de corelaie r Bravais-Pearson ntre genul biologic i timpul de studiu.
n tabelul 1.39, putei observa lipsa oricrei asocieri ntre cele dou
variabile. Putem afirma c cele dou variabile nu sunt corelate liniar, genul
biologic nu determin niciun efect asupra timpului de studiu.
133
Correlations
Gen biologic
Pearson Correlation
Gen biologic
1,00
,085
Sig. (2-tailed)
,391
Timp de studiu
Timp de studiu
103,00
103
Pearson Correlation
,085
1,00
Sig. (2-tailed)
,391
103
103,00
Eticheta
Nivel de msur
Tip
Caractere
sex
Genul biologic
Nominal
Numeric
Nominal
Numeric
Ultima scoala
Ordinal
Numeric
grad
Grad militar
Ordinal
Numeric
inaltime
Inaltimea
Scale
Numeric
greutate
Greutatea
Scale
Numeric
134
Cristian Opariuc-Dan
structur suficient ndeplinirii scopurilor noastre. Etichetele variabilelor neparametrice sunt prezentate n tabelul 1.41 i nu necesit explicaii.
Cunoscnd toate aceste elemente, nu
v rmne dect s proiectai baza de date i
s o salvai sub un nume, s spunem, Corelaii neparametrice.sav.
Valoare
Sex
Masculin
Feminin
culoare_ochi 1
Albastri
Dup salvare, urmtorul pas este reprezentat de popularea bazei de date. n tabe3
Caprui
4
Negri
lul 1.42 avei structura complet a acestor
Educatie
1
Liceul
informaii. Desigur, toate valorile sunt fictive
2
Scoala postliceala
3
Facultate
i nu corespund unei cercetri reale. nar4
Postuniversitare
mai-v aadar cu mult rbdare i completai
Grad
1
Subofiter
cele 50 de cazuri pentru a putea demara apoi
2
Ofiter cu grad inferior
3
Ofiter cu grad superior
analiza. Desigur, la final nu vei uita s sal4
General
vai din nou baza de date, sub acelai nume,
pentru a evita surprizele provocate de o eventual blocare a computerului.
2
Verzi
Culoare
Educatie
Grad
Inaltime
Greutate
Sex
Culoare
Educatie
Grad
Inaltime
Greutate
172
87
193
94
180
102
175
96
184
79
177
92
176
86
170
69
173
85
188
81
187
77
172
76
178
80
170
93
180
100
173
98
170
82
171
74
171
71
186
77
172
79
187
92
135
170
89
191
99
185
90
178
72
172
94
181
85
187
75
187
72
193
73
174
100
184
83
189
86
175
80
170
77
187
84
182
90
169
71
186
90
171
93
193
97
188
69
177
70
174
74
182
82
174
78
188
87
184
91
172
97
Pentru nceput ne propunem s analizm relaia dintre nlimea i greutatea celor 50 de subieci.
Teoretic ambele variabile sunt de tip scalar, putnduse folosi coeficientul de corelaie r Bravais-Pearson.
S presupunem, ns, c nlimea subiecilor nu are
o distribuie normal, ci una puternic asimetric la
stnga, artnd faptul c tendina n grupul de studiu
Figura 1.31 Meniul de
lansare a analizei
este ctre subiecii nali. Media nu mai este un indicator reprezentativ pentru tendina central, i, prin urmare, nu vom putea
folosi coeficientul de corelaie menionat mai sus. Urmtoarea alternativ este
aceea a coeficienilor de corelaie Spearman i Kendall. Pentru a ncepe
calculul acestor doi coeficieni, vei proceda exact la fel ca mai sus, la calculul coeficientului de corelaie r Bravais-Pearson. Vei accesa meniul Analyze, apoi submeniul Correlate i, n final, opiunea Bivariate. Se va
deschide cunoscuta fereastr din figura 1.32.
136
Cristian Opariuc-Dan
Atunci cnd ai calculat coeficientul
de corelaie r Bravais-Pearson, v amintii,
ai inclus cele dou variabile n lista variabilelor supuse analizei, apoi ai bifat caseta
Pearson. n cazul nostru, lucrurile stau la
fel, cu o singur excepie. Nu vom mai bifa
caseta Pearson din cadrul seciunii Correlation Coefficients, ci casetele Kendalls tau-b pentru a calcula coeficientul
Figura 1.32 Fereastra de analiz a
de corelaie Kendall i Spearman pencorelaiilor
tru a calcula coeficientul de corelaie
Spearman. Alte explicaii, la acest nivel, nu sunt necesare, toate aspectele
fiind lmurite anterior. Nu rmne dect s apsai butonul OK pentru ca
programul s iniieze calculul acestor date.
Fereastra de rezultate va afia un tabel, la fel cu tabelul 1.43, n care
sunt prezentate cele dou analize bazate pe coeficientul de corelaie Kendall
i pe coeficientul de corelaie Spearman, ambii fiind, v reamintim, coeficieni de corelaie ai rangurilor.
La fel ca n cazul coeficientului de corelaie r Pearson, tabelul conine
trei elemente: valoarea coeficientului de corelaie, pragul de semnificaie pentru o ipotez bilateral (sau unilateral dac am specificat acest lucru n fereastra de configurare a analizei) i numrul de subieci investigai (n).
Situaia noastr ar trebui s bucure sau s supere cercettorul, n funcie de modul n care i-a formulat obiectivele. Se poate observa existena unor
coeficieni de corelaie nesemnificativi, foarte mici (=0,069, =0,097) ntre
nlimea i greutatea subiecilor.
137
Correlations
nlimea
Kendall's tau_b
nlimea
Correlation Coefficient
Sig. (2-tailed)
1,000
.
N
Greutatea
nlimea
,491
50
Correlation Coefficient
,069
1,000
Sig. (2-tailed)
,491 .
Correlation Coefficient
Sig. (2-tailed)
N
Greutatea
,069
50
N
Spearman's rho
Greutatea
50
50
1,000
,097
,503
50
50
Correlation Coefficient
,097
1,000
Sig. (2-tailed)
,503 .
50
50
n concordan cu datele cercetrii, nu exist nicio legtur ntre nlimea i greutatea subiecilor, cele dou variabile fiind independente, iar noi
putem s nu respingem ipoteza nul. O asemenea cercetare, presupunnd c
am fi lucrat cu date reale, poate fi lipsit de valoare? Depinde de modul n
care explicm rezultatele.
nali-Slabi
Privind figura 1.33, n care am reprezentat grafic aceast relaie, putem observa
cteva lucruri interesante. Exist, ntr-adevr,
o tendin ctre un tip de corelaie pozitiv,
tendin anulat ns de dou situaii particulare: de existena unui grup de persoane foarte
Scunzi-Grai
nalte i foarte slabe i de existena unui alt
grup de persoane ceva mai numeros scunde
Figura 1.33 Relaia dintre
nlime i greutate
i supraponderale. Lipsa unui coeficient de
corelaie semnificativ se poate datora tocmai acestui lucru i, putem suspecta,
138
Cristian Opariuc-Dan
influena unei variabile de grup probabil tipul constituional pe care nu
am luat-o n considerare.
Analiza coeficientului de corelaie Kendall ori a coeficientului de
corelaie Spearman se realizeaz la fel ca i cea a coeficientului de corelaie
r Bravais-Pearson, drept pentru care nu vom intra
n amnunte referitoare la acest lucru.
Cum vom proceda n condiiile n care dorim s aflm dac exist vreo legtur ntre genul
biologic al subiecilor i culoarea ochilor? Ambele
Figura 1.34 Meniul de
accesare a tabelelor de
contingen.
139
140
Cristian Opariuc-Dan
Bifarea casetei Suppress tables are ca efect includerea tuturor tabelelor de contingen ntr-unul singur (dezactivndu-se i butoanele Cells
i Format). Personal nu recomand bifarea acestei opiuni deoarece rezultatele pot s piard foarte mult din lizibilitate. Caseta are efect numai asupra modului de prezentare al datelor, nu i asupra
procedurilor de calcul.
Apsarea butonului Exact determin
deschiderea formularului de configurare a testelor de semnificaie, furniznd o serie de metode
adiionale.
Varianta Asymptotic only este metoda
implicit, bazat pe calculul nivelului de semnificaie n funcie de tipul distribuiei teoretice.
Figura 1.36 Configurarea
Este, dac dorii, metoda clasic de calcul a semtestelor de semnificaie
nificaiei, aa cum a fost ea descris pn acum,
n acest volum. O valoare este considerat semnificativ dac pragul de semnificaie este mai mic de 0,05. Totui, varianta pleac de la premisa c setul
de date este suficient de mare i eterogen distribuit. Pentru un numr redus de
cazuri sau n condiiile n care omogenitatea distribuiei pune probleme,
aceast metod poate s nu reprezinte un bun indicator al pragului de semnificaie.
Celelalte metode, Monte Carlo i Exact, se vor folosi n condiiile n care distribuia datelor nu permite utilizarea metodei clasice.
Metoda Monte Carlo reprezint o form precis de analiz a nivelului de semnificaie, bazat pe simulare, derivat din calculul repetat, efectuat pe mai multe eantioane de tabele de contingen de aceleai dimensiuni
i cu aceleai totaluri marginale ca i tabelul analizat. Metoda Monte Carlo
permite estimarea precis a pragului de semnificaie, chiar n condiiile n
care nu se poate aplica metoda clasic, asimptotic. Se poate folosi n cazul
141
Cristian Opariuc-Dan
intereseaz. Formularul este foarte intuitiv, grupat pe seciuni, conine doar
casete de bifare. Remarcai o serie de indicatori pe care-i cunoatei, dar i
indicatori de care probabil nu ai auzit. Haidei s-i lum pe fiecare n parte.
Caseta Chi-square se refer exact la coeficientul de contingen 2.
Bifai aceast caset pentru a calcula coeficientul de contingen Pearson 2,
coeficientul de contingen probabilistic-proporional 2, testul de semnificaie Fisher i coeficientul de contingen Yate 2 corectat pentru continuitate.
tiu c nu ai auzit de aceti coeficieni. n esen sunt forme derivate din 2,
pentru a rspunde unor necesiti specifice de cercetare. Spre exemplu, 2
corectat pentru continuitate se folosete strict pentru tabele de continuitate
bidimensionale de tip 2x2, aa cum am vzut deja. Pentru tabele bidimensionale cu mai multe linii i coloane, reperul este 2 Pearson sau 2 probabilistic
proporional. Dac cele dou variabile nu sunt nominale sau ordinale, ci se
situeaz la un nivel scalar, cel mai bun indicator va fi coeficientul de asociere
liniar 2. Testul de semnificaie Fisher se folosete doar pentru tabele 2x2, n
cazul n care frecvena ateptat la nivelul unei celule este mai mic de 5. Nu
v impacientai. Toate aceste elemente le vom discuta n momentul n care
vom analiza rezultatele.
Caseta Correlations o putei folosi n condiiile n care tabelul de
contingen conine date aflate la un nivel ordinal sau scalar. Se va calcula
coeficientul de corelaie Spearman dac datele se afl la un nivel ordinal
sau/i coeficientul de corelaie r Pearson dac datele se afl la un nivel scalar.
Iat cel puin un motiv pentru care este important s definim corect nivelul de
msur atunci cnd proiectm baza de date.
Seciunea Nominal se refer la coeficieni de asociere pentru date
nominale. Putei bifa caseta Contingency coefficient pentru a calcula coeficientul de contingen, caseta Phi and Cramers V pentru a calcula coeficienii de contingen Pearson i v Cramer, caseta Lambda pentru coeficientul de asociere Goodman i Kruskal, acela care permite realizarea
143
Cristian Opariuc-Dan
Caseta Risk nu se refer la riscul de a v pierde buna dispoziie citind aceast carte, ci reprezint un coeficient care msoar puterea legturii
dintre prezena unui factor i apariia unui eveniment. Dac dorii s studiai
relaia dintre prezena soacrei i apariia unui
conflict n familie, acesta este coeficientul care
vi se potrivete cel mai bine.
Coeficientul McNemar studiaz legtura dintre dou variabile dihotomice i se bazeaz tot pe 2. Se folosete, de obicei, n cercetri de tipul nainte i dup, pentru a se identifica modificarea rspunsurilor n urma apariiei
unei situaii experimentale.
Cellalt element din aceast fereastr nu
Figura 1.38 Configurarea
datelor n tabele
prezint un interes deosebit pentru subiectul
nostru, referindu-se mai mult la studiul diferenelor dect la studiul corelaiilor, motiv pentru care l vom discuta cu alt ocazie.
Butonul Cells permite configurarea datelor ce vor fi prezentate n
tabelele de contingen.
Seciunea Counts are dou casete de bifare: Observed i Expected. Ele permit afiarea n tabelul de contingen a frecvenelor actuale
(observate) i/sau a frecvenelor estimate (teoretice) n condiiile n care se
lucreaz cu 2.
Seciunea Percentages permite adugarea i a frecvenelor relative
(procente) pentru variabilele situate pe linii (Row) i/sau pentru variabilele
situate pe coloane (Column) ori la nivelul rezultatelor marginale (Total).
Reziduurile nu reprezint altceva dect diferena dintre scorul observat i cel estimat. Controlul afirii acestor elemente se realizeaz prin intermediul seciunii Residuals. Acestea se pot afia n form brut, nestandar145
Cristian Opariuc-Dan
m n ntregi n sensul superior (de exemplu 1,39 va fi rotunjit la 2), iar la
trunchiere valorile zecimale se transform n ntregi, n sensul inferior (1,39
va fi trunchiat la 1). Operaiunile nu afecteaz datele din baza de date, ci doar
rezultatele calculelor statistice.
Opiunea Round case weights are ca efect rotunjirea datelor direct
n baza de date naintea efecturii oricror calcule
statistice.
Opiunea Truncate case weights are ca
efect trunchierea datelor direct n baza de date
naintea efecturii oricror calcule statistice.
Desigur, opiunea No adjustments nu
efectueaz nicio ajustare, datele fiind folosite aa
cum sunt.
Ultimul buton rmas este butonul Format care controleaz ordinea de sortare a variabilei reprezentate pe linii.
Putem opta pentru o sortare ascendent a categoriilor variabilei reprezentat pe linii (alegnd opiunea Ascending) sau pentru o sortare descendent, de la mare la mic, a aceleiai variabile (alegnd opiunea
Descending).
Acestea sunt, n mare, opiunile referitoare la construcia i analiza tabelelor de contingen. Acum s revenim la problemele noastre. Ne-am propus s studiem relaia existent ntre genul biologic al persoanelor i culoarea
ochilor. Ambele sunt variabile situate la nivel nominal, singurele statistici ce
pot fi calculate sunt cele bazate pe date nominale.
n lista Row(s) vom include genul biologic iar n lista Column(s)
includem culoare ochilor. Vom bifa i caseta Display clustered bar charts
pentru a fora SPSS s reprezinte graficul cu bare al acestor variabile i
147
cam att. Opiunea de calcul a testelor de semnificaie va rmne cea implicit opiunea asimptotic, astfel nct putem ignora butonul Exact. Butonul Statistics ne intereseaz ceva mai mult. Aici vom bifa caseta ChiSquare, pentru a calcula coeficienii 2. De asemenea, n seciunea Nominal vom calcula coeficientul de contingen i coeficienii i v Cramer.
Celelalte casete nu le vom bifa deoarece nu suntem n situaia de a ncerca
predicii i nici nu avem variabile situate la vreun nivel superior de msur.
Apsnd butonul Cells vom comunica programului modalitatea
de afiare a rezultatelor. Dorim s prezentm att frecvenele ateptate ct i
cele observate, ne intereseaz i toate reziduurile. Dup bifarea opiunilor
respective, putem apsa butonul Continue pentru a reveni la formularul
iniial i apoi butonul OK n vederea lansrii analizei.
Acum, dac vei privi n fereastra de afiare a rezultatelor, vei rmne
surprini. SPSS a generat nu mai puin de patru tabele i un grafic.
Tabelul 1.44 Sumarul analizei
Case Processing Summary
Cases
Valid
N
Genul biologic *
Culoarea ochilor
Percent
50 100,0%
Missing
N
Percent
0
,0%
Total
N
Percent
50 100,0%
Cristian Opariuc-Dan
fi trebuit s folosim opiunile de rotunjire sau trunchiere fr afectarea bazei
de date. Vei vedea imediat de ce.
Ce ne spune acest tabel? n primul rnd avem un numr de 34 de brbai. Dintre acetia, 5 au ochi albatri, 5 au ochi verzi, 16 au ochi cprui i 8
au ochi negri. Similar, am investigat 16 femei: 3 cu ochi albatri, 3 cu ochi
verzi, 7 cu ochi cprui i 3 cu ochi negri. Frecvenele estimate, pentru brbai,
sunt: 5,4 pentru ochi albatri, 5,4 pentru ochi verzi, 15,6 pentru ochi cprui,
7,5 pentru ochi negri. Situaia este redat n mod analog i pentru femei. Totui, ce nseamn, spre exemplu, 5,4? nseamn cumva cinci brbai i jumtate? La acest nivel de msur ar fi fost mai bine s folosim opiunile de rotunjire pentru a evita asemenea exprimri zecimale. Cnd folosim ns trunchierea, i cnd folosim rotunjirea? n general, dac baza de date conine un
numr mare de cazuri vom folosi trunchierea. Chiar dac pierdem informaie,
ctigm precizie. Dac numrul de cazuri este relativ mic, este de preferat s
utilizm rotunjirea. Beneficiem de mai mult informaie n detrimentul preciziei.
Urmtoarele linii din tabel se refer la reziduuri. Observm c pentru
culorile deschise (albatri i verzi) brbaii se situeaz sub frecvena ateptat, n timp ce femeile se situeaz sub frecvena ateptat la culorile nchise
(cprui i negri). Ne-am putea gndi la o predominan a culorilor nchise
pentru brbai i a culorilor deschise pentru femei, dei forma standardizat a
reziduurilor arat abateri mici de la situaia n care nu ar exista nici o relaie
ntre cele dou variabile.
149
Feminin
16
34
Expected Count
5,4
5,4
15,6
7,5
34,0
Residual
-,4
-,4
,4
,5
Std. Residual
-,2
-,2
,1
,2
Adjusted Residual
-,4
-,4
,2
,4
Count
16
2,6
2,6
7,4
3,5
16,0
Residual
,4
,4
-,4
-,5
Std. Residual
,3
,3
-,1
-,3
Adjusted Residual
,4
,4
-,2
-,4
Count
23
11
50
8,0
8,0
23,0
11,0
50,0
Expected Count
Total
Expected Count
df
Pearson Chi-Square
,361a
,948
Likelihood Ratio
,359
,949
Linear-by-Linear Association
,320
,571
N of Valid Cases
50
a. 3 cells (37,5%) have expected count less than 5. The minimum expected count is 2,56.
150
Cristian Opariuc-Dan
Tabelul 1.47 Coeficieni de asociere derivai din 2
Symmetric Measures
Value
Nominal by Nominal
Approx. Sig.
Phi
,085
,948
Cramer's V
,085
,948
Contingency Coefficient
,085
,948
N of Valid Cases
50
Reprezentarea grafic
a datelor vine n sprijinul demonstraiei cifrice. Genul
persoanelor investigate nu are
nicio legtur cu culoarea
ochilor acestora. Graficul arat doar o preponderen a
ochilor cprui la ambele sexe
i o oarecare frecven mai
ridicat a ochilor negri la brbai. Culorile deschise au n
Figura 1.40 Reprezentarea grafic a relaiei dintre
continuare o frecven sczut,
culoarea ochilor i genul biologic.
att la brbai ct i la femei.
Iat c prin procedee neparametrice, situate chiar la un nivel nominal, s-a
putut demonstra o ipotez de cercetare.
nainte de a ncheia, vom furniza cteva exemple, fr a intra n detalii, pentru a v putea familiariza cu procedurile de lucru.
S presupunem c dorim s aflm relaia dintre culoarea ochilor i
gradul militar, adic s vedem dac, ntr-adevr, coloneii au ochi albatri.
Suntem n situaia analizei legturii ntre o variabil nominal (culoarea ochilor) i o variabil ordinal (gradul militar). n acest caz avem dou posibiliti. Fie abordm analiza la nivel nominal, la fel cum am procedat anterior,
151
deoarece una dintre variabile se afl la acest nivel i aplicm principiul analizei bazate pe variabila cea mai slab, fie folosim coeficientul , coeficient
care relaioneaz o variabil nominal cu una ordinal sau scalar. Noi vom
aborda ambele situaii. Prin urmare, includem pe linii variabila culoarea
ochilor i pe coloane gradul militar. Bifm i caseta Display clustered bar
charts pentru a putea afia grafic variabilele, apoi alegem opiunile Chisquare, Contingency coefficient, Phi and Cramers V, dar i opiunea
Eta din fereastra de configurare a statisticilor. Vom considera c una dintre
variabile nu ndeplinete condiiile testrii asimptotice i vom alege metoda
Monte Carlo din fereastra de configurare a testelor de semnificaie. n final,
apsm butonul OK pentru a lansa analiza.
Nu vom furniza toate tabelele, majoritatea fiind identice cu cele din
analiza de mai sus.
Tabelul 1.48 Coeficieni de asociere 2
Chi-Square Tests
Monte Carlo Sig. (2-sided) Monte Carlo Sig. (1-sided)
99% Confidence
Interval
Value
Asymp. Sig.
(2-sided)
Sig.
df
Lower
Bound
Upper
Bound
99% Confidence
Interval
Sig.
Pearson Chi-Square
13,004a
,162 ,158b
,149
,168
Likelihood Ratio
14,002
,122 ,210b
,200
,220
11,963
,159b
,149
,168
,725 ,769b
,758
,779 ,397b
Linear-by-Linear
Association
,123c
N of Valid Cases
50
Lower
Bound
,384
Upper
Bound
,409
a. 13 cells (81,3%) have expected count less than 5. The minimum expected count is ,80.
b. Based on 10000 sampled tables with starting seed 2000000.
c. The standardized statistic is -,351.
Constatm c statisticile bazate pe 2 sunt mult mai elaborate la utilizarea metodei Monte Carlo. Avem pragurile de semnificaie att pentru metoda clasic, asimptotic, dar i pentru metoda Monte Carlo, alturi de intervalele de ncredere. Desigur, nu exist nicio legtur ntre cele dou variabile,
152
Cristian Opariuc-Dan
aa cum reiese i din tabelul 1.49, tabelul coeficienilor de asociere derivai
din 2.
Toi cei trei coeficieni de asociere calculai arat, din nou, lipsa corelaiei ntre cele dou variabile. Oricum, se poate observa creterea preciziei
pragului de semnificaie la utilizarea metodei Monte Carlo n comparaie cu
testul clasic.
Tabelul 1.49 Coeficieni de asociere derivai din 2
Symmetric Measures
Monte Carlo Sig.
99% Confidence Interval
Value Approx. Sig.
Sig.
,510
,162 ,158a
,149
,168
Cramer's V
,294
,162 ,158
,149
,168
Contingency Coefficient
,454
,162 ,158a
,149
,168
N of Valid Cases
50
Eta
,120
,184
153
Remarcm valoarea mic a acestei legturi i, de asemenea, lipsa pragului de semnificaie. SPSS nu furnizeaz valoarea semnificaiei pentru acest
coeficient, ea fiind tratat la analizele folosind date nominale. De aceea coeficientul va fi ntotdeauna nsoit de analize bazate pe 2.
Un ultim exemplu i propune analiza relaiei dintre ultima coal absolvit i gradul militar. Ambele variabile se afl la nivel ordinal, astfel nct
putem bifa i caseta Correlations, dar i ceilali coeficieni de corelaie pentru date ordinale: Gamma, Sommers d, Kendalls tau-b i Kendalls
tau-c. Dac avei curaj, alegei opiunea Exact cu limitare la 5 minute,
pentru a vedea cum funcioneaz i acest element. Apoi salvai dac ai lucrat
ceva, lansai analiza i luai-v o mic pauz. Glumeam! Numrul mic de
date permite analiza rapid a acestora.
Observm c legtura dintre cele dou variabile este semnificativ la
un prag de semnificaie mai mic de 0,01, prag furnizat att de testul clasic de
semnificaie, ct i de testul exact. Coeficienii au valori ridicate, fapt care
indic existena unei legturi pozitive, semnificative i puternice ntre gradul
militar i ultima coal absolvit. Desigur, gradele militare nalte presupun i
studii pe msur, relaia nefiind un fapt surprinztor.
Tabelul 1.51 Coeficieni de corelaie pentru date aflate la nivel ordinal
Symmetric Measures
Value
Asymp. Std.
Errora
Approx. Tb Approx. Sig. Exact Sig.
,742
,040
16,127
,000
,000
Kendall's tau-c
,661
,041
16,127
,000
,000
Gamma
,942
,040
16,127
,000
,000
,000
,000
Spearman Correlation
Interval by Interval Pearson's R
N of Valid Cases
,823
,034
10,025
,000
,780
,041
8,629
,000c
50
154
Cristian Opariuc-Dan
Exerciii:
Analizai i interpretai legturile dintre: gen biologic i grad militar, culoarea ochilor i ultima coal absolvit, gen biologic i
greutate. Explicai i argumentai utilizarea coeficienilor.
V voi lsa acum n compania SPSS s v jucai cu opiunile i cu indicatorii corelaiilor, s experimentai mai multe variante, deoarece numai aa
vei putea s v perfecionai. Nu vom ncheia ns acest capitol, dect dup
ce vom realiza cteva referiri generale la modul de raportare al studiilor corelaionale.
155
156
Cristian Opariuc-Dan
p= .003 ci expresii de forma p< .05, p< .01 sau p< .001, acesta
fiind i standardul raportrilor tiinifice.
5. Un prag de semnificaie p= .05 nu este semnificativ. Sunt
semnificative doar pragurile mai mici de .05, nu i cele egale
cu aceast valoare. n tiinele sociale, de obicei raportm
semnificaii mai mici de .05 sau mai mici de .01. Foarte rar
ajungem la niveluri mai mici de .001 i n mod excepional la
praguri de semnificaie mai mici de .0001.
n sfrit am ajuns i la finalul acestui capitol. A fost, ntr-adevr, un
capitol destul de lung, ns i informaia a fost consistent. Acum sper c
avei o idee precis asupra semnificaiei conceptului de corelaie, mai exact a
celui de legtur ntre variabile. Putei s fii mndri i s dai lecii colegilor
n domeniul studiilor corelaionale, ns nu v bucurai prea tare, deoarece
avem de discutat lucruri cel puin la fel de interesante.
Luai-v o pauz. Mergei la un grtar, la iarb verde, relaxai-v, deoarece imediat vom aborda un alt capitol, i anume cel al testelor statistice.
n concluzie:
Relaiile stabilite n urma analizei a dou variabile poart numele de analize bivariate, spre deosebire de analizele univariate care au n vedere doar o singur variabil;
Gradul de asociere ntre dou variabile se bazeaz pe conceptul ce covarian. Msura standardizat a covarianei poart numele de corelaie;
Coeficienii de corelaie pot fi parametrici i neparametrici, dup cum cele dou
variabile ndeplinesc sau nu condiiile de aplicare ale statisticilor parametrice;
Coeficientul de corelaie a rangurilor Spearman se poate folosi, n general, pentru variabile ordinale provenite din variabile continui sau pentru variabile continui
care nu ndeplinesc condiiile necesare aplicrii statisticilor parametrice;
Coeficientul de corelaie a rangurilor Kendall are mai multe forme, se bazeaz pe
calculul inversiunilor i al proversiunilor i se folosete pentru variabile aflate natural la un nivel de msur ordinal sau pentru variabile cantitative care nu ndeplinesc condiiile de aplicare a statisticilor parametrice;
157
Coeficientul de contingen 2 are mai multe forme i se folosete n cazul variabilelor nominale, n calcule bazate pe tabele de contingen. Este un coeficient nedirecional i nestandardizat;
Coeficientul de asociere este o form standardizat a coeficientului 2 i se utilizeaz, n general, pentru dou variabile dihotomice. n cazul n care una dintre variabile nu mai este dihotomic, acest coeficient nu are relevan;
Coeficientul de contingen Pearson (cc) este o variant a coeficientului , care
poate fi utilizat pentru variabile cu mai multe categorii;
Coeficientul de contingen Tschuprow (t) se bazeaz tot pe coeficientul i ine
seama de acesta i de numrul de categorii din cadrul fiecrei variabile, fiind o
form ajustat a coeficientului ;
Coeficientul de asociere Cramer (V) se folosete dac cel puin una dintre variabile
este polihotomic, fiind bazat direct pe 2;
Coeficientul de asociere Goodman i Kruskal () msoar reducerea proporional
a erorilor ntr-un tabel de contingen, fiind folosit pentru variabile strict ordinale
n scop predictiv;
Coeficientul de asociere Goodman i Kruskal () are la baz variabile ordinale, este similar cu Kendall i se calculeaz innd cont de numrul perechilor concordante i discordante;
Coeficienii tetrachoric, polichoric i poliserial se folosesc pentru variabile dihotomice provenind din variabile continui sau pentru variabile ordinale, condiia fiind
aceea a provenienei din variabile continui;
Coeficientul de concordan Kendall (W) se bazeaz pe ranguri i permite aprecierea gradului de acord dintre evaluatori. Datele folosite sunt date ordinale;
Coeficientul de corelaie rang biserial ofer expresia legturii dintre o variabil
dihotomic i o variabil ordinal;
Coeficientul de corelaie r Bravais-Pearson este cel mai cunoscut coeficient de corelaie pentru date parametrice i se folosete la analiza legturilor dintre dou variabile cantitative care ndeplinesc toate condiiile aplicrii testelor parametrice;
Coeficienii de corelaie biserial, punct biserial i triserial se folosesc pentru analiza asocierii dintre o variabil scalar i o variabil nominal, dihotomic sau
polihotomic. Diferena dintre acetia este dat de natura dihotomiei dihotomie
discret sau continu;
Coeficientul de corelaie eneahoric permite asocierea unor variabile polihotomice,
polihotomia fiind una continu;
Corelaiile pariale, att cele parametrice ct i cele neparametrice, au n vedere
analiza relaiei dintre dou variabile n condiiile n care se menine controlul asupra unei a treia variabile, susceptibil de a influena comportamentul celorlalte dou variabile analizate.
Raportarea corelaiei presupune raportarea intensitii acesteia, a sensului i a
pragului de semnificaie;
158
Cristian Opariuc-Dan
159
Planuri de cercetare;
Ipoteze i variabile specifice statisticilor infereniale;
Teste statistice pentru date parametrice i pentru
date neparametrice;
Relevana i utilizarea testelor statistice;
Dup parcurgerea capitolului, cititorii vor fi capabili s:
Studiul relaiilor ntre variabile reprezint doar o mic parte din arsenalul analizei de date pe care l are la dispoziie specialistul n tiine socioumane pentru a desfura o cercetare tiinific. Desigur, cercetrile corelaionale se folosesc atunci cnd dorim s investigm legtura dintre dou variabile (de exemplu legtura dintre coeficientul de inteligen i performana
colar) i fac obiectul aa-numitelor planuri de cercetare de tip corelaional.
Cum procedm, ns, atunci cnd suntem interesai de studiul diferenelor
statistice? Care ar fi abordarea n situaia unei ntrebri de genul: exist diferene determinate de genul biologic sub aspectul performanei la matematic?. n acest caz, un plan de cercetare corelaional nu ne este de prea mare
folos. Suntem, din nou, n faa unei provocri. Provocarea analizei infereniale sub aspectelor diferenelor statistice bivariate.
Dei i gsete locul mai degrab ntr-o lucrare din domeniul metodologiei cercetrii, urmtorul subcapitol nu poate fi trecut cu vederea. Vom dis-
160
Cristian Opariuc-Dan
cuta, aadar, despre planurile de cercetare i vom vedea o alt clasificare a
variabilelor.
161
162
Cristian Opariuc-Dan
cercetarea ctignd un plus de precizie sub aspectul efectelor generate de
variabila independent.
Al treilea principiu este cel al controlului variabilelor confundate.
Prin aceste proceduri, un plan de cercetare va izola sursele de variaie determinate de alte variabile posibile i va limita efectul acestora asupra variabilelor dependente. Exist mai multe metode prin care se poate realiza acest lucru. Una dintre acestea se refer la meninerea constant a variabilei confundate. De exemplu, dac presupunem c genul biologic al subiecilor poate
influena abandonul fumatului, vom efectua dou cercetri, una pe brbai i
alta pe femei. O alt metod se refer la tratarea variabilei confundate ca variabil de cercetare. Putem include, de exemplu, alturi de variabila independent tipul de tratament i variabila independent gen biologic: Desigur,
cea mai bun metod rmne ns atribuirea aleatorie a subiecilor n condiiile de cercetare. n mod practic, procedura statistic de control a variabilelor
confundate poart numele de analiz de covarian (ANCOVA) i va fi expus n cadrul aventurilor noastre n lumea statisticii.
Exist un numr impresionant de planuri de cercetare, ns situaiile
practice impun utilizarea doar a ctorva. n general, literatura de specialitate
distinge ntre (Kirk, 1995):
Planuri de cercetare sistematice rar folosite n prezent, deoarece presupun existena unor loturi de cercetare selectate, iar lipsa
caracterului aleatoriu induce erori foarte mari. Dintre cele mai cunoscute planuri de cercetare de acest tip, menionm planurile de
tip tabl de ah sau half-drill strip ale lui Beavan, planul diagonal de ptrat sau planul n ptrate al lui Knut Vik;
Planuri aleatorii cu o singur variabil independent reprezint modele n care exist o singur variabil independent, iar
subiecii sunt atribuii aleatoriu n cadrul categoriilor determinate
163
de aceast variabil. Aceste planuri de cercetare pot accepta absolut aleatoriu atribuirea subiecilor n cadrul categoriilor variabilei
independente (cum este planul complet aleatoriu CR-p) sau subiecii sunt atribuii aleatoriu, ns nainte de acest lucru apare o
etap intermediar de construcie a unor grupuri sau categorii
omogene ale variabilei independente (cum sunt planurile de tip
bloc incomplet balansat BIP-p, planul ncruciat CO-p, planul
cu blocuri aleatorii generalizate GRB-p, planurile de tip ptrate
greco-latine GLS-p i HGLS-p i altele;
Planuri aleatorii cu dou sau mai multe variabile independente similare planurilor de cercetare anterioare, cu singura diferen a existenei mai multor variabile independente. i aici avem dou situaii particulare. Putem vorbi despre planuri factoriale, n care nu exist o relaie de ordine ntre categoriile variabilelor independente (planuri fr variabile confundate CRF-pq, GRBF-pq,
RBF-pq, planuri cu tratarea variabilelor confundate la nivel de
grup SPF-p.q, planuri cu interaciunea variabilelor confundate la
nivel de grup LSCF-pk i planuri de tip tratare-interaciune) i
despre planuri ierarhice, n care se poate pune o relaie de ordine
ntre categoriile variabilelor independente, ordine fie total, fie
parial;
164
Cristian Opariuc-Dan
Nu v speriai, nu le vom studia pe toate. Ne vom concentra atenia
doar asupra ctorva, cele mai utilizate n sfera noastr de interes.
165
H1:medi natu 0
Cristian Opariuc-Dan
banc. n fine, teoretic, pot exista o infinitate de variabile confundate care s
influeneze variabila dependent.
Nu putem ti cu certitudine dac modificrile n comportamentul subiecilor se datoreaz, ntr-adevr, influenei exercitate de variabila independent sau au aprut ali factori care le-au determinat. Dac am conveni s
notm subiecii cu litera i, unde, n cazul nostru, i poate lua valori ntre 1 i
60, iar cele dou situaii de cercetare cu litera k, unde k poate fi tratamentul
naturist sau tratamentul medicamentos, am putea sintetiza acest design de
cercetare sub forma:
Yik= + k + i(k)
S nu ne speriem prea tare! Yik reprezint scorul obinut la variabila
dependent de ctre subiectul i aflat n situaia k. De exemplu, Costel este al
aselea subiect din grupul supus tratamentului medicamentos, care fumeaz,
n medie, 15 igri pe zi. Costel va fi, atunci, Y62 iar valoarea acestui Y devine
15. Aceste 15 igri fumate de Costel la sfritul experimentului reprezint
suma a trei parametri. n primul rnd, este vorba despre media mediilor celor
dou situaii de cercetare (= (medic+ natur)/2). Dac subiecii din situaia
tratamentului medicamentos fumeaz n medie 12 igri, iar subiecii din situaia tratamentului naturist fumeaz n medie 8 igri, atunci o component a
celor 15 igri fumate de Costel va fi media 10. O alt component a numrului de igri fumate de Costel este dat de efectul tratamentului k. Desigur,
alturi de media mediilor, n compoziia celor 15 igri intr i efectul determinat de tratamentul medicamentos la care a fost supus Costel. n fine, ultima
component a scorului observat este dat de efectul erorilor aprute la nivelul
grupului din care face parte Costel i(k).
Generaliznd, fiecare scor observat reprezint suma celor trei
componente: media general, efectul determinat de situaia de cercetare
i efectul erorilor din grupul de cercetare. Cnd vorbim despre efectul erorilor, ne referim exact la situaiile expuse mai sus; Costel s-ar fi putut certa la
167
168
Cristian Opariuc-Dan
2. Formarea de grupuri de participani avnd caracteristici similare, pe baza unei alte variabile care coreleaz cu variabila dependent, procedur numit similaritatea participanilor;
3. Obinerea grupurilor de subieci identici n baza caracteristicilor genetice (de exemplu grupuri de gemeni un frate ntr-un
eantion, cellalt n alt eantion);
4. Alegerea subiecilor care corespund unui criteriu convenit de
selecie (de exemplu perechi formate din so i soie soul
ntr-un eantion, soia n altul).
Dei n teorie este foarte simplu, n practic vei ntmpina dificulti
n gsirea subiecilor pe baza crora s construii eantioane dependente. Totui, efortul dumneavoastr va fi rspltit printr-o mai mare precizie a rezultatelor.
Tabelul 2.2 Plan de cercetare de tip RB-2
Bloc 1
Bloc 2
Bloc 3
.
.
.
Bloc 30
Medicamentos
Subiect rang 1
Subiect rang 3
Subiect rang 5
.
.
.
Subiect rang 29
Efect medicament
Naturist
Subiect rang 2
Subiect rang 4
Subiect rang 6
.
.
.
Subiect rang 30
Efect naturist
Efect bloc 1
Efect bloc 2
Efect bloc 3
.
.
.
Efect bloc 30
Probabil c abandonul fumatului este legat de experiena de fumtor. Exist posibilitatea ca subiecii care au fumat 30 de ani s se lase mai
greu de fumat n comparaie cu cei care fumeaz de 30 de zile. Iat o nou
variabil confundat care poate influena rezultatele. Dac n grupul supus
tratamentului medicamentos avem majoritatea fumtorilor veterani, iar n
grupul tratamentului naturist vom avea nceptorii, s-a putea ca eficiena
unui tratament s nu aib o importan att de mare, diferenele rezultnd, de
169
170
Cristian Opariuc-Dan
n general, cercetarea se concentreaz doar pe prima ipotez. Dei este
posibil i a doua ipotez, aceasta nu are un rol activ n studiu, ci mai degrab
pe acela de a elimina influena variabilei confundate.
Ecuaia caracteristic acestui design este foarte asemntoare cu cea a
designului complet aleatoriu, remarcndu-se doar apariia efectului determinat de blocuri:
Yik= + k + i+ ik
ntr-adevr, scorul observat este compus din media general (media
mediilor situaiilor de cercetare) , din efectul exercitat de ctre situaia de
cercetare k, din efectul exercitat de blocuri (de vechimea ca fumtor) i i de
efectul erorilor, de data aceasta considerat la nivelul ntregului eantion ik.
Desigur, efectul erorilor va fi incomparabil mai mic, datorit apariiei efectului determinat de blocuri. Folosind ns metoda similaritii participanilor
pentru a construi eantioanele dependente, acest efect al blocurilor se compenseaz i, prin urmare, precizia cercetrii va fi mult mai mare.
V putei da seama c izolnd o variabil confundat care contribuia
ntr-o bun msur la explicarea variabilei dependente, ai obinut un ctig
important n precizia i puterea cercetrii. Acest lucru a fost posibil prin simpla nlocuire a unui design de tip complet aleatoriu cu unul aleatoriu cu blocuri.
Creterea preciziei cercetrii poate fi posibil numai n cazul n care
variabila confundat are o legtur cu variabila dependent. n cazul n care,
de exemplu, am include n loc de vechimea ca fumtor, o alt variabil, s
spunem numrul de la pantofi, cercetarea nu numai c nu va ctiga n precizie, dar chiar va pierde din putere din cauza varianei suplimentare introdus
de o variabil care nu are nicio legtur cu variabila dependent. Atenie aadar la proiectarea cercetrilor de acest tip!
171
Brbai
Femei
nceptori
Medicament Naturist
Grup 1
Grup 2
Grup 5
Grup 6
Efect
Efect
medicament
naturist
Efect nceptori
Veterani
Medicament Naturist
Grup 3
Grup 4
Grup 7
Grup 8
Efect
Efect
medicament
naturist
Efect veterani
Efect brbai
Efect femei
Numrul de linii i de coloane din cadrul acestui design trebuie s fie egal cu numrul situaiilor determinate de variabila
independent. n cazul nostru, putem clasifica subiecii doar n
dou grupuri de cercetare, dup variabilele confundate vechime fumtor i gen biologic, deoarece tipul tratamentului
are doar dou condiii de cercetare;
Dac o variabil continu va fi folosit ca variabil confundat, este necesar transformarea acesteia n variabil categorial. Dei vechimea ca fumtor este o variabil continu, expri172
Cristian Opariuc-Dan
mat n ani, nu putem s o folosim nici mcar la nivel ordinal,
ca n designul de mai sus. Va trebui s mprim subiecii, pe
baza acestei variabile, n dou categorii: nceptori i veterani.
Toate aceste eforturi sunt ns rspltite printr-o precizie sporit a cercetrii, deoarece nu mai controlm o singur variabil confundat ci dou.
Acest plan de cercetare rmne totui un plan cu o singur variabil independent tratamentul. Problema se pune la nivelul controlului variabilelor confundate i nu la includerea unui numr mai mare de variabile independente.
Referitor la ipotezele statistice, de data aceasta ne confruntm cu trei
ipoteze statistice:
n primul rnd, putem spune c nu exist diferene semnificative ntre
mediile igrilor fumate de ctre subiecii care urmeaz un tratament medicamentos i subiecii care urmeaz un tratament naturist (H0:medi =natu).
n al doilea rnd, vom putea spune c nu exist diferene semnificative
ntre media igrilor fumate de ctre subiecii nceptori, n comparaie cu
media subiecilor veterani (H0:nceptor = veteran).
n al treilea rnd, presupunem c nu exist diferene semnificative ntre media igrilor fumate de ctre brbai i media igrilor fumate de femei
(H0:brbai = femei).
i n acest caz, interesul cade pe prima ipotez, celelalte avnd un rol
secundar, de izolare a variabilelor confundate.
Ecuaia designului cu ptrate latine are un numr de ase parametri,
fapt concludent pentru plusul de precizie pe care l aduce:
Yikmt= + k + m+ t +kmt + i(kmt)
Traducerea acestei expresii poate fi fcut destul de uor dac ai neles principiile expuse mai sus. Numrul mediu de igri fumate de ctre un
subiect i, aflat n situaia de tratament k, veteran n ale fumatului m i brbat t
173
174
Cristian Opariuc-Dan
Totui, nu m pot abine s nu v prezint, foarte pe scurt, cteva dintre
modelele complexe cele mai utilizate. n general, clasificarea planurilor de
cercetare se face dup cteva criterii (Kirk, 1995):
Utilizarea situaiilor de cercetare ncruciate sau pe baza modelului imbricat, numit i model cuib;
3. Diagonala de ptrat
GRB-p
GLS-p
HGLS-p
LS-p
LBIB-p
LPBIB-p
LUBIB-p
PBIB-p
176
Cod
Cristian Opariuc-Dan
Acum ce mai spunei? Nu-i aa c lucrurile stau puin altfel dect ai
crezut? V putei da seama c o afirmaie de genul plan factorial 2x2 nu mai
este suficient. Avei nevoie de ceva mai multe date pentru a v face cunoscute inteniile. Nu vom ncheia acest capitol nainte de a v prezenta, foarte
pe scurt, cteva dintre cele mai cunoscute planuri de cercetare complexe.
coala primar
Gimnaziu
Liceu
Masculin
30
30
30
Feminin
30
30
30
Efect principal
Gen biologic
Efect principal
colarizare
Efect de interaciune
Gen biologicxcolarizare
efecte reziduale,
pe care nu le determin niciuna
dintre cele dou
variabile
independente.
178
Cristian Opariuc-Dan
dintre posibilele variabile confundate este vechimea ca fumtor. n mod
cert, aceasta exercit un efect asupra variabilei dependente numr de igri
fumate, iar controlul acesteia se realizeaz similar designului cu blocuri din
planurile de baz. n primul rnd, mprim cei 120 de subieci dup nivelurile variabilelor independente, ca n tabelul 2.6. Vom avea 30 de subieci din
mediul rural care urmeaz un tratament medicamentos, 30 de subieci din
mediul rural care urmeaz un tratament naturist, 30 de subieci din mediul
urban cu tratament medicamentos i 30 de subieci din mediul urban cu tratament naturist.
Pn aici, nimic spectaculos. Avem un plan factorial complet randomizat, cu dou variabile independente. Pentru a transforma acest plan factorial ntr-un plan factorial randomizat cu blocuri, de tip RBF-22, va trebui s
includem variabila confundat. n acest moment, sunt necesare cteva explicaii suplimentare.
Prima variabil independent, mediul de provenien, este o variabil pe care cercettorul nu o poate controla. Un subiect pur i simplu provine
din mediul rural sau urban, prin faptul c locuiete acolo. Cercettorul nu are
nicio posibilitate s mute un subiect din mediul rural n mediul urban sau
invers. n termeni de specialitate, cercettorul nu poate s atribuie subiecii
aleatoriu n cadrul categoriilor acestei variabile. Din acest motiv, experimentele n care intervin asemenea variabile independente se numesc cvasiexperimente. Toate experimentele n care cercettorul poate atribui absolut
aleatoriu subiecii n toate categoriile variabilelor independente se numesc
experimente reale. n domeniul tiinelor socio-umane, cele mai multe experimente sau cercetri sunt cvasi-experimente. Alte variabile de acest tip sunt
genul biologic, grupa sanguin etc.
A doua variabil independent, tipul de tratament, permite atribuirea aleatorie a subiecilor n cele dou categorii medicamentos i naturist.
Un cercettor poate forma cele dou grupe de cercetare absolut aleatoriu. Din
179
Bloc 1
Bloc 2
Bloc 3
.
.
.
Bloc 60
MR
Subiect rang 1 R
Subiect rang 3 R
Subiect rang 5 R
.
.
.
Subiect rang 59 R
Primul bloc va fi format din subiecii cei mai tineri din punctul de
vedere al fumatului, att din mediul urban, ct i din mediul rural (rangurile 1
i 2). Al doilea bloc va conine subiecii cu rangurile 3 i 4, al treilea bloc
subiecii cu rangurile 5 i 6 i aa mai departe, pn la ultimul bloc. Am con-
180
Cristian Opariuc-Dan
struit astfel un plan factorial randomizat cu blocuri, dup cum se poate observa n tabelul 2.7.
Bineneles, acest plan factorial este superior planului factorial complet randomizat, deoarece permite includerea unei variabile confundate i,
implicit, creterea rigurozitii cercetrii. Ideal ar fi ca ambele variabile independente s permit atribuirea aleatorie a subiecilor. Dac acest lucru nu este
posibil, vom proceda dup schema prezentat.
Ecuaia caracteristic acestui design de cercetare este urmtoarea:
Yikm= + i + k + m+ ()km + ()ikm
Scorul observat este dat de media general, de efectul generat de blocuri (variabila confundat), de efectul exercitat de prima variabil independent, de efectul generat de a doua variabil independent, de efectul comun
generat de cele dou variabile independente i de efectul erorilor determinate
de cele dou variabile independente i de variabila confundat (erori determinate de bloc).
*
*
182
Cristian Opariuc-Dan
Vom avea, aadar, o singur variabil independent, cu dou grade de
intensitate (culoarea prului: blond i brunet) i o singur variabil dependent dihotomic (accident: Da i Nu).
Ipoteza nul a acestui studiu susine c nu exist nicio diferen semnificative ntre blonde i brunete referitor la producerea accidentelor rutiere.
Datele colectate pot fi sistematizate sub forma unui tabel, asemntor
tabelului de contingen, prezentat n capitolul anterior (tabelul 2.8).
Tabelul 2.8 Tabelul de analiz pentru 2
Cu accident
Fr accident
Total
Blonde
30
A
(26,04)
18
C
(21,95)
48
Brunete
21
B
(24,95)
25
D
(21,04)
46
Total
51
43
n=94
183
(formula 2.1)
unde fobs reprezint frecvena observat, fast reprezint frecvena estimat sau frecvena teoretic iar n numrul de categorii
Desigur, formula este analog celei expuse n capitolul I. Singura diferen se refer la notaia frecvenei teoretice. n capitolul I am notat-o cu
Fest, iar aici am convenit s o notm cu fast. Am procedat n acest fel pentru a
v obinui cu diferitele stiluri de notare ale formulelor pe care le putei ntlni
n lucrrile de specialitate.
De asemenea, modalitatea de calcul a frecvenei estimate (teoretice)
am prezentat-o n acelai capitol anterior. V-o reamintesc, n caz c ai uitato:
(formula 2.2)
Iat c avem toate datele necesare calculului, ns haidei s nu ne
grbim. n cazul nostru, tabelul are exact 4 celule, deoarece fiecare variabil
are dou grade de intensitate (dou niveluri). Cunoscnd aceast situaie, putem simplifica lucrurile i putem renuna la calculul frecvenei estimate, dac
aplicm o alt formul, valabil numai pentru tabele de acest tip tabele cu
patru celule (Radu, i alii, 1993):
(formula 2.3)
unde am notat cu f - frecvenele observate din cele patru celule.
Iat, vom aplica formula 2.3 pentru a obine valoarea testului 2, urmnd apoi s aplicm i formula 2.1 pentru a vedea c rezultatul este aproximativ acelai.
184
Cristian Opariuc-Dan
Diferenele dintre cele dou valori ale lui 2 (2,68 dup formula 2.3 i
2,75 dup formula 2.1) apar din cauza erorilor de rotunjire la dou zecimale
i sunt nerelevante. Dac ambele variabile sunt dihotomice, se folosete corecia pentru continuitate, aa cum s-a discutat deja n capitolul anterior.
Iat, cu graie i cteva calcule am reuit s gsim valoarea acestui indicator. Acum, dac tot o avem, ce facem cu ea? Ei bine, comparm aceast
valoare cu valorile prag prezentate n tabelul de referin din anexa 3. Mai
avem o singur problem: la cte grade de libertate? V mai aducei probabil
aminte din primul capitol c gradele de libertate se afl foarte simplu, pe baza
liniilor i a coloanelor din tabel. Astfel df=(linii-1)(coloane-1). Noi avem
dou linii i dou coloane, prin urmare df=(2-1)(2-1)=1x1=1. Linia care ne
intereseaz este, aadar, prima linie din tabelul din anex. Pentru un prag de
semnificaie p<0,05, valoarea indicatorului 2 trebuie s fie mai mare de
3,841. Valorile noastre sunt mult mai mici n comparaie cu aceast valoare
185
de referin, prin urmare testul 2 nu este semnificativ i astfel nu vom respinge ipoteza nul.
Aadar, iat c nu exist diferene semnificative ntre blonde i brunete sub aspectul accidentelor comise. Altfel spus, culoarea prului nu determin niciun efect asupra probabilitii de comitere a unui accident. Diferenele
dintre blonde i brunete, sub acest aspect, sunt absolut ntmpltoare, culoarea prului neavnd niciun cuvnt de spus. V-ai linitit acum, fetelor?
Particularitile acestui coeficient, precum i semnificaia sa, sunt
elemente tratate pe larg n primul capitol, asupra crora nu vom reveni aici.
Pentru detalii, consultai capitolul referitor la analiza relaiilor ntre variabile.
Testul 2 se mai numete i test de concordan, deoarece permite
compararea distribuiei datelor observate numite i date empirice cu o
repartiie teoretic. Prin intermediul acestor teste se poate nelege legea de
evoluie a fenomenului studiat i se poate chiar verifica posibilitatea de utilizare a testelor parametrice (Vasilescu, 1992). Asupra acestor aspecte vom
reveni spre finalul capitolului.
Desigur, m vei ntreba dac mai exist vreo modalitate prin care s
verificm aceast ipotez, sau suntem dependeni complet de 2. Sunt fericit
s v informez c da, ntr-adevr, mai exist o variant. Totui, i aceasta se
bazeaz pe 2, ns pornete de la o alt teorie, cea a probabilitii maximale
(n englez maximum-likelihood theory). Ideea general este aceea a construirii unui model teoretic pentru care probabilitatea de obinere a datelor s fie
maxim, apoi compararea datelor observate cu acel model teoretic. Diferena
este una subtil i ine de teoria mai sus menionat, teorie pe care o vom
aborda i noi ntr-un alt volum. Aceast metod se numete metoda raportului
de probabilitate (likelihood ratio), iar indicatorul acestui test se calculeaz
dup formula:
186
Cristian Opariuc-Dan
(formula 2.4)
Acest indicator se raporteaz la tabelul din anexa 3, la fel ca i 2. Desigur, testul este din nou nesemnificativ, determinndu-ne s nu respingem
ipoteza nul. Pentru eantioane sau loturi de cercetare de mari dimensiuni,
valoarea acestui indicator se apropie foarte mult de valoarea lui 2. Totui,
acest indicator se prefer atunci cnd volumul eantionului este mic, fiind un
indicator mai precis n comparaie cu 2.
n final, m simt dator s v atrag atenia asupra ctorva elemente legate de utilizarea testului 2 i a tuturor indicatorilor derivai din acesta
(Field, 2000):
Dei 2 se poate folosi i pentru date ordinale sau chiar parametrice (dup cum vom vedea), vom prefera totui s-l utilizm n cazul datelor strict nominale, sau atunci cnd lucrm
exclusiv cu frecvene. Este, de fapt, singurul test statistic pentru date aflate la un nivel categorial de msur. Din cauza puterii sale reduse, pentru date ordinale sau parametrice vom prefera alte teste;
Testul 2 este relevant doar atunci cnd toate frecvenele ateptate au valori mai mari dect 5. Dac exist celule n care frecvenele ateptate sunt sub 5, testul 2 i pierde puterea. Totui,
n tabelele de contingen de mari dimensiuni (n care variabilele au multe niveluri) se accept i unele celule cu frecvena
ateptat sub 5, dar acestea nu trebuie s depeasc 20% din
numrul total de celule;
Cristian Opariuc-Dan
V reamintesc c scorurile nregistrate nu reprezint numrul de accidente produse ci calificativul acestora, dup scala ordinal de mai sus. Am
folosit un numr de doar 20 de cazuri din considerente didactice. n realitate,
un asemenea studiu are mult mai muli subieci.
Desigur, nu se pune problema aplicrii testelor parametrice, variabila
dependent fiind aflat n mod natural la un nivel de msur ordinal. Ne decidem s verificm ipoteza nul prin testul medianei. Primul pas presupune
calculul medianei pentru cele dou grupe de cercetare. Ordonm datele, cresctor sau descresctor, mediana aflndu-se la a 5,5-a msurtoare, dup cum
tii deja.
189
Me(blonde)= 2
Brunete: 0, 0, 0, 1, 1, 1, 2, 2, 2, 3
Me(brunete)=1
Me=1,5
Mediana ntregului lot de cercetare este 1,5, fiind situat, n mod evident, la a 10,5-a msurtoare, ntre valorile 1 i 2. Stabilind aceste elemente
de baz, urmeaz s contabilizm numrul de scoruri aflate sub valoarea medianei generale i numrul de scoruri aflate peste valoarea medianei generale.
Pentru aceasta vom construi urmtorul tabel de contingen:
Tabelul 2.9 Tabelul de analiz pentru testul medianei
Blonde
Brunete
Total
Sub mediana
general (Me)
4
A
6
C
10
Peste mediana
general (Me)
6
B
4
D
10
Total
10
10
n=20
190
Cristian Opariuc-Dan
(formula 2.5)
Acum suntem n situaia fericit n care nu avem scoruri egale cu mediana general. Dac aceasta ar fi fost, s spunem, 2, am fi avut un numr de
6 scoruri (3 pentru blonde i 3 pentru brunete) egale cu mediana. n asemenea
cazuri, vom include scorurile egale cu mediana o dat n categoria scorurilor
sub mediana general, i a doua oar n categoria celor peste mediana general, construind dou tabele de contingen cu scoruri egale cu mediana
aflate n categoria scorurilor sub median i al doilea tabel, cu scoruri egale
cu mediana aflate n categoria scorurilor peste mediana general. Vom calcula, dup modelul de mai sus, valoarea testului 2 pentru ambele tabele i vom
lua n considerarea tabelul care are valoarea mai mic a testului 2.
191
Accidente
Grup
Blonde
Brunete
20
Total
3
5
2
2
1
1
2
3
2
1
3
3
3
2
1
2
2
1
1
0
20
20
Dac privim cu atenie tabelul de mai sus, vom observa c, cel puin
n aparen, avem condiiile aplicrii unor teste parametrice. Totui, nu este
aa, acel scor extrem (20 accidente) determinnd o distribuie skewness pozi192
Cristian Opariuc-Dan
tiv, cu tendine ctre valori mici ale accidentelor. n acest caz, evident c vom
folosi teste neparametrice n locul celor parametrice, mai exact testul U
Mann-Whitney.
Pentru a determina valoarea exact a testului statistic, trebuie, n primul rnd, s ordonm cresctor sau descresctor datele, apoi s calculm
rangurile. Realizm acest lucru prin cumularea cele dou iruri ntr-unul singur. Vom avea 8 femei cu zero accidente, 4 femei cu un accident, 2 femei cu
dou accidente i aa mai departe, pn la o singur femeie cu 20 de accidente (tim deja c este blond). Evident, irul a fost n prealabil ordonat cresctor dup numrul accidentelor.
Tabelul 2.11 Calculul rangurilor
Accidente
Grup
Blonde
Brunete
Total
Poziii
Rang
20
Total
3
5
8
1
2
3
4
5
6
7
8
4,5
2
2
4
9
10
11
12
1
1
2
13
14
2
3
5
15
16
17
18
19
2
1
3
20
21
22
3
3
6
23
24
25
26
27
28
3
2
5
29
30
31
32
33
1
2
3
34
35
36
2
1
3
37
38
39
1
0
1
40
20
20
40
10,5
13,5
17
21
25,5
31
35
38
40
Calculul rangurilor din tabelul 2.11 s-ar putea s v deruteze puin, ns nu v impacientai. Opt femei nu au comis niciun accident. n mod cert,
ele vor ocupa primele opt poziii n irul ordonat (poziiile de la 1 la 8). Deoarece cele opt poziii au aceeai valoare (valoarea zero accidente), rangul va fi
reprezentat de media poziiilor ocupate de scoruri. Adunnd numerele de la
193
unu la opt i mprind suma la opt, rezult 4,5, acesta fiind rangul scorului
zero accidente.
Urmtoarele patru femei au comis cte un singur accident. Bineneles, ele vor ocupa poziiile urmtoare, de la poziia a noua, la poziia doisprezece. Rangul scorului un accident rutier va fi media acestor patru poziii
de la 9 la 12 , adic 10,5. Procedm similar pentru a calcula rangurile tuturor scorurilor din distribuia noastr. Nu este deloc dificil, doar diferit fa de
cum erai dumneavoastr obinuii.
n urmtoarea etap, va trebui s calculm suma rangurilor pentru fiecare grup de cercetare. Din moment ce tim deja rangul fiecrui scor, suma
rangurilor se calculeaz foarte simplu, nmulind efectivul care a obinut scorul respectiv, cu rangul asociat scorurilor, apoi adunnd toate aceste produse.
Pentru a ne uura sarcina, vom construi tabelul 2.12 i obinem suma rangurilor pentru grupul blondelor de 444,5 i suma rangurilor pentru brunete 375,5.
Suma total a rangurilor va fi 820 (R1+R2=444,5+375,5=820).
Tabelul 2.12 Calculul sumei rangurilor
Scor
0
1
2
3
4
5
6
7
8
20
Blonde
Efectiv
Rang
(f)
(r)
3
4,5
2
10,5
1
13,5
2
17
2
21
3
25,5
3
31
1
35
2
38
1
40
R1=444,5
fxr
13,5
21
13,5
34
42
76,5
93
35
76
40
194
Brunete
Efectiv
Rang
(f)
(r)
5
4,5
2
10,5
1
13,5
3
17
1
21
3
25,5
2
31
2
35
1
38
0
40
R2=375,5
fxr
22,5
21
13,5
51
21
76,5
62
70
38
0
Cristian Opariuc-Dan
Ca msur suplimentar de precauie, vom verifica dac suma total a
rangurilor este egal cu
) (formula 2.6)
195
Cristian Opariuc-Dan
Vom ncheia prezentarea acestui test statistic atrgnd atenia asupra
unui singur element: atunci cnd comparm direct valoarea U cu valorile
prag prezentate n tabelul din anexa 8, aceasta trebuie s fie mai mic sau
cel mult egal cu valoarea prag pentru ca testul s prezinte semnificaie statistic. Dac ns lucrm cu notele z, atunci valoarea notei z pentru testul U
trebuie s fie mai mare dect valorile prag pentru ca acesta s prezinte semnificaie statistic. Am accentuat asupra acestor idei, deoarece de multe ori se
creeaz confuzie la interpretarea semnificaiei testului statistic U MannWhitney.
Acest test statistic, dei preferat n mai toate cercetrile care folosesc
date neparametrice, se folosete atunci cnd numrul de ranguri egale nu este
foarte mare. Dac aceast condiie nu poate fi ndeplinit din cauza naturii
datelor, atunci se prefer testul medianei sau se administreaz o serie de procedee i tehnici de corecie pentru egalitatea rangurilor, aceasta fiind ns
prea complexe pentru ca s le discutm n cadrul acestui volum.
197
nbl=20
Brunete: 3, 5, 1, 1, 1, 2, 2, 0, 1, 2, 0, 0, 1, 2, 3, 4 ,3, 5, 1, 1, 3
nbr=21
198
Cristian Opariuc-Dan
Nu ne rmne dect s calculm valoarea z a testului iteraiilor, dup
formula urmtoare:
(
(formula 2.8)
Toate datele necesare nlocuirii n formul exist deja, iar dup efectuarea calculelor obinem o valoare z de -3,03.
(
Aceast valoare obinut, luat fr semn, este mai mare dect valoarea critic 2,58 pentru un prag de semnificaie mai mic de 0,01, astfel nct
putem respinge ipoteza nul. Folosind aceste date, putem spune c, ntradevr, de aceast dat culoarea prului are efect. Exist diferene ntre blonde i brunete sub aspectul numrului de accidente comise.
Pentru a vedea sensul acestor diferene, adic pentru a vedea dac
blondele comit mai multe accidente n comparaie cu brunetele sau invers, nu
avem dect s calculm medianele celor dou iruri.
Acest test statistic este destul de puin folosit n tiinele socio-umane,
deoarece procesul de creare a secvenelor este unul miglos i de durat. De
cele mai multe ori procedeul este folosit pentru a verifica dac irul de date
are sau nu are un caracter aleatoriu. Desigur, procedeul de calcul este altul, se
folosete irul de date neordonat, calculndu-se nota z dup o alt formul.
Atunci cnd dorim s verificm dac datele au un caracter aleatoriu,
alturi de acest test mai avem la dispoziie testul fazelor Wallis-Moore sau
199
200
Cristian Opariuc-Dan
nainte 10 igri, iar dup tratament fumeaz 6 igri. Subiectul P.A. fumeaz
nainte de tratament 9 igri, dup tratament 10 igri i aa mai departe.
Tabelul 2.13 Modalitate de calcul pentru testul semnelor
Subiect
M.C.
P.A.
D.V.
S.T.
B.L.
A.T.
M.Z.
R.V.
I.G.
J.I.
S.I.
A.C.
nainte
10
9
15
13
12
18
21
32
35
24
26
18
8
Dup
6
10
11
11
12
18
20
15
12
29
10
7
=
2
Diferene
+
=
=
+
+
2
Egalitile nu ne intereseaz, decizia lundu-se doar la nivelul semnelor pozitive i negative. Prin urmare, -=8 i +=2. Numrul total de cazuri
(n) va fi considerat + + -, adic 8+2=10. Valoarea de referin (s) reprezint cea mai mic valoare dintre totalul semnelor negative i totalul semnelor pozitive. Deoarece avem 8 semne negative i 2 semne pozitive, valoarea cea mai mic este, evident, 2 i corespunde semnelor pozitive. Prin urmare, s=2 i n=10. Valoarea lui n fiind mic (sub 30 de cazuri), putem raporta
valoarea s la tabelul din anexa 10. Pentru n=10, valoarea de referin la un
prag de semnificaie mai mic de 0,01 este 1 (a treia linie din anexa 10). Noi
am obinut valoarea 2, o valoare care depete valoarea critic minim. Prin
urmare, testul este nesemnificativ, fiind nevoii s nu respingem ipoteza nul.
n cazul n care numrul de semne (n) este mai mare de 30, distribuia
acestora se apropie de o distribuie normal, avnd sens calculul notei z, dup
formula urmtoare:
201
(formula 2.9)
n ambele situaii, valoarea z este 1,58, mai mic dect valoarea prag
1,96 pentru un prag de semnificaie mai mic de 0,05. Desigur, testul este nesemnificativ era i normal s fie aa , nu vom respinge ipoteza nul conform creia tratamentul anti-fumat nu are nici un efect.
Cristian Opariuc-Dan
nu are importan, iar nivelul de msur poate fi cel puin unul ordinal. Testul
semnelor i proba Wilcoxon pot fi administrate valorilor sau rangurilor, fr
ca acest lucru s influeneze importana lor.
Pentru clarificare, vom relua exemplul folosit anterior, de data aceasta
urmrind calculul unui test statistic mai eficient. Ai dedus bine, este vorba
despre testul Wilcoxon.
Primul pas, la fel ca i n cazul celeilalte probe, se refer la calculul
diferenelor dintre scoruri. De aceast dat vom reine i valorile acestor diferene. Probabil c ai observat un lucru de nuan; dac la testul semnelor
diferena a fost Dup nainte, aici diferena este nainte Dup. n realitate
acest lucru nu are nicio importan. Singura diferen obinut va fi cea legat
de semn. Diferenele pozitive vor fi negative n al doilea caz i reciproc. Nu
este cazul s v batei capul prea tare cu aceste diferene, rmne la latitudinea dumneavoastr s le efectuai cum dorii. Dac folosii prima situaie
Tabelul 2.14 Modalitate de calcul pentru testul Wilcoxon
(Dup nainte) i obiSubiect
nainte
Dup
Diferene
Ranguri
nei o diferen semnificaM.C.
10
6
+4
+4,5
tiv pozitiv, atunci nP.A.
9
10
-1
-1,5
D.V.
15
11
+4
+4,5
seamn c tratamentul a
S.T.
13
11
+2
+3
avut efect, n sensul c a
B.L.
12
12
0
A.T.
18
18
0
crescut numrul de igri
M.Z.
21
20
+1
+1,5
fumate normal, deoarece
R.V.
32
15
+17
+9
diferena pozitiv provine
I.G.
35
12
+23
+10
J.I.
24
29
-5
-6
din faptul c valorile n
S.I.
26
10
+16
+8
situaia Dup sunt mai
A.C.
18
7
+11
+7
mari dect valorile n situR+
47,5
R7,5
aia nainte. Dac diferena este semnificativ i negativ, nseamn c tratamentul a avut efect n
sensul reducerii numrului de igri, conform aceluiai algoritm.
203
204
Cristian Opariuc-Dan
(formula 2.10)
Datele din formul sunt tiute. La fel ca i n cazul anterior, suma rangurilor este cea mai mic sum a rangurilor dintre suma rangurilor pozitive i
suma rangurilor negative.
205
206
Cristian Opariuc-Dan
Media populaiei poate nsemna, ad-litteram, media obinut de o colectivitate mare la un parametru. De exemplu, media sticlelor de bere pe care
le beau studenii universitii Ovidius din Constana poate fi considerat o
medie teoretic (valoarea dat). Dac din acea universitate vom extrage un
eantion de studeni de la psihologie, media sticlelor de bere pe care acetia le
consum reprezint media eantionului.
O alt accepie a mediei populaiei cunoscut mai frecvent sub denumirea de medie teoretic este legat de instrumentul de msur. De
exemplu, itemul Ct de frecvent consumai bere? poate primi rspunsuri pe
o scal de la 1 la 5, unde 1 nseamn niciodat iar 5 nseamn ntotdeauna.
Niciodat
1
ntotdeauna
2
n acest caz, media teoretic (valoarea dat) este reprezentat de mijlocul scalei (valoarea 3), valoare cu care se poate compara media eantionului
format din subiecii care au rspuns la acest item.
O variant a celor expuse mai sus se refer la media teoretic a unui
instrument format din mai muli itemi. De exemplu, un instrument care msoar anxietatea prin 25 de itemi de tipul Da i Nu, poate avea o amplitudine a rspunsurilor cuprins ntre zero puncte (dac un subiect rspunde
nesemnificativ clinic la toi itemii) i 25 de puncte (dac un subiect rspunde
semnificativ clinic la toi itemii). n acest caz, media teoretic va fi de 12,5,
mijlocul scalei anxietate din inventar.
Cunoscnd cteva dintre sensurile mediei populaiei, v doresc mult
succes la crearea de instrumente i s vedem cum putem compara un eantion
cu o populaie.
207
(formula 2.11)
unde m este media eantionului, este valoarea dat (presupusa medie a populaiei), este abaterea standard a populaiei din care provine
eantionul iar n se refer la mrimea eantionului.
Formula este foarte uor de aplicat. S presupunem c studenii universitii Ovidius din Constana consum, n medie, 1,3 litri de bere pe zi (),
cu o abatere standard de 2,1 litri de bere (). Am dori s tim dac studenii
de la psihologie consum semnificativ mai mult bere n comparaie cu media pe universitate. Pentru aceasta, convocm un eantion de 34 de studeni la
psihologie, mergem la restaurant timp de o sptmn i vedem cam ct
bere consum. Presupunem c am ajuns la concluzia c acetia consum, n
medie, 2,1 litri de bere zilnic (m).
H0: m= - Nu exist nicio diferen semnificativ ntre cantitatea de
bere consumat de studenii de la psihologie (populaia din care a fost extras
eantionul) i cantitatea de bere consumat de studenii universitii Ovidius
Constana (valoarea teoretic dat, cu care se compar media populaiei din
care s-a extras eantionul);
H1: m> - Studenii de la psihologie consum semnificativ mai mult
bere n comparaie cu studenii universitii Ovidius Constana.
Ipoteza alternativ este, n mod cert, o ipotez unilateral. De ce am
formulat aa, vom vedea imediat.
208
Cristian Opariuc-Dan
Avnd toate aceste informaii, presupunnd c datele se distribuie
normal la nivelul populaiei de studeni de la psihologie, constatm c ndeplinim condiiile de aplicare ale testului z.
209
Folosind testul z am artat c studenii de la psihologie consum semnificativ mai mult bere n comparaie cu media consumului studenilor universitii Ovidius. Dac valoarea z ar fi fost negativ (dac am fi artat c
studenii consum semnificativ mai puin bere), ipoteza alternativ, formulat unilateral, ca mai sus, nu s-ar fi putut susine.
(formula 2.12)
210
Cristian Opariuc-Dan
un nou tip de bere (de fapt exact berea neagr Guinness pe care o bem acum).
Proaspt absolvent al universitii Oxford, Gosset a fost imediat botezat de
ctre noul su patron cu numele de studentul. Monitoriznd ingredientele
berii i inventnd testele t, studentul a vzut ce anume face diferena semnificativ la nivel de calitate. Deoarece procedeul de fabricaie inclusiv
metodele matematice folosite reprezentau un secret comercial, Gosset a fost
nevoit s publice descoperirea testelor t, n revista Biometrika, nu sub numele
su real ci sub pseudonimul cu care l gratulase eful su. Acesta este motivul
pentru care cele mai cunoscute teste statistice de comparaie poart un nume
att de ciudat.
Dup ce ne-am relaxat puin, vom reconsidera exemplul anterior. Studenii universitii Ovidius din Constana consum, n medie, 1,3 litri de bere
pe zi (), iar un eantion de 34 de studeni la psihologie, consum, n medie,
2,1 litri de bere zilnic (m), cu o abatere standard de 3,1 litri de bere (s). n
acest caz, valoarea testului t devine:
Cristian Opariuc-Dan
S presupunem c dorim s aflm dac studenii universitii Ovidius
din Constana beau mai mult sau mai puin bere n comparaie cu studenii
universitii Alexandru Ioan Cuza din Iai.
H0: m1=m2 Nu exist nicio diferen ntre cantitatea de bere but de
ctre studenii universitii Ovidius din Constana i cantitatea de bere but
de ctre studenii universitii Alexandru Ioan Cuza din Iai.
H1: m1m2 ntre cantitatea de bere but de studenii universitii
Ovidius Constana i cantitatea de bere but de studenii universitii Alexandru Ioan Cuza din Iai exist o diferen semnificativ.
n mod cert, ipoteza alternativ este o ipotez bilateral, pragurile de
semnificaie fiind 1,96 pentru p<0,05 i 2,58 pentru p<0,01. Nu avem nevoie
dect de abaterile standard la nivelul populaiei pentru a desfura cercetarea.
S presupunem c abaterea standard a studenilor universitii Ovidius este de
1,34 litri de bere, iar cea a studenilor universitii Alexandru Ioan Cuza este
de 1,76 litri de bere.
Desfurnd cercetarea pe un lot de cercetare de 42 de persoane de la
universitatea Ovidius Constana, am constatat c media berii consumate este
de 2,10 litri, n timp ce pe lotul de cercetare de 45 de persoane de la Iai, media a fost de 1,87 litri. Ne punem problema dac cele dou medii difer semnificativ. Notm cu m1 media pentru Constana i cu m2 media pentru Iai,
dup care aplicm formula.
213
(formula 2.15)
unde s2 este dispersia ntregului lot de cercetare, obinut prin cumularea dispersiilor celor dou eantioane independente.
Formula 2.15 este, n general, mai puin utilizat n comparaie cu
formula 2.14, dintr-un motiv foarte simplu; este mai uor s calculm varianele (sau abaterile standard) fiecrui eantion dect s cumulm datele celor
dou eantioane i s introducem pai de calcul suplimentari, doar pentru a
calcula variana total a celor dou eantioane, aa cum o cere formula 2.15.
n exemplul de mai sus, alturi de medii (m1=2,10 litri i m2=1,87 litri) i de numrul de studeni (n1=45 studeni i n2=45 studeni) vom presupune c tim i abaterile standard (s1=0,35 litri i s2=0,98 litri). De fapt,
aceasta este i situaia clasic de cercetare. Mult mai uor aflm abaterile
standard ale unui eantion (s) dect abaterile standard ale populaiei ().
214
Cristian Opariuc-Dan
Valoarea testului t obinut (1,48) o comparm cu valoarea de referin din anexa 4. nainte de a face acest lucru, trebuie s decidem asupra numrului de grade de libertate. Deoarece vorbim despre dou eantioane independente, tii deja c fiecare eantion pierde un grad de libertate. Atunci, numrul total al gradelor de libertate va fi df=n1+n2-2. Adic, n situaia noastr, df
va fi 45+45-2=88 grade de libertate.
n tabel, pentru 80 de grade de libertate (valoarea imediat inferioar
valorii cutate), avem, pentru un p<0,05, o valoare a testului t de 1,99 n cazul ipotezei unidirecionale i 1,66 pentru ipoteza bidirecional. Indiferent de
modul n care formulm ipoteza, valoarea noastr (1,48) este mai mic dect
valoarea prag. Testul este nesemnificativ, nu exist nicio diferen ntre cantitile de bere consumate de studenii universitii Ovidius n comparaie cu
cei de la Iai. Asta este situaia, nu putem respinge ipoteza nul, toi studenii
sunt aproximativ la fel sub aspectul consumului de bere.
Referitor la acest test statistic, formula 2.14 sau 2.15 se aplic doar
atunci cnd dispersiile sunt egale (cnd s1=s2). Desigur, este aproape imposibil s ntlnim dispersii absolut egale, de aceea egalitatea varianelor (dispersiilor) se verific printr-un alt test statistic (testul F al lui Levene) pe care nu-l
vom detalia acum. Tot ceea ce v pot spune este c acest test statistic are ca
ipotez nul egalitatea varianelor populaiilor din care au fost extrase eantioanele (H0: s1=s2=s3=.=sn). Dac testul nu este semnificativ, atunci nu
respingem ipoteza nul i putem aplica formulele 2.14 sau 2.15. Dac testul
215
ceva dect un raport al celor dou variane. Acest raport se verific folosinduse distribuia F, distribuie pe care nu o vom trata n acest volum, ci o vom
aborda n urmtoarea carte, cnd vom discuta despre analiza de varian.
n exemplul nostru, evident c cele dou variane nu sunt egale. M
vei crede pe cuvnt atunci cnd v voi spune c testul F este semnificativ,
ipoteza nul a egalitii varianelor fiind respins. Atunci, valoarea corect a
testului t, n cazul nostru, va fi 1,49.
Nu este cine tie ce ctig, este doar o ajustare. Oricum, testul t rmne, n continuare, nesemnificativ.
Cristian Opariuc-Dan
H0: m1=m2 - Nu exist nicio diferen ntre mediile celor dou populaii din care s-au extras eantioanele perechi (ipoteza nul);
H1: m1m2 - Exist o diferen semnificativ ntre mediile celor dou
populaii din care s-au extras eantioanele perechi (ipotez alternativ bilateral);
H2: m1>m2 - Media primului eantion este semnificativ mai mare n
comparaie cu media celui de-al doilea eantion (ipotez alternativ unilateral).
H3: m1<m2 - Media primului eantion este semnificativ mai mic n
comparaie cu media celui de-al doilea eantion (ipotez alternativ unilateral).
Pentru a nu ne limita la o abordare simplist, s considerm urmtorul
experiment:
Un numr de 15 fumtori au participat la o edin de psihoterapie n
vederea abandonrii fumatului. Ne intereseaz s tim dac edina de psihoterapie a avut sau nu a avut efect. Prin urmare, ce s-a ntmplat cu numrul
igrilor fumate de ctre cei 15 fumtori dup psihoterapie. Ipoteza nul ne
spune c edina de psihoterapie nu are niciun efect. Transpus n termeni tiinifici, avem urmtoarele posibiliti:
H0: m1=m2 Nu exist nicio diferen semnificativ ntre media igrilor fumate nainte de edina de psihoterapie i media igrilor fumate dup
edina de psihoterapie (ipoteza nul);
H1: m1m2 Exist o diferen semnificativ ntre media igrilor fumate nainte de edina de psihoterapie i media igrilor fumate dup edina
de psihoterapie (ipotez alternativ bilateral);
H2: m1>m2 Media igrilor fumate naintea edinei de psihoterapie
este semnificativ mai mare n comparaie cu media igrilor fumate dup e217
nainte Dup
30
18
19
16
28
20
41
21
25
14
23
12
32
11
28
10
26
5
31
12
38
11
40
4
42
13
41
19
35
10
n=15
Dup-nainte
-12
-3
-8
-20
-11
-11
-21
-18
-21
-19
-27
-36
-29
-22
-25
dif=-283
(Dup-nainte)2
144
9
64
400
121
121
441
324
441
361
729
1296
841
484
625
dif2=6401
218
Cristian Opariuc-Dan
Ultima etap de calcul n tabel presupune ridicarea la ptrat a tuturor
diferenelor i calculul sumei acestor ptrate. Suma ptratelor diferenelor
este, pentru studiul propus, de 6401. Imediat vom vedea la ce ne folosete.
Testul t Student pentru eantioane perechi se calculeaz dup expresia
urmtoare:
(formula 2.17)
(formula 2.18)
Desigur, avem deja toate datele necesare pentru a calcula dispersia diferenelor.
(
219
220
Cristian Opariuc-Dan
(formula 2.21)
Ipoteza nul a acestui test statistic postuleaz c valoarea nu este aberant. Dac testul este semnificativ, atunci se respinge ipoteza nul, valoarea
222
Cristian Opariuc-Dan
testat fiind aberant. Testul statistic este semnificativ dac valoarea sa este
mai mare sau egal cu valoarea de referin prezentat n tabelul din anexa
12.
Pentru n=18, valoarea de referin este 2,17 la un prag de semnificaie
mai mic de 0,05 i 3,00 pentru un prag de semnificaie mai mic de 0,01. n
mod cert, testul nostru este semnificativ la un prag de semnificaie mai mic
de 0,01, ipoteza nul se respinge, valoarea testat (2) fiind o valoare aberant.
0,576
0,546
0,521
0,546
0,525
0,507
0,490
0,475
0,462
0,450
0,440
0,430
0,421
0,413
0,406
0,679
0,642
0,615
0,641
0,616
0,595
0,577
0,561
0,547
0,535
0,524
0,514
0,505
0,497
0,489
| (formula 2.24)
| (formula 2.25)
223
S presupunem
c avem un ir ordonat
cresctor, n acest caz
vom avea valorile x1, x2,
x3, x4, x5 xn-2, xn-1, xn,
cu proprietatea c x1
este cea mai mic valoare din ir (n situaia
noastr valoarea suspect) iar xn este cea mai
mare valoare din ir.
n
20
25
30
35
40
45
50
55
60
65
70
75
80
0,05
2,557
2,663
2,745
2,811
2,866
2,914
2,956
2,992
3,025
3,055
3,082
3,107
3,130
0,01
2,884
3,009
3,103
3,178
3,240
3,292
3,336
3,376
3,411
3,442
3,471
3,496
3,251
n
0,05
0,01
85
3,151
3,543
90
3,171
3,563
95
3,189
3,582
100
3,207
3,600
105
3,224
3,617
110
3,239
3,632
115
3,254
3,647
120
3,267
3,662
125
3,281
3,675
130
3,294
3,688
135
3,306
3,700
140
3,318
3,712
145
3,328
3,723
dup (Vasilescu, 1992)
224
Cristian Opariuc-Dan
raie cu valorile prag precizate n tabelul 2.17.
Deoarece vorbim despre eantioane mari, calculul testului Grubbs se
poate efectua doar dac datele au o distribuie normal, acesta bazndu-se pe
medie i abatere standard.
(formula 2.26)
(formula 2.27)
Dac valoarea testat este cea mai mare din ir, se folosete formula
2.26, iar dac valoarea testat este cea mai mic din ir, formula 2.27.
Cred c ai observat deja un lucru interesant. Testul Grubbs nu reprezint altceva dect nota z a scorului presupus aberant.
S considerm un exemplu, n care un numr de 130 de subieci au
efectuat un test de atenie. Media scorurilor obinute de cei 130 de subieci
este m=21,35 puncte iar abaterea standard s=5,41 puncte. Ne ntrebm dac
scorul maxim x=53 puncte este sau nu un scor aberant.
Pentru c valoarea testat este cea mai mare valoare din ir, aplicm
formula 2.26 pentru testul Grubbs.
225
Cristian Opariuc-Dan
Da, aa este, revenim, iat, la bazele statisticii. Procedura este analog, doar
c vom folosi media i abaterea standard pentru crearea claselor.
Tabelul 2.18 Testul de normalitate bazat pe 2
Clase
Clasa 1 (i=1)
< m-2,5s
< 13,58
Clasa 2 (i=2)
(m-2,5sm-2s]
13,58-14,65
Clasa 3 (i=3)
(m-2sm-1,5s]
14,66-15,72
Clasa 4 (i=4)
(m-1,5sm-1s]
15,73-16,79
Clasa 5 (i=5)
(m-1sm-0,5s]
16,80-17,86
Clasa 6 (i=6)
(m-0,5sm]
17,87-18,93
Clasa 7 (i=7)
(mm+0,5s]
18,94-20,00
Clasa 8 (i=8)
(m+0,5sm+1s]
20,01-21,07
Clasa 9 (i=9)
(m+1sm+1,5s]
21,08-22,14
Clasa 10 (i=10)
(m+1,5sm+2s]
22,15-23,21
Clasa 11 (i=11)
(m+2sm+2,5s]
23,22-24,28
Clasa 12 (i=12)
> m+2s
> 24,28
TOTAL
zi
F(zi)
(zi)
f*(zi)
f-ft
(f-ft)2
(f-ft)2/ft
-2,5
0,0062
0,0062
0,0062
0,9938
0,98763844
159,296523
-2
0,0228
0,0166
0,0664
3,9336
15,473209
233,030255
15
-1,5
0,0668
0,044
0,66
14,34
205,6356
311,569091
49
-1
0,1587
0,0919
4,5031
44,4969
1979,97411
439,691348
65
-0,5
0,3085
0,1498
9,737
55,263
3053,99917
313,648883
104
0,5000
0,1915
19,916
84,084
7070,11906
354,99694
97
+0,5
0,6915
0,1915
18,5755
78,4245
6150,4022
331,102915
87
+1
0,8413
0,1498
13,0326
73,9674
5471,17626
419,806966
38
+1,5
0,9332
0,0919
3,4922
34,5078
1190,78826
340,985127
18
+2
0,9772
0,044
0,792
17,208
296,115264
373,882909
+2,5
0,9938
0,0166
0,083
4,917
24,176889
291,287819
+3
0,9987
0,0049
0,0147
2,9853
8,91201609
606,259598
486
4175,55837
Exist mai multe variante de lucru. Cea mai comod variant este s
lucrm cu intervale avnd dimensiunea de jumtate de abatere standard. Exis-
227
tnd ase abateri standard ntr-o distribuie normal, vor rezulta un numr de
12 clase.
Prima clas va conine scorurile mai mici dect media minus 2,5 abateri standard. A doua clas cuprinde scorurile cuprinse ntre media minus 2,5
abateri standard i media minus 2 abateri standard. Clasa a treia se refer la
scoruri cuprinse ntre media minus 2 abateri standard i media minus 1,5 abateri standard i aa mai departe, dup cum putei vedea n tabelul 2.18.
Dup construcia claselor, stabilim, evident, frecvenele absolute la
nivelul fiecrei clase. Urmeaz calcului variabilei normale z, pentru fiecare
dintre cele 12 clase, dup expresia urmtoare
(formula 2.28)
Este formula clasic de calcul a notelor z, unde lsup(i) se refer la limita
superioar a clasei i. Pentru prima clas, am avea:
Cristian Opariuc-Dan
prezentat n tabelul din anexa 13, tabel care ne ajut s extragem probabilitile teoretice pentru fiecare scor z. nainte de a efectua calculele, se impune
totui s precizm c dac scorul z este negativ, atunci F(-z)=1 F(z). Adic,
pentru a calcula un scor z negativ, trebuie s scdem din valoarea 1, valoarea
F(z) din tabel pentru acel scor. Vedem imediat cum se procedeaz.
Prima clas are z=-2,5. n tabelul din anexa 13, pentru un z=2,5 avem
F(z)=0,9938. Cum ns z este negativ, obinem F(z)=1 0,9938, adic 0,0062.
A doua clas are z=-2. n tabelul din anexa 13 avem pentru un z=2, valoarea
0,9772. Din aceleai motive, obinem F(z)=1 0,9772=0,0228. La fel procedm cu toate clasele, pn la clasa a asea.
Pentru clasa a asea, unde avem z=0, F(z)=0,5000. Deoarece z nu mai
este negativ, aceasta este i valoarea cutat. La fel, clasa a aptea, unde
F(z)=0,6915.
Totui, pn acum nu am stabilit dect probabilitile teoretice cumulate pentru distribuia noastr, deoarece funcia Laplace este, dup cum am
spus, o funcie cumulativ. Am fi mai curnd interesai de probabilitile teoretice efective, nu de cele cumulate. Din fericire, acest lucru este simplu de
aflat. Nu avem dect s scdem din probabilitatea teoretic cumulat a unei
clase, probabilitatea teoretic cumulat a clasei anterioare i iat, am obinut
probabilitile teoretice efective pentru fiecare dintre clase. Aadar, vom avea
o nou coloan n tabelul 2.18, coloana (zi) unde:
(formula 2.29)
Pentru prima clas nu avem o clas anterioar, aadar (zi)=0,0062. A
doua clas va fi (zi)=0,0228-0,0062=0,0166. Pentru a treia clas vom avea
(zi)=0,0668-0,0228=0,0440 i aa mai departe. Dup calculul probabilitilor teoretice efective, urmeaz s nmulim frecvena absolut a fiecrei clase
cu probabilitatea teoretic efectiv (f*(zi)). Aceast valoare o putem denumi
229
frecven teoretic i o notm cu ft. Avnd aceste elemente, putem acum trasa
formula de calcul pentru 2 atunci cnd efectum testul de normalitate:
(formula 2.30)
Destul de simplu. Din formul mai rezult civa pai. S facem diferenele dintre frecvena observat i frecvena teoretic, s ridicm la ptrat
aceste diferene i apoi s mprim ptratele la frecvena teoretic. n final
efectum suma acestor rezultate i obinem valoarea pentru 2. Valoarea
noastr este foarte mare. Am obinut 2=4175,55. Aceast valoare o vom
compara cu valoarea de referin pentru un numr de k-3 grade de libertate,
deoarece avem doi parametri media i abaterea standard. n situaia noastr,
valoarea indicatorului este comparat la 12-3=9 grade de libertate. La un prag
de semnificaie mai mic de 0,01, valoarea de referin este de 21,665. Valoarea obinut este mult mai mare dect valoarea prag, testul este semnificativ
la un prag de semnificaie mai mic de 0,01, vom respinge ipoteza nul. Cu
alte cuvinte, distribuia empiric difer semnificativ de distribuia teoretic
normal. Pe scurt, datele noastre nu se distribuie normal.
Folosind aceast metod putem compara o distribuie empiric nu
numai cu distribuia normal, dar i cu alte distribuii, precum distribuia Poisson, binomial, etc.
230
Cristian Opariuc-Dan
(formula 2.31)
231
unde Wk nu este altceva dect diferena dintre al doilea i primul ir. Adic,
Wk=XII-XI.
Coeficientul a se extrage din tabelul din anexa 14, pentru diferitele
valori ale lui n i k. n cazul nostru, n=10 i, evident, k=5. Ne deplasm n
tabel pe coloana numrul 10 (corespunztoare lui n) i vom avea pentru k=1,
un coeficient a=0,5739. Pentru k=2 avem a=0,3291 i aa mai departe. Copiem aceti coeficieni n coloana corespunztoare din tabelul 2.19. Urmeaz
apoi s nmulim, pentru fiecare k, coloana Wk i coloana a, rezultatele fiind
trecute ntr-o ultim coloan din tabel. nsumnd toate aceste produse, obinem expresia estimrii liniare a abaterii standard (b), n situaia noastr aceasta fiind 126,882.
Restul procesului este foarte simplu i nu l vom detalia. Este necesar
s calculm media celor 10 scoruri (m=253 n cazul de fa), apoi s scdem
fiecare scor din medie, la fel ca la calculul varianei, (xi-m), s ridicm la ptrat aceste diferene (xi-m)2 i, n final, s facem suma acestor ptrate. Pentru
exemplul nostru, suma ptratelor diferenelor este 16410. Avnd toate datele,
putem nlocui acum n formul:
Valoarea testului Shapiro-Wilk o raportm la pragurile de semnificaie din tabelul din anexa 15. Pentru n=10, pragul de semnificaie la un p<0,05
este de 0,842, iar la un p<0,01 este de 0,781. Deoarece valoarea testului este
mai mare de 0,842, testul este nesemnificativ, ipoteza nul nu se respinge i,
prin urmare, distribuia poate fi considerat o distribuie normal. Avei grij
la interpretare. De aceast dat, testul este semnificativ dac valoarea sa este
mai mic dect valoarea prag.
232
Cristian Opariuc-Dan
(formula 2.32)
)
(formula 2.33)
S presupunem c o cercetare efectuat pe un numr de 853 de studeni, crora li s-a nregistrat greutatea, a condus la o distribuie avnd coeficientul de simetrie 1=-0,46 i coeficientul de boltire 2=0,87. S se decid
dac datele empirice se distribuie sau nu normal.
233
Cristian Opariuc-Dan
Atunci cnd vorbea despre teoriile tiinifice, marele Albert Einstein
fcea o afirmaie pertinent n care putem regsi, de fapt, ntregul spirit al
demersului tiinific: Oamenii de tiin nu sunt de invidiat. Natura, sau mai
exact, experimentul este un judector neprietenos i inexorabil al muncii
cercettorului. Niciodat nu i spune Da teoriei acestuia. n cele mai favorabile cazuri i spune Poate, iar n majoritatea cazurilor i spune Nu.
Dac experimentul sprijin o teorie, pentru aceasta nseamn Poate, iar
dac nu sprijin nseamn Nu. Probabil c orice teorie va experimenta
ntr-o bun zi pe Nu cele mai multe chiar imediat dup conceperea lor.
(Sava, 2004).
innd cont de citatul de mai sus, chiar cu riscul de a ne repeta, vom
efectua, n cele ce urmeaz, o serie de observaii referitoare la ipoteza nul:
analiznd ipoteza nul, trebuie s menionm c, dup verificare, aceasta nu poate fi adevrat sau fals. Singurul lucru pe
care l putem face cu ipoteza nul este s o respingem sau s
nu o respingem. Ipoteza nul nu poate fi confirmat sau infirmat. Afirmaii precum ipoteza nul este fals sau testul nu
este semnificativ, deci se confirm ipoteza nul sunt afirmaii
eronate, dei frecvent ntlnite printre nceptori. n realitate,
putem spune doar c respingem ipoteza nul sau nu respingem ipoteza nul;
235
postulat de Fisher i corespunde, n tiinele sociale, unei valori mai mici de 0,05. Dac respingem ipoteza nul, nu nseamn c aceasta nu se poate, la un moment dat, susine.
Acest prag de semnificaie nu spune dect probabilitatea cu
care am obine, ntmpltor, datele observate, pornind de la
ideea c ipoteza nul este adevrat. Att i nimic mai mult;
Atunci cnd raportm rezultatele unui test statistic, ne intereseaz cteva elemente:
236
Cristian Opariuc-Dan
tre ipotezele experimentale afirm c exist o diferen semnificativ ntre brbai i femei sub aspectul anxietii, n sensul c brbaii sunt mai puin anxioi n comparaie cu femeile, aceasta ar putea fi susinut numai n condiiile n care, la
comparaia mediei obinute de ctre brbai la anxietate cu cea
obinut de ctre femei, se obine un test semnificativ, negativ
(adic media brbailor este mai mic n comparaie cu media
femeilor);
Gradele de libertate reprezint o expresie a volumului eantionului studiat, raportarea lor fiind obligatorie;
237
exist un element extrem de important care trebuie precizat. Este vorba despre mrimea efectului.
Ctig
Ce a prevzut
c se ntmpl
Pierde
Cristian Opariuc-Dan
alternativ, deoarece probabilitatea de a nu ctiga btlia era
foarte mic. Cellalt mprat avea probabil un numr mic de
oameni i o tehnic de lupt net inferioar. Vrjitorul a obinut
o nou avere i respectul mpratului;
239
Cristian Opariuc-Dan
date neparametrice, unul pentru 2 (dup Rosenthal, Rosnow i Rubin) (Sava,
2004) iar cellalt pentru date ordinale coeficientul propus de Cliff.
Estimarea mrimii efectului pentru 2 atunci cnd exist doar un singur grad de libertate se poate face prin intermediul coeficientului de determinare r2, dup expresia:
(formula 2.34)
n formula 2.34, la numrtor avem valoarea testului 2 pentru un singur grad de libertate, iar la numitor regsim numrul de cazuri observate.
n exemplul de la capitolul II.2.1 am pornit de la ipoteza nul conform
creia nu exist nicio diferen semnificativ ntre blonde i brunete referitor
la producerea accidentelor rutiere. Am aplicat atunci testul 2 obinnd o diferen nesemnificativ la un singur grad de libertate. Valoarea testului a fost
de 2,75, la un numr n=94 de femei studiate.
Dac testul ar fi fost semnificativ, am putea calcula mrimea efectului
pe baza expresiei de mai sus:
241
Atunci cnd datele se afl la un nivel ordinal, nu mai putem folosi coeficientul de determinare exprimat anterior. O msur alternativ pentru acesta este reprezentat de coeficientul delta () propus de Cliff n anul 1993.
Acest coeficient testeaz echivalena probabilitii ca scorurile dintr-un grup
s fie mai mari dect scorurile din cellalt grup i se bazeaz pe conceptul de
dominan. Formula de calcul a coeficientului este urmtoarea:
(
(formula 2.35)
Pare complicat, dar nu este chiar aa. Practic #Xi1>Xj2 reprezint numrul de comparaii ntre observaiile dintre cele dou grupuri, atunci cnd
numrul de observaii din primul grup este mai mare dect numrul de observaii din al doilea grup.
S considerm un exemplu simplu pentru a lmuri formula de calcul.
O cercetare efectuat pe brbaii i femeile dintr-o unitate militar pleac de
la ipoteza nul conform creia nu exist nicio diferen ntre brbai i femei
sub aspectul gradelor militare de ofieri. Desigur, ne situm la un nivel pur
ordinal, unde am notat cu 1 locotenentul, 2 cpitanul, 3 maiorul, 4
locotenent colonelul i 5 colonelul. Datele noastre sunt urmtoarele
Brbai:
1, 1, 2, 2, 2, 3, 3, 3, 4, 5
n1=10
Femei:
1, 2, 3, 4, 4, 5
n2=6
Pentru a uura lucrul, am ordonat deja datele noastre. Urmeaz construcia aa-numitei matrice de dominan. n primul rnd, construim un tabel
similar tabelului 2.20. Pe coloane trecem una dintre variabile iar pe linii cealalt variabil. Regula de completare a matricei de dominan este simpl. O
celul poate lua valoarea +1 dac valoarea la nivel de linie este mai mare
dect valoarea la nivel de coloan, 0 dac cele dou valori sunt la fel i -1
dac valoarea de pe linie este mai mic dect valoarea de pe coloan.
242
Cristian Opariuc-Dan
Tabelul 2.20 Calculul matricei de dominan
Brbai
1
1
2
2
2
3
3
3
4
5
dj
Femei
1
0
0
1
1
1
1
1
1
1
1
0,8
2
-1
-1
0
0
0
1
1
1
1
1
0,3
3
-1
-1
-1
-1
-1
0
0
0
1
1
-0,3
4
-1
-1
-1
-1
-1
-1
-1
-1
0
1
-0,7
4
-1
-1
-1
-1
-1
-1
-1
-1
-1
1
-0,7
5
-1
-1
-1
-1
-1
-1
-1
-1
-1
0
-0,9
di
-0,833
-0,833
-0,500
-0,500
-0,500
-0,167
-0,167
-0,167
0,333
0,833
=-0,250
Pentru prima linie, valoarea pentru brbai (1) este egal cu prima coloan, valoarea pentru femei (1). La nivelul acestei celule, dominana ia valoarea 0. Tot la prima linie, valoarea pentru brbai (1) este mai mic dect
valoarea pentru femei (2). Atunci celula ia valoarea -1 i aa mai departe,
dup regula expus, pn la completarea ntregii matrice de dominan.
n urmtorul pas, facem media dominanelor att pe linie ct i pe coloan. Astfel, pentru prima linie vom avea 0-1-1-1-1-1=-5, apoi -1/6=-0,833.
Vei continua la fel pentru toate liniile i toate coloanele, aa cum observai n
tabelul 2.20.
nainte de a aplica formula, calculm indicii di i dj. Acetia nu reprezint altceva dect suma mediilor dominanelor. Adunai, aadar, toate valorile de pe ultima coloan i vei obine di=-2,50. Apoi adunai toate valorile de
pe ultima linie i vei obine dj=-1,50. Valoarea pe care o reinem este valoarea cea mai mare luat n modul. Deoarece 2,50 este mai mare dect 1,50,
reinem 2,50. Pentru a obine coeficientul este suficient s facem media
valorilor nsumate pentru cea mai mare dominan. Deoarece cea mai mare
sum a fost 2,50, obinut pentru cei 10 brbai, vom avea -2,50/10=-0,250.
Prin urmare, =-0,250.
Acest indicator ia valori cuprinse ntre -1 (atunci cnd toate observaiile din primul grup sunt mai mari dect observaiile din cel de-al doilea grup)
243
i +1 (atunci cnd toate observaiile din primul grup sunt mai mici dect observaiile din al doilea grup). Valoarea 0 arat c observaiile din cele dou
grupuri sunt perfect identice. Interpretarea acestui coeficient ca msur a mrimii efectului, va ine cont de urmtoarele repere:
n cazul nostru, am obinut un efect sczut. Putem suspecta i existena unei diferene semnificative ntre brbai i femei n raport cu atribuirea
gradelor militare. Ca exerciiu, v revine dumneavoastr sarcina s alegei
testul statistic adecvat i s verificai dac, ntr-adevr, exist o asemenea
diferen semnificativ, apoi s decidei ce facei cu ipoteza nul.
Cristian Opariuc-Dan
Ioan Cuza din Iai. Obinusem un t(88)=1,48, testul fiind nesemnificativ. Adic nu exist diferene semnificative ntre studenii celor dou universiti, sub
aspectul consumului de bere. Dac ar fi existat diferene semnificative, ar fi
trebuit s calculm i mrimea efectului.
Desigur, nu ne ateptam la existena vreunui efect. Conform principiilor interpretative ale acestui coeficient, efectul este sczut.
Corespondentul coeficientului de determinare este coeficientul de corelaie a mrimii efectului. Formula de calcul a acestuia este extrem de simpl, el nefiind altceva dect rdcina ptrat din coeficientul de determinare
(formula 2.37)
n cazul nostru, coeficientul de corelaie al efectelor este de 0,155, interpretarea sa fiind analoag interpretrii coeficientului de corelaie r BravaisPearson. Spre deosebire de coeficientul Bravais-Pearson, n acest caz ntlnim doar valori pozitive.
Folosind cei doi coeficieni, putem deduce i ali indicatori ai mrimii
efectului. Vom exemplifica doar civa, deoarece este posibil s-i ntlnii n
studii i cercetri, mai ales n cele de factur meta-analitic.
Coeficientul d al lui Cohen poate fi calculat pe baza coeficientului de
determinare i a coeficientului de corelaie al efectelor, dup expresia:
(formula 2.38)
(formula 2.39)
245
(formula 2.40)
V lsm dumneavoastr ca exerciiu calculul acestui coeficient pentru mrimea efectului, precum i sarcina interpretrii sale.
246
Cristian Opariuc-Dan
Mrimea efectului se interpreteaz mpreun cu pragul de semnificaie. Vom furniza o serie de repere interpretative, aa cum au fost ele prezentate de Florin Sava (Fan, 2001 apud Sava, 2004).
Tabelul 2.21 Interpretarea mrimii efectului i a semnificaiei
Mrime
efect
Efect mic
1.
1.
Efect mediu
2.
1.
Efect mare
2.
Interpretarea valorii mrimii efectului se completeaz cu analiza sensului acesteia. Un efect pozitiv, determinat de valoarea pozitiv a mrimii
efectului, conduce la ideea c efectele observate sunt n direcia presupus.
De exemplu, dac obinem un efect puternic i pozitiv n baza ipotezei alternative conform creia exist o diferen semnificativ ntre cantitatea de bere
but de studenii de la universitatea din Constana i cantitatea de bere but
de studenii de la universitatea din Iai, n sensul c cei din universitatea moldovean beau semnificativ mai mult bere n comparaie cu cei din universitatea dobrogean, atunci datele observate susin aceast ipotez. Dac am
obine un efect puternic i negativ, nseamn c ipoteza se susine, doar c
247
n baza meta-analizei, prin cercetarea studiilor efectuate anterior. Dac ne propunem s cercetm efectul exercitat de reactivitatea motorie asupra riscului de a se produce un accident
rutier, este o bun idee s ncepem prin studiul literaturii de
specialitate i a cercetrilor, destul de numeroase, referitoare la
aceast tem. Astfel, ne putem da seama de modul n care variabilele se influeneaz, i putem proiecta studiul n cunotin de cauz;
248
Cristian Opariuc-Dan
este intim legat de mrimea efectului, dei ia n considerare un numr de trei
parametri importani:
luai. Putei, fie include mai muli subieci n ntregul lot de studiu, fie mri numrul de subieci la nivelul grupelor de cercetare
considerate cele mai importante din perspectiva ipotezelor stabilite;
2. Utilizarea unui design de cercetare cu msurri repetate. tii
deja c un design cu msurri repetate care folosete eantioane
dependente are o putere mai mare n comparaie cu design-ul
bazat pe eantioane independente, deoarece variana rezidual
cea determinat de erori, variana neexplicat este mai mic. Folosind, de obicei, aceiai subieci n dou condiii experimentale
diferite, erorile determinate de factorii subiectivi sunt mult mai
mici n comparaie cu situaia n care vei folosi dou eantioane
independente;
3. Introducerea unei covariabile eficiente. nc nu avei noiunea
complet asupra semnificaiei unei covariabile. Pentru a v face
ct de ct o idee, revedei capitolul referitor la corelaii pariale. n
acest volum ne-am limitat la studiul efectelor pe care le exercit o
singur variabil independent asupra unei singure variabile dependente. Majoritatea situaiilor de cercetare presupun ns analiza
efectului generat de mai multe variabile independente asupra unei
singure variabile dependente (ANOVA analiza de varian), a
efectului generat de mai multe variabile independente asupra mai
multor variabile dependente sau a efectului generat de variabilele
independente asupra variabilelor dependente n condiiile meninerii constante a efectului unei variabile numit covariabil
(ANCOVA analiza de covarian). Despre aceste elemente vom
discuta, ns, n urmtoarea lucrare. Ceea ce trebuie s tii deocamdat este faptul c introducerea unei covariabile, aflat, desigur, n relaie cu variabila dependent, poate determina micorarea
250
Cristian Opariuc-Dan
varianei neexplicate i, implicit, creterea puterii unei cercetri.
Dac studiem efectul determinat de emotivitate asupra notelor obinute la examene, este posibil s nu obinem nicio diferen semnificativ ntre emotivi i neemotivi sub aspectul notelor obinute.
Includerea unei covariabile de tipul timp dedicat studiului s-ar
putea s conduc la efecte semnificative;
4. Utilizarea unui design de cercetare ct mai simplu. Cu ct includem ntr-un studiu mai multe variabile, cu att crete riscul de a
comite o eroare de tip I, de a obine rezultate semnificative din ntmplare. Chiar dac aplicm corecii statistice pentru a reduce
riscul de apariie a erorilor de tip I, vom crete probabilitatea de a
obine erori de tip II. Principiul fundamental: cel mai simplu e cel
mai bine;
5. Creterea numrului de grade de intensitate pentru variabila
independent sau creterea amplitudinii factorilor. Dac vom
studia efectul reactivitii asupra producerii de accidente rutiere, sar putea ca n condiiile n care variabila independent reactivitate are doar dou grade de intensitate, reactivitate mic i reactivitate mare s nu obinem diferene semnificative. Dac am include un grad de intensitate n plus, spre exemplu reactivitate
medie, este foarte probabil s gsim un efect al reactivitii asupra producerii de accidente rutiere;
6. Tratarea variabilelor independente ca variabile discrete. Dac
vom msura reactivitatea pe o scal continu (de interval), puterea
statistic ar fi redus. n loc s punem n relaie scorurile variabilei
reactivitate aflate la un nivel de interval cu scorurile variabilei accidente rutiere aflate la un nivel natural continuu preferm s recodificm variabila reactivitate variabil independen-
251
252
Cristian Opariuc-Dan
II.5.1.3.3 Metode exclusiv statistice
1. Salvarea unor grade de libertate. Implicit, un experiment sau o
cercetare ct mai simplu proiectat duce la un numr de grade de
libertate mai redus. Planurile de cercetare complexe determin, pe
lng calcularea unui numr mare de efecte, i o putere statistic
mai mic;
2. Utilizarea tehnicilor statistice cu o putere mai mare. Atunci
cnd situaia o permite, este de preferat s folosim cele mai puternice teste statistice. De exemplu, dac ntr-o cercetare avem de
ales ntre folosirea testului z i folosirea testului t Student, vom
alege utilizarea testului z, acesta fiind mai puternic n comparaie
cu testul t.
dows). Deoarece att aspectul ct i funcionalitatea PASW sunt radical diferite de ceea ce tiai deja, vom continua s utilizm SPSS n acest volum
(versiunea 17), urmnd ca n celelalte cri s trecem ctre noua variant de la
IBM.
Costachescu Virgil
Agape Alexandru
Costachescu Virgil
Ionescu George
Cristian Opariuc-Dan
Lansarea acestui test se face din meniul Analyze, opiunea Nonparametric Tests i apoi opiunea ChiSquare. n aceast seciune (Nonparametric tests) vom regsi aproape toate testele
statistice folosite n cazul datelor neparametrice.
Executarea comenzii determin lansarea ferestrei de configurare pentru testul
statistic 2. Fereastra are mai multe elemente
de noutate, astfel nct vom insista puin
Figura 2.2 Configurarea analizei
asupra ei. Lista variabilelor din baza de date
pentru testul chi ptrat
se afl n partea stng, lista variabilelor
incluse n vederea analizei o regsim n partea dreapt. Dup cum observai
n figura 2.2, am inclus deja variabila noastr n vederea analizei acesteia.
Seciunea Expected Range permite configurarea modalitii de calcul a amplitudinii frecvenelor teoretice. Astfel, cazul cel mai des ntlnit este
Get from data, situaia n care SPSS calculeaz automat amplitudinea
frecvenelor estimate, pornind de la datele existente la fel cum am procedat
i noi. Putei alege i opiunea
Tabelul 2.24 Rezultatul analizei pentru testul 2
Use specified range, caz n
Daca saptamana viitoare ar fi alegeri prezidentiale, cu cine
ati vota?
care frecvenele estimate sunt
Observed N Expected N Residual
cele cuprinse ntre limita miCostachescu Virgil 8
5,0
3,0
nim (Lower) i limita maIonescu George
5
5,0
,0
xim (Upper). Aceast ulNeacsu Vasile
4
5,0
-1,0
Agape Alexandru 3
5,0
-2,0
tim situaie se folosete n
Total
20
cazul n care dorii s comparai frecvenele observate cu alte frecvene, nu cele calculate automat de
SPSS. Este, dac vrei, o form neparametric a testului t Student pentru un
singur eantion.
255
2,800a
3
,423
256
Cristian Opariuc-Dan
Agape Alexandru are o frecven observat de 3. Fa de frecvena
teoretic 5, aceasta subestimeaz pentru acest prezideniabil cu 2 alegeri.
Pentru a rspunde dac exist diferene semnificative ntre cei patru
prezideniabili, vom urmri al doilea tabel din foaia de rezultate. Observm
c pragul de semnificaie este de 0,423, mult mai mare dect limita admis,
0,05. Aadar diferena
Tabelul 2.25 Structura bazei de date pentru testul binomial
nu este semnificativ,
Variable Information
nu putem respinge ipoMeasurement
Variable
Position
Label
Level
teza nul. Iat c, n
culoare_par
1
Culoarea paru- Nominal
ciuda aparenelor, opilui
nia alegtorilor nu este
accidente
2
Numar de
Scale
accidente
conturat. Dup cum
Variables in the working file
vedei, pentru a vedea
Variable Values
dac o opinie este sau
Value
Label
nu este conturat, avem
culoare_par
1
Blond
nevoie de ceva mai
2
Brunet
mult dect exprimri
procentuale sau simple frecvene absolute.
O variant a acestui test, pentru situaia n care variabila are doar dou
categorii (variabile de tip Masculin Feminin sau Da Nu) este testul binomial. Acesta poate fi lansat din aceeai categorie (Nonparametric Tests),
opiunea Binomial, fiind mai precis dect chi-ptrat atunci cnd variabila are exact dou categorii.
V mai amintii exemplul cu blondele, brunetele i accidentele rutiere? Haidei s construim o baz de date avnd structura din tabelul 2.25.
Avem dou variabile: culoarea prului, o variabil nominal dihotomic, avnd dou valori blond i brunet i accidente, variabil scalar
care nregistreaz numrul de accidente comise.
257
258
Cristian Opariuc-Dan
Caseta de text Test proportion permite specificarea proporiei teoretice cu care se va face comparaia. Implicit este inclus valoarea 0,50, ceea
ce arat o comparaie cu situaia n care cele dou grupuri ar avea proporii
egale, 50% i 50%.
Rezultatul
acestui test este
Binomial Test
Observed Test
Asymp. Sig.
foarte simplu de
Category N
Prop.
Prop.
(2-tailed)
interpretat. Se obGroup 1 Blond
12
,39
,50
,281a
serv, n tabelul
Culoarea
Group 2 Brunet
19
,61
parului
2.27, c testul nu
Total
31
1,00
este semnificativ,
a. Based on Z Approximation.
pragul de semnificaie fiind mai mare de 0,05. Aadar, ipoteza nul nu se poate respinge, cu
alte cuvinte lotul nostru de cercetare poate fi considerat omogen din punctul
de vedere al caracteristicii culoarea prului. Proporia de blonde nu difer
semnificativ de proporia de brunete.
Tabelul 2.27 Rezultatul analizei pentru testul binomial
31
2,10
1,938
,224
,224
-,140
1,246
,090
Mean
Std. Deviation
Most Extreme Differences Absolute
Positive
Negative
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
a. Test distribution is Normal.
b. Calculated from data.
Desigur, pe noi
ne intereseaz doar
comparaia cu distribuia normal, prin urmare
vom bifa numai caseta
Normal. De asemenea, variabila supus
analizei va fi, n mod
evident, o variabil continu numrul de
accidente.
260
Cristian Opariuc-Dan
tribuia normal i informaia conform creia aceti parametri sunt estimai
pe baza datelor calculate la nivelul celor 31 de femei investigate.
Dup compararea cu distribuia normal, tabelul ne arat i diferenele
extreme observate, n sens pozitiv i negativ. Cea mai mare diferen observat fa de distribuia normal este o diferen pozitiv, avnd valoarea
0,224. Urmtoarea ntrebare este dac aceast diferen se ncadreaz n limite acceptabile, pentru ca distribuia noastr s fie considerat normal. Ei
bine, dup cum se poate constata, testul nu este semnificativ, pragul de semnificaie fiind de 0,09, mai mare dect pragul critic de 0,05. Cu alte cuvinte,
vom accepta ipoteza nul conform creia nu exist nicio diferen ntre distribuia empiric i distribuia teoretic normal (ZKS(31)=1,24, p>0,05). Iat
cum am demonstrat faptul c distribuia este una normal.
V-am prezentat trei dintre
cele mai utilizate teste neparametrice pentru un singur eantion.
Cum procedm dac avem de a
face cu dou eantioane independente? Pentru a verifica n
exemplul nostru dac exist
diferene semnificative ntre
blonde i brunete sub aspectul
Figura 2.5 Fereastra de configurare al testelor
comiterii de accidente, vom folosi neparametrice pentru dou eantioane independente
acelai sub-meniu, Nonparametric Test, din care vom alege opiunea 2
Independent Samples.
Fereastra de configurare prezentat n figura 2.5 are o serie de particulariti. n primul rnd, lista Test Variable List reprezint locaia n care
vom include variabila dependent numrul de accidente n cazul de fa.
Caseta Grouping Variable reprezint locul n care vom include variabila
261
Cristian Opariuc-Dan
stabilete rangurile scorurilor din ambele grupuri. Dac cele dou eantioane
sunt din aceeai populaie adic dac nu exist diferene ntre ele cele
dou grupuri vor fi distribuite aleatoriu n jurul rangurilor generale. Testul
Kolmogorov-Smirnov Z face deja ceea ce tii. Se bazeaz pe analiza diferenei maxime dintre cele dou distribuii cumulative. Practic, este un fel de test
de normalitate, doar c nu se mai compar distribuia teoretic i cea empiric ci distribuiile celor dou eantioane.
Testul Moses al reaciilor extreme presupune c variabila independent va afecta unii subieci ntr-o direcie i pe alii n direcia opus. De
obicei, acest test se folosete atunci cnd lucrm cu un grup de control. Grupul de control este definit ca fiind grupul 1, n timp ce grupul experimental se
definete ca fiind grupul 2. n cazul nostru, neavnd o cercetare cu grupuri de
control, utilizarea acestui test este inadecvat.
Tabelul 2.29 Rezultatul analizei pentru testul Mann-Whitney
U
Ranks
Culoarea parului N
Numar de
accidente
Mean
Rank
Sum of
Ranks
Blond
12
16,25
195,00
Brunet
19
15,84
301,00
Total
31
Rezultatele
testului
Mann-Whitney U sunt furnizate
Numar de accidente
Mann-Whitney U
111,000 n tabelul 2.29. Observm c
Wilcoxon W
301,000 media rangurilor pentru blonde
Z
-,125
este de 16,25 iar pentru brunete
Asymp. Sig. (2-tailed)
,900
Exact Sig. [2*(1-tailed Sig.)]
,921a este de 15,84. Diferena mic
dintre cele dou medii ale rangua. Not corrected for ties.
b. Grouping Variable: Culoarea parului
rilor se confirm i n tabelul
statisticilor. ntr-adevr, testul nu este semnificativ, valoarea semnificaiei
statistice (0,921) fiind mult mai mare n comparaie cu pragul critic 0,05.
Test Statisticsb
263
264
Cristian Opariuc-Dan
comise nainte de efectuarea celor 10 ore de curs i accidentele comise dup
efectuarea celor zece ore de curs.
Din sub-meniul Nonparametric Tests vom alege opiunea 2 Related Samples pentru a putea accesa formularul de configurare pentru testele
neparametrice referitoare la dou eantioane perechi. De aceast dat, fereastra este puin diferit. Lista variabilelor care urmeaz s fie analizate (Test
Pairs) are un aspect special care invit la construcia variabilelor perechi.
Iniial, dup cum este i firesc, lista va fi goal. Trebuie s alegem prima variabil din pereche (Numr de accidente din lista din partea stng) i s
apsm butonul de transfer. Vom observa c aceast variabil s-a transferat n
partea dreapt, pe rndul 1 al coloanei Pair, n coloana Variable1. Alegem apoi a doua variabil din pereche (Numr de accidente dup curs) i
acionm acelai buton de transfer. Variabila se va copia pe acelai rnd, dar
n a doua coloan (Variable2). Astfel am construit prima pereche de variabile. Dac dorii, putei aduga mai multe variabile perechi nu este cazul
nostru iar cu butoanele din partea dreapt a listei Test Pairs putei modifica ordinea perechilor (primele dou butoane) sau putei modifica ordinea
variabilelor n cadrul perechii selectate (ultimul buton).
Testele statistice disponibile se afl n aceeai seciune Test Type.
Cel mai puternic test este testul Wilcoxon, pe care l cunoatei deja foarte
bine. Avei posibilitatea s efectuai i testul semnului dac bifai caseta
Sign. Atunci cnd datele din cele dou variabile sunt dihotomice, vei folosi testul McNemar. Acesta determin dac rata de rspuns iniial (naintea
evenimentului) este egal cu rata de rspuns final (dup eveniment). Testul
este util n detectarea modificrilor n rspunsuri ca urmare a unei intervenii
experimentale, n situaii de tipul nainte-dup.
O extensie a testului McNemar pentru date categoriale este testul
omogenitii marginale (Marginal Homogeneity). Acest test permite nu
numai variabile dihotomice, ci i variabile cu mai multe variante de rspuns.
265
Noi vom discuta doar testul Wilcoxon i testul semnelor, acestea fiind
testele adecvate tipului nostru de date. Desigur, pornirea analizei se va face
prin acionarea butonului OK.
Cele dou tabele ale testului Wilcoxon ne arat c, n urma comparaiilor, avem un numr de 18 cazuri n care rangurile au fost calculate pentru
diferene pozitive (ranguri n care numrul de accidente dup cursuri este mai
mic n comparaie cu numrul de accidente nainte de cursuri) cu o medie a
rangurilor de 11,39, un numr de 3 ranguri calculate pentru diferene negative
cu o medie a rangurilor de 8,67 (ranguri n care numrul de accidente dup
cursuri este mai mare n comparaie cu numrul de accidente nainte de cursuri) i 10 ranguri egale.
Tabelul 2.31 Rezultatele testului Wilcoxon
Ranks
Mean Sum of
Rank Ranks
N
Numar accidente dupa Negative Ranks
cursuri - Numar de
Positive Ranks
accidente
Ties
Total
18a 11,39
3
10
8,67
205,00
26,00
31
Pornind de la aceste
date, obinem un Z(31)=3,18
la un p<0,01. Testul este
semnificativ, aadar respingem ipoteza nul i
putem considera c cele 10
ore de curs au avut efect.
Interpretarea
decurge aproape la fel i n
cazul n care folosim testul
semnului.
Z
Asymp. Sig. (2-tailed)
266
Cristian Opariuc-Dan
Raportat la aceste diferene, testul este semnificativ la un prag de
semnificaie mai mic de 0,01. Respingem i n aceast situaie ipoteza nul i
putem considera c cele 10 ore de curs au avut efect.
Tabelul 2.32 Rezultatele testului semnului
Frequencies
N
Numar accidente
Negative Differences
dupa cursuri Positive Differencesb
Numar de accidente
Tiesc
18
3
10
Total
31
Procedeele parametrice vor fi abordate folosindu-se aceeai baz de date, pentru a nu complica inutil demersul nostru. n
definitiv, avem 31 de cazuri, avem dou
variabile continui i o variabil dihotomic,
ar trebui ca cele dou variabile continui s
se i distribuie normal. tim c cel puin una
267
Cristian Opariuc-Dan
dar, vom transfera variabila continu Numr de accidente n lista Test
Variable(s) iar n caseta de text Test Value vom include valoarea cu care
dorim s efectum comparaia n situaia de fa valoarea 1,5 care reprezint media anual a accidentelor din Romnia.
Butonul Options conine modalitatea de tratare a cazurilor lips i
stabilirea intervalului de ncredere (implicit 95%), fiind descris n detaliu
ntr-un capitol anterior.
Tabelul 2.33 Rezultatele testului t Student pentru un singur eantion
One-Sample Statistics
N
Numar de accidente
Mean
31
Std. Deviation
2,10
1,938
,348
One-Sample Test
Test Value = 1.5
t
Numar de accidente
1,714
df Sig. (2-tailed)
30
,097
Mean
Difference
,597
Upper
1,31
269
Concluzia este clar. Testul t Student pentru un eantion nu este semnificativ, valoarea semnificaiei sale depind valoarea prag 0,05. Prin urmare, nu putem respinge ipoteza nul. Aadar, nu exist nicio diferen semnificativ ntre media accidentelor comise de ctre femei i media anual a accidentelor din Romnia.
Urmtoarea problem pe
care ne-o punem se refer la solicitarea pe care v-am fcut-o la
finalul subcapitolului anterior. S
verificm dac exist diferene
semnificative ntre blonde i brunete sub aspectul numrului de
accidente comise ntr-un an, dup
ce au efectuat cele 10 ore supli- Figura 2.10 Fereastra de configurare a testului
t Student pentru eantioane independente
mentare de curs. Ipoteza nul susine c nu exist nicio diferen semnificativ ntre blonde i brunete din acest
punct de vedere. De aceast dat nu vom mai aborda problema la nivel neparametric ci la nivelul testelor parametrice. Mai precis, vom folosi testul t Student pentru eantioane independente.
Fereastra de configurare seamn frapant cu cea a testelor neparametrice de tipul eantioanelor independente
(Mann-Whitney U). Vom transfera variabila
dependent Numr de accidente dup curs
n lista Test Variable(s) i variabila independent Culoarea prului n lista Grouping Variable. Urmeaz definirea grupurilor,
la fel ca la testele neparametrice. Blondele au
Figura 2.11 Definirea grupurilor
pentru testul t Student
fost codate cu cifra 1, aadar vor forma primul
grup, iar brunetele au fost codate cu cifra 2, constituind al doilea grup. Am
270
Cristian Opariuc-Dan
folosit, n acest caz, opiunea Use specified values care ne permite introducerea precis a valorilor dintr-o variabil discret. n cazul n care am fi folosit o variabil continu, exist posibilitatea transformrii acesteia ntr-una
discret alegnd opiunea Cut point. Aceast opiune funcioneaz la fel ca
i n cazul testelor neparametrice, unde a fost detaliat i exemplificat.
Tabelul 2.34 Rezultatele testului t Student pentru dou eantioane independente
Group Statistics
Culoarea
parului
Numar accidente dupa cursuri
Mean
Std. Deviation
Blond
12
1,00
1,128
,326
Brunet
19
1,26
1,147
,263
Numar
accidente
dupa
cursuri
Equal
variances
assumed
Equal
variances
not assumed
2,005
Sig.
,167 -,626
Sig. (2Mean
Std. Error
Lower Upper
tailed) Difference Difference
df
29
,536
-,263
,420 -1,123
,597
-,629 23,843
,536
-,263
,419 -1,128
,601
Tabelele generate de acest test sunt ceva mai complexe. Regsim tabelul statisticilor descriptive, n care, pentru fiecare grup, sunt prezentate
numrul de cazuri, mediile, abaterile standard i erorile standard ale mediilor.
Astfel, avem un numr de 12 blonde, media accidentelor acestora dup cursuri este de 1 cu o abatere standard de 1,12 accidente i o eroare standard a
mediei de 0,32 accidente, precum i un numr de 19 brunete, avnd o medie a
271
Cristian Opariuc-Dan
manier similar testelor neparametrice. De altfel, se poate observa c fereastra de configurare a testului t Student pentru eantioane perechi arat la fel ca
fereastra de configurare a testelor neparametrice pentru aceleai eantioane.
Nu intrm n detalii. Vom construi perechea format din cele dou variabile numr de accidente nainte de curs i numr de accidente dup curs,
apoi apsm butonul OK pentru a porni analiza statistic.
Tabelul 2.35 Rezultatele testului t Student pentru dou eantioane perechi
Numar de accidente
Numar accidente dupa cursuri
Std. Error
Mean
Std. Deviation
2,10
31
1,938
,348
1,16
31
1,128
,203
Correlation
31
Sig.
,663
,000
95% Confidence
Interval of the
Difference
Lower
Pair 1
,935
1,459
,262
,400
df
Sig. (2tailed)
Upper
1,471 3,570
30
,001
De aceast dat, rezultatele se prezint sub forma a trei tabele. n primul tabel sunt afiate statisticile descriptive. Media anual a accidentelor
nainte de curs este de 2,10 accidente, cu o abatere standard de 1,93 accidente
i o eroare standard a mediei de 0,34 accidente. Dup curs, media anual a
accidentelor se reduce la 1,16, cu o abatere standard de 1,12 i o eroare standard a mediei de 0,20. Desigur, ideea central a testului este dac aceast
reducere a numrului de accidente poate fi considerat semnificativ.
273
ntr-adevr, n ultimul tabel, constatm c diferena este semnificativ. Putem aadar respinge ipoteza nul conform creia nu exist niciun efect
al cursurilor asupra numrului de accidente comise. Iat c exist o diferen
semnificativ ntre numrul de accidente comise nainte de curs i numrul de
accidente comise dup curs (t(30)=3,54; p<0,01), n sensul c, dup efectuarea
celor 10 ore de curs, numrul de accidente anuale a sczut semnificativ.
Al doilea tabel conine un coeficient de corelaie. M vei ntreba
ce treab are coeficientul de corelaie ntr-un test statistic. Acesta urmrete
pstrarea ierarhiei datelor. Cu alte cuvinte, un coeficient de corelaie semnificativ i pozitiv ne spune c subiecii care iniial aveau scoruri mici, n final
vor avea tot scoruri mici; cei care iniial aveau scoruri mari, n final vor avea
tot scoruri mari, cu toate c exist diferene semnificative ntre situaia iniial i cea final. Coeficientul de corelaie semnificativ i negativ ne arat c
subiecii care iniial aveau scoruri mici au obinut n final scoruri mari i invers. Dac acest coeficient nu este semnificativ, nseamn c ierarhia iniial
a scorurilor nu se mai pstreaz.
n exemplul nostru, avem un coeficient de corelaie semnificativ i
pozitiv. Acest lucru arat c, dei n final subiecii au fcut mai puine accidente ca urmare a participrii acestora la curs, totui cei care nainte fceau
puine accidente, n final vor face i mai puine; cei care iniial au fcut foarte
multe accidente, n final vor face tot multe accidente, cu toate c accidentele
n final sunt totui mai puine n comparaie cu situaia iniial.
274
Cristian Opariuc-Dan
pentru un singur eantion i am observat maniera n care acest test se poate
folosi pentru a analiza normalitatea unei distribuii empirice de date.
n cadrul acestui subcapitol vom vedea i alte variante prin
care putem decide dac o distribuie este sau nu este normal i/sau
dac ne confruntm cu scoruri
extreme.
Foarte multe dintre informaiile prezentate aici au fost deja
detaliate n lucrri anterioare, luFigura 2.14 Fereastra de configurare a statisticilor exploratorii
crri
dedicate
statisticilor
univariate. Nu vom relua acele
explicaii, deoarece consider c sunt cunoscute. Vom insista doar asupra particularitilor care in de analiza normalitii i a scorurilor aberante prin
prisma testelor statistice.
Procedeele de analiz pot fi lansate din
meniul Descriptive Statistics, opiunea Explore.
n mod normal, aceast fereastr ar trebui s v fie foarte bine cunoscut. n lista
Dependent list vom include variabila pe care
dorim s o analizm. De asemenea, comunicm
programului s afieze att statisticile, ct i
graficele, prin alegerea opiunii Both din
cadrul seciunii Display.
Missing
Percent
31 100,0%
Total
Percent
0
Percent
,0%
31
100,0%
Descriptives
Statistic
Numar accidente dupa
cursuri
Mean
Std. Error
1,16
1,58
5% Trimmed Mean
1,09
Median
1,00
Variance
1,273
Std. Deviation
1,128
,203
,75
Minimum
Maximum
Range
Interquartile Range
Skewness
,704
,421
Kurtosis
-,242
,821
276
Cristian Opariuc-Dan
Primele dou tabele furnizeaz statisticile descriptive univariate. Alturi de numrul de cazuri, ntlnim media i intervalul de ncredere al mediei,
media 5% trim, mediana,
Tabelul 2.37 Teste de normalitate
Tests of Normality
variana i abaterea stana
Kolmogorov-Smirnov
Shapiro-Wilk
dard, amplitudinea de variStatistic df
Sig.
Statistic df Sig.
aie, valorile minime i
Numar acciden,203 31
,002
,862 31 ,001
maxime,
intervalul
te dupa cursuri
intercuartil, coeficienii de
a. Lilliefors Significance Correction
simetrie i boltire. Pentru detalii despre aceti indicatori, consultai lucrarea
anterioar dedicat statisticilor univariate.
Urmtorul tabel este acela al testelor
de normalitate. Avem att valorile pentru
Kolmogorov-Smirnov, ct i valorile pentru
Shapiro-Wilk.
Se observ cu uurin c ambele teste sunt semnificative. Aadar, respingem
ipoteza nul conform creia nu exist nicio
diferen ntre distribuia empiric i distribu- Figura 2.16 Histograma distribuiei
pentru variabila studiat
ia teoretic normal. Iat c, scorurile pentru
variabila Numr de accidente dup cursuri nu prezint o distribuie normal.
Acest lucru devine evident dac analizm
coeficientul de simetrie Skewness. Vom
constata o asimetrie pozitiv, o tendin
ctre valori mici, fapt mai mult dect clar
din analiza histogramei.
Figura 2.17 Graficul boxplot al
distribuiei pentru variabila studiat
normalizare a datelor. Dac nu dorim normalizarea datelor, singura alternativ pe care o avem este cea a testelor neparametrice.
Aceleai tendine se pot observa i n graficul boxplot din figura 2.17.
Putei remarca modul n care datele se concentreaz n zona scorurilor mici
(cutia), n timp ce una dintre musti determin asimetria pozitiv.
Din fericire, nu exist scoruri aberante. Graficul nu remarc asemenea
valori dincolo de limita mustilor.
Programul SPSS ne prezint i dou grafice prin intermediul crora se
compar distribuia datelor
empirice cu distribuia teoretic normal.
Primul grafic Numit
Normal Q-Q Plot
traseaz dreapta probabilitilor distribuiei normale i
prezint modul n care categoriile variabilei analizate se
abat de la distribuia normal.
n figura 2.18 se poate
observa c pentru scoruri
Figura 2.18 Graficul Q-Q Plot al distribuiei pentru variabila studiat
mici (scoruri de la 0 la 2),
abaterile de la distribuia normal nu sunt semnificative. n zona scorurilor
mici, distribuia empiric respect caracteristicile distribuiei normale. Probleme apar n zona scorurilor mari (scoruri peste valoarea 2).
Categoriile cu valori mari se abat n sens negativ de la distribuia
normal. Prin urmare, pentru ca datele s se distribuie normal, ar trebui ca
scorurile mari s aib valori mult mai mici n comparaie cu cele actuale.
278
Cristian Opariuc-Dan
Acest lucru nu ne spune dect c distribuia este asimetric pozitiv,
fapt pe care l cunoteam deja.
Al doilea grafic furnizat de SPSS compar distribuia z (distribuie cu
media 0 i abaterea standard 1) cu distribuia empiric, n termeni de abateri
standard.
Se observ n figura
2.19 dreapta distribuiei z i
modul n care se abat categoriile variabilei studiate de
la aceasta. Lucrurile sunt
mult mai clare n acest caz.
Tendinele sunt aceleai.
Scorurile mici se apropie
Figura 2.19 Graficul Q-Q Plot al distribuiei pentru
variabila studiat, n raport cu distribuia z
de distribuia normal, n timp
ce scorurile mari sunt puternic distanate. Totui nu avem de a face cu scoruri
extreme, deoarece nicio valoare nu depete o abatere standard n jurul mediei.
Iat i abordarea profesionist a analizei normalitii unei distribuii,
inclusiv tratarea scorurilor extreme.
Nu vom ncheia acest capitol nainte de a v furniza aa cum v-am
obinuit un exemplu profesional de analiz i interpretare a unui test statistic. Ne vom rezuma la testele parametrice, deoarece acestea sunt cele mai
folosite, menionnd c analiza testelor neparametrice se face dup un algoritm asemntor.
279
Mean
Std. Deviation
Masculin
32
5,98
1,369
,214
Feminin
30
7,60
1,639
,423
F
Factorul C Equal variances
assumed
Equal variances
not assumed
1,696
Sig.
Sig. (2Mean
tailed) Difference
df
,198 -3,728
Std. Error
Lower Upper
Difference
60
,000
-1,624
,436 -2,498
-,751
-3,426 27,570
,002
-1,624
,474 -2,609
-,640
Statisticile de grup indic un numr de 32 de deinui i 30 de deinute. Media brbailor la factorul emotivitate este de 5,98, cu o eroare standard a mediei de 0,21 i o abatere standard de 1,36. n cazul femeilor, media
la factorul emotivitate este de 7,60, cu o eroare standard a mediei de 0,423 i
o abatere standard a scorurilor de 1,63.
280
Cristian Opariuc-Dan
Conform testului Levene de egalitate a varianelor, varianele celor
dou grupuri studiate sunt egale, deoarece testul este nesemnificativ
(F=1,69; p=0,198), prin
urmare nu putem respinge
ipoteza nul conform creia
varianele scorurilor celor
dou eantioane sunt egale.
n aceste condiii,
constatm existena unei
diferene semnificative ntre
brbai i femei sub aspectul
emotivitii
(t(60)=3,728;
p<0,01), n sensul c emotivitatea femeilor este semnificativ mai mare n
comparaie cu emotivitatea brbailor (mfemei=7,60 > mbrbai=5,98), aa cum
rezult i din graficul ataat.
Astfel, vom respinge ipoteza nul conform creia nu exist diferene
semnificative ntre brbai i femei sub aspectul emotivitii i vom susine
ipoteza alternativ. ntr-adevr, diferena dintre brbai i femei din punctul
de vedere al variabilei studiate exist i este semnificativ.
Efectul exercitat de variabila independent gen biologic asupra
variabilei dependente emotivitate este un efect puternic (r2=0,188), testul
fiind semnificativ att statistic, ct i din punctul de vedere al utilitii practice. Efectul se manifest n sensul testului statistic, susinnd ipoteza alternativ propus. Astfel, 18,8% din variana emotivitii se poate explica prin
genul biologic, aspect care confirm teoria dup care emotivitatea femeilor
este mai mare n comparaie cu cea a brbailor, chiar i n mediul penitenciar.
281
n concluzie:
Extinderea cunotinelor dobndite n urma studierii unui eantion la nivelul ntregii populaii, face parte din domeniul statisticilor infereniale. Orice cercetare tiinific are la baz un plan (design) de cercetare;
Un design de cercetare este un plan care permite atribuirea subiecilor n diferite
condiii experimentale, mpreun cu modalitile de analiz ale datelor rezultate.
Planurile de cercetare pot fi de baz sau complexe. Planurile de cercetare complexe deriv din combinaiile planurilor de cercetare de baz;
Planurile de cercetare de baz sunt: designul complet aleatoriu (CR-p), designul
aleatoriu cu blocuri (RB-p) i designul ptratelor latine (LS-p);
Testele statistice neparametrice se aplic atunci cnd datele sunt situate la un nivel
de msur neparametric sau cnd datele sunt parametrice, ns nu este ndeplinit
condiia distribuiei normale;
Principalele teste neparametrice sunt: testul diferenelor dintre frecvene 2, testul
medianei pentru eantioane independente, testul Mann-Whitney U pentru eantioane independente, testul iteraiilor Wald-Wolfowitz (Runs), testul semnelor pentru
eantioane dependente, testul Wilcoxon;
Principalele teste parametrice sunt: testele pentru un singur eantion, teste pentru
dou eantioane independente i teste pentru dou eantioane perechi;
Exist i teste specifice, testele de depistare a unor valori aberante i testele de
comparare a distribuiei empirice cu o distribuie teoretic, n general distribuia
normal;
La interpretarea unui test statistic se ine cont de pragul de semnificaie, valoarea
testului, semnul testului i mrimea efectului;
Creterea puterii unei cercetri tiinifice se poate realiza prin msuri care in de:
designul cercetrii, msurtorile efectuate n cadrul cercetrii i metodele statistice
folosite.
282
Cristian Opariuc-Dan
III.ANALIZA FIDELITII
n acest capitol se va discuta despre:
Stimate doamne, domnioare i domni, fidelitatea, n aceast accepiune, nu este ceea ce credei. Nu se refer la fidelitatea partenerului sau la cea
a partenerei, ci vizeaz un cu totul alt concept. Cei dintre dumneavoastr,
care urmeaz sau au urmat cursurile unei faculti de psihologie, i mai
amintesc probabil comarul teoretic al validitii i fidelitii din cadrul disciplinelor psihodiagnostic i metodologia elaborrii instrumentelor psihologice. Fii linitii, deoarece nu doresc s detaliez aceste elemente aici. Totui, se impun anumite precizri.
Atunci cnd ne gndim la validitatea unui instrument de cercetare sau
la cea a unuia de diagnostic, avem n vedere faptul c itemii acelui instrument
reuesc s msoare, ntr-adevr, ceea ce-i propun s msoare. Fidelitatea, pe
de alt parte, pleac de la supoziia c itemii deja msoar dimensiunea investigat i ncearc s determine ct de precis, ct de fiabil se msoar acest
lucru. Vom clarifica imediat definiiile prin cteva exemple. M vei ntreba,
283
284
Cristian Opariuc-Dan
Pe scurt, un instrument de cercetare sau unul de diagnostic pentru care
nu exist studii serioase de validitate i de fidelitate, este un instrument pe ct
de inutil, pe att de periculos, deoarece, n baza rezultatelor obinute, se pot
lua decizii complet false.
S presupunem c dorii s investigai anxietatea colegilor de serviciu,
iar pentru aceasta vei construi un chestionar. Putei s msurai anxietatea
direct? Desigur, nu! Anxietatea nu se msoar n metri sau n kilograme, ci
prin intermediul unor ntrebri, care vizeaz comportamente asociate cu
aceast dimensiune. S presupunem c ai inclus n chestionar urmtoarele
ntrebri, la care subiectul va rspunde prin Da sau Nu:
Atunci cnd v cheam eful, v ngrijorai i v este fric deoarece credei c ai fcut ceva ru?
Dac subiectul rspunde afirmativ la aceste trei ntrebri, atunci comportamentul su poate fi suspectat de anxietate. Iat, pe scurt, modalitatea de
prezentare a validitii. Dac primul set de ntrebri este invalid, iar itemii nu
285
au nimic n comun cu anxietatea, al doilea set poate fi considerat valid, acetia fiind puternic saturai n dimensiunea investigat.
Relaia dintre validitate i fidelitate poate fi foarte uor neleas dac
apelm la un exemplu. S presupunem c instrumentul de diagnostic sau cel
de cercetare este asimilat unui trgtor cu pistolul5. Situaia trgtorilor din
punctul de vedere al validitii i fidelitii poate fi prezentat n figura 3.1.
Exemplul nu-mi aparine n totalitate. A fost citit sau mi s-a povestit de ctre Florin Sava.
Din nefericire, nu am sursa s-l pot cita, ns mi fac datoria de onoare s menionez acest
lucru.
286
Cristian Opariuc-Dan
Ce se ntmpl, ns, din punct de vedere statistic? Orice cercetare
efectuat, va fi afectat de dou surse de eroare: erori aleatorii i erori nealeatorii (sistematice).
Erorile aleatorii reprezint influene ale factorilor externi care pot
afecta msurtorile. Nici mcar n lumea fizic msurtorile nu sunt scutite
de asemenea erori. Dac msurm un obiect la o temperatur de 45 de grade
Celsius, vom obine o valoare, diferit de valoarea obinut la msurarea aceluiai obiect la -10 grade Celsius. Mai mult, n domeniul socio-uman pot interveni o mulime de factori externi care s afecteze rspunsurile subiecilor
i, deci, msurtoarea. Vremea de afar, genul biologic al cercettorului sau
modul n care acesta s-a mbrcat, faptul c subiectul s-a certat cu soia sau
cu soacra, faptul c nu a dormit noaptea sau c l strnge un pantof sunt tot
attea surse externe de influen care pot genera erori aleatorii i care pot
influena msurtorile. Din nefericire, asemenea erori apar fie c vrem fie c
nu vrem i de multe ori sunt aproape imposibil de controlat. Este cunoscut
faptul c influena acestor erori coreleaz negativ cu gradul de fidelitate al
unui instrument de cercetare. Cu ct influena erorilor aleatorii este mai mare,
cu att instrumentul este mai puin fidel, reciproca fiind, de asemenea, valabil. Un instrument are un grad ridicat de fidelitate, dac aplicat acelorai subieci, n condiii variate, conduce la aceleai rspunsuri sau la rspunsuri foarte apropiate.
Erorile nealeatorii, numite i erori sistematice, au un caracter constant i sunt legate, de cele mai multe ori, de instrumentul de cercetare. De
exemplu, dac avei un ceas care merge cu 10 minute nainte, aceast diferen dintre ora exact i ora indicat de ceas reprezint o eroare sistematic. La
fel, un termometru care arat cu 20 de grade mai puin dect temperatura real este un termometru invalid. Iat c am ajuns i la esena problemei. Dup
cum ai constatat deja, controlul erorilor sistematice ine de validitatea unui
287
instrument (revedei figura cu inta), n timp ce minimizarea influenei erorilor aleatorii reprezint o problem de fidelitate.
Nu intenionez s susin aici o prelegere referitoare la aceste dou
concepte, deoarece fac parte dintr-o alt disciplin. Se pare c m-a cam luat
valul i nu m-am putut abine s nu ncerc s lmuresc aceste lucruri. De
fapt, de buna lor nelegere depinde nsuirea tehnicilor de analiz ale fidelitii. Ct despre validitate, o parte dintre instrumentele menite s o asigure va fi
discutat cu alt ocazie.
288
Cristian Opariuc-Dan
n realitate, scorul real (t) nu poate fi niciodat cunoscut. Nu vei
putea ti vreodat, absolut exact, ce cantitate de inteligen avei. Acesta
este un indicator ipotetic, imposibil de observat i de msurat direct. Poate,
doar n condiiile n care ai efectua testul de inteligen vreo 50 de ani, n
fiecare zi, iar apoi ai face media tuturor rezultatelor obinute, ar rezulta o
msur foarte apropiat de scorul real (conform teoremei limitei centrale),
ns nu vom uita c i inteligena este afectat de timp.
Totui, dac singura surs de variaie a scorului real este reprezentat
de erorile aleatorii, nseamn c vor exista zile n care scorul dumneavoastr
observat va fi mai mare dect scorul real, dup cum vor fi evaluri n care
scorul observat se va situa sub cel real. Acest lucru ne spune, de fapt, c scorurile observate situate peste valoarea scorului real vor anula, n cele din urm, scorurile situate sub scorul real. Cu alte cuvinte, la un numr suficient de
mare de evaluri, erorile aleatorii tind s fie nule.
Sintetiznd, vom considera urmtoarele asumpii referitoare la ecuaia
fundamental a teoriei clasice a testului (Carmines, i alii, 1979):
Din acelai motiv, corelaia dintre scorul real i erorile aleatorii tinde spre zero, cele dou variabile fiind independente;
Plecnd de la aceste asumpii de baz, care, desigur, au i o demonstraie matematic pertinent, putem ajunge la concluzia c vom reui s
aflm scorul real, dac evalum o persoan de foarte multe ori cu acelai in289
strument. ns, acest lucru nu este posibil din mai multe motive. Nu cred c
vom gsi o asemenea persoan disponibil, i apoi intervin factorii de memorie i ali factori care pot influena rezultatele, prin noi erori aleatorii. n acest
caz, renunm la a evalua o singur persoan i evalum, cu acelai instrument, un grup de persoane. Intuii deja c fundamentul teoretic de mai sus se
poate aplica i n aceast situaie. Nu intrm n detalii i n demonstraii. Cei
care doresc mai multe informaii, pot consulta literatura de specialitate. O
prezentare excelent a acestor elemente este realizat de ctre Carmines i
Zeller (Carmines, i alii, 1979) n lucrarea lor. n linii mari, aceasta este
logica evalurii fidelitii. La un numr suficient de mare de persoane evaluate cu acelai instrument, erorile aleatorii se compenseaz reciproc i putem
avea msura fidelitii scorului real. Repet, problema nu se refer la aflarea
scorului real, ci la analiza fidelitii unui instrument de msur, a stabilitii
sale. Dac ceea ce fluctueaz sunt erorile aleatorii, atunci, identificnd ceva
stabil, acel lucru trebuie s fie scorul real.
n practic, exist mai multe metode prin care putem evalua fidelitatea
unui instrument: metoda test-retest, metoda formelor paralele, metoda njumtirii, metoda acordului ntre evaluatori i metoda consistenei interne. Le
vom analiza pe fiecare n parte.
290
Cristian Opariuc-Dan
Una dintre cele mai controversate ntrebri care se pune este cea referitoare la intervalul de timp dintre cele dou evaluri (Stan, 2002). Ei bine,
intervalul de timp depinde de stabilitatea dimensiunii msurate. Retestarea
dup un an poate fi inadecvat pentru un chestionar de opinii, acestea
putndu-se schimba ntre timp, ns poate fi perfect valabil pentru un test de
inteligen. Oricum, durata dintre cele dou evaluri nu poate fi mai mic de
3-4 sptmni. n cele mai multe cazuri, cercettorii acord un interval de 5-6
luni, considerat suficient pentru o analiz pertinent a fidelitii.
Aceast metod, dei intens folosit, nu este agreat n mod deosebit
de ctre cercettori, din cauza unor motive obiective. n primul rnd, unii nu
o consider o msur a fidelitii, ci una a stabilitii scorurilor. Apoi, dac
intervalul de timp este prea scurt, metoda nu mai estimeaz n mod real stabilitatea, intervenind influena memoriei i efectul de nvare. Subiecii i pot
aminti unele rspunsuri de la evaluarea trecut, fapt care biaseaz masiv analiza de fidelitate. Dac intervalul de timp este prea lung, intervine efectul de
maturizare, prin care dimensiunea evaluat se modific, mai ales dac vorbim
de factori de personalitate. Mai mult dect att, subiecii tind s dea rspunsuri la ntmplare n condiiile celei de-a doua administrri.
Ideea este c nu se poate folosi aceast metod ca metod unic de estimare a fidelitii, ci doar nsoit de o alt metod, de obicei de metoda consistenei interne. Foarte muli consider metoda test-retest ca o form a metodei njumtirii, poate i datorit faptului c procedeele statistice de calcul
sunt analoage. Din aceast cauz, nu vom prezenta aici calculul coeficientului
de fidelitate test-retest, ci l vom aborda n cadrul celei de-a doua metode
studiate.
291
dup un interval de timp. Ideea de baz a metodei este aceea c, dac avem
un set de itemi care msoar o dimensiune, oricare dou subseturi din acei
itemi, msurnd aceeai dimensiune, vor corela puternic. De exemplu, dac
avem un chestionar care msoar depresia, chestionar format din 20 de ntrebri, dintre care, aleatoriu, formm dou chestionare de cte 10 ntrebri (lum la ntmplare 10 itemi din chestionar i construim o form, ceilali 10
itemi rmai reprezentnd cealalt form), i apoi corelm cele dou chestionare, ar trebui s obinem un coeficient de corelaie ridicat. Acest coeficient
poart numele de coeficient de fidelitate split-half i reprezint o msur
mai precis a fidelitii n comparaie cu cellalt indicator, coeficientul de
stabilitate.
Dac ai fost ateni, ai observat c metoda test-retest este o variant a
metodei njumtirii. Pentru test-retest se folosete ntregul instrument aplicat la dou intervale de timp, iar pentru split-half folosim cele dou jumti
ale instrumentului, aplicate o singur dat. Ambele metode presupun aceleai
operaii statistice, i anume corelarea celor dou administrri n cazul testretest i corelarea celor dou jumti pentru split-half.
Fidelitatea prin metoda split-half msoar, de fapt, echivalena celor
dou jumti de instrument. Unii autori o numesc i fidelitate a formelor
paralele sau chiar fidelitatea consistenei interne, dei aceste denumiri sunt
oarecum improprii metodei.
Att fidelitatea prin metoda test-retest, ct i cea evaluat prin metoda
njumtirii se pot analiza prin mai multe procedee statistice. Unul dintre
acestea implic obinerea coeficientului de fidelitate split-half dup formula
Spearman-Brown, numit i coeficient de predicie Spearman-Brown.
292
Cristian Opariuc-Dan
(formula 3.1)
unde, rij reprezint coeficientul de corelaie Bravais-Pearson ntre cele dou forme, iar k se refer la numrul total de itemi mprit la numrul
de itemi din fiecare form i are, n general, valoarea 2.
Aceast formul se folosete exclusiv n situaia n care utilizm metoda njumtirii, factorul k jucnd rolul de factor de corecie.
S presupunem c avem un chestionar cu un numr de 25 de itemi
pentru care dorim s verificm fidelitatea prin metoda njumtirii. Dintre
cei 25 de itemi, vom construi dou forme, alegerea ntrebrilor fiind absolut
aleatorie. Vor rezulta, aadar, dou forme, una coninnd 13 itemi iar cealalt
12 itemi.
Am ales intenionat un numr inegal de itemi n cele dou forme, pentru a v arta modul n care se poate calcula factorul k. Pentru un plus de precizie, vom considera forma cea mai scurt, cea cu 12 itemi. Fcnd raportul
dintre numrul total al itemilor din chestionarul original i numrul de itemi
din prima jumtate, obinem 25/12=2,08. Practic, chestionarul original este
de 2,08 ori mai lung n comparaie cu aceast form. Similar, raportul pentru
forma a doua, cea cu 13 itemi devine 25/13=1,92. Aceast form este de 1,92
ori mai scurt n comparaie cu chestionarul original. Singurul element care
ne lipsete este coeficientul de corelaie dintre cele dou forme. Acest indicator tii deja s-l calculai foarte bine i, s presupunem c ai obinut r= 0,87.
nlocuind n formul, vom obine un coeficient de predicie Spearman-Brown
rSB1= 0,93, valoare care arat o fidelitate foarte bun, cele dou forme fiind
echivalente, iar pe ansamblu chestionarul fiind fidel.
293
Dac dorim un exces de precizie, putem calcula coeficientul de predicie a fidelitii ajustat i pentru cealalt parte. Vom obine valoarea 0,92
pentru coeficientul de fidelitate split-half, diferena dintre cele dou valori
fiind foarte mic.
Acest coeficient l vom folosi doar dac analizm fidelitatea prin metoda split-half. n ceea ce privete semnificaia lui, majoritatea autorilor consider c valorile de peste 0,80 sunt adecvate pentru o fidelitate acceptabil,
iar dac dorim un grad ridicat al fidelitii, nu vom putea accepta coeficieni
sub 0,90. Totui, pentru cercetri exploratorii i nu diagnostice, se pot lua n
considerare coeficieni de fidelitate de peste 0,60, sub aceast limit
considerndu-se instrumentul ca nefiind fidel.
Probabil c v vei ntreba de ce acest coeficient se numete coeficient
de predicie? Rspunsul const n analiza formulei. Practic, formula prezice
fidelitatea ntregului chestionar, pornind de la o form a acestuia form
pentru care s-a calculat factorul k , i n baza corelaiei dintre cele dou forme.
n cazul n care s-a utilizat metoda test-retest pentru calculul fidelitii, formula 3.1 nu mai corespunde. Un caz particular al acestei formule este
exprimat prin relaia urmtoare:
(formula 3.2)
Este, de fapt, situaia n care am construi dou forme ale unui chestionar, ambele cu acelai numr de itemi. Prin extensie, metoda se poate aplica
i n cazul formei test-retest.
S presupunem c acelai chestionar cu 25 de itemi este aplicat unui
lot de cercetare de 130 de subieci, cu readministrare peste 8 luni. Coeficien294
Cristian Opariuc-Dan
tul de corelaie dintre cele dou administrri este r= 0,79. n acest caz, fidelitatea test-retest va fi 0,88, artnd c instrumentul are o foarte bun stabilitate.
Pentru a nelege mai bine calculul acestui coeficient, vom lua exemplul unui chestionar cu 40 de itemi, aplicat unui numr de 10 studeni. Rezultatele vor fi centralizate n tabelul 3.1. Se observ c, pentru fiecare subiect,
am inclus att scorul total obinut (la nivelul ntregului chestionar) ct i scorul obinut pentru fiecare dintre cele dou jumti (forma x cu 20 de itemi i
forma y, tot cu 20 de itemi).
Primul pas este reprezentat de calculul mediilor, att pentru forma
complet a instrumentului, ct i pentru cele dou sub-forme. Media scorurilor este de 31 pentru ntregul chestionar (mtot), 15,2 pentru prima form (mx)
i 15,8 pentru forma a doua (my).
Tabelul 3.1 Calculul coeficientului de fidelitate split-half
Student
A
B
C
D
E
F
G
H
I
J
Media
Scor
(40)
40
28
35
38
22
20
35
33
31
28
31.0
Forma x
(20)
20
15
19
18
l0
12
16
16
12
14
15.2
Forma y
(20)
20
13
16
20
12
8
19
17
19
14
15.8
x-mx
y-my
(x-mx)2
(y-my) 2
(x-mx)( y-my)
4.8
-0.2
3.8
2.8
-5.2
-3.2
0.8
0.8
-3.2
-1.2
4.2
-2.8
0.2
4.2
-3.8
-7.8
3.2
1.2
3.2
-1.8
23.04
0.04
14.44
7.84
27.04
10.24
0.64
0.64
10.24
1.44
95.60
17.64
7.84
0.04
17.64
14.44
60.84
10.24
1.44
10.24
3.24
143.60
20.16
0.56
0.76
11.76
19.76
24.96
2.56
0.96
-10.24
2.16
73.40
296
Cristian Opariuc-Dan
Acest coeficient calculeaz direct fidelitatea, bazndu-se doar pe variane, nu i pe ali coeficieni de corelaie. Tot ceea ce avem de fcut este s
calculm varianele instrumentului original i varianele celor dou forme ale
sale, apoi s nlocuim n formul. tii deja c variana nu este altceva dect
abaterea standard la ptrat, modalitatea de calcul fiind prezentat ntr-un alt
volum6.
S presupunem c variana total a unui chestionar de 37 de ntrebri
este 132,43, variana primei forme, care conine 18 ntrebri este de 40,01 iar
variana celei de-a doua forme, cu 19 ntrebri este de 32,21. Aplicnd n
formul, obinem un coeficient de fidelitate de 0,90.
Putei consulta lucrarea Statistic aplicat n tiinele socio-umane. Noiuni de baz Statistici univariat, de acelai autor, aprut la editura ASCR, Cluj-Napoca, 2009
297
298
Cristian Opariuc-Dan
(formula 3.4)
unde n reprezint numrul de itemi analizai, iar este media corelaiilor inter-itemi.
S considerm un chestionar cu un numr de 10 itemi, care msoar
satisfacia profesional. Primul pas n calcularea coeficientului de fidelitate
Cronbach l reprezint construirea matricei de corelaii.
n afara faptului c este foarte migloas, construirea tabelului 3.2 nu
pune probleme deosebite de calcul. Nu trebuie dect s luai fiecare item i
s-l corelai cu ceilali. Desigur, dac ai corelat itemul 3 cu itemul 5, nu are
rost s corelai itemul 5 cu itemul 3, pentru c vei ajunge la acelai rezultat.
Acesta este i motivul pentru care sunt afiate doar rezultatele de deasupra
(sau de dedesubtul, dac preferai) diagonalei principale. Coeficientul de corelaie a unui item cu el nsui este ntotdeauna 1, de aceea diagonala tabelului va avea ntotdeauna valoarea 1.
Tabelul 3.2 Matricea de corelaii inter-itemi
Item 1
Item 2
Item 3
Item 4
Item 5
Item 6
Item 7
Item 8
Item 9
Item 10
Item
1
1
Item
2
,185
1
Item
3
,451
,048
1
Item
4
,399
,209
,350
1
Item
5
,413
,248
,399
,369
1
Item
6
,263
,246
,209
,415
,338
1
Item
7
,394
,230
,381
,469
,446
,474
1
Item
8
,352
,050
,427
,280
,457
,214
,315
1
Item
9
,361
,277
,276
,358
,317
,502
,577
,299
1
Item
10
,204
,270
,332
,221
,425
,189
,311
,374
,233
1
3,022
1,578
2,374
2,112
1,983
1,379
1,203
0,673
0,233
-
=14,557
299
Cristian Opariuc-Dan
cazul testelor de inteligen, n timp ce pentru inventarele de personalitate se
poate cobor pn la 0,70, iar pentru chestionarele de opinie chiar i mai jos.
Totui, niciun autor nu susine posibilitatea ca un coeficient de consisten
intern s fie mai mic de 0,60.
De asemenea, Cortina (Cortina, 1993) ridic o alt problem a acestui
coeficient, cea conform creia valoarea sa depinde de numrul de itemi. Pe
msur ce crete numrul de itemi dintr-un instrument, crete i coeficientul
Cronbach. De aceea, exist posibilitatea s obinem un instrument sau o
scal consistent, nu pentru c aceasta ar fi, ntr-adevr, fidel, ci pentru c
are un numr foarte mare de ntrebri.
O alt eroare des ntlnit n interpretarea coeficientului de consisten intern se refer la faptul c cercettorii pleac de la premisa unidimensionalitii. Cu alte cuvinte, se presupune c n spatele acelor itemi se afl o singur dimensiune, ceea nu este, de multe ori, corect. Consistena intern nu
poate reliefa structura dimensiunilor, a factorilor instrumentului, acest lucru
fiind de competena analizei factoriale. Tot Cortina (Cortina, 1993) a artat
c seturi de itemi cu acelai coeficient de consisten intern, pot avea structuri foarte diferite. Itemii pot s vizeze un singur factor, doi factori corelai
sau factori complet necorelai. Cercetrile au artat c Cronbach nu poate i
nu trebuie folosit ca o msur a unidimensionalitii. Obinerea unui coeficient nalt arat doar c itemii sunt corelai ntre ei, nu i c vizeaz o singur
dimensiune. Din nefericire, destui cercettori confund aceste elemente i
creeaz instrumente de cercetare valide bazndu-se exclusiv pe
Cronbach, lucru, desigur, eronat. Chiar Cronbach afirma c dac un instrument are mai multe scale, coeficientul va fi calculat pentru fiecare scal i
nu pe ntregul chestionar, un asemenea demers neavnd sens.
De obicei, coeficientul de consisten intern are valori pozitive. S-ar
putea, ns, s avei surpriza obinerii unor coeficieni negativi. De unde poate s apar acest lucru? Ei bine, un asemenea coeficient are valori negative n
301
cazul n care covariana negativ este mai mare n comparaie cu cea pozitiv.
tim foarte bine, c pentru a evita tendina subiecilor ctre un rspuns pozitiv, de multe ori folosim itemi inversai. Adic, dac la unii itemi rspunsul
Da este semnificativ i primete un punct, la ali itemi primete un punct
rspunsul Nu. Sau, dac vom nuana puin, avnd o evaluare pe o scal de
la 1 la 5, pentru unii itemi 5 nseamn foarte mult, n timp ce pentru ali
itemi, 1 va nsemna foarte mult. n acest caz, unii itemi vor corela negativ.
n funcie de numrul itemilor inversai, per ansamblu este posibil s obinem
o covarian negativ mai mare n comparaie cu cea pozitiv, i, evident, un
coeficient negativ. Vom vedea, atunci cnd vom discuta despre aplicaiile n
SPSS, ce avem de fcut n acest caz, fiind vorba despre un proces de recodare
al itemilor.
Cronbach a descoperit formula sa n anul 1951. S nu credei c pn
atunci cercettorii nu aveau idee despre consistena intern. nc din anul
1937 conceptul era bine cunoscut, cel puin pentru Kuder i Richardson, care
au pus la punct o metod de calcul a consistenei interne, n condiiile n care
itemii sunt dihotomici. Adic, atunci cnd rspunsurile sunt de tipul Da i
Nu. Este cazul, desigur, al binecunoscutei formule Kuder-Richardson
KR20, formul alternativ pentru Cronbach.
(
) (formula 3.5)
302
Cristian Opariuc-Dan
Tabelul 3.3 Calculul coeficientului Kuder-Richardson pentru itemi dihotomici
Itemi (k)
Subieci
A
B
C
D
E
F
G
H
I
J
1
1
1
1
1
1
1
1
1
1
0
9
0,9
2
1
1
1
1
1
1
1
1
1
0
9
0,9
3
1
1
1
1
1
1
1
0
1
0
8
0,8
4
1
1
1
0
1
0
1
1
0
1
7
0,7
5
1
1
1
1
1
0
0
0
1
1
7
0,7
6
1
1
1
1
0
1
0
0
0
0
5
0,5
7
1
1
1
0
0
1
1
0
0
0
5
0,5
8
0
1
1
1
1
0
0
1
0
0
5
0,5
9
1
0
1
1
1
0
0
0
0
0
4
0,4
10
1
1
0
0
0
1
0
0
0
0
3
0,3
11
1
1
0
0
0
0
0
0
0
0
2
0,2
12
1
0
0
0
0
0
0
0
0
0
1
0,1
0,1
0,1
0,2
0,3
0,3
0,5
0,5
0,5
0,6
0,7
0,8
0,9
pq
,09
,09
,16
,21
,21
,25
,25
,25
,24
,21
,16
,09
-m
(-m)2
11
10
9
7
7
6
5
4
4
2
4.5
3.5
2.5
0.5
0.5
-0.5
-1.5
-2.5
-2.5
-4.5
20.25
12.25
6.25
0.25
0.25
0.25
2.25
6.25
6.25
20.25
74.50
Media
6.5
pq=2,21
303
Nu este deloc greu, aa cum deja v-ai obinuit. Un asemenea coeficient indic o consisten intern bun a celor 12 itemi din instrumentul de mai
sus.
Ce ne facem ns dac nu avem la dispoziie structura datelor, la nivel
de item, ci doar scorul brut total, aa ca n tabelul 3.4?
Tabelul 3.4 Calculul coeficientului Kuder-Richardson pe baza notelor brute
Subieci
NB
-m
(-m)2
A
B
C
D
E
F
G
H
I
J
11
10
9
7
7
6
5
4
4
2
4.5
3.5
2.5
0.5
0.5
-0.5
-1.5
-2.5
-2.5
-4.5
20.25
12.25
6.25
0.25
0.25
0.25
2.25
6.25
6.25
20.25
=74,5
m=6,5
304
Cristian Opariuc-Dan
Ai remarcat, sunt aceleai date, ns nu mai avem rspunsurile celor
zece subieci la fiecare dintre cei 12 itemi, ci doar scorul brut, total, pentru
fiecare dintre subieci. Fr s intrm n detalii, avem i media acestor evaluri, precum i suma abaterilor ptratice de la medie, rezultnd, evident, aceeai varian, care va avea valoarea 8,28. Exist acum vreo posibilitate s
aflm consistena intern? Rspunsul este pozitiv i va trebui s aducei mulumiri lui Kuder i Richardson pentru acest lucru. Iat c cei doi autori ne
mai ofer o relaie, exact pentru situaii de acest gen, numit formula de calcul a coeficientului Kuder-Richardson 21 (KR21).
(
(formula 3.6)
Se constat o important reducere a coeficientului de consisten intern, de la 0,79 la 0,70. Acest lucru apare din cauza faptului c nu cunoatem structura intern a rspunsurilor. Formula Kuder-Richardson 21 utilizeaz o aproximare matematic a proporiilor i nu o evaluare exact a acestora.
Este perfect normal faptul c se pierde foarte mult informaie, iar coeficientul de consisten intern va fi mult mai mic. ns, dac nu avem alt soluie,
este bine i aa.
Spre deosebire de Cronbach, care se poate calcula pentru orice fel
de itemi, coeficientul Kuder-Richardson se folosete numai pentru itemi dihotomici.
Desigur, exist i alte metode de evaluare a consistenei interne, pe
care le vom analiza n cadrul aplicaiei computerizate. Cele mai importante
tehnici au fost expuse n acest subcapitol, cunoaterea lor oferindu-v o baz
305
Cristian Opariuc-Dan
p, unele imperfeciuni. O bun practic ar fi s studiai i consistena intern
a fiecrei scale. Repet, aceste operaii nu sunt obligatorii i nu fac parte din
metoda propriu-zis. Dac ns suntei maniaci ai preciziei, le vei folosi.
n a doua etap vom aplica prima form unui alt lot de cercetare, apoi,
dup minimum dou sptmni, aplicm, aceluiai lot de cercetare, forma a
doua i calculm coeficientul de stabilitate ntre cele dou forme, aplicate la
un anumit interval de timp.
Metoda formelor paralele este net superioar metodei test-retest, din
mai multe motive, dintre care poate cel mai important este acela c se reduce
efectul memoriei i al nvrii. Timpul relativ redus ntre cele dou administrri nu permite apariia efectului de maturizare, acesta fiind un alt argument
al superioritii metodei formelor paralele.
Singura deficien major a metodei const n dificultatea de a se obine forme perfect paralele (forme cu proprieti psihometrice absolut identice). De cele mai multe ori, repartiia itemilor duce la forme echivalente, nu la
forme paralele. Diferene ntre forme pot exista, acestea contribuind la influenarea coeficientului de fidelitate. Iat cel puin un motiv pentru care recomandam studiu consistenei interne i al coeficientului de fidelitate split-half
n prima etap. n realitate, aceast metod implic i o analiza factorial pentru a se putea asigura unidimensionalitatea scalei.
se referi la plusul de obiectivitate sau la evitarea situaiilor prin care evaluatorul ar beneficia gratuit de mielul de Pati ori de porcul de Crciun.
n asemenea evaluri, bazate pe judecat, este foarte important s analizm un tip special de fidelitate, numit grad de acord ntre evaluatori. Cu
alte cuvinte, suntem interesai s vedem dac prerile evaluatorilor sunt sau
nu sunt consistente, acest lucru reprezentnd una dintre cele mai importante
msuri a obiectivitii evalurii.
Pentru a se putea realiza o evaluare a fidelitii prin acordul ntre evaluatori, este necesar ndeplinirea urmtoarelor condiii (Carmines, i alii,
1979):
Evaluatorii trebuie s cunoasc foarte bine scala sau categoriile de evaluare, precum i modul de nregistrare a performanelor, pentru a putea nregistra acelai lucru.
n final, protocolul de evaluare ar trebui s reprezinte un sistem consistent, care s vizeze evaluarea obiectiv a performanelor. Consistena evalurilor efectuate de diferii evaluatori unuia i aceluiai subiect, poart numele de fidelitate inter-evaluatori. Pentru ca fidelitatea inter-evaluatori s
fie ct mai mare, metoda presupune, iniial, o instruire a evaluatorilor, instruire care s cuprind:
O prezentare general a scalei de evaluare, tuturor evaluatorilor, astfel nct s fie clarificate, de la nceput, toate interpretrile posibile. De obicei, n urma acestei discuii au loc modificri ale scalei, n funcie de aspectele mai puin clare ale evalurii;
308
Cristian Opariuc-Dan
Organizarea de evaluri demonstrative, n care s se discute fiecare scor acordat. Rezultatele pot fi folosite i n scopul perfecionrii nelegerii conceptelor care stau la baza evalurii.
n aceast etap se vor elimina evaluatorii care furnizeaz constant evaluri divergente.
Efectul de halo reprezint o surs de eroare foarte bine cunoscut n special n domeniul educaional. Percepia general
asupra celor evaluai poate influena evaluarea unei persoane
sau a unui grup de persoane. Un grup de evaluatori de la Universitatea Harvard ar putea genera un asemenea efect n condiiile n care evalueaz studenii universitii din Lehliu-Gar.
O posibil percepie a calitii slabe a celor evaluai poate de-
309
Cristian Opariuc-Dan
n clasificarea de mai sus, observm c Aiken a fost extrem de generos cu aceste praguri. Personal, consider c un coeficient de fidelitate de 0,26
nu poate reprezenta o valoare serioas pentru fidelitatea unui instrument. Mai
mult dect att, este discutabil calcularea fidelitii pe ansamblul unei baterii
care conine mai multe scale, mai multe instrumente. Rmnem totui la ideea unui coeficient de fidelitate de peste 0,55 0,60 pentru orice scal care se
dorete serioas.
Exist totui, o serie de recomandri importante n cea ce privete utilizarea coeficienilor de fidelitate (Albu, 2000):
311
Dac toi itemii unui instrument sunt foarte uori sau foarte
dificili, coeficientul de fidelitate are o valoare mic.
Cristian Opariuc-Dan
sper s nu v uitai urt dac n baza de date va
trebui s definii mai multe variabile dect pn
acum i, n acelai timp, vei introduce mai multe date. V pot promite c aceste date le vom
folosi i pentru analiza factorial.
Iat, n figura 3.3, formularul de definire
al analizei de fidelitate. Nu, s nu v induc n
eroare simplitatea extraordinar a acestuia. AnaFigura 3.2 Accesarea meniuliza este chiar mai simpl dect credei. Cele
lui de analiz a fidelitii
dou liste, lista variabilelor din baza de date i
lista variabilelor supuse analizei, separate prin butonul de transfer, nu mai
necesit nicio precizare suplimentar. La fel, observai butoanele de comand. n realitate, exist doar trei elemente de noutate, i anume lista derulant
Model, seciunea Scale label i butonul Statistics care include opiuni specifice analizei de fidelitate.
n comparaie cu expunerea teoretic din acest capitol,
SPSS v propune chiar mai multe
elemente de studiu ale fidelitii,
v permite s analizai proprietile scalelor de msur i proprietile tuturor itemilor componeni,
Figura 3.3 Formularul de configurare al analiinclusiv relaiile dintre acetia i
zei de fidelitate
relaiile itemilor cu scala n ansamblul ei. Credei-m, nu ai vrea s calculai manual aceste lucruri
Lista derulant Model v permite s alegei metoda de studiu a fidelitii pe care o dorii. Iat ce posibiliti avei:
313
314
Cristian Opariuc-Dan
Seciunea Descriptives for determin afiarea statisticilor descriptive pentru fiecare item inclus n analiz (la bifarea casetei Item), la nivelul
scalelor (bifnd caseta Scale) i pentru scal atunci cnd un item este eliminat (bifarea casetei Scale if item deleted). Acesta din urm este i un
element extrem de important, pe care l vom discuta n detaliu ceva mai trziu.
Statisticile afiate la nivel de item se refer la media, abaterea standard i numrul de cazuri pentru fiecare item analizat. La nivelul scalei, programul prezint media, variana i abaterea standard a scalei (a tuturor
itemilor supui analizei) precum i numrul total de itemi. Dac alegem i
afiarea compoziiei scalei la eliminarea itemului, atunci SPSS va calcula,
pentru fiecare item, comportamentul scalei dac acel item nu ar mai exista.
Astfel, se va include media i variana scalei dac acel item este eliminat,
precum i corelaia item-scal i comportamentul noului coeficient de fidelitate, dac itemul respectiv nu va mai fi inclus n scal.
Seciunea Inter-Item v ofer posibilitatea prezentrii matricei de
corelaii ntre toi itemii scalei (bifnd opiunea Correlations) precum i
cea a afirii matricei de covarian a itemilor scalei (bifnd opiunea Covariances), ambele elemente fiind extrem de utile atunci cnd dorim s studiem detaliat compoziia scalei.
Seciunea Summaries furnizeaz statistici descriptive privind distribuia itemilor n raport cu toi ceilali itemi ai scalei. Bifnd caseta
Means vei putea calcula statisticile legate de media itemilor. Astfel, SPSS
va afia cea mai mic i cea mai mare medie a itemilor, media mediilor
itemilor, amplitudinea i variana mediilor itemilor, precum i numrul de
itemi inclui n analiz. Bifarea casetei Variances determin calculul statisticilor centralizate pentru variana itemilor. La fel ca mai sus, se va calcula
variana cea mai mic, variana cea mai mare, media varianelor, amplitudinea i variana varianelor. Aceleai elemente vor fi calculate i pentru cova315
316
Cristian Opariuc-Dan
Opiunea Tukeys test of additivity verific dac exist interaciuni
multiplicative ntre itemi. Dac testul este semnificativ, nseamn c asemenea interaciuni exist.
Opiunea Intraclass correlation coefficient determin evaluarea
consistenei, adic evaluarea acordului la nivelul scorurilor fiecrui subiect.
Este o opiune foarte interesant, folosit mai ales la analiza fidelitii interevaluatori, i presupune definirea mai multor elemente de calcul:
317
Alegerea intervalului de ncredere, n cadrul casetei Confidence interval. De obicei, intervalul de ncredere este cel implicit, 95%;
Alegerea valorii de test cu care se vor compara valorile observate n cadrul casetei Test
Tabelul 3.5 Structura bazei de date
value. Valoarea implicit
Nivelul de
este zero, ns adeseori Variabila Eticheta msur Format
Itemul 1
Scale
F1
aceast valoare va trebui item1
item2
Itemul 2
Scale
F1
modificat.
item3
Itemul 3
Scale
F1
item4
Itemul 4
Scale
F1
item5
Itemul 5
Scale
F1
item6
Itemul 6
Scale
F1
item7
Itemul 7
Scale
F1
item8
Itemul 8
Scale
F1
item9
Itemul 9
Scale
F1
item10
Itemul 10
Scale
F1
item11
Itemul 11
Scale
F1
item12
Itemul 12
Scale
F1
item13
Itemul 13
Scale
F1
item14
Itemul 14
Scale
F1
item15
Itemul 15
Scale
F1
item16
Itemul 16
Scale
F1
item17
Itemul 17
Scale
F1
item18
Itemul 18
Scale
F1
item19
Itemul 19
Scale
F1
item20
Itemul 20
Scale
F1
item21
Itemul 21
Scale
F1
item22
Itemul 22
Scale
F1
item23
Itemul 23
Scale
F1
n tabelul 3.6 observai i modalitatea de codificare a genului biologic, procedur care ar trebui s v fie deja familiar.
item24
Itemul 24
Scale
F1
Sexul
Genul
biologic
Nominal
F1
Varsta
Varsta
Scale
subiectilor
F3
nainte de a prezenta efectiv datele, s vedem cteva dintre particularitile acestei baze de date. S presupunem c
318
Cristian Opariuc-Dan
avem un chestionar cu 24 de itemi care msoar orice dorii dumneavoastr.
Din considerente practice, vom alege s vorbim despre un chestionar de evaluare a climatului organizaional. Acest chestionar are un numr de ase scale:7
Etichet
Barbati
Femei
suportul are n vedere resursele i condiiile de munc pe care le asigur organizaia n vederea realizrii unor activiti performante. Itemii
corespunztori acestei scale sunt 17, 18, 19 i 20;
conducerea evalueaz stilul de conducere eficient, sprijinind performana individual i colectiv. Itemii 5, 6, 7 i 8 sunt cei care se refer la
acest indicator;
sarcina este prezentat ca modul de definire al sarcinilor i obiectivelor, att la nivelul organizaiei ct i la nivelul fiecrui angajat. Aceast
scal are n componen itemii 1, 2, 3, 4;
structura vizeaz modul de organizare a muncii, cu referire la eficien, flexibilitatea i adaptabilitatea posturilor i a funciilor. Itemii componeni sunt 21, 22, 23 i 24;
Chestionarul este absolut fictiv. Datele nu corespund unor cercetri reale. Descrierea scalelor a fost preluat din lucrarea Evaluarea psihologic a personalului Ticu Constantin,
Editura Polirom, Iai, 2004.
319
320
It1
7
6
7
6
4
7
7
3
7
5
6
3
3
6
7
7
5
7
6
6
7
6
6
7
6
5
7
7
6
7
3
4
7
6
6
It2
7
6
7
5
5
7
7
5
7
5
6
4
4
6
7
7
5
7
4
6
7
6
6
7
6
3
6
7
6
7
4
4
7
6
6
It3
7
6
7
3
4
7
7
4
7
5
6
5
5
6
7
7
5
7
5
5
7
6
6
7
6
5
6
7
6
7
5
4
7
6
6
It4
7
6
7
4
4
7
7
5
7
6
6
5
4
6
7
7
4
7
4
4
7
6
6
7
6
4
6
7
5
7
5
4
7
6
6
It5
6
5
6
7
4
6
7
5
5
5
6
7
5
6
7
7
7
7
7
7
7
4
6
7
5
6
6
7
6
5
6
7
7
6
6
It6
5
5
6
7
4
6
7
5
4
5
6
7
6
6
7
7
6
7
7
7
7
4
6
7
5
6
6
7
6
7
3
7
5
6
5
It7
5
5
6
7
5
5
6
5
4
5
6
7
6
6
7
7
6
7
7
7
7
4
6
7
5
6
6
7
6
7
4
7
7
6
6
It8
6
4
6
7
4
5
7
5
4
5
6
7
5
6
7
7
7
7
6
6
7
4
6
7
5
6
6
7
6
6
5
7
7
6
4
It9
6
7
7
6
7
7
7
7
7
7
7
7
6
6
7
6
7
7
6
6
7
7
7
7
7
6
6
7
7
7
5
7
7
7
7
It10
6
7
7
5
6
6
7
7
7
6
7
7
6
7
7
6
7
7
6
6
7
7
7
7
6
7
7
7
7
7
5
7
7
6
7
It19
7
6
3
6
6
7
7
3
4
4
5
5
6
6
6
4
6
4
6
7
7
6
6
5
7
7
6
7
4
7
6
7
7
6
6
It20
7
6
3
6
6
7
7
3
5
3
5
5
6
6
6
4
5
5
6
7
7
6
6
5
7
7
6
7
5
7
6
7
7
6
6
It21
6
6
6
6
6
6
7
6
7
4
7
5
6
5
6
7
6
7
6
5
5
6
7
It22
6
6
6
6
6
6
7
6
6
5
6
5
6
5
6
6
6
7
6
5
5
6
6
It23
5
6
5
6
6
5
7
7
6
5
6
5
6
5
6
6
6
7
6
3
5
6
6
It24
5
6
5
5
5
5
7
7
7
5
6
6
6
4
6
7
6
7
5
4
6
6
6
7
7
6
6
7
7
5
6
6
7
6
7
7
6
5
6
7
5
6
6
7
6
7
7
6
5
6
7
5
6
6
6
6
7
7
6
5
7
7
6
6
6
6
7
Sex
2
1
2
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
2
1
1
1
1
1
1
1
1
1
Varsta
46
48
52
35
48
53
58
46
53
58
56
50
50
47
50
54
48
39
31
48
50
43
54
55
46
44
50
54
31
57
53
58
35
53
36
3
4
7
5
6
6
5
5
6
6
6
6
7
7
6
7
7
6
5
5
6
4
6
4
7
5
3
6
7
6
6
7
6
4
5
5
7
5
6
5
6
7
6
6
6
6
7
7
6
7
7
6
5
5
6
4
6
5
7
3
4
6
7
6
6
7
6
5
4
5
7
6
5
6
6
5
5
6
5
6
7
7
6
7
7
6
5
4
5
3
5
7
7
4
5
6
7
6
6
7
6
4
7
3
7
7
6
6
6
5
6
6
7
6
7
7
6
7
6
6
5
7
6
2
6
5
7
6
5
6
6
2
5
4
6
7
7
4
7
7
6
6
6
6
6
6
7
6
7
7
6
7
5
6
6
7
6
3
6
5
7
6
5
6
5
3
5
4
6
7
7
5
7
7
7
6
6
5
6
6
7
6
7
7
6
7
5
6
5
6
6
5
7
5
7
7
5
6
5
5
5
5
6
7
7
5
7
7
7
6
6
6
6
6
7
6
7
6
6
7
6
6
4
7
6
4
7
5
7
7
4
6
6
4
5
4
6
7
7
7
7
7
7
6
7
6
5
5
7
7
6
7
7
7
7
6
6
6
7
6
6
6
7
6
6
7
7
6
7
6
7
7
7
7
7
7
7
7
7
6
5
6
7
7
7
7
7
7
7
7
6
7
7
5
6
6
7
5
6
7
7
7
5
7
7
7
6
7
6
7
7
7
7
7
6
7
7
7
7
7
7
7
7
7
7
6
7
5
6
6
7
6
7
7
6
7
6
7
6
7
7
7
5
7
5
6
6
6
5
7
6
5
7
7
7
5
4
7
5
6
6
5
7
5
6
4
4
5
6
6
5
7
6
6
7
7
5
7
5
6
6
7
5
7
6
5
7
5
6
5
5
7
5
6
6
5
7
5
7
4
4
6
6
7
5
7
7
5
7
7
7
7
6
6
6
7
5
7
6
6
7
6
6
7
7
6
5
6
6
5
7
5
5
4
4
5
7
7
4
7
6
5
322
7
7
6
7
6
6
6
7
5
7
6
4
7
6
5
6
6
6
4
6
5
5
7
4
5
5
4
6
6
7
5
7
4
7
7
6
6
7
6
6
6
7
5
7
6
4
6
7
5
5
6
6
4
6
5
4
7
4
5
5
4
6
7
7
4
7
4
5
5
6
7
3
5
6
6
7
5
6
7
6
6
7
6
4
5
7
6
5
4
3
5
4
7
7
6
1
6
6
6
7
6
5
5
6
7
5
4
6
6
7
5
6
7
5
6
7
5
3
5
7
6
5
4
3
5
2
7
7
4
4
7
6
6
7
6
5
5
6
7
4
5
6
6
7
3
6
7
5
6
7
6
4
6
7
6
6
5
4
6
5
7
7
6
4
6
6
6
7
6
6
6
6
7
5
5
6
6
7
3
6
7
6
6
7
5
3
6
7
6
7
5
5
6
5
6
7
5
5
6
6
6
7
6
5
6
6
4
7
6
5
7
6
5
5
6
6
6
7
6
6
6
7
5
6
7
4
6
4
7
7
6
6
7
7
5
6
6
7
6
6
4
6
6
6
7
6
5
5
6
6
6
7
6
7
6
7
6
6
6
4
6
3
7
7
6
6
7
7
5
6
6
6
6
6
4
7
6
6
6
6
5
6
6
5
6
7
6
7
6
7
6
6
6
3
6
5
7
7
6
6
7
6
5
6
5
7
5
6
5
7
6
6
6
6
4
5
6
5
6
7
6
6
6
7
6
6
7
3
6
5
7
7
7
6
7
6
5
6
5
6
1
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
50
49
23
50
58
46
59
50
48
39
44
43
56
58
48
46
48
50
53
53
48
56
48
36
51
39
47
53
48
47
56
57
31
48
Cristian Opariuc-Dan
7
6
6
6
5
6
3
6
7
5
6
6
6
7
3
4
7
7
6
6
5
7
6
6
6
6
5
5
5
6
5
4
7
4
7
6
6
6
5
6
3
6
7
5
6
6
6
7
3
4
7
6
6
6
4
6
6
6
6
6
5
7
6
3
5
3
7
4
5
6
6
6
5
6
4
6
7
5
6
6
6
7
4
4
7
6
6
6
5
7
6
6
6
7
3
6
7
5
5
3
7
4
7
5
6
6
6
5
4
6
7
6
6
6
6
7
4
4
7
7
5
6
4
5
6
6
6
7
3
7
7
4
6
4
7
5
4
5
3
6
5
6
3
5
7
7
6
6
6
7
6
5
7
6
6
5
7
5
5
6
5
7
4
6
4
6
3
6
6
6
4
5
4
5
5
7
4
5
7
7
6
6
6
7
6
4
7
6
6
5
6
4
6
6
6
7
4
5
5
6
4
6
6
6
4
4
5
5
5
6
5
5
7
7
6
6
6
7
7
5
7
6
7
7
7
5
6
6
5
7
4
6
5
7
5
6
6
6
4
4
5
6
5
7
5
4
7
7
6
6
6
7
7
5
7
6
7
5
6
5
5
6
6
7
4
7
5
7
4
6
6
6
7
7
7
6
7
6
6
7
7
7
6
7
7
7
6
7
6
7
7
7
7
6
7
7
7
7
6
6
7
6
6
7
7
7
6
6
6
6
7
7
6
7
7
7
6
7
5
7
5
6
6
7
7
7
7
6
7
7
7
7
7
6
7
6
7
7
7
6
6
7
7
6
6
7
6
7
7
7
6
7
6
7
6
7
6
7
6
7
7
6
7
7
6
7
7
6
7
6
7
7
7
7
6
5
5
7
7
6
5
4
5
5
5
6
5
7
6
5
5
6
6
5
5
6
4
7
5
5
6
6
5
6
7
7
7
5
6
5
5
6
7
6
5
5
6
5
5
7
5
7
6
5
5
6
6
5
5
5
4
7
5
6
7
6
6
6
5
7
7
4
7
5
6
7
6
6
5
5
5
5
6
5
5
7
6
7
6
7
6
6
5
7
6
6
6
5
7
6
5
6
5
7
7
4
323
6
6
4
6
4
6
6
4
6
5
4
5
5
7
6
6
6
7
6
6
5
6
4
7
6
6
7
5
6
6
6
7
7
5
6
6
4
6
4
6
6
5
6
5
4
5
3
6
6
6
6
6
6
6
5
6
4
7
6
6
7
5
6
5
6
7
7
4
6
5
6
4
3
4
7
6
2
3
5
3
6
6
7
7
3
7
5
6
7
6
4
7
3
6
6
7
7
6
6
6
7
7
7
5
7
5
3
5
7
7
3
4
6
4
6
6
6
7
4
7
4
6
7
6
5
6
3
6
6
7
7
6
6
6
7
7
6
6
6
4
4
5
7
6
4
5
5
3
6
6
5
7
5
7
5
6
7
6
5
7
4
6
6
7
6
6
6
6
7
7
6
6
6
4
4
5
7
7
5
5
6
4
6
6
5
7
5
7
5
7
7
6
5
6
4
7
6
7
6
6
6
6
7
7
6
5
6
6
4
6
6
6
6
6
6
6
5
7
7
6
7
5
6
5
7
6
4
6
5
7
6
6
7
4
6
7
7
7
6
5
6
6
4
6
6
6
7
7
5
6
5
7
7
6
7
5
6
6
7
6
5
6
5
6
6
6
7
3
6
7
7
7
5
6
5
5
5
6
5
6
6
7
5
6
6
7
7
5
7
5
6
4
7
6
5
6
7
6
7
5
7
5
6
7
77
7
5
6
5
5
5
6
5
7
7
7
5
6
6
7
7
5
7
4
6
5
7
7
5
6
7
6
7
5
7
5
6
7
7
7
2
1
2
1
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1
2
1
1
1
1
1
52
31
30
50
48
53
31
35
53
36
46
59
51
48
57
43
58
31
49
57
56
50
31
53
52
50
59
58
52
51
53
53
45
55
7
6
7
3
4
7
6
6
3
4
6
4
6
3
7
5
7
6
6
6
4
4
4
7
6
7
7
6
5
7
4
7
4
6
6
5
7
4
6
7
6
5
4
5
6
4
6
5
7
6
7
6
6
7
3
3
4
6
6
7
7
7
4
7
5
7
3
6
7
5
7
4
4
7
6
6
4
5
6
3
6
7
7
6
7
6
6
7
4
4
5
7
6
7
7
7
5
7
5
7
4
6
7
6
6
4
7
6
6
5
7
2
4
6
6
4
3
6
7
5
6
7
5
6
3
6
7
7
6
4
6
3
5
6
6
6
5
6
5
4
7
7
6
5
7
3
5
6
6
5
4
6
7
5
6
7
5
6
4
6
6
7
6
4
6
4
6
6
6
6
6
6
5
4
7
6
5
6
6
5
5
6
6
5
5
6
7
6
5
6
5
5
5
5
7
7
6
4
7
5
6
6
6
6
7
4
6
4
7
7
6
6
6
4
5
6
6
5
4
6
7
6
5
6
5
4
5
5
6
7
6
4
7
5
5
6
6
6
7
6
7
5
7
6
7
6
6
5
7
6
7
6
7
7
7
7
7
7
6
5
7
6
7
5
6
7
7
6
6
7
7
6
5
6
7
4
7
7
6
6
6
5
7
7
7
5
7
7
7
6
7
6
6
5
7
6
7
6
6
6
7
7
7
5
7
7
6
7
7
5
7
7
6
7
6
6
7
6
7
5
7
7
6
6
7
7
6
6
7
6
6
5
6
6
7
7
7
6
7
7
7
6
5
4
7
7
7
5
6
1
5
6
7
7
3
7
5
7
5
5
4
5
7
6
5
6
3
6
5
5
6
7
7
6
6
6
5
4
7
6
6
5
6
4
5
6
7
7
4
7
6
7
5
5
4
5
6
7
6
6
3
7
5
6
5
7
7
6
5
5
7
5
7
6
7
7
6
2
6
6
6
7
3
7
5
7
7
5
4
4
6
7
5
6
7
7
5
5
7
7
7
6
324
7
7
6
5
7
6
6
6
6
3
6
6
4
7
3
7
6
7
6
5
3
4
6
7
6
6
6
7
5
6
7
6
7
6
7
7
6
3
7
7
6
6
6
4
6
6
4
7
4
7
6
6
6
5
4
4
6
7
6
6
6
7
5
6
6
6
7
6
7
6
7
5
4
6
3
6
6
6
6
6
7
4
5
4
4
6
4
5
5
5
5
7
6
6
7
6
7
6
5
3
6
3
6
6
6
5
4
5
5
6
6
6
6
6
6
3
5
4
5
6
4
5
5
5
6
7
6
6
7
6
7
6
5
5
6
3
6
6
6
5
5
6
4
6
5
6
5
6
6
5
6
5
5
6
4
6
5
6
5
7
6
6
7
6
7
6
5
4
6
4
6
6
6
5
5
5
5
6
6
6
5
6
6
5
6
5
5
6
4
6
5
5
7
7
6
6
7
6
7
6
6
5
6
4
7
6
7
6
6
6
7
6
7
5
4
7
6
5
6
6
6
4
6
7
2
5
6
6
6
7
6
6
7
6
5
4
7
6
6
6
7
6
6
6
7
6
7
5
4
7
6
5
6
6
6
4
6
7
2
5
6
6
6
6
6
6
7
6
6
4
7
6
7
6
7
6
6
6
7
5
7
5
4
7
6
5
5
7
6
4
6
7
5
3
6
7
6
6
6
6
7
6
5
4
7
6
6
6
7
6
6
6
7
5
7
5
4
7
6
5
5
7
7
4
6
7
6
4
6
7
6
6
6
6
7
6
5
5
7
6
1
1
1
1
1
2
1
1
1
1
1
1
1
1
2
1
1
2
2
1
2
1
1
2
1
1
1
1
1
2
1
1
1
2
55
53
56
51
45
50
54
54
53
50
50
53
49
39
30
48
57
44
30
53
30
56
36
44
49
53
54
31
50
46
23
58
50
50
Cristian Opariuc-Dan
7
7
5
7
6
7
3
6
5
6
7
5
6
5
6
5
6
6
5
7
3
5
6
5
7
5
7
7
7
4
7
6
6
7
5
6
5
7
5
6
6
6
7
4
5
6
5
7
6
7
6
5
5
6
7
7
7
5
6
7
5
4
6
6
5
7
3
5
6
5
7
6
7
7
6
5
7
7
7
5
5
6
7
7
4
6
6
5
7
4
6
6
5
7
5
7
6
5
6
5
6
5
5
7
6
6
6
7
6
6
7
3
2
7
6
6
7
5
7
6
7
6
6
6
6
7
7
6
6
5
7
6
6
7
4
3
7
6
6
7
5
7
7
6
6
6
6
6
7
7
6
6
6
7
6
6
7
5
5
7
6
5
7
5
7
7
7
6
5
7
5
7
7
6
6
5
7
6
6
7
4
4
7
6
6
7
7
7
7
5
6
6
6
6
7
7
6
6
6
6
6
6
6
7
4
7
7
6
7
6
7
6
6
6
7
6
6
6
7
7
6
6
6
7
6
6
6
5
7
7
6
7
6
7
7
7
6
7
6
6
7
7
7
7
6
6
7
6
6
6
5
7
6
6
7
5
6
4
7
7
6
6
5
7
7
7
7
5
6
6
7
5
5
5
7
7
7
7
5
6
5
7
7
5
6
6
6
7
7
7
6
6
6
5
5
5
5
7
7
7
7
5
6
5
6
7
5
6
7
6
7
7
7
6
5
6
7
4
5
5
7
6
325
7
7
6
7
5
5
7
5
6
7
4
7
7
7
5
6
6
6
4
5
3
7
7
7
6
6
7
4
4
7
6
7
6
4
7
7
7
5
5
5
6
4
5
4
7
7
7
3
6
6
6
7
7
7
7
7
6
4
6
7
7
5
6
6
5
4
6
3
7
7
4
6
5
6
7
7
7
7
7
6
4
6
6
7
5
7
6
5
5
6
4
7
7
4
6
5
6
7
7
7
7
7
6
5
7
6
7
5
6
6
4
5
6
5
7
7
5
6
6
6
7
7
7
7
7
7
5
7
6
7
6
6
6
3
5
6
5
7
5
5
6
5
6
6
7
4
5
5
7
6
6
7
6
7
5
6
4
5
5
7
6
5
4
6
5
7
6
7
4
5
5
7
6
7
7
6
6
5
6
4
6
5
6
6
5
4
6
5
7
6
7
4
5
4
7
6
6
7
5
7
4
6
5
5
5
7
5
5
4
7
5
7
6
7
5
5
5
7
6
6
7
5
6
5
6
5
5
5
7
5
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
43
45
55
57
53
50
53
50
56
47
59
54
48
57
45
57
53
23
54
23
46
35
48
Cronbach. Deoarece acest chestionar are ase scale, analiza consistenei interne pentru ntregul instrument nu are sens.
Cristian Opariuc-Dan
Dup ce am prsit acest formular, prin apsarea butonului Continue, va trebui s apsm butonul OK n vederea lansrii procedurilor de
calcul.
Primul tabel din foaia de
Case Processing Summary
rezultate se refer la sumarul
N
%
cazurilor analizate. Observm c
Cases
Valid
160
100,0
studiul consistenei interne s-a
Excludeda
0
,0
realizat pe un numr de 160 de
Total
160
100,0
subieci, toi avnd rezultatele
a. Listwise deletion based on all variables in the procedure.
completate corect, procentul de rezultate valide fiind de 100%. A doua linie
din tabel ne informeaz asupra cazurilor excluse din analiz. Dac unii dintre subieci ar fi avut date lips la vreunul dintre cei cinci itemi, n aceast
linie ar fi fost prezentat numrul acestora. Desigur, ntr-o asemenea situaie,
numrul de cazuri valide nu ar mai fi fost 160, ci un alt numr, diminuat cu
valoarea din linia cazurilor excluse. Din fericire, nu ne aflm ntr-o asemenea situaie, iar SPSS nu raporteaz niciun caz exclus. n mod firesc, linia
Total reprezint suma dintre cazurile valide i cazurile excluse, numr
egal cu subiecii din baza de Tabelul 3.9 Coeficientul de consisten intern Cronbach
Reliability Statistics
date.
Tabelul 3.8 Sumarul cazurilor analizate
Cronbach's Alpha
N of
on Standardized Items
Items
Urmtorul tabel conine
,899
,899
5
datele care ne intereseaz pe noi
cel mai mult, i anume valoarea coeficientului de consisten intern. Observm c scala analizat, format din cinci itemi, are un coeficient de consisten intern Cronbach de 0,899, att n form brut ct i n form
standardizat. Diferena dintre cele dou valori const n procedura de lucru. n forma brut, calculul de bazeaz pe numrul de itemi din scal i pe
raportul dintre media covarianelor inter-item i media varianelor itemilor.
Formula de calcul nu a fost prezentat n acest volum, prefernd calculul
coeficientului standardizat. Acesta din urm pleac de la supoziia c vari-
327
ana itemilor este egal aa cum am discutat deja i se bazeaz pe corelaiile dintre itemi. Indiferent de metoda de lucru, am constatat c scala
motivaie este o scal fidel sub aspectul consistenei interne (o scal consistent).
Tabelul urmtor pe care l afieaz formularul de rezultate conine
Mean Std. Deviation
N
statisticile descriptive pentru fiecare
Itemul 12
5,77
1,059
160
Itemul 13
5,84
,955
160 dintre cei cinci itemi analizai. ObserItemul 14
5,92
1,009
160 vm c SPSS a calculat, pentru fiecaItemul 15
5,82
1,045
160
re dintre itemi, media i abaterea
Itemul 16
5,72
1,065
160
standard. Privind mediile, am putea
aprecia, la prima vedere, c acestea sunt relativ egale, fr diferene semnificative ntre ele. Ne amintim, totui, c am ales un test statistic pentru a
verifica egalitatea mediilor testul T-square care pleac de la ipoteza nul
a egalitii acestora. Ultimul tabel din formularul de rezultate arat rezultatele administrrii acestui test statisTabelul 3.11 Testul de egalitate a mediilor
Hotelling's T-Squared Test
tic. ntr-adevr, ne-am fi nelat
Hotelling's
Tdac am fi presupus c mediile sunt
F
df1 df2
Sig
Squared
egale. Testul este semnificativ
14,277 3,502
4 156
,009
(F(4,156)=3,50, p<0,01), prin urmare
ipoteza nul nu poate fi acceptat. Mediile nu sunt egale la nivelul celor
cinci itemi, existnd diferene semnificative ntre rspunsurile subiecilor la
aceste ntrebri, fapt de
Tabelul 3.12 Matricea de corelaii inter-itemi
Inter-Item Correlation Matrix
altfel pozitiv, care asigur
Itemul 12 Itemul 13 Itemul 14 Itemul 15 Itemul 16
variabilitatea, eterogenita1,000
,803
,635
,558
,533
Itemul 12
tea necesar.
,803
1,000
,567
,570
,562
Itemul 13
Tabelul 3.10 Statistici descriptive la nivel de itemi
Item Statistics
Itemul 14
,635
,567
1,000
,672
,622
Itemul 15
,558
,570
,672
1,000
,880
Itemul 16
,533
,562
,622
,880
1,000
328
Urmtoarele dou
tabele v arat matricele
de corelaii i de covarian-
Cristian Opariuc-Dan
e inter-itemi. Tabelul 3.12 prezint tocmai matricea de corelaii dintre cei
cinci itemi, similar celei pe care am construit-o n capitolul anterior, la
calcularea manual a acestui coeficient.
La o simpl priviTabelul 3.13 Matricea de covarian inter-itemi
Inter-Item Covariance Matrix
re, observm coeficieni de
Itemul 12 Itemul 13 Itemul 14 Itemul 15 Itemul 16
corelaie ridicai ntre cei
1,122
,813
,679
,618
,601
Itemul 12
cinci itemi, aceasta fiind Itemul 13
,813
,913
,547
,569
,572
explicaia obinerii unei Itemul 14
,679
,547
1,019
,708
,669
,618
,569
,708
1,093
,980
fideliti ridicate la nivelul Itemul 15
,601
,572
,669
,980
1,134
Itemul 16
scalei. Studiul covarianelor ne permite, de asemenea, aprecierea omogenitii scalei. ntr-adevr,
diferenele dintre itemi sunt relativ mici, subiecii rspunznd compact pe
scala motivaie, lucru care ne permite s deducem, din nou, existena unei
valori mari pentru fidelitatea scalei.
Tabelul 3.14 Statistici cumulate la nivelul scalei
Summary Item Statistics
Mean Minimum Maximum Range
Maximum /
Variance N of Items
Minimum
Item Means
5,814
5,719
5,919
,200
1,035
,006
Item Variances
1,056
,913
1,134
,222
1,243
,008
Inter-Item Covariances
,676
,547
,980
,433
1,792
,017
Inter-Item Correlations
,640
,533
,880
,348
1,652
,013
Cronbach's
Alpha if Item
Deleted
Itemul 12
23,30
12,249
,731
,693
,881
Itemul 13
23,23
12,880
,729
,671
,881
Itemul 14
23,15
12,569
,728
,551
,881
Itemul 15
23,25
11,950
,796
,802
,866
Itemul 16
23,35
12,015
,765
,781
,873
Cristian Opariuc-Dan
n final, am adus suficiente dovezi n sprijinul fidelitii acestei scale, demonstrnd c toi cei cinci itemi sunt consisteni, fidelitatea prin aceast metod fiind bun, putem pstra scala n forma ei actual. Desigur, n
general nu vom folosi toate aceste opiuni statistice pentru calculul fidelitii prin metoda consistenei interne. Spre exemplu, statisticile descriptive la
nivel de scal se folosesc, n special, pentru metoda split-half i nu pentru
metoda consistenei interne.
Pentru a clarifica problematica analizei de fidelitate prin metoda
consistenei interne, vom considera o nou scal scala sarcina, format
din itemii 1, 2, 3 i 4. nainte de a ncepe studiul acestei scale, s vedem ce
se ntmpl dac avem un item inversat. Anterior, am afirmat c rspunsurile subiecilor se dau pe o scal de la 1 la 7, unde 1 nseamn foarte puin
iar 7 nseamn foarte mult. De obicei, n chestionare nu vei ntlni toi
itemii prezentai n forma natural a scalei (1 foarte puin, 7 foarte
mult). Din cnd n cnd, vei observa itemi la care 1 nseamn foarte mult
iar 7 foarte puin. Motivul pentru care cercettorii folosesc un asemenea
sistem, cu itemi inversai, este unul foarte simplu. Se evit tendina de rspuns n sensul pozitiv sau negativ al scalei, i oblig subiecii s fie
ateni la rspunsurile pe care le dau. Cu alte cuvinte, elimin rutina rspunsurilor. Dei practica este apreciat i rspndit n lumea tiinific, ea poate crea probleme atunci cnd apare necesitatea analizei datelor.
Chestionarul nostru nu are itemi cu scale de rspuns inversate, ns
putem crea foarte uor un item de acest tip. Care ar fi procedeul? n primul
rnd, vom reine valoarea maxim a scalei de rspuns. n cazul nostru,
aceasta este valoarea 7 (variantele de rspuns sunt de la 1 la 7). Apoi adugm o unitate la aceast valoare (7+1=8). Din valoarea astfel rezultat, scdem scorul obinut de ctre subieci la itemul respectiv.
De exemplu, dorim s inversm itemul 4 din scala sarcina. Desigur, subiecii au rspuns la aceast scal de la 1 la 7, valoarea maxim fiind
331
Cristian Opariuc-Dan
Numeric Expression scriem formula de calcul, n cazul nostru 8-item4.
La apsarea butonului OK, programul va crea o nou variabil, numit
item4tr, apoi va lua scorul fiecruia dintre cei 160 de subieci i l va scdea din valoarea 8, rezultatul fiind depozitat n variabila nou creat.
Ce am obinut de fapt?
Dac rspunsurile la itemul 4
original nsemnau 1 foarte
puin i 7 foarte mult, rspunsurile la itemul 4 transformat
vor nsemna 1 foarte mult i 7
foarte puin. Iat metoda prin
care putem inversa itemii,
Figura 3.9 Analiza fidelitii scalei sarcina
atunci cnd constatm probleme n consistena scalei. Simplu i elegant! Totui, care ar putea fi problemele legate de consistena scalei? n seciunea teoretic din cadrul acestui
capitol am discutat despre posibilitatea
obinerii unui coeficient de consisten
intern foarte mic, sau chiar negativ, din
cauza existenei itemilor inversai. A
venit momentul s ne i confruntm cu o
asemenea situaie. S ne imaginm c
scala sarcina avea itemii 1, 2 i 3 n
sensul natural al scalei iar itemul 4 era
inversat. Acum, ne intereseaz studiul
consistenei interne a acestei scale.
Figura 3.10 Statistici calculate pentru
scala sarcina
333
Cristian Opariuc-Dan
i 3, coeficienii fiind cuprini ntre 0,62 i 0,80, singura problem fiind
aceea c itemul 4 coreleaz negativ. Este foarte clar faptul c avem de a
face cu un item inversat.
n mod normal, analiza s-ar opri la aceast faz, dup care vom proceda la inversarea sensului scalei itemului 4 i reluarea studiului de fidelitate.
Tabelul 3.20 Relaii ntre itemi i scal
Item-Total Statistics
Squared MulScale Mean if Scale Variance Corrected Itemtiple CorrelaItem Deleted if Item Deleted Total Correlation
tion
Cronbach's Alpha
if Item Deleted
Itemul 1
13,64
1,931
,799
,723
-1,598a
Itemul 2
13,57
2,486
,686
,809
-1,062a
Itemul 3
13,51
3,082
,552
,730
-,653a
Itemul 4 transformat
17,02
11,239
-,790
,718
,912
a. The value is negative due to a negative average covariance among items. This violates reliability model
assumptions. You may want to check item codings.
Chiar i SPSS i-a dat seama de acest lucru, dac observai subsolul
tabelului 3.20. Strict informativ, putei vedea ce se ntmpl dac eliminm
al patrulea item. Media i variana scalei vor crete, la fel i coeficientul de
consisten intern. Totui, acesta nu este un item neconsistent ci un item
care coreleaz bine cu scala, singura sa problem fiind aceea a sensului de
rspuns.
Relund analiza, prin nlocuirea itemului 4 transformat cu itemul 4
original, vom obine un coeficient de consisten intern de 0,92, aceasta
fiind i cea mai mare valoare obinut a consistenei interne.
Exerciii:
Efectuai analiza consistenei interne a scalei sarcina folosind
itemul 4 original i explicai diferenele.
335
Realizai analiza de fidelitate prin metoda consistenei interne pentru celelalte patru scale rmase.
Nu vom mai insista asupra acestei metode, deoarece consider c
avei deja suficiente informaii pentru a realiza analize pertinente. Vreau
doar s menionez, n final, c metoda consistenei interne prin calculul coeficientului Cronbach nu este, de fiecare dat, cea mai bun variant. S-au
analizat, anterior, limitele sale. De aceea, Raykov (1998) a pus la punct o
modalitate de analiz a consistenei interne, numit fidelitate compozit sau
fidelitate Raykov , care pleac de la un principiu al analizei factoriale, conform creia un set de variabile poate s acopere o singur dimensiune, un
singur factor. Aceast metod este, la ora actual, preferat metodei lui
Cronbach i se consider c estimeaz mult mai bine fidelitatea real a unei
scale. Din nefericire, procedurile de calcul nu au fost nc implementate n
SPSS. Ele sunt ns disponibile n alte aplicaii, precum EQS i LISREL sau
AMOS.
Exist controverse ntre cercettori privind ordinea analizelor. Unii
afirm c este util, nti, s studiem consistena intern, pentru a ne asigura
de fidelitatea scalei, apoi s verificm unidimensionalitatea prin metoda
analizei factoriale. Alii se situeaz la polul opus. nti vom verifica dimensiunile unui instrument, prin analiza factorial, apoi vom studia, pentru fiecare dimensiune, fidelitatea acestora.
n realitate, au dreptate i unii i alii. Dac instrumentul este bine
conceput i vizeaz o singur dimensiune, studiul iniial al consistenei poate furniza informaii preioase, iar analiza factorial confirmatorie le va susine. Pentru instrumente complexe, multidimensionale, este mai util s realizm o analiz factorial sau o scalare multidimensional iniial, pentru a
verifica numrul de dimensiuni i modul n care acestea sunt saturate prin
itemi, iar apoi vom apela la studiul consistenei interne.
336
Cristian Opariuc-Dan
Dac instrumentul este greit conceput, fr consisten, atunci nici
analiza factorial, nici consistena intern, nicio metod nu-l poate repara.
n definitiv, nu putem face minuni cu procedeele statistice, dac cercettorul
a fost neinspirat sau diletant.
Analiza consistenei interne nu se folosete, de obicei, independent,
ci este asociat cu alte metode de explorare ale dimensionalitii instrumentelor. Cele mai utilizate proceduri asociate consistenei interne sunt analiza
factorial, scalarea multidimensional sau analiza de cluster. Cu rbdare, le
vom aborda pe toate n decursul lucrrilor noastre.
Valid
a
Excluded
Total
%
159
99,4
,6
160
100,0
337
S presupunem c dorim
s studiem fidelitatea, prin metoda njumtirii, pentru ntregul chestionar. Dup alegerea
Part 1
Value
,839
12a
N of Items
Part 2
Value
,572
12b
N of Items
Total N of Items
Spearman-Brown Coefficient
24
,254
Equal Length
,405
Unequal Length
,405
,393
Cristian Opariuc-Dan
medii sunt sau nu semnificative, am fi putut afla utiliznd unul dintre testele
statistice prezentate mai sus, sau prin construirea tabelelor de analiz de
varian. Dac v-ai format puin ochiul statistic, deja putei suspecta ceva. Oare despre ce este vorba? S rezulte, oare, un coeficient de fidelitate
split-half cu o valoare mic?
ntr-adevr, aa este! S privim puin tabelul 3.23, cel mai important
tabel generat de SPSS. Consistena intern pentru prima parte a instrumentului este bun (0,839), n timp ce a doua parte are o consisten intern
aproape satisfctoare (0,572). Este firesc s obinem un coeficient de corelaie ntre cele dou pri de numai 0,254. Mai mult dect att, se observ o
fidelitate split-half redus, de doar 0,40, estimat prin intermediul coeficientului Spearman-Brown. Cele dou forme, avnd un numr egal de itemi,
expresia acestui coeficient va fi prima valoare (Equal Length). Dac formele ar fi avut un numr inegal de itemi (de exemplu prima parte 12 itemi i a
doua parte 13 itemi), am fi luat ca referin cea de-a doua valoare a coeficientului (Unequal Length).
Am vzut, totui, c varianele nu sunt egale. Dac ne-am raporta
precis la teorie, am alege ca indicator coeficientul de fidelitate split-half
Guttman. ns, lucrurile par mai sumbre. Coeficientul este de numai 0,39
(de fapt, coeficientul Guttman 4), cea mai mic sub aspectul fidelitii.
n realitate, Guttman a propus ase coeficieni de fidelitate care furnizeaz limitele inferioare ale fidelitii reale. Dac dorim s-i calculm, tot ceea ce avem de fcut este s nlocuim
modelul (alegem modelul Guttman din lista
derulant Model).
Vom obine tabelul din figura 3.24. Primul coeficient (1) este o estimare simpl a fide-
339
N of Items
,690
,738
,720
,393
,724
,806
24
Cristian Opariuc-Dan
aprecia c msura comportamentului organizaional este o msur fidel,
ns acesta prezint mai multe scale, fiind aadar necesar studierea structurii dimensionale a instrumentului. n realitate, tim bine c acest chestionar
este format din ase scale. Chiar dac nu am fi cunoscut acest lucru, iat c
studiul coeficienilor Guttman ne poate avertiza asupra acestor aspecte particulare. n mod evident, primii 12 itemi acoper anumite scale, ultimii 12
acoper alte scale. Chiar dac per ansamblu chestionarul poate fi consistent,
nu este necesar s exist o corelaie ntre scalele instrumentului.
341
342
Cristian Opariuc-Dan
rii. Coeficientul de corelaie ntre itemii formelor paralele este foarte mic.
Totui, fidelitatea scalei pare s fie ridicat (0,72). ntr-adevr, fidelitatea
este estimat similar coeficientului Cronbach, bazndu-se pe consistena
intern. Dac am fi folosit modelul paralel strict, acest coeficient ar fi fost i
mai mic, deoarece consistena intern se ajusteaz n funcie de diferenele
dintre mediile itemilor.
Desigur, dac am decis c modelul paralel simplu nu poate fi aplicat,
deoarece formele nu sunt paralele, nu vom putea aplica nici modelul paralel
strict. n realitate, modelul paralel simplu este, aa cum am specificat anterior, o variant mai permisiv a modelului paralel strict.
n concluzie, nu putem vorbi de existena formelor paralele la nivelul acestui chestionar. De fapt, bnuiam deja acest lucru n urma analizei
fidelitii prin metoda split-half. n realitate, foarte puine instrumente ndeplinesc condiiile formelor paralele, i, de aceea, nici metoda nu este intens
folosit.
344
Cristian Opariuc-Dan
Dintre tabelele afiate, nu ne intereseaz dect dou. n primul rnd, tabelul 3.27,
Item Statistics
care prezint statisticile descriptive ale fiecrui
Mean Std. Deviation N
Itemul 1
5,61
1,304 160 profesor. Fiecare dintre cei trei profesori a evaItemul 2
5,68
1,200 160 luat un numr de 160 de studeni. Cel mai geItemul 3
5,74
1,124 160
neros a fost profesorul Itemul 3, cu o medie
a notelor de 5,74 (atenie, ne aflm pe o scal de la 1 la 7, nu de la 1 la 10),
iar cel mai exigent a fost profesorul Itemul 1 cu o medie a notelor de
5,61. Abaterile standard ne informeaz c, primul profesor, dei mai exigent, are o variabilitate a notelor acordate mai mare n comparaie cu ultimul profesor, care nu numai c este cel mai tolerant, dar ofer i note mai
apropiate. Mediile relativ apropiate, acordate de ctre cei trei profesori, ne
ndeamn s credem c, n linii mari, acetia au fost de acord. Din pcate, n
statistic lucrurile nu in de aparen, ci trebuie demonstrate.
Tabelul 3.27 Statistici descriptive la
nivel de evaluatori
df1
df2
Sig
,776b
,721
,000
,912
,886
,000
Two-way random effects model where both people effects and measures effects are
random.
a. Type C intraclass correlation coefficients using a consistency definition-the between-measure variance is excluded from the denominator variance.
b. The estimator is the same, whether the interaction effect is present or not.
n medie, evalurile celor trei profesori (a doua linie din tabel), prezint un grad ridicat de acord (0,91), la un interval de ncredere 95% cuprins
ntre 0,88 i 0,93. Este mai mult dect evident faptul c cei trei profesori au
evaluat consistent studenii. Dac v ndoiai de acest lucru, testul F pleac
345
de la ipoteza nul a dezacordului total. Faptul c este semnificativ, ne permite s respingem ipoteza nul i s susinem acordul semnificativ ntre cei
trei profesori (F(159,318)=11,387, p<0,01).
Prima linie a tabelului (Single Measures) ne arat gradul de acord,
de fapt fidelitatea evalurilor, dac s-ar fi utilizat un singur profesor. Desigur, acest coeficient de fidelitate este mai mic n comparaie cu evaluarea
realizat de comisie (coeficientul de fidelitate are valoarea 0,76), totui,
constatm, n baza testului F, c i o asemenea evaluare ar fi fost semnificativ.
Prin urmare, nu mai dai vina pe profesori i trecei la nvat. Iat c
evaluarea realizat de o comisie nu va duce la note de trecere a examenului.
Glumeam, desigur!
,803**
Sig. (2-tailed)
,000
160
1
160
Cristian Opariuc-Dan
lot de cercetare format din 160 de subieci. Prima administrare a fost nregistrat n baza de date sub numele de Itemul 3, iar a doua administrare
sub numele de Itemul 4. Ne intereseaz s aflm dac scorurile obinute
de cei 160 de subieci sunt stabile n timp.
n primul rnd, vom calcula coeficientul de corelaie r BravaisPearson ntre cele dou administrri. Desigur, nu vom mai intra n amnuntele procedeului de calcul, aceste lucruri fiind deja discutate anterior.
Analiznd tabelul 3.29, observm existena unei corelaii semnificative, puternice i pozitive ntre cele dou administrri ale testului de inteligen (r=0,80, p<0,01).
Coeficientul de stabilitate se calculeaz, apoi, n baza formulei a doua a lui Spearman-Brown (formula 3.2). Vom avea, deci,
.
Valoarea coeficientului de stabilitate este 0,88, o valoare, desigur,
semnificativ, care arat o bun stabilitate a rezultatelor n timp.
348
Cristian Opariuc-Dan
349
Bibliografie
1. Albu, Monica. 2000. Metode i instrumente de evaluare n
psihologie. Cluj-Napoca : Argonaut, 2000. 973-9350351-8.
2. Bakeman, Roger i Robinson, Byron F. 2004. Understanding
Statistics in the Behavioral Sciences. New Jersey : Lawrence
Erlbaum Associates, 2004. 0-8058-4944-0.
3. Carmines, Edward i Zeller, Richard. 1979. Reliability and
Validity Assessment. Iowa : Sage Publication, Inc, 1979.
9780803913714.
4. Cortina, J.M. 1993. What is coefficient alpha? An examination of
theory and applications. Journal of Applied Psychology. 98-104,
1993, 78.
5. Field, A. 2000. Discovering statistics using SPSS for Windows.
London : Sage, 2000.
6. Fisher, Ronald A. 1971. The design of experiments. New York :
Hafner Press, 1971.
7. Gibbons, Jean Dickinson. 1993. Nonparametric Measures of
Association. Iowa : Sage Publications, Inc, 1993. Vol. 07-091.
9780803946644.
8. Havrneanu, Corneliu Eugen. 2000. Cunoaterea psihologic a
persoanei. Posibiliti de utilizare a computerului n psihologia
aplicat. Iai : Polirom, 2000.
9. . 2000. Metodologia cercetrii n tiinele sociale. Iai : Erota,
2000.
10. Kenny, David A. 1987. Statistics for the social and behavioral
sciences. Ontario : Little, Brown and Company, 1987. 0-316-489158.
11. Kirk, Roger E. 1995. Experimental design: Procedures for the
behaioral sciences. 3rd. Pacific Grove : Brooks/Cole, 1995.
12. Kline, P. 1999. The handbook of psychological testing, 2nd Edition.
London : Routledge, 1999.
13. Liebetrau, Albert M. 1983. Measures of Association. Washington :
Sage Publications, 1983. 0-8039-1974-3.
350
Cristian Opariuc-Dan
14. Opariuc-Dan, Cristian. 2009. Statistic aplicat n tiinele socioumane. Noiuni de baz - Statistici univariate. Cluj-Napoca : ASCR
& Cognitrom, 2009. 9737973631.
15. Radu, Ioan, i alii. 1993. Metodologie psihologic i analiza
datelor. Cluj-Napoca : Sincron, 1993.
16. Sava, Florin. 2004. Analiza datelor n cercetarea psihologic. ClujNapoca : ASCR, 2004. 973-7973-11-9.
17. Sntion, Filaret. 2009. Statistic psihologic. Constana : Europolis,
2009. Vol. 1. 9789736763823.
18. Stan, Aurel. 2002. Testul psihologic - Evoluie, construcie,
aplicaii. Iai : Polirom, 2002.
19. Swinscow, T.D.V. i Campbell, M.J. 2002. Statistic at Square One,
10th Edition. Navarra : BMJ Books, 2002. 0-7279-1552-5.
20. Urdan, Timothy. 2005. Statistics in Plain English, 2nd Edition.
New Jersey : Lawrence Erlbaum Associates, 2005. 0-8058-5241-7.
21. Vasilescu, Ilie Puiu. 1992. Statistic informatizat pentru tiinele
despre om. Bucureti : Militar, 1992.
351
Anexe
Anexa 1
Praguri de semnificaie la diferite valori ale coeficientului de corelaie a rangurilor
Spearman pentru loturi de cercetare de diferite dimensiuni.
0,536
0,503
0,484
0,464
0,443
0,429
0,414
0,401
0,391
0,380
0,618
0,587
0,560
0,538
0,521
0,503
0,485
0,472
0,460
0,447
0,709
0,671
0,648
0,622
0,604
0,582
0,566
0,550
0,535
0,520
0,755
0,727
0,703
0,675
0,654
0,635
0,615
0,600
0,584
0,570
21
22
23
24
25
26
27
28
0,370
0,361
0,353
0,344
0,337
0,331
0,324
0,317
0,435
0,425
0,415
0,406
0,398
0,390
0,382
0,375
0,508
0,496
0,486
0,476
0,466
0,457
0,448
0,440
0,556
0,544
0,532
0,521
0,511
0,501
0,491
0,483
352
Cristian Opariuc-Dan
29
30
35
40
45
50
60
70
80
90
100
0,312
0,306
0,283
0,264
0,248
0,235
0,214
0,190
0,185
0,174
0,165
0,368
0,362
0,335
0,313
0,294
0,279
0,255
0,235
0,220
0,207
0,197
0,433
0,425
0,394
0,368
0,347
0,329
0,300
0,278
0,260
0,245
0,233
0,475
0,467
0,433
0,405
0,382
0,363
0,331
0,307
0,287
0,271
0,257
Mod de utilizare:
Cutai rndul din tabel ce conine n prima coloan (n) numrul de subieci
din lotul dumneavoastr de cercetare. Dac nu gsii exact numrul de subieci dorit, alegei numrul imediat inferior (de exemplu, dac avei 21 de subieci, alegei rndul cu 20 de subieci).
353
Anexa 2
Praguri de semnificaie la diferite valori ale coeficientului de corelaie a rangurilor
Kendall pentru loturi de cercetare de diferite dimensiuni.
Anexa 2 Praguri de semnificaie pentru diferitele valori ale lui Kendall
0,025
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
0,05
1
0,87
0,71
0,64
0,56
0,51
0,46
0,43
0,41
0,39
0,38
0,36
0,35
0,34
0,33
0,32
0,31
0,30
0,29
0,29
0,28
0,27
0,27
0,26
0,26
0,25
0,25
0,25
0,24
Pragul de semnificaie
Pentru ipoteze unidirecionale
0,01
Pentru ipoteze bidirecionale
0,02
1
0,89
0,81
0,72
0,67
0,60
0,54
0,52
0,49
0,47
0,45
0,43
0,42
0,40
0,39
0,38
0,37
0,36
0,35
0,34
0,33
0,33
0,32
0,31
0,30
0,30
0,29
0,29
0,29
354
0,005
0,01
1
0,91
0,79
0,72
0,64
0,60
0,57
0,54
0,52
0,50
0,47
0,46
0,45
0,43
0,42
0,41
0,40
0,39
0,38
0,37
0,36
0,35
0,35
0,34
0,33
0,33
0,33
0,32
Cristian Opariuc-Dan
34
35
36
37
38
39
40
0,24
0,23
0,23
0,23
0,22
0,22
0,22
0,28
0,28
0,27
0,27
0,26
0,26
0,26
0,32
0,32
0,31
0,31
0,30
0,30
0,30
SURSA: dup (Vasilescu, 1992)
Mod de utilizare:
Cutai rndul din tabel ce conine n prima coloan (n) numrul de subieci
din lotul dumneavoastr de cercetare.
Pe rndul selectat, alegei pragul de semnificaie dorit, n funcie de tipul intervalului, unilateral sau bilateral. n cazul n care coeficientul dumneavoastr
de corelaie este mai mare dect valoarea nscris, atunci este semnificativ la
pragul ales. De exemplu, dac pe un lot de cercetare de 31 de subieci am obinut un coeficient de corelaie de 0,68, atunci este semnificativ la un prag de
semnificaie mai mic de 0,01 (0,68 este mai mare de 0,33, valoarea de referin pentru acest prag).
355
Anexa 3
Praguri de semnificaie la diferite valori ale coeficientului de contingen 2 pentru
loturi de cercetare de diferite dimensiuni.
Anexa 3 Praguri de semnificaie pentru diferitele valori ale lui 2
df
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0,050
3.84146
5.99146
7.81473
9.48773
11.07050
12.59159
14.06714
15.50731
16.91898
18.30704
19.67514
21.02607
22.36203
23.68479
24.99579
26.29623
27.58711
28.86930
30.14353
31.41043
32.67057
33.92444
35.17246
36.41503
37.65248
38.88514
40.11327
41.33714
42.55697
43.77297
Praguri de semnificaie
0,025
0,01
5.02389
6.63490
7.37776
9.21034
9.34840
11.34487
11.14329
13.27670
12.83250
15.08627
14.44938
16.81189
16.01276
18.47531
17.53455
20.09024
19.02277
21.66599
20.48318
23.20925
21.92005
24.72497
23.33666
26.21697
24.73560
27.68825
26.11895
29.14124
27.48839
30.57791
28.84535
31.99993
30.19101
33.40866
31.52638
34.80531
32.85233
36.19087
34.16961
37.56623
35.47888
38.93217
36.78071
40.28936
38.07563
41.63840
39.36408
42.97982
40.64647
44.31410
41.92317
45.64168
43.19451
46.96294
44.46079
48.27824
45.72229
49.58788
46.97924
50.89218
0,005
7.87944
10.59663
12.83816
14.86026
16.74960
18.54758
20.27774
21.95495
23.58935
25.18818
26.75685
28.29952
29.81947
31.31935
32.80132
34.26719
35.71847
37.15645
38.58226
39.99685
41.40106
42.79565
44.18128
45.55851
46.92789
48.28988
49.64492
50.99338
52.33562
53.67196
356
Cristian Opariuc-Dan
Anexa 4
Praguri de semnificaie la diferite valori ale testului t pentru loturi de cercetare de
diferite dimensiuni.
df
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
0,05
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
0,025
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
357
0,01
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
0,005
63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
0,001
318,309
22,327
10,215
7,173
5,893
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
0,0005
636,619
31,599
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
27
28
29
30
31
32
33
34
35
36
37
38
39
40
50
60
80
100
150
Infinit
1,314
1,313
1,311
1,310
1,309
1,309
1,308
1,307
1,306
1,306
1,305
1,304
1,304
1,303
1,299
1,296
1,292
1,290
1,287
1,282
1,703
1,701
1,699
1,697
1,696
1,694
1,692
1,691
1,690
1,688
1,687
1,686
1,685
1,684
1,676
1,671
1,664
1,660
1,655
1,645
2,052
2,048
2,045
2,042
2,040
2,037
2,035
2,032
2,030
2,028
2,026
2,024
2,023
2,021
2,009
2,000
1,990
1,984
1,976
1,960
2,473
2,467
2,462
2,457
2,453
2,449
2,445
2,441
2,438
2,434
2,431
2,429
2,426
2,423
2,403
2,390
2,374
2,364
2,351
2,326
2,771
2,763
2,756
2,750
2,744
2,738
2,733
2,728
2,724
2,719
2,715
2,712
2,708
2,704
2,678
2,660
2,639
2,626
2,609
2,576
3,421
3,408
3,396
3,385
3,375
3,365
3,356
3,348
3,340
3,333
3,326
3,319
3,313
3,307
3,261
3,232
3,195
3,174
3,145
3,090
3,690
3,674
3,659
3,646
3,633
3,622
3,611
3,601
3,591
3,582
3,574
3,566
3,558
3,551
3,496
3,460
3,416
3,390
3,357
3,291
Mod de utilizare:
Cutai rndul din tabel ce conine n prima coloan (n) numrul de subieci
din lotul dumneavoastr de cercetare.
Pe rndul selectat, alegei pragul de semnificaie dorit, n funcie de tipul intervalului, unilateral sau bilateral. n cazul n care coeficientul dumneavoastr
de corelaie este mai mare dect valoarea nscris, atunci este semnificativ la
pragul ales. De exemplu, dac pe un lot de cercetare de 31 de subieci am obinut o valoare t de 3,68, atunci este semnificativ la un prag de semnificaie
mai mic de 0,01 (3,68 este mai mare de 0,37, valoarea de referin pentru
acest prag).
358
Cristian Opariuc-Dan
Anexa 5
Valori critice ale testului de concordan W Kendall. Sunt furnizate att pragurile
pentru S ct i, direct, pragurile pentru W.
Anexa 5 Valori critice ale testului de concordan W Kendall
N
k
3
4
5
6
7
Valori pentru un prag de semnificaie mai mic de 0,05
S
W
S
W
S
W
S
W
S
W
64,4 0,716 103,9 0,660 157,3
0,624
3
49,5 0,619 88,4 0,552 143,3 0,512 217,0
0,484
4
62,6 0,501 112,3 0,449 182,2 0,417 276,2
0,395
5
75,7 0,421 136,1 0,378 221,4 0,351 335,2
0,333
6
48,1 0,379 101,7 0,318 183,7 0,287 299,0 0,267 453,1
0,253
8
0,204
10 60,0 0,300 127,8 0,256 231,2 0,231 376,7 0,215 571,0
0,137
15 89,8 0,200 192,9 0,171 349,8 0,155 570,5 0,145 864,9
0,103
20 119,7 0,150 258,0 0,129 468,5 0,117 764,4 0,109 1158,7
Valori pentru un prag de semnificaie mai mic de 0,01
75,6 0,840 122,8 0,780 185,6
0,737
3
61,4 0,768 109,3 0,683 176,2 0,629 265,0
0,592
4
80,5 0,644 142,8 0,571 229,4 0,524 343,8
0,491
5
99,5 0,553 176,1 0,489 282,4 0,448 422,6
0,419
6
66,8 0,522 137,4 0,429 242,7 0,379 388,3 0,347 579,9
0,324
8
0,263
10 85,1 0,425 175,3 0,351 309,1 0,309 494,0 0,282 737,0
0,179
15 131,0 0,291 269,8 0,240 475,2 0,211 758,2 0,193 1129,5
0,136
20 177,0 0,221 364,2 0,182 641,2 0,160 1022,2 0,146 1521,9
SURSA: dup (Radu, i alii, 1993)
Valori suplimentare cnd n=3
p<0,05
p<0,01
54,0 0,333 75,9 0,469
9
12 71,9 0,250 103,5 0,359
14 83,8 0,214 121,9 0,311
16 95,8 0,187 140,2 0,274
18 107,7 0,166 158,6 0,245
359
Anexa 6
Valori critice privind testarea coeficienilor de corelaie r Bravais-Pearson
Anexa 6 Valori critice ale testului de concordan W Kendall
Nivel de semnificaie pentru ipotez bidirecional
df= n-2
0,10
0,05
0,02
0,01
1
0.988
0.997
0.9995
0.9999
2
0.900
0.950
0.980
0.990
3
0.805
0.878
0.934
0.959
4
0.729
0.811
0.882
0.917
5
0.669
0.754
0.833
0.874
6
0.622
0.707
0.789
0.834
7
0.582
0.666
0.750
0.798
8
0.549
0.632
0.716
0.765
9
0.521
0.602
0.685
0.735
10
0.497
0.576
0.658
0.708
11
0.476
0.553
0.634
0.684
12
0.458
0.532
0.612
0.661
13
0.441
0.514
0.592
0.641
14
0.426
0.497
0.574
0.628
15
0.412
0.482
0.558
0.606
16
0.400
0.468
0.542
0.590
17
0.389
0.456
0.528
0.575
18
0.378
0.444
0.516
0.561
19
0.369
0.433
0.503
0.549
20
0.360
0.423
0.492
0.537
21
0.352
0.413
0.482
0.526
22
0.344
0.404
0.472
0.515
23
0.337
0.396
0.462
0.505
24
0.330
0.388
0.453
0.495
25
0.323
0.381
0.445
0.487
26
0.317
0.374
0.437
0.479
27
0.311
0.367
0.430
0.471
28
0.306
0.361
0.423
0.463
29
0.301
0.355
0.416
0.456
30
0.296
0.349
0.409
0.449
35
0.275
0.325
0.381
0.418
40
0.257
0.304
0.358
0.393
45
0.243
0.288
0.338
0.372
50
0.231
0.273
0.322
0.354
60
0.211
0.250
0.295
0.325
360
Cristian Opariuc-Dan
70
80
90
100
0.195
0.183
0.173
0.164
0.232
0.217
0.205
0.195
0.274
0.256
0.242
0.230
0.302
0.284
0.267
0.254
Mod de utilizare:
Cutai rndul din tabel ce conine n prima coloan (df) numrul de grade de
libertate (n-2).
Pe rndul selectat, alegei pragul de semnificaie dorit. n cazul n care coeficientul dumneavoastr de corelaie este mai mare dect valoarea nscris,
atunci este semnificativ la pragul ales. De exemplu, dac pe un lot de cercetare de 31 de subieci am obinut o valoare r de 0,68, atunci este semnificativ la
un prag de semnificaie mai mic de 0,01.
361
Anexa 7
Valori de referin privind coeficientul de corelaie biserial i triserial
Anexa 7 Valori de referin pentru calculul coeficientului biserial i triserial
p
q
0,350
0,351
0,352
0,353
0,354
0,355
0,356
0,357
0,358
0,359
0,360
0,361
0,362
0,363
0,364
0,365
0,366
0,367
0,368
0,369
0,370
0,371
0,372
0,373
0,374
0,375
0,376
0,377
0,378
0,379
0,380
0,381
0,382
0,383
0,384
0,385
0,386
0,387
0,6142
0,6144
0,6145
0,6147
0,6149
0,6151
0,6152
0,6154
0,6155
0,6157
0,6158
0,6160
0,6162
0,6163
0,6165
0,6166
0,6168
0,6169
0,6171
0,6172
0,6174
0,6175
0,6177
0,6178
0,6179
0,6181
0,6182
0,6184
0,6185
0,6186
0,6188
0,6189
0,6190
0,6192
0,6193
0,6194
0,6196
0,6197
1,288
1,287
1,287
1,286
1,286
1,285
1,285
1,284
1,284
1,283
1,283
1,283
1,282
1,282
1,281
1,281
1,280
1,280
1,280
1,279
1,279
1,278
1,278
1,278
1,277
1,277
1,276
1,276
1,276
1,275
1,275
1,274
1,274
1,274
1,273
1,273
1,273
1,272
p
q
1,0583
1,0564
1,0544
1,0525
1,0506
1,0487
1,0468
1,0449
1,0430
1,0411
1,0392
1,0373
1,0354
1,0336
1,0317
1,0289
1,0279
1,0261
1,0242
1,0223
1,0205
1,0186
1,0167
1,0149
1,0130
1,0112
1,0093
1,0075
1,0057
1,0038
1,0020
1,0002
0,9983
0,9965
0,9947
0,9929
0,9910
0,9892
0,401
0,402
0,403
0,404
0,405
0,406
0,407
0,408
0,409
0,410
0,411
0,412
0,413
0,414
0,415
0,416
0,417
0,418
0,419
0,420
0,421
0,422
0,423
0,424
0,425
0,426
0,427
0,428
0,429
0,430
0,431
0,432
0,433
0,434
0,435
0,436
0,437
0,438
0,6213
0,6214
0,6215
0,6216
0,6218
0,6219
0,6220
0,6221
0,6222
0,6223
0,6224
0,6225
0,6225
0,6226
0,6227
0,6228
0,6229
0,6230
0,6231
0,6233
0,6233
0,6234
0,6234
0,6235
0,6236
0,6237
0,6238
0,6239
0,6239
0,6240
0,6241
0,6242
0,6242
0,6243
0,6244
0,6244
0,6245
0,6246
1,268
1,267
1,267
1,267
1,267
1,266
1,266
1,266
1,265
1,265
1,265
1,265
1,264
1,264
1,264
1,264
1,263
1,263
1,263
1,263
1,262
1,262
1,262
1,262
1,261
1,261
1,261
1,261
1,261
1,260
1,260
1,260
1,260
1,260
1,259
1,269
1,259
1,259
362
p
q
0,9644
0,9623
0,9605
0,9587
0,9570
0,9552
0,9534
0,9517
0,9499
0,9482
0,9464
0,9446
0,9429
0,9411
0,9394
0,9376
0,9359
0,9342
0,9342
0,9307
0,9290
0,9272
0,9255
0,9237
0,9221
0,9203
0,9186
0,9169
0,9152
0,9134
0,9117
0,9100
0,9083
0,9066
0,9049
0,9032
0,9015
0,8998
0,451
0,452
0,453
0,454
0,455
0,456
0,457
0,458
0,459
0,460
0,461
0,462
0,463
0,464
0,465
0,466
0,467
0,468
0,469
0,470
0,471
0,472
0,473
0,474
0,475
0,476
0,477
0,478
0,479
0,480
0,481
0,482
0,483
0,484
0,485
0,486
0,487
0,488
0,6254
0,6254
0,6255
0,6255
0,6256
0,6256
0,6257
0,6257
0,6258
0,6258
0,6258
0,6259
0,6259
0,6260
0,6260
0,6260
0,6261
0,6261
0,6261
0,6262
0,6262
0,6262
0,6263
0,6263
0,6263
0,6263
0,6264
0,6264
0,6264
0,6264
0,6265
0,6265
0,6265
0,6265
0,6265
0,6266
0,6266
0,6266
1,257
1,257
1,256
1,256
1,256
1,256
1,256
1,256
1,256
1,256
1,256
1,255
1,255
1,255
1,255
1,255
1,255
1,255
1,255
1,255
1,255
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
1,254
0,8779
0,8762
0,8746
0,8729
0,8712
0,8695
0,8679
0,8662
0,8646
0,8629
0,8612
0,8596
0,8579
0,8563
0,8546
0,8530
0,8513
0,8497
0,8480
0,8464
0,8448
0,8431
0,8415
0,8399
0,8382
0,8366
0,8350
0,8333
0,8317
0,8301
0,8285
0,8268
0,8252
0,8236
0,8220
0,8204
0,8188
0,8171
Cristian Opariuc-Dan
0,388
0,389
0,390
0,391
0,392
0,393
0,394
0,395
0,396
0,397
0,398
0,399
0,400
0,6198
0,6199
0,6200
0,6202
0,6203
0,6204
0,6205
0,6206
0,6208
0,6209
0,6210
0,6211
0,6212
1,272
1,272
1,271
1,271
1,271
1,270
1,270
1,270
1,269
1,269
1,269
1,268
1,268
0,9874
0,9856
0,9838
0,9820
0,9802
0,9784
0,9766
0,9748
0,9730
0,9712
0,9694
0,9676
0,9659
0,439
0,440
0,441
0,442
0,443
0,444
0,445
0,446
0,447
0,448
0,449
0,450
0,6246
0,6247
0,6248
0,6248
0,6249
0,6250
0,6250
0,6251
0,6251
0,6252
0,6253
0,6253
1,259
1,259
1,258
1,258
1,258
1,258
1,258
1,258
1,257
1,257
1,257
1,257
363
0,8981
0,8964
0,8947
0,8930
0,8913
0,8896
0,8880
0,8863
0,8846
0,8829
0,8813
0,8796
Anexa 8
Valori critice pentru testul U Mann-Whitney la un prag de semnificaie p < 0,05.
Pentru a fi semnificativ la acest prag, valoarea U trebuie s fie MAI MIC SAU CEL
MULT EGAL cu valoarea de referin din acest tabel.
Anexa 8 Valori de referin pentru calculul testului U Mann-Whitney
10
11
12
13
14
15
16
17
18
19
20
10
11
11
12
13
14
11
12
13
14
15
17
18
19
20
10
11
13
14
16
17
19
21
22
24
25
27
10
12
14
16
18
20
22
24
26
28
30
32
34
13
15
17
19
22
24
26
29
31
34
36
38
41
17
20
23
26
28
31
34
37
39
42
45
48
10
23
26
29
33
36
39
42
45
48
52
55
11
30
33
37
40
44
47
51
55
58
62
12
37
41
45
49
53
57
61
65
69
13
45
50
54
59
63
67
72
76
14
55
59
64
67
74
78
83
15
64
70
75
80
85
90
16
75
81
86
92
98
17
87
93
99
105
18
99
106
112
19
113
119
20
127
364
Cristian Opariuc-Dan
Anexa 9
Praguri de semnificaie pentru coeficientul de corelaie parial xy.z Kendall.
Anexa 9 - Valori critice pentru coeficientul de corelaie parial Kendall
n
0,05
0,025
0,01
0,005
3
1
1
1
1
4
0,707
1
1
1
5
0,667
0,802
0,816
1
6
0,600
0,667
0.764
0,866
7
0,527
0,617
0,712
0,761
8
0,484
0,565
0,648
0,713
9
0,443
0,515
0,602
0,660
10
0,413
0,480
0,562
0,614
11
0,387
0,453
0,530
0,581
12
0,365
0,430
0,505
0,548
13
0,346
0,410
0,481
0,527
14
0,331
0,391
0,458
0,503
15
0,317
0,375
0,439
0,482
16
0,305
0,361
0,423
0,466
17
0,294
0,348
0,410
0,450
18
0,284
0,336
0,395
0,434
19
0,275
0,326
0,382
0,421
20
0,267
0,317
0,372
0,410
25
0,235
0,278
0,328
0,362
30
0,211
0,251
0,297
0,328
SURSA: Adaptare dup S. Maghsoodloo (1975), Estimates of the quantiles of Kendall's
partial rank correlation coefficient and additional quantile estimates, Journal of Statistical Computation and Simulation 4: 155-164
Mod de utilizare:
Cutai rndul din tabel ce conine n prima coloan (n) numrul de subieci.
Pe rndul selectat, alegei pragul de semnificaie dorit. n cazul n care coeficientul dumneavoastr de corelaie este mai mare dect valoarea nscris,
atunci este semnificativ la pragul ales. De exemplu, dac pe un lot de cercetare de 13 de subieci am obinut o valoare de 0,481, atunci este semnificativ
la un prag de semnificaie mai mic de 0,01.
365
Anexa 10
Praguri de semnificaie pentru valoarea de referin s n cazul semnelor, la diferite
valori ale lotului de cercetare (n).
n
6-7
8
9-11
12-14
15-16
17
18-19
20
21-22
23
24
25
26-27
28
29
30-31
p<0,05
0
0
1
2
3
4
4
5
5
6
6
7
7
8
8
9
p<0,01
0
0
0
1
2
2
3
3
4
4
5
5
6
6
7
7
SURSA: dup (Radu, i alii, 1993)
Mod de utilizare:
Cutai rndul din tabel ce conine n prima coloan (n) numrul de subieci.
Pe rndul selectat, alegei pragul de semnificaie dorit, pentru s. Dac valoarea este mai mic dect valoarea nscris, atunci este semnificativ la pragul
ales.
366
Cristian Opariuc-Dan
Anexa 11
Praguri de semnificaie pentru suma de referin a rangurilor n cazul testului
Wilcoxon, la diferite valori ale lotului de cercetare (n).
n
7
8
9
10
11
12
13
14
15
16
17
18
19
20
p<0,05
2
4
6
8
11
14
17
21
25
30
35
40
46
52
p<0,01
0
0
2
3
5
7
10
13
16
20
23
28
32
38
SURSA: dup (Radu, i alii, 1993)
Mod de utilizare:
Cutai rndul din tabel ce conine n prima coloan (n) numrul de subieci.
Pe rndul selectat, alegei pragul de semnificaie dorit, pentru s. Dac valoarea este mai mic dect valoarea nscris, atunci este semnificativ la pragul
ales.
367
Anexa 12
Praguri de semnificaie pentru valorile de referin n cazul testului Romanovski,
la diferite valori ale lotului de cercetare (n) i pentru diferite praguri de semnificaie.
n
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
p<0,05
4,93
3,56
3,04
2,78
2,62
2,51
2,43
2,37
2,33
2,29
2,26
2,24
2,22
2,20
2,18
2,17
2,16
2,15
p<0,01
11,46
6,53
5,04
4,36
3,96
3,71
3,54
3,41
3,31
3,23
3,17
3,12
3,08
3,04
3,01
3,00
2,95
2,93
SURSA: dup (Sntion, 2009)
Mod de utilizare:
Cutai rndul din tabel ce conine n prima coloan (n) numrul de subieci.
Pe rndul selectat, alegei pragul de semnificaie dorit, pentru R. Dac valoarea este mai mare dect valoarea nscris, atunci este semnificativ la pragul
ales.
368
Cristian Opariuc-Dan
Anexa 13
Funcia de repartiie normal normat (funcia cumulativ F (z) a lui Laplace).
Anexa 13 Funcia cumulativ F(z) Laplace
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
0,00
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9023
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9977
0,9981
0,9987
0,9990
0,9993
0,9995
0,9997
0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,9987
0,9991
0,9993
0,9995
0,9997
0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7321
0,7642
0,7939
0,8212
0,8161
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9729
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9987
0,9991
0,9994
0,9995
0,9997
0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7337
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9913
0,9957
0,9968
0,9977
0,9983
0,9988
0,9991
0,9994
0,9996
0,9997
0,04
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7380
0,7704
0,7995
0,8261
0,8508
0,8702
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9981
0,9988
0,9992
0,9994
0,9996
0,9997
369
0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8719
0,8914
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9916
0,9960
0,9970
0,9978
0,9983
0,9989
0,9992
0,9994
0,9996
0,9997
0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9932
0,9918
0,9961
0,9971
0,9979
0,9985
0,9989
0,9992
0,9994
0,9996
0,9997
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,830
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9989
0,9992
0,9995
0,9996
0,9997
0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,9990
0,9993
0,9995
0,9996
0,9997
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7519
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9979
0,9952
0,9964
0,9974
0,9981
0,9986
0,9990
0,9993
0,9995
0,9997
0,9998
Anexa 14
Coeficienii a pentru testul de normalitate W Shapiro-Wilk.
Anexa 14 Coeficienii a pentru testul de normalitate W Shapiro-Wilk
n
k
1
2
3
4
5
n
k
1
2
3
4
5
6
7
8
9
10
n
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
10
0,7071
-
0,7071
0
-
0,6872
0,1677
-
0,6646
0,2413
0
-
0,6431
0,2806
0,0875
-
0,6233
0,3031
0,1401
0
-
0,6052
0,3164
0,1743
0,0561
-
0,6052
0,3244
0,1976
0,0947
0
0,5888
0,3291
0,5141
0,1224
0,0399
11
12
13
14
15
16
17
18
19
20
0,5601
0,3315
0,2260
0,1429
0,0695
0
-
0,5475
0,3325
0,2347
0,1586
0,0922
0,0303
-
0,5359
0,3325
0,2412
0,1707
0,1099
0,0539
0
-
0,5251
0,3318
0,2460
0,1802
0,1240
0,0727
0,0240
-
0,5150
0,3306
0,2495
0,1878
0,1353
0,0880
0,0433
0
-
0,5056
0,3290
0,2521
0,1939
0,1447
0,1005
0,0593
0,0196
-
0,4958
0,3273
0,2540
0,1988
0,1524
0,1109
0,0725
0,0359
0
-
0,4886
0,3253
0,2553
0,2027
0,1587
0,1137
0,0837
0,0496
0,0163
-
0,4808
0,3232
0,2561
0,2059
0,1641
0,1271
0,0932
0,0612
0,0303
0
0,4743
0,3211
0,2565
0,2085
0,1686
0,1334
0,1013
0,0711
0,0422
0,0140
21
22
23
24
25
26
27
28
29
30
0,4643
0,3185
0,2578
0,2119
0,1736
0,1399
0,1092
0,0804
0,0530
0,0263
0
-
0,4590
0,3156
0,2571
0,2131
0,1764
0,1443
0,1150
0,0878
0,0618
0,0368
0,0122
-
0,4542
0,3126
0,2563
0,2139
0,1787
0,1480
0,1201
0,0941
0,0696
0,0459
0,0228
0
-
0,4493
0,3098
0,2554
0,2145
0,1807
0,1512
0,1245
0,0997
0,0764
0,0539
0,0321
0,0107
-
0,4450
0,3069
0,2543
0,2148
0,1822
0,1539
0,1283
0,1046
0,0823
0,0610
0,0403
0,0200
0
-
0,4407
0,3043
0,2533
0,2151
0,1836
0,1563
0,1316
0,1089
0,0876
0,0672
0,0476
0,0284
0,0094
-
0,4366
0,3018
0,2522
0,2152
0,1848
0,1584
0,1346
0,1128
0,0923
0,0728
0,0540
0,0358
0,0178
0
-
0,4328
0,2992
0,2510
0,2151
0,1857
0,1601
0,1372
0,1162
0,0965
0,0778
0,0598
0,0424
0,0253
0,0084
-
0,4291
0,2968
0,2499
0,2150
0,1864
0,1616
0,1395
0,1192
0,1002
0,0822
0,0650
0,0483
0,0320
0,0159
0
0,4254
0,2944
0,2487
0,2148
0,1870
0,1630
0,1415
,1219
0,1036
0,0862
0,0697
0,0537
0,0381
0,0227
0,0076
370
Cristian Opariuc-Dan
n
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
n
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
31
32
33
34
35
36
37
38
39
40
0,4220
0,2921
0,2475
0,2145
0,1874
0,1641
0,1433
0,1243
0,1066
0,0899
0,0739
0,0585
0,0435
0,0289
0,0144
0
-
0,4188
0,2829
0,2463
0,2141
0,1878
0,1651
0,1449
0,1265
0,1093
0,0931
0,0777
0,0629
0,0485
0,0344
0,0206
0,0068
-
0,4156
0,2876
0,2451
0,2137
0,1880
0,1660
0,1463
0,1284
0,1118
0,0961
0,0812
0,0669
0,0530
0,0395
0,0262
0,0131
0
-
0,4127
0,2854
0,2439
0,2132
0,1882
0,1667
0,1475
0,1301
0,1140
0,0988
0,0844
0,0706
0,0572
0,0441
0,0314
0,0187
0,0062
-
0,4096
0,2834
0,2427
0,2127
0,1883
0,1673
0,1487
0,1317
0,1160
0,1013
0,0873
0,0739
0,0610
0,0484
0,0631
0,0239
0,0119
0
-
0,4068
0,2813
0,2415
0,2121
0,1883
0,1678
0,1496
0,1331
0,1179
0,1036
0,0900
0,0770
0,0645
0,0523
0,0404
0,0287
0,0172
0,0057
-
0,4040
0,2794
0,2403
0,2116
0,1883
0,1683
0,1505
0,1344
0,1196
0,1056
0,0924
0,0798
0,0677
0,0559
0,0444
0,0331
0,0220
0,0110
0
-
0,4015
0,2774
0,2391
0,2110
0,1881
0,1680
0,1513
0,1356
0,1211
0,1075
0,0947
0,0824
0,0706
0,0592
0,0481
0,0372
0,0264
0,0158
0,0053
-
0,3989
0,2755
0,2380
0,2101
0,1880
0,1689
0,1520
0,1366
0,1225
0,1092
0,0967
0,0848
0,0733
0,0622
0,0515
0,0409
0,0305
0,0203
0,0101
0
0,3964
0,2737
0,2368
0,2098
0,1878
0,1691
0,1526
0,1376
0,1237
0,1108
0,0986
0,0870
0,0759
0,0651
0,0546
0,0444
0,0343
0,0244
0,0116
0,0049
41
42
43
44
45
46
47
48
49
50
0,3940
0,2719
0,2357
0,2091
0,1876
0,1693
0,1531
0,1384
0,1249
0,1123
0,1004
0,0891
0,0782
0,0677
0,0575
0,0476
0,0379
0,0283
0,0188
0,0094
0
-
0,3917
0,2701
0,2345
0,2085
0,1874
0,1694
0,1535
0,1392
0,1259
0,1136
0,1020
0,0909
0,0804
0,0701
0,0602
0,0506
0,0411
0,0318
0,0227
0,0136
0,0045
-
0,3894
0,2684
0,2334
0,2078
0,1871
0,1695
0,1539
0,1398
0,1269
0,1149
0,1035
0,0927
0,0824
0,0724
0,0628
0,0534
0,0442
0,0352
0,0263
0,0175
0,0087
0
-
0,3872
0,2667
0,2323
0,2072
0,1868
0,1695
0,1512
0,1405
0,1278
0,1160
0,1049
0,0943
0,0824
0,0745
0,0651
0,0560
0,0471
0,0383
0,0296
0,0211
0,0126
0,0042
-
0,3850
0,2651
0,2310
0,2065
0,1865
0,1695
0,1541
0,1410
0,1286
0,1170
0,1062
0,0959
0,0860
0,0765
0,0673
0,0584
0,0497
0,0412
0,0328
0,0245
0,0163
0,0081
0
-
0,3830
0,2635
0,2303
0,2058
0,1862
0,1695
0,1548
0,1415
0,1293
0,1180
0,1073
0,0972
0,0876
0,0783
0,0694
0,0607
0,0522
0,0439
0,0357
0,0277
0,0197
0,0118
0,0039
-
0,3808
0,2620
0,2291
0,2052
0,1859
0,1695
0,1550
0,1420
0,1300
0,1189
0,1085
0,0986
0,0892
0,0801
0,0713
0,0628
0,0546
0,0465
0,0385
0,0307
0,0229
0,0153
0,0076
0
-
0,3789
0,2604
0,2281
0,2045
0,1855
0,1693
0,1551
0,1423
0,1306
0,1197
0,1095
0,0998
0,0906
0,0817
0,0731
0,0648
0,0568
0,0489
0,0411
0,0335
0,0259
0,0185
0,0111
0,0037
-
0,3770
0,2589
0,2271
0,2038
0,1851
0,1692
0,1553
0,1427
0,1312
0,1205
0,1105
0,1010
0,0919
0,0832
0,0718
0,0667
0,0588
0,0511
0,0436
0,0361
0,0288
0,0215
0,0143
0,0071
0
0,3751
0,2574
0,2260
0,2032
0,1847
0,1691
0,1554
0,1430
0,1317
0,1212
0,1113
0,1020
0,0932
0,0816
0,0764
0,0685
0,0608
0,0532
0,0459
0,0386
0,0314
0,0244
0,0174
0,0104
0,0035
371
Anexa 15
Praguri de semnificaie pentru testul de normalitate W Shapiro-Wilk.
n
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
372
0,05
0,767
0,748
0,762
0,788
0,803
0,818
0,829
0,842
0,850
0,859
0,866
0,874
0,881
0,887
0,892
0,897
0,901
0,905
0,908
0,911
0,914
0,916
0,918
0,920
0,923
0,924
0,926
0,927
0,929
0,930
0,931
0,933
0,934
0,935
0,936
0,938
0,939
0,940
Cristian Opariuc-Dan
41
42
43
44
45
46
47
48
49
50
0,920
0,922
0,923
0,924
0,926
0,927
0,928
0,929
0,929
0,930
0,929
0,930
0,932
0,933
0,934
0,935
0,936
0,937
0,937
0,938
0,941
0,942
0,943
0,944
0,945
0,945
0,946
0,947
0,947
0,947
373