Documente Academic
Documente Profesional
Documente Cultură
Doi studeni discutau ntr-o diminea n drum spre facultate despre performanele
sportivilor romni la Jocurile Olimpice de la Rio din 2016, subiectul principal fiind importana
condiiilor de pregtire i a antrenamentului intensiv n perioada copilriei. Ambii studeni erau
de acord c performana poate fi obinut doar dac antrenamentele sunt desfurate dup
strategii moderne i folosind tehnologii de ultim or n pregtirea fizic i a recuperrii de dup
efort. ns, aveau opinii diferite n ceea ce privete rolul antrenamentelor intensive n timpul
copilriei.
- Cred c antrenamentele intensive pentru copii care fac sport de performan sunt decisive
n obinerea performanei.
- Nu cred. Sunt sigur c printre finalitii probelor de la Jocurile Olimpice sunt sportivi care
nu au fcut antrenamente intensive cnd erau copii.
- n regul. Se pare c avem opinii diferite. Hai s operaionalizm expresia antrenamente
intensive n timpul copilriei.
- S spunem c antrenament intensiv ar nsemna mai mult de dou ore n fiecare zi, iar prin
copilrie ne referim la perioada 10-12 ani.
- Da, pare rezonabil. Acum, hai s alegem un sport i s facem o analiz. Propun s
discutm despre juctorii de tenis, deoarece competiiile sunt sptmnale i clasamentul
este uor de neles.
- Sunt de acord. Populaia discuiei noastre o reprezint juctorii de tenis de performan,
iar primii 20 de sportivi vor servi ca eantion.
- Aceti sportivi trebuie mprii n dou grupuri pe care s le comparm: cei care au fcut
antrenamente intensive n copilrie i cei care nu au fcut acest lucru. Variabila
dependent este poziia n clasament a juctorului.
- Ne trebuie un test statistic pentru a testa dac diferena dintre mediile poziiilor n
clasament este semnificativ statistic.
- Testul t pentru eantioane independente nu poate fi utilizat deoarece scorurile variabilei
dependente trebuie s se distribuie normal (s ndeplineasc condiia de normalitate). n
cazul nostru distribuia este dreptunghiular, fiecare scor avnd frecvena de 1. n plus,
variabila dependent este msurat pe scal ordinal.
- Cred c un test neparametric este potrivit pentru a compara poziiile n clasament ale
sportivilor.
n capitolele anterioare au fost prezentate testele statistice parametrice, care sunt mult mai
des utilizate n practic, fiind mai solide i asigurnd o ncredere mai mare n interpretarea
rezultatelor. Acestea dispun de o putere mai mare i reduc probabilitatea erorii de tip II. n acelai
timp, testele parametrice solicit ndeplinirea unor condiii pentru a putea fi utilizate (eantion
suficient de mare, variabila dependent trebuie s fie msurat pe scal I/R i s se distribuie
normal). Atunci cnd una din aceste condiii nu este ndeplinit trebui utilizat o alt categorie de
teste statistice, denumite teste neparametrice. Atunci cnd valorile variabilei dependente sunt
msurate pe scal I/R are loc o transformare a acestora n ranguri. Astfel, fiecare valoare este
nlocuit cu poziia (locul) pe care l ocup n distribuie n funcie de mrime. Mai departe se
obine o distribuie cu valori msurate pe scal ordinal.
Utilizarea testelor neparametrice solicit parcurgerea unor etape pe care le cunoatem, paii
utilizai n testarea ipotezelor: emiterea ipotezei de nul, a ipotezei alternative, colectarea datelor,
calcularea probabilitii ca ipoteza de nul s fie adevrat i redactarea i interpretarea rezultatelor.
Cunoscnd aceste raionamente, n seciunile urmtoare vor fi prezentate testele neparametrice
corespunztoare testelor detaliate n capitolele anterioare. Tabelul 12.1 prezint corespondena
dintre testele neparametrice i cele parametrice alturi de contextul n care se aplic aceste teste.
Acest test este utilizat pentru a determina dac dou seturi de date extrase din eantioane
independente provin din aceeai populaie. Astfel, nelegem c este testul statistic care ar putea fi
utilizat de cei doi studeni pentru a testa dac antrenamentele intensive din copilrie sunt decisive
n obinerea performanei n sport. S ne imaginm c cei doi studeni reuesc s i duc la bun
sfrit cercetarea i obin informaii despre tipul de antrenament desfurat de primii 20 de
tenismeni n perioada 10 12 ani. n tabelul 12.2 sunt prezentate datele recoltate de cei doi studeni.
' ' + 1
' = " ' + '
2
(formula 12.2)
10 10 + 1 110
" = 10 10 + 102 " = 100 + 102 "
2 2
= 100 + 55 102 " = 53
10 10 + 1 110
' = 10 10 + 108 ' = 100 + 108 '
2 2
= 100 + 55 108 ' = 47
Valoarea testului Mann-Whitney este dat de valoarea calculat U cea mai mic. Pentru
exemplul nostru valoarea testului Mann-Whitney este U = 47. Decizia statistic se ia prin
compararea valorii U calculate (47) cu valoarea critic U din Anexa 6. Aceasta se va citi n funcie
de nivelul la intersecia dintre N1 i N2. Pentru un prag = 0,05 valoarea Ucitic = 23.
n cazul testului Mann-Whitney decizia statistic se ia dup un principiu opus celui cu care
ne-am obinuit la testele anterioare. Astfel:
Dac Ucalculat > Ucritic se accept ipoteza de nul.
Dac Ucalculat Ucritic se respinge ipoteza de nul.
Deoarece Ucalculat (47) este mai mare dect Ucritic (23) vom accepta ipoteza de nul i vom
respinge ipoteza cercetrii. Concluzia este c performana tenismenilor nu difer semnificativ n
funcie de practicarea antrenamentelor intensive n copilrie.
Atunci cnd volumul unui eantion cuprinde cel puin 21 de participani vom lua decizia
statistic folosindu-ne de curba normal z. Astfel, se va calcula o valoare z cu ajutorul formulei
12.3.
+ 9
=
9
(formula 12.3)
U reprezint valoarea calculat cea mai mic.
c = 0,5.
= =
U = > ?
'
=> =? (=> B =? B")
U =
"'
Cnd folosim scorul z, pentru a lua decizia statistic vom compara valoarea calculat a lui z
cu valorile critice de pe curba normal.
De cele mai multe ori suntem n situaia de a aplica un test neparametric fr a avea acces
direct la rangurile participanilor, aa cum a fost n cazul celor doi studeni, datele fiind exprimate
pe scal de interval/raport. ntr-o astfel de situaie realizm o transformare a valorilor nregistrate
n ranguri.
S ne imaginm c un psiholog dorete s studieze n ce msur muzica clasic are un efect
asupra capacitii de memorare. El selecteaz un eantion de 27 de studeni crora le d spre
memorare o list de cuvinte. Participanii sunt mprii n dou grupuri: 15 studeni au memorat
lista ascultnd muzic clasic, iar 12 au memorat lista ntr-un mediu fr fundal sonor. n tabelul
12.5 se regsesc valorile nregistrate de cercettor n urma recoltrii datelor. Rangurile sunt
atribuite n funcie de poziia respondentului dup ordonarea cresctoare sau descresctoare a
valorilor. Putem atribui rangul cel mai mic scorului cel mai mare (primul loc este ocupat de
respondentul cu cea mai bun performan), dar la fel de bine putem atribui rangul cel mai mare
respondentului cu scorul cel mai mare. Cnd valorile sunt distincte fiecare primete un rang propriu
i nu are importan cum atribuim rangul. n schimb, trebuie s fim ateni cum distribuim rangurile
atunci cnd dou sau mai multe valori sunt identice. Aceast atribuire se poate face n trei moduri,
iar tabelul 12.4 cuprinde exemplificarea acestora. n SPSS, cu ajutorul procedurii Transform
Rank Cases putem folosi oricare dintre metodele prezeatate.
atribuirea rangului mediu toate valorile identice primesc un rang egal cu media aritmetic
a rangurilor cuvenite scorurilor identice. De exemplu, dac avem dou valori identice, iar
pentru prima primul rang disponibil este 10, iar pentru a doua 11, vom atribui ambelor
valori rangul 10,5. Urmtoarea valoare va primi rangul 12.
Atribuirea rangului cel mai mic sau a celui mai mare toate valorile identice primesc
rangul cel mai mic (cel ce corespunde primei valori) sau rangul cel mai mare (cel care
corespunde ultimei valori identice). Folosind exemplul de mai sus, fie ambele valori
primesc rangul 10, fie primesc rangul 11. Urmtoarea valoare va primi rangul 12.
Atribuirea secvenial presupune ca valorile identice s primeasc primul rang disponibil,
iar valoarea distinct ce urmeaz primete rangul imediat urmtor. n exemplul nostru,
valorile identice primesc rangul 8, iar urmtoarea valoare distinct primete rangul 9. n
urma unei astfel de atribuiri va rezulta un numr de ranguri mai mic dect numrul valorilor
din distribuie.
Revenind la exemplul cu efectul muzicii clasice asupra memoriei, vom atribui rangurile
folosind metoda rangului mediu i vom ncepe prin a atribui rangul cel mai mic valorii celei mai
mari (cele mai multe cuvinte memorate primesc poziia 1).
n continuare vom calcula valoarea testului Mann-Whitney. Pentru respondenii care au fcut
parte din eantionul care au memorat ascultnd muzic clasic oferim codul 1, iar pe cei care nu
au avut fond muzical n momentul memorrii i notm cu 2. n prima etap vom calcula suma
rangurilor pentru cele dou eantioane.
" = 2,5 + 2,5 + 4,5 + 6,5 + 8,5 + 8,5 + 13 + 14,5 + 14,5 + 18 + 18 + 21,5 + 24,5
+ 26 + 27 " = 210
' = 168
" " + 1 15 15 + 1
" = " ' + " " = 15 12 + 210 "
2 2
240
= 180 + 210 " = 180 + 120 210 " = 90
2
' ' + 1 12 12 + 1
' = " ' + ' ' = 15 12 + 168 '
2 2
156
= 180 + 168 ' = 180 + 78 168 ' = 90
2
Dup cum ne-am obinuit, nainte de a aplica testul statistic trebuie conceput baza de date.
Aceasta se construiete la fel ca n cazul testului t pentru eantioane independente. Vom crea
variabila performan (tip numeric, scal de interval/raport) i variabila condiie (cu etichetarea
convenional 1 = cu muzic i 2 = fr muzic), dup care vom introduce datele din tabelul 12.5.
Psihologul unei fabrici este interesat s studieze efectul concediului de odihn asupra
productivitii n munc ( = 0,05, bilateral). Acesta msoar productivitatea timp de o sptmn
nainte de plecarea n concediu a angajailor i o sptmn dup revenirea la locul de munc. n
tabelul 12.6 sunt sintetizate datele strnse de psiholog. Procedura de calcul se desfoar astfel:
Se calculeaz diferena dintre rezultatele obinute la a doua msurtoare i cele obinute la
prima evaluare.
Diferena obinut este transformat n valoare absolut astfel nct toate diferenele vor
deveni pozitive.
Rezultatele obinute la etapa anterioar sunt transformate n ranguri folosind una din
metodele descrise la testul Mann-Whitney. n tabelul 12.6 s-a utilizat atribuirea rangului
mediu, rangul 1 fiind atribuit valorii celei mai mici.
Atunci cnd avem o diferen egal cu 0 aceasta nu se ia n considerare i volumul
eantionului scade cu 1. Atunci cnd aveam dou diferene egale cu 0, una primete rangul
1,5, iar cea de a doua va primi rangul +1,5. Cnd sunt trei diferene egale cu 0, una din ele
este eliminat, iar celelalte dou primesc rangurile +1,5, respectiv -1,5. Ali autori
recomand eliminarea diferenelor egale cu 0 i reducerea volumului eantionului cu
numrul de perechi egale. Programul SPSS elimin perechile egale atunci cnd calculeaz
acest test statistic.
Se noteaz semnul diferenei obinute n prima etap.
Se calculeaz suma rangurilor pentru diferenele pozitive T(+), respectiv cele negative T(-
).
Valoarea cea mai mic reprezint valoarea calculat a testului i va fi comparat cu
valoarea critic.
T + = 2 + 3 + 1 T(+) = 6
T = 8 + 5 + 5 + 5 + 7 T() = 30
Valoarea calculat a testului este valoarea T cea mai mic, n exemplul nostru 6. Valoarea
critic tabelar o vom citi n Anexa 8 n funcie de volumul eantionului (N = 8) i = 0,05
bilateral. Astfel, Tcritic este egal cu 4. Decizia statistic se i-a ntr-o manier asemntoare cu cea
de la testul Mann-Whitney. Ipoteza de nul afirm c suma rangurilor pozitive este egal cu suma
rangurilor negative.
Atunci cnd valoarea calculat este mai mic sau egal cu valoarea critic, se respinge
ipoteza de nul, iar ipoteza cercetrii se confirm.
Cnd valoare calculat este mare dect valoarea critic, se accept ipoteza de nul, iar
ipoteza cercetrii nu se confirm.
n exemplul nostru, valoarea calculat este T(+) = 6. Aceasta este mai mare dect valoarea
Tcritic = 4. Prin urmare, acceptm ipoteza de nul i respingem ipoteza cercetrii. Vom concluziona
c nu exist diferene semnificative ntre performana angajailor nainte de a pleca n concediu i
cea obinut la revenirea la locul de munc.
Atunci cnd exist diferene semnificative ntre cele dou perechi de valori, concluziile
trebuie enunate n funcie de modul n care au fost atribuite rangurile, deoarece vom ine cont de
valoarea care a primit rangul 1. n cazul nostru, rangul 1 a fost atribuit valorii celei mai mici.
Deoarece suma rangurilor pentru diferenele negative este 30, iar cea pentru diferenele pozitive
este 6 putem nelege c angajaii au performat mai slab la revenirea din concediu, diferena fiind
nesemnificativ statistic.
La fel ca n cazul testului Mann-Whitney, atunci cnd avem un eantion cu mai mult de 50
de participani calculm un scor Z pe care l vom compara cu valorile critice tabelare ale lui z n
funcie de nivelul lui .
+ H
=
H
(formula 12.4)
T = este valoarea calculat a testului Wilcoxon (cea mai mic sum a rangurilor).
c = 0,5.
= (=B")
H =
I
= =B" ('=B")
H =
'I
Aranjarea bazei de date implic crearea a dou variabile care vor primi rezultatele
nregistrate n evaluarea performanei nainte de concediu (nainte), respectiv la revenirea din
concediu (dup).
n tabelul Test Statistics sunt afiate rezultatele testului. Z (-1,689) reprezint o transformare
a scorului obinut prin nsumarea rangurilor pozitive, acestea avnd valoarea cea mai mic.
Reamintim c valoarea calculat a testului este dat de suma rangurilor cea mai mic. Asymp. Sig.
(2-tailed) este probabilitatea asociat testului. Deoarece aceasta din urm este mai mare dect =
0,05 vom accepta ipoteza de nul i vom concluziona c nu exist diferene semnificative la nivelul
performanei angajailor la ntoarcerea din concediu.
12.3 Testul Kruskal-Wallis pentru mai mult de dou eantioane independente
IMPORTANT
Scorul H poate avea doar valori mai mari sau egale cu 0. Cu ct valoarea scorului H este mai
mare cu att grupurile supuse comparaiei sunt mai diferite ntre ele.
Scorul H calculat va fi comparat cu valoarea critic tabelar. Pentru situaiile n care cel puin
unul din eantioane are minim 6 participani, valoarea critic se citete din tabelul de la Anexa 8
n funcie de numrul de grade de libertate (df = numrul de grupuri - 1) i pragul . Atunci cnd
toate eantioanele au sub 6 participani valoarea critic se citete dintr-un tabel special (Anexa 9)
n funcie de volumul fiecrui grup i nivelul pragului . Vom citi din tabel valoarea critic de la
intersecia linie cu cte 5 participani n fiecare grup (ultima linie) cu coloana pentru = 0,01.
Astfel, valoarea critic este egal cu 8,00. Decizia statistic se ia astfel:
Atunci cnd valoarea calculat este mai mic dect valoarea critic acceptm ipoteza de
nul i respingem ipoteza cercetrii.
Atunci cnd valoarea calculat este mai mare sau egal cu valoarea critic vom respinge
ipoteza de nul i ipoteza cercetrii se confirm.
n exemplul nostru H = 0,875 este mai mic dect Hcritic = 8,00 i vom accepta ipoteza de nul.
n concluzie nivelul depresiei pacienilor nu difer semnificativ n funcie de timpul petrecut
efectund exerciii fizice.
Testul Friedman este utilizat n situaia n care dorim s comparm rezultatele obinute n cel
puin trei condiii pe acelai eantion. Echivalentul parametric al acestui test este ANOVA pentru
msurtori repetate (vezi capitolul 14). S ne imaginm c un profesor este interesat s studieze
anxietatea studenilor nainte de a intra n sesiune. Acesta selecteaz un eantion de 10 studeni
crora le msoar anxietatea n la nceputul fiecrei sesiuni pe parcursul celor trei ani de studii.
Prin urmare, profesorul msoar anxietatea studenilor n ase momente. Datele colectate sunt
sintetizate n Tabelul 12.8. Pentru acest studiu este ales un = 0,05.
12 K
O = P' 3 ( + 1)
+1 PQ"
(formula 12.6)
N reprezint numrul participanilor.
c este numrul msurrilor repetate.
Ti este suma rangurilor pentru fiecare msurare.
n cazul nostru, valoarea calculat (9,2) este mai mic dect cea critic (11,07) i lum
decizia de a accepta ipoteza de nul i de a respinge ipoteza cercetrii. n concluzie, nivelul de
anxietate al studenilor nu se modific semnificativ de la o sesiune la alta.
n baza de date vom introduce ase variabile care vor reprezenta momentele n care am
msurat anxietatea studenilor i vor primi valorile din tabelul 11.8.
Un psiholog este interesat s studieze dac exist o relaie ntre vechimea n munc i stresul
de lupt la militari. Acesta selecteaz 10 militari crora le aplic un chestionar pentru a putea
evalua stresul de lupt. Pentru a lua decizia statistic, psihologul utilizeaz un prag = 0,05
bilateral.
Valoarea calculat se compar cu valoarea critic pentru a lua decizia statistic. Valoarea
critic se citete din Anexa 10 n funcie de volumul eantionului (N) i pragul stabilit. Pentru
exemplul nostru, rscritic este 0,648. Decizia statistic se ia astfel:
Atunci cnd valoarea calculat este mai mic dect valoarea critic acceptm ipoteza de
nul i respingem ipoteza cercetrii.
Atunci cnd valoarea calculat este mai mare sau egal cu valoarea critic vom respinge
ipoteza de nul i ipoteza cercetrii se confirm.
n cazul nostru, valoarea calculat (-0,133) este mai mic dect cea critic (0,648) i lum
decizia de a accepta ipoteza de nul i de a respinge ipoteza cercetrii. n concluzie, nu exist o
corelaie semnificativ statistic ntre stresul de lupt i vechimea n munc a militarilor.
Baza de date necesar aplicrii corelaiei Spearman se realizeaz ntr-o manier identic cu
cea de la corelaia Pearson. Vom introduce dou variabile (vechime i stres) pentru care vom
aduga valorile din tabelul 12.10.
Exerciii
1. Managerul unui hotel este interesat s studieze satisfacia turitilor fa de mncarea care
le este servit n timpul sptmnii. n acest sens, selecteaz un eantion de turiti, acetia
fiind rugai, timp de o sptmn, s acorde note de la 1 (nu mi-a plcut deloc) pn la 10
(mi-a plcut foarte mult) pentru calitatea hranei din ziua respectiv. Datele nregistrate se
regsesc n tabelul de mai jos. Exist diferene semnificative n ceea ce privete calitatea
mncrii pe parcursul unei sptmni?
2. Psihologul unui penitenciar a citit dosarele mai multor persoane private de libertate i este
interesat s afle dac acetia se deosebesc n ceea ce privete IQ-ul n funcie de tipul
infraciunii comise. Faptele comise sunt mprite n trei categorii: mpotriva proprietii,
mpotriva persoanei i infraciuni economice. n tabelul de mai jos sunt notate scorurile
IQ nregistrate de psiholog. Persoanele private de libertate se deosebesc la nivelul
inteligenei n funcie de tipul infraciunii?
Agreabil Rigid
8 4
7 5
9 10
4 9
8 7
5 4
6 5
10 6
6 8
5 6
4 6
7 3
4. Un tnr pasionat de tenis urmrete clasamentul juctorilor i observ datele din tabelul
de mai jos. Exist o legtur ntre poziia n clasament i vrsta juctorilor de tenis?
Poziia Vrsta
1 28
2 28
3 30
4 29
5 25
6 24
7 34
8 29
9 30
10 22
nainte Final
20 23
15 18
25 22
22 22
16 16
18 20
17 20
16 19
15 19
21 22