Documente Academic
Documente Profesional
Documente Cultură
Not:
Coninutul modulelor este suficient de dezvoltat pentru nsuirea cursului, dar versiunea
complet a materiei de curs se gsete n volumul: M. Popa, Statistic pentru psihologie. Teorie
i aplicaii SPSS, aprut la Editura Polirom (2008).
2
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni statistice fundamentale
CUPRINS
3
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni statistice fundamentale
Abaterea quartil (cvartil, intercvartil) (RQ) .......................................................................31
Abaterea semi-interquartil (RSQ): .........................................................................................31
Abaterea medie (d de la deviaie medie)................................................................................32
Dispersia (variana, abaterea medie ptratic) .......................................................................33
Abaterea standard...................................................................................................................33
Coeficientul de variaie ..........................................................................................................35
Indicatori ai formei distribuiei ..................................................................................................36
Sarcina de lucru nr. 2.4...............................................................................................................38
Valori extreme ale distribuiei........................................................................................................39
Tratarea valorilor extreme ..........................................................................................................40
Rezumatul unitii de nvare........................................................................................................41
Rspunsuri corecte la sarcinile de lucru.........................................................................................41
Lucrarea de evaluare nr. 1.2 ...........................................................................................................42
Bibliografie minimal ....................................................................................................................43
4
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni statistice fundamentale
NOIUNI STATISTICE FUNDAMENTALE
Definiie:
Statistica psihologic este disciplina care se ocup cu analiza
datelor care descriu aspecte de natur psihic, individual sau colectiv, n
scopul de a le prezenta sintetic, sub form numeric sau grafic, de a le
analiza i de a extrage concluzii pe seama lor.
Faptele de natur psihic sau cu semnificaii psihologice care fac
obiectul msurrii i al analizei statistice, pot fi extrem de variate: genul
(masculin/feminin), inteligena, timpul de reacie, atitudinile, nivelul
motivaiei, nivelul diverselor caracteristici psihice (sociabilitate, anxietate,
emotivitate)
Metoda tiinific
n esen, tiina este o metod, un mod specific de a afla
Statistica rspunsuri la ntrebrile pe care ni le punem. Principalele ei caracteristici
este un sunt: cutarea unor reguli generale (legiti), colectarea unor dovezi
instrument obiective, operarea cu afirmaii controlabile, atitudine sceptic fa de
al metodei cunotinele acumulate, atitudine deschis fa de orice informaii noi,
tiinifice n creativitate i transparen.
psihologie
n mod practic, un demers de tip tiinific pornete de la identificarea
unei probleme, urmat de o serie standardizat de etape de gsire a
rspunsului adecvat: generarea unei ipoteze n legtur cu rspunsul
posibil, testarea ipotezei (prin experiment sau alt metod empiric),
analizarea datelor recoltate, emiterea unei decizii de confirmare sau de
infirmare a ipotezei. n faza urmtoare, ipoteza poate fi rafinat iar procesul
se reia atta timp ct problema prezint un interes de cunoatere. n acest
proces, statistica se ocup cu tratarea datelor numerice prin sintetizarea
lor, ntr-o prim faz, i prin proceduri de analiz care s fundamenteze o
5
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni statistice fundamentale
decizie lipsit de subiectivitate cu privire la adevrul ipotezei, n a doua
faz.
Exemplu: Un psiholog observ, printre cunoscuii si, c cei care
fumeaz sunt, de regul, mai emotivi dect cei care nu fumeaz. Dorind s
verifice dac acest lucru este adevrat i nu doar o simpl impresie,
selecioneaz dou grupuri de persoane, fumtori i nefumtori, crora le
aplic un instrument de evaluare a trsturilor de personalitate, printre
care i manifestrile de tip afectiv. Rezultatele individuale se concretizeaz
n scoruri numerice pentru fiecare trstur. Utiliznd proceduri statistice,
calculeaz media scorului pentru fiecare dintre trsturile investigate. S
zicem c, n final, constat c fumtorii au obinut un scor la anxietate de
14.3, comparativ cu nefumtorii, care au obinut un scor mediu de 12.7.
Este aceast diferen suficient pentru a concluziona c fumtorii au un
nivel mai ridicat de anxietate, sau diferena obinut nu este dect una
neimportant, care a aprut ntmpltor la grupurile investigate i nu poate
nu poate fi generalizat dincolo de acestea?
Pentru a rspunde la aceast ntrebare trebuie utilizat o anumit
procedur statistic, care va face obiectul unei teme de curs.
Msurarea n psihologie
Scala nominal
Scala ordinal
Scala de interval
Scala de raport
Tem de reflecie:
Dac evalum scalele n funcie de nivelul de msurare ale
fiecreia, pe ce scal de msurare putem considera c se plaseaz?
......................................................................................................
Tipul scalei
1 Apartenena la o anumit minoritate etnic, codificat astfel: 1. lipoveni; 2.
romni; 3. polonezi; 4. maghiari; 5. italieni; 6. armeni
2 Latena reaciei la un stimul auditiv, msurat n sutimi de secund
3 Atitudinea fa de statistic msurat pe o scal continu de la 1 (absolut
antipatic) la 10 (absolut simpatic)
4 Numrul de rspunsuri corecte la un test de calcule aritmetice
5 Poziia pe o list la un concurs de admitere organizat n ordinea mediei
9
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni statistice fundamentale
dependente urmeaz sa fie puse n eviden. Termenii dependent,
independent se utilizeaz n mod obinuit n legtur cu cercetarea
experimental. n acest context exist variabile manipulate adic
independente de reaciile, inteniile, conduitele sau tririle subiecilor
investigai (toate acestea fiind variabile dependente). n raport cu analiza
statistic, definirea variabilelor ca dependente i independente nu este
condiionat de msurarea lor n condiii de experiment.
Nu exist variabile care sunt dependente sau independente prin
natura lor. Caracteristica de a fi de un tip sau de altul provine din rolul care
le este atribuit de ctre cercettor ntr-un anumit context de cercetare. De
exemplu, dac presupunem c starea emoional este influenat de
fumat, rezultatul la un test de labilitate emoional este variabila
dependent, iar fumatul, variabila independent. ntr-un alt studiu, ns, n
care ne intereseaz frecvena fumatului n funcie de sex, numrul igrilor
este variabila dependent, iar sexul, variabila independent. Sexul, la
rndul su, poate deveni variabil dependent ntr-un studiu privind relaia
dintre consumul unei anumite substane de ctre gravide i sexului copiilor
lor.
Populaie i eantion
Procedurile
parametrice
Esena procedurilor statistice este verificarea ipotezelor. Aceasta se
testeaz face prin utilizarea unor proceduri de calcul care urmresc punerea n
variabile eviden a legturilor dintre variabile. Atunci cnd aceste proceduri se
cantitative. aplic unor situaii n care variabilele dependente sunt de tip cantitativ
Procedurile (interval/raport), procedura se numete parametric. Prin opoziie,
neparametrice procedurile aplicate n cazul n care variabilele dependente sunt de tip
testeaz calitativ (nominale sau ordinale) se numesc neparametrice.
variabile
calitative.
12
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni statistice fundamentale
apartenena la o anumit categorie. Totui, rezultatele studiilor
corelaionale pot fi interpretate uneori n termeni cauzali, utiliznd teorii
existente sau ipoteze, dar astfel de rezultate nu pot constitui n nici un caz
o dovad a unei relaii de tip cauzal.
13
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni statistice fundamentale
Rspunsuri corecte la sarcinile de lucru
14
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni statistice fundamentale
Comentarii. Se va observa c, de fiecare dat, populaia studiului este diferit ca mrime,
n funcie de nivelul de generalizare pe care cercettorul dorete s l dea rezultatelor.
Bibliografie
Bibliografia de baz
Marian Popa, (2008), Statistic pentru psihologie. Teorie i aplicaii SPSS, editura
Polirom
Pagina web a cursului, la adresa www.mpopa.ro
Bibliografie suplimentar
Clocotici, V., & Stan, A. (2000). Statistica aplicata in psihologie. Iasi: Polirom, p. 11-
57
Rotaru, T. (coord.). (1999). Metode statistice aplicate in stiintele sociale. Iasi:
Polirom. p. 15-28
Radu I., (coord), (1993), Metodologie psihologic i analiza datelor, Editura Sincron,
p. 45-51
Vasilescu, I. P. (1992). Statistica informatizata pentru stiinte despre om (Vol. 1-2).
Bucuresti: Editura militara., p.5-43
15
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
STATISTICI DESCRIPTIVE
Analiza de frecvene
Valoare fa
10 2
9 2
8 5
7 3
6 7
5 1
4 4
3 0
2 1
Total fa=25
18
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
spune c are rangul percentil 52, adic, 52% dintre valorile unei distribuii
sunt ntre cea mai mic valoare i valoarea 6, inclusiv.
o Prin convenie, rangul percentil se definete ca procentajul
datelor valorilor dintr-o distribuie care se afl pn la o anumit valoare
inclusiv.
o n mod complementar, numim percentil, valoarea dintr-o
distribuie care corespunde unui anumit rang percentil. n exemplul de mai
sus, rangului percentil 52 i corespunde valoarea 6, numit, de aceea,
percentila 52.
o n practic, exist anumite percentile care au o importan
aparte. Acestea sunt percentilele corespunztoare rangurilor percentile cu
valorile 10, 20, 30,..., 100. Despre semnificaia lor vom vorbi mai trziu n
acest curs. De asemenea, se utilizeaz termenul de quartile pentru
percentilele care mpart distribuia n patru zone egale ca numr de valori.
Acestea sunt corespunztoare rangurilor percentile de 25, 50 i 75. Cu alte
cuvinte, valoarea dintr-o distribuie pn la care se afl 25% din valori este
percentila 25, valoarea pn la care se afl 50% este percentila 50, iar
valoarea pn la care se afl 75% din valori este percentila 75.
Datele din tabel sunt aranjate la ntmplare, analiza lor fiind dificil.
Presupunnd c le-am ordona i am face tabelul frecvenelor simple, am
19
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
obine un uor progres, dar nc ar fi greu de analizat deoarece vom obine
un tabel cu prea multe valori distincte.
Pentru a ne face o imagine sintetic a distribuiei, ne propunem s
realizm un numr de categorii (clase) cuprinse ntre anumite intervale de
performan la test, urmnd s stabilim apoi care este frecvena de apariie
a fiecrei clase n distribuia noastr. Aceast tehnic de organizare a
datelor se numete frecvena grupat
Pentru a realiza un tabel de frecvene grupate se procedeaz astfel:
20
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
115 119 7 14% 92%
110 114 7 14% 78%
105 109 13 26% 64%
100 104 8 16% 38%
95 99 4 8% 22%
90 94 4 8% 14%
85 89 3 6% 6%
fa=50 fr%=100
Alegei varianta de rspuns aleas sau scriei rspunsul n text, apoi verificai
rspunsurile corecte
1. Percentila 25 este acea valoare a unei distribuii care:
a. are 75% din valori mai mari dect ea
b. se ntlnete la 25% dintre subieci
c. mparte distribuia n 25 de pri egale
d. nici una din variantele de mai sus
2. Percentila 50 este o valoare identic cu:
a. quartila 3; b. quartila 1; c. mediana; d. abaterea standard
3. Ce procent de valori este reprezentat n caseta reprezentrii box-plot:
a. 50%; b. 25%; c. 30%; d. 75%
4. Ce reprezint frecvena relativ raportat la unitate?
____________________________________________________________________
5. Ce nseamn faptul c pe coloana frecvenei relative procentuale din dreptul unui
anumite valori este scris 7%?
____________________________________________________________________
6. Cum se stabilete limita inferioar a primei clase, n cazul unei distribuii de
frecvene grupate?
____________________________________________________________________
7. Care este numrul recomandabil de clase ntr-o distribuie de frecvene grupate?
____________________________________________________________________
8. Cum se numesc valorile de pe coloana frecvenelor relative procentuale cumulate?
____________________________________________________________________
21
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
9. Cum se numete valoarea variabilei care corespunde unui anumit rang percentil?
____________________________________________________________________
1
O prezentare extensiv a tipurilor de reprezentri grafice poate fi gsit n Statistica, Electronic Textbook, 1984-1999,
StatSoft Inc., Graphical techniques
22
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Axa vertical (Oy) pe care sunt reprezentate frecvenele
fiecrei valori, sub forma unei bare rectangulare.
Iat cum arat un grafic de acest tip efectuat pe datele din tabelul de
frecvene grupate, lund clasele drept valori ale distribuiei. Cu ct
frecvena unei valori este mai mare, cu att bara este mai mare.
Simplitatea i claritatea este cea mai mare calitate a acestui tip de grafic.
14
12
10
Axa Oy
0
1 2 3 4 5 6 7 8 9
Axa Ox
Histograma
10
0
85,0 90,0 95,0 100,0 105,0 110,0 115,0 120,0 125,0
Clase
Poligonul de frecvene
23
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
14
12
10
0
1 2 3 4 5 6 7 8 9
Clase de interval
70
60
50
40
30
Frecvena cumulat
20
10
0
1 2 3 4 5 6 7 8 9
Clase de interval
Graficul circular
Modul de realizare
Stem-and-Leaf
8 . 679
9 . 1224
9 . 6778
10 . 11112224
10 . 5667778889999
11 . 0233444
11 . 5566788
12 . 134
12 . 5
Mrimea tulpinii: 10
Valorile din coloana stem indic numrul de zeci, iar cele din
coloana Leaf, numrul de uniti. Dac privim imaginea n ansamblu ne-o
putem reprezenta ca pe o histogram orizontal. n acest exemplu:
Stem 8, urmat de Leaf 679 indic faptul c variabila noastr are n
compunere valorile 86,87,89.
Stem 12, urmat de leaf 134, ne arat c distribuia conine valorile
121, 123,124
25
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
__________________________________________________________________
__________________________________________________________________
3. n ce situaie se utilizeaz graficul de tip circular?
__________________________________________________________________
4. Facei reprezentarea stem-and-leaf pentru urmtoarea distribuie de valori:
29, 28, 36, 41, 25, 15, 33, 40, 33, 20, 35, 26, 32, 23
Modul (Mo)
Mediana (Me)
Este valoarea din mijlocul unei distribuii, adic aceea care are
50% dintre valori deasupra ei i 50% dintre valori dedesubtul ei (cu alte
cuvinte, percentila 50).
Se gsete prin alctuirea tabelei de frecvene, n coloana
frecvenelor relative procentuale cumulate, i corespunde valorii de 50%.
n cazul distribuiilor cu numr impar de valori, Me este chiar
valoarea respectiv.
n cazul distribuiilor pare, Me se calculeaz ca medie a celor dou
valori din mijlocul distribuiei
Exemplu: n seria de valori 5,8,3,2,5,4, ordonat cresctor
(2,3,4,5,5,8), Me=4,5 (ca medie a valorilor 4 i 5 aflate n mijlocul unei
distribuii pare). Dac distribuia noastr ar fi avut 5 valori (fr 2, de
exemplu), Me=5
m= =
X 5 + 8 + 3 + 2 + 5 + 4 26
= = 4,50 (formula 2.1)
N 6 6
Calcularea mediei pentru o distribuie de frecvene grupate: Se face
suma produsului dintre fiecare valoare i frecvena ei, apoi se mparte la
suma frecvenelor (numrul valorilor)
Exemplu: Pentru distribuia: 5,8,3,3,3,2,4,2,3,5,4
m=
( X * f ) 5 * 2 + 8 * 1 + 3 * 4 + 2 * 2 + 4 * 2 43
= = = 3,90
f 2 +1+ 4 + 2 + 2 11
(formula 2.2)
27
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Prin X se nelege ca Sum de la X=1 la N (numrul
valorilor)
f este frecvena . f se nelege ca Sum de la f=1 la k
(unde k numrul grupelor de frecven)
AVANTAJE DEZAVANTAJE
- Uor de calculat (nesemnificativ - n general, nesigur, mai ales n cazul
n prezent); eantioanelor mici, cnd se poate
- Poate fi utilizat pentru orice tip demodifica dramatic la o modificare minor
MODUL
28
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
- Reflect valorile ntregii distribuii; - De obicei nu corespunde unei valori
- Are multe proprieti statistice reale;
MEDIA dezirabile; - Nu este tocmai adecvat pentru scale
- Adecvat pentru utilizare n ordinale;
statistici avansate; - Conduce la interpretri greite pe
distribuii asimetrice
- Poate fi puternic afectat de scorurile
extreme;
Tabelul de mai jos conine dou distribuii de valori (variabile). Una reprezint scorurile la
un test de evaluare a timiditii, cealalt, la un test de evaluare a sentimentului de
singurtate.
Calculai i scriei care sunt, pentru fiecare dintre cele dou variabile, urmtorii indicatori
statistici:
(1). Mediana _________ Modul ___________ Media _____________
Indicatori ai mprtierii
Amplitudinea relativ
Exemple:
30
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Abaterea quartil (cvartil, intercvartil) (RQ)
31
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Abaterea medie (d de la deviaie medie)2
X Xi m
5 (5 4.5) = .5
8 (8 4.5) = 3.5
3 (3 4.5) = -1.5
2 (2 4.5) = -2.5
5 (5 4.5) = .5
4 (4 4.5) = -.5
X = 27 (Xi-m) = 0
N=6
m = 4.5
X (Xi m)
5 (5 4.5) = 0.5
8 (8 4.5) = 3.5
3 (3 4.5) = 1.5
2 (2 4.5) = 2.5
5 (5 4.5) = 0.5
4 (4 4.5) = 0.5
X = 27 |Xi-m| = 9
N=6
m = 4.5
d= | X i m|
(formula 2.7)
N
2
n continuare ne vom raporta la media de eantionare. Se subnelege c, pentru cazul unei populaii, media va fi scris
cu litera (miu).
32
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Pentru cazul frecvenelor grupate, formula devine:
d=
| X m |* f
i i (formula 2.8)
f i
Notaii uzuale:
s2 (cnd se calculeaz pentru eantion)
2 (cnd se calculeaz pentru ntreaga populaie)
Pentru a elimina inconvenientul abaterilor de la medie de a avea
suma egal cu zero, se opereaz ridicarea la ptrat a abaterilor valorilor
individuale 3 .
X (Xi m) (Xi m) 2
5 (5 4.5) = 0.5 0.25
8 (8 4.5) = 3.5 12.25
3 (3 4.5) = -1.5 2.25
2 (2 4.5) = -2.5 6.25
5 (5 4.5) = 0.5 0.25
4 (4 4.5) = -0.5 0.25
Abaterea standard
Notaii uzuale:
Abaterea s (pentru eantioane)
standard este (pentru populaie)
cel mai utilizat SD (Standard Deviation, n standardul APA )
indicator al ab.std.
mprtierii
3
Aceast operaie este permis de proprietile mediei
33
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Abaterea standard se obine prin extragerea radicalului din expresia
abaterii medii ptratice (dispersiei).
Formula de calcul: s=
(X i m) 2 (formula 2.10)
N
Dispersia: s2 =
(X i m) 2
(formula 2.11)
N 1
Abaterea standard: s=
(X i m) 2 (formula 2.12)
N 1
34
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Coeficientul de variaie
s
cv = *100
m (formula 2.13)
36
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Distribuie: simetric asimetric negativ asimetric pozitiv
Medie Median
Mediana Medie Mod Medie
Mod Mod
Median
leptocurtica
mezocurtica
platicurtica
37
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
____________
______________
38
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Valori extreme ale distribuiei
4
n mod normal, reprezentarea boxplot se construiete independent de tabelul de frecvene. Dac le-am asociat n imagine, am fcut-o doar cu scop
didactic, pentru a pune mai clar n eviden mecanismul de elaborare.
39
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Valori frc%
fa fr% Limita de sus a boxplotului poate urca pn
QI (rang percentil)
142 este valoare extrem la valoarea 128.
142 1 1,9 100,0 Se fixeaz la 125, pentru c 128 nu exist iar
135 1 1,9 98,1 135 este valoare extrem celelalte valori sunt mai mari de 128
125 1 1,9 96,2
124 1 1,9 94,2 114+13*1,5=128
123 1 1,9 92,3
121 1 1,9 90,4
118 2 3,8 88,5
117 1 1,9 84,6
116 2 3,8 82,7
115 2 3,8 78,8
114 3 5,8 75,0 114
Percentila 75 este valoarea 114
113 2 3,8 69,2
112 1 1,9 65,4
110 1 1,9 63,5
109 4 7,7 61,5 108 Mediana corespunde valorii 108 (prin
108 3 5,8 53,8 aproximare)
107 3 5,8 48,1
106 2 3,8 42,3
H=114-101=13
105 1 1,9 38,5
104 1 1,9 36,5
102 3 5,8 34,6 Percentila 25 este valoarea 101, pentru c
101 4 7,7 28,8 101 28.8 este rangul percentil cel mai apropiat de
25
98 1 1,9 21,2
97 2 3,8 19,2
96 1 1,9 15,4
94 1 1,9 13,5
92 2 3,8 11,5
91 1 1,9 7,7
89 1 1,9 5,8
87 1 1,9 3,8 101-13*1,5=83
Limita de jos a boxplotului poate cobor pn
86 1 1,9 1,9 la valoarea 83.
Total 52 100,0 Se fixeaz la 86, care este valoarea minim
distribuiei
1. a
2. c
3. a (50%)
4. O valoare care exprim raportul dintre frecvena unei valori i 1
5. Valoarea respectiv apare n 7% din totalul valorilor unei distribuii
6. Trebuie s fie multiplu al mrimii intervalului de grupare ales
7. ntre 5 i15
8. Ranguri percentile
9. Percentil
Precizri:
Variabila (2) este multimodal, 30 este modul cel mai mic.
42
Copyright DEPARTAMENT ID 2008
Marian Popa
Statistici descriptive
Bibliografie minimal
Bibliografia de baz
Marian Popa, (2008), Statistic pentru psihologie. Teorie i aplicaii SPSS, Polirom
Pagina web a cursului, la adresa: www.mpopa.ro
Bibliografie suplimentar
Clocotici, V., & Stan, A. (2000). Statistica aplicata in psihologie. Iasi: Polirom, p. 63-
73
Rotaru, T. (coord.). (1999). Metode statistice aplicate in stiintele sociale. Iasi:
Polirom. p. 42-61
Vasilescu, I. P. (1992). Statistica informatizata pentru stiinte despre om (Vol. 1-2).
Bucuresti: Editura militara., p.95-116
43
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
(Modulul II)
1
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
CUPRINS
Scoruri standard.................................................................................................................................5
Altetipuridescoruristandardizate ................................................................................................................................6
2
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Mrimeaefectului .......................................................................................................................................................31
Calculareamrimiiefectuluipentrutestulz(t)pentruunsingureantion ............................................................32
Relaiadintremrimeaefectuluiiputereatestului...............................................................................................33
Interpretarerezultatuluiunuiteststatistic ..................................................................................................................33
3
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
CondiiipentrucalculareacoeficientuluidecorelaiePearson...............................................................................72
Utilizareacoeficientuldecorelaie..........................................................................................................................72
Publicarearezultatuluicorelaiei.............................................................................................................................72
Sarcinadelucru2.7 ......................................................................................................................................................72
4
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
STATISTIC INFERENIAL, NOIUNI DE BAZ
Scoruri standard
Modalitatea de a exprima semnificaia unei anumite valori dintr-o distribuie prin raportare la
parametrii distribuiei (medie i abatere standard) este scorul standardizat z (numit i not z sau scor z).
Aceasta msoar distana dintre o anumit valoare i media distribuiei, n abateri standard:
xm
z=
s
unde x reprezint oricare dintre valorile distribuiei
70 60 respectiv, 70 60
zI = = +2.0 z II = = + 0 .5
5 20
Iar n cazul n care pentru distribuia II am avea un scor de 45:
45 60
z II = = 0.75
20
Semnul la rezultat ne arat c performana este mai mic dect media, mai precis, se afl la 0.75
abateri standard sub medie. Semnul + indic o valoare standardizat peste medie, indicnd, n exemplul de
mai sus, c se plaseaz la o jumtate de abatere standard deasupra mediei.
Scorul z se numete scor standardizat (not standardizat), deoarece exprim distana unei valori
fa de media distribuiei din care face parte n uniti ale abaterii standard. De aici decurge unul din
avantajele lui importante, acela de a putea fi utilizat pentru a compara valori care provin din distribuii
diferite, indiferent de unitatea de msur a fiecreia.
Exemplu: Dac un subiect obine un scor echivalent cu z=+0.2 la un test de calcul aritmetic i un
scor echivalent cu z=+0.1, la un test de reprezentare spaial, se poate spune c are o performan mai bun la
primul test dect la al doilea.
5
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Dac am calcula scorurile (notele) z pentru fiecare dintre valorile unei distribuii, am obine o
distribuie n scoruri z a acelei distribuii. n tabelul urmtor, distribuia X a fost transformat n distribuie
z.
X z
14 +0.50
11 -0.75
10 -1.17
16 +1.34
13 +0.08
N=5 N=5
X =64 Z =0
m=12.8 m=0
s=2.38 s=1
Proprietile scorurilor z
1. Media unei distribuii z este ntotdeauna egal cu 0. Aceasta rezult din proprietatea mediei de a se
diminua corespunztor dac se extrage o constant din fiecare valoare a unei distribuii. Formula de calcul
pentru z implic scderea unei constante din fiecare valoare a distribuiei. Aceasta nseamn c i media noii
distribuii (z) se va reduce cu constanta respectiv. Dar aceast constant este nsi media distribuiei
originale, ceea ce nseamn c distribuia z va avea media egal cu zero, ca rezultat al diminurii mediei cu
ea nsi.
2. Abaterea standard a unei distribuii z este ntotdeauna 1. Acest fapt decurge prin efectul cumulat al
proprietilor abaterii standard. Prima proprietate afirm c n cazul scderii unei constante (n cazul
scorurilor z, media) din valorile unei distribuii, abaterea standard a acesteia nu se modific. A doua
proprietate afirm c n cazul mpririi valorilor unei distribuii la o constant, noua abatere standard este
rezultatul raportului dintre vechea abatere standard i constant. Dar constanta de care vorbim este, n cazul
distribuiei z, chiar abaterea standard. Ca urmare, noua abatere standard este un raport dintre dou valori
identice al crui rezultat, evident, este 1.
Scorurile z prezint un avantaj important, permit compararea valorilor unei distribuii i a valorilor
provenind din distribuii diferite, ca urmare a faptului ca se exprim n abateri standard de la medie. Totui se
impune o anumit precauie n comparaia pe baza scorurilor z atunci cnd distribuiile au forme diferite i,
mai ales, asimetrii opuse.
Notele z au ns i unele dezavantaje: se exprim prin numere mici, cu zecimale, (greu de manipulat
intuitiv) i, n plus, pot lua valori negative. Aceste dezavantaje pot fi uor nlturate printr-un artificiu de
calcul care s conduc la note standardizate convenabile, ce corespund anumitor nevoi practice specifice. n
tabelul de mai jos sunt descrise cteva tipuri de note standard calculate pe baza notelor z.
6
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Formula m xxxm
x Formula mxm m m s
bazat pe z zTH====50
QI
SAT =
50+500
+desfurat
100 + 16
10
14+
15
**100
* *
s ss s s
Note z 0 1
Note T
50+10*z 50 10
(Thurstone) 1
Note H
50+14*z 50 14
(Hull)
QI
100+16*z 100 16
(Binet)
QI
100+15*z 100 15
(Wechsler)
SAT
(Scholastic
500+100*z 500 100
Assessment
Test)
Observaii:
Toate variantele sunt obinute prin transformarea operat pe distribuia de note z.
La nici una dintre variante nu mai avem valori negative (cu condiia ca distribuia s nu aib o
variabilitatea aberant).
Zecimalele nu mai sunt semnificative (ele rezult din calcule, dar sunt ignorate).
Distribuiile variantelor oscileaz n jurul unei valori medii specifice, sub care se afl 50% din valori,
i peste care se afl restul de 50% dintre valori.
Scorurile standard mari indic valori mari, iar scorurile standard mici indic valori mici. Acest fapt
poate crea dificulti n unele cazuri. S lum urmtorul exemplu: Un subiect realizeaz 145
rspunsuri corecte la un test de calcul aritmetic (m=120, s=12) i un timp de reacie de 0.15 sec., la
un test de reactivitate (m=0,11, s=0,05). n acest caz, notele T corespunztoare celor dou
performane sunt: T1=50+10*(145-120)/12=70, respectiv T2=50+10*(0,15-0,11)/0,05=58. Cu alte
cuvinte, ar rezulta c la ambele teste subiectul nostru a obinut un rezultat peste medie. Dar aceast
concluzie este fals, dac inem cont c la testul de reactivitate un timp mai mare nseamn o
performan mai sczut. Soluia problemei const n modificarea semnului expresiei de calcul, n
funcie de semnificaia calitativ a valorilor distribuiei. n acest mod, rezultatul transformrii n not
standard la testul de reactivitate devine: T2=50-10*(0,15-0,11)/0,05=42, ceea ce indic exact
semnificaia de performan sub medie. Raportat la valoarea medie a distribuiei T, scorul 58 este
echivalent cu 42, sub aspectul distanei fa de medie (8 uniti). Diferena const n faptul c
valoarea 42 exprim i n mod intuitiv, nu doar cantitativ, evoluia performanei la test. O asemenea
transformare nu este obligatorie, se poate utiliza oricare dintre formule, cu semnul plus, sau minus.
n orice caz, trebuie s precizm semnificaia valorilor mari si mici pentru distribuiile cu care
operm.
Reprezentarea grafic a rezultatelor msurrilor reale poate lua diverse forme, curba distribuiei
putnd fi unimodal sau multimodal, aplatizat sau nalt, simetric sau asimetric. n statistic exist ns
un tip special de distribuie, numit distribuie normal, care corespunde reprezentrii grafice a unei
caracteristici pentru care exist un mare numr de msurri, tinznd spre infinit. Aceast distribuie este
1
Cunoscute mai ales datorit utilizrii n evaluarea scalelor la MMPI, unul dintre cele mai celebre teste de personalitate.
7
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
numit teoretic pentru c nu este rezultatul unui proces real de msurare, ci reprezint un model teoretic.
Conceptul de curb normal (expresia grafic a distribuiei normale) se refer la un anumit tip de
distribuie teoretic care are cteva proprieti caracteristice:
are form de clopot. Cea mai mare parte a valorilor se concentreaz n zona central (medie);
este perfect simetric pe ambele laturi ale sale;
linia curbei se apropie la infinit de axa OX (orizontal), fr a o atinge vreodat;
n conformitate cu proprietatea 2, de fiecare parte a mediei se afl exact jumtate dintre valorile
distribuiei.
Imaginea de mai sus ilustreaz diferite variante ale familiei de curbe normale, care respect, fiecare
dintre ele, condiiile de mai sus, chiar dac au medii i abateri standard diferite.
Distribuia normal z
Curba normal n care valorile sunt exprimate n scoruri z se numete curba normal standardizat. Ea are
toate proprietile enunate mai sus, avnd ns i parametrii oricrei distribuii z: m=0 i s=1. Rezult astfel
c distribuia normal standardizat (z) este este simetric n jurul lui 0.
Curba normal
standardizat are cteva caracteristici care sunt figurate n imaginea de mai sus i pe care este important s le
reinem:
Aproximativ 34% dintre scorurile distribuiei normale se afl ntre medie i o abatere
standard deasupra mediei (z=+1)
ntre 1z i +1z se afl aproximativ 68% dintre valorile distribuiei
Aproximativ 96% dintre scoruri se afl ntre 2z i +2z
Avnd n vedere distribuia scorurilor z pe o curb normal standardizat, aceasta poate fi utilizat
pentru a afla rspuns la ntrebri precum: Care este procentajul de valori care se afl sub/peste o anumit
not z; ntre anumite note z; ori ntre medie i o not z? Care este nota z corespunztoare unui anumit
procentaj de valori? Pentru a rspunde la aceste ntrebri, se utilizeaz o tabel special care conine, sub
form de probabiliti, frecvenele valorilor de sub curba normal z (Anexa 1).
Aa cum vom vedea mai departe, curba normal are o importan aparte pentru analiza statistic.
Aceasta, deoarece se accept faptul c variabilele statistice s-ar distribui mai ales sub aceasta form dac ar
fi efectuate un numr mare (tinznd spre infinit) de msurri.
8
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Exemple:
S ne raportm la distribuia valorilor QI, pentru care media este egal cu 100 i abaterea standard 16
Exemplul 1: Care este procentajul oamenilor al cror scor QI este ntre 100 i 110?
Pentru a rspunde la aceast ntrebare, convertim valorile QI n scoruri z. 100(QI)=0(z). Pentru 110(QI) se
aplic formula:
X m 110 100
z= = = +0.63
s 16
Aria de sub curba normal cuprins ntre valorile QI i 100 i 110 este reprezentat pe figura urmtoare:
Citim tabela ariilor la intersecia celulelor 0.6 cu 0.03. Valoarea este 0.2357 ceea ce, exprimat n
procente, este 23.57%
Conchidem c 23.57% din oameni au un QI cuprins ntre 100 i 110)
Exemplul 2: Care este procentul oamenilor al cror QI este mai mare dect 125?
Convertim n note z:
X m 125 100
z= = =+1.56
s 16
Aria de sub curba normal pentru scoruri QI mai mari dect 125 este reprezentat mai jos:
Citim valoarea din tabel care corespunde interseciei celulei 1.5 cu 0.06, pentru a afla procentajul
dintre medie i nota z +1.56. Gsim valoarea, exprimat n procente, 44.06%. Acesta este procentajul dintre
medie i z=+1.56.
tim c procentajul peste medie este 50%, ca urmare, procentajul celor peste QI=125 va fi 50-
44.06=5.94.
Conchidem c 5.94% dintre oameni au un QI mai mare de 125 (z=1.56)
Exemplul 3: Care este scorul minim pe care trebuie s l obin o persoan pentru a fi ntre primii 5% din
populaie?
Ne reprezentm aria de sub curb care delimiteaz cele mai mari 5% dintre valorile z, trebuind s
aflm valoarea corespunztoare z, respectiv QI:
9
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Aria dintre medie i linia noastr este 50%-5%=45%. Cutm n tabel valoarea cea mai apropiat de
0.45 i o gsim la intersecia celulelor 1.6 cu 0.04. Deci, z=1.64 pentru limita procentului de 5%.
Convertim scorul z=1.64 n valoare brut: X=m+z*s=100+ (+1.64)*16=126.24
Conchidem c pentru a fi n primii 5% trebuie s obinem un QI=126.24
Exemplul 4: Care este scorul care indic cei mai slabi 33%?
Ne reprezentm limita de 33% n zona valorilor de sub medie:
Conchidem c este necesar un scor de cel mult 92.96 pentru a avea un QI ntre ultimii 33%.
Valorile reprezentate pe curba normal nu reprezint valori reale, rezultate n urma unui proces de
msurare. Ele reprezint valori ipotetice, distribuite astfel pe baza unui model matematic (legea numerelor
mari). Nimic nu ne mpiedic s considerm c valorile de sub curba normal sunt rezultatul unei ipotetice
extrageri aleatoare. Pe msur ce extragem mai multe valori, curba de distribuie a acestora ia o form care
se apropie de forma curbei normale. Extrgnd la infinit valori aleatoare, vom obine o distribuie normal
perfect, exprimabil printr-o curb normal perfect.
Din cele spuse mai sus, rezult faptul c valorile din zona central a curbei sunt mai frecvente (mai
multe), pentru c apariia lor la o extragere aleatoare este mai probabil. n acelai timp, valorile mai
puin probabile, apar mai rar i populeaz zonele laterale, din ce n ce mai extreme, ale distribuiei (curbei).
Probabilitatea nseamn frecvena relativ a apariiei unui eveniment. Subiectiv, se traduce prin ct de
siguri putem fi c acel eveniment apare. Dac probabilitatea reprezint raportul dintre evenimentul favorabil
i toate evenimentele posibile, atunci valoarea ei variaz ntre 0 i 1. Ea poate fi exprimat i n procente. De
exemplu, probabilitatea de 0.05 corespunde unui procentaj de apariie de 5%
Utiliznd simbolul p (de la probabilitate), spunem c dac p<0.05 nseamn c evenimentul are
mai puin de 5% anse s apar, n condiiile unei distribuii corespunztoare curbei normale. Procentajul
ariilor de sub curba normal poate fi citit deci, i ca probabilitate a distribuiei. De exemplu, probabilitatea de
a avea un scor ntre medie i z=+1 este de p=0.34, iar probabilitatea de avea un scor z=+1.65 sau mai mare,
este mai mic de 0.05 (p<0.05).
10
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Distribuii reale i distribuii normale z
Caracteristicile curbei normale i frecvena cu care se face apel la aceasta n studiile statistice
determin adesea interpretri greite. De aceea se cuvine s insistm asupra faptului c distribuia normal
reprezint un model teoretic care se consider c aproximeaz de o manier mulumitoare cele mai multe
dintre distribuiile caracteristicilor naturale, incluzndu-le i pe cele psihice. Cu toate acestea, distribuiile
reale pe care le descoper psihologii n studiile lor nu au niciodat parametrii unei curbe normale perfecte.
Acest lucru este practic imposibil dac ne gndim c o curb normal are limitele deschise, mergnd spre
infinit, n timp ce distribuiile reale sunt ntotdeauna finite. n ciuda acestui neajuns, aproximarea oferit de
modelul teoretic al curbei normale este considerat acceptabil din punct de vedere tiinific.
Un alt aspect care poate conduce la interpretri eronate este exprimarea valorilor curbei normale n
scoruri z. Acest fapt este neles adesea cu sensul c transformarea n scoruri z a unei distribuii o transform
automat ntr-o distribuie normal, ceea ce este o concluzie profund greit. Convertirea valorilor unei
distribuii n scoruri z nu modific forma distribuiei. Distribuia normal z este o distribuie teoretic, n
timp ce o distribuie z oarecare are forma distribuiei valorilor originale.
Distribuia de eantionare
Populaie i eantion
Obiectivul legitim al cercetrii tiinifice este identificarea unor adevruri cu un anumit grad de
generalitate. Din punct de vedere statistic generalul este reprezentat de totalitatea valorilor care descriu o
anumit caracteristic, i este numit populaie. Din pcate ns, investigarea tuturor indivizilor (valorilor)
care compun o anumit populaie nu este aproape niciodat posibil. Ca urmare, n practica cercetrii
tiinifice se supun cercetrii psihologice loturi mai restrnse, numite eantioane, extrase din ansamblul
populaiei vizate. Parametrii descriptivi ai acestor eantioane (medie, abatere stadard) sunt extrapolai, n
anumite condiii i cu ajutorul unor proceduri specializate, la populaia din care fac parte.
A fundamenta un adevr statistic nseamn a trage o concluzie care descrie parametrii unei populaii
de valori, pe baza indicatorilor unui eantion din acea populaie.
n contextul cercetrii statistice utilizm urmtoarele definiii:
Populaia reprezint totalitatea unitilor de informaie care constituie obiectivul de interes al unei
investigaii. Prin uniti de informaie nelegem cel mai adesea persoane (subieci, cu un termen uzual
in cercetarea psihologic 2). Dar, la fel de bine, putem nelege i populaia de cupluri familiale, sau
populaia de diferene dintre mediile a dou variabile, de exemplu. n esen, prin populaie trebuie s
nelegem extinderea maxim posibil, sub aspectul volumului, a respectivei uniti de informaie.
Extinderea menionat este, la rndul ei, definit prin obiectivul de cercetare, ceea ce nseamn ca are o
dimensiune subiectiv. Aceasta se refer la domeniul de interes pe care i-l propune cercettorul. De
exemplu, ntr-un studiu cu privire la efectul oboselii asupra performanei cognitive, pot fi vizate diferite
categorii de populaii: a aviatorilor, a studenilor, a mecanicilor de locomotiv, a ahitilor, etc. Este de la
2
Denumirea de subiect este respins n mediul anglo-saxon din cauza semnificaiei de supus pe care o are n limba
englez cuvntul subject. Din acest motiv, o variant frecvent uzitat este cea de participant.
11
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
sine neles faptul c, nc de la nceputul unei cercetri tiinifice, se va preciza populaia cercetrii, cu alte
cuvinte, domeniul de extindere a rezultatelor i a concluziilor ce urmeaz a fi trase.
Eantionul reprezint unitile de informaie selecionate pentru a fi efectiv studiate. Ideea pe care
se bazeaz cercetrile bazate pe eantioane este aceea c se pot face aprecieri asupra unei ntregi populaii, n
anumite condiii, doar pe baza caracteristicilor msurate pe o parte a acesteia.
Exemple:
- ntr-un studiu asupra efectelor accesului la internet asupra elevilor de liceu, elevii de liceu
reprezint populaia, iar elevii selecionai pentru investigaie, eantionul.
- ntr-un studiu care vizeaz influena inteligenei asupra performanei n instruirea de zbor,
populaia este reprezentat de toi piloii, iar eantionul, de subiecii inclui n studiu.
Dac am reui recoltarea datelor cu privire la ntreaga populaie care face obiectul cercetrii, am
putea trage concluzii directe cu privire la aceasta prin utilizarea indicatorilor statistici descriptivi cunoscui
(medie, dispersie, abatere standard) numii i parametrii populaiei. Dar acest lucru nu este aproape
niciodat posibil i, ca urmare, indicatorii statistici ai eantionului sunt utilizai pentru a face estimri,
inferene, cu privire la parametrii populaiei. n esen, a testa o ipotez statistic nseamn a emite concluzii
asupra unei populaii pe baza rezultatelor obinute pe un eantion care aparine acelei populaii. n acest
context, demersul tiinific presupune urmtorii pai:
1. formularea problemei cercetrii (sub forma unei ntrebri, cu referire la o anumit populaie);
2. emiterea unei ipoteze privind cel mai probabil rspuns;
3. selectarea unui eantion;
4. aplicarea unei proceduri care sa permit acceptarea sau respingerea ipotezei.
Reprezentativitatea eantionului
Verificarea statistic a ipotezelor se bazeaz pe o idee simpl: dac avem un eantion a crui alegere
respect anumite condiii, extras dintr-o populaie orict de mare, rezultatele obinute pe acesta pot fi
extrapolate la ntreaga populaie.
Calitatea unui eantion de a permite extinderea concluziilor la ntreaga populaie din care a fost
extras se numete reprezentativitate. De fapt, nici un eantion nu poate reprezenta perfect datele populaiei.
De aceea reprezentativitatea are o semnificaie relativ. Ca urmare estimrile pe baz de eantion conin
ntotdeauna o doz mai mare sau mai mic de eroare. Cu ct eroarea este mai mic, cu att concluziile
obinute pe eantion pot fi generalizate mai sigur asupra populaiei.
Pentru a permite fundamentarea inferenelor statistice, eantionul trebuie s fie constituit din uniti
de informaie (subieci, valori, etc.) independente unele de altele. Independena valorilor se refer la faptul
c fiecare valoare (sau unitate experimental) trebuie s fie absolut distinct de celelalte. n esen
constituirea unui eantion trebuie s evite efectele unor factori sistematici care s interfereze cu obiectivele
studiului, orientnd rezultatele ntr-o anumit direcie (situaie desemnat n limba englez prin termenul de
bias).
Cteva exemple:
Dac msurm timpul de reacie la un numr de cinci subieci, dar facem trei evaluri la fiecare
subiect, nu avem eantion de 15 valori independente, deoarece valorile aceluiai subiect au n comun
o constant personal care le face dependente una de cealalt. Pentru avea un singur eantion am
putea s utilizm media celor trei determinri pentru fiecare subiect.
Dac dorim s investigm efectul inteligenei asupra performanei colare trebuie s avem grij s
includem n eantion subieci provenind din familii cu un nivel variat al veniturilor, pentru a anihila
influena statutului socio-economic asupra performanei colare.
Un studiu asupra atitudinii fa de utilizarea computerelor n educaie, poate fi influenat n mod
sistematic dac eantionul este constituit numai din elevi care utilizeaz frecvent calculatorul.
n cazul unui sondaj cu privire la inteniile de vot bazat pe interviul telefonic, vom obine rezultate
afectate de starea social a respondenilor (i permit montarea unui telefon) sau de ora apelului (n
orele dimineii sunt acas, s zicem, mai multe femei casnice).
Este clar de ce modul de constituire a eantionului este decisiv pentru nivelul de reprezentativitate.
Esenial n acest caz este asigurarea condiiilor ca acesta s acopere n mod real caracteristicile populaiei,
12
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
evitndu-se favorizarea sistematic a unor subieci nereprezentativi. Fr a intra n amnunte tehnice cu
privire la procedurile de eantionare, iat care sunt cele mai utilizate metode de constituire a eantioanelor:
a) Eantionare stratificat multistadial. Populaia se mparte n categorii, fiecare categorie n
subcategorii .a.m.d., iar subiecii sunt selecionai aleator la nivelul categoriei de nivelul cel mai
sczut. Se obine astfel un eantion care reproduce fidel structura populaiei.
b) Eantionare prin clasificare unistadial. Se identific categorii pe un singur nivel iar subiecii se
extrag aleator din fiecare categorie.
c) Eantionare aleatoare. Subiecii sunt extrai aleator (la ntmplare) din ansamblul populaiei. La
ntmplare, nseamn n acest caz utilizarea unei proceduri care asigur fiecrui subiect al
populaiei absolut aceleai anse de a fi extras. n acest scop se pot utiliza programe de calculator
(de ex. SPSS) sau tabele de numere aleatoare.
d) Eantionare pseudo-aleatoare (haphazard, sau de convenien). Sunt utilizai subiecii
disponibili. Este cazul cel mai frecvent ntlnit n practic i, dac disponibilitatea nu este
afectat de un aspect care s influeneze semnificativ obiectivul cercetrii, atunci
reprezentativitatea este acceptabil.
Atunci cnd constituim un eantion de studiu nu facem dect s utilizm doar unul dintre
eantioanele posibil a fi selecionate (alese, constituite, extrase) din populaia cercetrii. Dac am selecta mai
multe eantioane din aceeai populaie, fiecare dintre ele ar fi caracterizat prin indicatori sintetici specifici,
vor avea, fiecare, media i abaterea lor standard. Imaginea de mai jos sugereaz situaia descris:
POPULAIE
eantion 1 eantion 2 eantion 3 eantion 4
Dac fiecare dintre cele patru eantioane de valori are propria sa medie, atunci distribuia mediilor
tuturor eantioanelor extrase se numete distribuia mediei de eantionare sau, mai scurt, distribuia de
eantionare. La rndul ei, distribuia mediilor are i ea o medie, numit medie de eantionare, i care se
calculeaz, evident, dup urmtoarea formul:
m1 + m2 + m3 + ... + mk
=
k
unde este media populaiei, valorile m sunt mediile fiecrui eantion constituit, iar k este numrul
eantioanelor.
Dac am extrage toate eantioanele posibile dintr-o populaie, atunci media de eantionare este
identic cu media populaiei. Pentru exemplificare, s presupunem c avem o populaie constituit din
valorile 1,2,3,4 i s ne propunem constituirea tuturor eantioanelor posibile de cte 3 valori. Tabelul de mai
jos ilustreaz aceast situaie:
Distribuia
Populaia Eantioane mediei de
eantionare
1 1,2,3 m1=2.00
2 1,2,4 m2=2.33
3 3,4,1 m3=2.67
13
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
4 2,3,4 m4=3.00
=2.5 Toate eantioanele =10.00
=1.29 posibile pentru N=3 m=10/4=2.5
Aa cum se observ, dac extragem toate eantioanele posibile (n acest caz 4) dintr-o populaie de
valori, atunci media mediilor eantioanelor extrase (denumit medie de eantionare) este identic cu media
populaiei (n cazul dat: m==2.5). Datele din tabel ne mai arat i faptul c media fiecrui eantion
oscileaz (variaz) n jurul mediei de eantionare. De aceea ele pot fi considerate o estimare a acesteia din
urm, n ciuda impreciziei pe care o conine fiecare. Aceast imprecizie se numete eroare de estimare.
Desigur, exemplul are o valoare de ilustrare teoretic deoarece, n practic, niciodat nu se ajunge la
selectarea tuturor eantioanelor posibile dintr-o anumit populaie de valori.
n acest exemplu, cele cinci eantioane nu sunt toate, ci doar o parte din eantioanele posibile de 3
valori extrase din populaia cercetat. Media distribuiei de eantionare pentru acest exemplu este:
m1 + m 2 + m3 + m 4 + m5
= = 5.375
5
n ceea ce privete mprtierea distribuiei de eantionare, aceasta este, aa cum am spus, mai mic
dect mprtierea variabilei la nivelul ntregii populaii, deoarece o parte a mprtierii generale se
concentreaz (se pierde) n media fiecrui eantion extras. Ca urmare, abaterea standard a distribuiei de
eantionare este o fraciune din abaterea standard a populaiei, fiind dependent de mrimea eantionului.
Mai precis, fr a intra n detalii explicative, abaterea standard a distribuiei de eantionare este egal cu
N din abaterea standard a populaiei, unde N este volumul eantionului.
Deoarece mprtierea mediei de eantionare arat ct de mult se abat aceste medii de la media
populaiei, abaterea standard a mediei de eantionare este denumit eroare standard a mediei i se calculeaz
cu formula:
sm = (formula 3.1)
N
unde sm este eroarea standard a mediei de eantionare, este abaterea standard a populaiei iar N
este volumul eantionului. n cazul distribuiei de mai sus, eroarea standard a mediei este
3 . 02
sm = = = 1 . 74
N 3
Pentru c, n mod obinuit, abaterea standard a populaiei nu este cunoscut, eroarea standard a
mediei de eantionare se calculeaz utiliznd abaterea standard a eantionului, care reprezint o estimare a
mprtierii la nivelul populaiei.
Figura de mai jos sugereaz foarte bine modul n care, prin creterea volumului eantionului, media
eantionului se apropie tot mai mult de media populaiei, cu alte cuvinte, comport o eroare din ce n ce n
mai mic fa de aceasta.
14
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Expresia de eroare standard a mediei poate fi mai greu de neles, dat fiind faptul c este folosit
pentru a defini un indicator al mprtierii, n timp ce are n compunere cuvntul medie. Trebuie ns s
reinem faptul c acest indicator msoar ct de departe poate fi media unui eantion de media populaiei din
care a fost extras. Altfel spus, ct eroare poate conine media unui eantion n estimarea mediei
populaiei. Avnd n vederea faptul c la numitor avem o expresie bazat pe N (volumul eantionului), este
limpede de ce, cu ct eantionul este mai mare, cu att eroarea standard a mediei este mai mic.
3
Sau teorema limit central.
4
Dincolo de aceste considerente teoretice, mrimea eantioanelor utilizate n studiile statistice psihologice face obiectul
unor recomandri specifice pentru diferite situaii practice de cercetare. Acestea vor fi prezentate mai trziu.
15
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Ne vom referi acum la exemplul anterior, n care avem cinci eantioane extrase dintr-o populaie de
10 valori. Dac avem media distribuiei de eantionare i abaterea standard a acesteia (calculat ca eroare
standard a mediei, cu formula 3.1), atunci putem exprima media unui eantion oarecare, ca scor standardizat
z, ntr-o manier similar cu scorul standardizat z pentru o valoare oarecare. Rostul acestei transformri ar fi
acela de a vedea n ce msur media eantionului de studiu se ndeprteaz de media populaiei de referin.
Cu alte cuvinte, n ce msur rezultatul obinut pe eantion este unul obinuit (mai aproape de media
populaiei) sau unul neobinuit (mai ndeprtat de media populaiei).
Formula de calcul este foarte asemntoare cu formula lui z pentru valori individuale:
m
z= (formula 3.2)
sm
unde m este media eantionului, media populaiei, iar sm este eroarea standard a mediei.
Dac presupunem c obiectul studiului l face eantionul 1, atunci putem calcula mai nti eroarea
standard a mediei, astfel:
3.02
sm = = = 1.74
N 3
n exemplul nostru, limitat la o populaie cunoscut, am putut calcula abaterea standard a populaiei
(=3.02), dar pentru situaii reale, cu populaii nelimitate, acest lucru nu este posibil. n astfel de cazuri se
accept faptul c abaterea standard a populaiei este suficient de bine reprezentat de abaterea standard a
eantionului extras din aceasta. Ca urmare, dac nu aveam abaterea standard a populaiei, am fi putut utiliza
16
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
n formula erorii standard a mediei abaterea standard a eantionului (n cazul nostru s1=5.65 n loc de
=3.02).
Mai departe, scorul standard z pentru eantionul 1, se calculeaz astfel:
Exemplu:
S presupunem c, la un examen de cunotine de statistic, o grup de 45 de studeni obine un scor
mediu de m=28.5 puncte. Presupunnd c media pe populaia studeneasc care a mai dat acest examen
(calculat de-a lungul anilor anteriori) este =27.3, cu o abatere standard =8.2, trebuie s aflm care este
performana grupei respective transformat n not z.
Calculm mai nti abaterea standard a mediei:
8.2 8.2
sm = = = = 1.22
N 45 6.70
Dac vrem s tim unde se plaseaz performana grupului nostru pe o curb normal, atunci ne uitm
pe tabela notelor z i gsim, n dreptul scorului z=0.98, valoarea tabelar 0.3365. Aceasta poate fi interpretat
n mai multe feluri. De exemplu, putem spune c procentul performanelor posibile peste nivelul grupului
nostru este 50%-33%, adic 17%. Sau, n termeni probabilistici, putem sune i c: probabilitatea de a avea
o grup (un eantion, de aceeai mrime) care s obin un scor mai bun la un examen de statistic (cu
aceleai ntrebri) este de 0.17.
Ipoteza cercetrii
n mod obinuit, o cercetare tiinific se bazeaz pe estimarea unui rezultat ateptat, denumit
ipotez. n cazul nostru, psihologul se poate atepta n mod legitim ca participanii la olimpiad s fie mai
inteligeni dect elevii n general. Acest rezultat ateptat, prefigurat, se numete ipoteza cercetrii, fiind
codificat cu H1. Am putea formaliza ipoteza cercetrii astfel:
H1 mpomeg
unde mpo reprezint media inteligenei populaiei participanilor la olimpiade, iar meg reprezint
media inteligenei populaiei elevilor n general.
n conformitate cu ipoteza cercetrii, exist dou populaii distincte sub aspectul nivelului de
inteligen, cea a elevilor participani la olimpiade i cea a elevilor n general.
17
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Ipoteza statistic (de nul)
H0 mpo=meg
ceea ce semnific faptul c mediile celor dou populaii comparate nu difer, ci sunt egale. Cu alte
cuvinte, ipoteza de nul afirm c nu exist dou populaii distincte sub aspectul nivelului de inteligen, ci
una singur. Elevii participani la olimpiade nu se deosebesc sub aspectul inteligenei de populaia elevilor n
general.
Expresia mpo=meg descrie situaia n care media olimpicilor nu difer de media populaiei generale de
elevi, care poate fi definit, din acest motiv, drept populaia diferenei nule sau, mai scurt, populaia de
nul. Corespunztor, distribuia mediilor eantioanelor aleatore extrase din populaia de nul se numete
distribuia populaiei de nul sau distribuia de nul.
Aa cum am spus anterior, extragerea unui numr mare de eantioane (eventual infinit de mare),
produce ceea ce se numete distribuia de eantionare, care respect legea curbei normale. Din perspectiva
cercetrii statistice, aceasta este chiar distribuia de nul, deoarece ilustreaz forma n care se distribuie
mediile tuturor eantioanelor posibile, dac acestea ar fi constituite pe o baz pur ntmpltoare, cu alte
cuvinte, exact situaia n care ipoteza de nul ar fi adevrat.
Dac avem n vedere eantioane extrase la ntmplare din populaia de nul, atunci, n conformitate cu
teorema limitei centrale, mediile acestora se distribuie pe o curb normal. Ca urmare, putem utiliza tabela
distribuiei normale standard pentru a rspunde ntrebrilor cu privire la media eantionului de cercetare, n
acelai mod n care am fcut-o pentru notele z individuale.
Dac vrem s tim care este probabilitatea de a obine un rezultat mai bun prin jocul ansei, nu
trebuie dect s vedem unde se plaseaz rezultatul cercetrii pe distribuia de nul. Apoi calculm aria de
dincolo de acest punct, deoarece aceasta ne arat proporia (probabilitatea) cazurilor n care eantioane de
5
n realitate, media QI este diferit n funcie de vrst, dar, pentru exemplul nostru, vom accepta c populaia general
de elevi are o medie de 100 i o abatere standard de 15.
18
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
aceeai mrime, selectate la ntmplare din populaia de nul, ar putea avea un QI mediu mai mare dect
eantionul de participani la olimpiad.
Procedura de calcul
m 106 100 6 6
z= = = = = +2.18
sm / N 15 / 5.47 2.74
n exemplul de mai sus, fiind vorba de o valoare QI, a crei abatere standard la nivelul populaiei ne
este cunoscut (am optat pentru =15) i am utilizat-o ca atare. Dac ar fi fost vorba de o variabil pentru
care nu cunoteam abaterea standard la nivelul populaiei, am fi putut utiliza aceeai valoare calculat pe
eantionul de studiu (s=7).
Dac citim frecvena corespunztoare valorii z calculate (2.18) n tabelul distribuiei normale,
constatm c ntre media populaiei de nul (z=0) i nivelul inteligenei eantionului de elevi olimpici se afl
48.54% dintre valorile posibile. De aici rezult c exist 50-48.54 adic 1.46% anse (sau o probabilitate
p=0.0146) ca hazardul s produc un eantion cu un QI egal sau mai mare dect eantionul cercetrii noastre.
Imaginea de mai jos ilustreaz grafic poziia mediei eantionului de cercetare pe distribuia de nul.
Ne putem imagina o situaie n care scorul mediu QI al eantionului de participani la olimpiad este
att de mare nct s nu existe nici o ans de a se obine un rezultat mai bun ca urmare a unei selecii
ntmpltoare din populaia de nul? Teoretic, acest lucru nu este posibil. Orict de mare ar fi media unui
eantion de olimpici, hazardul poate produce un eantion cu medie mai mare din populaia de nul, deoarece
curba normal este asimptotic. Exist ns un prag dincolo de care probabilitatea unui eantion aleatoriu
din populaia general de elevi cu un QI mai mare dect cel al eantionului de olimpici este att de mic,
nct s ne putem permite s o considerm neglijabil. ntr-un asemenea caz, putem concluziona c valoarea
calculat pe eantionul cercetrii nu decurge din variaia ntmpltoare a mediei de eantionare, ci provine
din aciunea unui factor sistematic care a condus la ndeprtarea semnificativ a mediei eantionului de
19
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
studiu de media populaiei (n cazul nostru, accesul celor mai inteligeni elevi la olimpiadele colare). Despre
pragul evocat mai sus, vom vorbi n continuare.
Decizia statistic
Urmtorul pas pe care trebuie s l fac cercettorul este acela de a decide dac valoarea medie a
eantionului de olimpici decurge din faptul c acetia sunt ntr-adevr mai inteligeni dect elevii n general,
sau reprezint rezultatul unui joc al ansei, care a condus la selecia unui eantion ce nu se difereniaz n
mod real de populaia de nul.
Este evident faptul c, dac media eantionului de olimpici ar fi fost egal cu 100, cercettorul ar fi
decis c valoarea nu confirm ipoteza cercetrii. n exemplul dat ns, media eantionului cercetrii fiind mai
mare, ne punem problema, ct de mare trebuie s fie diferena fa de media populaiei pentru a accepta c
este o diferen real (determinat de un factor de influen, accesul la olimpiad pe baza inteligenei).
Altfel spus, trebuie s decidem dac acceptm sau respingem ipoteza de nul.
Din pcate, nu exist un criteriu obiectiv de decizie ntr-o situaie de acest gen. Acceptarea sau
respingerea ipotezei de nul depinde de gradul de risc pe care suntem dispui s ni-l asumm n acest sens.
Este evident c cineva interesat n acceptarea ideii c olimpicii sunt mai inteligeni ar fi dispus s considere
c valoarea obinut este suficient de ndeprtat de medie pentru a respinge ipoteza de nul. La fel cum,
cineva nencreztor n aceast ipotez (considernd c efortul de studiu, motivaia, fac diferena dintre
participanii i neparticipanii la olimpiadele colare), ar putea fi dispus s impun un prag de respingere mult
mai sever. Iat de ce, n practica cercetrii tiinifice s-a impus convenia unui prag maxim de risc acceptat
pentru decizia statistic. Acest prag critic se numete nivel alfa () i corespunde probabilitii de 0.05. Pe
curba normal z, fiecrei probabiliti i corespunde o anumit valoare z, ca urmare i probabilitii critice
alfa i corespunde o valoare critic z. Dat fiind faptul c a nceput prin a fi citit dintr-un tabel, mai este
desemnat i ca valoare tabelar.
Avem acum toate elementele pentru luarea deciziei statistice n cazul cercetrii noastre, pe baza unui
raionament convenional, identic pentru ntreaga comunitate tiinific. Esena acestuia const n comparaia
rezultatelor derivate dintr-un context de cercetare cu cele specifice unui context ipotetic, aleatoriu (bazat pe
ansa pur), dup cum urmeaz:
a. Dac rezultatul calculat pentru eantion este cel puin egal sau mai mare dect scorul critic, atunci
avem un rezultat semnificativ al cercetrii. Aceasta, deoarece se accept c ansele ca acest rezultat s fi
decurs din ntmplare sunt suficient de mici pentru a fi ignorate. n consecin, ntr-un astfel de caz, ipoteza
de nul (H0) se respinge, iar ipoteza cercetrii (H1) se consider confirmat la un prag alfa=0.05 (dac acesta a
fost nivelul ales).
b. Dac rezultatul eantionului este mai mic dect scorul z critic, atunci avem un rezultat nesemnificativ
al cercetrii, prin faptul c exist prea multe anse ca acesta s poat fi obinut n condiii pur aleatoare. n
aceast variant, ipoteza de nul se accept, iar ipoteza cercetrii se consider infirmat la un prag alfa=0.05.
c. Cele dou reguli decizionale de la punctele a i b sunt exprimate pe baza comparaiei dintre valoarea
calculat a testului i valoarea critic tabelar, aferent nivelului alfa. Ele ns pot fi exprimate i direct, prin
comparaia probabilitii valorii calculate cu alfa. Singura diferen este dat de faptul c raportul dintre
probabilitatea asociat scorului calculat i alfa este invers dect n cazul valorilor. Astfel, ipoteza de nul se
admite dac probabilitatea (p) a valorii calculate este mai mare dect alfa, i se respinge dac este egal sau
mai mare dect acesta. Aceast precizare, i dovedete utilitatea n momentul n care se utilizeaz programe
statistice, care fac inutil consultarea tabelelor distribuiei de nul, deoarece dau direct probabilitatea asociat
valorii calculate a testului.
Imaginea de mai jos ilustreaz poziia valorii calculate a testului z n raport cu valoarea critic pentru
alfa=0.05.
20
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Dat fiind faptul c z calculat (+2.18) este mai mare dect z critic pentru valoarea lui alfa=0.05
(+1.65), decidem respingerea ipotezei de nul 6. Ca urmare, n legtur cu studiul nostru demonstrativ, trebuie
s decidem respingerea ipotezei de nul (participanii la olimpiade nu sunt mai inteligeni dect elevii n
general) ceea ce nseamn, implicit, confirmarea ipotezei de cercetare. (participanii la olimpiade sunt
mai inteligeni dect elevii n general).
Raionamentul deciziei statistice exemplificat astfel, se va regsi n toate situaiile de testare a
ipotezelor statistice cu care ne vom confrunta mai departe, indiferent de modelul de cercetare i de natura
relaiei pe care vrem s o demonstrm ntre variabile.
n exemplul nostru, ipoteza cercetrii a fost aceea c elevii participani la olimpiade au o inteligen
mai mare dect media populaiei de nul. Din acest motiv, ne-a interesat s vedem n ce msur rezultatul
nostru confirm ipoteza pe direcia valorilor din dreapta curbei normale (valori mari, cu z pozitiv). Ca
urmare, am efectuat ceea ce se numete un test unilateral (one-tailed). n acest caz, ipoteza c participanii la
olimpiadele colare ar putea avea o inteligen sub medie, nu este viabil, dar dac am fi obinut un z negativ
pentru eantionul cercetrii, ar fi trebuit s l testm n partea din stnga curbei de distribuie, n aceste dou
situaii am fi avut acelai z critic (1.65) cu semnul + sau n funcie de zona scalei pentru care fceam
testarea. Imaginea de mai jos ilustreaz grafic cele dou direcii de testare a ipotezelor statistice unilaterale i
ariile valorilor semnificative/nesemnificative, n funcie de valoarea critic a lui z.
Ce s-ar fi ntmplat ns dac eantionul cercetrii ar fi obinut un scor QI=94, ceea ce ar fi corespuns
unui scor z=-2.18? n acest caz, aplicnd un test unilateral orientat spre valori superioare mediei, conform
ipotezei, ar fi trebuit s acceptm ipoteza de nul, concluzionnd c olimpicii nu sunt mai inteligeni dect
media, fr a putea emite o concluzie privitoare la faptul c ei sunt, de fapt, mai puin inteligeni, aa cum ar
fi cerut-o datele cercetrii.
Pentru a elimina acest neajuns putem verifica ipoteza pe ambele laturi ale distribuiei, aplicnd ceea
ce se numete un test bilateral (two-tailed). n acest caz se pstreaz acelai nivel alfa (0.05), dar el se
distribuie n mod egal pe ambele extreme ale curbei, astfel nct pentru 2.5% de fiecare parte, avem un z
6
Puteam ajunge la aceeai concluzie pe baza faptului c probabilitatea valorii calculate (0.014) este mai mic dect alfa
(0.05), dar acest raionament nu este posibil dect atunci cnd utilizm programe specializate de calcul, care ne ofer
direct valoarea lui p calculat.
21
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
critic de 1.96 (cu semnul - sau +). Aceast valoare este luat din tabelul ariei de sub curb, n dreptul
probabilitii 0.4750 care corespunde unei probabiliti complementare de 0.025 (echivalent cu 2.5%).
Figura de mai sus indic scorurile critice pentru un test z bilateral. Se observ c n cazul alegerii
unui test bilateral (z=1.96) nivelul de 5% se mparte n mod egal ntre cele dou laturi ale curbei. Este de
la sine neles faptul c semnificaia statistic este mai greu de atins n cazul unui test bilateral dect n cazul
unui test unilateral, deoarece valoarea testului trebuie s fie mai mare de 1.65, ct este n cazul pentru un test
unilateral.
Alegerea tipului de test, unilateral sau bilateral, este la latitudinea cercettorului. De regul ns, se
prefer testul bilateral, chiar i n situaii de cercetare cum este aceea din exemplul nostru, cnd o diferen
negativ fa de media populaiei este improbabil. Motivul l constituie necesitatea de a introduce mai mult
rigoare i de a lsa mai puin loc hazardului. Se alege testul unilateral doar atunci cnd suntem interesai de
evaluarea semnificaiei strict ntr-o anumit direcie a curbei, sau atunci cnd miza rezultatului este prea
mare nct s fie justificat asumarea unui risc sporit de eroare. n mod uzual, ipotezele statistice sunt testate
bilateral, chiar dac ipoteza cercetrii este formulat n termeni unilaterali. Testarea unilateral este utilizat
numai n mod excepional, n cazuri bine justificate.
O scurt discuie pe tema nivelului alfa maxim acceptabil (0.05) se impune, avnd n vedere faptul
c ntregul eafodaj al deciziei statistice se sprijin pe acest prag. Vom sublinia, din nou, c p=0.05 este un
prag de semnificaie convenional, impus prin consensul cercettorilor din toate domeniile, nu doar n
psihologie. Faptul c scorul critic pentru atingerea pragului de semnificaie este 1.96 a jucat, de asemenea,
un rol n impunerea acestei convenii. Practic, putem considera c orice ndeprtare mai mare de dou abateri
standard de la media populaiei de referin este semnificativ. Chiar dac persist posibiliti de a ne nela,
ele sunt suficient de mici pentru a le trece cu vederea.
Impunerea unui prag minim de semnificaie a testelor statistice are ns, mai ales, rolul de a garanta
faptul c orice concluzie bazat pe date statistice rspunde aceluiai criteriu de exigen, nefiind influenat
de subiectivitatea cercettorului. Nivelul alfa de 0.05 nu este dect pragul maxim acceptat. Nimic nu
mpiedic un cercettor s i impun un nivel mai exigent pentru testarea ipotezei de nul, ceea e nseamn
un prag alfa mai sczut. n practic mai este utilizat pragul de 0.01 i, mai rar, cel de 0.001. Toate aceste
praguri pot fi exprimate i n procente, prin opusul lor, care exprim nivelul de ncredere n rezultatul
cercetrii. Astfel, printr-o probabilitate de 0.05 se poate nelege i un nivel de ncredere de 95% n rezultatul
cercetrii (99%, pentru p=0.01 i, respectiv, 99.9% pentru p=0.001).
n fine, este bine s subliniem faptul c utilizarea acestor praguri vine din perioada n care nu
existau calculatoare i programe automate de prelucrare statistic. Din acest motiv, cercettorii calculau
valoarea testului statistic pe care apoi o comparau cu valori tabelare ale probabilitii de sub curba de
referin. Pentru a face mai practice aceste tabele, ele nu cuprindeau toate valorile de sub curb, ci doar o
parte dintre acestea, printre ele, desigur, cele care marcau anumite praguri. Rezultatul cercetrii era
raportat, de aceea, prin invocarea faptului de a fi sub pragul de semnificaie sau deasupra sa. Odat cu
diseminarea pe scar larg a tehnicii de calcul i cu apariia programelor de prelucrri statistice, semnificaia
valorilor testelor statistice nu mai este cutat n tabele, ci este calculat direct i exact de ctre program,
putnd fi afiat ca atare. De aici, aa cum am mai spus, rezult i posibilitatea de a lua decizia statistic prin
compararea direct a valorii calculate a lui p cu pragul alfa critic asumat.
Eantionul cercetrii noastre a obinut medie QI=106, care s-a dovedit semnificativ. Acest lucru
nseamn c valorile inteligenei elevilor olimpici fac parte dintr-o populaie special de valori QI, care are o
medie mai mare dect media populaiei generale de elevi. Dar ct de mare este aceast medie? Media
22
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
eantionului cercetrii ne ofer o estimare a acesteia dar, ca orice estimare, conine o anumit imprecizie,
exprimat prin eroarea standard a mediei. Nu vom putea ti niciodat cu precizie care este media inteligenei
populaiei de elevi olimpici, dar teorema limitei centrale ne permite s calculm, cu o anumit probabilitate,
n ce interval se afl ea, pe baza mediei eantionului cercetrii i a erorii standard a acesteia.
Acest lucru se bazeaz pe proprietatea curbei normale de a avea un numr bine definit de valori pe
un interval simetric n jurul mediei. Astfel, dac lum pe curba normal un interval cuprins ntre z=1.96 de
o parte i de alta a mediei, tim c acoperim aproximativ 95% din valorile posibile ale distribuiei. n acest
caz, z=1.96 se numete z critic deoarece reprezint un prag limit, pe cele dou laturi ale distribuiei (care,
pentru curba normal standardizat, este 0). Alegerea acestor limite pentru z critic este convenional. Se pot
alege, la fel de bine, valori simetrice ale lui z care s cuprind ntre ele 99% sau 99.9% dintre valorile de pe
curba normal. Prin consens, ns, se consider c asumarea unui nivel de ncredere de 95% (corespunztor
pentru valori critice ale lui z=1.96) este considerat suficient pentru pstrarea unui echilibru ntre precizia
estimrii i probabilitatea estimrii. Ca urmare, n aceast condiie, putem spune c exist 95% anse ca,
avnd media unui eantion aleator, media populaiei s se afle undeva n intervalul:
n ce privete eroarea standard a mediei, aceasta este dat de raportul dintre abaterea standard a
populaiei, pe care n acest caz o cunoatem (15) i radical din volumul eantionului:
15
sm = = 2.74
30
Mai departe, utiliznd formula 3.3 pentru datele eantionului cercetrii, limitele de ncredere pentru
media populaiei mediei pot fi calculate astfel:
Ca urmare, putem afirma, cu o probabilitate de 95%, c media real a populaiei de elevi olimpici,
estimat prin media eantionului cercetrii, se afl undeva ntre 100.6 i 111.3. Acest interval a crui limit
inferioar este foarte aproape de media populaiei generale de valori QI (100), ne arat c, dei semnificativ,
diferena eantionului nostru nu are o valoare foarte ridicat. Trebuie s observm, de asemenea, c mrimea
intervalului de ncredere rezult din imprecizia mediei, exprimat prin eroarea standard a mediei. Acesta, la
rndul ei, este cu att mai mare cu ct volumul eantionului este mai mic. Desigur, cu ct limitele intervalului
de estimare sunt mai apropiate de media eantionului, cu att aceasta din urm estimeaz mai precis media
populaiei i prezint mai mult ncredere.
Aa cum am precizat mai sus, testul z poate fi utilizat doar atunci cnd cunoatem media
populaiei de referin i avem la dispoziie un eantion mare (adic de cel puin 30 de subieci, n cazul
unei variabile despre care avem motive s credem c se distribuie normal). Dar nu ntotdeauna putem avea la
dispoziie eantioane mari (minim 30 de subieci). Pentru situaiile care nu corespund acestei condiii,
testul z nu poate fi aplicat. i aceasta, pentru c distribuia mediei de eantionare urmeaz legea curbei
normale standardizate doar pentru eantioane de minim 30 de subieci, conform teoremei limitei centrale.
La nceputul secolului XX, William Gosset, angajat al unei companii productoare de bere din
SUA, trebuia s testeze calitatea unor eantioane de bere pentru a trage concluzii asupra ntregii arje. Din
considerente practice, el nu putea utiliza dect eantioane (cantiti) mici de bere. Pentru a rezolva problema,
23
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
a dezvoltat un model teoretic propriu, bazat pe un tip special de distribuie, denumit distribuie t, cunoscut
ns i ca distribuia Student, dup pseudonimul cu care a semnat articolul n care i-a expus modelul.
n esen, distribuia t este o distribuie teoretic care are toate caracteristicile unei distribuii
normale (este perfect simetric i are form de clopot). Specificul acestei distribuii const n faptul c forma
ei (mai exact, nlimea) depinde de un parametru denumit grade de libertate (df sau degrees of freedom),
care este egal cu N-1 (unde N este volumul eantionului). Acest parametru poate fi orice numr mai mare
dect 0, iar mrimea lui este aceea care definete forma exact a curbei i, implicit, proporia valorilor de sub
curb ntre diferite puncte ale acesteia. Imaginea de mai jos ilustreaz modul de variaie a nlimii
distribuiei t, n funcie de gradele de libertate.
df 31...
df = 6
df = 3
Aa cum se observ, curba devine din ce n ce mai aplatizat pe msur ce df (volumul eantionului)
este mai mic. Acest fapt are drept consecin existena unui numr mai mare de valori spre extremele
distribuiei. Nu este ns greu de observat c, pe msur ce df este mai mare, distribuia t se apropie de o
distribuie normal standard astfel nct, pentru valori ale lui N de peste 31 (df=30), aria de sub curba
distribuiei t se apropie foarte mult de valorile de sub aria curbei normale standard (z), iar scorul critic pentru
t este acelai ca i cel pentru z pe curba normal (1.96).
Din cele spuse rezult c, dac avem un eantion de volum mic (N<30), vom utiliza testul t n
loc de testul z, pe baza unei formule asemntoare:
m
t= (formula 3.4)
sm
unde:
m este media eantionului
este media populaiei
sm este eroarea standard a mediei
Interpretarea valorii lui t se face n mod similar cu cea pentru valoarea lui z, cu deosebirea c se
utilizeaz tabelul distributiei t (Anexa 2). n acest caz, valorile critice ale lui t vor fi diferite n funcie de
numrul de grade de libertate. Citind tabelul, se observ c pragurile critice ale lui t (subnelegnd
alfa=0.05, pentru test bilateral) se plaseaz la valori diferite n funcie de nivelul df. n acelai timp, dac df
este mare (peste 30), valorile tabelare ale lui t se apropie de cele ale lui z. La infinit, ele sunt identice (1.96,
la fel ca i n cazul valorilor lui z).
Date fiind caracteristicile enunate, n practic, testul t se poate utiliza i pentru eantioane mari
(N30). n nici un caz ns, nu poate fi utilizat testul z pentru eantioane mici (N<30). Utilizarea testului
bazat pe un singur eantion (fie z sau t) depinde ntr-o msur decisiv de asigurarea caracteristicii aleatoare
a eantionului.
Publicarea rezultatelor diferitelor proceduri statistice trebuie fcut astfel nct cititorii s i poat
face o imagine corect i complet asupra rezultatelor. n acest scop la publicarea rezultatelor trebuie
respectate anumite reguli, la care vom face trimitere n continuare, n legtur cu fiecare nou test statistic ce
va fi introdus.
n principiu, publicarea rezultatelor unui test statistic se poate face n dou moduri:
sintetic (de regul sub form tabelar), atunci cnd numrul variabilelor testate este relativ
mare;
24
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
narativ, atunci cnd se refer, s zicem, la o singur variabil.
n cazul testului pentru un singur eantion se vor raporta: media eantionului, media populaiei,
valoarea lui z (sau t), nivelul lui p, tipul de test (unilateral/bilateral).
Dac avem n vedere rezultatele obinute pe exemplul de mai sus, se apeleaz la o raportare de tip
narativ, care poate utiliza o formulare n maniera urmtoare: Eantionul de elevi participani la olimpiade a
obinut un scor (QI=106; 95%CI:100.6-111.3) peste media populaiei generale (QI=100). Testul z, cu alfa
0.05, a demonstrat c diferena nu este semnificativ statistic, z=+2.13, p>0.05, unilateral.
n acest exemplu de prezentare nu formularea ca atare este esenial, ci informaiile asociate
publicrii testului z. Formularea poate diferi de cea enunat, dar elementele informaionale trebuie s fie
complete. Expresia 95%CI vine de la 95% Confidence Interval i exprim intervalul de ncredere pentru
media populaiei.
Aa cum am spus mai sus, utilizarea programelor statistice ofer pentru orice valoare a lui z (sau
oricare alt test statistic) valoarea exact a lui p. Ea poate fi utilizat ca atare, pstrnd ns raportarea acesteia
la pragul de semnificaie. Orice valoare a lui p mai mare de 0.05 este considerat nesemnificativ 7, dac nu a
fost fixat un alt prag, mai sever.
La o evaluare a cunotinelor de statistic indicatorii statistici descriptivi pentru studenii din ntregul an de
studiu (populaia) sunt urmtorii:
=19.8
=3.91
N=192
Aceiai indicatori, pentru dou cele dou grupe de studiu care compun anul respectiv, sunt urmtoarele:
GR. m S N
1 18.36 4.45 32
2 20.21 3.09 31
7
Programele de prelucrri statistice utilizeaz termenul Sig. (de la significance n loc de p. Ele sunt strict
echivalente.
25
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Erori statistice; Puterea testului statistic; Mrimea efectului
S presupunem c avem un munte n care bnuim s se afl aur (populaia) i ca dorim s dovedim
prezena lui pe baza unei cantiti de pmnt extrase dintr-un loc ales la ntmplare (eantion) din acest
munte. Ipoteza de nul n acest caz afirm c aurul nu este prezent n acest munte mai mult dect n orice alt
loc. Mai departe, determinm cantitatea de aur din eantionul recoltat i descoperim o anumit concentraie
de metal preios. n final, trebuie s hotrm dac aceast concentraie difer de concentraia natural, pe
care ne putem atepta s o gsim oriunde. Dac nivelul concentraiei de aur din eantion este mai mare dect
cel al concentraiei pe care ne ateptm s gsim n cel mult 5% (pragul alfa) din eantioanele recoltate din
orice loc de pe pmnt, ales la ntmplare, atunci suntem ndreptii s concluzionm c aurul din
eantionul cercetrii nu este ntmpltor (respingem H0) i, implicit, c foarte probabil muntele nostru
conine aur ntr-o concentraie mai mare dect cea natural (acceptm H1).
Am spus mai sus foarte probabil, fiindc este evident faptul c nu putem fi absolut siguri de
rezultatul nostru. n conformitate cu legea distribuiei normale, dac am recolta la ntmplare eantioane de
pmnt, ne putem atepta s avem situaii n care concentraia de aur s fie orict de mare, fr ca acest lucru
sa nsemne neaprat c muntele (populaia cercetrii) este un zcmnt aurifer (poate exista doar o zon
limitat, cu concentraie mare, iar restul muntelui s nu conin aur). Aceasta nseamn c asumarea deciziei
cu privire la ipoteza de nul presupune implicit asumarea riscului unei anumite erori. Chiar dac respectm
rigorile raionamentului i deciziei statistice, nu avem garania c decizia noastr reflect realitatea vieii.
Cercetrile statistice au un caracter probabilist i, ca atare, conin o anumit cantitate de eroare.
Erori statistice
n raport cu realitatea vieii, decizia cu privire la ipoteza de nul poate fi corect sau greit dar, din
pcate, cercettorul care a efectuat studiul privind inteligena elevilor olimpici nu are cum s tie cu
certitudine dac decizia pe care o ia este cu adevrat corect sau este greit. O imagine sintetic, frecvent
utilizat pentru a ilustra relaiile posibile ntre decizia statistic i adevrul vieii, este prezentat n mod
clasic prin urmtorul tablou:
Adevrul vieii
(necunoscut)
H0 este adevrat H0 este fals
(olimpicii NU SUNT mai (olimpicii SUNT mai
inteligeni) inteligeni)
Acceptarea H0 1. decizie corect 4. eroare de tip II
(olimpicii NU SUNT p=1-alfa p=beta
Decizia mai inteligeni)
statistic Respingerea H0 2. eroare de tip I 3. decizie corect
(olimpicii SUNT mai P=alfa p=1-beta (power)
inteligeni)
Aa cum observm, decizia statistic este corect n dou din celulele tabelului de mai sus: celula 1,
acceptarea ipotezei de nul cnd ea este i n realitate adevrat, i celula 3, respingerea ipotezei de nul atunci
cnd ea este i n realitate fals. n acest din urm caz ne plasm ntr-o situaie statistic ideal, n care
decizia confirm ipoteza cercetrii, atunci cnd aceasta este adevrat i n viaa real. Capacitatea unui test
statistic de a susine o astfel de decizie, se numete puterea testului statistic (sau puterea cercetrii), pe
care o vom analiza pe larg puin mai trziu. La rndul lor, erorile sunt ilustrate n celelalte dou celule: celula
2, cnd respingem, ipoteza de nul, dei ea este adevrat i celula 4, cnd acceptm ipoteza de nul, dei ea
este fals. Pentru nceput, vom detalia situaiile de eroare.
n continuare, vom analiza n detaliu situaiile de eroare statistic.
26
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Eroarea de tip I
Cercettorul tie c, chiar i n cazul n care testul diferenei dintre media eantionului i media
populaiei este mai mare dect valoarea critic corespunztoare lui alfa, hazardul ar putea produce o
diferen chiar mai mare dect cea constatat, fr nicio legtur cu prezena la olimpiad. Rezult de aici c,
dac pe baza rezultatului la testul statistic respingem ipoteza de nul i acceptm c participarea la olimpiade
se asociaz cu un nivel mai ridicat al inteligenei, o facem asumndu-ne contient riscul unei erori. Dac
diferena dintre cele dou medii rezult a fi semnificativ i respingem ipoteza de nul, dei conform
adevrului vieii ea este adevrat, se comite o eroare de tip I. Probabilitatea acesteia este egal cu
valoarea pragului alfa, al crui nivel maxim acceptabil este fixat convenional la 0.05. Atunci cnd fixm
valoarea lui alfa (0.05 sau mai mic) drept criteriu de respingere a ipotezei de nul, definim, de fapt, cantitatea
de eroare pe care suntem dispui s ne-o asumm n a respinge ipoteza de nul, chiar dac n realitate aceasta
ar putea fi adevrat. Altfel spus, riscul de a decide c muntele conine un zcmnt aurifer, cnd de fapt
acest lucru nu este adevrat. Din acest motiv, eroarea de tip I se concretizeaz ntr-un rezultat fals pozitiv.
Decizia statistic se bazeaz pe msura n care eantionul reprezint n mod rezonabil caracteristicile
populaiei. Chiar dac selecia eantionului s-a fcut n condiii ideale, exist o anumit probabilitate (cu att
mai mare cu ct eantionul este mai mic) ca valorile sale s se abat de la parametrii populaiei (adevrul
vieii). Ca urmare, putem s ne imaginm o situaie n care, chiar i un eantion selecionat aleatoriu s
prezinte valori neobinuit de ndeprtate de parametrii populaiei, fr nici o legtur cu condiia cercetrii.
ntr-o astfel de situaie, supunndu-ne n mod corect regulilor convenionale ale deciziei statistice, respingem
ipoteza de nul, fcnd o eroare de tip I i asumndu-ne un rezultat fals pozitiv. Desigur, putem reduce
probabilitatea erorii de tip I prin asumarea unei valori mai mici pentru alfa dar, aa cum vom vedea mai
departe, acest lucru nu este lipsit de consecine.
Dac privim n cvadrantul 1 din tabelul de mai sus, vom observa c probabilitatea de a decide corect,
prin acceptarea ipotezei de nul atunci cnd ea este ntr-adevr adevrat este egal cu 1-alfa. Acest lucru
nseamn c prin asumarea unei valori alfa=0.05, de exemplu, avem o probabilitate de 0.95 (1-0.5) de a
accepta H0 cnd aceasta este n mod real adevrat. Din acest motiv valoarea din cadranul 1 se numete nivel
de ncredere. Ca s nelegem i mai bine, s ne imaginm c am efectua exact acelai studiu de 100 de ori,
utiliznd eantioane diferite, dar similare sub aspectul vrstei copiilor, volumului grupurilor i procedurii etc.
n cazul unei decizii statistice care respect criteriile impuse, cu alfa=0.05 (implicit, 1-alfa=0.95), ne putem
atepta ca n 5% dintre aceste cercetri (100x0.05) s respingem n mod greit ipoteza de nul (aceasta fiind,
n realitate, adevrat). Acest lucru este echivalent cu a spune c avem un nivel de ncredere de 95%
(100x0.95) s acceptm corect ipoteza de nul, dar i c avem 95% anse s acceptm o ipotez de nul care
este n realitate adevrat. Cu alte cuvinte, valoarea lui alfa ne spune care este probabilitatea de a respinge n
mod nejustificat o ipotez de nul, adevrat n viaa real, eroare pe care ns cercettorul este dispus s o
tolereze.
Eroarea de tip II
Dar dac, dei muntele la care am fcut referire conine n mod real un zcmnt de aur, iar
eantionul nostru nu conine dovada acestui fapt i ne silete s admitem ipoteza de nul? n acest caz
comitem o eroare de tip II, care descrie un rezultat fals negativ.
S presupunem c participarea la olimpiad este asociat n mod real cu un nivel de inteligen mai
ridicat dar, ca urmare a hazardului eantionrii, diferena dintre media eantionului cercetrii i media
populaiei nu atinge pragul semnificaiei statistice. Aceasta este situaia n care, dei elevii olimpici sunt mai
inteligeni, cercetarea noastr are un rezultat nesemnificativ. S nu uitm c cercettorul nu cunoate care
este adevrul vieii (dac olimpicii sunt mai inteligeni) i, drept urmare, chiar i atunci cnd admite o
ipotez de nul i asum un risc de eroare. Aceasta este o eroare de tip II, codificat cu beta. Admiterea
existenei erorii de tip II nu este lipsit de controverse. Fisher, unul dintre teoreticienii marcani ai statisticii
moderne, considera c atunci cnd nu decidem respingerea ipotezei de nul, nu decidem acceptarea ei, ci doar
consemnm eecul de a o respinge, ceea ce nu este propriu-zis o decizie. Abia mai trziu, Neyman i Egon
Pearson (fiul lui Karl Pearson, autorul coeficientului de corelaie care i poart numele) au dezvoltat teoria
modern a deciziei statistice, n prezent larg acceptat de comunitatea tiinific (B. Cohen, 2001).
Stabilirea nivelului probabilitii erorii de tip II nu este uor de neles, mai ales c ea este n legtur
cu puterea testului, probabilitatea deciziei corecte, fixat n cadranul 3 al tabelului. Aceste dou valori sunt
complementare, puterea testului fiind egal cu 1-beta. n general, o valoare acceptabil pentru eroarea de tip
27
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
II este beta=0.20, deoarece, aa cum vom vedea mai trziu, valoarea recomandabil pentru puterea testului
este 0.80.
Atunci cnd iniiaz studiul privind relaia dintre inteligen i participarea la olimpiadele colare,
cercettorul este interesat mai ales s evite admiterea ipotezei de nul atunci cnd aceasta ar fi, n realitate,
fals. Altfel spus, cercettorul este interesat cu precdere n asumarea unei valori ct mai mici pentru eroarea
de tip II (evitarea acceptrii ipotezei de nul cnd ea este fals), deoarece ar nsemna c nu poate confirma
ipoteza a cercetrii. Micorarea erorii de tip II ar nsemna ns asumarea implicit a unei valori mai mari
pentru riscul erorii de tip I. Se poate stabili o ierarhie ntre cele dou tipuri de eroare? Este una mai
periculoas dect alta? n mod obinuit, societatea i impune punctul de vedere, declarnd eroarea de tip
I ca fiind mai periculoas, prin fixarea limitei maxime pentru eroarea de tip I (alfa=0.05). Dar de ce ar fi
admiterea greit a ipotezei de nul mai rea dect respingerea ei greit? Aici trebuie s fim n consens cu
Hack (2004) care afirm c, dei exist o tendin de considerare a erorii de tip I ca fiind mai rea dect
eroarea de tip II, n realitate ambele tipuri de erori pot fi la fel de rele, prin consecinele practice care
decurg din rezultatele cercetrii.
Nu avem nici un motiv s credem c vreunul dintre cele dou tipuri de eroare este mai ru sau mai
bun dect cellalt. Dac avem n vedere un criteriu moral, nainte de toate ar trebui s nu ne asumm un
rezultat pozitiv al cercetrii, fr ca acest lucru s fie adevrat. Pe de alt parte, respingerea unui adevr
tiinific numai pentru c cercetarea nu a fost n msur s aduc dovada acestuia, este de asemenea de
nedorit. Dac am concluziona c muntele conine un zcmnt de aur, iar acest lucru s-ar dovedi fals, eroare
de tip I, ar rezulta pierderi mari de organizare a unei exploatri ineficiente. La rndul ei, o eroare de tip II,
care presupune admiterea ipotezei de nul i negarea existenei unui zcmnt real, ar conduce la pierderi prin
neexploatarea aurului existent. La fel, n plan psihologic, dac obiectul testului statistic ar fi efectul unei noi
metode de tratament psihoterapeutic, este la fel de ru s fie acceptat utilizarea ei, dei nu este eficient
(eroare de tip I), ca i respingerea utilizrii, dac ar fi eficient (eroare de tip II), deoarece pacienii sunt
lipsii de un serviciu util.
Erorile de tip I i II nu epuizeaz toate situaiile de eroare posibile ntr-o cercetare statistic. Howard
Raiffa, ntr-o lucrare clasic de teoria deciziei, a introdus noiunea de eroare de tip III (Raiffa, 1968 ).
Ulterior, acest tip de eroare a fost luat n discuie i de ali autori (Hack, 2004; Hsu, 1999), conturndu-se
dou accepiuni de baz ale termenului:
a. Respingerea corect a ipotezei de nul, urmat de atribuirea incorect a cauzei, definiie care
corespunde cu definiia iniial propus de Raiffa. n acest sens eroarea de tip III nseamn o interpretare
greit a rezultatului. Cercettorul concluzioneaz c ceva semnificativ se ntmpl i, ntr-un fel, are
dreptate, ceva se ntmpl, dar nu ceea ce crede el. Exemplul clasic este ilustrat de efectul de noutate. Dac
introducem o noua metod de antrenament bazat pe joc pentru stimularea nvrii, copiii ar putea fi atrai
de noutatea situaiei n raport cu modalitatea clasic de nvare a regulilor de circulaie. Ca urmare, un
rezultat semnificativ diferit fa de metoda utilizat pe un grup de control (care a nvat dup metoda
clasic) s-ar datora nu neaprat efectului noii metode, ci caracterului de noutate i interes pe care l prezint
aceasta. Este evident c cercettorul este nclinat s considere efectul ca fiind generat de metoda investigat,
dar acest lucru trebuie dovedit ca atare, nu este suficient s fie asumat. Efectul placebo poate fi inclus de
asemenea n categoria erorilor de tip III, dar nu toate erorile de tip III sunt de tip placebo.
Nu exist metode statistice pentru eliminarea erorii de tip III, n aceast accepie. Singura protecie
vine dinspre calitatea modelului de cercetare. Pentru evaluarea efectului placebo, de exemplu, studiile
medicale prevd protocoale de tip dublu orb, n care nici cei care administreaz medicamentul i nici
pacienii nu tiu dac dau/iau medicamentul supus cercetrii sau un placebo.
b. A doua definiie a erorii de tip III este similar cu prima, dar este diferit sub un aspect esenial.
n acest caz rezultatul cercetrii conduce la confirmarea unui efect sau relaii ntre variabile, dar sensul
(direcia) efectului este greit interpretat. Dac revenim la exemplul anterior, ne putem imagina c rezultatele
cercetrii susin concluzia c efectul noii metode de nvare este superior celei vechi dei, n realitate,
situaia st exact invers, concluzia fiind greit. n aceast accepie, probabilitatea erorii de tip III este
codificat cu litera (gamma), iar unele programe statistice sunt capabile s o estimeze. Evident, eroarea de
tip III se poate manifesta numai n cercetri de tip experimental, singurele care permit concluzii de natur
cauzal.
28
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Conceptul de eroare de tip III este fundamental diferit de celelalte dou tipuri de erori. Existena lui
vine s ne aduc aminte c cercetarea tiinific vizeaz n ultim instan un adevr al realitii, care nu este
complet demonstrat de raionamentul decizional statistic, bazat pe atitudinea fa de ipoteza cercetrii i
admiterea sau respingerea ipotezei de nul. Principala lui utilitate este aceea c ne atrage atenia asupra
vulnerabilitii cercetrilor statistice, subliniind relativitatea acestora i faptul c simpla declarare drept
semnificativ a rezultatului unei cercetri nu probeaz n mod suficient adevrul ipotezei i nici nu reflect n
mod sigur realitatea. Existena erorii de tip III este unul din argumentele mpotriva asumrii simpliste a
rezultatelor statistice pe baza deciziei cu privire la ipoteza de nul. Mijlocul esenial de protecie mpotriva
erorii de tip III este stabilitatea rezultatelor de la o cercetare la alta, replicabilitatea lor, care nseamn
obinerea acelorai rezultate la repetarea studiului n aceleai condiii.
Puterea testului
Puterea testului este definit prin capacitatea sau sensibilitatea unui test statistic de a detecta un
efect real (sau o legtur real) ntre variabile. nelegem prin efect real faptul c modificri ale valorilor
unei variabile se regsesc n modificri ale valorilor celeilalte variabile (indiferent dac relaia este de tip
cauzal sau de tip asociativ). Formulat n termeni statistici, puterea testului este probabilitatea de a respinge
ipoteza de nul atunci cnd ea este cu adevrat fals, i se exprim ca 1-beta (probabilitatea erorii de tip II).
Aceast situaie corespunde celei mai bune decizii pe care i-o poate dori un cercettor: s dovedeasc c
ipoteza a cercetrii este realmente adevrat. Dac n viaa real ipoteza de nul este fals, dar datele cercetrii
ne oblig totui s o acceptm, atunci putem spune c cercetarea noastr a avut o putere insuficient pentru a
determina respingerea ei i, implicit, confirmarea ipotezei cercetrii.
Aa cum am vzut, eroarea de tip II i puterea testului sunt complementare. Ca urmare, putem
calcula eroarea de tip II ca beta=1-puterea testului. Cu alte cuvinte, cu ct puterea testului este mai mare, cu
att probabilitatea erorii de tip II (acceptarea nejustificat a ipotezei de nul) este mai mic. Dac presupunem
c puterea unui experiment psihologic este de 0.85, rezult c probabilitatea erorii de tip II este 1-0.85, adic
0.15. Complementar, dac puterea experimentului (cercetrii) ar fi de 0.15, atunci probabilitatea erorii de tip
II s-ar ridic la 1-0.15, adic 0.85.
Puterea testului statistic sau, la fel de bine spus, a cercetrii, poate fi calculat matematic.
Introducerea procedurilor de calcul pentru puterea testului este dincolo de obiectivele pe care ni le propunem
aici, mai ales c ele nu se regsesc n pachetele obinuite de analiz statistic. Vom reine ns, o serie de
metode prin care poate fi asigurat creterea puterii testelor statistice, aa cum sunt ele sintetizate n literatura
statistic (B. Cohen, 2004, Spata, 2003):
1. Aa cum tim, eroarea standard a mediei este cu att mai mare cu ct eantionul este mai mic. Ca
urmare, una din modalitile prin care putem crete puterea este creterea volumului eantionului
(N).
2. O cale de cretere a puterii este maximizarea variabilitii primare, aceea care decurge ca urmare
a efectului unei variabile asupra celeilalte. Aceasta deoarece efectul variabilei independente
se manifest mai puternic pe grupurile de subieci aflate la extremitile scalei de msurare a
variabilei dependente dect pe valorile ntregii scale. Dac mprtierea datelor de cercetare este
mic, atunci puterea testului de a surprinde un efect semnificativ se reduce.
29
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
3. Reducerea erorilor de msurare are ca efect mrirea puterii cercetrii. n acest scop trebuie avute
n vedere: utilizarea unor proceduri de investigare adecvate; controlul i eliminarea surselor de
eroare; tratarea identic a tuturor subiecilor cercetrii; selectarea aleatoare a eantioanelor sau,
n cazul unei eantionri nealeatoare, eliminarea surselor de selecie prtinitoare (bias).
4. Modelul de cercetare, prin el nsui, este cel care poate crete puterea unui studiu. De exemplu,
modelele de cercetare within-subjects (intra-subiect), care msoar aceiai subieci n condiii
diferite, au mai mult putere dect modelele between-subjects (inter-subiect), n care sunt
comparate grupuri de subieci diferii n condiii diferite.
5. Testul bilateral reduce probabilitatea erorii de tip I, dar crete probabilitatea erorii de tip II i,
implicit, reduce puterea. Ca urmare, ori de cte ori este justificabil, se va opta pentru test
unilateral, chiar dac, n practic, testul bilateral este cel uzual.
6. Testele parametrice prezint o putere statistic mai mare dect cele neparametrice, motiv pentru
care, utilizarea acestora din urm se va face doar atunci cnd este absolut necesar (n
conformitate cu condiiile de aplicare). Nu se va renuna cu uurin la un test parametric, dac
datele cercetrii sunt msurate pe scal cantitativ.
Nu trebuie s nelegem ns, c asigurarea unei puteri ct mai mari este principalul obiectiv pentru
un cercettor. Prea mult putere este tot att de nedorit ca i prea puin. Dac avem n vedere
intercondiionrile din procesul deciziei statistice, atunci trebuie s observm c prin creterea puterii
reducem probabilitatea erorii de tip II, dar cretem probabilitatea erorii de tip I. Cu alte cuvinte, dac un
studiu are o putere mare, de exemplu prin utilizarea unui eantion foarte mare, atunci crete probabilitatea de
a respinge ipoteza de nul, chiar dac aceasta este adevrat. Ne aflm aici n situaia care a generat critici
vehemente cu privire la cercetrile statistice, i care a fost exprimat n maniera cea mai direct de
Thompson (1998a) ... testul statistic devine o cutare tautologic pentru suficieni participani n msur s
ating semnificaia statistic.
Calitatea deciziei unei cercetri reprezint rezultatul unei negocieri ntre nivelul acceptat pentru
erorile de tip I i II. Cu ct prima este mai mic, cu att a doua este mai mare, i invers. S presupunem c
studiul privind inteligena olimpicilor este efectuat n mod identic de doi cercettori, dar unul dintre ei
fixeaz nivelul lui alfa la 0.05, iar al doilea, la 0.01. Dac n urma prelucrrii datelor rezultatului obinut i
corespunde un p=0.03, primul cercettor va respinge ipoteza de nul, confirmnd ipoteza cercetrii, n timp ce
al doilea va fi nevoit s admit ipoteza de nul i s resping ipoteza cercetrii. Prin fixarea unui nivel mai
redus pentru alfa, al doilea cercettor a redus probabilitatea erorii de tip I, dar a redus i puterea testului,
mrind n schimb riscul erorii de tip II (respingerea unei ipoteze de cercetare adevrate).
n concluzie, atunci cnd fixm criteriile de decizie statistic trebuie s fim contieni de urmtoarele
aspecte:
cu ct este mai mic pragul alfa, cu att puterea testului este mai mic i invers, cu ct alfa este
mai mare, cu att puterea testului este mai mare;
cu ct alfa este mai mic, cu att scade probabilitatea erorii de tip I (respingerea ipotezei de nul
cnd aceasta este adevrat);
cu ct alfa este mai mic, cu att testul este mai riguros, probabilitatea de a confirma ipoteza
cercetrii dac este fals, fiind mai mic;
un prag alfa de 0.01 (comparat cu 0.05 sau 0.1) nseamn c cercettorul este precaut, dorind s
i asume un risc de a grei de 1 dintr-o sut de cazuri atunci cnd respinge ipoteza de nul, dac
aceasta este adevrat;
un prag alfa de 0.01 nseamn c exist 99% anse de a decide c nu exist diferene atunci cnd
acestea ntr-adevr nu exist;
mrind nivelul lui alfa (de la 0.01 la 0.05 sau 0.1), cretem riscul de a face o eroare de tip I i
reducem riscul de a face o eroare de tip II, ceea ce nseamn i o reducere a rigorii testului;
n egal msur, dac mrim pragul alfa, de la 0.01, la 0.05 sau 0.1, mrim puterea, deoarece
cretem probabilitatea de respingere a ipotezei de nul (acceptnd ipoteza cercetrii), atunci cnd
aceasta din urm este adevrat (eroare de tip I);
Din cele spuse s-ar putea deduce c, dac ne propunem cea mai mare valoare pentru puterea testului,
atunci singura opiune pe care o avem este s fixm pragul alfa la nivelul maxim permis de convenia
tiinific (0.05). n realitate, problema nu este att de simpl, deoarece obiectivul unei cercetri nu se poate
limita doar la atingerea pragului de semnificaie. Aa cum am vzut, acesta poate fi atins prin mrirea
volumului eantionului, iar simpla constatare a unui rezultat semnificativ nu ne spune nimic despre
30
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
intensitatea relaiei dintre variabilele studiate, despre importana practic i despre utilitatea rezultatului
obinut.
Cunoaterea puterii unei cercetri este util n dou situaii:
a. n faza premergtoare a unei cercetri estimarea puterii este util pentru a evalua ansa de a
obine un rezultat semnificativ statistic n contextul unei cercetri. Dac puterea estimat a testului este prea
mic, devine lipsit de interes s angajm eforturi i costuri pentru conducerea acelei cercetri. Ct de mic
poate fi puterea unei cercetri pentru a accepta efectuarea ei? La aceasta ntrebare cei mai muli cercettori
consider c 0.5 este prea puin pentru a investi timp i bani n efectuarea ei. O putere de 0.7, care
corespunde unei probabiliti de 0.3 pentru eroarea de tip II, este considerat ca fiind minim, iar o putere de
0.8 este considerat cel mai bun compromis ntre nivelul puterii i consecinele negative de care am vorbit
anterior (B. Cohen, 2001).
b. Dup efectuarea unei cercetri, pentru a ti care este probabilitatea ca rezultatul acesteia s
indice un efect al variabilei independente asupra variabilei dependente atunci cnd acest efect exist i n
realitate.
n practic calcularea puterii unei cercetri se face cu programe specializate. Unul dintre cele mai
accesibile i mai cunoscut dintre acestea este GPower, care poate fi descrcat gratuit de la adresa
http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/ (Buchner, Erdfelder & Faul, 1997).
Mrimea efectului
Problema semnalat este mai acut dect pare la prima vedere. Criticii deciziei bazate pe testarea
ipotezei de nul merg pn acolo nct cer eliminarea acestui model de decizie cu privire la ipotezele
cercetrilor tiinifice. La rndul ei, American Psychological Association a organizat un grup de lucru avnd
ca obiect elaborarea unor recomandri cu privire la raportarea rezultatelor statistice (Wilkinson&APA Task
Force on Statistical Inference, 1999). Concluziile acestui grup de lucru stipuleaz c raportarea i
interpretarea mrimii efectului (...) este esenial pentru o cercetare bun. n opinia autorilor, raportarea i
interpretarea mrimii efectului prezint trei avantaje importante:
faciliteaz studiile de metaanaliz (studii care sintetizeaz rezultatele mai multor cercetri pe
aceeai tem);
faciliteaz formularea unor ipoteze cu un grad mai mare de specificitate de ctre cercettorii care
vor studia aceeai tem;
faciliteaz integrarea rezultatului unei cercetri n literatura dedicat acelui subiect,
31
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Una dintre soluiile acestei probleme este calcularea unui indice de mrime a efectului care ofer o
informaie suplimentar, extrem de util n interpretarea rezultatului testelor statistice. Aceast informaie ne
apropie mai mult de semnificaia practic a rezultatului cercetrii, ceea ce nseamn mai mult dect
semnificaia statistic.
Indicele de mrime a efectului este, n esen, o valoare numeric ce exprim fora sau mrimea
relaiei dintre variabilele cercetate, indiferent dac aceast este de tip cauzal sau nu. Principial, atunci cnd
comparm dou medii, formula de calcul pentru mrimea efectului se bazeaz pe diferena dintre aceste
medii, raportat la un indicator al variabilitii.
n cazul testului z sau t pentru diferena dintre media unui eantion i media populaiei, indicele de
mrime a efectului se calculeaz dup formula lui Cohen (1988):
m
d= (formula 3.5)
unde:
m=media eantionului
=media populaiei
=abaterea standard a populaiei (atunci cnd nu o cunoatem, putem utiliza abatarea
standard a eantionului)
Ca urmare, mrimea efectului pentru rezultatul cercetrii cu privire la relaia dintre participarea la
olimpiadele colare i nivelul inteligenei este:
106 100
d= = 0.4
15
Dat fiind faptul c d este calculat prin raportarea diferenei la abaterea standard, el este considerat un
indice standardizat al mrimii efectului. Acesta se exprim printr-un numr zecimal cuprins ntre 0 (efect
nul) i 1 (efect maxim). Valori mai mari de 1 pot fi obinute uneori, dar numai n cazuri extreme. Valorile
mici exprim un nivel redus al intensitii relaiei dintre variabile (chiar dac este semnificativ), n timp ce
valorile mari indic o relaie intens (puternic).
Dar cum putem s interpretm valoarea lui d? O valoare ca cea obinut n cercetarea noastr este
mare, sau mic? n cazul explorrii zcmntului aurifer, geologii pot estima suficient de exact
cantitatea de aur pe care o pot extrage din zcmnt, pornind de la concentraia de aur din eantionul
explorat. n general, evalurile mrimii efectului n mediul ingineresc sunt de ateptat s fie mult mai mari
dect cele din cercetrile socio-umane. Spre deosebire de tiinele naturii, n psihologie rspunsul la aceast
ntrebare nu este uor de gsit. Ca urmare cercettorii sunt ndreptii s dezvolte propriile repere de
apreciere a mrimii efectului ca fiind mici, medii sau mari. n psihologie, interpretarea valorii lui d se
face dup un model propus de Cohen (op.cit.), care a devenit un standard preluat de toi cercettorii, i care
fixeaz doar trei praguri de mrime:
n conformitate cu recomandrile lui Cohen, d=0.8 este considerat un efect mare. Nu att de mare
nct s rezulte ca evident prin observaie direct, dar suficient de mare pentru a exista o bun ans de a fi
gsit ca statistic semnificativ prin utilizarea unui eantion format dintr-un numr relativ mic de subieci. Prin
contrast, d=0.2 este considerat un efect mic. Pentru valori mai reduse dect att, iniierea unei cercetri nu se
justific.
Revenind la studiul din exemplul nostru, rezultatul obinut corespunde unui nivel moderat al mrimii
efectului (d=0.4). Sau, altfel spus, diferena dintre media inteligenei elevilor olimpici i populaia de elevi
32
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
are un indice moderat de mrime. Acest lucru ar putea fi interpretat n sensul c prezena la olimpiad este
asociat n mod semnificativ cu inteligena, dar are i alte componente importante care o determin.
Calcularea mrimii efectului nu este oferit n toate situaiile de programele de prelucrare statistic.
Din fericire, formulele de calcul nu sunt laborioase, putnd fi aplicate cu uurin pe rezultatele oferite de
aceste programe. O prezentare sintetic i practic a formulelor de calcul ale mrimii efectului pentru diverse
teste statistice de semnificaie ne ofer Thalheimer&Cook (2002).
Mrimea efectului poate fi ilustrat prin gradul de suprapunere dintre distribuiile supuse comparaiei
(distribuia de nul i distribuia cercetrii). Cu ct suprafaa comun a celor dou distribuii este mai mic,
mediile celor dou distribuii devin tot mai ndeprtate una de alta, iar mrimea efectului crete. Imaginea de
mai jos ilustreaz exact acest lucru:
n acelai timp, pe msur ce crete mrimea efectului, crete i puterea testului (concomitent cu
reducerea riscului erorii de tip II):
n contextul celor spuse pn acum, pentru a putea interpreta mai complet rezultatele unei cercetri
statistice, trebuie s inem cont att de nivelul de semnificaie, ct i de puterea testului i de mrimea
efectului. Un algoritm de evaluare a rezultatului la testul statistic este prezentat n tabloul urmtor:
33
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Rezultat
semnificativ Volumul
Concluzii
statistic? eantionului
(se respinge H0?)
Rezultat important.
Chiar dac puterea testului este mic, din cauza volumului
DA MIC
redus al eantionului, existena unui rezultat semnificativ
arat o mrime a efectului important.
Rezultatul poate fi important sau nu:
semnificaia poate rezulta din puterea ridicat a
testului, ca urmare a volumului mare al eantionului
DA MARE
SAU
poate fi expresia unei diferene importante dintre
populaiile comparate
Rezultatul este neconcludent. Absena semnificaiei
statistice se poate datora:
faptului c ipoteza cercetrii este fals
NU MIC
SAU
puterii reduse a testului, ca urmare a eantionului prea
mic
Ipoteza cercetrii este probabil fals din cauz c, n ciuda
puterii ridicate (eantion mare), rezultatul nu a atins nivelul
NU MARE
semnificaiei statistice.
Mrimea efectului este foarte mic
Scorul standard z exprim distana dintre o valoare a distribuiei i media acesteia, exprimat n
abateri standard
Media scorurilor z ale unei distribuii este ntotdeauna egal cu 0.
Abaterea standard a scorurilor z ale unei distribuii este ntotdeauna egal cu 1.
Alte tipuri de scoruri standard (QI, T, Hull, SAT, etc.) se calculeaz pe baza formulei scorului z,
urmrind obinerea unei valori convenabile sub aspectul formei de expresie.
Curba normal (Gauss) este o distribuie teoretic, caracteristic populaiilor de valori, care are o
form de clopot, este perfect simetric i asimptotic la axa Ox (poate lua, toretic, valori orict de
mari sau orict de mici).
Curba normal z, reprezint o distribuie normal (Gauss) transformat n scoruri z. Aceasta poate
exprima orice distribuie, indiferent de forma de exprimare a valorilor originale.
Distribuiile reale, transformate n distribuii z, nu i modific forma original.
Distribuia de eantionare este format din totalitatea mediilor eantioanelor de acelai volum
posibile, extrase aleatori dintr-o populaie.
Media de eantionare este egal cu media populaiei, dac au fost extrase toate eantioanele posibile.
Eroarea standard a mediei este indicatorul de mprtiere ale mediei de eantionare.
Eroarea standard a mediei este ntotdeauna mai mic dect abaterea standard a populaiei.
Teorema limitei centrale stipuleaz c distribuia de eantionare tinde spre forma normal, atunci
cnd eantioanele extrase sunt suficient de mari (N este cel puin 30).
Facem precizarea c n acest context eantion mic sau mare nu se refer la N=30 de subieci la care am fcut
referire n cazul teoremei limitei centrale. Se poate considera ns un eantion mic ca fiind de ordinul zecilor, iar unul
mare de ordinul sutelor.
34
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Scorul z pentru eantion (grup), se calculeaz n acelai mod ca i pentru valori individuale, cu
deosebirea c n locul abaterii standard, se utilizeaz la numitor eroarea standard a mediei.
Limitele de ncredere ale mediei unui eantion estimeaz, cu o anumit probabilitate, localizarea
mediei la nivelul populaiei, n funcie de media eantionului.
Ipoteza cercetrii descrie rezultatul ateptat de cercettor la problema studiat.
Ipoteza de nul reprezint negaia ipotezei cercetrii i face obiectul testrii printr-o anumit
procedur statistic.
Decizia statistic este un raionament n baza cruia se admite sau se respinge ipoteza de nul.
Pragul alfa este probabilitatea maxim ca rezultatul procedurii de tastare statistic s poat fi
ntmpltor, pe care o fixeaz cercettorul drept criteriu de respingere sau de acceptare a ipotezei de
nul.
Pragul alfa=0.05 este nivelul maxim de probabilitate convenional acceptat de comunitatea
tiinific pentru respingerea ipotezei de nul.
Decizia unilateral testeaz ipoteza statistic numai spre o latur a distribuiei. Decizia bilateral
testeaz ipoteza n ambele direcii, cu meninerea pragului alfa stabilit.
Eroarea de tip I este probabilitatea de a respinge o ipotez de nul adevrat (se accept o ipotez a
cercetrii care este fals) rezultat fals pozitiv.
Eroarea de tip II este probabilitatea de a se admite o ipotez de nul fals (se respinge o ipotez a
cercetrii adevrat) rezultat fals negativ.
O eroare de tip III apare atunci cnd rezultatul cercetrii, dei semnificativ, este greit atribuit
efectului variabilei independente, sau este n opoziie cu sensul real.
Erorile de tip I i II sunt n egal msur negative dar, de regul, acordm mai mult atenie erorii de
tip I, ncercnd s inem alfa la o valoare ct mai mic.
Puterea testului este o mrime probabilist care indic ansa de a obine un rezultat semnificativ
statistic.
Puterea variaz n funcie de nivelul pragului alfa (eroarea de tip I). Cu ct alfa este mai mic, cu att
puterea testului scade.
Dac reducem alfa de la 0.05 la 0.01, reducem probabilitatea de a face o eroare de tip I dar, n acelai
timp, facem mai dificil respingerea ipotezei de nul i, n egal msur, cretem probabilitatea de a
face o eroare de tip II.
Puterea testului este complementar erorii de tip II (suma lor este 1).
Mrimea efectului este o valoare care indic intensitatea relaiei dintre variabila independent i
variabila dependent.
Mrimea efectului este n legtur cu puterea testului i cu volumul eantionului. Cu ct puterea este
mai mare i eantionul este mai mic, cu att mrimea efectului este mai ridicat.
Calcularea mrimii efectului, alturi de semnificaia statistic, este o exigen actual n cercetarea
tiinific psihologic.
Aten ie, calculai utiliznd numai primele dou zecimale, fr rotunjiri. Eventuale mici
varia ii ale rezultatelor sunt posibile i nu vor fi considerate erori.
1. z=(60-55)/(25/sqrt(30))=1,09
35
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
2. 36,21% (citit direct din tabelul distribu iei z, la intersec ia liniei z=1 cu coloana 0,09)
3. 50%-36,21%=13,79%
4. (50+36,21)=86,21% (procentul sub medie+procentul intre medie si z=1.09)
5. Calculam mai nti z53=(53-55)/(25/sqrt(30))=-0,65; Apoi cutm n tabelul z probabilitatea
la intersec ia liniei 0,6 cu coloana 0,05 i gsim p=0,24215. Aceast valoare reprezint
probabilitatea dintre medie (z=0) i valoarea z=-0,65. Pentru a gsi probabilitatea unei
valori mai mari de 53, adunm probabilitatea valorilor peste medie (0.50) cu probabilitatea
valorilor dintre -0,65 i medie (0,24215)=0,74215 (tabelul este simetric atit pentru valori
pozitive ct i pentru valori negative).
6. Calculm z40=(40-55)/(25/sqrt(30))=-1,09. Probabilitatea valorilor dintre mdie i -1,09 este
0,36214., iar probabilitatea valorilor mai mici (adic mai ndeprtate de medie) este 50-
0,36214=0,13786
7. Calculam mai nti z45=(45-55)/(25/sqrt(30))=-2,18 i notm probabilitatea
asociat=0,48537; Calculm apoi z48==(48-55)/(25/sqrt(30))=-1,53 i notm probabilitatea
asociat=-0,43699. Diferenta dintre aceste probabilit i este rspunsul cutat: p=0,04838
8. Tabelul z ne da probabilit ile dintre medie i o anumit valoare z. Primii 10%
nseamn cele mai mari 10% dintre valori, ceea ce nseamn c ntre acestea i medie se
afl 40%. Citim celulele tabelului z pn gsim cea mai apropiat cea mai apropiat valoare
de 0,40 (0,39973). Apoi compunem scorul z limit din valorile liniei i coloanei (z=1,28).
n final, trebuie s transformm scorul z n unit ile de msur ale scalei:
X=55+1,28*25=87 (am adunat fiindc calculm n dreapta mediei).
9. Tabelul z ne da probabilit ile dintre medie i o anumit valoare z. Ultimii 15%
nseamn cele mai mici 15% dintre valori, ceea ce nseamn c ntre acestea i medie se
afl 35%. Citim celulele tabelului z pn gsim cea mai apropiat cea mai apropiat valoare
de 0,35 (0,35083). Apoi compunem scorul z limit din valorile liniei i coloanei (z=1,04).
n final, trebuie s transformm scorul z n unit ile de msur ale scalei: X=55-
1,04*25=29 (am sczut fiindc calculm n stnga mediei).
36
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
TESTE STATISTICE PARAMETRICE
Testul z (t) pentru un singur eantion este util ntr-un model de cercetare n care ne propunem
compararea valorii msurate pe un eantion cu media populaiei din care acesta provine. Aa cum am
precizat deja, acest tip de cercetare este destul de rar ntlnit, ca urmare a dificultii de a avea acces la media
populaiei.
Un model de cercetare mult mai frecvent ns, este acela care vizeaz punerea n eviden a
diferenelor care exist ntre dou categorii de subieci (diferena asumrii riscului ntre brbai i femei,
diferena dintre timpul de reacie al celor care au consumat o anumit cantitate de alcool fa de al celor
care nu au consumat alcool etc.). n situaii de acest gen psihologul compar mediile unei variabile
(preferina pentru risc, timpul de reacie etc.), msurat pe dou eantioane compuse din subieci care difer
sub aspectul unei alte variabile (sexul, consumul de alcool, etc.). Variabila supus comparaiei este variabila
dependent, deoarece presupunem c suport efectul variabilei sub care se disting cele dou eantioane i
care, din acest motiv, este variabil independent 8. n studii de acest gen, eantioanele supuse cercetrii se
numesc independente, deoarece sunt constituite, fiecare, din subieci diferii.
S ne imaginm c dorim s vedem dac un lot de sportivi, trgtori la int, care practic trainingul
autogen 9 (variabila independent) obin o performan (variabila dependent) mai bun dect un lot de
sportivi care nu practic aceast tehnic de autocontrol psihic. n acest caz, variabila dependent ia valori
prin evaluarea performanei de tragere, iar variabila independent ia valori convenionale, pe o scal
nominal categorial, dihotomic (practicani i nepracticani de edine de relaxare).
n acest exemplu avem dou eantioane de cercetare, unul format din sportivi practicani ai
trainingului autogen (TA) i altul format din sportivi nepracticani ai TA. Ipoteza cercetrii susine c media
performanei celor dou grupuri este diferit. Sau, cu alte cuvinte, c cele dou grupuri provin din populaii
diferite, respectiv, populaia sportivilor practicani de TA i cea a nepracticanilor de TA. Trebuie s
8
Am pus cuvntul efect ntre ghilimele deoarece, chiar dac este logic s considerm c este vorba de o relaie de tip
cauz-efect, simpla msurare a diferenelor pe dou eantioane de subieci nu este suficient pentru a concluziona o
relaie cauzal. Pentru aceasta, ar fi mai potrivit, spre exemplu, s msurm timpul de reacie la aceiai subieci nainte
i dup consumarea unei cantiti de alcool.
9
O metod de relaxare psihic
37
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
acceptm faptul c perechea de eantioane studiate nu este dect una din perechile posibile. S privim figura
de mai jos, care ne sugereaz ce se ntmpl dac, teoretic, am extrage (selecta) n mod repetat de eantioane
perechi din cele dou populaii:
Imaginea arat faptul c, pe msur ce constituim perechi de eantioane (m11-m21, etc.) cu valori ale
performanei la int, diferena dintre medii devine o distribuie n sine, format din valorile acestor diferene.
Dac am reui constituirea tuturor perechilor posibile de eantioane, aceast distribuie, la rndul ei, ar
reprezenta o nou populaie, populaia diferenei dintre mediile practicanilor i nepracticanilor de training
autogen. i, fapt important de reinut, curba diferenelor dintre medii urmeaz legea distribuiei t. Cu alte
cuvinte, la un numr mare (tinznd spre infinit) de eantioane perechi, trebuie s ne ateptm ca cele mai
multe medii perechi sa fie apropiate ca valoare, diferena dintre mediile fiind, ca urmare, mic, tinznd spre 0
i ocupnd partea central a curbei. Diferenele din ce n ce mai mari fiind din ce n ce mai puin probabile,
vor ocupa marginile distribuiei (vezi figura de mai jos). Aceasta este ceea ce se numete distribuia
ipotezei de nul pentru diferena dintre mediile a dou eantioane independente.
(m1-1 m2-1)
1-2 = 0
n acest moment este bine s accentum din nou semnificaia statistic a noiunii de populaie. Dup
cum se observ, aceasta nu face referire neaprat la indivizi, ci la totalitatea valorilor posibile care descriu o
anumit caracteristic (psihologic, biologic sau de alt natur). n cazul nostru, diferenele dintre mediile
eantioanelor perechi (fiecare provenind dintr-o populaie fizic distinct) devin o nou populaie, de
aceast dat statistic, compus din totalitatea diferenelor posibile, a crei distribuie se supune i ea
modelului curbei t.
Procedura statistic pentru testarea semnificaiei diferenei dintre mediile a dou eantioane
Problema pe care trebuie s o rezolvm este urmtoarea: este diferena dintre cele dou eantioane
suficient de mare pentru a o putea considera c este n legtur cu variabila independent, sau este doar una
dintre diferenele probabile, generat de jocul hazardului la constituirea perechii de eantioane? Vom observa
c sarcina noastr se reduce, de fapt, la ceea ce am realizat anterior n cazul testului z sau t pentru un singur
eantion. Va trebui s vedem dac diferena dintre dou eantioane reale se distaneaz semnificativ de
diferena la care ne putem atepta n cazul extragerii absolut aleatoare a unor perechi de eantioane, pentru
care distribuia diferenelor este normal. Mai departe, dac probabilitatea de a obine din ntmplare un
38
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
astfel de rezultat (diferen) este prea mic (maxim 5%) o putem neglija i accepta ipoteza c ntre cele dou
variabile este o relaie semnificativ.
Dac avem valoarea diferenei dintre cele dou eantioane cercetate, ne mai sunt necesare doar
media populaiei (de diferene ale mediilor) i abaterea standard a acesteia, pentru a calcula testul z (n cazul
eantioanelor mari) sau cel t (n cazul eantioanelor mici). n final, nu ne rmne dect s citim valoarea
tabelar pentru a vedea care este probabilitatea de a se obine un rezultat mai bun (o diferen mai mare ) pe
o baz strict ntmpltoare.
Media populaiei de diferene. Diferena dintre mediile celor dou eantioane ale cercetrii face
parte, aa cum am spus, dintr-o populaie compus din toate diferenele posibile de eantioane perechi.
Media acestei populaii este 0 (zero). Atunci cnd extragem un eantion aleator dintr-o populaie, valoarea sa
tinde s se plaseze n zona centrala cea mai probabil). Dar aceeai tendin o va avea i media oricrui
eantion extras din populaia pereche. Ca urmare, la calcularea diferenei dintre mediile a dou eantioane,
cele mai probabile sunt diferenele mici, tinznd spre zero. Astfel, ele vor ocupa partea central a distribuiei,
conturnd o medie tot mai aproape de zero cu ct numrul eantioanelor extrase va fi mai mare.
Eroarea standard a diferenei (mprtierea), pe care o vom nota cu m1-m2, se calculeaz pornind
de la formula de calcul a erorii standard:
m = (formula 3.6)
N
Din raiuni practice, pentru a obine o formul care s sugereze diferena dintre medii (m1-m2),
formula de mai sus este supus unor transformri succesive. Prin ridicarea la ptrat a ambilor termeni, i
dup extragerea radicalului din noua expresie, se obine:
2
(formula 3.7)
m =
N
Dac am utiliza-o pentru calcule, aceast ultim formul ar produce acelai rezultat ca i formula de
origine.
Formula erorii standard a distribuiei diferenei dintre medii ne arat ct de mare este mprtierea
diferenei tipice ntre dou medii independente atunci cnd eantioanele sunt extrase la ntmplare
12 22 (formula 3.8)
m1 m 2 = +
N1 N2
Formula 3.8 ne indic faptul c eroarea standard a diferenei dintre medii este dat de suma erorii
standard a celor dou eantioane. Unul dintre eantioane are N1 subieci i o dispersie 12 iar cellalt
eantion, N2 subieci i dispersia 22. Faptul c obinem eroarea standard a diferenei dintre medii ca sum a
erorilor standard a celor dou eantioane este fundamentat pe o lege statistica a crei demonstraie nu se
justific aici.
Pentru a calcula scorul z al diferenei, vom utiliza o formul asemntoare cu formula notei z pe care
o cunoatem deja:
m
z=
m
Aceasta va fi:
( m1 m2 ) ( 1 2 )
z= (formula 3.9)
m1 m 2
Numrtorul exprim diferena dintre diferena obinut de noi (m1-m2) i diferena dintre mediile
populaiilor (1-2). Dac ne amintim c distribuia ipotezei de nul (1-2) are media 0, atunci deducem c
expresia (1-2) poate lipsi. De altfel, dac am cunoate mediile celor dou populaii nici nu ar mai fi
necesar calcularea semnificaiei diferenei dintre eantioanele care le reprezint.
39
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Numitorul descrie eroarea standard a diferenei, calculat cu formula 3.7, adic mprtierea
diferenei tipice pentru extrageri aleatoare.
n conformitate cu cele spuse pn acum, formula final pentru scorul z al diferenei dintre dou
eantioane devine :
m1 m 2
z=
12 22 (formula 3.10)
+
N1 N2
Acesta se bazeaz pe considerarea separat a dispersiilor celor dou populaii (estimate prin
dispersiile eantioanelor). Formula este foarte asemntoare cu formula anterioar pentru testul z. Vom
reine aceast formul ca testul t pentru dispersii diferite:
m1 m2 (formula 3.11)
t=
2 2
s1 s
+ 2
N1 N 2
Se observ nlocuirea lui (pentru populaie) cu s (pentru eantion). Utilizarea acestei formule este
destul de controversat deoarece rezultatul nu urmeaz cu exactitate distribuia t, aa cum am introdus-o
anterior. Pentru eliminarea acestui neajuns, se utilizeaz o alt variant de calcul, care ia n considerare
dispersia cumulat a celor dou eantioane.
Dispersiile celor dou eantioane pot fi considerate mpreun pentru a forma o singur estimare a
dispersiei populaiei (2). Obinem astfel ceea ce se numete dispersia cumulat, pe care o vom nota cu s2c
i o vom calcula cu formula urmtoare:
2 2
( N 1) * s1 + ( N 2 1) * s 2
s 2
c = 1 (formula 3.12)
N1 + N 2 2
40
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
m1 m2 (formula 3.13):
t=
( N1 1) * s1 + ( N 2 1) * s2 1 1
2 2
* +
N1 + N 2 2 N
1 N 2
Expresia 3.13 este formula uzual pentru calcularea diferenei dintre medii pentru dou eantioane
independente. Chiar dac a fost introdus ca utilizabil pentru eantioane mici, caracteristicile distribuiei t
ne permit utilizarea ei i pentru eantioane mari, deoarece distribuia t tinde spre cea normal la valori din ce
n ce mai mari ale gradelor de libertate.
EXEMPLU DE CALCUL:
41
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Datele cercetrii
practicani TA (1) ne-practicani TA (2)
X1 (X1-m1)2 X2 (X2-m2)2
15 2.78 10 2.78
9 18.74 8 0.10
12 1.76 11 7.12
13 0.10 5 11.08
16 7.12 7 1.76
15 2.78 9 0.44
80 33.28 50 23.28
N 6 6
m 13.33 8.33
s 2
=
(X i m) 2 33.28
= 6.67
23.28
= 4.66
N 1 5 5
2.58 2.16
s= s 2
Iar apoi:
m1 m2 13.33 8.33
t= = = 3.73
sDif 1.34
Mrimea efectului
Atunci cnd calculm testul t, nu valoarea obinut este relevant ci probabilitatea care este asociat
acestei valori (p). De exemplu, dac avem n vedere formula de calcul pentru t, atunci nelegem c o valoare
t=3.73 nu nseamn altceva dect faptul c diferena dintre mediile comparate este 3.73 ori mai mare dect
eroarea standard estimat a acelei diferene. Chiar dac probabilitatea asociat acestei valori t este foarte
mic, sub pragul alfa, magnitudinea diferenei dintre medii poate fi mic. Ca urmare, aprecierea
importanei diferenei dintre mediile grupurilor cercetate are nevoie de informaii suplimentare. Acestea
sunt oferite de indicele de mrime a efectului.
Pentru a afla mrimea efectului pentru testul t pentru eantioane independente, se utilizeaz
indicele d al lui Cohen. Din pcate, pachetele de programe statistice uzuale (inclusiv SPSS) nu ofer acest
valoarea lui d. El poate fi ns obinut relativ uor cu formula:
m1 m2
d= (formula 3.14)
( N1 1) s 21 + ( N 2 1) s 2 2
( N1 1) + ( N 2 1)
unde numitorul exprim abatarea standard cumulat a celor dou grupuri comparate.
Pentru exemplul nostru, calculm mrimea efectului nlocuind datele n formula 3.14, dup cum
urmeaz:
42
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
13.33 8.33 5
d= = = 2. 1
(6 1) 6.67 + (6 1) 4.66 2.38
(6 1) + (6 1)
Interpretarea mrimii lui d se face utiliznd aceleai praguri propuse de Cohen: 0.20 efect mic;
0.50 efect mediu; 0.80 efect mare. Valoarea obinut de noi indic un nivel ridicat al mrimii efectului,
semn al faptulului c practicarea edinelor de relaxare are un efect important asupra performanei
sportivilor din eantionul cercetrii.
Aa cum tim, mediile grupurilor comparate reprezint doar o estimare a mediei populaiilor din care
provin, oscilnd jurul mediei adevrate. n mod similar, diferena dintre mediile celor dou eantioane
estimeaz media populaiei de diferene. Ct de precis este aceast estimare putem afla prin calcularea
intervalului de ncredere pentru diferena mediilor. Principial, limitele de ncredere n acest caz se calculeaz
la fel ca i limitele de ncredere pentru media populaiei, dup urmtoarea formul:
dif = mdif tcritic sdif (formula 3.15)
unde:
dif=media populaiei de diferene (1-2)
mdif=diferena dintre mediile eantioanelor cercetrii (m1-m2 )
tcritic=valoarea lui t pentru nivelul de ncredere ales (de regul 95%)
sdif=eroarea standard a diferenei (calculat cu expresia de la numitorul formulei 3.13)
nlocuind datele n formul, obinem urmtoarele limite de ncredere pentru media populaiei de
diferene:
Limita inferioar dif=5-2.228*1.34=2.01
Limita superioar dif=5+2.228*1.34=7.98
Imaginea de mai jos ilustreaz limitele ntre care se afl, pe distribuia populaiei de diferene, avnd
media 0, cu un nivel de ncredere de 95%, poziia mediei reale a diferenei dintre grupurile comparate:
- 2.01 7.98 +
dif=0 Linf mdif=5 Lsup
Relevana intervalului de ncredere poate fi discutat din mai multe puncte de vedere:
(a) Faptul c media populaiei de nul (dif=0) se afl n afara limitelor de ncrerede subliniaz odat
n plus caracterul semnificativ al diferenei dintre mediile grupurilor comparate. Cu ct una dintre limite ar fi
mai aproape de valoarea 0, cu att faptul de a fi obinut un rezultat semnificativ ar fi mai puin relevant. Dac
media distribuiei de nul ar fi cuprins ntre limitele de ncredere ipoteza de nul ar trebui acceptat, indiferent
de rezultatul testului statistic.
(b) Mrimea intervalului de ncredere arat precizia estimrii rezultatului cercetrii. Aceasta este
legat n mod direct de eroarea standard a diferenei (eroarea de estimare) care, la rndul ei, depinde de
numrul subiecilor din cele dou eantioane, dar i de omogenitatea valorilor msurate.
(c) n msura n care variabila testat are o utilitate practic, limitele de ncredere scot n eviden
dac rezultatul are o semnificaie n raport cu criterii de ordin practic. De exemplu, n cazul nostru,
antrenorul sportivilor respectivi poate aprecia n ce msur un progres al performanei care poate fi ntre 2 i
7 puncte ar aduce o clasare mai bun la concursurile de profil sau, dimpotriv, este nerentabil.
(d) Limitele de ncredere nu prezint o utilitate practic atunci cnd valorile variabilei nu au o
semnificaie prin ele nsele. S ne imaginm, spre exemplu, un experiment n care un grup privete un film
trist, iar un alt grup privete un film vesel, dup care starea de spirit a celor dou grupuri este evaluat prin
numrarea cuvintelor triste sau vesele pe care subiecii i le pot aminti dintr-o list citit imediat dup
vizionare. n aceast situaie este greu de atribuit o utilitate practic limitelor de ncredere ale numrului de
cuvinte evocate. Nu acelai lucru se ntmpl dac, de exemplu, n cazul unui experiment n care utilizarea
unui anumit tip de exerciii la locul de munc se traduce n creterea productivitii muncii, msurat prin
numrul de produse finite. Este evident c numrul de produse finite este un indicator cu relevan practic,
43
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
uor de interpretat. Cu toate acestea, chiar i atunci cnd nu prezint o relevan practic direct, calcularea
limitelor de ncredere ofer o imagine a gradului de precizie a estimrii testului statistic, fapt care face
necesar cunoaterea lor i raportarea lor.
Atunci cnd valoarea calculat a testului este egal sau mai mare dect t critic (ceea ce este
echivalent cu p este mai mic sau egal cu alfa), rezultatul justific aprecierea ca semnificativ a diferenei
dintre mediile celor dou eantioane (adic suficient de mare pentru a respinge ipoteza c ar putea fi
ntmpltoare). Modelul de cercetare nu permite formularea acestei concluzii n termenii unei relaii cauzale
ntre practicarea trainingului autogen i performana sportiv, orict de tentat ar fi aceast concluzie. Cel
puin nu n contextul acestui model de de cercetare. Dac acelai grup de subieci ar fi fost supus evalurii
performanei de extragere n zile cu training autogen i n zile fr training autogen, concluzia ar fi putut fi
de ordin cauzal.
n plus, existena unei diferene semnificative nu este similar cu existena unei diferene cu valoare
practic. Este posibil ca diferena dintre cele dou loturi de sportivi, dei semnificativ statistic, s nu
justifice costurile angajate n desfurarea programului de relaxare psihic. ntr-o asemenea situaie, studiul
nu este lipsit de valoare dar concluziile sunt utile doar n plan teoretic.
Publicarea rezultatului
La publicarea testului t pentru diferena dintre mediile a dou eantioane independente vor fi
menionate: mediile i abaterile standard ale fiecrui eantion, volumul eantioanelor sau gradele de libertate,
valoarea testului, nivelul lui p, mrimea efectului i limitele de intervalului de ncredere pentru diferena
dintre medii.
n form narativ, rezultatul pentru exemplul de mai sus poate fi formulat astfel: Sportivii care
practic trainingul autogen au fost comparai cu cei care nu practic. Primii au realizat o performan mai
bun (m=13.33, =2.58) fa de ceilali (m=8.33, =2.16), t(10)=3.65, p<0.05. Mrimea efectului este
mare (d=2.1), iar limitele de ncredere (95%) pentru diferena mediilor sunt cuprinse ntre 2.01 i 7.98.
Generic, acest test statistic se utilizeaz n situaiile n care vrem sa aflm dac o variabil
dependent, msurat pe o scal de interval/raport, difer semnificativ ntre dou grupuri (eantioane)
difereniate pe o variabil independent msurat pe scala de tip nominal (dihotomic), sau bi-categorial,
indiferent de natura ei. Deoarece este unul dintre modelele frecvent ntlnite n practica cercetrii
44
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
psihologice, utilizarea testului t pentru eantioane independente este i ea des ntlnit n literatura de
specialitate.
ntr-un studiu asupra efectelor unui nou tratament al fobiei, datele pentru grupul experimental
obinute printr-o scal de evaluare a tendinelor fobice sunt: m1=27.2, s1=4 i N1=15
Datele pentru grupul de control sunt: m2=34.4, s2=14 i N2=15
Utiliznd aceste date:
1. Formulai problema (ntrebarea) cercetrii
2. Formulai ipoteza cercetrii (H1)
3. Formulai ipoteza de nul (H0)
4. Aflai t critic pentru =0,05; bilateral
5. Calculai testul t pentru diferena dintre cele dou eantioane
6. Formulai i motivai decizia statistic
7. Formulai concluzia cercetrii
Pentru a elimina aceste neajunsuri, i mai ales pe ultimul dintre ele, se utilizeaz o procedur
statistic numit analiza de varian (cunoscut sub acronimul ANOVA, de la ANalysis Of VAriance, n
englez). n mod uzual, analiza de varian este inclus ntr-o categorie aparte de teste statistice. Motivul
pentru care o introducem aici, imediat dup testul t pentru eantioane independente, este acela c, n esen,
45
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
ANOVA nu este altceva dect o extensie a logicii testului t pentru situaiile n care se dorete compararea a
mai mult de dou medii independente. Dar, dac problema este similar, soluia este, aa cum vom vedea,
diferit.
Exist mai multe tipuri de ANOVA, dou fiind mai frecvent folosite:
- ANOVA unifactorial, care se aplic atunci cnd avem o variabil dependent msurat pe o scal
de interval/raport msurat pentru trei sau mai multe valori ale unei variabile independente
categoriale. n contextul ANOVA, variabila independent este denumit factor, iar valorile pe care
acesta le ia se numesc niveluri. Din acest motiv, modelul de analiz de varian cu o singura
variabil independent se numete ANOVA unifactorial, ANOVA simpl sau, cel mai frecvent,
ANOVA cu o singur cale (One-way ANOVA).
o Exemple:
Nivelul anxietii n raport cu trei categorii de fumtori (1-10 igri zilnic, 11-20
igri i 21-30 igri).
Timpul de rspuns la un strigt de ajutor, n funcie de natura vocii persoanelor care
solicit ajutorul (copil, femeie, brbat).
Scorul la un test de cunotine statistice ale studenilor de la psihologie, n funcie de
tipul de liceu absolvit (real, umanist, agricol, artistic).
- ANOVA multifactorial, care se aplic atunci cnd avem o singur variabil dependent (la fel ca
n cazul ANOVA unifactorial) dar dou sau mai multe variabile independente, fiecare cu dou sau
mai multe valori, msurate pe o scal categorial (nominal sau ordinal).
o Exemple
Nivelul anxietii n raport cu intensitatea fumatului (1-10 igri zilnic, 11-20
igri i 21-30 igri), i cu genul (masculin, feminin). n acest caz, problema
cercetrii este dac intensitatea fumatului i caracteristica de gen au, mpreun, o
relaie cu nivelul anxietii.
Timpul de rspuns la un strigt de ajutor n funcie de natura vocii care solicit
ajutorul (copil, femeie, brbat) i de genul (masculin, feminin) al persoanei care
trebuie s rspund la solicitarea de ajutor.
Scorul la un test de cunotine statistice ale studenilor de la psihologie, n funcie de
tipul de liceu absolvit (real, umanist, agricol, artistic) i de genul (masculin, feminin)
al studenilor.
Ne vom limita aici doar la prezentarea analizei de varian unifactoriale, urmnd s revenim cu alt
prilej asupra altor variante de ANOVA.
S ne imaginm o cercetare a crei ipotez este c relaia dintre performana sportivilor n tragerea la
int i trei metode de antrenament (s le denumim metoda 1, metoda 2 i metoda 3).
n esen, ANOVA este o procedur de comparare a mediilor eantioanelor. Specificul ei const n
faptul c n locul diferenei directe dintre medii se utilizeaz dispersia lor, gradul de mprtiere. Procedura
se bazeaz pe urmtorul demers logic: Ipoteza cercetrii sugereaz c performana sportivilor antrenai cu
fiecare dintre cele trei metode de antrenament face parte dintr-o populaie distinct, creia i corespunde un
nivel specific de performan (adic o medie caracteristic, diferit de a celorlalte dou populaii). Prin
opoziie, ipoteza de nul ne oblig s presupunem c cele trei eantioane 10 (modele de antrenament) pe care
vrem s le comparm, provin dintr-o populaie unic de valori ale performanei, iar diferenele dintre mediile
lor nu reprezint dect expresia variaiei fireti a distribuiei de eantionare.
n imaginea de mai jos populaiile cercetrii (Pc1, Pc2, Pc3) sunt exprimate cu linie continu, iar
populaie de nul cu linie discontinu.
10
Pentru simplificare, n continuare ne vom referi numai la trei eantioane, dar se va nelege trei sau mai multe
46
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Chiar dac absena unei legturi ntre metoda de antrenament i intensitatea nivelul performanei
(ipotez de nul) este adevrat, cele trei grupuri (eantioane) nu trebuie s aib n mod necesar aceeai
medie. Ele pot avea medii diferite care s rezulte ca expresie a variaiei aleatoare de eantionare
(m1m2m3) i, de asemenea, mprtieri (dispersii) diferite (s1s2s3). S ne gndim la cele trei medii pe
care vrem s le comparm, ca la o distribuie de sine stttoare de trei valori (sau mai multe, pentru cazul n
care variabila independent are mai multe categorii). Cu ct ele sunt mai diferite una de alta, cu att
distribuia lor are o mprtiere (varian) mai mare. Este evident faptul c dac eantioanele ar aparine
populaiei de nul, diferena mediilor (exprimat prin dispersia lor) ar fi mai mic dect n cazul n care
acestea ar proveni din populaii distincte (corespunztor ipotezei cercetrii).
Mai departe, se pune urmtoarea problem: ct de diferite (mprtiate) trebuie s fie mediile celor
trei eantioane, luate ca distribuie de sine stttoare de trei valori, pentru ca s putem concluziona c ele nu
provin din populaia de nul (dreptunghiul punctat), ci din trei populaii diferite, corespunztoare
eantioanelor de cercetare (Pc1, Pc2, Pc3)?
Pentru a rspunde la aceast ntrebare este necesar:
a) S calculm dispersia valorilor individuale la nivelul populaiei de nul, care se bazeaz pe valorile
performanei tuturor valorilor msurate, indiferent de metoda de antrenament;
b) S calculm dispersia mediilor anxietii grupurilor cercetrii (considerate ca eantioane separate);
c) S facem raportul dintre aceste dou valori. Obinerea unei valori mai ridicate a acestui raport ar
exprima apartenena fiecreia din cele trei medii la o populaie distinct, n timp ce obinerea unei
valori mai sczute ar sugera proveniena mediilor dintr-o populaie unic (de nul). Decizia statistic
cu privire la mrimea raportului i, implicit, cu privire la semnificaia diferenelor dintre mediile
comparate, se face prin raportarea valorii raportului la o distribuie teoretic adecvat, alta dect
distribuia normal, aa cum vom vedea mai departe.
n continuare ne vom concentra asupra fundamentrii modului de calcul pentru cei doi termeni ai
raportului. Calcularea exact a dispersiei populaiei de nul este imposibil, deoarece nu avem acces la toate
valorile acesteia, dar poate fi estimat prin calcularea mediei dispersiei grupurilor de cercetare. Valoarea
astfel obinut se numete dispersia intragrup i reprezint estimarea mprtierii valorilor msurate la
nivelul populaiei de nul.
La rndul ei, dispersia mediilor grupurilor de cercetare, calculat dup metoda cunoscut de calcul a
dispersiei, formeaz ceea ce se numete dispersia intergrup. Valoarea astfel obinut evideniaz ct de
diferite (mprtiate) sunt mediile eantioanelor care fac obiectul comparaiei.
Raportul dintre dispersia intergrup i dispersia intragrup se numete raport F i ne d valoarea
testului ANOVA unifactorial. Cu ct acest raport este mai mare, cu att mprtierea mediilor grupurilor
comparate este mai mare i, implicit, diferena lor poate fi una semnificativ, ndeprtat de o variaie pur
ntmpltoare.
Dac distana (mprtierea) dintre mediile eantioanelor depete o anumit valoare, atunci putem
concluziona c nu avem o singur populaie (ipoteza de nul), ci mai multe, mediile grupurilor provenind din
populaii cu medii distincte (cf. ipotezei cercetrii). Dac, dimpotriv, mediile eantioanelor comparate sunt
apropiate, atunci vom concluziona c ele nu provin din populaii diferite, ci dintr-una singur (cf. ipotezei de
nul).
(a) Estimarea dispersiei populaiei de nul pe baza mediei dispersiei grupurilor (variana intragrup)
Atta timp ct nu cunoatem dispersia populaiei (2) din care ar putea proveni grupurile, trebuie s
o estimm prin dispersiile celor trei grupuri (s12, s22, s32).
Calculnd media celor trei dispersii vom obine o valoare care estimeaz dispersia pentru cele trei
grupuri luate mpreun (indiferent de metoda de antrenament utilizat). Aceast valoare se consider c
estimeaz dispersia populaiei totale. Deoarece ea se calculeaz pe baza dispersiilor n interiorul grupurilor,
este desemnat n mod uzual prin termenul de intragrup (sau, mai frecvent, prin forma englez: within-
group) i se noteaz cu s2intragrup, fiind calculat cu una dintre formulele urmtoare:
2 2 2
s1 + s2 + s3
s 2 intragrup = (formula 3.16)
N grupuri
df1 df 2 df 3
s 2 intragrup = * s 21 + * s22 + * s 23 (formula 3.17)
df intragrup df intragrup df intragrup
(b) Estimarea dispersiei populaiei de nul pe baza dispersiei mediilor grupurilor (variana intergrup)
Mediile celor trei grupuri (eantioane) sunt numere care pot fi analizate ca distribuie n sine, a cror
dispersie (varian) poate fi calculat, fiind o estimare a mprtierii valorilor la nivelul populaiei. Din cauz
c se bazeaz pe mediile grupurilor, aceasta se mai numete i varian intergrupuri (between groups, n
limba englez). ntre variaia acestor medii i variaia valorilor din grupurile analizate, luate mpreun, exist
o legtur care poate fi exprimat pe baza formulei transformate a erorii standard, astfel:
2
2M =
N de unde se deduce 2 = N * 2 M (formula 3.18)
Vom putea utiliza dispersia mediilor celor trei eantioane pentru a estima dispersia populaiei totale
(vezi exemplul de mai jos). Aceasta se numete estimarea varianei intergrupuri, notat cu s2intergrup.
Dac nlocuim n expresia de mai sus expresia de calcul a dispersiei (formula 3.17), obinem:
11
Metoda de calcul pe care o vom prezenta aici (bazat pe dispersie) nu este singura posibil. n multe manuale de
statistic este utilizat metoda sumei ptratelor, care se bazeaz pe scorurile brute, fr utilizarea parametrilor
distribuiei. Am preferat aceast metod deoarece ni se pare mai intuitiv, pe de o parte, iar pe de alt parte, deoarece
poate fi aplicat i n cazul n care nu avem distribuia scorurilor brute, ci doar parametrii grupurilor comparate. Fiecare
metod are avantaje i dezavantaje, dar n esen, ele conduc la acelai rezultat.
48
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
s 2 intergrup = n * (m M )
i i
2
(formula 3.19)
df intergrup
unde mi este media performanei din fiecare grup, M este media celor trei grupuri luate mpreun, iar
ni este numrul subiecilor din fiecare grup, iar dfintergrup se calculeaz ca numrul grupurilor-1.
Ca urmare, pentru o situaie cu trei grupuri, formula desfurat se scrie astfel:
unde: m1, m2, m3 sunt mediile celor trei grupuri, n1, n2, n3, sunt volumele celor trei eantioane, iar
celelalte valori sunt cele descrise pentru formula anterioar.
Pentru situaia n care grupurile au un numr egal de subieci, formula 3.19 devine:
(formula 3.19)
(m M ) 2 + (m2 M ) 2 + (m3 M ) 2
s 2
intergrup = n* 1
df intergrup
Ambele tipuri de estimri sunt estimri independente ale varianei populaiei de nul. ns, n timp ce
variana intragrup o estimeaz n mod direct (media varianelor), variana intergrup o msoar indirect
(variana mediilor). Aceasta din urm, variana intergrup, reprezint o estimare a varianei populaiei de nul
numai dac ipoteza de nul este adevrat. Dac ipoteza de nul este fals, ea reflect de fapt msura n care
valorile variabilei independente (factorul) influeneaz mediile variabilei dependente. Pe aceast
particularitate se bazeaz procedura analizei de varian. Raportul dintre cele dou estimri (s2intergrup/s2intragrup)
va tinde s devin cu att mai mare cu ct diferena dintre mediile grupurilor (tradus prin dispersia mediilor)
devine mai mare dect dispersia din interiorul grupurilor (tradus prin media dispersiilor). Acest raport se
numete raport Fisher, dup numele celui care a fundamentat acest tip de analiz 12, i se scrie astfel:
s 2 intergrup
F= 2 (formula 3.20)
s intragrup
Interpretarea raportului F
Numitorul raportului F (dispersia intragrup) exprim variabilitatea din interiorul grupurilor supuse
comparaiei. Dac analizm sursele acestei variaii, ea poate proveni din mai multe surse: diferenele
individuale dintre subieci, erorile de msurare ale variabilei dependente, fluctuaia condiiilor n care au fost
efectuate msurrile. Neputnd defini cu exactitate nici sursa i nici contribuia fiecreia, dispersia intragrup
exprim aa numita varian neexplicat, definit generic i ca variana erorii.
n conformitate cu ipoteza cercetrii, grupurile de subieci ar trebui s aib scoruri diferite, fie pentru
au fost supuse unui tratament diferit (n exemplul nostru prin cele trei metode de antrenament), fie ca
urmare a faptului c fac parte din populaii diferite. n acelai timp, subiecii din fiecare grup n parte ar
trebui s aib scoruri similare. Faptul c ele difer totui, nu poate fi explicat prin efectul tratamentului,
motiv pentru care variaia lor este definit drept o varian a erorii.
La rndul lui, variabilitatea numrtorului raportului F este rezultatul manipulrii de ctre cercettor
(atunci cnd operm n context experimental), sau este rezultatul unor grupuri preexistente (atunci cnd
efectum un studiu observaional). i valoarea acestuia este amplificat de variana erorii. Aceasta deoarece,
chiar i n cazul n care tratamentul cu cele trei metode de antrenament ar fi total ineficient, i toate
populaiile ar avea medii identice, mediile grupurilor comparate ar diferi ntre ele, sub efectul unor surse
diverse (erori). Ca urmare, avem dou surse de variabilitate la numrtor i numai una singur la numitor,
fapt care poate fi sintetizat prin urmtoarea expresie:
12
Sir Ronald Aylmer Fisher (1890-1962). Astronom de formaie, interesat de teoria erorilor, s-a remarcat prin
contribuiile sale n teoria statisticii creia, din anul 1922, i-a dat o nou orientare.
49
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Atunci cnd ipoteza de nul este adevrat, efectul tratamentului se apropie de zero, iar raportul F
este rezultatul varianei erorii. Dac cele dou variane ale erorii ar fi identice, F ar avea valoarea 1 dar, de
fapt, cele dou variane ale erorii pot avea valori diferite, ceea ce conduce la fluctuaii ale lui F n jurul lui 1.
Atunci cnd efectul tratamentului nu este zero (ipoteza de nul este fals), ne ateptm ca valoarea
raportului F s fie mai mare dect 1. ns pentru a respinge ipoteza de nul valoarea lui F trebuie s fie nu
doar mai mare dect 1, ci mai mare dect un prag critic convenional asumat (alfa), astfel nct probabilitatea
ca un rezultat similar s decurg din ntmplare s fie mai mic sau cel mult egal cu alfa.
Distribuia Fisher
Valorile raportului F (sau testul F) se distribuie ntr-un mod particular, numit distribuia F sau distribuia
Fisher. Ca i distribuia normal, distribuia F este o familie de distribuii, avnd urmtoarele caracteristici:
1. asimetrie pozitiv (tendina valorilor de grupare spre partea stng, cu valori mici);
2. poate lua valori orict de mari;
3. valoarea minim este 0, deoarece decurge din raportul a dou dispersii, iar dispersiile nu pot fi
niciodat negative 13.
4. forma distribuiei variaz n funcie de o pereche de grade de libertate format din numrul grupelor
(categoriile variabilei independente) i numrul subiecilor.
Imaginea de mai sus reprezint curba F pentru 3 grupuri cu 30 de subieci n total. Distribuia Fisher
are forme distincte n funcie de numrul eantioanelor comparate i volumul acestora.
EXEMPLU DE CALCUL
Problema cercetrii:
Avem rezultatele la o edin de tragere la int pentru trei grupuri de cte 6 sportivi, fiecare grup
fiind antrenat cu o alt metod, i vrem s vedem dac exist o legtur ntre nivelul performanei i metoda
de antrenament.
13
n practic, se poate ajunge n situaia ca dispersia intragrup s rezulte a fi mai mic dect dispersia intergup i, ca
urmare, valoarea lui F s fie mai mic dect 0. Acest lucru este determinat de inegalitatea sever a dispersiilor ntre
grupurile analizate.
50
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Ipoteza cercetrii:
Performana sportiv este n legtur cu metoda de antrenament utilizat.
Ipoteza de nul:
Nu exist o legtur ntre performana sportiv i metoda de antrenament.
Fixm criteriile deciziei statistice:
Nivelul =0.05
Stabilim F critic:
dfintergrup=3-1=2
dfintragrup=18-3=15
Citim F critic (F(0.05, 2, 15)) din tabelul F pentru =0.05:
Fcritic=3.6823 (vezi tabelul anexat)
Spre deosebire de tabelele distribuiilor utilizate pn acum, (z i t), pentru interpretarea lui F avem
mai multe tabele, calculate fiecare pentru un anume nivel al lui . Mai nti cutm tabela pentru dorit (s
zicem, =0.05). Apoi citim valoarea critic pentru F la intersecia dintre coloana care reprezint numrul
gradelor de libertate pentru numrul grupurilor (dfB) cu linia care reprezint numrul gradelor de libertate
pentru volumul total al subiecilor (dfW). Dac valoarea obinut prin calcul este mai mare sau egal dect
cea tabelar, atunci putem lua decizia de respingere a ipotezei de nul.
O precizare important cu privire la ANOVA, ca test statistic, privete caracterul ei unilateral
(one-tailed). ntr-adevr, spre deosebire de celelalte teste studiate pn acum, ANOVA este interpretat ntr-
o singur direcie i anume, dac mediile grupurilor difer semnificativ ntre ele (au o variaie mai mare
dect cea normal pentru o distribuie aleatoare). Nu putem avea o valoare negativ pentru F i, ca urmare,
testul F este ntotdeauna un test unilateral.
Metoda de antrenament
metoda 1 metoda 2 metoda 3
X1 X2 X3
(X1-m1)2 (X2-m2)2 (X3-m3)2
(puncte) (puncte) (puncte)
10 2,79 3 8.00 4 1.36
9 0,45 6 0.02 5 4.70
10 2,79 6 0.02 2 0.68
7 1,77 5 0.68 3 0.02
8 0,11 8 4.70 2 0.02
6 5,43 7 1.36 1 3.34
X 50 13.33 35 14.78 17 10.14
N 6 6 6
M m1=8.33 m2=5.83 m3=2.83 M=(m1+m2+m3)/3=5.66
s2 2.66 2.96 2.02
(m-M) 2.67 0.17 -2.83
(m-M)2 7.12 0.02 8.00 (m-M)2=15.14
14
Atenie, acest mod de prezentare a datelor servete calculrii manuale a testului F. ntr-o baz de date SPSS vom avea
cte o nregistrare pentru fiecare subiect, cu dou variabile, una pentru nivelul anxietii i cealalt pentru intensitatea
fumatului, aceasta din urm cu trei valori convenionale, s zicem 1, 2, 3 pentru fiecare nivel de intensitate a fumatului.
51
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Recunoatem n interiorul graficului parametrii fiecrui grup (m i s2) precum i media mare (M),
a valorilor individuale din toate grupurile, luate mpreun.
Avnd calculai parametrii celor trei grupuri, putem trece la calcularea raportului F. Mai nti
calculm numrtorul, adic dispersia mediilor celor trei grupuri. Dat fiind faptul c nu cunoatem dispersia
populaiei vom utiliza dispersia eantioanelor, conform formulei 3.19 pentru grupuri egale.
Prin nlocuire cu valorile calculate n tabelul de mai sus, obinem:
2 2 2
s1 + s2 + s3 2.66 + 2.96 + 2.02
s 2 intragrup = = = 7.64
N grupuri 3
s 2intergrup 45.42
F= = = 5.94
s 2intragrup 7.64
Valoarea astfel obinut o comparm cu F critic gsit anterior n tabel. Constatm c F calculat
(5.94), este mai mare dect F critic (3.6823).
Decizia statistic:
Respingem ipoteza de nul i acceptm ipoteza cercetrii: Nivelul performanei prezint o variaie n
legtur cu metoda de antrenament utilizat.
La fel ca i n cazul testelor statistice introduse anterior, valoarea testului F nu este informativ n
sine. Mrimea lui F indic doar dect de cte ori este cuprins dispersia intragrup n dispersia intergrup.
Pentru a decide dac acest raport este mare sau mic trebuie s calculm un indice al mrimii efectului. n
cazul analizei de varian sunt utilizai n mod obinuit doi indici de mrime a efectului: eta ptrat (2) i
omega ptrat (2). Spre deosebire de indicele d (Cohen), care este un indice al diferenei, eta ptrat i omega
52
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
15
ptrat sunt indici ai asocierii (B. Cohen, 2001), similari cu coeficientul de corelaie, pe care l vom analiza
analiza n alt loc.
Vom prezenta aici doar indicele eta ptrat, dat fiind faptul c este accesibil cu metoda pe care am
utilizat-o pentru calcularea lui F 16. Formula de calcul pentru 2 este urmtoarea:
df intergrup F
2 = (formula 3.21)
df intergrup F + df intragrup
n esen, indicele eta ptrat descrie procentul din variana (mprtierea) variabilei dependente care
este explicat de variana variabilei independente.
Nu exist o gril unic de interpretare a indicelui eta ptrat dar, prin similitudine cu coeficientul
de corelaie, putem prelua sugestiile unor autori diferii, ale cror opinii sunt, n linii mari, convergente.
Redm aici, pentru comparaie, dou variante de interpretare pentru eta ptrat:
Vom observa c, n ambele variante, pentru a fi important indicele eta ptrat trebuie s ating cel
puin valoare de 0.50, ceea ce nseamn c 50% din varian variabilei dependente este explicat de variabila
independente.
Pentru datele exemplului nostru, indicele de mrime a efectului este:
df intergrup F 2 5.94
2 = = = 0.44
df intergrup F + df intragrup 2 5.94 + 15
La rndul lui, Cohen (1988) a dezvoltat un indice de mrime a efectului (f) pentru ANOVA, care
atenueaz ceea ce se consider a fi tendina de supraestimare a mrimii efectului de ctre indicele eta
ptrat:
2
f = (formula 3.22)
1 2
0.44
f = = 0.88
1 0.44
15
Fr a intra n amnunte, facem precizarea c indicii de mrime a efectului pot fi transformai cu uurin unii ntr-
alii, cu ajutorul unor formule de conversie.
16
Programele statistice ofer, de regul, posibilitatea de a calcula ambii indici ai puterii
53
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
n conformitate cu recomandrile lui Cohen, valorile lui f se interpreteaz astfel: efect mic=0.10;
efect mediu=0.25; efect mare=0.40. Interpretarea mrimii efectului trebuie fcut cu precauie i modestie
(Runyon et. al, 1996). Un indice redus de mrime a efectului indic, desigur, o slab intensitate a relaiei
dintre variabila independent i variabila dependent. Cu toate acestea, uneori, chiar i o relaie slab ntre
variabile poate fi important pentru cercetarea tiinific din tiinele sociale i umane. Comportamentul
uman este supus unor surse extrem de complexe de determinri, fapt care face aproape imposibil
controlarea (eliminarea) unora dintre surse, pentru stabilirea exact a efectului uneia anume. Acest lucru face
inevitabil prezena unei anumite cantiti de erori de msurare n toate cercetrile psihologice. n aceste
condiii, uneori, chiar i un efect mic poate fi considerat un ctig important din punct de vedere tiinific,
chiar dac este puin relevant din punct de vedere practic. De exemplu, un rezultat semnificativ statistic, dar
cu un indice sczut de mrime a efectului, poate constitui punctul de plecare al unei noi cercetri, n care
efectele colaterale ale unor variabile s fie mai bine controlate (eliminarea erorii), ceea ce poate conduce la
evidenierea unei relaii mai puternice ntre variabilele studiate.
Dac privim cei doi indici ai mrimii efectului calculai pentru exemplul dat, putem aprecia c, n
contextul datelor cercetrii noastre, 44% din variaia performanei de instruire este explicat de utilizarea
metodelor de antrenament (ceea ce nseamn, implicit, c un procent de 56% provine din alte surse). n
conformitate cu recomandrile de interpretare pentru eta ptrat, putem afirma c relaia dintre metodele de
antrenament utilizate i performan este moderat sau medie. n acelai timp, indicele f al lui Cohen
indic un nivel ridicat al mrimii efectului. Nu trebuie s privim aceste dou aprecieri ale mrimii efectului
ca fiind contradictoirii, ci ca pe dou perspective asupra aceleiai realiti.
Analiza post-hoc
17
Cu toate acestea, exist autori care consider c nimic nu ne mpiedic s calculm testele post-hoc chiar dac testul F
s-a finalizat cu admiterea ipotezei de nul.
54
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
n raportul de publicare pentru ANOVA vor fi descrise grupurile (categoriile) comparate, mediile
lor, valoarea testului F cu numrul gradelor de libertate i pragul de semnificaie al testului. La acestea se
adaug indicele de mrime a efectului. ntr-o manier narativ, rezultatul obiinut pe exemplul de mai sus,
poate fi prezentat astfel:
A fost analizat performana n tragerea la int a trei grupuri de sportivi, antrenai cu metode
diferite. Mediile performanei pentru cele trei grupuri au fost 8.33, 5.83, respectiv 2.83. Analiza de varian
unifactorial a relevat o diferen semnificativ ntre aceste medii, F (2, 15)=6; p0.05. Mrimea efectului
apreciat cu indicele eta ptrat indic un efect moderat (2=0.44), n timp ce indicele f al lui Cohen indic
un efect mare (f=0.88).
Atunci cnd vom calcula ANOVA cu ajutorul unui program care ne va oferi i comparaiile multiple
ntre grupurile comparate (analiza post-hoc), la descrierea de mai sus vom aduga i comparaiile grupurilor,
dou cte dou, care exprim diferenele directe dintre grupurile supuse comparaiei, explicnd analitic
sursele semnificaiei raportului F global.
Avantajele ANOVA
Utilizarea ANOVA pentru testarea ipotezelor n cazul unui numr mai mare de grupuri (eantioane)
prezint dou avantaje. Primul, ine de ceea ce am precizat deja, i anume faptul c eliminm riscul cumulrii
unei cantiti prea mari de eroare de tip I, prin efectuarea repetat a testului t. Al doilea, rezult din faptul c
avem posibilitatea s punem n eviden diferene semnificative ntre mediile mai multor grupuri, chiar i
atunci cnd nici una dintre ele nu difer semnificativ una de cealalt (testul t).
Dei, n mod normal, analiza de varian este utilizat doar n situaia n care se dorete testarea
diferenei dintre mediile a mai mult de dou grupuri independente, ea d rezultate echivalente i n cazurile
n care exist numai dou grupuri (singura diferen fiind valoarea calculat a testului, nu i nivelul lui p).
Utilizarea testului t pentru testarea diferenei dintre dou medii este, totui, o metod mult mai direct, mai
uor de aplicat i de neles, dect analiza de varian.
v. v. De exemplu, dac lum n considerare datele din tabelul alturat, n care avem o
indep. dep. variabil dependent distribuit pe dou valori ale unei variabile independente,
1 9 valoarea testului t este 3.13, iar valoarea testului F este 9.82 (ceea ce reprezint
1 5 ptratul valorii t). n acelai timp, rezultatul la ambele teste este semnificativ pentru
1 7 aceeai valoare a lui p (0.035).
2 14
2 15
2 10
Atunci cnd una sau mai multe dintre aceste condiii nu sunt ntrunite, se poate adopta una dintre
soluiile urmtoare:
o renunarea la ANOVA n favoarea unei prezentri descriptive (soluie care ne lipsete de
posibilitatea unei concluzii testate statistic);
o transformarea variabilei dependente astfel nct s dobndeasc proprietile necesare
(printre metodele uzuale, citm aici doar logaritmarea sau extragerea radicalului din toate
valorile variabilei dependente);
55
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
o transformarea variabilei pe o alt scal de msurare i aplicarea altui test statistic (de
exemplu, prin transformarea pe o scal nominal, se poate aplica testul neparametric chi-
ptrat sau, prin transformarea pe o scal ordinal, se poate aplica testul neparametric
Kruskal-Wallis, ambele urmnd a fi tratate mai departe).
Un psiholog dorete s testeze ipoteza c preferina pentru o anumit varietate de bomboane este n
legtur cu culoarea acestora (verde, rou, galben). n acest scop alege 18 subieci, pe care i mparte n trei
grupuri, fiecare grup primind cte un bol cu bomboane de o anumit culoare. Grupurile au de ndeplinit o
sarcin plictisitoare timp de 30 de minute. Dup acest timp, psihologul numr cte bomboane a mncat
fiecare subiect din cele trei grupuri i construiete tabelul urmtor.
Verde Rou Galben
2 3 2
1 4 0
1 5 2
0 6 1
3 4 3
2 6 1
1. Gsii F critic pentru =0.05
2. Calculai F
3. Care este decizia statistic n acest caz
4. Prezentai rezultatul n format APA
56
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
c) Cazul n care natura situaiei experimentale nu permite utilizarea acelorai subieci pentru
cele dou msurri, de exemplu, n contextul unei intervenii terapeutice care are un efect pe termen foarte
lung. n acest caz este se poate gsi pentru fiecare subiect corespunztor condiiei iniiale un subiect
similar, corespunztor condiiei finale, constituind astfel perechi de subieci aparinnd fiecare unui grup
distinct, ntre care se poate face o comparaie direct. Ca urmare, dei diferii, vom trata cei doi subieci din
pereche ca i cum ar fi aceeai persoan. Sau, ntr-un alt context, putem compara subieci care sunt ntr-un
anumit tip de relaie, interesndu-ne diferena dintre ei sub o anumit caracteristic. De exemplu, ne poate
interesa daca ntre nivelul de inteligen dintre bieii i fetele care formeaz cupluri de prieteni exist o
anumit diferen. n acest caz, dei avem dou eantioane distincte, fiecrui subiect din eantionul de biei
i corespunde un subiect din eantionul de fete, constituirea celor dou eantioane fcndu-se pe baza relaiei
de prietenie dintre ei. n aceeai categorie se afl comparaiile ntre perechi de gemeni, sau cele dintre soi. n
astfel de cazuri, avem de a face cu aa numitul model al eantioanelor perechi (matched pairs design).
Indiferent de tipul lor, toate modele prezentate mai sus au un obiectiv similar, acela de a pune n
eviden n ce msur o anumit condiie (variabila independent) corespunde unei modificri la nivelul unei
caracteristici psihologice oarecare (variabila dependent). Vom observa c, n toate exemplele evocate,
variabila independent este una de tip nominal, dihotomic (nainte/dup; semestru/sesiune; grup de
cercetare/grup de control; biat/fat; so/soie, etc.), n timp ce variabila dependent se msoar pe o scal
cantitativ, de interval sau de raport. De asemenea, trebuie s consemnm faptul c n ambele situaii se
utilizeaz msurtori de acelai fel, cu acelai instrument, care produce valori exprimate n aceeai unitate de
msur, ntre care se poate efectua un calcul direct al diferenei.
Pentru descrierea testului statistic adecvat acestor cazuri s ne imaginm urmtoarea situaie
generic de cercetare: Un grup de pacieni cu tulburri de tip anxios sunt inclui ntr-un program de
psihoterapie, avnd drept scop ameliorarea nivelului anxietii. nainte de nceperea programului a fost
aplicat o scal de evaluare a anxietii. Acelai instrument a fost aplicat din nou, dup parcurgerea
programului de terapie.
Aici s-ar putea pune ntrebarea de ce nu considerm valorile rezultate din cele dou msurtori ca
fiind independente, urmnd s utilizm testul t pentru acest tip de date? Exist mai multe argumente n
favoarea respingerii acestei variante simplificatoare:
a) Utilizarea valorilor perechi ofer informaii mai bogate despre situaia de cercetare. n modele
de cercetare de tip nainte/dup ea capt chiar valene de experiment.
b) Testul t pentru eantioane independente surprinde variabilitatea dintre subieci, n timp ce
testul t pentru eantioane dependente (msurri repetate) se bazeaz pe variabilitatea intra-
subiect, aceea care provine din diferena valorilor de la o msurare la alta, la nivelul fiecrui
subiect n parte.
c) Dac exist o diferen real ntre subieci, atunci testul diferenei dintre valorile perechi are
mai multe anse s o surprind dect cel pentru valori independente (puterea unui model de
cercetare intra-subiect este mai mare dect n modelul inter-subieci).
Revenind la tema de cercetare pe care am enunat-o mai sus, dei avem aceiai subieci, i n primul
i n al doilea caz, ne vom raporta la aceasta situaie ca i cum ar fi dou eantioane. Unul, cel al subiecilor
care nu au urmat nc un program de terapie, iar celalalt, al subiecilor care au urmat un astfel de
program. Datorit faptului c cele dou eantioane sunt formate din aceiai subieci, ele se numesc
dependente sau corelate.
n acest tip de studiu, obiectivul testului statistic este acela de a pune n eviden semnificaia
diferenei dintre mediile anxietii n cele dou momente. Cea mai simpl procedur de calcul este metoda
diferenei directe. Pentru aceasta, calculm diferenele fiecrei perechi de valori din cele dou distribuii (X2-
X1), obinnd astfel o distribuie a diferenelor, pe care o vom nota cu D.
Dac programul de terapie ar fi total ineficient, trebuie s presupunem c diferenele pozitive le-ar
echilibra pe cele negative ceea ce, la un numr mare de eantioane ipotetice (formate din acelai numr de
subieci), am obine o medie a diferenelor egal cu 0. Ca urmare, ipoteza statistic presupune c media
diferenelor la nivelul populaiei de nul este 0. Aceasta nseamn c testul t trebuie s demonstreze c media
diferenelor msurate pe eantionul cercetrii este suficient de departe de 0, pentru a respinge ipoteza de nul
i a accepta ipoteza cercetrii. De aici rezult c putem reduce metoda de calcul la formula testului t pentru
un singur eantion, pornind de la formula cunoscut a testului t,
57
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
m
t=
sm
mD D
t= (formula 3.24)
seD
unde mD este media distribuiei D (a diferenelor dintre cele dou msurri), D este media populaiei de nul
a diferenelor dintre eantioane de acelai fel, iar seD este eroarea standard a distribuiei D (mprtierea
distribuiei D).
Problema cercetrii: Se poate obine o reducere a reaciilor anxioase prin aplicarea unei anumite
proceduri de psihoterapie?
Ipoteza cercetrii (H1):
Pentru test bilateral Programul de psihoterapie are un efect asupra anxietii.
Pentru test unilateral Programul de psihoterapie reduce intensitatea reaciilor de tip anxios.
Ipoteza de nul (H0):
Pentru test bilateral Programul de psihoterapie nu are nici un efect asupra anxietii.
Pentru test unilateral Programul de psihoterapie nu reduce nivelul anxietii.
Populaiile cercetrii:
Populaia 1 Subiecii cu anxietate ridicat care nu au urmat un program de terapie
Populaia 2 Subiecii cu anxietate ridicat care au urmat un program de terapie
Ipoteza cercetrii afirm c ele sunt diferite (m1-m20), n timp ce ipoteza de nul afirm c ele sunt
identice (m1-m2=0).
Eantion: Un singur grup de subieci cu probleme anxioase (N=8) al crui nivel de anxietate este
evaluat nainte i dup programul de terapie.
Datele cercetrii:
nainte de Dup
D
program program D-mD (D-mD) 2
(X2-X1)
(X1) (X2)
6 6 0.00 0.50 0.25
8 7 -1.00 -0.50 0.25
18
Am optat pentru alfa=0.01 doar pentru a varia exemplele de calcul, dar in practic se utilizeaz n mod obinuit
alfa=0.05.
58
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
nainte de Dup
D
program program D-mD (D-mD) 2
(X2-X1)
(X1) (X2)
10 11 1.00 1.50 2.25
9 8 -1.00 -0.50 0.25
5 5 0.00 0.50 0.25
6 5 -1.00 -0.50 0.25
11 10 -1.00 -0.50 0.25
5 4 -1.00 -0.50 0.25
X 60 56 -4 (D-mD)2=4
N 8 8 8
m=
X 7.50 7.00 mD=-0,5
N
(D mD ) 2 4
sD = sD = = 0.75
N 1 7
Not: n principiu, sub aspectul procedurii statistice, nu prezint nici o importan dac utilizm diferena
X1-X2 sau X2-X1. Ordinea depinde de ceea ce dorete s scoat n eviden cercettorul. Important este ca,
n final, s interpreteze corect rezultatul obinut, n funcie de semnul diferenei i semnificaia concret a
acestuia.
0,5
t= = 2.08
0,75 / 8
Raionamentul decizional
Mrimea efectului
m2 m1
d= (formula 3.25)
sD
Interpretarea indicelui d se face n conformitate cu recomandrile lui Cohen, astfel: 0.20, efect mic;
0.50, efect mediu, 0.80, efect mare.
Pentru exemplul nostru, indicele de mprime a efectului este:
m2 m1 7 7.50
d= = = 0.66
sD 0.75
Valoarea obinut indic o diferen medie-mare sau relativ important ntre mediile comparate
(semnul lui d nu are relevan). Aa cum se vede, este posibil s obinem un indice al mrimii efectului
59
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
mediu spre ridicat n condiiile unui rezultat nesemnificativ statistic. Acest lucru trebuie s ne atrag odat
n plus atenia asupra faptului c cele dou proceduri (testul statistic i mrimea efectului) vizeaz aspecte
diferite. Pentru exemplul nostru, vom concluziona c efectul terapiei este relativ important, dar nu are o
putere suficient penmtru a atinge pragul de semnificaie pe un lot de numai 8 subieci. Este mai mult dect
probabil c pe un eantion mai mare rezultatul ar atinge i pragul de semnificaie statistic.
n condiiile studiului nostru, decizia statistic de acceptare a ipotezei de nul a infirmat ipoteza
cercetrii dar analiza intervalului de ncredere poate ajuta la nelegerea mai bun a situaiei. nlocuind
valorile corespunztoare studiului nostru, obinem urmtoarele limite de ncredere:
limita inferioar: D = -0.5-(-3.4998)*0.26= +0.40
limita superioar D = -0.5+(-3.4998)*0.26=-1.4
Rezultatul arat c media diferenei la nivelul populaiei se afl, cu o probabilitate de 0.99 (sau
99%), ntre o limit inferioar=+0.40 i o alta superioar=-1.40. n acest caz, inferior se refer la o valoare
plasat n jumtatea stng a curbei t, unde valori inferioare sunt cele care se apropie de 0, care este media
diferenei de nul. Aa cum se constat, intervalul de ncredere cuprinde i valoarea 0, care exprim ipoteza de
nul (diferen nul). Acest lucru este concordant cu decizia statistic, n urma creia am admis ipoteza de nul
i am respins ipoteza cercetrii. O privire mai atent asupra datelor ar putea s i arate cercettorului c unul
dintre subieci a obinut un scor mai mare al anxietii dup terapie dect nainte de terapie, fapt care este
nefiresc i ar trebui analizat. Acest caz se pare ca a fost decisiv n neatingerea pragului de semnificaie. O
reluare a procesului de diagnostic psihologic cu subiectul n cauz poate, eventual, conduce la concluzia c
problemele lui sunt de alt natur (de ex., sufer de depresie i nu de anxietate) i c, n cazul su, terapia
respectiv nu are nici un efect. Refacerea calculelor cu scoaterea din eantionul de cercetare a acestui subiect
(numai dac acest lucru este bine motivat), va conduce, cu siguran, la un interval mai restrns de ncredere
pentru diferena dintre medii, ceea ce va nsemna o precizie de estimare mai ridicat i, implicit, poate, la
atingerea pragului de semnificaie.
Nu trebuie s omitem, de asemenea, faptul c n exemplul nostru este vorba de un eantion foarte
mic, iar eantioanele mici conduc la valori ridicate ale erorii standard a mediei i, prin aceasta, la intervale de
ncredere largi. n astfel de situaii riscul erorii de tip II (imposibilitatea de a pune n eviden diferene reale,
rezultat fals negativ) este mai mare. Dar, atunci cnd obinem rezultate semnificative pe eantioane mici, ele
pot prezenta un nivel de ncredere cu att mai mare. n acelai timp, eantioanele mici sunt instabile (n
exemplul nostru, o singur diferen pozitiv poate schimba rezultatul cercetrii), fapt care impune cel puin
replicarea cercetrii, pentru mai mult siguran.
60
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Publicarea rezultatului
Un psiholog i propune s scoat n eviden efectul stresului temporal (criza de timp) asupra
performanei de operare numeric. n acest scop, selecteaz un eantion de subieci crora le cere s
efectueze un test de calcule aritmetice n dou condiii experimentale diferite: prima, n condiii de timp
nelimitat, cu recomandarea de a lucra ct mai corect; a doua, n condiii de timp limitat, cu condiia de a lucra
ct mai repede i mai corect n acelai timp.
Rezultatele celor dou reprize sunt cele din tabelul alturat.
Fr Cu
criz de timp criz de timp
67 65
79 73
83 70
80 85
99 93
95 88
80 72
100 69
S se rezolve urmtoarele sarcini:
61
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Testarea asocierii dintre dou variabile msurate pe aceiai subieci
Am utilizat testul t pentru eantioane dependente pentru a evalua semnificaia diferenei dintre dou
medii, rezultate n urma msurrii unei variabile cantitative, pe un eantion de subieci (sau de subieci
pereche) aflat n dou situaii (condiii) diferite. Cele dou condiii reprezint valorile variabilei
independente, iar cercettorul este interesat s afle dac exist o diferen semnificativ ntre mediile
rezultate n fiecare dintre cele dou condiii. n concluzie, problema cercetrii ntr-o situaie de acest gen este
axat pe ideea de diferen ntre perechile de valori.
n practica cercetrii exist fie situaii n care nu suntem interesai de diferena dintre dou medii
rezultate pe acelai grup de subieci, ci de gradul de asociere dintre dou variabile msurate pe acelai grup
de subieci. fiecare variabil reprezentnd altceva. n acest caz cercettorul dorete s afle dac exist o
legtur ntre variaia valorilor unei variabile n raport cu cealalt variabil.
Pentru a nelege mai bine diferena dintre cele dou abordri statistice, s ne uitm puin n tabelele
de date de mai jos:
v1 v2 (a) n cazul diferenei dintre medii, valorile celor dou distribuii (v1 i
sub 1 7 4 v2) pentru un eantion de 5 subieci sunt condensate prin mediile lor (7 i 5), a
sub 2 9 5 cror diferen (7-5=2) este testat din punct de vedere al semnificaiei statistice.
sub 3 8 6
sub 4 6 7
sub 5 5 3
media 7 5
v1 v2 (b) n cazul corelaiei dintre valorile celor dou distribuii se urmrete
sub 1 7 4 punerea n eviden a modului n care se asociaz valorile perechi, adic n ce
sub 2 9 5 msur exist o legtur ntre fiecare valoare i perechea ei.
sub 3 8 6
sub 4 6 7
sub 5 5 3
ntr-o relaie de asociere ambele variabile sunt dependente una de alta, iar valorile lor pot fi
exprimate, fie cu aceeai unitate de msur, fie cu uniti de msur diferite. Iat cteva exemple de acest
gen:
exist o legtur ntre numrul atitudinilor pozitive pe care le manifest oamenii i numrul
atitudinilor pozitive pe care le primesc din partea celor din jur?
exist o legtur ntre timpul de reacie i nivelul extraversiunii, ca trstur de
personalitate?
exist o legtur ntre greutate i nlime?
exist o relaie ntre frecvena pulsului oferilor i viteza cu care conduc maina?
exist o relaie ntre numrul orelor de studiu la statistic i punctajul obinut la evaluri?
n toate aceste situaii avem cte dou variabile, ambele fiind dependente una n raport cu alta, n
sensul c este vizat existena unei concordane n variaia reciproc a valorilor celor dou variabile, iar testul
statistic utilizat se bazeaz pe calcularea unui coeficient de corelaie.
nainte de a fi un concept statistic termenul de corelaie este un cuvnt uzual n limbajul cotidian. n
esen, el exprim o legtur ntre anumite aspecte ale realitii, aa cum este ea reflectat n planul
observaiei directe. De exemplu, o parcare plin cu maini ne sugereaz c magazinul alturat este plin cu
cumprtori, ntre numrul de maini din parcare i numrul de cumprtori existnd o anumit corelare.
La nivel statistic, corelaia exprim o legtur cantitativ sistematic ntre valorile a dou variabile perechi,
msurate pe subieci aparinnd aceluiai eantion de cercetare. Coeficientul de corelaie este doar una dintre
procedurile statistice prin care se pune n eviden corelarea dintre variabile. n termeni generali, chiar i
testele t, prezentate anterior, pun n eviden (co)relaia (legtura) dintre o variabil dependent i valorile
unei variabile independente.
62
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Corelaia liniar
cov xy =
x* y
N (formula 3.27)
unde x i y sunt valorile perechi ale celor dou variabile, iar N este volumul eantionului.
Problema pe care o ridic coeficientul de covarian este legat de unitile de msur. Formula
poate fi aplicat numai dac valorile perechi sunt exprimate n aceeai unitate de msur, pentru ca produsul
lor s aib sens. Evident, nu am putea-o utiliza pentru a calcula coeficientul de covariaie ntre nlime i
greutate, de exemplu, deoarece este dificil s nelegem rezultatului unui produs dintre uniti de msur
diferite (greutate i lungime). Soluia problemei const n transformarea valorilor celor dou variabile n
scoruri standard, ceea ce produce un rezultat care nu mai are legtur cu unitatea de msur. Intensitatea
legturii dintre valorile a dou variabile se exprim prin coeficientul de corelaie liniar, notat cu simbolul r.
Introdus de Karl Pearson 19, acest coeficient mai este cunoscut i sub numele de coeficientul de corelaie
Pearson, sau al moment-produsului, dup expresia uneia din formulele de calcul.
Formula de definiie a coeficientului de corelaie este:
r=
z x * zy
N (formula 3.28)
unde zx respectiv zy sunt scorurile z ale variabilelor x i y, iar N este volumul eantionului.
Situaia de maxim corelaie posibil ntre cele dou distribuii este atunci cnd valorile lor sunt
identice. Dac ar fi aa, atunci valorile zx sunt egale cu valorile zy, iar formula 3.28 ar putea scris ca:
z
2
x
r= (formula 3.29)
N
n continuare, dac nlocuim n formula de mai sus expresia de calcul a lui z i facem toate
simplificrile posibile, ajungem n final la formula deja cunoscut a dispersiei. n consecin, din faptul c
dispersia unei distribuii z este ntotdeauna egal cu +1, rezult c valoarea maxim pe care o poate atinge
coeficientul de corelaie, n cazul unei corelaii pozitive perfecte, este r=+1. Corespunztor, n cazul unei
corelaii negative perfecte, conform aceluiai raionament, rezult c valoarea minim posibil a
coeficientului de corelaie este r= -1.
Plasarea valorilor corelate pe un grafic, produce o imagine intuitiv a relaiei dintre valori. Acest tip
de grafic se numete scatterplot.
19
Karl Pearson (1857-1936), matematician, filozof al tiinei, biometrician i statistician englez.
63
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Relaie direct Corelaie pozitiv
r = 1.00 r = .80 r = .20
+ + + z
| z | z | z z
| z | z z | z
| z | z | z z z
| z | z z | z z
|________________ |________________
n cazul unei corelaii pozitive valorilor mari ale unei variabile tind s le corespund valori mari le
celeilalte variabile. La limit, pentru o corelaie pozitiv perfect (r=+1) punctele de intersecie ale perechilor
de valori se plaseaz pe o linie dreapt, dinspre stnga jos spre dreapta sus, la un unghi de 45 de grade ntre
cele dou axe. Cu ct corelaia este mai mic, cu att norul de puncte este mai larg, dar forma elipsei indic
relaia pozitiv dintre cele dou variabile.
n imaginea de mai jos avem reprezentri scatterplot caracteristice pentru trei corelaii liniare
negative.
Relaie indirect- Corelaie negativ
r = -1.00 r = -.80 r = -.20
+ + +
| z | z | z z
| z | z | z z z
| z | z z z | z z z
| z | z | z z
|________________ |________________ |________________
- + - + - +
n cazul corelaiei negative, tendina este aceea ca valorilor mari ale unei variabile s le corespund
valori mici ale celeilalte variabile. Ca urmare, att linia corelaiei negative perfecte (r=-1), ct i diagonala
mare a elipsei norului de puncte al unei corelaii negative imperfecte, se orienteaz din stnga sus spre
dreapta jos a sistemului de coordonate.
n fine, atunci cnd corelaia dintre cele dou variabile este inexistent, norul punctelor de intersecie
are o form circular, care nu contureaz nici o tendin (r=0).
+ z
| z z
| z z z z
| z z
| z z z z
| z z z z
|________________
- +
De obicei, pentru a uura calcularea manual a coeficientului de corelaie, mai ales atunci cnd avem
date numeroase, sunt utilizate formule derivate din formula de definiie (formula 3.28), prin nlocuirea
expresiilor pentru scorul z.
r=
z x * zy
=
[( X m ) / s ]* [(Y m
x x y ) / sy ]
N N
Se deduce astfel o formul care, dei apare mai complicat, este mai uor de pus n practic,
deoarece se bazeaz pe valori care se obin prin calcule mai simple:
64
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
de unde obinem: r =
( X m ) * (Y m )
x y
(formula 3.30)
N * sx * s y
unde:
X i Y reprezint valorile individuale ale distribuiilor X i Y
mx i my reprezint mediile distribuiilor X i Y
sx i sy reprezint abaterile standard ale distribuiilor X i Y
N este volumul eantionului
Formula 3.30 este doar una dintre variantele utilizate. Ea poate fi utilizat pentru calcule, la fel de
bine ca i formula 3.28, obinndu-se rezultate identice. n general, pentru pstrarea acurateei rezultatului se
recomand pstrarea primelor patru zecimale ale fiecrei operaii de calcul dar, pentru exemplele didactice,
unde rezultatul nu are o finalitate real, se poate lucra i cu primele dou zecimale. Oricum, n final, valoarea
coeficientului r se raporteaz n mod obinuit cu doar dou zercimale.
n condiiile precizate pentru cercetarea propus ca exemplu, valoarea tabelar (critic) a lui r este
0.622. Dac am fi preferat un test bilateral, pentru acelai nivel al lui alfa, valoarea r critic ar fi fost 0.707.
EXEMPLU DE CALCUL
Vom lua n considerare cazul aplicrii celor dou teste de raionament de tip diferit. n acest caz,
ipoteza cercetrii se exprim n maniera: exist o legtur (corelaie) ntre cele dou tipuri de raionament,
cei care obin rezultate bune la unul din teste, vor tinde sa obin rezultate bune i la celalalt. Desigur,
ipoteza poate fi formulat i corespunztor unei corelaii negative, dac avem motive s presupunem acest
lucru.
65
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Scorul la testul Scorul la testul Produsul abaterilor de
de calcul aritmetic de raionament verbal la medie
X (x-mx) (x-mx)2 Y (y-my) (y-my)2 (x-mx)* (y-my)
25 -4.63 21.44 28 -1.88 3.53 8.70
32 2.37 5.62 27 -2.88 8.29 -6.83
40 10.37 107.54 41 11.12 123.65 115.31
29 -0.63 0.40 34 4.12 16.97 -2.60
31 1.37 1.88 25 -4.88 23.81 -6.69
16 -13.63 185.78 19 -10.88 118.37 148.29
28 -1.63 2.66 26 -3.88 15.05 6.32
36 6.37 40.58 39 9.12 83.17 58.09
= 237 =365.88 = 239 =392.88 =320,63
mX= 29.63 mY = 29.88
sX = 7.23 sY = 7.49
Pentru calcularea coeficientului de corelaie am ales, de data aceasta, formula 3.30, prin care,
nlocuind valorile, obinem valoarea coeficientului de corelaie:
r=
( X m )* (Y m ) =
x y 320.63
=
320.63
= +0.74
N * sx * s y 8 * 7.23 * 7.49 433.22
Graficul scatterplot pentru datele din exemplu este corespunztor unei asocieri pozitive ntre cele
dou variabile, norul de puncte urmnd o elips cu diagonala mare pe direcia stnga jos-dreapta sus:
45
40
35
30
25
X
20
15
10
5
0
0 10 20 30 40 50
Y
Decizia statistic
Valoarea calculat a lui r (+0.74) este mai mare dect valoarea critic (+0.62), fapt care ndreptete
respingerea ipotezei de nul. Ca urmare, acceptm ca semnificativ coeficientul de corelaie obinut. Datele
cercetrii susin ipoteza c ntre scorurile celor dou teste exist o legtur pozitiv semnificativ 20.
Corelaie i cauzalitate
Coeficientul de corelaie ne ofer informaii despre modul n care variaz valorile a dou variabile,
una n raport cu cealalt. Ca urmare, coeficientul de corelaie nu are o semnificaie cauzal dect dac cele
dou variabile au fost msurate ntr-un context care probeaz cauzalitatea. Iar acest lucru se petrece numai n
condiii de experiment.
Trebuie s reinem faptul c ceea ce exprim r este intensitatea corelaiei liniare, adic msura n
care norul de puncte reprezentat de intersecia valorilor perechi ale celor dou variabile poate fi reprezentat
de o linie dreapt. Asocierea de tip liniar este ns doar una dintre formele de aproximare a legturii dintre
variabile. n realitate, uneori, corelaia dintre dou variabile are o form care se abate de la modelul rectiliniu
20
n mod uzual, valorile lui r se raporteaz cu dou zecimale, chiar dac valorile tabelare i cele calculate de
programele statistice sunt cu mai mult de dou zecimale.
66
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
(are o form curb). Dac privim imaginile de mai jos, putem observa cteva tipuri posibile de curbe de
corelaie. Figurile a i b exprim corelaii perfecte, dar care se supun unui model curbiliniu, n timp ce figura
c reprezint o corelaie perfect rectilinie.
Relaiile curbilinii sunt calculate pe baza altor proceduri dect coeficientul Pearson (r), dar acestea
nu fac de regul obiectul de studiu al unei introduceri n statistica aplicat. S reinem totui c, dac am
calcula un coeficient r pentru distribuiile din figurile a i b, atunci valoarea acestora ar fi foarte mic i, cel
mai probabil, nesemnificativ, n ciuda asocierii grafice evidente a valorilor lor.
Pentru a nelege i mai bine acest fapt, oferim un exemplu ilustrativ. Am introdus valorile lui z i
probabilitile corespunztoare lor de pe curba normal, ntr-un program de prelucrri statistice. Forma
Distributia normala z (r=0)
normal a curbei obinute ne indic faptul c, dinspre partea
,6 stng a acesteia, valorile z devin din ce n ce mai mici (n
valoare absolut), corespunztor cu creterea probabilitii,
,5
pn la mijlocul curbei, unde z=0, iar probabilitatea este
,4 maxim. Mergnd mai departe, spre dreapta, valorile lui z
,3
ncep s creasc, concomitent cu reducerea probabilitii.
Coeficientul de corelaie calculat pentru un eantion de date
,2 ale celor dou variabile statistice este r=0, iar imaginea
,1
scatterplot a relaiei dintre ele este prezentat n figura
alturat 21:
0,0
p
-4 -3 -2 -1 0 1 2 3 4
Aa cum se observ, dei r=0, ceea ce indic absena oricrei corelaii liniare ntre variabile, curba de
distribuie arat o corelaie curbilinie perfect.
Din fericire, astfel de situaii sunt relativ rare n realitate, modelul corelaiei liniare fiind adecvat
pentru un mare numr de relaii dintre variabilele naturale, incluzndu-le i pe cele psihologice. Atunci cnd
exist suspiciuni consistente cu privire la natura liniar a legturii dintre variabile, se pot efectua anumite
transformri care s le aduc n cadrul unei variaii liniare (de exemplu, extragerea radicalului sau
logaritmarea variabilelor). Atunci cnd se raporteaz un coeficient de corelaie fr a se preciza caracterul
liniar sau curbiliniu, vom considera c acesta se refer la corelaia liniar.
Exemplul dat ne sugereaz faptul c graficul scatterplot ofer informaii suplimentare semnificative
i, din acest motiv, este recomandabil realizarea acestuia de fiecare dat cnd utilizm testul de corelaie
Pearson. Un argument spectaculos n sprijinul acestui aspect ne este oferit de Anscombe (1973), care a
realizat cele patru seturi de date din tabelul de mai jos:
21
Exemplul se bazeaz pe un eantion de 61 de perechi de valori, selectate de pe toat plaja distribuiei z
67
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
14,00 9,96 14,00 8,10 14,00 8,84 8,00 7,04
6,00 7,24 6,00 6,13 6,00 6,08 8,00 5,25
4,00 4,26 4,00 3,10 4,00 5,39 19,00 12,50
12,00 10,84 12,00 9,13 12,00 8,15 8,00 5,56
7,00 4,82 7,00 7,26 7,00 6,42 8,00 7,91
5,00 5,68 5,00 4,74 5,00 5,73 8,00 6,89
Coeficienii de corelaie dintre cele patru perechi de variabile (X1-Y1, X2-Y2, X3-Y3; X4-Y4) sunt
identici: r=0.81. i totui, dac sunt analizate reprezentrile scatterplot pentru fiecare dintre cele patru
perechi de variabile, imaginile ne ofer diferene importante cu privire la natura real a relaiei dintre ele:
14,00 14,00
12,00 12,00
10,00 10,00
x1
x2
8,00 8,00
6,00 6,00
4,00 4,00
4,00 5,00 6,00 7,00 8,00 9,00 10,00 11,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00
y1 y2
14,00 20,00
18,00
12,00
16,00
10,00
x3
x4
14,00
8,00
12,00
6,00
10,00
4,00 8,00
y3 y4
n cazul perechii X3-Y3, o valoare extrem a redus coeficientul de corelaie, iar n cazul perechii de
variabile X4-Y4, unde corelaia ar fi fost nul, ea este generat de o singur valoare extrem. Desigur, astfel
de efecte apar cu precdere n cazul eantioanelor de volum mic, dar grija pentru valorile extreme trebuie
meninut n toate cazurile.
Spre deosebire de testele t, introduse anterior, valoarea testului r este interpretabil prin ea nsi,
exprimnd intensitatea asocierii dintre variabile. Aa cum am spus deja, avem o corelaie perfect atunci
cnd r este egal cu +1 sau 1. Valoarea obinut pe exemplul nostru (+0.74) este destul de apropiat de +1.
Desigur, +0.74 este mai puin dect +1, dar i mai mult dect, s zicem, +0.32. O asemenea interpretare, dei
absolut corect, nu poate fi satisfctoare. Se simte necesitatea de a avea un criteriu de valorizare a
cuantificrii numerice a corelaiei. De-a lungul timpului au fost propuse diverse astfel de scale de valorizare,
prin atribuirea unor calificative coeficienilor de corelaie, n funcie de mrimea lor. Aceast problem
comport multe discuii, iar soluiile oferite de diferii autori sunt deseori diferite. Ca regul general, toi
autorii sunt de acord c valorile mai mici de 0.1 ale coeficienilor de corelaie trebuie s fie considerate
neglijabile, chiar i atunci cnd ating pragul de semnificaie statistic.
Oferim, cu caracter orientativ, modelul de descriere propus de Hopkins (2000) cu privire la
interpretarea valorilor coeficienilor de corelaie:
O alt variant de interpretare a mrimii efectului recunoscut este cea propus de Davis (citat de
Kotrlik i Williams, 2003):
naintea oricrui calificativ ns, prima condiie pentru a lua n considerare existena unei corelaii
ntre dou variabile rmne atingerea pragului de semnificaie (alfa). Dac valoarea lui r este mai mic dect
r critic (corespunde unui nivel p mai mare de 0.05, sau dect alt prag legitim decis de cercettor), existena
unei corelaii nu poate fi luat n considerare, indiferent de mrimea coeficientului r Pearson. Aceasta,
deoarece nu avem temei pentru a accepta c se ndeprteaz suficient de o valoare care ar fi putut decurge
prin jocul hazardului.
n cele din urm ce trebuie s lum n considerare, semnificaia sau intensitatea asocierii? Desigur,
rspunsul este unul relativ. Dac finalitatea studiului este aceea de a lua decizii, ca n cazul seleciei de
personal, de exemplu, se vor cuta valori ct mai mari ale coeficientului de corelaie (r). Dar dac obiectivul
este preponderent teoretic, de a pune n eviden relaii ascunse ntre variabile, atunci, indiferent de
mrimea lor, coeficienii de corelaie vor fi luai n considerare (desigur, dac sunt mai mari de 0.1).
Coeficientul de determinare
Valorile lui r trebuie considerate pe o scal ordinal. Ca urmare, nu este corect s afirmm c un
coeficient de corelaie de 0.40 este de dou ori mai mare dect un altul de 0.20. Dac dorim s comparm n
mod direct doi coeficieni de corelaie trebuie s ridicm valorile lui r la ptrat (r2), obinnd astfel ceea ce se
numete coeficient de determinare (prezentat n programele statistice i ca r squared). Acesta este
considerat un indicator mai adecvat al mrimii efectului, deoarece ia valori sensibili mai mici dect cele ale
coeficientului de corelaie. Pentru exemplul nostru, coeficientul de determinare este 0.742=0.55. Transformat
n procente, acest rezultat se interpreteaz astfel: 55% din variaia (mprtierea) uneia dintre cele dou
variabile este determinat de variaia celeilalte variabile. Sau, altfel spus, cele dou variabile au in comun
55% din variaia care le caracterizeaz, ceea ce nseamn c 45% din variabilitatea lor provine din alte surse.
Atenie, interpretarea procentual, n maniera prezentat, este valabil numai pentru coeficientul de
determinare. Coeficientul de corelaie (r) nu poate fi interpretat n nici un caz sub form procentual!
Cohen (citat de Kotrlik i Williams, 2003) a propus urmtoarea regul de evaluare a mrimii
coeficentului de determinare ca indice de mrime a efectului n cazul corelaiei:
Vom observa c valorile lui r corespunztoare celor trei praguri ale lui r2 sunt 0.14, 0.36 i,
respectiv, 0.50, ceea ce este n concordan cu recomandrile de mai sus pentru interpretarea lui r.
S reinem c mrimea efectului, care este, de fapt, nsi mrimea coeficientului r, depinde de dou
elemente principale:
- Caracterul liniar al relaiei dintre variabile. O component curbilinie a asocierii va conduce la valori
mai mici ale coeficientului de corelaie. Graficul scatterplot ne poate ajuta la evidenierea acestui
aspect.
- Variabilitatea distribuiilor comparate. Dac variabilele cercetate au o mprtiere redus, acest fapt
limiteaz posibilitatea de a obine valori ridicate pentru r.
Mrimea eantionului are efect doar asupra puterii testului (eantioanele mari conduc mai uor la
atingerea pragului de semnificaie), dar nu au un efect important asupra mrimii lui r.
69
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Atunci cnd calculm coeficientul de corelaie pentru valorile msurate pe un eantion, o facem,
desigur, cu scopul de a avea o estimare asupra gradului n care cele dou variabile au o variaie comun la
nivelul ntregii populaii. Deoarece calcularea corelaiei pe valorile populaiei este practic imposibil, tot
ce putem face este s o estimm, cu o anumit marj de eroare, prin utilizarea corelaiei pe eantion. Astfel,
n termeni formali, r (calculat pentru eantion) este o estimare pentru (ro), corelaia adevrat la nivelul
populaiei.
Pentru a se evita aplicarea acestei formule relativ greoaie, se poate utiliza un tabel (vezi n anex
tabelul Fisher de transformare n Z a valorilor lui r) care, chiar dac nu conine toate valorile intermediare,
este suficient pentru a acoperi nevoile practice.
S lum ca exemplu valoarea coeficientului de corelaie parial obinut de noi mai sus: r=+0.74. Ne
propunem s aflm care sunt limitele de ncredere ale acestei valori, adic s definim intervalul n care se
poate afla valoarea real a corelaiei la nivelul populaiei, cu o probabilitate asumat. De regul, aa cum
tim, aceast probabilitate asumat este de 0.05 sau, exprimat altfel, un nivel de ncredere de 95%.
Practic, aflarea limitelor se face n felul urmtor:
Se transform r calculat n valoare Z, citind tabela Fisher: n cazul nostru, pentru r=0.85 avem o
valoare Z=0.9505 (dac valoarea lui r nu se regsete ca atare n tabel, se poate face o medie a
valorilor apropiate). Pe o distribuie normal, cum este distribuia de eantionare Z, tim c
aproximativ 95% dintre valori se ntind ntre -1.96 i +1.96. Adic, pe o distan de aproximativ
dou abateri standard n jurul mediei (abaterea standard a valorilor Z fiind 1).
Se calculeaz eroarea standard a transformrii Z, cu formula:
1 1
re = = = 0,447 unde N este volumul eantionului
N 3 83
Se calculeaz limitele superioar i inferioar a intervalului: = r zcritic * re , adic:
Limita superioar (Z): 0.9505+1.96*0.447=+1.826
Limita inferioar (Z): 0.9505-1.96*0.447=+0.074
Limitele astfel calculate sunt exprimate n valori transformate Z, ori noi avem nevoie s tim limitele
n valori ale lui r. Pentru aceasta, facem acum transformarea invers, citind valorile lui Z n tabela Fisher,
corespunztoare celor dou limite de mai sus:
Limita superioara de ncredere pentru r=+0.95
Limita inferioar de ncredere pentru r=+0.07
n concluzie, valoarea adevrat (la nivelul populaiei) a corelaiei dintre cele dou variabile, se afl,
cu o probabilitate de 95%, n intervalul cuprins ntre +0.07 i +0.95. Limita inferioar este n apropierea unei
70
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
corelaii egale cu 0, iar limita superioar n vecintatea corelaiei perfecte, ceea ce ne arat o precizie de
estimare sczut. Acest fapt este normal, dac avem n vedere mrimea redus a eantionului, care determin
un nivel ridicat al erorii standard pentru r (prin faptul c se afl la numitorul formulei).
Dac analizm limitele intervalului de ncredere astfel obinute, pentru exemplul nostru, trebuie s
constatm c ele sunt foarte mari, n zona valorilor pozitive, dar avnd limita inferioar destul de aproape de
valoarea zero. Acest fapt conduce la concluzia c, dei este att mare i semnificativ statistic, coeficientul
obinut are o valoare mic de generalizare. Situaia este generat, n acest caz, de volumul extrem de mic al
eantionului. Amplitudinea intervalului de ncredere este direct dependent de volumul eantionului. Cu ct
N este mai mare, cu att valoarea erorii standard tinde s scad, ceea ce aduce limitele intervalului de
ncredere mai aproape de valoarea calculat a lui r.
S ne imaginm c am efectuat un calcul de corelaie pe 30 de subieci i am obinut r=0.30 (cnd
semnul corelaiei nu este specificat, se consider pozitiv). Limitele de ncredere pentru acesta sunt ntre -0.07
i +0.60, ceea ce arat c este nesemnificativ, dat fiind faptul c ntre cele dou limite este i valoarea zero,
aceea care este vizat de ipoteza de nul. Faptul c limita inferioar este foarte aproape de valoarea zero (la
numai 7 sutimi de ea), ne ndreptete s credem c, prin mrirea volumului eantionului de cercetare ar
putea fi atins nivelul de semnificaie statistic. Aceasta, deoarece n formula erorii standard a lui r volumul
eantionului se afl la numitor i, cu ct N va fi mai mare, cu att valoarea lui re va fi mai mic, iar limitele
intervalului de ncredere pentru r, mai aproape de r.
Tabelul urmtor arat care sunt limitele pentru exemplul dat, dac N ar crete, progresiv, pn la
100:
Niv. de Limite de ncredere
Pearson
N ncredere
r inferioar superioar
(%)
30 0,30 95 -0,07 0,60
40 0,30 95 -0,01 0,56
50 0,30 95 0,02 0,53
60 0,30 95 0,05 0,51
70 0,30 95 0,07 0,50
80 0,30 95 0,09 0,49
90 0,30 95 0,10 0,48
100 0,30 95 0,11 0,47
Utilitatea practic a acestor estimri de limite este dat de faptul c ne arat cu ct ar trebui s
cretem volumul eantionului pentru a obine un rezultat semnificativ al coeficientului de corelaie dintre
cele dou variabile. Aa cum se vede, dac am crete volumul eantionului la 50 de subieci, limita inferioar
ar trece deja peste valoarea zero. Celelalte linii din tabel prezint efectul de mrime al eantionului n cazul
creterii lui N pn la 100 de subieci.
S presupunem c ntr-o cercetare este evaluat corelaia dintre extraversie i agresivitate separat,
pentru brbai i pentru femei, obinndu-se o valoare r=0.50 pentru brbai i o valoare r=0.30 pentru femei,
ambii coeficieni fiind semnficativi. n acest caz ne-am putea pune problema dac cei doi coeficieni difer
semnificativ ntre ei, ceea ce ar nsemna c relaia dintre extraversie i agresivitate este mai ridicat la brbai
dect la femei.
Diferena dintre doi coeficieni de corelaie poate fi evaluat cu un test specific, care ia n
considerare nu doar diferena dntre valorile r, ci i mrimea eantioanelor i mrimea n sine a celor doi
coeficieni. De exemplu, avnd n vedere c semnificaia coeficienilor de corelaie depinde i de mrimea
eantionului, nseamn c o diferen de 0.1 ntre doi indici de corelaie poate fi nesemnficativ dac cei doi
r sunt 0.15 i 0.25, dar poate fi semnificativ dac valorile r comparate sunt 0.80 i 0.90.
71
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Modul de calcul al semnificaiei dintre doi coeficieni de corelaie va fi prezentat mai trziu, n
seciunea rezervat procedurilor SPSS.
Pentru a putea utiliza n mod legitim calculul de corelaie eantionul trebuie s fie aleatoriu, iar cele
dou variabile (ambele msurate pe scale de interval/raport) trebuie s aib o distribuie care s nu se abat
grav de la distribuia normal. Aceast condiie este cu att mai important cu ct eantionul este mai mic. O
atenie aparte trebuie acordat valorilor excesive, prezena acestora putnd avea efecte neateptate asupra
valorii coeficientului de corelaie (vezi exemplele lui Anscombe).
Analiza de corelaie este una dintre cele mai uzuale proceduri statistice n cercetarea psihologic.
Printre utilizrile cele mai comune menionm analiza consistenei i validitii testelor psihologice.
Consistena se refer la gradul n care un instrument de evaluare se concentreaz asupra unei anumite
realiti psihice. Validitatea, se refer la faptul dac ceea ce presupune c msoar un instrument psihologic
este msurat cu adevrat (de exemplu, o scal de anxietate msoar cu adevrat anxietatea?).
Din cele prezentate, rezult c putem utiliza coeficientul atunci cnd avem serii perechi de
distribuii. Pentru o mai bun nelegere, se cuvine s facem cteva aprecieri comparative cu testul t pentru
eantioane dependente. Testul t pentru eantioane dependente, se aplic atunci cnd msurm o anumit
variabil n dou situaii diferite (de ex. nainte/dup), ceea ce presupune aceeai unitate de msur.
Coeficientul de corelaie poate fi aplicat att pentru variabile msurate cu aceeai unitate de msur ct i
pentru variabile exprimate n uniti de msur diferite. Aceasta deoarece formula de calcul ia n considerare
expresia standardizat a valorilor (corurile z). ntrebarea este, cnd utilizm unul sau altul dintre cele dou
teste? Rspunsul ine de scopul pe care ni-l propunem. Dac dorim s punem n eviden diferena dintre
valorile medii ale variabilelor, vom aplica testul t pentru eantioane dependente. Dac ne intereseaz
intensitatea variaiei concomitente a variabilelor, vom utiliza coeficientul de corelaie.
Coeficientul de corelaie Pearson nu este singurul test al asocierii variabilelor. Exist o varietate de
teste de corelaie, utilizate pentru situaiile n care variabilele cercetate sunt msurate, fiecare, pe oricare
dintre scalele de murare.
NOT: Se precizeaz neaprat semnificaia valorilor variabilelor n raport de mrimea lor, pentru a se putea
aprecia corect natura relaiei dintre variabile.
Un eantion de 10 subieci a fost testat cu un test de inteligen de dou ori, pentru a se verifica
stabilitatea test-retest a instrumentului. Rezultatele, marcate cu I i II, sunt prezentate n tabelul urmtor:
72
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
I II
110 105
100 108
120 110
90 95
108 105
115 125
122 118
110 116
127 118
118 126
Testele statistice verific adevrul ipotezelor de cercetare prin testarea adevrului ipotezei statistice
(de nul). Atunci cnd ipoteza de nul este respins, ipoteza cercetrii este confirmat. Atunci cnd
ipoteza de nul este acceptat, ipoteza cercetrii nu se confirm.
Testul z pentru un singur eantion compar scorul z al unui eantion cu media populaiei din care
provine, pentru a testa dac eantionul face pare din acea populaie (numit de nul) sau nu.
Condiia limitativ a utilizrii testului z pentru un eantion este cunoaterea mediei populaiei.
Testul t pentru un eantion este similar cu testul z, dar se aplic n cazul eantioanelor mai mici de 30
de subieci.
Testul t pentru eantioane independente verific semnificaia diferenei dintre mediile a dou
eantioane formate din subieci diferii, care au fost evaluate n condiii distincte.
Respingerea ipotezei de nul n acest caz, nseamn acceptarea ipotezei c cele dou medii sunt
diferite, ceea ce este echivalent cu acceptarea ipotezei cercetrii care afirm existena unei relaii
ntre condiia testrii (variabila independent, msurat pe scal nominal, dihotomic) i rezultatul
msurat prin variabila dependent (msurat pe scal cantitativ).
Analiza de varian (ANOVA) testeaz diferena dintre mediile a mai mult de dou medii obinute pe
eantioane independente.
Testul ANOVA se bazeaz pe evidenierea diferenei dintre medii prin analiza variabilitii lor.
ANOVA este necesar n cazul comparrii a mai mult de dou medii deoarece compararea acestora
dou cte dou este nepermis, ca urmare a acumulrii excesive de eroare de tip I.
Testul t pentru diferena mediilor a dou eantioane dependente vizeaz situaiile n care aceiai
subieci au fost evaluai cu acelai instrument n situaii diferite. Variabila independent este
reprezentat de condiia n care are loc msurarea, iar variabila dependent este caracteristica care
face obiectul msurrii, fiind exprimat pe scal cantitativ.
Coeficientul de corelaie Pearson testeaz intensitatea asocierii de tip liniar dintre dou variabile
msurate pe aceiai subieci, n condiii diferite sau cu instrumente diferite. Coeficientul de corelaie
73
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
variaz ntre -1 i +1, care exprim corelaii maxime (negativ, respectiv pozitiv). Un coeficient de
corelaie egal cu 0 semnific absena oricrei asocieri ntre cele dou variabile.
6. Se accept ipoteza de nul deoarece t calculat (-1.92)este mai mic dect t critic (-2.04)
7. Ipoteza cercetrii nu se confirm. Rezultatele nu sus in ipoteza c tratamentul mpotriva fobiei
are vreun efect.
1. Ipoteza cercetrii: Stresul temporal diminueaz performana de calcul numeric. Ipoteza de nul:
Stresul temporal nu are nici un efect asupra performanei de calcul.
2. t critic=2.36
3. t calculat=2.29
4. Se accept ipoteza de nul
5. Se infirm ipoteza cercetrii
6. Un eantion de 8 subieci a fost supus unui test de calcul aritmetic n condiii de stres temporal i
n condiii fr stres. Nivelul performanei n condiii de stres a sczut (m=76.88) fa de condiii
lipsite de stres (m=85.38). Diferena nu s-a dovedit totui semnificativ statistic t(7)=2.29, p>0.05,
pentru alfa=0.05, bilateral.
74
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Observaie: n acest caz, rezultatul nesemnificativ al testului t este determinat de numrul mic de subieci.
Aa cum se observ, valoarea calculat a lui t este foarte aproape de t critic.
1. Ipoteza cercetrii: Scorurile obinute de subieci la cele dou aplicri vor fi concordante.
2. Ipoteza statistic: Scorurile nu vor fi concordante
3. Populaiile cercetrii sunt populaia subieci la prima aplicare i populaia de subieci la a doua
aplicare a testului.
4. Criteriile de decizie statistic: alfa 0.05 bilateral; df=10-2=8, r critic=063
5. r calculat=0.73
6. Decizia statistic: Se respinge ipoteza de nul.
7. Concluzia cercetrii: Scorurile sunt concordante de la o aplicare la alta.
Bibliografie minimal
Bibliografia de baz
Marian Popa, (2008), Statistic pentru psiholgie. Teorie i aplica ii SPSS, Polirom
Pagina web a cursului, la adresa: www.mpopa.ro
Bibliografie suplimentar
Clocotici, V., & Stan, A. (2000). Statistica aplicata in psihologie. Iasi: Polirom, (selectiv)
Rotaru, T. (coord.). (1999). Metode statistice aplicate in stiintele sociale. Iasi: Polirom.
(selectiv)
Vasilescu, I. P. (1992). Statistica informatizata pentru stiinte despre om (Vol. 1-2).
Bucuresti: Editura militara., (selectiv)
75
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
ANEXE TABELE STATISTICE
0 z
Valorile din tabel indic probabilitatea dintre 0 i z.
76
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
4.3 0.49999 0.49999 0.49999 0.49999 0.49999 0.49999 0.49999 0.49999 0.49999 0.49999
4.4 0.49999 0.49999 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
4.5 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
4.6 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
4.7 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
4.8 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
4.9 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.1 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.2 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.3 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.4 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.5 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.6 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.7 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.8 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
5.9 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
6 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000 0.50000
77
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Anexa 2. Tabelul valorilor critice pentru distribuia t Student (unilateral)
(sursa: http://www.psychology.ilstu.edu/psy138/tables.html)
78
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Anexa 3. Tabelul parial al distribuiei F pentru =0.05 22
(Sursa: Electronic Textbook, STATSOFT, Copyright StatSoft, Inc., 1984-1999)
df df intergrup (between)
intragrup
1 2 3 4 5 6 7 8 9 10
(within)
1 161.4476 199.5000 215.7073 224.5832 230.1619 233.9860 236.7684 238.8827 240.5433 241.8817
2 18.5128 19.0000 19.1643 19.2468 19.2964 19.3295 19.3532 19.3710 19.3848 19.3959
3 10.1280 9.5521 9.2766 9.1172 9.0135 8.9406 8.8867 8.8452 8.8123 8.7855
4 7.7086 6.9443 6.5914 6.3882 6.2561 6.1631 6.0942 6.0410 5.9988 5.9644
5 6.6079 5.7861 5.4095 5.1922 5.0503 4.9503 4.8759 4.8183 4.7725 4.7351
6 5.9874 5.1433 4.7571 4.5337 4.3874 4.2839 4.2067 4.1468 4.0990 4.0600
7 5.5914 4.7374 4.3468 4.1203 3.9715 3.8660 3.7870 3.7257 3.6767 3.6365
8 5.3177 4.4590 4.0662 3.8379 3.6875 3.5806 3.5005 3.4381 3.3881 3.3472
9 5.1174 4.2565 3.8625 3.6331 3.4817 3.3738 3.2927 3.2296 3.1789 3.1373
10 4.9646 4.1028 3.7083 3.4780 3.3258 3.2172 3.1355 3.0717 3.0204 2.9782
11 4.8443 3.9823 3.5874 3.3567 3.2039 3.0946 3.0123 2.9480 2.8962 2.8536
12 4.7472 3.8853 3.4903 3.2592 3.1059 2.9961 2.9134 2.8486 2.7964 2.7534
13 4.6672 3.8056 3.4105 3.1791 3.0254 2.9153 2.8321 2.7669 2.7144 2.6710
14 4.6001 3.7389 3.3439 3.1122 2.9582 2.8477 2.7642 2.6987 2.6458 2.6022
15 4.5431 3.6823 3.2874 3.0556 2.9013 2.7905 2.7066 2.6408 2.5876 2.5437
16 4.4940 3.6337 3.2389 3.0069 2.8524 2.7413 2.6572 2.5911 2.5377 2.4935
17 4.4513 3.5915 3.1968 2.9647 2.8100 2.6987 2.6143 2.5480 2.4943 2.4499
18 4.4139 3.5546 3.1599 2.9277 2.7729 2.6613 2.5767 2.5102 2.4563 2.4117
19 4.3807 3.5219 3.1274 2.8951 2.7401 2.6283 2.5435 2.4768 2.4227 2.3779
20 4.3512 3.4928 3.0984 2.8661 2.7109 2.5990 2.5140 2.4471 2.3928 2.3479
21 4.3248 3.4668 3.0725 2.8401 2.6848 2.5727 2.4876 2.4205 2.3660 2.3210
22 4.3009 3.4434 3.0491 2.8167 2.6613 2.5491 2.4638 2.3965 2.3419 2.2967
23 4.2793 3.4221 3.0280 2.7955 2.6400 2.5277 2.4422 2.3748 2.3201 2.2747
24 4.2597 3.4028 3.0088 2.7763 2.6207 2.5082 2.4226 2.3551 2.3002 2.2547
25 4.2417 3.3852 2.9912 2.7587 2.6030 2.4904 2.4047 2.3371 2.2821 2.2365
26 4.2252 3.3690 2.9752 2.7426 2.5868 2.4741 2.3883 2.3205 2.2655 2.2197
27 4.2100 3.3541 2.9604 2.7278 2.5719 2.4591 2.3732 2.3053 2.2501 2.2043
28 4.1960 3.3404 2.9467 2.7141 2.5581 2.4453 2.3593 2.2913 2.2360 2.1900
29 4.1830 3.3277 2.9340 2.7014 2.5454 2.4324 2.3463 2.2783 2.2229 2.1768
30 4.1709 3.3158 2.9223 2.6896 2.5336 2.4205 2.3343 2.2662 2.2107 2.1646
Anexa 4. Valorile critice pentru coeficientul de corelaie Pearson (r)
(sursa: http://www.psychology.ilstu.edu/psy138/tables.html)
Unilateral
Bilateral
df p=0.10 p=0.05 p=0.02 p=0.01
1 0,988 0,997 0,9995 0,9999
2 0,9 0,95 0,98 0,99
3 0,805 0,878 0,934 0,959
4 0,729 0,811 0,882 0,917
5 0,669 0,754 0,833 0,874
6 0,622 0,707 0,789 0,834
7 0,582 0,666 0,75 0,798
8 0,549 0,632 0,716 0,765
22
Tabelul este aplicabil pentru maxim 11 grupuri (dfBetween=10) i dfWithin maxim=30. Tabele complete pentru F se
gsesc n manualele recomandate n bibliografie.
79
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Unilateral
Bilateral
df p=0.10 p=0.05 p=0.02 p=0.01
9 0,521 0,602 0,685 0,735
10 0,497 0,576 0,658 0,708
11 0,476 0,553 0,634 0,684
12 0,458 0,532 0,612 0,661
13 0,441 0,514 0,592 0,641
14 0,426 0,497 0,574 0,623
15 0,412 0,482 0,558 0,606
16 0,4 0,468 0,542 0,59
17 0,389 0,456 0,528 0,575
18 0,378 0,444 0,516 0,561
19 0,369 0,433 0,503 0,549
20 0,36 0,423 0,492 0,537
21 0,352 0,413 0,482 0,526
22 0,344 0,404 0,472 0,515
23 0,337 0,396 0,462 0,505
24 0,33 0,388 0,453 0,496
25 0,323 0,381 0,445 0,487
26 0,317 0,374 0,437 0,479
27 0,311 0,367 0,43 0,471
28 0,306 0,361 0,423 0,463
29 0,301 0,355 0,416 0,456
30 0,296 0,349 0,409 0,449
35 0,275 0,325 0,381 0,418
40 0,257 0,304 0,358 0,393
45 0,243 0,288 0,338 0,372
50 0,231 0,273 0,322 0,354
60 0,211 0,25 0,295 0,325
70 0,195 0,232 0,274 0,302
80 0,183 0,217 0,256 0,283
90 0,173 0,205 0,242 0,267
100 0,164 0,195 0,23 0,254
80
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul II. Statistici infereniale. Teste parametrice
Anexa 5. Tabelul Fisher de transformare a valorilor r n scoruri Z
(Sursa: http://davidmlane.com/hyperstat/rtoz_table.html)
R Z r Z r Z R Z
0.0000 0.0000 0.2600 0.2661 0.5200 0.5763 0.7800 1.0454
0.0100 0.0100 0.2700 0.2769 0.5300 0.5901 0.7900 1.0714
0.0200 0.0200 0.2800 0.2877 0.5400 0.6042 0.8000 1.0986
0.0300 0.0300 0.2900 0.2986 0.5500 0.6184 0.8100 1.1270
0.0400 0.0400 0.3000 0.3095 0.5600 0.6328 0.8200 1.1568
0.0500 0.0500 0.3100 0.3205 0.5700 0.6475 0.8300 1.1881
0.0600 0.0601 0.3200 0.3316 0.5800 0.6625 0.8400 1.2212
0.0700 0.0701 0.3300 0.3428 0.5900 0.6777 0.8500 1.2562
0.0800 0.0802 0.3400 0.3541 0.6000 0.6931 0.8600 1.2933
0.0900 0.0902 0.3500 0.3654 0.6100 0.7089 0.8700 1.3331
0.1000 0.1003 0.3600 0.3769 0.6200 0.7250 0.8800 1.3758
0.1100 0.1104 0.3700 0.3884 0.6300 0.7414 0.8900 1.4219
0.1200 0.1206 0.3800 0.4001 0.6400 0.7582 0.9000 1.4722
0.1300 0.1307 0.3900 0.4118 0.6500 0.7753 0.9100 1.5275
0.1400 0.1409 0.4000 0.4236 0.6600 0.7928 0.9200 1.5890
0.1500 0.1511 0.4100 0.4356 0.6700 0.8107 0.9300 1.6584
0.1600 0.1614 0.4200 0.4477 0.6800 0.8291 0.9400 1.7380
0.1700 0.1717 0.4300 0.4599 0.6900 0.8480 0.9500 1.8318
0.1800 0.1820 0.4400 0.4722 0.7000 0.8673 0.9600 1.9459
0.1900 0.1923 0.4500 0.4847 0.7100 0.8872 0.9700 2.0923
0.2000 0.2027 0.4600 0.4973 0.7200 0.9076 0.9800 2.2976
0.2100 0.2132 0.4700 0.5101 0.7300 0.9287 0.9900 2.6467
0.2200 0.2237 0.4800 0.5230 0.7400 0.9505
0.2300 0.2342 0.4900 0.5361 0.7500 0.9730
0.2400 0.2448 0.5000 0.5493 0.7600 0.9962
0.2500 0.2554 0.5100 0.5627 0.7700 1.0203
81
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
UNIVERSITATEA DIN BUCURETI
26
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
CUPRINS
27
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
TESTE NEPARAMETRICE PENTRU DATE NOMINALE
Noiuni introductive
Testele neparametrice prezint, n raport cu cele parametrice, o serie de avantaje, dar i dezavantaje.
Se pot utiliza pe scale ale cror caliti de msurare sunt slabe (ordinale, nominale).
Pot fi utilizate n cazul variabilelor afectate de valori extreme care nu pot fi eliminate.
Utilizarea lor nu presupune condiii la fel de restrictive ca testele parametrice (normalitatea
distribuiei, omogenitatea varianei, etc.).
Pentru anumite proceduri, calculele sunt relativ simple i uor de efectuat, chiar i fr
utilizarea tehnicii de calcul.
Conceptele i metodele statisticii neparametrice sunt uor de neles.
Se bazeaz pe msurri pe scale nominale i ordinale, care sunt, prin natura lor, msurri
mai puin precise dect cele pe scale cantitative (de interval sau de raport).
Au o putere mai redus dect testele parametrice de a proba c ipoteza cercetrii este
adevrat.
Tind sa fie utilizate, datorit relativei lor simpliti, i n situaii n care se pot utiliza teste
parametrice. Este important s reinem faptul c, atunci cnd sunt ntrunite condiiile pentru
aplicarea unui test parametric, nu este recomandabil transformarea variabilei i utilizarea
unui test neparametric.
Dei se bazeaz pe calcule elementare, adesea acestea pot fi destul de complexe i de
laborioase.
Principiul care st la baza evalurii mrimii efectului pentru testele parametrice (proporia
explicat a varianei) nu este uor de aplicat n cazul testelor neparametrice. Ca urmare,
28
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
pentru multe dintre testele neparametrice nu se poate calcula un indicie de mrime a
efectului.
Distribuia binomial
Atunci cnd msurm o caracteristic pe o scal de tip cantitativ, obinem o valoare care descrie
mrimea acelei caracteristici. Uneori, ns, nu facem dect s observm msura n care acea caracteristic
este prezent ntr-un anumit context. De exemplu, observm caracteristica de gen (masculin, feminin) a
copiilor la natere, prezenaabsena efectului unei metode psihoterapeutice sau caracterul
corectgreit al rspunsului la o serie de ntrebri. n acest toate aceste cazuri naterea unui biat (sau
unei fete), prezena efectului, rspunsul corect sunt denumite evenimente despre care putem doar s
consemnm frecvena cu care apar ntr-o anumit serie de ncercri (nateri, subieci tratai cu metoda
respectiv, list de ntrebri).
Distribuia evenimentelor de tip dihotomic, fiecare avnd o anumit probabilitate de apariie,
constant de la o ncercare la alta, se numete distribuie binomial 1 . Caracteristicile distribuiei binomiale
difer n funcie de numrul ncercrilor (N) i de probabilitatea de apariie a evenimentului (P), vzut
ca ans teoretic de apariie a evenimentului, n raport cu toate evenimentele posibile. De exemplu, la
aruncarea unei monede, o singur dat (N=1), ansa (probabilitatea) teoretic de apariie a stemei este
P=1/2=0.5. Aceeai probabilitate caracterizeaz i evenimentul rspuns corect, dac rspundem la
ntmplare la o ntrebare cu dou variante de rspuns, dintre care una este corect iar alta greit.
1
Sau distribuie Bernoulli , dup numele matematicianului elveian Jakob Bernoulli (1654-1705).
29
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
0.5*0.5*0.5*0.5*=0.0625
Dac analizm toate cele 16 combinaii posibile, vom observa c avem urmtoarea distribuie
probabil pentru rspunsurile corecte:
0,375
0,4
0,3 0,25 0,25
0,2
0,1 0,0625 0,0625
0
0 1 2 3 4
Cu alte cuvinte, n cazul alegerii ntmpltoare a unui rspuns din dou posibile, pentru patru
ntrebri, probabilitatea niciunui rspuns corect este egal cu aceea pentru patru rspunsuri corecte (0.0625).
30
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Cea mai mare probabilitate o are situaia de a rezulta dou rspunsuri corecte (0.375), n timp ce
probabilitatea de a ghici 1 sau trei rspunsuri corecte este de 0.25. Nu putem s nu observm, de asemenea,
forma simetric a distribuiei 2 . n conformitate cu teorema Moivre-Laplace, distribuia binomial a apariiei
evenimentelor echiprobabile (P=Q=0.5) ntr-o serie de n de observaii independente, urmeaz forma
distribuiei normale. Sau, mai exact, dup standardizarea probabilitilor acestea corespund valorilor de sub
curba normal.
Dar ce s-ar ntmpla dac, n loc de 4 ntrebri, chestionarul nostru de statistic ar avea 12 ntrebri?
Distribuia binomial pentru N=12 este cea din graficul de mai jos:
0,25 0,2256
0,1934 0,1934
0,2
0,15 0,1208 0,1208
0,1
0,0537 0,0537
0,05 0,0161 0,0161
0,00020,0029 0,00290,0002
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Se observ creterea corespunztoare a numrului variantelor posibile i, n acelai timp, devine mai
evident tendina distribuiei de a semna cu una normal. n mod firesc, aceast tendin se accentueaz pe
msur ce numrul secvenelor de predicie crete.
Dar sunt i situaii n care P i Q nu sunt egale. De exemplu, dac variantele de rspuns la fiecare
ntrebare a chestionarului de statistic sunt n numr de patru, dintre care numai una este corect, atunci
probabilitatea rspunsului corect (P) este =0.25. n acest caz distribuia binomial nu este simetric la
valori mici ale lui N, dar tinde s devin simetric pe msur ce N crete. Nu exist un rspuns exact cu
privire la valoarea lui N pentru care distribuia binomial este aproximat suficient de bine de cea normal.
n general, se accept faptul c pentru P=0.5 N nu trebuie s fie mai mare de 20-25, n timp ce pentru P
apropiat de 0 sau 1 se impune o valoare pentru N de cel puin 100.
Din cele spuse rezult c se poate lua n considerare aproximarea distribuiei binomiale cu o
distribuie normal. Aceasta nseamn c putem exprima valorile z n termeni de N, P i Q. Formula original
pentru z ne amintim c este:
X
z=
X N *P
z=
N * P *Q
(formula 4.1)
Aceast formul poate fi utilizat pentru a afla ct ncredere putem avea n cazul n care am obine 8
rspunsuri corecte la un chestionar cu 10 ntrebri dihotomice:
8 10 * 0.5 85 3
z= = = = 1.897
10 * 0.5 * 0.5 2.5 1.581
Nivelul probabilitii de sub curba normal z, pentru valori ale lui z egale sau mai mari de 1.897 este
0.0294. Aceasta nseamn c putem respinge ipoteza de nul i s admitem c studentul nu a rspuns la
2
Distribuia binomial a fost descris de Abraham De Moivre n lucrarea Approximatio ad Summam Terminorum
Binomii in Seriem Expansi, publicat n 1733. Acelai autor a publicat i un manual pentru juctorii de noroc, n care
descrie principiile aritmetice pentru strategiile i probabilitile de ctig.
31
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
ntmplare. Vom observa ns, c putem accepta aceast concluzie numai dac, anterior calculelor, am ales o
decizie de tip unilateral, deoarece pentru o decizie bilateral ar fi fost necesar un nivel minim p=0.025.
Oricum, constatarea cea mai important n acest caz este aceea c utilizarea ntrebrilor cu rspuns dihotomic
nu este recomandabil, din cauza ansei prea mari de se obine un numr relativ ridicat de rspunsuri corecte
prin alegeri ntmpltoare.
S schimbm puin datele problemei i s punem la fiecare ntrebare nu dou, ci patru variante de
rspuns, dintre care numai una este corect. n acest caz, P=1/4=0.25 iar Q=3/4=0.75. Considernd un
chestionar format tot din 10 ntrebri, cu 8 rspunsuri corecte, i utiliznd formula 4.1, valoarea testului de
semnificaie este:
n aceste condiii este evident c ipoteza de nul se respinge, iar ipoteza c rspunsurile se bazeaz mai
mult pe cunotine dect pe hazard se accept. Fr s relum calculele, putem s ne dm seama c am obine
o valoare semnificativ chiar i pentru un numr mai mic de rspunsuri corecte. Desigur, acesta este un
exemplu didactic, n practic nefiind utilizate chestionare de cunotine cu un numr att de mic de ntrebri.
32
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Testul z pentru proporia unui eantion
Odat ce am gsit o modalitate de elaborare a distribuiei de nul pentru evenimente de tip binomial,
se pot elabora diverse teste de inferen statistic. Unul dintre acestea este testul z pentru proporii, care este
echivalentul pentru date nominale al testului z parametric pentru un singur eantion.
S ne imaginm situaia n care descoperim c, pe un eantion aleator de 100 de subieci dintr-o
anumit comunitate, procentul stngacilor este de 20%, n timp ce studiile la nivelul populaiei generale
indic un procent de stngaci de numai 15% . n acest caz ne putem pune ntrebarea dac la nivelul acelei
comuniti exist o anomalie a lateralitii.
Pentru a putea utiliza formula 4.1 pentru testarea direct a proporiilor, o supunem unei transformri
convenabile, prin mprirea simultan a numrtorului i numitorului cu N. Ca urmare, obinem urmtoare
formul:
pP
z=
PQ
N (formula 4.2)
Nivelul lui p pentru z=1.42 pe curba normal este de 0.0778, valoare care oblig la acceptarea
ipotezei de nul. Cu alte cuvinte, proporia stngacilor n comunitatea cercetat nu depete semnificativ
proporia la nivelul populaiei generale.
Testul z pentru proporii implic testarea semnificaiei unui procent observat n raport procentul
populaiei (atunci cnd este cunoscut), pentru evenimente de tip dihotomic. De exemplu, se poate rspunde la
ntrebarea dac un procent 55% de nou nscui biei este neobinuit de mare, tiind care este procentul
general al noilor nscui biei.
Pentru situaiile n care evenimentele cercetate nu sunt de tip dihotomic, se aplic alte teste statistice,
despre care vom vorbi mai trziu.
33
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
z=
( p1 p 2 ) ( P1 P2 )
(p p )
1 2
(formula 4.3)
unde:
p1 i p2 sunt proporiile evenimentului la nivelul eantioanelor
P1 i P2 sunt proporiile evenimentului la nivelul populaiei
(p1-p2) este eroarea standard a distribuiei de eantionare
Avnd n vedere ipoteza de nul (P1-P2=0), rezult c la numitor se va pstra doar diferena dintre
proporiile eantioanelor (p1-p2).
34
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
La rndul ei, eroarea standard de eantionare a diferenei proporiilor se calculeaz astfel:
p1 * q1 p 2 * q 2
(p p ) = +
1 2
n1 n2
(formula 4.4)
unde:
q1 i q2 sunt proporiile complementare ale lui p1, respectiv p2 (q1=1-p1, respectiv q2=1-p2)
n1 i n2 sunt volumele celor dou eantioane
Ca urmare, formula pentru testul diferenei dintre proporiile a dou eantioane independente devine:
p1 p 2
z=
p1 * q1 p 2 * q 2
+
n1 n2
(formula 4.5)
Aceast formul este adecvat atunci cnd eantioanele sunt suficient de mari (>30). n caz contrar,
numrtorul formulei suport o corecie, dup cum urmeaz:
1 1
p1 p 2
2 * n1 2 * n2
z=
p1 * q1 p 2 * q 2
+
n1 n2
(formula 4.6)
Pentru exemplul nostru, vom utiliza formula 4.5
35
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Dei, principial, este corect, se impune o anumit corecie a acestei formule, corecie util mai ales
pentru valori mici ale lui N. Dac privim graficele distribuiilor binomiale prezentate anterior vom observa
c, spre deosebire de curba normal z, acestea au un caracter discontinuu, cu treceri n trepte la o valoare
la alta. Din acest motiv se recomand aplicarea unei corecii de continuitate, prin scderea valorii 0.5 din
valoarea numrtorului, luat n sens absolut. Formula definitiv devine astfel:
X N * P 0.5
z=
N * P *Q
(formula 4.7)
Mai departe, nu ne rmne dect s nlocuim valorile i sa facem calculele pentru studiul nostru:
3
Arbuthnot, John. (1710), "An Argument for Divine Providence, Taken From the Constant Regularity Observed in the
Births of Both Sexes," Philosophical Transactions, 27, 186-190.
36
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Testul semnului (denumit astfel pentru c ia n considerare doar sensul variaiei, nu i valoarea ei)
este utilizabil ca substitut al testului t pentru eantioane dependente n cazul datelor msurate pe scal
nominal dihotomic.
(1) ntr-un experiment de psihologie social, participanilor (N=35) li s-a cerut s citeasc
un pasaj care conine o dilem a crei soluie este apoi descris. Subiecilor li s-a cerut apoi s
indice nivelul de susinere pe care l manifest fa de soluia propus, pe o scal de la 1 (foarte
puternic mpotriv), la 7 (foarte mult n favoarea soluiei). n continuare, au loc discuii pe tema
soluiei, dup care subiecilor li se cere s i exprime din nou gradul de susinere. Rezultatele
indic faptul c, n urma discuiilor, un numr de 30 de subieci i-au modificat gradul de susinere
iniial a soluiei. Problema cercetrii este dac discuia n grup are un efect asupra opiniei
participanilor.
(2) ase studeni de la facultatea de arte plastice au fost pui s picteze dou tablouri, pe o
tem imaginar. ntr-un caz au lucrat n condiii de linite, n cel de-al doilea caz au avut un fond
sonor de muzic clasic. Lucrrile lor au fost evaluate de un profesor, care a apreciat c 5 dintre
studeni au pictat mai creativ n condiii de muzic dect n condiii de linite. Se poate concluziona
c muzica clasic favorizeaz creativitatea artistic, pentru alfa=0.05, bilateral? (utilizai Tabelul
3.1 din Anexe)
Distribuia multinomial
z2 =
( X N * P )2
N * P * Q (formula 4.8)
Dac, nainte de ridicarea la ptrat, z urmeaz o distribuie normal, dup ridicarea la ptrat
z urmeaz un alt tip de distribuie, numit chi-ptrat i simbolizat cu litera greceasc cu
indicele de ridicare la ptrat ( 2). Fr a intra n amnunte, vom preciza c distribuia 2 prezint
urmtoarele caracteristici:
este, la fel ca distribuia normal, o familie de distribuii;
are form asimetric;
are originea n zero (din cauza ridicrii la ptrat);
are o form dependent de numrul de grade de libertate.
Imaginea de mai jos prezint dou distribuii chi-ptrat, pentru 4, respectiv, 10 grade de
libertate.
nainte de a merge mai departe, s analizm puin, datele sugerate de exemplul de mai sus.
Aa cum am spus, ponderea studenilor la facultatea de psihologie este, n funcie de tipul de liceu
absolvit, de, respectiv, 60, 30, 10. Aceste valori se numesc frecvene observate sau frecvene
calculate (notate cu fo de la Observed), fiind cele consemnate n cadrul studiului. La rndul lor,
frecvenele corespunztoare distribuiei de nul, cele care se refer, n acest caz, la ponderea
absolvenilor de liceu n general, se numesc frecvene ateptate (notate cu fe de la Expected).
Raportul dintre aceste dou categorii de frecvene se afl la baza testului de semnificaie statistic
numit chi-ptrat, despre care vorbim mai departe.
Testul chi-ptrat
38
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
nainte de a trece la testul propriu-zis, este util s aruncm o privirea asupra modului de organizare a
datelor pentru o situaie similar exemplului de mai sus. n acest scop, putem s ne permitem o lrgire a
cadrului de investigare. S presupunem c avem cele trei categorii de liceu i ne intereseaz distribuirea lor,
nu n legtur cu o singur facultate (cea de psihologie), ci n legtur cu trei tipuri de faculti: umaniste,
artistice i tehnice.
Dac realizm un cadru de reprezentare sintetic al valorilor celor dou variabile, obinem ceea ce se
numete un tabel de coresponden. Iat cum ar arta un astfel de tabel, pentru un set de date ipotetice:
Acesta este un tabel de coresponden pentru dou variabile nominale, fiecare avnd cte trei valori
distincte (categorii) 4 . Valorile din celule reprezint numrul de cazuri (frecvenele observate) care corespund
fiecrei combinaii dintre categoriile celor dou variabile. Totalul pe linii exprim numrul de studeni din
fiecare facultate, consemnai n cercetare, indiferent de tipul de liceu absolvit, totalul pe coloane, exprim
numrul de absolveni din fiecare tip de liceu, indiferent de facultatea la care sunt nscrii, iar la intersecia
celor dou totaluri regsim totalul general al subiecilor cercetrii (N=264).
Avnd un numr de 95 de studeni n faculti umaniste, aceast nseamn c ei reprezint 36% din
totalul subiecilor cercetrii (95/264*100=36). Acest procent indic se refer la absolvenii care au ales o
facultate de tip umanist, indiferent de liceul absolvit. n mod similar, calculm procentele corespunztoare
celorlalte tipuri de faculti. Valorile astfel calculate, pentru fiecare linie a tabelului, se numesc frecvene
marginale.
Dac alegerea facultii nu ar avea nici o legtur cu tipul de liceu absolvit atunci, n mod normal, ar
trebui s regsim, pentru fiecare tip de liceu, acelai procent care exprim ponderea studenilor din fiecare
facultate n totalul subiecilor cercetai. Avnd procentele studenilor din fiecare facultate i numrul
absolvenilor din fiecare tip de liceu, putem calcula frecvenele teoretice (ateptate) pentru fiecare celul a
tabelului. De exemplu, dintre cei 79 de absolveni de liceu umanist consemnai de cercetare, 36% ar trebui s
se afle n faculti umaniste, ceea ce nseamn: (79*36)/100=28.4. n mod similar, ar trebui s avem 32.5%
(25.6) n faculti tiinifice i 31.5% (24.8) n faculti artistice. Acelai raionament se aplic mai departe i
celorlalte tipuri de liceu, cu utilizarea procentului corespunztor fiecrei faculti. Precizm c frecvenele
teoretice (ateptate) vor fi aceleai, n fiecare celul, chiar dac vor fi calculate pe baza frecvenelor
marginale de pe coloane.
4
n mod similar, se pot crea tabele de coresponden pentru variabile categoriale avnd, fiecare, un numr diferit de
valori (categorii).
39
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Aa cum constatm, ntre frecvenele observate i cele ateptate sunt diferene. Suma frecvenelor
ateptate (teoretice) este egal cu suma frecvenelor observate (poate rezulta o anumit diferen ntre
totaluri, ca urmare a aproximrii zecimalelor).
n final, problema cercettorului este aceea de a stabili dac ntre frecvenele observate i cele
teoretice (calculate) este o diferen care s justifice aprecierea c ntre cele dou variabile exist sau nu o
legtur. Datele de acest gen nu mai pot fi analizate prin prisma distribuiei binomiale, deoarece implic mai
mult dect dou evenimente posibile. De aceea, distribuia acestora se numete distribuie multinomial.
Desigur procedura de calcul pentru acest caz ar putea urma modelul celei binomiale dar, din cauza
complexitii ei, s-a apelat la o soluie mai simpl. Aceast soluie este fundamentat pe o aproximare
derivat din formula binomial a lui z, care este pur si simplu ridicat la ptrat, devenind:
z 2
=
( X N * P)
2
N * P *Q (formula 4.8)
Dac nainte de ridicarea la ptrat z urmeaz o distribuie normal, dup ridicarea la ptrat z urmeaz
un alt tip de distribuie, numit chi-ptrat, simbolizat cu litera greceasc cu indicele de ridicare la ptrat
(2). Fr a intra n amnunte, vom preciza c distribuia 2 prezint urmtoarele caracteristici:
este, la fel ca i distribuia normal, o familie de distribuii;
are form asimetric;
are originea n zero (din cauza ridicrii la ptrat);
are o form dependent de numrul de grade de libertate.
( fO f E )2
= 2
fE (formula 4.9)
Decizia pentru testul chi-ptrat se bazeaz pe compararea valorii calculate cu o valoare critic,
corespunztoare nivelului alfa ales (0.05 sau, opional, mai mic). Valorile critice pentru distribuia chi-ptrat
se gsesc ntr-o tabel special (vezi anexa 6). Dac valoarea calculat a lui 2 este egal sau mai mare dect
valoarea critic pentru nivelul ales al lui alfa, atunci ipoteza de nul poate fi respins, iar ipoteza cercetrii
confirmat.
Pe aceast structur formal se bazeaz dou variante distincte ale testului chi-ptrat: testul
corespondenei (Goodness of Fit) i testul asocierii. Primul, compar frecvenele observate ale valorilor unei
singure variabile cu frecvenele ateptate pentru acele valori. Al doilea, compar frecvenele valorilor
observate pentru dou variabile cu frecvenele lor ateptate, cu scopul de a testa relaia (asocierea) dintre cele
dou variabile.
Aceast variant a testului chi-ptrat compar frecvenele observate ale unei distribuii cu
frecvenele teoretice (ateptate) ale acelei variabile. De exemplu, dac avem frecvenele unei variabile putem
afla dac aceasta se distribuie dup curba normal (z), prin compararea cu frecvenele cunoscute ale acestei
distribuii (aria de sub curb).
40
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
S presupunem c a fost aplicat un test de cunotine unui eantion de 200 de elevi, care a fost
evaluat cu calificative, astfel: F.Slab, Slab, Mediu, Bun, F.Bun.
Problema cercetrii: Calificativele obinute se distribuie normal la nivelul clasei?
Populaia 1: Calificativele obinute de elevi.
Populaia 2: Calificativele, aa cum s-ar distribui pe o curb normal: FS=2.5%, B=14%, M=67%,
B=14% i FB=2.5% (procentele sunt cele tipice unei curbe z, mprite n cinci clase valorice).
Ipoteza cercetrii (H1): Distribuia calificativelor urmeaz legea curbei normale la nivelul
eantionului de elevi.
Ipoteza de nul (H0): Distribuia calificativelor nu urmeaz legea curbei normale n rndul
elevilor examinai.
Frecvena ( fO f E )2
Frecvena ateptat
Calificativ observat
(fE) fE
(fO)
(10 5) 2
FB 10 2.5% din 200 =5 = 5.00
5
(34 28) 2
B 34 14% din 200 =28 = 1.29
28
(140 134) 2
M 140 67% din 200 =134 = 0.27
134
(10 28) 2
S 10 14% din 200 =28 = 11.57
28
(6 5) 2
FS 6 2.5% of 200 =5 = 0.20
5
( f f E )2
200 - 2 = O = 18.33
fE
Decizia statistic:
2 calculat (18,33) este mai mare dect 2 critic (9,48)
Respingem ipoteza de nul i tragem concluzia c distribuia calificativelor urmeaz forma curbei
normale.
Concluzia statistic poate fi interpretat, n acest caz, ca fiind negativ din punctul de vedere al
eficienei procesului didactic. n mod normal, dac activitatea de nvare ar fi eficient, rezultatele elevilor
ar trebui s se distribuie asimetric negativ, adic cu tendin de grupare a valorilor spre calificativele
superioare. Rezultatele procesului de nvare nu se distribuie normal, nefiind un proces natural, ci unul
n care valorile (calificativele) sunt supuse unei influene sistematice (prin efortul profesorilor i al elevilor
nii) nspre valorile mari.
Facem, nc o dat, precizarea c aceast form a testului chi-ptrat se aplic atunci cnd vrem s
comparm frecvene observate cu frecvene teoretice (ateptate), pe care le cunoatem deja. El este
echivalentul testului z pentru proporii pentru distribuia binomial, cu specificaia c se utilizeaz atunci
cnd avem mai mult de dou categorii. Testul chi-ptrat pentru gradul de coresponden (goodness of fit) nu
are un indice de mrime a efectului.
41
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Iat cteva exemple posibile de cercetri ale cror date pot fi analizate cu testul chi-ptrat al gradului
de coresponden:
Vrem s tim dac exist o preferin pentru o anumit categorie de muzic (clasic,
popular, pop-rock). n acest caz, dac distribuia preferinelor nu ar fi influenat de nici o anumit
preferin (ipoteza de nul) atunci frecvena ateptat (teoretic) pentru fiecare gen muzical ar trebui s fie
echivalent cu 100/3=33.3% numrul subiecilor. Mai departe, nu ne rmne dect s testm diferena dintre
cele dou categorii de frecvene (teoretice i observate), conform modelului de calcul de mai sus.
ntr-un studiu asupra relaiei dintre atractivitate i preferina pentru profesori, unui numr de
studeni li se prezint fotografiile preselectate ale unor ase poteniali profesori, ale cror portrete sugereaz
grade diferite de atractivitate, i li se cere s aleag dintre acetia pe cel pe care ar dori s l aib ca profesor.
Dac gradul de atractivitate nu are nici un impact asupra preferinei ca profesor, atunci frecvenele cu care
sunt alese fotografiile ar trebui s fie egale (100/6=16.6%).
ntr-un studiu de marketing, o companie trebuie s aleag dintre patru propuneri imagini.
Acestea sunt prezentate unui eantion de subieci i se consemneaz numrul de preferine exprimate pentru
fiecare imagine. Dac toate ar avea acelai impact, atunci numrul de preferine ar trebui s fie egal (25%,
pentru fiecare imagine).
Vrem s tim dac exist o preferin pentru un anumit gen muzical (clasic, popular,
dance, rock) printre cei 200 de studeni ai facultii de psihologie. n acest caz, dac distribuia
preferinelor nu ar fi afectat de nici o preferin (ipoteza de nul), atunci frecvena ateptat
(teoretic) pentru fiecare din cele patru genuri muzicale este 25% numrul subiecilor (100%
mprit la cele patru genuri muzicale), adic exact 50 pentru fiecare gen muzical. n realitate,
preferinele exprimate de studeni se distribuie astfel: muzic clasic=30; muzic popular=15;
muzic dance=100; muzic rock=55. Problema cercetrii este dac exist o distribuie preferinial
pentru genurile muzicale, n rndul studenilor de la psihologie (pentru alfa=0.5). 5
Aceast variant a testului chi-ptrat este mai frecvent utilizat. Ea compar frecvenele observate
ale unei distribuii (variabile) cu frecvenele corespondente ale altei distribuii (variabile), ambele msurat pe
scale de tip categorial, cu scopul de a vedea dac exist o relaie ntre cele dou variabile. S presupunem c
avem rezultatele la testul de statistic (msurate pe o scal ordinal i notate, convenional, cu A, B, C, D, E,
unde A reprezint nivelul de performan cel mai ridicat iar E, cel mai sczut).
Problema cercetrii: Dorim s aflm dac exist o diferen semnificativ ntre biei (M) i fete (F)
la testul de statistic.
Ipoteza cercetrii: Distribuia performanei depinde de genul masculin sau feminin.
Ipoteza de nul: Rezultatele la testul de statistic nu au legtur cu variabila sex.
Determinarea criteriilor de decizie statistic:
alegem =0.05
df=(2-1)*(5-1)=4
citim valoarea critic pentru 2 n tabela pentru distribuia 2:
5
Datele sunt fictive.
6
Cunoscut i sub numele testul chi-ptrat Pearson al asocierii, a fost elaborat de Karl Pearson.
42
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
2
critic= 9.49
Frecvenele marginale sunt: 200 (57.14%) pentru biei i 150 (42.86%) pentru fete
Dac performana la test nu are nici o legtur cu genul subiecilor, trebuie s regsim aceste
procente pentru fiecare dintre calificativele acordate.
Aceasta nseamn c, teoretic, n celula A/Masculin, ar trebui s gsim, proporional, tot atia biei
ci sunt pe ntregul lot (57.14%). Adic (20*57.14)/100=11.42, care reprezint frecvena ateptat
pentru celula respectiv din tabelul de coresponden.
La fel, pentru celula A/Feminin ar trebui s avem 42.86% din totalul pentru feminin, adic:
(20*42.86)/100=8.52.
n acelai mod de calculeaz frecvenele observate pentru fiecare celul a tabelului.
Pentru o mai uoar nelegere a mecanismului de calcul, vom rearanja tabelul astfel:
Frecvena ( fO f E )2
Celule observat Frecvena ateptat
(fO) fE
(10 11.43) 2
Masculin A 10 (20*57.14)/100=11.43 = 0.18
11.43
(34 37.71) 2
Masculin B 34 (66*57.14)/100=37.71 = 0.36
37.71
(140 135.42) 2
Masculin C 140 (237*57.14)/100=135.42 = 0.15
135.42
(10 9.14) 2
Masculin D 10 (16*57.14)/100=9.14 = 0.08
9.14
(6 6.29) 2
Masculin F 6 (11*57.14)/100=6.29 = 0.01
6.29
(10 8.57) 2
Feminin A 10 (20*42.86)/100=8.57 = 0.24
8.57
(32 28.29) 2
Feminin B 32 (66*42.86)/100=28.29 = 0.49
28.29
(97 101.58) 2
Feminin C 97 (237*42.86)/100=101.58 = 0.21
101.58
(6 6.86) 2
Feminin D 6 (16*42.86)/100=6.86 = 0.11
6.86
(5 4.71) 2
Feminin F 5 (11*42.86)/100=4.71 = 0.02
4.71
( fO f E )2
2 = = 1.85
350 fE
7
Datele din acest exemplu nu se refer la o situaie real.
43
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
2 2
Se compar critic (9.49) cu calculat (1.85) pentru df = (2-1)(5-1) = 4
Valoarea calculat a testului este mai mic dect valoarea critic, ca urmare, acceptm ipoteza de
nul. Rezultatele la test nu confirm ipoteza c rezultatele se distribuie n funcie de apartenena de
gen a subiecilor.
Cele dou variabile nu trebuie s se intersecteze (s nu existe subieci care s fie inclui n mai
mult de o celul de tabel)
Selecie aleatoare a eantioanelor
Este recomandabil ca frecvena ateptat s nu ia valori mai mici de 5 (sau, cel puin, n nu mai mult
de 20% din celule).
Nici o celul nu trebuie s aib frecvena ateptat mai mic de 1.
Pentru situaiile n care frecvenele ateptate sunt mai mici dect specificaiile de mai sus, sau atunci
cnd tabelul de coresponden dintre variabile are dou linii i dou coloane, se recomand aplicarea unei
corecii la formula de baz. Aceasta se numete corecia Yeates i const n scderea unei constante (0.5)
din expresia de la numrtor, luat n valoare absolut:
= 2
(f O f E 0.5)
2
fE (formula 4.10)
Testul chi-ptrat al asocierii se utilizeaz atunci cnd dorim s testm relaia dintre dou variabile,
ambele msurate pe scal de tip categorial. Facem precizarea c variabilele categoriale dei sunt, de regul,
de tip nominal, pot fi att ordinale ct i de interval sau de raport. Ceea ce caracterizeaz o variabil
categorial nu este att scala de msurare, ct faptul c primete puine valori, care mpart distribuia n
categorii de valori. De exemplu, ntr-un studiu cu privire la relaia dintre gravitatea accidentelor de circulaie
(fr rnii, cu rnii uor, cu rnii grav, cu mori) i puterea motoarelor (1400 cm3, 1600 cm3, 2000
cm3, 2500 cm3, 3000 cm3), ambele variabile sunt de tip categorial, dar prima este pe scal nominal, iar a
doua pe scal cantitativ.
Testul chi-ptrat al asocierii (independenei) poate fi vzut ca un veritabil test de corelaie pentru
date categoriale. De asemenea, poate fi folosit n locul testului t sau ANOVA, dac nu sunt ndeplinite
condiiile pentru variabila dependent. ntr-un asemenea caz, variabila dependent cantitativ se transform,
prin gruparea n frecvene, n variabil de tip categorial. Aceast opiune se va alege numai dac ne aflm n
faa unei flagrante violri a condiiei de normalitate, deoarece testele parametrice au o putere mai mic dect
cele neparametrice. La fel ca i n cazul altor teste statistice, nu se vor putea trage concluzii de tip cauzal
dect numai dac variabilele sunt msurate n contextul unui experiment psihologic.
Coeficientul (fi)
Atunci cnd utilizm testul pentru asocierea variabilelor, valoarea 2 certific faptul c cele dou
variabile sunt relaionate. Dar mrimea lui 2 nu ne spune nimic cu privire la intensitatea relaiei dintre
variabile. De fapt, mrimea lui 2 este n funcie de N. Dac multiplicm frecvenele celulelor cu o constant,
valoarea lui 2 se multiplic i ea cu acea constant, singura consecin fiind aceea c se diminueaz
probabilitatea ca valoarea respectiv s fie obinut din ntmplare. Pentru completarea interpretrii valorii 2
este necesar un indicator suplimentar, care s ne spun ceva i despre intensitatea legturii, nu doar despre
semnificaia acesteia. Un astfel de indicator este coeficientul (fi), care se calculeaz pentru asocierea
variabilelor care prezint fiecare doar dou valori posibile (tabele de contingen 2x2).
Formula dup care se calculeaz este:
44
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
2
= (formula 4.11)
N
Coeficientul Cramer
Coeficientul este adecvat doar pentru tabelele de contingen de tip 2x2, cnd ambele variabile
sunt dihotomice. O uoar modificare a acestuia, denumit Cramer, l face utilizabil pentru intensitatea
asocierii dintre variabile avnd un numr diferit de categorii.
Indicele Cramer se calculeaz dup formula:
2
c = (formula 4.11 bis)
N ( L 1)
unde:
N este volumul eantionului
L este valoarea cea mai mic dintre numrul liniilor sau al coloanelor tabelului de
coresponden (de exemplu, pentru un tabel de coresponden 4x3 - patru linii i patru
coloane - L are valoarea 3-1=2).
n cazul coeficienilor , dac frecvenele fiecrei celule din tabelul de coresponden sunt
multiplicate cu o constant, att 2 ct i N cresc concomitent, iar valoarea coeficientului rmne aceeai.
Coeficientul se modific numai dac se modific i raporturile dintre proporii, ceea ce nseamn c
mrimea lui nu este influenat de N. El reprezint un indicator numeric al intensitii relaiei i poate lua
valori ntre zero - absena relaiei i unu - relaie perfect ntre cele dou variabile. De exemplu, pentru testul
chi-ptrat al asocierii dintre gen i performana la testul de statistic (care a rezultat nesemnificativ), al crui
tabel de coresponden este de forma 2x5, valoarea coeficientului c este:
2 1.85
c = = = 0.07
N (2 1) 350
Interpretarea coeficienilor
Valoarea coeficientului se asociaz interpretrii testului chi-ptrat, atunci cnd acesta este
semnificativ, pentru a aduga o informaie suplimentar cu privire la intensitatea relaiei. Prin ridicarea la
ptrat a expresiei de calcul, coeficientul 2 poate fi interpretat procentual, la fel ca i coeficientul de
determinare (r2), indicnd proporia variaiei unei variabile determinat de variaia celeilalte variabile. n
cazul nostru, numai 0.4% (0.072*100) din variaia calificativelor la testul de statistic este explicat prin
diferena de gen (masculin/feminin), ceea ce, n conformitate cu decizia statistic, s-a dovedit a fi
nesemnificativ.
n conformitate cu recomandrile lui Cohen, cit. de Kotrlik i Williams (2003), valorile lui vor fi
interpretate dup cum urmeaz:
Raportarea rezultatului
n cazul testului 2 elementele care vor fi incluse n raport sunt urmtoarele: gradele de libertate,
valoare testului, nivelul p i coeficientul sau Cramer . n varianta narativ, pentru exemplul de mai sus,
prezentarea rezultatelor ar putea avea urmtoarea form:
Rezultatele testului de statistic, evaluate pe cinci clase valorice (A,B,C,D,E) au fost comparate pe
sexe. Testul 2 pentru asocierea variabilelor indic faptul c rezultatele nu difer semnificativ n funcie de
gen, 2(4) = 1.85, p >0 .05, cu un coeficient =0.07, care indic o asociere slab.
45
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
n cazul n care testul ar fi fost semnificativ, raportarea rezultatelor ar fi trebuit s conin i referine
cu privire la procentele consemnate n celulele tabelului de coresponden, astfel nct s fie scoase n
eviden diferenele releavnte dintre categoriile comparate.
80 de pacieni depresivi au fost mprii aleatori n patru grupuri egale, fiecare dintre acestea
urmnd un tip diferit de psihoterapie (psihodinamic, rogerian, de grup i comportamental). Dup ase
luni de terapie, fiecare pacient a fost clasificat ntr-una din urmtoarele trei categorii: ameliorat, agravat,
neschimbat. Datele sunt cele din tabelul urmtor:
model psihoterapeutic
Frecvene observate suma pe linie
psihodinamic rogerian de grup comportamental
ameliorat 6 4 8 12 30
neschimbat 6 14 3 5 28
nrutit 8 2 9 3 22
suma pe coloane 20 20 20 20 N=80
Aa cum am precizat, testul chi-ptrat este calculat pe baza unei formule ale crei rezultate nu urmeaz cu
maxim precizie distribuia 2. Dac n cele mai multe situaii acest lucru nu reprezint un neajuns notabil,
sunt si cazuri n care rezultatele pot fi alterate suficient de mult pentru a putea fi luate n considerare:
atunci cnd volumul eantionului este redus (N<20);
atunci cnd valorile fe pentru una sau mai multe dintre celulele tabelei de coresponden
sunt foarte mici.
n aceste situaii, precum i atunci cnd tabelul de coresponden este compus din dou linii i dou
coloane, este recomandabil utilizarea testului exact Fisher. El se bazeaz pe calcularea tuturor tabelelor
posibile ce pot fi construite pentru frecvenele marginale. Deoarece necesit un mare volum de calcule, testul
exact Fisher se efectueaz numai cu ajutorul programelor computerizate.
46
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Distribuia binomial deriv din serii de evenimente independente dihotomice. Cele dou
posibiliti ale fiecrui eveniment au probabilitile P i Q, a cror sum este 1 (de unde
Q=1-P).
Atunci cnd P=Q=0.5, distribuia binomial este simetric. Pe msur ce numrul
evenimentelor (N) crete, distribuia binomial se apropie de forma normal. Chiar i atunci
cnd PQ distribuia binomial se apropie de forma normal odat cu creterea lui N.
Atunci cnd N crete la infinit, distribuia binomial devine normal, avnd media=N*P i
abaterea standard= N P Q . Ca urmare, probabilitatea ca un anume eveniment s cad n
categoria P poate fi aproximat prin calcularea unui scor z i evaluarea ariei corespunztoare
de sub curba normal.
Dac P=0.5, distribuia normal devine o aproximare bun pentru distribuia normal
ncepnd cu N=25.
Testul semnului poate fi utilizat n locul testului t pentru eantioane dependente atunci cnd
nivelul diferenei dintre cele dou determinri nu poate fi evaluat, ci numai direcia
diferenei. Dat fiind faptul c fiecare diferen poate fi ntr-una din categorii (+ sau -)
distribuia binomial poate fi utilizat pentru a estima n ce msur dezechilibrul ntre cele
dou categorii este posibil s apar din ntmplare (prin raportare la distribuia normal).
Atunci cnd N nu este foarte mare, utilizarea distribuiei normale pentru aproximarea
distribuiei binomiale introduce o eroare sistematic care poate fi compensat prin corecia
de continuitate, extrgnd 0.5 din valoare absolut a diferenei de la numrtorul scorului z.
Dac evenimentele probabilistice pot avea mai mult dect dou posibiliti (de ex., adevrat-
fals), probabilitatea cu care fiecare eveniment cade ntr-una din categoriile posibile se
supune distribuiei multinomiale.
Din cauza complexitii procesului de evaluare a probabilitilor multinomiale, este utilizat
o estimare a acestora prin distribuia chi-ptrat. Numrul gradelor de libertate pentru
distribuia multinomial este dat de numrul categoriilor minus 1.
Testul chi-ptrat are dou variante: (1) Testul chi-ptrat al asocierii testeaz diferena dintre
valorile a dou variabile categoriale (nominale sau ordinale). (2) Testul chi ptrat al
corespondenei (goodness-of-fit) msoar diferena (potrivirea) dintre valorile unei
variable categoriale i probabilitile teoretice dinainte cunoscute ale acestor valori.
Diferenele mari dintre frecvenele observate i cele ateptate produc valori ridicate ale
testului chi-ptrat, care cad n zona dreapt (pozitiv) a distribuiei de nul i conduc la
respingere a ipotezei de nul. Diferenele mici, produc valori ale testulu chi-ptrat apropiate
de zero, conducnd la acceptarea ipotezei de nul.
Atunci cnd fiecare dintre cele dou variabile au doar dou categorii, situaie n care
frecvenele ateptate sunt prea mici pentru a justifica o estimare chi-ptrat, se utilizeaz
testul exact Fischer.
47
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
(1) Se accept ipoteza de nul (pentru alfa=0.05, bilateral). Studentul a rspuns la ntmplare.
58 50
z= = 1.6 (mai mic dect 1.96, ct este z critic pentru alfa=0.05 bilateral)
100 * 0.5 * 0.5
1 1
0,25 0.60
2 * 30 2 * 30 0.24 0.59 0.35
z= = = = 3.18
0.25 * 0.75 0.60 * 0.40 0.006 + 0.008 0.11
+
30 30
30 35 * 0.5 0.5 12
(1) z = = = 4.06
35 * 0.5 * 0.5 2.95
z calculat (4.06) este mai mare dect z critic pentru alfa=0.05 bilateral (1.96). Ca urmare, se respinge ipoteza
de nul i se accept ipoteza cercetrii. Discuiile n grup au efect asupra opiniei individuale.
Frecvena ( fO f E )2
Gen Frecvena ateptat
observat fE
muzical (fE)
(fO)
48
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
( f O f E )2
2 = = 83
fE
Criterii de decizie: alfa=0.05; df=(2-1)*(5-1)=4
Valoarea critic pentru X2=9.49 (atenie X2 nu se testeaz bilateral)
Decizia: X2 calculat (83) este mai mare dect X2 critic (9.49), iar ca urmare, se respinge ipoteza de nul.
Studenii de la psihologie au anumite preferine n raport cu cele patru genuri muzicale.
( fO f E )2
fo fE
fE
ameliorat-I 6 (30/80)*20=7.5 (6-7.5)2/7.5=0.3
ameliorat-II 4 (30/80)*20=7.5 (4-7.5)2/7.5=1.63
ameliorat-III 8 (30/80)*20=7.5 (8-7.5)2/7.5=0.03
ameliorat-IV 12 (30/80)*20=7.5 (12-7.5)2/7.5=2.7
neschimbat-I 6 (28/80)*20=7 (6-7)2/7=0.14
neschimbat-II 14 (28/80)*20=7 (14-7)2/7=7
neschimbat-III 3 (28/80)*20=7 (3-7)2/7=2.28
neschimbat-IV 5 (28/80)*20=7 (5-7)2/7=0.57
nrutit-I 8 (22/80)*20=5.5 (8-5.5)2/5.5)=1.13
nrutit-II 2 (22/80)*20=5.5 (2-5.5)2/5.5)=2.22
nrutit-III 9 (22/80)*20=5.5 (9-5.5)2/5.5)=2.22
nrutit-IV 3 (22/80)*20=5.5 (3-5.5)2/5.5)=1.13
=21.4
Valoarea calculat (X2=21.4) este mai mare dect valoarea X2 critic (9.49). Ca urmare,
ipoteza de nul se respinge.
Concluzia cercetrii: Exist o diferen ntre cele patru categorii psihoterapeutice n ceea
ce privete eficiena asupra depresiei. 8
8
Datele cercetrii sunt fictive.
49
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Lucrarea de evaluare va vi publicat pe portal. Termenul de trimitere este preziua tutorialului. Dup
aceast dat lucrrile trimise nu vor mai fi acceptate.
50
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
TESTE STATISTICE NEPARAMETRICE PENTRU DATE ORDINALE
Introducere
a) Atunci cnd variabila dependent este exprimat pe scal de tip ordinal. n acest caz
valorile nu au proprieti de interval dar exprim poziia fiecreia n raport cu cealalt.
b) Atunci cnd variabila dependent este msurat pe scal de interval/raport dar
distribuia ei nu respect condiiile impuse de testele parametrice. n aceast situaie se efectueaz
transformare de rang, adic nlocuiete fiecare valoare a distribuiei cu poziia pe care o are n
cadrul distribuiei, sub aspectul ordinii de mrime. Noua distribuie rezultat poate fi supus
analizei statistice cu teste neparametrice ordinale.
S lum n considerare urmtoarea problem: Un psiholog care lucreaz ntr-o mare banc
dorete s vad dac exist o diferen ntre premiile bneti anuale primite de femeile i brbaii
angajai ai bncii. n tabelele de mai jos se afl nivelurile primelor i rangurile acestora n raport cu
ntreaga distribuie a primelor, indiferent de sex.
51
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Problema este una tipic pentru a fi rezolvat cu testul t al diferenei dintre mediile a dou
eantioane independente. Avem o variabil independent de tip nominal-dihotomic i una
dependent, de tip interval/raport. Din pcate, analiza preliminar a variabilei dependente (prim)
relev abateri mari de la condiiile de normalitate (un indice de boltire de peste 7) precum i o slab
reprezentativitate a mediei, ambele datorate, mai ales, prezenei unei valori extreme (o prim de 200
mil. lei). Dup ce verificm corectitudinea valorii respective, ajungem la concluzia c ea nu poate fi
eliminat i, ca urmare, nu este recomandabil utilizarea unui test parametric.
ntr-o situaie de acest gen este aplicabil testul Mann-Whitney U 9 pentru date ordinale. Pe
ultima coloan a fiecrui tabel gsim transformarea n ranguri a valorilor variabilei dependente.
Atribuirea rangurilor n mod descresctor sau cresctor este nerelevant. Dac toate valorile sunt
distincte, fiecare valoare primete un rang distinct. Atunci cnd exist valori identice, valorile
respective primesc un rang egal cu media aritmetic a rangurilor cuvenite. Se poate alege i soluia
atribuirii tuturor valorilor identice primul rang cuvenit (ranguri ex aequo).
Procedura de calcul:
Se calculeaz cele dou valori U, corespunztoare grupurilor A (masculin) i B (feminin),
astfel:
n A * (n A + 1)
U A = n A * nB + R A
2 (formula 5.1)
respectiv,
n B * (n B + 1)
U B = n A * nB + RB
2 (formula 5.2)
9
Desemnat uneori i sub numele Wilcoxon-Mann-Withney, sau testul U.
52
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Unde:
nA i nB reprezint volumul celor dou grupuri independente care compun eantionul
RA i RB reprezint suma rangurilor pentru fiecare din cele dou grupuri
17 * 18
U A = 17 * 10 + 180.5 = 170 + 153 180.5 = 142.5
2
respectiv,
10 * 11
U B = 17 * 10 + 198.5 = 170 + 55 198.5 = 26.5
2
Valoarea testului Mann-Whitney este dat de valoarea U cea mai mic, n cazul nostru UB
(26.5).
Decizia statistic se ia prin compararea valorii U celei mai mici cu valoarea citit n tabelul
valorilor critice pentru testul Mann-Whitney U, n funcie de nivelul alfa, nA i nB (Anexa 7).
n cazul testului U decizia statistic se ia astfel:
Se respinge ipoteza de nul dac valoarea U calculat este mai mic sau egal cu
valoarea critic tabelar.
Se accept ipoteza de nul dac valoarea U calculat este mai mare dect valoarea
critic tabelar.
n general tabelele de decizie pentru testul Mann-Whitney nu acoper dect parial situaiile
posibile i nu trec de valori ale lui nA i nB mai mari de 20. Pentru exemplul nostru, valoarea critic
corespunztoare pentru U0.05;17:10=48 (dac preferm aproximarea, mai conservatoare, nA=18).
Deoarece UB<U0.05;17:10 ipoteza de nul se respinge i se accept ipoteza cercetrii. Nivelul
primelor anuale este semnificativ diferit pentru brbai fa de femei 10 .
Afirmam mai sus c tabelele statistice pentru testul Mann-Whitney U nu se refer la grupuri
mai mari de 20. Aceasta deoarece, de la acest volum n sus, distribuia valorilor testului poate fi
aproximat de curba normal z, iar testul poate fi calculat cu formula urmtoare:
R A 0.5 * n A * ( N + 1)
z=
n A * n B * ( N + 1) / 12
(formula 5.3)
(unde N=nA+nB)
Valoarea lui z astfel obinut este comparat cu valorile critice tabelare de pe curba normal
corespunztoare nivelului alfa ales, unilateral sau bilateral.
Publicarea rezultatului
La publicarea rezultatului pentru testul Mann-Whitney U se vor indica:
- volumul grupurilor comparate (nA i nB)
- valoarea testului (U)
- pragul de semnificaie (p).
10
Desigur, nu se poate invoca neaprat o discriminare de sex n acordarea primelor, dac poziiile profesionale ocupate
de subiecii cercetrii sunt diferite. Rezultatul poate sugera, ns, c brbaii ocup poziii profesionale mai nalte dect
femeile.
53
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Dou grupuri de cte 5 subieci au fost supuse unui experiment care vizeaz reacia
fiziologic la prezentarea unui stimul ocant. Unul din grupuri a primit un instructaj care sugera
natura ocant a stimulului n timp ce celuilalt grup i s-a spus c vor primi stimuli agreabili. Datele
de mai jos prezint valoarea pulsului msurat n primele 10 secunde de la prezentarea stimulului:
54
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Grup rang
1 2
1 6
1 7
1 11
1 12
1 3
2 5
2 8
2 10
3 1
3 4
3 9
3 13
Tabelul prezint datele cercetrii. Variabila grup este una de tip nominal, fiecare din cele
trei grupuri fiind codificat cu o valoare convenional (1=pilot, 2=controlor de trafic, 3=navigator
de bord). Variabila rang conine poziia a fiecrui subiect sub aspectul reprezentrii spaiale, n
raport cu toate valorile nregistrate.
55
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Un psiholog trebuie s recomande unui patiser culoarea glazurii pentru un nou tip de prjitur, avnd
de ales ntre verde, rou i galben. n acest scop alege 18 subieci, crora le cere s efectueze o sarcin
plictisitoare avnd la ndemn platouri cu prjituri glazurate. Subiecii sunt mprii n trei grupe, fiecare
primind prjituri de o singur culoare. Dup un timp, numr cte prjituri a mncat fiecare subiect din cele
trei grupuri i construiete tabelul urmtor.
Verde Rou Galben
3 3 2
7 4 0
1 5 4
0 6 6
9 4 4
2 6 1
Dac avem subieci evaluai de dou ori, pe o scal de interval, iar variabilele nu ntrunesc
condiiile pentru utilizarea testului t al diferenelor pentru eantioane dependente, se poate apela la
testul Wilcoxon. Acesta este un test care, dei se aplic pe scale de interval/raport, utilizeaz
proceduri de tip neparametric, apelnd la diferenele dintre valorile perechi i la ordonarea lor. Este,
din acest punct de vedere, un test de date ordinale.
Exemplu
Un psiholog evalueaz frecvena conduitelor agresive dup prezentarea unui film care are
inclui stimuli subliminali cu semnificaie agresiv. Frecvena conduitelor agresive este msurat
nainte i dup vizionarea filmului. Rezultatele sunt sintetizate n tabelul urmtor.
56
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Coloanele tabelului prezint etapele procedurii de calcul:
- se calculeaz diferena dintre variabilele supuse testrii
- dac sunt diferene nule, se elimin
- se iau n considerare diferenele n valoare absolut
- se construiesc rangurile pentru diferenele n valoare absolut
- se marcheaz semnul diferenelor pentru fiecare pereche de valori
Din acest punct, calcularea valorilor testului este simpl. Se calculeaz dou valori, T(-)
prin nsumarea rangurilor diferenelor negative i T(+) prin nsumarea rangurilor diferenelor
pozitive. Valoarea cea mai mic dintre ele este rezultatul testului Wilcoxon, al crui nivel de
semnificaie se afl prin compararea cu valorile critice dintr-o tabel special (Anexa 8), n funcie
de nivelul alfa ales i de volumul eantionului (N). Testul se fundamenteaz pe ideea c atunci cnd
ipoteza nula este adevrat ar trebui ca suma rangurilor pentru diferenele pozitive s fie egal cu
suma rangurilor pentru diferenele negative. Pe msur ce diferena dintre ele este mai mare, ne
ndeprtm de condiia ipoteza de nul.
Decizia statistic se ia n felul urmtor:
Atunci cnd valoarea calculat este mai mic dect valoarea critic tabelar, ipoteza
de nul se respinge iar ipoteza cercetrii se confirm
Atunci cnd valoarea calculat este mai mare dect valoarea critic tabelar, ipoteza
de nul se accept, iar ipoteza cercetrii nu se confirm.
Pentru exemplul nostru, T(+)=28.5 iar T(-)=8.5. Acesta din urm devine rezultatul testului.
Valoarea calculat (8.5) este mai mare dect valoarea critic (4) pentru N=8 i alfa=0.5 bilateral. Ca
urmare, suntem nevoii s acceptm ipoteza de nul, considernd neconfirmat ipoteza cercetrii.
Dup cum observm, dei am calculat testul pentru diferenele negative de rang, am emis concluzia
n legtur cu diferenele pozitive, deoarece ele fceau obiectul ipotezei de nul.
Ca i n cazul testului Mann-Whitney, pentru eantioane mai mari de 20 distribuia de nul a
testului Wilcoxon poate fi aproximat prin distribuia normal. Formula de calcul pentru acest caz
este urmtoarea:
T [n * (n + 1)] / 4
Z=
n * (n + 1) * (2n + 1) / 24
(formula 5.5)
nainte 9 8 10 9 7 8 6 7 5 9
dup 8 5 9 6 8 4 9 7 7 10
(1) Ordonai dup rang diferenele, n termeni de mrime absolut (ignornd semnele), dar
punnd semnele ntre paranteze, dup fiecare diferen.
57
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
(2) nsumai separat rangurile pentru diferenele pozitive i negative.
(3) Testai ipoteza c tratamentul psihologic a redus fobia de a vorbi n public.
Testul Friedman (Fr) pune n eviden n ce msur rangurile evalurilor repetate difer cu
adevrat (statistic semnificativ) unele de altele, dup formula:
c
12
* Ti 3 * N * (c + 1)
2
Fr =
N * c * (c + 1) i =1 (formula 5.6)
unde:
c este numrul msurrilor repetate
N este volumul seturilor de evaluri perechi
58
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Ti este suma rangurilor corespunztoare fiecrui moment de msurare
Fr =
12
6 *3* 4
( )
* 8 2 + 10 2 + 18 2 3 * 6 * 4 = 0,1666 * 488 - 72 = 9.3
Valoarea critic tabelar chi-ptrat pentru df=3-1=2, este 5.99. Valoarea calculat fiind mai
mare, se respinge ipoteza de nul i se consider confirmat ipoteza cercetrii: nivelul satisfaciei
profesionale variaz semnificativ n funcie de stilul de conducere.
Testul Friedman poate fi aplicat i n cazul a doar dou msurri, situaie n care devine
similar testului semnului. La fel ca i celelalte teste pentru date ordinale, el este afectat de existena
rangurilor atribuite ex-aequo, pentru valori identice. n astfel de cazuri este recomandabil aplicarea
unei corecie formulei de calcul, pe care nu o vom prezenta aici, n sperana c utilizarea
programelor specializate va face, oricum, coreciile necesare.
Un neurofiziolog dorete s verifice dac exist o relaie ntre leziunea cerebral stng i tipul de
deficit de memorie de scurt durat, n trei tipuri de sarcin diferite: cifre, litere, litere i cifre amestecate. n
acest scop, un numr de cinci subieci cu leziune cerebral stng au efectuat teste de memorie distincte, pe
iruri de cifre, litere i combinaii de cifre i litere. Performana nregistrat marcheaz irul cel mai lung
memorat pentru fiecare test n parte.
Datele cercetrii:
(valorile semnific lungimea irului memorat)
Testele Wilcoxon i Friedman sunt utilizate pentru a pune n eviden diferenele dintre dou
sau mai multe eantioane perechi (situaie care, de regul, se refer la msurri repetate pe aceiai
59
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
subieci). Atunci cnd avem dou variabile ordinale i suntem interesai n evaluarea gradului de
asociere ntre ele, vom utiliza un test similar coeficientului de corelaie pentru date de interval care
este coeficientul de corelaie a rangurilor (Spearman).
Aa cum ne amintim, coeficientul de corelaie Pearson (r) ne d msura intensitii legturii
dintre dou variabile exprimate pe scale de tip interval/raport. Mecanismul de calcul se bazeaz pe
transformarea valorilor ambelor variabile n scoruri z, adic pe convertirea acestora n distan
standard fa de medie. Pentru datele de tip ordinal, modalitatea de calcul a coeficientului de
corelaie se bazeaz pe poziia relativ a unei valori fa de celelalte. Coeficientul de corelaie a
rangurilor Spearman (rS) are acelai domeniu de variaie (-1/+1) i se interpreteaz n acelai mod
ca i coeficientul de corelaie pentru date parametrice Pearson.
Exemplu:
Problema cercetrii: ntr-un studiu cu privire la ameliorarea sistemului de evaluare e
personalului, doi instructori urmeaz un program special de armonizare a evalurii. La sfritul
programului ei sunt pui s ierarhizeze personalul unui compartiment de munc (N=10) din punctul
de vedere al performanei profesionale.
Ipoteza cercetrii: (pentru test bilateral) Evalurile celor doi instructori vor fi concordante.
Ipoteza de nul: ntre evalurile celor doi instructori nu exist nici o legtur
Criteriile deciziei statistice:
= 0.05
rS critic se citete ntr-un tabel special pentru coeficientul Spearman (Anexa
9).
Valoarea se citete la intersecia dintre linia corespunztoare lui N (n acest caz nu se
folosesc gradele de libertate) cu coloana corespunztoare tipului de test (unilateral, bilateral) i a
nivelului . nregistrm rS critic =0.648
Datele cercetrii:
RANG RANG
Diferena (D)
Angajai Instructor Instructor D2
(R1-R2)
I II
A 3 2 1 1
B 1 3 -2 4
C 7 5 2 4
D 6 4 2 4
E 10 10 0 0
F 5 8 -3 9
G 9 7 2 4
H 8 9 -1 1
I 4 6 -2 4
J 2 1 1 1
D2=32
6 * D2
rS = 1
N * ( N 2 1) (formula 5.7)
6 * 32 192
rS = 1 =1 = 1 0.19 = 0.81
10 * (100 1) 990
60
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Dac nivelul de semnificaie (p) este mai mare dect 0.05, coeficientul de corelaie va fi
considerat nesemnificativ (are anse prea mari s rezulte din jocul ntmplrii). Aceasta nu
nseamn c nu exist o corelaie ntre cele dou variabile ci doar c datele noastre nu au putut s o
pun n eviden.
Calcularea coeficientului de determinare (r2) n cazul corelaiei Spearman nu este
recomandabil, dei exist autori care o accept.
61
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Un psiholog dorete s verifice relaia dintre inteligena verbal i cea non verbal. n acest
scop, un eantion de 10 subieci este supus unei testri cu dou teste care vizeaz cele dou categorii
de inteligen, exprimate n uniti QI. Din cauza volumului foarte redus al eantionului, decide s
aplice testul de corelaie a rangurilor Spearman, n locul testului Pearson.
Datele cercetrii sunt urmtoarele:
Pentru a testa dac dou populaii difer ntre ele, pe o variabil continu, fr a avea
posibilitatea de msurare exact a acesteia (pe scal de interval sau raport), pot fi
selecionate dou eantioane care sunt puse mpreun, dup care valorile sunt ordonate pe
baza rangurilor de mrime. Testarea diferenei se face prin nsumarea separat a rangurilor
valorilor celor dou eantioane.
Dac eantioanele nu difer, suma rangurilor va fi apropiat sau egal, dac difer,
semnificaia diferenei dintre ranguri este probat cu testul Mann-Whitney U.
Testul Mann-Whitney U este utilizat ori de cte ori o variabil nu poate fi msurat precis,
dar se poate determina ordinea valorilor. De asemenea, el se utilizeaz atunci cnd cele dou
variabile sunt msurate pe scale cantitative dar prezint valori aberante legitime.
Testul Mann-Whitney este echivalentul pentru date ordinale a testului diferenei dintre medii
pentru eantioane independente (compuse din subieci diferii).
Testul Kruskal-Wallis este o extensie a testului Mann-Whitney i se utilizeaz atunci cnd
avem de comparat rangurile a mai mult de dou eantioane independente. Din acest punct de
vedere, Testul Kruskal.Wallis este echivalentul pentru date ordinale al analizei de varian
unifactoriale (ANOVA).
Dac datele sunt recoltate de la aceiai subieci n dou condiii de cercetare diferite, testarea
diferenei dintre ranguri se face cu testul Wilcoxon. Acesta este echivalentul testului t pentru
diferena dintre mediile a dou eantioane dependente (compuse din aceiai subieci).
n acest caz, toate diferenele sunt ordonate dup mrime, ignornd semnul lor, suma
rangurilor fiind fcut separat, pentru diferenele pozitive i negative. O diferen mare
dintre aceste dou sume este dovada unei diferene ntre cele dou eantioane comparate.
62
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Testul Friedman, este un test care extinde cazul testul Wilcoxon la mai mult de dou
eantioane dependente. El este echivalentul analizei de varian pentru msurtori repetate
(test care nu a fost tratat n acest volum).
Atunci cnd avem dou variabile msurate pentru aceiai subieci, ale cror valori se
exprim pe scal ordinal, i dorim s testm gradul de asociere dintre acestea, n locul
testului de corelaie Pearson se utilizeaz corelaia Spearman, pentru date ordinale.
Corelaia Spearman este recomandabil i atunci cnd variabilele sunt msurate pe scale de
interval sau de raport, dar distribuia uneia, sau a ambelor, se ndeprteaz grav de la forma
normal.
Coeficientul de corelaie Spearman se definete n aceeai plaj de valori ca i corelaia
Pearson (1) i se interpreteaz n mod similar.
Testele bazate pentru variabile ordinale sunt independente de forma distribuiei variabilelor.
Dou grupuri de cte 5 subieci au fost supuse unui experiment care vizeaz reacia fiziologic la
prezentarea unui stimul ocant. Unul din grupuri a primit un instructaj care sugera natura ocant a
stimulului n timp ce celuilalt grup i s-a spus c vor primi stimuli agreabili. Datele de mai jos
prezint valoarea pulsului msurat n primele 10 secunde de la prezentarea stimulului:
5 * (5 + 1)
U A = 5*5 + 18 = 22
2
5 * (5 + 1)
UB = 5*5 + 37 = 3
2
Valoarea UB este valoarea testului i este egal cu valoarea tabelar (tabela 3.3) pentru nA=5 i
nB=5, alfa=0.05. n acest caz se respinge ipoteza de nul i se accept ipoteza cercetrii. Anticiparea
naturii stimulului reduce reacia fiziologic de surpriz.
(1)
dup 4 5 6 9 7 8 9 8 10 7
nainte 8 8 9 6 5 9 10 7 9 7
4(-) 3(-) 3(-) 3(+) 2(+) 1(-) 1(-) 1(+) 1(+) 0
rang 1 3 3 3 5 7.5 7.5 7.5 7.5 10
prjituri
rang
mncate
verde 9 1
verde 7 2
Rou 6 4
Rou 6 4
galben 6 4
Rou 5 6
Rou 4 8.5
Rou 4 8.5
galben 4 8.5
galben 4 8.5
verde 3 11.5
Rou 3 11.5
verde 2 13.5
galben 2 13.5
verde 1 15.5
galben 1 15.5
verde 0 17.5
galben 0 17.5
Suma rangurilor pe culori:
Rou=31
Verde=61
Galben=67.5
64
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Se admite c preferina pentru prjitur este influenat de culoare acesteia. Cele mai
preferate sunt cele de culoare roie (plasate pe ranguri superioare), urmate de culoarea verde
i galben, care se afl la mic distana una de cealalt.
Valoarea critic citit n tabelul chi-ptrat, pentru df=3-1=2 i alfa=0.05, este 5.99
Fr calculat este mai mare dect Fr critic. Ca urmare, se respinge ipoteza de nul i se accept ipoteza
cercetrii. Leziunea cerebral stng are un efect asupra coninutului memorat. Cea mai afectat
este memorarea literelor (obine ranguri superioare) iar cea mai puin afectat este memorarea
cifrelor (obine cele mai mici ranguri).
Valoarea critic a testului se citete n tabela 3.5 din anexe, pentru alfa 0.05 bilateral i N=10:
Rs critic=0.64
Calculm Rs
6 *126.75
rs = 1 = 0.28
10 * (100 1)
65
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Statistici infereniale. Teste neparametrice ordinale
Decizia statistic: Se accept ipoteza de nul. Rs calculat (0.28) este mai mic dect rs critic (0.64).
Performana la cele doua teste de inteligen nu coreleaz semnificativ.
Bibliografie minimal
Bibliografia de baz
Bibliografie suplimentar
Clocotici, V., & Stan, A. (2000). Statistica aplicata in psihologie. Iasi: Polirom,
(selectiv)
Rotaru, T. (coord.). (1999). Metode statistice aplicate in stiintele sociale. Iasi:
Polirom. (selectiv)
Vasilescu, I. P. (1992). Statistica informatizata pentru stiinte despre om (Vol. 1-2).
Bucuresti: Editura militara., (selectiv)
66
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Elemente de strategie a analizei statistice
ANEXE TABELE STATISTICE
p
df .05 .025 .01
1 3.84 5.02 6.64
2 5.99 7.38 9.21
3 7.81 9.35 11.34
4 9.49 11.14 13.28
5 11.07 12.83 15.09
6 12.59 14.45 16.81
7 14.07 16.01 18.48
8 15.51 17.53 20.09
9 16.92 19.02 21.67
10 18.31 20.48 23.21
11 19.68 21.92 24.72
12 21.03 23.34 26.22
13 22.36 24.74 27.69
14 23.68 26.11 29.14
15 25.00 27.49 30.58
16 26.30 28.85 32.00
17 27.59 30.19 33.41
18 28.87 31.53 34.80
19 30.14 32.85 36.19
20 31.41 34.17 37.57
21 32.67 35.48 38.93
22 33.92 36.78 40.29
23 35.17 38.08 41.64
24 36.42 39.36 42.98
25 37.65 40.65 44.31
26 38.88 41.92 45.64
27 40.11 43.19 46.96
28 41.34 44.46 48.28
29 42.56 45.72 49.59
30 43.77 46.98 50.89
40 55.76 59.34 63.69
50 67.50 71.42 76.15
60 79.08 83.29 88.38
70 90.53 95.02 100.42
80 101.88 106.63 100.43
90 113.15 118.14 124.12
100 124.34 129.56 135.81
67
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Elemente de strategie a analizei statistice
Anexa 7. Tabelul valorilor critice pentru testul Mann-Whitney U
(sursa: Clocotici V., Stan A., 2000, Statistic aplicat n psihologie, Polirom)
nA/nB 5 6 8 10 12 14 16 18 20
0.05 0 1 2 3 4 5 6 7 8
3
0.01 - - - 0 1 1 2 2 3
0.05 1 2 4 5 7 9 11 12 14
4
0.01 - 0 1 2 3 4 5 6 8
0.05 2 3 6 8 11 13 15 18 20
5
0.01 0 1 2 4 6 7 9 11 13
0.05 3 5 8 11 14 17 21 24 27
6
0.01 1 2 4 6 9 11 13 16 18
0.05 6 8 13 17 22 26 31 36 41
8
0.01 2 4 7 11 15 18 22 26 30
0.05 8 11 17 23 29 36 42 48 55
10
0.01 4 6 11 16 21 26 31 37 42
0.05 11 14 22 29 37 45 53 61 69
12
0.01 6 9 15 21 27 34 41 47 54
0.05 13 17 26 36 45 55 64 74 83
14
0.01 7 11 18 26 34 42 50 58 67
0.05 15 21 31 42 53 64 75 86 98
16
0.01 9 13 22 31 41 50 60 70 79
0.05 18 24 36 48 61 74 86 99 112
18
0.01 11 16 26 37 47 58 70 81 92
0.05 20 27 41 55 69 83 98 112 127
20
0.01 13 18 30 42 54 67 79 92 105
68
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Elemente de strategie a analizei statistice
Anexa 8. Valorile critice pentru testul Wilcoxon
(sursa : Clocotici V., Stan A., 2000, Statistic aplicat n psihologie, Polirom)
69
Copyright DEPARTAMENT ID 2008
Marian Popa
Modulul III. Elemente de strategie a analizei statistice
Anexa 9. Valorile critice pentru testul de corelaie a rangurilor (Spearman)
(sursa: http://www.netnam.vn/unescocourse/index.htm)
test unilateral
alfa=0.05 alfa=0.025 alfa=0.01 alfa=0.005
N
test bilateral
alfa=0.10 alfa=0.05 alfa=0.02 alfa=0.01
5 0,900
6 0,829 0,886 0,943
7 0,714 0,786 0,893
8 0,643 0,738 0,833 0,881
9 0,600 0,683 0,783 0,833
10 0,564 0,648 0,745 0,794
11 0,523 0,623 0,736 0,818
12 0,497 0,591 0,703 0,780
13 0,475 0,566 0,673 0,745
14 0,457 0,545 0,646 0,716
15 0,441 0,525 0,623 0,689
16 0,425 0,507 0,601 0,666
17 0,412 0,490 0,582 0,645
18 0,399 0,476 0,564 0,625
19 0,388 0,462 0,549 0,608
20 0,377 0,450 0,534 0,591
21 0,368 0,438 0,521 0,576
22 0,359 0,428 0,508 0,562
23 0,351 0,418 0,496 0,549
24 0,343 0,409 0,485 0,537
25 0,336 0,400 0,475 0,526
26 0,329 0,392 0,465 0,515
27 0,323 0,385 0,456 0,505
28 0,317 0,377 0,448 0,496
29 0,311 0,370 0,440 0,487
30 0,305 0,364 0,432 0,478
70
Copyright DEPARTAMENT ID 2008