Documente Academic
Documente Profesional
Documente Cultură
Statistica Psihologica Marian Popa PDF
Statistica Psihologica Marian Popa PDF
DEPARTAMENTUL DE
NVMNT LA DISTAN
Not:
Coninutul modulelor este suficient de dezvoltat pentru nsuirea cursului, dar versiunea
complet a materiei de curs se gsete n volumul: M. Popa, Statistic pentru psihologie. Teorie
i aplicaii SPSS, aprut la Editura Polirom (2008).
Marian Popa
Marian Popa
Marian Popa
CUPRINS
NOIUNI STATISTICE FUNDAMENTALE....................................................................................5
Obiectivele unitii de nvare ........................................................................................................5
Definiia i rolul statisticii n psihologie ..........................................................................................5
Utilitatea statisticii n practica psihologic ......................................................................................6
Msurarea n psihologie ...................................................................................................................6
Scala nominal .............................................................................................................................7
Scala ordinal ...............................................................................................................................7
Scala de interval ...........................................................................................................................8
Scala de raport..............................................................................................................................8
Sarcina de lucru nr. 1. 1....................................................................................................................9
Concepte statistice fundamentale .....................................................................................................9
Noiunea de variabil statistic ....................................................................................................9
Variabile dependente i variabile independente...........................................................................9
Sarcin de lucru nr. 1. 2..............................................................................................................10
Variabile continue i variabile discrete ......................................................................................10
Populaie i eantion...................................................................................................................10
Sarcin de lucru nr. 1. 3..............................................................................................................11
Statistica descriptiv i statistica inferenial.............................................................................12
Statistica parametric i statistica neparametric .......................................................................12
Studii experimentale i studii observaionale.............................................................................12
Rezumatul unitii de nvare........................................................................................................13
Rspunsuri corecte la sarcinile de lucru.........................................................................................14
Lucrarea de evaluare nr. 1.1 ...........................................................................................................15
Bibliografie.....................................................................................................................................15
STATISTICI DESCRIPTIVE ............................................................................................................16
Obiective de nvare i informaii introductive.............................................................................16
Statistici descriptive globale...........................................................................................................17
Analiza de frecvene...................................................................................................................17
Analiza de frecvene simple ...................................................................................................17
Analiza de frecvene grupate..................................................................................................19
Sarcina de lucru nr. 2.1...............................................................................................................21
Reprezentarea grafic a datelor ..................................................................................................22
Graficul de tip bar.................................................................................................................22
Histograma .............................................................................................................................23
Poligonul de frecvene............................................................................................................23
Graficul frecvenei cumulate..................................................................................................24
Graficul circular .....................................................................................................................24
Reprezentarea de tip stem-and-leaf (stem plot).....................................................................25
Stem-and-Leaf..........................................................................................................................1
Sarcina de lucru nr. 2.2...............................................................................................................26
Indicatori statistici descriptivi ........................................................................................................26
Indicatori ai tendinei centrale....................................................................................................26
Modul (Mo) ............................................................................................................................26
Mediana (Me).........................................................................................................................27
Media aritmetic (m)..............................................................................................................27
Sarcina de lucru nr. 2.3...............................................................................................................29
Indicatori ai mprtierii .............................................................................................................29
Amplitudinea absolut (R de la Range) .................................................................................30
Amplitudinea relativ.............................................................................................................30
Copyright DEPARTAMENT ID 2008
Marian Popa
Marian Popa
Statistica
este un
instrument
al metodei
tiinifice n
psihologie
Definiie:
Statistica psihologic este disciplina care se ocup cu analiza
datelor care descriu aspecte de natur psihic, individual sau colectiv, n
scopul de a le prezenta sintetic, sub form numeric sau grafic, de a le
analiza i de a extrage concluzii pe seama lor.
Faptele de natur psihic sau cu semnificaii psihologice care fac
obiectul msurrii i al analizei statistice, pot fi extrem de variate: genul
(masculin/feminin), inteligena, timpul de reacie, atitudinile, nivelul
motivaiei, nivelul diverselor caracteristici psihice (sociabilitate, anxietate,
emotivitate)
Metoda tiinific
n esen, tiina este o metod, un mod specific de a afla
rspunsuri la ntrebrile pe care ni le punem. Principalele ei caracteristici
sunt: cutarea unor reguli generale (legiti), colectarea unor dovezi
obiective, operarea cu afirmaii controlabile, atitudine sceptic fa de
cunotinele acumulate, atitudine deschis fa de orice informaii noi,
creativitate i transparen.
n mod practic, un demers de tip tiinific pornete de la identificarea
unei probleme, urmat de o serie standardizat de etape de gsire a
rspunsului adecvat: generarea unei ipoteze n legtur cu rspunsul
posibil, testarea ipotezei (prin experiment sau alt metod empiric),
analizarea datelor recoltate, emiterea unei decizii de confirmare sau de
infirmare a ipotezei. n faza urmtoare, ipoteza poate fi rafinat iar procesul
se reia atta timp ct problema prezint un interes de cunoatere. n acest
proces, statistica se ocup cu tratarea datelor numerice prin sintetizarea
lor, ntr-o prim faz, i prin proceduri de analiz care s fundamenteze o
Marian Popa
Msurarea n psihologie
A msura n
nseamn a
atribui
numere sau
simboluri
unor
caracteristici
ale realitii.
Marian Popa
Scala nominal
Valorile de
tip nominal,
denumesc
indivizi sau
categorii de
indivizi.
Scala ordinal
Valorile plasate pe o scal de tip ordinal au o anumit semnificaie
cantitativ. O anumit valoare este mai mare sau mai bun dect alta,
aflat sub ea. Implicit, ea poate fi mai mic sau mai puin bun dect
alt valoare, aflat deasupra ei. Dac o anumit persoan este mai
Valorile de
preferat dect alta i atribuim celei primei valoarea 1, iar celei de-a doua
tip ordinal
valoarea 2, atunci cele dou valori se exprim pe o scal de tip ordinal,
exprim
care indic doar ordinea preferinei i nu msura intensitii acestei
poziia,
rangul, unei preferine.
Exemple: ordinea de rang la nivelul unei clase, n funcie de notele
valori dintr-o
colare,
ordinea copiilor la natere.
serie de
valori.
7
Copyright DEPARTAMENT ID 2008
Marian Popa
Scala de interval
O variabil msurat pe o scal de interval ne ofer informaii nu
doar despre ordinea de mrime, ci i despre dimensiunea exact a
caracteristicii msurate. Valorile de acest tip au un caracter cantitativ,
exprimat numeric, iar intervalele dintre ele sunt egale.
Valorile de
Exemple:
tip interval
timpul
mrimea,
Marian Popa
1
2
3
4
5
Statistica se
ocup cu
studiul
relaiilor
dintre
variabile
Marian Popa
10
Marian Popa
11
Marian Popa
12
Marian Popa
13
Marian Popa
Rspuns
nominal
raport
ordinal
raport
ordinal
14
Marian Popa
Marian Popa, (2008), Statistic pentru psihologie. Teorie i aplicaii SPSS, editura
Polirom
Pagina web a cursului, la adresa www.mpopa.ro
Bibliografie suplimentar
Clocotici, V., & Stan, A. (2000). Statistica aplicata in psihologie. Iasi: Polirom, p. 1157
Rotaru, T. (coord.). (1999). Metode statistice aplicate in stiintele sociale. Iasi:
Polirom. p. 15-28
Radu I., (coord), (1993), Metodologie psihologic i analiza datelor, Editura Sincron,
p. 45-51
Vasilescu, I. P. (1992). Statistica informatizata pentru stiinte despre om (Vol. 1-2).
Bucuresti: Editura militara., p.5-43
15
Marian Popa
Statistici descriptive
STATISTICI DESCRIPTIVE
Obiective de nvare i informaii introductive
Parcurgerea acestei uniti, va permite studenilor:
9 s utilizeze tehnicile numerice de analiz global a variabilelor
statistice (analiza de frecvene);
9 s utilizeze tehnicile grafice de analiz a variabilelor statistice
(histograma, graficul de tip bar, graficul circular, reprezentarea stemand-leaf);
9 s calculeze indicatorii tendinei centrale (modul, mediana, media)
9 s calculeze indicatorii mprtierii (amplitudinea, abaterea quartil,
abaterea medie, abaterea standard, coeficientul de variaie);
S
9
t s utilizeze indicatorii formei distribuiei (simetrie i boltire):
a
9 s analizeze valorile extreme ale distribuiilor statistice.
t
istica descriptiv are drept obiective organizarea, sintetizarea i descrierea
datelor. Rezultatul msurrii se traduce n obinerea unei colecii de date.
Definirea i
componentele S presupunem c am aplicat un test de cunotine unui grup de 25 de
studeni i am obinut urmtoarea distribuie de valori pentru variabila
statisticii
descriptive
rspunsuri corecte:
8, 6, 10, 9, 6, 6, 8, 7, 4, 9, 6, 2, 8, 6, 10, 4, 5, 6, 8, 4, 7, 8, 4, 7, 6
Datele de mai sus reprezint valorile variabilei statistice rspunsuri
corecte (denumite i serie statistic sau distribuie statistic), care este
compus din 25 de valori sau scoruri. Fiind rezultatul primar al
msurrii, aceste valori se mai numesc i valori primare sau brute.
Valorile acestei variabile sunt exprimate pe o scal cantitativ de tip raport.
Privite sub forma n care se prezint mai sus, datele respective ne
spun puine lucruri. Iar dac ar fi i mai multe, de ordinul sutelor sau miilor,
atunci ar fi practic imposibil de fcut vreo apreciere, n aceast form de
prezentare . De aceea, pentru a ne face o imagine mai coerent asupra
unei serii de valori, acestea trebuie supuse unor operaii care s scoat n
eviden caracteristicile distribuiei
Definiie: Tehnicile i procedurile destinate organizrii i prezentrii
sumative a datelor, constituie ceea ce se numete statistica descriptiv.
Principalele componente ale statisticii descriptive sunt:
Tehnici de organizare i prezentare a datelor, care pot fi, la
rndul lor:
o numerice (distribuia de frecvene simple sau grupate;)
o grafice (histograme; grafice de tip bar, linie, circular,
histograma stem-and-leaf)
Indicatori numerici sumativi, care sunt la rndul lor de trei tipuri:
o indicatori ai tendinei centrale (mod, medie, median)
o indicatori ai mprtierii (amplitudine, abatere quartil,
abatere standard)
o indicatori ai formei distribuiei (simetrie i boltire).
Copyright DEPARTAMENT ID 2008
16
Marian Popa
Statistici descriptive
Dincolo de scopul n sine al acestor proceduri, acela de a oferi o
imagine sintetic asupra datelor analizate, trebuie s nelegem statistica
descriptiv i ca pe o etap pregtitoare n fundamentarea procedurilor
statisticii infereniale (destinat verificrii ipotezelor statistice) despre care
vom vorbi mai trziu.
Statistici descriptive globale
Analiza de
frecvene
simple se
bazeaz pe
frecvena
de apariie
a fiecrei
valori
dintr-o
distribuie
fa
10
9
8
7
6
5
4
3
2
Total
2
2
5
3
7
1
4
0
1
fa=25
17
Marian Popa
Statistici descriptive
Se observ c astfel datele au un caracter mai ordonat, iar coloana
frecvenelor absolute scoate n eviden anumite aspecte cum ar fi, de
exemplu, faptul c cea mai frecvent valoare este 6 (apare de 7 ori).
Observm c seria de valori din tabel include toate valorile posibile ntre
valoarea cea mai mare (10) i cea mai mic (2), incluznd i valorile care
nu se ntlnesc n mod real n cadrul seriei. n cazul nostru avem valoarea
3, cu frecvena de apariie 0. Suma frecvenelor absolute (fa) indic totalul
valorilor din cadrul seriei (25).
n practic, pe lng frecvenele absolute se iau n considerare i
alte tipuri de frecvene (vezi tabelul 2):
Frecvena cumulat (fc). Totalul valorilor care se cumuleaz
ncepnd de la valoarea cea mai mare pn la valoarea cea mai mic din
tabel. De exemplu, n tabelul sintetic de mai jos, avem 6 valori mai mici sau
egale cu 5, 21 de valori mai mici sau egale cu 8 i, evident, 25 de valori
mai mici sau egale cu 10.
Frecvena relativ raportat la unitate fr(1). Este raportul
dintre frecvena absolut i suma frecvenelor absolute (fa/fa).
Exemple:
pentru valoarea 10: fa/fa=2/25=0.08;
pentru valoarea 6: fa/fa=7/25=0.13; .a.m.d.
Frecvena relativ cumulat, raportat la unitate fr(1): Este
similar frecvenei cumulate absolute, cu deosebirea c n acest caz se
cumuleaz frecvenele relative.
Exemple:
Dac privim ntreaga serie ca ntreg (egal cu 1 sau unitate ),
atunci toate valorile mai mici sau egale cu 5 au o frecven
cumulat egal cu 0.24 (adic, fr(1)=0.04+0+0.16+0.04=0.24)
Pentru valoarea 7, frecvena relativ cumulat raportat la
unitate este: frc(1)=0.04+0+0.16+0.04+0.28+0.12=0.64
Frecvena relativ cumulat pentru valoarea cea mai mare din
serie este ntotdeauna 1.00 (corespunztoare n cazul nostru
valorii 10).
Frecvena relativ procentual fr(%): Exprim procentul
valorilor care se situeaz pn la o anumit valoare din cadrul distribuiei.
Se calculeaz fie prin nmulirea fr(1) cu 100, fie prin calcularea direct
procentului pe care l reprezint o anumit valoare raportat la totalul
valorilor dintr-o distribuie. Suma frecvenelor relative procentuale este
ntotdeauna egal cu 100.
Exemple (tabelul 2):
18
Marian Popa
Statistici descriptive
spune c are rangul percentil 52, adic, 52% dintre valorile unei distribuii
sunt ntre cea mai mic valoare i valoarea 6, inclusiv.
o
Prin convenie, rangul percentil se definete ca procentajul
datelor valorilor dintr-o distribuie care se afl pn la o anumit valoare
inclusiv.
o
n mod complementar, numim percentil, valoarea dintr-o
distribuie care corespunde unui anumit rang percentil. n exemplul de mai
sus, rangului percentil 52 i corespunde valoarea 6, numit, de aceea,
percentila 52.
o
n practic, exist anumite percentile care au o importan
aparte. Acestea sunt percentilele corespunztoare rangurilor percentile cu
valorile 10, 20, 30,..., 100. Despre semnificaia lor vom vorbi mai trziu n
acest curs. De asemenea, se utilizeaz termenul de quartile pentru
percentilele care mpart distribuia n patru zone egale ca numr de valori.
Acestea sunt corespunztoare rangurilor percentile de 25, 50 i 75. Cu alte
cuvinte, valoarea dintr-o distribuie pn la care se afl 25% din valori este
percentila 25, valoarea pn la care se afl 50% este percentila 50, iar
valoarea pn la care se afl 75% din valori este percentila 75.
Tabelul 2. Tabloul sintetic al frecvenelor simple
Valoare
fa
fc
fr (1)
frc (1)
fr (%)
frc (%)
10
9
8
7
6
5
4
3
2
Total
2
2
5
3
7
1
4
0
1
fa=25
25
23
21
16
13
6
5
1
1
0,08
0,08
0,20
0,12
0,28
0,04
0,16
0
0,04
fr=1
1,00
0,92
0,84
0,64
0,52
0,24
0,20
0,04
0,04
8%
8%
20%
12%
28%
4%
16%
0%
4%
fr%=100
100%
92%
84%
64%
52%
24%
20%
4%
4%
Analiza de
frecvene
grupate se
bazeaz pe
frecvena de
apariie a
claselor
(grupelor) de
valori ntr-o
distribuie
94
107
109
108
104
87
118
124
115
110
117
114
102
92
101
115
98
118
97
101
116
112
113
102
121
91
101
116
108
125
113
114
106
102
86
96
107
108
109
109
105
109
89
114
123
Datele din tabel sunt aranjate la ntmplare, analiza lor fiind dificil.
Presupunnd c le-am ordona i am face tabelul frecvenelor simple, am
Copyright DEPARTAMENT ID 2008
19
Marian Popa
Statistici descriptive
obine un uor progres, dar nc ar fi greu de analizat deoarece vom obine
un tabel cu prea multe valori distincte.
Pentru a ne face o imagine sintetic a distribuiei, ne propunem s
realizm un numr de categorii (clase) cuprinse ntre anumite intervale de
performan la test, urmnd s stabilim apoi care este frecvena de apariie
a fiecrei clase n distribuia noastr. Aceast tehnic de organizare a
datelor se numete frecvena grupat
Pentru a realiza un tabel de frecvene grupate se procedeaz astfel:
1. Alegem numrul de intervale (clase, categorii), recomandabil,
ntre 5 i 15 (valori stabilite convenional i orientativ)
2. Definim mrimea intervalului de clas, respectnd urmtoarele
reguli:
fa
1
3
fr%
2%
6%
frc%
100%
98%
Copyright DEPARTAMENT ID 2008
20
Marian Popa
115 119
110 114
105 109
100 104
95 99
90 94
85 89
7
7
13
8
4
4
3
fa=50
14%
14%
26%
16%
8%
8%
6%
fr%=100
Statistici descriptive
92%
78%
64%
38%
22%
14%
6%
Alegei varianta de rspuns aleas sau scriei rspunsul n text, apoi verificai
rspunsurile corecte
1. Percentila 25 este acea valoare a unei distribuii care:
a. are 75% din valori mai mari dect ea
b. se ntlnete la 25% dintre subieci
c. mparte distribuia n 25 de pri egale
d. nici una din variantele de mai sus
2. Percentila 50 este o valoare identic cu:
a. quartila 3; b. quartila 1; c. mediana; d. abaterea standard
3. Ce procent de valori este reprezentat n caseta reprezentrii box-plot:
a. 50%; b. 25%; c. 30%; d. 75%
4. Ce reprezint frecvena relativ raportat la unitate?
____________________________________________________________________
5. Ce nseamn faptul c pe coloana frecvenei relative procentuale din dreptul unui
anumite valori este scris 7%?
____________________________________________________________________
6. Cum se stabilete limita inferioar a primei clase, n cazul unei distribuii de
frecvene grupate?
____________________________________________________________________
7. Care este numrul recomandabil de clase ntr-o distribuie de frecvene grupate?
____________________________________________________________________
8. Cum se numesc valorile de pe coloana frecvenelor relative procentuale cumulate?
____________________________________________________________________
Copyright DEPARTAMENT ID 2008
21
Marian Popa
Statistici descriptive
9. Cum se numete valoarea variabilei care corespunde unui anumit rang percentil?
____________________________________________________________________
O prezentare extensiv a tipurilor de reprezentri grafice poate fi gsit n Statistica, Electronic Textbook, 1984-1999,
StatSoft Inc., Graphical techniques
Copyright DEPARTAMENT ID 2008
22
Marian Popa
Statistici descriptive
12
10
Axa Oy
0
1
Axa Ox
Histograma
10
0
85,0
90,0
95,0
100,0
105,0
110,0
115,0
120,0
125,0
Clase
23
Marian Popa
Statistici descriptive
14
12
10
2
0
1
Clase de interval
60
50
40
Frecvena cumulat
30
20
10
0
1
Clase de interval
Graficul circular
24
Marian Popa
Statistici descriptive
reprezenta fie valorile absolute, fie procentajul fiecrei clase raportat la
ntreg.
113
114
106
102
86
96
107
108
109
109
105
109
89
114
123
Stem-and-Leaf
8 . 679
9 . 1224
9 . 6778
10 . 11112224
10 . 5667778889999
11 . 0233444
11 . 5566788
12 . 134
12 . 5
Mrimea tulpinii:
10
Valorile din coloana stem indic numrul de zeci, iar cele din
coloana Leaf, numrul de uniti. Dac privim imaginea n ansamblu ne-o
putem reprezenta ca pe o histogram orizontal. n acest exemplu:
Stem 8, urmat de Leaf 679 indic faptul c variabila noastr are n
compunere valorile 86,87,89.
Stem 12, urmat de leaf 134, ne arat c distribuia conine valorile
121, 123,124
25
Marian Popa
Statistici descriptive
Sarcina de lucru nr. 2.2
26
Marian Popa
Statistici descriptive
n cazul unei distribuii de frecvene grupate, este clasa de interval
cu frecvena cea mai mare de apariie
Modul se afl prin alctuirea tabelei de frecvene (simple sau
grupate) i este identificat ca valoarea creia i corespunde frecvena
absolut cea mai ridicat.
Distribuiile pot avea un singur mod (unimodale), dou moduri
(bimodale) sau mai multe (multimodale)
Exemplu: n seria de valori 5,8,3,2,5,4, Mo=5 (apare de cele mai
multe ori)
Mediana (Me)
Este valoarea din mijlocul unei distribuii, adic aceea care are
50% dintre valori deasupra ei i 50% dintre valori dedesubtul ei (cu alte
cuvinte, percentila 50).
Se gsete prin alctuirea tabelei de frecvene, n coloana
frecvenelor relative procentuale cumulate, i corespunde valorii de 50%.
n cazul distribuiilor cu numr impar de valori, Me este chiar
valoarea respectiv.
n cazul distribuiilor pare, Me se calculeaz ca medie a celor dou
valori din mijlocul distribuiei
Exemplu: n seria de valori 5,8,3,2,5,4, ordonat cresctor
(2,3,4,5,5,8), Me=4,5 (ca medie a valorilor 4 i 5 aflate n mijlocul unei
distribuii pare). Dac distribuia noastr ar fi avut 5 valori (fr 2, de
exemplu), Me=5
Media aritmetic (m)
27
Marian Popa
Statistici descriptive
Prin X se nelege ca Sum de la X=1 la N (numrul
valorilor)
f este frecvena .
MEDIANA
MODUL
DEZAVANTAJE
- n general, nesigur, mai ales n cazul
eantioanelor mici, cnd se poate
modifica dramatic la o modificare minor
a unei valori;
- Poate fi greit interpretat. Se identific
total cu un scor anume, fr a spune
nimic despre celelalte valori;
- Nu poate fi utilizat n statistici
infereniale;
- Poate fi utilizat pe scale ordinale - Poate s nu corespund unei valori
i de interval\raport;
reale (N par);
- Poate fi utilizat i pe distribuii
- Nu reflect valorile distribuiei (un scor
de frecven cu clase deschise sau extrem se poate modifica, fr a afecta
scoruri nedeterminate la marginile Me);
distribuiei;
- Este mai puin sigur n extrapolarea de
la eantion la populaie;
- Greu de utilizat n statistici avansate
28
MEDIA
Marian Popa
Statistici descriptive
- De obicei nu corespunde unei valori
reale;
- Nu este tocmai adecvat pentru scale
ordinale;
- Conduce la interpretri greite pe
distribuii asimetrice
- Poate fi puternic afectat de scorurile
extreme;
Tabelul de mai jos conine dou distribuii de valori (variabile). Una reprezint scorurile la
un test de evaluare a timiditii, cealalt, la un test de evaluare a sentimentului de
singurtate.
Timiditate (1)
29
28
36
41
25
15
33
40
33
20
35
26
32
23
Singurtate (2)
27
35
30
51
30
20
47
42
40
33
28
40
22
15
Calculai i scriei care sunt, pentru fiecare dintre cele dou variabile, urmtorii indicatori
statistici:
(1). Mediana _________ Modul ___________ Media _____________
(2). Mediana _________ Modul ___________ Media _____________
Verificai rspunsurile corecte
Indicatori ai mprtierii
mprtierea
se refer la
gradul de
variabilitate a
valorilor.
29
Marian Popa
Statistici descriptive
se asemna unele cu altele, asemnare surprins de indicatorii
tendinei centrale. n cazul mprtierii, se urmrete descrierea tendinei
valorilor de a se deosebi una de alta, de a se sustrage unei tendine
centrale prin ndeprtarea de aceasta.
Pentru evaluarea mprtierii distribuiilor statistice se utilizeaz mai
muli indicatori. Distingem dou categorii de indicatori ai mprtierii:
elementari i sintetici.
Principala caracteristic a indicatorilor elementari este aceea c
surprind mprtierea distribuiei prin distana dintre doar dou valori ale
acesteia.
30
Marian Popa
Statistici descriptive
31
Marian Popa
Statistici descriptive
X
5
8
3
2
5
4
X = 27
N=6
m = 4.5
Xi m
(5 4.5) = .5
(8 4.5) = 3.5
(3 4.5) = -1.5
(2 4.5) = -2.5
(5 4.5) = .5
(4 4.5) = -.5
(Xi-m) = 0
(Xi m)
(5 4.5) = 0.5
(8 4.5) = 3.5
(3 4.5) = 1.5
(2 4.5) = 2.5
(5 4.5) = 0.5
(4 4.5) = 0.5
|Xi-m| = 9
d=
| X
m|
(formula 2.7)
n continuare ne vom raporta la media de eantionare. Se subnelege c, pentru cazul unei populaii, media va fi scris
cu litera (miu).
Copyright DEPARTAMENT ID 2008
32
Marian Popa
Statistici descriptive
Pentru cazul frecvenelor grupate, formula devine:
d=
| X m |* f
f
i
(formula 2.8)
Notaii uzuale:
s2 (cnd se calculeaz pentru eantion)
2 (cnd se calculeaz pentru ntreaga populaie)
Pentru a elimina inconvenientul abaterilor de la medie de a avea
suma egal cu zero, se opereaz ridicarea la ptrat a abaterilor valorilor
individuale 3 .
X
5
8
3
2
5
4
X = 27
N=6
m = 4.5
(Xi m)
(5 4.5) = 0.5
(8 4.5) = 3.5
(3 4.5) = -1.5
(2 4.5) = -2.5
(5 4.5) = 0.5
(4 4.5) = -0.5
(Xi m) 2
0.25
12.25
2.25
6.25
0.25
0.25
(Xi-m) = 0
(X-m)2 = 21.5
(X
m) 2
(formula 2.9)
Abaterea
standard este
cel mai utilizat
indicator al
mprtierii
3
Notaii uzuale:
s (pentru eantioane)
(pentru populaie)
SD (Standard Deviation, n standardul APA )
ab.std.
33
Marian Popa
Statistici descriptive
Abaterea standard se obine prin extragerea radicalului din expresia
abaterii medii ptratice (dispersiei).
Formula de calcul:
s=
(X
m) 2
(formula 2.10)
s2 =
Abaterea standard:
(X
s=
m) 2
N 1
(X
m) 2
N 1
(formula 2.11)
(formula 2.12)
34
Marian Popa
Statistici descriptive
Proprietile abaterii standard
Abaterea standard este, aa cum vom vedea, indicatorul principal al
mprtierii utilizat n diverse proceduri statistice avansate. Pentru a-i
justifica modul de utilizare n diverse formule, trebuie s reinem cteva
proprieti fundamentale ale abaterii standard:
1. Dac se adaug/scade o constant la fiecare valoare a unei
distribuii, abaterea standard nu este afectat
Coeficientul de variaie
s
*100
m
(formula 2.13)
35
Marian Popa
Statistici descriptive
respectiv, dat fiind ponderea ridicat a mprtierii. Utilizarea
coeficientului de variaie este limitat la valorile msurate pe scale de
raport, cu origine natural 0. n cazul a dou variabile a cror origine este
diferit una de alta, diferenele dintre valori (abaterea standard) rmn
aceleai dar media se schimb, fapt care face ca raportul exprimat n
formul s fie modificat iar comparaia a doi coeficieni de variaie,
irelevant. n plus, pe o scal de interval cu valori negative se poate ajunge
la medie egal cu 0, ceea ce face formula inaplicabil.
Utilitatea coeficientului de variaie vine de la faptul c valoarea sa
mai este legat de unitatea de msur. Diferena dintre dou valori cv
poate fi interpretat ca diferen de mprtiere a celor dou variabile, chiar
dac msoar lucruri diferite.
Sunt propuse anumite limite de interpretare a acestui indicator,
astfel:
36
Marian Popa
Distribuie: simetric
Medie
Mediana
Mod
Statistici descriptive
asimetric pozitiv
asimetric negativ
Median
Mod
Medie
Mod
Medie
Median
mezocurtica
platicurtica
37
Marian Popa
Statistici descriptive
Desigur, o curb poate fi n acelai timp i asimetric i boltit
excesiv, chiar dac imaginea de mai sus ilustreaz boltirea pe curbe
simetrice.
Indicatorul numeric al boltirii (kurtosis) are o plaj de variaie n jurul
valorii zero (care nseamn boltire medie, normal, mezocurtic). Indicele
de boltire pozitiv indic o curb nalt (leptocurtic), iar indicele de
boltire negativ, o curb aplatizat (platicurtic). La fel ca i n cazul
indicelui de oblicitate (skewness), cu ct acesta este mai ndeprtat de
valorile +1/-1, avem de a face cu distribuii cu abatere accentuat de la
boltirea normal.
38
Marian Popa
Statistici descriptive
Valori extreme ale distribuiei
94
107
109
108
104
87
117
115
116
91
113
96
105
135
118
114
98
112
101
114
107
109
142
124
102
118
113
116
106
108
89
115
92
97
102
108
102
109
114
110
101
101
121
125
86
109
123
Pentru a face reprezentarea box plot facem mai nti tabela de
frecvene simple, cu scopul calculrii percentilelor. Tabelul de frecvene
alturat cuprinde valorile ordonate ale distribuiei, ntre de la valoarea cea
mai mic (86) i se cea mai mare (142). Pe coloana frc% se afl
frecvenele cumulate procentuale (percentilele). Pentru box plot identificm
percentilele 25 i 75. Ele corespund valorilor 101 (este valoarea cea mai
apropiat de 25 pe coloana frc%) i, respectiv, 114. Am obinut astfel,
limita inferioar i superioar a casetei. Mediana (percentila 50)
corespunde valorii 108 (frc%=53.8, prin aproximare). Diferena dintre
valorile corespunztoare percentilelor 25 i 50 este 13 (114-101). Astfel
putem determina limitele prelungirilor superioar i inferioar ale casetei
care sunt: 114+13*1.5=128 (aproximare) pentru prelungirea superioar i,
respectiv 101-13*1,5=83 (aproximare) pentru cea de jos. Am obinut astfel
toate valorile necesare trasrii box plotului.
Imaginea de mai jos prezint tabelul distribuiei i boxplot-ul
corespunztor 4 :
n mod normal, reprezentarea boxplot se construiete independent de tabelul de frecvene. Dac le-am asociat n imagine, am fcut-o doar cu scop
didactic, pentru a pune mai clar n eviden mecanismul de elaborare.
39
Marian Popa
Valori
QI
142
135
125
124
123
121
118
117
116
115
114
113
112
110
109
108
107
106
105
104
102
101
98
97
96
94
92
91
89
87
86
Total
Statistici descriptive
fa
fr%
1
1
1
1
1
1
2
1
2
2
3
2
1
1
4
3
3
2
1
1
3
4
1
2
1
1
2
1
1
1
1
52
1,9
1,9
1,9
1,9
1,9
1,9
3,8
1,9
3,8
3,8
5,8
3,8
1,9
1,9
7,7
5,8
5,8
3,8
1,9
1,9
5,8
7,7
1,9
3,8
1,9
1,9
3,8
1,9
1,9
1,9
1,9
100,0
frc%
(rang percentil)
100,0
98,1
96,2
94,2
92,3
90,4
88,5
84,6
82,7
78,8
75,0
69,2
65,4
63,5
61,5
53,8
48,1
42,3
38,5
36,5
34,6
28,8
21,2
19,2
15,4
13,5
11,5
7,7
5,8
3,8
1,9
114+13*1,5=128
114
108
H=114-101=13
101
101-13*1,5=83
Marian Popa
Statistici descriptive
aib efecte majore asupra rezultatelor fapt care trebuie luat n considerare
la alegerea procedurilor statistice infereniale.
a
c
a (50%)
O valoare care exprim raportul dintre frecvena unei valori i 1
Valoarea respectiv apare n 7% din totalul valorilor unei distribuii
Trebuie s fie multiplu al mrimii intervalului de grupare ales
ntre 5 i15
Ranguri percentile
Percentil
41
Marian Popa
Statistici descriptive
42
Marian Popa
Statistici descriptive
Bibliografie minimal
Bibliografia de baz
Marian Popa, (2008), Statistic pentru psihologie. Teorie i aplicaii SPSS, Polirom
Pagina web a cursului, la adresa: www.mpopa.ro
Bibliografie suplimentar
Clocotici, V., & Stan, A. (2000). Statistica aplicata in psihologie. Iasi: Polirom, p. 6373
Rotaru, T. (coord.). (1999). Metode statistice aplicate in stiintele sociale. Iasi:
Polirom. p. 42-61
Vasilescu, I. P. (1992). Statistica informatizata pentru stiinte despre om (Vol. 1-2).
Bucuresti: Editura militara., p.95-116
43
Marian Popa
FACULTATEA DE PSIHOLOGIE I
TIINELE EDUCAIEI
DEPARTAMENTUL DE
NVMNT LA DISTAN
Marian Popa
CUPRINS
STATISTIC INFERENIAL, NOIUNI DE BAZ................................................................5
Obiectiveleunitiidenvare ......................................................................................................................................5
Scoruri standard.................................................................................................................................5
Altetipuridescoruristandardizate ................................................................................................................................6
Marian Popa
Mrimeaefectului .......................................................................................................................................................31
Calculareamrimiiefectuluipentrutestulz(t)pentruunsingureantion ............................................................32
Relaiadintremrimeaefectuluiiputereatestului...............................................................................................33
Interpretarerezultatuluiunuiteststatistic ..................................................................................................................33
Marian Popa
CondiiipentrucalculareacoeficientuluidecorelaiePearson...............................................................................72
Utilizareacoeficientuldecorelaie..........................................................................................................................72
Publicarearezultatuluicorelaiei.............................................................................................................................72
Sarcinadelucru2.7 ......................................................................................................................................................72
Marian Popa
d fi
l d
i i i
i i
Scoruri standard
Modalitatea de a exprima semnificaia unei anumite valori dintr-o distribuie prin raportare la
parametrii distribuiei (medie i abatere standard) este scorul standardizat z (numit i not z sau scor z).
Aceasta msoar distana dintre o anumit valoare i media distribuiei, n abateri standard:
z=
xm
s
zI =
70 60
= +2.0
5
respectiv,
z II =
70 60
= + 0 .5
20
Marian Popa
Dac am calcula scorurile (notele) z pentru fiecare dintre valorile unei distribuii, am obine o
distribuie n scoruri z a acelei distribuii. n tabelul urmtor, distribuia X a fost transformat n distribuie
z.
X
14
11
10
16
13
N=5
z
+0.50
-0.75
-1.17
+1.34
+0.08
N=5
X =64
Z =0
m=12.8
s=2.38
m=0
s=1
Dac
z=
xm
s
atunci:
Proprietile scorurilor z
1. Media unei distribuii z este ntotdeauna egal cu 0. Aceasta rezult din proprietatea mediei de a se
diminua corespunztor dac se extrage o constant din fiecare valoare a unei distribuii. Formula de calcul
pentru z implic scderea unei constante din fiecare valoare a distribuiei. Aceasta nseamn c i media noii
distribuii (z) se va reduce cu constanta respectiv. Dar aceast constant este nsi media distribuiei
originale, ceea ce nseamn c distribuia z va avea media egal cu zero, ca rezultat al diminurii mediei cu
ea nsi.
2. Abaterea standard a unei distribuii z este ntotdeauna 1. Acest fapt decurge prin efectul cumulat al
proprietilor abaterii standard. Prima proprietate afirm c n cazul scderii unei constante (n cazul
scorurilor z, media) din valorile unei distribuii, abaterea standard a acesteia nu se modific. A doua
proprietate afirm c n cazul mpririi valorilor unei distribuii la o constant, noua abatere standard este
rezultatul raportului dintre vechea abatere standard i constant. Dar constanta de care vorbim este, n cazul
distribuiei z, chiar abaterea standard. Ca urmare, noua abatere standard este un raport dintre dou valori
identice al crui rezultat, evident, este 1.
Marian Popa
mxm m
x Formula
m xxxm
50
=
100
+500
+desfurat
10
14
+ 16
15
+
**100
* *
QI
SAT
====50
zTH
s
ss s s
Note z
Note T
(Thurstone) 1
50+10*z
50
10
Note H
(Hull)
50+14*z
50
14
QI
(Binet)
100+16*z
100
16
QI
(Wechsler)
100+15*z
100
15
SAT
(Scholastic
Assessment
Test)
500+100*z
500
100
Observaii:
Toate variantele sunt obinute prin transformarea operat pe distribuia de note z.
La nici una dintre variante nu mai avem valori negative (cu condiia ca distribuia s nu aib o
variabilitatea aberant).
Zecimalele nu mai sunt semnificative (ele rezult din calcule, dar sunt ignorate).
Distribuiile variantelor oscileaz n jurul unei valori medii specifice, sub care se afl 50% din valori,
i peste care se afl restul de 50% dintre valori.
Scorurile standard mari indic valori mari, iar scorurile standard mici indic valori mici. Acest fapt
poate crea dificulti n unele cazuri. S lum urmtorul exemplu: Un subiect realizeaz 145
rspunsuri corecte la un test de calcul aritmetic (m=120, s=12) i un timp de reacie de 0.15 sec., la
un test de reactivitate (m=0,11, s=0,05). n acest caz, notele T corespunztoare celor dou
performane sunt: T1=50+10*(145-120)/12=70, respectiv T2=50+10*(0,15-0,11)/0,05=58. Cu alte
cuvinte, ar rezulta c la ambele teste subiectul nostru a obinut un rezultat peste medie. Dar aceast
concluzie este fals, dac inem cont c la testul de reactivitate un timp mai mare nseamn o
performan mai sczut. Soluia problemei const n modificarea semnului expresiei de calcul, n
funcie de semnificaia calitativ a valorilor distribuiei. n acest mod, rezultatul transformrii n not
standard la testul de reactivitate devine: T2=50-10*(0,15-0,11)/0,05=42, ceea ce indic exact
semnificaia de performan sub medie. Raportat la valoarea medie a distribuiei T, scorul 58 este
echivalent cu 42, sub aspectul distanei fa de medie (8 uniti). Diferena const n faptul c
valoarea 42 exprim i n mod intuitiv, nu doar cantitativ, evoluia performanei la test. O asemenea
transformare nu este obligatorie, se poate utiliza oricare dintre formule, cu semnul plus, sau minus.
n orice caz, trebuie s precizm semnificaia valorilor mari si mici pentru distribuiile cu care
operm.
Cunoscute mai ales datorit utilizrii n evaluarea scalelor la MMPI, unul dintre cele mai celebre teste de personalitate.
Marian Popa
numit teoretic pentru c nu este rezultatul unui proces real de msurare, ci reprezint un model teoretic.
Conceptul de curb normal (expresia grafic a distribuiei normale) se refer la un anumit tip de
distribuie teoretic care are cteva proprieti caracteristice:
are form de clopot. Cea mai mare parte a valorilor se concentreaz n zona central (medie);
este perfect simetric pe ambele laturi ale sale;
linia curbei se apropie la infinit de axa OX (orizontal), fr a o atinge vreodat;
n conformitate cu proprietatea 2, de fiecare parte a mediei se afl exact jumtate dintre valorile
distribuiei.
Exemple de curbe normale:
Imaginea de mai sus ilustreaz diferite variante ale familiei de curbe normale, care respect, fiecare
dintre ele, condiiile de mai sus, chiar dac au medii i abateri standard diferite.
Distribuia normal z
Curba normal n care valorile sunt exprimate n scoruri z se numete curba normal standardizat. Ea are
toate proprietile enunate mai sus, avnd ns i parametrii oricrei distribuii z: m=0 i s=1. Rezult astfel
c distribuia normal standardizat (z) este este simetric n jurul lui 0.
Curba
normal
standardizat are cteva caracteristici care sunt figurate n imaginea de mai sus i pe care este important s le
reinem:
Aproximativ 34% dintre scorurile distribuiei normale se afl ntre medie i o abatere
standard deasupra mediei (z=+1)
ntre 1z i +1z se afl aproximativ 68% dintre valorile distribuiei
Aproximativ 96% dintre scoruri se afl ntre 2z i +2z
Avnd n vedere distribuia scorurilor z pe o curb normal standardizat, aceasta poate fi utilizat
pentru a afla rspuns la ntrebri precum: Care este procentajul de valori care se afl sub/peste o anumit
not z; ntre anumite note z; ori ntre medie i o not z? Care este nota z corespunztoare unui anumit
procentaj de valori? Pentru a rspunde la aceste ntrebri, se utilizeaz o tabel special care conine, sub
form de probabiliti, frecvenele valorilor de sub curba normal z (Anexa 1).
Aa cum vom vedea mai departe, curba normal are o importan aparte pentru analiza statistic.
Aceasta, deoarece se accept faptul c variabilele statistice s-ar distribui mai ales sub aceasta form dac ar
fi efectuate un numr mare (tinznd spre infinit) de msurri.
Marian Popa
Exemple:
S ne raportm la distribuia valorilor QI, pentru care media este egal cu 100 i abaterea standard 16
Exemplul 1:
Care este procentajul oamenilor al cror scor QI este ntre 100 i 110?
Pentru a rspunde la aceast ntrebare, convertim valorile QI n scoruri z. 100(QI)=0(z). Pentru 110(QI) se
aplic formula:
z=
X m 110 100
=
= +0.63
s
16
Aria de sub curba normal cuprins ntre valorile QI i 100 i 110 este reprezentat pe figura urmtoare:
Citim tabela ariilor la intersecia celulelor 0.6 cu 0.03. Valoarea este 0.2357 ceea ce, exprimat n
procente, este 23.57%
Conchidem c 23.57% din oameni au un QI cuprins ntre 100 i 110)
Exemplul 2:
Care este procentul oamenilor al cror QI este mai mare dect 125?
Convertim n note z:
z=
X m 125 100
=
=+1.56
16
s
Aria de sub curba normal pentru scoruri QI mai mari dect 125 este reprezentat mai jos:
Citim valoarea din tabel care corespunde interseciei celulei 1.5 cu 0.06, pentru a afla procentajul
dintre medie i nota z +1.56. Gsim valoarea, exprimat n procente, 44.06%. Acesta este procentajul dintre
medie i z=+1.56.
tim c procentajul peste medie este 50%, ca urmare, procentajul celor peste QI=125 va fi 5044.06=5.94.
Conchidem c 5.94% dintre oameni au un QI mai mare de 125 (z=1.56)
Exemplul 3:
Care este scorul minim pe care trebuie s l obin o persoan pentru a fi ntre primii 5% din
populaie?
Ne reprezentm aria de sub curb care delimiteaz cele mai mari 5% dintre valorile z, trebuind s
aflm valoarea corespunztoare z, respectiv QI:
Marian Popa
Aria dintre medie i linia noastr este 50%-5%=45%. Cutm n tabel valoarea cea mai apropiat de
0.45 i o gsim la intersecia celulelor 1.6 cu 0.04. Deci, z=1.64 pentru limita procentului de 5%.
Convertim scorul z=1.64 n valoare brut: X=m+z*s=100+ (+1.64)*16=126.24
Conchidem c pentru a fi n primii 5% trebuie s obinem un QI=126.24
Exemplul 4:
Care este scorul care indic cei mai slabi 33%?
Ne reprezentm limita de 33% n zona valorilor de sub medie:
10
Marian Popa
Distribuia de eantionare
Populaie i eantion
Obiectivul legitim al cercetrii tiinifice este identificarea unor adevruri cu un anumit grad de
generalitate. Din punct de vedere statistic generalul este reprezentat de totalitatea valorilor care descriu o
anumit caracteristic, i este numit populaie. Din pcate ns, investigarea tuturor indivizilor (valorilor)
care compun o anumit populaie nu este aproape niciodat posibil. Ca urmare, n practica cercetrii
tiinifice se supun cercetrii psihologice loturi mai restrnse, numite eantioane, extrase din ansamblul
populaiei vizate. Parametrii descriptivi ai acestor eantioane (medie, abatere stadard) sunt extrapolai, n
anumite condiii i cu ajutorul unor proceduri specializate, la populaia din care fac parte.
Parametrii populatiei
Indicatorii
eantionului
estimeaz
A fundamenta un adevr statistic nseamn a trage o concluzie care descrie parametrii unei populaii
de valori, pe baza indicatorilor unui eantion din acea populaie.
n contextul cercetrii statistice utilizm urmtoarele definiii:
Populaia reprezint totalitatea unitilor de informaie care constituie obiectivul de interes al unei
investigaii. Prin uniti de informaie nelegem cel mai adesea persoane (subieci, cu un termen uzual
in cercetarea psihologic 2). Dar, la fel de bine, putem nelege i populaia de cupluri familiale, sau
populaia de diferene dintre mediile a dou variabile, de exemplu. n esen, prin populaie trebuie s
nelegem extinderea maxim posibil, sub aspectul volumului, a respectivei uniti de informaie.
Extinderea menionat este, la rndul ei, definit prin obiectivul de cercetare, ceea ce nseamn ca are o
dimensiune subiectiv. Aceasta se refer la domeniul de interes pe care i-l propune cercettorul. De
exemplu, ntr-un studiu cu privire la efectul oboselii asupra performanei cognitive, pot fi vizate diferite
categorii de populaii: a aviatorilor, a studenilor, a mecanicilor de locomotiv, a ahitilor, etc. Este de la
Denumirea de subiect este respins n mediul anglo-saxon din cauza semnificaiei de supus pe care o are n limba
englez cuvntul subject. Din acest motiv, o variant frecvent uzitat este cea de participant.
11
Marian Popa
sine neles faptul c, nc de la nceputul unei cercetri tiinifice, se va preciza populaia cercetrii, cu alte
cuvinte, domeniul de extindere a rezultatelor i a concluziilor ce urmeaz a fi trase.
Eantionul reprezint unitile de informaie selecionate pentru a fi efectiv studiate. Ideea pe care
se bazeaz cercetrile bazate pe eantioane este aceea c se pot face aprecieri asupra unei ntregi populaii, n
anumite condiii, doar pe baza caracteristicilor msurate pe o parte a acesteia.
Exemple:
- ntr-un studiu asupra efectelor accesului la internet asupra elevilor de liceu, elevii de liceu
reprezint populaia, iar elevii selecionai pentru investigaie, eantionul.
- ntr-un studiu care vizeaz influena inteligenei asupra performanei n instruirea de zbor,
populaia este reprezentat de toi piloii, iar eantionul, de subiecii inclui n studiu.
Dac am reui recoltarea datelor cu privire la ntreaga populaie care face obiectul cercetrii, am
putea trage concluzii directe cu privire la aceasta prin utilizarea indicatorilor statistici descriptivi cunoscui
(medie, dispersie, abatere standard) numii i parametrii populaiei. Dar acest lucru nu este aproape
niciodat posibil i, ca urmare, indicatorii statistici ai eantionului sunt utilizai pentru a face estimri,
inferene, cu privire la parametrii populaiei. n esen, a testa o ipotez statistic nseamn a emite concluzii
asupra unei populaii pe baza rezultatelor obinute pe un eantion care aparine acelei populaii. n acest
context, demersul tiinific presupune urmtorii pai:
1. formularea problemei cercetrii (sub forma unei ntrebri, cu referire la o anumit populaie);
2. emiterea unei ipoteze privind cel mai probabil rspuns;
3. selectarea unui eantion;
4. aplicarea unei proceduri care sa permit acceptarea sau respingerea ipotezei.
Reprezentativitatea eantionului
Verificarea statistic a ipotezelor se bazeaz pe o idee simpl: dac avem un eantion a crui alegere
respect anumite condiii, extras dintr-o populaie orict de mare, rezultatele obinute pe acesta pot fi
extrapolate la ntreaga populaie.
Calitatea unui eantion de a permite extinderea concluziilor la ntreaga populaie din care a fost
extras se numete reprezentativitate. De fapt, nici un eantion nu poate reprezenta perfect datele populaiei.
De aceea reprezentativitatea are o semnificaie relativ. Ca urmare estimrile pe baz de eantion conin
ntotdeauna o doz mai mare sau mai mic de eroare. Cu ct eroarea este mai mic, cu att concluziile
obinute pe eantion pot fi generalizate mai sigur asupra populaiei.
Pentru a permite fundamentarea inferenelor statistice, eantionul trebuie s fie constituit din uniti
de informaie (subieci, valori, etc.) independente unele de altele. Independena valorilor se refer la faptul
c fiecare valoare (sau unitate experimental) trebuie s fie absolut distinct de celelalte. n esen
constituirea unui eantion trebuie s evite efectele unor factori sistematici care s interfereze cu obiectivele
studiului, orientnd rezultatele ntr-o anumit direcie (situaie desemnat n limba englez prin termenul de
bias).
Cteva exemple:
Dac msurm timpul de reacie la un numr de cinci subieci, dar facem trei evaluri la fiecare
subiect, nu avem eantion de 15 valori independente, deoarece valorile aceluiai subiect au n comun
o constant personal care le face dependente una de cealalt. Pentru avea un singur eantion am
putea s utilizm media celor trei determinri pentru fiecare subiect.
Dac dorim s investigm efectul inteligenei asupra performanei colare trebuie s avem grij s
includem n eantion subieci provenind din familii cu un nivel variat al veniturilor, pentru a anihila
influena statutului socio-economic asupra performanei colare.
Un studiu asupra atitudinii fa de utilizarea computerelor n educaie, poate fi influenat n mod
sistematic dac eantionul este constituit numai din elevi care utilizeaz frecvent calculatorul.
n cazul unui sondaj cu privire la inteniile de vot bazat pe interviul telefonic, vom obine rezultate
afectate de starea social a respondenilor (i permit montarea unui telefon) sau de ora apelului (n
orele dimineii sunt acas, s zicem, mai multe femei casnice).
Este clar de ce modul de constituire a eantionului este decisiv pentru nivelul de reprezentativitate.
Esenial n acest caz este asigurarea condiiilor ca acesta s acopere n mod real caracteristicile populaiei,
12
Marian Popa
POPULAIE
eantion 1
eantion 2
eantion 3
eantion 4
Dac fiecare dintre cele patru eantioane de valori are propria sa medie, atunci distribuia mediilor
tuturor eantioanelor extrase se numete distribuia mediei de eantionare sau, mai scurt, distribuia de
eantionare. La rndul ei, distribuia mediilor are i ea o medie, numit medie de eantionare, i care se
calculeaz, evident, dup urmtoarea formul:
m1 + m2 + m3 + ... + mk
k
unde este media populaiei, valorile m sunt mediile fiecrui eantion constituit, iar k este numrul
eantioanelor.
Dac am extrage toate eantioanele posibile dintr-o populaie, atunci media de eantionare este
identic cu media populaiei. Pentru exemplificare, s presupunem c avem o populaie constituit din
valorile 1,2,3,4 i s ne propunem constituirea tuturor eantioanelor posibile de cte 3 valori. Tabelul de mai
jos ilustreaz aceast situaie:
Populaia
Eantioane
1
2
3
1,2,3
1,2,4
3,4,1
Distribuia
mediei de
eantionare
m1=2.00
m2=2.33
m3=2.67
13
Marian Popa
2,3,4
Toate eantioanele
posibile pentru N=3
m4=3.00
=10.00
m=10/4=2.5
Aa cum se observ, dac extragem toate eantioanele posibile (n acest caz 4) dintr-o populaie de
valori, atunci media mediilor eantioanelor extrase (denumit medie de eantionare) este identic cu media
populaiei (n cazul dat: m==2.5). Datele din tabel ne mai arat i faptul c media fiecrui eantion
oscileaz (variaz) n jurul mediei de eantionare. De aceea ele pot fi considerate o estimare a acesteia din
urm, n ciuda impreciziei pe care o conine fiecare. Aceast imprecizie se numete eroare de estimare.
Desigur, exemplul are o valoare de ilustrare teoretic deoarece, n practic, niciodat nu se ajunge la
selectarea tuturor eantioanelor posibile dintr-o anumit populaie de valori.
m2=4.5
s2=4.94
m3=4.0
s3=4.24
m4=2.5
s4=2.12
m5=5.5
s5=6.36
n acest exemplu, cele cinci eantioane nu sunt toate, ci doar o parte din eantioanele posibile de 3
valori extrase din populaia cercetat. Media distribuiei de eantionare pentru acest exemplu este:
m1 + m 2 + m3 + m 4 + m5
= 5.375
5
n ceea ce privete mprtierea distribuiei de eantionare, aceasta este, aa cum am spus, mai mic
dect mprtierea variabilei la nivelul ntregii populaii, deoarece o parte a mprtierii generale se
concentreaz (se pierde) n media fiecrui eantion extras. Ca urmare, abaterea standard a distribuiei de
eantionare este o fraciune din abaterea standard a populaiei, fiind dependent de mrimea eantionului.
Mai precis, fr a intra n detalii explicative, abaterea standard a distribuiei de eantionare este egal cu
sm =
(formula 3.1)
unde sm este eroarea standard a mediei de eantionare, este abaterea standard a populaiei iar N
este volumul eantionului. n cazul distribuiei de mai sus, eroarea standard a mediei este
sm =
3 . 02
= 1 . 74
3
Pentru c, n mod obinuit, abaterea standard a populaiei nu este cunoscut, eroarea standard a
mediei de eantionare se calculeaz utiliznd abaterea standard a eantionului, care reprezint o estimare a
mprtierii la nivelul populaiei.
Figura de mai jos sugereaz foarte bine modul n care, prin creterea volumului eantionului, media
eantionului se apropie tot mai mult de media populaiei, cu alte cuvinte, comport o eroare din ce n ce n
mai mic fa de aceasta.
14
Marian Popa
Expresia de eroare standard a mediei poate fi mai greu de neles, dat fiind faptul c este folosit
pentru a defini un indicator al mprtierii, n timp ce are n compunere cuvntul medie. Trebuie ns s
reinem faptul c acest indicator msoar ct de departe poate fi media unui eantion de media populaiei din
care a fost extras. Altfel spus, ct eroare poate conine media unui eantion n estimarea mediei
populaiei. Avnd n vederea faptul c la numitor avem o expresie bazat pe N (volumul eantionului), este
limpede de ce, cu ct eantionul este mai mare, cu att eroarea standard a mediei este mai mic.
15
Marian Popa
Ne vom referi acum la exemplul anterior, n care avem cinci eantioane extrase dintr-o populaie de
10 valori. Dac avem media distribuiei de eantionare i abaterea standard a acesteia (calculat ca eroare
standard a mediei, cu formula 3.1), atunci putem exprima media unui eantion oarecare, ca scor standardizat
z, ntr-o manier similar cu scorul standardizat z pentru o valoare oarecare. Rostul acestei transformri ar fi
acela de a vedea n ce msur media eantionului de studiu se ndeprteaz de media populaiei de referin.
Cu alte cuvinte, n ce msur rezultatul obinut pe eantion este unul obinuit (mai aproape de media
populaiei) sau unul neobinuit (mai ndeprtat de media populaiei).
Formula de calcul este foarte asemntoare cu formula lui z pentru valori individuale:
z=
m
sm
(formula 3.2)
unde m este media eantionului, media populaiei, iar sm este eroarea standard a mediei.
Dac presupunem c obiectul studiului l face eantionul 1, atunci putem calcula mai nti eroarea
standard a mediei, astfel:
sm =
3.02
= 1.74
3
n exemplul nostru, limitat la o populaie cunoscut, am putut calcula abaterea standard a populaiei
(=3.02), dar pentru situaii reale, cu populaii nelimitate, acest lucru nu este posibil. n astfel de cazuri se
accept faptul c abaterea standard a populaiei este suficient de bine reprezentat de abaterea standard a
eantionului extras din aceasta. Ca urmare, dac nu aveam abaterea standard a populaiei, am fi putut utiliza
16
Marian Popa
n formula erorii standard a mediei abaterea standard a eantionului (n cazul nostru s1=5.65 n loc de
=3.02).
Mai departe, scorul standard z pentru eantionul 1, se calculeaz astfel:
z=
m 5 5 . 5 0 .5
=
=
= 0.28 este eroarea standard a mediei.
1.74
1.74
sm
Exemplu:
S presupunem c, la un examen de cunotine de statistic, o grup de 45 de studeni obine un scor
mediu de m=28.5 puncte. Presupunnd c media pe populaia studeneasc care a mai dat acest examen
(calculat de-a lungul anilor anteriori) este =27.3, cu o abatere standard =8.2, trebuie s aflm care este
performana grupei respective transformat n not z.
Calculm mai nti abaterea standard a mediei:
sm =
Calculm apoi scorul z pentru grup:
z=
8.2
8.2
=
= 1.22
45 6.70
Dac vrem s tim unde se plaseaz performana grupului nostru pe o curb normal, atunci ne uitm
pe tabela notelor z i gsim, n dreptul scorului z=0.98, valoarea tabelar 0.3365. Aceasta poate fi interpretat
n mai multe feluri. De exemplu, putem spune c procentul performanelor posibile peste nivelul grupului
nostru este 50%-33%, adic 17%. Sau, n termeni probabilistici, putem sune i c: probabilitatea de a avea
o grup (un eantion, de aceeai mrime) care s obin un scor mai bun la un examen de statistic (cu
aceleai ntrebri) este de 0.17.
Ipoteza cercetrii
n mod obinuit, o cercetare tiinific se bazeaz pe estimarea unui rezultat ateptat, denumit
ipotez. n cazul nostru, psihologul se poate atepta n mod legitim ca participanii la olimpiad s fie mai
inteligeni dect elevii n general. Acest rezultat ateptat, prefigurat, se numete ipoteza cercetrii, fiind
codificat cu H1. Am putea formaliza ipoteza cercetrii astfel:
H1 mpomeg
unde mpo reprezint media inteligenei populaiei participanilor la olimpiade, iar meg reprezint
media inteligenei populaiei elevilor n general.
n conformitate cu ipoteza cercetrii, exist dou populaii distincte sub aspectul nivelului de
inteligen, cea a elevilor participani la olimpiade i cea a elevilor n general.
17
Marian Popa
n realitate, media QI este diferit n funcie de vrst, dar, pentru exemplul nostru, vom accepta c populaia general
de elevi are o medie de 100 i o abatere standard de 15.
18
Marian Popa
aceeai mrime, selectate la ntmplare din populaia de nul, ar putea avea un QI mediu mai mare dect
eantionul de participani la olimpiad.
Procedura de calcul
n urma aplicrii testului de inteligen pentru eantionul de participani la olimpiad (N=30) am
obinut urmtoarele valori statistice: m=106 i s=7. Ne amintim c media inteligenei populaiei, exprimat n
uniti QI, este =100, iar abaterea standard =15. Cu aceste date putem calcula nota z corespunztoare
eantionului cercetrii, cu formula:
z=
m
sm
(formula 3.4)
unde m este media eantionului, este media populaiei, iar sm este eroarea standard a mediei.
Rezultatul calculului este:
z=
m 106 100
6
6
=
=
=
= +2.18
sm
15 / 5.47 2.74
/ N
n exemplul de mai sus, fiind vorba de o valoare QI, a crei abatere standard la nivelul populaiei ne
este cunoscut (am optat pentru =15) i am utilizat-o ca atare. Dac ar fi fost vorba de o variabil pentru
care nu cunoteam abaterea standard la nivelul populaiei, am fi putut utiliza aceeai valoare calculat pe
eantionul de studiu (s=7).
Dac citim frecvena corespunztoare valorii z calculate (2.18) n tabelul distribuiei normale,
constatm c ntre media populaiei de nul (z=0) i nivelul inteligenei eantionului de elevi olimpici se afl
48.54% dintre valorile posibile. De aici rezult c exist 50-48.54 adic 1.46% anse (sau o probabilitate
p=0.0146) ca hazardul s produc un eantion cu un QI egal sau mai mare dect eantionul cercetrii noastre.
Imaginea de mai jos ilustreaz grafic poziia mediei eantionului de cercetare pe distribuia de nul.
Ne putem imagina o situaie n care scorul mediu QI al eantionului de participani la olimpiad este
att de mare nct s nu existe nici o ans de a se obine un rezultat mai bun ca urmare a unei selecii
ntmpltoare din populaia de nul? Teoretic, acest lucru nu este posibil. Orict de mare ar fi media unui
eantion de olimpici, hazardul poate produce un eantion cu medie mai mare din populaia de nul, deoarece
curba normal este asimptotic. Exist ns un prag dincolo de care probabilitatea unui eantion aleatoriu
din populaia general de elevi cu un QI mai mare dect cel al eantionului de olimpici este att de mic,
nct s ne putem permite s o considerm neglijabil. ntr-un asemenea caz, putem concluziona c valoarea
calculat pe eantionul cercetrii nu decurge din variaia ntmpltoare a mediei de eantionare, ci provine
din aciunea unui factor sistematic care a condus la ndeprtarea semnificativ a mediei eantionului de
19
Marian Popa
studiu de media populaiei (n cazul nostru, accesul celor mai inteligeni elevi la olimpiadele colare). Despre
pragul evocat mai sus, vom vorbi n continuare.
Decizia statistic
Urmtorul pas pe care trebuie s l fac cercettorul este acela de a decide dac valoarea medie a
eantionului de olimpici decurge din faptul c acetia sunt ntr-adevr mai inteligeni dect elevii n general,
sau reprezint rezultatul unui joc al ansei, care a condus la selecia unui eantion ce nu se difereniaz n
mod real de populaia de nul.
Este evident faptul c, dac media eantionului de olimpici ar fi fost egal cu 100, cercettorul ar fi
decis c valoarea nu confirm ipoteza cercetrii. n exemplul dat ns, media eantionului cercetrii fiind mai
mare, ne punem problema, ct de mare trebuie s fie diferena fa de media populaiei pentru a accepta c
este o diferen real (determinat de un factor de influen, accesul la olimpiad pe baza inteligenei).
Altfel spus, trebuie s decidem dac acceptm sau respingem ipoteza de nul.
Din pcate, nu exist un criteriu obiectiv de decizie ntr-o situaie de acest gen. Acceptarea sau
respingerea ipotezei de nul depinde de gradul de risc pe care suntem dispui s ni-l asumm n acest sens.
Este evident c cineva interesat n acceptarea ideii c olimpicii sunt mai inteligeni ar fi dispus s considere
c valoarea obinut este suficient de ndeprtat de medie pentru a respinge ipoteza de nul. La fel cum,
cineva nencreztor n aceast ipotez (considernd c efortul de studiu, motivaia, fac diferena dintre
participanii i neparticipanii la olimpiadele colare), ar putea fi dispus s impun un prag de respingere mult
mai sever. Iat de ce, n practica cercetrii tiinifice s-a impus convenia unui prag maxim de risc acceptat
pentru decizia statistic. Acest prag critic se numete nivel alfa () i corespunde probabilitii de 0.05. Pe
curba normal z, fiecrei probabiliti i corespunde o anumit valoare z, ca urmare i probabilitii critice
alfa i corespunde o valoare critic z. Dat fiind faptul c a nceput prin a fi citit dintr-un tabel, mai este
desemnat i ca valoare tabelar.
Avem acum toate elementele pentru luarea deciziei statistice n cazul cercetrii noastre, pe baza unui
raionament convenional, identic pentru ntreaga comunitate tiinific. Esena acestuia const n comparaia
rezultatelor derivate dintr-un context de cercetare cu cele specifice unui context ipotetic, aleatoriu (bazat pe
ansa pur), dup cum urmeaz:
a. Dac rezultatul calculat pentru eantion este cel puin egal sau mai mare dect scorul critic, atunci
avem un rezultat semnificativ al cercetrii. Aceasta, deoarece se accept c ansele ca acest rezultat s fi
decurs din ntmplare sunt suficient de mici pentru a fi ignorate. n consecin, ntr-un astfel de caz, ipoteza
de nul (H0) se respinge, iar ipoteza cercetrii (H1) se consider confirmat la un prag alfa=0.05 (dac acesta a
fost nivelul ales).
b. Dac rezultatul eantionului este mai mic dect scorul z critic, atunci avem un rezultat nesemnificativ
al cercetrii, prin faptul c exist prea multe anse ca acesta s poat fi obinut n condiii pur aleatoare. n
aceast variant, ipoteza de nul se accept, iar ipoteza cercetrii se consider infirmat la un prag alfa=0.05.
c. Cele dou reguli decizionale de la punctele a i b sunt exprimate pe baza comparaiei dintre valoarea
calculat a testului i valoarea critic tabelar, aferent nivelului alfa. Ele ns pot fi exprimate i direct, prin
comparaia probabilitii valorii calculate cu alfa. Singura diferen este dat de faptul c raportul dintre
probabilitatea asociat scorului calculat i alfa este invers dect n cazul valorilor. Astfel, ipoteza de nul se
admite dac probabilitatea (p) a valorii calculate este mai mare dect alfa, i se respinge dac este egal sau
mai mare dect acesta. Aceast precizare, i dovedete utilitatea n momentul n care se utilizeaz programe
statistice, care fac inutil consultarea tabelelor distribuiei de nul, deoarece dau direct probabilitatea asociat
valorii calculate a testului.
Imaginea de mai jos ilustreaz poziia valorii calculate a testului z n raport cu valoarea critic pentru
alfa=0.05.
20
Marian Popa
Dat fiind faptul c z calculat (+2.18) este mai mare dect z critic pentru valoarea lui alfa=0.05
(+1.65), decidem respingerea ipotezei de nul 6. Ca urmare, n legtur cu studiul nostru demonstrativ, trebuie
s decidem respingerea ipotezei de nul (participanii la olimpiade nu sunt mai inteligeni dect elevii n
general) ceea ce nseamn, implicit, confirmarea ipotezei de cercetare. (participanii la olimpiade sunt
mai inteligeni dect elevii n general).
Raionamentul deciziei statistice exemplificat astfel, se va regsi n toate situaiile de testare a
ipotezelor statistice cu care ne vom confrunta mai departe, indiferent de modelul de cercetare i de natura
relaiei pe care vrem s o demonstrm ntre variabile.
Ce s-ar fi ntmplat ns dac eantionul cercetrii ar fi obinut un scor QI=94, ceea ce ar fi corespuns
unui scor z=-2.18? n acest caz, aplicnd un test unilateral orientat spre valori superioare mediei, conform
ipotezei, ar fi trebuit s acceptm ipoteza de nul, concluzionnd c olimpicii nu sunt mai inteligeni dect
media, fr a putea emite o concluzie privitoare la faptul c ei sunt, de fapt, mai puin inteligeni, aa cum ar
fi cerut-o datele cercetrii.
Pentru a elimina acest neajuns putem verifica ipoteza pe ambele laturi ale distribuiei, aplicnd ceea
ce se numete un test bilateral (two-tailed). n acest caz se pstreaz acelai nivel alfa (0.05), dar el se
distribuie n mod egal pe ambele extreme ale curbei, astfel nct pentru 2.5% de fiecare parte, avem un z
6
Puteam ajunge la aceeai concluzie pe baza faptului c probabilitatea valorii calculate (0.014) este mai mic dect alfa
(0.05), dar acest raionament nu este posibil dect atunci cnd utilizm programe specializate de calcul, care ne ofer
direct valoarea lui p calculat.
21
Marian Popa
critic de 1.96 (cu semnul - sau +). Aceast valoare este luat din tabelul ariei de sub curb, n dreptul
probabilitii 0.4750 care corespunde unei probabiliti complementare de 0.025 (echivalent cu 2.5%).
Figura de mai sus indic scorurile critice pentru un test z bilateral. Se observ c n cazul alegerii
unui test bilateral (z=1.96) nivelul de 5% se mparte n mod egal ntre cele dou laturi ale curbei. Este de
la sine neles faptul c semnificaia statistic este mai greu de atins n cazul unui test bilateral dect n cazul
unui test unilateral, deoarece valoarea testului trebuie s fie mai mare de 1.65, ct este n cazul pentru un test
unilateral.
Alegerea tipului de test, unilateral sau bilateral, este la latitudinea cercettorului. De regul ns, se
prefer testul bilateral, chiar i n situaii de cercetare cum este aceea din exemplul nostru, cnd o diferen
negativ fa de media populaiei este improbabil. Motivul l constituie necesitatea de a introduce mai mult
rigoare i de a lsa mai puin loc hazardului. Se alege testul unilateral doar atunci cnd suntem interesai de
evaluarea semnificaiei strict ntr-o anumit direcie a curbei, sau atunci cnd miza rezultatului este prea
mare nct s fie justificat asumarea unui risc sporit de eroare. n mod uzual, ipotezele statistice sunt testate
bilateral, chiar dac ipoteza cercetrii este formulat n termeni unilaterali. Testarea unilateral este utilizat
numai n mod excepional, n cazuri bine justificate.
O scurt discuie pe tema nivelului alfa maxim acceptabil (0.05) se impune, avnd n vedere faptul
c ntregul eafodaj al deciziei statistice se sprijin pe acest prag. Vom sublinia, din nou, c p=0.05 este un
prag de semnificaie convenional, impus prin consensul cercettorilor din toate domeniile, nu doar n
psihologie. Faptul c scorul critic pentru atingerea pragului de semnificaie este 1.96 a jucat, de asemenea,
un rol n impunerea acestei convenii. Practic, putem considera c orice ndeprtare mai mare de dou abateri
standard de la media populaiei de referin este semnificativ. Chiar dac persist posibiliti de a ne nela,
ele sunt suficient de mici pentru a le trece cu vederea.
Impunerea unui prag minim de semnificaie a testelor statistice are ns, mai ales, rolul de a garanta
faptul c orice concluzie bazat pe date statistice rspunde aceluiai criteriu de exigen, nefiind influenat
de subiectivitatea cercettorului. Nivelul alfa de 0.05 nu este dect pragul maxim acceptat. Nimic nu
mpiedic un cercettor s i impun un nivel mai exigent pentru testarea ipotezei de nul, ceea e nseamn
un prag alfa mai sczut. n practic mai este utilizat pragul de 0.01 i, mai rar, cel de 0.001. Toate aceste
praguri pot fi exprimate i n procente, prin opusul lor, care exprim nivelul de ncredere n rezultatul
cercetrii. Astfel, printr-o probabilitate de 0.05 se poate nelege i un nivel de ncredere de 95% n rezultatul
cercetrii (99%, pentru p=0.01 i, respectiv, 99.9% pentru p=0.001).
n fine, este bine s subliniem faptul c utilizarea acestor praguri vine din perioada n care nu
existau calculatoare i programe automate de prelucrare statistic. Din acest motiv, cercettorii calculau
valoarea testului statistic pe care apoi o comparau cu valori tabelare ale probabilitii de sub curba de
referin. Pentru a face mai practice aceste tabele, ele nu cuprindeau toate valorile de sub curb, ci doar o
parte dintre acestea, printre ele, desigur, cele care marcau anumite praguri. Rezultatul cercetrii era
raportat, de aceea, prin invocarea faptului de a fi sub pragul de semnificaie sau deasupra sa. Odat cu
diseminarea pe scar larg a tehnicii de calcul i cu apariia programelor de prelucrri statistice, semnificaia
valorilor testelor statistice nu mai este cutat n tabele, ci este calculat direct i exact de ctre program,
putnd fi afiat ca atare. De aici, aa cum am mai spus, rezult i posibilitatea de a lua decizia statistic prin
compararea direct a valorii calculate a lui p cu pragul alfa critic asumat.
22
Marian Popa
eantionului cercetrii ne ofer o estimare a acesteia dar, ca orice estimare, conine o anumit imprecizie,
exprimat prin eroarea standard a mediei. Nu vom putea ti niciodat cu precizie care este media inteligenei
populaiei de elevi olimpici, dar teorema limitei centrale ne permite s calculm, cu o anumit probabilitate,
n ce interval se afl ea, pe baza mediei eantionului cercetrii i a erorii standard a acesteia.
Acest lucru se bazeaz pe proprietatea curbei normale de a avea un numr bine definit de valori pe
un interval simetric n jurul mediei. Astfel, dac lum pe curba normal un interval cuprins ntre z=1.96 de
o parte i de alta a mediei, tim c acoperim aproximativ 95% din valorile posibile ale distribuiei. n acest
caz, z=1.96 se numete z critic deoarece reprezint un prag limit, pe cele dou laturi ale distribuiei (care,
pentru curba normal standardizat, este 0). Alegerea acestor limite pentru z critic este convenional. Se pot
alege, la fel de bine, valori simetrice ale lui z care s cuprind ntre ele 99% sau 99.9% dintre valorile de pe
curba normal. Prin consens, ns, se consider c asumarea unui nivel de ncredere de 95% (corespunztor
pentru valori critice ale lui z=1.96) este considerat suficient pentru pstrarea unui echilibru ntre precizia
estimrii i probabilitatea estimrii. Ca urmare, n aceast condiie, putem spune c exist 95% anse ca,
avnd media unui eantion aleator, media populaiei s se afle undeva n intervalul:
= m z critic * s m
(formula 3.3)
sm =
15
= 2.74
30
Mai departe, utiliznd formula 3.3 pentru datele eantionului cercetrii, limitele de ncredere pentru
media populaiei mediei pot fi calculate astfel:
pentru limita inferioar = 106 1.96 * 2.74 = 100.62
pentru limita superioar = 106 + 1.96 * 2.74 = 111 .37
Ca urmare, putem afirma, cu o probabilitate de 95%, c media real a populaiei de elevi olimpici,
estimat prin media eantionului cercetrii, se afl undeva ntre 100.6 i 111.3. Acest interval a crui limit
inferioar este foarte aproape de media populaiei generale de valori QI (100), ne arat c, dei semnificativ,
diferena eantionului nostru nu are o valoare foarte ridicat. Trebuie s observm, de asemenea, c mrimea
intervalului de ncredere rezult din imprecizia mediei, exprimat prin eroarea standard a mediei. Acesta, la
rndul ei, este cu att mai mare cu ct volumul eantionului este mai mic. Desigur, cu ct limitele intervalului
de estimare sunt mai apropiate de media eantionului, cu att aceasta din urm estimeaz mai precis media
populaiei i prezint mai mult ncredere.
23
Marian Popa
a dezvoltat un model teoretic propriu, bazat pe un tip special de distribuie, denumit distribuie t, cunoscut
ns i ca distribuia Student, dup pseudonimul cu care a semnat articolul n care i-a expus modelul.
n esen, distribuia t este o distribuie teoretic care are toate caracteristicile unei distribuii
normale (este perfect simetric i are form de clopot). Specificul acestei distribuii const n faptul c forma
ei (mai exact, nlimea) depinde de un parametru denumit grade de libertate (df sau degrees of freedom),
care este egal cu N-1 (unde N este volumul eantionului). Acest parametru poate fi orice numr mai mare
dect 0, iar mrimea lui este aceea care definete forma exact a curbei i, implicit, proporia valorilor de sub
curb ntre diferite puncte ale acesteia. Imaginea de mai jos ilustreaz modul de variaie a nlimii
distribuiei t, n funcie de gradele de libertate.
df 31...
df = 6
df = 3
-3,18
-1,96
-2,45
+1,96 +3,18
+2,45
Aa cum se observ, curba devine din ce n ce mai aplatizat pe msur ce df (volumul eantionului)
este mai mic. Acest fapt are drept consecin existena unui numr mai mare de valori spre extremele
distribuiei. Nu este ns greu de observat c, pe msur ce df este mai mare, distribuia t se apropie de o
distribuie normal standard astfel nct, pentru valori ale lui N de peste 31 (df=30), aria de sub curba
distribuiei t se apropie foarte mult de valorile de sub aria curbei normale standard (z), iar scorul critic pentru
t este acelai ca i cel pentru z pe curba normal (1.96).
Din cele spuse rezult c, dac avem un eantion de
volum mic (N<30), vom utiliza testul t n
loc de testul z, pe baza unei formule asemntoare:
t=
m
sm
(formula 3.4)
unde:
m este media eantionului
este media populaiei
sm este eroarea standard a mediei
Interpretarea valorii lui t se face n mod similar cu cea pentru valoarea lui z, cu deosebirea c se
utilizeaz tabelul distributiei t (Anexa 2). n acest caz, valorile critice ale lui t vor fi diferite n funcie de
numrul de grade de libertate. Citind tabelul, se observ c pragurile critice ale lui t (subnelegnd
alfa=0.05, pentru test bilateral) se plaseaz la valori diferite n funcie de nivelul df. n acelai timp, dac df
este mare (peste 30), valorile tabelare ale lui t se apropie de cele ale lui z. La infinit, ele sunt identice (1.96,
la fel ca i n cazul valorilor lui z).
Date fiind caracteristicile enunate, n practic, testul t se poate utiliza i pentru eantioane mari
(N30). n nici un caz ns, nu poate fi utilizat testul z pentru eantioane mici (N<30). Utilizarea testului
bazat pe un singur eantion (fie z sau t) depinde ntr-o msur decisiv de asigurarea caracteristicii aleatoare
a eantionului.
24
Marian Popa
La o evaluare a cunotinelor de statistic indicatorii statistici descriptivi pentru studenii din ntregul an de
studiu (populaia) sunt urmtorii:
=19.8
=3.91
N=192
Aceiai indicatori, pentru dou cele dou grupe de studiu care compun anul respectiv, sunt urmtoarele:
GR.
1
2
18.36
20.21
4.45
3.09
32
31
Programele de prelucrri statistice utilizeaz termenul Sig. (de la significance n loc de p. Ele sunt strict
echivalente.
25
Marian Popa
S presupunem c avem un munte n care bnuim s se afl aur (populaia) i ca dorim s dovedim
prezena lui pe baza unei cantiti de pmnt extrase dintr-un loc ales la ntmplare (eantion) din acest
munte. Ipoteza de nul n acest caz afirm c aurul nu este prezent n acest munte mai mult dect n orice alt
loc. Mai departe, determinm cantitatea de aur din eantionul recoltat i descoperim o anumit concentraie
de metal preios. n final, trebuie s hotrm dac aceast concentraie difer de concentraia natural, pe
care ne putem atepta s o gsim oriunde. Dac nivelul concentraiei de aur din eantion este mai mare dect
cel al concentraiei pe care ne ateptm s gsim n cel mult 5% (pragul alfa) din eantioanele recoltate din
orice loc de pe pmnt, ales la ntmplare, atunci suntem ndreptii s concluzionm c aurul din
eantionul cercetrii nu este ntmpltor (respingem H0) i, implicit, c foarte probabil muntele nostru
conine aur ntr-o concentraie mai mare dect cea natural (acceptm H1).
Am spus mai sus foarte probabil, fiindc este evident faptul c nu putem fi absolut siguri de
rezultatul nostru. n conformitate cu legea distribuiei normale, dac am recolta la ntmplare eantioane de
pmnt, ne putem atepta s avem situaii n care concentraia de aur s fie orict de mare, fr ca acest lucru
sa nsemne neaprat c muntele (populaia cercetrii) este un zcmnt aurifer (poate exista doar o zon
limitat, cu concentraie mare, iar restul muntelui s nu conin aur). Aceasta nseamn c asumarea deciziei
cu privire la ipoteza de nul presupune implicit asumarea riscului unei anumite erori. Chiar dac respectm
rigorile raionamentului i deciziei statistice, nu avem garania c decizia noastr reflect realitatea vieii.
Cercetrile statistice au un caracter probabilist i, ca atare, conin o anumit cantitate de eroare.
Erori statistice
n raport cu realitatea vieii, decizia cu privire la ipoteza de nul poate fi corect sau greit dar, din
pcate, cercettorul care a efectuat studiul privind inteligena elevilor olimpici nu are cum s tie cu
certitudine dac decizia pe care o ia este cu adevrat corect sau este greit. O imagine sintetic, frecvent
utilizat pentru a ilustra relaiile posibile ntre decizia statistic i adevrul vieii, este prezentat n mod
clasic prin urmtorul tablou:
Decizia
statistic
Acceptarea H0
(olimpicii NU SUNT
mai inteligeni)
Respingerea H0
(olimpicii SUNT mai
inteligeni)
Adevrul vieii
(necunoscut)
H0 este fals
H0 este adevrat
(olimpicii NU SUNT mai
(olimpicii SUNT mai
inteligeni)
inteligeni)
1. decizie corect
4. eroare de tip II
p=1-alfa
p=beta
2. eroare de tip I
P=alfa
3. decizie corect
p=1-beta (power)
Aa cum observm, decizia statistic este corect n dou din celulele tabelului de mai sus: celula 1,
acceptarea ipotezei de nul cnd ea este i n realitate adevrat, i celula 3, respingerea ipotezei de nul atunci
cnd ea este i n realitate fals. n acest din urm caz ne plasm ntr-o situaie statistic ideal, n care
decizia confirm ipoteza cercetrii, atunci cnd aceasta este adevrat i n viaa real. Capacitatea unui test
statistic de a susine o astfel de decizie, se numete puterea testului statistic (sau puterea cercetrii), pe
care o vom analiza pe larg puin mai trziu. La rndul lor, erorile sunt ilustrate n celelalte dou celule: celula
2, cnd respingem, ipoteza de nul, dei ea este adevrat i celula 4, cnd acceptm ipoteza de nul, dei ea
este fals. Pentru nceput, vom detalia situaiile de eroare.
n continuare, vom analiza n detaliu situaiile de eroare statistic.
26
Marian Popa
Eroarea de tip I
Cercettorul tie c, chiar i n cazul n care testul diferenei dintre media eantionului i media
populaiei este mai mare dect valoarea critic corespunztoare lui alfa, hazardul ar putea produce o
diferen chiar mai mare dect cea constatat, fr nicio legtur cu prezena la olimpiad. Rezult de aici c,
dac pe baza rezultatului la testul statistic respingem ipoteza de nul i acceptm c participarea la olimpiade
se asociaz cu un nivel mai ridicat al inteligenei, o facem asumndu-ne contient riscul unei erori. Dac
diferena dintre cele dou medii rezult a fi semnificativ i respingem ipoteza de nul, dei conform
adevrului vieii ea este adevrat, se comite o eroare de tip I. Probabilitatea acesteia este egal cu
valoarea pragului alfa, al crui nivel maxim acceptabil este fixat convenional la 0.05. Atunci cnd fixm
valoarea lui alfa (0.05 sau mai mic) drept criteriu de respingere a ipotezei de nul, definim, de fapt, cantitatea
de eroare pe care suntem dispui s ne-o asumm n a respinge ipoteza de nul, chiar dac n realitate aceasta
ar putea fi adevrat. Altfel spus, riscul de a decide c muntele conine un zcmnt aurifer, cnd de fapt
acest lucru nu este adevrat. Din acest motiv, eroarea de tip I se concretizeaz ntr-un rezultat fals pozitiv.
Decizia statistic se bazeaz pe msura n care eantionul reprezint n mod rezonabil caracteristicile
populaiei. Chiar dac selecia eantionului s-a fcut n condiii ideale, exist o anumit probabilitate (cu att
mai mare cu ct eantionul este mai mic) ca valorile sale s se abat de la parametrii populaiei (adevrul
vieii). Ca urmare, putem s ne imaginm o situaie n care, chiar i un eantion selecionat aleatoriu s
prezinte valori neobinuit de ndeprtate de parametrii populaiei, fr nici o legtur cu condiia cercetrii.
ntr-o astfel de situaie, supunndu-ne n mod corect regulilor convenionale ale deciziei statistice, respingem
ipoteza de nul, fcnd o eroare de tip I i asumndu-ne un rezultat fals pozitiv. Desigur, putem reduce
probabilitatea erorii de tip I prin asumarea unei valori mai mici pentru alfa dar, aa cum vom vedea mai
departe, acest lucru nu este lipsit de consecine.
Dac privim n cvadrantul 1 din tabelul de mai sus, vom observa c probabilitatea de a decide corect,
prin acceptarea ipotezei de nul atunci cnd ea este ntr-adevr adevrat este egal cu 1-alfa. Acest lucru
nseamn c prin asumarea unei valori alfa=0.05, de exemplu, avem o probabilitate de 0.95 (1-0.5) de a
accepta H0 cnd aceasta este n mod real adevrat. Din acest motiv valoarea din cadranul 1 se numete nivel
de ncredere. Ca s nelegem i mai bine, s ne imaginm c am efectua exact acelai studiu de 100 de ori,
utiliznd eantioane diferite, dar similare sub aspectul vrstei copiilor, volumului grupurilor i procedurii etc.
n cazul unei decizii statistice care respect criteriile impuse, cu alfa=0.05 (implicit, 1-alfa=0.95), ne putem
atepta ca n 5% dintre aceste cercetri (100x0.05) s respingem n mod greit ipoteza de nul (aceasta fiind,
n realitate, adevrat). Acest lucru este echivalent cu a spune c avem un nivel de ncredere de 95%
(100x0.95) s acceptm corect ipoteza de nul, dar i c avem 95% anse s acceptm o ipotez de nul care
este n realitate adevrat. Cu alte cuvinte, valoarea lui alfa ne spune care este probabilitatea de a respinge n
mod nejustificat o ipotez de nul, adevrat n viaa real, eroare pe care ns cercettorul este dispus s o
tolereze.
Eroarea de tip II
Dar dac, dei muntele la care am fcut referire conine n mod real un zcmnt de aur, iar
eantionul nostru nu conine dovada acestui fapt i ne silete s admitem ipoteza de nul? n acest caz
comitem o eroare de tip II, care descrie un rezultat fals negativ.
S presupunem c participarea la olimpiad este asociat n mod real cu un nivel de inteligen mai
ridicat dar, ca urmare a hazardului eantionrii, diferena dintre media eantionului cercetrii i media
populaiei nu atinge pragul semnificaiei statistice. Aceasta este situaia n care, dei elevii olimpici sunt mai
inteligeni, cercetarea noastr are un rezultat nesemnificativ. S nu uitm c cercettorul nu cunoate care
este adevrul vieii (dac olimpicii sunt mai inteligeni) i, drept urmare, chiar i atunci cnd admite o
ipotez de nul i asum un risc de eroare. Aceasta este o eroare de tip II, codificat cu beta. Admiterea
existenei erorii de tip II nu este lipsit de controverse. Fisher, unul dintre teoreticienii marcani ai statisticii
moderne, considera c atunci cnd nu decidem respingerea ipotezei de nul, nu decidem acceptarea ei, ci doar
consemnm eecul de a o respinge, ceea ce nu este propriu-zis o decizie. Abia mai trziu, Neyman i Egon
Pearson (fiul lui Karl Pearson, autorul coeficientului de corelaie care i poart numele) au dezvoltat teoria
modern a deciziei statistice, n prezent larg acceptat de comunitatea tiinific (B. Cohen, 2001).
Stabilirea nivelului probabilitii erorii de tip II nu este uor de neles, mai ales c ea este n legtur
cu puterea testului, probabilitatea deciziei corecte, fixat n cadranul 3 al tabelului. Aceste dou valori sunt
complementare, puterea testului fiind egal cu 1-beta. n general, o valoare acceptabil pentru eroarea de tip
27
Marian Popa
II este beta=0.20, deoarece, aa cum vom vedea mai trziu, valoarea recomandabil pentru puterea testului
este 0.80.
Atunci cnd iniiaz studiul privind relaia dintre inteligen i participarea la olimpiadele colare,
cercettorul este interesat mai ales s evite admiterea ipotezei de nul atunci cnd aceasta ar fi, n realitate,
fals. Altfel spus, cercettorul este interesat cu precdere n asumarea unei valori ct mai mici pentru eroarea
de tip II (evitarea acceptrii ipotezei de nul cnd ea este fals), deoarece ar nsemna c nu poate confirma
ipoteza a cercetrii. Micorarea erorii de tip II ar nsemna ns asumarea implicit a unei valori mai mari
pentru riscul erorii de tip I. Se poate stabili o ierarhie ntre cele dou tipuri de eroare? Este una mai
periculoas dect alta? n mod obinuit, societatea i impune punctul de vedere, declarnd eroarea de tip
I ca fiind mai periculoas, prin fixarea limitei maxime pentru eroarea de tip I (alfa=0.05). Dar de ce ar fi
admiterea greit a ipotezei de nul mai rea dect respingerea ei greit? Aici trebuie s fim n consens cu
Hack (2004) care afirm c, dei exist o tendin de considerare a erorii de tip I ca fiind mai rea dect
eroarea de tip II, n realitate ambele tipuri de erori pot fi la fel de rele, prin consecinele practice care
decurg din rezultatele cercetrii.
Nu avem nici un motiv s credem c vreunul dintre cele dou tipuri de eroare este mai ru sau mai
bun dect cellalt. Dac avem n vedere un criteriu moral, nainte de toate ar trebui s nu ne asumm un
rezultat pozitiv al cercetrii, fr ca acest lucru s fie adevrat. Pe de alt parte, respingerea unui adevr
tiinific numai pentru c cercetarea nu a fost n msur s aduc dovada acestuia, este de asemenea de
nedorit. Dac am concluziona c muntele conine un zcmnt de aur, iar acest lucru s-ar dovedi fals, eroare
de tip I, ar rezulta pierderi mari de organizare a unei exploatri ineficiente. La rndul ei, o eroare de tip II,
care presupune admiterea ipotezei de nul i negarea existenei unui zcmnt real, ar conduce la pierderi prin
neexploatarea aurului existent. La fel, n plan psihologic, dac obiectul testului statistic ar fi efectul unei noi
metode de tratament psihoterapeutic, este la fel de ru s fie acceptat utilizarea ei, dei nu este eficient
(eroare de tip I), ca i respingerea utilizrii, dac ar fi eficient (eroare de tip II), deoarece pacienii sunt
lipsii de un serviciu util.
28
Marian Popa
Conceptul de eroare de tip III este fundamental diferit de celelalte dou tipuri de erori. Existena lui
vine s ne aduc aminte c cercetarea tiinific vizeaz n ultim instan un adevr al realitii, care nu este
complet demonstrat de raionamentul decizional statistic, bazat pe atitudinea fa de ipoteza cercetrii i
admiterea sau respingerea ipotezei de nul. Principala lui utilitate este aceea c ne atrage atenia asupra
vulnerabilitii cercetrilor statistice, subliniind relativitatea acestora i faptul c simpla declarare drept
semnificativ a rezultatului unei cercetri nu probeaz n mod suficient adevrul ipotezei i nici nu reflect n
mod sigur realitatea. Existena erorii de tip III este unul din argumentele mpotriva asumrii simpliste a
rezultatelor statistice pe baza deciziei cu privire la ipoteza de nul. Mijlocul esenial de protecie mpotriva
erorii de tip III este stabilitatea rezultatelor de la o cercetare la alta, replicabilitatea lor, care nseamn
obinerea acelorai rezultate la repetarea studiului n aceleai condiii.
Puterea testului
Revenind la analogia cu muntele aurifer, s presupunem c rezultatul cercetrii ne impune admiterea
ipotezei de nul, implicit respingerea ipotezei c muntele conine aur. ntr-un astfel de caz avem dou
posibiliti de interpretare a acestui rezultat:
a. fie rezultatul cercetrii este corect, ipoteza de nul este de fapt adevrat (ipoteza cercetrii este
realmente fals), iar muntele nu conine aur (elevii olimpici nu sunt mai inteligeni dect
populaia elevilor n general);
b. fie ipoteza de nul este fals, ceea ce ar nsemna c zcmntul de aur exist (olimpicii sunt mai
inteligeni), dar explorarea noastr nu a avut suficient putere (sensibilitate) pentru a
surprinde existena aurului (relaia dintre participarea la olimpiad i nivelul de inteligen). n
acest caz, prin acceptarea ipotezei de nul (respingerea ipotezei cercetrii) am comis o eroare de
tip II.
Puterea testului este definit prin capacitatea sau sensibilitatea unui test statistic de a detecta un
efect real (sau o legtur real) ntre variabile. nelegem prin efect real faptul c modificri ale valorilor
unei variabile se regsesc n modificri ale valorilor celeilalte variabile (indiferent dac relaia este de tip
cauzal sau de tip asociativ). Formulat n termeni statistici, puterea testului este probabilitatea de a respinge
ipoteza de nul atunci cnd ea este cu adevrat fals, i se exprim ca 1-beta (probabilitatea erorii de tip II).
Aceast situaie corespunde celei mai bune decizii pe care i-o poate dori un cercettor: s dovedeasc c
ipoteza a cercetrii este realmente adevrat. Dac n viaa real ipoteza de nul este fals, dar datele cercetrii
ne oblig totui s o acceptm, atunci putem spune c cercetarea noastr a avut o putere insuficient pentru a
determina respingerea ei i, implicit, confirmarea ipotezei cercetrii.
Aa cum am vzut, eroarea de tip II i puterea testului sunt complementare. Ca urmare, putem
calcula eroarea de tip II ca beta=1-puterea testului. Cu alte cuvinte, cu ct puterea testului este mai mare, cu
att probabilitatea erorii de tip II (acceptarea nejustificat a ipotezei de nul) este mai mic. Dac presupunem
c puterea unui experiment psihologic este de 0.85, rezult c probabilitatea erorii de tip II este 1-0.85, adic
0.15. Complementar, dac puterea experimentului (cercetrii) ar fi de 0.15, atunci probabilitatea erorii de tip
II s-ar ridic la 1-0.15, adic 0.85.
29
Marian Popa
3. Reducerea erorilor de msurare are ca efect mrirea puterii cercetrii. n acest scop trebuie avute
n vedere: utilizarea unor proceduri de investigare adecvate; controlul i eliminarea surselor de
eroare; tratarea identic a tuturor subiecilor cercetrii; selectarea aleatoare a eantioanelor sau,
n cazul unei eantionri nealeatoare, eliminarea surselor de selecie prtinitoare (bias).
4. Modelul de cercetare, prin el nsui, este cel care poate crete puterea unui studiu. De exemplu,
modelele de cercetare within-subjects (intra-subiect), care msoar aceiai subieci n condiii
diferite, au mai mult putere dect modelele between-subjects (inter-subiect), n care sunt
comparate grupuri de subieci diferii n condiii diferite.
5. Testul bilateral reduce probabilitatea erorii de tip I, dar crete probabilitatea erorii de tip II i,
implicit, reduce puterea. Ca urmare, ori de cte ori este justificabil, se va opta pentru test
unilateral, chiar dac, n practic, testul bilateral este cel uzual.
6. Testele parametrice prezint o putere statistic mai mare dect cele neparametrice, motiv pentru
care, utilizarea acestora din urm se va face doar atunci cnd este absolut necesar (n
conformitate cu condiiile de aplicare). Nu se va renuna cu uurin la un test parametric, dac
datele cercetrii sunt msurate pe scal cantitativ.
Nu trebuie s nelegem ns, c asigurarea unei puteri ct mai mari este principalul obiectiv pentru
un cercettor. Prea mult putere este tot att de nedorit ca i prea puin. Dac avem n vedere
intercondiionrile din procesul deciziei statistice, atunci trebuie s observm c prin creterea puterii
reducem probabilitatea erorii de tip II, dar cretem probabilitatea erorii de tip I. Cu alte cuvinte, dac un
studiu are o putere mare, de exemplu prin utilizarea unui eantion foarte mare, atunci crete probabilitatea de
a respinge ipoteza de nul, chiar dac aceasta este adevrat. Ne aflm aici n situaia care a generat critici
vehemente cu privire la cercetrile statistice, i care a fost exprimat n maniera cea mai direct de
Thompson (1998a) ... testul statistic devine o cutare tautologic pentru suficieni participani n msur s
ating semnificaia statistic.
Calitatea deciziei unei cercetri reprezint rezultatul unei negocieri ntre nivelul acceptat pentru
erorile de tip I i II. Cu ct prima este mai mic, cu att a doua este mai mare, i invers. S presupunem c
studiul privind inteligena olimpicilor este efectuat n mod identic de doi cercettori, dar unul dintre ei
fixeaz nivelul lui alfa la 0.05, iar al doilea, la 0.01. Dac n urma prelucrrii datelor rezultatului obinut i
corespunde un p=0.03, primul cercettor va respinge ipoteza de nul, confirmnd ipoteza cercetrii, n timp ce
al doilea va fi nevoit s admit ipoteza de nul i s resping ipoteza cercetrii. Prin fixarea unui nivel mai
redus pentru alfa, al doilea cercettor a redus probabilitatea erorii de tip I, dar a redus i puterea testului,
mrind n schimb riscul erorii de tip II (respingerea unei ipoteze de cercetare adevrate).
n concluzie, atunci cnd fixm criteriile de decizie statistic trebuie s fim contieni de urmtoarele
aspecte:
cu ct este mai mic pragul alfa, cu att puterea testului este mai mic i invers, cu ct alfa este
mai mare, cu att puterea testului este mai mare;
cu ct alfa este mai mic, cu att scade probabilitatea erorii de tip I (respingerea ipotezei de nul
cnd aceasta este adevrat);
cu ct alfa este mai mic, cu att testul este mai riguros, probabilitatea de a confirma ipoteza
cercetrii dac este fals, fiind mai mic;
un prag alfa de 0.01 (comparat cu 0.05 sau 0.1) nseamn c cercettorul este precaut, dorind s
i asume un risc de a grei de 1 dintr-o sut de cazuri atunci cnd respinge ipoteza de nul, dac
aceasta este adevrat;
un prag alfa de 0.01 nseamn c exist 99% anse de a decide c nu exist diferene atunci cnd
acestea ntr-adevr nu exist;
mrind nivelul lui alfa (de la 0.01 la 0.05 sau 0.1), cretem riscul de a face o eroare de tip I i
reducem riscul de a face o eroare de tip II, ceea ce nseamn i o reducere a rigorii testului;
n egal msur, dac mrim pragul alfa, de la 0.01, la 0.05 sau 0.1, mrim puterea, deoarece
cretem probabilitatea de respingere a ipotezei de nul (acceptnd ipoteza cercetrii), atunci cnd
aceasta din urm este adevrat (eroare de tip I);
Din cele spuse s-ar putea deduce c, dac ne propunem cea mai mare valoare pentru puterea testului,
atunci singura opiune pe care o avem este s fixm pragul alfa la nivelul maxim permis de convenia
tiinific (0.05). n realitate, problema nu este att de simpl, deoarece obiectivul unei cercetri nu se poate
limita doar la atingerea pragului de semnificaie. Aa cum am vzut, acesta poate fi atins prin mrirea
volumului eantionului, iar simpla constatare a unui rezultat semnificativ nu ne spune nimic despre
30
Marian Popa
intensitatea relaiei dintre variabilele studiate, despre importana practic i despre utilitatea rezultatului
obinut.
Cunoaterea puterii unei cercetri este util n dou situaii:
a. n faza premergtoare a unei cercetri estimarea puterii este util pentru a evalua ansa de a
obine un rezultat semnificativ statistic n contextul unei cercetri. Dac puterea estimat a testului este prea
mic, devine lipsit de interes s angajm eforturi i costuri pentru conducerea acelei cercetri. Ct de mic
poate fi puterea unei cercetri pentru a accepta efectuarea ei? La aceasta ntrebare cei mai muli cercettori
consider c 0.5 este prea puin pentru a investi timp i bani n efectuarea ei. O putere de 0.7, care
corespunde unei probabiliti de 0.3 pentru eroarea de tip II, este considerat ca fiind minim, iar o putere de
0.8 este considerat cel mai bun compromis ntre nivelul puterii i consecinele negative de care am vorbit
anterior (B. Cohen, 2001).
b. Dup efectuarea unei cercetri, pentru a ti care este probabilitatea ca rezultatul acesteia s
indice un efect al variabilei independente asupra variabilei dependente atunci cnd acest efect exist i n
realitate.
n practic calcularea puterii unei cercetri se face cu programe specializate. Unul dintre cele mai
accesibile i mai cunoscut dintre acestea este GPower, care poate fi descrcat gratuit de la adresa
http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/ (Buchner, Erdfelder & Faul, 1997).
Mrimea efectului
S considerm c rezultatul explorrii muntelui presupus aurifer conduce la respingerea ipotezei de
nul, iar geologii concluzioneaz c eantionul conine aur ntr-o proporie semnificativ. nseamn oare
acest lucru c muntele conine mult aur? Desigur, nu. nseamn doar c acea cantitate de aur gsit n
eantion are o probabilitate prea mic s fie acolo din ntmplare, motiv pentru care s-a decis c prezena ei
semnaleaz o concentraie similar la nivelul ntregului munte (populaii). Ct de mare este cantitatea de
aur nu putem ti doar pe baza testului de semnificaie statistic, deoarece acesta nu exprim dect o decizie
probabilistic i nu o evaluare cantitativ.
Situaia este identic n cazul cercetrii cu privire la relaia dintre participarea la olimpiadele colare
i nivelul de inteligen, unde am obinut pentru eantionul de olimpici o medie QI=106. Aplicnd criteriile
deciziei statistice, am concluzionat c diferena de 6 uniti fa de media populaiei (QI=100) este
semnificativ i am respins ipoteza de nul. Dar ce putem spune despre aceast diferen, ct de mare este
ea? n vorbirea curent, prin semnificativ se nelege i important sau mare. n cazul deciziei statistice
ns, semnificativ are un neles limitat la expresia probabilitate prea mic pentru a rezulta din
ntmplare. De aceea, din ce n ce mai muli autori (Daniel, 1998; Denis, 2003; Fan, 2001; Kotrlik &
Williams, 2003; Thompson, 1998b) consider c decizia statistic nu este suficient pentru a proba integral
valoarea unei ipoteze de cercetare. Respingerea ipotezei de nul pe baza criteriului alfa nu ofer suficient
informaie cu privire la relaia dintre variabilele cercetrii. Este evident c rezultatul testului (QI=106)
conine i o component de mrime. Dac media eantionului ar fi fost 108, sau 120, diferena ar fi fost
mai mare dect 106. i totui, respingerea ipotezei de nul i considerarea rezultatului drept semnificativ nu
exprim n nici un fel nivelul de mrime al diferenei. Mai mult, ne amintim c puterea testului crete pe
msur ce crete volumul eantionului. Ca urmare, un rezultat semnificativ poate fi obinut fie i numai
prin creterea numrului de subieci, fr ca relaia dintre cele dou variabile s fie una intens.
Problema semnalat este mai acut dect pare la prima vedere. Criticii deciziei bazate pe testarea
ipotezei de nul merg pn acolo nct cer eliminarea acestui model de decizie cu privire la ipotezele
cercetrilor tiinifice. La rndul ei, American Psychological Association a organizat un grup de lucru avnd
ca obiect elaborarea unor recomandri cu privire la raportarea rezultatelor statistice (Wilkinson&APA Task
Force on Statistical Inference, 1999). Concluziile acestui grup de lucru stipuleaz c raportarea i
interpretarea mrimii efectului (...) este esenial pentru o cercetare bun. n opinia autorilor, raportarea i
interpretarea mrimii efectului prezint trei avantaje importante:
faciliteaz studiile de metaanaliz (studii care sintetizeaz rezultatele mai multor cercetri pe
aceeai tem);
faciliteaz formularea unor ipoteze cu un grad mai mare de specificitate de ctre cercettorii care
vor studia aceeai tem;
faciliteaz integrarea rezultatului unei cercetri n literatura dedicat acelui subiect,
31
Marian Popa
Una dintre soluiile acestei probleme este calcularea unui indice de mrime a efectului care ofer o
informaie suplimentar, extrem de util n interpretarea rezultatului testelor statistice. Aceast informaie ne
apropie mai mult de semnificaia practic a rezultatului cercetrii, ceea ce nseamn mai mult dect
semnificaia statistic.
d=
(formula 3.5)
unde:
m=media eantionului
=media populaiei
=abaterea standard a populaiei (atunci cnd nu o cunoatem, putem utiliza abatarea
standard a eantionului)
Ca urmare, mrimea efectului pentru rezultatul cercetrii cu privire la relaia dintre participarea la
olimpiadele colare i nivelul inteligenei este:
d=
106 100
= 0.4
15
Dat fiind faptul c d este calculat prin raportarea diferenei la abaterea standard, el este considerat un
indice standardizat al mrimii efectului. Acesta se exprim printr-un numr zecimal cuprins ntre 0 (efect
nul) i 1 (efect maxim). Valori mai mari de 1 pot fi obinute uneori, dar numai n cazuri extreme. Valorile
mici exprim un nivel redus al intensitii relaiei dintre variabile (chiar dac este semnificativ), n timp ce
valorile mari indic o relaie intens (puternic).
Dar cum putem s interpretm valoarea lui d? O valoare ca cea obinut n cercetarea noastr este
mare, sau mic? n cazul explorrii zcmntului aurifer, geologii pot estima suficient de exact
cantitatea de aur pe care o pot extrage din zcmnt, pornind de la concentraia de aur din eantionul
explorat. n general, evalurile mrimii efectului n mediul ingineresc sunt de ateptat s fie mult mai mari
dect cele din cercetrile socio-umane. Spre deosebire de tiinele naturii, n psihologie rspunsul la aceast
ntrebare nu este uor de gsit. Ca urmare cercettorii sunt ndreptii s dezvolte propriile repere de
apreciere a mrimii efectului ca fiind mici, medii sau mari. n psihologie, interpretarea valorii lui d se
face dup un model propus de Cohen (op.cit.), care a devenit un standard preluat de toi cercettorii, i care
fixeaz doar trei praguri de mrime:
D
(Cohen)
0.20
0.50
0.80
efect mic
efect mediu
efect mare
n conformitate cu recomandrile lui Cohen, d=0.8 este considerat un efect mare. Nu att de mare
nct s rezulte ca evident prin observaie direct, dar suficient de mare pentru a exista o bun ans de a fi
gsit ca statistic semnificativ prin utilizarea unui eantion format dintr-un numr relativ mic de subieci. Prin
contrast, d=0.2 este considerat un efect mic. Pentru valori mai reduse dect att, iniierea unei cercetri nu se
justific.
Revenind la studiul din exemplul nostru, rezultatul obinut corespunde unui nivel moderat al mrimii
efectului (d=0.4). Sau, altfel spus, diferena dintre media inteligenei elevilor olimpici i populaia de elevi
32
Marian Popa
are un indice moderat de mrime. Acest lucru ar putea fi interpretat n sensul c prezena la olimpiad este
asociat n mod semnificativ cu inteligena, dar are i alte componente importante care o determin.
Calcularea mrimii efectului nu este oferit n toate situaiile de programele de prelucrare statistic.
Din fericire, formulele de calcul nu sunt laborioase, putnd fi aplicate cu uurin pe rezultatele oferite de
aceste programe. O prezentare sintetic i practic a formulelor de calcul ale mrimii efectului pentru diverse
teste statistice de semnificaie ne ofer Thalheimer&Cook (2002).
n acelai timp, pe msur ce crete mrimea efectului, crete i puterea testului (concomitent cu
reducerea riscului erorii de tip II):
33
Marian Popa
Rezultat
semnificativ
statistic?
(se respinge H0?)
DA
MIC
Concluzii
DA
MARE
NU
MIC
NU
MARE
Rezultat important.
Chiar dac puterea testului este mic, din cauza volumului
redus al eantionului, existena unui rezultat semnificativ
arat o mrime a efectului important.
Rezultatul poate fi important sau nu:
semnificaia poate rezulta din puterea ridicat a
testului, ca urmare a volumului mare al eantionului
SAU
poate fi expresia unei diferene importante dintre
populaiile comparate
Rezultatul este neconcludent. Absena semnificaiei
statistice se poate datora:
faptului c ipoteza cercetrii este fals
SAU
puterii reduse a testului, ca urmare a eantionului prea
mic
Ipoteza cercetrii este probabil fals din cauz c, n ciuda
puterii ridicate (eantion mare), rezultatul nu a atins nivelul
semnificaiei statistice.
Mrimea efectului este foarte mic
Scorul standard z exprim distana dintre o valoare a distribuiei i media acesteia, exprimat n
abateri standard
Media scorurilor z ale unei distribuii este ntotdeauna egal cu 0.
Abaterea standard a scorurilor z ale unei distribuii este ntotdeauna egal cu 1.
Alte tipuri de scoruri standard (QI, T, Hull, SAT, etc.) se calculeaz pe baza formulei scorului z,
urmrind obinerea unei valori convenabile sub aspectul formei de expresie.
Curba normal (Gauss) este o distribuie teoretic, caracteristic populaiilor de valori, care are o
form de clopot, este perfect simetric i asimptotic la axa Ox (poate lua, toretic, valori orict de
mari sau orict de mici).
Curba normal z, reprezint o distribuie normal (Gauss) transformat n scoruri z. Aceasta poate
exprima orice distribuie, indiferent de forma de exprimare a valorilor originale.
Distribuiile reale, transformate n distribuii z, nu i modific forma original.
Distribuia de eantionare este format din totalitatea mediilor eantioanelor de acelai volum
posibile, extrase aleatori dintr-o populaie.
Media de eantionare este egal cu media populaiei, dac au fost extrase toate eantioanele posibile.
Eroarea standard a mediei este indicatorul de mprtiere ale mediei de eantionare.
Eroarea standard a mediei este ntotdeauna mai mic dect abaterea standard a populaiei.
Teorema limitei centrale stipuleaz c distribuia de eantionare tinde spre forma normal, atunci
cnd eantioanele extrase sunt suficient de mari (N este cel puin 30).
Facem precizarea c n acest context eantion mic sau mare nu se refer la N=30 de subieci la care am fcut
referire n cazul teoremei limitei centrale. Se poate considera ns un eantion mic ca fiind de ordinul zecilor, iar unul
mare de ordinul sutelor.
34
Marian Popa
Scorul z pentru eantion (grup), se calculeaz n acelai mod ca i pentru valori individuale, cu
deosebirea c n locul abaterii standard, se utilizeaz la numitor eroarea standard a mediei.
Limitele de ncredere ale mediei unui eantion estimeaz, cu o anumit probabilitate, localizarea
mediei la nivelul populaiei, n funcie de media eantionului.
Ipoteza cercetrii descrie rezultatul ateptat de cercettor la problema studiat.
Ipoteza de nul reprezint negaia ipotezei cercetrii i face obiectul testrii printr-o anumit
procedur statistic.
Decizia statistic este un raionament n baza cruia se admite sau se respinge ipoteza de nul.
Pragul alfa este probabilitatea maxim ca rezultatul procedurii de tastare statistic s poat fi
ntmpltor, pe care o fixeaz cercettorul drept criteriu de respingere sau de acceptare a ipotezei de
nul.
Pragul alfa=0.05 este nivelul maxim de probabilitate convenional acceptat de comunitatea
tiinific pentru respingerea ipotezei de nul.
Decizia unilateral testeaz ipoteza statistic numai spre o latur a distribuiei. Decizia bilateral
testeaz ipoteza n ambele direcii, cu meninerea pragului alfa stabilit.
Eroarea de tip I este probabilitatea de a respinge o ipotez de nul adevrat (se accept o ipotez a
cercetrii care este fals) rezultat fals pozitiv.
Eroarea de tip II este probabilitatea de a se admite o ipotez de nul fals (se respinge o ipotez a
cercetrii adevrat) rezultat fals negativ.
O eroare de tip III apare atunci cnd rezultatul cercetrii, dei semnificativ, este greit atribuit
efectului variabilei independente, sau este n opoziie cu sensul real.
Erorile de tip I i II sunt n egal msur negative dar, de regul, acordm mai mult atenie erorii de
tip I, ncercnd s inem alfa la o valoare ct mai mic.
Puterea testului este o mrime probabilist care indic ansa de a obine un rezultat semnificativ
statistic.
Puterea variaz n funcie de nivelul pragului alfa (eroarea de tip I). Cu ct alfa este mai mic, cu att
puterea testului scade.
Dac reducem alfa de la 0.05 la 0.01, reducem probabilitatea de a face o eroare de tip I dar, n acelai
timp, facem mai dificil respingerea ipotezei de nul i, n egal msur, cretem probabilitatea de a
face o eroare de tip II.
Puterea testului este complementar erorii de tip II (suma lor este 1).
Mrimea efectului este o valoare care indic intensitatea relaiei dintre variabila independent i
variabila dependent.
Mrimea efectului este n legtur cu puterea testului i cu volumul eantionului. Cu ct puterea este
mai mare i eantionul este mai mic, cu att mrimea efectului este mai ridicat.
Calcularea mrimii efectului, alturi de semnificaia statistic, este o exigen actual n cercetarea
tiinific psihologic.
Aten ie, calculai utiliznd numai primele dou zecimale, fr rotunjiri. Eventuale mici
varia ii ale rezultatelor sunt posibile i nu vor fi considerate erori.
Marian Popa
2.
3.
4.
5.
6.
7.
8.
9.
36
Marian Popa
Testul z (t) pentru un singur eantion este util ntr-un model de cercetare n care ne propunem
compararea valorii msurate pe un eantion cu media populaiei din care acesta provine. Aa cum am
precizat deja, acest tip de cercetare este destul de rar ntlnit, ca urmare a dificultii de a avea acces la media
populaiei.
Un model de cercetare mult mai frecvent ns, este acela care vizeaz punerea n eviden a
diferenelor care exist ntre dou categorii de subieci (diferena asumrii riscului ntre brbai i femei,
diferena dintre timpul de reacie al celor care au consumat o anumit cantitate de alcool fa de al celor
care nu au consumat alcool etc.). n situaii de acest gen psihologul compar mediile unei variabile
(preferina pentru risc, timpul de reacie etc.), msurat pe dou eantioane compuse din subieci care difer
sub aspectul unei alte variabile (sexul, consumul de alcool, etc.). Variabila supus comparaiei este variabila
dependent, deoarece presupunem c suport efectul variabilei sub care se disting cele dou eantioane i
care, din acest motiv, este variabil independent 8. n studii de acest gen, eantioanele supuse cercetrii se
numesc independente, deoarece sunt constituite, fiecare, din subieci diferii.
Am pus cuvntul efect ntre ghilimele deoarece, chiar dac este logic s considerm c este vorba de o relaie de tip
cauz-efect, simpla msurare a diferenelor pe dou eantioane de subieci nu este suficient pentru a concluziona o
relaie cauzal. Pentru aceasta, ar fi mai potrivit, spre exemplu, s msurm timpul de reacie la aceiai subieci nainte
i dup consumarea unei cantiti de alcool.
9
O metod de relaxare psihic
37
Marian Popa
acceptm faptul c perechea de eantioane studiate nu este dect una din perechile posibile. S privim figura
de mai jos, care ne sugereaz ce se ntmpl dac, teoretic, am extrage (selecta) n mod repetat de eantioane
perechi din cele dou populaii:
Imaginea arat faptul c, pe msur ce constituim perechi de eantioane (m11-m21, etc.) cu valori ale
performanei la int, diferena dintre medii devine o distribuie n sine, format din valorile acestor diferene.
Dac am reui constituirea tuturor perechilor posibile de eantioane, aceast distribuie, la rndul ei, ar
reprezenta o nou populaie, populaia diferenei dintre mediile practicanilor i nepracticanilor de training
autogen. i, fapt important de reinut, curba diferenelor dintre medii urmeaz legea distribuiei t. Cu alte
cuvinte, la un numr mare (tinznd spre infinit) de eantioane perechi, trebuie s ne ateptm ca cele mai
multe medii perechi sa fie apropiate ca valoare, diferena dintre mediile fiind, ca urmare, mic, tinznd spre 0
i ocupnd partea central a curbei. Diferenele din ce n ce mai mari fiind din ce n ce mai puin probabile,
vor ocupa marginile distribuiei (vezi figura de mai jos). Aceasta este ceea ce se numete distribuia
ipotezei de nul pentru diferena dintre mediile a dou eantioane independente.
(m1-1 m2-1)
1-2 = 0
(m1-2 m2-2)
(m1-3 m2-3)
n acest moment este bine s accentum din nou semnificaia statistic a noiunii de populaie. Dup
cum se observ, aceasta nu face referire neaprat la indivizi, ci la totalitatea valorilor posibile care descriu o
anumit caracteristic (psihologic, biologic sau de alt natur). n cazul nostru, diferenele dintre mediile
eantioanelor perechi (fiecare provenind dintr-o populaie fizic distinct) devin o nou populaie, de
aceast dat statistic, compus din totalitatea diferenelor posibile, a crei distribuie se supune i ea
modelului curbei t.
Procedura statistic pentru testarea semnificaiei diferenei dintre mediile a dou eantioane
Problema pe care trebuie s o rezolvm este urmtoarea: este diferena dintre cele dou eantioane
suficient de mare pentru a o putea considera c este n legtur cu variabila independent, sau este doar una
dintre diferenele probabile, generat de jocul hazardului la constituirea perechii de eantioane? Vom observa
c sarcina noastr se reduce, de fapt, la ceea ce am realizat anterior n cazul testului z sau t pentru un singur
eantion. Va trebui s vedem dac diferena dintre dou eantioane reale se distaneaz semnificativ de
diferena la care ne putem atepta n cazul extragerii absolut aleatoare a unor perechi de eantioane, pentru
care distribuia diferenelor este normal. Mai departe, dac probabilitatea de a obine din ntmplare un
38
Marian Popa
astfel de rezultat (diferen) este prea mic (maxim 5%) o putem neglija i accepta ipoteza c ntre cele dou
variabile este o relaie semnificativ.
Dac avem valoarea diferenei dintre cele dou eantioane cercetate, ne mai sunt necesare doar
media populaiei (de diferene ale mediilor) i abaterea standard a acesteia, pentru a calcula testul z (n cazul
eantioanelor mari) sau cel t (n cazul eantioanelor mici). n final, nu ne rmne dect s citim valoarea
tabelar pentru a vedea care este probabilitatea de a se obine un rezultat mai bun (o diferen mai mare ) pe
o baz strict ntmpltoare.
Media populaiei de diferene. Diferena dintre mediile celor dou eantioane ale cercetrii face
parte, aa cum am spus, dintr-o populaie compus din toate diferenele posibile de eantioane perechi.
Media acestei populaii este 0 (zero). Atunci cnd extragem un eantion aleator dintr-o populaie, valoarea sa
tinde s se plaseze n zona centrala cea mai probabil). Dar aceeai tendin o va avea i media oricrui
eantion extras din populaia pereche. Ca urmare, la calcularea diferenei dintre mediile a dou eantioane,
cele mai probabile sunt diferenele mici, tinznd spre zero. Astfel, ele vor ocupa partea central a distribuiei,
conturnd o medie tot mai aproape de zero cu ct numrul eantioanelor extrase va fi mai mare.
Eroarea standard a diferenei (mprtierea), pe care o vom nota cu
de la formula de calcul a erorii standard:
(formula 3.6)
Din raiuni practice, pentru a obine o formul care s sugereze diferena dintre medii (m1-m2),
formula de mai sus este supus unor transformri succesive. Prin ridicarea la ptrat a ambilor termeni, i
dup extragerea radicalului din noua expresie, se obine:
(formula 3.7)
Dac am utiliza-o pentru calcule, aceast ultim formul ar produce acelai rezultat ca i formula de
origine.
Formula erorii standard a distribuiei diferenei dintre medii ne arat ct de mare este mprtierea
diferenei tipice ntre dou medii independente atunci cnd eantioanele sunt extrase la ntmplare
m1 m 2 =
12
N1
22
(formula 3.8)
N2
Formula 3.8 ne indic faptul c eroarea standard a diferenei dintre medii este dat de suma erorii
standard a celor dou eantioane. Unul dintre eantioane are N1 subieci i o dispersie 12 iar cellalt
eantion, N2 subieci i dispersia 22. Faptul c obinem eroarea standard a diferenei dintre medii ca sum a
erorilor standard a celor dou eantioane este fundamentat pe o lege statistica a crei demonstraie nu se
justific aici.
Pentru a calcula scorul z al diferenei, vom utiliza o formul asemntoare cu formula notei z pe care
o cunoatem deja:
z=
Aceasta va fi:
z=
( m1 m2 ) ( 1 2 )
m1 m 2
(formula 3.9)
Numrtorul exprim diferena dintre diferena obinut de noi (m1-m2) i diferena dintre mediile
populaiilor (1-2). Dac ne amintim c distribuia ipotezei de nul (1-2) are media 0, atunci deducem c
expresia (1-2) poate lipsi. De altfel, dac am cunoate mediile celor dou populaii nici nu ar mai fi
necesar calcularea semnificaiei diferenei dintre eantioanele care le reprezint.
39
Marian Popa
Numitorul descrie eroarea standard a diferenei, calculat cu formula 3.7, adic mprtierea
diferenei tipice pentru extrageri aleatoare.
n conformitate cu cele spuse pn acum, formula final pentru scorul z al diferenei dintre dou
eantioane devine :
z=
m1 m 2
12
N1
22
(formula 3.10)
N2
t=
m1 m2
2
(formula 3.11)
s1
s
+ 2
N1 N 2
Se observ nlocuirea lui (pentru populaie) cu s (pentru eantion). Utilizarea acestei formule este
destul de controversat deoarece rezultatul nu urmeaz cu exactitate distribuia t, aa cum am introdus-o
anterior. Pentru eliminarea acestui neajuns, se utilizeaz o alt variant de calcul, care ia n considerare
dispersia cumulat a celor dou eantioane.
( N 1) * s1 + ( N 2 1) * s 2
= 1
N1 + N 2 2
(formula 3.12)
40
Marian Popa
t=
m1 m2
( N1 1) * s1 + ( N 2 1) * s2 1
1
+
*
N1 + N 2 2
N
N
2
1
2
Expresia 3.13 este formula uzual pentru calcularea diferenei dintre medii pentru dou eantioane
independente. Chiar dac a fost introdus ca utilizabil pentru eantioane mici, caracteristicile distribuiei t
ne permit utilizarea ei i pentru eantioane mari, deoarece distribuia t tinde spre cea normal la valori din ce
n ce mai mari ale gradelor de libertate.
EXEMPLU DE CALCUL:
S presupunem c vrem s vedem dac practicarea trainingului autogen (variabila independent)
determin o cretere a performanei n tragerea la int, manifestat printr-un numr mai mare de lovituri n
centru intei (variabil dependent). Pentru aceasta selectm un eantion de 6 sportivi care practic trainingul
autogen i un eantion de 6 sportivi care nu l practic. Pentru fiecare eantion msurm performana de
tragere.
Formularea ipotezei cercetrii, a ipotezei de nul, i a criteriilor deciziei statistice
Pentru exemplul de mai sus:
Problema cercetrii: Are practicarea trainingului autogen un efect asupra performanei la tirul cu
arcul?
Ipoteza cercetrii (H1): Practicarea trainingului autogen determin un numr mai mare de puncte
la edinele de tragere.
Ipoteza de nul (statistic) (H0): Numrul punctelor la edinele de tragere nu este mai mare la cei
care practic trainingul autogen. Aceast variant este potrivit cu o testare unilateral a ipotezei (nu avem
n vedere dect eventualitatea ca trainingul autogen s creasc performana sportiv).
Dac, ns, am dori s testm n ambele direcii, bilateral, atunci am avea urmtoarele versiuni ale
ipotezelor:
Ipoteza cercetrii: Performana sportiv este diferit la subiecii care practic trainig autogen fa
de cei care nu practic
Ipoteza de nul (statistic): Performana nu difer semnificativ n funcie de practicarea
trainingului autogen.
Fixarea lui t critic. Optm pentru efectuarea unui test bilateral, pentru c nu putem ti dinainte dac
TA nu are un efect negativ asupra performanei sportive a trgtorilor la int. Alegem nivelul =0,05.
Stabilim gradele de libertate:
df=N1+N2-2=10
Utiliznd tabelul distribuiei t pentru 10 grade de libertate (adic 12-2) i =0,05, bilateral, gsim t
critic=2.228, la intersecia coloanei 0.025 i cu linia pentru 10 grade de libertate.
Valoarea t calculat va trebui s fie cel puin egal sau mai mare dect t critic, pentru a putea
respinge ipoteza de nul i a accepta ipoteza cercetrii (vezi imaginea de mai jos).
41
Marian Popa
N
m
(X
=
m) 2
N 1
s= s
(X1-m1)2
2.78
18.74
1.76
0.10
7.12
2.78
33.28
ne-practicani TA (2)
X2
(X2-m2)2
10
2.78
8
0.10
11
7.12
5
11.08
7
1.76
9
0.44
50
23.28
6
8.33
33.28
= 6.67
5
23.28
= 4.66
5
2.58
2.16
( N1 1)( s 21 ) + ( N 2 1)( s 2 2 ) 1
1
=
+
N1 + N 2 2
N1 N 2
(6 1) (2.58) 2 + (6 1) (2.16) 2 1 1
+ = 1.34
10
6 6
Iar apoi:
t=
m1 m2 13.33 8.33
=
= 3.73
1.34
sDif
Mrimea efectului
Atunci cnd calculm testul t, nu valoarea obinut este relevant ci probabilitatea care este asociat
acestei valori (p). De exemplu, dac avem n vedere formula de calcul pentru t, atunci nelegem c o valoare
t=3.73 nu nseamn altceva dect faptul c diferena dintre mediile comparate este 3.73 ori mai mare dect
eroarea standard estimat a acelei diferene. Chiar dac probabilitatea asociat acestei valori t este foarte
mic, sub pragul alfa, magnitudinea diferenei dintre medii poate fi mic. Ca urmare, aprecierea
importanei diferenei dintre mediile grupurilor cercetate are nevoie de informaii suplimentare. Acestea
sunt oferite de indicele de mrime a efectului.
Pentru a afla mrimea efectului pentru testul t pentru eantioane independente, se utilizeaz
indicele d al lui Cohen. Din pcate, pachetele de programe statistice uzuale (inclusiv SPSS) nu ofer acest
valoarea lui d. El poate fi ns obinut relativ uor cu formula:
d=
m1 m2
( N1 1) s 21 + ( N 2 1) s 2 2
( N1 1) + ( N 2 1)
(formula 3.14)
unde numitorul exprim abatarea standard cumulat a celor dou grupuri comparate.
Pentru exemplul nostru, calculm mrimea efectului nlocuind datele n formula 3.14, dup cum
urmeaz:
42
Marian Popa
d=
Interpretarea mrimii lui d se face utiliznd aceleai praguri propuse de Cohen: 0.20 efect mic;
0.50 efect mediu; 0.80 efect mare. Valoarea obinut de noi indic un nivel ridicat al mrimii efectului,
semn al faptulului c practicarea edinelor de relaxare are un efect important asupra performanei
sportivilor din eantionul cercetrii.
2.01
Linf
7.98
mdif=5
Lsup
Relevana intervalului de ncredere poate fi discutat din mai multe puncte de vedere:
(a) Faptul c media populaiei de nul (dif=0) se afl n afara limitelor de ncrerede subliniaz odat
n plus caracterul semnificativ al diferenei dintre mediile grupurilor comparate. Cu ct una dintre limite ar fi
mai aproape de valoarea 0, cu att faptul de a fi obinut un rezultat semnificativ ar fi mai puin relevant. Dac
media distribuiei de nul ar fi cuprins ntre limitele de ncredere ipoteza de nul ar trebui acceptat, indiferent
de rezultatul testului statistic.
(b) Mrimea intervalului de ncredere arat precizia estimrii rezultatului cercetrii. Aceasta este
legat n mod direct de eroarea standard a diferenei (eroarea de estimare) care, la rndul ei, depinde de
numrul subiecilor din cele dou eantioane, dar i de omogenitatea valorilor msurate.
(c) n msura n care variabila testat are o utilitate practic, limitele de ncredere scot n eviden
dac rezultatul are o semnificaie n raport cu criterii de ordin practic. De exemplu, n cazul nostru,
antrenorul sportivilor respectivi poate aprecia n ce msur un progres al performanei care poate fi ntre 2 i
7 puncte ar aduce o clasare mai bun la concursurile de profil sau, dimpotriv, este nerentabil.
(d) Limitele de ncredere nu prezint o utilitate practic atunci cnd valorile variabilei nu au o
semnificaie prin ele nsele. S ne imaginm, spre exemplu, un experiment n care un grup privete un film
trist, iar un alt grup privete un film vesel, dup care starea de spirit a celor dou grupuri este evaluat prin
numrarea cuvintelor triste sau vesele pe care subiecii i le pot aminti dintr-o list citit imediat dup
vizionare. n aceast situaie este greu de atribuit o utilitate practic limitelor de ncredere ale numrului de
cuvinte evocate. Nu acelai lucru se ntmpl dac, de exemplu, n cazul unui experiment n care utilizarea
unui anumit tip de exerciii la locul de munc se traduce n creterea productivitii muncii, msurat prin
numrul de produse finite. Este evident c numrul de produse finite este un indicator cu relevan practic,
43
Marian Popa
uor de interpretat. Cu toate acestea, chiar i atunci cnd nu prezint o relevan practic direct, calcularea
limitelor de ncredere ofer o imagine a gradului de precizie a estimrii testului statistic, fapt care face
necesar cunoaterea lor i raportarea lor.
Publicarea rezultatului
La publicarea testului t pentru diferena dintre mediile a dou eantioane independente vor fi
menionate: mediile i abaterile standard ale fiecrui eantion, volumul eantioanelor sau gradele de libertate,
valoarea testului, nivelul lui p, mrimea efectului i limitele de intervalului de ncredere pentru diferena
dintre medii.
n form narativ, rezultatul pentru exemplul de mai sus poate fi formulat astfel: Sportivii care
practic trainingul autogen au fost comparai cu cei care nu practic. Primii au realizat o performan mai
bun (m=13.33, =2.58) fa de ceilali (m=8.33, =2.16), t(10)=3.65, p<0.05. Mrimea efectului este
mare (d=2.1), iar limitele de ncredere (95%) pentru diferena mediilor sunt cuprinse ntre 2.01 i 7.98.
44
Marian Popa
psihologice, utilizarea testului t pentru eantioane independente este i ea des ntlnit n literatura de
specialitate.
ntr-un studiu asupra efectelor unui nou tratament al fobiei, datele pentru grupul experimental
obinute printr-o scal de evaluare a tendinelor fobice sunt: m1=27.2, s1=4 i N1=15
Datele pentru grupul de control sunt:
m2=34.4, s2=14 i N2=15
Utiliznd aceste date:
1. Formulai problema (ntrebarea) cercetrii
2. Formulai ipoteza cercetrii (H1)
3. Formulai ipoteza de nul (H0)
4. Aflai t critic pentru =0,05; bilateral
5. Calculai testul t pentru diferena dintre cele dou eantioane
6. Formulai i motivai decizia statistic
7. Formulai concluzia cercetrii
45
Marian Popa
ANOVA nu este altceva dect o extensie a logicii testului t pentru situaiile n care se dorete compararea a
mai mult de dou medii independente. Dar, dac problema este similar, soluia este, aa cum vom vedea,
diferit.
Exist mai multe tipuri de ANOVA, dou fiind mai frecvent folosite:
-
ANOVA unifactorial, care se aplic atunci cnd avem o variabil dependent msurat pe o scal
de interval/raport msurat pentru trei sau mai multe valori ale unei variabile independente
categoriale. n contextul ANOVA, variabila independent este denumit factor, iar valorile pe care
acesta le ia se numesc niveluri. Din acest motiv, modelul de analiz de varian cu o singura
variabil independent se numete ANOVA unifactorial, ANOVA simpl sau, cel mai frecvent,
ANOVA cu o singur cale (One-way ANOVA).
o Exemple:
Nivelul anxietii n raport cu trei categorii de fumtori (1-10 igri zilnic, 11-20
igri i 21-30 igri).
Timpul de rspuns la un strigt de ajutor, n funcie de natura vocii persoanelor care
solicit ajutorul (copil, femeie, brbat).
Scorul la un test de cunotine statistice ale studenilor de la psihologie, n funcie de
tipul de liceu absolvit (real, umanist, agricol, artistic).
ANOVA multifactorial, care se aplic atunci cnd avem o singur variabil dependent (la fel ca
n cazul ANOVA unifactorial) dar dou sau mai multe variabile independente, fiecare cu dou sau
mai multe valori, msurate pe o scal categorial (nominal sau ordinal).
o Exemple
Nivelul anxietii n raport cu intensitatea fumatului (1-10 igri zilnic, 11-20
igri i 21-30 igri), i cu genul (masculin, feminin). n acest caz, problema
cercetrii este dac intensitatea fumatului i caracteristica de gen au, mpreun, o
relaie cu nivelul anxietii.
Timpul de rspuns la un strigt de ajutor n funcie de natura vocii care solicit
ajutorul (copil, femeie, brbat) i de genul (masculin, feminin) al persoanei care
trebuie s rspund la solicitarea de ajutor.
Scorul la un test de cunotine statistice ale studenilor de la psihologie, n funcie de
tipul de liceu absolvit (real, umanist, agricol, artistic) i de genul (masculin, feminin)
al studenilor.
Ne vom limita aici doar la prezentarea analizei de varian unifactoriale, urmnd s revenim cu alt
prilej asupra altor variante de ANOVA.
10
Pentru simplificare, n continuare ne vom referi numai la trei eantioane, dar se va nelege trei sau mai multe
46
Marian Popa
Chiar dac absena unei legturi ntre metoda de antrenament i intensitatea nivelul performanei
(ipotez de nul) este adevrat, cele trei grupuri (eantioane) nu trebuie s aib n mod necesar aceeai
medie. Ele pot avea medii diferite care s rezulte ca expresie a variaiei aleatoare de eantionare
(m1m2m3) i, de asemenea, mprtieri (dispersii) diferite (s1s2s3). S ne gndim la cele trei medii pe
care vrem s le comparm, ca la o distribuie de sine stttoare de trei valori (sau mai multe, pentru cazul n
care variabila independent are mai multe categorii). Cu ct ele sunt mai diferite una de alta, cu att
distribuia lor are o mprtiere (varian) mai mare. Este evident faptul c dac eantioanele ar aparine
populaiei de nul, diferena mediilor (exprimat prin dispersia lor) ar fi mai mic dect n cazul n care
acestea ar proveni din populaii distincte (corespunztor ipotezei cercetrii).
Mai departe, se pune urmtoarea problem: ct de diferite (mprtiate) trebuie s fie mediile celor
trei eantioane, luate ca distribuie de sine stttoare de trei valori, pentru ca s putem concluziona c ele nu
provin din populaia de nul (dreptunghiul punctat), ci din trei populaii diferite, corespunztoare
eantioanelor de cercetare (Pc1, Pc2, Pc3)?
Pentru a rspunde la aceast ntrebare este necesar:
a) S calculm dispersia valorilor individuale la nivelul populaiei de nul, care se bazeaz pe valorile
performanei tuturor valorilor msurate, indiferent de metoda de antrenament;
b) S calculm dispersia mediilor anxietii grupurilor cercetrii (considerate ca eantioane separate);
c) S facem raportul dintre aceste dou valori. Obinerea unei valori mai ridicate a acestui raport ar
exprima apartenena fiecreia din cele trei medii la o populaie distinct, n timp ce obinerea unei
valori mai sczute ar sugera proveniena mediilor dintr-o populaie unic (de nul). Decizia statistic
cu privire la mrimea raportului i, implicit, cu privire la semnificaia diferenelor dintre mediile
comparate, se face prin raportarea valorii raportului la o distribuie teoretic adecvat, alta dect
distribuia normal, aa cum vom vedea mai departe.
n continuare ne vom concentra asupra fundamentrii modului de calcul pentru cei doi termeni ai
raportului. Calcularea exact a dispersiei populaiei de nul este imposibil, deoarece nu avem acces la toate
valorile acesteia, dar poate fi estimat prin calcularea mediei dispersiei grupurilor de cercetare. Valoarea
astfel obinut se numete dispersia intragrup i reprezint estimarea mprtierii valorilor msurate la
nivelul populaiei de nul.
La rndul ei, dispersia mediilor grupurilor de cercetare, calculat dup metoda cunoscut de calcul a
dispersiei, formeaz ceea ce se numete dispersia intergrup. Valoarea astfel obinut evideniaz ct de
diferite (mprtiate) sunt mediile eantioanelor care fac obiectul comparaiei.
Raportul dintre dispersia intergrup i dispersia intragrup se numete raport F i ne d valoarea
testului ANOVA unifactorial. Cu ct acest raport este mai mare, cu att mprtierea mediilor grupurilor
comparate este mai mare i, implicit, diferena lor poate fi una semnificativ, ndeprtat de o variaie pur
ntmpltoare.
Imaginile de mai jos dau o expresie grafic acestui raionament:
Figura a reprezint grafic ipoteza de nul:
presupunem c cele trei grupuri provin din aceeai
populaie. Ca urmare, cele trei medii sunt egale
(1=2=3), iar distribuiile sunt suprapuse.
47
Marian Popa
Dac distana (mprtierea) dintre mediile eantioanelor depete o anumit valoare, atunci putem
concluziona c nu avem o singur populaie (ipoteza de nul), ci mai multe, mediile grupurilor provenind din
populaii cu medii distincte (cf. ipotezei cercetrii). Dac, dimpotriv, mediile eantioanelor comparate sunt
apropiate, atunci vom concluziona c ele nu provin din populaii diferite, ci dintr-una singur (cf. ipotezei de
nul).
s 2 intragrup =
s1 + s2 + s3
N grupuri
(formula 3.16)
s 2 intragrup =
df1
df intragrup
* s 21 +
df 2
df intragrup
* s22 +
df 3
df intragrup
* s 23
(formula 3.17)
2M =
2
N de unde se deduce 2 = N * 2 M
(formula 3.18)
Vom putea utiliza dispersia mediilor celor trei eantioane pentru a estima dispersia populaiei totale
(vezi exemplul de mai jos). Aceasta se numete estimarea varianei intergrupuri, notat cu s2intergrup.
Dac nlocuim n expresia de mai sus expresia de calcul a dispersiei (formula 3.17), obinem:
11
Metoda de calcul pe care o vom prezenta aici (bazat pe dispersie) nu este singura posibil. n multe manuale de
statistic este utilizat metoda sumei ptratelor, care se bazeaz pe scorurile brute, fr utilizarea parametrilor
distribuiei. Am preferat aceast metod deoarece ni se pare mai intuitiv, pe de o parte, iar pe de alt parte, deoarece
poate fi aplicat i n cazul n care nu avem distribuia scorurilor brute, ci doar parametrii grupurilor comparate. Fiecare
metod are avantaje i dezavantaje, dar n esen, ele conduc la acelai rezultat.
48
Marian Popa
n * (m M )
i
(formula 3.19)
df intergrup
unde mi este media performanei din fiecare grup, M este media celor trei grupuri luate mpreun, iar
ni este numrul subiecilor din fiecare grup, iar dfintergrup se calculeaz ca numrul grupurilor-1.
Ca urmare, pentru o situaie cu trei grupuri, formula desfurat se scrie astfel:
s 2 intergrup =
(formula 3.19)
unde: m1, m2, m3 sunt mediile celor trei grupuri, n1, n2, n3, sunt volumele celor trei eantioane, iar
celelalte valori sunt cele descrise pentru formula anterioar.
Pentru situaia n care grupurile au un numr egal de subieci, formula 3.19 devine:
intergrup
(m M ) 2 + (m2 M ) 2 + (m3 M ) 2
= n* 1
df intergrup
(formula 3.19)
s 2 intergrup
F= 2
s intragrup
(formula 3.20)
Interpretarea raportului F
Numitorul raportului F (dispersia intragrup) exprim variabilitatea din interiorul grupurilor supuse
comparaiei. Dac analizm sursele acestei variaii, ea poate proveni din mai multe surse: diferenele
individuale dintre subieci, erorile de msurare ale variabilei dependente, fluctuaia condiiilor n care au fost
efectuate msurrile. Neputnd defini cu exactitate nici sursa i nici contribuia fiecreia, dispersia intragrup
exprim aa numita varian neexplicat, definit generic i ca variana erorii.
n conformitate cu ipoteza cercetrii, grupurile de subieci ar trebui s aib scoruri diferite, fie pentru
au fost supuse unui tratament diferit (n exemplul nostru prin cele trei metode de antrenament), fie ca
urmare a faptului c fac parte din populaii diferite. n acelai timp, subiecii din fiecare grup n parte ar
trebui s aib scoruri similare. Faptul c ele difer totui, nu poate fi explicat prin efectul tratamentului,
motiv pentru care variaia lor este definit drept o varian a erorii.
La rndul lui, variabilitatea numrtorului raportului F este rezultatul manipulrii de ctre cercettor
(atunci cnd operm n context experimental), sau este rezultatul unor grupuri preexistente (atunci cnd
efectum un studiu observaional). i valoarea acestuia este amplificat de variana erorii. Aceasta deoarece,
chiar i n cazul n care tratamentul cu cele trei metode de antrenament ar fi total ineficient, i toate
populaiile ar avea medii identice, mediile grupurilor comparate ar diferi ntre ele, sub efectul unor surse
diverse (erori). Ca urmare, avem dou surse de variabilitate la numrtor i numai una singur la numitor,
fapt care poate fi sintetizat prin urmtoarea expresie:
12
Sir Ronald Aylmer Fisher (1890-1962). Astronom de formaie, interesat de teoria erorilor, s-a remarcat prin
contribuiile sale n teoria statisticii creia, din anul 1922, i-a dat o nou orientare.
49
Marian Popa
Atunci cnd ipoteza de nul este adevrat, efectul tratamentului se apropie de zero, iar raportul F
este rezultatul varianei erorii. Dac cele dou variane ale erorii ar fi identice, F ar avea valoarea 1 dar, de
fapt, cele dou variane ale erorii pot avea valori diferite, ceea ce conduce la fluctuaii ale lui F n jurul lui 1.
Atunci cnd efectul tratamentului nu este zero (ipoteza de nul este fals), ne ateptm ca valoarea
raportului F s fie mai mare dect 1. ns pentru a respinge ipoteza de nul valoarea lui F trebuie s fie nu
doar mai mare dect 1, ci mai mare dect un prag critic convenional asumat (alfa), astfel nct probabilitatea
ca un rezultat similar s decurg din ntmplare s fie mai mic sau cel mult egal cu alfa.
Distribuia Fisher
Valorile raportului F (sau testul F) se distribuie ntr-un mod particular, numit distribuia F sau distribuia
Fisher. Ca i distribuia normal, distribuia F este o familie de distribuii, avnd urmtoarele caracteristici:
1. asimetrie pozitiv (tendina valorilor de grupare spre partea stng, cu valori mici);
2. poate lua valori orict de mari;
3. valoarea minim este 0, deoarece decurge din raportul a dou dispersii, iar dispersiile nu pot fi
niciodat negative 13.
4. forma distribuiei variaz n funcie de o pereche de grade de libertate format din numrul grupelor
(categoriile variabilei independente) i numrul subiecilor.
Imaginea de mai sus reprezint curba F pentru 3 grupuri cu 30 de subieci n total. Distribuia Fisher
are forme distincte n funcie de numrul eantioanelor comparate i volumul acestora.
Calcularea gradelor de libertate
Ca i n cazul distribuiei t, distribuia F se prezint sub o varietate de forme. Distribuia F rezult
dintr-un raport a dou distribuii diferite (s2intergpup i s2intragrup), fiecare cu gradele ei de libertate. Ca urmare, i
schimb forma, n acelai timp n funcie de numrul grupurilor, i de numrul subiecilor din fiecare grup.
n concluzie, vom avea dou grade de libertate, unul pentru dispersia integrup i altul pentru dispersia
intragrup, calculate astfel:
dfintergrup=numrul grupurilor-1
dfintragrup=numrul cumulat al subiecilor din toate grupurile-numrul grupurilor
EXEMPLU DE CALCUL
Problema cercetrii:
Avem rezultatele la o edin de tragere la int pentru trei grupuri de cte 6 sportivi, fiecare grup
fiind antrenat cu o alt metod, i vrem s vedem dac exist o legtur ntre nivelul performanei i metoda
de antrenament.
13
n practic, se poate ajunge n situaia ca dispersia intragrup s rezulte a fi mai mic dect dispersia intergup i, ca
urmare, valoarea lui F s fie mai mic dect 0. Acest lucru este determinat de inegalitatea sever a dispersiilor ntre
grupurile analizate.
50
Marian Popa
Ipoteza cercetrii:
Performana sportiv este n legtur cu metoda de antrenament utilizat.
Ipoteza de nul:
Nu exist o legtur ntre performana sportiv i metoda de antrenament.
Fixm criteriile deciziei statistice:
Nivelul =0.05
Stabilim F critic:
dfintergrup=3-1=2
dfintragrup=18-3=15
Citim F critic (F(0.05, 2, 15)) din tabelul F pentru =0.05:
Fcritic=3.6823 (vezi tabelul anexat)
Not privind utilizarea tabelei pentru distribuiile F
Spre deosebire de tabelele distribuiilor utilizate pn acum, (z i t), pentru interpretarea lui F avem
mai multe tabele, calculate fiecare pentru un anume nivel al lui . Mai nti cutm tabela pentru dorit (s
zicem, =0.05). Apoi citim valoarea critic pentru F la intersecia dintre coloana care reprezint numrul
gradelor de libertate pentru numrul grupurilor (dfB) cu linia care reprezint numrul gradelor de libertate
pentru volumul total al subiecilor (dfW). Dac valoarea obinut prin calcul este mai mare sau egal dect
cea tabelar, atunci putem lua decizia de respingere a ipotezei de nul.
O precizare important cu privire la ANOVA, ca test statistic, privete caracterul ei unilateral
(one-tailed). ntr-adevr, spre deosebire de celelalte teste studiate pn acum, ANOVA este interpretat ntro singur direcie i anume, dac mediile grupurilor difer semnificativ ntre ele (au o variaie mai mare
dect cea normal pentru o distribuie aleatoare). Nu putem avea o valoare negativ pentru F i, ca urmare,
testul F este ntotdeauna un test unilateral.
Calculm F pe baza datelor centralizate n tabelul urmtor 14:
X
N
M
s2
(m-M)
(m-M)2
Metoda de antrenament
metoda 1
metoda 2
metoda 3
X2
X3
X1
(X2-m2)2
(X3-m3)2
(X1-m1)2
(puncte)
(puncte)
(puncte)
10
2,79
3
8.00
4
1.36
9
0,45
6
0.02
5
4.70
10
2,79
6
0.02
2
0.68
7
1,77
5
0.68
3
0.02
8
0,11
8
4.70
2
0.02
6
5,43
7
1.36
1
3.34
50
13.33
35
14.78
17
10.14
6
6
6
m1=8.33
m2=5.83
m3=2.83 M=(m1+m2+m3)/3=5.66
2.66
2.96
2.02
2.67
0.17
-2.83
7.12
0.02
8.00
(m-M)2=15.14
Distribuia valorilor celor trei grupuri poate fi ilustrat grafic astfel:
14
Atenie, acest mod de prezentare a datelor servete calculrii manuale a testului F. ntr-o baz de date SPSS vom avea
cte o nregistrare pentru fiecare subiect, cu dou variabile, una pentru nivelul anxietii i cealalt pentru intensitatea
fumatului, aceasta din urm cu trei valori convenionale, s zicem 1, 2, 3 pentru fiecare nivel de intensitate a fumatului.
51
Marian Popa
Recunoatem n interiorul graficului parametrii fiecrui grup (m i s2) precum i media mare (M),
a valorilor individuale din toate grupurile, luate mpreun.
Avnd calculai parametrii celor trei grupuri, putem trece la calcularea raportului F. Mai nti
calculm numrtorul, adic dispersia mediilor celor trei grupuri. Dat fiind faptul c nu cunoatem dispersia
populaiei vom utiliza dispersia eantioanelor, conform formulei 3.19 pentru grupuri egale.
Prin nlocuire cu valorile calculate n tabelul de mai sus, obinem:
s 2 intergrup = 6 *
Mai departe, calculm numitorul raportului F (dispersia intragrup), prin nlocuirea valorilor calculate
pentru dispersiile din interiorul celor trei grupuri luate separat, n formula 3.16:
2
s 2 intragrup =
s1 + s2 + s3
2.66 + 2.96 + 2.02
=
= 7.64
3
N grupuri
F=
s 2intergrup 45.42
=
= 5.94
s 2intragrup
7.64
Valoarea astfel obinut o comparm cu F critic gsit anterior n tabel. Constatm c F calculat
(5.94), este mai mare dect F critic (3.6823).
Decizia statistic:
Respingem ipoteza de nul i acceptm ipoteza cercetrii: Nivelul performanei prezint o variaie n
legtur cu metoda de antrenament utilizat.
52
Marian Popa
ptrat sunt indici ai asocierii (B. Cohen, 2001), similari cu coeficientul de corelaie, pe care l vom analiza
analiza n alt loc.
Vom prezenta aici doar indicele eta ptrat, dat fiind faptul c este accesibil cu metoda pe care am
utilizat-o pentru calcularea lui F 16. Formula de calcul pentru 2 este urmtoarea:
2 =
df intergrup F
df intergrup F + df intragrup
(formula 3.21)
n esen, indicele eta ptrat descrie procentul din variana (mprtierea) variabilei dependente care
este explicat de variana variabilei independente.
Nu exist o gril unic de interpretare a indicelui eta ptrat dar, prin similitudine cu coeficientul
de corelaie, putem prelua sugestiile unor autori diferii, ale cror opinii sunt, n linii mari, convergente.
Redm aici, pentru comparaie, dou variante de interpretare pentru eta ptrat:
Varianta de interpretare a lui Hopkins (2000):
0.9-1 Aproape perfect, descrie relaia dintre dou variabile practic indistincte
0.7-0.9 Foarte mare, foarte ridicat
0.5-0.7 Mare, ridicat, major
0.3-0.5 Moderat, mediu
0.1-0.3 Mic, minor
0.0-0.1 Foarte mic, neglijabil, nesubstanial
Varianta de interpretare a lui Davis (citat de Kotrlik i Williams, 2003)
0.70
asociere foarte puternic
0.50 0.69
asociere substanial
0.30 0.49
asociere moderat
0.10 0.29
asociere sczut
0.01 0.09
asociere neglijabil
Vom observa c, n ambele variante, pentru a fi important indicele eta ptrat trebuie s ating cel
puin valoare de 0.50, ceea ce nseamn c 50% din varian variabilei dependente este explicat de variabila
independente.
Pentru datele exemplului nostru, indicele de mrime a efectului este:
2 =
df intergrup F
df intergrup F + df intragrup
2 5.94
= 0.44
2 5.94 + 15
La rndul lui, Cohen (1988) a dezvoltat un indice de mrime a efectului (f) pentru ANOVA, care
atenueaz ceea ce se consider a fi tendina de supraestimare a mrimii efectului de ctre indicele eta
ptrat:
f =
2
1 2
(formula 3.22)
f =
0.44
= 0.88
1 0.44
15
Fr a intra n amnunte, facem precizarea c indicii de mrime a efectului pot fi transformai cu uurin unii ntralii, cu ajutorul unor formule de conversie.
16
Programele statistice ofer, de regul, posibilitatea de a calcula ambii indici ai puterii
53
Marian Popa
n conformitate cu recomandrile lui Cohen, valorile lui f se interpreteaz astfel: efect mic=0.10;
efect mediu=0.25; efect mare=0.40. Interpretarea mrimii efectului trebuie fcut cu precauie i modestie
(Runyon et. al, 1996). Un indice redus de mrime a efectului indic, desigur, o slab intensitate a relaiei
dintre variabila independent i variabila dependent. Cu toate acestea, uneori, chiar i o relaie slab ntre
variabile poate fi important pentru cercetarea tiinific din tiinele sociale i umane. Comportamentul
uman este supus unor surse extrem de complexe de determinri, fapt care face aproape imposibil
controlarea (eliminarea) unora dintre surse, pentru stabilirea exact a efectului uneia anume. Acest lucru face
inevitabil prezena unei anumite cantiti de erori de msurare n toate cercetrile psihologice. n aceste
condiii, uneori, chiar i un efect mic poate fi considerat un ctig important din punct de vedere tiinific,
chiar dac este puin relevant din punct de vedere practic. De exemplu, un rezultat semnificativ statistic, dar
cu un indice sczut de mrime a efectului, poate constitui punctul de plecare al unei noi cercetri, n care
efectele colaterale ale unor variabile s fie mai bine controlate (eliminarea erorii), ceea ce poate conduce la
evidenierea unei relaii mai puternice ntre variabilele studiate.
Dac privim cei doi indici ai mrimii efectului calculai pentru exemplul dat, putem aprecia c, n
contextul datelor cercetrii noastre, 44% din variaia performanei de instruire este explicat de utilizarea
metodelor de antrenament (ceea ce nseamn, implicit, c un procent de 56% provine din alte surse). n
conformitate cu recomandrile de interpretare pentru eta ptrat, putem afirma c relaia dintre metodele de
antrenament utilizate i performan este moderat sau medie. n acelai timp, indicele f al lui Cohen
indic un nivel ridicat al mrimii efectului. Nu trebuie s privim aceste dou aprecieri ale mrimii efectului
ca fiind contradictoirii, ci ca pe dou perspective asupra aceleiai realiti.
Analiza post-hoc
Graficul alturat prezint variaia mediilor
performanei celor grupuri de sportivi. Aa cum se
observ, nivelul performanei are nivelul cel mai ridicat
pentru prima metod de antrenament (8.33), i din ce n
ce mai reduse la urmtoarele dou (5.83; 2.83).
Testul ANOVA ne ofer o imagine global a
variaiei mediilor fr s ne spun nimic cu privire la
sursa de provenien acesteia, i nici n ce msur
difer mediile grupurilor luate dopu ct dou. n
exemplul nostru valoarea obinut pentru F ar putea
decurge doar prin contribuia unui singur grup (de
ex., cei antrenai cu metoda 1), celelalte grupuri avnd
o contribuie minor sau inexistent. Cercettorul
poate fi ns interesat care dintre grupuri difer ntre ele, i n ce sens.
Pentru a rezolva aceast problem se efectueaz aa numitele comparaii multiple, pe baza unor teste
statistice denumite post-hoc, pentru c, n mod normal, acestea se calculeaz dup aplicarea procedurii
ANOVA. Printre cele mai frecvent utilizate sunt testele: Scheffe, Tukey i Bonferoni (desigur, se utilizeaz
unul sau altul dintre ele, la alegere). Nu vom intra n detalii teoretice i de calcul cu privire la aceste teste.
Fiecare are avantajele i dezavantajele sale. Important aici este s nelegem c testele post-hoc se
interpreteaz n mod similar testului t pentru diferena mediilor pentru eantioane necorelate, calculate astfel
nct s ia, att ct se poate, msuri de precauie mpotriva excesului de eroare de tip I menionat anterior.
Este important de reinut, de asemenea, faptul c analiza post-hoc este practicat, de regul, numai dac a
fost obinut un rezultat semnificativ pentru testul F 17. Aceasta nseamn c analiza post-hoc nu poate fi
utilizat ca substitut pentru testul t efectuat n mod repetat. Ca urmare, n practic, analiza de varian va
cuprinde dou faze: prima, n care se decide asupra semnificaiei testului F, i a doua, n cazul c acest raport
este semnificativ, n care se analizeaz comparativ diferenele dintre categoriile analizate, pe baza unui test
post- hoc.
n ce privete calcularea testelor post-hoc menionate mai sus, vom prezenta modul lor de calcul n
seciunea dedicat programului SPSS.
17
Cu toate acestea, exist autori care consider c nimic nu ne mpiedic s calculm testele post-hoc chiar dac testul F
s-a finalizat cu admiterea ipotezei de nul.
54
Marian Popa
Avantajele ANOVA
Utilizarea ANOVA pentru testarea ipotezelor n cazul unui numr mai mare de grupuri (eantioane)
prezint dou avantaje. Primul, ine de ceea ce am precizat deja, i anume faptul c eliminm riscul cumulrii
unei cantiti prea mari de eroare de tip I, prin efectuarea repetat a testului t. Al doilea, rezult din faptul c
avem posibilitatea s punem n eviden diferene semnificative ntre mediile mai multor grupuri, chiar i
atunci cnd nici una dintre ele nu difer semnificativ una de cealalt (testul t).
Dei, n mod normal, analiza de varian este utilizat doar n situaia n care se dorete testarea
diferenei dintre mediile a mai mult de dou grupuri independente, ea d rezultate echivalente i n cazurile
n care exist numai dou grupuri (singura diferen fiind valoarea calculat a testului, nu i nivelul lui p).
Utilizarea testului t pentru testarea diferenei dintre dou medii este, totui, o metod mult mai direct, mai
uor de aplicat i de neles, dect analiza de varian.
v.
indep.
1
1
1
2
2
2
v.
dep.
9
5
7
14
15
10
De exemplu, dac lum n considerare datele din tabelul alturat, n care avem o
variabil dependent distribuit pe dou valori ale unei variabile independente,
valoarea testului t este 3.13, iar valoarea testului F este 9.82 (ceea ce reprezint
ptratul valorii t). n acelai timp, rezultatul la ambele teste este semnificativ pentru
aceeai valoare a lui p (0.035).
55
Marian Popa
transformarea variabilei pe o alt scal de msurare i aplicarea altui test statistic (de
exemplu, prin transformarea pe o scal nominal, se poate aplica testul neparametric chiptrat sau, prin transformarea pe o scal ordinal, se poate aplica testul neparametric
Kruskal-Wallis, ambele urmnd a fi tratate mai departe).
Un psiholog dorete s testeze ipoteza c preferina pentru o anumit varietate de bomboane este n
legtur cu culoarea acestora (verde, rou, galben). n acest scop alege 18 subieci, pe care i mparte n trei
grupuri, fiecare grup primind cte un bol cu bomboane de o anumit culoare. Grupurile au de ndeplinit o
sarcin plictisitoare timp de 30 de minute. Dup acest timp, psihologul numr cte bomboane a mncat
fiecare subiect din cele trei grupuri i construiete tabelul urmtor.
Verde
2
1
1
0
3
2
1.
2.
3.
4.
Rou
3
4
5
6
4
6
Galben
2
0
2
1
3
1
56
Marian Popa
c) Cazul n care natura situaiei experimentale nu permite utilizarea acelorai subieci pentru
cele dou msurri, de exemplu, n contextul unei intervenii terapeutice care are un efect pe termen foarte
lung. n acest caz este se poate gsi pentru fiecare subiect corespunztor condiiei iniiale un subiect
similar, corespunztor condiiei finale, constituind astfel perechi de subieci aparinnd fiecare unui grup
distinct, ntre care se poate face o comparaie direct. Ca urmare, dei diferii, vom trata cei doi subieci din
pereche ca i cum ar fi aceeai persoan. Sau, ntr-un alt context, putem compara subieci care sunt ntr-un
anumit tip de relaie, interesndu-ne diferena dintre ei sub o anumit caracteristic. De exemplu, ne poate
interesa daca ntre nivelul de inteligen dintre bieii i fetele care formeaz cupluri de prieteni exist o
anumit diferen. n acest caz, dei avem dou eantioane distincte, fiecrui subiect din eantionul de biei
i corespunde un subiect din eantionul de fete, constituirea celor dou eantioane fcndu-se pe baza relaiei
de prietenie dintre ei. n aceeai categorie se afl comparaiile ntre perechi de gemeni, sau cele dintre soi. n
astfel de cazuri, avem de a face cu aa numitul model al eantioanelor perechi (matched pairs design).
Indiferent de tipul lor, toate modele prezentate mai sus au un obiectiv similar, acela de a pune n
eviden n ce msur o anumit condiie (variabila independent) corespunde unei modificri la nivelul unei
caracteristici psihologice oarecare (variabila dependent). Vom observa c, n toate exemplele evocate,
variabila independent este una de tip nominal, dihotomic (nainte/dup; semestru/sesiune; grup de
cercetare/grup de control; biat/fat; so/soie, etc.), n timp ce variabila dependent se msoar pe o scal
cantitativ, de interval sau de raport. De asemenea, trebuie s consemnm faptul c n ambele situaii se
utilizeaz msurtori de acelai fel, cu acelai instrument, care produce valori exprimate n aceeai unitate de
msur, ntre care se poate efectua un calcul direct al diferenei.
Pentru descrierea testului statistic adecvat acestor cazuri s ne imaginm urmtoarea situaie
generic de cercetare: Un grup de pacieni cu tulburri de tip anxios sunt inclui ntr-un program de
psihoterapie, avnd drept scop ameliorarea nivelului anxietii. nainte de nceperea programului a fost
aplicat o scal de evaluare a anxietii. Acelai instrument a fost aplicat din nou, dup parcurgerea
programului de terapie.
Aici s-ar putea pune ntrebarea de ce nu considerm valorile rezultate din cele dou msurtori ca
fiind independente, urmnd s utilizm testul t pentru acest tip de date? Exist mai multe argumente n
favoarea respingerii acestei variante simplificatoare:
a) Utilizarea valorilor perechi ofer informaii mai bogate despre situaia de cercetare. n modele
de cercetare de tip nainte/dup ea capt chiar valene de experiment.
b) Testul t pentru eantioane independente surprinde variabilitatea dintre subieci, n timp ce
testul t pentru eantioane dependente (msurri repetate) se bazeaz pe variabilitatea intrasubiect, aceea care provine din diferena valorilor de la o msurare la alta, la nivelul fiecrui
subiect n parte.
c) Dac exist o diferen real ntre subieci, atunci testul diferenei dintre valorile perechi are
mai multe anse s o surprind dect cel pentru valori independente (puterea unui model de
cercetare intra-subiect este mai mare dect n modelul inter-subieci).
Revenind la tema de cercetare pe care am enunat-o mai sus, dei avem aceiai subieci, i n primul
i n al doilea caz, ne vom raporta la aceasta situaie ca i cum ar fi dou eantioane. Unul, cel al subiecilor
care nu au urmat nc un program de terapie, iar celalalt, al subiecilor care au urmat un astfel de
program. Datorit faptului c cele dou eantioane sunt formate din aceiai subieci, ele se numesc
dependente sau corelate.
n acest tip de studiu, obiectivul testului statistic este acela de a pune n eviden semnificaia
diferenei dintre mediile anxietii n cele dou momente. Cea mai simpl procedur de calcul este metoda
diferenei directe. Pentru aceasta, calculm diferenele fiecrei perechi de valori din cele dou distribuii (X2X1), obinnd astfel o distribuie a diferenelor, pe care o vom nota cu D.
Logica ipotezei de nul
Dac programul de terapie ar fi total ineficient, trebuie s presupunem c diferenele pozitive le-ar
echilibra pe cele negative ceea ce, la un numr mare de eantioane ipotetice (formate din acelai numr de
subieci), am obine o medie a diferenelor egal cu 0. Ca urmare, ipoteza statistic presupune c media
diferenelor la nivelul populaiei de nul este 0. Aceasta nseamn c testul t trebuie s demonstreze c media
diferenelor msurate pe eantionul cercetrii este suficient de departe de 0, pentru a respinge ipoteza de nul
i a accepta ipoteza cercetrii. De aici rezult c putem reduce metoda de calcul la formula testului t pentru
un singur eantion, pornind de la formula cunoscut a testului t,
57
Marian Popa
m
sm
seD =
sD
(formula 3.23 )
N
t=
mD D
seD
(formula 3.24)
unde mD este media distribuiei D (a diferenelor dintre cele dou msurri), D este media populaiei de nul
a diferenelor dintre eantioane de acelai fel, iar seD este eroarea standard a distribuiei D (mprtierea
distribuiei D).
Exemplu analitic de calcul
Problema cercetrii: Se poate obine o reducere a reaciilor anxioase prin aplicarea unei anumite
proceduri de psihoterapie?
Ipoteza cercetrii (H1):
Pentru test bilateral Programul de psihoterapie are un efect asupra anxietii.
Pentru test unilateral Programul de psihoterapie reduce intensitatea reaciilor de tip anxios.
Ipoteza de nul (H0):
Pentru test bilateral Programul de psihoterapie nu are nici un efect asupra anxietii.
Pentru test unilateral Programul de psihoterapie nu reduce nivelul anxietii.
Populaiile cercetrii:
Populaia 1 Subiecii cu anxietate ridicat care nu au urmat un program de terapie
Populaia 2 Subiecii cu anxietate ridicat care au urmat un program de terapie
Ipoteza cercetrii afirm c ele sunt diferite (m1-m20), n timp ce ipoteza de nul afirm c ele sunt
identice (m1-m2=0).
Eantion: Un singur grup de subieci cu probleme anxioase (N=8) al crui nivel de anxietate este
evaluat nainte i dup programul de terapie.
Criteriile deciziei statistice
Alegem modul de testare a ipotezei, bilateral.
Fixm, convenional, nivelul =0.01. S spunem c preferm acest nivel deoarece costurile de
implementare a programului sunt destul de mari, iar pacienii trebuie convini c merit timpul i banii 18.
Cutm t critic pentru =0.01 n tabelul distribuiei t pentru 7 grade de libertate (N-1). Tabelul ne d
valorile pentru un test unilateral (n dreapta curbei). Pentru testul bilateral trebuie mai nti s njumtim
valoarea aleas pentru (0.01/2=0.005). n continuare, cutm valoare aflat la intersecia coloanei gradelor
de libertate (7) cu coloana lui =0.005 i citim t critic= -3.49. i atribuim semnul minus, deoarece ne
ateptm ca nivelul anxietii s scad dup aplicarea programului de terapie.
Datele cercetrii:
nainte de
Dup
program
program
(X1)
(X2)
6
6
8
7
D
(X2-X1)
D-mD
(D-mD) 2
0.00
-1.00
0.50
-0.50
0.25
0.25
18
Am optat pentru alfa=0.01 doar pentru a varia exemplele de calcul, dar in practic se utilizeaz n mod obinuit
alfa=0.05.
58
Marian Popa
X
N
m=
sD =
X
N
nainte de
program
(X1)
10
9
5
6
11
5
60
8
Dup
program
(X2)
11
8
5
5
10
4
56
8
7.50
7.00
D
(X2-X1)
1.00
-1.00
0.00
-1.00
-1.00
-1.00
-4
8
D-mD
(D-mD) 2
1.50
-0.50
0.50
-0.50
-0.50
-0.50
2.25
0.25
0.25
0.25
0.25
0.25
(D-mD)2=4
mD=-0,5
(D mD ) 2
N 1
sD =
4
= 0.75
7
Not: n principiu, sub aspectul procedurii statistice, nu prezint nici o importan dac utilizm diferena
X1-X2 sau X2-X1. Ordinea depinde de ceea ce dorete s scoat n eviden cercettorul. Important este ca,
n final, s interpreteze corect rezultatul obinut, n funcie de semnul diferenei i semnificaia concret a
acestuia.
Introducem valorile n formula 3.24 i obinem:
t=
0,5
0,75 / 8
= 2.08
Raionamentul decizional
Mrimea efectului
Indicele de mrime a efectului (d - Cohen) pentru diferena dintre medii dependente se
calculeaz cu formula lui Cohen:
d=
m2 m1
(formula 3.25)
sD
Interpretarea indicelui d se face n conformitate cu recomandrile lui Cohen, astfel: 0.20, efect mic;
0.50, efect mediu, 0.80, efect mare.
Pentru exemplul nostru, indicele de mprime a efectului este:
d=
m2 m1 7 7.50
=
= 0.66
0.75
sD
Valoarea obinut indic o diferen medie-mare sau relativ important ntre mediile comparate
(semnul lui d nu are relevan). Aa cum se vede, este posibil s obinem un indice al mrimii efectului
59
Marian Popa
mediu spre ridicat n condiiile unui rezultat nesemnificativ statistic. Acest lucru trebuie s ne atrag odat
n plus atenia asupra faptului c cele dou proceduri (testul statistic i mrimea efectului) vizeaz aspecte
diferite. Pentru exemplul nostru, vom concluziona c efectul terapiei este relativ important, dar nu are o
putere suficient penmtru a atinge pragul de semnificaie pe un lot de numai 8 subieci. Este mai mult dect
probabil c pe un eantion mai mare rezultatul ar atinge i pragul de semnificaie statistic.
Limitele de ncredere pentru diferena dintre medii
La fel ca i n cazul testului t pentru eantioane independente, se pune problema generalizrii
rezultatului la nivelul populaiei, cu alte cuvinte, care este intervalul n care ne putem atepta s se afle
diferena dintre medii, pentru variabilele studiate. Pentru o estimare cu o precizie de 99%, conform cu nivelul
alfa ales, limitele critice pentru diferena dintre medii sunt cele care corespund valorilor lui p=0,005, de o
parte i de alta a curbei t (3.4998). Formula de calcul pentru intervalul de ncredere deriv, i n acest caz,
din formula 3.24:
t=
mD D
se D
de unde rezult formula pentru calculul limitelor de ncredere ale mediei diferenei:
60
Marian Popa
Publicarea rezultatului
La publicare se vor meniona: volumul eantionului, mediile variabilei dependente n raport cu
valorile variabilei independente, valoarea testului t, pragul de semnificaie, tipul de test (unilateral sau
bilateral), mrimea efectului i limitele de ncredere ale diferenei. Avnd n vedere faptul c, uzual, testele
statistice se efectueaz bilateral, se poate meniona numai cazul n care testul este unilateral, eventual cu
explicarea motivului pentru care a fost preferat aceast soluie.
Pentru exemplul de mai sus, o prezentare narativ a rezultatului ar putea arta astfel:
Un eantion de 8 subieci cu probleme de anxietate au participat la un program de terapie
anxiolitic. Nivelul anxietii (msurat cu o scal specific) a fost evaluat nainte i dup programul de
terapie. S-a constatat o reducere a nivelului anxietii de la o medie de 7.50 la 7.0, dup aplicarea terapiei.
Diferena nu a atins pragul semnificaiei statistice t(7)=-2,08, p<0.01, pentru =0.01 bilateral, cu limitele
de ncredere (99%) cuprinse ntre +0.40 i -1.40. Indicele d (Cohen) al mrimii efectului (0.66) arat totui
existena unei diferene relativ importante ntre mediile celor dou momente. Absena semnificaiei statistice
se datorez, foarte probabil, volumului foarte redus al eantionului i existenei unui scor extrem al unuia
dintre subieci. n concluzie, rezultatele ncurajeaz utilizarea n continuare a metodei terapeutice i
reevaluarea eficienei ei pe un eantion mai mare.
Un psiholog i propune s scoat n eviden efectul stresului temporal (criza de timp) asupra
performanei de operare numeric. n acest scop, selecteaz un eantion de subieci crora le cere s
efectueze un test de calcule aritmetice n dou condiii experimentale diferite: prima, n condiii de timp
nelimitat, cu recomandarea de a lucra ct mai corect; a doua, n condiii de timp limitat, cu condiia de a lucra
ct mai repede i mai corect n acelai timp.
Rezultatele celor dou reprize sunt cele din tabelul alturat.
Fr
criz de timp
67
79
83
80
99
95
80
100
S se rezolve urmtoarele sarcini:
1.
2.
3.
4.
5.
6.
Cu
criz de timp
65
73
70
85
93
88
72
69
61
Marian Popa
v1
7
9
8
6
5
7
v1
7
9
8
6
5
v2
4
5
6
7
3
5
v2
4
5
6
7
3
(a) n cazul diferenei dintre medii, valorile celor dou distribuii (v1 i
v2) pentru un eantion de 5 subieci sunt condensate prin mediile lor (7 i 5), a
cror diferen (7-5=2) este testat din punct de vedere al semnificaiei statistice.
ntr-o relaie de asociere ambele variabile sunt dependente una de alta, iar valorile lor pot fi
exprimate, fie cu aceeai unitate de msur, fie cu uniti de msur diferite. Iat cteva exemple de acest
gen:
exist o legtur ntre numrul atitudinilor pozitive pe care le manifest oamenii i numrul
atitudinilor pozitive pe care le primesc din partea celor din jur?
exist o legtur ntre timpul de reacie i nivelul extraversiunii, ca trstur de
personalitate?
exist o legtur ntre greutate i nlime?
exist o relaie ntre frecvena pulsului oferilor i viteza cu care conduc maina?
exist o relaie ntre numrul orelor de studiu la statistic i punctajul obinut la evaluri?
n toate aceste situaii avem cte dou variabile, ambele fiind dependente una n raport cu alta, n
sensul c este vizat existena unei concordane n variaia reciproc a valorilor celor dou variabile, iar testul
statistic utilizat se bazeaz pe calcularea unui coeficient de corelaie.
nainte de a fi un concept statistic termenul de corelaie este un cuvnt uzual n limbajul cotidian. n
esen, el exprim o legtur ntre anumite aspecte ale realitii, aa cum este ea reflectat n planul
observaiei directe. De exemplu, o parcare plin cu maini ne sugereaz c magazinul alturat este plin cu
cumprtori, ntre numrul de maini din parcare i numrul de cumprtori existnd o anumit corelare.
La nivel statistic, corelaia exprim o legtur cantitativ sistematic ntre valorile a dou variabile perechi,
msurate pe subieci aparinnd aceluiai eantion de cercetare. Coeficientul de corelaie este doar una dintre
procedurile statistice prin care se pune n eviden corelarea dintre variabile. n termeni generali, chiar i
testele t, prezentate anterior, pun n eviden (co)relaia (legtura) dintre o variabil dependent i valorile
unei variabile independente.
62
Marian Popa
Corelaia liniar
S presupunem c un grup de studeni au efectuat un test de inteligen bazat pe raionament
abstract/figurativ i un altul, bazat pe raionament verbal/logic. Dac studenii care obin valori mari la
primul test tind s obin valori mari i la cel de-al doilea, avem ceea ce se numete o corelaie pozitiv.
Dac, dimpotriv, studenii care obin valori mari la unul dintre teste tind s obin valori mici la cel de-al
doilea, atunci ne aflm n faa unei corelaii negative. Este evident c exist i posibilitatea ca valorile celor
dou variabile s evolueze absolut independent unele de celelalte, ceea ce indic absena oricrei corelaii.
Precursorul teoretic al coeficientului de corelaie este coeficientul de covarian. El se definete ca
sum a produselor dintre valorile celor dou variabile, raportat la numrul perechilor de valori din cele dou
distribuii:
cov xy =
x* y
N
(formula 3.27)
unde x i y sunt valorile perechi ale celor dou variabile, iar N este volumul eantionului.
Problema pe care o ridic coeficientul de covarian este legat de unitile de msur. Formula
poate fi aplicat numai dac valorile perechi sunt exprimate n aceeai unitate de msur, pentru ca produsul
lor s aib sens. Evident, nu am putea-o utiliza pentru a calcula coeficientul de covariaie ntre nlime i
greutate, de exemplu, deoarece este dificil s nelegem rezultatului unui produs dintre uniti de msur
diferite (greutate i lungime). Soluia problemei const n transformarea valorilor celor dou variabile n
scoruri standard, ceea ce produce un rezultat care nu mai are legtur cu unitatea de msur. Intensitatea
legturii dintre valorile a dou variabile se exprim prin coeficientul de corelaie liniar, notat cu simbolul r.
Introdus de Karl Pearson 19, acest coeficient mai este cunoscut i sub numele de coeficientul de corelaie
Pearson, sau al moment-produsului, dup expresia uneia din formulele de calcul.
Formula de definiie a coeficientului de corelaie este:
r=
* zy
(formula 3.28)
unde zx respectiv zy sunt scorurile z ale variabilelor x i y, iar N este volumul eantionului.
Situaia de maxim corelaie posibil ntre cele dou distribuii este atunci cnd valorile lor sunt
identice. Dac ar fi aa, atunci valorile zx sunt egale cu valorile zy, iar formula 3.28 ar putea scris ca:
r=
2
x
(formula 3.29)
n continuare, dac nlocuim n formula de mai sus expresia de calcul a lui z i facem toate
simplificrile posibile, ajungem n final la formula deja cunoscut a dispersiei. n consecin, din faptul c
dispersia unei distribuii z este ntotdeauna egal cu +1, rezult c valoarea maxim pe care o poate atinge
coeficientul de corelaie, n cazul unei corelaii pozitive perfecte, este r=+1. Corespunztor, n cazul unei
corelaii negative perfecte, conform aceluiai raionament, rezult c valoarea minim posibil a
coeficientului de corelaie este r= -1.
19
63
Marian Popa
r = .80
r = .20
+
|
z
|
z
z
|
z
|
z
z
|________________
+
|
|
| z
| z
z
z
z
z
z
z
n cazul unei corelaii pozitive valorilor mari ale unei variabile tind s le corespund valori mari le
celeilalte variabile. La limit, pentru o corelaie pozitiv perfect (r=+1) punctele de intersecie ale perechilor
de valori se plaseaz pe o linie dreapt, dinspre stnga jos spre dreapta sus, la un unghi de 45 de grade ntre
cele dou axe. Cu ct corelaia este mai mic, cu att norul de puncte este mai larg, dar forma elipsei indic
relaia pozitiv dintre cele dou variabile.
n imaginea de mai jos avem reprezentri scatterplot caracteristice pentru trei corelaii liniare
negative.
Relaie indirect- Corelaie negativ
r = -1.00
r = -.80
r = -.20
+
| z
|
z
|
z
|
z
|________________
+
+
| z
z
| z
z
z
|
z
z
z
|
z
z
|________________
+
+
| z
|
z
|
z z z
|
z
|________________
+
n cazul corelaiei negative, tendina este aceea ca valorilor mari ale unei variabile s le corespund
valori mici ale celeilalte variabile. Ca urmare, att linia corelaiei negative perfecte (r=-1), ct i diagonala
mare a elipsei norului de puncte al unei corelaii negative imperfecte, se orienteaz din stnga sus spre
dreapta jos a sistemului de coordonate.
n fine, atunci cnd corelaia dintre cele dou variabile este inexistent, norul punctelor de intersecie
are o form circular, care nu contureaz nici o tendin (r=0).
Nici o relaie Nu exist corelaie
r = 0.00
+
z
|
z
z
| z z
z
z
|
z
z
| z
z
z z
| z
z
z z
|________________
+
r=
* zy
[( X m ) / s ]* [(Y m
x
) / sy
Se deduce astfel o formul care, dei apare mai complicat, este mai uor de pus n practic,
deoarece se bazeaz pe valori care se obin prin calcule mai simple:
64
Marian Popa
de unde obinem: r =
( X m ) * (Y m )
x
N * sx * s y
unde:
Formula 3.30 este doar una dintre variantele utilizate. Ea poate fi utilizat pentru calcule, la fel de
bine ca i formula 3.28, obinndu-se rezultate identice. n general, pentru pstrarea acurateei rezultatului se
recomand pstrarea primelor patru zecimale ale fiecrei operaii de calcul dar, pentru exemplele didactice,
unde rezultatul nu are o finalitate real, se poate lucra i cu primele dou zecimale. Oricum, n final, valoarea
coeficientului r se raporteaz n mod obinuit cu doar dou zercimale.
Criteriile deciziei statistice
La fel ca n cazul celorlalte teste statistice, i coeficientul r se raporteaz la o distribuie teoretic,
care este una derivat din distribuia t. Indiferent de ct de mare este r calculat, nu putem avea ncredere n
acesta atta timp ct nu tim n ce msur este diferit de un r care ar rezulta prin jocul ntmplrii. Pentru
aceasta se utilizeaz distribuia t i o formul care deriv din testul t.
Pentru uurarea evalurii semnificaiei, a fost creat un tabel special cu praguri de semnificaie ale
coeficientului de corelaie r care poate fi folosit fr a mai fi necesar utilizarea formulei (vezi tabelul
semnificaiilor coeficientului de corelaie din anex). Practic, se caut n tabel care este nivelul lui r pentru
numrul gradelor de libertate (df=N-2), i un prag ales n prealabil. Dac valoarea calculat este cel puin
egal sau mai mare dect valoarea tabelar (critic) a lui r, atunci ipoteza de nul se respinge, coeficientul de
corelaie fiind considerat semnificativ.
Pentru exemplul nostru, pentru test unilateral, =0.05 i df=6 (8-2), citirea tabelului se face ca n
figura alturat.
Nivel de semnificaie test
unilateral
.05
.025
.01
.005
df
Nivel de semnificaie test
bilateral
.10
.05
.02
.01
1
.988
.997
.9995
.9999
2
.900
.950
.980
.990
3
.805
.878
.934
.959
4
.729
.811
.882
.917
5
.669
.754
.833
.874
6
.622
.707
.789
.834
n condiiile precizate pentru cercetarea propus ca exemplu, valoarea tabelar (critic) a lui r este
0.622. Dac am fi preferat un test bilateral, pentru acelai nivel al lui alfa, valoarea r critic ar fi fost 0.707.
EXEMPLU DE CALCUL
Vom lua n considerare cazul aplicrii celor dou teste de raionament de tip diferit. n acest caz,
ipoteza cercetrii se exprim n maniera: exist o legtur (corelaie) ntre cele dou tipuri de raionament,
cei care obin rezultate bune la unul din teste, vor tinde sa obin rezultate bune i la celalalt. Desigur,
ipoteza poate fi formulat i corespunztor unei corelaii negative, dac avem motive s presupunem acest
lucru.
65
Marian Popa
Scorul la testul
de calcul aritmetic
X
(x-mx)
(x-mx)2
25
-4.63
21.44
32
2.37
5.62
40
10.37
107.54
29
-0.63
0.40
31
1.37
1.88
16
-13.63
185.78
28
-1.63
2.66
36
6.37
40.58
= 237
=365.88
mX= 29.63
sX = 7.23
Scorul la testul
de raionament verbal
Y
(y-my)
(y-my)2
28
-1.88
3.53
27
-2.88
8.29
41
11.12
123.65
34
4.12
16.97
25
-4.88
23.81
19
-10.88
118.37
26
-3.88
15.05
39
9.12
83.17
= 239
=392.88
mY = 29.88
sY = 7.49
Produsul abaterilor de
la medie
(x-mx)* (y-my)
8.70
-6.83
115.31
-2.60
-6.69
148.29
6.32
58.09
=320,63
Pentru calcularea coeficientului de corelaie am ales, de data aceasta, formula 3.30, prin care,
nlocuind valorile, obinem valoarea coeficientului de corelaie:
r=
( X m )* (Y m ) =
x
N * sx * s y
320.63
320.63
=
= +0.74
8 * 7.23 * 7.49 433.22
Graficul scatterplot pentru datele din exemplu este corespunztor unei asocieri pozitive ntre cele
dou variabile, norul de puncte urmnd o elips cu diagonala mare pe direcia stnga jos-dreapta sus:
45
40
35
30
25
20
15
10
5
0
0
10
20
30
40
50
Decizia statistic
Valoarea calculat a lui r (+0.74) este mai mare dect valoarea critic (+0.62), fapt care ndreptete
respingerea ipotezei de nul. Ca urmare, acceptm ca semnificativ coeficientul de corelaie obinut. Datele
cercetrii susin ipoteza c ntre scorurile celor dou teste exist o legtur pozitiv semnificativ 20.
Corelaie i cauzalitate
Coeficientul de corelaie ne ofer informaii despre modul n care variaz valorile a dou variabile,
una n raport cu cealalt. Ca urmare, coeficientul de corelaie nu are o semnificaie cauzal dect dac cele
dou variabile au fost msurate ntr-un context care probeaz cauzalitatea. Iar acest lucru se petrece numai n
condiii de experiment.
n mod uzual, valorile lui r se raporteaz cu dou zecimale, chiar dac valorile tabelare i cele calculate de
programele statistice sunt cu mai mult de dou zecimale.
66
Marian Popa
(are o form curb). Dac privim imaginile de mai jos, putem observa cteva tipuri posibile de curbe de
corelaie. Figurile a i b exprim corelaii perfecte, dar care se supun unui model curbiliniu, n timp ce figura
c reprezint o corelaie perfect rectilinie.
Relaiile curbilinii sunt calculate pe baza altor proceduri dect coeficientul Pearson (r), dar acestea
nu fac de regul obiectul de studiu al unei introduceri n statistica aplicat. S reinem totui c, dac am
calcula un coeficient r pentru distribuiile din figurile a i b, atunci valoarea acestora ar fi foarte mic i, cel
mai probabil, nesemnificativ, n ciuda asocierii grafice evidente a valorilor lor.
Pentru a nelege i mai bine acest fapt, oferim un exemplu ilustrativ. Am introdus valorile lui z i
probabilitile corespunztoare lor de pe curba normal, ntr-un program de prelucrri statistice. Forma
normal a curbei obinute ne indic faptul c, dinspre partea
Distributia normala z
(r=0)
stng a acesteia, valorile z devin din ce n ce mai mici (n
,6
valoare absolut), corespunztor cu creterea probabilitii,
,5
pn la mijlocul curbei, unde z=0, iar probabilitatea este
,4
maxim. Mergnd mai departe, spre dreapta, valorile lui z
ncep s creasc, concomitent cu reducerea probabilitii.
,3
Coeficientul de corelaie calculat pentru un eantion de date
,2
ale celor dou variabile statistice este r=0, iar imaginea
scatterplot
a relaiei dintre ele este prezentat n figura
,1
alturat 21:
0,0
-4
-3
-2
-1
Aa cum se observ, dei r=0, ceea ce indic absena oricrei corelaii liniare ntre variabile, curba de
distribuie arat o corelaie curbilinie perfect.
Din fericire, astfel de situaii sunt relativ rare n realitate, modelul corelaiei liniare fiind adecvat
pentru un mare numr de relaii dintre variabilele naturale, incluzndu-le i pe cele psihologice. Atunci cnd
exist suspiciuni consistente cu privire la natura liniar a legturii dintre variabile, se pot efectua anumite
transformri care s le aduc n cadrul unei variaii liniare (de exemplu, extragerea radicalului sau
logaritmarea variabilelor). Atunci cnd se raporteaz un coeficient de corelaie fr a se preciza caracterul
liniar sau curbiliniu, vom considera c acesta se refer la corelaia liniar.
Exemplul dat ne sugereaz faptul c graficul scatterplot ofer informaii suplimentare semnificative
i, din acest motiv, este recomandabil realizarea acestuia de fiecare dat cnd utilizm testul de corelaie
Pearson. Un argument spectaculos n sprijinul acestui aspect ne este oferit de Anscombe (1973), care a
realizat cele patru seturi de date din tabelul de mai jos:
Setul #1
X1
Y1
10,00
8,04
8,00
6,95
13,00
7,58
9,00
8,81
11,00
8,33
21
Setul #2
X2
10,00
8,00
13,00
9,00
11,00
Y2
9,14
8,14
8,74
8,77
9,26
Setul #3
X3
Y3
10,00
7,46
8,00
6,77
13,00
12,74
9,00
7,11
11,00
7,81
Setul #4
X4
Y4
8,00
6,58
8,00
5,76
8,00
7,71
8,00
8,84
8,00
8,47
67
Marian Popa
9,96
7,24
4,26
10,84
4,82
5,68
14,00
6,00
4,00
12,00
7,00
5,00
8,10
6,13
3,10
9,13
7,26
4,74
14,00
6,00
4,00
12,00
7,00
5,00
8,84
6,08
5,39
8,15
6,42
5,73
8,00
8,00
19,00
8,00
8,00
8,00
7,04
5,25
12,50
5,56
7,91
6,89
Coeficienii de corelaie dintre cele patru perechi de variabile (X1-Y1, X2-Y2, X3-Y3; X4-Y4) sunt
identici: r=0.81. i totui, dac sunt analizate reprezentrile scatterplot pentru fiecare dintre cele patru
perechi de variabile, imaginile ne ofer diferene importante cu privire la natura real a relaiei dintre ele:
12,00
12,00
10,00
10,00
x2
14,00
x1
14,00
8,00
8,00
6,00
6,00
4,00
4,00
4,00
5,00
6,00
7,00
8,00
9,00
10,00
11,00
3,00
4,00
5,00
6,00
y1
7,00
8,00
9,00
10,00
y2
20,00
14,00
18,00
12,00
16,00
x4
x3
10,00
14,00
8,00
12,00
6,00
10,00
4,00
8,00
6,00
8,00
10,00
12,00
6,00
y3
8,00
10,00
12,00
y4
n cazul perechii X3-Y3, o valoare extrem a redus coeficientul de corelaie, iar n cazul perechii de
variabile X4-Y4, unde corelaia ar fi fost nul, ea este generat de o singur valoare extrem. Desigur, astfel
de efecte apar cu precdere n cazul eantioanelor de volum mic, dar grija pentru valorile extreme trebuie
meninut n toate cazurile.
Descriptor
Foarte mic, neglijabil, nesubstanial
Mic, minor
Moderat, mediu
Mare, ridicat, major
68
Marian Popa
O alt variant de interpretare a mrimii efectului recunoscut este cea propus de Davis (citat de
Kotrlik i Williams, 2003):
0.70
0.50 0.69
0.30 0.49
0.10 0.29
0.01 0.09
naintea oricrui calificativ ns, prima condiie pentru a lua n considerare existena unei corelaii
ntre dou variabile rmne atingerea pragului de semnificaie (alfa). Dac valoarea lui r este mai mic dect
r critic (corespunde unui nivel p mai mare de 0.05, sau dect alt prag legitim decis de cercettor), existena
unei corelaii nu poate fi luat n considerare, indiferent de mrimea coeficientului r Pearson. Aceasta,
deoarece nu avem temei pentru a accepta c se ndeprteaz suficient de o valoare care ar fi putut decurge
prin jocul hazardului.
n cele din urm ce trebuie s lum n considerare, semnificaia sau intensitatea asocierii? Desigur,
rspunsul este unul relativ. Dac finalitatea studiului este aceea de a lua decizii, ca n cazul seleciei de
personal, de exemplu, se vor cuta valori ct mai mari ale coeficientului de corelaie (r). Dar dac obiectivul
este preponderent teoretic, de a pune n eviden relaii ascunse ntre variabile, atunci, indiferent de
mrimea lor, coeficienii de corelaie vor fi luai n considerare (desigur, dac sunt mai mari de 0.1).
Coeficientul de determinare
Valorile lui r trebuie considerate pe o scal ordinal. Ca urmare, nu este corect s afirmm c un
coeficient de corelaie de 0.40 este de dou ori mai mare dect un altul de 0.20. Dac dorim s comparm n
mod direct doi coeficieni de corelaie trebuie s ridicm valorile lui r la ptrat (r2), obinnd astfel ceea ce se
numete coeficient de determinare (prezentat n programele statistice i ca r squared). Acesta este
considerat un indicator mai adecvat al mrimii efectului, deoarece ia valori sensibili mai mici dect cele ale
coeficientului de corelaie. Pentru exemplul nostru, coeficientul de determinare este 0.742=0.55. Transformat
n procente, acest rezultat se interpreteaz astfel: 55% din variaia (mprtierea) uneia dintre cele dou
variabile este determinat de variaia celeilalte variabile. Sau, altfel spus, cele dou variabile au in comun
55% din variaia care le caracterizeaz, ceea ce nseamn c 45% din variabilitatea lor provine din alte surse.
Atenie, interpretarea procentual, n maniera prezentat, este valabil numai pentru coeficientul de
determinare. Coeficientul de corelaie (r) nu poate fi interpretat n nici un caz sub form procentual!
Cohen (citat de Kotrlik i Williams, 2003) a propus urmtoarea regul de evaluare a mrimii
coeficentului de determinare ca indice de mrime a efectului n cazul corelaiei:
r2
(Cohen)
0.0196
0.1300
0.2600
efect mic
efect mediu
efect mare
Vom observa c valorile lui r corespunztoare celor trei praguri ale lui r2 sunt 0.14, 0.36 i,
respectiv, 0.50, ceea ce este n concordan cu recomandrile de mai sus pentru interpretarea lui r.
S reinem c mrimea efectului, care este, de fapt, nsi mrimea coeficientului r, depinde de dou
elemente principale:
- Caracterul liniar al relaiei dintre variabile. O component curbilinie a asocierii va conduce la valori
mai mici ale coeficientului de corelaie. Graficul scatterplot ne poate ajuta la evidenierea acestui
aspect.
- Variabilitatea distribuiilor comparate. Dac variabilele cercetate au o mprtiere redus, acest fapt
limiteaz posibilitatea de a obine valori ridicate pentru r.
Mrimea eantionului are efect doar asupra puterii testului (eantioanele mari conduc mai uor la
atingerea pragului de semnificaie), dar nu au un efect important asupra mrimii lui r.
69
Marian Popa
(formula 3.31)
Pentru a se evita aplicarea acestei formule relativ greoaie, se poate utiliza un tabel (vezi n anex
tabelul Fisher de transformare n Z a valorilor lui r) care, chiar dac nu conine toate valorile intermediare,
este suficient pentru a acoperi nevoile practice.
S lum ca exemplu valoarea coeficientului de corelaie parial obinut de noi mai sus: r=+0.74. Ne
propunem s aflm care sunt limitele de ncredere ale acestei valori, adic s definim intervalul n care se
poate afla valoarea real a corelaiei la nivelul populaiei, cu o probabilitate asumat. De regul, aa cum
tim, aceast probabilitate asumat este de 0.05 sau, exprimat altfel, un nivel de ncredere de 95%.
Practic, aflarea limitelor se face n felul urmtor:
Se transform r calculat n valoare Z, citind tabela Fisher: n cazul nostru, pentru r=0.85 avem o
valoare Z=0.9505 (dac valoarea lui r nu se regsete ca atare n tabel, se poate face o medie a
valorilor apropiate). Pe o distribuie normal, cum este distribuia de eantionare Z, tim c
aproximativ 95% dintre valori se ntind ntre -1.96 i +1.96. Adic, pe o distan de aproximativ
dou abateri standard n jurul mediei (abaterea standard a valorilor Z fiind 1).
Se calculeaz eroarea standard a transformrii Z, cu formula:
1
1
=
= 0,447 unde N este volumul eantionului
N 3
83
Se calculeaz limitele superioar i inferioar a intervalului: = r zcritic * re , adic:
re =
70
Marian Popa
corelaii egale cu 0, iar limita superioar n vecintatea corelaiei perfecte, ceea ce ne arat o precizie de
estimare sczut. Acest fapt este normal, dac avem n vedere mrimea redus a eantionului, care determin
un nivel ridicat al erorii standard pentru r (prin faptul c se afl la numitorul formulei).
Utilizarea limitelor de ncredere
Dac analizm limitele intervalului de ncredere astfel obinute, pentru exemplul nostru, trebuie s
constatm c ele sunt foarte mari, n zona valorilor pozitive, dar avnd limita inferioar destul de aproape de
valoarea zero. Acest fapt conduce la concluzia c, dei este att mare i semnificativ statistic, coeficientul
obinut are o valoare mic de generalizare. Situaia este generat, n acest caz, de volumul extrem de mic al
eantionului. Amplitudinea intervalului de ncredere este direct dependent de volumul eantionului. Cu ct
N este mai mare, cu att valoarea erorii standard tinde s scad, ceea ce aduce limitele intervalului de
ncredere mai aproape de valoarea calculat a lui r.
S ne imaginm c am efectuat un calcul de corelaie pe 30 de subieci i am obinut r=0.30 (cnd
semnul corelaiei nu este specificat, se consider pozitiv). Limitele de ncredere pentru acesta sunt ntre -0.07
i +0.60, ceea ce arat c este nesemnificativ, dat fiind faptul c ntre cele dou limite este i valoarea zero,
aceea care este vizat de ipoteza de nul. Faptul c limita inferioar este foarte aproape de valoarea zero (la
numai 7 sutimi de ea), ne ndreptete s credem c, prin mrirea volumului eantionului de cercetare ar
putea fi atins nivelul de semnificaie statistic. Aceasta, deoarece n formula erorii standard a lui r volumul
eantionului se afl la numitor i, cu ct N va fi mai mare, cu att valoarea lui re va fi mai mic, iar limitele
intervalului de ncredere pentru r, mai aproape de r.
Tabelul urmtor arat care sunt limitele pentru exemplul dat, dac N ar crete, progresiv, pn la
100:
Niv. de
Limite de ncredere
Pearson
N
ncredere
r
inferioar superioar
(%)
30
0,30
95
-0,07
0,60
40
0,30
95
-0,01
0,56
50
0,30
95
0,02
0,53
60
0,30
95
0,05
0,51
70
0,30
95
0,07
0,50
80
0,30
95
0,09
0,49
90
0,30
95
0,10
0,48
100
0,30
95
0,11
0,47
Utilitatea practic a acestor estimri de limite este dat de faptul c ne arat cu ct ar trebui s
cretem volumul eantionului pentru a obine un rezultat semnificativ al coeficientului de corelaie dintre
cele dou variabile. Aa cum se vede, dac am crete volumul eantionului la 50 de subieci, limita inferioar
ar trece deja peste valoarea zero. Celelalte linii din tabel prezint efectul de mrime al eantionului n cazul
creterii lui N pn la 100 de subieci.
71
Marian Popa
Modul de calcul al semnificaiei dintre doi coeficieni de corelaie va fi prezentat mai trziu, n
seciunea rezervat procedurilor SPSS.
Un eantion de 10 subieci a fost testat cu un test de inteligen de dou ori, pentru a se verifica
stabilitatea test-retest a instrumentului. Rezultatele, marcate cu I i II, sunt prezentate n tabelul urmtor:
72
Marian Popa
1.
2.
3.
4.
5.
6.
7.
II
105
108
110
95
105
125
118
116
118
126
Testele statistice verific adevrul ipotezelor de cercetare prin testarea adevrului ipotezei statistice
(de nul). Atunci cnd ipoteza de nul este respins, ipoteza cercetrii este confirmat. Atunci cnd
ipoteza de nul este acceptat, ipoteza cercetrii nu se confirm.
Testul z pentru un singur eantion compar scorul z al unui eantion cu media populaiei din care
provine, pentru a testa dac eantionul face pare din acea populaie (numit de nul) sau nu.
Condiia limitativ a utilizrii testului z pentru un eantion este cunoaterea mediei populaiei.
Testul t pentru un eantion este similar cu testul z, dar se aplic n cazul eantioanelor mai mici de 30
de subieci.
Testul t pentru eantioane independente verific semnificaia diferenei dintre mediile a dou
eantioane formate din subieci diferii, care au fost evaluate n condiii distincte.
Respingerea ipotezei de nul n acest caz, nseamn acceptarea ipotezei c cele dou medii sunt
diferite, ceea ce este echivalent cu acceptarea ipotezei cercetrii care afirm existena unei relaii
ntre condiia testrii (variabila independent, msurat pe scal nominal, dihotomic) i rezultatul
msurat prin variabila dependent (msurat pe scal cantitativ).
Analiza de varian (ANOVA) testeaz diferena dintre mediile a mai mult de dou medii obinute pe
eantioane independente.
Testul ANOVA se bazeaz pe evidenierea diferenei dintre medii prin analiza variabilitii lor.
ANOVA este necesar n cazul comparrii a mai mult de dou medii deoarece compararea acestora
dou cte dou este nepermis, ca urmare a acumulrii excesive de eroare de tip I.
Testul t pentru diferena mediilor a dou eantioane dependente vizeaz situaiile n care aceiai
subieci au fost evaluai cu acelai instrument n situaii diferite. Variabila independent este
reprezentat de condiia n care are loc msurarea, iar variabila dependent este caracteristica care
face obiectul msurrii, fiind exprimat pe scal cantitativ.
Coeficientul de corelaie Pearson testeaz intensitatea asocierii de tip liniar dintre dou variabile
msurate pe aceiai subieci, n condiii diferite sau cu instrumente diferite. Coeficientul de corelaie
73
Marian Popa
variaz ntre -1 i +1, care exprim corelaii maxime (negativ, respectiv pozitiv). Un coeficient de
corelaie egal cu 0 semnific absena oricrei asocieri ntre cele dou variabile.
t=
27.2 34.4
2
s1
s
+ 2
N1 N 2
7.2
= 1.92
3.75
6. Se accept ipoteza de nul deoarece t calculat (-1.92)este mai mic dect t critic (-2.04)
7. Ipoteza cercetrii nu se confirm. Rezultatele nu sus in ipoteza c tratamentul mpotriva fobiei
are vreun efect.
Sarcina de lucru 2.5
1. F critic pentru 2 cu 15 grade de libertate =3.6823
2. F calculat= 16,4
3. Se respinge ipoteza de nul
4. 18 subieci au fost repartizai aleatoriu n 3 grupuri, fiecare primind bomboane de culori diferite
(rou, verde, galben). Mediile de consum pentru fiecare grup n parte au fost: Cele trei grupuri au
consumat n medie, m1=1.5; m2=4.67 i m3=1.5. Analiza de varian unifactorial a relevat o
diferen semnificativ ntre medii F(2,15)=16.4; p0.05. Rezultatele indic faptul c cea mai
preferat culoare de bomboane este rou.
Sarcina de lucru 2.6
1. Ipoteza cercetrii: Stresul temporal diminueaz performana de calcul numeric. Ipoteza de nul:
Stresul temporal nu are nici un efect asupra performanei de calcul.
2. t critic=2.36
3. t calculat=2.29
4. Se accept ipoteza de nul
5. Se infirm ipoteza cercetrii
6. Un eantion de 8 subieci a fost supus unui test de calcul aritmetic n condiii de stres temporal i
n condiii fr stres. Nivelul performanei n condiii de stres a sczut (m=76.88) fa de condiii
lipsite de stres (m=85.38). Diferena nu s-a dovedit totui semnificativ statistic t(7)=2.29, p>0.05,
pentru alfa=0.05, bilateral.
74
Marian Popa
Observaie: n acest caz, rezultatul nesemnificativ al testului t este determinat de numrul mic de subieci.
Aa cum se observ, valoarea calculat a lui t este foarte aproape de t critic.
Sarcina de lucru 2.7
1. Ipoteza cercetrii: Scorurile obinute de subieci la cele dou aplicri vor fi concordante.
2. Ipoteza statistic: Scorurile nu vor fi concordante
3. Populaiile cercetrii sunt populaia subieci la prima aplicare i populaia de subieci la a doua
aplicare a testului.
4. Criteriile de decizie statistic: alfa 0.05 bilateral; df=10-2=8, r critic=063
5. r calculat=0.73
6. Decizia statistic: Se respinge ipoteza de nul.
7. Concluzia cercetrii: Scorurile sunt concordante de la o aplicare la alta.
Bibliografie minimal
Bibliografia de baz
Bibliografie suplimentar
Clocotici, V., & Stan, A. (2000). Statistica aplicata in psihologie. Iasi: Polirom, (selectiv)
Rotaru, T. (coord.). (1999). Metode statistice aplicate in stiintele sociale. Iasi: Polirom.
(selectiv)
Vasilescu, I. P. (1992). Statistica informatizata pentru stiinte despre om (Vol. 1-2).
Bucuresti: Editura militara., (selectiv)
75
Marian Popa
0
z
Valorile din tabel indic probabilitatea dintre 0 i z.
Z
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
4
4.1
4.2
0
0.00000
0.03983
0.07926
0.11791
0.15542
0.19146
0.22575
0.25804
0.28814
0.31594
0.34134
0.36433
0.38493
0.40320
0.41924
0.43319
0.44520
0.45543
0.46407
0.47128
0.47725
0.48214
0.48610
0.48928
0.49180
0.49379
0.49534
0.49653
0.49744
0.49813
0.49865
0.49903
0.49931
0.49952
0.49966
0.49977
0.49984
0.49989
0.49993
0.49995
0.49997
0.49998
0.49999
0.01
0.00399
0.04380
0.08317
0.12172
0.15910
0.19497
0.22907
0.26115
0.29103
0.31859
0.34375
0.36650
0.38686
0.40490
0.42073
0.43448
0.44630
0.45637
0.46485
0.47193
0.47778
0.48257
0.48645
0.48956
0.49202
0.49396
0.49547
0.49664
0.49752
0.49819
0.49869
0.49906
0.49934
0.49953
0.49968
0.49978
0.49985
0.49990
0.49993
0.49995
0.49997
0.49998
0.49999
0.02
0.00798
0.04776
0.08706
0.12552
0.16276
0.19847
0.23237
0.26424
0.29389
0.32121
0.34614
0.36864
0.38877
0.40658
0.42220
0.43574
0.44738
0.45728
0.46562
0.47257
0.47831
0.48300
0.48679
0.48983
0.49224
0.49413
0.49560
0.49674
0.49760
0.49825
0.49874
0.49910
0.49936
0.49955
0.49969
0.49978
0.49985
0.49990
0.49993
0.49996
0.49997
0.49998
0.49999
0.03
0.01197
0.05172
0.09095
0.12930
0.16640
0.20194
0.23565
0.26730
0.29673
0.32381
0.34849
0.37076
0.39065
0.40824
0.42364
0.43699
0.44845
0.45818
0.46638
0.47320
0.47882
0.48341
0.48713
0.49010
0.49245
0.49430
0.49573
0.49683
0.49767
0.49831
0.49878
0.49913
0.49938
0.49957
0.49970
0.49979
0.49986
0.49990
0.49994
0.49996
0.49997
0.49998
0.49999
0.04
0.01595
0.05567
0.09483
0.13307
0.17003
0.20540
0.23891
0.27035
0.29955
0.32639
0.35083
0.37286
0.39251
0.40988
0.42507
0.43822
0.44950
0.45907
0.46712
0.47381
0.47932
0.48382
0.48745
0.49036
0.49266
0.49446
0.49585
0.49693
0.49774
0.49836
0.49882
0.49916
0.49940
0.49958
0.49971
0.49980
0.49986
0.49991
0.49994
0.49996
0.49997
0.49998
0.49999
76
0.05
0.01994
0.05962
0.09871
0.13683
0.17364
0.20884
0.24215
0.27337
0.30234
0.32894
0.35314
0.37493
0.39435
0.41149
0.42647
0.43943
0.45053
0.45994
0.46784
0.47441
0.47982
0.48422
0.48778
0.49061
0.49286
0.49461
0.49598
0.49702
0.49781
0.49841
0.49886
0.49918
0.49942
0.49960
0.49972
0.49981
0.49987
0.49991
0.49994
0.49996
0.49997
0.49998
0.49999
0.06
0.02392
0.06356
0.10257
0.14058
0.17724
0.21226
0.24537
0.27637
0.30511
0.33147
0.35543
0.37698
0.39617
0.41309
0.42785
0.44062
0.45154
0.46080
0.46856
0.47500
0.48030
0.48461
0.48809
0.49086
0.49305
0.49477
0.49609
0.49711
0.49788
0.49846
0.49889
0.49921
0.49944
0.49961
0.49973
0.49981
0.49987
0.49992
0.49994
0.49996
0.49998
0.49998
0.49999
0.07
0.02790
0.06749
0.10642
0.14431
0.18082
0.21566
0.24857
0.27935
0.30785
0.33398
0.35769
0.37900
0.39796
0.41466
0.42922
0.44179
0.45254
0.46164
0.46926
0.47558
0.48077
0.48500
0.48840
0.49111
0.49324
0.49492
0.49621
0.49720
0.49795
0.49851
0.49893
0.49924
0.49946
0.49962
0.49974
0.49982
0.49988
0.49992
0.49995
0.49996
0.49998
0.49998
0.49999
0.08
0.03188
0.07142
0.11026
0.14803
0.18439
0.21904
0.25175
0.28230
0.31057
0.33646
0.35993
0.38100
0.39973
0.41621
0.43056
0.44295
0.45352
0.46246
0.46995
0.47615
0.48124
0.48537
0.48870
0.49134
0.49343
0.49506
0.49632
0.49728
0.49801
0.49856
0.49896
0.49926
0.49948
0.49964
0.49975
0.49983
0.49988
0.49992
0.49995
0.49997
0.49998
0.49999
0.49999
0.09
0.03586
0.07535
0.11409
0.15173
0.18793
0.22240
0.25490
0.28524
0.31327
0.33891
0.36214
0.38298
0.40147
0.41774
0.43189
0.44408
0.45449
0.46327
0.47062
0.47670
0.48169
0.48574
0.48899
0.49158
0.49361
0.49520
0.49643
0.49736
0.49807
0.49861
0.49900
0.49929
0.49950
0.49965
0.49976
0.49983
0.49989
0.49992
0.49995
0.49997
0.49998
0.49999
0.49999
Marian Popa
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9
6
0.49999
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
77
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.49999
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
0.50000
Marian Popa
df
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
alfa=0.10
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.296
1.289
alfa=0.05
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.760
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.684
1.671
1.658
alfa=0.025
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.021
2.000
1.980
alfa=0.01
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.528
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.423
2.390
2.358
alfa=0.005
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.102
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.704
2.660
2.617
alfa=0.0005
636.620
31.598
12.924
8.610
6.869
5.959
5.408
5.041
4.781
4.587
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
3.850
3.819
3.792
3.767
3.745
3.725
3.707
3.690
3.674
3.659
3.646
3.551
3.460
3.373
1.282
1.645
1.960
2.326
2.576
3.291
78
Marian Popa
df intergrup (between)
1
10
161.4476
18.5128
10.1280
7.7086
6.6079
5.9874
5.5914
5.3177
5.1174
4.9646
4.8443
4.7472
4.6672
4.6001
4.5431
4.4940
4.4513
4.4139
4.3807
4.3512
4.3248
4.3009
4.2793
4.2597
4.2417
4.2252
4.2100
4.1960
4.1830
4.1709
199.5000
19.0000
9.5521
6.9443
5.7861
5.1433
4.7374
4.4590
4.2565
4.1028
3.9823
3.8853
3.8056
3.7389
3.6823
3.6337
3.5915
3.5546
3.5219
3.4928
3.4668
3.4434
3.4221
3.4028
3.3852
3.3690
3.3541
3.3404
3.3277
3.3158
215.7073
19.1643
9.2766
6.5914
5.4095
4.7571
4.3468
4.0662
3.8625
3.7083
3.5874
3.4903
3.4105
3.3439
3.2874
3.2389
3.1968
3.1599
3.1274
3.0984
3.0725
3.0491
3.0280
3.0088
2.9912
2.9752
2.9604
2.9467
2.9340
2.9223
224.5832
19.2468
9.1172
6.3882
5.1922
4.5337
4.1203
3.8379
3.6331
3.4780
3.3567
3.2592
3.1791
3.1122
3.0556
3.0069
2.9647
2.9277
2.8951
2.8661
2.8401
2.8167
2.7955
2.7763
2.7587
2.7426
2.7278
2.7141
2.7014
2.6896
230.1619
19.2964
9.0135
6.2561
5.0503
4.3874
3.9715
3.6875
3.4817
3.3258
3.2039
3.1059
3.0254
2.9582
2.9013
2.8524
2.8100
2.7729
2.7401
2.7109
2.6848
2.6613
2.6400
2.6207
2.6030
2.5868
2.5719
2.5581
2.5454
2.5336
233.9860
19.3295
8.9406
6.1631
4.9503
4.2839
3.8660
3.5806
3.3738
3.2172
3.0946
2.9961
2.9153
2.8477
2.7905
2.7413
2.6987
2.6613
2.6283
2.5990
2.5727
2.5491
2.5277
2.5082
2.4904
2.4741
2.4591
2.4453
2.4324
2.4205
236.7684
19.3532
8.8867
6.0942
4.8759
4.2067
3.7870
3.5005
3.2927
3.1355
3.0123
2.9134
2.8321
2.7642
2.7066
2.6572
2.6143
2.5767
2.5435
2.5140
2.4876
2.4638
2.4422
2.4226
2.4047
2.3883
2.3732
2.3593
2.3463
2.3343
238.8827
19.3710
8.8452
6.0410
4.8183
4.1468
3.7257
3.4381
3.2296
3.0717
2.9480
2.8486
2.7669
2.6987
2.6408
2.5911
2.5480
2.5102
2.4768
2.4471
2.4205
2.3965
2.3748
2.3551
2.3371
2.3205
2.3053
2.2913
2.2783
2.2662
240.5433
19.3848
8.8123
5.9988
4.7725
4.0990
3.6767
3.3881
3.1789
3.0204
2.8962
2.7964
2.7144
2.6458
2.5876
2.5377
2.4943
2.4563
2.4227
2.3928
2.3660
2.3419
2.3201
2.3002
2.2821
2.2655
2.2501
2.2360
2.2229
2.2107
241.8817
19.3959
8.7855
5.9644
4.7351
4.0600
3.6365
3.3472
3.1373
2.9782
2.8536
2.7534
2.6710
2.6022
2.5437
2.4935
2.4499
2.4117
2.3779
2.3479
2.3210
2.2967
2.2747
2.2547
2.2365
2.2197
2.2043
2.1900
2.1768
2.1646
p=0.05
p=0.25
p=0.01
p=0.005
Bilateral
df
p=0.10
p=0.05
p=0.02
p=0.01
0,988
0,997
0,9995
0,9999
0,9
0,95
0,98
0,99
0,805
0,878
0,934
0,959
0,729
0,811
0,882
0,917
0,669
0,754
0,833
0,874
0,622
0,707
0,789
0,834
0,582
0,666
0,75
0,798
0,549
0,632
0,716
0,765
22
Tabelul este aplicabil pentru maxim 11 grupuri (dfBetween=10) i dfWithin maxim=30. Tabele complete pentru F se
gsesc n manualele recomandate n bibliografie.
79
Marian Popa
p=0.05
p=0.25
p=0.01
p=0.005
Bilateral
df
p=0.10
p=0.05
p=0.02
p=0.01
0,521
0,602
0,685
0,735
10
0,497
0,576
0,658
0,708
11
0,476
0,553
0,634
0,684
12
0,458
0,532
0,612
0,661
13
0,441
0,514
0,592
0,641
14
0,426
0,497
0,574
0,623
15
0,412
0,482
0,558
0,606
16
0,4
0,468
0,542
0,59
17
0,389
0,456
0,528
0,575
18
0,378
0,444
0,516
0,561
19
0,369
0,433
0,503
0,549
20
0,36
0,423
0,492
0,537
21
0,352
0,413
0,482
0,526
22
0,344
0,404
0,472
0,515
23
0,337
0,396
0,462
0,505
24
0,33
0,388
0,453
0,496
25
0,323
0,381
0,445
0,487
26
0,317
0,374
0,437
0,479
27
0,311
0,367
0,43
0,471
28
0,306
0,361
0,423
0,463
29
0,301
0,355
0,416
0,456
30
0,296
0,349
0,409
0,449
35
0,275
0,325
0,381
0,418
40
0,257
0,304
0,358
0,393
45
0,243
0,288
0,338
0,372
50
0,231
0,273
0,322
0,354
60
0,211
0,25
0,295
0,325
70
0,195
0,232
0,274
0,302
80
0,183
0,217
0,256
0,283
90
0,173
0,205
0,242
0,267
100
0,164
0,195
0,23
0,254
80
Marian Popa
Z
0.0000
0.0100
0.0200
0.0300
0.0400
0.0500
0.0601
0.0701
0.0802
0.0902
0.1003
0.1104
0.1206
0.1307
0.1409
0.1511
0.1614
0.1717
0.1820
0.1923
0.2027
0.2132
0.2237
0.2342
0.2448
0.2554
r
0.2600
0.2700
0.2800
0.2900
0.3000
0.3100
0.3200
0.3300
0.3400
0.3500
0.3600
0.3700
0.3800
0.3900
0.4000
0.4100
0.4200
0.4300
0.4400
0.4500
0.4600
0.4700
0.4800
0.4900
0.5000
0.5100
Z
0.2661
0.2769
0.2877
0.2986
0.3095
0.3205
0.3316
0.3428
0.3541
0.3654
0.3769
0.3884
0.4001
0.4118
0.4236
0.4356
0.4477
0.4599
0.4722
0.4847
0.4973
0.5101
0.5230
0.5361
0.5493
0.5627
r
0.5200
0.5300
0.5400
0.5500
0.5600
0.5700
0.5800
0.5900
0.6000
0.6100
0.6200
0.6300
0.6400
0.6500
0.6600
0.6700
0.6800
0.6900
0.7000
0.7100
0.7200
0.7300
0.7400
0.7500
0.7600
0.7700
81
Z
0.5763
0.5901
0.6042
0.6184
0.6328
0.6475
0.6625
0.6777
0.6931
0.7089
0.7250
0.7414
0.7582
0.7753
0.7928
0.8107
0.8291
0.8480
0.8673
0.8872
0.9076
0.9287
0.9505
0.9730
0.9962
1.0203
R
0.7800
0.7900
0.8000
0.8100
0.8200
0.8300
0.8400
0.8500
0.8600
0.8700
0.8800
0.8900
0.9000
0.9100
0.9200
0.9300
0.9400
0.9500
0.9600
0.9700
0.9800
0.9900
Z
1.0454
1.0714
1.0986
1.1270
1.1568
1.1881
1.2212
1.2562
1.2933
1.3331
1.3758
1.4219
1.4722
1.5275
1.5890
1.6584
1.7380
1.8318
1.9459
2.0923
2.2976
2.6467
Marian Popa
FACULTATEA DE PSIHOLOGIE I
TIINELE EDUCAIEI
DEPARTAMENTUL DE
NVMNT LA DISTAN
26
Copyright DEPARTAMENT ID 2008
Marian Popa
27
Copyright DEPARTAMENT ID 2008
Marian Popa
Noiuni introductive
Testele neparametrice prezint, n raport cu cele parametrice, o serie de avantaje, dar i dezavantaje.
Principalele avantaje sunt:
Se pot utiliza pe scale ale cror caliti de msurare sunt slabe (ordinale, nominale).
Pot fi utilizate n cazul variabilelor afectate de valori extreme care nu pot fi eliminate.
Utilizarea lor nu presupune condiii la fel de restrictive ca testele parametrice (normalitatea
distribuiei, omogenitatea varianei, etc.).
Pentru anumite proceduri, calculele sunt relativ simple i uor de efectuat, chiar i fr
utilizarea tehnicii de calcul.
Conceptele i metodele statisticii neparametrice sunt uor de neles.
Se bazeaz pe msurri pe scale nominale i ordinale, care sunt, prin natura lor, msurri
mai puin precise dect cele pe scale cantitative (de interval sau de raport).
Au o putere mai redus dect testele parametrice de a proba c ipoteza cercetrii este
adevrat.
Tind sa fie utilizate, datorit relativei lor simpliti, i n situaii n care se pot utiliza teste
parametrice. Este important s reinem faptul c, atunci cnd sunt ntrunite condiiile pentru
aplicarea unui test parametric, nu este recomandabil transformarea variabilei i utilizarea
unui test neparametric.
Dei se bazeaz pe calcule elementare, adesea acestea pot fi destul de complexe i de
laborioase.
Principiul care st la baza evalurii mrimii efectului pentru testele parametrice (proporia
explicat a varianei) nu este uor de aplicat n cazul testelor neparametrice. Ca urmare,
28
Copyright DEPARTAMENT ID 2008
Marian Popa
Distribuia binomial
Atunci cnd msurm o caracteristic pe o scal de tip cantitativ, obinem o valoare care descrie
mrimea acelei caracteristici. Uneori, ns, nu facem dect s observm msura n care acea caracteristic
este prezent ntr-un anumit context. De exemplu, observm caracteristica de gen (masculin, feminin) a
copiilor la natere, prezenaabsena efectului unei metode psihoterapeutice sau caracterul
corectgreit al rspunsului la o serie de ntrebri. n acest toate aceste cazuri naterea unui biat (sau
unei fete), prezena efectului, rspunsul corect sunt denumite evenimente despre care putem doar s
consemnm frecvena cu care apar ntr-o anumit serie de ncercri (nateri, subieci tratai cu metoda
respectiv, list de ntrebri).
Distribuia evenimentelor de tip dihotomic, fiecare avnd o anumit probabilitate de apariie,
constant de la o ncercare la alta, se numete distribuie binomial 1 . Caracteristicile distribuiei binomiale
difer n funcie de numrul ncercrilor (N) i de probabilitatea de apariie a evenimentului (P), vzut
ca ans teoretic de apariie a evenimentului, n raport cu toate evenimentele posibile. De exemplu, la
aruncarea unei monede, o singur dat (N=1), ansa (probabilitatea) teoretic de apariie a stemei este
P=1/2=0.5. Aceeai probabilitate caracterizeaz i evenimentul rspuns corect, dac rspundem la
ntmplare la o ntrebare cu dou variante de rspuns, dintre care una este corect iar alta greit.
S transpunem aceast problem ntr-o situaie cu relevan practic. S ne imaginm c am construit
un chestionar de cunotine de statistic, compus din ntrebri cu dou variante de rspuns, una corect i una
eronat. n faa rezultatelor, este firesc s ne ntrebm dac studenii au rspuns utilizndu-i cunotinele,
sau la ntmplare, ncercndu-i norocul. Dac la un chestionar cu patru ntrebri un student d patru
rspunsuri corecte, sunt ele un indiciu suficient c rezultatul reflect cunotinele de statistic i nu norocul
de a fi ghicit de fiecare dat rspunsul corect?
Pentru a ncerca s rezolvm aceasta dilem, s zicem c ne adresm unui alt student pentru a
rspunde absolut la ntmplare. Ca s fim siguri c rspunsurile acestuia nu sunt alterate de cunotinele
sale de statistic, i cerem s aleag rspunsul fr a vedea ntrebrile, dnd de patru ori cu banul, pentru a
indica rspunsul la fiecare ntrebare. n acest caz, rspunsurile corecte decurg numai prin jocul hazardului,
adic sunt evenimente aleatoare. Acestea se definesc ca raport ntre evenimentul ateptat i numrul
evenimentelor posibile. Existnd doar dou variante de rspuns, probabilitatea teoretic de a rspunde corect
la o ntrebare este de 0.5. Probabilitatea de a rspunde corect la toate cele patru ntrebri se calculeaz ca
produs al probabilitii fiecrui element al secvenei de patru ntrebri (regula multiplicrii probabilitii
evenimentelor dihotomice):
1
Sau distribuie Bernoulli , dup numele matematicianului elveian Jakob Bernoulli (1654-1705).
29
Copyright DEPARTAMENT ID 2008
Marian Popa
CECC
CECE
CEEC
CEEE
ECCC
ECCE
ECEC
ECEE
EECC
EECE
EEEC
EEEE
Dac analizm toate cele 16 combinaii posibile, vom observa c avem urmtoarea distribuie
probabil pentru rspunsurile corecte:
Nr. rsp. corecte
0
1
2
3
4
Frecvena
1
4
6
4
1
P(C)*
1/16=0.0625 4/16=0.25 6/16=0.375 4/16=0.25 1/16=0.0625
P(C) =Probabilitatea de apariie a rspunsului corect
Transpuse grafic, probabilitile corespunztoare pentru frecvenele de rspuns corect se prezint ca
n imaginea urmtoare:
Distribuia binomial (N=4)
0,375
0,4
0,25
0,3
0,25
0,2
0,1
0,0625
0,0625
0
0
Cu alte cuvinte, n cazul alegerii ntmpltoare a unui rspuns din dou posibile, pentru patru
ntrebri, probabilitatea niciunui rspuns corect este egal cu aceea pentru patru rspunsuri corecte (0.0625).
30
Copyright DEPARTAMENT ID 2008
Marian Popa
Cea mai mare probabilitate o are situaia de a rezulta dou rspunsuri corecte (0.375), n timp ce
probabilitatea de a ghici 1 sau trei rspunsuri corecte este de 0.25. Nu putem s nu observm, de asemenea,
forma simetric a distribuiei 2 . n conformitate cu teorema Moivre-Laplace, distribuia binomial a apariiei
evenimentelor echiprobabile (P=Q=0.5) ntr-o serie de n de observaii independente, urmeaz forma
distribuiei normale. Sau, mai exact, dup standardizarea probabilitilor acestea corespund valorilor de sub
curba normal.
Dar ce s-ar ntmpla dac, n loc de 4 ntrebri, chestionarul nostru de statistic ar avea 12 ntrebri?
Distribuia binomial pentru N=12 este cea din graficul de mai jos:
0,2256
0,1934
0,2
0,15
0,1934
0,1208
0,1208
0,1
0,0537
0,05
0
0,00020,0029
0,0537
0,0161
0,0161
0,00290,0002
9 10 11 12
Se observ creterea corespunztoare a numrului variantelor posibile i, n acelai timp, devine mai
evident tendina distribuiei de a semna cu una normal. n mod firesc, aceast tendin se accentueaz pe
msur ce numrul secvenelor de predicie crete.
Dar sunt i situaii n care P i Q nu sunt egale. De exemplu, dac variantele de rspuns la fiecare
ntrebare a chestionarului de statistic sunt n numr de patru, dintre care numai una este corect, atunci
probabilitatea rspunsului corect (P) este =0.25. n acest caz distribuia binomial nu este simetric la
valori mici ale lui N, dar tinde s devin simetric pe msur ce N crete. Nu exist un rspuns exact cu
privire la valoarea lui N pentru care distribuia binomial este aproximat suficient de bine de cea normal.
n general, se accept faptul c pentru P=0.5 N nu trebuie s fie mai mare de 20-25, n timp ce pentru P
apropiat de 0 sau 1 se impune o valoare pentru N de cel puin 100.
Din cele spuse rezult c se poate lua n considerare aproximarea distribuiei binomiale cu o
distribuie normal. Aceasta nseamn c putem exprima valorile z n termeni de N, P i Q. Formula original
pentru z ne amintim c este:
z=
z=
X N *P
N * P *Q
(formula 4.1)
Aceast formul poate fi utilizat pentru a afla ct ncredere putem avea n cazul n care am obine 8
rspunsuri corecte la un chestionar cu 10 ntrebri dihotomice:
z=
8 10 * 0.5
85
3
=
=
= 1.897
10 * 0.5 * 0.5
2.5 1.581
Nivelul probabilitii de sub curba normal z, pentru valori ale lui z egale sau mai mari de 1.897 este
0.0294. Aceasta nseamn c putem respinge ipoteza de nul i s admitem c studentul nu a rspuns la
2
Distribuia binomial a fost descris de Abraham De Moivre n lucrarea Approximatio ad Summam Terminorum
Binomii in Seriem Expansi, publicat n 1733. Acelai autor a publicat i un manual pentru juctorii de noroc, n care
descrie principiile aritmetice pentru strategiile i probabilitile de ctig.
31
Copyright DEPARTAMENT ID 2008
Marian Popa
ntmplare. Vom observa ns, c putem accepta aceast concluzie numai dac, anterior calculelor, am ales o
decizie de tip unilateral, deoarece pentru o decizie bilateral ar fi fost necesar un nivel minim p=0.025.
Oricum, constatarea cea mai important n acest caz este aceea c utilizarea ntrebrilor cu rspuns dihotomic
nu este recomandabil, din cauza ansei prea mari de se obine un numr relativ ridicat de rspunsuri corecte
prin alegeri ntmpltoare.
S schimbm puin datele problemei i s punem la fiecare ntrebare nu dou, ci patru variante de
rspuns, dintre care numai una este corect. n acest caz, P=1/4=0.25 iar Q=3/4=0.75. Considernd un
chestionar format tot din 10 ntrebri, cu 8 rspunsuri corecte, i utiliznd formula 4.1, valoarea testului de
semnificaie este:
z=
8 10 * 0.25
8 2.5
5.5
=
=
= 4.01
10 * 0.25 * 0.75
1.875 1.369
n aceste condiii este evident c ipoteza de nul se respinge, iar ipoteza c rspunsurile se bazeaz mai
mult pe cunotine dect pe hazard se accept. Fr s relum calculele, putem s ne dm seama c am obine
o valoare semnificativ chiar i pentru un numr mai mic de rspunsuri corecte. Desigur, acesta este un
exemplu didactic, n practic nefiind utilizate chestionare de cunotine cu un numr att de mic de ntrebri.
32
Copyright DEPARTAMENT ID 2008
Marian Popa
z=
pP
PQ
N
(formula 4.2)
z=
0.20 0.15
0.15 * 0.85
100
0.05
0.127
100
0.05
= 1.42
0.035
Nivelul lui p pentru z=1.42 pe curba normal este de 0.0778, valoare care oblig la acceptarea
ipotezei de nul. Cu alte cuvinte, proporia stngacilor n comunitatea cercetat nu depete semnificativ
proporia la nivelul populaiei generale.
Testul z pentru proporii implic testarea semnificaiei unui procent observat n raport procentul
populaiei (atunci cnd este cunoscut), pentru evenimente de tip dihotomic. De exemplu, se poate rspunde la
ntrebarea dac un procent 55% de nou nscui biei este neobinuit de mare, tiind care este procentul
general al noilor nscui biei.
Pentru situaiile n care evenimentele cercetate nu sunt de tip dihotomic, se aplic alte teste statistice,
despre care vom vorbi mai trziu.
33
Copyright DEPARTAMENT ID 2008
Marian Popa
( p1 p 2 ) ( P1 P2 )
(p p
1
(formula 4.3)
unde:
p1 i p2 sunt proporiile evenimentului la nivelul eantioanelor
P1 i P2 sunt proporiile evenimentului la nivelul populaiei
(p1-p2) este eroarea standard a distribuiei de eantionare
Avnd n vedere ipoteza de nul (P1-P2=0), rezult c la numitor se va pstra doar diferena dintre
proporiile eantioanelor (p1-p2).
34
Copyright DEPARTAMENT ID 2008
Marian Popa
(p p ) =
1
p1 * q1 p 2 * q 2
+
n1
n2
(formula 4.4)
unde:
q1 i q2 sunt proporiile complementare ale lui p1, respectiv p2 (q1=1-p1, respectiv q2=1-p2)
n1 i n2 sunt volumele celor dou eantioane
Ca urmare, formula pentru testul diferenei dintre proporiile a dou eantioane independente devine:
z=
p1 p 2
p1 * q1 p 2 * q 2
+
n1
n2
(formula 4.5)
Aceast formul este adecvat atunci cnd eantioanele sunt suficient de mari (>30). n caz contrar,
numrtorul formulei suport o corecie, dup cum urmeaz:
1
1
p 2
p1
2 * n1
2 * n2
z=
p1 * q1 p 2 * q 2
+
n1
n2
(formula 4.6)
z=
0.15 0.25
0.15 * 0.85 0.25 * 0.75
+
100
90
0.10
0.001 + 0.002
0.10
= 1.85
0.054
Dac ne-am propus un test bilateral la un nivel alfa=0.05 (pentru care z critic pe curba normal este
egal cu 1.96), atunci va trebui s acceptm ipoteza de nul i s concluzionm c nu se confirm existena
unei diferene semnificative ntre proporia stngacilor din cele dou comuniti.
Marian Popa
z=
X N *P
N * P *Q
Dei, principial, este corect, se impune o anumit corecie a acestei formule, corecie util mai ales
pentru valori mici ale lui N. Dac privim graficele distribuiilor binomiale prezentate anterior vom observa
c, spre deosebire de curba normal z, acestea au un caracter discontinuu, cu treceri n trepte la o valoare
la alta. Din acest motiv se recomand aplicarea unei corecii de continuitate, prin scderea valorii 0.5 din
valoarea numrtorului, luat n sens absolut. Formula definitiv devine astfel:
z=
X N * P 0.5
N * P *Q
(formula 4.7)
Mai departe, nu ne rmne dect s nlocuim valorile i sa facem calculele pentru studiul nostru:
z=
6 8 * 0.75 0.5
8 * 0.75 * 0.25
0.5
= 0.40
1.22
Mai departe, cutm valoarea lui p corespunztoare pentru z=-0.40 n tabelul distribuiei normale z,
unde gsim p=0.844. Dat fiind faptul c valoarea lui p este mai mare dect 0.05, suntem nevoii s acceptm
ipoteza de nul i s conchidem c, cel puin pn n acel moment, terapia antifobic nu are un efect
semnificativ statistic pe lotul aflat n tratament. Desigur, rezultatul nu trebuie s fie considerat neaprat ca
descurajant de ctre terapeut. Faptul c lotul investigat este att de redus conduce n mod inevitabil la nevoia
unor valori foarte ridicate ale testului statistic pentru atingerea pragului de semnificaie. n cazul nostru
rezultatul poate fi considerat ncurajator dac, s zicem, evaluarea eficienei s-a fcut dup un numr relativ
mic de edine de terapie. Continuarea lor i refacerea testului ar putea conduce la o alt concluzie.
Arbuthnot, John. (1710), "An Argument for Divine Providence, Taken From the Constant Regularity Observed in the
Births of Both Sexes," Philosophical Transactions, 27, 186-190.
36
Copyright DEPARTAMENT ID 2008
Marian Popa
Testul semnului (denumit astfel pentru c ia n considerare doar sensul variaiei, nu i valoarea ei)
este utilizabil ca substitut al testului t pentru eantioane dependente n cazul datelor msurate pe scal
nominal dihotomic.
(1) ntr-un experiment de psihologie social, participanilor (N=35) li s-a cerut s citeasc
un pasaj care conine o dilem a crei soluie este apoi descris. Subiecilor li s-a cerut apoi s
indice nivelul de susinere pe care l manifest fa de soluia propus, pe o scal de la 1 (foarte
puternic mpotriv), la 7 (foarte mult n favoarea soluiei). n continuare, au loc discuii pe tema
soluiei, dup care subiecilor li se cere s i exprime din nou gradul de susinere. Rezultatele
indic faptul c, n urma discuiilor, un numr de 30 de subieci i-au modificat gradul de susinere
iniial a soluiei. Problema cercetrii este dac discuia n grup are un efect asupra opiniei
participanilor.
(2) ase studeni de la facultatea de arte plastice au fost pui s picteze dou tablouri, pe o
tem imaginar. ntr-un caz au lucrat n condiii de linite, n cel de-al doilea caz au avut un fond
sonor de muzic clasic. Lucrrile lor au fost evaluate de un profesor, care a apreciat c 5 dintre
studeni au pictat mai creativ n condiii de muzic dect n condiii de linite. Se poate concluziona
c muzica clasic favorizeaz creativitatea artistic, pentru alfa=0.05, bilateral? (utilizai Tabelul
3.1 din Anexe)
Verific rspunsul corect
Distribuia multinomial
S presupunem c populaia absolvenilor de liceu se mparte n patru categorii: teoreticumanist, teoretic-real, artistic. Probabilitile aferente fiecrui tip de liceu sunt, respectiv, P,
Q i R. ntr-o asemenea situaie P+Q+R=1. De asemenea, putem scrie probabilitile pentru fiecare
eveniment dup modelul: Q=1-P-R. S lum n considerare situaia n care toate liceele au acelai
numr de absolveni, deci P=Q=R=1/3=0.33. Alegerea unor ponderi diferite, aa cum este i cazul
n realitate, nu ar schimba datele raionamentului care urmeaz dar l-ar face mai puin evident. Mai
departe, s ne imaginm c analizm tipul de liceu absolvit de studenii unei faculti de psihologie
i constatm c din 100 de studeni 60 sunt absolveni de liceu teoretic-umanist, 30 au absolvit un
liceu cu profil artistic i 10, unul cu profil teoretic-real. Ponderea studenilor la facultatea
respectiv este, evident, diferit de ponderea din cadrul populaiei de absolveni. Se poate afirma c
absolvenii de profil umanist i artistic prefer psihologia mai mult dect care au absolvit un
profil real? Sau, ntr-o formulare mai larg, se poate afirma c exist o relaie ntre tipul de liceu
absolvit i preferina pentru psihologie ca specialitate universitar?
Datele din exemplul de mai sus nu mai pot fi analizate prin prisma distribuiei binomiale
deoarece implic mai mult dect dou evenimente posibile. De aceea, distribuia acestora se
numete distribuie multinomial. Desigur, procedura de calcul pentru acest caz ar putea urma
modelul celei binomiale dar, din cauza complexitii ei, s-a apelat la o soluie mai simpl. Aceast
37
Copyright DEPARTAMENT ID 2008
Marian Popa
( X N * P )2
N * P * Q (formula 4.8)
Dac, nainte de ridicarea la ptrat, z urmeaz o distribuie normal, dup ridicarea la ptrat
z urmeaz un alt tip de distribuie, numit chi-ptrat i simbolizat cu litera greceasc cu
indicele de ridicare la ptrat ( 2). Fr a intra n amnunte, vom preciza c distribuia 2 prezint
urmtoarele caracteristici:
este, la fel ca distribuia normal, o familie de distribuii;
are form asimetric;
are originea n zero (din cauza ridicrii la ptrat);
are o form dependent de numrul de grade de libertate.
Imaginea de mai jos prezint dou distribuii chi-ptrat, pentru 4, respectiv, 10 grade de
libertate.
nainte de a merge mai departe, s analizm puin, datele sugerate de exemplul de mai sus.
Aa cum am spus, ponderea studenilor la facultatea de psihologie este, n funcie de tipul de liceu
absolvit, de, respectiv, 60, 30, 10. Aceste valori se numesc frecvene observate sau frecvene
calculate (notate cu fo de la Observed), fiind cele consemnate n cadrul studiului. La rndul lor,
frecvenele corespunztoare distribuiei de nul, cele care se refer, n acest caz, la ponderea
absolvenilor de liceu n general, se numesc frecvene ateptate (notate cu fe de la Expected).
Raportul dintre aceste dou categorii de frecvene se afl la baza testului de semnificaie statistic
numit chi-ptrat, despre care vorbim mai departe.
Testul chi-ptrat
38
Copyright DEPARTAMENT ID 2008
Marian Popa
nainte de a trece la testul propriu-zis, este util s aruncm o privirea asupra modului de organizare a
datelor pentru o situaie similar exemplului de mai sus. n acest scop, putem s ne permitem o lrgire a
cadrului de investigare. S presupunem c avem cele trei categorii de liceu i ne intereseaz distribuirea lor,
nu n legtur cu o singur facultate (cea de psihologie), ci n legtur cu trei tipuri de faculti: umaniste,
artistice i tehnice.
Dac realizm un cadru de reprezentare sintetic al valorilor celor dou variabile, obinem ceea ce se
numete un tabel de coresponden. Iat cum ar arta un astfel de tabel, pentru un set de date ipotetice:
Fac. Umaniste
Fac. Tehnice
Fac. Artistice
Total pe coloane
Liceu
umanist
45
14
20
79
Liceu
real
20
60
13
93
Liceu
artistic
30
12
50
92
Total pe
linii
95
86
83
264
Acesta este un tabel de coresponden pentru dou variabile nominale, fiecare avnd cte trei valori
distincte (categorii) 4 . Valorile din celule reprezint numrul de cazuri (frecvenele observate) care corespund
fiecrei combinaii dintre categoriile celor dou variabile. Totalul pe linii exprim numrul de studeni din
fiecare facultate, consemnai n cercetare, indiferent de tipul de liceu absolvit, totalul pe coloane, exprim
numrul de absolveni din fiecare tip de liceu, indiferent de facultatea la care sunt nscrii, iar la intersecia
celor dou totaluri regsim totalul general al subiecilor cercetrii (N=264).
Fac. Umaniste
Fac. Tehnice
Fac. Artistice
Total pe coloan
Liceu
umanist
45
(28.4)
14
(25.6)
20
(24.8)
79
Liceu
real
20
(33.4)
60
(30.2)
13
(29.2)
93
Liceu
artistic
30
(33.1)
12
(29.9)
50
(28.9)
92
Total pe
linie
% pe linii
95
(95/264)*100=36%
86
(86/264)*100=32,5%
83
(83/264)*100=31.5%
264
n mod similar, se pot crea tabele de coresponden pentru variabile categoriale avnd, fiecare, un numr diferit de
valori (categorii).
39
Copyright DEPARTAMENT ID 2008
Marian Popa
Aa cum constatm, ntre frecvenele observate i cele ateptate sunt diferene. Suma frecvenelor
ateptate (teoretice) este egal cu suma frecvenelor observate (poate rezulta o anumit diferen ntre
totaluri, ca urmare a aproximrii zecimalelor).
n final, problema cercettorului este aceea de a stabili dac ntre frecvenele observate i cele
teoretice (calculate) este o diferen care s justifice aprecierea c ntre cele dou variabile exist sau nu o
legtur. Datele de acest gen nu mai pot fi analizate prin prisma distribuiei binomiale, deoarece implic mai
mult dect dou evenimente posibile. De aceea, distribuia acestora se numete distribuie multinomial.
Desigur procedura de calcul pentru acest caz ar putea urma modelul celei binomiale dar, din cauza
complexitii ei, s-a apelat la o soluie mai simpl. Aceast soluie este fundamentat pe o aproximare
derivat din formula binomial a lui z, care este pur si simplu ridicat la ptrat, devenind:
2
(
X N * P)
=
N * P *Q
(formula 4.8)
Dac nainte de ridicarea la ptrat z urmeaz o distribuie normal, dup ridicarea la ptrat z urmeaz
un alt tip de distribuie, numit chi-ptrat, simbolizat cu litera greceasc cu indicele de ridicare la ptrat
(2). Fr a intra n amnunte, vom preciza c distribuia 2 prezint urmtoarele caracteristici:
este, la fel ca i distribuia normal, o familie de distribuii;
are form asimetric;
are originea n zero (din cauza ridicrii la ptrat);
are o form dependent de numrul de grade de libertate.
La fel ca i distribuiile t i F, distribuia 2 este dependent de numrul gradelor de libertate.
Acestea se calculeaz pe baza tabelului de coresponden dintre cele dou variabile, astfel:
df=(numr coloane-1)*(numr linii-1)
Formula de calcul pentru testul chi-ptrat, derivat din formula 4.8, este :
( fO f E )2
=
fE
(formula 4.9)
2
40
Copyright DEPARTAMENT ID 2008
Marian Popa
S presupunem c a fost aplicat un test de cunotine unui eantion de 200 de elevi, care a fost
evaluat cu calificative, astfel: F.Slab, Slab, Mediu, Bun, F.Bun.
Problema cercetrii: Calificativele obinute se distribuie normal la nivelul clasei?
Populaia 1: Calificativele obinute de elevi.
Populaia 2: Calificativele, aa cum s-ar distribui pe o curb normal: FS=2.5%, B=14%, M=67%,
B=14% i FB=2.5% (procentele sunt cele tipice unei curbe z, mprite n cinci clase valorice).
Ipoteza cercetrii (H1): Distribuia calificativelor urmeaz legea curbei normale la nivelul
eantionului de elevi.
Ipoteza de nul (H0): Distribuia calificativelor nu urmeaz legea curbei normale n rndul
elevilor examinai.
Determinarea caracteristicilor deciziei statistice:
alegem =0.05 (n cazul testului 2 decizia nu poate fi dect unilateral, deoarece acest test nu
poate lua valori negative)
gsim valoarea critic pentru 2=9.48 n tabela pentru distribuia 2, pentru df=(2-1)*(5-1)=4 i
=0.05
Tabelul urmtor conine datele de cercetare i algoritmul de calcul:
Calificativ
Frecvena
observat
(fO)
FB
10
34
140
10
FS
2.5% of 200 =5
200
Frecvena ateptat
(fE)
( fO f E )2
fE
(10 5) 2
= 5.00
5
(34 28) 2
= 1.29
28
(140 134) 2
= 0.27
134
(10 28) 2
= 11.57
28
(6 5) 2
= 0.20
5
( f f E )2
2 = O
= 18.33
fE
Decizia statistic:
2 calculat (18,33) este mai mare dect 2 critic (9,48)
Respingem ipoteza de nul i tragem concluzia c distribuia calificativelor urmeaz forma curbei
normale.
Concluzia statistic poate fi interpretat, n acest caz, ca fiind negativ din punctul de vedere al
eficienei procesului didactic. n mod normal, dac activitatea de nvare ar fi eficient, rezultatele elevilor
ar trebui s se distribuie asimetric negativ, adic cu tendin de grupare a valorilor spre calificativele
superioare. Rezultatele procesului de nvare nu se distribuie normal, nefiind un proces natural, ci unul
n care valorile (calificativele) sunt supuse unei influene sistematice (prin efortul profesorilor i al elevilor
nii) nspre valorile mari.
Facem, nc o dat, precizarea c aceast form a testului chi-ptrat se aplic atunci cnd vrem s
comparm frecvene observate cu frecvene teoretice (ateptate), pe care le cunoatem deja. El este
echivalentul testului z pentru proporii pentru distribuia binomial, cu specificaia c se utilizeaz atunci
cnd avem mai mult de dou categorii. Testul chi-ptrat pentru gradul de coresponden (goodness of fit) nu
are un indice de mrime a efectului.
41
Copyright DEPARTAMENT ID 2008
Marian Popa
Iat cteva exemple posibile de cercetri ale cror date pot fi analizate cu testul chi-ptrat al gradului
de coresponden:
Vrem s tim dac exist o preferin pentru o anumit categorie de muzic (clasic,
popular, pop-rock). n acest caz, dac distribuia preferinelor nu ar fi influenat de nici o anumit
preferin (ipoteza de nul) atunci frecvena ateptat (teoretic) pentru fiecare gen muzical ar trebui s fie
echivalent cu 100/3=33.3% numrul subiecilor. Mai departe, nu ne rmne dect s testm diferena dintre
cele dou categorii de frecvene (teoretice i observate), conform modelului de calcul de mai sus.
ntr-un studiu asupra relaiei dintre atractivitate i preferina pentru profesori, unui numr de
studeni li se prezint fotografiile preselectate ale unor ase poteniali profesori, ale cror portrete sugereaz
grade diferite de atractivitate, i li se cere s aleag dintre acetia pe cel pe care ar dori s l aib ca profesor.
Dac gradul de atractivitate nu are nici un impact asupra preferinei ca profesor, atunci frecvenele cu care
sunt alese fotografiile ar trebui s fie egale (100/6=16.6%).
ntr-un studiu de marketing, o companie trebuie s aleag dintre patru propuneri imagini.
Acestea sunt prezentate unui eantion de subieci i se consemneaz numrul de preferine exprimate pentru
fiecare imagine. Dac toate ar avea acelai impact, atunci numrul de preferine ar trebui s fie egal (25%,
pentru fiecare imagine).
Vrem s tim dac exist o preferin pentru un anumit gen muzical (clasic, popular,
dance, rock) printre cei 200 de studeni ai facultii de psihologie. n acest caz, dac distribuia
preferinelor nu ar fi afectat de nici o preferin (ipoteza de nul), atunci frecvena ateptat
(teoretic) pentru fiecare din cele patru genuri muzicale este 25% numrul subiecilor (100%
mprit la cele patru genuri muzicale), adic exact 50 pentru fiecare gen muzical. n realitate,
preferinele exprimate de studeni se distribuie astfel: muzic clasic=30; muzic popular=15;
muzic dance=100; muzic rock=55. Problema cercetrii este dac exist o distribuie preferinial
pentru genurile muzicale, n rndul studenilor de la psihologie (pentru alfa=0.5). 5
Verific rspunsul corect la pagina 22
Chi-ptrat - testul asocierii (independence chi-square) 6
Aceast variant a testului chi-ptrat este mai frecvent utilizat. Ea compar frecvenele observate
ale unei distribuii (variabile) cu frecvenele corespondente ale altei distribuii (variabile), ambele msurat pe
scale de tip categorial, cu scopul de a vedea dac exist o relaie ntre cele dou variabile. S presupunem c
avem rezultatele la testul de statistic (msurate pe o scal ordinal i notate, convenional, cu A, B, C, D, E,
unde A reprezint nivelul de performan cel mai ridicat iar E, cel mai sczut).
Problema cercetrii: Dorim s aflm dac exist o diferen semnificativ ntre biei (M) i fete (F)
la testul de statistic.
Ipoteza cercetrii: Distribuia performanei depinde de genul masculin sau feminin.
Ipoteza de nul: Rezultatele la testul de statistic nu au legtur cu variabila sex.
Determinarea criteriilor de decizie statistic:
alegem =0.05
df=(2-1)*(5-1)=4
citim valoarea critic pentru 2 n tabela pentru distribuia 2:
5
6
42
Copyright DEPARTAMENT ID 2008
Marian Popa
2
critic=
Frecvenele marginale sunt: 200 (57.14%) pentru biei i 150 (42.86%) pentru fete
Dac performana la test nu are nici o legtur cu genul subiecilor, trebuie s regsim aceste
procente pentru fiecare dintre calificativele acordate.
Aceasta nseamn c, teoretic, n celula A/Masculin, ar trebui s gsim, proporional, tot atia biei
ci sunt pe ntregul lot (57.14%). Adic (20*57.14)/100=11.42, care reprezint frecvena ateptat
pentru celula respectiv din tabelul de coresponden.
La fel, pentru celula A/Feminin ar trebui s avem 42.86% din totalul pentru feminin, adic:
(20*42.86)/100=8.52.
n acelai mod de calculeaz frecvenele observate pentru fiecare celul a tabelului.
Pentru o mai uoar nelegere a mecanismului de calcul, vom rearanja tabelul astfel:
Celule
Frecvena
observat
(fO)
Frecvena ateptat
Masculin A
10
(20*57.14)/100=11.43
Masculin B
34
(66*57.14)/100=37.71
Masculin C
140
(237*57.14)/100=135.42
Masculin D
10
(16*57.14)/100=9.14
Masculin F
(11*57.14)/100=6.29
Feminin A
10
(20*42.86)/100=8.57
Feminin B
32
(66*42.86)/100=28.29
Feminin C
97
(237*42.86)/100=101.58
Feminin D
(16*42.86)/100=6.86
Feminin F
(11*42.86)/100=4.71
( fO f E )2
fE
(10 11.43) 2
= 0.18
11.43
(34 37.71) 2
= 0.36
37.71
(140 135.42) 2
= 0.15
135.42
(10 9.14) 2
= 0.08
9.14
(6 6.29) 2
= 0.01
6.29
(10 8.57) 2
= 0.24
8.57
(32 28.29) 2
= 0.49
28.29
(97 101.58) 2
= 0.21
101.58
(6 6.86) 2
= 0.11
6.86
(5 4.71) 2
= 0.02
4.71
2 =
350
( fO f E )2
= 1.85
fE
43
Copyright DEPARTAMENT ID 2008
Marian Popa
Cele dou variabile nu trebuie s se intersecteze (s nu existe subieci care s fie inclui n mai
mult de o celul de tabel)
Selecie aleatoare a eantioanelor
Este recomandabil ca frecvena ateptat s nu ia valori mai mici de 5 (sau, cel puin, n nu mai mult
de 20% din celule).
Nici o celul nu trebuie s aib frecvena ateptat mai mic de 1.
Pentru situaiile n care frecvenele ateptate sunt mai mici dect specificaiile de mai sus, sau atunci
cnd tabelul de coresponden dintre variabile are dou linii i dou coloane, se recomand aplicarea unei
corecii la formula de baz. Aceasta se numete corecia Yeates i const n scderea unei constante (0.5)
din expresia de la numrtor, luat n valoare absolut:
=
2
(f
f E 0.5)
fE
(formula 4.10)
44
Copyright DEPARTAMENT ID 2008
Marian Popa
2
N
(formula 4.11)
Coeficientul Cramer
Coeficientul este adecvat doar pentru tabelele de contingen de tip 2x2, cnd ambele variabile
sunt dihotomice. O uoar modificare a acestuia, denumit Cramer, l face utilizabil pentru intensitatea
asocierii dintre variabile avnd un numr diferit de categorii.
Indicele Cramer se calculeaz dup formula:
c =
2
N ( L 1)
unde:
N este volumul eantionului
L este valoarea cea mai mic dintre numrul liniilor sau al coloanelor tabelului de
coresponden (de exemplu, pentru un tabel de coresponden 4x3 - patru linii i patru
coloane - L are valoarea 3-1=2).
n cazul coeficienilor , dac frecvenele fiecrei celule din tabelul de coresponden sunt
multiplicate cu o constant, att 2 ct i N cresc concomitent, iar valoarea coeficientului rmne aceeai.
Coeficientul se modific numai dac se modific i raporturile dintre proporii, ceea ce nseamn c
mrimea lui nu este influenat de N. El reprezint un indicator numeric al intensitii relaiei i poate lua
valori ntre zero - absena relaiei i unu - relaie perfect ntre cele dou variabile. De exemplu, pentru testul
chi-ptrat al asocierii dintre gen i performana la testul de statistic (care a rezultat nesemnificativ), al crui
tabel de coresponden este de forma 2x5, valoarea coeficientului c este:
c =
2
N (2 1)
1.85
= 0.07
350
Interpretarea coeficienilor
Valoarea coeficientului se asociaz interpretrii testului chi-ptrat, atunci cnd acesta este
semnificativ, pentru a aduga o informaie suplimentar cu privire la intensitatea relaiei. Prin ridicarea la
ptrat a expresiei de calcul, coeficientul 2 poate fi interpretat procentual, la fel ca i coeficientul de
determinare (r2), indicnd proporia variaiei unei variabile determinat de variaia celeilalte variabile. n
cazul nostru, numai 0.4% (0.072*100) din variaia calificativelor la testul de statistic este explicat prin
diferena de gen (masculin/feminin), ceea ce, n conformitate cu decizia statistic, s-a dovedit a fi
nesemnificativ.
n conformitate cu recomandrile lui Cohen, cit. de Kotrlik i Williams (2003), valorile lui vor fi
interpretate dup cum urmeaz:
(Cohen)
0.10
0.25
0.40
efect mic
efect mediu
efect mare
Raportarea rezultatului
n cazul testului 2 elementele care vor fi incluse n raport sunt urmtoarele: gradele de libertate,
valoare testului, nivelul p i coeficientul sau Cramer . n varianta narativ, pentru exemplul de mai sus,
prezentarea rezultatelor ar putea avea urmtoarea form:
Rezultatele testului de statistic, evaluate pe cinci clase valorice (A,B,C,D,E) au fost comparate pe
sexe. Testul 2 pentru asocierea variabilelor indic faptul c rezultatele nu difer semnificativ n funcie de
gen, 2(4) = 1.85, p >0 .05, cu un coeficient =0.07, care indic o asociere slab.
45
Copyright DEPARTAMENT ID 2008
Marian Popa
n cazul n care testul ar fi fost semnificativ, raportarea rezultatelor ar fi trebuit s conin i referine
cu privire la procentele consemnate n celulele tabelului de coresponden, astfel nct s fie scoase n
eviden diferenele releavnte dintre categoriile comparate.
80 de pacieni depresivi au fost mprii aleatori n patru grupuri egale, fiecare dintre acestea
urmnd un tip diferit de psihoterapie (psihodinamic, rogerian, de grup i comportamental). Dup ase
luni de terapie, fiecare pacient a fost clasificat ntr-una din urmtoarele trei categorii: ameliorat, agravat,
neschimbat. Datele sunt cele din tabelul urmtor:
Frecvene observate
ameliorat
neschimbat
nrutit
suma pe coloane
psihodinamic
6
6
8
20
model psihoterapeutic
rogerian
de grup
4
8
14
3
2
9
20
20
comportamental
12
5
3
20
suma pe linie
30
28
22
N=80
Aa cum am precizat, testul chi-ptrat este calculat pe baza unei formule ale crei rezultate nu urmeaz cu
maxim precizie distribuia 2. Dac n cele mai multe situaii acest lucru nu reprezint un neajuns notabil,
sunt si cazuri n care rezultatele pot fi alterate suficient de mult pentru a putea fi luate n considerare:
atunci cnd volumul eantionului este redus (N<20);
atunci cnd valorile fe pentru una sau mai multe dintre celulele tabelei de coresponden
sunt foarte mici.
n aceste situaii, precum i atunci cnd tabelul de coresponden este compus din dou linii i dou
coloane, este recomandabil utilizarea testului exact Fisher. El se bazeaz pe calcularea tuturor tabelelor
posibile ce pot fi construite pentru frecvenele marginale. Deoarece necesit un mare volum de calcule, testul
exact Fisher se efectueaz numai cu ajutorul programelor computerizate.
46
Copyright DEPARTAMENT ID 2008
Marian Popa
Distribuia binomial deriv din serii de evenimente independente dihotomice. Cele dou
posibiliti ale fiecrui eveniment au probabilitile P i Q, a cror sum este 1 (de unde
Q=1-P).
Atunci cnd P=Q=0.5, distribuia binomial este simetric. Pe msur ce numrul
evenimentelor (N) crete, distribuia binomial se apropie de forma normal. Chiar i atunci
cnd PQ distribuia binomial se apropie de forma normal odat cu creterea lui N.
Atunci cnd N crete la infinit, distribuia binomial devine normal, avnd media=N*P i
abaterea standard= N P Q . Ca urmare, probabilitatea ca un anume eveniment s cad n
categoria P poate fi aproximat prin calcularea unui scor z i evaluarea ariei corespunztoare
de sub curba normal.
Dac P=0.5, distribuia normal devine o aproximare bun pentru distribuia normal
ncepnd cu N=25.
Testul semnului poate fi utilizat n locul testului t pentru eantioane dependente atunci cnd
nivelul diferenei dintre cele dou determinri nu poate fi evaluat, ci numai direcia
diferenei. Dat fiind faptul c fiecare diferen poate fi ntr-una din categorii (+ sau -)
distribuia binomial poate fi utilizat pentru a estima n ce msur dezechilibrul ntre cele
dou categorii este posibil s apar din ntmplare (prin raportare la distribuia normal).
Atunci cnd N nu este foarte mare, utilizarea distribuiei normale pentru aproximarea
distribuiei binomiale introduce o eroare sistematic care poate fi compensat prin corecia
de continuitate, extrgnd 0.5 din valoare absolut a diferenei de la numrtorul scorului z.
Dac evenimentele probabilistice pot avea mai mult dect dou posibiliti (de ex., adevratfals), probabilitatea cu care fiecare eveniment cade ntr-una din categoriile posibile se
supune distribuiei multinomiale.
Din cauza complexitii procesului de evaluare a probabilitilor multinomiale, este utilizat
o estimare a acestora prin distribuia chi-ptrat. Numrul gradelor de libertate pentru
distribuia multinomial este dat de numrul categoriilor minus 1.
Testul chi-ptrat are dou variante: (1) Testul chi-ptrat al asocierii testeaz diferena dintre
valorile a dou variabile categoriale (nominale sau ordinale). (2) Testul chi ptrat al
corespondenei (goodness-of-fit) msoar diferena (potrivirea) dintre valorile unei
variable categoriale i probabilitile teoretice dinainte cunoscute ale acestor valori.
Diferenele mari dintre frecvenele observate i cele ateptate produc valori ridicate ale
testului chi-ptrat, care cad n zona dreapt (pozitiv) a distribuiei de nul i conduc la
respingere a ipotezei de nul. Diferenele mici, produc valori ale testulu chi-ptrat apropiate
de zero, conducnd la acceptarea ipotezei de nul.
Atunci cnd fiecare dintre cele dou variabile au doar dou categorii, situaie n care
frecvenele ateptate sunt prea mici pentru a justifica o estimare chi-ptrat, se utilizeaz
testul exact Fischer.
47
Copyright DEPARTAMENT ID 2008
Marian Popa
(1) Se accept ipoteza de nul (pentru alfa=0.05, bilateral). Studentul a rspuns la ntmplare.
58 50
z=
= 1.6 (mai mic dect 1.96, ct este z critic pentru alfa=0.05 bilateral)
100 * 0.5 * 0.5
(2) (a) z =
0.22 0.15
0.07
= 2.33
0.03
0.85 * 0.15
120
(b) da, deoarece z calculat este mai mare dect z critic pentru alfa 0.05, bilateral (1.96)
0,25
0.60
2 * 30
2 * 30
=
z=
0.25 * 0.75 0.60 * 0.40
+
30
30
0.24 0.59
0.006 + 0.008
0.35
= 3.18
0.11
(1) z =
30 35 * 0.5 0.5
35 * 0.5 * 0.5
12
= 4.06
2.95
z calculat (4.06) este mai mare dect z critic pentru alfa=0.05 bilateral (1.96). Ca urmare, se respinge ipoteza
de nul i se accept ipoteza cercetrii. Discuiile n grup au efect asupra opiniei individuale.
Gen
muzical
Frecvena
observat
(fO)
clasic
30
popular
15
Frecvena ateptat
(fE)
( fO f E )2
fE
(30 50)2
=8
50
(15 50)2 = 24.5
50
48
Copyright DEPARTAMENT ID 2008
Marian Popa
2 =
dance
100
rock
55
200
( f O f E )2
fE
(100 50)2
= 50
50
(55 50)2 = 0.5
50
83
= 83
6
4
8
12
6
14
3
5
8
2
9
3
fE
(30/80)*20=7.5
(30/80)*20=7.5
(30/80)*20=7.5
(30/80)*20=7.5
(28/80)*20=7
(28/80)*20=7
(28/80)*20=7
(28/80)*20=7
(22/80)*20=5.5
(22/80)*20=5.5
(22/80)*20=5.5
(22/80)*20=5.5
( fO f E )2
fE
(6-7.5)2/7.5=0.3
(4-7.5)2/7.5=1.63
(8-7.5)2/7.5=0.03
(12-7.5)2/7.5=2.7
(6-7)2/7=0.14
(14-7)2/7=7
(3-7)2/7=2.28
(5-7)2/7=0.57
(8-5.5)2/5.5)=1.13
(2-5.5)2/5.5)=2.22
(9-5.5)2/5.5)=2.22
(3-5.5)2/5.5)=1.13
=21.4
Valoarea calculat (X2=21.4) este mai mare dect valoarea X2 critic (9.49). Ca urmare,
ipoteza de nul se respinge.
Concluzia cercetrii: Exist o diferen ntre cele patru categorii psihoterapeutice n ceea
ce privete eficiena asupra depresiei. 8
49
Copyright DEPARTAMENT ID 2008
Marian Popa
Lucrarea de evaluare va vi publicat pe portal. Termenul de trimitere este preziua tutorialului. Dup
aceast dat lucrrile trimise nu vor mai fi acceptate.
50
Copyright DEPARTAMENT ID 2008
Marian Popa
Introducere
S lum n considerare urmtoarea problem: Un psiholog care lucreaz ntr-o mare banc
dorete s vad dac exist o diferen ntre premiile bneti anuale primite de femeile i brbaii
angajai ai bncii. n tabelele de mai jos se afl nivelurile primelor i rangurile acestora n raport cu
ntreaga distribuie a primelor, indiferent de sex.
51
Copyright DEPARTAMENT ID 2008
Marian Popa
Masculin
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
nA=17
Premiu
(mil. lei)
9
34
35
43
56
61
62
64
67
67
70
75
80
87
88
110
200
Rang
Prim
26
22
21
18.5
14
12
11
10
9
9
7
6
5
4
3
2
1
RA=180.5
Feminin
2
2
2
2
2
2
2
2
2
2
nB=10
Premiu
(mil. lei)
3
17
26
32
36
43
44
47
51
59
Rang
prim
27
25
24
23
20
18.5
17
16
15
13
RB=198.5
Problema este una tipic pentru a fi rezolvat cu testul t al diferenei dintre mediile a dou
eantioane independente. Avem o variabil independent de tip nominal-dihotomic i una
dependent, de tip interval/raport. Din pcate, analiza preliminar a variabilei dependente (prim)
relev abateri mari de la condiiile de normalitate (un indice de boltire de peste 7) precum i o slab
reprezentativitate a mediei, ambele datorate, mai ales, prezenei unei valori extreme (o prim de 200
mil. lei). Dup ce verificm corectitudinea valorii respective, ajungem la concluzia c ea nu poate fi
eliminat i, ca urmare, nu este recomandabil utilizarea unui test parametric.
ntr-o situaie de acest gen este aplicabil testul Mann-Whitney U 9 pentru date ordinale. Pe
ultima coloan a fiecrui tabel gsim transformarea n ranguri a valorilor variabilei dependente.
Atribuirea rangurilor n mod descresctor sau cresctor este nerelevant. Dac toate valorile sunt
distincte, fiecare valoare primete un rang distinct. Atunci cnd exist valori identice, valorile
respective primesc un rang egal cu media aritmetic a rangurilor cuvenite. Se poate alege i soluia
atribuirii tuturor valorilor identice primul rang cuvenit (ranguri ex aequo).
Procedura de calcul:
Se calculeaz cele dou valori U, corespunztoare grupurilor A (masculin) i B (feminin),
astfel:
U A = n A * nB +
n A * (n A + 1)
R A
2
(formula 5.1)
n B * (n B + 1)
RB
2
(formula 5.2)
respectiv,
U B = n A * nB +
52
Copyright DEPARTAMENT ID 2008
Marian Popa
Unde:
nA i nB reprezint volumul celor dou grupuri independente care compun eantionul
RA i RB reprezint suma rangurilor pentru fiecare din cele dou grupuri
Pentru exemplu nostru:
U A = 17 * 10 +
17 * 18
180.5 = 170 + 153 180.5 = 142.5
2
U B = 17 * 10 +
10 * 11
198.5 = 170 + 55 198.5 = 26.5
2
respectiv,
(26.5).
Valoarea testului Mann-Whitney este dat de valoarea U cea mai mic, n cazul nostru UB
Decizia statistic se ia prin compararea valorii U celei mai mici cu valoarea citit n tabelul
valorilor critice pentru testul Mann-Whitney U, n funcie de nivelul alfa, nA i nB (Anexa 7).
n cazul testului U decizia statistic se ia astfel:
Se respinge ipoteza de nul dac valoarea U calculat este mai mic sau egal cu
valoarea critic tabelar.
Se accept ipoteza de nul dac valoarea U calculat este mai mare dect valoarea
critic tabelar.
n general tabelele de decizie pentru testul Mann-Whitney nu acoper dect parial situaiile
posibile i nu trec de valori ale lui nA i nB mai mari de 20. Pentru exemplul nostru, valoarea critic
corespunztoare pentru U0.05;17:10=48 (dac preferm aproximarea, mai conservatoare, nA=18).
Deoarece UB<U0.05;17:10 ipoteza de nul se respinge i se accept ipoteza cercetrii. Nivelul
primelor anuale este semnificativ diferit pentru brbai fa de femei 10 .
Afirmam mai sus c tabelele statistice pentru testul Mann-Whitney U nu se refer la grupuri
mai mari de 20. Aceasta deoarece, de la acest volum n sus, distribuia valorilor testului poate fi
aproximat de curba normal z, iar testul poate fi calculat cu formula urmtoare:
z=
R A 0.5 * n A * ( N + 1)
n A * n B * ( N + 1) / 12
(formula 5.3)
(unde N=nA+nB)
Valoarea lui z astfel obinut este comparat cu valorile critice tabelare de pe curba normal
corespunztoare nivelului alfa ales, unilateral sau bilateral.
Publicarea rezultatului
La publicarea rezultatului pentru testul Mann-Whitney U se vor indica:
- volumul grupurilor comparate (nA i nB)
- valoarea testului (U)
- pragul de semnificaie (p).
10
Desigur, nu se poate invoca neaprat o discriminare de sex n acordarea primelor, dac poziiile profesionale ocupate
de subiecii cercetrii sunt diferite. Rezultatul poate sugera, ns, c brbaii ocup poziii profesionale mai nalte dect
femeile.
53
Copyright DEPARTAMENT ID 2008
Marian Popa
Dou grupuri de cte 5 subieci au fost supuse unui experiment care vizeaz reacia
fiziologic la prezentarea unui stimul ocant. Unul din grupuri a primit un instructaj care sugera
natura ocant a stimulului n timp ce celuilalt grup i s-a spus c vor primi stimuli agreabili. Datele
de mai jos prezint valoarea pulsului msurat n primele 10 secunde de la prezentarea stimulului:
Grupul cu instructaj linititor:
105
130
145
125
115
Grupul cu instructaj pregtitor corect
120
80
90
110
95
Verificai rspunsurile corecte
54
Copyright DEPARTAMENT ID 2008
Marian Popa
Tabelul prezint datele cercetrii. Variabila grup este una de tip nominal, fiecare din cele
trei grupuri fiind codificat cu o valoare convenional (1=pilot, 2=controlor de trafic, 3=navigator
de bord). Variabila rang conine poziia a fiecrui subiect sub aspectul reprezentrii spaiale, n
raport cu toate valorile nregistrate.
Formula de calcul pentru testul Kruskal-Wallis (notat cu H) este urmtoarea:
2
k
T
12
H=
* i 3 * ( N + 1)
N * ( N + 1) i =1 ni
(formula 5.4)
unde:
H este valoarea calculat a testului K-W
N este volumul total al eantionului
n este volumul grupurilor (N=n1+n2+n3+...+nk)
K este numrul grupurilor independente
T este suma rangurilor care va fi calculat pentru fiecare grup
nlocuind valorile corespunztoare exemplului, obinem:
412 23 2 27 2
12
3 *14 = 0.06593 * 638,74 42 = 0,1121
*
H=
+
+
13 *14 6
3
4
Valorile distribuiei de nul ale lui H urmeaz forma distribuiei chi-ptrat care, ne amintim,
are originea n valoarea 0. Cu ct sumele rangurilor pentru cele k grupuri sunt mai diferite ntre ele,
cu att valoarea testului este mai mare i, potenial, mai aproape de o variaie semnificativ.
Diferenele mici dintre rangurile grupurilor conduc spre valori ale testului care tind spre 0 i,
implicit, nesemnificative. Valoarea critic a testului se citete din tabelul distribuiei chi-ptrat
pentru df=k-1. Exist, totui, o excepie, atunci cnd nici unul din grupurile comparate nu este mai
mare de 6, situaie n care decizia se ia cu ajutorul unei tabele speciale. n cazul nostru exist un
grup cu mai mult de cinci subieci. Ca urmare, scorul critic pentru alfa=0.05 i 2 grade de libertate
este 5.99. Deoarece H calculat este mai mic dect H critic, suntem nevoii s acceptm ipoteza de
nul i s concluzionm c cele trei categorii de subieci nu sunt diferite sub aspectul capacitii de
reprezentare spaial.
55
Copyright DEPARTAMENT ID 2008
Marian Popa
Un psiholog trebuie s recomande unui patiser culoarea glazurii pentru un nou tip de prjitur, avnd
de ales ntre verde, rou i galben. n acest scop alege 18 subieci, crora le cere s efectueze o sarcin
plictisitoare avnd la ndemn platouri cu prjituri glazurate. Subiecii sunt mprii n trei grupe, fiecare
primind prjituri de o singur culoare. Dup un timp, numr cte prjituri a mncat fiecare subiect din cele
trei grupuri i construiete tabelul urmtor.
Verde
3
7
1
0
9
2
Rou
3
4
5
6
4
6
Galben
2
0
4
6
4
1
Dac avem subieci evaluai de dou ori, pe o scal de interval, iar variabilele nu ntrunesc
condiiile pentru utilizarea testului t al diferenelor pentru eantioane dependente, se poate apela la
testul Wilcoxon. Acesta este un test care, dei se aplic pe scale de interval/raport, utilizeaz
proceduri de tip neparametric, apelnd la diferenele dintre valorile perechi i la ordonarea lor. Este,
din acest punct de vedere, un test de date ordinale.
Exemplu
Un psiholog evalueaz frecvena conduitelor agresive dup prezentarea unui film care are
inclui stimuli subliminali cu semnificaie agresiv. Frecvena conduitelor agresive este msurat
nainte i dup vizionarea filmului. Rezultatele sunt sintetizate n tabelul urmtor.
Cod
nainte Dup
subiect
9
8
1
14
17
2
10
17
3
11
12
4
12
15
5
9
13
6
10
14
7
14
2
8
dup-nainte
-1
3
7
1
3
4
4
-12
Modulul
diferenei
1
3
7
1
3
4
4
12
Rangul
diferenei
7.5
5.5
2.0
7.5
5.5
3.5
3.5
1.0
Semnul
Diferenei
+
+
+
+
+
+
-
56
Copyright DEPARTAMENT ID 2008
Marian Popa
Din acest punct, calcularea valorilor testului este simpl. Se calculeaz dou valori, T(-)
prin nsumarea rangurilor diferenelor negative i T(+) prin nsumarea rangurilor diferenelor
pozitive. Valoarea cea mai mic dintre ele este rezultatul testului Wilcoxon, al crui nivel de
semnificaie se afl prin compararea cu valorile critice dintr-o tabel special (Anexa 8), n funcie
de nivelul alfa ales i de volumul eantionului (N). Testul se fundamenteaz pe ideea c atunci cnd
ipoteza nula este adevrat ar trebui ca suma rangurilor pentru diferenele pozitive s fie egal cu
suma rangurilor pentru diferenele negative. Pe msur ce diferena dintre ele este mai mare, ne
ndeprtm de condiia ipoteza de nul.
Decizia statistic se ia n felul urmtor:
Atunci cnd valoarea calculat este mai mic dect valoarea critic tabelar, ipoteza
de nul se respinge iar ipoteza cercetrii se confirm
Atunci cnd valoarea calculat este mai mare dect valoarea critic tabelar, ipoteza
de nul se accept, iar ipoteza cercetrii nu se confirm.
Pentru exemplul nostru, T(+)=28.5 iar T(-)=8.5. Acesta din urm devine rezultatul testului.
Valoarea calculat (8.5) este mai mare dect valoarea critic (4) pentru N=8 i alfa=0.5 bilateral. Ca
urmare, suntem nevoii s acceptm ipoteza de nul, considernd neconfirmat ipoteza cercetrii.
Dup cum observm, dei am calculat testul pentru diferenele negative de rang, am emis concluzia
n legtur cu diferenele pozitive, deoarece ele fceau obiectul ipotezei de nul.
Ca i n cazul testului Mann-Whitney, pentru eantioane mai mari de 20 distribuia de nul a
testului Wilcoxon poate fi aproximat prin distribuia normal. Formula de calcul pentru acest caz
este urmtoarea:
Z=
T [n * (n + 1)] / 4
n * (n + 1) * (2n + 1) / 24
(formula 5.5)
9
8
8
5
10
9
9
6
7
8
8
4
6
9
7
7
5
7
9
10
(1) Ordonai dup rang diferenele, n termeni de mrime absolut (ignornd semnele), dar
punnd semnele ntre paranteze, dup fiecare diferen.
57
Copyright DEPARTAMENT ID 2008
Marian Popa
Democratic
1
2
1
1
1
2
T1=8
Laissez-faire
2
1
2
2
2
1
T2=10
Autocratic
3
3
3
3
3
3
T3=18
Testul Friedman (Fr) pune n eviden n ce msur rangurile evalurilor repetate difer cu
adevrat (statistic semnificativ) unele de altele, dup formula:
Fr =
c
12
2
* Ti 3 * N * (c + 1)
N * c * (c + 1) i =1
(formula 5.6)
unde:
c este numrul msurrilor repetate
N este volumul seturilor de evaluri perechi
58
Copyright DEPARTAMENT ID 2008
Marian Popa
12
* 8 2 + 10 2 + 18 2 3 * 6 * 4 = 0,1666 * 488 - 72 = 9.3
6 *3* 4
Valoarea critic tabelar chi-ptrat pentru df=3-1=2, este 5.99. Valoarea calculat fiind mai
mare, se respinge ipoteza de nul i se consider confirmat ipoteza cercetrii: nivelul satisfaciei
profesionale variaz semnificativ n funcie de stilul de conducere.
Testul Friedman poate fi aplicat i n cazul a doar dou msurri, situaie n care devine
similar testului semnului. La fel ca i celelalte teste pentru date ordinale, el este afectat de existena
rangurilor atribuite ex-aequo, pentru valori identice. n astfel de cazuri este recomandabil aplicarea
unei corecie formulei de calcul, pe care nu o vom prezenta aici, n sperana c utilizarea
programelor specializate va face, oricum, coreciile necesare.
Sarcina de lucru nr. 3.9
Un neurofiziolog dorete s verifice dac exist o relaie ntre leziunea cerebral stng i tipul de
deficit de memorie de scurt durat, n trei tipuri de sarcin diferite: cifre, litere, litere i cifre amestecate. n
acest scop, un numr de cinci subieci cu leziune cerebral stng au efectuat teste de memorie distincte, pe
iruri de cifre, litere i combinaii de cifre i litere. Performana nregistrat marcheaz irul cel mai lung
memorat pentru fiecare test n parte.
Datele cercetrii:
(valorile semnific lungimea irului memorat)
Subiectul
Cifre
Litere
A
6
5
B
8
7
C
7
7
D
8
5
E
6
4
F
7
6
Care este valoarea testului Friedman?
Care este decizia statistic i ce concluzie trage cercettorul?
Cifre/Litere
6
5
4
8
7
5
Testele Wilcoxon i Friedman sunt utilizate pentru a pune n eviden diferenele dintre dou
sau mai multe eantioane perechi (situaie care, de regul, se refer la msurri repetate pe aceiai
59
Copyright DEPARTAMENT ID 2008
Marian Popa
Diferena (D)
(R1-R2)
D2
1
-2
2
2
0
-3
2
-1
-2
1
1
4
4
4
0
9
4
1
4
1
D2=32
6 * D2
N * ( N 2 1)
(formula 5.7)
192
6 * 32
=1
= 1 0.19 = 0.81
990
10 * (100 1)
60
Copyright DEPARTAMENT ID 2008
Marian Popa
Dac nivelul de semnificaie (p) este mai mare dect 0.05, coeficientul de corelaie va fi
considerat nesemnificativ (are anse prea mari s rezulte din jocul ntmplrii). Aceasta nu
nseamn c nu exist o corelaie ntre cele dou variabile ci doar c datele noastre nu au putut s o
pun n eviden.
Calcularea coeficientului de determinare (r2) n cazul corelaiei Spearman nu este
recomandabil, dei exist autori care o accept.
Cnd se utilizeaz coeficientul de corelaie Spearman:
61
Copyright DEPARTAMENT ID 2008
Marian Popa
Un psiholog dorete s verifice relaia dintre inteligena verbal i cea non verbal. n acest
scop, un eantion de 10 subieci este supus unei testri cu dou teste care vizeaz cele dou categorii
de inteligen, exprimate n uniti QI. Din cauza volumului foarte redus al eantionului, decide s
aplice testul de corelaie a rangurilor Spearman, n locul testului Pearson.
Datele cercetrii sunt urmtoarele:
Subiect
A
B
C
D
E
F
G
H
I
J
Qi verbal
110
100
120
90
108
115
122
110
127
118
QI nonverbal
105
108
110
95
105
125
118
116
118
126
Pentru a testa dac dou populaii difer ntre ele, pe o variabil continu, fr a avea
posibilitatea de msurare exact a acesteia (pe scal de interval sau raport), pot fi
selecionate dou eantioane care sunt puse mpreun, dup care valorile sunt ordonate pe
baza rangurilor de mrime. Testarea diferenei se face prin nsumarea separat a rangurilor
valorilor celor dou eantioane.
Dac eantioanele nu difer, suma rangurilor va fi apropiat sau egal, dac difer,
semnificaia diferenei dintre ranguri este probat cu testul Mann-Whitney U.
Testul Mann-Whitney U este utilizat ori de cte ori o variabil nu poate fi msurat precis,
dar se poate determina ordinea valorilor. De asemenea, el se utilizeaz atunci cnd cele dou
variabile sunt msurate pe scale cantitative dar prezint valori aberante legitime.
Testul Mann-Whitney este echivalentul pentru date ordinale a testului diferenei dintre medii
pentru eantioane independente (compuse din subieci diferii).
Testul Kruskal-Wallis este o extensie a testului Mann-Whitney i se utilizeaz atunci cnd
avem de comparat rangurile a mai mult de dou eantioane independente. Din acest punct de
vedere, Testul Kruskal.Wallis este echivalentul pentru date ordinale al analizei de varian
unifactoriale (ANOVA).
Dac datele sunt recoltate de la aceiai subieci n dou condiii de cercetare diferite, testarea
diferenei dintre ranguri se face cu testul Wilcoxon. Acesta este echivalentul testului t pentru
diferena dintre mediile a dou eantioane dependente (compuse din aceiai subieci).
n acest caz, toate diferenele sunt ordonate dup mrime, ignornd semnul lor, suma
rangurilor fiind fcut separat, pentru diferenele pozitive i negative. O diferen mare
dintre aceste dou sume este dovada unei diferene ntre cele dou eantioane comparate.
62
Copyright DEPARTAMENT ID 2008
Marian Popa
Dou grupuri de cte 5 subieci au fost supuse unui experiment care vizeaz reacia fiziologic la
prezentarea unui stimul ocant. Unul din grupuri a primit un instructaj care sugera natura ocant a
stimulului n timp ce celuilalt grup i s-a spus c vor primi stimuli agreabili. Datele de mai jos
prezint valoarea pulsului msurat n primele 10 secunde de la prezentarea stimulului:
Grupul cu instructaj linititor:
105
130
145
125
115
Suma rangurilor
Grupul cu instructaj pregtitor corect
120
80
90
110
95
Suma rangurilor
U A = 5*5 +
Rang
7
2
1
3
5
18
4
10
9
6
8
37
5 * (5 + 1)
18 = 22
2
5 * (5 + 1)
37 = 3
2
Valoarea UB este valoarea testului i este egal cu valoarea tabelar (tabela 3.3) pentru nA=5 i
nB=5, alfa=0.05. n acest caz se respinge ipoteza de nul i se accept ipoteza cercetrii. Anticiparea
naturii stimulului reduce reacia fiziologic de surpriz.
UB = 5*5 +
63
Copyright DEPARTAMENT ID 2008
Marian Popa
(1)
dup
nainte
rang
5
8
3(-)
3
6
9
3(-)
3
9
6
3(+)
3
7
5
2(+)
5
8
9
1(-)
7.5
9
10
1(-)
7.5
8
7
1(+)
7.5
10
9
1(+)
7.5
verde
verde
Rou
Rou
galben
Rou
Rou
Rou
galben
galben
verde
Rou
verde
galben
verde
galben
verde
galben
prjituri
mncate
9
7
6
6
6
5
4
4
4
4
3
3
2
2
1
1
0
0
rang
1
2
4
4
4
6
8.5
8.5
8.5
8.5
11.5
11.5
13.5
13.5
15.5
15.5
17.5
17.5
64
Copyright DEPARTAMENT ID 2008
7
7
0
10
Marian Popa
rang Litere
5
1.5
7
1
7
1.5
5
1.5
4
2
6
1
8.5
Valoarea critic citit n tabelul chi-ptrat, pentru df=3-1=2 i alfa=0.05, este 5.99
Calculm testul Friedman:
12
Fr =
* (8.5 2 + 13.5 2 + 112 ) 3 * 6 * (3 + 1) = 48.16
6 * 3 * (3 + 1)
Fr calculat este mai mare dect Fr critic. Ca urmare, se respinge ipoteza de nul i se accept ipoteza
cercetrii. Leziunea cerebral stng are un efect asupra coninutului memorat. Cea mai afectat
este memorarea literelor (obine ranguri superioare) iar cea mai puin afectat este memorarea
cifrelor (obine cele mai mici ranguri).
Rspunsul la sarcina de lucru 3.10
Subiect
A
B
C
D
E
F
G
H
I
J
Qi verbal
110
100
120
90
108
115
122
110
127
118
Rang v.
6.5
9
3
10
8
5
2
6.5
1
4
QI nonverbal
105
108
110
95
105
125
118
116
118
126
Rang nv.
8.5
4
7
10
8.5
2
4
6
4
1
(v-nv)2
6.25
25
64
0
0.25
9
4
0.25
9
9
2
(v-nv) =126.75
Valoarea critic a testului se citete n tabela 3.5 din anexe, pentru alfa 0.05 bilateral i N=10:
Rs critic=0.64
Calculm Rs
rs = 1
6 *126.75
= 0.28
10 * (100 1)
65
Copyright DEPARTAMENT ID 2008
Marian Popa
Bibliografie minimal
Bibliografia de baz
i aplica ii SPSS,
Bibliografie suplimentar
Clocotici, V., & Stan, A. (2000). Statistica aplicata in psihologie. Iasi: Polirom,
(selectiv)
Rotaru, T. (coord.). (1999). Metode statistice aplicate in stiintele sociale. Iasi:
Polirom. (selectiv)
Vasilescu, I. P. (1992). Statistica informatizata pentru stiinte despre om (Vol. 1-2).
Bucuresti: Editura militara., (selectiv)
66
Copyright DEPARTAMENT ID 2008
Marian Popa
.05
3.84
5.99
7.81
9.49
11.07
12.59
14.07
15.51
16.92
18.31
19.68
21.03
22.36
23.68
25.00
26.30
27.59
28.87
30.14
31.41
32.67
33.92
35.17
36.42
37.65
38.88
40.11
41.34
42.56
43.77
55.76
67.50
79.08
90.53
101.88
113.15
124.34
p
.025
5.02
7.38
9.35
11.14
12.83
14.45
16.01
17.53
19.02
20.48
21.92
23.34
24.74
26.11
27.49
28.85
30.19
31.53
32.85
34.17
35.48
36.78
38.08
39.36
40.65
41.92
43.19
44.46
45.72
46.98
59.34
71.42
83.29
95.02
106.63
118.14
129.56
.01
6.64
9.21
11.34
13.28
15.09
16.81
18.48
20.09
21.67
23.21
24.72
26.22
27.69
29.14
30.58
32.00
33.41
34.80
36.19
37.57
38.93
40.29
41.64
42.98
44.31
45.64
46.96
48.28
49.59
50.89
63.69
76.15
88.38
100.42
100.43
124.12
135.81
67
Copyright DEPARTAMENT ID 2008
Marian Popa
(sursa: Clocotici V., Stan A., 2000, Statistic aplicat n psihologie, Polirom)
nA/nB
3
4
5
6
8
10
12
14
16
18
20
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
5
0
1
2
0
3
1
6
2
8
4
11
6
13
7
15
9
18
11
20
13
6
1
2
0
3
1
5
2
8
4
11
6
14
9
17
11
21
13
24
16
27
18
8
2
4
1
6
2
8
4
13
7
17
11
22
15
26
18
31
22
36
26
41
30
10
3
0
5
2
8
4
11
6
17
11
23
16
29
21
36
26
42
31
48
37
55
42
12
4
1
7
3
11
6
14
9
22
15
29
21
37
27
45
34
53
41
61
47
69
54
14
5
1
9
4
13
7
17
11
26
18
36
26
45
34
55
42
64
50
74
58
83
67
16
6
2
11
5
15
9
21
13
31
22
42
31
53
41
64
50
75
60
86
70
98
79
18
7
2
12
6
18
11
24
16
36
26
48
37
61
47
74
58
86
70
99
81
112
92
20
8
3
14
8
20
13
27
18
41
30
55
42
69
54
83
67
98
79
112
92
127
105
68
Copyright DEPARTAMENT ID 2008
Marian Popa
(sursa : Clocotici V., Stan A., 2000, Statistic aplicat n psihologie, Polirom)
N
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
0.025
0.05
0
2
4
6
8
11
14
17
21
25
30
35
40
46
52
59
66
73
81
89
0.005
0.01
0
2
3
5
7
10
13
16
20
23
28
32
38
43
49
55
61
68
69
Copyright DEPARTAMENT ID 2008
Marian Popa
(sursa: http://www.netnam.vn/unescocourse/index.htm)
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
alfa=0.05
alfa=0.10
0,900
0,829
0,714
0,643
0,600
0,564
0,523
0,497
0,475
0,457
0,441
0,425
0,412
0,399
0,388
0,377
0,368
0,359
0,351
0,343
0,336
0,329
0,323
0,317
0,311
0,305
test unilateral
alfa=0.025
alfa=0.01
test bilateral
alfa=0.05
alfa=0.02
0,886
0,786
0,738
0,683
0,648
0,623
0,591
0,566
0,545
0,525
0,507
0,490
0,476
0,462
0,450
0,438
0,428
0,418
0,409
0,400
0,392
0,385
0,377
0,370
0,364
0,943
0,893
0,833
0,783
0,745
0,736
0,703
0,673
0,646
0,623
0,601
0,582
0,564
0,549
0,534
0,521
0,508
0,496
0,485
0,475
0,465
0,456
0,448
0,440
0,432
alfa=0.005
alfa=0.01
0,881
0,833
0,794
0,818
0,780
0,745
0,716
0,689
0,666
0,645
0,625
0,608
0,591
0,576
0,562
0,549
0,537
0,526
0,515
0,505
0,496
0,487
0,478
70
Copyright DEPARTAMENT ID 2008