Documente Academic
Documente Profesional
Documente Cultură
ŞTIINŢELE SOCIO-UMANE
Analiza asocierilor şi a diferenţelor statistice
Cristian Opariuc-Dan
3
Statistică aplicată în ştiinţele socio-umane
Cuprins
Cuprins ............................................................................................................. 4
Prefață .............................................................................................................. 7
Cuvântul autorului ......................................................................................... 11
I. Relaţii între variabile ............................................................................. 13
I.1 Coeficienţi de corelaţie neparametrici ............................................ 18
I.1.1 Coeficientul de corelaţie a rangurilor ρ (rho) Spearman ......... 19
I.1.2 Coeficientul de corelaţie a rangurilor τ (tau) Kendall ............. 26
I.1.3 Coeficientul de contingenţă χ2 (chi pătrat) .............................. 36
I.1.4 Coeficientul de asociere φ (phi), coeficientul V Cramer şi
coeficientul de contingenţă (cc), derivaţi din χ2 .................................... 42
I.1.5 Coeficientul de asociere λ (lambda) Goodman şi Kruskal ...... 48
I.1.6 Coeficientul de asociere γ (gamma) ........................................ 53
I.1.7 Coeficientul tetrachoric şi polichoric....................................... 56
I.1.8 Coeficientul de concordanţă W Kendall .................................. 58
I.1.9 Coeficientul de corelaţie rang biserială ................................... 62
I.2 Coeficienţi de corelaţie parametrici ................................................ 64
I.2.1 Coeficientul de corelaţie r Bravais-Pearson ............................ 64
I.2.2 Coeficientul de corelaţie biserial, punct biserial şi triserial ..... 78
I.2.3 Coeficientul de corelaţie eneahoric ......................................... 87
I.3 Corelaţii parţiale .............................................................................. 90
I.3.1 Corelaţii semi-parţiale ............................................................. 95
I.3.2 Corelaţii parţiale pentru date neparametrice ............................ 96
I.3.3 Semnificaţia corelaţiilor parţiale............................................ 100
I.4 Interpretarea coeficienţilor de corelaţie ........................................ 102
4
Cristian Opariuc-Dan
5
Statistică aplicată în ştiinţele socio-umane
6
Cristian Opariuc-Dan
Prefață
7
Statistică aplicată în ştiinţele socio-umane
8
Cristian Opariuc-Dan
9
Statistică aplicată în ştiinţele socio-umane
acordat pentru realizarea unor activităţi rutiniere, însă care nu poate fi utiliza-
tă fără cunoaşterea suficientă specificului aplicativ al unor proceduri. Nu în-
tâmplător, autorul insistă atât de mult pe corectitudinea unor aplicaţii statisti-
ce şi pe oportunitatea lor. În aplicarea unor tipuri de analize factoriale, reali-
zatorii unor studii trebuie să cunoască bine exigenţe referitoare dimensiunea
scalară a datelor, la liniaritatea relaţiilor între variabile şi la numărul minim
de subiecţi care trebuie să fie prezenţi în cercetare. Dacă nu suntem atenţi la
astfel de aspecte, riscăm să fim catalogaţi drept creatori de artefacte în activi-
tatea ştiinţifică şi de folosire abuzivă, incompetentă a unor creaţii tehnice de
excepţie. Cristian Opariuc-Dan a relevat bine deficienţele de înţelegere ale
statisticii de către studenţi, şi ne oferă o lucrare de un impresionant efort ana-
litic şi sintetic.
10
Cristian Opariuc-Dan
Cuvântul autorului
11
Statistică aplicată în ştiinţele socio-umane
12
Cristian Opariuc-Dan
13
Statistică aplicată în ştiinţele socio-umane
14
Cristian Opariuc-Dan
+1,4
+0,4 +0,4
Var. X
-0,6
-1,6
+0,8
+0,5 +2,3
Var Y
-0,2
-0,6
15
Statistică aplicată în ştiinţele socio-umane
16
Cristian Opariuc-Dan
∑ ̅ ̅
(formula 1.1)
Cele două variabile din exemplul de mai sus covariază pozitiv (adică
dacă scorul la o variabilă se află peste medie, scorul la cealaltă variabilă se
află şi el peste medie şi invers), valoarea acestei covariaţii fiind de 1,20.
Marea problemă a covarianţei este aceea că relaţiile dintre cele două
variabile depind de scala de măsură. Dacă avem două instrumente ce măsoa-
ră, fiecare, o singură variabilă, unul cu 100 de itemi şi unul cu 10 itemi, în
condițiile în care itemii sunt cotați la fel, modul în care se vor abate scorurile
individuale de la medie diferă extrem de mult, coeficientul de covarianţă fi-
ind foarte mare în comparaţie cu situaţia analogă în care cele două instrumen-
te ar avea, fiecare, 10 itemi. În realitate acest coeficient nu ne spune, practic,
nimic. Avem nevoie, aşadar, de o măsură standardizată a covarianţei, iar
această măsură o regăsim sub denumirea de corelaţie.
Corelaţia exprimă, practic, sub formă numerică, gradul de asociere
dintre variabile. Două variabile sunt asociate, în situaţia în care comporta-
mentul uneia este legat de comportamentul celeilalte, cu alte cuvinte, dacă nu
sunt independente. Două variabile independente arată că modificarea valori-
lor într-o variabilă nu are niciun efect asupra valorilor din cealaltă variabilă.
(Gibbons, 1993).
În teorie e simplu. În practica ştiinţifică din domeniul socio-uman, am
arătat că variabilele pot fi dificil măsurate la un nivel de interval, majoritatea
lor fiind, strict vorbind, la o scală de măsură ordinală. Este greu să găsim o
17
Statistică aplicată în ştiinţele socio-umane
18
Cristian Opariuc-Dan
În acest sens, există mai mulţi indici ai relaţiilor dintre variabile, utili-
zabili în funcţie de tipul variabilelor.
19
Statistică aplicată în ştiinţele socio-umane
20
Cristian Opariuc-Dan
Revenind la exemplul nostru, vom avea un alt tip de tabel, ceva mai
complex.
Tabelul 1.3 – Calculul coeficientului de corelaţie ρ Spearman
Nr. Mate Fizică Rang Mate Rang Fizică RMxRF R M2 R F2
1 2 3 1 1 1 1 1
2 3 4 2 2,5 5 4 6,25
3 4 4 3 2,5 7,5 9 6,25
4 5 5 4 4 16 16 16
5 6 6 5,5 5 27,5 30,25 25
6 6 7 5,5 6 33 30,25 36
7 7 7 7 6 42 49 36
8 8 7 8 6 48 64 36
9 9 8 9 9 81 81 81
10 10 9 10 10 100 100 100
∑=55 ∑=52 ∑=361 ∑=384,5 ∑=343,5
21
Statistică aplicată în ştiinţele socio-umane
√ √
Acest coeficient de corelaţie, foarte uşor de calculat, are, însă, o pro-
blemă. Aţi observat că cele două variabile utilizate se situează la un nivel
scalar de măsură. După unii autori (Vasilescu, 1992, apud Yule şi Kendall,
1969; Lohse, Kudwig şi Rohr, 1986), acest coeficient de corelaţie este ina-
decvat pentru ranguri, deoarece presupune că datele au, toate, proprietăţile
necesare pentru calcularea coeficienţilor parametrici. Indicatorul reduce, de
fapt, datele de la un nivel scalar la un nivel ordinal. În acest sens, mai adecva-
tă ar fi calcularea altor coeficienţi, specifici pentru rang (Vasilescu, 1992).
Totuşi, datorită uşurinţei calculării acestui coeficient şi a faptului că
poate fi folosit pentru date parametrice care nu îndeplinesc condiţiile aplicării
de teste parametrice, coeficientul ρ Spearman are o largă utilizare. În general,
folosim acest coeficient de corelaţie atunci când ambele variabile se află la un
nivel de măsură ordinal, când o variabilă se află la un nivel ordinal, iar cealal-
tă la un nivel scalar, ori când ambele se află la nivel scalar, dar cel puţin una
dintre ele nu prezintă o distribuţie normală.
22
Cristian Opariuc-Dan
23
Statistică aplicată în ştiinţele socio-umane
√ (formula 1.4)
√ √ √ √
√ (formula 1.5)
24
Cristian Opariuc-Dan
25
Statistică aplicată în ştiinţele socio-umane
26
Cristian Opariuc-Dan
27
Statistică aplicată în ştiinţele socio-umane
(formula 1.6)
28
Cristian Opariuc-Dan
(formula 1.7)
29
Statistică aplicată în ştiinţele socio-umane
∑ (formula 1.8)
30
Cristian Opariuc-Dan
( )
(formula 1.9)
31
Statistică aplicată în ştiinţele socio-umane
(formula 1.10)
√( )( )
32
Cristian Opariuc-Dan
( ) ( )
33
Statistică aplicată în ştiinţele socio-umane
( ) ( )
Având valorile pentru S+ şi S-, putem acum calcula suma lui Kendall
Pentru a putea calcula Smax ,va trebui să aflăm doar numărul de legă-
turi ambiverte din prima variabilă (Ax), în cazul nostru limba română. Avem
trei legături de câte 2 elemente, 2,5 4,5 şi 6,5. Ştim acum formula de calcul şi
putem afla uşor această valoare. ∑ ( )
Nu ne rămâne decât să completăm formula de calcul şi obţinem valoarea
23,97.
√( )( ) √( )( )
√ √
34
Cristian Opariuc-Dan
(formula 1.11)
√
√
√ √ √
35
Statistică aplicată în ştiinţele socio-umane
36
Cristian Opariuc-Dan
(formula 1.12)
37
Statistică aplicată în ştiinţele socio-umane
∑ (formula 1.13)
Noi ne aflăm în cea de-a doua situaţie, astfel încât vom aplica, pentru
fiecare dintre cele patru celule, formula corectată şi vom obţine valoarea 4,2
pentru coeficientul de contingenţă χ2.
| |
∑
| | | |
| | | |
38
Cristian Opariuc-Dan
Coeficientul de contingenţă χ2, după cum aţi putut constata, este sim-
plu de înţeles şi de calculat. De aceea, voi „risca” să abordez, în cele ce ur-
mează, o perspectivă ceva mai „matematizată” asupra datelor neparametrice,
deoarece un stil asemănător îl puteţi întâlni în cele mai multe lucrări din acest
domeniu.
Tabelele de contingenţă (asociere) sunt intens folosite atunci când lu-
crăm cu date discrete. În momentul în care reprezentăm, folosind un aseme-
nea tabel, doar două variabile, vorbim de tabele de contingenţă bidimensio-
nale, deoarece există posibilitatea reprezentării mai multor variabile în ace-
laşi tabel, caz în care ne vom referi la tabele de contingenţă multidimensio-
nale.
În tabelul 1.11 v-am furnizat reprezentarea generală a unui tabel de
contingenţă bidimensional. Putem observa că variabila X are un număr de i
categorii (unde, spre exemplu, i poate fi 2, în cazul variabilei sex – masculin
şi feminin, ori 4 în cazul culorii ochilor – albastru, verde, negru, căprui), iar
variabila Y are un număr de j categorii. Prin însumarea datelor, la nivelul
fiecărei categorii, obţinem un nou tip de rubrică, numită secţiunea datelor
marginale. Coloana „Total X”, respectiv linia „Total Y” se referă exact la
acest tip de date.
Tabelul 1.11 – Reprezentarea generală a unui tabel de contingenţă bidimensional
Variabila Y
Categorie 1 Categorie 2 … Categorie j Total X
n11 n12 … n1j ∑nX1
Categorie 1
e11 e12 … e1j ∑eX1
n21 n22 … n2j ∑nX2
Categorie 2
e21 e22 … e2j ∑eX1
Variabila . . . … . .
X . . . … . .
ni1 ni2 … nij ∑nXi
Categorie i
ei1 ei2 … eij ∑eX1
∑nY1 ∑nY2 … ∑nYj n
Total Y
∑eY1 ∑eY2 … ∑eYj e
39
Statistică aplicată în ştiinţele socio-umane
Numărul de cazuri din fiecare categorie îl notăm, aşa cum ştim deja,
cu litera n, căreia i se adaugă indici arătând numărul liniei și numărul coloa-
nei. Astfel, subiecţii din categoria 1 pentru variabila X şi categoria 1 pentru
variabila Y, se notează cu n11 (spre exemplu, bărbaţii cu ochi albaştri). Sub-
iecţii din categoria 2 pentru variabila X şi din categoria 1 pentru variabila Y
se notează cu n21 (de exemplu femeile cu ochi albaştri) şi aşa mai departe.
Generalizând parţial, vom spune că subiecţii din categoria 1 pentru variabila
X şi din categoria j pentru variabila Y se notează n1j; similar, subiecţii din
categoria 1 pentru variabila Y şi din categoria i pentru variabila X se notează
ni1. Înţelegând acest stil de notare, vom spune că numărul de subiecţi din ca-
tegoria i în cazul variabilei X şi din categoria j în cazul variabilei Y se poate
nota nij.
Rezultatele marginale urmează aceeaşi logică. Toţi subiecţii aflaţi în
categoria 1 a variabilei X sunt reprezentaţi de ∑nX1 (de exemplu, toţi bărbaţii,
indiferent de culoarea ochilor). Toţi subiecţii aflaţi în categoria 1 a variabilei
Y sunt reprezentaţi de ∑nY1 (de exemplu, toţi subiecţii cu ochi albaştri, indi-
ferent de sex). În general, toţi subiecţii din categoria i a unei variabile şi din
categoria j a celeilalte variabile sunt reprezentaţi de ∑nij.
Referindu-de strict la χ2, putem raţiona în acelaşi mod atunci când
vorbim despre frecvenţele estimate, notate în cazul nostru cu e. Nu vom deta-
lia raţionamentul, vă lăsăm pe dumneavoastră să o faceţi.
Cunoscând toate aceste date, să revedem formula pentru χ2, în condiţii
de maximă generalitate. Vă reamintim formula iniţială, apoi vom proceda la
deducerea noii formule.
∑ ∑ ∑ (formula 1.15)
40
Cristian Opariuc-Dan
41
Statistică aplicată în ştiinţele socio-umane
42
Cristian Opariuc-Dan
(formula 1.16)
√
Această formulă nu este, practic, altceva decât rădăcina pătrată din ra-
43
Statistică aplicată în ştiinţele socio-umane
√ √
√ (formula 1.17)
44
Cristian Opariuc-Dan
√ √ √ √
√√ (formula 1.18)
√ √ √ √ √
√ √ √
45
Statistică aplicată în ştiinţele socio-umane
dintre variabile prezintă mai mult de două categorii, fiind o versiune mai pre-
cisă a coeficientului de contingenţă Pearson.
Coeficientul de asociere v Cramer se foloseşte în cazul în care cel
puţin una dintre variabile are mai mult de două modalităţi de realizare şi poa-
te fi definit după formula următoare:
√ (formula 1.19)
√ √ √ √
46
Cristian Opariuc-Dan
√ ⇔ ⇔
Putem, practic, extrage valoarea lui χ2, dacă ştim numărul de subiecţi
şi valoarea lui φ. În exemplul nostru, φ avea valoarea 0,21, cercetare realizată
pe 215 persoane. Atunci . Fiind un
singur grad de libertate, observăm că această valoare este semnificativă, la un
prag de semnificaţie mai mic de 0,01. Putem spune că există o asociere slabă
între părul blond şi ochii albaştri. Adică, în majoritatea cazurilor, persoanele
cu păr blond au şi ochii albaştri, restul situaţiilor fiind excepţii.
47
Statistică aplicată în ştiinţele socio-umane
unde nMi este cea mai mare frecvenţă de pe rândul i şi Max(Cj) este
frecvența cea mai mare dintre frecvențele coloanelor, iar n se referă la nu-
mărul subiecților.
Ştiţi ce mă bucură acum cel mai tare? Faptul că nu vă mai speriaţi de
formule. Aţi observat că ele devin din ce în ce mai stufoase şi, totuşi, în reali-
tate, aplicarea lor este foarte simplă. Să luăm un nou exemplu. Presupunem
că am desfăşurat o cercetare în cadrul căreia dorim să studiem asocierea între
două variabile: preferinţa pentru un partid politic (1 – PSD; 2 – PNL; 3 –
PDL; 4 – PC şi 5 – PRM) şi nivelul de stres al subiecţilor pe o scală Likert de
la 1 la 5 (1 – Foarte slab; 2 – Slab; 3 – Mediu; 4 – Ridicat; 5 – Foarte ridicat).
Suntem în situaţia asocierii dintre o variabilă nominală (preferinţa pentru
partide) şi o variabilă ordinală (nivelul de stres). Vom construi tabelul de
contingenţă pentru cele două variabile.
48
Cristian Opariuc-Dan
Structura tabelului este clară. Dintre cei care preferă PSD, 12 persoa-
ne au un nivel de stres foarte scăzut, 9 un nivel de stres scăzut, 7 un nivel de
stres mediu, 4 ridicat şi o persoană prezintă nivelul stresului foarte ridicat.
Situaţia este analogă în cazul celorlalte partide.
Avem partidele afişate pe linii şi nivelul de stres pe coloane. În primul
rând, va trebui să stabilim, pentru fiecare linie, celula cu frecvenţa cea mai
mare. Pentru PSD, categoria cu frecvenţa cea mai mare este reprezentată de
nivelul de stres foarte scăzut (12 persoane). Pentru PNL întâlnim categoria cu
nivelul de stres scăzut (45 de persoane), pentru PDL nivelul de stres mediu
(42 de persoane), pentru PC tot nivelul de stres mediu (10 persoane), iar pen-
tru PRM nivelul de stres scăzut (5 persoane).
Tabelul 1.14 – Tabelul de contingenţă pentru calculul coeficientului λ
Nivelul de stres
1 2 3 4 5
Foarte Scăzut Mediu Ridicat Foarte
scăzut ridicat
1 – PSD 12 9 7 4 1
2 – PNL 8 45 21 6 5
Partidul 3 – PDL 7 19 42 13 1
4 – PC 8 4 10 7 3
5 - PRM 1 5 1 3 2
Total coloane 36 82 81 33 12
Efectuăm acum totalul pe coloane. În mod clar, categoria cu frecvenţa
cea mai mare este cea a stresului scăzut (82 de persoane), în timp ce numărul
total de participanţi la studiu a fost de 244 de persoane. În acest moment,
informaţiile sunt suficiente pentru a putea completa formula.
∑ ( )
( )
49
Statistică aplicată în ştiinţele socio-umane
(formula 1.21)
√
50
Cristian Opariuc-Dan
valori mici de referinţă, de 10%, 5%, 3% sau 1%. Exprimat sub formă de
proporţii, valori de 0,10, 0,05, 0,03 sau 0,01 pentru λref.
Dacă avem motive suficiente să credem că există legături între cele
două variabile, atunci putem aborda soluţii optimiste, în sensul că vom consi-
dera o mare parte dintre informaţiile unei variabile ca fiind dependente de
informaţiile din cealaltă variabilă. În acest sens, putem alege valori de 50%,
60%, 70% pentru λref.
Nu există o regulă de atribuire în acest sens. Personal, vă recomand să
fiţi sceptici şi să nu consideraţi valori mai mari de 0,10 – 0,15 pentru λref.
Evident, cu cât valorile lui λref se apropie cu zero, cu atât legătura trebuie să
fie mai puternică pentru a fi semnificativă.
În exemplul nostru, am plecat de la presupunerea că doar 10% din ni-
velul de stres poate determina preferinţe pentru un anumit partid politic. Va-
loarea pentru λref va fi, aşadar, 0,10 şi vom analiza dacă la acest nivel putem
vorbi despre o legătură semnificativă.
Următorul aspect din formula 1.21 se referă la varianţa coeficientului
λ. Această varianţă poate fi calculată în baza relației următoare:
( ∑ )(∑ ( ) ∑ )
(formula 1.22)
( ( ))
unde nMi este cea mai mare frecvenţă de pe rândul i, Max(Cj) cea mai
mare frecvență dintre frecvențele calculate pe coloane şi ∑ este suma
tuturor frecvenţelor maxime asociate coloanei cu frecvenţa cea mai mare, m
reprezentând numărul de rânduri.
Aceasta este chiar complicată, nu-i aşa? Oare cum o calculăm? Poate
vă gândiţi să o învăţaţi pe de rost pentru examene. Sau poate o memoraţi să
impresionaţi prietenul ori prietena. Nu are rost. În condiţii de examen, ar tre-
bui să vi se dea formula, iar dumneavoastră să ştiţi să o aplicaţi. Pentru prie-
51
Statistică aplicată în ştiinţele socio-umane
ten ori prietenă, cred că puteţi să impresionaţi şi altfel. Dacă veţi scrie formu-
la asta într-o scrisoare de amor, în mod sigur nu veţi reuşi decât să îndepărtaţi
partenerul. Haideţi totuşi să vedem ce ne cere formula şi dacă e atât de com-
plicat calculul. Vom relua tabelul de contingenţă.
Numărul total de persoane este 244. Îl avem, aşadar, pe n. Suma celor
mai mari frecvenţe de pe rânduri o ştim deja. Este 114 şi nu reprezintă altce-
va decât valoarea ∑ . Cea mai mare frecvență dintre frecvențele calcu-
late pe coloane este situată în a doua coloană şi are valoarea 82. Iată că avem
şi rezultatul pentru ( ).
Tabelul 1.15 – Tabelul de contingenţă pentru calculul coeficientului λ
Nivelul de stres
1 2 3 4 5
Foarte Scăzut Mediu Ridicat Foarte
scăzut ridicat
1 – PSD 12 9 7 4 1
2 – PNL 8 45 21 6 5
Partidul 3 – PDL 7 19 42 13 1
4 – PC 8 4 10 7 3
5 - PRM 1 5 1 3 2
Total coloane 36 82 81 33 12
Ce trebuie să mai facem? Trebuie să calculăm suma tuturor frecvenţe-
lor maxime asociate coloanei cu frecvenţa cea mai mare. Am stabilit deja
care este aceasta. Este a doua coloană. Care sunt frecvenţele maxime din
această coloană? Pe primul rând avem frecvenţa 9, pe al doilea rând frecvenţa
45, pe al treilea rând frecvenţa 19, pe al patrulea rând frecvenţa 4 şi pe al cin-
cilea rând frecvenţa 5. Care este frecvenţa cea mai mare? Evident, cea de pe
al doilea rând, frecvenţa 45. Mai vedeţi şi alte cifre de 45 acolo? Nu. Ei bine,
aceasta este şi suma mult căutată. Dacă aveaţi 45 pe rândul 2 şi 45 pe rândul
4, atunci suma frecvenţelor maxime ar fi fost 90 (45+45). În cazul nostru,
avem o singură frecvenţă maximă, 45, şi aceea reprezintă valoarea pentru
∑ . Relaxaţi-vă. V-am spus că formulele mai mult sperie prin aspect
52
Cristian Opariuc-Dan
( ( ))
√ √
53
Statistică aplicată în ştiinţele socio-umane
(formula 1.23)
54
Cristian Opariuc-Dan
55
Statistică aplicată în ştiinţele socio-umane
( ) (formula 1.24)
√
56
Cristian Opariuc-Dan
( )
√ √ √
( ) ( ) ( )
57
Statistică aplicată în ştiinţele socio-umane
58
Cristian Opariuc-Dan
59
Statistică aplicată în ştiinţele socio-umane
(formula 1.25)
∑ ( ) (formula 1.22)
∑ ( )
(formula 1.26)
∑ ( ) ( )
60
Cristian Opariuc-Dan
61
Statistică aplicată în ştiinţele socio-umane
(formula 1.27)
(formula 1.28)
62
Cristian Opariuc-Dan
poate fi asociată unei variabile dihotomice (este sau nu este bărbat), în relaţie
cu o variabilă ordinală (gradele militare cu valorile 1 – locotenent; 2 – căpi-
tan; 3 – maior; 4 – locotenent colonel; 5 – colonel; 6 – general). Colectăm
datele de la un număr de 15 persoane din unitatea militară respectivă,
centralizându-le într-un tabel.
Tabelul 1.22 – Calculul coeficientului rang biserial
Cadre militare
mr
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0 1 3 4 2 2 4 1 2,42
Sex
1 1 5 4 1 6 3 1 5 3,25
63
Statistică aplicată în ştiinţele socio-umane
64
Cristian Opariuc-Dan
65
Statistică aplicată în ştiinţele socio-umane
66
Cristian Opariuc-Dan
67
Statistică aplicată în ştiinţele socio-umane
68
Cristian Opariuc-Dan
(formula 1.30)
69
Statistică aplicată în ştiinţele socio-umane
70
Cristian Opariuc-Dan
71
Statistică aplicată în ştiinţele socio-umane
ceva concentrare. Iată motivul pentru care s-au inventat programele de anali-
ză statistică.
În cazul în care doriţi să calculaţi direct coeficientul de corelaţie r
Bravais-Pearson, fără a mai calcula, în prealabil, mediile, puteţi aplica urmă-
toarea formulă:
∑ ∑ ∑
(formula 1.32)
√[ ∑ (∑ ) ][ ∑ (∑ ) ]
lor ridicate la pătrat). În final, efectuăm suma scorurilor pentru valorile cele
două variabile, pentru pătratul acestora, şi suma produsului lor. Acestea sunt
toate datele necesare aplicării formulei.
∑ ∑ ∑
√[ ∑ ∑ ][ ∑ ∑ ]
√ √
72
Cristian Opariuc-Dan
73
Statistică aplicată în ştiinţele socio-umane
√ √ √
√ √ √
74
Cristian Opariuc-Dan
1
Nu am mai menţionat că este negativă. În realitate corelaţia există, într-adevăr, şi este pozi-
tivă. Noi am obţinut o corelaţie negativă, deoarece am lucrat cu date la întâmplare care nu au
rezultat din cercetări. Mă şi mir că a rezultat o corelaţie semnificativă.
75
Statistică aplicată în ştiinţele socio-umane
(formula 1.34)
ș (formula 1.35)
√ √
76
Cristian Opariuc-Dan
ș (formula 1.36)
√ √
√ √
77
Statistică aplicată în ştiinţele socio-umane
78
Cristian Opariuc-Dan
79
Statistică aplicată în ştiinţele socio-umane
80
Cristian Opariuc-Dan
81
Statistică aplicată în ştiinţele socio-umane
̅ ̅
√ (formula 1.38)
82
Cristian Opariuc-Dan
cele două situaţii, iar sigma se referă la abaterea standard a datelor variabi-
lei continui.
Formula nu se mai bazează pe proporţii, ci pe frecvenţe absolute, fiind
mai uşor de calculat în comparaţie cu coeficientul biserial. Vom relua exem-
plul anterior, considerând de data aceasta că testul de inteligenţă doreşte să
prezică diferenţa, sub acest aspect, dintre bărbaţi şi femei.
Variabila dihotomică are acum o dihotomie discretă, calculul coefici-
entului biserial nu mai are sens, prin urmare vom aplica formula coeficientu-
lui de corelaţie punct biserial.
Tabelul 1.27 – Calculul coeficientului de corelaţie punct biserial
Test inteligenţă (punctaj total)
Sex Total
0 1 2 3 4 5 6 7 8 9 10
Bărbaţi 0 0 1 2 4 6 0 9 7 6 8 43
Femei 0 0 3 5 8 5 4 5 2 4 1 37
Total 0 0 4 7 12 11 4 14 9 10 9 80
̅ ̅
√ √ √
83
Statistică aplicată în ştiinţele socio-umane
√
Valoarea raportului se citeşte în acelaşi tabel ca şi raportul ,
luându-se ca referinţă proporţia cea mai mică. În exemplul nostru, am luat ca
referinţă q=0,463. Găsisem, anterior, că raportul . În acelaşi ta-
84
Cristian Opariuc-Dan
85
Statistică aplicată în ştiinţele socio-umane
√ (formula 1.41)
√ √ √
√ √ √
√ √ √
86
Cristian Opariuc-Dan
87
Statistică aplicată în ştiinţele socio-umane
88
Cristian Opariuc-Dan
(formula 1.42)
( ) ( )
√( )( )
√( )( )
√( )( ) √( )( )
89
Statistică aplicată în ştiinţele socio-umane
90
Cristian Opariuc-Dan
2
Varianţa se calculează ridicând la pătrat coeficientul de corelaţie. În acest caz, varianţa ar fi
0,3422, adică 0,116 sau 11,6%. Despre coeficientul de corelaţie multiplă şi varianţă explicată
vom discuta într-un alt volum. Unii autori numesc această varianţă prin termenul de varianţă
comună.
91
Statistică aplicată în ştiinţele socio-umane
tra acest lucru folosind un grafic asemănător celui din figura 1.3. Am răs-
puns, iată, la întrebarea anterioară. Tipul de studiu explică 42,3% din varianţa
notei obţinute la examen. Mult mai mult în comparaţie cu emotivitatea. Do-
rind să fim şi mai riguroşi, putem acum asocia chiar timpul de studiu cu emo-
ţiile din timpul examenului. Desigur, surpriza nu va întârzia să apară. Obţi-
nem un coeficient de corelaţie negativ, să spunem – 0,410. Iată că timpul de
studiu se regăseşte, şi el, în procent de 16,8%, în varianța emoţiilor din tim-
pul examenului. Cu cât un student alocă mai mult timp studiului unei disci-
pline, cu atât performanţa sa la examen va fi mai mare şi emoţiile din timpul
examenului mai mici. Nu prea vă convine. Când credeaţi şi dumneavoastră că
vă veţi putea justifica notele mici la examene prin emoţii, iată că vi se spulbe-
ră teoria.
Cu un oarecare sentiment de tristeţe, veţi reprezenta acest lucru în fi-
gura 1.4.
Problema, totuşi, nu s-a rezolvat. Nu am arătat decât că timpul de stu-
diu contribuie la scăderea emoţiilor din timpul examenelor şi la creşterea no-
telor obţinute la
examene. După o
Varianţa „pură” explicată Notă examen
logică simplă, de timpul de studiu
emoţiile duc la
scăderea notei
obţinute la exa-
men, iar timpul de
Timp de studiu
studiu determină Emoţii examen
creşterea acestora.
Totuşi, cum ară-
Varianţa comună explicată de
tăm relaţia dintre Varianţa „pură”
timpul de studiu şi emoţii
explicată de emoţii
emoţii şi perfor-
manţa în timpul Figura 1.5 – Varianţa comună explicată de timpul de studiu şi emoţii
92
Cristian Opariuc-Dan
(formula 1.43)
√( )( )
93
Statistică aplicată în ştiinţele socio-umane
√ √ √
Iată că, menţinând sub control timpul de studiu, corelaţia dintre per-
formanţa la examen şi emoţiile din timpul examenului este una negativă, de
doar 0,109. Varianţa performanţei la examen nu este acoperită în procent de
11,6%, cum credeam iniţial, ci într-un procent de doar 1,18%.
Un asemenea tip de corelaţie parţială poartă numele de corelaţie par-
ţială de rang I, deoarece există o singură variabilă pe care dorim să o contro-
lăm din punctul de vedere al efectului. Putem să controlăm efectul unui nu-
măr de două variabile, caz în care vorbim despre corelaţie parţială de rang
II, efectul a trei variabile – corelaţie parţială de rang III şi aşa mai departe.
Coeficientul de corelaţie se va scrie r12.3 în cazul unei corelaţii parţiale de
94
Cristian Opariuc-Dan
ordin I, r12.34 pentru o corelaţie parţială de rang II, r12.345 pentru corelaţiile
parţiale de ordin III şi aşa mai departe.
Algoritmul de lucru este unul analog, bazat pe formula anterioară, ex-
tinsă pentru un ordin mai mare. Calculele pot deveni însă laborioase, de aceea
pentru corelaţii parţiale de ranguri mari se preferă utilizarea unui computer şi
a unui program specializat.
(formula 1.45)
√
95
Statistică aplicată în ştiinţele socio-umane
(formula 1.47)
√
96
Cristian Opariuc-Dan
(formula 1.48)
√ √
√ √ √ √
97
Statistică aplicată în ştiinţele socio-umane
care ne vom rezuma doar să o prezentăm, fără vreun exemplu, deoarece cal-
culul se realizează identic, lăsându-vă dumneavoastră plăcerea găsirii şi re-
zolvării unui exerciţiu în baza acestei relaţii.
(formula 1.49)
( )( )
(formula 1.50)
√
98
Cristian Opariuc-Dan
√ √
99
Statistică aplicată în ştiinţele socio-umane
√ (formula 1.51)
100
Cristian Opariuc-Dan
√ √ √
(formula 1.52)
101
Statistică aplicată în ştiinţele socio-umane
102
Cristian Opariuc-Dan
mila mai multe cunoştinţe, în timp ce subiecţii în vârstă vor asimila cunoştin-
ţe mai puţine.
Tabelul 1.34 – Utilizarea coeficienţilor de corelaţie
Variabila Y
Dihotomic Nominal Ordinal Scalar
- χ2 - χ2
- poliserial
-φ - V Cramer - polichoric
Dihotomic - biserial
- cc - cc - rang biserial
- punct biserial
- tetrachoric -λ
- χ2
- V Cramer
- χ2 - χ2 - χ2 - cc
- V Cramer - V Cramer - V Cramer - λ (grupată în
Nominal
- cc - cc - cc clase)
-λ -λ -λ - triserial (provi-
ne din variabila
continuă)
- ρ Spearman
(dacă lotul este
mai mic de 30
sau dacă cel
puţin o variabilă
- ρ Spearman nu se distribuie
- χ2
- τ Kendall normal)
- polichoric - V Cramer
Ordinal -γ - τ Kendall (dacă
- rang biserial - cc
- polichoric cel puţin o una
-λ
- W Kendall dintre variabile
Variabila X
nu se distribuie
normal)
- γ (date grupate
în clase ierarhice)
- poliserial
- ρ Spearman
(dacă lotul este
mai mic de 30
sau dacă cel
puţin o variabilă
- χ2
nu se distribuie
- V Cramer
normal)
- cc - r Pearson
- poliserial - τ Kendall
- λ (grupată în - eneahoric (vari-
Scalar - biserial (dacă cel puţin
clase) abile categori-
- punct biserial o una dintre
- triserial (provine zate)
variabile nu se
din variabila
distribuie
continuă)
normal)
- γ (date grupate
în clase ierarhi-
ce)
- poliserial
103
Statistică aplicată în ştiinţele socio-umane
104
Cristian Opariuc-Dan
105
Statistică aplicată în ştiinţele socio-umane
ează astfel premisele unei noi cercetări pe alte teme. Să nu vă mai fie frică,
aşadar, de ne-respingerea ipotezei nule. Valoarea unui studiu ştiinţific nu este
dată de respingerea sau nu a ipotezei nule, ci de informaţiile noi pe care le
aduce cercetarea. Am făcut această menţiune, deoarece mi s-a întâmplat să
cunosc studenţi în licenţă, disperaţi că nu obţineau corelaţii semnificative, şi
cărora profesorii coordonatori le spuneau că dacă nu se obţine o corelaţie
semnificativă, lucrarea de licenţă nu este bună. Dincolo de tragi-comicul situ-
aţiei, a trebuit să petrec ceva timp lămurind persoanele în cauză că lucrurile
nu stau chiar aşa.
106
Cristian Opariuc-Dan
şansă de a alege. În cazul ultimului angajat, această şansă nu mai există. Care
a fi, aşadar, soluţia? Fie mărim numărul de premii (11), caz în care şi cel de-
al zecelea angajat poate alege între două obiecte de îmbrăcăminte, fie renun-
ţăm la al zecelea angajat şi ne limităm la ultimul care a putut să facă o alegere
(al nouălea, care a ales unul dintre cele două obiecte rămase). Această ultimă
situaţie reflectă exact principiul gradelor de libertate.
Să nuanţăm puţin lucrurile. Presupunem că cele 10 articole de îmbră-
căminte sunt formate din 5 rochii şi 5 costume bărbăteşti. Întrebarea care se
pune este câte persoane pot accesa aceste articole, în condiţia în care fiecare
persoană va trebui să aibă o şansă de a alege? Probabil că cele 5 rochii vor fi
alese de femei. Ca să poată alege, vom avea nevoie de cel mult 4 femei. Simi-
lar, cele 5 costume bărbăteşti pot fi alese de maximum 4 bărbaţi, ultimul
având posibilitatea de a alege între două costume. Aşadar, putem lua în calcul
maximum 8 persoane, şi nu 10 câte aveam iniţial.
În orice analiză multivariată, numărul total de subiecţi se reduce în
funcţie de nivelurile unei variabile. Gradele de libertate exprimă numărul de
cazuri luat în calcul pentru a obţine indicatorul statistic dorit, în condiţiile în
care se poate vorbi de probabilităţi.
107
Statistică aplicată în ştiinţele socio-umane
12,9% şi nu de 34% aşa cum am crezut iniţial. Motivele care stau în spatele
acestei operaţii se regăsesc în suportul teoretic al varianţei şi nu le vom mai
trata aici. Alături de coeficientul de corelaţie, mărimea efectului este o altă
măsură, mai versatilă, mai intuitivă, a puterii statistice a unei cercetări. Ex-
primarea procentuală este mai uşor de înţeles în comparaţie cu expresia sim-
plă a unui coeficient de corelaţie. Este bine ca în orice studiu de acest tip,
alături de coeficientul de corelaţie, să indicaţi şi mărimea efectului pe care îl
generează, în termeni de varianţă explicată.
Strict orientativ, Andy Fields (Field, 2000) oferă o serie de repere în
interpretarea mărimii efectului, în funcție de valorile absolute ale coeficientu-
lui de corelație liniară (notat generic cu r):
0,00 < r < 0,10 – efecte reduse, explicând până la 1% din vari-
anţa totală;
0,11 < r < 0,30 – efecte medii, explicând între 1% şi 9% din
varianţa totală;
0,31 < r < 0,50 – efecte mari, explicând între 9% şi 25% din
varianţa totală;
r > 0,51 – efecte foarte mari, explicând peste 25% din varianţa
totală.
Ar fi destul de multe lucruri de discutat aici, inclusiv aspecte referi-
toare la puterea indicatorilor statistici. Nu le vom aborda acum. Acestea vor fi
tratate pe larg în capitolul dedicat statisticilor inferenţiale. Cunoştinţele dum-
neavoastră în domeniul planurilor de cercetare de tip corelaţional sunt, deo-
camdată, suficiente.
108
Cristian Opariuc-Dan
109
Statistică aplicată în ştiinţele socio-umane
Cea mai fericită situaţie este aceea în care colectăm date aflate la un
nivel scalar (sau asimilate unui nivel scalar). Dar, şi în acest caz, se pun anu-
mite probleme. În primul rând, existenţa unui număr suficient de cazuri. Nu
are sens că calculăm coeficientul de corelaţie r Pearson sau corelaţii seriale
ori parţiale dacă numărul de cazuri este foarte mic, în general sub 50 de sco-
ruri. În această situaţie, o măsură mai stabilă ar fi calculul coeficientului de
corelaţie ρ Spearman. În al doilea rând, datele sunt distribuite normal? Iată un
motiv foarte serios pentru a proceda la analiza normalităţii distribuţiei. Dacă
numărul de subiecţi este mare, iar datele nu se distribuie normal, nu putem
lucra cu un coeficient de corelaţie bazat pe medii, cum este r Pearson. Se pre-
feră, în acest caz, ρ Spearman sau τ Kendall. Unii autori (Liebetrau, 1983)
interzic chiar utilizarea coeficientului ρ Spearman în aceste situaţii, recoman-
dând doar analizele bazate pe τ Kendall.
2. Ce tip de ipoteze au fost formulate?
Tipul ipotezei formulate are o mare importanţă, îndeosebi sub aspec-
tul distincţiei între ipotezele unilaterale şi bilaterale. Stabilirea semnificaţiei
unui coeficient se va face doar în strictă concordanţă cu acest aspect. Rapor-
tarea pragului de semnificaţie bilateral în condiţiile unei ipoteze unilaterale şi
invers, constituie o eroare. Din fericire, acest lucru poate fi uşor remediat.
3. Care este motivul pentru care s-a analizat relaţia dintre două va-
riabile?
Iată o întrebare care, la prima vedere, s-ar putea să vă surprindă. De-
sigur, răspunsul îl puteţi găsi studiind obiectivele şi ipotezele cercetării. Cer-
cetarea urmăreşte analiza legăturii (corelaţiei) dintre două variabile? Ori, poa-
te, doreşte să precizeze gradul de acord între mai multe persoane referitor la o
anumită problemă sau la un anumit grup de subiecţi. Sau, de ce nu, pentru a
efectua o predicţie şi a stabili o relaţie cauzală.
110
Cristian Opariuc-Dan
111
Statistică aplicată în ştiinţele socio-umane
112
Cristian Opariuc-Dan
113
Statistică aplicată în ştiinţele socio-umane
114
Cristian Opariuc-Dan
pe departe realitatea. De exemplu (Sava, 2004), dacă vom studia relaţia dintre
coeficientul de inteligenţă şi creativitate, vom obţine un nor de puncte
heteroscedastic. Corelaţia dintre aceste două dimensiuni este puternică la
valori mici ale inteligenţei şi creativităţii. Pe măsură ce coeficientul de inteli-
genţă creşte, intensitatea legăturii scade, datorită
intervenţiei unor factori intelectuali şi non-
intelectuali. Problema care se pune este aceea a
stabilirii punctului până la care relaţia se păs-
trează, iar interpretarea va ţine seama de aceste
aspecte.
Dacă vom studia relaţia dintre venituri şi Figura 1.12 – Existenţa seturi-
cheltuieli pe articole de îmbrăcăminte, s-ar putea lor de date
să aveţi surpriza obţinerii unui coeficient de core-
laţie mic. Acceptarea ipotezei conform căreia nu există nicio legătură între
venituri şi cheltuieli pe articole de îmbrăcăminte s-ar putea să fie eronată, în
condiţiile în care norul de puncte arată ca în figura 1.12.
Remarcăm, în acest caz, existenţa a două seturi distincte de date.
Putem suspecta existenţa unei variabile moderatoare, în acest caz genul bio-
logic al persoanei. Relaţia poate exista în cazul femeilor (norul de puncte
compact din partea de stânga-sus a graficului), pentru bărbaţi nefiind semni-
ficativă (norul de puncte din dreapta-jos). Dacă
vom trata compact lotul de cercetare, sigur că
vom obţine un coeficient de corelaţie foarte mic.
În acest caz, analiza se realizează separat pentru
bărbaţi şi pentru femei, rezultatele raportându-se
în consecinţă.
Figura 1.13 – Relaţiile nelinia-
re între variabile Ultimul element pe care îl remarcăm, din
punctul de vedere al formei distribuţiei, se referă
la relaţiile neliniare. Cei dintre dumneavoastră care au studiat psihologie,
115
Statistică aplicată în ştiinţele socio-umane
116
Cristian Opariuc-Dan
117
Statistică aplicată în ştiinţele socio-umane
118
Cristian Opariuc-Dan
3
Datele sunt fictive şi nu corespund unui studiu real. Ele au fost manipulate în aşa fel încât
să corespundă necesităţilor didactice.
119
Statistică aplicată în ştiinţele socio-umane
120
Cristian Opariuc-Dan
figura 1.18.
Formularul conţine două liste, separate prin butonul de transfer în
formă de săgeată. Cu ajutorul acestuia, putem transfera variabilele din baza
de date (fereastra din stânga) în lista variabilelor supuse analizei (fereastra
din dreapta). În cazul nostru, am inclus spre analiză, variabilele „Nota exa-
men” şi „Emoţii examen”, în conformitate cu planul de cercetare.
Sub aceste două liste se află secţiunea „Correlation Coefficients”, ca-
re conţine trei casete de bifare, corespunzătoare celor trei coeficienţi de core-
laţie ce pot fi calculaţi: coeficientul de corelaţie r Bravais-Pearson (Pearson),
coeficientul de corelaţie τ Kendall (Kendall’s tau-b) şi coeficientul de corela-
ţie a rangurilor ρ Spearman (Spearman). Situaţia noastră este clară; vom cal-
cula coeficientul de corelaţie r Bravais-Pearson.
Următoarea secţiune, „Test of Significance” are în vedere stabilirea
tipului de ipoteză cu care lucrăm. Putem alege între o ipoteză nedirecţională
(Two-tailed) şi o ipoteză direcţională (One-tailed). Presupunem că ipoteza
noastră vizează stabilirea unei relaţii între performanţa la examen şi emoţiile
din timpul examenului. Ştiţi deja că aceasta este o ipoteză nedirecţională,
corelaţia fiind semnificativă atât în cazul unei legături pozitive, cât şi în cazul
unei legături negative.
Întrebare
Cum aţi formula o ipoteză direcţională în acest design de cercetare?
Ce opţiune aţi alege în secţiunea testelor de semnificaţie?
122
Cristian Opariuc-Dan
123
Statistică aplicată în ştiinţele socio-umane
124
Cristian Opariuc-Dan
125
Statistică aplicată în ştiinţele socio-umane
bile. Pentru a nu desena mai multe grafice, se poate folosi această formă.
Observăm în figura 1.24 reprezentarea tuturor celor trei diagrame de
corelaţie. Pe ambele axe sunt incluse variabilele. La
intersecţia a două variabile se afişează norul de
puncte corespunzător. Puteţi remarca, pe al doilea
rând, ultimul cadran, graficul din figura 1.20.
Aceasta este o modalitate ideală de a vizualiza an-
samblul legăturilor dintre variabile.
Figura 1.25 – Grafic tip 3- Graficul „3-D Scatter” este util în reprezen-
D Scatter tarea tridimensională a corelaţiilor între mai multe
perechi de variabile. Este o diagramă de corelaţie
mai dificil de analizat şi presupune o oarecare experienţă în analiza datelor,
folosindu-se frecvent în ana-
liza factorială şi în corelaţii
parţiale. În figura 1.25, re-
prezentând tridimensional
cele trei variabile, putem
observa uşor lipsa efectului
emoţiilor din timpul exame-
nului. Norul de puncte este
concentrat preponderent în
zona variabilelor „nota exa-
men” şi „timp de studiu”, cu
orientare către scoruri mici
ale dimensiunii „emoţiei din
timpul examenelor”.
Graficul de tip „Sim- Figura 1.26 – Formularul de definire a graficului de tip
ple dot” nu-l vom discuta. „nor de puncte”
126
Cristian Opariuc-Dan
127
Statistică aplicată în ştiinţele socio-umane
128
Cristian Opariuc-Dan
129
Statistică aplicată în ştiinţele socio-umane
că, sociologică sau economică a faptelor constatate. Nici nu este cazul. Statis-
tica se bazează pe datele existente şi oferă un raport constatativ şi nu explica-
tiv a fenomenelor. Interpretarea statistică nu se poate confunda cu un alt tip
de interpretare. Deşi sunt psiholog de profesie, nu m-aş hazarda să fac apreci-
eri asupra acestor fapte, în condiţiile unei lucrări destinate însuşirii tehnicilor
de analiză a datelor. Având la dispoziţie aceste date, un sociolog îşi poate
exprima punctul de vedere, un psiholog poate avea viziune proprie, la fel şi
un economist sau un medic psihiatru. Reţineţi că metodele de analiză a date-
lor oferă fapte. Interpretarea faptelor cade în sarcina analistului.
Exerciţii:
Studiaţi legătura care există între performanţa la examen şi timpul
alocat studiului, precum şi între emoţiile din timpul examenului şi timpul
alocat studiului. Stabiliţi ipotezele, precizaţi tipul acestora, analizaţi cifric şi
grafic coeficienţii de corelaţiei, elaboraţi raportul.
130
Cristian Opariuc-Dan
131
Statistică aplicată în ştiinţele socio-umane
132
Cristian Opariuc-Dan
În tabelul 1.39, puteţi observa lipsa oricărei asocieri între cele două
variabile. Putem afirma că cele două variabile nu sunt corelate liniar, genul
biologic nu determină niciun efect asupra timpului de studiu.
133
Statistică aplicată în ştiinţele socio-umane
134
Cristian Opariuc-Dan
Sex Culoare Educatie Grad Inaltime Greutate Sex Culoare Educatie Grad Inaltime Greutate
1 3 4 4 172 87 2 3 2 2 193 94
2 1 4 3 184 79 1 4 2 2 177 92
2 3 4 3 176 86 1 4 2 2 170 69
1 1 3 3 173 85 2 2 2 2 188 81
1 3 3 3 187 77 2 2 2 2 172 76
1 4 3 4 178 80 1 2 2 1 170 93
2 1 3 4 170 82 1 4 2 1 171 74
1 1 3 3 171 71 2 3 2 1 186 77
1 3 3 3 172 79 2 1 2 1 187 92
135
Statistică aplicată în ştiinţele socio-umane
1 3 3 3 170 89 1 1 2 1 191 99
1 4 3 3 185 90 1 4 2 1 178 72
2 4 3 3 172 94 2 4 2 1 181 85
1 1 3 3 187 75 2 3 2 1 187 72
1 4 3 3 184 83 1 3 2 1 189 86
2 4 3 3 175 80 2 3 2 1 170 77
1 3 3 3 187 84 1 3 2 2 182 90
1 4 3 3 169 71 1 2 2 2 186 90
2 3 3 2 171 93 1 2 2 2 193 97
1 2 3 2 188 69 1 3 2 1 177 70
1 2 3 2 174 74 2 3 1 1 182 82
1 3 3 2 174 78 1 3 1 1 188 87
1 3 3 2 184 91 1 3 1 2 172 97
136
Cristian Opariuc-Dan
137
Statistică aplicată în ştiinţele socio-umane
138
Cristian Opariuc-Dan
139
Statistică aplicată în ştiinţele socio-umane
140
Cristian Opariuc-Dan
141
Statistică aplicată în ştiinţele socio-umane
142
Cristian Opariuc-Dan
143
Statistică aplicată în ştiinţele socio-umane
144
Cristian Opariuc-Dan
145
Statistică aplicată în ştiinţele socio-umane
146
Cristian Opariuc-Dan
147
Statistică aplicată în ştiinţele socio-umane
148
Cristian Opariuc-Dan
149
Statistică aplicată în ştiinţele socio-umane
150
Cristian Opariuc-Dan
Reprezentarea grafică
a datelor vine în sprijinul de-
monstraţiei cifrice. Genul
persoanelor investigate nu are
nicio legătură cu culoarea
ochilor acestora. Graficul ara-
tă doar o preponderenţă a
ochilor căprui la ambele sexe
şi o oarecare frecvenţă mai
ridicată a ochilor negri la băr-
baţi. Culorile deschise au în
Figura 1.40 – Reprezentarea grafică a relaţiei dintre
culoarea ochilor şi genul biologic. continuare o frecvenţă scăzută,
atât la bărbaţi cât şi la femei.
Iată că prin procedee neparametrice, situate chiar la un nivel nominal, s-a
putut demonstra o ipoteză de cercetare.
Înainte de a încheia, vom furniza câteva exemple, fără a intra în deta-
lii, pentru a vă putea familiariza cu procedurile de lucru.
Să presupunem că dorim să aflăm relaţia dintre culoarea ochilor şi
gradul militar, adică să vedem dacă, într-adevăr, coloneii au „ochi albaştri”.
Suntem în situaţia analizei legăturii între o variabilă nominală (culoarea ochi-
lor) şi o variabilă ordinală (gradul militar). În acest caz avem două posibili-
tăţi. Fie abordăm analiza la nivel nominal, la fel cum am procedat anterior,
151
Statistică aplicată în ştiinţele socio-umane
deoarece una dintre variabile se află la acest nivel şi aplicăm principiul „ana-
lizei bazate pe variabila cea mai slabă”, fie folosim coeficientul η, coeficient
care relaţionează o variabilă nominală cu una ordinală sau scalară. Noi vom
aborda ambele situaţii. Prin urmare, includem pe linii variabila „culoarea
ochilor” şi pe coloane „gradul militar”. Bifăm şi caseta „Display clustered bar
charts” pentru a putea afişa grafic variabilele, apoi alegem opţiunile „Chi-
square”, „Contingency coefficient”, „Phi and Cramer’s V”, dar şi opţiunea
„Eta” din fereastra de configurare a statisticilor. Vom considera că una dintre
variabile nu îndeplineşte condiţiile testării asimptotice şi vom alege metoda
„Monte Carlo” din fereastra de configurare a testelor de semnificaţie. În final,
apăsăm butonul „OK” pentru a lansa analiza.
Nu vom furniza toate tabelele, majoritatea fiind identice cu cele din
analiza de mai sus.
Tabelul 1.48– Coeficienţi de asociere χ2
Chi-Square Tests
Monte Carlo Sig. (2-sided) Monte Carlo Sig. (1-sided)
99% Confidence 99% Confidence
Interval Interval
Asymp. Sig. Lower Upper Lower Upper
Value df (2-sided) Sig. Bound Bound Sig. Bound Bound
Pearson Chi-Square 13,004a 9 ,162 ,158b ,149 ,168
Likelihood Ratio 14,002 9 ,122 ,210b ,200 ,220
Fisher's Exact Test 11,963 ,159b ,149 ,168
Linear-by-Linear ,123c 1 ,725 ,769b ,758 ,779 ,397b ,384 ,409
Association
N of Valid Cases 50
a. 13 cells (81,3%) have expected count less than 5. The minimum expected count is ,80.
b. Based on 10000 sampled tables with starting seed 2000000.
c. The standardized statistic is -,351.
Constatăm că statisticile bazate pe χ2 sunt mult mai elaborate la utili-
zarea metodei Monte Carlo. Avem pragurile de semnificaţie atât pentru me-
toda clasică, asimptotică, dar şi pentru metoda Monte Carlo, alături de inter-
valele de încredere. Desigur, nu există nicio legătură între cele două variabile,
152
Cristian Opariuc-Dan
aşa cum reiese şi din tabelul 1.49, tabelul coeficienţilor de asociere derivaţi
din χ2.
Toţi cei trei coeficienţi de asociere calculaţi arată, din nou, lipsa core-
lației între cele două variabile. Oricum, se poate observa creşterea preciziei
pragului de semnificaţie la utilizarea metodei Monte Carlo în comparaţie cu
testul clasic.
Tabelul 1.49– Coeficienţi de asociere derivaţi din χ2
Symmetric Measures
Monte Carlo Sig.
99% Confidence Interval
Value Approx. Sig. Sig. Lower Bound Upper Bound
Nominal by Nominal Phi ,510 ,162 ,158a ,149 ,168
a
Cramer's V ,294 ,162 ,158 ,149 ,168
Contingency Coefficient ,454 ,162 ,158a ,149 ,168
N of Valid Cases 50
a. Based on 10000 sampled tables with starting seed 2000000.
153
Statistică aplicată în ştiinţele socio-umane
154
Cristian Opariuc-Dan
Exerciţii:
Analizaţi şi interpretaţi legăturile dintre: „gen biologic” şi „grad mi-
litar”, „culoarea ochilor” şi „ultima şcoală absolvită”, „gen biologic” şi
„greutate”. Explicaţi şi argumentaţi utilizarea coeficienţilor.
Vă voi lăsa acum în compania SPSS să vă jucaţi cu opţiunile şi cu in-
dicatorii corelaţiilor, să experimentaţi mai multe variante, deoarece numai aşa
veţi putea să vă perfecţionaţi. Nu vom încheia însă acest capitol, decât după
ce vom realiza câteva referiri generale la modul de raportare al studiilor core-
laţionale.
155
Statistică aplicată în ştiinţele socio-umane
156
Cristian Opariuc-Dan
p= .003 ci expresii de forma p< .05, p< .01 sau p< .001, acesta
fiind şi standardul raportărilor ştiinţifice.
5. Un prag de semnificaţie p= .05 nu este semnificativ. Sunt
semnificative doar pragurile mai mici de .05, nu şi cele egale
cu această valoare. În ştiinţele sociale, de obicei raportăm
semnificaţii mai mici de .05 sau mai mici de .01. Foarte rar
ajungem la niveluri mai mici de .001 şi în mod excepţional la
praguri de semnificaţie mai mici de .0001.
În sfârşit am ajuns şi la finalul acestui capitol. A fost, într-adevăr, un
capitol destul de lung, însă şi informaţia a fost consistentă. Acum sper că
aveţi o idee precisă asupra semnificaţiei conceptului de corelaţie, mai exact a
celui de legătură între variabile. Puteţi să fiţi mândri şi să daţi lecţii colegilor
în domeniul studiilor corelaţionale, însă nu vă bucuraţi prea tare, deoarece
avem de discutat lucruri cel puţin la fel de interesante.
Luaţi-vă o pauză. Mergeţi la un grătar, la iarbă verde, relaxaţi-vă, de-
oarece imediat vom aborda un alt capitol, şi anume cel al testelor statistice.
În concluzie:
Relaţiile stabilite în urma analizei a două variabile poartă numele de analize biva-
riate, spre deosebire de analizele univariate care au în vedere doar o singură vari-
abilă;
Gradul de asociere între două variabile se bazează pe conceptul ce covarianţă. Mă-
sura standardizată a covarianţei poartă numele de corelaţie;
Coeficienţii de corelaţie pot fi parametrici şi neparametrici, după cum cele două
variabile îndeplinesc sau nu condiţiile de aplicare ale statisticilor parametrice;
Coeficientul de corelaţie a rangurilor ρ Spearman se poate folosi, în general, pen-
tru variabile ordinale provenite din variabile continui sau pentru variabile continui
care nu îndeplinesc condiţiile necesare aplicării statisticilor parametrice;
Coeficientul de corelaţie a rangurilor τ Kendall are mai multe forme, se bazează pe
calculul inversiunilor şi al proversiunilor şi se foloseşte pentru variabile aflate na-
tural la un nivel de măsură ordinal sau pentru variabile cantitative care nu îndepli-
nesc condiţiile de aplicare a statisticilor parametrice;
157
Statistică aplicată în ştiinţele socio-umane
158
Cristian Opariuc-Dan
159
Statistică aplicată în ştiinţele socio-umane
Studiul relaţiilor între variabile reprezintă doar o mică parte din arse-
nalul analizei de date pe care îl are la dispoziţie specialistul în ştiinţe socio-
umane pentru a desfăşura o cercetare ştiinţifică. Desigur, cercetările corelaţi-
onale se folosesc atunci când dorim să investigăm legătura dintre două varia-
bile (de exemplu legătura dintre coeficientul de inteligenţă şi performanţa
şcolară) şi fac obiectul aşa-numitelor planuri de cercetare de tip corelaţional.
Cum procedăm, însă, atunci când suntem interesaţi de studiul diferenţelor
statistice? Care ar fi abordarea în situaţia unei întrebări de genul: „există dife-
renţe determinate de genul biologic sub aspectul performanţei la matemati-
că?”. În acest caz, un plan de cercetare corelaţional nu ne este de prea mare
folos. Suntem, din nou, în faţa unei provocări. Provocarea analizei inferenția-
le sub aspectelor diferențelor statistice bivariate.
Deşi îşi găseşte locul mai degrabă într-o lucrare din domeniul metodo-
logiei cercetării, următorul subcapitol nu poate fi trecut cu vederea. Vom dis-
160
Cristian Opariuc-Dan
4
Desigur, ne referim la clasificările prezentate în lucrarea anterioară.
161
Statistică aplicată în ştiinţele socio-umane
162
Cristian Opariuc-Dan
163
Statistică aplicată în ştiinţele socio-umane
164
Cristian Opariuc-Dan
165
Statistică aplicată în ştiinţele socio-umane
166
Cristian Opariuc-Dan
167
Statistică aplicată în ştiinţele socio-umane
168
Cristian Opariuc-Dan
169
Statistică aplicată în ştiinţele socio-umane
170
Cristian Opariuc-Dan
171
Statistică aplicată în ştiinţele socio-umane
172
Cristian Opariuc-Dan
173
Statistică aplicată în ştiinţele socio-umane
este format din media generală μ, efectul situaţiei de tratament αk, efectul
determinat de vechimea ca fumător βm, precum şi efectul determinat de genul
biologic γt. În componenţa acestui scor observat intră şi efectele exercitate de
două surse de eroare: erorile la nivelul întregului eşantion, numite şi efect
rezidual εkmt, precum şi efectul erorilor de la nivelul grupului din care face
parte subiectul – de exemplu efectul erorilor determinate de faptul că subiec-
tul Costel este bărbat, fumător înrăit şi urmează un tratament medicamentos
εi(kmt).
Desigur, acest plan de cercetare este unul mult mai precis, însă preci-
zia designului s-a obţinut printr-o proiectare mai complexă şi, desigur, printr-
un număr de subiecţi mai mare. Pentru a putea desfăşura un studiu valid, în
cazul nostru vom avea nevoie de un număr de 240 de subiecţi (8 grupe, fieca-
re grupă conţinând un număr de 30 de subiecţi.
Toate cele trei planuri expuse mai sus se numesc planuri de cercetare
de bază, deoarece modelele mai complexe pot fi construite prin combinarea a
două sau mai multe planuri de acest tip. Aceste modele formează întreaga
structură de organizare şi de clasificare a design-urilor de cercetare (Kirk,
1995).
174
Cristian Opariuc-Dan
175
Statistică aplicată în ştiinţele socio-umane
176
Cristian Opariuc-Dan
Acum ce mai spuneţi? Nu-i aşa că lucrurile stau puţin altfel decât aţi
crezut? Vă puteţi da seama că o afirmaţie de genul plan factorial 2x2 nu mai
este suficientă. Aveţi nevoie de ceva mai multe date pentru a vă face cunos-
cute intenţiile. Nu vom încheia acest capitol înainte de a vă prezenta, foarte
pe scurt, câteva dintre cele mai cunoscute planuri de cercetare complexe.
177
Statistică aplicată în ştiinţele socio-umane
178
Cristian Opariuc-Dan
179
Statistică aplicată în ştiinţele socio-umane
Primul bloc va fi format din subiecţii cei mai „tineri” din punctul de
vedere al fumatului, atât din mediul urban, cât şi din mediul rural (rangurile 1
şi 2). Al doilea bloc va conţine subiecţii cu rangurile 3 şi 4, al treilea bloc
subiecţii cu rangurile 5 şi 6 şi aşa mai departe, până la ultimul bloc. Am con-
180
Cristian Opariuc-Dan
struit astfel un plan factorial randomizat cu blocuri, după cum se poate obser-
va în tabelul 2.7.
Bineînţeles, acest plan factorial este superior planului factorial com-
plet randomizat, deoarece permite includerea unei variabile confundate şi,
implicit, creşterea rigurozităţii cercetării. Ideal ar fi ca ambele variabile inde-
pendente să permită atribuirea aleatorie a subiecţilor. Dacă acest lucru nu este
posibil, vom proceda după schema prezentată.
Ecuaţia caracteristică acestui design de cercetare este următoarea:
Yikm=μ + πi + αk + βm+ (αβ)km + (παβ)ikm
Scorul observat este dat de media generală, de efectul generat de blo-
curi (variabila confundată), de efectul exercitat de prima variabilă indepen-
dentă, de efectul generat de a doua variabilă independentă, de efectul comun
generat de cele două variabile independente şi de efectul erorilor determinate
de cele două variabile independente şi de variabila confundată (erori determi-
nate de bloc).
*
* *
Ne vom opri aici cu expunerea planurilor de cercetare. Acest capitol
nu intenționează să facă o prezentare exhaustivă a acestora, ci doar să vă in-
formeze asupra elementelor de bază legate de proiectarea unei cercetări știin-
țifice. Informații suplimentare referitoare la planurile de cercetare și prezenta-
rea detaliată a acestora găsiți în lucrări specializate pe metodologia cercetării,
o parte dintre acestea fiind prezentate mai sus.
Ați observat deja că planurile de cercetare complexe derivă, de fapt,
din cele de bază, nefiind altceva decât combinații la diferite niveluri ale aces-
tora. Să trecem acum la scopul real al acestui capitol, și anume acela de a
prezenta câteva tehnici statistice de analiză a datelor bazate pe diferențe.
181
Statistică aplicată în ştiinţele socio-umane
182
Cristian Opariuc-Dan
183
Statistică aplicată în ştiinţele socio-umane
∑ (formula 2.1)
(formula 2.2)
(formula 2.3)
184
Cristian Opariuc-Dan
Diferențele dintre cele două valori ale lui χ2 (2,68 după formula 2.3 și
2,75 după formula 2.1) apar din cauza erorilor de rotunjire la două zecimale
și sunt nerelevante. Dacă ambele variabile sunt dihotomice, se folosește co-
recția pentru continuitate, așa cum s-a discutat deja în capitolul anterior.
Iată, cu grație și câteva calcule am reușit să găsim valoarea acestui in-
dicator. Acum, dacă tot o avem, ce facem cu ea? Ei bine, comparăm această
valoare cu valorile prag prezentate în tabelul de referință din anexa 3. Mai
avem o singură problemă: la câte grade de libertate? Vă mai aduceți probabil
aminte din primul capitol că gradele de libertate se află foarte simplu, pe baza
liniilor și a coloanelor din tabel. Astfel df=(linii-1)(coloane-1). Noi avem
două linii și două coloane, prin urmare df=(2-1)(2-1)=1x1=1. Linia care ne
interesează este, așadar, prima linie din tabelul din anexă. Pentru un prag de
semnificație p<0,05, valoarea indicatorului χ2 trebuie să fie mai mare de
3,841. Valorile noastre sunt mult mai mici în comparație cu această valoare
185
Statistică aplicată în ştiinţele socio-umane
186
Cristian Opariuc-Dan
∑ (formula 2.4)
∑ [ ]
187
Statistică aplicată în ştiinţele socio-umane
188
Cristian Opariuc-Dan
189
Statistică aplicată în ştiinţele socio-umane
Blonde: 0, 0, 1, 1, 2, 2, 2, 3, 3, 4 Me(blonde)= 2
Brunete: 0, 0, 0, 1, 1, 1, 2, 2, 2, 3 Me(brunete)=1
Mediana întregului lot de cercetare este 1,5, fiind situată, în mod evi-
dent, la a 10,5-a măsurătoare, între valorile 1 și 2. Stabilind aceste elemente
de bază, urmează să contabilizăm numărul de scoruri aflate sub valoarea me-
dianei generale și numărul de scoruri aflate peste valoarea medianei generale.
Pentru aceasta vom construi următorul tabel de contingență:
Tabelul 2.9 – Tabelul de analiză pentru testul medianei
Sub mediana Peste mediana
Total
generală (Me) generală (Me)
4 6
Blonde 10
A B
6 4
Brunete 10
C D
Total 10 10 n=20
190
Cristian Opariuc-Dan
[ ]
(formula 2.5)
191
Statistică aplicată în ştiinţele socio-umane
Dacă privim cu atenție tabelul de mai sus, vom observa că, cel puțin
în aparență, avem condițiile aplicării unor teste parametrice. Totuși, nu este
așa, acel scor extrem (20 accidente) determinând o distribuție skewness pozi-
192
Cristian Opariuc-Dan
tiv, cu tendințe către valori mici ale accidentelor. În acest caz, evident că vom
folosi teste neparametrice în locul celor parametrice, mai exact testul U
Mann-Whitney.
Pentru a determina valoarea exactă a testului statistic, trebuie, în pri-
mul rând, să ordonăm crescător sau descrescător datele, apoi să calculăm
rangurile. Realizăm acest lucru prin cumularea cele două șiruri într-unul sin-
gur. Vom avea 8 femei cu zero accidente, 4 femei cu un accident, 2 femei cu
două accidente și așa mai departe, până la o singură femeie cu 20 de acciden-
te (știm deja că este blondă). Evident, șirul a fost în prealabil ordonat crescă-
tor după numărul accidentelor.
Tabelul 2.11 – Calculul rangurilor
Accidente
0 1 2 3 4 5 6 7 8 20 Total
Grup
Blonde 3 2 1 2 2 3 3 1 2 1 20
Brunete 5 2 1 3 1 3 2 2 1 0 20
Total 8 4 2 5 3 6 5 3 3 1 40
1 9 13 15 20 23 29 34 37 40
2 10 14 16 21 24 30 35 38
3 11 17 22 25 31 36 39
4 12 18 26 32
Poziții
5 19 27 33
6 28
7
8
Rang 4,5 10,5 13,5 17 21 25,5 31 35 38 40
Calculul rangurilor din tabelul 2.11 s-ar putea să vă deruteze puțin, în-
să nu vă impacientați. Opt femei nu au comis niciun accident. În mod cert,
ele vor ocupa primele opt poziții în șirul ordonat (pozițiile de la 1 la 8). Deoa-
rece cele opt poziții au aceeași valoare (valoarea zero accidente), rangul va fi
reprezentat de media pozițiilor ocupate de scoruri. Adunând numerele de la
193
Statistică aplicată în ştiinţele socio-umane
unu la opt și împărțind suma la opt, rezultă 4,5, acesta fiind rangul scorului
„zero accidente”.
Următoarele patru femei au comis câte un singur accident. Bineînțe-
les, ele vor ocupa pozițiile următoare, de la poziția a noua, la poziția doispre-
zece. Rangul scorului „un accident rutier” va fi media acestor patru poziții –
de la 9 la 12 –, adică 10,5. Procedăm similar pentru a calcula rangurile tutu-
ror scorurilor din distribuția noastră. Nu este deloc dificil, doar diferit față de
cum erați dumneavoastră obișnuiți.
În următoarea etapă, va trebui să calculăm suma rangurilor pentru fie-
care grup de cercetare. Din moment ce știm deja rangul fiecărui scor, suma
rangurilor se calculează foarte simplu, înmulțind efectivul care a obținut sco-
rul respectiv, cu rangul asociat scorurilor, apoi adunând toate aceste produse.
Pentru a ne ușura sarcina, vom construi tabelul 2.12 și obținem suma ranguri-
lor pentru grupul blondelor de 444,5 și suma rangurilor pentru brunete 375,5.
Suma totală a rangurilor va fi 820 (∑R1+∑R2=444,5+375,5=820).
194
Cristian Opariuc-Dan
(∑ ∑ ) (formula 2.6)
(∑ ∑ )
( )
195
Statistică aplicată în ştiinţele socio-umane
(formula 2.7)
√
√
√ √
196
Cristian Opariuc-Dan
197
Statistică aplicată în ştiinţele socio-umane
198
Cristian Opariuc-Dan
( )
(formula 2.8)
√
Toate datele necesare înlocuirii în formulă există deja, iar după efec-
tuarea calculelor obținem o valoare z de -3,03.
( ) ( )
√ √
√
Această valoare obținută, luată fără semn, este mai mare decât valoa-
rea critică 2,58 pentru un prag de semnificație mai mic de 0,01, astfel încât
putem respinge ipoteza nulă. Folosind aceste date, putem spune că, într-
adevăr, de această dată culoarea părului are efect. Există diferențe între blon-
de și brunete sub aspectul numărului de accidente comise.
Pentru a vedea sensul acestor diferențe, adică pentru a vedea dacă
blondele comit mai multe accidente în comparație cu brunetele sau invers, nu
avem decât să calculăm medianele celor două șiruri.
Acest test statistic este destul de puțin folosit în științele socio-umane,
deoarece procesul de creare a secvențelor este unul migălos și de durată. De
cele mai multe ori procedeul este folosit pentru a verifica dacă șirul de date
are sau nu are un caracter aleatoriu. Desigur, procedeul de calcul este altul, se
folosește șirul de date neordonat, calculându-se nota z după o altă formulă.
Atunci când dorim să verificăm dacă datele au un caracter aleatoriu,
alături de acest test mai avem la dispoziție testul fazelor Wallis-Moore sau
199
Statistică aplicată în ştiinţele socio-umane
200
Cristian Opariuc-Dan
înainte 10 țigări, iar după tratament fumează 6 țigări. Subiectul P.A. fumează
înainte de tratament 9 țigări, după tratament 10 țigări și așa mai departe.
201
Statistică aplicată în ştiinţele socio-umane
(formula 2.9)
√
√ √
și
√ √
În ambele situații, valoarea z este 1,58, mai mică decât valoarea prag
1,96 pentru un prag de semnificație mai mic de 0,05. Desigur, testul este ne-
semnificativ – era și normal să fie așa –, nu vom respinge ipoteza nulă con-
form căreia tratamentul anti-fumat nu are nici un efect.
202
Cristian Opariuc-Dan
nu are importanță, iar nivelul de măsură poate fi cel puțin unul ordinal. Testul
semnelor și proba Wilcoxon pot fi administrate valorilor sau rangurilor, fără
ca acest lucru să influențeze importanța lor.
Pentru clarificare, vom relua exemplul folosit anterior, de data aceasta
urmărind calculul unui test statistic mai eficient. Ați dedus bine, este vorba
despre testul Wilcoxon.
Primul pas, la fel ca și în cazul celeilalte probe, se referă la calculul
diferențelor dintre scoruri. De această dată vom reține și valorile acestor dife-
rențe. Probabil că ați observat un lucru de nuanță; dacă la testul semnelor
diferența a fost După – Înainte, aici diferența este Înainte – După. În realitate
acest lucru nu are nicio importanță. Singura diferență obținută va fi cea legată
de semn. Diferențele pozitive vor fi negative în al doilea caz și reciproc. Nu
este cazul să vă bateți capul prea tare cu aceste diferențe, rămâne la latitudi-
nea dumneavoastră să le efectuați cum doriți. Dacă folosiți prima situație
Tabelul 2.14 – Modalitate de calcul pentru testul Wilcoxon (După – Înainte) și obți-
Subiect Înainte După Diferențe Ranguri
M.C. 10 6 +4 +4,5
neți o diferență semnifica-
P.A. 9 10 -1 -1,5 tivă pozitivă, atunci în-
D.V. 15 11 +4 +4,5 seamnă că tratamentul a
S.T. 13 11 +2 +3
B.L. 12 12 0 - avut efect, în sensul că a
A.T. 18 18 0 - crescut numărul de țigări
M.Z. 21 20 +1 +1,5
fumate – normal, deoarece
R.V. 32 15 +17 +9
I.G. 35 12 +23 +10 diferența pozitivă provine
J.I. 24 29 -5 -6 din faptul că valorile în
S.I. 26 10 +16 +8
A.C. 18 7 +11 +7
situația „După” sunt mai
∑R+ 47,5 mari decât valorile în situ-
∑R- 7,5 ația „Înainte”. Dacă dife-
rența este semnificativă și negativă, înseamnă că tratamentul a avut efect în
sensul reducerii numărului de țigări, conform aceluiași algoritm.
203
Statistică aplicată în ştiinţele socio-umane
204
Cristian Opariuc-Dan
(formula 2.10)
√
Datele din formulă sunt știute. La fel ca și în cazul anterior, suma ran-
gurilor este cea mai mică sumă a rangurilor dintre suma rangurilor pozitive și
suma rangurilor negative.
√ √ √
205
Statistică aplicată în ştiinţele socio-umane
206
Cristian Opariuc-Dan
Niciodată Întotdeauna
1 2 3 4 5
207
Statistică aplicată în ştiinţele socio-umane
(formula 2.11)
√
208
Cristian Opariuc-Dan
√ √
209
Statistică aplicată în ştiinţele socio-umane
(formula 2.12)
√
210
Cristian Opariuc-Dan
un nou tip de bere (de fapt exact berea neagră Guinness pe care o bem acum).
Proaspăt absolvent al universității Oxford, Gosset a fost imediat „botezat” de
către noul său patron cu numele de „studentul”. Monitorizând ingredientele
berii și inventând testele t, „studentul” a văzut ce anume face diferența sem-
nificativă la nivel de calitate. Deoarece procedeul de fabricație – inclusiv
metodele matematice folosite – reprezentau un secret comercial, Gosset a fost
nevoit să publice descoperirea testelor t, în revista Biometrika, nu sub numele
său real ci sub pseudonimul cu care îl gratulase șeful său. Acesta este motivul
pentru care cele mai cunoscute teste statistice de comparație poartă un nume
atât de ciudat.
După ce ne-am relaxat puțin, vom reconsidera exemplul anterior. Stu-
denții universității Ovidius din Constanța consumă, în medie, 1,3 litri de bere
pe zi (µ), iar un eșantion de 34 de studenți la psihologie, consumă, în medie,
2,1 litri de bere zilnic (m), cu o abatere standard de 3,1 litri de bere (s). În
acest caz, valoarea testului t devine:
√ √
211
Statistică aplicată în ştiinţele socio-umane
(formula 2.13)
√
212
Cristian Opariuc-Dan
√ √
√
213
Statistică aplicată în ştiinţele socio-umane
(formula 2.14)
√ ( )
(formula 2.15)
√ ( )
214
Cristian Opariuc-Dan
√
√ ( )
√
√
215
Statistică aplicată în ştiinţele socio-umane
(formula 2.16)
√
√
√
Nu este cine știe ce câștig, este doar o ajustare. Oricum, testul t rămâ-
ne, în continuare, nesemnificativ.
216
Cristian Opariuc-Dan
H0: m1=m2 - Nu există nicio diferență între mediile celor două popu-
lații din care s-au extras eșantioanele perechi (ipoteza nulă);
H1: m1≠m2 - Există o diferență semnificativă între mediile celor două
populații din care s-au extras eșantioanele perechi (ipoteză alternativă bila-
terală);
H2: m1>m2 - Media primului eșantion este semnificativ mai mare în
comparație cu media celui de-al doilea eșantion (ipoteză alternativă unilate-
rală).
H3: m1<m2 - Media primului eșantion este semnificativ mai mică în
comparație cu media celui de-al doilea eșantion (ipoteză alternativă unilate-
rală).
Pentru a nu ne limita la o abordare simplistă, să considerăm următorul
experiment:
Un număr de 15 fumători au participat la o ședință de psihoterapie în
vederea abandonării fumatului. Ne interesează să știm dacă ședința de psiho-
terapie a avut sau nu a avut efect. Prin urmare, ce s-a întâmplat cu numărul
țigărilor fumate de către cei 15 fumători după psihoterapie. Ipoteza nulă ne
spune că ședința de psihoterapie nu are niciun efect. Transpus în termeni ști-
ințifici, avem următoarele posibilități:
H0: m1=m2 – Nu există nicio diferență semnificativă între media țigă-
rilor fumate înainte de ședința de psihoterapie și media țigărilor fumate după
ședința de psihoterapie (ipoteza nulă);
H1: m1≠m2 – Există o diferență semnificativă între media țigărilor fu-
mate înainte de ședința de psihoterapie și media țigărilor fumate după ședința
de psihoterapie (ipoteză alternativă bilaterală);
H2: m1>m2 – Media țigărilor fumate înaintea ședinței de psihoterapie
este semnificativ mai mare în comparație cu media țigărilor fumate după șe-
217
Statistică aplicată în ştiinţele socio-umane
218
Cristian Opariuc-Dan
(formula 2.17)
√
( )
(formula 2.18)
Desigur, avem deja toate datele necesare pentru a calcula dispersia di-
ferențelor.
( )
√
√
219
Statistică aplicată în ştiinţele socio-umane
(formula 2.19)
( )
√
220
Cristian Opariuc-Dan
221
Statistică aplicată în ştiinţele socio-umane
(formula 2.20)
√
(formula 2.21)
√
√ √
222
Cristian Opariuc-Dan
testată fiind aberantă. Testul statistic este semnificativ dacă valoarea sa este
mai mare sau egală cu valoarea de referință prezentată în tabelul din anexa
12.
Pentru n=18, valoarea de referință este 2,17 la un prag de semnificație
mai mic de 0,05 și 3,00 pentru un prag de semnificație mai mic de 0,01. În
mod cert, testul nostru este semnificativ la un prag de semnificație mai mic
de 0,01, ipoteza nulă se respinge, valoarea testată (2) fiind o valoare aberantă.
223
Statistică aplicată în ştiinţele socio-umane
| | | | | |
224
Cristian Opariuc-Dan
(formula 2.26)
(formula 2.27)
Dacă valoarea testată este cea mai mare din șir, se folosește formula
2.26, iar dacă valoarea testată este cea mai mică din șir, formula 2.27.
Cred că ați observat deja un lucru interesant. Testul Grubbs nu repre-
zintă altceva decât nota z a scorului presupus aberant.
Să considerăm un exemplu, în care un număr de 130 de subiecți au
efectuat un test de atenție. Media scorurilor obținute de cei 130 de subiecți
este m=21,35 puncte iar abaterea standard s=5,41 puncte. Ne întrebăm dacă
scorul maxim x=53 puncte este sau nu un scor aberant.
Pentru că valoarea testată este cea mai mare valoare din șir, aplicăm
formula 2.26 pentru testul Grubbs.
225
Statistică aplicată în ştiinţele socio-umane
226
Cristian Opariuc-Dan
Da, așa este, revenim, iată, la bazele statisticii. Procedura este analogă, doar
că vom folosi media și abaterea standard pentru crearea claselor.
Tabelul 2.18 – Testul de normalitate bazat pe χ2
Clase f zi F(zi) π(zi) f*π(zi) f-ft (f-ft)2 (f-ft)2/ft
Clasa 1 (i=1)
< m-2,5s 1 -2,5 0,0062 0,0062 0,0062 0,9938 0,98763844 159,296523
< 13,58
Clasa 2 (i=2)
(m-2,5s…m-2s] 4 -2 0,0228 0,0166 0,0664 3,9336 15,473209 233,030255
13,58-14,65
Clasa 3 (i=3)
(m-2s…m-1,5s] 15 -1,5 0,0668 0,044 0,66 14,34 205,6356 311,569091
14,66-15,72
Clasa 4 (i=4)
(m-1,5s…m-1s] 49 -1 0,1587 0,0919 4,5031 44,4969 1979,97411 439,691348
15,73-16,79
Clasa 5 (i=5)
(m-1s…m-0,5s] 65 -0,5 0,3085 0,1498 9,737 55,263 3053,99917 313,648883
16,80-17,86
Clasa 6 (i=6)
(m-0,5s…m] 104 0 0,5000 0,1915 19,916 84,084 7070,11906 354,99694
17,87-18,93
Clasa 7 (i=7)
(m…m+0,5s] 97 +0,5 0,6915 0,1915 18,5755 78,4245 6150,4022 331,102915
18,94-20,00
Clasa 8 (i=8)
(m+0,5s…m+1s] 87 +1 0,8413 0,1498 13,0326 73,9674 5471,17626 419,806966
20,01-21,07
Clasa 9 (i=9)
(m+1s…m+1,5s] 38 +1,5 0,9332 0,0919 3,4922 34,5078 1190,78826 340,985127
21,08-22,14
Clasa 10 (i=10)
(m+1,5s…m+2s] 18 +2 0,9772 0,044 0,792 17,208 296,115264 373,882909
22,15-23,21
Clasa 11 (i=11)
(m+2s…m+2,5s] 5 +2,5 0,9938 0,0166 0,083 4,917 24,176889 291,287819
23,22-24,28
Clasa 12 (i=12)
> m+2s 3 +3 0,9987 0,0049 0,0147 2,9853 8,91201609 606,259598
> 24,28
TOTAL 486 4175,55837
Există mai multe variante de lucru. Cea mai comodă variantă este să
lucrăm cu intervale având dimensiunea de jumătate de abatere standard. Exis-
227
Statistică aplicată în ştiinţele socio-umane
tând șase abateri standard într-o distribuție normală, vor rezulta un număr de
12 clase.
Prima clasă va conține scorurile mai mici decât media minus 2,5 aba-
teri standard. A doua clasă cuprinde scorurile cuprinse între media minus 2,5
abateri standard și media minus 2 abateri standard. Clasa a treia se referă la
scoruri cuprinse între media minus 2 abateri standard și media minus 1,5 aba-
teri standard și așa mai departe, după cum puteți vedea în tabelul 2.18.
După construcția claselor, stabilim, evident, frecvențele absolute la
nivelul fiecărei clase. Urmează calcului variabilei normale z, pentru fiecare
dintre cele 12 clase, după expresia următoare
(formula 2.28)
228
Cristian Opariuc-Dan
prezentată în tabelul din anexa 13, tabel care ne ajută să extragem probabili-
tățile teoretice pentru fiecare scor z. Înainte de a efectua calculele, se impune
totuși să precizăm că dacă scorul z este negativ, atunci F(-z)=1 – F(z). Adică,
pentru a calcula un scor z negativ, trebuie să scădem din valoarea 1, valoarea
F(z) din tabel pentru acel scor. Vedem imediat cum se procedează.
Prima clasă are z=-2,5. În tabelul din anexa 13, pentru un z=2,5 avem
F(z)=0,9938. Cum însă z este negativ, obținem F(z)=1 – 0,9938, adică 0,0062.
A doua clasă are z=-2. În tabelul din anexa 13 avem pentru un z=2, valoarea
0,9772. Din aceleași motive, obținem F(z)=1 – 0,9772=0,0228. La fel proce-
dăm cu toate clasele, până la clasa a șasea.
Pentru clasa a șasea, unde avem z=0, F(z)=0,5000. Deoarece z nu mai
este negativ, aceasta este și valoarea căutată. La fel, clasa a șaptea, unde
F(z)=0,6915.
Totuși, până acum nu am stabilit decât probabilitățile teoretice cumu-
late pentru distribuția noastră, deoarece funcția Laplace este, după cum am
spus, o funcție cumulativă. Am fi mai curând interesați de probabilitățile teo-
retice efective, nu de cele cumulate. Din fericire, acest lucru este simplu de
aflat. Nu avem decât să scădem din probabilitatea teoretică cumulată a unei
clase, probabilitatea teoretică cumulată a clasei anterioare și iată, am obținut
probabilitățile teoretice efective pentru fiecare dintre clase. Așadar, vom avea
o nouă coloană în tabelul 2.18, coloana π(zi) unde:
(formula 2.29)
Pentru prima clasă nu avem o clasă anterioară, așadar π(zi)=0,0062. A
doua clasă va fi π(zi)=0,0228-0,0062=0,0166. Pentru a treia clasă vom avea
π(zi)=0,0668-0,0228=0,0440 și așa mai departe. După calculul probabilități-
lor teoretice efective, urmează să înmulțim frecvența absolută a fiecărei clase
cu probabilitatea teoretică efectivă (f*π(zi)). Această valoare o putem denumi
229
Statistică aplicată în ştiinţele socio-umane
frecvență teoretică și o notăm cu ft. Având aceste elemente, putem acum trasa
formula de calcul pentru χ2 atunci când efectuăm testul de normalitate:
∑ (formula 2.30)
Destul de simplu. Din formulă mai rezultă câțiva pași. Să facem dife-
rențele dintre frecvența observată și frecvența teoretică, să ridicăm la pătrat
aceste diferențe și apoi să împărțim pătratele la frecvența teoretică. În final
efectuăm suma acestor rezultate și obținem valoarea pentru χ2. Valoarea
noastră este foarte mare. Am obținut χ2=4175,55. Această valoare o vom
compara cu valoarea de referință pentru un număr de k-3 grade de libertate,
deoarece avem doi parametri – media și abaterea standard. În situația noastră,
valoarea indicatorului este comparată la 12-3=9 grade de libertate. La un prag
de semnificație mai mic de 0,01, valoarea de referință este de 21,665. Valoa-
rea obținută este mult mai mare decât valoarea prag, testul este semnificativ
la un prag de semnificație mai mic de 0,01, vom respinge ipoteza nulă. Cu
alte cuvinte, distribuția empirică diferă semnificativ de distribuția teoretică
normală. Pe scurt, datele noastre nu se distribuie normal.
Folosind această metodă putem compara o distribuție empirică nu
numai cu distribuția normală, dar și cu alte distribuții, precum distribuția Po-
isson, binomială, etc.
230
Cristian Opariuc-Dan
∑
(formula 2.31)
Tabelul 2.19 – Calcului estimației b pentru testulÎn primul rând, formăm co-
Shapiro-Wilk
loana XI pentru fiecare valoare a lui
k xI xII Wk a Wk*a
1 190 330 140 0,5739 80,346 k. Practic, această coloană este for-
2 200 290 90 0,3291 29,619 mată din primele k numere ordonate
3 220 280 60 0,2141 12,846
4 240 270 30 0,1224 3,672 crescător – în cazul nostru, primele 5
5 250 260 10 0,0399 0,399 numere. Coloana XII este formată din
126,882
ultimele k numere – 5 numere în
cazul nostru – de data aceasta ordonate descrescător. Vom avea, în situația
noastră, pentru fiecare valoare a lui k de la 1 la 5, șirul X I=190, 200, 220, 240
și 250, și XII=330, 290, 280, 270 și 260. Urmează construcția coloanei Wk,
231
Statistică aplicată în ştiinţele socio-umane
unde Wk nu este altceva decât diferența dintre al doilea și primul șir. Adică,
Wk=XII-XI.
Coeficientul a se extrage din tabelul din anexa 14, pentru diferitele
valori ale lui n și k. În cazul nostru, n=10 și, evident, k=5. Ne deplasăm în
tabel pe coloana numărul 10 (corespunzătoare lui n) și vom avea pentru k=1,
un coeficient a=0,5739. Pentru k=2 avem a=0,3291 și așa mai departe. Copi-
em acești coeficienți în coloana corespunzătoare din tabelul 2.19. Urmează
apoi să înmulțim, pentru fiecare k, coloana Wk și coloana a, rezultatele fiind
trecute într-o ultimă coloană din tabel. Însumând toate aceste produse, obți-
nem expresia estimării liniare a abaterii standard (b), în situația noastră aceas-
ta fiind 126,882.
Restul procesului este foarte simplu și nu îl vom detalia. Este necesar
să calculăm media celor 10 scoruri (m=253 în cazul de față), apoi să scădem
fiecare scor din medie, la fel ca la calculul varianței, (xi-m), să ridicăm la pă-
trat aceste diferențe (xi-m)2 și, în final, să facem suma acestor pătrate. Pentru
exemplul nostru, suma pătratelor diferențelor este 16410. Având toate datele,
putem înlocui acum în formulă:
232
Cristian Opariuc-Dan
| |
√ (formula 2.32)
( )√ (formula 2.33)
√ √ √
233
Statistică aplicată în ştiinţele socio-umane
( )√
( )√
234
Cristian Opariuc-Dan
235
Statistică aplicată în ştiinţele socio-umane
236
Cristian Opariuc-Dan
237
Statistică aplicată în ştiinţele socio-umane
există un element extrem de important care trebuie precizat. Este vorba de-
spre mărimea efectului.
238
Cristian Opariuc-Dan
239
Statistică aplicată în ştiinţele socio-umane
240
Cristian Opariuc-Dan
(formula 2.34)
241
Statistică aplicată în ştiinţele socio-umane
Pare complicat, dar nu este chiar așa. Practic #Xi1>Xj2 reprezintă nu-
mărul de comparații între observațiile dintre cele două grupuri, atunci când
numărul de observații din primul grup este mai mare decât numărul de obser-
vații din al doilea grup.
Să considerăm un exemplu simplu pentru a lămuri formula de calcul.
O cercetare efectuată pe bărbații și femeile dintr-o unitate militară pleacă de
la ipoteza nulă conform căreia nu există nicio diferență între bărbați și femei
sub aspectul gradelor militare de ofițeri. Desigur, ne situăm la un nivel pur
ordinal, unde am notat cu 1 – locotenentul, 2 – căpitanul, 3 – maiorul, 4 –
locotenent colonelul și 5 – colonelul. Datele noastre sunt următoarele
Bărbați: 1, 1, 2, 2, 2, 3, 3, 3, 4, 5 n1=10
Femei: 1, 2, 3, 4, 4, 5 n2=6
Pentru a ușura lucrul, am ordonat deja datele noastre. Urmează con-
strucția așa-numitei matrice de dominanță. În primul rând, construim un tabel
similar tabelului 2.20. Pe coloane trecem una dintre variabile iar pe linii cea-
laltă variabilă. Regula de completare a matricei de dominanță este simplă. O
celulă poate lua valoarea +1 dacă valoarea la nivel de linie este mai mare
decât valoarea la nivel de coloană, 0 dacă cele două valori sunt la fel și -1
dacă valoarea de pe linie este mai mică decât valoarea de pe coloană.
242
Cristian Opariuc-Dan
243
Statistică aplicată în ştiinţele socio-umane
și +1 (atunci când toate observațiile din primul grup sunt mai mici decât ob-
servațiile din al doilea grup). Valoarea 0 arată că observațiile din cele două
grupuri sunt perfect identice. Interpretarea acestui coeficient ca măsură a mă-
rimii efectului, va ține cont de următoarele repere:
Pentru un δ mai mic de 0,147, nu există niciun efect;
Pentru δ cuprins între 0,147 și 0,33, efectul este scăzut;
Pentru δ cuprins între 0,33 și 0,474, efectul este unul mediu,
moderat;
Pentru δ mai mare de 0,474, efectul este puternic.
În cazul nostru, am obținut un efect scăzut. Putem suspecta și existen-
ța unei diferențe semnificative între bărbați și femei în raport cu atribuirea
gradelor militare. Ca exercițiu, vă revine dumneavoastră sarcina să alegeți
testul statistic adecvat și să verificați dacă, într-adevăr, există o asemenea
diferență semnificativă, apoi să decideți ce faceți cu ipoteza nulă.
(formula 2.36)
244
Cristian Opariuc-Dan
Ioan Cuza din Iași. Obținusem un t(88)=1,48, testul fiind nesemnificativ. Adi-
că nu există diferențe semnificative între studenții celor două universități, sub
aspectul consumului de bere. Dacă ar fi existat diferențe semnificative, ar fi
trebuit să calculăm și mărimea efectului.
√ √ (formula 2.37)
(formula 2.38)
√
√
(formula 2.39)
√
245
Statistică aplicată în ştiinţele socio-umane
√ √
Doar nu v-ați fi așteptat să obțineți aici vreun efect puternic. Observați
că și după acest coeficient, ne situăm în același domeniu al efectelor slabe.
Coeficientul g al lui Hedges are o formulă de calcul bazată tot pe coe-
ficientul de determinare și pe cel de corelație al efectelor:
√
(formula 2.40)
√
246
Cristian Opariuc-Dan
247
Statistică aplicată în ştiinţele socio-umane
248
Cristian Opariuc-Dan
249
Statistică aplicată în ştiinţele socio-umane
luați. Puteți, fie include mai mulți subiecți în întregul lot de stu-
diu, fie mări numărul de subiecți la nivelul grupelor de cercetare
considerate cele mai importante din perspectiva ipotezelor stabili-
te;
2. Utilizarea unui design de cercetare cu măsurări repetate. Știți
deja că un design cu măsurări repetate – care folosește eșantioane
dependente – are o putere mai mare în comparație cu design-ul
bazat pe eșantioane independente, deoarece varianța reziduală –
cea determinată de erori, varianța neexplicată – este mai mică. Fo-
losind, de obicei, aceiași subiecți în două condiții experimentale
diferite, erorile determinate de factorii subiectivi sunt mult mai
mici în comparație cu situația în care veți folosi două eșantioane
independente;
3. Introducerea unei covariabile eficiente. Încă nu aveți noțiunea
completă asupra semnificației unei covariabile. Pentru a vă face
cât de cât o idee, revedeți capitolul referitor la corelații parțiale. În
acest volum ne-am limitat la studiul efectelor pe care le exercită o
singură variabilă independentă asupra unei singure variabile de-
pendente. Majoritatea situațiilor de cercetare presupun însă analiza
efectului generat de mai multe variabile independente asupra unei
singure variabile dependente (ANOVA – analiza de varianță), a
efectului generat de mai multe variabile independente asupra mai
multor variabile dependente sau a efectului generat de variabilele
independente asupra variabilelor dependente în condițiile menține-
rii constante a efectului unei variabile – numită covariabilă
(ANCOVA – analiza de covarianță). Despre aceste elemente vom
discuta, însă, în următoarea lucrare. Ceea ce trebuie să știți deo-
camdată este faptul că introducerea unei covariabile, aflată, desi-
gur, în relație cu variabila dependentă, poate determina micșorarea
250
Cristian Opariuc-Dan
251
Statistică aplicată în ştiinţele socio-umane
252
Cristian Opariuc-Dan
253
Statistică aplicată în ştiinţele socio-umane
dows). Deoarece atât aspectul cât și funcționalitatea PASW sunt radical dife-
rite de ceea ce știați deja, vom continua să utilizăm SPSS în acest volum
(versiunea 17), urmând ca în celelalte cărți să trecem către noua variantă de la
IBM.
254
Cristian Opariuc-Dan
255
Statistică aplicată în ştiinţele socio-umane
256
Cristian Opariuc-Dan
257
Statistică aplicată în ştiinţele socio-umane
258
Cristian Opariuc-Dan
259
Statistică aplicată în ştiinţele socio-umane
260
Cristian Opariuc-Dan
261
Statistică aplicată în ştiinţele socio-umane
262
Cristian Opariuc-Dan
stabilește rangurile scorurilor din ambele grupuri. Dacă cele două eșantioane
sunt din aceeași populație – adică dacă nu există diferențe între ele – cele
două grupuri vor fi distribuite aleatoriu în jurul rangurilor generale. Testul
Kolmogorov-Smirnov Z face deja ceea ce știți. Se bazează pe analiza diferen-
ței maxime dintre cele două distribuții cumulative. Practic, este un fel de test
de normalitate, doar că nu se mai compară distribuția teoretică și cea empiri-
că ci distribuțiile celor două eșantioane.
Testul Moses al reacțiilor extreme presupune că variabila indepen-
dentă va afecta unii subiecți într-o direcție și pe alții în direcția opusă. De
obicei, acest test se folosește atunci când lucrăm cu un grup de control. Gru-
pul de control este definit ca fiind grupul 1, în timp ce grupul experimental se
definește ca fiind grupul 2. În cazul nostru, neavând o cercetare cu grupuri de
control, utilizarea acestui test este inadecvată.
Tabelul 2.29 – Rezultatul analizei pentru testul Mann-Whitney Din considerente care
U
țin de specificul datelor noastre,
Ranks
Mean Sum of
vom bifa doar testul Mann-
Culoarea parului N
Rank Ranks Whitney U, acesta fiind singurul
Numar de Blond 12 16,25 195,00 test adecvat, care ne poate furni-
accidente
Brunet 19 15,84 301,00 za informații utile.
Total 31
Test Statisticsb Rezultatele testului
Numar de accidente Mann-Whitney U sunt furnizate
Mann-Whitney U 111,000 în tabelul 2.29. Observăm că
Wilcoxon W 301,000 media rangurilor pentru blonde
Z -,125
este de 16,25 iar pentru brunete
Asymp. Sig. (2-tailed) ,900
Exact Sig. [2*(1-tailed Sig.)] ,921a este de 15,84. Diferența mică
a. Not corrected for ties. dintre cele două medii ale rangu-
b. Grouping Variable: Culoarea parului rilor se confirmă și în tabelul
statisticilor. Într-adevăr, testul nu este semnificativ, valoarea semnificației
statistice (0,921) fiind mult mai mare în comparație cu pragul critic 0,05.
263
Statistică aplicată în ştiinţele socio-umane
264
Cristian Opariuc-Dan
265
Statistică aplicată în ştiinţele socio-umane
Noi vom discuta doar testul Wilcoxon și testul semnelor, acestea fiind
testele adecvate tipului nostru de date. Desigur, pornirea analizei se va face
prin acționarea butonului „OK”.
Cele două tabele ale testului Wilcoxon ne arată că, în urma comparați-
ilor, avem un număr de 18 cazuri în care rangurile au fost calculate pentru
diferențe pozitive (ranguri în care numărul de accidente după cursuri este mai
mic în comparație cu numărul de accidente înainte de cursuri) cu o medie a
rangurilor de 11,39, un număr de 3 ranguri calculate pentru diferențe negative
cu o medie a rangurilor de 8,67 (ranguri în care numărul de accidente după
cursuri este mai mare în comparație cu numărul de accidente înainte de cur-
suri) și 10 ranguri egale.
266
Cristian Opariuc-Dan
267
Statistică aplicată în ştiinţele socio-umane
268
Cristian Opariuc-Dan
269
Statistică aplicată în ştiinţele socio-umane
270
Cristian Opariuc-Dan
folosit, în acest caz, opțiunea „Use specified values” care ne permite introdu-
cerea precisă a valorilor dintr-o variabilă discretă. În cazul în care am fi folo-
sit o variabilă continuă, există posibilitatea transformării acesteia într-una
discretă alegând opțiunea „Cut point”. Această opțiune funcționează la fel ca
și în cazul testelor neparametrice, unde a fost detaliată și exemplificată.
Tabelul 2.34 – Rezultatele testului t Student pentru două eșantioane independente
Group Statistics
Culoarea
N Mean Std. Deviation Std. Error Mean
parului
Numar accidente dupa cursuri Blond 12 1,00 1,128 ,326
Brunet 19 1,26 1,147 ,263
Independent Samples Test
Levene's Test
for Equality of t-test for Equality of Means
Variances
95% Confi-
dence Interval
of the Differ-
ence
Sig. (2- Mean Std. Error
F Sig. t df Lower Upper
tailed) Difference Difference
Equal 2,005 ,167 -,626 29 ,536 -,263 ,420 -1,123 ,597
Numar variances
acci- assumed
dente Equal -,629 23,843 ,536 -,263 ,419 -1,128 ,601
dupa variances
cursuri not as-
sumed
Tabelele generate de acest test sunt ceva mai complexe. Regăsim ta-
belul statisticilor descriptive, în care, pentru fiecare grup, sunt prezentate
numărul de cazuri, mediile, abaterile standard și erorile standard ale mediilor.
Astfel, avem un număr de 12 blonde, media accidentelor acestora după cur-
suri este de 1 cu o abatere standard de 1,12 accidente și o eroare standard a
mediei de 0,32 accidente, precum și un număr de 19 brunete, având o medie a
271
Statistică aplicată în ştiinţele socio-umane
272
Cristian Opariuc-Dan
273
Statistică aplicată în ştiinţele socio-umane
274
Cristian Opariuc-Dan
275
Statistică aplicată în ştiinţele socio-umane
276
Cristian Opariuc-Dan
277
Statistică aplicată în ştiinţele socio-umane
278
Cristian Opariuc-Dan
279
Statistică aplicată în ştiinţele socio-umane
280
Cristian Opariuc-Dan
281
Statistică aplicată în ştiinţele socio-umane
În concluzie:
Extinderea cunoștințelor dobândite în urma studierii unui eșantion la nivelul între-
gii populații, face parte din domeniul statisticilor inferențiale. Orice cercetare știin-
țifică are la bază un plan (design) de cercetare;
Un design de cercetare este un plan care permite atribuirea subiecților în diferite
condiții experimentale, împreună cu modalitățile de analiză ale datelor rezultate.
Planurile de cercetare pot fi de bază sau complexe. Planurile de cercetare comple-
xe derivă din combinațiile planurilor de cercetare de bază;
Planurile de cercetare de bază sunt: designul complet aleatoriu (CR-p), designul
aleatoriu cu blocuri (RB-p) și designul pătratelor latine (LS-p);
Testele statistice neparametrice se aplică atunci când datele sunt situate la un nivel
de măsură neparametric sau când datele sunt parametrice, însă nu este îndeplinită
condiția distribuției normale;
Principalele teste neparametrice sunt: testul diferențelor dintre frecvențe χ2, testul
medianei pentru eșantioane independente, testul Mann-Whitney U pentru eșantioa-
ne independente, testul iterațiilor Wald-Wolfowitz (Runs), testul semnelor pentru
eșantioane dependente, testul Wilcoxon;
Principalele teste parametrice sunt: testele pentru un singur eșantion, teste pentru
două eșantioane independente și teste pentru două eșantioane perechi;
Există și teste specifice, testele de depistare a unor valori aberante și testele de
comparare a distribuției empirice cu o distribuție teoretică, în general distribuția
normală;
La interpretarea unui test statistic se ține cont de pragul de semnificație, valoarea
testului, semnul testului și mărimea efectului;
Creșterea puterii unei cercetări științifice se poate realiza prin măsuri care țin de:
designul cercetării, măsurătorile efectuate în cadrul cercetării și metodele statistice
folosite.
282
Cristian Opariuc-Dan
III.ANALIZA FIDELITĂŢII
În acest capitol se va discuta despre:
Conceptul de fidelitate şi validitate;
Tehnicile şi metodele de calcul ale fidelităţii;
Modalitatea de alegere a metodei de analiză a fi-
delităţii;
Relevanţa şi strategiile de calcul ale fidelită-
ţii;
După parcurgerea capitolului, cititorii vor fi capabili să:
Înţeleagă principiile generale şi utilitatea fide-
lităţii şi a validităţii;
Calculeze coeficienţii de fidelitate, în funcţie
de specificul cercetării;
Analizeze şi să interpreteze elementele specifice
de studiu ale fidelităţii;
Utilizeze SPSS în calculul coeficienţilor de fide-
litate.
283
Statistică aplicată în ştiinţele socio-umane
284
Cristian Opariuc-Dan
285
Statistică aplicată în ştiinţele socio-umane
a b c d
Figura 3.1 – Relaţia dintre validitate şi fidelitate
5
Exemplul nu-mi aparţine în totalitate. A fost citit sau mi s-a povestit de către Florin Sava.
Din nefericire, nu am sursa să-l pot cita, însă îmi fac datoria de onoare să menţionez acest
lucru.
286
Cristian Opariuc-Dan
287
Statistică aplicată în ştiinţele socio-umane
288
Cristian Opariuc-Dan
289
Statistică aplicată în ştiinţele socio-umane
strument. Însă, acest lucru nu este posibil din mai multe motive. Nu cred că
vom găsi o asemenea persoană disponibilă, şi apoi intervin factorii de memo-
rie şi alţi factori care pot influenţa rezultatele, prin noi erori aleatorii. În acest
caz, renunţăm la a evalua o singură persoană şi evaluăm, cu acelaşi instru-
ment, un grup de persoane. Intuiţi deja că fundamentul teoretic de mai sus se
poate aplica şi în această situaţie. Nu intrăm în detalii şi în demonstraţii. Cei
care doresc mai multe informaţii, pot consulta literatura de specialitate. O
prezentare excelentă a acestor elemente este realizată de către Carmines şi
Zeller (Carmines, și alții, 1979) în lucrarea lor. În linii mari, aceasta este
logica evaluării fidelităţii. La un număr suficient de mare de persoane evalua-
te cu acelaşi instrument, erorile aleatorii se compensează reciproc şi putem
avea măsura fidelităţii scorului real. Repet, problema nu se referă la aflarea
scorului real, ci la analiza fidelităţii unui instrument de măsură, a stabilităţii
sale. Dacă ceea ce fluctuează sunt erorile aleatorii, atunci, identificând ceva
stabil, acel lucru trebuie să fie scorul real.
În practică, există mai multe metode prin care putem evalua fidelitatea
unui instrument: metoda test-retest, metoda formelor paralele, metoda înju-
mătăţirii, metoda acordului între evaluatori şi metoda consistenţei interne. Le
vom analiza pe fiecare în parte.
290
Cristian Opariuc-Dan
Una dintre cele mai controversate întrebări care se pune este cea refe-
ritoare la intervalul de timp dintre cele două evaluări (Stan, 2002). Ei bine,
intervalul de timp depinde de stabilitatea dimensiunii măsurate. Retestarea
după un an poate fi inadecvată pentru un chestionar de opinii, acestea
putându-se schimba între timp, însă poate fi perfect valabilă pentru un test de
inteligenţă. Oricum, durata dintre cele două evaluări nu poate fi mai mică de
3-4 săptămâni. În cele mai multe cazuri, cercetătorii acordă un interval de 5-6
luni, considerat suficient pentru o analiză pertinentă a fidelităţii.
Această metodă, deşi intens folosită, nu este agreată în mod deosebit
de către cercetători, din cauza unor motive obiective. În primul rând, unii nu
o consideră o măsură a fidelităţii, ci una a stabilităţii scorurilor. Apoi, dacă
intervalul de timp este prea scurt, metoda nu mai estimează în mod real stabi-
litatea, intervenind influenţa memoriei şi efectul de învăţare. Subiecţii îşi pot
aminti unele răspunsuri de la evaluarea trecută, fapt care biasează masiv ana-
liza de fidelitate. Dacă intervalul de timp este prea lung, intervine efectul de
maturizare, prin care dimensiunea evaluată se modifică, mai ales dacă vorbim
de factori de personalitate. Mai mult decât atât, subiecţii tind să dea răspun-
suri la întâmplare în condiţiile celei de-a doua administrări.
Ideea este că nu se poate folosi această metodă ca metodă unică de es-
timare a fidelităţii, ci doar însoţită de o altă metodă, de obicei de metoda con-
sistenţei interne. Foarte mulţi consideră metoda test-retest ca o formă a meto-
dei înjumătăţirii, poate şi datorită faptului că procedeele statistice de calcul
sunt analoage. Din această cauză, nu vom prezenta aici calculul coeficientului
de fidelitate test-retest, ci îl vom aborda în cadrul celei de-a doua metode
studiate.
291
Statistică aplicată în ştiinţele socio-umane
după un interval de timp. Ideea de bază a metodei este aceea că, dacă avem
un set de itemi care măsoară o dimensiune, oricare două subseturi din acei
itemi, măsurând aceeaşi dimensiune, vor corela puternic. De exemplu, dacă
avem un chestionar care măsoară depresia, chestionar format din 20 de între-
bări, dintre care, aleatoriu, formăm două chestionare de câte 10 întrebări (lu-
ăm la întâmplare 10 itemi din chestionar şi construim o formă, ceilalţi 10
itemi rămaşi reprezentând cealaltă formă), şi apoi corelăm cele două chestio-
nare, ar trebui să obţinem un coeficient de corelaţie ridicat. Acest coeficient
poartă numele de coeficient de fidelitate split-half şi reprezintă o măsură
mai precisă a fidelităţii în comparaţie cu celălalt indicator, coeficientul de
stabilitate.
Dacă aţi fost atenţi, aţi observat că metoda test-retest este o variantă a
metodei înjumătăţirii. Pentru test-retest se foloseşte întregul instrument apli-
cat la două intervale de timp, iar pentru split-half folosim cele două jumătăţi
ale instrumentului, aplicate o singură dată. Ambele metode presupun aceleaşi
operaţii statistice, şi anume corelarea celor două administrări în cazul test-
retest şi corelarea celor două jumătăţi pentru split-half.
Fidelitatea prin metoda split-half măsoară, de fapt, echivalenţa celor
două jumătăţi de instrument. Unii autori o numesc şi fidelitate a formelor
paralele sau chiar fidelitatea consistenţei interne, deşi aceste denumiri sunt
oarecum improprii metodei.
Atât fidelitatea prin metoda test-retest, cât şi cea evaluată prin metoda
înjumătăţirii se pot analiza prin mai multe procedee statistice. Unul dintre
acestea implică obţinerea coeficientului de fidelitate split-half după formula
Spearman-Brown, numit şi coeficient de predicţie Spearman-Brown.
292
Cristian Opariuc-Dan
(formula 3.1)
293
Statistică aplicată în ştiinţele socio-umane
Acest coeficient îl vom folosi doar dacă analizăm fidelitatea prin me-
toda split-half. În ceea ce priveşte semnificaţia lui, majoritatea autorilor con-
sideră că valorile de peste 0,80 sunt adecvate pentru o fidelitate acceptabilă,
iar dacă dorim un grad ridicat al fidelităţii, nu vom putea accepta coeficienţi
sub 0,90. Totuşi, pentru cercetări exploratorii şi nu diagnostice, se pot lua în
considerare coeficienţi de fidelitate de peste 0,60, sub această limită
considerându-se instrumentul ca nefiind fidel.
Probabil că vă veţi întreba de ce acest coeficient se numeşte coeficient
de predicţie? Răspunsul constă în analiza formulei. Practic, formula prezice
fidelitatea întregului chestionar, pornind de la o formă a acestuia – formă
pentru care s-a calculat factorul k –, şi în baza corelaţiei dintre cele două for-
me.
În cazul în care s-a utilizat metoda test-retest pentru calculul fidelită-
ţii, formula 3.1 nu mai corespunde. Un caz particular al acestei formule este
exprimat prin relaţia următoare:
(formula 3.2)
Este, de fapt, situaţia în care am construi două forme ale unui chestio-
nar, ambele cu acelaşi număr de itemi. Prin extensie, metoda se poate aplica
şi în cazul formei test-retest.
Să presupunem că acelaşi chestionar cu 25 de itemi este aplicat unui
lot de cercetare de 130 de subiecţi, cu readministrare peste 8 luni. Coeficien-
294
Cristian Opariuc-Dan
tul de corelaţie dintre cele două administrări este r= 0,79. În acest caz, fideli-
tatea test-retest va fi 0,88, arătând că instrumentul are o foarte bună stabilita-
te.
Pentru a înţelege mai bine calculul acestui coeficient, vom lua exem-
plul unui chestionar cu 40 de itemi, aplicat unui număr de 10 studenţi. Rezul-
tatele vor fi centralizate în tabelul 3.1. Se observă că, pentru fiecare subiect,
am inclus atât scorul total obţinut (la nivelul întregului chestionar) cât şi sco-
rul obţinut pentru fiecare dintre cele două jumătăţi (forma x cu 20 de itemi şi
forma y, tot cu 20 de itemi).
Primul pas este reprezentat de calculul mediilor, atât pentru forma
completă a instrumentului, cât şi pentru cele două sub-forme. Media scoruri-
lor este de 31 pentru întregul chestionar (mtot), 15,2 pentru prima formă (mx)
şi 15,8 pentru forma a doua (my).
Tabelul 3.1– Calculul coeficientului de fidelitate split-half
Scor Forma x Forma y
Student x-mx y-my (x-mx)2 (y-my) 2 (x-mx)( y-my)
(40) (20) (20)
A 40 20 20 4.8 4.2 23.04 17.64 20.16
B 28 15 13 -0.2 -2.8 0.04 7.84 0.56
C 35 19 16 3.8 0.2 14.44 0.04 0.76
D 38 18 20 2.8 4.2 7.84 17.64 11.76
E 22 l0 12 -5.2 -3.8 27.04 14.44 19.76
F 20 12 8 -3.2 -7.8 10.24 60.84 24.96
G 35 16 19 0.8 3.2 0.64 10.24 2.56
H 33 16 17 0.8 1.2 0.64 1.44 0.96
I 31 12 19 -3.2 3.2 10.24 10.24 -10.24
J 28 14 14 -1.2 -1.8 1.44 3.24 2.16
Media 31.0 15.2 15.8 95.60 143.60 73.40
295
Statistică aplicată în ştiinţele socio-umane
√∑ ∑ √
̅ ̅
(formula 3.3)
296
Cristian Opariuc-Dan
6
Puteţi consulta lucrarea „Statistică aplicată în ştiinţele socio-umane. Noţiuni de bază -
Statistici univariată”, de acelaşi autor, apărută la editura ASCR, Cluj-Napoca, 2009
297
Statistică aplicată în ştiinţele socio-umane
298
Cristian Opariuc-Dan
̅
̅
(formula 3.4)
299
Statistică aplicată în ştiinţele socio-umane
300
Cristian Opariuc-Dan
301
Statistică aplicată în ştiinţele socio-umane
cazul în care covarianţa negativă este mai mare în comparaţie cu cea pozitivă.
Ştim foarte bine, că pentru a evita tendinţa subiecţilor către un răspuns pozi-
tiv, de multe ori folosim itemi inversaţi. Adică, dacă la unii itemi răspunsul
„Da” este semnificativ şi primeşte un punct, la alţi itemi primeşte un punct
răspunsul „Nu”. Sau, dacă vom nuanţa puţin, având o evaluare pe o scală de
la 1 la 5, pentru unii itemi 5 înseamnă „foarte mult”, în timp ce pentru alţi
itemi, 1 va însemna „foarte mult”. În acest caz, unii itemi vor corela negativ.
În funcţie de numărul itemilor inversaţi, per ansamblu este posibil să obţinem
o covarianţă negativă mai mare în comparaţie cu cea pozitivă, şi, evident, un
coeficient negativ. Vom vedea, atunci când vom discuta despre aplicaţiile în
SPSS, ce avem de făcut în acest caz, fiind vorba despre un proces de recodare
al itemilor.
Cronbach a descoperit formula sa în anul 1951. Să nu credeţi că până
atunci cercetătorii nu aveau idee despre consistenţa internă. Încă din anul
1937 conceptul era bine cunoscut, cel puţin pentru Kuder şi Richardson, care
au pus la punct o metodă de calcul a consistenţei interne, în condiţiile în care
itemii sunt dihotomici. Adică, atunci când răspunsurile sunt de tipul „Da” şi
„Nu”. Este cazul, desigur, al binecunoscutei formule Kuder-Richardson
KR20, formulă alternativă pentru α Cronbach.
∑
( ) (formula 3.5)
302
Cristian Opariuc-Dan
303
Statistică aplicată în ştiinţele socio-umane
Nu este deloc greu, aşa cum deja v-aţi obişnuit. Un asemenea coefici-
ent indică o consistenţă internă bună a celor 12 itemi din instrumentul de mai
sus.
Ce ne facem însă dacă nu avem la dispoziţie structura datelor, la nivel
de item, ci doar scorul brut total, aşa ca în tabelul 3.4?
Tabelul 3.4– Calculul coeficientului Kuder-Richardson pe baza notelor brute
304
Cristian Opariuc-Dan
Aţi remarcat, sunt aceleaşi date, însă nu mai avem răspunsurile celor
zece subiecţi la fiecare dintre cei 12 itemi, ci doar scorul brut, total, pentru
fiecare dintre subiecţi. Fără să intrăm în detalii, avem şi media acestor evalu-
ări, precum şi suma abaterilor pătratice de la medie, rezultând, evident, ace-
eaşi varianţă, care va avea valoarea 8,28. Există acum vreo posibilitate să
aflăm consistenţa internă? Răspunsul este pozitiv şi va trebui să aduceţi mul-
ţumiri lui Kuder şi Richardson pentru acest lucru. Iată că cei doi autori ne
mai oferă o relaţie, exact pentru situaţii de acest gen, numită formula de cal-
cul a coeficientului Kuder-Richardson 21 (KR21).
̅ ̅
( ) (formula 3.6)
305
Statistică aplicată în ştiinţele socio-umane
306
Cristian Opariuc-Dan
307
Statistică aplicată în ştiinţele socio-umane
308
Cristian Opariuc-Dan
309
Statistică aplicată în ştiinţele socio-umane
310
Cristian Opariuc-Dan
311
Statistică aplicată în ştiinţele socio-umane
312
Cristian Opariuc-Dan
313
Statistică aplicată în ştiinţele socio-umane
314
Cristian Opariuc-Dan
315
Statistică aplicată în ştiinţele socio-umane
316
Cristian Opariuc-Dan
317
Statistică aplicată în ştiinţele socio-umane
318
Cristian Opariuc-Dan
7
Chestionarul este absolut fictiv. Datele nu corespund unor cercetări reale. Descrierea scale-
lor a fost preluată din lucrarea „Evaluarea psihologică a personalului” – Ticu Constantin,
Editura Polirom, Iaşi, 2004.
319
Statistică aplicată în ştiinţele socio-umane
8
Toate fișierele de date SPSS le puteți descărca de la adresa http://www.statistica-socială.ro
320
Tabelul 3.7– Baza de date pentru analiza fidelităţii
It1 It2 It3 It4 It5 It6 It7 It8 It9 It10 It11 It12 It13 It14 It15 It16 It17 It18 It19 It20 It21 It22 It23 It24 Sex Varsta
7 7 7 7 6 5 5 6 6 6 7 6 7 7 7 7 7 7 7 7 6 6 5 5 2 46
6 6 6 6 5 5 5 4 7 7 6 7 7 7 7 7 6 6 6 6 6 6 6 6 1 48
7 7 7 7 6 6 6 6 7 7 6 7 7 7 7 7 5 3 3 3 6 6 5 5 2 52
6 5 3 4 7 7 7 7 6 5 6 5 6 5 6 6 6 6 6 6 6 6 6 5 1 35
4 5 4 4 4 4 5 4 7 6 7 7 7 6 6 6 6 6 6 6 6 6 6 5 1 48
7 7 7 7 6 6 5 5 7 6 7 5 4 7 6 6 7 7 7 7 6 6 5 5 1 53
7 7 7 7 7 7 6 7 7 7 7 6 6 6 6 6 7 7 7 7 7 7 7 7 1 58
3 5 4 5 5 5 5 5 7 7 7 7 6 7 6 6 4 4 3 3 6 6 7 7 2 46
7 7 7 7 5 4 4 4 7 7 7 5 6 5 6 6 5 5 4 5 7 6 6 7 1 53
5 5 5 6 5 5 5 5 7 6 7 7 7 7 7 7 4 3 4 3 4 5 5 5 1 58
6 6 6 6 6 6 6 6 7 7 7 5 6 5 6 6 6 6 5 5 7 6 6 6 1 56
3 4 5 5 7 7 7 7 7 7 7 6 5 5 6 6 5 3 5 5 5 5 5 6 1 50
3 4 5 4 5 6 6 5 6 6 7 6 6 7 7 6 6 6 6 6 6 6 6 6 1 50
6 6 6 6 6 6 6 6 6 7 7 6 6 6 4 4 6 6 6 6 5 5 5 4 1 47
7 7 7 7 7 7 7 7 7 7 7 7 7 6 4 4 6 6 6 6 6 6 6 6 1 50
7 7 7 7 7 7 7 7 6 6 6 5 5 6 6 5 3 3 4 4 7 6 6 7 1 54
5 5 5 4 7 6 6 7 7 7 7 6 6 6 6 6 6 6 6 5 6 6 6 6 1 48
7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 3 5 4 5 7 7 7 7 1 39
6 4 5 4 7 7 7 6 6 6 6 5 5 6 6 6 5 6 6 6 6 6 6 5 1 31
6 6 5 4 7 7 7 6 6 6 6 6 6 5 6 6 6 6 7 7 5 5 3 4 1 48
7 7 7 7 7 7 7 7 7 7 7 6 6 6 5 5 7 7 7 7 5 5 5 6 2 50
6 6 6 6 4 4 4 4 7 7 7 7 7 7 7 7 6 6 6 6 6 6 6 6 1 43
6 6 6 6 6 6 6 6 7 7 7 4 5 5 5 4 6 6 6 6 7 6 6 6 1 54
7 7 7 7 7 7 7 7 7 7 7 5 6 5 6 6 3 4 5 5 1 55
6 6 6 6 5 5 5 5 7 6 6 7 7 7 6 7 7 7 7 7 7 7 7 7 1 46
5 3 5 4 6 6 6 6 6 7 7 4 4 4 5 5 7 7 7 7 7 7 7 7 2 44
7 6 6 6 6 6 6 6 6 7 7 5 5 5 5 4 6 6 6 6 6 6 6 6 1 50
7 7 7 7 7 7 7 7 7 7 7 6 6 6 6 6 7 7 7 7 6 5 5 5 1 54
6 6 6 5 6 6 6 6 7 7 7 5 6 5 6 6 4 5 4 5 7 6 6 7 1 31
7 7 7 7 5 7 7 6 7 7 7 5 5 4 4 4 7 7 7 7 7 7 7 7 1 57
3 4 5 5 6 3 4 5 5 5 6 5 5 4 4 4 6 6 6 6 5 5 5 6 1 53
4 4 4 4 7 7 7 7 7 7 7 7 7 6 6 6 7 7 7 7 6 6 6 6 1 58
7 7 7 7 7 5 7 7 7 7 7 6 6 6 7 7 7 7 7 7 6 6 6 6 1 35
6 6 6 6 6 6 6 6 7 6 6 4 4 5 5 5 6 6 6 6 7 7 6 6 1 53
6 6 6 6 6 5 6 4 7 7 7 6 7 7 7 7 6 6 6 6 6 6 6 7 1 36
Statistică aplicată în ştiinţele socio-umane
6 3 5 4 7 7 7 7 7 7 6 7 7 7 7 7 5 5 5 6 6 6 6 5 1 50
3 4 5 5 3 4 5 5 7 7 7 7 7 7 7 6 6 6 6 6 6 6 6 6 1 49
7 7 7 7 7 7 7 7 7 7 6 5 5 7 6 6 7 7 7 7 4 4 4 5 1 23
5 5 5 6 7 7 7 7 7 7 7 7 7 7 7 7 3 5 4 5 7 6 7 7 1 50
6 6 6 5 6 6 7 7 7 7 7 5 5 6 6 6 5 4 5 5 6 6 6 6 1 58
5 6 5 6 6 6 6 6 6 7 7 6 6 6 6 6 6 6 6 6 5 6 6 6 1 46
5 5 6 6 6 6 6 6 7 7 7 6 6 6 6 6 6 6 6 6 7 7 6 6 1 59
5 5 7 5 5 6 5 6 6 6 7 6 7 7 7 7 7 7 7 7 6 6 6 6 1 50
6 6 6 5 6 6 6 6 5 5 6 5 5 5 5 5 5 5 3 3 5 5 5 4 1 48
6 6 6 6 6 6 6 6 5 6 7 7 7 7 7 7 6 6 6 6 5 5 6 5 1 39
6 6 6 5 7 7 7 7 7 7 7 6 6 6 6 6 7 7 7 7 6 6 6 6 2 44
6 6 6 6 6 6 6 6 7 7 7 5 5 6 4 4 6 5 5 6 6 6 5 5 1 43
7 7 7 7 7 7 7 7 6 7 7 7 7 7 7 6 6 6 6 6 6 6 6 6 1 56
7 7 7 7 7 7 7 6 7 7 7 7 5 6 6 7 7 7 7 7 7 7 7 7 1 58
6 6 6 6 6 6 6 6 7 7 7 7 6 6 5 5 6 5 6 5 6 6 6 6 1 48
7 7 7 7 7 7 7 7 7 7 7 5 5 7 6 5 4 3 4 3 6 7 7 6 1 46
7 7 7 7 6 5 5 6 7 7 7 4 5 7 6 6 5 5 6 6 6 6 6 6 1 48
6 6 6 6 6 6 6 6 6 7 7 7 7 6 6 6 7 7 7 7 7 7 7 7 2 50
5 5 5 5 5 6 5 4 6 6 7 5 5 5 4 4 6 6 6 6 5 6 6 6 1 53
5 5 5 4 7 7 6 7 6 7 6 6 6 6 6 6 5 5 6 7 6 6 6 6 1 53
6 6 6 5 6 6 6 6 7 7 7 6 6 6 5 5 4 4 5 5 7 6 6 7 1 48
3 4 4 3 2 3 5 4 6 5 5 5 5 5 5 4 3 3 4 5 4 4 3 3 1 56
6 6 6 5 6 6 7 7 6 6 6 7 7 7 7 7 5 5 6 6 6 6 6 6 1 48
3 4 5 7 5 5 5 5 6 6 6 5 5 5 4 4 4 2 5 5 4 3 5 5 1 36
7 7 7 7 7 7 7 7 7 7 7 6 7 5 5 5 7 7 7 6 7 7 7 7 1 51
6 5 3 4 6 6 7 7 6 5 6 4 4 4 5 5 7 7 7 7 7 7 7 7 1 39
2 3 4 5 5 5 5 4 6 6 7 4 4 4 4 4 6 4 6 5 6 6 6 7 1 47
6 6 6 6 6 6 6 6 7 7 7 5 6 5 6 6 1 4 4 5 6 6 6 6 1 53
7 7 7 7 6 5 5 6 7 7 6 6 6 7 6 7 6 7 6 6 7 7 7 7 1 48
6 6 6 6 2 3 5 4 6 7 7 6 7 7 7 7 6 6 6 6 7 7 6 6 1 47
6 6 6 6 5 5 5 5 7 5 6 5 5 4 5 4 6 6 6 6 5 5 5 5 1 56
7 7 7 7 4 4 5 4 6 7 7 7 7 7 7 7 7 7 7 7 6 6 6 6 1 57
6 6 6 6 6 6 6 6 7 7 6 6 7 6 4 4 6 6 6 6 6 6 5 5 1 31
5 4 5 4 7 7 7 7 7 7 7 6 5 5 7 5 5 5 6 5 7 6 7 6 1 48
322
Cristian Opariuc-Dan
7 7 5 7 4 4 4 4 7 6 6 6 6 7 6 6 6 7 6 6 6 6 5 5 2 52
6 6 6 5 5 5 4 4 7 6 7 5 5 5 6 6 5 5 6 6 5 5 6 6 1 31
6 6 6 6 3 4 5 5 7 6 7 5 5 6 4 4 6 7 6 6 6 6 5 5 2 30
6 6 6 6 6 5 5 6 6 6 6 7 6 7 6 6 4 5 4 4 6 6 5 5 1 50
5 5 5 6 5 5 5 5 7 7 6 7 7 6 4 4 3 3 4 4 4 4 5 5 1 48
6 6 6 5 6 7 6 7 6 7 7 6 6 6 6 6 4 5 5 5 6 6 6 6 1 53
3 3 4 4 3 4 5 5 6 6 6 5 5 5 6 6 7 7 7 7 6 6 5 5 1 31
6 6 6 6 5 5 5 4 7 7 7 4 5 5 4 5 6 7 6 7 6 6 6 7 1 35
7 7 7 7 7 7 7 7 7 7 7 5 6 5 6 6 2 3 4 5 6 7 6 7 1 53
5 5 5 6 7 7 7 7 7 7 7 5 5 5 5 5 3 4 5 5 6 7 7 7 1 36
6 6 6 6 6 6 6 6 6 6 6 5 5 6 4 4 5 6 5 6 6 5 5 5 2 46
6 6 6 6 6 6 6 6 7 7 7 6 7 5 5 5 3 4 3 4 6 6 6 6 1 59
6 6 6 6 6 6 6 6 7 5 6 5 5 5 5 3 6 6 6 6 5 5 6 6 1 51
7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 6 6 6 6 6 7 7 7 7 1 48
3 3 4 4 6 6 7 7 6 5 6 6 6 6 6 6 7 6 5 5 7 7 7 7 1 57
4 4 4 4 5 4 5 5 7 6 7 5 5 7 6 6 7 7 7 7 6 6 5 5 1 43
7 7 7 7 7 7 7 7 6 6 6 5 5 6 6 6 3 4 5 5 7 7 7 7 1 58
7 6 6 7 6 6 6 6 7 7 7 6 6 7 7 6 7 7 7 7 5 5 5 4 1 31
6 6 6 5 6 6 7 7 7 7 6 6 6 6 6 6 5 4 5 5 6 6 6 6 1 49
6 6 6 6 5 5 7 5 7 7 7 5 5 6 6 6 6 6 6 7 5 6 4 5 1 57
5 4 5 4 7 6 7 6 7 7 7 5 5 5 5 5 7 7 7 7 7 7 7 7 1 56
7 6 7 5 5 4 5 5 6 6 6 6 5 7 6 6 6 6 6 6 6 6 6 7 1 50
6 6 6 6 5 6 6 5 7 7 7 4 4 6 4 4 4 5 5 5 4 5 5 5 1 31
6 6 6 6 6 6 6 6 7 7 7 7 7 6 7 7 7 6 7 6 6 6 6 6 1 53
6 6 6 6 5 6 5 6 7 7 6 5 5 6 6 6 3 3 4 4 5 5 7 7 2 52
6 6 7 7 7 7 7 7 7 7 7 5 6 5 6 6 6 6 6 7 7 6 6 6 1 50
5 5 3 3 4 4 4 4 6 7 7 6 7 7 7 7 6 6 6 6 6 6 7 7 1 59
5 7 6 7 6 5 6 7 6 6 6 6 6 6 5 5 7 7 7 7 6 6 5 5 1 58
5 6 7 7 4 5 5 5 7 7 7 5 6 5 6 6 7 7 6 6 7 7 7 7 2 52
6 3 5 4 6 6 7 7 6 6 6 6 6 6 6 5 6 6 6 6 4 3 5 5 1 51
5 5 5 6 3 4 5 4 6 7 7 7 5 5 6 6 6 6 6 6 6 6 6 6 1 53
4 3 3 4 6 6 6 6 7 7 7 7 7 7 7 7 6 6 6 6 7 7 7 7 1 53
7 7 7 7 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 77 7 1 45
4 4 4 5 6 6 6 6 7 6 7 5 4 4 5 4 7 7 7 7 7 7 7 7 1 55
323
Statistică aplicată în ştiinţele socio-umane
5 7 6 7 7 5 6 7 7 5 6 7 6 5 7 7 7 6 6 6 7 6 7 6 1 55
6 6 5 5 6 6 6 4 6 6 7 6 6 5 7 7 6 6 6 6 6 6 6 6 1 53
7 7 7 7 6 5 5 6 7 7 7 5 5 7 6 6 7 6 6 6 7 7 7 7 1 56
3 3 4 4 4 4 4 4 5 4 5 4 4 5 5 3 5 5 5 5 6 6 6 6 1 51
3 4 6 4 7 7 7 7 7 7 7 7 7 7 7 7 4 4 5 5 6 6 6 6 1 45
7 7 7 7 6 7 6 7 6 7 7 7 6 6 6 7 6 5 6 5 6 6 6 6 2 50
6 6 6 6 6 6 5 6 7 6 6 7 6 7 6 6 3 5 4 5 7 7 7 7 1 54
5 6 5 6 5 5 6 6 6 6 7 5 5 7 6 6 6 6 6 6 6 6 5 5 1 54
3 3 4 4 7 7 6 6 6 6 6 6 6 6 6 6 6 6 5 6 7 7 7 7 1 53
3 4 5 5 2 3 5 4 5 5 6 1 4 2 3 4 6 6 6 6 5 5 5 5 1 50
6 6 6 6 4 5 5 5 7 7 7 5 5 6 6 6 6 6 5 5 4 4 4 4 1 50
3 4 4 3 6 6 6 6 6 7 6 6 6 6 6 6 6 6 6 6 7 7 7 7 1 53
6 6 6 6 6 6 6 6 7 7 7 7 7 6 4 4 7 6 6 6 6 6 6 6 1 49
3 3 5 7 4 5 5 5 6 5 5 7 7 7 7 7 4 3 5 5 5 5 5 5 1 39
7 7 7 7 3 4 5 4 7 7 7 3 4 3 3 4 5 5 6 6 6 6 5 5 2 30
6 5 6 6 6 6 6 6 7 7 7 7 7 7 7 7 4 4 5 5 6 6 7 7 1 48
7 7 7 7 7 7 7 7 7 7 6 5 6 5 6 6 4 5 5 5 6 6 6 7 1 57
6 6 6 6 5 5 6 6 7 6 6 7 7 7 7 6 6 6 6 6 4 4 4 4 2 44
6 6 6 6 6 6 5 5 7 7 7 5 5 7 6 6 4 4 4 4 6 6 6 6 2 30
5 6 7 7 7 7 6 6 7 6 7 5 5 5 5 5 5 5 6 6 7 7 7 7 1 53
3 4 3 4 5 5 5 5 6 6 6 4 4 4 3 4 5 5 5 5 2 2 5 6 2 30
6 4 3 4 6 6 5 4 5 5 6 5 5 4 4 4 5 5 6 5 5 5 3 4 1 56
4 4 4 5 3 4 5 5 7 7 7 7 6 6 6 6 5 6 5 7 6 6 6 6 1 36
5 7 6 7 6 6 5 5 6 6 6 6 7 7 7 7 7 7 7 7 6 6 7 7 2 44
6 6 6 6 7 6 7 6 7 7 6 5 6 5 6 6 6 6 6 6 6 6 6 6 1 49
7 7 7 7 7 7 7 7 5 6 5 6 6 6 6 6 6 6 6 6 7 6 6 6 1 53
7 7 7 7 6 6 6 6 6 6 6 3 3 7 6 6 7 7 7 7 6 6 6 6 1 54
6 6 7 7 4 4 4 4 7 6 6 6 7 7 7 7 6 6 6 6 6 6 6 6 1 31
4 5 4 5 6 6 7 7 7 7 7 5 5 5 5 5 7 7 7 7 7 7 7 7 1 50
7 7 7 7 3 4 5 5 6 7 7 5 6 5 6 6 6 6 6 6 6 6 6 6 2 46
3 4 5 5 5 6 6 5 6 7 7 6 5 7 7 6 5 5 5 6 5 6 5 5 1 23
7 7 7 7 6 6 6 6 7 5 6 7 7 7 6 6 3 5 4 5 4 4 4 5 1 58
3 4 3 4 6 6 6 6 7 7 7 7 7 7 7 7 6 6 6 6 7 7 7 7 1 50
6 6 6 6 6 6 6 6 6 7 7 6 6 6 6 6 3 3 4 4 6 6 6 6 2 50
324
Cristian Opariuc-Dan
7 5 5 5 5 6 6 5 6 6 6 6 7 7 7 7 7 7 7 7 5 5 5 5 1 43
7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 6 3 4 4 5 5 4 4 4 1 45
5 5 6 6 5 5 5 5 7 6 6 5 5 5 6 6 6 6 6 6 6 6 6 7 1 55
7 7 7 7 7 7 7 7 7 7 7 6 6 6 7 7 6 5 5 6 5 5 5 5 1 57
6 7 6 7 6 6 7 7 7 6 7 4 5 5 5 4 6 6 6 6 6 7 7 7 1 53
7 7 5 6 5 7 6 7 5 6 7 7 7 6 5 4 7 7 7 7 6 6 6 6 1 50
3 4 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 1 53
6 7 6 7 5 6 6 5 6 7 7 6 5 5 5 6 7 7 7 7 4 4 4 5 1 50
5 6 7 7 6 6 6 7 6 6 6 6 6 6 6 7 7 7 7 7 5 5 5 5 1 56
6 6 7 7 5 6 6 5 6 6 6 5 6 7 7 6 7 7 7 7 5 5 4 5 1 47
7 7 7 5 5 7 7 7 7 6 7 7 6 6 4 4 6 6 6 7 7 7 7 7 1 59
5 5 5 5 7 7 7 7 7 7 7 7 7 7 7 7 4 4 5 5 6 6 6 6 1 54
6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 6 6 7 7 6 7 6 6 1 48
5 5 7 7 6 6 6 6 6 6 7 7 7 7 7 7 7 6 6 6 7 7 7 7 1 57
6 7 5 7 6 5 6 5 6 6 6 5 6 6 5 5 7 7 7 7 6 6 5 5 1 45
5 5 4 4 7 7 7 7 6 6 6 6 6 5 6 5 5 5 5 6 7 6 7 6 1 57
6 6 6 6 6 6 6 6 6 7 7 6 6 6 6 5 6 7 6 6 5 5 4 5 1 53
6 6 6 6 6 6 6 6 6 6 6 7 5 7 6 6 6 6 6 6 6 6 6 6 1 23
5 6 5 5 7 7 7 7 6 6 6 5 5 4 4 4 5 5 4 3 4 4 5 5 1 54
7 7 7 7 3 4 5 4 7 6 6 5 5 5 5 5 4 5 5 5 5 6 5 5 1 23
3 4 3 4 2 3 5 4 4 5 5 5 5 5 3 4 6 6 6 6 5 5 5 5 1 46
5 5 5 6 7 7 7 7 7 7 7 7 7 7 7 7 3 4 5 5 7 6 7 7 1 35
6 6 6 6 6 6 6 6 7 7 6 7 7 6 7 7 7 7 7 7 6 6 5 5 1 48
325
Vă felicit pentru răbdare! Într-adevăr, aţi muncit ceva, iar acum să
vedem răsplata. Pentru început, vom analiza consistenţa internă a fiecărei
scale, folosind metoda α
Cronbach. Deoarece acest chesti-
onar are şase scale, analiza consis-
tenţei interne pentru întregul in-
strument nu are sens.
Vom începe cu scala „mo-
tivaţie”, itemii componenţi fiind
Figura 3.5 – Analiza consistenţei interne pentru 12, 13, 14, 15 şi 16.
scala „motivaţie”
În figura 3.5 am inclus
aceşti itemi în vederea analizei, am ales modelul de analiză (modelul Alpha)
şi am scris o etichetă descriptivă pentru
aceste proceduri în secţiunea „Scale label”.
În principiu, aceste informaţii sunt suficien-
te pentru ca programul să calculeze coefici-
entul dorit. Totuşi, fiind cercetători cu expe-
rienţă, vom dori să aflăm în detaliu şi com-
poziţia scalei. Accesând butonul „Statis-
tics…” vom alege, imediat, şi opţiunile care
ne interesează în mod deosebit.
Vom alege calculul statisticilor de-
scriptive la nivel de item, la nivel de scală şi Figura 3.6 – Analiza compoziţiei
la nivel de scală atunci când eliminăm un scalei „motivaţie”
item. Matricele de corelaţie şi de covarianţă
sunt, de asemenea, foarte utile, precum şi statisticile cumulate (mediile,
varianţele, covarianţele şi corelaţiile). Nu vom proceda la analiza de varian-
ţă, însă vom dori să testăm ipoteza egalităţii mediilor prin testul T-square
Hotelling. Toate aceste configurări le puteţi urmări în figura 3.6.
Cristian Opariuc-Dan
327
Statistică aplicată în ştiinţele socio-umane
anţa itemilor este egală – aşa cum am discutat deja – şi se bazează pe core-
laţiile dintre itemi. Indiferent de metoda de lucru, am constatat că scala
„motivaţie” este o scală fidelă sub aspectul consistenţei interne (o scală con-
sistentă).
Tabelul 3.10 – Statistici descriptive la nivel de itemi Tabelul următor pe care îl afi-
Item Statistics şează formularul de rezultate conţine
Mean Std. Deviation N
statisticile descriptive pentru fiecare
Itemul 12 5,77 1,059 160
Itemul 13 5,84 ,955 160 dintre cei cinci itemi analizaţi. Obser-
Itemul 14 5,92 1,009 160 văm că SPSS a calculat, pentru fieca-
Itemul 15 5,82 1,045 160
re dintre itemi, media şi abaterea
Itemul 16 5,72 1,065 160
standard. Privind mediile, am putea
aprecia, la prima vedere, că acestea sunt relativ egale, fără diferenţe semni-
ficative între ele. Ne amintim, totuşi, că am ales un test statistic pentru a
verifica egalitatea mediilor – testul T-square – care pleacă de la ipoteza nulă
a egalităţii acestora. Ultimul tabel din formularul de rezultate arată rezulta-
tele administrării acestui test statis- Tabelul 3.11 – Testul de egalitate a mediilor
tic. Într-adevăr, ne-am fi înşelat Hotelling's T-Squared Test
328
Cristian Opariuc-Dan
329
Statistică aplicată în ştiinţele socio-umane
330
Cristian Opariuc-Dan
331
Statistică aplicată în ştiinţele socio-umane
7. Adăugăm o unitate acestei valori şi obţinem 8. Până aici este clar. Acum,
observăm că primul subiect a dat răspunsul 7 la itemul 4. Atunci, 8-7=1,
aceasta fiind valoarea inversată pentru primul subiect. Al doilea subiect a
dat răspunsul 6 şi vom avea 8-6=2 ca valoare inversată. Al treilea subiect va
avea valoarea inversată 8-7=1 şi aşa mai departe. Practic, inversarea este o
operaţiune de „reflectare în oglindă” a scorurilor. Dacă scala ar fi de tipul 7
– foarte puţin şi 1 foarte mult, vă daţi seama că prin inversare vom restabili
sensul natural al acesteia.
Realizarea acestui lucru manual ar în-
semna „muncă de chinez bătrân”. Din fericire,
SPSS ne pune la dispoziţie un utilitar foarte
Figura 3.7 – Meniul de trans- important, situat în cadrul meniului „Trans-
formare a variabilelor form”, opţiunea „Compute Variable…”. De-
spre acest meniu am discutat şi în volumul anterior, astfel încât aici ne vom
concentra doar pe elementele esenţiale.
În figura 3.8 aveţi rezultatul accesării acestui meniu. Chiar dacă nu
aţi lecturat lucrarea anterioară,
fereastra este destul de intuitivă.
Vă puteţi da seama că formularul
permite efectuarea diferitelor cal-
cule folosind variabilele din baza
de date. Vom folosi aceste proce-
duri pentru a inversa itemul 4 al
scalei „sarcina”.
În caseta „Target
Variable” vom include noul nume
al variabilei noastre. Vom conveni Figura 3.8 – Inversarea unui item
ca noua variabilă creată să se nu-
mească „item4tr”, prescurtare pentru „itemul 4 transformat”. În caseta
332
Cristian Opariuc-Dan
333
Statistică aplicată în ştiinţele socio-umane
334
Cristian Opariuc-Dan
Chiar şi SPSS şi-a dat seama de acest lucru, dacă observaţi subsolul
tabelului 3.20. Strict informativ, puteţi vedea ce se întâmplă dacă eliminăm
al patrulea item. Media şi varianţa scalei vor creşte, la fel şi coeficientul de
consistenţă internă. Totuşi, acesta nu este un item neconsistent ci un item
care corelează bine cu scala, singura sa problemă fiind aceea a sensului de
răspuns.
Reluând analiza, prin înlocuirea itemului 4 transformat cu itemul 4
original, vom obţine un coeficient de consistenţă internă de 0,92, aceasta
fiind şi cea mai mare valoare obţinută a consistenţei interne.
Exerciţii:
Efectuaţi analiza consistenţei interne a scalei „sarcina” folosind
itemul 4 original şi explicaţi diferenţele.
335
Statistică aplicată în ştiinţele socio-umane
336
Cristian Opariuc-Dan
337
Statistică aplicată în ştiinţele socio-umane
fost analizate doar 159. Probabil Both Parts 141,49 183,733 13,555 24
a. The items are: Itemul 1, Itemul 2, Itemul 3, Itemul 4,
că unul dintre subiecţi nu a com- Itemul 5, Itemul 6, Itemul 7, Itemul 8, Itemul 9, Itemul 10,
Itemul 11, Itemul 12.
pletat răspunsul la unul sau la b. The items are: Itemul 13, Itemul 14, Itemul 15, Itemul 16,
mai mulţi itemi, acesta fiind un Itemul 17, Itemul 18, Itemul 19, Itemul 20, Itemul 21, Itemul
22, Itemul 23, Itemul 24.
motiv suficient pentru a fi exclus
din prelucrare. În orice caz, avem suficiente date pentru a putea trage con-
Tabelul 3.23 – Analiza fidelităţii prin metoda split-half cluzii utile.
Reliability Statistics
Cronbach's Alpha Part 1 Value ,839
Ultimul tabel din
N of Items 12a formularul de rezultate
Part 2 Value ,572 conţine statisticile de-
N of Items 12b scriptive la nivelul scalei.
Total N of Items 24 Se observă că SPSS a
Correlation Between Forms ,254
Spearman-Brown Coefficient Equal Length ,405
inclus primii 12 itemi din
Unequal Length ,405 chestionar într-o formă şi
Guttman Split-Half Coefficient ,393
ultimii 12 itemi în cealal-
a. The items are: Itemul 1, Itemul 2, Itemul 3, Itemul 4, Itemul 5, Itemul
6, Itemul 7, Itemul 8, Itemul 9, Itemul 10, Itemul 11, Itemul 12. tă formă.
b. The items are: Itemul 13, Itemul 14, Itemul 15, Itemul 16, Itemul 17,
Din primele in-
Itemul 18, Itemul 19, Itemul 20, Itemul 21, Itemul 22, Itemul 23, Itemul
24.
formaţii, aflăm că media
itemilor din prima formă este mai mare în comparaţie cu media itemilor din
cea de-a doua formă, iar varianţele sunt, din nou, diferite. A doua formă are
o varianţă mai mare în comparaţie cu prima formă. Dacă diferenţele dintre
338
Cristian Opariuc-Dan
medii sunt sau nu semnificative, am fi putut afla utilizând unul dintre testele
statistice prezentate mai sus, sau prin construirea tabelelor de analiză de
varianţă. Dacă v-aţi format puţin „ochiul statistic”, deja puteţi suspecta ce-
va…. Oare despre ce este vorba? Să rezulte, oare, un coeficient de fidelitate
split-half cu o valoare mică?
Într-adevăr, aşa este! Să privim puţin tabelul 3.23, cel mai important
tabel generat de SPSS. Consistenţa internă pentru prima parte a instrumen-
tului este bună (0,839), în timp ce a doua parte are o consistenţă internă
aproape satisfăcătoare (0,572). Este firesc să obţinem un coeficient de core-
laţie între cele două părţi de numai 0,254. Mai mult decât atât, se observă o
fidelitate split-half redusă, de doar 0,40, estimată prin intermediul coeficien-
tului Spearman-Brown. Cele două forme, având un număr egal de itemi,
expresia acestui coeficient va fi prima valoare (Equal Length). Dacă forme-
le ar fi avut un număr inegal de itemi (de exemplu prima parte 12 itemi şi a
doua parte 13 itemi), am fi luat ca referinţă cea de-a doua valoare a coefici-
entului (Unequal Length).
Am văzut, totuşi, că varianţele nu sunt egale. Dacă ne-am raporta
precis la teorie, am alege ca indicator coeficientul de fidelitate split-half
Guttman. Însă, lucrurile par mai sumbre. Coeficientul este de numai 0,39
(de fapt, coeficientul Guttman λ4), cea mai mică sub aspectul fidelităţii.
În realitate, Guttman a propus şase coefi- Tabelul 3.24 – Fidelitatea split-half
cienţi de fidelitate care furnizează limitele inferi- pe baza modelului Guttman
Reliability Statistics
oare ale fidelităţii reale. Dacă dorim să-i calcu-
Lambda 1 ,690
lăm, tot ceea ce avem de făcut este să înlocuim 2 ,738
modelul (alegem modelul „Guttman” din lista 3 ,720
derulantă „Model”). 4 ,393
5 ,724
Vom obţine tabelul din figura 3.24. Pri- 6 ,806
mul coeficient (λ1) este o estimare simplă a fide- N of Items 24
339
Statistică aplicată în ştiinţele socio-umane
340
Cristian Opariuc-Dan
341
Statistică aplicată în ştiinţele socio-umane
342
Cristian Opariuc-Dan
rii. Coeficientul de corelaţie între itemii formelor paralele este foarte mic.
Totuşi, fidelitatea scalei pare să fie ridicată (0,72). Într-adevăr, fidelitatea
este estimată similar coeficientului α Cronbach, bazându-se pe consistenţa
internă. Dacă am fi folosit modelul paralel strict, acest coeficient ar fi fost şi
mai mic, deoarece consistenţa internă se ajustează în funcţie de diferenţele
dintre mediile itemilor.
Desigur, dacă am decis că modelul paralel simplu nu poate fi aplicat,
deoarece formele nu sunt paralele, nu vom putea aplica nici modelul paralel
strict. În realitate, modelul paralel simplu este, aşa cum am specificat ante-
rior, o variantă mai permisivă a modelului paralel strict.
În concluzie, nu putem vorbi de existenţa formelor paralele la nive-
lul acestui chestionar. De fapt, bănuiam deja acest lucru în urma analizei
fidelităţii prin metoda split-half. În realitate, foarte puţine instrumente înde-
plinesc condiţiile formelor paralele, şi, de aceea, nici metoda nu este intens
folosită.
343
Statistică aplicată în ştiinţele socio-umane
344
Cristian Opariuc-Dan
345
Statistică aplicată în ştiinţele socio-umane
346
Cristian Opariuc-Dan
lot de cercetare format din 160 de subiecţi. Prima administrare a fost înre-
gistrată în baza de date sub numele de „Itemul 3”, iar a doua administrare
sub numele de „Itemul 4”. Ne interesează să aflăm dacă scorurile obţinute
de cei 160 de subiecţi sunt stabile în timp.
În primul rând, vom calcula coeficientul de corelaţie r Bravais-
Pearson între cele două administrări. Desigur, nu vom mai intra în amănun-
tele procedeului de calcul, aceste lucruri fiind deja discutate anterior.
Analizând tabelul 3.29, observăm existenţa unei corelaţii semnifica-
tive, puternice şi pozitive între cele două administrări ale testului de inteli-
genţă (r=0,80, p<0,01).
Coeficientul de stabilitate se calculează, apoi, în baza formulei a do-
ua a lui Spearman-Brown (formula 3.2). Vom avea, deci,
347
Statistică aplicată în ştiinţele socio-umane
348
Cristian Opariuc-Dan
În concluzie:
Fidelitatea se referă la controlul erorilor aleatorii, în timp ce validitatea se ocupă
cu limitarea efectului pe care îl exercită erorile sistematice (nealeatorii);
Orice scor observat reprezintă suma dintre scorul real şi erorile de măsurare
(erorile aleatorii). Aceasta este ecuaţia fundamentală a teoriei clasice a testului;
Metoda test-retest vizează analiza stabilităţii scorurilor în timp şi presupune ad-
ministrarea aceluiaşi instrument, aceloraşi subiecţi, după un interval de timp;
Metoda înjumătăţirii (split-half) presupune împărţirea instrumentului în două
părţi, pe cât posibil egale, şi administrarea celor două forme aceluiaşi lot de sub-
iecţi;
Metoda consistenţei interne tratează fiecare item ca o mini formă a instrumentului
şi verifică măsura în care toţi aceşti itemi sunt corelaţi;
Metoda formelor paralele este o variantă a metodei înjumătăţirii şi presupune
echivalenţa celor două părţi sub aspectul varianţelor şi, pe cât posibil, sub aspec-
tul mediilor;
Metoda acordului între evaluatori urmăreşte identificarea măsurii în care mai
mulţi judecători efectuează evaluări consistente asupra unui grup de subiecţi;
Fidelitatea nu ne informează asupra unidimensionalităţii scalei, şi doar asupra
modului în care itemii sunt relaţionaţi între ei;
Nu există un acord între specialişti sub aspectul valorii de la care un instrument
poate fi considerat fidel. Recomandările oscilează în jurul coeficienţilor de la
0,50 la 0,60;
349
Statistică aplicată în ştiinţele socio-umane
Bibliografie
1. Albu, Monica. 2000. Metode şi instrumente de evaluare în
psihologie. Cluj-Napoca : Argonaut, 2000. 973-9350351-8.
2. Bakeman, Roger și Robinson, Byron F. 2004. Understanding
Statistics in the Behavioral Sciences. New Jersey : Lawrence
Erlbaum Associates, 2004. 0-8058-4944-0.
3. Carmines, Edward și Zeller, Richard. 1979. Reliability and
Validity Assessment. Iowa : Sage Publication, Inc, 1979.
9780803913714.
4. Cortina, J.M. 1993. What is coefficient alpha? An examination of
theory and applications. Journal of Applied Psychology. 98-104,
1993, 78.
5. Field, A. 2000. Discovering statistics using SPSS for Windows.
London : Sage, 2000.
6. Fisher, Ronald A. 1971. The design of experiments. New York :
Hafner Press, 1971.
7. Gibbons, Jean Dickinson. 1993. Nonparametric Measures of
Association. Iowa : Sage Publications, Inc, 1993. Vol. 07-091.
9780803946644.
8. Havârneanu, Corneliu Eugen. 2000. Cunoaşterea psihologică a
persoanei. Posibilităţi de utilizare a computerului în psihologia
aplicată. Iaşi : Polirom, 2000.
9. —. 2000. Metodologia cercetării în ştiinţele sociale. Iaşi : Erota,
2000.
10. Kenny, David A. 1987. Statistics for the social and behavioral
sciences. Ontario : Little, Brown and Company, 1987. 0-316-48915-
8.
11. Kirk, Roger E. 1995. Experimental design: Procedures for the
behaioral sciences. 3rd. Pacific Grove : Brooks/Cole, 1995.
12. Kline, P. 1999. The handbook of psychological testing, 2nd Edition.
London : Routledge, 1999.
13. Liebetrau, Albert M. 1983. Measures of Association. Washington :
Sage Publications, 1983. 0-8039-1974-3.
350
Cristian Opariuc-Dan
351
Statistică aplicată în ştiinţele socio-umane
Anexe
Anexa 1
Praguri de semnificaţie la diferite valori ale coeficientului de corelaţie a rangurilor
ρ Spearman pentru loturi de cercetare de diferite dimensiuni.
352
Cristian Opariuc-Dan
Mod de utilizare:
Căutaţi rândul din tabel ce conţine în prima coloană (n) numărul de subiecţi
din lotul dumneavoastră de cercetare. Dacă nu găsiţi exact numărul de sub-
iecţi dorit, alegeţi numărul imediat inferior (de exemplu, dacă aveţi 21 de sub-
iecţi, alegeţi rândul cu 20 de subiecţi).
353
Statistică aplicată în ştiinţele socio-umane
Anexa 2
Praguri de semnificaţie la diferite valori ale coeficientului de corelaţie a rangurilor
τ Kendall pentru loturi de cercetare de diferite dimensiuni.
Anexa 2 – Praguri de semnificaţie pentru diferitele valori ale lui τ Kendall
Pragul de semnificaţie
Pentru ipoteze unidirecţionale
n 0,025 0,01 0,005
Pentru ipoteze bidirecţionale
0,05 0,02 0,01
5 1 1 -
6 0,87 0,89 1
7 0,71 0,81 0,91
8 0,64 0,72 0,79
9 0,56 0,67 0,72
10 0,51 0,60 0,64
11 0,46 0,54 0,60
12 0,43 0,52 0,57
13 0,41 0,49 0,54
14 0,39 0,47 0,52
15 0,38 0,45 0,50
16 0,36 0,43 0,47
17 0,35 0,42 0,46
18 0,34 0,40 0,45
19 0,33 0,39 0,43
20 0,32 0,38 0,42
21 0,31 0,37 0,41
22 0,30 0,36 0,40
23 0,29 0,35 0,39
24 0,29 0,34 0,38
25 0,28 0,33 0,37
26 0,27 0,33 0,36
27 0,27 0,32 0,35
28 0,26 0,31 0,35
29 0,26 0,30 0,34
30 0,25 0,30 0,33
31 0,25 0,29 0,33
32 0,25 0,29 0,33
33 0,24 0,29 0,32
354
Cristian Opariuc-Dan
Mod de utilizare:
Căutaţi rândul din tabel ce conţine în prima coloană (n) numărul de subiecţi
din lotul dumneavoastră de cercetare.
355
Statistică aplicată în ştiinţele socio-umane
Anexa 3
Praguri de semnificaţie la diferite valori ale coeficientului de contingenţă χ2 pentru
loturi de cercetare de diferite dimensiuni.
356
Cristian Opariuc-Dan
Anexa 4
Praguri de semnificaţie la diferite valori ale testului t pentru loturi de cercetare de
diferite dimensiuni.
357
Statistică aplicată în ştiinţele socio-umane
Mod de utilizare:
Căutaţi rândul din tabel ce conţine în prima coloană (n) numărul de subiecţi
din lotul dumneavoastră de cercetare.
358
Cristian Opariuc-Dan
Anexa 5
Valori critice ale testului de concordanţă W Kendall. Sunt furnizate atât pragurile
pentru S cât şi, direct, pragurile pentru W.
Anexa 5 – Valori critice ale testului de concordanţă W Kendall
N
k
3 4 5 6 7
Valori pentru un prag de semnificaţie mai mic de 0,05
S W S W S W S W S W
3 - - - - 64,4 0,716 103,9 0,660 157,3 0,624
4 - - 49,5 0,619 88,4 0,552 143,3 0,512 217,0 0,484
5 - - 62,6 0,501 112,3 0,449 182,2 0,417 276,2 0,395
6 - - 75,7 0,421 136,1 0,378 221,4 0,351 335,2 0,333
8 48,1 0,379 101,7 0,318 183,7 0,287 299,0 0,267 453,1 0,253
10 60,0 0,300 127,8 0,256 231,2 0,231 376,7 0,215 571,0 0,204
15 89,8 0,200 192,9 0,171 349,8 0,155 570,5 0,145 864,9 0,137
20 119,7 0,150 258,0 0,129 468,5 0,117 764,4 0,109 1158,7 0,103
Valori pentru un prag de semnificaţie mai mic de 0,01
3 - - - - 75,6 0,840 122,8 0,780 185,6 0,737
4 - - 61,4 0,768 109,3 0,683 176,2 0,629 265,0 0,592
5 - - 80,5 0,644 142,8 0,571 229,4 0,524 343,8 0,491
6 - - 99,5 0,553 176,1 0,489 282,4 0,448 422,6 0,419
8 66,8 0,522 137,4 0,429 242,7 0,379 388,3 0,347 579,9 0,324
10 85,1 0,425 175,3 0,351 309,1 0,309 494,0 0,282 737,0 0,263
15 131,0 0,291 269,8 0,240 475,2 0,211 758,2 0,193 1129,5 0,179
20 177,0 0,221 364,2 0,182 641,2 0,160 1022,2 0,146 1521,9 0,136
Valori suplimentare când n=3 SURSA: după (Radu, și alții, 1993)
p<0,05 p<0,01
9 54,0 0,333 75,9 0,469
12 71,9 0,250 103,5 0,359
14 83,8 0,214 121,9 0,311
16 95,8 0,187 140,2 0,274
18 107,7 0,166 158,6 0,245
359
Statistică aplicată în ştiinţele socio-umane
Anexa 6
Valori critice privind testarea coeficienţilor de corelaţie r Bravais-Pearson
Anexa 6 – Valori critice ale testului de concordanţă W Kendall
Nivel de semnificaţie pentru ipoteză bidirecţională
df= n-2
0,10 0,05 0,02 0,01
1 0.988 0.997 0.9995 0.9999
2 0.900 0.950 0.980 0.990
3 0.805 0.878 0.934 0.959
4 0.729 0.811 0.882 0.917
5 0.669 0.754 0.833 0.874
6 0.622 0.707 0.789 0.834
7 0.582 0.666 0.750 0.798
8 0.549 0.632 0.716 0.765
9 0.521 0.602 0.685 0.735
10 0.497 0.576 0.658 0.708
11 0.476 0.553 0.634 0.684
12 0.458 0.532 0.612 0.661
13 0.441 0.514 0.592 0.641
14 0.426 0.497 0.574 0.628
15 0.412 0.482 0.558 0.606
16 0.400 0.468 0.542 0.590
17 0.389 0.456 0.528 0.575
18 0.378 0.444 0.516 0.561
19 0.369 0.433 0.503 0.549
20 0.360 0.423 0.492 0.537
21 0.352 0.413 0.482 0.526
22 0.344 0.404 0.472 0.515
23 0.337 0.396 0.462 0.505
24 0.330 0.388 0.453 0.495
25 0.323 0.381 0.445 0.487
26 0.317 0.374 0.437 0.479
27 0.311 0.367 0.430 0.471
28 0.306 0.361 0.423 0.463
29 0.301 0.355 0.416 0.456
30 0.296 0.349 0.409 0.449
35 0.275 0.325 0.381 0.418
40 0.257 0.304 0.358 0.393
45 0.243 0.288 0.338 0.372
50 0.231 0.273 0.322 0.354
60 0.211 0.250 0.295 0.325
360
Cristian Opariuc-Dan
Mod de utilizare:
Căutaţi rândul din tabel ce conţine în prima coloană (df) numărul de grade de
libertate (n-2).
361
Statistică aplicată în ştiinţele socio-umane
Anexa 7
Valori de referinţă privind coeficientul de corelaţie biserial şi triserial
Anexa 7 – Valori de referinţă pentru calculul coeficientului biserial şi triserial
p √ p √ p √
q q q
0,350 0,6142 1,288 1,0583 0,401 0,6213 1,268 0,9644 0,451 0,6254 1,257 0,8779
0,351 0,6144 1,287 1,0564 0,402 0,6214 1,267 0,9623 0,452 0,6254 1,257 0,8762
0,352 0,6145 1,287 1,0544 0,403 0,6215 1,267 0,9605 0,453 0,6255 1,256 0,8746
0,353 0,6147 1,286 1,0525 0,404 0,6216 1,267 0,9587 0,454 0,6255 1,256 0,8729
0,354 0,6149 1,286 1,0506 0,405 0,6218 1,267 0,9570 0,455 0,6256 1,256 0,8712
0,355 0,6151 1,285 1,0487 0,406 0,6219 1,266 0,9552 0,456 0,6256 1,256 0,8695
0,356 0,6152 1,285 1,0468 0,407 0,6220 1,266 0,9534 0,457 0,6257 1,256 0,8679
0,357 0,6154 1,284 1,0449 0,408 0,6221 1,266 0,9517 0,458 0,6257 1,256 0,8662
0,358 0,6155 1,284 1,0430 0,409 0,6222 1,265 0,9499 0,459 0,6258 1,256 0,8646
0,359 0,6157 1,283 1,0411 0,410 0,6223 1,265 0,9482 0,460 0,6258 1,256 0,8629
0,360 0,6158 1,283 1,0392 0,411 0,6224 1,265 0,9464 0,461 0,6258 1,256 0,8612
0,361 0,6160 1,283 1,0373 0,412 0,6225 1,265 0,9446 0,462 0,6259 1,255 0,8596
0,362 0,6162 1,282 1,0354 0,413 0,6225 1,264 0,9429 0,463 0,6259 1,255 0,8579
0,363 0,6163 1,282 1,0336 0,414 0,6226 1,264 0,9411 0,464 0,6260 1,255 0,8563
0,364 0,6165 1,281 1,0317 0,415 0,6227 1,264 0,9394 0,465 0,6260 1,255 0,8546
0,365 0,6166 1,281 1,0289 0,416 0,6228 1,264 0,9376 0,466 0,6260 1,255 0,8530
0,366 0,6168 1,280 1,0279 0,417 0,6229 1,263 0,9359 0,467 0,6261 1,255 0,8513
0,367 0,6169 1,280 1,0261 0,418 0,6230 1,263 0,9342 0,468 0,6261 1,255 0,8497
0,368 0,6171 1,280 1,0242 0,419 0,6231 1,263 0,9342 0,469 0,6261 1,255 0,8480
0,369 0,6172 1,279 1,0223 0,420 0,6233 1,263 0,9307 0,470 0,6262 1,255 0,8464
0,370 0,6174 1,279 1,0205 0,421 0,6233 1,262 0,9290 0,471 0,6262 1,255 0,8448
0,371 0,6175 1,278 1,0186 0,422 0,6234 1,262 0,9272 0,472 0,6262 1,254 0,8431
0,372 0,6177 1,278 1,0167 0,423 0,6234 1,262 0,9255 0,473 0,6263 1,254 0,8415
0,373 0,6178 1,278 1,0149 0,424 0,6235 1,262 0,9237 0,474 0,6263 1,254 0,8399
0,374 0,6179 1,277 1,0130 0,425 0,6236 1,261 0,9221 0,475 0,6263 1,254 0,8382
0,375 0,6181 1,277 1,0112 0,426 0,6237 1,261 0,9203 0,476 0,6263 1,254 0,8366
0,376 0,6182 1,276 1,0093 0,427 0,6238 1,261 0,9186 0,477 0,6264 1,254 0,8350
0,377 0,6184 1,276 1,0075 0,428 0,6239 1,261 0,9169 0,478 0,6264 1,254 0,8333
0,378 0,6185 1,276 1,0057 0,429 0,6239 1,261 0,9152 0,479 0,6264 1,254 0,8317
0,379 0,6186 1,275 1,0038 0,430 0,6240 1,260 0,9134 0,480 0,6264 1,254 0,8301
0,380 0,6188 1,275 1,0020 0,431 0,6241 1,260 0,9117 0,481 0,6265 1,254 0,8285
0,381 0,6189 1,274 1,0002 0,432 0,6242 1,260 0,9100 0,482 0,6265 1,254 0,8268
0,382 0,6190 1,274 0,9983 0,433 0,6242 1,260 0,9083 0,483 0,6265 1,254 0,8252
0,383 0,6192 1,274 0,9965 0,434 0,6243 1,260 0,9066 0,484 0,6265 1,254 0,8236
0,384 0,6193 1,273 0,9947 0,435 0,6244 1,259 0,9049 0,485 0,6265 1,254 0,8220
0,385 0,6194 1,273 0,9929 0,436 0,6244 1,269 0,9032 0,486 0,6266 1,254 0,8204
0,386 0,6196 1,273 0,9910 0,437 0,6245 1,259 0,9015 0,487 0,6266 1,254 0,8188
0,387 0,6197 1,272 0,9892 0,438 0,6246 1,259 0,8998 0,488 0,6266 1,254 0,8171
362
Cristian Opariuc-Dan
0,388 0,6198 1,272 0,9874 0,439 0,6246 1,259 0,8981 0,489 0,6266 1,253 0,8155
0,389 0,6199 1,272 0,9856 0,440 0,6247 1,259 0,8964 0,490 0,6266 1,253 0,8139
0,390 0,6200 1,271 0,9838 0,441 0,6248 1,258 0,8947 0,491 0,6266 1,253 0,8123
0,391 0,6202 1,271 0,9820 0,442 0,6248 1,258 0,8930 0,492 0,6266 1,253 0,8107
0,392 0,6203 1,271 0,9802 0,443 0,6249 1,258 0,8913 0,493 0,6266 1,253 0,8091
0,393 0,6204 1,270 0,9784 0,444 0,6250 1,258 0,8896 0,494 0,6266 1,253 0,8075
0,394 0,6205 1,270 0,9766 0,445 0,6250 1,258 0,8880 0,495 0,6266 1,253 0,8059
0,395 0,6206 1,270 0,9748 0,446 0,6251 1,258 0,8863 0,496 0,6266 1,253 0,8043
0,396 0,6208 1,269 0,9730 0,447 0,6251 1,257 0,8846 0,497 0,6266 1,253 0,8027
0,397 0,6209 1,269 0,9712 0,448 0,6252 1,257 0,8829 0,498 0,6267 1,253 0,8011
0,398 0,6210 1,269 0,9694 0,449 0,6253 1,257 0,8813 0,499 0,6267 1,253 0,7995
0,399 0,6211 1,268 0,9676 0,450 0,6253 1,257 0,8796 0,50 0,6267 1,253 0,7979
0,400 0,6212 1,268 0,9659 SURSA: după (Radu, și alții, 1993)
363
Statistică aplicată în ştiinţele socio-umane
Anexa 8
Valori critice pentru testul U Mann-Whitney la un prag de semnificație p < 0,05.
Pentru a fi semnificativ la acest prag, valoarea U trebuie să fie MAI MICĂ SAU CEL
MULT EGALĂ cu valoarea de referință din acest tabel.
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
3 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8
4 1 2 3 4 4 5 6 7 8 9 10 11 11 12 13 14
5 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19 20
6 - 5 6 8 10 11 13 14 16 17 19 21 22 24 25 27
Eșantionul cu numărul cel mai mic de subiecți n2
7 - - 8 10 12 14 16 18 20 22 24 26 28 30 32 34
8 - - - 13 15 17 19 22 24 26 29 31 34 36 38 41
9 - - - - 17 20 23 26 28 31 34 37 39 42 45 48
10 - - - - - 23 26 29 33 36 39 42 45 48 52 55
11 - - - - - - 30 33 37 40 44 47 51 55 58 62
12 - - - - - - - 37 41 45 49 53 57 61 65 69
13 - - - - - - - - 45 50 54 59 63 67 72 76
14 - - - - - - - - - 55 59 64 67 74 78 83
15 - - - - - - - - - - 64 70 75 80 85 90
16 - - - - - - - - - - - 75 81 86 92 98
17 - - - - - - - - - - - - 87 93 99 105
18 - - - - - - - - - - - - - 99 106 112
19 - - - - - - - - - - - - - - 113 119
20 - - - - - - - - - - - - - - - 127
364
Cristian Opariuc-Dan
Anexa 9
Praguri de semnificaţie pentru coeficientul de corelaţie parţială τxy.z Kendall.
Anexa 9 - Valori critice pentru coeficientul de corelaţie parţială Kendall
n 0,05 0,025 0,01 0,005
3 1 1 1 1
4 0,707 1 1 1
5 0,667 0,802 0,816 1
6 0,600 0,667 0.764 0,866
7 0,527 0,617 0,712 0,761
8 0,484 0,565 0,648 0,713
9 0,443 0,515 0,602 0,660
10 0,413 0,480 0,562 0,614
11 0,387 0,453 0,530 0,581
12 0,365 0,430 0,505 0,548
13 0,346 0,410 0,481 0,527
14 0,331 0,391 0,458 0,503
15 0,317 0,375 0,439 0,482
16 0,305 0,361 0,423 0,466
17 0,294 0,348 0,410 0,450
18 0,284 0,336 0,395 0,434
19 0,275 0,326 0,382 0,421
20 0,267 0,317 0,372 0,410
25 0,235 0,278 0,328 0,362
30 0,211 0,251 0,297 0,328
SURSA: Adaptare după S. Maghsoodloo (1975), „Estimates of the quantiles of Kendall's
partial rank correlation coefficient and additional quantile estimates,” Journal of Statisti-
cal Computation and Simulation 4: 155-164
Mod de utilizare:
Căutaţi rândul din tabel ce conţine în prima coloană (n) numărul de subiecţi.
365
Statistică aplicată în ştiinţele socio-umane
Anexa 10
Praguri de semnificaţie pentru valoarea de referință s în cazul semnelor, la diferite
valori ale lotului de cercetare (n).
Mod de utilizare:
Căutaţi rândul din tabel ce conţine în prima coloană (n) numărul de subiecţi.
366
Cristian Opariuc-Dan
Anexa 11
Praguri de semnificaţie pentru suma de referință a rangurilor în cazul testului
Wilcoxon, la diferite valori ale lotului de cercetare (n).
Mod de utilizare:
Căutaţi rândul din tabel ce conţine în prima coloană (n) numărul de subiecţi.
367
Statistică aplicată în ştiinţele socio-umane
Anexa 12
Praguri de semnificaţie pentru valorile de referință în cazul testului Romanovski,
la diferite valori ale lotului de cercetare (n) și pentru diferite praguri de semnificație.
Mod de utilizare:
Căutaţi rândul din tabel ce conţine în prima coloană (n) numărul de subiecţi.
368
Cristian Opariuc-Dan
Anexa 13
Funcția de repartiție normală normată (funcția cumulativă F (z) a lui Laplace).
Anexa 13 – Funcția cumulativă F(z) Laplace
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7321 0,7337 0,7380 0,7422 0,7454 0,7486 0,7517 0,7519
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8261 0,8289 0,8315 0,830 0,8365 0,8389
1,0 0,8413 0,8438 0,8161 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8702 0,8719 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8914 0,8962 0,8980 0,8997 0,9015
1,3 0,9023 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9729 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9932 0,9932 0,9934 0,9979
2,5 0,9938 0,9940 0,9941 0,9913 0,9945 0,9916 0,9918 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9977 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9981 0,9983 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
369
Statistică aplicată în ştiinţele socio-umane
Anexa 14
Coeficienții „a” pentru testul de normalitate W Shapiro-Wilk.
Anexa 14 – Coeficienții a pentru testul de normalitate W Shapiro-Wilk
n
2 3 4 5 6 7 8 9 10 -
k
1 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6052 0,6052 0,5888 -
2 - 0 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291 -
3 - - - 0 0,0875 0,1401 0,1743 0,1976 0,5141 -
4 - - - - - 0 0,0561 0,0947 0,1224 -
5 - - - - - - - 0 0,0399 -
n
11 12 13 14 15 16 17 18 19 20
k
1 0,5601 0,5475 0,5359 0,5251 0,5150 0,5056 0,4958 0,4886 0,4808 0,4743
2 0,3315 0,3325 0,3325 0,3318 0,3306 0,3290 0,3273 0,3253 0,3232 0,3211
3 0,2260 0,2347 0,2412 0,2460 0,2495 0,2521 0,2540 0,2553 0,2561 0,2565
4 0,1429 0,1586 0,1707 0,1802 0,1878 0,1939 0,1988 0,2027 0,2059 0,2085
5 0,0695 0,0922 0,1099 0,1240 0,1353 0,1447 0,1524 0,1587 0,1641 0,1686
6 0 0,0303 0,0539 0,0727 0,0880 0,1005 0,1109 0,1137 0,1271 0,1334
7 - - 0 0,0240 0,0433 0,0593 0,0725 0,0837 0,0932 0,1013
8 - - - - 0 0,0196 0,0359 0,0496 0,0612 0,0711
9 - - - - - - 0 0,0163 0,0303 0,0422
10 - - - - - - - - 0 0,0140
n
21 22 23 24 25 26 27 28 29 30
k
1 0,4643 0,4590 0,4542 0,4493 0,4450 0,4407 0,4366 0,4328 0,4291 0,4254
2 0,3185 0,3156 0,3126 0,3098 0,3069 0,3043 0,3018 0,2992 0,2968 0,2944
3 0,2578 0,2571 0,2563 0,2554 0,2543 0,2533 0,2522 0,2510 0,2499 0,2487
4 0,2119 0,2131 0,2139 0,2145 0,2148 0,2151 0,2152 0,2151 0,2150 0,2148
5 0,1736 0,1764 0,1787 0,1807 0,1822 0,1836 0,1848 0,1857 0,1864 0,1870
6 0,1399 0,1443 0,1480 0,1512 0,1539 0,1563 0,1584 0,1601 0,1616 0,1630
7 0,1092 0,1150 0,1201 0,1245 0,1283 0,1316 0,1346 0,1372 0,1395 0,1415
8 0,0804 0,0878 0,0941 0,0997 0,1046 0,1089 0,1128 0,1162 0,1192 ,1219
9 0,0530 0,0618 0,0696 0,0764 0,0823 0,0876 0,0923 0,0965 0,1002 0,1036
10 0,0263 0,0368 0,0459 0,0539 0,0610 0,0672 0,0728 0,0778 0,0822 0,0862
11 0 0,0122 0,0228 0,0321 0,0403 0,0476 0,0540 0,0598 0,0650 0,0697
12 - - 0 0,0107 0,0200 0,0284 0,0358 0,0424 0,0483 0,0537
13 - - - - 0 0,0094 0,0178 0,0253 0,0320 0,0381
14 - - - - - - 0 0,0084 0,0159 0,0227
15 - - - - - - - - 0 0,0076
370
Cristian Opariuc-Dan
n
31 32 33 34 35 36 37 38 39 40
k
1 0,4220 0,4188 0,4156 0,4127 0,4096 0,4068 0,4040 0,4015 0,3989 0,3964
2 0,2921 0,2829 0,2876 0,2854 0,2834 0,2813 0,2794 0,2774 0,2755 0,2737
3 0,2475 0,2463 0,2451 0,2439 0,2427 0,2415 0,2403 0,2391 0,2380 0,2368
4 0,2145 0,2141 0,2137 0,2132 0,2127 0,2121 0,2116 0,2110 0,2101 0,2098
5 0,1874 0,1878 0,1880 0,1882 0,1883 0,1883 0,1883 0,1881 0,1880 0,1878
6 0,1641 0,1651 0,1660 0,1667 0,1673 0,1678 0,1683 0,1680 0,1689 0,1691
7 0,1433 0,1449 0,1463 0,1475 0,1487 0,1496 0,1505 0,1513 0,1520 0,1526
8 0,1243 0,1265 0,1284 0,1301 0,1317 0,1331 0,1344 0,1356 0,1366 0,1376
9 0,1066 0,1093 0,1118 0,1140 0,1160 0,1179 0,1196 0,1211 0,1225 0,1237
10 0,0899 0,0931 0,0961 0,0988 0,1013 0,1036 0,1056 0,1075 0,1092 0,1108
11 0,0739 0,0777 0,0812 0,0844 0,0873 0,0900 0,0924 0,0947 0,0967 0,0986
12 0,0585 0,0629 0,0669 0,0706 0,0739 0,0770 0,0798 0,0824 0,0848 0,0870
13 0,0435 0,0485 0,0530 0,0572 0,0610 0,0645 0,0677 0,0706 0,0733 0,0759
14 0,0289 0,0344 0,0395 0,0441 0,0484 0,0523 0,0559 0,0592 0,0622 0,0651
15 0,0144 0,0206 0,0262 0,0314 0,0631 0,0404 0,0444 0,0481 0,0515 0,0546
16 0 0,0068 0,0131 0,0187 0,0239 0,0287 0,0331 0,0372 0,0409 0,0444
17 - - 0 0,0062 0,0119 0,0172 0,0220 0,0264 0,0305 0,0343
18 - - - - 0 0,0057 0,0110 0,0158 0,0203 0,0244
19 - - - - - - 0 0,0053 0,0101 0,0116
20 - - - - - - - - 0 0,0049
n
41 42 43 44 45 46 47 48 49 50
k
1 0,3940 0,3917 0,3894 0,3872 0,3850 0,3830 0,3808 0,3789 0,3770 0,3751
2 0,2719 0,2701 0,2684 0,2667 0,2651 0,2635 0,2620 0,2604 0,2589 0,2574
3 0,2357 0,2345 0,2334 0,2323 0,2310 0,2303 0,2291 0,2281 0,2271 0,2260
4 0,2091 0,2085 0,2078 0,2072 0,2065 0,2058 0,2052 0,2045 0,2038 0,2032
5 0,1876 0,1874 0,1871 0,1868 0,1865 0,1862 0,1859 0,1855 0,1851 0,1847
6 0,1693 0,1694 0,1695 0,1695 0,1695 0,1695 0,1695 0,1693 0,1692 0,1691
7 0,1531 0,1535 0,1539 0,1512 0,1541 0,1548 0,1550 0,1551 0,1553 0,1554
8 0,1384 0,1392 0,1398 0,1405 0,1410 0,1415 0,1420 0,1423 0,1427 0,1430
9 0,1249 0,1259 0,1269 0,1278 0,1286 0,1293 0,1300 0,1306 0,1312 0,1317
10 0,1123 0,1136 0,1149 0,1160 0,1170 0,1180 0,1189 0,1197 0,1205 0,1212
11 0,1004 0,1020 0,1035 0,1049 0,1062 0,1073 0,1085 0,1095 0,1105 0,1113
12 0,0891 0,0909 0,0927 0,0943 0,0959 0,0972 0,0986 0,0998 0,1010 0,1020
13 0,0782 0,0804 0,0824 0,0824 0,0860 0,0876 0,0892 0,0906 0,0919 0,0932
14 0,0677 0,0701 0,0724 0,0745 0,0765 0,0783 0,0801 0,0817 0,0832 0,0816
15 0,0575 0,0602 0,0628 0,0651 0,0673 0,0694 0,0713 0,0731 0,0718 0,0764
16 0,0476 0,0506 0,0534 0,0560 0,0584 0,0607 0,0628 0,0648 0,0667 0,0685
17 0,0379 0,0411 0,0442 0,0471 0,0497 0,0522 0,0546 0,0568 0,0588 0,0608
18 0,0283 0,0318 0,0352 0,0383 0,0412 0,0439 0,0465 0,0489 0,0511 0,0532
19 0,0188 0,0227 0,0263 0,0296 0,0328 0,0357 0,0385 0,0411 0,0436 0,0459
20 0,0094 0,0136 0,0175 0,0211 0,0245 0,0277 0,0307 0,0335 0,0361 0,0386
21 0 0,0045 0,0087 0,0126 0,0163 0,0197 0,0229 0,0259 0,0288 0,0314
22 - - 0 0,0042 0,0081 0,0118 0,0153 0,0185 0,0215 0,0244
23 - - - - 0 0,0039 0,0076 0,0111 0,0143 0,0174
24 - - - - - - 0 0,0037 0,0071 0,0104
25 - - - - - - - - 0 0,0035
371
Statistică aplicată în ştiinţele socio-umane
Anexa 15
Praguri de semnificație pentru testul de normalitate W Shapiro-Wilk.
Anexa 15 – Valori critice pentru testul de normalitate W Shapiro-Wilk
n 0,01 0,02 0,05
3 0,653 0,756 0,767
4 0,686 0,707 0,748
5 0,687 0,715 0,762
6 0,713 0,743 0,788
7 0,730 0,760 0,803
8 0,749 0,778 0,818
9 0,764 0,791 0,829
10 0,781 0,806 0,842
11 0,792 0,817 0,850
12 0,805 0,828 0,859
13 0,814 0,837 0,866
14 0,825 0,846 0,874
15 0,835 0,855 0,881
16 0,844 0,863 0,887
17 0,851 0,869 0,892
18 0,858 0,871 0,897
19 0,863 0,879 0,901
20 0,868 0,884 0,905
21 0,873 0,888 0,908
22 0,878 0,892 0,911
23 0,881 0,895 0,914
24 0,881 0,898 0,916
25 0,888 0,901 0,918
26 0,891 0,904 0,920
27 0,894 0,906 0,923
28 0,896 0,908 0,924
29 0,898 0,910 0,926
30 0,900 0,912 0,927
31 0,902 0,914 0,929
32 0,904 0,915 0,930
33 0,906 0,917 0,931
34 0,908 0,919 0,933
35 0,910 0,920 0,934
36 0,912 0,922 0,935
37 0,914 0,924 0,936
38 0,916 0,925 0,938
39 0,917 0,927 0,939
40 0,919 0,928 0,940
372
Cristian Opariuc-Dan
373