Sunteți pe pagina 1din 8

1

Curs 7`
ELEMENTE DE STATISTIC PENTRU PSIHODIAGNOZ
La finele acestui curs vei fi capabili:
-S alegei metoda potrivit de etalonare a unui test, funcie de tendinele centrale ale
eantionului utilizat.
- S elaborai un tabel de norme i s l utilizai n interpretarea rezltatelor individuale la test.
I Tabelarea scorurilor la teste
Presupunem c aplicndu-se un test de inteligen la o clas format din 42 copii (N=42)
au fost obinute urmtoarele rezultate (= note, cote brute, scoruri):
61 60 50 52 58 38 60 51 55 68 55 62 47 39
58 42 47 42 48 49 48 46 55 51 58 65 45 35
48 54 52 56 46 65 53 34 48 50 39 59 53 52
Examinatorul ar dori s tie care este nivelul clasei i ct de mari sunt diferenele ntre copii.
Valorile primare (cotele la test, notele) nu ne spun nimic.
Primul pas pe care trebuie s-l fac examinatorul este ntocmirea tebelei de frecven. Aceasta
se poate realiza n dou variante: cu date negrupate I cu date grupate.
a)Varinta cu date negrupate: se ntocmete tabelul de mai jos.
Tabelul 1.
Note obtinute
Tabelarea
Frecvena
Frecvena
La test
frecvenei
(f)
cumulata
34
/
1
1
35
/
1
2
36
37
38
/
1
3
39
///
6
40
41
42
//
2
8
43
44
45
/
1
9
46
//
2
11
47
//
2
13
48
////
4
17
49
/
1
18
50
/
51
//
2
21
52
///
3
24
53
//
2
26
54
/
1
27
55
///
3
30
56
/
1
31
57
58
///
3
34
59
/
1
35
60
//
2
37
61
/
1
38

62
63
64
65
66
67
68

39

//

41

42

Scorul maxim obinut la acest test este MAX=68, iar cel minim este MIN=34. n prima coloan se
trec n ordine cresctoare toate valorile posibile cuprinse ntre limitele 34 i 68. n a doua coloan,
n dreptul fiecrei valori, se trage cte o linie de fiecare dat cnd gsim aceast scor n populaia
noastr de date. n a teria coloan se trece n cifre numrul de apariii al fiecrei valori. n a patra
coloan se nsumeaz frecvenele de sus n jos.
b) Varianta cu date grupate:
Spre deosebire de prima variant, n acest caz, prima coloan conine intervalele n care sunt
cuprinse scorurile brute obinute la test. Mrimea intervalului se numete amplitudine. Se dorete
ca amplitudinea s fie un numr impar (3, 5, 7) pentru c ne intereseaz intotdeauna valoarea de
mijloc a fiecrui interval, care este de dorit s fie un numr ntreg. Se recomand ca valoarea
minim a primului interval s fie un multiplu al amplitudinii. Amplitudinea intervalului se stabilete
astfel: Xmax - Xmin = 68 - 34 = 34. Alegem numrul de intervale cel mai convenabil. El nu trebuie
s fie mai mic de 10 i nu mai mare de 20. Optm pentru un numr de 13 intervale. Amplitudinea
intervalului notat cu i va fi:
i = Xmax - Xmin = 34/13 = 2.6 valoare care prin aproximare este 3. Construim primul interval (de
jos n sus) alegnd limita minim a celui mai mic interval astfel nct aceasta s fie mai mic
dect cea cel mai mic scor din populaia noastr de date.
Tabelarea frecvenelor se realizeaz dup procedura deja cunoscut. Coloana xk nglobeaz
valorile de mijloc ale fiecrui interval.
Tabelul 2.
Interval
Tabelarea
frecvenei f
66-68
/
63-65
//
60-62
////
57-59
////
54-56
/////
51-53
///////
48-50
///////
45-47
/////
42-44
//
39-41
//
36-38
/
33-35
//

Xk
67
64
61
58
55
52
49
46
43
40
37
34

f
1
2
4
4
5
7
7
5
2
2
1
2

42
41
39
35
31
26
19
12
7
5
3
2

Xk*f
67
128
244
232
275
364
343
230
86
80
37
68

Coloanele f i f conin frecvenele simple, respectiv, cumulate. Ultima colaoan conine


produsul dintre mijlocul intervalului i frecvena. Suma lor este T=Xk*f = 2154 , ceea ce
echivaleaz cu suma tuturor valorilor din populaia de scoruri la testul de inteligen. Ea va putea
fi utilizat n calcularea tendinelor centrale.
Deja tabelele, n special tabelul 2, ne ofer unele informaii: liniuele ne arat o anumit
aproximare a curbei normale de distribuie (forma de clopot este evident dac rotii foia pe
orizontal); 24 de valori se situeaz n intervalul de mijloc; extremele sunt rare.

II Reprezentarea grafic a distribuiei de frecvene


Un al doilea pas n interpretarea valorilor primare este reprezentarea grafic a distribuiei de
frecven. Aceasta se poate realiza n dou moduri: poligonul frecvenelor i histograma.
A. Poligonul frecvenelor:
Pe abscis sunt reprezentate valorile variabilei aleatoare (orice caracteristic psihic, fizic,
fiziologic ce ia valori ntr-un anumit domeniu de definiie). Exemplu inteligena ia valori n
totalitatea scorurilor obinute la test, mai frecvent valorile din mijloc ale intervalului. Pe ordonat
sunt reprezentate frecvenele de apariie n colecia de date ale acestor valori. Pe abscis sunt
reprezentate valorile de mijloc ale intervalelor.
B. Metoda histogramei
Pe abcis sunt reprezentate intervalele din tabela de frecven cu date grupate, pe ordonat sunt
reprezentate frecvenele. Histograma reprezint o transpunere n trepte a distribuiei de frecvena.
Avantaj: suprafaa sa poate fi interpretata ca fiind numrul total de cazuri. Aria fiecrui dreptunghi
este egal cu numrul de persoane, de cazuri, ce se situeaz la intervalul respectiv.
Dac numrul de subieci ar tinde catre valorile obinute ar fi foarte multe, nct
suprafaa s-ar diviza n n suprafee, ar cpta aspectul de linie curb continua i s-ar apropia
foarte mult de forma curbei normale de distribuie a lui Gauss.

Graficul este sugestiv pentru deosebirea dintre curba care teoretic (linia neagr accentuat) s-ar
fi putut obine obine dac eantionul ar fi fost sufucient de mare, i curba real obinut prin
unirea cu o linie continu a conturului exterior al dreptunghiurilor din histogram.
Cu ct eantionul de subieci (sau colecia de date) este mai mare, cu att
probabilitatea ca histograma sa aproximeze, curba distribuiei normale este mai mare. Dup curba
lui Gauss, se distribuie marea majoritate a msurtorilor intreprinse n domeniul fenomenelor
fizice i psihofiziologice, cu condiia s existe un numr destul de mare de msurtori.
Semnificaia acestei distribuii este c valorile foarte mari i foarte mici ale unei variabile (statura
sau nivelul de inteligen ), ntr-un eantion ales la ntmplare din populaia general, sunt mai
rare i situate la extremele abscisei curbei, n timp ce valorile mijlocii sunt mult mai numeroase i
''acoper'' zona de mijloc a curbei. Accentum c eantioanele de date trebuie s fie extrase din
populaie la ntamplare, pentru a fi reprezentative pentru populaia de apartenen.
n funcie de caracteristicile curbei obinute vor fi utilizate unele sau altele dintre
instrumentele statistice. Sunt doi indici care descriu forma curbei prin raportare la modelul normal
care este cel gaussian:
a) indicele de oblicitate (skewness) = msoar asimetria distribuiei; o valoare pozitiv are
semnificaia c valorile extreme sunt mai numeroase dect cele medii; o valoare negativ are
semnificaia c valorile extreme ale unei variabile msurate sunt mai puine dect cele de mrime
medie, ceea ce se i ntmpl atunci cnd populaia de date este obinut pe criterii aleatoare i
este suficient de numeroas.
b) indicile de curtoz (kurtosis) = semnific gradul de ''turtire'' al curbei, comparativ cu o curba
normal avnd aceeai abatere standard. Un indice pozitiv semnific existena mai multor cazuri
n cozile extreme ale curbei dect n zona de mijloc.
Cnd curba este bimodal, adic are dou maximuri (''cocoae''), nseamn c n eantion au fost
inclui subieci care provin din dou populaii distincte i ca urmare orice generalizare este fr
valoare deoarece media se situeaz ntre cele dou maximuri.
nainte de a continua un experiment sau un program de testare este necesar s studiem curba de
distribuie. Dac devierea de la forma curbei normale este excesiv, urmeaz unele consecine

privind decizia de a utiliza un anume gen de instrumente statistice sau altul. Asupra acestei
chestiuni vom mai reveni.
Msuri ale tendinei centrale.
Cnd studiem o populaie de date este de dorit sa avem la dispozitie nite indici (numere) care s
exprime ntr-o form ct mai sintetic tendinele populaiei.
A. Unul dintre aceti indici este media aritmetic ( x )
n mod obinuit mediana este desemnat de simbolul X
. Pentru lejeritatea redactrii am
preferat simbolul X
X = x /n
n cazul nostru, pentru date negrupate, media va fi 2154 / 42
Metoda de calcul pentru date grupate.

= 53,5

X = f*xk / n.
Media este msura cea mai precis a tendinei centrale deoarece se bazeaz pe numrul total al
valorilor individuale ale variabilei aleatoare. Cnd colecia de date se reduce la cteva cazuri
media este mai puin relevant dect mediana.
B. Modulul (moda bruta). Este dat de valoarea cu frecvena cea mai mare. Exemplu : ntr-o
populaie de date 3, 9, 10, 11, 11, 11, 12, 12, 13, 18 moda brut este 11. Reprezint estimaia
cea mai grosier a tendinei centrale a unei colecii de date.
n tabelul 1 modul brut este val. 48 deoarece are frecvena cea mai mare, egal cu 4. n tabelul 2
modul brut este mijlocul intervalului cu frecvena cea mai mare, adic 50.5 (deoarece ''cade'' ntre
49 i 52). Gruparea datelor, este un procedeu comod, dar poate duce la unele distorsiuni, cum
este cazul valorii diferite a modei brute, mediei i medianei comparativ cu datele negrupate.
C. Mediana. Este punctul central al unei distribuii a valorilor unei variabile aleatoare. Ea se
definete ca fiind punctul, dedesubtul i deasupra creia se situeaz 50% din totalitatea valorilor
(valorile trebuie aranjate n ordinea mrimii lor).
Determinarea medianei pentru date negrupate:
Cazul 1. N este impar: Fie valorile: 6 9 10 11 12 13 15 17 20 Mediana este 12
Cazul 2. N este par 3 6 9 10 11 12 13 15 17 20
Mediana este 11.5
Determinarea madianei (tabelul 1.):
Pe coloana frecvenelor cumulate cutm valoarea lui 21, care este echivalentul lui 50% din
populaie, adic:
50*42/100=21. Semnul ''*'' desemneaz aici operaia de nmulire.
n dreptul valorii 21, reperat pe coloana frecvenelor cumulate, pe coloana notelor la test gsim
valoarea 51. Deci 51 este mediana.
Determinarea medianei pe date grupate
Tabelul 2: Se vede c 50% din cazuri reprezint 21. Aceast valoare este uneori numit quot.
Ne situm pe coloana frecvenelor cumulate. Valoarea 21 se situeaz ntre 19 i 26. Mediana se
va situa in jurul valorii de 50 (corespunztor frecvenei 19) la care trebuie sa adunam o anumit
cot, o corecie ce se determin prin interpolare linear, corespunztor frecvenei de 21.
Deoarece de la 19 la 21 sunt dou uniti aplicm regula de trei simpl
7_ _ _ _ _ _ _ _ _3
2_ _ _ _ _ _ _ _ _ x
Dac unei creteri de 7 uniti pe scara frecvenelor (de la 19 la 26) i corespunde o cretere de 3
uniti pe scara notelor la test, atunci unei creteri de frecven de dou uniti i va corespunde o
cretere, n coloana notelor la test de x.
x=2*3/7 = 0.8
Mediana = 50,8. Mediana prezint fa de medie urmtoarele avantaje:
-este mai uor de calculat dect mediana.

poate fi mai reprezentativ dect media in unele situaii.


ntr-o colecie de date care se distribuie, aproximnd pn la suprapunere curba normal de
distribuie media, mediana i moda brut coincid.
Compararea si combinarea datelor la teste
Pentru a putea interpreta datele rezultate din administrarea instrumentului de psihodiagnoz
recurgem la anumite procedee statistice.
Variabile normate. Reprezint un procedeu statistic prin care poziia subiectului, ntr-o distribuie
dat, privitoare la o anumita caracteristic psihologic, este exprimat att n raport cu media, ct
i n raport cu mprtierea. Acest fapt permite efectuarea unor comparaii ntre nsuiri, altfel, de
necomparat: inteligena cuiva cu greutatea sa.
Suntem nevoii s facem urmtoarele explicaii:
Indicatori pentru inprtiere:
1. Amplitudinea mprtierii = Xmax - Xmin . n cazul datelor noastre Xma - Xmin =68 - 34 = 34
2. Abaterea medie este media abaterilor absolute
Am= (X X) / N ; unde x= media, x= valorile de la teste
3. Dispersia (2)
2 = x2 unde x2 = (X - X ) - ptratul abaterii valorii individuale de la medie
Pentru eantioane mici, care reprezint selecii aleatoare dintr-o populaie, dispersia i abaterea
standard se calculeza mprind numrtorul la N -1; pentru populaiile totale utilizm ca numitor
N 1. In cazurile seleciilor din populaia total abaterea standard se noteaz cu ''s''.
Pentru datele din tabelul 1 abaterea standard va fi:
s =
x2
=
(x- x)2
= 2,7
N-1
N-1
Sunt mai multe tipuri de variabile normate (note standard). Cel mai ntlnit tip de variabil normat
este variabila Z care este definita prin ctul dintre abaterea individual de la medie i abaterea
standard: (X - X ) /
n cazul coleciei noastre de date = 2,7
S lum cazul unui subiect care a obinut la testul de inteligen nota 56. Transformat n not Z ,
performana sa va fi, pentru abaterea standard, deja calculat, de 2.7:
Z = (X - X) / = (56 - 53.5) / 2.7 1.
Variabilele Z au abaterea standard teoretic egal cu 1.
Presupunnd, c nota Z al aceluiai subiect la un alt test Y ar fi egal cu 2, am putea afirma c
subiectul respectiv este de dou ori mai bun la al doilea test dect la primul.
Atunci cnd valoarea individual este mai mic dect media rezult o not Z cu semn ( - ) ceea ce
este un dezavantaj.
Variabila T elimin acest dezavantaj deoarece n formul se adaug o constant egal cu 50:
T = 50 +10 / * (x-x ). n exemplul nostru T = 50 + 10 / 2.7 * (56 - 53.5) = 50 + 3.7 * 2.7 = 59.9
Variabilele T au abaterea standard teoretic egal cu 10 i media egal cu 50. Subiectul cu nota T
egal cu 59.9 este un subiect situat deasupra mediei. Odat cu aceast constatare am
progresat, cci deja putem face aseriuni despre nivelul de inteligen.
Valorile variabilei T merg de le 0 la 100 (media =50; abaterea standard= 10), dar n realitate
variabila T se distribuie ntre 15 i 85.
Variabila Hull. Spre deosebire de variabile normate au abaterea standard de 14.
Hull = 50 + 14/ ( x x)
ETALONAREA TESTELOR PSIHOLOGICE
O prim etap n valorificarea rezultatelor la testele psihologice o reprezint exprimarea
performantelor individuale ntr-o form numeric. Aceste rezultate reprezint forma brut a
performanei. Pentru a accede la interpretarea psihologic a rezultatelor trebuie s le raportm la
caracteristicile populaiei sau eantionului de apartenen.

Un prim pas n a valorifica notele ( scorurile brute) l reprezint transformarea lor n variabile
normate.
Dintre multiplele variante de etalonare o vom alege pe aceea care este mai potrivit. n luarea
deciziei vom apela la metoda histogramei sau a poligolunului frecvenelor. O distribuie normal a
coleciei noastre de date ne va perimite s alegem metoda quartilelor, variabilelor normate sau a
staninelor. n caz contrar vom alege o metod mai grosier numit metoda percentilelor. Aici
avem dou variante: metoda decilelor i metoda centilelor.
1. Etalonarea n quartile.
Se mparte colecia de scoruri la test n 4 clase, Q1, Q2, Q3, Q4, fiecare cuprinznd 25 % din
totalul coleciei de date ordonate, ca n tabelul 1, n ordinea mrimii lor.
Calculm ct reprezint 25% din colecia noastr de scoruri la test . N fiind egal cu 42 rezult: 25 *
42 /100 = 10.5. n tabelul 1, pe coloana frecvenelor cumulate, cutm o valoare apropiat cu
10.5, aceasta fiind 11. Pe coloana notelor obinute de subieci la testul de inteligen, n dreptul
valorii 11 citim valoarea 46. Deci subiecii situai n primul Quartil, vor fi cei care au scorurile la test
cuprinse ntre 0 i 46. Subiecii situai n quartlul al doilea vor fi cei care reprezint 50 % din
populaie, adic 21. Valoarea gsit pe coloana scorurilor la test, n tabelul 1, pentru valoarea de
21 pe coloana frecvenelor cumulate, va fi 51. Deci intervalul n care se vor situa aceti subieci,
privitor la scorurile obinute la test, va fi cuprins ntre 47 ( valoarea imediat mai mare dect limit
maxim a primului interval) i valoarea 51. Pentru quartilul al treilea 75 % din 42 este egal cu
31.5. Quartilul al treilea va fi cuprins ntre 52 i 56. Quartilul al patrulea va fi cuprins ntre 53 i
nota cea mai mare, teoretic posibil, la testul etalonat. Pentru exemplul nostru, care este imaginar,
putem presupune ca not maxim valoarea 68 sau 70.
Intervalele (quartilele) obinute le putem grupa n urmtorul tabel:
Quartilul
I
II
III
IV

Procentaje
Procentaje reale
teoretice cumulate
cumulate
25%
10.5
50%
21
75%
31.5
100%
42
Media
Mediana

Intervale
scoruri

de

0 - 46
47 - 51
52 - 56
57 - 70
51.2
50.5

Presupunem c un copil a obinut scorul 39. Tabelul ne permite s inferm c la nivelul


eantionului de elevi studiat subiectul va fi mai slab dect ceilali 75 %, adic, dect 31 dintre ei.
Aa cum se observ el se situeaz dramatic sub medie cu mai bine de un interval , respectiv cu
12 puncte la test. Aceast metod de etalonare este expeditiv, dar n acelai timp grosier. Ea
se bazeaz pe presupunerea c datele la test s-au distribuit pe o curb (histogram, poligon al
frecvenelor) care aproximeaz curba normal.
2. Etalonarea n decile . Apelnd la tabelul 1 procedm asemntor metodei quartilelor cu
deosebirea c vom calcula procentajele pentru 10%, 20%, 30%......90%.
Decile

Interval

1
2
3
4
5
6

0 39
40 45
46 47
48 49
50 51
52 53

Procentaje
teoretice
cumulate
10%
20%
30%
40%
50%
60%

Procentaje
reale
cumulate
4.2
8.4
12.6
16.8
21
25.2

7
8
9
10

54 55
56 58
59 61
62 - 68

70%
80%
90%
100%

29.4
33.6
37.8
42

Despre un subiect care a obinut scorul de 58 vom putea spune c este mai bun dect ceilali 80 %, i
c, la nivelul, eantionului studiat, doar 20 % dintre elevi sunt mai buni dect el.
Etalonarea n centile. Se procedeaz asemntor metodei decilelor i quartilelor dar de aceast
dat vom realiza intervale de scoruri pentru procentajele 1%, 2%, 3%.....99%.
Etalonarea n clase normalizate.
Prin metodele precedente, subiecii au fost mparii n unitai procentuale egale ceea ce duce la
intervale ntre repere care nu sunt echidistante.
Repartizarea procentajelor pe curba lui Gauss nu se face dup funcii lineare. Teoretic acest
curba a fost mparit ntr-un numr variabil de clase (intervale), ca n tabelul urmtor:
6,7
4,8
4,0
11,6

24,2
11,1
6,6
4,5

38,2
21,2
12,1
7,7

24,2
25,8
17,8
11,6

6,7
21,2
19,6
14,6

11,1
17,5
16,0

4,8
12,1
14,6

6,6
11,6

4,0
7,7

4,5

3,6

Numr clase
5
7
9
11

Exemplificm n continuare utilizarea metodei de normalizare (etalonare) n cinci clase. Se


calculeaz procentajele reale, cumulate, pentru N = 42, corespunztor celor cinci procentaje
teoretice, rezultate din gradarea curbei n 5 clase.
Pentru primul interval (clas) se calculeaz: 6.7 * 42 / 100 = 2.81. n tabelul 1, valoarea cea mai
apropiat, pe coloana frecvenelor cumalte de acest valoare este 3. Lui 3 i corespunde, pe
coloana scorurilor la test valoarea 38. Deci primul interval va fi cuprins ntre 0 i 38. Pentru al
doilea interval procentajul va fi: (6.7 +24.2) * 42 /100 = 12.97. Scorul la test corespunztor va fi de
47. Al doilea interval va fi cuprins ntre 39 i 47. Al treilea interval se va calcula pentru urmtorul
procentaj: (6.7 + 24.2 +38.2) * 42 / 100. Odat cu al patrulea interval procentajul va fi (6.7 +24.2 +
38.2 + 24.2) * 42 / 100. Rezult tabelul de norme prezentat n continuare.
Clasa
Calificativ Interval
Procent Procentaje
e
reale
teoretice cumulate
cumulate
1
foarte
0 - 38
6,7
2.81
slab
2
slab
39 - 47
30,9
12.97
3
mediu
48 - 55
69,1
29.02
4
bun
56 - 62
93,3
39.18
5
foarte
63 - 70
100
42
bun
Media
51.2
Mediana
50.5
2.7

N
42
Observai c intervalelor le-au fost ataate calificative, ceea ce este un pas nainte n
interpretarea psihologic a rezultatelor la test.
Exist o anumit echivalen ntre diferitele tipuri de etalonare pe care o prezentm n anexa dup
A. Anastasi (1976).

Exist etaloane generale obinte pe populaii foarte mari, cu costuri considerabile. S-a dovedit
ns c etaloanele locale (obinute pe eantioane restrnse, caracterizate prin similaritatea mai
multor caracteristici cum sunt: ocupaia, natura solicitorilor, particulariti culturale, etc.) sunt,
uneori, mult mai valide.
ntrebri pentru autoevaluare.
Crui scop servete realizarea histogramei sau realizarea poligonului de frecvene ?
De ce este necesar s raportm scorurile brute la tabele de norme ?
Crui scop servesc, n domeniul psihodiagnozei, calcularea indicatorilor tendinelor centrale ?
Lecturi suplimentare
Smith, M., 1971, Ghid simplificat de statistic pentru psihologie i pedagogie, E.D.P. Bucureti.
Pitariu, H., 1983, Psihologia seleciei i formrii profesionale, Ed. Dacia, Cluj, pp 270 - 287.
Anastasi, A., 1976, Psychological Testing, Macmil., Publ. ,New York, London, pp.67-94.