Documente Academic
Documente Profesional
Documente Cultură
Curs 7`
ELEMENTE DE STATISTIC PENTRU PSIHODIAGNOZ
La finele acestui curs vei fi capabili:
-S alegei metoda potrivit de etalonare a unui test, funcie de tendinele centrale ale
eantionului utilizat.
- S elaborai un tabel de norme i s l utilizai n interpretarea rezltatelor individuale la test.
I Tabelarea scorurilor la teste
Presupunem c aplicndu-se un test de inteligen la o clas format din 42 copii (N=42)
au fost obinute urmtoarele rezultate (= note, cote brute, scoruri):
61 60 50 52 58 38 60 51 55 68 55 62 47 39
58 42 47 42 48 49 48 46 55 51 58 65 45 35
48 54 52 56 46 65 53 34 48 50 39 59 53 52
Examinatorul ar dori s tie care este nivelul clasei i ct de mari sunt diferenele ntre copii.
Valorile primare (cotele la test, notele) nu ne spun nimic.
Primul pas pe care trebuie s-l fac examinatorul este ntocmirea tebelei de frecven. Aceasta
se poate realiza n dou variante: cu date negrupate I cu date grupate.
a)Varinta cu date negrupate: se ntocmete tabelul de mai jos.
Tabelul 1.
Note obtinute
Tabelarea
Frecvena
Frecvena
La test
frecvenei
(f)
cumulata
34
/
1
1
35
/
1
2
36
37
38
/
1
3
39
///
6
40
41
42
//
2
8
43
44
45
/
1
9
46
//
2
11
47
//
2
13
48
////
4
17
49
/
1
18
50
/
51
//
2
21
52
///
3
24
53
//
2
26
54
/
1
27
55
///
3
30
56
/
1
31
57
58
///
3
34
59
/
1
35
60
//
2
37
61
/
1
38
62
63
64
65
66
67
68
39
//
41
42
Scorul maxim obinut la acest test este MAX=68, iar cel minim este MIN=34. n prima coloan se
trec n ordine cresctoare toate valorile posibile cuprinse ntre limitele 34 i 68. n a doua coloan,
n dreptul fiecrei valori, se trage cte o linie de fiecare dat cnd gsim aceast scor n populaia
noastr de date. n a teria coloan se trece n cifre numrul de apariii al fiecrei valori. n a patra
coloan se nsumeaz frecvenele de sus n jos.
b) Varianta cu date grupate:
Spre deosebire de prima variant, n acest caz, prima coloan conine intervalele n care sunt
cuprinse scorurile brute obinute la test. Mrimea intervalului se numete amplitudine. Se dorete
ca amplitudinea s fie un numr impar (3, 5, 7) pentru c ne intereseaz intotdeauna valoarea de
mijloc a fiecrui interval, care este de dorit s fie un numr ntreg. Se recomand ca valoarea
minim a primului interval s fie un multiplu al amplitudinii. Amplitudinea intervalului se stabilete
astfel: Xmax - Xmin = 68 - 34 = 34. Alegem numrul de intervale cel mai convenabil. El nu trebuie
s fie mai mic de 10 i nu mai mare de 20. Optm pentru un numr de 13 intervale. Amplitudinea
intervalului notat cu i va fi:
i = Xmax - Xmin = 34/13 = 2.6 valoare care prin aproximare este 3. Construim primul interval (de
jos n sus) alegnd limita minim a celui mai mic interval astfel nct aceasta s fie mai mic
dect cea cel mai mic scor din populaia noastr de date.
Tabelarea frecvenelor se realizeaz dup procedura deja cunoscut. Coloana xk nglobeaz
valorile de mijloc ale fiecrui interval.
Tabelul 2.
Interval
Tabelarea
frecvenei f
66-68
/
63-65
//
60-62
////
57-59
////
54-56
/////
51-53
///////
48-50
///////
45-47
/////
42-44
//
39-41
//
36-38
/
33-35
//
Xk
67
64
61
58
55
52
49
46
43
40
37
34
f
1
2
4
4
5
7
7
5
2
2
1
2
42
41
39
35
31
26
19
12
7
5
3
2
Xk*f
67
128
244
232
275
364
343
230
86
80
37
68
Graficul este sugestiv pentru deosebirea dintre curba care teoretic (linia neagr accentuat) s-ar
fi putut obine obine dac eantionul ar fi fost sufucient de mare, i curba real obinut prin
unirea cu o linie continu a conturului exterior al dreptunghiurilor din histogram.
Cu ct eantionul de subieci (sau colecia de date) este mai mare, cu att
probabilitatea ca histograma sa aproximeze, curba distribuiei normale este mai mare. Dup curba
lui Gauss, se distribuie marea majoritate a msurtorilor intreprinse n domeniul fenomenelor
fizice i psihofiziologice, cu condiia s existe un numr destul de mare de msurtori.
Semnificaia acestei distribuii este c valorile foarte mari i foarte mici ale unei variabile (statura
sau nivelul de inteligen ), ntr-un eantion ales la ntmplare din populaia general, sunt mai
rare i situate la extremele abscisei curbei, n timp ce valorile mijlocii sunt mult mai numeroase i
''acoper'' zona de mijloc a curbei. Accentum c eantioanele de date trebuie s fie extrase din
populaie la ntamplare, pentru a fi reprezentative pentru populaia de apartenen.
n funcie de caracteristicile curbei obinute vor fi utilizate unele sau altele dintre
instrumentele statistice. Sunt doi indici care descriu forma curbei prin raportare la modelul normal
care este cel gaussian:
a) indicele de oblicitate (skewness) = msoar asimetria distribuiei; o valoare pozitiv are
semnificaia c valorile extreme sunt mai numeroase dect cele medii; o valoare negativ are
semnificaia c valorile extreme ale unei variabile msurate sunt mai puine dect cele de mrime
medie, ceea ce se i ntmpl atunci cnd populaia de date este obinut pe criterii aleatoare i
este suficient de numeroas.
b) indicile de curtoz (kurtosis) = semnific gradul de ''turtire'' al curbei, comparativ cu o curba
normal avnd aceeai abatere standard. Un indice pozitiv semnific existena mai multor cazuri
n cozile extreme ale curbei dect n zona de mijloc.
Cnd curba este bimodal, adic are dou maximuri (''cocoae''), nseamn c n eantion au fost
inclui subieci care provin din dou populaii distincte i ca urmare orice generalizare este fr
valoare deoarece media se situeaz ntre cele dou maximuri.
nainte de a continua un experiment sau un program de testare este necesar s studiem curba de
distribuie. Dac devierea de la forma curbei normale este excesiv, urmeaz unele consecine
privind decizia de a utiliza un anume gen de instrumente statistice sau altul. Asupra acestei
chestiuni vom mai reveni.
Msuri ale tendinei centrale.
Cnd studiem o populaie de date este de dorit sa avem la dispozitie nite indici (numere) care s
exprime ntr-o form ct mai sintetic tendinele populaiei.
A. Unul dintre aceti indici este media aritmetic ( x )
n mod obinuit mediana este desemnat de simbolul X
. Pentru lejeritatea redactrii am
preferat simbolul X
X = x /n
n cazul nostru, pentru date negrupate, media va fi 2154 / 42
Metoda de calcul pentru date grupate.
= 53,5
X = f*xk / n.
Media este msura cea mai precis a tendinei centrale deoarece se bazeaz pe numrul total al
valorilor individuale ale variabilei aleatoare. Cnd colecia de date se reduce la cteva cazuri
media este mai puin relevant dect mediana.
B. Modulul (moda bruta). Este dat de valoarea cu frecvena cea mai mare. Exemplu : ntr-o
populaie de date 3, 9, 10, 11, 11, 11, 12, 12, 13, 18 moda brut este 11. Reprezint estimaia
cea mai grosier a tendinei centrale a unei colecii de date.
n tabelul 1 modul brut este val. 48 deoarece are frecvena cea mai mare, egal cu 4. n tabelul 2
modul brut este mijlocul intervalului cu frecvena cea mai mare, adic 50.5 (deoarece ''cade'' ntre
49 i 52). Gruparea datelor, este un procedeu comod, dar poate duce la unele distorsiuni, cum
este cazul valorii diferite a modei brute, mediei i medianei comparativ cu datele negrupate.
C. Mediana. Este punctul central al unei distribuii a valorilor unei variabile aleatoare. Ea se
definete ca fiind punctul, dedesubtul i deasupra creia se situeaz 50% din totalitatea valorilor
(valorile trebuie aranjate n ordinea mrimii lor).
Determinarea medianei pentru date negrupate:
Cazul 1. N este impar: Fie valorile: 6 9 10 11 12 13 15 17 20 Mediana este 12
Cazul 2. N este par 3 6 9 10 11 12 13 15 17 20
Mediana este 11.5
Determinarea madianei (tabelul 1.):
Pe coloana frecvenelor cumulate cutm valoarea lui 21, care este echivalentul lui 50% din
populaie, adic:
50*42/100=21. Semnul ''*'' desemneaz aici operaia de nmulire.
n dreptul valorii 21, reperat pe coloana frecvenelor cumulate, pe coloana notelor la test gsim
valoarea 51. Deci 51 este mediana.
Determinarea medianei pe date grupate
Tabelul 2: Se vede c 50% din cazuri reprezint 21. Aceast valoare este uneori numit quot.
Ne situm pe coloana frecvenelor cumulate. Valoarea 21 se situeaz ntre 19 i 26. Mediana se
va situa in jurul valorii de 50 (corespunztor frecvenei 19) la care trebuie sa adunam o anumit
cot, o corecie ce se determin prin interpolare linear, corespunztor frecvenei de 21.
Deoarece de la 19 la 21 sunt dou uniti aplicm regula de trei simpl
7_ _ _ _ _ _ _ _ _3
2_ _ _ _ _ _ _ _ _ x
Dac unei creteri de 7 uniti pe scara frecvenelor (de la 19 la 26) i corespunde o cretere de 3
uniti pe scara notelor la test, atunci unei creteri de frecven de dou uniti i va corespunde o
cretere, n coloana notelor la test de x.
x=2*3/7 = 0.8
Mediana = 50,8. Mediana prezint fa de medie urmtoarele avantaje:
-este mai uor de calculat dect mediana.
Un prim pas n a valorifica notele ( scorurile brute) l reprezint transformarea lor n variabile
normate.
Dintre multiplele variante de etalonare o vom alege pe aceea care este mai potrivit. n luarea
deciziei vom apela la metoda histogramei sau a poligolunului frecvenelor. O distribuie normal a
coleciei noastre de date ne va perimite s alegem metoda quartilelor, variabilelor normate sau a
staninelor. n caz contrar vom alege o metod mai grosier numit metoda percentilelor. Aici
avem dou variante: metoda decilelor i metoda centilelor.
1. Etalonarea n quartile.
Se mparte colecia de scoruri la test n 4 clase, Q1, Q2, Q3, Q4, fiecare cuprinznd 25 % din
totalul coleciei de date ordonate, ca n tabelul 1, n ordinea mrimii lor.
Calculm ct reprezint 25% din colecia noastr de scoruri la test . N fiind egal cu 42 rezult: 25 *
42 /100 = 10.5. n tabelul 1, pe coloana frecvenelor cumulate, cutm o valoare apropiat cu
10.5, aceasta fiind 11. Pe coloana notelor obinute de subieci la testul de inteligen, n dreptul
valorii 11 citim valoarea 46. Deci subiecii situai n primul Quartil, vor fi cei care au scorurile la test
cuprinse ntre 0 i 46. Subiecii situai n quartlul al doilea vor fi cei care reprezint 50 % din
populaie, adic 21. Valoarea gsit pe coloana scorurilor la test, n tabelul 1, pentru valoarea de
21 pe coloana frecvenelor cumulate, va fi 51. Deci intervalul n care se vor situa aceti subieci,
privitor la scorurile obinute la test, va fi cuprins ntre 47 ( valoarea imediat mai mare dect limit
maxim a primului interval) i valoarea 51. Pentru quartilul al treilea 75 % din 42 este egal cu
31.5. Quartilul al treilea va fi cuprins ntre 52 i 56. Quartilul al patrulea va fi cuprins ntre 53 i
nota cea mai mare, teoretic posibil, la testul etalonat. Pentru exemplul nostru, care este imaginar,
putem presupune ca not maxim valoarea 68 sau 70.
Intervalele (quartilele) obinute le putem grupa n urmtorul tabel:
Quartilul
I
II
III
IV
Procentaje
Procentaje reale
teoretice cumulate
cumulate
25%
10.5
50%
21
75%
31.5
100%
42
Media
Mediana
Intervale
scoruri
de
0 - 46
47 - 51
52 - 56
57 - 70
51.2
50.5
Interval
1
2
3
4
5
6
0 39
40 45
46 47
48 49
50 51
52 53
Procentaje
teoretice
cumulate
10%
20%
30%
40%
50%
60%
Procentaje
reale
cumulate
4.2
8.4
12.6
16.8
21
25.2
7
8
9
10
54 55
56 58
59 61
62 - 68
70%
80%
90%
100%
29.4
33.6
37.8
42
Despre un subiect care a obinut scorul de 58 vom putea spune c este mai bun dect ceilali 80 %, i
c, la nivelul, eantionului studiat, doar 20 % dintre elevi sunt mai buni dect el.
Etalonarea n centile. Se procedeaz asemntor metodei decilelor i quartilelor dar de aceast
dat vom realiza intervale de scoruri pentru procentajele 1%, 2%, 3%.....99%.
Etalonarea n clase normalizate.
Prin metodele precedente, subiecii au fost mparii n unitai procentuale egale ceea ce duce la
intervale ntre repere care nu sunt echidistante.
Repartizarea procentajelor pe curba lui Gauss nu se face dup funcii lineare. Teoretic acest
curba a fost mparit ntr-un numr variabil de clase (intervale), ca n tabelul urmtor:
6,7
4,8
4,0
11,6
24,2
11,1
6,6
4,5
38,2
21,2
12,1
7,7
24,2
25,8
17,8
11,6
6,7
21,2
19,6
14,6
11,1
17,5
16,0
4,8
12,1
14,6
6,6
11,6
4,0
7,7
4,5
3,6
Numr clase
5
7
9
11
N
42
Observai c intervalelor le-au fost ataate calificative, ceea ce este un pas nainte n
interpretarea psihologic a rezultatelor la test.
Exist o anumit echivalen ntre diferitele tipuri de etalonare pe care o prezentm n anexa dup
A. Anastasi (1976).
Exist etaloane generale obinte pe populaii foarte mari, cu costuri considerabile. S-a dovedit
ns c etaloanele locale (obinute pe eantioane restrnse, caracterizate prin similaritatea mai
multor caracteristici cum sunt: ocupaia, natura solicitorilor, particulariti culturale, etc.) sunt,
uneori, mult mai valide.
ntrebri pentru autoevaluare.
Crui scop servete realizarea histogramei sau realizarea poligonului de frecvene ?
De ce este necesar s raportm scorurile brute la tabele de norme ?
Crui scop servesc, n domeniul psihodiagnozei, calcularea indicatorilor tendinelor centrale ?
Lecturi suplimentare
Smith, M., 1971, Ghid simplificat de statistic pentru psihologie i pedagogie, E.D.P. Bucureti.
Pitariu, H., 1983, Psihologia seleciei i formrii profesionale, Ed. Dacia, Cluj, pp 270 - 287.
Anastasi, A., 1976, Psychological Testing, Macmil., Publ. ,New York, London, pp.67-94.