Sunteți pe pagina 1din 63

STATISTIC PENTRU PSIHOLOGI

Prof. univ. dr. Dumitru Gheorghiu

1 Introducere

Rolul statisticii n psihologie


Pentru psiholog i, n general, pentru cercettorul n domeniul tiinelor omului, statistica este un set de metode i tehnici matematice de organizare i prelucrare a datelor, folosite cu scopul de a rspunde la anumite ntrebri i de a testa anumite ipoteze. Datele sunt informaii, n principal numerice, care reprezint anumite caracteristici. Dac cercettorul i-a formulat greit problema sau a proiectat greit cercetarea, atunci cele mai sofisticate analize statistice sunt lipsite de valoare. Metodele i tehnicile statistice se supun regulii IGIG = introduci gunoaie, ies gunoaie.

Statistici descriptive i statistici infereniale


O variabil este orice trstur care i poate schimba valoarea de la caz la caz. De pild, trsturile sex, vrst i venit sunt variabile. O populaie este un grup ce include toate cazurile de care este interesat cercettorul. De pild, toi cetenii romni cu drept de vot, toi studenii unei universiti i toate rile europene sunt populaii. Un eantion este submulime strict a populaiei de referin. Statisticile descriptive sunt tehnici statistice utilizate pentru a prezenta, clasifica i nsuma scorurile (valorile) unei variabile. Statisticile infereniale sunt tehnici statistice utilizate pentru a trage concluzii despre caracteristicile unei populaii pe baza caracteristicilor corespunztoare ale unui eantion din acea populaie.
4

Niveluri de msur
Alegerea unei tehnici statistice depinde de nivelul la care au fost msurate variabilele de interes. Nivelurile de msur ale variabilelor sunt clasificate ntr-o ierarhie, n funcie de complexitatea lor. Orice tehnic statistic aplicabil la nivelul n este aplicabil la nivelul n + 1, reciproca nefiind valabil. Msurarea unei variabile la nivel nominal const din clasificarea diferitelor cazuri n categoriile prestabilite ale unei variabile. Exemple: sex, denominaia religioas, culoarea ochilor. n cazul msurrii la nivel ordinal, pe lng clasificarea cazurilor n categorii, cazurile repartizate ntr-o categorie sau alta pot fi ordonate, n funcie de gradul calitativ n care acestea posed trstura msurat. Exemplu: nivel de colarizare .

Niveluri de msur
n msurarea la nivel de interval, pe lng clasificare i ordonare, distanele (intervalele) dintre oricare dou cazuri aflate n categorii succesive sunt egale. Cu alte cuvinte, la acest nivel variabilele sunt msurabile n uniti care au intervale egale. Exemplu: nivelul de stabilitate emoional. La acest nivel sunt permise toate operaiile matematice. n msurarea la nivel de raport, pe lng toate trsturile unei msurri de interval, se poate determina msura exact

(proporia) n care un caz aflat ntr-o categorie satisface caracteristica msurat, n raport cu un caz aflat ntr-o alt categorie i apare un punct zero natural, care reflect absena caracteristicii msurate. Exemple: vechimea n munc, venitul.

2 Prezentarea datelor statistice


Funcia de baz a statisticii descriptive este prezentarea clar i concis a rezultatelor cercetrii. n acest capitol sunt expuse tehnici de organizare i prezentare rezumativ a datelor: procente, proporii, raporturi i distribuii de frecvene.

Procente i proporii
f 1. Proporie (p) = n f 100 2. Procent (%) = n
f = frecvena sau numrul de cazuri n fiecare
This image cannot currently be display ed. This image cannot currently be display ed.

categorie n = numrul total de cazuri (numrul de cazuri din toate categoriile)

Procente i proporii
Tabelul 1 Opinia fa de interzicerea fumatului n locurile publice Opinia Acord Dezacord Nu tiu/Nu rspund TOTAL Frecvena (f) Proporia (p) Procentul (%) 167 72 30 269 0,621 0,268 0,111 1,000 62,1 26,8 11,1 100,0

Procente i proporii
Tabelul 2 Numrul de studeni nscrii pe specializri la dou universiti

Specializarea Drept tiine economice Psihologie Sociologie TOTAL

Universitatea A Universitatea B 103 82 137 93 415 312 279 188 217 996

10

Procente i proporii
Tabelul 3 Procentul de studeni nscrii pe specialiti la dou universiti

Specializarea Drept tiine economice Psihologie Sociologie TOTAL

Universitatea A Universitatea B 24,8 19,8 33,0 22,4 100,0 (415) 31,3 28,0 18,9 21,8 100,0 (996)
11

Raporturi
fi 3. Raport = fj fi = numrul de cazuri din categoria i fj = numrul de cazuri din categoria j
This image cannot currently be display ed.

Raportul ne spune n ce msur categoria i depete n numr de cazuri categoria j. Raportul studenilor nscrii la tiine economice fa de cei nscrii la Psihologie n Universitatea B este 279/188 = 1,48: pentru fiecare student la Psihologie exist 1,48 studeni la tiine economice.
12

Distribuii de frecvene
Tabelul 4 Scoruri obinute la un test de cunotine (180 subieci)
68 55 65 42 64 45 56 59 56 42 38 50 37 42 53 52 54 57 49 63 54 38 46 49 33 43 40 29 43 60 69 54 64 41 63 44 55 58 55 41 37 49 36 41 52 51 53 49 48 64 55 37 47 50 34 44 39 30 42 61 43 33 51 50 54 63 68 57 43 56 54 47 37 52 49 36 48 56 24 45 55 46 58 45 32 56 55 49 47 55 44 32 50 49 53 62 67 56 42 55 53 46 36 51 48 35 47 48 25 46 56 45 59 46 33 57 54 50 46 56 54 47 53 53 50 50 65 60 53 40 57 39 36 63 38 57 57 56 55 40 46 48 62 40 45 46 56 44 48 48 55 48 52 52 49 49 64 59 52 39 56 38 35 62 37 56 56 55 56 41 47 49 63 41 46 45 55 45 49 47

13

Distribuii de frecvene
Tabelul 5 Distribuie de frecvene pentru datele din Tabelul 4
Scorul 24 25 26 27 28 29 30 31 32 33 34 35

f
1 1 0 0 0 1 1 0 2 3 1 2

Scorul 36 37 38 39 40 41 42 43 44 45 46 47

f
4 5 4 3 4 5 5 4 4 7 9 7

Scorul 48 49 50 51 52 53 54 55 56 57 58 59

f
8 11 7 3 6 7 7 12 14 6 2 3

Scorul 60 61 62 63 64 65 66 67 68 69

f
2 1 3 5 4 2 0 1 2 1

14

Distribuii de frecvene
Tabelul 6 Distribuie de frecvene cu intervale de clas (n = 5) pentru datele din Tabelul 4
Intervale de clas
2024 2529 3034 3539 4044 4549 5054 5559 6064 6569 TOTAL

f
1 2 7 18 22 42 30 37 15 6 180

% 0,56 1,11 3,89 10,00 12,22 23,33 16,67 20,56 8,33 3,33 100,0

15

Distribuii de frecvene cu frecvene cumulate i procente cumulate


Frecvenele cumulate (fc) i procentele cumulate (%c) prezint numrul de cazuri i, respectiv, procentul de cazuri dintr-un interval de clas i din toate intervalele precedente. (Se presupune c intervalele de clas apar n ordine cresctoare.) Pentru primul interval, fc este egal cu numrul de scoruri din interval. Pentru intervalul imediat urmtor, fc este egal cu numrul de scoruri din interval plus numrul de scoruri din primul interval .a.m.d. fc pentru ultimul interval este egal cu numrul total de cazuri. Construirea coloanei de %c urmeaz acelai model aditiv. %c pentru ultimul interval este egal cu 100%.

16

Distribuii de frecvene cu frecvene cumulate i procente cumulate


Tabelul 7 Distribuie de frecvene cufc i %c pentru datele din Tabelul 4
Intervale de clas
2024 2529 3034 3539 4044 4549 5054 5559 6064 6569 TOTAL

f
1 2 7 18 22 42 30 37 15 6 180

fc
1 3 10 28 50 92 122 159 174 180

% 0,56 1,11 3,89 10,00 12,22 23,33 16,67 20,56 8,33 3,33 100,0

%c 0,56 1,67 5,56 15,56 27,78 51,11 67,78 88,34 96,67 100,0

17

Distribuii de frecvene cu limite reale i centre de interval


Msurarea unei variabile produce date discrete, dac nregistrarea acestora se face n categorii reciproc exclusive (nesuprapuse). Uneori, este nevoie ca distribuia unei variabile msurabil la nivel de interval/raport s fie construit ca o serie continu de categorii parial suprapuse. Pentru aceasta, pe baza limitelor intervalelor de clas stabilite iniial (limite stabilite) se calculeaz limitele reale. Pentru calcularea limitelor reale se mparte la 2 distana aritmetic dintre intervalele de clas stabilite iniial, iar rezultatul obinut se scade din fiecare limit inferioar stabilit i se adun la fiecare limit superioar stabilit.
18

Distribuii de frecvene cu limite reale i centre de interval


n Tabelul 6, distana aritmetic dintre intervalele de clas este de o unitate (2024; 2529; 3034 etc.). Limitele reale se afl scznd 0,5 din fiecare limit inferioar stabilit i adugnd 0,5 la fiecare limit superioar stabilit (19,524,5; 24,529,5; 29,534,5 etc.) Intervalele de clas cu limite reale se suprapun parial dou cte dou, astfel nct distribuia apare ca fiind continu. Centrele de interval sunt punctele situate exact la mijlocul unui interval i se afl calculnd media aritmetic a limitelor superioar i inferioar ale intervalului. Centrele de interval sunt aceleai, indiferent dac se folosesc limite stabilite sau limite reale.
19

Distribuii de frecvene cu limite reale i centre de interval


Tabelul 8 Distribuie de frecvene cu limite reale i centre de interval pentru datele din Tabelul 4
Intervale de clas 2024 2529 3034 3539 4044 4549 5054 5559 6064 6569 TOTAL Limite reale 19,524,5 24,529,5 29,534,5 34,539,5 39,544,5 44,549,5 49,554,5 54,559,5 59,564,5 64,569,5 Centre de interval 22 27 32 37 42 47 52 57 62 67

f
1 2 7 18 22 42 30 37 15 6 180

20

3 Mrimile tendinei centrale i ale dispersiei


Pentru descrierea mai detaliat a unei distribuii de scoruri se folosesc mrimile tendinei centrale, care exprim ideea de caz tipic ntr-o distribuie, i mrimile dispersiei, care exprim ideea de varietate sau eterogenitate a unei distribuii.

Mrimile tendinei centrale: media aritmetic


1. X
X = n
This image cannot currently be display ed.

n care X i = suma scorurilor dintr-o mulime de scoruri n = numrul total de scoruri din mulime Media aritmetic se calculeaz doar pentru variabile msurate la nivel de interval/raport. Pentru media aritmetic a unei populaii se folosete simbolul .
22

Mrimile tendinei centrale: media aritmetic


Tabelul 1 Vrstele pentru un eantion de 11 persoane Vrsta 16 17 18 19 23

f
1 4 1 2 3

TOTAL 11

23

Mrimile tendinei centrale: media aritmetic


Pentru a afla media aritmetic a vrstelor persoanelor din eantion (vrsta medie) nsumm toate cele 11 scoruri i mprim rezultatul la 11:
X X= n
i

(1 16) + (4 17) + (1 18) + (2 19) + (3 23) 209 = = = 19 11 11

24

Mrimile tendinei centrale: proprieti ale mediei aritmetice


Abaterea unui scor X i fa de media aritmetic X este diferena Xi X . Pentru orice distribuie de scoruri, suma abaterilor scorurilor de la media lor aritmetic este egal cu 0:

(X

X) = 0

Cu alte cuvinte, suma diferenelor dintre scoruri i media lor aritmetic este egal cu 0. Aceast proprietate arat c pentru orice distribuie de scoruri, media aritmetic este punctul n jurul cruia toate scorurile se anuleaz.
25

Mrimile tendinei centrale: proprieti ale mediei aritmetice


Pentru orice distribuie de scoruri, suma ptratelor abaterilor scorurilor fa de media lor aritmetic este mai mic dect suma ptratelor abaterilor scorurilor fa de oricare alt scor din distribuie:

(X X)
i

<

(X X )
i j

Aceast proprietate arat c media aritmetic este punctul n jurul cruia suma abaterilor ptratice ale scorurilor este minim.

26

Mrimile tendinei centrale: proprieti ale mediei aritmetice


Tabelul 2 Proprieti ale mediei aritmetice pentru datele din Tabelul 1
Xi
16 17 17 17 17 18 19 19 23 23 23

Xi X
3 2 2 2 2 1 0 0 4 4 4 0

( X i X )2
9 4 4 4 4 1 0 0 16 16 16 74

X i 17 1 0 0 0 0 1 2 2 6 6 6

( X i 17) 2
1 0 0 0 0 1 4 4 36 36 36 118

27

Mrimile tendinei centrale: mediana


Mediana X a unei mulimi de scoruri este punctul de mijloc al acelei mulimi, n sensul c numrul de ~ cazuri cu scoruri mai mici sau egale cu X este egal cu ~ X numrul de cazuri cu scoruri mai mari sau egale cu Pentru a afla mediana pentru n scoruri, scorurile respective se ordoneaz cresctor sau descresctor. Dac n este impar, mediana este scorul cazului de mijloc. Dac n este par, vor fi dou cazuri de mijloc i, dac scorurile sunt de interval/raport, se ia drept median media aritmetic a scorurilor cazurilor de mijloc.
28

Mrimile tendinei centrale: mediana


Care este vrsta median n exemplul din Tabelul 1? S presupunem c urmtoarele scoruri sunt de interval/raport: 26, 26, 28, 29, 30, 31, 32, 100 Aici apar dou cazuri de mijloc, avnd scorurile 29 i 30, deci ~ X = 29,5. Comparai cu X = 37,5. S presupunem c urmtoarele scoruri sunt de interval/raport: 1, 2, 3, 5, 5, 5, 7, 10, 12 Aici avem patru scoruri mai mici sau egale cu 5 i patru scoruri ~ mai mari sau egale cu 5. Prin urmare, X = 5. Mediana poate fi determinat i pentru variabile msurate la nivel ordinal.
29

Mrimile tendinei centrale: modul


Modul unei mulimi de scoruri, Mo, este scorul care apare cel mai frecvent n acea mulime. n ultimul exemplu de mai sus avem o mulime unimodal de scoruri, cu Mo = 5. n exemplul 3, 3, 3, 5, 5, 5, 7, 10, 12 avem o mulime bimodal de scoruri, cu Mo1 = 3 i Mo2 = 5. Este posibil ca o mulime de scoruri s aib trei sau mai multe moduri, dup cum este posibil ca o mulime de scoruri s nu aib mod. Modul este singura mrime care poate fi folosit n msurarea tendinei centrale pentru variabile de nivel nominal. Modul unei astfel de variabile este categoria cu cele mai multe cazuri.

30

Distribuii simetrice i distribuii asimetrice


This image cannot currently be display ed.

O distribuie unimodal este simetric, dac media aritmetic i mediana au aceeai valoare.
Frecvena

~ X = X

Cel mai nalt punct al curbei este modul, deoarece este punctul n care sunt nregistrate cele mai multe cazuri, este mediana, deoarece numrul de cazuri nregistrate la stnga acestui punct este egal cu numrul de cazuri nregistrat la dreapta sa i este media aritmetic, deoarece scorurile aflate n partea dreapt ntrec scorul median n aceeai msur n care scorurile aflate n partea stng sunt mai mici dect scorul median.
31

Distribuii simetrice i distribuii asimetrice


O distribuie unimodal prezint o asimetrie pozitiv, dac media aritmetic este mai mare dect mediana (scorurile mici sunt predominante).

Frecvena

~ X X

32

Distribuii simetrice i distribuii asimetrice


O distribuie unimodal prezint o asimetrie negativ, dac media aritmetic este mai mic dect mediana (scorurile mari sunt predominante).

Frecvena

~ X

33

Media aritmetic ponderat


This image cannot currently be display ed.

Media aritmetic ponderat a i grupuri de scoruri, i 2: 2. X =

n X
i

n care ni = numrul de scoruri din fiecare grup X i = media aritmetic a fiecrui grup N = numrul total de scoruri

34

Media aritmetic ponderat


S presupunem c media aritmetic a unui grup de 86 de scoruri este 7,33 i c media aritmetic a unui grup de 54 de scoruri este 8,45. Media aritmetic ponderat a celor dou grupuri este:
n X X =
i i

= (86 7,33) + (54 8,45) = 1086,68 = 7,76


140 140

Dac am fi fcut media aritmetic a valorilor 7,33 i 8,45 am fi obinut 7,89, ceea ce ar fi fost incorect, deoarece grupurile difer n privina numrului de scoruri.

35

Percentile
Poziia unui scor individual ntr-o distribuie poate fi determinat cu ajutorul percentilelor. Cea de-a m-a percentil a unei mulimi de scoruri, Pm, este valoarea fa de care cel mult m% din scoruri sunt mai mici dect m i cel mult (100 m)% din scoruri sunt mai mari dect m. ntruct mediana unei mulimi este valoarea fa de care cel mult 50% din scoruri sunt mai mici i cel mult 50% din scoruri sunt mai mari, mediana este cea de-a 50-a percentil a acelei mulimi. Tot aa cum exist un nume special pentru cea de-a 50-a percentil a unei mulimi de scoruri, exist nume speciale pentru percentilele care mpart o mulime ordonat de scoruri n sferturi i n zecimi: cuartile i, respectiv, decile.

36

Percentile
Lista urmtoare prezint cele mai utilizate percentile, mpreun cu simbolurile uzuale pentru cuartile i decile (considernd c este vorba despre o mulime de scoruri ordonat cresctor):

D1 = Prima decil = P10 Q1 = Prima cuartil = P25 Q2 = A doua cuartil = P50 = Q3 = A treia cuartil = P75 D9 = A noua decil = P90

~ X

37

Percentile
Fie urmtoarea mulime ordonat de 15 scoruri: 2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30 Prima cuartil este valoarea fa de care cel mult 25% din scoruri, i.e. cel mult 3,75 din scoruri sunt mai mici i cel mult 75% din scoruri, i.e. 11,25 scoruri sunt mai mari. Deci Q1 = 5. Cea de-a doua cuartil, mediana, este scorul central, i.e. 12. Cea de-a treia cuartil este valoarea fa de care cel mult 75% din scoruri, i.e. 11,25 din scoruri sunt mai mici i cel mult 25% din scoruri, i.e. 3,75 scoruri sunt mai mari. Deci Q3 = 21.

38

Percentile
Uneori, percentila cutat cade ntre dou scoruri din mulimea respectiv. ntr-un astfel de caz, prin convenie, se ia media aritmetic a celor dou scoruri pentru a aproxima percentila cutat. Cea de-a 20-a percentil din mulimea de mai sus ar fi valoarea fa de care cel mult 3 scoruri sunt mai mici i cel mult 12 scoruri sunt mai mari. ntruct orice numr cuprins ntre 4 i 5 (inclusiv) satisface acest criteriu, vom lua 4,50 drept cea de-a 20-a percentil.
39

Mrimile dispersiei
Mrimile dispersiei furnizeaz informaii despre eterogenitatea sau varietatea unei distribuii de scoruri. De exemplu, o medie aritmetic de 6,33 poate fi obinut dintro mulime de scoruri similare, concentrate n jurul acestei valori precum 6, 6, 7 sau dintr-o mulime de scoruri nesimilare, mprtiate n raport cu aceast valoare precum 1, 8, 10. n cazul unor scoruri similare sau cu variabilitate sczut, media aritmetic este mai adecvat pentru msurarea tendinei centrale dect n cazul unor scoruri nesimilare sau cu variabilitate nalt. Cele mai des folosite mrimi ale dispersiei: indicele variaiei calitative, amplitudinea i amplitudinea intercuartilic, abaterea standard i coeficientul de variaie.

40

Mrimile dispersiei: indicele variaiei calitative


Indicele variaiei calitative (IQV) reprezint raportul dintre variaia observat efectiv ntr-o mulime de scoruri i variaia maxim posibil pentru acea distribuie. IQV se folosete n mod obinuit pentru variabile msurate la nivel nominal, putnd fi utilizat i pentru variabile msurate la celelalte niveluri, dac scorurile respective sunt grupate n distribuii de frecvene. IQV poate lua valori cuprinse ntre 0,00 (nici o variaie sau variaie nul) i 1,00 (variaie maxim).
41

Mrimile dispersiei: indicele variaiei calitative


Tabelul 3 Apartenena religioas n trei colectiviti

Denominaia Cretin-ortodox Catolic Altele TOTAL

Colectivitatea

A
90 0 0 90

B
60 20 10 90

C
30 30 30 90

42

Mrimile dispersiei: indicele variaiei calitative


3. IQV =

k(n2 f 2 ) n2 (k 1)

n care k = numrul de categorii n = numrul total de cazuri din cele k categorii f 2 = suma ptratelor frecvenelor din fiecare categorie

43

Mrimile dispersiei: indicele variaiei calitative


Pentru colectivitatea A: f2 = 902 + 02 + 02 = 8100

3(90 2 8100 ) 3(8100 8100 ) 30 0 IQV = = = = =0 2 8100 2 16200 16200 90 (3 1)


Pentru colectivitatea B: f2 = 602 + 202 + 102 = 4100

IQV =

3 ( 8100 4100 ) 3 4000 12000 = = = 0 , 74 16200 16200 16200

Pentru colectivitatea C: f2 = 302 + 302 + 302 = 2700

IQV =

3 ( 8100 2700 ) 3 5400 16200 = = = 1, 00 16200 16200 16200


44

Mrimile dispersiei: amplitudinea i amplitudinea intercuartilic


Amplitudinea (A) a unei mulimi de scoruri este diferena dintre cel mai mare scor i cel mai mic scor din acea mulime:

A = Xmax Xmin
Amplitudinea intercuartilic (Q) este diferena dintre cea de-a treia i prima cuartil a unei distribuii de scoruri ordonate cresctor:

Q = Q3 Q1
Pentru mulimea de scoruri 2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30, A = 30 2 = 28 i Q = 21 5 = 16.

45

Mrimile dispersiei: abaterea standard


Abaterea standard (s) este o mrime a dispersiei care capteaz ideea de variabilitate a unei distribuii de scoruri de interval/raport fa de media sa aritmetic i folosete toate scorurile distribuiei. Amintim c ntr-o distribuie de scoruri de interval/raport cu media aritmetic X , diferena Xi X reprezint abaterea scorului Xi fa de media aritmetic a distribuiei. Formula definiional a abaterii standard:
2 ( X X ) i

4.

s=

n 1
46

Mrimile dispersiei: abaterea standard


Urmtoarele formule permit calculul simplificat al s: 5. s =

X i nX 2
2

n 1

6.

s=

Xi

(X )
i

n 1

Formula 6 este cu deosebire util n calculul s, deoarece folosete doar scorurile individuale.

47

Mrimile dispersiei: abaterea standard


Pentru ilustrare, folosim din nou datele din Tabelul 2, n care scorurile individuale sunt: 16, 17, 17, 17, 17, 18, 19, 19, 23, 23, 23. = 162 + 172 + 172 + 172 + 172 + 182 + 192 + 192 + 232 + 232 + + 232 = 4045 ( X i )2 = (16 + 17 + 17 + 17 + 17 + 18 + 19 + 19 + 23 + 23 + 23)2 = = 43681 Aplicnd formula 6, obinem:

2 i

s=

4045

43681 11 = 7,40 = 2,72 10


48

Mrimile dispersiei: abaterea standard


Valoarea abaterii standard este cu att mai mare cu ct distribuia scorurilor este mai eterogen. Reciproc, valoarea abaterii standard este cu att mai mic cu ct distribuia scorurilor este mai omogen. Dac fiecare caz ntr-o distribuie ar avea acelai scor, atunci pentru distribuia respectiv s = 0. Astfel, abaterea standard nu are limit superioar, iar limita sa inferioar este 0. Abaterea standard i dovedete utilitatea mai ales atunci cnd se dorete compararea a dou sau mai multe distribuii. Abaterea standard este folosit n calculul scorurilor standard i este implicat n noiunea de distribuie normal standard.

49

4 Distribuia normal
Noiunea de distribuie normal este foarte important n statistic. Distribuia normal poate fi folosit n combinaie cu abaterea standard pentru a formula enunuri descriptive precise despre distribuii particulare i st la baza multor tehnici statistice infereniale.

Caracteristicile distribuiei normale


Distribuia normal este o distribuie teoretic de scoruri, unimodal, simetric i continu. Graficul unei distribuii normale, curba normal, are form de clopot cu ambele extremiti ntinse la infinit:

n onoarea matematicienilor Carl Friedrich Gauss i Pierre Simon de Laplace, care au descoperit independent dinstribuia normal n secolul al XIX-lea, curba normal este numit i clopotul lui Gauss sau curba Gauss-Laplace.
51

Caracteristicile distribuiei normale


Distribuia normal este un model teoretic ce poate fi folosit pentru a descrie distribuii particulare ale scorurilor unor variabile msurate la nivel de interval sau de raport, despre care s-a constatat c aproximeaz suficient normalitatea ntr-o populaie, precum i pentru inferene statistice. Dac distribuia scorurilor unei variabile ntr-o populaie aproximeaz normalitatea, se spune c variabila respectiv este normal distribuit n populaia respectiv sau, pe scurt, c variabila respectiv este normal. Exemple de variabile normale: coeficientul de inteligen, rezultatele obinute la diferite teste de cunotine sau numrul de erori comise n ndeplinirea anumitor sarcini. Utilizarea distribuiei normale n statistic face apel la scoruri standard sau scoruri Z.
52

Calculul scorurilor standard


Scorurile standard (scoruri Z) descriu poziia relativ a unui scor individual n raport cu ntreaga mulime de scoruri din care face parte i folosesc abaterea standard ca unitate de msur. 1.

Xi X Z= s

Aceast formul transform orice scor brut Xi n scorul Z corespunztor. Numrtorul fraciei indic distana n uniti brute a scorului Xi fa de media aritmetic. Prin mprirea acestei distane la s aflm distana n (fraciuni de) abateri standard a scorului Xi fa de medie.
53

Calculul scorurilor standard


Fie o distribuie de scoruri pentru un eantion cu X = 100 i s = 20. Scorurile Z corespunztoare scorurilor brute 85, 120 i 150 sunt: 85 100 Z 85 = = 0,75 20

120100 Z120 = = +1,00 20 150 100 Z150 = = +2,50 20


Fiecare dintre aceste scoruri Z arat la cte abateri standard fa de media aritmetic se afl scorul brut corespunztor.
54

Calculul scorurilor standard


Un scor Z negativ arat c scorul brut se afl sub media aritmetic, iar un scor Z pozitiv arat c scorul brut este mai mare dect media aritmetic. Evident, un scor Z egal cu 0 arat c scorul brut corespunztor este egal cu media aritmetic. Se demonstreaz c dac toate scorurile unei distribuii particulare se standardizeaz, atunci: Forma distribuiei scorurilor Z este aceeai cu cea a distribuiei iniiale; Media aritmetic a distribuiei scorurilor Z este 0; Abaterea standard a distribuiei scorurilor Z este 1.

55

Distribuia normal standard


Ca orice distribuie particular de scoruri de interval/raport, distribuia normal poate fi descris prin media sa aritmetic i abaterea standard. ntruct oricrei perechi de valori pentru aceste mrimi i corespunde o distribuie normal, matematic vorbind exist o infinitate de distribuii normale, ale cror forme exacte depind de mrimile menionate. n analiza statistic se consider o distribuie normal particular, numit distribuia normal standard (distribuia Z). Variabila corespunztoare distribuiei normale standard este numit variabila normal standard, valorile acestei variabile fiind scoruri Z. Distribuia normal standard are media aritmetic egal cu 0 i abaterea standard egal cu 1. Graficul corespunztor distribuiei normale standard este numit curba normal standard (CNS).
56

Tabelul curbei normale standard


n corpul Tabelului CNS (vezi Anexa A) apar numere alctuite din patru cifre, care reprezint ariile de sub CNS cuprinse ntre un anumit scor Z dat i media aritmetic. Numerele nscrise n prima coloan din stnga reprezint primele dou cifre ale unui scor Z, iar numerele nscrise pe primul rnd de sus reprezint ce-a de-a treia cifr. Fie Z = 0,45. La intersecia coordonatei 0,4 cu 0,05 gsim numrul 1736, ceea ce nseamn c 17,36% din aria total de sub CNS se afl ntre Z = +0,45 i media aritmetic (Z = 0) (proporia de sub aria total a CNS cuprins ntre Z = +0,45 i media aritmetic este de 0,1736). ntruct CNS este simetric, aceeai procedur se aplic i pentru scoruri Z negative (17,36% din aria total de sub CNS se afl ntre Z = 0,45 i media aritmetic).

57

Procente din aria de sub CNS


34,13 34,13

68,26

13,59

13,59

2,15 0,13 -3 -2 -1 95,44 0 +1 +2

2,15 0,13 +3

58

Determinarea procentelor de cazuri


Fie o distribuie de scoruri a variabilei coeficient de inteligen (IQ) pentru 1000 de subieci, cu X = 100 i s = 20. 1. Care este procentul de cazuri cu IQ 115? Z115 = +0,75.

Aria dintre Z = +0,75 i medie = 27,34% din aria total. Aria aflat sub medie = 50% din aria total. Procentul de cazuri cu IQ 115 este 27,34% + 50% = 77,34% (aproximativ 773 de subieci au scoruri IQ 115). Acelai model de calcul se utilizeaz pentru a afla aria situat peste un scor Z negativ.
59

+0,75

Determinarea procentelor de cazuri


2. Care este procentul de cazuri cu IQ 75? Z75 = 1,25.

1,25

Aria dintre Z = 1,25 i medie = 39,44% din aria total. Procentul de cazuri cu IQ 75 = 50% 39,44 = 10,56% (aproximativ 105 subieci au scoruri IQ < 75). Acelai model de calcul se utilizeaz pentru a afla aria situat peste un scor Z pozitiv.

60

Determinarea procentelor de cazuri


3. Care este procentul de cazuri cu 95 IQ 125? Z95 = 0,25 i Z125 = +1,25?

0,25 +1,25

Aria dintre Z = 0,25 i medie = 9,87% din aria total, iar aria dintre Z = +1,25 i medie =39,44% din aria total. Procentul de cazuri cu 95 IQ 125 este de 9,87% + 39,44% = 49,31% (aproximativ 493 de subieci au scoruri 95 IQ 125).
61

Determinarea procentelor de cazuri


4. Care este procentul de cazuri cu 115 IQ 125? Z115 = +0,75 i Z125 = +1,25?

+0,75 +1,25

Aria dintre un Z = +0,75 i medie = 27,34% din aria total. Aria dintre un Z = +1,25 i medie = 39,44% din aria total. Procentul de cazuri cu 115 IQ 125 este de 39,44 27,34 = 12,10 (aproximativ 121 de subieci au scoruri 115 IQ 125).

62

Determinarea procentelor de cazuri


Pentru a determina aria aflat sub un scor Z pozitiv sau peste un scor Z negativ, aria dintre scorul respectiv i media aritmetic se adun cu 50%. Pentru a determina aria aflat sub un scor Z negativ sau peste un scor Z pozitiv, aria dintre scorul respectiv i media aritmetic se scade din 50%. Pentru a determina aria dintre dou scoruri Z aflate de o parte i de alta a mediei, se adun ariile dintre fiecare scor i medie. Pentru a determina aria dintre dou scoruri Z aflate de aceeai parte a mediei aritmetice, se determin mai nti ariile dintre fiecare scor i medie, dup care aria mai mic se scade din aria mai mare.
63