Sunteți pe pagina 1din 11

Prof.univ.dr.

Alin Gilbert Sumedrea Statistic psihologic (curs universitar)

6. DISTRIBUII NORMALE I SCORURI STANDARD


Prelucrarea i interpretarea datelor statistice este eficient n studiul sistemelor multidimensionale unde non-tipicalitatea este cvasi-prezent i controlul experimental posibil. Pentru surprinderea ct mai fidel a caracteristicilor oricrui fenomen sau proces analizat este nevoie de o cantitate ct mai mare de informaie statistic. Ct de mare sau ct de ampl poate fi informaia statistic? Teoretic, volumul de date statistice poate fi infinit. Nevoia de cunoatere n detalii fine a realitii care ne nconjoar i la care avem acces, asociat cu imposibilitatea de a opera pe serii infinite de date statistice a canalizat efortul statisticienilor n direcia elaborrii unor proceduri de evaluare a proprietilor unei populaii pe baza unui volum limitat de informaie. Nu de puine ori, seriile statistice supuse prelucrrii sunt extrem de lungi. Pentru a surprinde ceea ce este esenial ntr-un volum mare de informaie statistic, aparent fr semnificaie, este necesar comprimarea seriilor statistice simple n serii cu distribuii de frecvene. Distribuiile de frecvene sunt extrem de variate. O form particular este distribuia normal. Dei n realitate distribuia normal este ntlnit n foarte puine cazuri, exist un numr extrem de mare de variabile care au tendine s urmeze caracteristicile sale. Dm cteva exemple: - abilitatea mental a copiilor; - greutatea indivizilor; - nlimea indivizilor; - etc. n ultima perioad a secolului XIX, Sir Francis Galton a nceput s se preocupe de studiul diferenelor individuale care constituie o important zon de studiu n psihologie i educaie. n investigaiile sale asupra modului n care oamenii difer n zona activitilor mentale i trsturilor fizice, Galton a sesizat c distribuia normal constituie un bun i rezonabil descriptor. Exist ns o serie de variabile care nu urmeaz n dinamica lor distribuia normal, cum ar fi: impozitul anual, mrimea familiei, aptitudinile educaionale etc. Mai mult, variabilele care sunt distribuite normal ntr-un anumit context pot prezenta o distribuie ne-normal dac situaia sau contextul se schimb. De exemplu, distribuia greutii este modal pentru femei i brbai luai separat. ns cnd cele dou grupuri sunt combinate, distribuia este bimodal. n ciuda acestor excepii este de reinut faptul c distribuia normal ofer o descriere rezonabil i convenabil a unui numr mare de variabile. Totodat, curba normal poate descrie distribuia multor statistici ale eantioanelor. De exemplu, dac se dispune de 100 de eantioane aleatoare de la o populaie de adolesceni unde se urmrete greutatea acestora i se calculeaz greutatea medie n fiecare eantion, se constat c distribuia celor 100 de medii aproximeaz curba normal. n asemenea situaii este recomandabil folosirea curbei normale n elaborarea judecilor statistice. Proprietatea numeroaselor caracteristici de a urma normalitatea statistic este de importan major n statistica inferenial. 6.1 PROPRIETILE CURBEI NORMALE Distribuia normal reprezint un model matematic, un concept idealizat al formei distribuiei. Nici o distribuie empiric nu satisface perfect proprietile curbei normale. Cu toate acestea, distribuiile empirice ofer adesea o aproximare rezonabil 1

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar) a curbei normale i din acest motiv, pare acceptabil s spunem c datele sunt distribuite normal. Trebuie ns surprins o nuan important. Dac ecuaia unui cerc descrie o familie de cercuri, unele mai mari, altele mai mici, ecuaia curbei normale descrie o familie de distribuii. Curbele normale pot diferi ntre ele. Responsabile de aceste diferenieri sunt mediile i abaterile standard ale distribuiilor. Care sunt proprietile curbei normale? n primul rnd, acestea sunt simetrice, n sensul c jumtatea stng a distribuiei este oglinda imaginii jumtii drepte. n al doilea rnd, aceste curbe sunt unimodale, prezentnd o mod n centru. Media, mediana i modulul au aceeai valoare. n al treilea rnd, aceste curbe au forma de clopot. n al patrulea rnd, curbele normale nu intersecteaz niciodat abscisa. Aceast proprietate ilustreaz de ce o distribuie empiric nu poate fi niciodat perfect normal. n graficele de mai jos sunt prezentate elementele de difereniere ale distribuiilor normale.
Fig. 6.1 Medii egale, abateri standard inegale.

Fig. 6.2 Abateri standard inegale, medii inegale.

Fig. 6.3 Abateri standard egale, mediile inegale.

6.2 DEVIAIA STANDARD I DISTRIBUIA NORMAL Prezentm n continuare un rezultat important i frecvent utilizat n statistic. Proporia zonei delimitate de abaterile standard de o parte i de alta a mediei (n ansamblul zonei delimitate de curba normal) este egal cu proporia cazurilor care nregistreaz scoruri cuprinse n acea zon. De exemplu, ntr-o distribuie normal, 34,13% din cazuri nregistreaz scoruri cuprinse ntre medie i o abatere standard fa de medie. n graficul de mai jos sunt evideniate frecvenele relative ale cazurilor cuprinse n interiorul intervalelor deviaiilor standard.

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar)

Fig. 6.4 Graficul frecvenelor relative a cazurilor cuprinse ntre intervalele deviaiilor standard pentru o medie x = 100 i o abatere standard s = 15 . 6.3 SCORURILE Z
Relaia dintre zonele curbei normale i unitile de deviaie standard poate fi utilizat pentru a rspunde anumitor ntrebri care sunt fundamentale n statistic. De exemplu: fiind dat o distribuie normal cu media 100 i deviaia standard 15, care este procentul cazurilor care nregistreaz scoruri IQ mai mari de 115? tim c un scor de 115 provenit de la o distribuie a scorurilor avnd media de 100 i abaterea standard de 15, reprezint o deviaie standard fa de medie ( 115 100 = 15 = 1s ). Mai mult, tim din figura 1.4 c 34,13% din cazuri prezint un scor IQ cuprins ntre 100 i 115 iar n 50% din cazuri, scorurile sunt mai mici de 100. Deci, n aproximativ 16% din cazuri vom ntlni scoruri IQ mai mari de 115. Figura de mai sus, nu mai poate fi utilizat dac se urmrete evaluarea procentual a cazurilor care nregistreaz scoruri IQ superioare scorului de 117. Tabelele statistice sunt astfel construite nct s elimine acest impediment. ns problema care se ridic const n identificarea unei modaliti de exprimare a locaiei scorurilor n termeni care s fie echivaleni pentru toate distribuiile normale. Spre exemplu, un scor IQ de 115 care are o deviaie standard deasupra mediei de 15 va avea o cu totul alt localizare ntr-o distribuie cu x = 116 i s = 5 . Soluia oferit de statistic este aceea de a transforma scorurile originale n scoruri standard (scoruri z). Un scor standard exprim poziia unui scor n raport de media distribuiei, utiliznd deviaia standard ca unitate de msur. Scorul z stabilete numrul de deviaii standard prin care scorul original se plaseaz deasupra sau sub media distribuiei. ntr-o distribuie unde x = 100 i s = 15 , scorul de 115 corespunde unui scor z de 1.00, indicnd faptul c scorul este situat la o deviaie standard deasupra mediei. Scorurile z se calculeaz dup relaia:

z=

xx s

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar) S ne oprim asupra scorului IQ de 115 nregistrat n dou distribuii diferite, una n care x = 100 i s = 15 iar cealalt n care x = 135 i s = 10 . Valorile lui z sunt: - pentru distribuia cu x = 100 i s = 15

z=
-

115 100 + 15 = = +1 15 15

pentru distribuia cu x = 135 i s = 10

z=

115 135 = 2 10

Chiar dac scorurile originale sunt identice, ele au poziii diferite n distribuiile menionate. Acest lucru se poate constata uor din analiza graficelor urmtoare:

Fig. 6.5 Scorul original i scorul z pentru dou distribuii normale avnd medii i abateri standard diferite.
O situaie interesant apare atunci cnd pentru distribuia normal x = 50 i s = 10 . Aici un scor de 60 reprezint o deviaia standard deasupra mediei i cade n aceeai poziie relativ ca i scorul de 115 din distribuia original ( x = 100 i s = 15 ).

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar)

Fig. 6.6 Scorul original de 60 i scorul z asociat ntr-o distribuie cu x = 50 i s = 10 . S calculm acum scorurile standard corespunztoare scorurilor IQ egale cu 120 i 95. Dac x = 100 i s = 15 , atunci scorurile z corespunztoare sunt:
z= 120 100 + 20 = = +1,33 15 15 95 100 5 = = 0,33 15 15

z=

Scorul IQ de 120 reprezint 1,33 deviaii standard deasupra mediei, n timp ce scorul IQ de 95 reprezint 0,33 deviaii standard sub medie. Proporiile corespunztoare acestor cote sunt precis specificate n tabelele statistice. Distribuiile normale difer prin valorile variabilelor, medie i abatere standard. Ceea ce este comun acestor distribuii este repartiia proporiilor pe un orizont de variaii. Distribuiile normale pot fi reduse la o distribuie standardizat de medie 0 i abatere standard 1 prin transformarea scorurilor originale n scoruri standard (z). Motivaia unei asemenea transformri const n faptul c, dat fiind distribuia standardizat, se pot determina cu uurin proporiile valorilor care se gsesc de o parte i de alta a unei valori z date.

TIPURI DE PROBLEME
1. Pentru o distribuie normal avnd x = 100 i s = 20 , care este procentul cazurilor ce nregistreaz scoruri mai mici de 80? Calculm: x x 80 100 = = 1,00 s 20 Valoarea corespunztoare cotei z din anexa A este de 15,87%. Prin urmare n 15.87% din cazuri scorurile vor fi mai mici de 80. z= 2. Pentru o distribuie normal cu x = 100 i s = 20 , care este procentul cazurilor ce nregistreaz scoruri mai mari de 120?

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar)


120 100 = +1,00 20 n anexa A se gsete ca i n exemplul de mai sus valoarea de 15,87%. z=

Fig. 6.7 Distribuia normal a scorurilor pentru x = 100 i s = 20 .


3. Pentru o distribuie cu x = 100 i s = 20 , se cere procentul cazurilor care nregistreaz scoruri mai mari de 80.
80 100 = 1,00 20 Figura de mai jos sugereaz necesitatea corespunztoare celor dou zone marcate. Cota z corespunztoare este:

z=

determinrii

procentelor

Fig. 6.8 Zonele corespunztoare cotelor standard pentru determinarea proporiei cazurilor care nregistreaz scoruri mai mari de 80.
Prima coloan a anexei A ofer rspunsul pentru prima zon cuprins ntre scorurile 80 i 100. Este vorba de un procent de 34,13%. ntruct curba normal este simetric, zona cuprins dincolo de medie reprezint din totalul zonei aflat sub grafic, adic 50%. n consecin, zona marcat reprezint 34,13% + 50% = 84,13% din totalul zonei plasate sub grafic. Prin urmare, n aproximativ 84% din cazuri se nregistreaz scoruri IQ mai mari de 80.

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar) 4. Pentru o distribuie normal cu x = 100 i s = 20 , care este procentul subiecilor care nregistreaz scoruri IQ cuprinse ntre 90 i 120?
Calculm cotele z corespunztoare scorurilor de 90 i 120:

z=

90 100 120 100 = 0,50 i z = = 1,00 20 20

Analiznd figura de mai jos, reiese necesitatea determinrii procentelor corespunztoare celor dou zone marcate: una cuprins ntre scorurile de 90 i 100 i cealalt cuprins ntre 100 i 120.

Fig. 6.9 Determinarea proporiei cazurilor care nregistreaz scoruri cuprinse ntre 90 i 120.
n anexa A, procentele corespunztoare celor dou zone sunt de 19,15% respectiv de 34,13%. Deci procentul subiecilor care nregistreaz scoruri cuprinse ntre 90 i 120 (pentru distribuia N( x = 100 i s = 20 )) este de 53,28%. 5. Pentru o distribuie normal cu x = 100 i s = 20 , care este proporia cazurilor care nregistreaz scoruri cuprinse ntre 110 i 120? Aceast problem este similar problemei 4, mai puin faptul c ambele scoruri sunt poziionate dincolo de medie. O soluie ar fi s determinm proporia cazurilor care nregistreaz scoruri mai mari de 110 i apoi proporia cazurilor care nregistreaz scoruri mai mari de 120. Avnd aceste informaii, pentru determinarea proporiei cazurilor care nregistreaz scoruri cuprinse ntre 110 i 120 este suficient s facem diferena dintre procentele rezultate. Pentru datele de care dispunem, scorurile z sunt: z= 110 100 120 100 = +0,50 i z = = +1,00 20 20

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar) Procentele corespunztoare scorurilor mai mari de 110 i 120 sunt de 30,85% respectiv de 15,87%. Rezult c n 30,85%-15,87%=14,98% din cazuri se vor nregistra scoruri cuprinse ntre 110 i 120. SITUAIA INVERS Problema pe care o propunem n continuare este de a gsi scorul care separ dou zone aflate sub graficul curbei normale. Exist n principiu trei tipuri de probleme. 1.Pentru o distribuie normal cu x = 100 i s = 20 , s se gseasc scorul care separ zona scorurilor mai mari prezente ntr-un procent de 20% de celelalte scoruri prezente ntr-un procent de 80%.
n anexa A coloana 3, se caut valoarea cea mai apropiat de 20% care este 20,05%, iar cota z corespunztoare este de 0,84. n continuare se convertete scorul z n scor original x. n cazul de fa, scorul original se afl la 0,84 abateri standard deasupra mediei i este egal cu 100 + 0,84 20 = 116,8 . Acesta este scorul care separ cele dou zone. Graficul corespunztor este cel prezentat mai jos.

Fig. 6.10 Scorul care separ zona scorurilor mai mari aflate ntr-un procent de 20% de restul scorurilor. 2. Pentru o distribuie normal cu x = 100 i s = 20 s se gseasc scorul care separ zona scorurilor mai mici prezente ntr-un procent de 20% de celelalte scoruri (prezente ntr-un procent de 80%). Grafic, situaia este cea prezentat mai jos.

Fig. 6.11 Scorul care separ zona scorurilor mai mici aflate ntr-un procent de 20% de restul scorurilor. 8

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar)

Ca i n exemplul de mai sus, n anexa A coloana a treia se urmrete valoarea cea mai apropiat de 20%. ntruct trebuie delimitat o zon care cuprinde scorurile mai mici aflate ntr-un procent 20% de cealalt zon care cuprinde restul de 80% din scoruri, scorul se va plasa n stnga mediei i deci va corespunde unei zone z negative ( z = 0,84 ). Acum exist condiiile de a converti scorul z n scor original. Astfel, x = 100 0,84 20 = 83,2 .
3. Pentru o distribuie normal cu x = 100 i s = 20 , care sunt limitele (exprimate n scoruri) n interiorul crora se nregistreaz 95% din scoruri? Situaia este prezentat n graficul mai jos:

Fig. 6.12 Limitele n interiorul crora se ntlnesc 95% din scoruri pentru o distribuie N( x = 100, s = 20 ).
Avnd n vedere simetria curbei normale, rezult c zonele care se exclud trebuie s reprezinte fiecare un procent de 2,5% din zona aflat sub grafic. n coloana a treia a anexei A se gsete cota z de 1,96 corespunztoare procentului de 2,5%, respectiv de 1,96 pentru cota z negativ. Scorurile originale sunt:

100 + ( 1,96) 20 = 60,8 i 100 + 1,96 20 = 139,2


ntre scorurile de 60,8 respectiv de 139,2 se cuprind, n condiiile distribuiei menionate, 95% din scoruri.

6.4 COMPARAREA SCORURILOR DIFERITELOR DISTRIBUII


Convertirea scorurilor originale n scoruri z conduce la distribuia normal centrat i redus, de medie 0 i abatere standard egal cu 1. Deci, indiferent de media i abaterea standard a distribuiei originale, convertirea n scoruri z conduce la o unic distribuie statistic. Acest lucru este foarte important ntruct permite compararea scorurilor diferitelor distribuii. Pentru o mai bun nelegere prezentm urmtorul exemplu. S presupunem c se nregistreaz un scor de 60 la un examen pentru care media este de 40 i abaterea standard este de 10 i un scor de 80 la acelai examen n anul urmtor pentru care media este de 65 i abaterea standard de 15. Se pune ntrebarea care rezultat este mai bun?

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar) Scorul mai mare de 80 este relativ neltor, date fiind mediile i abaterile standard diferite la cele dou examene. Transformnd cele dou scoruri n cote z, obinem:
z1 = 60 40 80 65 = 2,00 ; z 2 = = 1,00 10 15

Grafic, situaia este prezentat mai jos.

Fig. 6.13 Compararea scorurilor a dou distribuii avnd medii i abateri standard diferite.
ntruct la primul examen doar 2% din note au fost mai mari fa de media de 60 comparativ cu al doilea examen unde 16% din note au fost superioare mediei de 80, rezult c la primul examen performana obinut a fost mai bun.

6.5 ALTE SCORURI STANDARD


Utilizarea scorurilor z poate constitui un inconvenient din cel puin dou puncte de vedere: - n primul rnd se lucreaz cu ambele valori, pozitive i negative; n al doilea rnd, scorurile z nu sunt foarte familiare, mai ales cnd se ncearc comunicarea rezultatelor unui public ne-familiarizat cu proprietile acestor scoruri.

Avnd n vedere aceste inconveniente, scorurile t constituie o alternativ mai bun, fiind accesibile nelegerii. Ca i scorurile z, scorurile t sunt standardizate la o medie i abatere standard fixate. Cnd convertim toate scorurile n scoruri t, media lor este 50 iar abaterea standard este 10. Scorurile t se calculeaz dup relaia:
t = 50 + 10 z De exemplu, pentru un scor z = 1.7 , scorul t corespunztor este:

t = 50 + 10 ( 1, 7 ) = 33
10

Prof.univ.dr. Alin Gilbert Sumedrea Statistic psihologic (curs universitar)

sau, dac pentru un scor z abaterea standard este de +1.00, atunci scorul t este 60. n figura de mai jos sunt prezentate comparativ diverse scale ale scorurilor standard.

Fig. 6.14 Scale de scoruri ntr-o distribuie normal. Ceea ce trebuie reinut este c standardizarea unei scale nu duce la modificarea formei distribuiei; se schimb doar valorile corespunztoare lui x , x i s .

11

S-ar putea să vă placă și