Sunteți pe pagina 1din 8

4 DISTRIBUIA NORMAL Pagina 1 din 8

DISTRIBUIA NORMAL

Noiunea de distribuie normal este de mare importan n statistic. Pe de o parte, distribuia normal poate fi folosit n combinaie cu abaterea standard pentru a formula enunuri descriptive precise despre distribuiile scorurilor unor variabile. Pe de alt parte, distribuia normal st la baza multor tehnici statistice infereniale.

4.1 CARACTERISTICILE DISTRIBUIEI NORMALE


Distribuia normal este o distribuie teoretic de scoruri unimodal, simetric i continu. Graficul unei distribuiei normale are form de clopot cu ambele extremiti extinse la infinit1. Ca atare, un astfel de grafic, numit i curba normal2, nu atinge axa orizontal sau, altfel spus, este asimptotic fa de axa orizontal, dup cum se ilustreaz n figura 4.1. Figura 4.1 Un exemplu de curb normal

Distribuia normal este un model teoretic ce poate fi folosit pentru a descrie distribuii particulare ale scorurilor unor variabile msurate la nivel de interval sau de raport, despre care s-a constatat c aproximeaz suficient normalitatea ntr-o populaie, precum coeficientul de inteligen, rezultatele obinute la diferite teste de cunotine sau numrul de erori comise n ndeplinirea anumitor sarcini. Scorurile unor astfel de variabile tind s se grupeze simetric n jurul scorului central, dnd natere unui grafic de distribuie n form de clopot. Dac distribuia scorurilor unei variabile ntr-o populaie aproximeaz normalitatea, se spune c variabila respectiv este normal distribuit n populaia respectiv sau, pe scurt, c variabila respectiv este normal. Pe de alt parte, dup cum vom vedea n capitolele urmtoare, distribuia normal poate fi folosit pentru
1

Distribuia normal a fost studiat pentru prima dat n secolul al XVIII-lea de ctre Abraham De Moivre. La nceputul secolului al XIX-lea a fost descoperit independent de Carl Friedrich Gauss i Pierre Simon de Laplace. 2 n onoarea matematicienilor Gauss i Laplace, curba normal este cunoscut i sub numele de clopotul lui Gauss sau curba GaussLaplace.

4 DISTRIBUIA NORMAL Pagina 2 din 8 a reprezenta diferite mrimi statistice care rezult din studierea unor eantioane dintr-o populaie dat, ceea ce permite obinerea unor concluzii despre valorile pentru populaie pe baza valorilor cunoscute pentru eantioane. Utilizarea distribuiei normale n statistic face apel la aanumitele scoruri standard sau scoruri Z.

4.2 CALCULUL SCORURILOR STANDARD


Scorurile standard, numite i scoruri Z, folosesc abaterea standard ca unitate de msur i descriu poziia relativ a unui scor individual n raport cu ntreaga mulime de scoruri din care face parte. Formula de calcul pentru scorurile Z ale unei populaii este urmtoarea: Formula 4.1
Z= X

Aceast formul transform orice scor brut X n scorul Z corespunztor. Numrtorul fraciei, X , indic distana n uniti brute a scorului X fa de media aritmetic. Prin mprirea acestei distane la aflm distana n abateri standard sau fraciuni de abateri standard a scorului X fa de medie. Corespunztor, formula de calcul pentru scorurile Z ale unui eantion este urmtoarea: Formula 4.2
Z = X X s

Pentru ilustrare, s considerm o distribuie de scoruri pentru un eantion, n care X = 100 i s = 20. n acest caz, scorurile Z corespunztoare scorurilor brute 85, 120 i 150 sunt:
Z 85 = Z 120 = Z 150 = 85 100 = 0,75 20 120 100 = +1,00 20 150 100 = +2,50 20

Fiecare dintre aceste scoruri Z arat la cte abateri standard fa de media aritmetic se afl scorul brut corespunztor. Un scor Z negativ arat c scorul brut se afl sub media aritmetic, iar un scor Z pozitiv arat c scorul brut este mai mare dect media aritmetic. Evident, un scor Z egal cu 0 arat c scorul brut corespunztor este egal cu media aritmetic.

4 DISTRIBUIA NORMAL Pagina 3 din 8 Se demonstreaz c dac toate scorurile unei distribuii particulare se transform n scoruri Z, atunci:

Forma distribuiei scorurilor Z este aceeai cu cea a distribuiei iniiale; Media aritmetic a distribuiei scorurilor Z este 0, indiferent de valoarea mediei aritmetice a distribuiei iniiale; Abaterea standard a distribuiei scorurilor Z este 1, indiferent de valoarea abaterii standard a distribuiei iniiale.

Aceste proprieti au fost generalizate n studiul distribuiei normale standard.

4.3 DISTRIBUIA NORMAL STANDARD


Ca i n cazul unei distribuii particulare de scoruri de interval sau de raport, distribuia normal poate fi descris cu ajutorul mediei sale aritmetice i a abaterii standard. ntruct oricrei perechi de valori pentru media aritmetic i abaterea standard i corespunde o distribuie normal, matematic vorbind exist o infinitate de distribuii normale, ale cror forme exacte depind de mrimile menionate. Pentru a descrie efectiv distribuiile unor variabile normale, n analiza statistic se consider o distribuie normal particular, numit distribuia normal standard. Variabila corespunztoare distribuiei normale standard este numit variabila normal standard, valorile acestei variabile fiind scoruri Z. Din acest motiv, aceast distribuie se mai numete i distribuia Z. Prin convenie, media aritmetic a distribuiei normale standard se ia ca origine a variaiei variabilei normale standard, ceea ce nseamn c aceast distribuie are media aritmetic egal cu 0. De asemenea, se consider c abaterea standard a distribuiei normale standard este egal cu unitatea. Graficul corespunztor distribuiei normale standard este numit curba normal standard. Aria delimitat de curba normal standard este proporional cu frecvena scorurilor, astfel c proporia de cazuri cuprinse ntre un scor Z i media aritmetic poate fi aflat cu ajutorul calculului integral. Statisticienii au determinat cu precizie aceste arii, rezultatele fiind organizate sub forma unui tabel, numit tabelul curbei normale standard sau tabelul ariilor de sub curba normal standard (vezi Anexa A). Schema general a acestui tabel este prezentat n figura 4.2. Figura 4.2 Schema tabelului curbei normale standard
Z 0,0 0,1 0,2 0,3 0,4 0,5 0,00 0000 0,01 0,02 0,03 0,04 0,05

1736

4 DISTRIBUIA NORMAL Pagina 4 din 8 n corpul tabelului apar numere alctuite din patru cifre. Aceste numere reprezint ariile cuprinse ntre un scor Z dat i media aritmetic. Numerele nscrise n prima coloan din stnga, etichetat Z, reprezint primele dou cifre ale unui scor Z, iar numerele nscrise pe primul rnd de sus reprezint cea de-a treia cifr. De pild, pentru a afla aria cuprins ntre un scor Z = 0,45 i media aritmetic, se coboar n prima coloan din stnga pn la 0,4 (primele dou cifre ale scorului Z considerat) i apoi se parcurge spre dreapta rndul respectiv pn cnd se ajunge sub 0,05 (cea de-a treia cifr). Numrul gsit la intersecia acestor dou coordonate este 1736, care poate fi citit sau ca un procent (17,36%), sau ca o proporie (0,1736). n primul caz vom spune c 17,35% din aria total a curbei normale standard se afl ntre scorul Z = 0,45 i media aritmetic (punct n care Z = 0); n cel de-al doilea caz vom spune c proporia din aria total a curbei normale standard cuprins ntre scorul Z = 0,45 i media aritmetic este de 0,1736. ntruct orice curb normal este simetric, aceeai procedur se aplic i pentru afla aria cuprins ntre un scor Z negativ i media aritmetic. Astfel, rezultatul de mai sus poate fi interpretat spunnd c 17,35% din aria total a curbei normale standard se afl ntre scorul Z = 0,45 i media aritmetic.

4.4 UTILIZAREA STANDARD

DISTRIBUIEI

NORMALE

Figura 4.3 ilustreaz utilizarea tabelului distribuiei normale standard pentru determinarea procentelor din aria delimitat de curba normal, aflate ntre un scor Z dat i media aritmetic (Z = 0). Figura 4.3 Procente din aria de sub curba normal
34,13% 34,13%

68,26%

13,59%

13,59%

0,13%

2,15%

95,44%

2,15%

0,13%

-3

-2

-1

+1

+2

+3

Abateri standard fa de media aritmetic

De pild, din tabel aflm c ntre Z = +1 i media aritmetic se afl 34,13% din aria de sub curb (v. intersecia coordonatelor 1,0 i 0,00). ntruct curba este simetric, procentul din arie cuprins ntre Z = 1 i media aritmetic este tot de 34,13%. Astfel, ntre 1 abateri standard fa de medie se afl 68,26% din aria total. Similar, ntre Z =

4 DISTRIBUIA NORMAL Pagina 5 din 8 +2 i medie se afl 47,72% din arie, astfel c ntre 2 abateri standard fa de medie se afl 94,44% din arie. ntruct un procent relativ mic din aria total se afl peste +3 abateri standard sau sub 3 abateri standard (0,13%), pentru scopuri practice, ilustrate n cele ce urmeaz, se consider c distribuia normal se extinde de la Z 3,59 la Z +3,59 sau, altfel spus, la 3,59 abateri standard de o parte i de cealalt a mediei aritmetice, scorurile Z aflate dincolo de aceste limite fiind considerate a fi egale cu 0. n cazul variabilelor normal distribuite pentru care cunoatem media aritmetic i abaterea standard, distribuia normal standard poate fi folosit pentru a determina diferite procente sau proporii de cazuri n distribuii particulare, precum i pentru a determina probabilitatea de a selecta la ntmplare un scor cuprins ntr-o plaj dat de scoruri ale unei distribuii aproximativ normale. 4.4.1 DETERMINAREA PROCENTELOR DE CAZURI S considerm o distribuie de scoruri a variabilei coeficient de inteligen (IQ) pentru un eantion de1000 de subieci cu X = 100 i s = 20, ilustrat n figura 4.4. Figura 4.4 Distribuia scorurilor IQ pentru un eantion de 1000 de subieci
34,13% 34,13%

68,26%

13,59%

13,59%

0,13%

2,15%

95,44%

2,15%

0,13%

40

60

80

120

140

160

Uniti IQ

S presupunem c ne intereseaz procentul de cazuri cu scoruri IQ mai mici dect 115. Calculm mai nti scorul Z corespunztor scorului brut 115:
Z= 115 100 = +0,75 20

Din tabelul curbei normale aflm c aria dintre scorul Z = +0,75 i media aritmetic reprezint 27,34% din aria total. ntruct aria aflat sub media aritmetic reprezint 50% din aria total, procentul de subieci cu scoruri IQ mai mici dect 115 este de 74,34% (27,34% + 50%). Acest rezultat poate fi exprimat i n numr de cazuri,

4 DISTRIBUIA NORMAL Pagina 6 din 8 spunnd c aproximativ 743 de subieci din eantionul considerat (74,34% din 1000) au scoruri IQ mai mici dect 115. S presupunem acum c ne intereseaz procentul de cazuri cu scoruri IQ mai mici dect 75. Scorul Z corespunztor scorului brut 75 este
Z= 75 100 = 1,25 20

Pentru a afla aria de sub un scor Z negativ, aria dintre scor i media aritmetic se scade din 50% (aria aflat la stnga mediei). Din tabelul curbei normale aflm c aria dintre scorul Z = 1,25 i media aritmetic reprezint 39,44% din aria total. Astfel, procentul de subieci cu scoruri CI mai mici dect 75 este de 10,56% (50% 39,44%), ceea ce nseamn c aproximativ 394 de subieci (39,44% din 1000) au scoruri IQ mai mici dect 75. Acelai model de calcul se utilizeaz pentru a afla aria situat deasupra unui scor Z pozitiv. S presupunem c ne intereseaz procentul de cazuri cu scoruri mai mari dect 150. tim c scorul Z corespunztor acestui scor brut este +2,50. Din tabelul curbei normale aflm c aria dintre scorul Z = +2,50 i media aritmetic reprezint 47,98% din aria total, astfel c procentul de subieci cu scoruri mai mari dect 150 este de 2,02% (50% 47,98%). Aceasta nseamn c aproximativ 20 de subieci (2,02% din 1000) au scoruri IQ mai mari dect 150. n general, ariile situate peste sau sub un anumit scor Z se determin conform urmtoarelor reguli: 1. Pentru a determina aria aflat sub un scor Z negativ sau peste un scor Z pozitiv, aria dintre scorul respectiv i media aritmetic se scade din 50%. 2. Pentru a determina aria aflat sub un scor Z pozitiv sau peste un scor Z negativ, aria dintre scorul respectiv i media aritmetic se adun cu 50%. S vedem acum felul n care se determin ariile, respectiv procentele de cazuri dintre dou scoruri. S presupunem c ne intereseaz procentul de subieci cu scoruri IQ cuprinse ntre 95 i 125. Scorurile Z corespunztoare acestor scoruri brute sunt
Z 95 = Z 110 = 95 100 = 0,25 20 125 100 = +1,25 20

Din tabelul curbei normale aflm c aria dintre scorul Z = 0,25 i media aritmetic reprezint 9,87% din aria total i c aria dintre scorul Z = +1,25 i media aritmetic reprezint 39,44% din aria total. Fiind vorba despre scoruri aflate de o parte i de alta a mediei, aria dintre scoruri se determin adunnd ariile dintre fiecare scor i media aritmetic. Astfel, procentul de subieci cu scoruri IQ cuprinse ntre 95 i 125 este de 49,31% (9,87% + 39,44%). Aceasta nseamn c aproximativ 439 de subieci au scoruri IQ cuprinse ntre 95 i 125. Pentru a determina aria dintre dou scoruri aflate de aceeai parte a mediei aritmetice, se determin mai nti ariile dintre fiecare scor i medie, dup care aria mai

4 DISTRIBUIA NORMAL Pagina 7 din 8 mic se scade din aria mai mare. S presupunem c ne intereseaz procentul de subieci cu scoruri IQ cuprinse ntre 115 i 125. tim c scorul Z corespunztoare scorurilor brute 115 i 125 sunt, respectiv, +0,75 i +1,25. tim, de asemenea, c ntre Z = +0,75 i media aritmetic se afl 27,34% din aria total i c ntre Z = +1,25 i media aritmetic se afl 39,44% din aria total. Prin urmare, procentul de subieci cu scoruri IQ cuprinse ntre 115 i 125 este de 12,10% (39,44% 27,34%), ceea ce nseamn c aproximativ 121 de subieci au scoruri IQ cuprinse ntre 115 i 125. Acelai model de calcul se utilizeaz atunci cnd ambele scoruri se afl sub medie. 4.4.2 SCORURI DETERMINAREA PROBABILITILOR PENTRU

Tabelul curbei normale standard poate fi utilizat pentru a determina probabilitatea de a selecta la ntmplare un scor cuprins ntr-o plaj dat de scoruri ale unei distribuii aproximativ normale. nainte de a considera acest tip de utilizare, s examinm pe scurt noiunea de probabilitate. Pentru a estima probabilitatea producerii unui eveniment, trebuie s definim evenimentele care reprezint cazuri favorabile. Un caz favorabil este un caz n care se produce evenimentul a crui probabilitate de apariie dorim s o estimm sau, pe scurt, un caz care realizeaz acel eveniment. S presupunem c ntr-o urn sunt n bile de culori diferite, dintre care exact m sunt albe i c ne intereseaz probabilitatea de a extrage de la prima ncercare o bil alb. Evenimentul fiind apariia unei bile albe, cazul favorabil este extragerea unei bile albe. Fa de cazul favorabil, vom spune c extragerea unei bile de orice culoare este un caz egal posibil. Avem astfel m cazuri favorabile i n cazuri egal posibile. Probabilitatea teoretic a unui eveniment E, notat Pr(E) se definete ca raportul dintre numrul m al cazurilor favorabile i numrul n al cazurilor egal posibile:
Pr ( E ) = m n

Pentru ilustrare, s presupunem c n urn se afl 52 de bile de culori diferite, dintre care una singur este alb. ntruct m = 1 i n = 52, probabilitatea de a extrage de la prima ncercare o bil alb este 1 /52. Aceast fracie poate fi exprimat i ca proporie, mprind numrtorul la numitor: (1/52) = 0,0192. Vom spune c apariia bilei albe la o singur extragere se produce n proporie de 0,0192. n tiinele omului, probabilitile sunt exprimate n mod obinuit ca proporii i vom urma aceast convenie n continuare. Este important de remarcat c, gndite astfel, probabilitile au un neles precis: pe termen lung, cazurile favorabile se afl ntr-o anumit relaie proporional cu numrul total de cazuri. n exemplul nostru, probabilitatea de 0,0192 ca bila alb s apar la o singur extragere nseamn de fapt c din 10000 de extrageri a cte unei bile din urna complet, proporia de extrageri a bilei albe va fi de 0,0192 sau, altfel spus, c din 10000 de extrageri a cte unei bile din urna complet, bila alb va aprea de 192 de ori, celelalte 9808 extrageri producnd bile de alte culori. Acum, din cele de mai sus tim c pentru orice distribuie particular aproximativ normal, proporiile prezentate n tabelul curbei normale standard ne dau frecvena relativ a cazurilor cu scoruri cuprinse ntre un anumit scor i media aritmetic, precum i c probabilitatea unui eveniment este frecvena relativ a cazurilor

4 DISTRIBUIA NORMAL Pagina 8 din 8 care realizeaz acel eveniment. Prin urmare, proporiile din tabelul curbei normale standard pot fi interpretate ca probabiliti i pot fi folosite pentru a determina probabilitatea de selecie a unui scor cuprins ntr-o plaj dat de scoruri ale unei distribuii aproximativ normale. Considernd din nou distribuia variabilei coeficient de inteligen cu care am lucrat mai sus, s presupunem c ne intereseaz probabilitatea ca un subiect ales la ntmplare s aib un scor IQ cuprins ntre 95 i scorul mediu de 100 (aici, cazul favorabil este selectarea unui subiect al crui scor se afl n amplitudinea de scoruri specificat3). Scorul Z corespunztor scorului brut de 95 este 0,25 i, conform tabelului curbei normale standard, proporia din arie cuprins ntre scorul Z = 0,25 i media aritmetic este de 0,0987. Aceast proporie este probabilitatea cutat. Vom spune c probabilitatea ca un subiect ales la ntmplare s aib un scor IQ cuprins ntre 95 i 100 este de 0,0987 sau, rotunjit, de 0,1 sau de unu la zece. De notat c pentru determinarea probabilitilor de selectare a scorurilor se utilizeaz aceleai proceduri ilustrate mai sus pentru determinarea procentelor de cazuri, diferena fiind aceea c proporiile din tabelul curbei normale standard sunt interpretate ca probabiliti. De pild, probabilitatea ca un subiect ales la ntmplare din eantionul considerat s aib un scor IQ peste 95 este de 0,5987 (0,5000 + 0,0987). S mai notm c, ntruct n distribuia normal standard cele mai multe scoruri sunt grupate n jurul mediei aritmetice, frecvena acestora scznd pe msur ce ne ndeprtm de medie, dac vom selecta la ntmplare un numr de scoruri dintr-o distribuie aproximativ normal, vom selecta mai des scoruri apropiate de media aritmetic i mai rar scoruri aflate mult sub sau peste medie. GLOSAR

Determinarea probabilitii cutate cu ajutorul formulei de calcul pentru probabiliti ar conduce la construirea unei fracii care s aib drept numrtor numrul de subieci ale cror scoruri se afl n amplitudinea specificat i drept numitor numrul total de subieci.

S-ar putea să vă placă și