Sunteți pe pagina 1din 15

VERIFICAREA NORMALITATII REPARTITIEI DATELOR

A. Scopul lucrarii:
Se urmareste realizarea urmatoarelor obiective: - prezentarea notiunilor generale legate de verificarea concordantei dintre o repartitie teoretica i o repartitie empirica; - prezentarea testelor de concordanta pentru verificarea normalitatii; - prezentarea unei aplicaii;

B. Notiuni de baza:
Rezolvarea practica a problemelor de prelucrare statistica a datelor implica in general aproximarea unei repartitii experimenale (obinuta din datele masurate) cu o repartitia teoretica de care sa se apropie in mod satisfacator. Pentru eliminarea aproximarilor este recomandat sa se aplice un test de verificare aceste teste parcurgand in general urm!toarele etape: - enuntarea ipotezei a presupunerii asupra unei sau mai multor repartitii sau asupra unuia sau mai multor parametrii ai repartitiei respective; - alegerea parametrilor (" n etc); - calculul functiei de repartitie pe baza datelor i stabilirea regulilor# criteriilor ce vor definii decizia (adaptarea sau respingerea unei repartitii); - luarea deciziei acceptarea sau respingerea functiei de repartitie. $xista diferite metode i teste de verificare a aplicabilitatii repartitiilor teoretice %eoarece ma&oitatea fenomenelor se supun legii de repartitie normala ('auss()aplace) testele cel mai frecvent test utilizate se refera la verificarea normalitatii. Pntru verificarea repartitiilor trebuie sa se specifice un prag de semnificatie sau un risc pentru care sa poata fi luata decizia de acceptare a ipotezelor. *etodele de verificare a normalitatii sunt: - verificarea egalitatii unor parametrii al repartitiei cu o valoare data; - verificarea egalitatii valorilor parametrilor a doua repartitii fara a se preciza insa aceste valori; - verificarea concordantei dintre o repartitie experimentala (empirica) si o repartitie teoretica; - verificarea valorilor aberante; 1. +erificarea concordantei dintre o repartitie experimentala (empirica) si o repartitie teoretica; +erificarea normalitatii curbei de repartitie 1.1. Verificarea valorilor unora dintre parametrii statistici *etoda este mai ales calitativa i consta din parcurgerea urmatorilor pasi (vezi )ucrarea, Repartitia in frecventa a datelor. Reprezentarea i prelucrarea primara a sirurilor):

100

)ucrarea -

.( se traseaza /istograma care are reprezentate pe abscisa valoarea limitelor claselor xi iar pe ordonata frecventa absoluta ai sau frecventa relativa f0 utilizandu(se relatiile: m =1 +3,322 lgn ( determinand numarul de clase (-..)

W = x max x min ( determinand valoarea amplitudinii


d= W x max x min = ( raport ce defineste valoarea m!rimii unui sub(interval m m

(-.,)

(-.1)

fi =

ai ; n

i =1

f i = 1 ( determinand valorile frecventelor relative


n

(-.2)

,( se calculeaza valoarea mediei aritmetice a medianei si a modulului:

M [ x ] = i =1 n
M e = X n +1
2

xi

(-.-)

(pentru numar impar de valori M e par

x( n / 2 ) + x( n 2 + 1 ) (pentru numar 2

(-.3)

M 0 = x + 3 M e x

(-.4)

1( se calculeaza valoarea coeficientului de asimetrie:

1=

M3 = M3 /2 3 M3 2 D[ x]

(-.5)

2( se calculeaza coeficientul de aplatizare excesul cu relatia:

2=

M4 3= M4 3 2 [ ] M2 D x 2
1 n k ( xi x) n i= 1

(-.6)

7nde: *1 este momentul centrat de ordinul 1 respectiv * 2 momentul centrat de ordinul 2 calculul valorilor momentului centrat de ordinul 8 9n raport cu media aritmetic: notandu(se cu *8 i este dat de expresia:

M
respectiv:

(-..;)

n 1 n k k ( xi x ) a i = ( xi x ) f n i= 1 i= 1

(-...)

<vand valorile calculate pentru toti acesti parametri statistici se poate face o evaluare a repartizarii. 0n cazul in care datele sunt normal repartizate: - /istograma va prezenta un singur maxim avand alura asemanatoare curbei normale; - media aritmetica mediana si modala vor avea valori apropiate; - coeficientul de asimetrie se va apropia de valoarea ;; - coeficientul de aplatizare va avea valoarea ;. %aca aceste verificari nu duc la concluzii favorabile privind normalitatea repartitiei datelor decizia poate fii:

+erificarea normalitatii repartitiei datelor

.;.

este necesara o analiza mai amanuntita cantitativa a sirului de date; pentru valori ce definesc o abatere suficient de mare intre repartizarea teoretica de referint: i cea observata se respinge ipoteza de normalitate a repartitiei datelor. =el mai important i mai des utilizat test de verificare a normalitatii repartitiilor unui sir de date experimentale este testul , 1.2. Testul 2 pentru verificarea normalitatii Repartitia , se utilizeaza i pentru verificarea normalitatii unei populatii normale cu > i ? , necunoscute. Statistica , pentru @n(. grade de libertate:

= z2 i i =0 in acest caz este data de relatia:


i

2 i

( xi ) 2 = i =0
i

(-..,)

i2 =
i=0

( ai npi ) 2
npi

(-..1)

7nde: - ai( este frecventa absoluta a abaterilor intervalului i (numarul inregistrat de valori din acest interval i); - pi( probabilitatea teoretica a intervalului i ( a evenimentului considerat); - n( volumul esantionului; Abservatie: testul de concordanta , se aplica atunci cand volumul esantionului este nB.;;. Pragul de semnificatie ,c se stabilete pentru un risc " acceptat i C@n(. grade de libertate iar daca: (-..2) 2 > c2 ; repartitia observata nu este de acelasi tip cu repartitia teoretica considerata <stfel in cazul practic de verificare a aplicabilitatii distributiei teoretice se parcurg urmatori pasii: .( datele observate se grupeaza in intervale (determinandu(se numarul m de clase) calculandu(se in continuare frecventa corespunzatoare repartitiei teoretice ai respectiv fi; ,( se calculeaza valoarea mediei aritmetice x
n

(-.-) respectiv abaterea medie p:tratic::


2

s=

xi x i =1 n 1

(-..-)

1( se aplica transformarea de variabila:

xx z= s

(-..3)

prin folosirea acestei transform:ri pentru repartitia teoretica normala putandu(se determina probabilitatea pi corespunzatoare intervalului xi(. xi cu a&utorul functiei )aplace:

valorile funciilor densitate de probabilitate f(z) i ale funciei de repartiie D(z) fiind date tabelar (<nexa <):

F ( x ) = f ( x )dx =

1 2

z 2 dx

(-..4)

102
xi x xi 1 x = F F ; s s

)ucrarea -

pi = F ( z i ) F ( z i 1 )

(-..5)

<stfel ca pentru primul interval:


p1 = F ( z1 ) F ( ) = F ( z 1 )
x1 x = F ; s

(-..6)

iar pentru ultimul interval:


p m = F ( + ) F ( z m )
xm x =1 F ; s

(-.,;)

%eoarece (vezi (-..4)):

(-.,.) 4- se calculeaza valoarea lui utilizand relatia (-..1) (dupa ce au fost calculate# sau determinate din tabelele de specialitate (<nexa <) pentru fiecare valoare a lui z i valorile functiilor de repartitie respectiv au fost calculate probabilitatile pi); 5- se determina valoarea ,c utilizand valorile tabelare ale functiei , (<nexa E) pentru nivelul de incredere .(" # riscul " impus i un numar C de grade de libertate decizia luandu(se in concordanta cu relatia:
,

f ( + ) = 1;

f ( t ) = 1 f ( t );

f ( ) = 0

n ( ai npi ) 2 2 = 1 P , i =1 np i

sau P c2 2, = 1

(-.,,)

Abservatie: numarul de grade de libertate reprezinta numarul de categorii (intervale) al caror continut se poate specifica in mod independent. 0n cazul repartitiei normale daca parametrii > i ? se apreciaza pe baza sonda&ului ( x =u conditia suplimentar impusa:

si s ) se reduc doua grade de libertate.


(-.,1)

a
i =1

= n => = m 3

grade de libertate (unde m este numarul de intervale). 3( daca: (-.,2) c2 2, se accepta repartitia teoretica studiata ca fiind o repartitie normala. Abservatie: *etoda testului ,poate fi aplicata i pentru rezolvarea unor probleme de comparatie intre doua grupe de rezultate obtinute cu un element sau factor modificat. %aca se cauta sa se confirme ipoteza ca diferenta (defectiunilor) intre cele doua categorii nu este semnificativa aceasta revine ipotezei ca cele doua grupe apartin unei distributii normale. 1.3. Testul Kolmogorov-Smirnov K) =ele mai multe verificari a aplicabilitatii repartitiilor teoretice necesita cunoasterea in prealabil a legii de repartitie dar in cazurile in care aceasta este necunoscuta se impun o categorie de teste valabile pentru ForiceF repartitie. 0n general aceste metode sunt mai puin precise decGt metodele de verificare clasice (la care se cunosc legile de repartitie teoretica) din acest motiv acestea din urma se aplica ori de cate ori este posibil. <ceste metode datorita posibilitatii aplicabilitatii pentru orice functie de repartitie (deci pentru orice parametrii) se numesc FneparametriceF ele fiind mai eficiente atunci cand se testeaza mediile i nu dispersiile. *etoda de verificare Holmogorov(Smirnov H verifica concordanta dintre o repartitie teoretica D(x) (normala binomiala Poisson) i una experimentala De(x) pasii parcursi fiind:

+erificarea normalitatii repartitiei datelor

.;1

.( datele observate se grupeaza in intervale (determinandu(se numarul m de clase) calculandu(se in continuare valorile frecventelor absolute ai respectiv valorile frecventelor relative fi corespunzatoare; ,( se calculeaza valoarea mediei aritmetice x utilizand relatia (-.-) respectiv abaterea medie p:tratic: s utilizand relatia (-..-); 1( se calculeaza valorile functiei de repartitie experimentale utilizand relatia: (-.,-) Fe ( xi ) = f i 2( se aplica transformarea de variabila aplicand relatia (-..3) pentru repartitia teoretica valorile funciilor densitate de probabilitate f(z) i ale funciei de repartiie D(z) fiind date tabelar (<nexa <) aceasta in cazul verificarii normalitatii. Abservatie: in cazul verificarii altor repartitii teoretice se vor aplica transform!rile specifice acestora. <stfel ca valorile functiei de repartitie teoretice vor fi date de relatia: (-.,3) F ( z i ) = F ( xi ) -( cu valorile grupate pe intervale se calculeaza diferenta:

Fe ( xi ) F ( xi )

(-.,4) (-.,5)

3( se determina valoarea maxima a diferentei: d e = max Fe ( xi ) F ( xi ) 4( pentru un nivel semnificativ .(" (sau risc " )adoptat se scrie relatia:

(-.,6) P de = 1 = K() n +aloarea lui I obtinandu(se din tabelele functiei calculate H (<nexa $) calculandu(se in continuare valoarea raportului 5( daca:

(-.1;) n se accepta ipoteza concordantei dintre repartitia teoretica i cea observata. 0n caz contrar ipoteza se respinge. Abservatie: *etoda de verificare H este o metoda greoaie necesitand un esantion de volum foarte mare respectiv un volum mare de calcul. 1.!. Testul "asse# <cest test se aplica in scopul verificarii normalitatii si se prezint! ca o modificare a testului H el fiind adaptat pentru selectii# esantioane de volum n redus (un volum intre 5 si 1, unitati statistice). <plicarea acestei metode presupune parcurgerea urmatoarelor etape: .( ordonarea valorilor experimentale xi in ordinea crescatoare;
de <

,( se calculeaza valoarea mediei aritmetice x medie p:tratic: s utilizand relatia (-..-); 1( se normeaza valorile variabilei:
i

utilizand relatia (-.-) respectiv abaterea

x x = i s

(-.1.)

2( se determina frecventa cumulata Dc corespunzatoare fiecarei valori Ji:

Fe (

) = fi
1

(-.1,)

7nde: f0 este frecventa relativa a valorii J0;

104

)ucrarea -

-( cu a&utorul tabelelor )aplace (<nexa <) se calculeaza functia teoretica de repartitie D(Ji) 6( se determina diferenta: (-.11) d = Fe ( i ) F ( i ) si se alege valoarea superioara: ds$sup d ; .;( din tabelul functiei calculate *asseJ se alege valoarea statistica dg corespunzator nivelului de semnificatie " adoptat; ..( daca: ds d! (-.12) se acepta ipoteza ca repartitia experimentala corespunde unei repartitii normale. 0n caz contrar se respinge aceasta ipoteza.

C. Desfasurarea lucrarii:
1. Tema% Pe un esantion de volum n@.;5 se masoara rezistenta la rupere i se obtin valorile (in daK): .-5.;;; .4;.;;; .42.;;; .4-.;;; .43.;;; .5;.;;; .43.;;; .5..;;; .51.;;; .3-.;;; .5-.;;; .45.;;; .52.;;; .62.;;; .5;.;;; .5;.;;; .41.;;; .4-.;;; .4,.;;; .56.;;; .5..;;; .5;.;;; .4;.;;; .31.;;; .5,.;;; .55.;;; .45.;;; .3;.;;; .4;.;;; .6;.;;; .4-.;;; .65.;;; .45.;;; .51.;;; .6-.;;; .5;.;;; .3,.;;; .4-.;;; .52.;;; .51.;;; .6,.;;; .53.;;; .66.;;; .3-.;;; .55.;;; .63.;;; .52.;;; .46.;;; .51.;;; .5,.;;; .34.;;; .32.;;; .44.;;; .6;.;;; .42.;;; .42.;;; .33.;;; .36.;;; .34.;;; .44.;;; .5-.;;; .6;.;;; .62.;;; .44.;;; .5-.;;; .6;.;;; .6..;;; .66.;;; .45.;;; .4..;;; .4,.;;; .4,.;;; .5-.;;; ,;..;;; .54.;;; .62.;;; .54.;;; .46.;;; .5-.;;; .5..;;; .5-.;;; ,;;.;;; .5,.;;; .5;.;;; .51.;;; .5;.;;; .5..;;; .5,.;;; .4-.;;; .51.;;; .6;.;;; .52.;;; .46.;;; .55.;;; .46.;;; .-6.;;; .51.;;; .53.;;; .42.;;; .5..;;; .54.;;; .4..;;; .41.;;; .34.;;; .4..;;; .41.;;; .4..;;; .4,.;;; - sa se verifice ipoteza conform careia datele statistice sunt variabile aleatoare repartizate normal pentru un nivel de incredere de ;.6-; (.("@6-L). 2. &relucrarea rezultatelor% 0n vederea verificarii normalitati datelor tinandu(se seama de volumul esantionului n@.;5 se pot aplica testele: - testul , pentru verificarea normalitatii; - testul Holmogorov(Smirnov H. .. Mestul , pentru verificarea normalitatii 7tilizand functiile oferite de softNare(ul $xcel verificarea normalitatii functiei de repartitie aplicand testul , presupune parcurgerea urmatorilor pasi: ...( se determina valorile de minim x min i a celor de maxim x max utilizand optiunile oferite de $xcel parcurgand pasii: .( selectati optiunea 0nsert Dunction... (0ntroducere Dunctii); ,( selectati din casuta de dialog care se desc/ide categoria Statistical (Statistic); 1( selectati optiunea *0K; astfel pentru sirul de date selectat se va obtine valoarea de minim 'min$1() 2( selectati optiunea *<O; obtinand in acest caz valoarea de maxim xmax a sirului in cazul nostru: 'ma' $ 2*1; ..,( se calculeaza num!rul de clase m+ utilizand formula (,.-):
m =1 +3,322 lgn

7tilizand functiile $xcel aceasta formula va fi scrisa in celula selectata sub forma: =1+3.322* !"1#$1#%& Abtinand valoarea: m$,.,((-

+erificarea normalitatii repartitiei datelor

.;-

Diind necesar un numar intreg de clase se adopta un numar de 5 clase astfel ca: m$) este valoarea num!rului de clase aproximat +aloare ce va ocupa adresa E1. in cadrul raportului $xcel. ..1( se calculeaza amplitudinea .+ utilizand formula (,.,3):

W = x max x min
7tilizand functiile $xcel avand adresele pentru valoarea lui 'min in cadrul raportului $xcel E,5 iar pentru 'ma' E,6) este: =$B1'(B1)& rezultand: .$!3.***..2( se determina m!rimea unui sub(interval utilizand formula (,.-1):

d=

W x max x min = m m

7tilizand $xcel valoarea obtinuta este: =B32*B31+ rezultand: d$(.3,( 7nde adresa E1, corespunde valorii amplitudinii iar E1. valorii num!rului de clase aproximat; valoarea sub(intervalului obtinut va corespunde in continuare adresei E11. ..-( se realizeaza tabelul datelor grupate reprezentnd valorile intervalelor astfel: /'min% 0min1d)- /'min1d% 'min12d)-2 'ma'37tilizand $xcel introducerea acestor valori poate fi realizata utilizand: +=,B,1) si =,B,1)+,B,2#&- +=,B,1)+,B,2# si =,B,1)+2*,B,2#& s.a.m.d. obtinand tabelul: .-5.;;; .31.14.35.4-; .42..,.46.-;; .52.54.6;.,-; .6-.3,.31.14.35.4-; .42..,.46.-;; .52.54.6;.,-; .6-.3,,;..;;;

+alori care vor ocupa adresele <.3(E,1 in cadrul raportului $xcel. ..3( se calculeaza frecventele absolute ai+ utilizandu(se facilitatile softNare(ul $xcel si anume: -( selectati optiunea 0nsert Dunction... (0ntroducere Dunctii); 3( selectati din casuta de dialog care se desc/ide categoria Statistical (Statistic); 4( selectati optiunea =A7KM0D (=ontabilizare conditionata); urmand a introduce datele: =C!.N/01$,A,2:,0,132341'3.35)3&, pentru primul interval Px minQd); =C!.N/01$,A,2:,0,132341'%.5)#3&(C1'+ pentru intervalul Px minQd x minQ,d); =C!.N/01$,A,2:,0,13234156.12)3&(S.7$C1':C15&2 pentru intervalul Px minQ,d x minQ1d) avand: =C!.N/01$,A,2:,0,132342#1.#3&+1(S.7$C1':C22& pentru ultimul interval Px minQ3d xmaxR <stfel vom obtine valorile: a1$(- a2$,- a3$14- a!$1)- a($2,- a5$2*- a,$5- a)$5 (valori care vor corespunde in continuare adreselor de la =.3 la =,1) ..4( verificarea rezultatelor se poate realiza avand formula (,.,):

a
i =1

=n

7tilizand $xcel aceasta va fii scrisa sub forma:

106

)ucrarea -

=S.7$C1':C23) sau =S.7$a12a22 a32a62a)2 a'2 a52 a%&; <stfel observam ca rezultatele obtinute sunt corecte deoarece avem: (1,11411)12,12*1515$1*) (adevarat aceasta valoare corespunzand in continuare adresei =,2. ..5( se calculeaza frecventele relative fi utilizand formula (,.1):

fi =

ai ; n

f
i =1

=1

<stfel avem: =C1'*,C,26- =C15*,C,26- s.a..m.d pentru fiecare valoare f1+ f2+ ...f,+alorile obtinute reprezentate tabelar i care vor ocupa in continuare adresele %.3(%,1 in cadrul protocolului $xcel sunt: f1$*.*!5- f2$*.*5(- f3$*.1,5- f!$*.15,- f($*.2(*- f5$*.1)(- f,$*.*(5- f)$*.*(5 +erificarea rezultatelor presupune insumarea valorilor frecventelor relative i anume: =S.7$"1':"23&; valoarea obtinuta fiind 1.** (ceea ce este conform formulei valoarea obtinuta corespunzand in continuare adresei %,2). ..6( se traseaza /istograma valorilor calculate avand pe abscisa valorile clasei iar pe ordonata valorile frecventelor urmand pasii: .( selectati datele pe care doriti sa le reprezentati grafic: adresele ce reprezinta valorile frecventelor relative fi; ,( executati clic asupra butonului =/artSizard (<sistent pentru grafice); 1( selectati tipul de grafic dorit: cazul reprezentarii unei Tistograme; .( selectati formatul graficului; ,( executati clic asupra butonului Kext (*ai departe); 1( definirea datelor pe care doriti sa le reprezentati grafic; 2( model de grafic; -( executati clic asupra butonului Kext (*ai departe); 3( efectuati modific!rile pe care le considerati necesare (titlul graficului etic/eta axei x etic/eta axei J etic/eta legendei etc); 4( executati clic asupra butonului Kext (*ai departe); 5( determinati locatia reprezentarii grafice; 6( executati clic asupra butonului Dinis/ (Merminare). ...;( pentru determinarea mediei aritmetice avand formulele (,.6) (,..;):

M [ x] =

xi
i =1

sau

M [ x ] = i =1

ai xi n

utilizand optiunile oferite de softNare(ul $xcel: 0nsert DunctionU(0ntroducere DunctiiU) selectand din caseta de dialog care se desc/ide categoria: Statistical (Statistica) vom avea: =A89:A"9$,A,2:,0,13& +aloarea obtinuta fiind: "/'3$1,4.)(2 (i ea va corespunde in continuare adresei E12)(sau pentru calcularea aceleiasi expresii mai puteam scrie: $S6" 72%813)91*) ); ....( pentru determinarea dispersiei avem formula (,.,.):
1 D[ x ] = i =

( x i M [ x ] )
n

; sau :

+erificarea normalitatii repartitiei datelor

.;4

1 D[x ] =i =

( xi M [ x ])2 ai n

= ( xi M [ x ])2 f
i= 1

7tilizand $xcel se va aplica functia: =A89D98$,A,2:,0,13&& obtinand valoarea :/'3$ s2$,.355+ valoare ce va ocupa in continuare adresa E1-. <ceeasi expresie o mai putem calcula utilizand functiile: =$S.7$;!<9:$$,A,2:,0,13(,B,36&22&&&*1#%...,( se calculeaza abaterea standard (abaterea medie patratica) (,.,2):

D[ x ] =

i= 1

( x i M [ x ])2 n

n 1 2 x i M [ x]2 n i =1

=;!<9:$S.7$;!<9:$$,A,2:,0,13(,B,36&22&21#%&2 192) sau =S=:/$B3)& obtinand valoarea D[ x ] $ s$2.,1! (valoare ce va ocupa adresa E13). ...1( se face sc/imbarea de variabila utilizand formula (2.,3): x z= 7nde valorile mediei *PxR i a abaterii
D[ x ] sunt valorile calculate anterior i care se

gasesc la adresa E,. respectiv E,1 in cadrul raportului $xcel. <stfel vom avea: =$91'(,B,36&*,B,3'- =$915(,B,36&*,B,3'- >=$923(,B,36&*,B,3'2 Abtinand valorile: z1$-5.*,1- z2$-!.*41- z3$-2.11*- z!$-*.13*- z($1.)(1- z5$3.)31- z,$(.)12- z)$,.,42 1;) valori ce vor ocupa in continuare adresele D.3(D,1 in cadrul raportului $xcel. ...2( prin folosirea acestei transform:ri pentru repartitia teoretica normala se poate determina probabilitatea pi corespunzatoare intervalului xi(. xi cu a&utorul functiei )aplace (2.,5)

2 <stfel in primul rand se vor determina valorile funciei de repartiie D(z) acestea fiind date tabelar (<nexa <).+alorile gasite sunt: < z1)$*.**1- < z2)$*.**1- < z3)$*.*1,- < z!)$*.!!)- < z()$*.45)- < z5)$*.444< z,)$*.444- < z))$*.**4. +alori care vor ocupa in cadrul raportului $xcel adresele '.3(',1. ...-( se calculeaza probabilitatea pi corespunzatoare intervalului xi(. xi utilizand formula (-..5)
pi = F ( z i ) F ( z i 1 )
xi x xi 1 x = F F ; s s

F ( x ) = f ( x )dx =

z 2 dx

si tinand cont de relatiile (-.,.)

f ( + ) = 1;

f ( t ) = 1 f ( t );

f ( ) = 0
x1 x = F ; s

Pentru primul interval valoarea p. va fii (-..6):


p1 = F ( z1 ) F ( ) = F ( z 1 )

iar pentru ultimul interval (-.,;):

108
xm x =1 F ; s

)ucrarea -

p m = F ( + ) F ( z m )

<stfel utilizand $xcel vom avea relatiile ="1'- ="15("1'- ="1%("15- >- ="23("22 valorile obtinute fiind: p1$*.**1- p2$*.***- p3$*.*15- p!$*.!31- p($*.(2*- p5$*.*31- p,$*.***- p)$*.*** valori ce vor ocupa in continuare adresele T.3(T,1 in cadrul raportului $xcel. ...3( avand valorile pi se pot calcula in continuare valorile produsul nVpi produs care intra in formula de calculul valorii ,.7tilizand $xcel vom avea: =,C,26*?1'- =,C,26*?15- > =,C,26*?237nde pe adresa =,2 se gaseste valoarea ce defineste volumul esantionului numarul de valori n. +alorile obtinute in urma calculelor vor ocupa adresele 0.3(0,1 din cadrul raportului $xcel acestea fiind: np1$*.1*)- np2$*.***- np3$1.,,1- np!$!5.(3,- np($(5.1*5- np5$3.3,*- np,$*.***np)$*.*** ...4( se calculeaza valoarea lui , (dupa ce au fost determinate din tabelele de specialitate (<nexa <) pentru fiecare valoare a lui zi valorile functiilor de repartitie respectiv au fost calculate probabilitatile pi) utilizand formula (-..1)

2 ca"cu"at

= =
2 i =1

( ai npi ) 2
npi

<stfel vom avea: =;!<9:$$C1'(01'&22&*01'- =;!<9:$$C15(015&22&*015- > =;!<9:$$C23(023&22&*023+alorile obtinute valori ce vor ocupa in continuare adresele W.3(W,1 in cadrul raportului fiind: =1$221.()4- =2$!34.)12- =3$1)*.,1(- =!$1,.!44- =($1(.*44- =5$)(.4*1- =,$321.!!1=)$32!.)*, , <stfel va avea valoarea:
2 ca"cu"at = 2 = 1606.864

pentru calcularea cestuia utilizand $xcel avand formula: $S6" >15%>23). ...5( se determina valoarea ,c utilizand valorile tabelare ale functiei , (<nexa E) pentru nivelul de incredere .(" # riscul " impus (.(" @;.6-;@6-L) i un numar C de grade de libertate decizia luandu(se in concordanta cu relatia (-.,,):

n ( ai npi ) 2 2 P , i =1 = 1 npi

sau P c2 2, = 1

Abservatie: numarul de grade de libertate reprezinta numarul de categorii (intervale) al caror continut se poate specifica in mod independent. %eci valoarea atribuita pentu numarul gradelor de libertate este: = m 1 ; rezultand astfel: = 8 1 = 7 ( grade de libertate unde m este numarul de intervale. <stfel valoarea gasita pentru ,c este:

2c $ 2.15, ...6( comparand valoarea calculata cu valoarea critica (-.,2) c2 2, observam ca: 15*5.)5! ? 2.15,

+erificarea normalitatii repartitiei datelor

.;6

=oncluzia pe care o putem trage in acest moment este doar aceea ca datele studiate nu respecta legea normala de repartitie astfel ca decizia este: 3repartitia teoretica studiata nu se accepta ca fiind o repartitie nor@ala3. ,. Mestul Holmogorov(Smirnov H pentru verificarea normalitatii 7tilizand functiile oferite de softNare(ul $xcel verificarea normalitatii functiei de repartitie aplicand de aceasta data testul Holmogorov(Smirnov H presupune parcurgerea urmatorilor pasi: ...( se determina valorile de minim 'min i a celor de maxim 'ma'; ..,( se calculeaza num!rul de clase m..1( se calculeaza amplitudinea ...2( se determina m!rimea unui sub(interval; ..-( se realizeaza tabelul datelor grupate reprezentnd valorile intervalelor: /'min% 0min1d)/'min1d% 'min12d)-2 'ma'R; ..3( se calculeaza frecventele absolute ai verificandu(se rezultatele obtinute; ..4( se calculeaza frecventele relative f0 verificandu(se de asemenea rezultatele obtinute; ..5( se traseaza /istograma valorilor calculate avand pe abscisa valorile clasei iar pe ordonata valorile frecventelor; ..6( se determina valoarea mediei aritmetice *PxR i valoarea dispersiei %PxR;

...;( se calculeaza abaterea standard (abaterea medie patratica)

D[ x ] ;

....( se face sc/imbarea de variabila aplicand relatia necesara verificarii normalitatii valorile funciilor densitate de probabilitate f(z) i ale funciei de repartiie D(z) fiind date tabelar (<nexa <); Pana aici toti acesti pasi se recunosc ca fiind aceeasi cu cei de la aplicatia anterioara deoarece este vorba despre acelasi sir de valori pasii ce urmeaz! insa pentru solutionarea temei propuse sunt pasii ce diferentiaza cele doua metode de verificare i anume: ...,( se calculeaza valorile functiei de repartitie experimentale utilizand relatia (-.,-): 7tilizand $xcel vom avea: =S.7$D1'&- =S.7$D1':D15&- > =S.7$D1':D23&+alorile obtinute valori ce vor ocupa in continuare adresele TX.3(TX,1 in cadrul raportului fiind: <e1$*.*!5- <e2$*.111- <e3$*.2),- <e!$*.!(!- <e($*.,*!- <e5$*.))4- <e,$*.44!<e)$1.*** ...1( cu valorile grupate pe intervale se calculeaza diferenta (-.,4)

Fe ( xi ) = f i

Fe ( xi ) F ( xi )

<stfel vom avea: =?1'("1'- =?15("15- > =?23("23+alorile obtinute fiind: :if1$*.*!(- :if2$*.1*4- :if3$*.2,*- :if!$*.**(:if($-2.25!- :if5$-*.1*4- :if,$-*.*((- <e)$*.****1 valori ce vor ocupa in continuare adresele 0X.3(0X,1 in cadrul raportului $xcel. ...2( se determina valoarea maxima a diferentei (-.,5): d e = max Fe ( xi ) F ( xi ) 7tilizand relatia: =7AA$B1':B23& obtinand valoarea: de$*.2,*-

110

)ucrarea -

+aloare ce va ocupa adresa WX,2 in cadrul raportului $xcel (unde adresele W.3(W,1 sunt ocupate de valorile absolute ale diferentei: Fe ( xi ) F ( xi ) ). ...-( pentru nivelul semnificativ .(" (sau risc " ) adoptat (.("@;.6-;@6-L) se scrie relatia (-.,6)
P de = 1 = K() n +aloarea lui I obtinandu(se din tabelele functiei calculate H (<nexa $). %eoarece 6-L se apropie mai mult de valoarea din stanga a intervalului P;.6244( ;.6-;-R vom gasi valoarea I: @1$1.,2*

...3( se calculeaza in continuare valoarea raportului

care utilizand $xcel va fii dat de

relatia (-.1;) =1.52*$;!<9:$1#%21*2&&2 obtinand valoarea: *.15(( ...4( se va face verificarea: de < n <stfel incat daca relatia se verifica se accepta ipoteza concordantei dintre repartitia teoretica i cea observata. 0n caz contrar ipoteza se respinge. 0n cazul nostru avem: d e = 0.270 > = 0.1655 n <stfel ca ipoteza cum ca repartitia teoretica a valorilor studiate ar fi o repartitie normala se respinge (ipoteza care a fost verificata i in cazul anterior utilizand metoda de verificare ,) decizia finala fiind: 3repartitia eCperi@entala nu corespunde unei repartitii nor@ale3. 2. Tema% *asurand rezistenta electrica la o serie de rezistoare s(au gasit urm!toarele valori (in 8Y): ,..2 ..53 ..64 ..54 ,.,. ,.;; ,.21 ..6, ..4, ..4; - sa se verifice ipoteza conform careia datele statistice sunt variabile aleatoare repartizate normal pentru un nivel de incredere de ;.6-; (.("@6-L). 3. &relucrarea rezultatelor% 0n acest caz tinandu(se seama de volumul esantionului n@.; (singura cunoscuta i care poate influenta decizia asupra metodei de verificare adoptata) se va plica ca test de verificare a ipotezei propuse testul *asseJ *. <cest test se aplica in scopul verificarii normalitatii si se prezint! ca o modificare a testului H el fiind adaptat pentru selectii# esantioane de volum n redus (un volum intre 5 si 1, unitati statistice). <plicarea acestei metode de verificare a normalitatii presupune parcurgerea urmatoarelor etape: ...( ordonarea valorilor experimentale xi in ordinea crescatoare ceea ce utilizand optiunile de sortare oferite de $xcel presupune parcurgerea urmatorilor pasi: .( selectati optiunea %ata SortU (%ate Sortare..): ,( selectati din casuta de dialog care se desc/ide optiunea de sortare <scending (=rescator); astfel sirul de valori se va ordona in ordine crescatoare ocupand adresele E2(E.1 din cadrul raportului $xcel vizualizandu(se valorile x min i xmax din volumul de valori.

+erificarea normalitatii repartitiei datelor

...

..,( se calculeaza valoarea mediei aritmetice x respectiv abaterea medie p:tratic: s parcurgand pasii: .( pentru determinarea mediei aritmetice avand formulele (,.6) (,..;):

M [ x] =

xi
i =1

sau

M [ x ] = i =1

ai xi n

utilizand optiunile oferite de softNare(ul $xcel: 0nsert DunctionU(0ntroducere DunctiiU) selectand din caseta de dialog care se desc/ide categoria: Statistical (Statistica) vom avea: =A89:A"9$,B,6:,B,13& +aloarea obtinuta fiind: "/'3$1.4)2 (i ea va corespunde in continuare adresei E.3)(sau pentru calcularea aceleiasi expresii mai puteam scrie: $S6" A!%A13)91* ); ,( pentru determinarea dispersiei avem formula (,.,.):
1 D[ x ] = i =
n

( x i M [ x ] )
n
n

; sau :

1 D[x ] =i =

( xi M [ x ])2 ai n

= ( xi M [ x ])2 f
i= 1

7tilizand $xcel se va aplica functia: =A89D98$,B,6:,B,13&& obtinand valoarea :/'3$ s2$*.1,*+ valoare ce va ocupa in continuare adresa E.4. <ceeasi expresie o mai putem calcula utilizand functiile: =$S.7$;!<9:$$,B,6:,B,13(,B,1'&22&&&*1#1( se calculeaza abaterea standard (abaterea medie patratica) (,.,2):

D[ x ] =

i= 1

( x i M [ x ])2 n

n 1 2 x i M [ x]2 n i =1

=;!<9:$S.7$;!<9:$$,B,6:,B,13(,B,1'&22&21#&2 1*2& sau =S=:/$B15& obtinand valoarea D[ x ] $ s$*.!13 (valoare ce va ocupa adresa E.5). ..1( se normeaza valorile variabilei (-.1.):
i

x x = i s

7nde valorile mediei *PxR i a abaterii

D[ x ] sunt valorile calculate anterior i care se

gasesc la adresa E.3 respectiv E.5 in cadrul raportului $xcel. <stfel vom avea: =$B6(,B,1'&*,B,1%- =$B)(,B,1'&*,B,1%- >=$B13(,B,1'&*,B,1%2 Abtinand valorile: #1$-*.5)3- #2$-*.5(3- #3$*.245- #!$-*.2,1- #($-*.1(*- #5$-*.*24- z,$*.*!!- z)$*.3)3#4$*.((2- #1*$1.*)( valori ce vor ocupa in continuare adresele =2(=.1 in cadrul raportului $xcel. ..2( se determina valoarea frecventelor absolute a0 pentru care utilizand optiunile oferite de $xcel vom parcurge pasii: .( selectati optiunea 0nsert Dunction... (0ntroducere Dunctii); ,( selectati din casuta de dialog care se desc/ide categoria Statistical (Statistic); 1( selectati optiunea =A7KM0D (=ontabilizare conditionata);

112

)ucrarea -

urmand a introduce datele: =C!.N/01$,C,6:,C,132$B6(,B,1'&*,B,1%&&, pentru prima valoare J.; =C!.N/01$,C,6:,C,132$B)(,B,1'&*,B,1%&2 pentru valoarea J,;U. avand: =C!.N/01$,C,6:,C,132$B13(,B,1'&*,B,1%&, pentru ultima valoare J.;. <stfel vom obtine valorile: a1$1- a2$1- a3$1- a!$1- a($1- a5$1- a,$1- a)$1- a4$1- a1*$1 (valori care vor corespunde in continuare adreselor de la %2 la %.1); ..-( verificarea rezultatelor se poate realiza avand formula (,.,):

a
i =1

=n

7tilizand $xcel aceasta va fii scrisa sub forma: =S.7$D6:D13&2 obtinand valoarea .; (adevarat; aceasta valoare corespunzand in continuare adresei %.2. ..3( se calculeaza frecventele relative fi a fiecarei valori Ji utilizand formula (,.1):

fi =

ai ; n

f
i =1

=1

<stfel avem: =D6*,D,16- =D)*,D,16- s.a..m.d pentru fiecare valoare f1+ f2+ ...f1*+alorile obtinute reprezentate tabelar i care vor ocupa in continuare adresele $2($.1 in cadrul protocolului $xcel sunt: f1-f1*$*.1** +erificarea rezultatelor presupune insumarea valorilor frecventelor relative i anume: =S.7$96:913&; valoarea obtinuta fiind 1.** (ceea ce este conform formulei valoarea obtinuta corespunzand in continuare adresei $.2). ..4( se determina frecventa cumulata Dc corespunzatoare fiecarei valori Ji Dc(Ji) (-.1,):

Fe (

i ) = fi 1

=alcularea frecventelor cumulate Di i prezentarea lor tabelara se va realiza utilizand rezultatele anterior obtinute i anume valorile ai i fi i au la baza relatiile (,.2):

#c = a i ;
i =1

Fc =

#c ; n

#d = ai ;
i= n

Fd =

#d ; n

<stfel utilizand functiile $xcel vom avea: =S.7$,D,6&- =S.7$,D,6:D)&-> =S.7$,D,6:D13) pentru <c; =S.7$,D,6&*,D,16- =S.7$,D,6:D)&* ,D,16-> =S.7$,D,6:D13&* ,D,16 pentru Dc; +alorile obtinute vor corespunde adreselor: de la D2 la D.1 pentru < c i de la '2 la '.1 pentru Dc acestea fiind: 71$1- 72$2- 73$3- 7!$!- 7($(- 75$5- 7,$,- 7)$)- 74$4- 71*$1*+ pentru <c(Ji) si <c1$*.1- <c2$*.2- <c3$*.3- <c!$*.!- <c($*.(- <c5$*.5- <c,$*.,- <c)$*.)- <c4$*.4<c1*$1.**+ pentru Dc(Ji); ..5( se determina functia teoretica de repartitie D(Ji) cu a&utorul tabelelor )aplace (<nexa <) acestea fiind: <#1$*.2!)3- <#2$*.25!3- <#3$*.3)21- <#!$*.3435- <#($*.!!*!- <#5$*.!))*- <#,$*.(15*<#)$*.5!)*- <#4$*.,*)*- <#1*$*.)521+alori care in cadrul raportului $xcel vor corespunde adreselor T2(T.1. ..6( se determina diferenta (-.11): d = Fe ( i ) F ( i ) 7tilizand $xcel relatia anterioara devine:

+erificarea normalitatii repartitiei datelor

..1

=07ABS$"6(?6&- =07ABS$")(?)&- >.. =07ABS$"13(?13&obtinand valorile: d1$*.1!)3- d2$*.*5!3- d3$*.*)21- d!$*.**5!- d($*.*(45- d5$*.112*- d,$*.1)!*d)$*.1(2*- d4$*.142*- d1*$*.13,4+alori care vor ocupa adresele 02(0.1 in cadrul raportului $xcel. ...;( se alege valoarea superioara: ds$sup d+ relatie care utilizand $xcel este: =7AA$06: 013) valoarea obtinuta fiind: d ma'$*.142* ....(din tabelul functiei calculate *asseJ se alege valoarea statistica d g corespunzatoare valorii n i valorii nivelului de semnificatie " adoptat (.("@6-L@;.6-;;; "@;.;-;;). +aloare gasita este: dg$ d1*+ *.*( $*.13*...,( se verifica ipoteza (-.12):
ds d!

0n cazul nostru avand valorile anterioare pentru parametrii studiati vom obtine: d ma'$*.142* ? dg$ d1*+ *.*( $*.13*se acepta ipoteza ca: 3repartitia eCperi@entala nu corespunde unei repartitii nor@ale3.

D. ;rezentarea rezultatelor:
Rezultatele vor fi prezentate sub forma unui raport (vezi <nexa-) ce cuprinde: - reprezentarea datelor primare sirul de date; - reprezentarea tabelara a datelor grupate i a indicatorilor statistici; - reprezentarea tabelara a valorilor parametrilor functiilor de repartitie; - trasarea /istogramelor repartitiei in frecventelor (relative fi i cumulate Dc); - verificarea ipotezei i prezentarea deciziei;

9. BiblioDrafie:
P.R P,R P1R P2R P-R P3R Eulgaru *. Eolboaca ). 8ngineria calitatii."angementul calitatii+ statistica i control+ nasurari in 3:+ <lma *ater =lu&(Kapoca ,;;. 0SEK 641(5-.-1(;(; %eaconescu <. %eaconescu M. "anagementul calitatii. 7plicaBii+ $ditura Amnia 7ni S.<.S.M. Erasov ,;;. 0SEK 641(6245(3-(2 =at/J H. C0DCE pentru .indoFs tm 4( in (*3 imagini+ Meora Eucuresti .666 0SEK 641(3;.(2-4(3 Dait/e S. "icrosoft Gffice 4, &rofessional 5in 1+ Meora Eucuresti .665 0SEK 641( 3;.(6;4(. Manasescu 0 Dontrolul statistic al proceselor si produselor+ Cditura didactica si pedagogica+ Aucuresti+ 14),. VVV Dolectie de standarde+ "anagementul i asigurarea calitatii+ $ditura te/nica Eucuresti .663

S-ar putea să vă placă și