Sunteți pe pagina 1din 20

REPARTITIA IN FRECVENTA A DATELOR REPREZENTAREA SI PRELUCRAREA PRIMARA A SIRURILOR DE DATE

A. Scopul lucrarii:
Se urmareste realizarea urmatoarelor obiective: - prezentarea repartitiilor empirice; - prezentarea indicatorilor statistici; - prezentarea notiunilor generale legate de utilizarea formulelor i functiilor utilizand software-ul Excel; - prezentarea unei aplicaii;

B. Notiuni de baza:
Masurarea oricarei marimi se face cu erori, ceea ce necesita efectuarea de mai multe ori a masurarii i prelucrarea ulterioara a rezultatelor, cu metodele statisticii matematice, in vederea determinarii cat mai apropiate de realitate a valorii masurate. O populaie poate fi omogen (statistica) dac elementele componente sunt de acelai tip ( exemplu: un lot de contactoare cu aceleasi date nominale, executate din acelasi material, etc.) sau neomogen, la care elementele componente sunt de tipuri diferite. Metodele statistice se aplic numai populaiilor omogene (statistice). In funcie de numrul indivizilor statistici populaia statistic poate fi finit sau infinit. Trasatura comuna a populatiei statistice, caracterizata prin valorile particulare corespunzatoare fiecrui individ, se numeste caracteristica i se noteaza cu litera mare (A, D, X). Caracteristica poarta denumirea de variabila i poate fi: - cantitativa: exprimata numeric prin valorile masurate; aceasta putand fii la randul sau: discreta (daca capata valori izolate, apartinand multimii numerelor intregi sau rationale, spre exemplu: numarul pieselor defecte dintr-un lot) sau continua (daca intr-un interval dat, capata orice valoare reala pentru caracteristica); - calitativa sau atributiva: exprimata prin aprecieri ca: bun sau defect, satisfacator/ nesatisfacator; O populatie statistica poate avea una sau mai multe caracteristici. Daca informatiile referitoare la caracteristica populatiei statistice sunt luate de la fiecare component, se efectueaza o cercetare completa (unitara) sau enumerare completa; in cazul cand informatiile se refera numai la o parte din indivizii populatiei, se face o cercetare selectiva, indivizii de la care se obtin informatiile formand selectia sau esantionul. Un element al populaiei statistice se numeste unitate statistica sau individ statistic. Colectarea datelor referitoare la caracteristica unei populatii statistice urmareste stabilirea valorii care poate caracteriza un individ al populatiei sau are ca scop formarea unor concluzii din datele observate. Statistica descriptiva reprezinta forma cea mai simpla de analiza a caracteristicii unei populatii i include colectarea de date, prezentarea lor sub forma de tabele, intocmirea unor reprezentari grafice i stabilirea indicatorilor statistici.

42

Lucrarea 2

1. Repartitii empirice/ experimentale 1.1 Prezentarea tabelara a datelor Tabelele trebuie n aa fel ntocmite nct s permit o interpretare direct i uoar fr a mai necesita texte aplicative suplimentare (vezi Lucrarea1, Introducerea in programul Excel. Achizitii de date i reprezentari grafice). Primul tabel care se ntocmete este tabelul datelor primare n care sunt trecute n ordinea msurrii caracteristicile cercetate. Aceleai valori aranjate n ordine cresctoare astfel ca ntre dou valori consecutive s existe relaia (2.1) ( x i < x i + 1) formeaz tabelul valorilor ordonate, totalitatea valorilor unei caracteristici scrise ntr-o anumit ordine (cresctoare sau descresctoare) formand un ir statistic. 1.2 Frecvente i intervale 1.2.1 Gruparea termenilor Valorile unei caracteristici se pot prezenta tabelat i sub forma mai restransa efectuand o grupare simpla sau pe intervale. Gruparea simpla, posibila in anumite cazuri pentru caracteristicile discrete, reprezinta un tabel continand valorile distincte i numarul respectiv de aparitii. Un astfel de tabel poart denumirea de tabel cu simpl intrare. Adoptarea unui numar de intervale disjuncte (m) i gruparea valorilor pe aceste intervale, conduc de asemenea, la intocmirea unui tabel cu clase (intervale) de grupare frecvent utilizat. Numarul unitatilor (elementelor) cu aceasi valoare sau apartinand aceluiasi interval reprezinta frecventa absoluta a1, a2, am, suma totala a frecventelor fiind egala cu numarul unitatilor cercetate n, (si poarta denumirea de volumul populatiei statistice) : m (2.2)

a
i =1

=n

Raportul dintre frecventa absoluta i numarul total de unitati statistice se numeste frecventa relativa; suma totala a frecventelor relative fiind egala cu unitatea: m (2.3) ai

fi =

f
i =1

=1

In multe cazuri este necesar sa se cunoasca numarul total de unitati statistice pana la o anumita valoare a caracteristicii sau numarul de la o anumita valoare in sus. Acest numar reprezinta frecventa cumulata, F; aceasta poate fii relativa sau absoluta, dupa cum se raporteaza sau nu la numarul total de elemente n, i de asemenea crescatoare (daca reprezinta suma frecventelor pana la valoarea x inclusiv) sau descrescatoare (daca reprezinta suma frecventelor de la valoarea x de asemenea inclusiv). j i (2.4) A A

Ac = a i ;
i =1

Fc =

Ad = ai ;
i =n

Fd =

1.2.2 Intervale de grupare Marimea intervalelor (claselor) de grupare se ia, in general egala, cu exeptia intervalelor extreme, pentru care uneori se pot adopta valori diferite, existand relatiile: 1. Relaia lui H.A.Sturges (cea mai des utilizata): (2.5) m = 1 + 3,322 lgn unde n reprezint numrul total al datelor de observaie. 2. Relaia lui H.B.Mann i A. Wald pentru n>100:

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date


1

43

1 5 m = 4 (n 1) 4
3. Prin adoptarea numrului ntreg dat de relaia:

(2.6)

m= n

(2.7)

In general s-a constatat c pentru n<250 este suficient gruparea n zece clase. Dac u i v sunt limitele intervalului de grupare intervalul se consider totdeauna semi-inchis, fie (u,v] fie [u,v). 1.3 Diagramele repartitiei Graficele cel mai frecvent folosite sunt: histogramele de repartitie a frecventelor (simple sau cumulate), diagramele cu bare, poligonul frecvenelor i diagramele circulare, (vezi Lucrarea1, Introducerea in programul Excel. Achizitii de date i reprezentari grafice). 1.4 Indicatorii statistici Din studiul unei histograme se poate observa c datele experimentale prezint dou tendine: - o tendinta de localizare, cand datele se concentreaz n jurul unei anumite valori; - o tendinta de mprtiere, cand datele rezultate n urma msurtorii se vor ncadra totdeauna intr-un interval; (exista populatii la care localizarea se face in jurul aceleiasi valori, dar care prezint imprastieri diferite). Se constata de asemenea ca repartitia frecventelor poate fii simetrica sau asimetrica in raport cu pozitia de localizare. Graficele de frecventa prezint aceste aspecte numai calitativ, o analiza cantitativa care sa permita o comparatie a doua sau mai mullte repartitii experimentale, a tendintelor de localizare i de variaie/ imprastiere se poate efectua numai cu ajutorul unor indicatori statistici determinati de valorile caracteristicilor respective. Specific tendinei datelor indicatorii statistici se clasific n: - indicatori de localizare; - indicatori de mprtiere. 1.4.1 Indicatorii de localizare (de pozitie) Indicatorul de localizare este o valoare teoretic, care poate s nu existe practic printre valorile msurate, el indicnd valoarea spre care tind s se grupeze datele reale. Indicatorul de baz al tendinei de localizare l reprezint media care poate fi calculat n mai multe feluri. 1.4.1.1 Media aritmetic. Considernd valorile unei caracteristici x: x1, x2, ...,xn, media aritmetic este dat de relaia:

M [ x ] = i =1 n

xi

(2.9)

Media aritmetic se noteaz n general cu M[x], pentru loturi de fabricaie media fiind notat cu iar pentru eantioane cu x . Dac x1, x2, ...,xn se repet, respectiv cu frecvenele absolute a1, a2, ...,an, atunci media aritmetic este:

M [ x ] = i =1

ai xi n

(2.10)

1.4..1.2. Media geometric. Cu valorile x1, x2, ...,xn, media geometric este:

44
n

Lucrarea 2

M g = n x1 x 2 ... x n = n x i
i =1

(2.11)

1.4.1.3. Media armonic. Pentru valorile x1, x2, ...,xn, media armonic se obine cu relaia (2.12) n

Ma=

i =1 x i

1.4.1.4. Media ptratic. Pentru aceleai valori media ptratic este:

Mp =

x
i =1

2 i

(2.13)

1.4.1.5. Mediana. Valoarea caracteristicii care ocup locul central n irul ordonat de valori, mprind caracteristica n dou grupe egale ca numr: Dac irul conine un numr impar de valori (n=2k+1) valoarea medianei este dat de valoarea unitii statistice de rang (n+1)/2, adic: (2.14) M e = X n +1
2

In cazul unui numr par de valori mediana este egal cu media aritmetic a celor dou valori centrale:

Me =

x( n / 2 ) + x( n 2 + 1 ) 2

(2.15)

Dac valorile sunt grupate pe clase intervalul care conine elementul median se numete interval median sau clas median. Mediana se determin mult mai uor dect media i nu necesit nici un calcul. Din cauza uurinei de determinare mediana este folosit frecvent n industrie la controlul statistic al fabricaiei. Mediana este preferat uneori mediei fiind mai puin afectat de valorile extreme, fiind totodata mult mai stabil la fluctuaiile de selecie dect media aritmetic. 1.4..1.6. Mod sau modal. Este valoarea caracteristicii corespunztoare celei mai mari frecvene. In cazul n care repartiia frecvenelor este reprezentat de o curb, moda corespunde valorii maxime a caracteristicii. Dup cum repartiia experimental are unul, dou sau mai multe maxime, se numete unimodal, bimodal, sau polimodal. Dac valorile sunt grupate pe clase, intervalul care conine elementul median se numete interval median sau clas median. 1.4.1.7. Valoarea central. Ca indicator al localizrii se utilizeaz i media extremelor valorilor caracteristicii:

Xc =

X max + X min 2

(2.16)

Valoarea central se poate referi i la un interval de grupare de ordinul i care reprezint media valorilor limit (inferior i superior) ale intervalului:

X ci =

sup X inf i + xi 2

(2.17)

Proprieti i observaii referitoare la indicatorii statistici de localizare - Pentru repartiii unimodale simetrice, abaterea medianei fa de media aritmetic este egal cu o treime din abaterea modului fa de media aritmetic:

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date

45

xMe =

xMo 3

(2.18)

- Mediile aritmetic i ptratic sunt influenate de valorile mari ale seriei. - Mediile geometric i armonic sunt influenate de valorile mici i reduc din influena valorilor mari. - Intre cei patru indicatori ai mediei exist relaia: (2.19) M <M <x<M
a g p

- Mediana nu este influenat de valorile extreme. - Dintre indicatoriii de localizare cel mai important este media aritmetica. 1.4..2 Indicatori de mprtiere Variatia (imprastierea) unei caracteristici poate fi redata cu ajutorul unuia din urmatorii indicatori: 1.4.2.1 Dispersia: Notat n general cu D[X], expresia dispersiei este:

D[x ] = i = 1

(x i M [ x ] ) n

(2.20)

Pentru loturi de fabricaie dispersia este notat cu 2 iar pentru eantioane cu s2. Dac x1, x2, ...,xn se repet, respectiv cu frecvenele absolute a1, a2, ...,an, atunci dispersia este:

D[x ] = i = 1

2 ( x i M [ x ]) a i

= ( x i M [ x ]) 2 f i
i =1

(2.21)

In cazul estimrii dispersiei populaiei cu ajutorul unei selecii, dispersia de selecie se ajusteaz cu un factor de corecie n/(n-1). In acest caz dispersia se numete dispersie corectat :

n D[x ] = i = 1 DC [ x ] = n 1

( x i M [ x ]) n 1

(2.22)

1.4.2.2. Abaterea medie ptratic. Acest indicator se obine din rdcina ptrat a dispersiei i se noteaz cu pentru lot i cu s pentru eantion.

D[x ] =

i =1

( x i M [ x ]) n

1 n 2 xi M [ x ] 2 n i =1
n

(2.23)

Considernd frecvenele absolute sau relative expresiile abaterii medii ptratice devin:

D[x ] =

i =1

2 ( x i M [ x ]) a i

n
n i =1

i =1

x i2 a i n
n

M [ x]2

(2.24)

D[x ] =

2 (x i M [ x ] ) f i =

i =1

2 x i2 f i M [ x ]

In cazul n care abaterea medie ptratic se estimeaz cu ajutorul unei selecii rezult:
xi x i =1 n 1 n 2

(2.25)

s=

46

Lucrarea 2

Abaterea unei caracteristici poate fi considerat n raport cu orice constant. In general abaterea se ia in raport cu media aritmetic i-n acest caz se numete abatere standard. 1.4.2.3. Amplitudinea. Este un indicator statistic definit de diferena valorilor extreme. (2.26) W = x max x min In mod similar se poate defini i amplitudinea clasei, w, sau a intervalului de grupare, care reprezint diferena ntre valorile extreme ale intervalului. 1.4.2.4. Intervalul intercuartilic. Cuartilele sunt definite de trei valori Q1, Q2, Q3, care mpart amplitudinea n patru intervale astfel ca frecvenele relative ale intervalelor s fie egale ntre ele. Rezult c 25% din numrul msurtorilor sunt inferioare cuartilei Q1, 25% din numrul observaiilor sunt superioare cuartilei Q3, iar cuartila Q2 este egal cu mediana Me. Intervalul intercuartilic este definit de diferena dintre prima i ultima cuartil: (2.27) I Q = Q 3 Q1 1.4.2.5. Coeficientul de variaie intercuartilic. Este definit de raportul:

q=

Q 3 Q1 Q 3 Q1 = Q2 Me

(2.28)

1.4.2.6 Coeficientul de variaie. Reprezint valoarea abaterii standard raportat la media aritmetic.

Cv =

D[x ] M [ x]

sau

Cv =

s x

(2.29)

Acest coeficient poate fi exprimat i n procente, relaiile prezentate putand fi utilizate i n cazul valorilor grupate pe clase. Proprieti i observaii referitoare la indicatorii de variaie - Suma algebric a abaterilor fa de media aritmetic este egal cu zero. Notnd abaterea valorii de ordinul i n raport cu media aritmetic: (2.30) =x x
i i

Media aritmetic a abaterilor este:

=
Dac:

n x 1 n 1 n 1 n = xx=0 i = ( xi x ) = xi n n i =1 n i =1 n i =1
rezult de asemenea i:

(2.31)

1 n i = 0 n i =1

i =1

=0

Deoarece suma erorilor msurtorilor fa de media aritmetic este zero, pentru aprecierea erorii totale este necesar ca aceste abateri s fie ridicate la ptrat i apoi nsumate, cea ce ne conduce la formula dispersiei. In consecin dintre indicatorii de mprtiere dispersia i abaterea standard reprezint cei mai buni estimatori ai dispersiei. - Suma abaterilor ptratice are valoarea minim atunci cnd sunt calculate n raport cu media aritmetic. Considernd suma abaterilor ptratice n raport cu valoarea arbitrar x0.
i =1 2 ( x i x0 ) = ( x i x )( x0 x ) n

[ i =1
n
2

]2
n 2 i =1

(2.32)

Dezvoltnd termenul din partea dreapt se obine:

[ i =1
n

( xi x) ( x0 x) = ( xi x) 2 ( x0 x) ( xi x) + ( x0 x)
i =1 i =1

(2.33)

Conform celor aratate mai sus (suma algebrica a abaterilor fat de media aritmetic), vom obtine:

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date


2 ( x i x0 ) = ( x i x ) + n ( x0 x ) i =1 n n 2 2

47

i =1

(2.34)

Rezult:
i =1 2 ( x i x0 ) > ( x i x ) i =1 n n 2

(2.35) (2.36)

Deci suma abaterii ptratice este minim dac:

x0 = x

- Abaterile n raport cu o constant oarecare x0 sunt folosite uneori pentru simplificarea unor calcule. Astfel valoarea medie a caracteristicii se obine mai uor dac se calculeaz suma abaterilor xi =xi-x0 adoptndu-se astfel ordinul de mrime cel mai convenabil:

x' =
de unde rezulta:

1 n 1 n 1 n x' i = ( x i x0 ) = x0 x0 = x x0 n i =1 n i =1 n i =1 x = x0 + 1 n x' i = x0 x' n i =1

(2.37)

(2.38)

Dispersia i abaterea standard sunt cei mai utilizai indicatori de variaie. 1.4.3. Momente Pentru stabilirea formei (alura) funciei de repartiie experimentale i a unor particulariti a acesteia s-a introdus noiunea de moment, intre acestia i indicatorii de baz existand o strns legtur. Momentele se mpart n dou categorii: - momente absolute de ordinul k la care valorile sunt considerate n raport cu originea; - momente centrate de ordinul k (la care valorile sunt exprimate n raport cu o valoare arbitrar) 1.4.3.1 Moment absolut de ordinul k (k>1) Prin definiie momentul absolut de ordinul k (k>1), este dat de relaia:

mk =

1 n k xi n i =1

(2.39)

unde x1, x2,...,xn, sunt valorile msurate, ale caracteristicii x. Momentul absolut de ordinul k poate fi exprimat i cu ajutorul frecvenelor absolute sau relative.

mk =

n 1 n k x a = xik f i i i n i =1 i =1

(2.40)

Se observ c momentul absolut de ordinul 1 reprezint media aritmetic:

m1 =

1 n x = x i n i =1

(2.41)

De asemenea momentul absolut de ordinul 2 este egal cu ptratul mediei ptratice.

m2 =

1 n 2 xi = M p2 n i =1

(2.42)

1.4.3.2 Momentul centrat de ordinul k (k>1) Prin definiie, momentul centrat de ordinul k (k>1), n raport cu o origine arbitrar este:

M k =
sau n funcie de frecven:

1 n k ( x i ) n i =1

(2.43)

48
n 1 n k k ( x i ) a i = ( x i ) f i n i =1 i =1

Lucrarea 2

M k =

(2.44)

Momentul centrat de ordinul k n raport cu media aritmetic se noteaz cu Mk i este dat de expresia:

Mk =
sau:

1 n k ( xi x ) n i =1

(2.45)

Mk =

n 1 n k k ( xi x ) ai = ( xi x ) f i n i =1 i =1

(2.46)

Momentul centrat de ordinul 2 este egal cu dispersia:

M2=

1 n 2 ( x i x ) = D[x] n i =1

(2.47)

1.4.3.3 Relaii intre momentele absolute i momentele centrate Intre momentele absolute i cele centrate se pot scrie urmtoarele relaii:

M1=0

2 = D[x ] M 2 = m 2 m1 3 M 3 = m 3 3 m1 m 2 + 2 m1 M 4 = m 4 4 m1 m 3 + 6 m1 m 2 3 m1

(2.48)

1.4.3.4 Corecia momentelor In general gruparea valorilor pe clase conduce la anumite erori, deoarece n calculele indicatorilor statistici frecvena este considerat corespunztoare valorii centrale a intervalului de grupare. Aceast consideraie presupune o repartiie uniform a datelor n interiorul clasei, lucru rar ntlnit. Corectarea valorilor din acest punct de vedere este cunoscut sub numele de corecia Sheppard. Media nu necesit nici o corecie deoarece:

x=

1 n 1 n xi = + ( xi ) n i =1 n i =1

(2.49)

Nici momentul absolut de ordinul 3 nu necesit corecii. In cazul momentelor absolute de ordinul 2 i 4 se realizeaz corectiile, conform relaiilor:

1 2 12 1 7 4 m4 = m4 m 2 + 2 240 m2 = m2

(2.50)

unde reprezint amplitudinea intervalului de grupare. 1.4.3.5 Indicatori pentru asimetrie i aplatizare Exist diferite moduri prin care se poate aprecia asimetria unei repartiii, cel mai utilizat fiind coeficientul de asimetrie (2.51) i coeficientul de exces (2.52) (care se refera la gradul de ascutire/ aplatizare a unei repartitii), indicatori obtinuti cu ajutorul momentelor, exprimati de relaiile:
3 = 1= M 3/ 2

M3 D[x ]
D[x ]
3

M2

(2.51)

3 = M 42 3 2= M4 2 M2

(2.52)

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date

49

1>0
Repartitie asimetrica la dreapta

1=0
Repartitie simetrica

1<0
Repartitie asimetrica la stanga

Fig.2.1: Indicarea tipului de asimetrie de catre coeficientul de asimetrie

; simetria repartitiei

Excesul sau aplatizarea se exprim avnd ca etalon de referin repartiia normal la care 2=0. Pentru 2<0 repartiia este mai aplatizat dect cea normal iar pentru 2>0 repartiia este mai ascuit, (fig. 2.2). Repartiiile experimentale pot avea unul sau mai multe maxime. Repartiia cu un singur maxim se numete repartiie unimodal; dac repartiia are mai multe maxime repartiia se numete repartiie polimodal, (fig. 2.3).

2<0
Repartitie aplatizata

2=0
Repartitie normala

2>0
Repartitie ascutita

Fig.2.2: Indicarea excesului sau a aplatizarii repartitiei de catre coeficientul de asimetrie

Se pot ntlni repartiii la care n loc de un maxim s apar un minim, in acest caz repartiia numindu-se repartiie antimodal, (fig. 2.3). Un caz particular de repartiie antimodal l reprezint repartiia uniform la care frecvenele rmn constante.

Repartitie unimodala

Repartitie bimodala

Repartitie antimodala

Fig.2.3: Tipuri de repartitii 2. Utilizarea programului Excel pentru calculul indicatorilor Pentru efectuarea calculelor necesare prelucrarii datelor statistice puteti utiliza formulele i functiile oferite de software-ul de specialitate Excel. Formulele sunt folosite in foile de calcul pentru efectuarea calculelor cu cifrele introduse (sau generate), putand fii efectuate operatii de adunare, scadere, inmultire, impartire, etc., folosind valorile din diferite celule. Formulele sunt formate de regula din una sau mai multe adrese de celule sau valori i un operator matematic cum ar fii: + (adunare), - (scadere), * (inmultire), /(impartire), s.a.m.d. Orice formula este formata din urmatoarele elemente:

50

Lucrarea 2

semnul= , ce arata ca ceea ce urmeaz este o formula; argumentul 1 (cum ar fii: A1), operatorul matematic; argumentul 2 (cum ar fii: B1), argumentele indicand adresele celulelor cu valorile afectate de formula. Cand folositi formulele pentru a efectua anumite calcule, Excel va recalcula automat rezultatul la orice modificare a valorilor numerice care participa la respectivul calcul. Formulele pot fi introduse in doua moduri: tastand formula direct in celula sau indicand celulele cu care formula va opera. Astfel:

1234-

Operatorul + *
4 1

Operatia
Adunare Scadere Inmultire Impartire Calcul procentual Ridicare la putere

/ % ^

Fig.2.4: Introducerea unei formule prin tastare/ indicare; operatori matematici

In cazul introducerii unei formule prin tastare avem: 1- selectati celula in care va apare formula; 2- tastati semnul = (egal), pentru a ncepe introducerea formulei; 3- introduceti coordonatele primei celule; introduceti operatorul; 4- introduceti operatorul; 5- introduceti coordonatele urmatoarei celule implicate in calcul; 6- repetati etapele 4 i 5, de cate ori este necesar; 7- apasat tasta Enter, la terminarea operatiei. La crearea formulelor este recomandata introducerea datelor necesare in foaia de calcul, referirea celulelor respectivein cadrul relaiilor de definitie a formulelor facandu-se ulterior; in acest mod la orice modificare a valorilor numerice din celule, Excel va recalcula imediat rezultatul. In cazul introducerii unei formule prin indicare, diferenta fata de cazul anterior apare in momentul introducerii coordonatelor celulelor implicate in calcul (3 , 5), i anume in acest caz celulele vor fi selectat prin executia dublu clic asupra celulelor implicate. Operatorii matematici sunt prezentati in figura 2.1, dreapta, ordinea efecturii operaiilor fiind: 1- operatiile dintre paranteze 2- ridicare la putere 3- inmultiri i impartiri 4- adunari i scaderi. Observatie: puteti sa obtineti suma unui grup de celule i selectand pur i simplu celulelel respective i citind rezultatul de pe bara de stare; puteti sa aflati astfel i media, valoarea minima sau cea maxima, i numarul celulelor dintr-un domeniu, pentru aceasta executand

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date

51

clic cu butonul din dreapta pe bara de stare i selectati optiunea dorita din meniul de comenzi rapide care apare pe ecran (este utilizarea functiei AutoCalculate (Auto-calculare)). In mod normal, Excel nu afiseaza in celula formula propriu-zisa, ci rezultatul calculului; puteti totusi sa vedeti formula selectand celula i citind-o pe bara cu formule. Dar in cazul unei revizuiri a formulelor dintr-o foaie de calcul mai mare, ar fi mai simplu daca le-ati putea vedea pe toate deodata; pentru aceasta este necesar parcurgerea urmatorilor pasi: 1- selectati optiunea Tools, Options..( Instrumente, Optiuni..); 2- selectati in caseta de dialog care se deschide titlul Wiew (Afisare); 3- in sectiunea Wiew Options (Optiunile afisarii) executati clic in caseta de validare Formulas (Formule) pentru a o selecta; 4- executati clic asupra butonului ok. In cazul copierii formulelor (utilizand optiunile Copy i Paste, ), acestea sunt adaptate pentru a corespunde pozitiei celulei in care va fi copiata (de exemplu: daca copiati formula =C2+C3 din celula C4 in celula D4, aceasta este adaptata pentru coloana D, devenind =D2+D3). De asemenea, in cazul copierii unei formule dintr-o pagina de calcul in alta, Excel adapteaza refeintele celulei din formule in functie de noua pozitie in foaia de calcul. Daca doriti ca referintele sa nu fie modificate atunci cand copiati formulele, veti lucra cu referine absolute. Observatie: O referint absoluta este referint la o celula dintr-o formula care nu se schimba atunci cand formula este copiata in alta parte. O referint relativa este o refeinta la o celula care este adaptata atunci cand este copiata. Pentru a face ca o refeinta la o celula dintr-o formula sa fie absoluta, trebuie sa-I adaugati simbolul dolarului ($) inaintea literei i a numrului care reprezinta adresa celulei (de exemplu: =B8/$B$10). De asemenea utilizarea tastei F4 permite folosirea coordonatelor absolute pentru indicarea celulei, i anume: 1- selectati celula in care va apare formula; 2- tastati semnul = (egal) pentru a ncepe introducerea formulei; 3- introduceti operatorul; 4- executati clic asupra urmatoarei celule imp-licate in calcul; 5- apasati tasta F4 (Coordonate absolute); 6- apasati tasta Enter. O alta observatie se poate referi la schimbarea parametrilor de calcul, deoarece Excel recalculeaza formulele din foaia de calcul de fiecare data cand editati o valoare intr-o celula. Intr-o foaie de calcul mare este mai bine insa, ca Excel sa nu recalculeze pana cand nu faceti toate modificrile (de exemplu: daca introduceti foarte multe modificari intr-o foaie de calcul care contine multe formule, puteti sa micsorati timpul de reactie trecand de la recalcularea automata la cea manuala). Pentru aceasta este necesara parcurgerea urmatorilor pasi: 1- selectati optiunea Tools, Options..( Instrumente, Optiuni..); 2- selectati in caseta de dialog care se deschide titlul Calculation (Calculare); 3- selectati una din urmtoarele optiuni: - Automatic (optiune prestabilita, ea recalculand intregul registru de calcul, de fiecare data cand editati sau introduceti o formula); - Automatic except Tables (recalculeaza automat totul, mai puin formulelel din tabele); - Manual (aceasta optiune cerand programului sa recalculeza numei la comanda; pentru a recalcula apasati tasta F9 sau selectati optiunea Tools, Options, Calculation (Instrumente, Optiuni, Calculare) i executati clic asupra butonului Calc Now (calculeaza

52

Lucrarea 2

acum). Cand este selectata aceasta optiune puteti sa dezactivati sau sa activati optiunea Recalculate Before Save (Recalculare inaintea salvarii)). 4- executati clic asupra butonului ok. Functiile sunt formule complexe preformate, folosite pentru executarea unei serii de operatii cu un grup specificat de valori (de exemplu, pentru a calcula suma unei serii de numere din celulele A1-H1, puteti folosii functia =SUM (A1:H1) in loc sa introduceti formula =A1+B1+C1+H1). Functiile pot folosi referine la domenii de celule, denumirei de domenii sau valori numerice. Orice functie este formata din urmtoarele trei elemente: 5- semnul= arata ca ceea ce urmeaz este o functie; 6- denumirea functiei (de exemplu: SUM), arata ce operaie va fii efectuata; 7- argumentul (cum ar fii: (A1:H1)), indica adresele celulelor cu valorile afectate de functie; argumentul este adeseori un domeniu de celule, dar poate fi i mult mai complex;

3 4

1 6
Fig.2.5: Introducerea unei functii intr-o celula; insumarea continutului unui rand/ coloana utilizand comanda AutoSum (Insumare automata)

Astfel pentru introducerea unei functii intr-o celula avem: 1- selectati celula in care doriti sa introduceti formula; 2- tastati semnul = (egal) pentru a ncepe introducerea functiei; 3- introduceti numele functiei urmat de o paranteza deschisa (exemplu: functia AVERAGEMedia aritmetica); 4- selectati grupul de celule; 5- apasati tasta Enter. Insumarea unui rand sau al unei coloane utilizand comanda AutoSum (Insumare automata) presupune: 6- selectati o celula situata mai jos sau la dreapta fata de sirul valorilor pe care doriti sa le insumati; 7- executati clic asupra butonului AutoSum (Insumare automata); 8- apasati tasta Enter. Daca nu sunteti sigur de modul in care opereaz o anumita functie, facilitatea Function Wizard (Asistent pentru functii) va poate ghida in procesul introducerii acesteia, pasii parcursi (prezentati in figura 2.6) fiind: 1- executati dublu clic asupra celulei in care doriti sa apara functia;

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date

53

2- executati clic asupra butonului Function Wizard (Asistent pentru functii), sau alegeti optiunile Insert, Function (Introducere, Functii..). ; 3- selectati categoria; 4- selectati functia; 5- executati clic asupra butonului ok; 6- in casuta de dialog care s-a deschis, introduceti argumentele functiei; 7- cititi informatiile referitoare la functia aleasa; 8- executai clic asupra butonului ok; 9- apasati tasta Enter pentru vizualizarea rezultatului. 2 6 7 4 8

1
Fig.2.6: Utilizarea facilitatii Function Wizard (Asistent pentru functii)

Cand folositi in comun cu alti utilizatori o foaie de calcul sau daca datele utiilizate de catre formula se modifica periodic, aveti posibilitatea indicarii naturii continutului unei celule prin intermediul unei note descriptiv-explicative, atasata fiecarei celule in parte, pentru aceasta fiind necesari parcurgerea urmatorilor pasi: 1- selectati celula careia doriti sa-i atasati o nota explicativa; 2- selectati optiunea Insert, Comment.. (Introducere, Comentariu explicativ); 3- in casuta de dialog care s-a deschis, introduceti textul notei explicative; Afisarea notei explicative presupune pozitionarea indicatorului mouse-ului pe celula (apare textul din nota explicativa); Inlaturarea unei note se realizeaz prin selectarea acesteia i executia clic asupra butonului Delete (Stergere).

C. Desfasurarea lucrarii:
1. Tema: Masurand rezistenta la rupere a unui material se efectueaza o serie de masuratori obtinandu-se urmtoarele valori (in daN): 164, 169, 176, 172, 167, 167, 179, 176, 189, 181, 184, 172, 172, 174, 169, 174, 176, 174. - sa se ordoneze valorile i sa se intocmeasca tabelul datelor grupate; - sa se reprezinte histograma repartitiei frecventelor relative (simple); - sa se reprezinte histograma repartitiei frecventelor cumulate; - sa se determine mediile: aritmetica, geometrica, armonica i patratica i sa se stabileasca succesiunea acestora; - sa se determine mediana, moda i valoarea centrala; - sa se determine dispersia, abaterea standard i amplitudinea. 2. Prelucrarea rezultatelor:

54

Lucrarea 2

Pe baza relatiilor prezentate in lucrare vom determina: 1.1- sortarea valorilor sirului; determinarea valorilor de minim, xmin i a celor de maxim, xmax, utilizand optiunile de sortare (Sort) oferite de Excel, parcurgand pasii: 1- selectati optiunea Data, Sort... (Date, Sortare); 2- selectati din casuta de dialog care se deschide optiunea de sortare Ascending (Crescator); astfel pe prima pozitie/celula a sirului se va vizualiza valoarea de minim, xmin , iar pe ultima pozitie/celula valoarea de maxim, xmax , a sirului. In cazul nostru: xmin = 164, iar xmax = 189; 1.2- calcularea numrului de clase m, utilizand formula (2.5);

m = 1 + 3,322 lgn
Utilizand functiile Excel, aceasta formula va fi scrisa in celula selectata sub forma: =1+3.322*LOG10(18) Obtinand valoarea: m=5.170015; Fiind necesar un numar intreg de clase, se adopta un numar de 6 clase, astfel ca: m=6 este valoarea numrului de clase aproximat. 1.3- calcularea amplitudinii W, utilizand formula (2.26);

W = x max x min
Avand valorile deja calculate pentru xmin si xmax (vezi punctul 1.1), valoarea obtinuta utilizand functiile Excel (unde adresele de la A1 pana la A18 reprezinta valorile sirului), este: =(A1-A18) rezultand: W=25 1.4- determinarea mrimii unui sub-interval, utilizand formula:

d=

W x max x min = m m

(2.53)

Utilizand Excel, valoarea obtinuta este: =B3/C1 sau =25/6 rezultand: d=4.166667 Unde, adresa B3 corespunde valorii amplitudinii, iar C1 valorii numrului de clase aproximat; valoarea sub-intervalului obtinut va corespunde in continuare adresei B4. 1.5- intocmirea tabelului datelor grupate, reprezentnd valorile intervalelor, astfel: [xmin: Xmin+d); [xmin+d: xmin+2d); (xmax]; Utilizand Excel, introducerea acestor valori poate fi realizata utilizand: [=$A$1 si =$A$1+$B$4); [=$A$1+$B$4 si =$A$1+2*$B$4) s.a.m.d. Obtinand tabelul: valoarea clasei 164.000 168.167 168.167 172.333 172.333 176.500 176.500 180.667 180.667 184.833 184.833 189.000 2.1- calcularea frecventelor absolute, ai, se poate realiza utilizand facilitatile de sortare ale software-ul Excel, si anume: 1- selectati optiunea Data, Filter, Autofilter.. (Date, Filtrare, Autofiltrare..) pentru sirul dat; astfel in partea dreapta sus apare un buton de derulare; executati clic cu mouse-ul pe acest buton; astfel apar tipurile de filtrari posibile;

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date

55

2- selectati optiunea Custom.. (Client..); selectati in casuta de dialog care se deschide optiunile necesare calculului temei si anume (conform figurii 2.8): 1- conditia de limitare la stanga; 2- valoarea de limitare, x min; 3- conditia de limitare la dreapta; 4- valoarea de limitare pentru primul interval, x min+d;

1 3

2 4

Fig. 2.8: Optiunea de filtrare a datelor; optiunea client

Astfel vom obtine valorile: a1=3; a2=5; a3=6; a4=1; a5=2; a6=1; (valori care vor corespunde in continuare adreselor de la E8 la E13) 2.2- verificarea rezultatelor, utilizand formula (2.2);

a
i =1

=n

Utilizand Excel, avem: =SUM(E8:E13) sau =SUM(a1,a2, a3,a4,a5, a6); Astfel, observam ca rezultatele obtinute sunt corecte, deoarece avem: 3+5+6+1+2+1=18, adevarat (aceasta valoare corespunzand in continuare adresei E14). 2.3- calcularea frecventelor relative, fi,utilizand formula (2.3);

fi =

ai ; n

f
i =1

=1

Astfel avem: =E8/$E$14 ; =E9/$E$14; s.a..m.d pentru fiecare valoare f1, f2, ...f6; Valorile tabelar obtinute sunt: fi f1 f2 f3 f4 f5 f6 Valoare fi 0.167 0.278 0.333 0.056 0.111 0.056

Verificarea rezultatelor presupunand insumarea valorilor frecventelor relative (vezi formula (2.3)): =SUM(F8:F13);

56

Lucrarea 2

(deoarece valorile frecventelor relative corespund adreselor de la F8 la F13), valoarea obtinuta fiind 1.00 (ceea ce este conform formulei (2.3), valoarea obtinuta corespunzand in continuare adresei F14) 2.4- calcularea frecventelor cumulate Fi, i prezentarea lor tabelara se va realiza utilizand rezultatele anterior obtinute, i anume valorile ai i fi, i au la baza relatiile (2.4).

Ac = a i ;
i =1

Fc =

Ac ; n

Ad = ai ;
i =n

Fd =

Ad ; n

Astfel, utilizand functiile Excel, vom avea: =SUM($E$8); =SUM($E$8:E9); =SUM($E$8:E13) pentru Ac; =SUM(E8:$E$13); =SUM(E9:$E$13); =SUM(E13:$E$13) pentru Ad; =SUM($E$8)/18; =SUM($E$8:E9)/18; =SUM($E$8:E13)/18 pentru Fc; =SUM($E8:F$13)/18; =SUM($E9:F$13)/18; =SUM($E13:F$13)/18 pentru Fd; Valorile obtinute, reprezentate tabelar (valori care in continuare vor corespunde adreselor: de la G8 la G13 pentru Ac, de la H8 la H13 pentru Fc, de la I8 la I13 pentru Ad, de la J8 la J13 pentru Fd), sunt: Ac 3.000 8.000 14.000 15.000 17.000 18.000 Fc 0.167 0.444 0.778 0.833 0.944 1.000 Ad 18.000 15.000 10.000 4.000 3.000 1.000 Fd 1.000 0.880 0.586 0.235 0.176 0.059

2.5- trasarea histogramei valorilor calculate, avand pe abscisa valorile clasei iar pe ordonata valorile frecventelor, (vezi fig. 2.9);

Reprezentarea pe clase
0.350 0.300 0.250 0.200 0.150 0.100 0.050 0.000 168.167 164.000 176.500 172.333 184.833 180.667

frecventa relativa f i

valo ar ea clasei

Fig. 2.9: Trasarea histogramei- frecventelor relative fi

3- Determinarea mediilor: aritmetica, geometrica, armonica i patratica i stabilirea succesiunii acestora, utilizand formulele (2.10), (2.11), (2.12), (2.13); 3.1- Media aritmetic, avand formula:

M [ x] =
Astfel, vom avea:

xi
i =1

sau M [ x ] = i = 1

ai xi n

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date

57

=SUM($A$1:$A$18)/18 sau =(D18*C18)- cazul unei valori ai, obtinandu-se valorile E18-E27, urmand: =SUM(E18:E27)/18 (cazul frecventelor absolute)Valoarea obtinuta este: M[x]=174.167 (i ea va corespunde in continuare adresei B30); 3.2- Media geometric. Cu valorile x1, x2, ...,xn, media geometric este:

M g = n x1 x 2 ... x n = n x i
i =1

Astfel: =POWER(PRODUCT(A1:A18),1/18) obtinand valoarea Mg=174.061 (valoare care va corespunde in continuare adresei B31);3.3- Media armonic. Pentru valorile x1, x2, ...,xn,, media armonic se obine cu relaia

Ma=

n
i =1 x i

Utilizand Excel, avem: =1/A1- cazul unei valori, obtinandu-se valorile E30-E47, urmand =18/(SUM(E30:E47)) sau =18/SUM(1/A1, 1/A2, , 1/A3, ..., 1/A18) Obtinandu-se valoarea: Ma=173, 957, (valoare care va ocupa in continuare pozitia B32); 3.4- Media ptratic. Pentru aceleai valori x1, x2, ...,xn, media ptratic este:

Mp =

x
i =1

2 i

Astfel: =POWER(SUM(POWER(A1:A18,2))/18,1/2), obtinand valoarea Mp=174.274;Stabilirea succesiunii acestora se poate realiza utilizand functia de sortare oferite de Excel, functie pe care am mai utilizat-o pe parcursul acestei lucrari. Astfel, facand o sortare in ordine crescatoare a valorilor calculate, vom avea: Ma<Mg<M[x]<Mp, ceea ce verifica relatia (2.19) 4- Determinarea medianei, moda i valoarea centrala, utilizand formula (2.14), (2.15) i (2.16); 4.1- Mediana:

M e = X n +1
2

In cazul unui numr par de valori (cazul nostru), mediana este egal cu media aritmetic a celor dou valori centrale:

Me =

x( n / 2 ) + x( n 2 + 1 ) 2

Astfel: =SUM($A$8+$A$9)/2 mediana are valoarea Me=174 (valoare care va corespunde in continuare adresei B35); 4.2- Moda. Conform rezultatelor obtinute, intervalul modal este intervalul (172,333, 176.5]; astfel se aplica relatia: =MAX(A6:A14) Obtinandu-se valoarea Mo=176, (valoare care va corespunde adresei B36).

58

Lucrarea 2

4.3- Valoarea centrala:

Xc =

X max + X min 2

Utilizand functiile Excel avem: =(A1+A18)/2 Obtinand valoarea Xc=176.5 (valoare care va corespunde in continuare adresei B37); Observatie: valoarea centrala se poate referi i la un interval de grupare de ordin i care reprezinta media valorilor limita (inferior i superior) ale intervalului. 5- Determinarea dispersiei, abaterii standard i a amplitudinii, (2.20), (2.21), (2.23), (2.24), (2.26); 5.1- Dispersia:

D[x ] = i = 1

(x i M [ x ] ) n

Pentru loturi de fabricaie dispersia este notat cu 2 iar pentru eantioane cu s2. Dac x1, x2, ...,xn se repet, respectiv cu frecvenele absolute a1, a2, ...,an, atunci dispersia este:

D[x ] = i = 1

2 ( x i M [ x ]) a i

= ( x i M [ x ]) 2 f i
i =1

Avand rezultatele anterioare (adic valoarea mediei aritmetice M[x], care se afla la adresa B30), se va aplica functia: =(SUM(POWER(($A$1:$A$18-$B$30),2)))/18, sau =SUM(POWER(($A$1:$A$18-$B$30),2),($F$8:$F$13)) obtinand valoarea D[x]= s2=4.648 valoare ce va ocupa in continuare adresa B39. 5.2- Abaterea standard(abaterea medie patratica):

D[x ] =

i =1

( x i M [ x ]) n

1 n 2 xi M [ x ] 2 n i =1

Considernd frecvenele absolute sau relative expresiile abaterii medii ptratice devin:

D[x ] = D[x ] =

i =1

2 ( x i M [ x ]) a i

n
n i =1

i =1

x i2 a i n
n

M [ x]2

2 (x i M [ x ] ) f i =

i =1

2 x i2 f i M [ x ]

=POWER(SUM(POWER(($A$1:$A$18-$B$30),2),($F$8:$F$13)), 1/2) sau =POWER($B$39,1/2)

obtinand valoarea

D[x ] = s=2.1559, (valoare ce va ocupa adresa B40).

5.3- Amplitudinea, avand formula:

W = x max x min
A fost calculata anterior (vezi punctul 1.3), utilizand functiile Excel (unde adresele de la A1 pana la A18 reprezinta valorile sirului), astfel: =(A1-A18) rezultand: W=25, (valoare ce ocupa adresa B3)

Repartitia in frecventa a datelor.Reprezentarea si prelucrarea primara a sirurilor de date

59

6- Realizarea verificarilor rezultatelor obtinute, utilizand optiunile oferite de Excel, i anume, 6.1- Verificarea reprezentarilor grafice utilizand optiunile: Tools, Data Analysis.. (Instrumente, Analiza datelor..), selectand din caseta de dialog care se deschide optiunea Histogram (Histograma). Pasii necesari fiind: 1- selectati optiunea Tools, Data Analysis.. (Instrumente, Analiza datelor..); 2- selectati titlul/optiunea Histogram (Histograma); 3- completati in casuta de dialog care se deschide optiunile necesare trasarii histogramei frecventelor (datele de intrare/sirul de numere, valoarea clasei, ..). 4- executati clic asupra butonului ok. Aceasta histograma nou obtinuta va fi comparata cu ceea obtinuta in urma calculelor anterioare, putand astfel sa fie evaluata calitatea rezultatelor obtinute, (Fig.2.10).
Reprezentarea pe clase

Histogram
7 6 5 4 3 2 1 0

0.300 0.250 0.200 0.150 0.100 0.050 0.000

Frequency

0.350

Frequency

f recventa relat iva f i

16

17

17

18

val o ar ea cl asei

Bin

Fig. 2.10: Verificarea histogramei ( frecventelor relative) utilizand optiunile Excel: Tools, Data Analysis

6.2- Verificarea valorilor indicilor statistici calculati anterior (cei mai uzuali), utilizand optiunile: Insert, Function(Introducere, Functii), selectand din caseta de dialog care se deschide, categoria: Statistical (Statistica), pasii urmati fiind: 6.1.1- Pentru verificarea mediei aritmetice: =AVERAGE(A1:A18) Valoarea obtinuta fiind: M[x]=174.167 (i ea va corespunde in continuare adresei D30); 6.1.2- Media geometric: =GEOMEAN(A1:A18) obtinand valoarea Mg=174.061 (valoare care va corespunde in continuare adresei D31); 6.1.3- Media armonic. Utilizand Excel, avem: =HARMEAN(A1:A18) Obtinandu-se valoarea: Ma=173, 957, (valoare care va ocupa in continuare pozitia D32); 6.1.4- Media ptratic: =POWER(SUM(POWER(A1:A18,2))/18,1/2), obtinand valoarea Mp=174.274; valoare care va ocupa in continuare pozitia D33 6.1.5- Dispersia: =AVEDEV(A1:A18) obtinand valoarea D[x]= s2=4.648, valoare ce va ocupa in continuare adresa D39. Se observa astfel ca toate valorile indicilor calculati se regasesc in valorile oferite de catre functiile dedicate, oferite de software-ul Excel, concluzia pe care o putem trage in urma acestor verificari putand fi numai aceea ca, tema propusa a fost solutionata corect.

D. Prezentarea rezultatelor:
Rezultatele vor fi prezentate sub forma unui raport (vezi Anexa2) ce cuprinde:

18

16

168.167 164.000

176.500 172.333

184.833 180.667

2. 33

6. 50

0. 66

4. 83

8. 16

4. 00

3 M or e

60

Lucrarea 2

reprezentarea datelor primare, sirul de date: reprezentarea tabelara a datelor grupate; reprezentarea tabelara a frecventelor: frecventele absolute aI, frecventele relative fi i a frecventelor cumulate crescatoare i descrescatoare: Ac, Ad, Fc, Fd. reprezentarea statistica pe grupe de clase, trasarea histogramelor repartitiei frecventelor relative fi i a frecventelor cumulate Fc, Fd. Bulgaru, M., Bolboaca, L., Ingineria calitatii.Mangementul calitatii, statistica i control, nasurari in 3D, Alma Mater, Cluj-Napoca 2001, ISBN 973-85153-0-0. Cathy, K., Excel pentru Windows tm 95 in 503 imagini, Teora, Bucuresti, 1999, ISBN 973-601-457-6 Faithe, W., Microsoft Office 97 Professional 6in 1, Teora, Bucuresti, 1998, ISBN 973601-907-1 Tanasescu I Controlul statistic al proceselor si produselor, Editura didactica si pedagogica, Bucuresti, 1987. *** Colectie de standarde, Managementul i asigurarea calitatii, Editura tehnica, Bucuresti, 1996

E. Bibliografie:
[1] [2] [3] [4] [5]

S-ar putea să vă placă și