Documente Academic
Documente Profesional
Documente Cultură
TABELAR
Introducere
Notiunile predate la Cursul de Controlul Calitatii se bazeaza pe statistica
matematica. Desi exista programe de calculator dedicate calculului statistic utilizat in
Controlul Calitatii, o metoda larg raspandita, datorita simplitatii si eficacitatii sale este
utilizarea unui program de calcul tabelar de tip Excel. Programul are o multitudine de
functii predefinite pentru statistica matematica necesara in Controlul statistic al
Procesului si Acceptanta bazata pe Esantionare, ca sa amintim doar doua dintre capitolele
cele mai importante ale disciplinei.
In cadrul laboratorului s-a optat pentru programul “Open Source”, care este
gratuit si nu are nevoie de licenta de operare numit Open Office Calc, ver. 4.1. (face
parte din pachetul Open Office detinut in prezent de Apache Software Foundation).
Programul de calcul tabelar este foarte asemanator cu popularul Excel, care face din
pachetul Office al Corporatiei Microsoft. Exista cateva diferente totusi de sintaxa, de
aceea studentii sunt rugati sa urmareasca cu atentie explicatiile din indrumarul de
laborator. Un exemplu foarte simplu de diferente, consta in faptul ca argumentele unei
functii sunt separate de virgula “,” in Excel, in timp ce Open Office separa argumentele
functiilor cu punct si virgula “;”. Deci mare atentie la sintaxa.
1. Bazele statisticii
Atunci cand se colecteaza un set de date numerice (masuratori) este util ca acestea
se faca un sumar al proprietatilor acelui set de date. Daca sumarul descriptiv al
masuratorilor se efectueaza dintr-un esantion al populatiei, masuratorile descriptive se
numesc statistica. Statistica descriptiva calculata dintr-o populatie defineste parametrii.
Controlul statistic al calitatii (SQC) se bazeaza pe statistica.
Cele mai importante trei proprietati ce descriu seturile de date sunt: tendinta
centrala (localizarea), variabilitatea sau dispersia (imprastierea) si forma distributiei.
Tendinta centrala si imprastierea se caracterizeaza prin indicatorii statistici.
1
x1 x 2 ... x n n
x
x i
n i 1 n
Daca unele valori se repeta de ai ori (ai se numesc frecvente absolute), expresia
devine:
n
a1 x1 a 2 x 2 ... a n x n
ai xi
x i 1
n n
Daca notam fi=ai/n frecventele relative:
n
x f1 x1 f 2 x 2 ... f n x n f i x i
i 1
Pentru a calcula media aritmetica in Excel se introduce urmatoarea formula intr-o
celula:
=AVERAGE(interval_celule)
Unde “interval_celule” specifica celulele ce trebuie incluse in calcul. Spre exemplu
=AVERAGE(B5:B35) va media valorile de la celula B5 pana la B35, iar
=AVERAGE(A9:C55) va media toate valorile din toate celulele din coloanele A, B si C
din randurile 9 pana la 55.
1.1.3. Mediana
Mediana este valoarea de mijloc din esantion, cu un numar egal de elemente sub
si deasupra valorii medianei. Pentru a obtine mediana prin calculmanual este bine ca
valorile sa fie mai intai ordonate. Daca avem un numar impar de valori ordonate (2k+1)
numerotate de la 1 la n=2k+2 mediana este valoarea a cu indexul k+1. Daca numarul de
valori este par (2k) cu valorile numerotate ordonat de la 1 la n=2k+1, mediana este media
aritmetica a valorilor centrale, de ordin k si k+1.
Pentru a calcula mediana in Excel se introduce urmatoarea formula intr-o celula:
=MEDIAN(interval_celule)
Unde “interval_celule” specifica celulele care trebuie introduse in calcul. Cand se
utilizeaza functia MEDIAN in Excel datele nu trebuie sa fie ordonate.
1.1.4. Moda
Moda este data de frecventa cea mai mare ce apare in setul de date. Moda arata
unde se concentreaza cele mai multe valori; astfel arata tendinta centrala. Pentru a
determina moda se numara aparitiile fiecarei valori din setul de date. Valoarea ce apare
cel mai frecvent da moda. Unele distributii au doua sau mai multe mode, acestea se
numesc bi-modala sau multi-modale.
Pentru a determina moda in Excel se utilizeaza formula:
=MODE(interval_celule)
Unde “interval_celule” specifica celulele care sunt incluse in calcul.
M G
n x x ... x
1 2 n
n xi
i 1
2
Sau prin logaritmare:
lg x1 lg x2 ... 1 n
lg MG
n
lg
n i 1 xi
In Excel se calculeaza cu formula:
=GEOMMEAN(Interval_celule)
x 2
i
MP
i 1
n
1.1.7. Valoarea centrala:
Valoarea centrala este media aritmetica a valorilor minima si maxima din setul de
date:
x MAX x min
X
c 2
1.2. Variatia sau imprastierea
Variatia este a doua proprietate care poate descrie un set de date. Variatia este
data de imprastierea valorilor din setul de date. Figura 1 arata doua esantioane de date
masurate cu aceeasi tendinta centrala dar cu variatii diferite. Primul grafic are o
imprestiere mai mica decat graficul al doilea. In primul caz datele sunt mai strans grupate
in jurul valorii centrale, in timp ce in graficul al doilea valorile sunt mai imprastiate
SQC utilizeaza in principal trei masuri ale variatiei: amplitudinea, varianta
(dispersia) si deviatia standard.
3
Figura 1. Comparatie intre doua seturi de date in care s-au reprezentat frecventele relative
de aparitie a valorilor x. In cele doua seturi de date mediile sunt aceleasi dar dispersia
este diferita
4
esantion din intreaga populatie. Expresia variantei pentru populatie este de una dintre
urmatoarele formule:
2
n_
2
xi x
i 1
σ n
2
n
_
2
i 1
ai
x i
x
σ
n
2
n
_
f i xi x
2
σ i 1
Cu aceeasi semnificatie pentru ai, fi, xi, n si x i ca in relatiile pentru media aritmetica.
Daca dispersia se calculeaza pentru un esantion (selectie) se utilizeaza notatia s2 si
se numeste dispersia corectata sau esantionara:
_ 2
_ 2
_ 2
x 1 X x 2 X ... x n X
s2
n 1
Deci la numitor apare n-1 in loc de n.
Pentru a calcula varianta unei populatii in Excel se utilizeaza expresia:
=VARP(interval_celule)
Pentru a calcula varianta unui esantion in Excel se utilizeaza expresia:
=VAR(interval_celule)
Unde “interval_celule” exprima celulele pentru care se calculeaza varianta.
5
1.2.4. Quartile:
Cuartilele sunt definite de trei valori Q1, Q2, Q3 ce impart amplitudinea in 4
intervale, astfel incat frecventele relative ale intervalelor sa fie egale intre ele (25%).
Daca sirul de valori este ordonat acestea se pot determina prin simpla inspectie, altfel se
poate utiliza functia Excel:
=QUARTILE(Interval_celule_date; Tip)
Unde Interval_Celule are aceeasi semnificatie ca pana acum, iar Tip: =0
returneaza valoarea minima a sirului de date; =1 returneaza prima quartila (de 25%); =2
returneaza a doua quartila (de 50%) care este chiar mediana, =3 returneaza a treia quartila
(de 75%), iar =4 returneaza maximul sirului de valori. Valorile in acest caz nu trebuie sa
fie in prealabil ordonate.
Se defineste coeficientul de variatie intercuartilica:
Iq Q Q1
q 3
Me Q2
x X
n 4
i
a4 i 1
n 4
Pentru distributia normala Gauss a4 este egal cu 3.
Daca a4>3 graficul este mai ascutit decat o distributie normala (leptokurtica),
valorile sunt concentrate in jurul mediei si cozile sunt mai groase avand o probabilitate
mai mare pentru valorile extreme.
Daca a4<3 graficul este mai plat decat o distributie normala (platikurtica), valorile
sunt dispersate pe un interval mai mare in jurul mediei si cozile sunt mai subtiri avand o
probabilitate mai mica pentru valorile extreme.
Daca a4=3 graficul seamana cu o distributie normala (mezokurtica).
Aplatizarea (kurtosis) se defineste ca:
k a4 3
Deci daca k<0 graficul este plat, k>0 graficul este ascutit, iar pentru k=0 seamana
cu o distributie normala.
In Excel se calculeaza cu functia:
=KURT(Interval_Celule)
6
x
n
3
i X
a3 i 1
n σ3
In Excel se calculeaza cu formula:
=SKEW(Interval_celule)
Tabelul 1. Rezultatele calculate pentru valorile tipice ale unui sir de date
7
Primul pas in analiza calitativa a datelor este construirea distributiei frecventelor.
Distributia frecventelor este numarul de aparitii a unei valori particulare intr-un esantion
sau un set de esantioane.
Cele mai utilizate distributii:
-continue: normala, uniforma, exponentiala, distributia f, distributia chi-patrat,
Student
-discrete: Poisson, uniforma, binomiala, hipergeometrica.
8
Figura 3. Histograma pentru distributia binomiala - densitatea de probabilitate - pdf
9
capabilitatea de a genera masuratori fictive de calitate care se potrivesc unei anumite
distributii, ceand astfel un sistem stabil de cauze. Apoi, utilizatorul poate introduce un
sistem instabil de cauze si sa examineze cum aceste schimbari afecteaza diagramele de
control si conduc specialistul SQC sa inteleaga ce modificari au loc in distributia
populatiei.
In viata reala foile de calcul permit utilizatorului sa introduca valori reale rezultate
din masuratori de calitate, sa genereze diagrame de control si sa determine daca
distributia frecventelor s-a modificat. Modificarile in distributia frecventelor pot fi asupra
mediei, variatiei sau formei. Cand o distributie se modifica, schimbarea poate fi buna, rea
sau neutra relativ la calitatea produsului finit.
Celula Eticheta
A1 norm.xls
A4 Low:
A5 High:
10
A6 Incrementul:
A8 z
B8 cdf
C8 pdf
Pentru centrarea textului in fiecare celula, se selecteaza domeniul A8, B8, C8,
punctand cu cursorul pe A8, apasand butorul stang al mouseului si tragand cursorul peste
B8, pana la C8. Cand toate celulele sunt selectate se elibereaza butonul de la mouse si se
urmeaza pasii urmatori:
1. Click pe Format
2. Click pe Cells
3. Click pe Alignment Cells
4. Click pe sageata Horizontal in jos si se selecteaza Center
5. Click pe OK
Deoarece formatarea textului este o alegere personala, acest lucru este lasat la
latitudinea utilizatorului. O alta modalitate de a centra textul este de a selecta celulele de
la A8 la C8 si de a apasa butonul Center din Toolbar (bara de unelte).
1. In celula B4 scrieti: -3.5 si apasati Enter (-3.5 este cea mai mica valoare a lui z)
2. In celula B5 scrieti: 3.5 si apasati Enter (3.5 este cea mai mare valoare a lui z)
3. In celula B6 scrieti: 0.05 si apasati Enter (0.05 este incrementul lui z)
4. In celula A9 scrieti: +B4 si apasati Enter
5. In celula A10 scrieti: +$B$6+A9 si apasati Enter
6. In celula B9 scrieti: =NORMSDIST(A9) si apasati Enter
7. Apasati pe celula B9
8. Apasati pe Edit
9. Apasati pe Copy
10. Apasati pe B10 si apasati Enter
11. In celula C9 scrieti:0 si apasati Enter
12. In celula C10 scrieti: +B10-B9 si apasati Enter
Primele doua randuri ale tabelului sunt complete. Pentru a copia continutul
celulelor A10, B10, pana la C10 in randurile de la 11 la 149 urmati urmatorii pasi:
13. Selectati celula A10 apasand butorul stanga al mouse-ului pe celula A10
14. Pozitionati cursorul mouse-ului pe coltul din dreata jos al celulei A10; cursoul
se modifica in +
15. Tineti apasat butonul stang al mouse-ului si trageti in jos peste toate celulele
de la A11 pana la A149. Acetea trebuie sa se umple cu datele corespunzatoare valorilor
lui z.
11
16. Repetati operatiile 14-15 pentru celulele din coloanele B si C, pornind de la
celula B10 (C10) si tragand cursorul mouse-ului in jos pana la celula B149 (C149).
Celule respective se vor umple cu datele corespunzatoare valorilor cdf, respectiv pdf.
Foaia de calcul este completa. Examinati continutul tabelului cum apare si in Fig.
Coloana z arata valorile crescatoare ale deviatiei standard de la -3.5 la 3.5 cu increment
de 0.05. Functia =NORMSDIST(z) calculeaza functia cumulata de distributie (cdf) a
fiecarei valori asociate deviatiei standard. Functia densitate de probabilitate (pdf) este
determinata din valorile cdf prin scaderi ale valorilor succesive. Precizia pdf este data de
utilizarea unui increment mic al valorilor lui z.
Se salveaza fisierul obtinut apasand pe File si apoi pe Save.
1. Selectati celulele care trebuie reprezentate grafic: A9:A149 apoi lasati liber
butonul stang al mouse-ului
2. Tineti apasat tasta control CTRL in timp ce selectati celulele C9:C149 ce
trebuie afisate grafic.
3. Apasati butonul Chart de afisare grafica.
12
4. La pasul 1 din 4 ai Chart selectati XY (Imprastiere - Scatter) si sub-tipul
graficului: Lines Only (doar linii simple).
5. Apasati Next>
6. La pasul 2 din 4 apasati Next>
7. La pasii 3-4 denumiti diagrama Distributie Normala; numele axei x: Z;
numele axei y: Probabilitate, apoi apasati Finish
8. Asezati graficul in pozitia dorita, tragand dreptunghiul prin apasarea butonului
stang al mouseului, cursorul de la mouse devine o cruce cu patru sageti, tineti
apasat butonul de la mouse si trageti graficul la pozitia dorita din foaia de
calcul
9. Apasati dreptunghiul seriei si apoi apasati Delete. Rezultatele sunt afisate in
Fig.
13
Figura 7. Graficul functiei de repartitie a distributiei normale normate (Functia
cumulativa de probabilitate) - cdf
14
C7 cdf Eticheta coloanei pentru cdf
A8 0 Zero aratand ca o anumita
valoare nu apare
15
b. In fereastra Trials scrieti $B$3 si apasati tasta TAB
c. In fereastra SP scrieti $B$4 si apasati tasta TAB
d. In fereastra C scrieti 0 (sau False) si apasati tasta TAB
6. Copiati functia B8 in domeniul B9:B18 punctand cursorul pe + in coltul din
dreapta jos al celulei apasand butonul din stanga al mouse-ului si tragand +
spre celula B18
16
2. Apasati pe butonul de Chart Wizard
3. La pasul 1 selectati optiunea Column cu tipul sub-graficului Normal
4. La pasul 4 denumiti diagrama Binomiala pdf; numele axei x: c; iar pentru axa
y: Probabilitate; click pe finish
17
3. Utilizarea functiilor de calcul tabelar
Exista multe functii statistice care sunt utile in controlul calitatii; in aceasta
lucrare au fost demosntrate doar doua dintre ele. Puteti cauta o functie statistica
anume facand click pe butonul de functii “fx” si apoi sa se caute functia necesara.
Fig. 11. arata cum arata ecranul dupa selectarea butonului de functie.
Figura 11.
18