Sunteți pe pagina 1din 32

FUNDAMENTE STATISTICE

ale
CONTROLULUI CALITATII

PROF. DR. ISAIC- MANIU ALEXANDRU

web www.amaniu.ase.ro
e-mail AL.ISAIC-MANIU@CSIE.ASE.RO
STATISTICA -elemente recapitulative
– Media aritmetică de sondaj
(sample average, sample mean-value)
• Raportul dintre suma tuturor valorilor x observate în
eşantionul considerat şi numărul total n al acestora:
n
1
Observaţii
x 
i 1 n
 i
x *

• În cazul valorilor observate, aranjate în ordine


crescătoare sau descrescătoare:
n n
1
x
n
ni 1
i xi  f
i 1
i xi
în care:
n - numărul total al valorilor observate;
ni - frecvenţa absolută corespunzătoare valorii xi;
fi - frecvenţa relativă corespunzătoare valorii xi.
Dispersie de sondaj (s2)
(Sample variance)
• Moment centrat de ordinul doi:
n
1
s 2   n i (x i  x) 2
n i 1
• Valoarea numerică a acestui indicator sintetic
caracterizează în modul cel mai adecvat împrăştierea
repartiţiei statistice
• Dispersia de sondaj poate fi folosită ca estimaţie
aproximativă a dispersiei din populaţia originară,
considerându-se formula corectă:
1 n
s 
2
 ( xi  x)
2

n  1 i 1
Dispersie de sondaj (s2)
(Sample variance)

1. În cazul valorilor observate, aranjate în


ordine crescătoare sau descrescătoare:

n n

n i (x i  x) 2
n i x i2
n 2
s2  i 1
 i 1
 x
n 1 n 1 n 1
2. În cazul valorilor observate, grupate în k clase:
n n

 n ( x  x )  n ( x  c)
i
'
i
2
i
'
i
2

n
s 
2 i 1
 i 1
 (c  x ) 2
n 1 n 1 n 1
Legea normală (Gauss-Laplace)
• Una din ipotezele fundamentale in controlul calitatii fiind
normalitatea (apartenenţa la legea Gauss-Laplace) a caracterizării
investigate este necesar să discutăm despre această lege statistică.

• Modelul Gauss-Laplace uzual, din punct de vedere matematic


reprezintă o repartiţie statistică definită de
• funcţia de repartitie
 x   2 
 
x
1
F x;  ;   exp  2 2 dx
2

 2
• unde
μ  R, σ  0, x  R

• Respectiv functia de frecventa


f x  
1 
exp 
 x   
2


 2  2 
2

• sau funcţia de densitate a repartitiei variabilei


aleatoare X
• X – mărimea fizică măsurată şi care reprezentată
grafic are binecunoscuta formă de „clopot” (aşa-
zisul „clopot al lui Gauss”):
• Se ştie că o funcţie de densitate trebuie să
îndeplinească următoarele cerinţe:
• (i) f x   0,  x  D şi

• (ii)  f x dx  1unde D este domeniul de definiţie al variabilei


D
X, în cazul nostru dreapta reală, R.
Scurt istoric – legea normala (1)
• Originea acestui model o găsim în lucrarea „Dialog despre cele
două sisteme fundamentale ale lumii” a lui Galileo GALILEI
(1564-1642), în care el îşi expune părerile referitoare la
măsurarea distanţelor dintre diferite corpuri cereşti:
Galilei considera că:
• erorile întâmplătoare sunt inevitabile în observaţiile obţinute cu
diverse mijloace de măsurare
• erorile mici au şanse mai mari de apariţie decât cele mari sau
foarte mari
• măsurările tind să se distribuie aproximativ egal la stânga şi la
dreapta unei valori „de referinţă”
• majoritatea valorilor observate tind să se grupeze („să se
aciuiască”) în jurul acestei valori de referinţă
• erorile aleatoare prezente în procesul măsurării/observării sunt
diferite (distincte) de cele ce pot apărea în calculele efectuate de
experimentator
(2)
• Repartiţia normală apare de fapt pentru prima oară în
1733 într-o lucrare a lui Abraham de MOIVRE (1667-
1754), matematician cunoscut mai curând prin
„formula Moivre” referitoare la numerele complexe

• Abia odată cu lucrările lui Carl Friedrich GAUSS


(1777-1855) şi cele ale lui Pierre Simon, Marquis de
LAPLACE (1749-1827) se pun în lumină proprietăţile
şi importanţa deosebită a acestei legi statistice ca
descriptor – iniţial al comportării erorilor de
observaţie (Gauss, 1809 în „Theoria Motus Corpum
Caelestium”

• Laplace (1810/1811 în „Theorie analitique des


Probabilites” din 1812) arată rolul teoretic (şi practic)
excepţional jucat de legea normală prin aşa-numita
TEOREMĂ LIMITĂ CENTRALĂ
(3) Teorema Limita Centrala
• Această teoremă, menţionată azi şi în diverse documente ISO
(de exemplu ISO Guide 13434, Anexa G. pp. 74-75) a
constituit fundamentul construirii fişelor de control de tip
SHEWHART destinate verificării unui proces (vezi SRISO
8258/1999).
• Într-o formulare „populară” Teorema Limită Centrală
afirmă că: dacă sunt variabile aleatoare continue, identic
repartizate cu aceeaşi medie (m) şi aceeaşi dispersie (D2),
atunci variabila medie este aproximativ normal repartizată, cu
aceeaşi medie (m) dar cu dispersia mai mică şi anume
D2 / n
• Acest fapt are loc chiar pentru valori modeste ale lui n .
Teorema Limita Centrala
• Teorema Limită Centrală a deschis drumul spre „universalizarea” legii
normale
• Demograful belgian Adolphe QUETELET (1796-1874) a aplicat
repartiţia Gauss-Laplace în cazul măsurărilor
antropometrice (1846 „Theorie des Probabilites
appliquee aux Science Morale set Politiques”).
• F.W. BESSEL (1784-18469 opera în mod uzual în
această repartiţie la prelucrarea datelor provenite din
măsurătorile astronomice.
• J.C. MAXWELL (1831-1879), creatorul teoriei cinetice
a gazelor, este probabil primul fizician care a încercat
să modeleze mişcare a gazelor folosind statistica. Iată
ce scria el:
• „Vitezele unor particule care se mişcă în vid sunt
repartizate după aceeaşi lege ce guvernează comportarea
erorilor în metoda celor mai mici pătrate”
Cateva proprietati ale legii normale ( 1 )
– graficul funcţiei are un singur maximum
pentru x  
– si două inflexiuni de abscise x    

  2
– parametrii descriptori şi au semnificaţia
mediei şi dispersia teoretice: Ex  ; var x    2

– intervalul   3 ,   3  conţine aproximativ 99,73%


din valorile mărimii X.
Cateva proprietati ale legii normale (2)
• Funcţia de repartiţie, definită ca:
 
F x; ;  Pr oblX  x
2 μ  R, σ  0, x  R

• Are expresia
  1  x
u    2

F x;  ;   exp 
2
2 
dx
 2   2 
• Variabila U  x   /  se zice variabila normală
standard (sau standardizată) şi are funcţia
de densitate respectiv de repartiţie sub
f 0 u   exp  u / 2
1 2
• 2
u
F0 u  
1
e
t 2 / 2
dt
2 
adică variabila U are media O şi dispersia 1
Aceste funcţii au fost tabelate iniţial de către
Laplace.
• Valoarea medie, mediana şi moda (valoarea modală) a unei variabile
sunt toate egale cu  ;
 
X  N , 2

• Momentele centrate de ordin impar sunt toate nule.


2 k 1

D2k 1   x    f x; ; 2 dx  0 
R
• 
D2 k    x    
f x;  ;  2 dx   2k !

2k
Momentele centrate de ordin par au expresia 2k  k
R

– coeficientul de asimetrie (Skewness) este 1  D3 /D2 3 / 2  0


– coeficientul de exces (Kurtosis) este  2  D4 / D22  3

• Funcţia eroare – erf (x) – are forma: 0  


erf x  2F x 2  1, x  0
• şi corespunde unei densităţi de medie 0 şi dispersie ½

• Coeficientul lui GEARY are valoarea:


a

1
 
  x   f x; ; 2 dx 
2

 0,7979
k
Grafice ale legii normale
• Estimarea parametrilor m şi sigma se face de regulă cu indicatorii
de eşantionaj x1 , x2 ......xn
• 1 n
̂  x 
n

1
x i

• respectiv
ˆ 
1 n

n 1 1
xi  x  
2

• Legea normală N  ,  este stabilă, adică dacă    xsunt variabile de


i i
2 i

tipul , atunci este tot o variabilă normală, cu media si

• 
dispersia  2   2
i
Repartiţia t (STUDENT)
• dacă 
xi  N  ,  2 sunt independente, cu
parametrii
X n 1
x i
s2 
1
n 1
 
xi  x 
2

• variabila x
t 
s/ n
• se numeşte variabila STUDENT (sau „t”) şi
joacă un rol important în experimentele
privind compararea a două medii normale
(adică a mediilor a două populaţii
caracterizate de legea normală )
Repartiţia t (STUDENT)
• Densitatea de tip t are forma:
n / 2  
n / 2
t2 
f t  
1
  1  
 n  1  n  1   n  1 
 
 2 

• unde 

•   x   0 e dt
t x 1 t

• este binecunoscuta funcţie GAMMA a lui


EULER (1707-1783).
Repartiţia t (STUDENT)

• Denumirea STUDENT provine de la


chimistul şi statisticianul britanic William
Sealy GOSSET (1876-1937) care a lucrat
la o celebră fabrică de bere din Dublin, în
calitate de supervizor al procesului de
fabricaţie al acestui produs, apreciat azi pe
întreg mapamondul ,Gosset a avut ca
„sarcină de serviciu” – printre altele – şi
compararea calităţii berii produse de firma
respectivă cu cea a concurenţilor acesteia.
Repartiţia t (STUDENT)

• Astfel s-au născut primele experimente de


comparare a calităţii medii, folosind un
instrument statistic. Din cauză că patronii fabricii
respective nu permiteau angajaţilor o activitate
publicistică sub propriul nume, Gosset şi-a ales
pseudonimul STUDENT, cu care şi-a semnat
toate lucrările, publicate în principal în celebra
revistă” BIOMETRIA” >înfiinţată în 1900 de
GALTON şi PEARSON.
Testarea normalităţii

• Verificarea faptului că datele


experimentale obţinute sunt repartizate
după legea Gauss-Laplace se poate face
în mai multe moduri, şi anume:
–algebric (utilizând indicatorii de eşantionaj
cu proprietăţile lor specifice în cazul legii
normale);
–grafic (folosind aşa-numitele „hârtii” sau
reţele de tip probabilist)
–analitic (utilizând procedee statistice
speciale – aşa numitele „teste de
concordanţă”).
Testarea normalităţii
• Metoda algebrică este foarte simplă dar este relativ
subiectivă
• deoarece calculând
1 indicatorii
x   xi (media ) de eşantionaj şi anume:
n
• Media:
 x k 1 , n  2k  1 
 
xme   x k   x k 1 
mediana:  , n  2k 
 2 

 x  x 
3

 x  x 
l1  n
i
coeficientul de asimetrie 2 3/ 2
i

 x  4
x
coeficientul de exces
 x  x 
 n
i
l2 2
2
i

coeficientul lui Geary 1  xi  x

 x 
a  

2 1/ 2
n  x
i
Testarea normalităţii (1)
• este dificil de dat o marjă a aproximărilor
şi
l1  1,2 l2  2

care ar caracteriza legea normală. Oricum, dacă „apropierile” respective nu au loc (de ex.

x  xme  xm0 e1  0, l2  3, a  0,7979

este limpede că nu mai are rost să facem apel la metode mai


sofisticate pentru a depista normalitatea, deoarece valorile asimetriei
şi excesului indică tocmai nenormalitatea datelor.
Testarea normalităţii ( 2)
• Metoda grafică sau „metoda RP” (a reţetelor
probabiliste) a fost pe larg descrisă în limba
română în monografia Wiener-Isaic-Maniu şi
Vodă (1983)
• Pe scurt, RP normală este o hârtie format A4
Într-un anume mod, pe axa verticală fiind fixate
valorile k  3/8
Pk 
n  1/ 4

• (estimaţii ale funcţiei de repartiţie)


• datele x  pe care experimentatorul s-i le
i 1i  n

calculează în cazul său concret, datele fiind


ordonate x   x   .....  x   x   .....  x 
1 2 k k 1 n

• şi înregistrate pe axa orizontală.


RETELE PROBABILISTE
Testarea normalităţii ( 4 )

• Metodele analitice fac apel la un capitol


special al teoriei verificării ipotezelor statistice, şi
anume la testele de concordanţă („goodness-of-
fit” tests) care realizează verificarea
concordanţei repartiţiei emprice (pusă în
evidenţă de datele experimentale) cu repartiţia
teoretică presupusă că „îmbracă” adecvat, că
„se mulează„ cel mai bine pe această repartiţie
empirică.
Testarea normalităţii ( 5 )
• Verificarea concordanţei se poate face fie cu
teste generale, adică
• procedee aplicabile pentru orice model
statistic presupus potrivit pentru datele
observate, fie teste speciale, destinate unui
anume tip de model statistic – de exemplu,
cel normal. Aceste teste se numesc chiar
teste de normalitate sau verificarea
normalităţii. Există evident şi teste pentru
verificarea exponeţiabilităţii a weibullităţii
*etc
• *) de la numele inginerului suedez W.WEIBULL (1900-1979) care în 1939 a propus
o repartiţie statistică pentru descrierea fenomenului defectării care azi îi poartă
numele (vezi Al. Isaic-Maniu, METODA WEIBULL,Ed.Academiei Romane ,1986 )
Testarea normalităţii( 6 )
• Cele mai cunoscute teste generale sunt testul (HI-
PĂTRAT), creat de Karl Pearson încă în 1899 şi aplicabil
pentru eşantioane de efectiv mare (de dorit valori
măsurate; Pearson este „responsabil” şi de inventarea
tremenului goodness-of-fit, în 1895 în lucrarea sa
„Contributions to the mathematical theory of evolution. II.
Skew variation in hemogeneous material”, în Phil. Trans.
Roy. Soc. London, Ser. A, vol. 186, pp. 343-414).
• Respectiv testul KOLMOGOROV-SMIRNOV aparţinând
matematicienilor ruşi Andrei Nicolaevici Kolmogorov
(1903-1987) şi Nikolai Vasilevici Smirnov (1900-1966) în
două lucrări şi anume „Sulla determinazione empirica di
una legge di distribuzione” (Kolmogorov, în „Giornale
dell’Instituto Italiano degli Attanari”, 1933, vol. 4, pp. 83-
91) şi
• „Sur la distribution de ” (Smirnov, în „Comptes Rendue de
l’Academic des sciences de Paris”, 1936, vol. 202, pp. 449-
452).
Testarea normalităţii ( 7 )
• Teste speciale de normalitate le putem clasifica în
funcţie de efectivul eşantionului pe care se lucrează:
• teste pentru eşantioane mici (de regulă, 8  n  50
) – de
exemplu testul Shapiro-Wilk (1965) sau testul Filliben
(1975);
• teste pentru eşantioane moderate (de obicei 50  n  100

• – de pildă testul lui D’Agostino (1971);


• teste pentru eşantioane mari (eventual n  100 ) – de
exemplu testul coeficienţilor pearsonieni l1 şi l2.
• Toate aceste procedee au fost prezentate în literatura
de specialitate înlimba română, aşa că nu le mai reluăm
aici. Mai menţionăm existenţa documentului ISO 5479-
1997 „Tests for departure from the normal distributin” –
tradus şi în limba română sub titlul „Teste pentru
verificarea depărtării de la normalitate” (SRISO 5479).
Testul HI - patrat
• Regiunea critică a testului  pentru verificarea
2

ipotezei p1 = p2 = … = pm se construieşte pe baza


indicatorului statistic de forma:
n
(n i  np i ) 2


i 1 np i
• care pentru n    2
are repartiţia cu n – 1 grade
de libertate
Echivalenţii englezeşti ai termenilor specifici ANOVA, DOE cât şi a
celor conecşi se află în recentul apărut „Dicţionar de statistică
generală”(coordonator Al. Isaic-Maniu, Bucureşti, Editura
Economică, 2003

S-ar putea să vă placă și