Sunteți pe pagina 1din 108

CURS 1.

pdf
CURS 2.pdf
CURS 3.pdf
CURS 4.pdf
CURS 5.pdf
CURS 6.pdf
CURS 7.pdf

Statistic aplicat n inginerie

CURS 1
1. ELEMENTE DE TEORIA PROBABILITILOR
1.1. NOIUNI UTILIZATE N TEORIA PROBABILITILOR
Teoria probabilitilor studiaz experienele aleatoare, acele experiene care reproduse de
mai multe ori se desfoar de fiecare dat n mod diferit, rezultatul neputnd fi anticipat.
Exemple de experiene aleatoare: aruncarea unui zar, tragerile la int, durata de funcionare a
unei maini etc.
n teoria probabilitilor se opereaz cu o serie de noiuni specifice:
Experimentul reprezint realizarea unui ansamblu de condiii conform unui criteriu de
cercetare.
Evenimentul reprezint rezultatul unui experiment.
Exemplul 1: Aruncarea unui zar. Experimentul este reprezentat de realizarea tuturor
condiiilor: zarul este simetric i omogen, suprafaa pe care se arunc zarul este plan i are
un coeficient de frecare uniform. Apariia cifrei 5 reprezint un eveniment.
Exemplul 2: Extragerea unei bile dintr-o urn n care se gsesc bile albe i negre. Acest tip de
experiment este analog cu extragerea unei piese defecte dintr-un lot de fabricaie n care se
gsesc piese bune (bile albe) i piese defecte (bile negre). Criteriul de cercetare
(experimentul) impune ca bilele s aib aceeai dimensiune, s fie uniform amestecate, iar
persoana care face extragerea s nu observe culoarea acestora. Apariia unei bile de
culoare alb reprezint un eveniment.
Teoria probabilitilor opereaz cu trei tipuri de evenimente:
1. Evenimentul sigur este evenimentul care se realizeaz n mod obligatoriu ntr-un
experiment. Acest eveniment se noteaz cu litera E;
2. Evenimentul imposibil este evenimentul cere nu se realizeaz niciodat n cadrul unui
experiment. Acest eveniment este notat cu ;
3. Evenimentul aleator este evenimentul care se poate realiza n cadrul unui experiment.
Evenimentele aleatoare se noteaz cu litere mari: A, B, X, sau A1, A2, A3. n cazul
aruncrii unui zar, apariia cifrei 5 se poate nota astfel: A 5 , iar extragerea din urn a
unei bile albe: X alb ;
Evenimentul contrar evenimentului A se noteaz i este evenimentul care se realizeaz
numai atunci cnd nu se realizeaz evenimentul A.

Statistic aplicat n inginerie


Cmpul de evenimente reprezint totalitatea evenimentelor care pot avea loc n cadrul
unui experiment. n el sunt incluse evenimentul sigur, evenimentul imposibil i toate
evenimentele aleatoare care pot avea loc.
Exemplul 3: n cadrul experimentului aruncarea zarului apar urmtoarele evenimente:

apariia unui numr par sau impar reprezint un eveniment sigur, E;

apariia cifrei 8 - este un eveniment imposibil, ;

apariia cifrei 5 - este un eveniment aleatoriu.

Pentru a putea rezolva aplicaiile n care intervin probabiliti este necesar clasificarea
evenimentelor (figura 1):

COMPATIBILE

INCOMPATIBILE

EVENIMENTE
DEPENDENTE

INDEPENDENTE

Fig.1. Clasificarea evenimentelor

1. Evenimente compatibile: sunt dou sau mai multe evenimente care pot avea loc
simultan n cadrul unui experiment;
2. Evenimente incompatibile: sunt evenimentele care nu pot avea loc simultan n
cadrul unui experiment. n cazul n care realizarea unui eveniment exclude
posibilitatea de realizare a altui eveniment, cele dou poart denumirea de
evenimente contrarii;
Exemplul 4: Se consider experimentul n care se arunc o singur dat o moned. Notm
cu A evenimentul apariiei capului i cu B evenimentul apariiei pajurii. Deoarece
aruncarea monedei se face o singur dat, din cele dou evenimente nu poate avea loc
dect unul singur. n concluzie, cele dou evenimente sunt incompatibile, mai mult ele se
exclud reciproc, deci sunt evenimente contrarii.
Dac experimentul presupune aruncarea monedei de trei ori, cele dou evenimente (A i
B) se produc simultan n cadrul experimentului, deci ele sunt compatibile.
3. Evenimente dependente sunt evenimente ale cror realizri depind de realizarea unui
alt eveniment. Notaia folosit este B|A (realizarea evenimentului B depinde de
realizarea evenimentului A);

Statistic aplicat n inginerie


4. Evenimente independente sunt evenimente ale cror realizri nu depind de realizarea
unui alt eveniment.
Exemplul 5: Considerm extragerea unei bile (piese) dintr-o urn (lot de piese) n care se
gsesc bile albe (piese conforme) i bile negre (piese neconforme). Fie A evenimentul ca la
prima extragere s apar o bil alb (pies conform) i B evenimentul ca a doua bil
extras s fie o bil neagr (pies neconform). Exist dou variante:

dac bila extras prima dat (alb sau neagr) nu este reintrodus n urn, cel de-al
doilea eveniment este dependent de primul, deoarece n urma extragerii unei bile
la prima extragere compoziia urnei se modific; din punct de vedere al
compatibilitii sau incompatibilitii, cele dou evenimente sunt compatibile
deoarece se pot desfura simultan n cadrul experimentului;
dac bila extras prima dat (alb sau neagr) este reintrodus napoi n urn, cel
de-al doilea eveniment este independent de primul, deoarece n urma extragerii
unei bile la prima extragere i reintroducerea ei, compoziia urnei nu se modific.

Exemplul 6: n cazul experimentului aruncrii unui zar de dou ori, fie evenimentele A 5
i B 6 . Evenimentele sunt independente deoarece apariia cifrei 6 nu depinde de faptul
c la aruncarea anterioar a fost sau nu obinut cifra 5. Din punct de vedere al
compatibilitii sau incompatibilitii cele dou evenimente sunt compatibile deoarece se
pot desfura simultan n cadrul experimentului, zarul fiind aruncat de dou ori. Dac
zarul ar fi aruncat o singur dat ar fi fost posibil un singur eveniment, deci cele dou
evenimente ar fi incompatibile.
1.2. OPERAII CU EVENIMENTE
Dou sau mai multe evenimente pot defini printr-o operaie un alt eveniment. Deoarece
evenimentelor li se pot asocia numere, operaiile care se pot face cu evenimente sunt similare
operaiilor din teoria mulimilor.
ntre evenimentele asociate unei experiene pot exista relaii.
1.2.1. Implicarea evenimentelor
Spunem c evenimentul A implic evenimentul B i scriem A B , dac realizarea
evenimentului A atrage dup sine i realizarea evenimentului B.
1.2.2. Reuniunea evenimentelor (suma evenimentelor1)
Considernd evenimentele A i B, reuniunea evenimentelor (suma evenimentelor) nseamn
realizarea cel puin unuia din evenimentele A sau B. Notaia folosit este:

R A B , sau R A B .

ATENIE: NU ESTE SUMA ALGEBRIC

Statistic aplicat n inginerie


n cazul unui sistem de n evenimente Ai (i = 1, 2, ..., n) reuniunea (suma) R se determin astfel:
R A1

A2

An

i1

An A i .

Ai , sau R A1 A2

i1

Exemplul 7: S presupunem c se trag 5 gloane asupra unei inte. Evenimentele posibile sunt:
A 0 = niciun glon nu lovete inta;

A1 = exact un glon lovete inta;


A 2 = exact dou gloane lovesc inta;

A 3 = exact trei gloane lovesc inta;


A 4 = exact patru gloane lovesc inta;
A 5 = exact cinci gloane lovesc inta.

Atunci: B A0

A1

A2 se citete cel mult dou gloane lovesc inta;

C A3

A4

A5 se citete cel puin trei gloane lovesc inta.

1.2.3. Intersecia evenimentelor (produsul evenimentelor2)


Considernd evenimentele A i B, intersecia evenimentelor (produsul evenimentelor)
nseamn realizarea evenimentului A i a evenimentului B. Notaia folosit este:

A B , sau A B .
n cazul unui sistem de n evenimente Ai (i = 1, 2, ..., n) intersecia (produsul) se determin
astfel:
A1

A2

An

n
i1

Ai , sau A1 A2

An A i .
i1

Exemplul 8: La extragerea unei cri dintr-un pachet se consider evenimentele:

A = extragerea unui as;

B = extragerea unei trefle.


Atunci: C A B este extragerea unui as de trefl.
1.2.4. Diferena evenimentelor
Considernd evenimentele A i B, diferena evenimentelor nseamn realizarea evenimentului
A i nerealizarea evenimentului B. Notaia folosit este: A \ B
Exemplul 8: n cazul aruncrii unui zar considerm evenimentele:

A = apariia unei fee cu un numr par de puncte;


2

ATENIE: NU ESTE PRODUS ALGEBRIC

Statistic aplicat n inginerie

B = apariia unei fee cu un numr prim de puncte.


Matematic, cele dou evenimente se scriu astfel:

A 2 , 4 , 6 ;
B 1 , 2 , 3 , 5 .
Atunci: C A \ B 4 , 6 ;

D B \ A 1 , 3 , 5 .
1.2.5. Operaii cu evenimente
Tabelul 1. Principalele operaii cu evenimente
Enun

Relaii

Reflexivitatea relaiei de implicare

AA

Tranzitivitate a relaiei de implicare

A B si B C A C

Echivalena (egalitatea) evenimentelor

A B si B A A B

Contrariul unui eveniment sigur este un eveniment


imposibil (i invers)

Reuniunea sau intersecia unui eveniment A cu el


nsui este egal cu acelai eveniment

AA

AA

A B B A

Reuniunile i interseciile sunt comutative

A B B A

A
A

Reuniunile i interseciile sunt asociative


Intersecia n raport cu reuniunea i reuniunea n
raport cu intersecia sunt asociative

A
A

B
B

B C A

B
B

B C A

A
B A

C A

A A E

Intersecia a dou evenimente contrare


(incompatibile) este un eveniment imposibil

A A

Considernd evenimentele A, B i contrariile A, B ,


exist urmtoarele relaii (relaiile de Morgan):

C A B

Reuniunea a dou evenimentelor contrare


(incompatibile) este un eveniment sigur

Dac E este un eveniment sigur, este un eveniment


imposibil i A un eveniment aleator, exist relaiile:

A E E A A E E
A EA A E

A B A
A B A

B
B

Statistic aplicat n inginerie


1.3. PROBABILITATEA EVENIMENTELOR
1.3.1. Definiia matematic a probabilitii
Probabilitatea unui eveniment reprezint expresia numeric (msura numeric) a posibilitii
de realizare.
Aa cum s-a artat, n cadrul unui experiment se pot produce mai multe evenimente. Numrul
total al acestor evenimente este definit ca numrul cazurilor egal posibile. Dintre acestea,
conform unui criteriu de cercetare, se poate realiza un anumit numr care este definit ca
numrul cazurilor favorabile.
Probabilitatea matematic a unui eveniment se calculeaz ca raport al celor dou numere:
P A

numrul cazurilor favorabile


m
.
numrul cazurilor egal posibile n

Aceast formul se poate aplica n cazul sistemelor n care fiecare caz posibil are aceeai
probabilitate de realizare i compoziia sistemului este cunoscut.
Exemplul 9: Se tie c ntr-un lot format din 100 de buci exist 7 piese defecte. Care este
probabilitatea alegerii unei piese defecte?

A = alegerea unei piese defecte;


m = numrul cazurilor favorabile 7 ;
n = numrul cazurilor egal posibile 100 .
P A

7
0,07 .
100

Exemplul 10: Probabilitatea apariiei cifrei 2 la aruncarea zarului:


m = numrul cazurilor favorabile 1 ;
n = numrul cazurilor egal posibile 6 .
1
P X 2 .
6

1.3.2. Frecvena relativ sau probabilitatea statistic a unui eveniment


Este clar c nu orice experiment repetat are ca rezultat un numr finit de cazuri posibile,
existnd astfel o clas important de evenimente ale cror probabiliti nu pot fi calculate cu
formula anterioar.
Fie un experiment repetat de n ori n aceleai condiii, n care se poate sau nu se poate realiza
un eveniment A.

Statistic aplicat n inginerie


Se numete frecven relativ a evenimentului A n cele n repetri ale experimentului
considerat raportul dintre numrul de apariii ale evenimentului A i numrul total de
observaii (msurtori, ncercri) efectuate.
Frecvena relativ a unui eveniment este adesea numit probabilitate statistic sau empiric.
n acest caz se utilizeaz relaia:
P* A

numrul de apariii ale evenimentului A m

numrul total de observaii


n

Este evident c probabilitatea statistic (frecvena relativ) P* A depinde n general de


numrul total de observaii efectuate.
1
0,5 ,
2
dar dac moneda se arunc doar de 10 ori este posibil ca pajura s apar de 2 ori, deci
2
probabilitatea statistic (frecvena relativ) este numai
0,2 . Prin urmare, probabilitatea
10
statistic are un caracter aleatoriu.

n experiena aruncrii unei monede, apariia pajurii are probabilitatea matematic

Dac numrul de experiene este crescut, frecvena relativ a evenimentului (probabilitatea


statistic) pierde din caracterul aleator, i tinde ca valoare ctre probabilitatea matematic.
Legtura dintre frecvena relativ a unui eveniment i probabilitatea sa este foarte profund,
cele dou noiuni fiind practic inseparabile. Estimarea probabilitii unui eveniment se face
bazndu-ne pe frecvena relativ a unor evenimente analoage n practic.
1.3.3. Proprietile probabilitii ntr-un cmp finit de probabilitate
Sunt urmtoarele:

0 P A 1
P 0
P E 1

P A 1 PA

P A \ B P A P A B
A B P A P B
P A B P A P B P A B

Statistic aplicat n inginerie


1.4. ALGEBRA EVENIMENTELOR
1.4.1. Relaii referitoare la reuniunea i intersecia evenimentelor
Tabelul 2. Relaii referitoare la reuniune i intersecie
Proprietile
evenimentelor

Definiia
evenimentului

Relaii de calcul
2 1
n
P Ai P Ai 1 P A i
i1 i1
i j
n

Compatibile i
dependente
(formula lui
Poincar):

31

P A

i j k

Aj

Ak ... 1

P A B P A P B P A B
Reuniunea

n
P Ai 1 1 P Ai
i1
i1
n

Compatibile i
independente

n
i 1

Ai

P A B 1 1 P A 1 P B
n
P Ai P Ai
i1 i1
n

Incompatibile

P A B P A P B
n
i1
P Ai P Ai | Ai
i1 i1 i1
n

Compatibile i
dependente

P A B P A P B|A
n
P Ai P A i
i1 i1
n

Compatibile i
independente

P A B P A P B
Intersecia

Incompatibile

Compatibile
dependente sau
independente
Incompatibile
(inegalitatea lui
Boole)

n
i 1

Ai

n
P Ai 0
i1

P A B 0

n
P A i P A i n 1
i1 i1
n

P A B P A P B 1

Aj
n1

n
P Ai
i1

Statistic aplicat n inginerie


n cazul unui sistem de evenimente este necesar o analiz a proprietilor evenimentelor i
aplicarea unor metode indirecte de calcul. Etapele care trebuie parcurse sunt urmtoarele:
1. Stabilirea tuturor evenimentelor care ar putea avea loc n cadrul experimentului;
2. Determinarea relaiilor de legtur ntre acestea (operaiile evenimentelor) (tabelul 1);
3. Stabilirea proprietilor evenimentelor (compatibilitate i dependen);
4. Aplicarea relaiilor referitoare la reuniunea i intersecia evenimentelor (tabelul 2).
Exemplul 11: Dintr-o urn n care se gsesc 30 bile albe i 10 bile negre se extrage o bil a crei
culoarea nu se verific i se introduce ntr-o alt urn n care se afl 15 bile albe i 14 bile negre.
Se efectueaz o extragere din a doua urn. Care este probabilitatea ca bila extras s fie alb?
1. Evenimentele care ar putea avea loc sunt:
A1 bila extras din prima urn este alb;
N1 bila extras din prima urn este neagr;
A2 bila extras din urna a doua este alb.
2. Pentru rezolvarea problemei trebuie avut n vedere algebra evenimentelor: poate s se
produc evenimentul A1 sau evenimentul N1 i apoi evenimentul A2. Conform tabelului 1 aceste
evenimente se pot exprima cu relaia:

A1

N1 A2 A1

3. Evenimentele A1

A2 i N1

A2

N1

A2 .

A2 sunt incompatibile (deoarece A1 i N1 nu pot avea loc

simultan la aceeai extragere) i independente. Evenimentul A2 este dependent de A1 (cci


probabilitatea lui A2 se modific dac este introdus o bil alb n a doua urn) i este
compatibil cu acesta. Evenimentul A2 este dependent de N1 (cci probabilitatea lui A2 se
modific dac este introdus o bil neagr n a doua urn) i este compatibil cu acesta.
4. Pe baza tabelului 2 se poate scrie:
P A1

A2

N1

A 2 P A1

A2 P N1

A2 P A1 P A 2 |A1 P N1 P A 2 |N1

30 16 10 15 480 150
630

0,525
40 30 40 30 1200 1200 1200

2.3.4. Formula probabilitilor totale


Pentru un cmp de probabilitate i un sistem complet de evenimente3 Ai (i = 1, 2, , n),
pentru orice eveniment B are loc formula:
n

P B P Ai P B|Ai .
i1

Format din evenimente incompatibile ntre ele, a cror reuniune este evenimentul sigur E.

Statistic aplicat n inginerie


Exemplul 12: Se cunosc produciile realizate de trei maini i procentele de rebut realizate pe
fiecare main:
- prima main produce 30% din totalul pieselor cu un procent de rebut de 3%;
- a doua main produce 20% din totalul pieselor cu un procent de rebut de 2%;
- a treia main produce 50% din totalul pieselor cu un procent de rebut de 1%.
Care este coeficientul de rebut al lotului obinut prin amestecarea produciilor obinute de cele
trei maini?
Se noteaz cu X1 evenimentul producerii pieselor la prima main, cu X2 evenimentul producerii
pieselor la a doua main i cu X3 evenimentul producerii pieselor la a treia main.
Probabilitile acestor evenimente sunt egale cu procentul producerii pieselor.
Se observ c X1 ,X2 ,X3 reprezint un sistem complet de evenimente deoarece ele sunt
X2 ,X1

incompatibile unul cu altul: X1

X3 ,X2

X3 i X1

X2

X3 E .

Se noteaz cu Y evenimentul extragerii unei piese defecte i observm c acest eveniment se


produce simultan cu unul dintre evenimentele X1, X2, X3. Evenimentul Y|X1 reprezint
evenimentul extragerii unei piese defecte de la prima main, probabilitatea acestui
eveniment fiind egal cu coeficientul de rebut. Similar se desfoar evenimentele Y|X2 i
Y|X3.
n

P Y P Xi P Y|Xi
i1

30 3
20 2
50 1
90
40
50
18

100 100 100 100 100 100 10000 10000 10000 1000

Deci coeficientul de rebut este 1,8%.


2.3.5. Teorema ipotezelor (Formula lui Bayes)
Se consider un sistem complet de ipoteze incompatibile A1 ,A2 ,...,An ale cror probabiliti

P A1 ,P A2 ,...,P An sunt cunoscute naintea experimentului (de unde i denumirea de


ipoteze).
Experimentul const n realizarea unui anumit eveniment B cu probabilitatea P B . Se pune
problema de a determina n ce fel realizarea evenimentului B influeneaz probabilitile
ipotezelor, adic trebuie gsite probabilitile condiionale P Ai |B (i = 1, 2, , n)
(probabilitatea ca dup ce tim c un eveniment care poate apare din mai multe cauze s-a
realizat, acesta s se fi realizat dintr-o cauz anume).
Formula lui Bayes permite calculul acestor probabiliti condiionale:

P Ai |B

P Ai P B|Ai
n

P A P B|A
i1

10

Statistic aplicat n inginerie


Exemplul 13: n condiiile desfurrii experimentului conform exemplului 12, s se calculeze
probabilitatea ca o pies defect extras din lot s provin de la maina 1 (X1), adic P X1 |Z :
30 3

90 1
100
100
P X1 |Z n

30 3
20 2
50 1
180
2

P Xi P Z|X i

100 100 100 100 100 100


i1
P X1 P Z|X1

Probabilitatea ca o pies defect extras din lot s provin de la maina 2 (X2), respectiv

P X2 |Z este:

20 2

40 2
100
100
P X2 |Z n

30 3
20 2
50 1
180
9

P Xi P Z|X i

100 100 100 100 100 100


i1
P X2 P Z|X 2

Probabilitatea ca o pies defect extras din lot s provin de la maina 3 (X3), respectiv

P X3 |Z este:

50 1

50
5
100 100
P X 3 |Z n

30 3
20 2
50 1
180 18

P Xi P Z|X1

100 100 100 100 100 100


i1
P X 3 P Z|X 3

Verificare:

1 2 5
9
4
5 18

1.
2 9 18 18 18 18 18

Tem: La unul din examenele din sesiunea de iarn, n cazul unei grupe de 25 de studeni,
situaia notelor este urmtoarea:
5 studeni au primit nota 9 sau 10;
8 studeni au primit nota 7 sau 8;
7 studeni au primit nota 5 sau 6.
Care este probabilitatea ca 3 studeni luai la ntmplare din cei 25 ai grupei s fi primit not
mai mic dect 5?

BIBLIOGRAFIE
1. *** Probabiliti i statistic, www.edumanager.ro
2. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
3. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
11

Statistic aplicat n inginerie

CURS 2
2. STATISTIC MATEMATIC. DISTRIBUII DE PROBABILITATE
2.1. INTRODUCERE
Statistica reprezint un corp de metode utilizate pentru a colecta, descrie i analiza date
numerice din observaii sau investigaii tiinifice i se bazeaz pe aplicarea metodelor
statistice.
Metodele statistice sunt formate din tehnicile utilizate n descrierea sub aspect cantitativ a
caracteristicilor unei colectiviti.
Statistica se mparte n dou categorii majore:
A. Statistica descriptiv: este constituit din totalitatea metodelor utilizate n descrierea
caracteristicilor unei populaii.
B. Statistica inferenial: este reprezentat de totalitatea metodelor statistice utilizate pentru
extinderea/generalizarea observaiilor emise pe baza unui eantion asupra ntregii populaii.
Deopotriv, statistica descriptiv, ct i cea inferenial, utilizeaz indicatori statistici
reprezentativi care caracterizeaz tendina datelor statistice de a se grupa n jurul valorii
centrale, medii sau mijlocii (indicatorii tendinei centrale) i de a identifica tendinele datelor
aflate la periferia distribuiei statistice (indicatorii tendinei dispersionale).
2.2. DISTRIBUIA EMPIRIC
2.2.1. Fia de observaie, diagrame prin puncte i gruparea observaiilor
Rezultatele observrilor, ncercrilor, determinrilor, se nregistreaz, pe msura obinerii, lor n
fia de observare. Aceste date constituie ceea ce numim date iniiale.
Exemplul 1. n tabelul 1 sunt prezentate rezultatele observrii rezistenei Ia rupere a 130 de
arje de font maleabil neagr.
Tabelul 1

Statistic aplicat n inginerie


Deoarece aceeai valoare se poate ntlni ca rezultat al mai multor ncercri este necesar
scrierea datelor n ordine cresctoare. n tabelul 2 s-a fcut aceast operaie pentru datele
prezentate n tabelul 1.
Tabelul 2

Aceste rezultate pot fi prezentate i


sub form grafic i anume, se ia un
sistem de axe ortogonale, pe abscis
se reprezint valorile observate, iar
pe ordonat numrul observaiilor.
Fiecare valoare este reprezentat
printr-un punct ca n figura 1; se
obine astfel diagrama prin puncte.

Fig.1

Tabelul 2 i figura 1 dau o descriere mai clar a distribuiei rezistenei la rupere dect simpla
niruire neordonat a celor 130 de valori iniiale. Se vede astfel c exist tendina de grupare a
valorilor n jurul unei valori, dar colectivitatea este mult prea frmiat i ca urmare tendina
este foarte slab scoas n eviden. O descriere mai bun a distribuiei se poate obine cu
ajutorul gruprii observaiilor n clase.
Prin grupare sau clasificare se nelege distribuirea celor n observaii a1, a2,..., ai,..., n k
intervale numite intervale de grupare.
Dac h1, h2,, hk reprezint mrimile intervalelor i x1, x2,, xk centrele intervalelor, atunci
observaia ai face parte din intervalul i dac satisface inegalitile:

xi

hi
h
ai xi i .
2
2

(2.1)

Se recomand ca mrimile intervalelor hi s fie egale.

Statistic aplicat n inginerie


Totalitatea valorilor care aparin unui interval dat se numete clas.
Pentru fiecare interval se stabilesc urmtoarele mrimi (vezi tabelul 3):
frecvena absolut ni, (i = 1, 2,..., n), adic numrul observaiilor care aparin unui
interval oarecare i;
frecvena absolut cumulat, adic numrul tuturor observaiilor crora le corespund
h
valori mai mici sau cel mult egale cu limita superioar xi i a intervalului i;
2
frecvena relativ

ni
, adic raportul dintre frecvena absolut i numrul total n al
n

observaiilor;
frecvena relativ cumulat Fn(xi), adic suma frecvenelor relative corespunztoare
intervalului i i intervalelor precedente, sau raportul dintre:
o numrul observaiilor crora le corespund valori mai mici sau cel mult egale cu
h
limita superioar xi i a intervalului i i;
2
o numrul tuturor observaiilor n.
Tabelul 3

Mrimea intervalelor trebuie astfel stabilit nct domeniul de variaie a observaiilor s fie
mprit n aproximativ 10 intervale. Numrul intervalelor ns poate varia de la caz la caz n
funcie de condiiile concrete n care se desfoar cercetarea, dar nu trebuie s fie mai mic de
5 i mai mare de 20.
Mrimea intervalului trebuie s aib n vedere numrul observaiilor. Cnd numrul
observaiilor este mai mic, caracterul distribuiei nu poate fi scos n evident dect dac avem
un numr mai mic de intervale, respectiv mrimea acestora este mai mare. Cu ct numrul
intervalelor este mai mare, respectiv mrimea acestora este mai mic, ies n eviden oscilaiile

Statistic aplicat n inginerie


ntmpltoare, iar cu ct mrimea intervalelor este mai mare, oscilaiile ntmpltoare se
anihileaz i sunt puse n eviden trsturile fundamentale ale distribuiei.
Numrul intervalelor se poate calcula cu una din urmtoarele relaii:
1. Relaia lui H. A. Sturges (cea mai des utilizat):

m 1 3,322 log n ,

(2.2)

unde n reprezint numrul total al datelor observate;


2. Relaia lui H. B. Mann i A. Wald pentru n > 100:
1

1
5
m 4 n 1 .
4

(2.3)

3. Prin adoptarea numrului ntreg dat de relaia:

m n .

(2.4)

S-a constatat c pentru n < 250 este suficient gruparea n zece clase. Dac u i v sunt limitele
intervalului de grupare intervalul se consider ntotdeauna semi-nchis, fie (u,v] fie [u,v).
Mrimea intervalului se calculeaz astfel:

xmax xmin
.
m

(2.5)

Exemplul 2. Se scrie distribuia rezistenei la rupere a celor 130 de arje. n tabelul 4 sunt date
frecvenele absolute, frecvenele absolute cumulate, frecvenele relative, i frecvenele relative
54,5 28
cumulate, m 10 , h
2,65 3 kg/mm2.
10
Tabelul 4
Rezistena
la rupere

Centrul
intervalelor

Frecv. abs.

Frecv. abs.
cum.

Frecv. rel.

Frecv. rel.
cum.

[27-30)

28,50

0,008

0,008

[30-33)

31,50

0,031

0,038

[33-36)

34,50

24

29

0,185

0,223

[36-39)

37,50

42

71

0,323

0,546

[39-42)

40,50

28

99

0,215

0,762

[42-45)

43,50

16

115

0,123

0,885

[45-48)

46,50

123

0,062

0,946

[48-51)

49,50

127

0,031

0,977

[51-54)

52,50

129

0,015

0,992

[54-57]

55,50

130

0,008

1,000

130

1,000

Statistic aplicat n inginerie


2.2.2. Reprezentarea grafic a distribuiilor empirice
Pentru a putea pune n eviden caracterul variaiei i trsturilor fundamentale ale unei
distribuii se face apel la reprezentrile grafice i anume: histograma frecvenelor absolute i
relative, poligonul frecvenelor absolute i relative, precum i poligonul frecvenelor relative
i absolute cumulate.
n vederea reprezentrii grafice se alege un sistem de axe i unitile de msur pe cele dou
axe. Pe abscis se fixeaz intervalul de variaie, iar pe ordonat, care se traseaz n vecintatea
valorii celei mai mici a variabilei (limita inferioar a intervalului de variaie), se stabilete scara
pentru frecvenele absolute, respectiv relative.
Histograma frecvenelor absolute, respectiv relative, se obine construind pentru fiecare
interval un dreptunghi cu baza egal cu mrimea intervalului, iar nlimea egal sau
proporional cu frecvena absolut, respectiv relativ, a intervalului.
Exemplul 3. n figura 2 se d histograma frecvenelor relative pe baza datelor tabelului 4.
Poligonul frecvenelor relative, respectiv absolute, se obine unind punctele care au ca abscise
centrele intervalelor, iar ca ordonat un numr egal sau proporional cu frecvenele relative,
respectiv absolute.
n figura 3 se d poligonul frecvenelor relative constituit pe baza datelor din tabelul 4.
Proieciile extremitilor segmentelor trebuie s coincid cu centrul intervalelor.

Fig.2

Fig.3

Exemplul 4. n figura 4 se d poligonul


frecvenelor relative cumulate construit pe
baza datelor din tabelul 4.

Fig.4

Statistic aplicat n inginerie


2.2.3. Parametrii tendinei centrale sau ai centrului de grupare
Dup cum se poate vedea n figurile 2 i 3, valorile variabilei se grupeaz n jurul unei anumite
valori care poart numele de centrul de grupare al colectivitii cercetate. Centrul de grupare
poate fi caracterizat cu ajutorul unor parametri ca: modul, median i medie aritmetic.
Modulul. Prin definiie, modulul este valoarea cea mai probabil a variabilei, adic valoarea
variabilei creia i corespunde frecvena absolut sau relativ cea mai mare. Potrivit definiiei,
modulul corespunde punctului maxim al distribuiei. Dac distribuia are un singur maxim, se
numete unimodal. n general, distribuia unei colectiviti omogene are un singur maxim.
Dac distribuia empiric are mai multe maxime, se va numi multimodal.
Pentru datele din tabelul 1 ordonate cresctor n tabelul 2, modulul are valoarea 37,5.
Cnd valorile variabilei sunt grupate n intervale, exist dou metode pentru stabilirea
modulului:
A. Modulul se consider centrul intervalului care conine cele mai multe valori
Pentru datele din tabelul 1 grupate n tabelul 4 valoarea modulului este egal cu centrul
intervalului [36-39), adic 37,5.
B. Cu urmtoarea formul de calcul:
Mo Lim_inf_int

1
h ,
1 2

(2.6)

unde: Lim_inf_int = limita inferioar a intervalului care are cele mai multe valori;

1 = diferena dintre frecvena absolut corespunztoare intervalului care are cele mai
multe valori i cea a intervalului anterior (atunci cnd seria este cresctoare);

2 = diferena dintre frecvena absolut corespunztoare intervalului care are cele mai
multe valori i cea a intervalului urmtor;
h = mrimea intervalului de clas.
Pentru datele din tabelul 1 grupate n tabelul 4 valoarea modulului este:
1
h
1 2
42 24
18
36
3 36
3 36 1,68 37,68
18 14
42 24 42 28

Mo Lim_inf_int

(2.7)

x1 ,x 2 ,...,x i ,..., xk
Mediana. Fie
o distribuie empiric.
n1 ,n2 ,...,ni ,..., nk
Mediana este valoarea care mparte seria statistica ordonat (cresctor sau descresctor) n
doua subserii de volume egale, volumele fiind msurate n numr de uniti statistice.

Statistic aplicat n inginerie


Dac seria are un numr impar de valori, n = 2p + 1, atunci mediana este valoare de rang p + 1,
adic este valoarea care ocup poziia central.
Dac seria are un numr par de valori, n = 2p, atunci mediana este media aritmetic a valorilor
de rang p i p + 1.
Pentru datele din tabelul 1 ordonate cresctor n tabelul 2, fiind un numr par de valori
(130=265), nseamn c mediana va fi egal cu media aritmetic a valorilor de rang 65 (=38) i
66 (=38,5):

Me

38 38,5
38,25 .
2

(2.8)

Cnd valorile variabilei sunt grupate n intervale, exist dou metode pentru stabilirea
medianei:
A. Mediana se consider centrul intervalului care cuprinde valoarea de rang p + 1 dac n este
impar, sau media valorilor centrelor intervalelor care cuprind valorile de rang p i p + 1 dac n
este par. Pentru datele din tabelul 1 grupate n tabelul 4 valoarea medianei, deoarece valorile
corespunztoare rangurilor 65 i 66 aparin aceluiai interval [36,39) este:

Me

37,5 37,5
37,5 .
2

(2.9)

B. Calculul bazat pe dou secvene:


1. calculul cotei elementului median (poziia elementului median n cadrul irului de valori):
a. Pentru un ir par de valori cota medianei se calculeaz conform formulei:

CotaMe

N
;
2

(2.10)

b. Pentru un ir impar de valori, cota medianei se calculeaz conform formulei:

CotaMe

N1
.
2

(2.11)

2. calculul valorii efective a medianei pe baza pe baza identificrii cotei acesteia:


Me Lim_inf_int

CotaMe fc
h ,
fi

(2.12)

unde: Lim_inf_int = limita inferioar a intervalului real care conine elementul median;
CotaMe = cota calculat pentru elementul median;
fc = frecvena absolut cumulat a clasei anterioare celei care cuprinde
elementul median;
fi = frecvena absolut corespunztoare clasei care cuprinde elementul median;
h = mrimea intervalului de clas.

Statistic aplicat n inginerie


Pentru datele din tabelul 1 grupate n tabelul 4 valoarea medianei se calculeaz astfel:

CotaMe

N 130

65 ,
2
2

Me Lim_inf_int

(2.13)

CotaMe fc
65 29
h 36
3 36 2,57 38,57.
fi
42

(2.14)

Media aritmetic. Media se definete ca suma valorilor variabilei empirice mprit la numrul
lor. Dac x1 ,x2 ,...,xi ,..., xn sunt valorile observate, atunci media este:
n

x
i1

(2.15)

x ,x ,...,x i ,..., xk
Dac 1 2
este distribuia empiric a caracteristicii X, atunci media este:
n1 ,n2 ,...,ni ,..., nk
k

x n x n
i

i1

n
i 1

i1

(2.16)

Cnd valorile variabilei sunt grupate n intervale, xi reprezint centrul fiecrui interval, iar ni
reprezint frecvena absolut a fiecrui interval.
Pentru datele din tabelul 1 grupate n tabelul 4 valoarea mediei aritmetice este 39,369.
Dispersia. Abaterea medie ptratic. Pe lng cunoaterea centrului de grupare al variabilei
ntmpltoare este necesar s se calculeze un parametru care s arate cum se mprtie
valorile variabilei n jurul centrului de grupare (parametrul mprtierii sau concentraiei).
Dac centrul de grupare este caracterizat prin media aritmetic x , atunci drept parametru al
mprtierii se consider dispersia distribuiei:
n cazul n care dispunem de date asupra ntregii populaii (lotului) sau dispunem de o
selecie de mrime mare n 40 :
k

xi x
i1

n
i1

ni

x x
i1

ni

(2.17)

n cazul n care dispunem de o selecii de mrime mic n 40 , estimarea dispersiei


populaiei se face cu ajutorul dispersiei de selecie:

Statistic aplicat n inginerie


k

s
2

xi x

i1

ni

n 1

x x

i1

ni

n1

(2.18)

i1

Cnd valorile variabilei sunt grupate n intervale, xi reprezint centrul fiecrui interval, iar ni
reprezint frecvena absolut a fiecrui interval.
Pentru a avea un parametru al mprtierii cu aceeai dimensiune cu variabila empiric se
folosete rdcina ptrat a dispersiei care se numete abatere medie ptratic (abatere
standard):
k

xi x ni

i1

n
i1

x x

i1

ni
.

(2.19)

respectiv abaterea medie ptratic de selecie (abaterea standard de selecie):


k

xi x ni

i1

n 1
i1

x x
i1

ni
.

n1

(2.20)

Abaterea medie ptratic este un parametru al mprtierii, ea caracteriznd modul cum se


mprtie valorile n jurul valorii medii !!!
Amplitudinea mprtierii.
Un alt parametru al mprtierii este amplitudinea mprtierii care se noteaz cu R i analog
cu abaterea medie ptratic msoar concentraia masei n jurul valorii medii.
Prin definiie, amplitudinea mprtierii este diferena dintre valoarea cea mai mare i valoarea
cea mai mic a variabilei, adic:

R xmax xmin .

(2.21)

Coeficient de variaie
Prin definiie se numete coeficient de variaie, raportul dintre abaterea medie ptratic i
media aritmetic, adic:

CV

s
.
x

(2.22)

Prezint mai intuitiv dect abaterea standard gradul de mprtiere a rezultatelor n jurul
mediei deoarece este o expresie procentual a mpririi abaterii standard la medie. Cu ct
valoarea lui CV este mai aproape de zero cu att variaia este mai slab, colectivitatea este mai
omogen, media avnd un grad ridicat de reprezentativitate. Cu ct valoarea lui CV este mai
mare cu att variaia este mai intens, colectivitatea este mai eterogen, iar media are un nivel
9

Statistic aplicat n inginerie


de semnificaie sczut. Se poate afirma c acest indicator poate fi folosit ca un test n aplicarea
metodei gruprii.
Concluzie:
Un coeficient de variaie mai mic de 0,15 indic un grad de mprtiere redus, media
fiind un bun indicator al tendinei centrale;
Un coeficient de variaie cuprins ntre 0,15 i 0,40 arat o mprtiere moderat, caz n
care reprezentativitatea mediei este satisfctoare;
Un coeficient de variaie de peste 0,40 arat o mprtiere mare, media nemaifiind un
bun indicator pentru tendina central, datele trebuind a fi separate n serii de
componente, pe grupe, n funcie de variaia unei alte caracteristici de grupare.
Observaie: dac media aritmetic este apropiat de zero, coeficientul de variaie nu are
semnificaie !!!
Quantile. Dac examinm definiia medianei, observm c aceasta reprezint valoarea
variabilei creia i corespunde frecvena absolut cumulat egal cu jumtate din numrul total
al observaiilor (valorilor), adic mediana este valoarea care mparte volumul colectivitii n
dou pri egale.
Noiunea de median poate fi extins. Astfel putem considera valorile variabilei care mpart
volumul colectivitii n patru pri egale. Exist n acest caz trei valori ale cror numere de
ordine sunt:

n n n 2
n n n 3
,
n,
n.
4 4 4 4
4 4 4 4

(2.23)

n general, valorile variabilei care mpart volumul colectivitii se numesc quantile.


Revenind la definiia medianei observm c numrul valorilor mai mici sau cel mult egale cu
n
mediana este egal cu jumtatea volumului colectivitii, adic . Rezult atunci c frecvena
2
1
relativ cumulat corespunztoare medianei este egal cu , sau c mediana este valoarea
2
1
creia i corespunde o frecven relativ cumulat egal cu .
2
Generaliznd aceast observaie, quantilul se poate defini ca fiind valoarea variabilei creia i
corespunde o frecven relativ cumulat dat. Astfel quantilul de 0,10 reprezint valoarea
variabilei creia i corespunde o frecven relativ cumulat egal cu 0,10. Dac frecvena
relativ cumulat se exprim n procente, atunci quantilul de 10% este acea valoare a variabilei
care nu este depit de 10% din totalitatea valorilor.
Determinarea quantilelor se poate face cu uurin pe cale grafic. Pentru aceasta se
construiete poligonul frecvenelor relative cumulate, iar quantilul corespunztor este abscisa
punctului a crui ordonat este egal cu frecvena dat.

10

Statistic aplicat n inginerie


2.3. DISTRIBUII DE PROBABILITATE ALEATOARE
2.3.1. Distribuii de probabilitate de tip discret
n terminologia teoriei probabilitilor, se noteaz cu X variabila probabilist cu mai multe
valori posibile i cu xi o anumit valoare particular a variabilei X. Variabila X care ia n orice
interval finit doar un numr finit de valori se numete variabil discret. Dac se dau valorile
posibile ..., x-3, x-2, x-1, x0, x1, x2, x3, ... ale variabilei ntmpltoare X n coresponden cu
probabilitile ca variabila s ia aceste valori se spune c s-a dat distribuia variabilei X.
Deoarece variabila este de tip discret, se spune c avem de-a face cu o distribuie de tip
discret. Distribuia variabilei discrete se prezint de obicei sub form de tabel.
X

x-3

x-2

x-1

x0

x1

x2

x3

P(x)

P(x-3)

P(x-2)

P(x-1)

P(x0)

P(x1)

P(x2)

P(x3)

Probabilitatea corespunztoare valorii xi depinde de aceasta din urm i este legat de ea


printr-o relaie bine determinat. Probabilitatea ca valoarea unei variabilei probabiliste X s fie
egal cu o anumit valoare xi se noteaz astfel:

P X xi P xi f x i .

(2.24)

Funcia f xi se numete funcie de frecven.


Fiecare din valorile X xi (i = ..., -3, -2, -1, 0, 1, 2, 3, ...) poate fi considerat ca un eveniment.
De aceea putem nota cu Ai evenimentul care const n apariia valorii xi a variabilei
ntmpltoare X. n fiecare ncercare se obine neaprat una, dar numai una din valorile X xi .
Prin urmare evenimentele Ai sunt incompatibile i formeaz un sistem complet de
evenimente:

... A3

A2

A1

A0

A1

A2

A3 ... E ,

(2.25)

unde E este evenimentul sigur.


De aici rezult c suma probabilitilor corespunztoare tuturor valorilor X xi (i = ...-3, -2, -1,
0, 1, 2, 3, ...) ale variabilei ntmpltoare este egal cu 1:

... P x 3 P x 2 P x 1 P x 0 P x1 P x2 P x3 ... 1 ,

(2.26)

Px 1 .

(2.27)

n aplicaii practice ne intereseaz adesea probabilitatea ca valorile variabilei ntmpltoare s


fie mai mic sau cel mult egal cu o valoare dat xk.

11

Statistic aplicat n inginerie


S notm cu B evenimentul care const n gsirea unei valori mai mici sau cel mult egal cu o
valoare dat X xk a variabilei ntmpltoare. Evenimentul B se produce atunci cnd se
produce unul din evenimentele A-3, A-2, A-1, A0, A1, A2, A3, ..., Ak, adic:

B ... A3

A2

A1

A0

A1

A2

A3... Ak ,

(2.28)

iar probabilitatea evenimentului B este:


k

P B ... P A 3 P A 2 P A 1 P A 0 P A1 ... P Ak P Ai .

(2.29)

Dar P B reprezint probabilitatea ca valorile variabilei X s fie mai mici sau cel puin egale cu o
valoare dat X xk , adic P X xk aa nct se poate scrie:

P X xk ... P x 3 P x 2 P x 1 P x 0 P x1 ... P xk ,

(2.30)

P X xk P x i .

(2.31)

Dup cum se vede din (2.31), probabilitatea P X xk depinde de valorile variabilei


ntmpltoare X, prin urmare este o funcie de x. Probabilitatea ca valorile variabilei
ntmpltoare s fie mai mici sau cel mult egale cu o valoare dat X xk se numete funcie de
distribuie (cumulativ) i se noteaz cu F xk , adic:
k

F xk P X xk P x i .

(2.32)

n figura 5 sunt reprezentate valorile funciei de


distribuie corespunztoare unei variabile discrete.
Dac xa i xb sunt dou valori oarecare ale variabilei i
dac xa < xb, atunci:

F x a F xb ,
prin urmare
cresctoare.

funcia

de

(2.33)
distribuie

este

strict

Fiind suma unor probabiliti, funcia de distribuie


este o cantitate pozitiv adic:

F x 0 .

(2.34)

Fig.5

Din (2.27) i (2.34) rezult:

0 F x 1 ,

(2.35)

adic funcia de distribuie (cumulativ), ca orice probabilitate, este cuprins ntre zero i unu.

12

Statistic aplicat n inginerie


n practic se pune adesea problema determinrii probabilitii ca valorile variabilei
ntmpltoare X s se gseasc ntre dou valori date xa i xb, unde a < b, adic:

P x a X xb .

(2.36)

Evenimentul X xb se descompune n evenimentele X xa i xa X xb :

P X xb P X x a P x a X x b ,

(2.37)

P x a X xb P X x b P X x a ,

(2.38)

de unde:

care se poate scrie:

P x a X xb F x b F x a .

(2.39)

Dar
b

F xb P x i , iar F x a P x i ,

(2.40)

rezult:
b

P x a X xb P x i P x i

Px .

i a 1

(2.41)

Prin urmare probabilitatea ca valorile variabilei X s fie cuprinse ntre dou valori date a i b
este egal cu suma probabilitilor corespunztoare valorilor lui X care satisfac inegalitatea
xa X xb .
2.3.2. Distribuii de probabilitate de tip continuu
Variabila ntmpltoare X care poate lua orice valoare ntr-un interval dat se numete variabil
de tip continuu. O variabil de tip continuu are o distribuie de tip continuu dac funcia de
distribuie (cumulativ) F x este continu peste tot, sau aproape peste tot n intervalul dat.
Din punct de vedere practic, o variabil continu se poate prezenta ca o variabil discret, i
h
h

anume se stabilesc anumite intervale x i , x i , iar valorile variabilei sunt distribuite


2
2

ntre aceste intervale respectnd urmtoarea condiie:

h
h
xi x xi .
2
2

(2.42)

Funcia de distribuie (cumulativ) reprezint probabilitatea ca valorile variabilei X s fie mai


mici sau cel mult egale cu o valoare dat x, adic:

F x P X x .

(2.43)

13

Statistic aplicat n inginerie


Funcia de distribuie a variabilei ntmpltoare de
tip continuu este o funcie pozitiv, cresctoare,
definit n intervalul

, ,

astfel nct

F 0 i F 1 . n figura 6 se d graficul
unui exemplu de funcie de distribuie continu.
Dac funcia de distribuie este continu i are o
derivat continu, atunci se spune c att variabila
ntmpltoare X, ct i distribuia ei sunt continue.

Fig.6

Derivata funciei de distribuie:

f x

dF x
,
dx

(2.44)

se numete funcie de frecven a distribuiei


variabilei ntmpltoare.
Dac C este curba funciei de frecven C f x ,
atunci funcia de distribuie F x reprezint aria
haurat din figura 7 limitat de curba C f x , de

Fig.7

axa absciselor i de perpendiculara dus n punctul


Xx.
Funcia de distribuie se calculeaz cu ajutorul integralei:

Fx

f x dx .

(2.45)

innd seama de proprietile funciei de distribuie avem:

f x dx 1 ,

(2.46)

adic masa de probabilitate distribuit pe ntreaga arie limitat de funcia de frecven i axa
absciselor este egal cu unitatea.
n general, ori de cte ori se d funcia de frecven sau funcia de distribuie, se spune c s-a
dat legea de distribuie a variabilei ntmpltoare.
2.3.3. Quantile
n cazul distribuiilor empirice, quantilul a fost definit ca valoarea variabilei corespunztoare
unei valori date a frecvenei relative cumulate.
Quantilele pot fi definite ca valori ale variabilei ntmpltoare corespunztoare unei valori
date a funciei de distribuie.

14

Statistic aplicat n inginerie


Dac variabila ntmpltoare este discret i ia valorile xi = ..., x-3, x-2, x-1, x0, x1, x2, x3,..., iar
f x este funcia de frecven, atunci quantilul xp se determin din relaia:

P P X xp F xp

xp

f x ,

(2.47)

unde P este o valoare dat.


Dac variabila ntmpltoare este continu i se distribuie dup o lege a crei funcie de
frecven este f x , atunci quantilul xp corespunztor probabilitii P se determin din relaia:
P P X xp F xp

xp

f x dx .

(2.48)

Pentru legile de distribuie utilizate sunt ntocmite tabele n care se dau valorile funciei de
distribuie corespunztoare valorilor X = x ale variabilei ntmpltoare. Prin urmare quantilul xp
se gsete n tabele i reprezint valoarea lui x care corespunde valorii date a probabilitii
P F x p . n aplicaiile software dedicate calculului statistic, pentru majoritatea distribuiilor de

probabilitate teoretice, au fost elaborate metode de rezolvare a ecuaiei P F xp .


2.3.4. Valoarea medie a variabilei ntmpltoare
Fie X o variabil ntmpltoare care urmeaz legea de distribuie dat de funcia de frecven
f x .

Dac X este o variabil discret care ia valorile X xi (i = -, ..., -3, -2, -1, 0, 1, 2, ..., +),
valoarea medie M[X] a variabilei X se calculeaz cu ajutorul formulei:

M x x i f x i .

(2.49)

Dac X este o variabila este continu, valoarea medie M[X] a variabilei X se calculeaz cu
ajutorul formulei:

M X

x f x dx ,

(2.50)

Valoarea medie empiric se calculeaz cu ajutorul formulei:


p

x n
j

j1

n
j1

(2.51)

unde x j reprezint valorile variabilei dac variabila este discret, sau centrele intervalelor dac
variabila este continu, iar nj indic de cte ori se repet aceeai valoare dac distribuia este

15

Statistic aplicat n inginerie


discret, respectiv numrul valorilor observate care aparin intervalului j dac distribuia este
continu. mprind att numrtorul ct i numitorul din partea dreapt a relaiei (2.51) cu
p

n nj se obine:
j1

x n
j

j1

j1

nj

j1

xj

j
p

xj r x j ,

(2.52)

j1

n
unde r x j sunt frecvenele relative corespunztoare valorilor x j .
n baza teoremei lui Bernoulli1 probabilitile P xi f xi se nlocuiesc n practic cu
p

n
frecvenele relative

j 1

nj
n

, unde n este numrul total de observaii.

n cazul n care numrul observaiilor este mare, n cazul variabilelor discrete putem scrie:
p

j1

M X x i f x i x x j r x j

x n
j

j1

n
j1

(2.53)

iar n cazul variabilelor continue:


k

M X

j1

x f x dx x x r x
j

x n
j

j1

(2.54)

n
j1

Dac X i Y sunt dou variabile ntmpltoare, atunci media aritmetic a sumei celor dou
variabile, X+Y, este egal cu suma mediilor variabilelor, adic:

MX Y MX MY .

(2.55)

Dac se consider un eveniment A a crui probabilitate de realizare este p, frecvena relativ, adic raportul
dintre numrul ni care indic de cte ori s-a realizat evenimentul A i numrul total n al probelor, tinde ctre p n
probabilitate. Teorema lui Bernoulli este cunoscut i sub denumirea de legea numerelor mari care se enun
astfel: ntr-un numr mare de ncercri, repetate n aceleai condiii, frecvena relativ a fiecruia din evenimentele
posibile este foarte apropiat de probabilitatea fiecrui eveniment. Apropierea este cu att mai mare cu ct
numrul ncercrilor este mai mare. Reiese din cele de mai sus c precizia msurrii empirice (cu ajutorul frecvenei
relative) a probabilitii este cu att mai mare cu ct numrul ncercrilor este mai mare.

16

Statistic aplicat n inginerie


n general se poate enuna urmtoarea teorem: Valoarea medie a sumei mai multor variabile
ntmpltoare este egal cu suma valorilor medii ale fiecrei variabile ntmpltoare:

MX1 X2 ... Xn MX1 MX2 ... MXn .

(2.56)

S considerm acum produsul variabilelor ntmpltoare independente XY. Media produsului


a dou variabile ntmpltoare este egal cu produsul dintre mediile fiecrei variabile, adic:

MX Y MX MY .

(2.57)

n general, media produsului mai multor variabile ntmpltoare independente dou cte
dou este egal cu produsul mediilor fiecrei variabile, adic:

MX1 X2 ... Xn MX1 MX2 ... MXn .

(2.58)

2.3.5. Momentele variabilei ntmpltoare


Momente. Prin definiie, momentul de ordinul r al distribuiei discrete se determin formula:

Mr xri f x i ,

(2.59)

iar n cazul distribuiei continue cu formula:

Mr

x f x dx .
r

(2.60)

Se observ c momentul de ordinul 1 (r = 1) reprezint media variabilei ntmpltoare Mx .


Momente centrate. Dac valorile variabilei X sunt raportate la punctul de abscis x = M1, unde
M1 este momentul de ordinul nti, atunci momentele care se obin utiliznd n locul valorilor
variabilei, abaterile xi M1 se numesc momente centrate.

n cazul distribuiei discrete momentul centrat de ordinul r se calculeaz formula:

mr x i M1 f x i ,
r

(2.61)

iar n cazul distribuiei continue cu formula:

mr

x M f x dx .
r

(2.62)

Pentru r = 1, pentru cazul distribuiei discrete se obine:

m1 xi M1 f xi xi f x i M1 f x i M1 M1 0 ,
i

M1

17

(2.63)

Statistic aplicat n inginerie


iar pentru cazul distribuiei continue:

m1

x M1 f x dx x f x dx M1 f x dx M1 M1 0 ,
1

M1

(2.64)

Prin urmare, media diferenelor dintre valorile variabilei i media variabilei este egal cu zero.
Pentru r =2, pentru cazul distribuiei discrete se obine:

m2 x i M1 f x i ,
2

(2.65)

iar pentru cazul distribuiei continue:

m2

x M f x dx .
2

(2.66)

Momentul centrat de ordinul doi sau media ptratelor diferenelor dintre valorile variabilei i
media aritmetic se numete dispersie i se noteaz cu D X :
2
D X M x M1 .

(2.67)

Se demonstreaz c dispersia mai este egal cu diferena dintre momentul de ordinul doi i
ptratul momentului de ordinul nti:

DX M2 M12 .

(2.68)

Abaterea medie ptratic se definete ca fiind rdcina ptrat a dispersiei, adic:

X D X .

(2.69)

2.3.6. Coeficient de variaie


Prin definiie se numete coeficient de variaie, raportul dintre abaterea medie ptratic i
momentul de ordinul nti (media aritmetic), adic:

CV

M X

(2.70)

2.3.7. Variabila ntmpltoare normat


Fie x1, x2, , xn valorile variabilei ntmpltoare X care se distribuie dup legea de distribuie

F x i are media M[X] i dispersia de D[X]. Variabila Z ale crei valori zi se calculeaz cu

formula:

zi

xi M X

(2.71)

18

Statistic aplicat n inginerie


se numete variabil ntmpltoare normat.
Media variabilei ntmpltoare normat este:
x M X
1
M Z M
M x MX .

(2.72)

S-a artat n (2.63) i (2.64) c M x M X 0 , deci:

MZ

1
0 0 .
X

(2.73)

Dispersia variabilei ntmpltoare normat este:

x M X 2
2
1
D Z M Z M
2 M x MX .
X X

(2.74)

2
M x M X D X 2 X ,

(2.75)

Dar:

prin urmare:

D Z

X
2

2 X 1 .

(2.76)

Concluzie: variabila ntmpltoare normat are media 0 i dispersia, deci i abaterea medie
ptratic egale cu 1 !!!

BIBLIOGRAFIE
1. *** Probabiliti i statistic, www.edumanager.ro
2. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
3. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
4. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963

19

Statistic aplicat n inginerie

CURS 3
2. STATISTIC MATEMATIC. DISTRIBUII DE PROBABILITATE
2.4. DISTRIBUII DE PROBABILITATE TEORETICE
2.4.1. Distribuia binomial
Este o distribuie de probabilitate discret care se aplic atunci cnd exist numai dou
rezultate posibile: succes sau eec, admis sau respins, promovat sau nepromovat, produs
conform sau produs neconform (rebut), alb sau negru, zero sau unu, adevrat sau fals etc.
De exemplu, variabila probabilist considerat este reprezentat de numrul experimentelor cu
succes: dac probabilitatea p a succesului este aceeai pentru fiecare din cele n
experimente, iar experimentele sunt independente, atunci funcia de probabilitate
(frecvenele relative) este definit prin probabilitatea ca numrul experimentelor de succes s
fie egal cu o anumit valoare xi i poate fi calculat cu expresia:
f x i Cnxi pxi (1 p)nxi

n!
n!
pxi (1 p)nxi
pxi qnxi (2.77)
x i ! n x i !
x i ! n x i !

pentru xi = 0, 1, 2, , n, unde q = 1 p reprezint probabilitatea eecului, iar n este numrul


total de experimente. Deoarece Cnx px qnx este termenul general al dezvoltrii binomului

p q

, distribuia variabilei X a crei probabilitate se calculeaz cu ajutorul formulei (2.77) se

numete distribuie binomial.


Funcia de distribuie (frecvenele relative cumulate) are expresia:
x xi

n!
n x
p x 1 p .
x 0 x! n x !

F xi P X xi

Funcia de probabilitate

(2.78)

Funcia de distribuie

Cunoscnd funcia de frecven se obin expresiile mediei i dispersiei distribuiei binomiale:

MX m n p ,

(2.79)

Statistic aplicat n inginerie

DX 2 n p 1 p .

(2.80)

APLICAIE. ntr-o turntoriei, din cercetri anterioare s-a stabilit c probabilitatea ca o arj s fie
necorespunztoare este egal cu 0,2. Considernd c ntr-un schimb se elaboreaz 10 arje, s se studieze
distribuia numrului de arje necorespunztoare/schimb.
Pentru

generarea

distribuiei

teoretice

bimomiale,

se

folosete

din

aplicaia

Excel

funcia

BINOMDIST(numar_s,incercari,probabilitate_s,val_logica):
Sintaxa funciei BINOMDIST are urmtoarele argumente:
numar_s

Obligatoriu. Este numrul de succese din experimente.

incercari

Obligatoriu. Este numrul de experimente independente.

probabilitate_s

Obligatoriu. Este probabilitatea de succes la fiecare experiment.

val_logica

Obligatoriu. Este o valoare logic ce determin forma funciei.


Dac este TRUE, atunci BINOMDIST ntoarce funcia de distribuie
(cumulativ); dac este FALSE, BINOMDIST ntoarce funcia de
frecven.

Rezolvare
Variabila X (numrul de arje necorespunztoare ntr-un schimb) poate lua valorile 0, 1, 2,..., 10. Probabilitile
corespunztoare acestor valori se calculeaz cu ajutorul formulelor:

Pn x

n!

n x

p q
x

x! n x !

sau pot fi calculate cu funcia BINOMDIST (vezi fiierul CURS 3.xls).

10

0,2

DISTRIBUTIA BINOMIALA
Nr. sarjelor
Functia de Functia de
necoresp.
frecventa distributie
(x)
0
0,107374182 0,1073742
1
0,268435456 0,3758096
2
0,301989888 0,6777995
3
0,201326592 0,8791261
4
0,088080384 0,9672065
5
0,026424115 0,9936306
6
0,005505024 0,9991356
7
0,000786432 0,9999221
8
7,3728E-05 0,9999958
9
4,096E-06 0,9999999
10
1,024E-07
1

M[x]

D[X]

1,6

Media i dispersia distribuiei numrului arjelor necorespunztoare sunt:

M X n p 10 0,2 2
DX n p q 10 0,2 0,8 1,6
Valorii x = 4 i corespunde o valoare mare a funciei de distribuie, adic probabilitatea ca numrul arjelor
necorespunztoare s fie mai mic sau cel mult egal cu 4 este egal cu 0,967:

F 4 P X 4 0,967 ,
iar probabilitatea ca numrul arjelor necorespunztoare s fie mai mare dect 4 este:

P X 4 1 0,967 0,033 .

Statistic aplicat n inginerie


Probabilitatea evenimentului x > 4 este mai mic dect 0,05, deci putem considera c producerea acestui
eveniment este practic imposibil.
De cte ori sunt produse cel mult patru arje necorespunztoare nseamn c procesul de elaborare a arjelor este
conform.
Dac ns numrul arjelor necorespunztoare este mai mare dect 4 nseamn c a intervenit o schimbare n
procesul de elaborare a arjelor.

2.4.2. Distribuia polinomial


Este o distribuie discret de probabilitate care se aplic atunci cnd exist 3, sau 4, , sau k
rezultate posibile. Exemplu pentru 3 rezultate posibile: produs conform - produs neconform
recuperabil - produs neconform nerecuperabil (rebut), alb - gri - negru, client care ia creditul client care se mai gndete - client care nu ia creditul etc.
Funcia de probabilitate este dat de formula:
f x1 ,x2 ,...,xk

n!
p1x1 p2x2 ... pkxk ,
x1 ! x2 ! ... xk !

(2.81)

unde x1 x2 ... xk n i p1 p2 ... pk 1 .


Denumirea de distribuie polinomial se datoreaz faptului c Pn x1 ,x2 ,...,xk , reprezint
termenul general al dezvoltrii p1 p2 ... pk .
n

2.4.3. Distribuia Poisson


Este o distribuie discret de probabilitate care se aplic n cazul unor evenimente
ntmpltoare independente. Variabila probabilist este reprezentat de numrul de
evenimente care pot avea loc ntr-o perioad de timp. Astfel, numrul persoanelor care sosesc
ntr-o staie de servire ntr-un interval de o or pentru a solicita un serviciu (clieni la un ghieu
de banc, autoturisme la o staie de benzin etc.), numrul defeciunilor care apar ntr-o or pe
o linie de producie, numrul de reparaii care trebuie fcute unei maini n 50.000 km parcuri,
sau numrul de pungi din 1.000 de pungi de cafea rezultate de pe o linie de ambalare care nu
corespunde standardelor de greutate, este o variabil probabilist al crei comportament poate
fi descris de o distribuie Poisson.
Pentru a putea utiliza distribuia Poisson este nevoie s fie ndeplinite dou condiii:
1. Probabilitatea de apariie a evenimentului este aceeai, pentru oricare dou intervale
(de timp, spaiu etc.) de aceeai lungime.
2. Apariia sau neapariia evenimentului n oricare interval este independent de
apariia sau neapariia evenimentului n oricare alt interval.
Funcia de probabilitate (frecvenele relative) pentru aceast distribuie este probabilitatea ca
numrul evenimentelor care au loc ntr-un interval de timp specificat s fie egal cu o anumit
valoare xi i poate fi calculat cu expresia:

Statistic aplicat n inginerie


f(x i )

xi e
,
xi !

(2.82)

unde: este numrul mediu al evenimentelor dintr-un interval de timp specificat,


e = 2,7182818 este numrul lui Euler.
Funcia de distribuiei (frecvenele relative cumulate) este:
xi

x e
.
x!
x 0
xi

F xi P X xi f x
x 0

Funcia de probabilitate

(2.83)

Funcia de distribuie

Se arat c media i dispersia variabilei X distribuit dup legea Poisson sunt egale cu
parametrul :

MX m ,

(2.84)

DX 2 .

(2.85)

APLICAIE. S se verifice dac distribuia numrului ruperilor firului n cazul unui ring cu 400 de fuse n timpul unui
schimb de 8 ore respect distribuia lui Poisson. Datele cercetrii sunt date n tabelul urmtor.
Nr. ruperi
xi
0
1
2
3
4
5
6
7
8
Total

Nr. fuselor la care firul s-a rupt


de x ori (frecvena absolut)
ni
53
110
107
72
37
16
4
0
1
400

Numrul de ruperi
xi*ni
0
110
214
216
148
80
24
0
8
800

Pentru generarea distribuiei teoretice Poisson se folosete funcia POISSON(x,media,val_logica) din


aplicaia Excel (vezi fiierul CURS 3.xls):

Statistic aplicat n inginerie


Sintaxa funciei POISSON are urmtoarele argumente:
x

Obligatoriu. Este numrul de evenimente.

media

Obligatoriu. Este valoarea numeric ateptat (media).

val_logica

Obligatoriu. Dac val_logic este TRUE, funcia POISSON ntoarce funcia


de distribuie; n cazul FALSE, va returna funcia de frecven.

Rezolvare
n timp de 8 ore Ia cele 400 fuse s-au constatat 800 ruperi. Aa c numrul mediu al ruperilor/fus este:

800
400

2,0 .

(2.86)

Comparnd cele dou iruri de valori ale funciei de frecven, valorile empirice (coloana 5) i valorile teoretice
(coloana 6), respectiv ale funciei de distribuie empiric (coloana 7) i teoretic (coloana 8), se vede c valorile
corespunztoare unui x dat sunt foarte apropiate ntre ele. Se poate conchide c numrul de ruperi ale firului
pentru cele 400 fuse se distribuie dup legea lui Poisson.

Nr. ruperi Nr. fuselor la


care firul s-a
rupt de x ori
(frecventa
absoluta)
xi
ni
0
1
2
3
4
5
6
7
8
Total

53
110
107
72
37
16
4
0
1
400

Numrul de
ruperi

DISTRIBUTIA POISSON
Numarul
Valorile
mediu de
empirice ale
ruperi/fus
functiei de
frecventa

xi*ni
0
110
214
216
148
80
24
0
8
800

Valorile
teoretice ale
functiei de
frecventa

Functia de Functia de
distributie distributie
empirica
teoretica

0,132500
0,275000
0,267500
0,180000
0,092500
0,040000
0,010000
0,000000
0,002500
1

0,135335
0,270671
0,270671
0,180447
0,090224
0,036089
0,012030
0,003437
0,000859
0,999763

0,132500
0,407500
0,675000
0,855000
0,947500
0,987500
0,997500
0,997500
1,000000

0,135335
0,406006
0,676676
0,857123
0,947347
0,983436
0,995466
0,998903
0,999763

2.4.4. Distribuia uniform


Distribuia este uniform dac toate valorile variabilei probabiliste au aceeai probabilitate de
apariie. Este o distribuie continu de probabilitate.
n simularea Monte Carlo, un rol deosebit l are distribuia uniform continu n intervalul [0, 1].
Funcia de probabilitate (frecvenele relative) este:
0 pentru x<0

f x 1 pentru 0 x 1
0 pentru x>1

(2.87)

Funcia de distribuie (frecvenele relative cumulate) este:


0 pentru x<0

F x x pentru 0 x 1
1 pentru x>1

(2.88)

Statistic aplicat n inginerie


n cazul unei variabile probabiliste uniform repartizate n intervalul [a, b], funcia de
probabilitate (frecvenele relative) este:

0
1

f x
b a
0

pentru x<a
pentru a x b

(2.89)

pentru x>b

iar funcia de distribuie (frecvenele relative cumulate):

0
x a

Fx
b a
1

pentru x<a
pentru a x b

(2.90)

pentru x>b

Funcia de probabilitate

Funcia de distribuie

Expresiile mediei i dispersiei distribuiei uniforme sunt date de relaiile:

M X m

D X

ab
,
2

(2.91)

b a

12

(2.92)

2.4.5. Distribuia triunghiular


Este o distribuie continu de probabilitate. Descrie valorile unei variabile probabiliste prin trei
valori: valoarea minim (a), valoarea cea mai probabil (c) i valoarea maxim (b). Se
presupune c att probabilitatea de realizare a valorii minime ct i probabilitatea de realizare
a valorii maxime sunt zero.
Distribuia triunghiular se utilizeaz atunci cnd nu exist date istorice referitoare la valorile
variabilei analizate, de exemplu veniturile anuale estimate a se realiza dup punerea n
funciune a unui obiectiv de investiii.

Statistic aplicat n inginerie


Funcia de probabilitate (frecvenele relative) este:

x a
2
b a c a
f x
bx
2
b a b c

pentru x<a
pentru a x c
(2.93)

pentru c<x b
pentru x>b

iar funcia de distribuie (frecvenele relative cumulate):

pentru x<a
0

2
x a
pentru a x c
b a c a

Fx
2
b x

1 b a b c pentru c<x b


1
pentru x>b

Funcia de probabilitate

(2.94)

Funcia de distribuie

Media i dispersia distribuiei triunghiulare sunt date de relaiile:

M X m

ab c
,
3

(2.95)

D X 2

a2 b2 c2 a b a c b c
.
18

(2.96)

2.4.6. Distribuia exponenial


Este o distribuie continu de probabilitate, fiind utilizat pentru a descrie timpul dintre
diferite evenimente cum sunt, de exemplu, intervalele de timp dintre sosirile clienilor ntr-un
sistem de ateptare.
Se poate demonstra c dac numrul sosirilor poate fi descris de o distribuie Poisson, atunci
intervalul dintre sosiri urmeaz o distribuie exponenial.

Statistic aplicat n inginerie


Funcia de probabilitate (frecvenele relative) este dat de relaia:

f x ex ,

(2.97)

iar funcia de distribuie (frecvenele relative cumulate) este:

F x P X x 1 ex ,

(2.98)

Rezult c P X x ex .

Funcia de probabilitate

Funcia de distribuie

Media i dispersia distribuiei exponeniale sunt:

MX m 1 ,

(2.99)

DX 2 2 .

(2.100)

2.4.7. Distribuia normal


Distribuia normal sau distribuia Gauss-Laplace este o distribuie continu i are un rol
fundamental n teoria probabilitilor i statistic.
Acest tip de distribuie descrie caracteristici ale populaiei (nlimea, greutatea), distribuiile
unor mrimi care sunt sume de alte mrimi, de exemplu prelucrarea prin achiere (conform
teoremei limitei centrale), sau durata total de realizare a unui proiect, ca sum a duratelor
probabiliste ale activitilor de pe drumul critic.
Funcia de frecven (frecvenele relative) este o funcie cu doi parametri, m i 2, de forma:

f x

1
2

x m2
22

(2.101)

Observaie: Se demonstreaz c parametrii distribuiei m i 2 reprezint media i dispersia


variabilei ntmpltoare !!!

Statistic aplicat n inginerie


Funcia de distribuie (frecvenele relative cumulate), adic probabilitatea ca variabila X s ia
valori mai mici sau egale dect o valoare dat x este:
F x

f x dx

e
2

x m2
22

dx .

(2.102)

Funcia de distribuie F x P X x satisface condiiile:

F x 0 ,

(2.103)

F x1 F x2 , x1 x2 ,

(2.104)

F P X 0 ,

(2.105)

F P X

e
2

x m2
22

dx 1 .

(2.106)

Funcia de probabilitate

Funcia de distribuie

Din figura funciei de probabilitate, rezult c distribuia normal este simetric fa de


ordonata corespunztoare valorii x = m.
Valoarea maxim a funciei de frecven se obine pentru valoarea x = m i este

2
Modulul i mediana variabilei ntmpltoare care urmeaz legea normal coincid cu media:

MoX MeX MX m .

(2.107)

Pe msur ce variabila X ia valori care se ndeprteaz de punctul x m , ordonata


corespunztoare descrete; curba are ca asimptot axa absciselor. Punctele de inflexiune ale
curbei se gsesc la o distan egal cu abaterea medie ptratic fa de axa de simetrie.

Statistic aplicat n inginerie


Cu ct abaterea medie ptratic este mai mic, cu
att ordonata maxim este mai mare. n schimb,
dac abaterea medie ptratic crete curba se
turtete, lund din ce n ce form plat. n figura 8
sunt reprezentate patru curbe avnd diferite abateri
medii ptratice.
Deoarece, funcia de probabilitate a distribuiei
normale nu poate fi integrat exact, ea nu se
folosete direct !!!
Fig.8
Calculul ariilor necesare pentru determinarea probabilitilor P a X b i a funciei de
distribuie (cumulativ) se bazeaz pe tabelele distribuiei normale standard de probabilitate a
unei variabile probabiliste cu media m 0 i abaterea medie ptratic 1 .
2.4.8. Distribuia normal standard Z
Pentru a transforma o variabil probabilist X cu distribuia normal ntr-o variabil
x m
probabilist Z cu distribuia normal standard (sau normat) se utilizeaz formula z
.

Funcia de frecven (frecvenele relative) a distribuiei normal standard Z are expresia:


2

1
f z
e 2 ,
2

(2.108)

iar funcia de distribuie (frecvenele relative cumulate):


z

1
2
F z f z dz
e
dz .

(2.109)

n tabelele distribuiei normale


standard se gsesc probabilitile
P 0 Z z ,

care

reprezint

valoarea ariei de sub curba funciei


de probabilitate f(z), cuprins ntre
media m 0 i valoarea z
specificat (figura 9).
De exemplu, probabilitatea ca
valoarea lui Z s fie cuprins ntre

Fig.9

0 i 1,25 se citete din tabelul 5 din celula de pe linia 1.20 i coloana 0.05, adic:
P 0 Z 1,25 0,3944 .

10

Statistic aplicat n inginerie


Tabelul 5

Datorit distribuiei simetrice rezult c P z Z 0 P 0 Z z . De exemplu, probabilitatea


ca valoarea variabilei Z s fie cuprins ntre -1,25 i 0 este egal cu probabilitatea ca valoarea
variabilei Z s fie cuprins ntre 0 i 1,25, adic P 1,25 Z 0 P 0 Z 1,25 0,3944 .
De asemenea:

Valoarea funciei distribuiei normale standard cumulative este:

F z P Z z 0,5 P 0 Z z ,

(2.110)

F z P Z z 0,5 P 0 Z z .

(2.111)

Pentru variabilele probabiliste cu distribuiei normal avnd media m i abaterea medie


ptratic , valoarea funciei de distribuiei (cumulativ) se poate determina astfel:
x m

F x PX x P Z
.

(2.112)

Probabilitatea ca valoarea unei variabile probabiliste X s fie cuprins n intervalul [a, b] este:
b m
a m

P a X b =P X b P X a P Z
P Z
.

(2.113)

2.4.9. Distribuia 2 (HI ptrat)


Fie Z1, Z2, , Zf, f variabile ntmpltoare independente, fiecare avnd o distribuie normal
standard cu media M[Zi] = 0 i dispersia DZi 1 i funcia de frecven:
z2

i
1
f zi
e 2 ; i 1, 2,..., f .
2

(2.114)

11

Statistic aplicat n inginerie


Se noteaz suma ptratelor variabilelor cu 2 , adic:
f

2 Z12 Z22 ... Z2f Z2i .

(2.115)

i1

Se demonstreaz c variabila 2 are o distribuie 2 cu f grade de libertate a crei funcie de


frecven este:

f
2
2

f

2

f
2 2 1

1
2
e 2

(2.116)

unde este funcia Gamma1 care se definete astfel:


x

x 1

e tdt .

(2.117)

Pentru x = n, unde n este numr ntreg pozitiv:

n n 1! .
Relaia de recuren este:

n 1 n n .

1
Pentru x n , unde n este numr ntreg pozitiv:
2
1 2n 1 !!

n
,
2
2n

unde !! reprezint dublu factorial care se definete astfel:

n n 2 ... 3 1, pentrunnumr impar pozitiv,


n!!

n n 2 ... 4 2, pentrunnumr par pozitiv.

Valori particulare ale funciei Gamma:


1 / 2 ; 1 0! 1; 3 / 2

;
2

3
;
4
15
3 2! 2; 7 / 2
; 4 3! 6;
8
2 1! 1; 5 / 2

n matematic, funcia gamma, reprezentat prin litera greceasc = gamma majuscul, este o funcie care
extinde noiunea de factorial de la numerele ntregi la numerele reale i complexe.

12

Statistic aplicat n inginerie


Deoarece variabila

2 Z12 Z22 ... Z2f

este o sum de f ptrate, domeniul de

variaie a funciei de frecven f 2

cuprinde mulimea valorilor lui 2 care


satisfac inegalitile 0 2 . De aici

rezult c funcia de frecven f 2

are

numai valori pozitive.


Pentru aplicaiile practice este util s se
dea expresiile funciei de frecven pentru
cazurile cnd numrul gradelor de
libertate este egal cu 1, 2, 3, 4, 5 (fig. 10).

Fig.10

Potrivit teoremei limitei centrale, distribuia variabilei ntmpltoare 2 tinde ctre distribuia
normal cu media M 2 f i dispersia D 2 2 f cnd f (vezi figura 11 n care se d
reprezentarea grafic a distribuiei, pentru cazurile cnd numrul gradelor de libertate este: 1,
2, 4, 10, 20).
Din figura 11 se poate vedea c pe msura creterii numrului gradelor de libertate f, adic a
numrului ptratelor care se nsumeaz, distribuia 2 tinde spre distribuia normal, dar acest
proces este lent.

Fig.11

Quantilii distribuiei 2
n aplicaiile practice este util s determinm probabilitatea P astfel nct valorile variabilei 2
s fie mai mici sau cel puin egale cu o valoare dat P2 , adic:

P 2 P2 P2 .

(2.118)

13

Statistic aplicat n inginerie

Aceasta revine la a determina valoarea funciei de distribuie F P2 corespunztoare valorii P2


a variabilei 2 , adic:
F

P
P2

P2

P2

P2

1
f
2
2

f

2

f
2 2 1

1
2
e 2 d 2

(2.119)

Pentru aplicaii practice s-au ntocmit tabele n care se dau valorile funciei de distribuie F P2

pentru valori ale numrului gradelor de libertate f. n practic ns, de cele mai multe ori se
stabilete n prealabil probabilitatea P. De aceea n asemenea cazuri se pune problema
determinrii valorii lui 2 , adic a quantilului P2 . Quantilii depind att de valoarea dat a lui P
ct i de numrul gradelor de libertate f. Pentru a pune n eviden aceasta, se folosete
notaia P2 f .
2.4.10. Distribuia t (Student)
S presupunem c dintr-o colectivitate general distribuit normal din punct de vedere al
caracteristicii X cu media m i dispersia 2 s-a extras o selecie de mrime n. Fie x1 , x2 ,..., xn
valorile caracteristicii obinute pentru selecia dat.
Media aritmetic (de selecie) x se supune ea nsi unei legi de repartiie normale, dar cu o
dispersie mai mic dect repartiia valorilor individuale.
Se demonstreaz ca abaterea medie ptratic a mediei, notat cu 0 , este:
0

.
n

(2.120)

Dac media de selecie x se distribuie normal cu media m i dispersia


Z

x m x m
,

0
n

2
, mrimea:
n

(2.121)

se distribuie normal cu media 0 i dispersia 1.


Acest lucru este valabil n cazul cnd dispersia colectivitii generale 2 este cunoscut. Sunt
ns numeroase cazurile cnd dispersia colectivitii generale 2 nu este cunoscut. Atunci n
locul dispersiei 2 se utilizeaz estimaia s 2 :

x x x2 x
1
2

... xn x

n1

determinat pe baza observaiilor.

14

(2.122)

Statistic aplicat n inginerie


Prin aceast nlocuire mrimea Z din (2.121) devine:
t

x m
.
s
n

(2.123)

Aceast mrime nu se mai distribuie dup legea normal, ci are o distribuie numit distribuia
Student sau distribuia t.
Se scrie mrimea t sub forma:
t

x m x m z

.
s
s s
n
n

(2.124)

Se poate demonstra c funcia de frecven a variabilei t are expresia:


f 1
f 1


2 2

t
2 1
f t
,

f
f
f
2

(2.125)

unde f n 1 este numrul gradelor de libertate.


n figura 12 sunt reprezentate funciile de
frecven ale variabilei t pentru cazurile
cnd numrul gradelor de libertate f este
egal cu 1, 2, 5 i .
Forma curbelor distribuiei t amintete de
curba distribuiei normale.

Fig.12
n figura 13 se d reprezentarea grafic a
distribuiei normale standard Z, respectiv
a distribuiei t.
Comparnd cele dou curbe se constat
c, curba distribuiei t se apropie mai
ncet de axa absciselor atunci cnd t tinde
ctre sau , mai ales pentru
valorile mici ale numrului gradelor de
libertate f.
Fig.13

15

Statistic aplicat n inginerie


La distribuia t s-a ajuns nlocuind pe prin s . Cum ns estimaia s tinde n probabilitate
ctre atunci cnd numrul gradelor de libertate tinde ctre , rezult c i distribuia t
tinde ctre distribuia standard atunci cnd f .
Funcia de distribuie a variabilei t este:
tP

F t P t tP
0

f 1
f 1


2 2

t
2

1
dt .

f
f
f
2

(2.126)

Ca urmare a simetriei distribuiei t, quantilul tP, adic valoarea lui t corespunztoare valorii P a
funciei de frecven F(t), este egal cu quantilul t1-P (valoarea lui t corespunztoare valorii

F t 1 P ), adic:
tP t1P

(2.127)

BIBLIOGRAFIE
1. *** Probabiliti i statistic, www.edumanager.ro
2. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
3. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
4. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963

16

Statistic aplicat n inginerie

CURS 4
3. VERIFICAREA IPOTEZELOR. CRITERII DE SEMNIFICAIE
3.1. CONSIDERAII GENERALE PRIVIND INTERVALELE DE NCREDERE
S considerm o caracteristic X a crei lege de distribuie este cunoscut i s presupunem c
trebuie s estimm, pe baza datelor unei selecii de mrime n, valoarea unui parametru u (de
exemplu media) al distribuiei caracteristicii X. Parametrul poate fi estimat cu ajutorul unor
anumite mrimi care se pot calcula pe baza datelor seleciei.
Obs. Este greit s considerm c estimaia obinut este nsi valoarea parametrului u.
Estimaia ne d ns posibilitatea s gsim un interval care acoper cu o probabilitate dat
valoarea parametrului estimat u. Intervalul astfel determinat se numete interval de
ncredere.
S presupunem c urmrim o anumit operaie care se execut la o main-unealt dat. n
urma acestei operaii, piesa care se prelucreaz trebuie s aib diametrul 9,200,1 mm.
Caracteristica studiat este n acest caz diametrul nominal 9,2mm.
Se tie c distribuia acestei caracteristici este normal cu media m i dispersia 2 . Dac
maina este reglat corect i dac precizia mainii este corespunztoare toleranelor fixate,
atunci media m coincide cu mijlocul cmpului de toleran i are valoarea m m0 9,15mm ,
iar abaterea medie ptratic este aproximativ egal cu 0,0167 .

max min 6

max min 0,1

0,0167 .
6
6

La nceputul lucrului maina trebuie reglat astfel nct diametrul mediu al pieselor s fie egal
cu 9,15mm. Dup ce s-a produs un numr de n piese, s zicem cinci, se msoar diametrul
acestora. De fapt s-a realizat o selecie de volum n = 5 i s-au obinut datele seleciei. Pe baza
acestor date (diametrele celor cinci piese), se pot determina anumite mrimi - parametri de
selecie - ca media, mediana, diferena dintre numrul pieselor care au diametrul mai mare
dect 9,2mm i numrul pieselor care au diametrul mai mic dect 9,1mm.
S presupunem c se determin media de selecie x i c s-a obinut valoarea x 9,13 mm.
Mrimea x 9,13mm estimeaz centrul de reglare i deci nu trebuie considerat c 9,13 este
centrul de reglare. Estimaia obinut, 9,13mm , permite ns s se conchid dac maina este
corect reglat, deoarece pentru ca centrul de reglare s fie m0 9,15mm , media seleciei
trebuie s se gseasc ntr-un interval care acoper centrul de reglare. Deoarece centrul de
reglare este o constant, intervalul m1 , m2 , n care trebuie s se gseasc mediile de
selecie, se poate determina cu o probabilitate dat.

Statistic aplicat n inginerie


Este important a se sublinia c nu este corect s se afirme c centrul de reglare s-ar gsi cu
probabilitatea dat n intervalul m1 , m2 i aceasta pentru c dei este o necunoscut, are o
valoare determinat (avem de-a face cu o reglare deja efectuat a mainii) i prin urmare nu
este o variabil ntmpltoare.
Intervalul m1 , m2 depinde de valorile 1, 2, 3, 4, 5 ale diametrelor msurate care sunt
variabile ntmpltoare, ca atare i el este o mrime ntmpltoare. Prin urmare este corect s
se afirme c pe baza mediei x 9,13 mm, se poate determina intervalul m1 , m2 care
acoper cu o probabilitate dat valoarea centrului de reglare.
3.2. CRITERIUL DE SEMNIFICAIE Z, BILATERAL
3.2.1. Nivel de semnificaie i nivel de siguran
S presupunem acum c trebuie s estimm media colectivitii generale m pe baza datelor
unei selecii de mrime n. Media colectivitii generale m este o mrime constant care se
poate estima cu ajutorul mediei aritmetice de selecie x .

x1 x 2 ... xn
.
n

(3.1)

S presupunem c variabila X se distribuie normal i c dispersia 2 este cunoscut.


Parametrul seleciei x (media seleciei) se distribuie normal cu media m i dispersia 20

2
.
n

mprind abaterea mediei de selecie x fa de media general m, adic ( x m ), la abaterea

medie ptratic a mediei 0


, se obine abaterea normat:
n
z

x m x m
.

0
n

(3.2)

Abaterea normat, are o distribuie normal cu media 0 i dispersia 1.


Funcia de frecven a variabilei Z are expresia:
2

1 z2
f z
e .
2
Dac se d intervalul

z1 , z2 ,

(3.3)
atunci

probabilitatea ca variabila Z s se
gseasc n acest interval (figura 1) se
obine cu ajutorul relaiei:

Fig.1

P z1 Z z2 P Z z2 P Z z1 0,5 P 0 Z z2 0,5 P 0 Z z1 z2 z1

(3.4)
2

Statistic aplicat n inginerie


Dac inem seam de relaia (3.2), atunci (3.4) se poate scrie:

P m z1
x m z2
z2 z1 .
n
n

(3.5)

Dac probabilitatea P are o valoare apropiat de 1, se consider c "practic" toate mediile de

x m z2
selecie x se gsesc n intervalul m z1
.
n
n

Intervalul astfel determinat se numete "interval de ncredere", iar intervalul definit de

inegalitile x m z1
i x m z2
se numete "interval critic".
n
n

Probabilitatea ca valorile variabilei Z s aparin intervalului critic se numete nivel de


semnificaie (risc acceptat) i se noteaz cu .
n cazul n care - z1 = - z i z2 = z (adic z1 = z2 = z), relaia (3.5) se scrie:

Pm z
x mz
2 z .
n
n

(3.6)

Exemplu. Trebuie s se verifice dac media m a diametrelor unui lot de piese obinute n aceleai condiii de
producie este m0 = 2,00mm, tiind din cercetri anterioare c abaterea medie ptratic este = 0,03mm i c
distribuia pieselor dup diametrul cercetat este una normal. Se vor folosi datele unei selecii compus din n = 9
piese.
n aceste condiii diametrul mediu x al celor 9 produse trebuie s se gseasc n intervalul determinat de
urmtoarea relaie:

P m0 z

x m0 z

Alegnd pentru P valoarea 0,9973, din rel. (3.6) rezult c z = 0,9973/2 = 0,49865; n tabelul 1, ANEXA 1, se
gsete c z = 3. Limitele intervalului de ncredere corespunztor probabilitii P = 0,9973 vor fi:
23

0,03
9

1,97mm; 2 3

0,03

2,03mm

n exemplul anterior s-a pus problema estimrii mediei generale cu ajutorul a n observaii, mai
exact s-a dat o colectivitate a crei medie m este necunoscut i vrem s verificm cu ajutorul
unei selecii dac aceast medie este egal cu m0. Trebuie s verificm prin urmare dac
ipoteza m m0 este just; aceast verificare se face cu ajutorul mediei de selecie i anume:
dac media seleciei x verific relaia (3.6), atunci se poate afirma, cu probabilitatea P, c
ipoteza este just. Dac media seleciei x se gsete n afara limitelor determinate cu ajutorul
relaiei (3.6), ipoteza se respinge.
S-a artat c probabilitatea P trebuie s aib o valoare apropiat de 1 i aceasta pentru ca
limitele de ncredere fixate s cuprind ntre ele majoritatea mediilor seleciilor care s-ar putea

Statistic aplicat n inginerie


forma din unitile colectivitii generale. Odat limitele fixate, se consider c ipoteza nu este
just ori de cte ori media seleciei se situeaz n afara acestor limite.
Evident c dintr-o colectivitate care are media m m0 , deci pentru care ipoteza este just, se
poate extrage un numr de selecii, ce-i adevrat, mic, ale cror medii se situeaz n afara
intervalului de ncredere. Dar criteriul odat fixat, limitele intervalului de ncredere odat
determinate, vom respinge ipoteza n aceste cazuri.
Aadar dac s-a ales o probabilitate P, ipoteza se va accepta n 100P cazuri i se va respinge
n 100 cazuri, unde poart numele de nivel de semnificaie sau risc acceptat i reprezint
probabilitatea ca mediile seleciilor s se situeze n afara intervalului de ncredere atunci cnd
de fapt ipoteza este just; se determin cu ajutorul relaiei:

1P .

(3.7)

n reprezentarea grafic din figura 2, P


reprezint aria colorat, iar aria
necolorat. Astfel, n cazul exemplului
anterior, din 100 cazuri n care ipoteza
este just, ea va fi acceptat pe baza
criteriului fixat de 100P=1000,9973
=99,73% cazuri, i se va respinge n
100=100(1-P)=100(1-0,9973)=0,27%
cazuri.

Fig.2

3.2.2. Puterea criteriului. Erori de spea I i erori de spea II


S-a artat la punctul 3.2.1 c regula stabilit pe baza criteriului nu duce la acceptarea ipotezei
n toate cazurile cnd ipoteza este just. i atunci se pune ntrebarea fireasc dac nu cumva
regula stabilit pe baza criteriului poate s duc la acceptarea ipotezei n cazuri cnd ea este
de fapt nejust.
Dac examinm cazurile cnd se fac afirmaii nejuste care decurg din folosirea criteriului,
observm c le putem mpri n:
a) cazuri de neacceptare a ipotezei cnd ea este just; n aceste cazuri spunem c se
comite o eroare de spea I, probabilitate care se noteaz cu (riscul productorului);
b) cazuri de acceptare a ipotezei cnd ea nu este just; n aceste cazuri spunem c se
comite o eroare de spea II, probabilitate care se noteaz cu (riscul cumprtorului).
n cazul n care media colectivitii cercetate m (necunoscut) este egal cu m1, deci diferit de
m0 (presupus), adic m m1 m0 , se disting dou posibiliti:
1. dac diferena m1 m0 este mic, numai un numr foarte mic de medii de selecie xi
se vor situa n afara limitelor de ncredere;

Statistic aplicat n inginerie


2. dac diferena m1 m0 este mare, un numr mai mare de medii de selecie xi se vor
situa n afara limitelor de ncredere.
Se poate spune c m1 m0 reprezint o abatere sistematic.
Probabilitatea neacceptrii ipotezei cnd ea nu este just este o funcie a parametrului m, i
se numete funcia de putere a criteriului, este notat cu (m), i reprezint probabilitatea de
a respinge o ipotez fals oricare ar fi valoarea lui m diferit de m0 ( m m0 ).
Pentru un nivel de semnificaie (risc asumat) , funcia de putere a criteriului se determin cu
relaia:

x m
0
m m1 P
z

x m0
z 1 z 1 z 1

(3.8)

unde:
1

m1 m0

n
n

(3.9)

unde 1 este abaterea sistematic normat.


Probabilitatea acceptrii ipotezei cnd de fapt ea nu este just (eroarea de spea II) este

1 m .
Funcia de putere depinde de m i deci de 1 . Dup cum se poate vedea n tabelul 2,
ANEXA 2, unde sunt date valorile funciei de putere n funcie de valorile absolute ale abaterii
m m0
sistematice normate 1 1
pentru diferite nivele de semnificaie , funcia de

n
putere a criteriului este funcie cresctoare de 1 .
Exemplu. Pentru a verifica dac gramajul mediu al hrtiei de ziar (caracteristic care urmeaz legea normal)
produs la un moment dat este m0 50g / m , cu abaterea medie ptratic a gramajului 0,67g / m , ct
2

prevede standardul, se extrage o selecie compus din n 4 probe.


Pentru a putea afirma pe baza seleciei c gramajul mediu este m m0 50g / m , se aplic criteriul de
2

semnificaie Z. Se alege pentru nivelul de semnificaie (riscul) valoarea 0,02 .


Se calculeaz limitele intervalului de ncredere corespunztor nivelului de semnificaie 0,02 :

0,02 1 P m0 z

x m0 z

unde m0 50 ; 0,67 ; n 4 .

1 2 z ,

Statistic aplicat n inginerie


z se determin prin relaia: 0,02 1 2 z .
Rezult z

1 0,02
2

0,49 ;

Din tabelul 1, ANEXA 1, rezult z 2, 32 .


Limitele intervalului de ncredere: m0 z

m0 z

n cazul n care ipoteza c m m0

50 2,32

0,67

49,2 g / m

4
50 2,32

0,67

50,8 g / m

50g / m2 este adevrat, din 100 cazuri (selecii compuse din

n 4 probe), n

98 media x se va gsi ntre 49,2 i 50,8g/m i numai n dou cazuri n afara acestor dou limite, adic vor fi 2
cazuri din 100 de neacceptare a ipotezei cnd ea este just i spunem c se comite o eroare de spea I.
S presupunem acum c maina care produce hrtia de ziare lucreaz cu o abatere sistematic 0,5g / m .
2

n acest caz media este: m m1 50 0,5 50,5g / m .


2

Abaterea sistematic normat este: 1

m1 m0

0,5
0,67
4

0,5
0,67

1
0,67

1,5

Se calculeaz funcia de putere a criteriului: m1 1 z 1 z 1 :

50,5 1 2,32 1,5 2,32 1,5 1 3,82 0,82 1 0,499933 0,29389 0,206043
Funcia puterii are valoarea 50,5 0,206 .
Aceasta nseamn c dac lum un numr de 100 de selecii de mrime n 4 , ipoteza fals m m0 50g / m se
2

va respinge n 20,6% din cazuri i se va accepta n mod greit n 79,4% din cazuri; n aceste cazuri spunem c se
comite o eroare de spea II ( = 79,4%).

3.2.3. Legtura dintre nivelul de semnificaie i funcia puterii


n tabelul 2, ANEXA 2, sunt calculate valorile funciei de putere pentru nivelurile de
semnificaie = 0,1; 0,05; 0,025; 0,01; 0,005; 0,001; 0,0005. Examinnd tabelul 2 observm c
pentru o valoare absolut dat a abaterii sistematice normate 1 valorile funciei de putere
(m) sunt mai mari atunci cnd nivelurile de semnificaie cresc. Aceasta nseamn c dac
micorm numrul erorilor de genul I, adic micorm riscul de a respinge ipoteza atunci
cnd ea este just, micorm i valoarea funciei de putere a criteriului , deci mrim numrul
erorilor de genul II, adic mrim riscul 1 de a accepta ipoteza fals.
3.2.4. Legtura dintre funcia de putere i mrimea seleciei
Deoarece funcia de putere a criteriului ne d posibilitatea s alegem criteriul cel mai raional,
evident c este important s studiem dependena funciei de putere de mrimea seleciei n.

Statistic aplicat n inginerie


Exemplu. Sarcina medie de rupere a unui fir trebuie s fie m0 130g . Pentru a verifica dac sarcina de rupere
medie a unui fir este m0 130g se face o selecie de mrime n 4 . Va trebui, cu ajutorul datelor seleciei, s se
verifice dac m m0 130g . n acest scop se vor determina limitele de ncredere pentru nivelul de semnificaie

0,01 . Din cercetri prealabile se tie c abaterea medie ptratic a sarcinii de rupere este de 4g .
Pentru un risc 0,01 Ia verificarea ipotezei m m0 130g , ntr-un caz din 100 se va respinge ipoteza cnd ea
este just. Pentru a gsi probabilitatea acceptri ipotezei atunci cnd ea nu este just, trebuie s calculm valoarea
funciei de putere.
S presupunem o eroare sistematic 4 g .
n acest caz media este: m m1 130 4 134g
Pentru 0,01 din tabelul 2, ANEXA 2: z z0 ,01 2,58
Limitele de ncredere sunt:

m0 z

m0 z

Abaterea sistematic normat este: 1

130 2,58

124,84g ,

130 2,58

135,16g .

m1 m0

4
4

Valoarea funciei de putere este:

134 1 z 1 z 1 1 2,58 2 2,58 2


1 4,58 0,58 1 0,499998 0,21904 0,281

Rezult c pentru 0,01 i un numr de n 4 probe (rezult limitele 124,84g i 135,16g) suntem n msur s
sesizm n 28,1% din cazuri c sarcina de rupere difer cu 4g de sarcina admis m 0=130g i vom accepta n 71,9%
cazuri c sarcina de rupere este 130g cnd de fapt ea este cu 4g mai mare.
S determinm valoarea funciei de putere n cazul cnd selecia luat ar fi compus din 9 probe elementare,
celelalte condiii rmnnd aceleai.
Limitele de ncredere sunt:

m0 z q

m0 z q

Abaterea sistematic normat este: 1

130 2,58

126,56g ,

9
130 2,58

m1 m0

133,44g .

4
4

Valoarea funciei de putere este: 134 1 2,58 3 2,58 3 0,664


Rezult c pentru 0,01 i un numr de n 9 probe (rezult limitele 126,56g i 133,44g, deci intervalul s-a
ngustat), ne vom da seama n 66,4% din cazuri c sarcina de rupere este afectat de o eroare sistematic egal cu
4g i vom accepta n mod greit n 33,6% din cazuri c sarcina de rupere a firului din fusul considerat este de 130g,

Statistic aplicat n inginerie


cnd de fapt ea este mai mare cu 4g. Odat cu creterea numrului n de Ia 4 Ia 9 puterea criteriului a crescut de
Ia 0,281 Ia 0,664.
n sfrit, s considerm i cazul cnd selecia este compus din 16 probe elementare:
Limitele de ncredere sunt:

m0 z q

m0 z q

Abaterea sistematic normat este: 1

130 2,58

127,42g ,

16
130 2,58

m1 m0

132,58g .

16

4
16

Valoarea funciei de putere este: 134 1 2,58 4 2,58 4 0,922


Rezult c pentru 0,01 i un numr de n 16 probe (rezult limitele 127,42g i 132,58g, deci intervalul s-a
ngustat i mai mult), ne vom da seama n 92,2% din cazuri c sarcina de rupere este afectat de o eroare
sistematic egal cu 4g i vom accepta n mod greit n 7,8% din cazuri c sarcina de rupere a firului din fusul
considerat este de 130g, cnd de fapt ea este mai mare cu 4g. Odat cu creterea numrului de probe de Ia 4 Ia
16 puterea criteriului a crescut de Ia 0,281 Ia 0,922.

Reiese din acest exemplu c puterea criteriului crete pe msur ce crete mrimea seleciei.
S-a pus n eviden dependena valorilor funciei de putere de mrimea seleciei, n, pentru a
folosi aceast proprietate a funciei de putere la planificarea experienelor, i anume pentru a
determina mrimea seleciei astfel nct s avem o putere dat a criteriului.
3.3. CRITERIUL DE SEMNIFICAIE Z, UNILATERAL
n practica cercetrilor industriale se ntlnesc cazuri n care trebuie s se verifice ipotezele
m m0 , respectiv m m0 unde m0 este o valoare dat.
3.3.1. Ipoteza m < m0
Intervalul critic este definit de inegalitatea:
x m0
z ,

(3.10)

Fig.3

unde z este valoarea abaterii normal


normate corespunztoare nivelului de
semnificaie :

x m

x m

1
1
0
0
P
z 1 P
z 1 z z . (3.11)
2
2

n
n

Statistic aplicat n inginerie


Limita de semnificaie pentru media de selecie se calculeaz atunci cu ajutorul formulei:
m0 z

.
n

(3.12)

Dac este nivelul de semnificaie, atunci ipoteza m m0 se respinge n 100% cazuri cnd ea
este just.
Dar n afar de intervalul de semnificaie pentru fiecare criteriu trebuie s evalum i riscul de a
accepta ipoteza fals, adic probabilitatea acceptrii ipotezei cnd de fapt ea nu este just
1 , unde n cazul verificrii ipotezei m m1 m0 puterea criteriului se determin cu
ajutorul formulei:

1
m1 z 1 .
2
unde 1

(3.13)

m1 m0
.

3.3.2. Ipoteza m > m0


Intervalul critic este definit de inegalitatea:
x m0
z ,

(3.14)

Fig.4
Nivelul de semnificaie i puterea criteriului se calculeaz cu ajutorul formulelor:

x m
1
0
P
z z ;

2

(3.15)

iar puterea criteriului se determin cu ajutorul formulei:

1
m1 z 1 ,
2
unde 1

(3.16)

m1 m0
.

Funcia de putere a criteriilor unilaterale m m0 i m m0 este uniform mai puternic


dect funcia de putere a criteriului bilateral m m0 .

Statistic aplicat n inginerie


Exemplu. n procesul de fabricaie a acului pulverizatorului unei pompe de injecie se controleaz caracteristica
btaia diametrului D1 3,4 mm fa de diametrul D2

5,6 mm. Btaia fiind o caracteristic strict pozitiv,

trebuie s ia valori ct mai apropiate de zero. Procesul tehnologic poate fi considerat n parametri normali dac
media caracteristicii pentru o selecie este mai mic dect 0,025mm. Dispersia care caracterizeaz procesul
tehnologic, determinat pe baza unor cercetri anterioare, este 0,000335 .
2

Pentru a verifica dac procesul tehnologic se menine


normal, din producia unei maini s-a extras o selecie
de 30 de piese, la care s-a controlat btaia i s-au
obinut datele din tabelul alturat.
Se verific ipoteza m m0 .
Media de selecie este: x 0,021
Nivelul de semnificaie ales: 0,02 .
Conform relaiei (3.11)

1
2

z 0,02 0,5 z z 0,5 0,02 0,48

Pentru z 0,48 , din tabelul 1, ANEXA 1, se gsete z 2,05 .


Limita de semnificaie este: m0 z

0,025 2,05

0,000335

0,0257 .

30

Deoarece x 0,021 este mai mic dect limita de semnificaie calculat pentru 0,02 , se poate afirma c
procesul se desfoar normal i este controlabil din punct de vedere statistic.
Puterea criteriului se calculeaz cu ajutorul formulei (3.13) pentru m m1 x :

m1 m0

m1

1
2

0,021 0,025

1,20 .

0,000335
30

z 1

1
2

2,05 1,20

1
2

3,25 0,5 0,4994 0,0006 ,

adic probabilitatea acceptrii ipotezei false este:

1 m1 1 0,0006 0,9994 ,
ceea ce nseamn c datorit diferenei mici dintre m1 i m0 numai n 0,06% cazuri vom respinge ipoteza cnd ea
nu este just i n 99,94% o acceptm chiar atunci cnd ea nu este just.

BIBLIOGRAFIE
1. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
2. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
3. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963
10

Statistic aplicat n inginerie


ANEXA 1
Tabelul 1

11

Statistic aplicat n inginerie


Tabelul 1 (continuare)

12

Statistic aplicat n inginerie


Tabelul 1 (continuare)

13

Statistic aplicat n inginerie


ANEXA 2
Tabelul 2

14

Statistic aplicat n inginerie

CURS 5
3. VERIFICAREA IPOTEZELOR. CRITERII DE SEMNIFICAIE (CONTINUARE)
3.4. CRITERIUL DE SEMNIFICAIE Z. COMPARAREA A DOU MEDII
S presupunem c se cerceteaz caracteristica X a unitilor care compun dou colectiviti, iar
aceasta este distribuit normal.
S notm cu m1, m2 mediile i cu 1 , 2 abaterile medii ptratice (standard) corespunztoare
celor dou colectiviti. Cunoatem din cercetri anterioare abaterile medii ptratice i ne
propunem s verificm, cu ajutorul mediilor a dou selecii extrase din cele dou colectiviti,
dac mediile necunoscute m1 i m2 sunt egale. Prin urmare trebuie s verificm ipoteza
m1 m2 .
Exemple:

a. avem dou suluri de hrtie de ziar i ne intereseaz lungimea de rupere. Abaterile medii
ptratice ale lungimii la rupere a hrtiei obinute la dou maini se cunosc din cercetri
prealabile: 1 20 m i 2 25 m. Pentru ca hrtia s fie corespunztoare, din punct de vedere
al procesului tehnic, media lungimii la rupere trebuie s fie de 3.000m. De aceea ne propunem s
verificm dac lungimea la rupere medie a celor dou suluri m1 i m2 sunt egale ntre ele i egale
cu m0 = 3.000m.
b. avem dou loturi de piese turnate obinute din dou arje executate n dou cubilouri diferite.
Ne intereseaz rezistena medie a pieselor aparinnd celor dou arje. Cunoscnd abaterile
medii ptratice ale rezistenei pieselor produse din arjele obinute la cele dou cubilouri trebuie
s verificm dac rezistenele medii a pieselor celor dou arje sunt egale.

Fie:

x11 , x12 , , x1n1 ,


x21 , x22 , , x2n2

valorile caracteristicii obinute pentru unitile care compun cele dou selecii de mrimi n1 i
n2 extrase din colectivitile studiate.
Se calculeaz mediile de selecie:
n1

x1

x1i
i1

n1

n2

i x2

x
i1

n2

2i

Se noteaz cu d diferena dintre cele dou medii: d x1 x2 .


Conform teoremei adunrii pentru distribuia normal, mrimea d se distribuie normal cu
media:

Md m1 m2 ,

(3.17)

Statistic aplicat n inginerie


i dispersia:

Dd

12 22
.
n1 n2

(3.18)

Ipoteza m1 m2 se poate verifica cu ajutorul criteriului Z:

x1 x2
12 22

n1 n2

(3.19)

unde variabila Z se distribuie normal cu media 0 i dispersia 1.


Potrivit criteriului de semnificaie bilateral Z, avem:

2 2
2 2
P P z 1 2 x1 x2 z 1 2 2 z

n1 n2
n1 n2

(3.20)

Intervalul critic determinat pentru o valoare dat a nivelului de semnificaie (risc) este
definit de inegalitile:

x1 x2 z

12 22
2 2
; x1 x2 z 1 2 .
n1 n2
n1 n2

(3.21)

Probabilitatea acestor inegaliti este egal cu nivelul de semnificaie, iar z se determin din
relaia:

2 2
2 2
1 P z 1 2 x1 x2 z 1 2 1 2 z

n1 n2
n1 n2

(3.22)

Prin urmare, ipoteza m1 m2 , sau d 0 , este fals cnd diferena dintre cele dou medii de
selecie d x1 x2 satisface inegalitile (3.21), adic se afl n intervalul critic.
Pentru un nivel de semnificaie ales ipoteza just se respinge n 100% cazuri i se accept
n 100(1 )% cazuri.
Exemplu. n filaturile de bumbac, 6 fire produse la carde se unesc la flyere pentru a da un fir. Numrul metric al
1
firului pentru firele produse la dou maini diferite, trebuie s fie acelai. Pentru a verifica acest lucru lum cte o
selecie compus din cinci probe elementare. Din cercetrile prealabile se cunosc abaterile medii ptratice ale
"numrului metric al firului" la cele dou carde: 1 0,005 i 2 0,0045 .
n urma determinrilor fcute asupra probelor elementare s-au obinut urmtoarele valori ale numrului metric:
0,240; 0,240; 0,235; 0,250; 0,235 pentru probele luate de la prima card i
0,220; 0,225; 0,220; 0,225; 0,235 pentru probele luate la a doua card.

Indicator de apreciere a grosimii firelor, exprimat n sistemul indirect, conform cruia gradul de subirime al firelor se exprim
prin lungimea unitii de mas, denumit prescurtat finee sau numr. Numrul metric al unui fir indic ci metri (km) sunt
cuprini ntr-un gram (kg) din acel fir.

Statistic aplicat n inginerie


Nivelul de semnificaie ales este = 0,02.
Din relaia (3.22): 1 2 z z

1
2

1 0,02
2

0,98

0,49 ,

Valorii z 0,49 i corespunde z 2,33 (tabelul 1, ANEXA 1).

Limitele intervalului de semnificaie:

n1
1

n1

2
2

n2

; 2,33

n2

5
2

; 2,33

0,005

0,005
5

0,0045
5

0,007

0,0045
5

0,007

Prin urmare se consider c numrul mediu al firului la cele dou carde este acelai, adic se accept ipoteza

m1 m2 atunci cnd diferena d x1 x2 se gsete n limitele 0,007 i 0,007.


Mediile seleciilor luate de la cele dou carde sunt: x1 0,240 i x2 0,225 .
Diferena lor este: d x1 x2 0,240 0,225 0,015 .
Deoarece diferena depete limita superioar 0,007, considerm c numrul mediu al firului la cele dou carde
nu este acelai.

3.5. CRITERIUL DE SEMNIFICAIE t


3.5.1. Determinarea intervalului de ncredere pentru criteriul t
n subcapitolele anterioare s-au studiat criterii cu ajutorul datelor unei selecii de mrime n
extras dintr-o colectivitate distribuit normal cu media m necunoscut i dispersia 2
cunoscut.
n practic ntlnim ns foarte des cazuri cnd abaterea medie ptratic nu se cunoate din
cercetri prealabile. n aceste cazuri abaterea medie ptratic a colectivitii generale se
nlocuiete cu abaterea medie ptratic calculat pe baza datelor seleciei, s.
n asemenea cazuri mrimea:
z

x m0
,

(3.23)

se nlocuiete cu mrimea:
t

x m0
,
s
n

(3.24)

Statistic aplicat n inginerie


unde s este abaterea medie ptratic determinat pe baza datelor seleciei calculat cu
formula:
n

x x
i1

n1

(3.25)

n care xi sunt valorile caracteristicii care compun selecia, x este media seleciei, iar n este
mrimea seleciei.
Mrimea definit de relaia (3.24) are o distribuie t (Student) cu f = n 1 grade de libertate.
Intervalul critic corespunztor unui nivel de semnificaie pentru criteriul t este definit de
inegalitile:
x m0
x m0
t i
t
s
s
n
n

(3.26)

Probabilitatea acestor inegaliti se poate calcula,


dup cum se vede i din figura 5, astfel:

P t t P t t

f t dt f t dt ,

(3.27)

unde f(t) este funcia de frecven pentru distribuia


t (Student).
Fig.5
Avnd n vedere c distribuia t este simetric fa de ordonata punctului de maxim, se poate
scrie:

P t t P t t


2 f t dt .
2 2
t

(3.28)

innd seama c n tabele se dau valorile funciei de distribuie:

F t P t t

f t dt ,

(3.29)

iar:

f t dt 1 f t dt ,

(3.30)

P t t P t t 2 1 f t dt 2 1 P t t .

(3.31)

rezult:

Statistic aplicat n inginerie


Dac se alege o anumit valoare pentru nivelul de semnificaie , atunci t se va determina
folosind relaia:

2 1 P t t P t t 1

.
2

(3.32)

Din figura 5 se poate vedea c probabilitatea inegalitilor:

t t t ,

(3.33)

care definesc intervalul de ncredere se evalueaz cu ajutorul formulei:

P t t t 1 ;

(3.34)

Cum inegalitile (3.33) se pot scrie, innd seam de relaia (3.24) sub forma:
m0 t

s
s
,
x m0 t
n
n

(3.35)

rezult c limitele de semnificaie pentru media de selecie corespunztoare unui nivel de


semnificaie (risc) sunt:
m0 t

s
s
,
, m0 t
n
n

(3.36)

prin urmare ipoteza m m0 se accept atunci cnd media de selecie x se gsete ntre
limitele de semnificaie (3.36), unde m0 este o valoare dat, s este abaterea media ptratic
calculat pe baza datelor seleciei, iar n este mrimea seleciei;
n legtur cu alegerea valorii nivelului de semnificaie este important s se fac urmtoarea
remarc: valoarea se alege n fiecare caz cercetat n funcie de domeniul n care se face
cercetarea i bineneles, de precizia pe care dorim s-o obinem.
n practica cercetrilor industriale s-a dovedit c n toate cazurile cnd nivelul de semnificaie
nu depete valoarea 0,05 se pot formula concluzii care corespund realitii. Aadar
pentru se aleg valori cuprinse ntre 0 i 0,05. Valorile cele mai utilizate ale nivelului de
semnificaie sunt: 0,01 i 0,05, iar n cazurile cnd se urmrete o precizie mare, 0,001 i
uneori 0,002 (sau 0,0027). Faptul c aceste valori s-au ncetenit n practica cercetrilor
industriale nu ne poate mpiedica s alegem i alte valori, pentru nivelul de semnificaie;
important este ca valorile alese s nu fie mai mari dect 0,05;
Valorile nivelului de semnificaie se stabilesc innd seama de condiiile concrete n care se
face cercetarea:
cnd dispunem de date din cercetri prealabile, bunoar n controlul statistic al
calitii produciei industriale care are ca scop verificarea ipotezei m m0 (m0 fiind
mijlocul cmpului de toleran), pentru stabilirea nivelului de semnificaie trebuie s
se in seam de procentul rebutului de la maina respectiv i se aplic criteriul Z;

Statistic aplicat n inginerie


cnd ns nu exist nici un fel de date referitoare la fenomenul sau procesul studiat,
nivelul de semnificaie nu mai poate fi ales n prealabil. n asemenea cazuri se
calculeaz mrimea t cu ajutorul formulei:

x m0
,
s
n

n care x i s se obin pe baza datelor seleciei de mrime n, iar m0 este valoarea


ipotetic. Mrimea t astfel obinut se compar cu t corespunztor nivelului de
semnificaie = 0,05 (adic t0,05) i numrului gradelor de libertate f = n 1:
Cazuri:
1) dac t gsit pe baza seleciei este mai mic dect t0,05 ipoteza se accept;
2) dac t este mai mare dect t0,05 corespunztor nivelului de semnificaie = 0,05,
dar mai mic dect t0,01 corespunztor nivelului de semnificaie = 0,01, nu exist
temei pentru respingerea, dar nici pentru acceptarea ipotezei. Decizia nu se poate
da n acest caz dect dac se face o alt selecie!!!;
3) dac t este mai mare dect t0,01 corespunztor lui = 0,01, ipoteza se respinge.
Deoarece distribuia t depinde de numrul gradelor de libertate f, valorile t0,05 i t0,01 cu care se
compar mrimea t obinut pe baza datelor seleciei se determin de fiecare dat n funcie
de numrul gradelor de libertate f cu ajutorul tabelului 2, ANEXA 2, n care se d probabilitatea
ca valorile lui t s fie mai mici sau egale cu o valoare dat t, adic P t t P .
Intereseaz valorile t0,05 i t0,01 corespunztoare nivelurilor de semnificaie = 0,05 i = 0,01.
0,05
0,01
Pentru = 0,05 rezult P 1
0,975 i pentru = 0,01 rezult P 1
0,995 .
2
2
Rezult aadar c valorile t0,05 i t0,01 se gsesc n tabelul 2, ANEXA 2, la intersecia coloanei
0,975, respectiv 0,995, cu rndul corespunztor numrului gradelor de libertate f. De exemplu
dac f = 13, atunci t0,05 = 2,160, respectiv t0,01 = 3,012.
3.5.2. Puterea criteriului t
Pentru a determina riscul de genul II, , adic probabilitatea comiterii unei erori de genul II
(probabilitatea acceptrii ipotezei nejuste):

1 m1 ,

(3.37)

trebuie s gsim expresia funciei de putere.


Potrivit definiiei, puterea criteriului reprezint probabilitatea de a respinge ipoteza m m0
atunci cnd ea nu este just, datorit faptului c m este afectat de o abatere sistematic,
adic m este diferit de m0 ( m m1 m0 ).
6

Statistic aplicat n inginerie


Se poate da o formul aproximativ bazat pe distribuia normal care permite folosirea
funciei tabelare a lui Laplace, cnd mrimea seleciei, adic numrul gradelor de libertate
f n 1 , este mare:


t
m1 1 1

t 2
1
2f

t 1

t 2

1
2f

(3.38)

unde: t se gsete n tabelul 2, ANEXA 2, corespunztor unei valori date a nivelului de

semnificaie, adic t corespunde valorii P 1 din tabel;


2

1 este eroarea sistematic normat:


m1 m0 m1 m0

s
s
n
n
n

f este numrul gradelor de libertate, f n 1 , n fiind mrimea seleciei.


Exemplu. Coninutul mediu de carbon al pieselor turnate din font maleabil
neagr trebuie s fie 2,35%. Pentru a verifica dac coninutul mediu de
carbon al pieselor turnate dintr-o arj este corespunztor, adic 2,35%, se
efectueaz o selecie de mrime n = 20 (se iau 20 de piese produse din
aceeai arj de font). Rezultatele cercetrii coninutului de carbon al celor
20 de piese sunt date n tabelul alturat.
Deoarece nu se cunoate dispersia se aplic criteriul t.
2

xi
i 1

x x

2,42 , s

i 1

n1

0,1517

Se calculeaz mrimea t:

t calc

x m0
s
n

2,42 2,35
0,1517

0,07
0,034

2,059

20

Din tabelul 2, ANEXA 2, pentru P 97,5 i f = 20 1 = 19, t0,05 = 2,093.


Rezult tcalc < t0,05, deci putem concluziona c, n ceea ce privete coninutul mediu de carbon al pieselor turnate
acesta este 2,35%.
Se calculeaz puterea criteriului presupunnd c m m0 = 2,35% i c m = m1 = x = 2,42% (exist o abatere
sistematic 0,07 ).

Statistic aplicat n inginerie

m1 m0

m1 m0
s

0,07
0,1517

2,064

20


t
1
m1 1
2

t
1



2f

t 1
2

t
1

2f

2,093 2,064

2,093 2,064

1
2
2


2,093
2,093

1
2 19
2 19

1 0,027 3,959 1 0,01197 0,499963 0,488


Prin urmare n ipoteza c abaterea sistematic normat este 1 2,1 (o abatere sistematic de 0,07 ),
obinem pentru funcia de putere a criteriului valoarea m1 0,49 ; criteriul nu permite dect n 49% cazuri s
ne dm seama de aceast abatere, iar n 51% din cazuri vom accepta c arja are un coninut mediu de carbon de
2,35%.

3.6. UTILIZAREA CRITERIULUI t LA COMPARAREA A DOU MEDII


Considerm acum dou colectiviti distribuite normal din punct de vedere al caracteristicii x cu
mediile m1, m2 i dispersiile 12 , 22 necunoscute. Trebuie s verificm ipoteza m1 m2 pe
baza datelor obinute cu ajutorul a dou selecii extrase ntmpltor din cele dou colectiviti.
Fie:

x11 , x12 ,.....x1n1 ,


x21 , x22 ,.....x2n2 ,

cele dou sisteme de observaii obinute prin cercetarea caracteristicii X a n1 uniti extrase din
prima colectivitate i a n2 uniti extrase din a doua colectivitate.
Mediile de selecie x1 , x2 estimeaz mediile m1, m2 i dispersiile de selecie s12 i s22
estimeaz dispersiile 12 , 22 . Dac mediile m1, m2 sunt egale, atunci diferena dintre mediile
de selecie x1 , x2 se datoreaz ntmplrii, adic d x1 x2 este ntmpltoare.
Conform teoremei adunrii pentru distribuia normal, mrimea d se distribuie normal cu
media Md m1 m2 i dispersia Dd

12 22
.
n1 n2

Aa cum s-a demonstrat n 3.4, ipoteza m1 m2 se poate verifica cu ajutorul criteriului Z:

x1 x2
12 22

n1 n2

(3.39)

care, evident, se distribuie normal cu media 0 i dispersia 1, ceea ce ar permite aplicarea


criteriului Z n cazul n care s-ar cunoate dispersiile 12 , 22 .

Statistic aplicat n inginerie


Deoarece dispersiile 12 , 22 sunt necunoscute, asupra lor se pot face dou ipoteze:
a) 12 = 22 ;
b) 12 22 .
Observaie: Ipoteza 12 22 se verific cu ajutorul raportului dispersiilor s12 , s22 cu ajutorul
criteriului de semnificaie F, Cursul 6, 3.7.
Dup cum s12 difer sau nu difer semnificativ de s22 , dispersiile 12 , 22 se consider egale
sau diferite ntre ele. De aici rezult c la verificarea ipotezei m1 m2 pe baza diferenei

d x1 x2 deosebim dou cazuri i anume:


a) m1 m2 i 12 22 ;
b) m1 m2 i 12 22 .
3.6.1. Verificarea ipotezei m1 m2 i 12 22
n aceste condiii, mrimea z este:

x1 x2

12 22

n1
n2

x1 x2
.
1 1

n1 n2

(3.40)

Dar ntruct abaterea medie ptratic este necunoscut trebuie s-o nlocuim cu estimaia s,
calculat pe baza datelor seleciilor.
Dac s12 , s22 sunt dispersiile a dou selecii extrase din dou colectiviti cu 12 22 ,
estimaia s2 a lui 2 este media aritmetic a dispersiilor s12 , s22 ponderate cu numrul
gradelor de libertate corespunztoare (teorema adunrii pentru distribuia s2 ):

s2

f1 s12 f2 s22
,
f1 f2

(3.41)

unde: f1 n1 1; f2 n2 1; f1 f2 n1 n2 2 .
Prin nlocuirea lui cu s, mrimea z se transform n mrimea t:

x1 x2
,
1 1
s

n1 n2

(3.42)

Mrimea t definit de relaia (3.42) are o distribuie Student t cu f f1 f2 n1 n2 2 grade


de libertate, prin urmare verificarea ipotezei m1 m2 se poate face cu ajutorul criteriului t.

Statistic aplicat n inginerie


Evident c n acest caz aplicarea criteriului t necesit stabilirea prealabil a nivelului de
semnificaie . Vom compara mrimea obinut pentru t din datele cercetrii cu valoarea lui t
corespunztoare nivelului de semnificaie = 0,05 (ANEXA 2, tabelul 2) i f f1 f2 n1 n2 2
grade de libertate:
1. dac t t0,05 se consider c diferena dintre cele dou medii d x1 x2 este
ntmpltoare i nu se datoreaz unei diferene dintre mediile m1 i m2, iar ca atare
ipoteza m1 m2 se accept ca just;
2. dac t0,05 t t0,01 se consider ipoteza ndoielnic, iar pentru a decide dac diferena
dintre cele dou medii este ntmpltoare sau sistematic este necesar o nou selecie
care se recomand s cuprind un numr mai mare de uniti;
3. t t0,01 se consider c diferena dintre cele dou medii nu este ntmpltoare, ci se
datoreaz diferenei care exist ntre mediile m1 i m2 i ipoteza egalitii celor dou
medii se respinge.
Obs. Pentru 0,05 P 1

0,05
0,01
0,975 , iar pentru 0,01 P 1
0,995 .
2
2

Dac cele dou selecii se extrag din aceeai colectivitate general i dac ipoteza m1 m2 m
este just, atunci pentru media m i dispersia 2 ale colectivitii generale se pot calcula
estimaiile:
x

n1 x1 n2 x2
m,
n1 n2
n1

s02

x
i1

x1 x2i x2
2

1i

n2

(3.43)

i1

n1 n2 1

2 .

(3.44)

2
Deoarece media x se distribuie normal cu media m i dispersia
, mrimea:
n1 n2
t

x m
,
s0
n1 n2

(3.45)

urmeaz distribuia t avnd f n1 n2 1 grade de libertate.


Pentru un nivel de semnificaie dat, intervalul de ncredere este:

s0
s0
P x t
m x t

n1 n2
n1 n2

10

1 ,

(3.46)

Statistic aplicat n inginerie


care d posibilitatea determinrii limitelor de ncredere pentru media colectivitii generale:

x t

s0
n1 n2

; x t

s0
n1 n2

unde: x i s 0 se calculeaz cu ajutorul formulelor (3.43) i (3.44);


n1 i n2 sunt mrimile celor dou selecii extrase din colectivitatea general;
t se gsete n ANEXA 2, tabelul 2 corespunztor nivelului de semnificaie ales i

numrul gradelor de libertate f n1 n2 1 , corespunztor probabilitii P 1 .


2
Obs. Pentru 0,05 P 1

0,05
0,01
0,975 , iar pentru 0,01 P 1
0,995 .
2
2

3.6.2. Verificarea ipotezei m1 m2 i 12 22


Mrimea z este:

x1 x2

(3.47)

12 22

n1
n2

n ipoteza m1 m2 i avnd n vedere c cele dou dispersii 12 22 sunt necunoscute, se


nlocuiesc cu estimaiile s12 , s22 :

x1 x2

s12 s22

n1 n2

(3.48)

Se demonstreaz c mrimea t se distribuie dup distribuie Student t cu:


f

1
c 1 c

f1
f2
2

(3.49)

grade de libertate, unde:

s 12
n1
s12 s 2 2

n1 n2

(3.50)

iar f1 n1 1 i f2 n2 1 sunt gradele de libertate ale dispersiilor de selecie s12 , s22 .

11

Statistic aplicat n inginerie


Aplicarea criteriului t necesit stabilirea prealabil a nivelului de semnificaie . Se compar
mrimea obinut pentru t din datele cercetrii cu valoarea lui t corespunztoare nivelului de
1
semnificaie = 0,05 (ANEXA 2, tabelul 2) i f
grade de libertate:
2
2
c 1 c

f1
f2
1. dac t t0,05 se consider c diferena dintre cele dou medii d x1 x2 este
ntmpltoare i nu se datoreaz unei diferene dintre mediile m1 i m2, iar ca atare
ipoteza m1 m2 se accept ca just;
2. dac t0,05 t t0,01 considerm ipoteza ndoielnic, iar pentru a decide dac diferena
dintre cele dou medii este ntmpltoare sau sistematic este necesar o nou selecie
care se recomand s cuprind un numr mai mare de uniti;
3. t t0,01 se consider c diferena dintre cele dou medii nu este ntmpltoare ci se
datoreaz diferenei care exist ntre mediile m1 i m2 i ipoteza egalitii celor dou
medii se respinge.
Obs. Pentru 0,05 P 1

0,05
0,01
0,975 , iar pentru 0,01 P 1
0,995 .
2
2

BIBLIOGRAFIE
1. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
2. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
3. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963

12

Statistic aplicat n inginerie


ANEXA 1
Tabelul 1

13

Statistic aplicat n inginerie


Tabelul 1 (continuare)

14

Statistic aplicat n inginerie


Tabelul 1 (continuare)

15

Statistic aplicat n inginerie


ANEXA 2
Tabelul 2

16

Statistic aplicat n inginerie

CURS 6
3. VERIFICAREA IPOTEZELOR. CRITERII DE SEMNIFICAIE (CONTINUARE)
3.7. CRITERIUL DE SEMNIFICAIE F
Ipoteza 1 2
2

12
se verific pe baza criteriul de verificare a raportului 2 1
2

Pentru a verifica ipoteza se folosesc datele unei cercetri selective i anume, se extrage o
selecie de mrime n1 din colectivitatea general a crei dispersie este 12 (necunoscut) i o
selecie de mrime n2 din colectivitatea general a crei dispersie este 22 (necunoscut).
Fie:

x11 , x12 ,.....x1n1 ,


x21 , x 22 ,.....x 2n2 ,

rezultatele cercetrii celor dou selecii.


Dispersiile 12 , 22 se estimeaz cu ajutorul dispersiilor de selecie:
n1

s 12

x
i 1

1i

n1 1
n2

s 22

x1

x
i 1

Raportul dispersiilor

2i

x2

(3.51)

(3.52)

n2 1

12
s12
se
estimeaz
cu
ajutorul
raportului
dispersiilor
de
selecie
(se
s 22
22

consider cazul n care s12 s22 ):


Pentru ca cele dou dispersii 12 , 22 s fie egale ntre ele, adic raportul lor s fie 1, trebuie
ca raportul dispersiilor de selecie

s12
s aib o valoare cuprins ntre dou valori bine
s 22

determinate F1 i F2.
Se demonstreaz c pentru un nivel de semnificaie (risc) i dac se consider probabilitatea
ca valorile raportului s fie mai mici dect F1 egal cu probabilitatea ca valorile raportului s
fie mai mare dect F2, atunci intervalul critic este definit de inegalitile:

s12
s1 2

F
F2 F ,
i
1

2
;f1 ;f2
1 ;f1 ;f2
s22
s
2
2
2

(3.53)

Statistic aplicat n inginerie


unde f1 n1 1; f2 n2 1 sunt gradele de libertate ale celor dou selecii.

s12
s se gseasc n intervalul de ncredere este, pentru un nivel de
s 22

Probabilitatea ca raportul

semnificaie (risc) dat, este:

s1 2
P F1 F
2 F2 F 1 .
;f1 ;f2
1 ;f1 ;f2
s2

2
2

(3.54)

n ANEXA 2, Tabelul 2 (n care se dau valorile lui F corespunztor unui risc 0,05
0,05
P 1
0,975 ) se caut valoarea lui F situat la intersecia coloanei corespunztoare lui
2
f1 cu rndul corespunztor lui f2. Valoarea gsit reprezint limita superioar a intervalului de
ncredere: F2 F .
1 ;f1 ;f2
2

Apoi, n acelai tabel, se caut valoarea lui F situat la intersecia coloanei corespunztoare lui
f2 cu rndul corespunztor lui f1. mprind pe 1 la valoarea gsit, obinem limita inferioar a
1
intervalului de ncredere: F1
.
F
1 ;f2 ;f1
2

Observaie: dac dispersia s12 i este mai mic dect dispersia s22 , atunci se studiaz raportul

s 22
1
, dar acest criteriu duce la aceleai rezultate, deoarece F

2
;f
;f
1 2
s1
F
2

1 ;f2 ;f1
2

n felul acesta se poate stabili criteriul pe baza unui singur raport i anume pe baza raportului
dintre dispersia mai mare i dispersia mai mic; acest raport se compar cu limita superioar
de ncredere:
F2 F

1 ;f1 ;f2
2

(3.55)

adic intervalul critic este definit de relaia:

dispersia de selectie maimare


F ,
dispersia de selectie maimica 1 2 ;f1 ;f2

(3.56)

unde f1 reprezint gradele de liberate ale dispersiei de selecie mai mari, iar f2 gradele de
libertate ale dispersiei de selecie mai mici.
Dac valoarea raportului dispersiilor de selecie determinat ca n relaia (3.56) este mai mic

dect valoarea F2 corespunztor probabilitii P 1 , se consider c dispersiile 12 , 22


2
sunt egale, adic raportul lor este 1.

Statistic aplicat n inginerie


Dac valoarea obinut pentru raportul dispersiilor de selecie este mai mare dect valoarea

F2 corespunztoare probabilitii P 1 , nseamn c dispersiile 12 , 22 ale colectivitilor


2
din care s-au extras cele dou selecii nu sunt egale, adic raportul lor este diferit de 1.
Exemplul 1. Pentru a verifica dac durata de ardere a dou loturi de becuri
electrice este aceeai, s-a luat cte o prob de 20 de becuri din fiecare lot
care s-au ncercat n privina caracteristicii studiate. Datele obinute sunt
prezentate n tabelul alturat.
Rezolvare
1. Mediile de selecie sunt:
n1

x1

n2

x 1i
1097 ore, x2

i 1

n1

2i

1108 ore.

i 1

n2

2. Dispersiile de selecie:
n1

s1
2

1i

x1

n2

4432,63 , s 2

i 1

x2

3157,26

i 1

n1 1

2i

n1 1

3. Verificarea egalitii celor dou dispersii 1 , 2 (criteriul F):


2

dispersia mai mare


dispersia mai mica

4432,63

1,44 ;

3157,26

gradele de libertate: f1 n1 1 20 1 19 , f2 n2 1 20 1 19 ;

n ANEXA 2, Tabelul 2, pentru f1 = 19, f2 = 19 (pentru un nivel de semnificaie = 0,05) gsim


F0,975;19;19 = 2,53, mai mare dect F = 1,44, rezult c cele dou dispersii 1 , 2 sunt egale.
2

4. Verificarea ipotezei m1 m2 cnd 1 2


2

4.1. Estimaia s pentru dup formula (3.41) Curs 5:

f1 s1 f2 s 2
2

f1 f2

19 4432,63 19 3157,26
19 19

4432,63 3157,26
2

61,6 ore.

4.2. Verificm dac diferena celor dou medii de selecie este ntmpltoare cu ajutorul criteriului t. Criteriul t se
va calcula dup formula (3.42) Curs 5:

x1 x2

t
s

1
n1

1
n2

1093 1108
61,6

1
20

1
20

1093 1108
61,6

0,77 0,77 ;

1
10

f f1 f2 n1 n2 2 20 20 2 38 grade de libertate.

Statistic aplicat n inginerie


n ANEXA 1, Tabelul 1 pentru f = 38 40 i P = 0,975 gsim t0,05 = 2,021 care este mult mai mare dect t = 0,77, deci
cele dou medii difer numai ntmpltor, rezult c ipoteza m1 = m2 este just.
5. Deoarece cele dou selecii se extrag din aceeai colectivitate general i ipoteza m1 = m2 = m este just atunci
pentru media m i dispersia ale colectivitii generale se pot calcula pe baza estimaiilor:
2

m x

n1 x1 n2 x2
n1 n2
n1

s0
2

s0

x1
2

1i

i 1

x1 x2

1093 1108

n2

2i

x2

1100,5 ore;

cu relaia (3.43) Curs 5

3695,9 ;

i 1

n1 n2 1

cu relaia (3.44) Curs 5

3695,9 60,79 ore.

7. Avnd aceste date putem determina, folosindu-ne de formula (3.46) Curs 5, limitele intervalului de ncredere
pentru media general necunoscut m. Alegnd ca nivel de semnificaie = 0,05, gsim n ANEXA 1, Tabelul 1
pentru f n1 n2 1 39 40 i P 0,975 , t0,05=2,021, iar pentru intervalul de ncredere obinem:

s0

x t 0 ,05

n1 n2

m x t 0 ,05

s0

1100,5 2,021

n1 n2

60,79

m 1100,5 2,021

60,79

40

1081,1 m 1119,9

40

Aadar cu o probabilitate de 95%, intervalul (1081,1; 1119,9) va acoperi media general m.


Exemplul 2. Fiola farmaceutic cu capacitate de 100mI poate s aib
capacitatea efectiv ntre 105ml i 115mI. Pentru dou loturi de fiole
provenite de la dou fabrici se cerceteaz dac mediile acestor dou
loturi sunt egale sau nu. n acest scop din lotul nti se extrage o selecie
de 25 fiole, iar din cel de-al doilea o selecie de 20 fiole.
Rezolvare
1. Mediile de selecie sunt:
n1

x1

n2

1i

104,76 ml, x2

i 1

n1

2i

112,2 ml.

i 1

n2

2. Dispersiile de selecie:
n1

s1
2

1i

x1

n2

5,19 , s 2

i 1

n1 1

2i

x2

i 1

n2 1

27,54

3. Verificarea egalitii celor dou dispersii 1 , 2 (criteriul F):


2

Se schimb indicii:
n2

x1

n1

x 2i

i 1

n2

112,2 , x2

n2

x 1i

i 1

n1

104,76 , s1
2

x 2i x2

i 1

n1

27,54 , s 2
2

n2 1

1i

x1

i 1

n1 1

5,19

Statistic aplicat n inginerie

dispersia mai mare


dispersia mai mica

27,54
5,19

5,31 ;

gradele de libertate: f1 n1 1 20 1 19 , f2 n2 1 25 1 24 ;

n ANEXA 2, Tabelul 2, pentru f1 = 19, f2 = 24 (pentru = 0,05) gsim F0,975;19;24 = 2,35, mai mic dect
F = 5,31. Rezult, cu o probabilitate de 0,95, c cele dou dispersii generale 1 , 2 se deosebesc
2

semnificativ.
4. Verificarea ipotezei m1 m2 cnd 1 2
2

4.1. Revenim la notaiile iniiale. Verificm dac diferena celor dou medii de selecie este ntmpltoare cu
ajutorul criteriului t. Criteriul t se va calcula dup formula (3.48) Curs 5:

x1 x2

s1

s2

n1

104,76 112,20

5,19
25

n2

5,11 5,11 .

27,54

20

4.2. Numrul gradelor de libertate pentru acest t se calculeaz dup formula (3.49) Curs 5:

f
c

f1

1 c

0,13103

f2

24

1 0,13103

24,7 25 ,

19

unde conform formulei (3.50) Curs 5:

s1
c

5,19

n1
s1

n1

s2

n2

25
0,13103 .
27,54

25
20

5,19

n ANEXA1, Tabelul 1, pentru f = 25 i = 0,05, adic P 1

0,05

1 0,025 0,975 , i corespunde t0,05 = 2,060


2
care este mai mic dect t calculat,prin urmare diferena mediilor celor dou loturi de fiole farmaceutice este
semnificativ, rezult c ipoteza m1 = m2 se respinge.

3.8. UTILIZAREA CRITERIULUI t LA COMPARAREA A DOU METODE DE CERCETARE


3.8.1. Schema comparrii mediilor ( d x1 x2 )
Adesea n cercetrile industriale i de laborator o caracteristic X se poate studia prin dou
metode de cercetare i se pune n mod firesc ntrebarea dac cele dou metode dau rezultate
identice i care din ele este mai eficace.
De exemplu, coninutul de siliciu al oelului, care reprezint caracteristica cercetat, se poate
determina pe dou ci: chimic sau colorimetric. De regul, cele dou metode dau rezultate
diferite dac se aplic la aceeai prob. Acesta nu poate fi ns un indiciu c n general
rezultatele celor dou metode difer semnificativ, deoarece chiar dac aceleiai probe i se

Statistic aplicat n inginerie


aplic aceeai metod n mod repetat, rezultatele obinute sunt diferite. Este firesc s se
ntmple aa deoarece asupra rezultatului acioneaz o serie de factori ntmpltori care
determin variaia ntmpltoare. Pentru a decide dac rezultatele difer sau nu semnificativ,
adic dac rezultatele unei metode difer datorit unei abateri sistematice i nu ntmpltor,
trebuie s folosim metode statistice.
Fie M1 i M2 dou metode de cercetare utilizate pentru studierea unei caracteristici X. n
vederea cercetrii acestei caracteristici sunt necesare mai multe uniti (obiecte, probe
elementare etc.). Astfel se pot extrage dou selecii, apoi unitile primei selecii se cerceteaz
cu ajutorul metodei M1, iar unitile celeilalte selecii se cerceteaz cu metoda M2.
Dac numrul unitilor fiecrei selecii ar fi foarte mare s-ar observa c valorile caracteristicii
obinute prin cele dou metode s-ar grupa n jurul valorilor m1 pentru prima selecie i m2
pentru a doua selecie. Aceste valori sunt mediile teoretice i reprezint valorile caracteristicii
care s-ar obine dac n-ar exista abaterile ntmpltoare determinate de factori ntmpltori
necunoscui, a cror influen nu se poate msura. Prin urmare a verifica c cele dou metode
duc sau nu la rezultate n esen identice (care nu difer semnificativ), nseamn a verifica dac
mediile teoretice numite adesea "valori adevrate" ale caracteristicii X sunt egale, adic
verificarea ipotezei m1 = m2.
Fie x11 , x12 ,...,x1n valorile caracteristicii obinute n urma cercetrii unitilor care compun prima
selecie utiliznd metoda M1 i x21 , x22 ,...,x2n valorile obinute prin cercetarea unitilor care
compun selecia a doua utiliznd metoda M2.
Mediile i dispersiile de selecie vor fi:
n

x1

x1i
i1

n1
n

s12

x
i1

, x2

x
i1

n2

1i x1

n1 1

2i

(3.57)
n

, s22

x
i1

x2

2i

n2 1

(3.58)

Se verific cu criteriul F dac 12 = 22 .


3.8.1.1. Cazul 12 = 22
Mrimea t care se calculeaz cu relaia:
t

x1 x2
,
1 1
s

n1 n2

(3.59)

urmeaz legea de distribuie Student t cu f n1 n2 2 grade de libertate.


n cazul n care seleciile conin un numr egal de uniti, deci n1 n2 n , t devine:

Statistic aplicat n inginerie


t

x1 x2
x x
1 2 n.
1 1 s 2
s

n n

(3.60)

Dispersia de selecie total s 2 se calculeaz cu ajutorul formulei:


s2

2
2
f1 s12 f2 s22 n 1 s1 n 1 s2 s12 s22

f1 f2
2
n 1 n 1

(3.61)

Mrimea t definit de relaia (3.60) are o distribuie Student t cu f n 1 n 1 2 n 1


grade de libertate.
Pentru a verifica dac cele dou metode de cercetare permit obinerea unor rezultate identice,
trebuie ca mrimea t calculat, pe baza datelor cercetrii, dup formula (3.60) s aib valori
mai mici dect valoarea t0,05 corespunztoare nivelului de semnificaie = 0,05 (ANEXA 1,
Tabelul 1, P 0,975 ):
1. dac t < t0,05 se consider c diferena dintre cele dou medii d x1 x2 nu este
semnificativ, prin urmare rezultatele obinute prin cele dou metode nu difer
semnificativ;
2. dac t0,05 < t < t0,01 considerm ipoteza d x1 x2 ndoielnic, iar pentru a decide dac
rezultatele obinute prin cele dou metode este ntmpltoare sau sistematic este
necesar o nou selecie care se recomand s cuprind un numr mai mare de uniti;
3. t > t0,01 se consider c diferena dintre cele dou medii d x1 x2 obinute prin cele
dou metode nu este ntmpltoare i ipoteza se respinge.
3.8.1.2. Cazul 12 22
Mrimea t care se calculeaz cu relaia:

x1 x2
s12 s22

n1 n2

(3.62)

urmeaz legea de distribuie Student t cu f

1
c 1 c

f1
f2
2

grade de libertate ( f1 n1 1 i

f2 n2 1 ), unde:

s1 2
n1

(3.63)

s1 2 s 2 2

n1 n2

Statistic aplicat n inginerie


n cazul n care seleciile conin un numr egal de uniti, deci n1 n2 n :

x1 x2

2
1

x1 x2

s12 s22

s
s
2
n1 n2
1

c2 1 c

f1
f2

s12
n1
s12 s22

n1 n2

n,

(3.64)

1 c
c2

n 1
n 1

n1
c 1 c
2

s12
.
s12 s22

(3.65)

(3.66)

Pentru a verifica dac cele dou metode de cercetare permit obinerea unor rezultate identice,
trebuie ca mrimea t calculat, pe baza datelor cercetrii, dup formula (3.64) s aib valori
mai mici dect valoarea t0,05 corespunztoare nivelului de semnificaie = 0,05 (ANEXA 1,
Tabelul 1, P 0,975 ):
1. dac t < t0,05 se consider c diferena dintre cele dou medii d x1 x2 nu este
semnificativ, prin urmare rezultatele obinute prin cele dou metode nu difer
semnificativ;
2. dac t0,05 < t < t0,01 considerm ipoteza d x1 x2 ndoielnic, iar pentru a decide dac
rezultatele obinute prin cele dou metode este ntmpltoare sau sistematic este
necesar o nou selecie care se recomand s cuprind un numr mai mare de uniti;
3. t > t0,01 se consider c diferena dintre cele dou medii d x1 x2 obinute prin cele
dou metode nu este ntmpltoare i ipoteza se respinge.
Exemplul 3. Coninutul de siliciu al arjelor s-a determinat prin dou
metode: chimic i colorimetric. Se analizeaz dac cele dou
metode dau rezultate identice. Pentru aceasta s-au luat apte probe
duble din aceeai arj de oel folosind metoda chimic i
colorimetric. Rezultatele cercetrii sunt date n tabelul alturat.
Rezolvare
1. Mediile de selecie sunt:
n

x1

1i

1,253 , x2

i 1

x
i 1

2i

1,267 .

2. Dispersiile de selecie:
n

s1
2

1i

x1

i 1

0,01852 , s 2
2

n1

2i

x2

0,02895 .

i 1

n1

Statistic aplicat n inginerie


3. Verificarea egalitii celor dou dispersii 1 , 2 (criteriul F)
2

dispersia mai mare


dispersia mai mica

0,02895
0,01852

1,56 ;

gradele de libertate

f1 f2 n 1 7 1 6 .

din ANEXA 2, Tabelul 2, pentru f1 = 6, f2 = 6 (pentru un nivel de semnificaie de 0,05) gsim F0,975;6;6 = 5,82,
mai mare dect F = 1,56. Cu o probabilitate de 95% se poate afirma c cele dou dispersii generale 1 ,
2

2 sunt egale.
2

4. Dispersia de selecie total s


s1 s 2
2

s
2

0,01852 0,02895
2

0,02374 ;

5. Calculul mrimii t
t

x1 x2
s 2

1,253 1,267
0,02374 2

7 0,17 0,17 ;

6. Numrul gradelor de libertate

f 2 n 1 2 7 1 12 grade de libertate.
Din tabel pentru f = 12 i P = 0,975 gsim t0,05 = 2,179 care este mult mai mare dect t = 0,17, prin urmare
rezultatele obinute prin cele dou metode nu difer semnificativ, ipoteza se accept.

3.8.2. Schema comparrii diferenelor


Procedeul de selecie examinat anterior poate fi utilizat numai cnd suntem siguri c unitile
cercetate sunt omogene din punct de vedere al caracteristicii cercetate, adic atunci cnd
aplicnd oricrei uniti aceeai metod obinem rezultate care nu difer dect ntmpltor.
Sunt destul de rare cazurile cnd se tie n prealabil dac unitile cercetate sunt omogene, de
aceea este cu mult mai raional s se extrag perechi de uniti, sau s se fac determinri
folosind una i aceeai prob. n felul acesta se ofer posibilitatea studierii efectelor celor dou
metode de cercetare n condiii ct mai diferite i obinerea unor concluzii cu o valabilitate
mai general. Aadar unitile care urmeaz a fi cercetate se grupeaz n n perechi, iar
caracteristica celor dou uniti ale perechii se cerceteaz prin cele dou metode M1 i M2. n
acest caz cele dou procedee de cercetare duc la rezultate n esen identice atunci cnd
diferenele dintre valorile caracteristicii corespunztoare celor dou uniti ale perechii sunt
ntmpltoare, adic atunci cnd media teoretic a diferenelor este zero.
Fie x11 , x12 , x21 , x22 , ..., xn1 , xn2 rezultatele cercetrii perechilor de uniti prin metodele

M1 i respectiv M2. S-a notat cu xi1 valoarea caracteristicii corespunztoare unitii din

Statistic aplicat n inginerie


perechea i determinat cu ajutorul metodei M1, iar cu xi2 valoarea caracteristicii
corespunztoare unitii din perechea i, determinat cu ajutorul metodei M2.
S presupunem c rezultatele obinute prin aplicarea celor dou metode de cercetare nu se
deosebesc dect ntmpltor. Aceasta nseamn c dac s-ar elimina abaterile ntmpltoare,
valorile observate xi1 i xi2 ar fi egale.
S mai presupunem c valorile caracteristicii, indiferent de metoda de cercetare, se distribuie
normal. n aceste condiii, diferenele di xi1 xi2 , n cazul cnd mrimea seleciei tinde ctre
, se distribuie normal cu media zero i dispersia d2 .

Rezult c diferena medie:


n

i1

(3.67)

se distribuie normal cu media 0 i dispersia


z

d2
, iar mrimea:
n

d
,
d
n

(3.68)

are o distribuie normal cu media 0 i dispersia 1.


Dac abaterea medie ptratic d se nlocuiete cu estimaia sa:
n

sd

d d
i1

n1

, f n1,

(3.69)

obinem mrimea
t

d
.
sd
n

(3.70)

Aceast mrime urmeaz legea de distribuie Student t cu f n 1 grade de libertate.


Putem conchide aadar c verificarea egalitii rezultatelor obinute prin folosirea metodelor
de cercetare M1 i M2 se poate face cu ajutorul criteriului t.
Dac diferenele di xi1 xi2 dintre dou valori observate corespunztoare unei perechi
oarecare i sunt ntmpltoare, atunci mrimea t calculat cu ajutorul formulei (3.70), pe baza
datelor cercetrii, trebuie s fie mai mic dect t corespunztoare valorii = 0,05 a nivelului
de semnificaie i numrului gradelor de libertate f n 1 (AEXA 1, Tabelul 1, P 0,975 ).

10

Statistic aplicat n inginerie


De remarcat c diferena dintre abaterile di i diferena medie d se poate scrie:

di d xi1 x1 xi2 x2 ,

(3.71)

deci estimaia sd2 a lui d2 se poate scrie:


n

d d

2
1 n
x i1 x1 x i2 x2

n1
n 1 i1
1 n
1 n
2 n
2
2
xi1 x1
xi2 x2

xi1 x1 xi2 x2 .
n 1 i1
n 1 i1
n 1 i1

s d2

i1

(3.72)

Notnd cu:

s12

1 n
2
xi1 x1

n 1 i1

(3.73)

s22

1 n
2
xi2 x2 .

n 1 i1

(3.74)

s12

1 n
xi1 x1 xi2 x2 ,
n 1 i1

(3.75)

Se noteaz cu:

momentul de ordinul doi corelat al celor dou iruri de valori xi1 i xi2 , estimaia sd2 se poate
scrie:
sd2 s12 s22 2 s12 .

(3.76)

Acest rezultat arat c sd2 , dispersia diferenelor di d , depinde de corelaia dintre valorile

xi1 i xi2 obinute ca rezultat al cercetrii caracteristicii prin metodele M1 i M2; dispersia sd2
are valoarea minim atunci cnd momentul de ordinul doi corelat are valoarea maxim, adic
1. Momentul de ordinul doi corelat are valoarea egal cu 1 atunci cnd ntre cele dou variabile
exist o corelaie strns.
Pentru a verifica dac cele dou metode de cercetare permit obinerea unor rezultate identice,
trebuie ca mrimea t calculat, pe baza datelor cercetrii, dup formula (3.70) s aib valori
mai mici dect valoarea t0,05 corespunztoare nivelului de semnificaie = 0,05 (ANEXA 1,
Tabelul 1, P 0,975 ):
1. dac t < t0,05 se consider c diferenele dintre perechile de valori nu sunt semnificative,
prin urmare rezultatele obinute prin cele dou metode nu difer semnificativ;
2. dac t0,05 < t < t0,01 considerm ipoteza ndoielnic, iar pentru a decide dac diferena
dintre rezultatele obinute prin cele dou metode este ntmpltoare sau sistematic

11

Statistic aplicat n inginerie


este necesar o nou selecie care se recomand s cuprind un numr mai mare de
uniti;
3. t > t0,01 se consider c diferenele dintre perechile de valori nu este ntmpltoare i
ipoteza se respinge.
3.8.3. Calculul puterilor celor dou criterii.
3.8.3.1. Schema comparrii mediilor
Puterea criteriului se poate calcula cu formula aproximativ:


t
t 1 1

t2
1
2f

t 1

t2

1
2f

(3.77)

n cazul n care n1 n2 n :
1

m1 m2
s 2
n

e
s 2
n

(3.78)

3.8.3.2. Schema comparrii diferenelor


Puterea criteriului se poate calcula cu formula aproximativ:

t
t
t 1 1 1 ,

t 2
t 2
1
1
f
f

(3.79)

unde:
1

m1 m2
e
.

sd
sd
n
n

(3.80)

Se observ c puterile criteriului aplicnd cele dou scheme de organizare expuse mai sus sunt
diferite i anume puterea criteriului pentru cazul cnd se utilizeaz perechi de uniti este mai
mare.
Pentru a ne convinge de avantajul celui de-al doilea mod de selecionare vom considera
urmtorul exemplu.

12

Statistic aplicat n inginerie


Exemplul 4. Caracteristica X este controlat cu
ajutorul a dou metode M1 i M2. Presupunem c
au fost extrase 10 perechi de uniti, iar rezultatele
determinrii prin cele dou metode sunt date n
tabelul 2.
Rezolvare
A. Schema comparrii mediilor
n acest caz valoarea lui t va include dispersiile celor
dou sisteme de observaii care depind de variaia
de la prob la prob i de abateri de
experimentare.
n

x1

1.

32,72 , x2

i 1

n
n

2.

s1

3.

x1

1i

2i

31,89 ;

i 1

1,326 , s 2

i 1

1i

n1

dispersia mai mare


dispersia mai mica

1,326
0,618

2i

x2

0,618 ;

i 1

n1

2,14 ;

gradele de libertate

f1 f2 n 1 10 1 9 ;

din ANEXA 2, tabelul 2, pentru f1 = 9, f2 = 9 (pentru un nivel de semnificaie de 0,05) gsim F0,975;9;9 = 4,03,
mai mare dect F = 2,14. Cu o probabilitate de 95% se poate afirma c cele dou dispersii generale 1 ,
2

2 sunt egale.
2

s1 s 2
2

4.

5.

x1 x2

1,326 0,618
2

32,72 31,89
0,9725 2

0,9725 ;

10 1,88 ;

n
6.

f 2 n 1 2 10 1 18 grade de libertate.

Din ANEXA 1, Tabelul 1, pentru f = 18 i P = 0,975 gsim t0,05 = 2,101 care este mai mare dect t = 1,88, prin urmare
rezultatele obinute prin cele dou metode nu difer semnificativ, ipoteza se accept cu o probabilitate de 95%.
B. Schema comparrii diferenelor
n

1.

2.

sd
2

i1

=0,83;
n

d d
n1

0,667 ;

i 1

13

Statistic aplicat n inginerie

3.

d
sd
n

4.

0,83

3,2 ;

o,667
10

f = n 1 = 10 1 = 9.

Din ANEXA 1, Tabelul 1 pentru f = 9 i P = 0,975 gsim t0,05 = 2,262 care este mai mic dect t = 3,2, pentru f = 9 i
P = 0,995 gsim t0,01 = 3,25 care este mai mare dect t = 3,2 (adic 2,262 < 3,2 < 3,25), deci considerm ipoteza
ndoielnic, iar pentru a decide dac diferena dintre rezultatele obinute prin cele dou metode este
ntmpltoare sau sistematic este necesar o nou selecie care se recomand s cuprind un numr mai mare de
uniti.

BIBLIOGRAFIE
1. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
2. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
3. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963

14

Statistic aplicat n inginerie


ANEXA 1
Tabelul 1

15

Statistic aplicat n inginerie


ANEXA 2
Tabelul 2

16

Statistic aplicat n inginerie

17

Statistic aplicat n inginerie

18

Statistic aplicat n inginerie

CURS 7
3. VERIFICAREA IPOTEZELOR. CRITERII DE SEMNIFICAIE (CONTINUARE)
3.9. ELIMINAREA VALORILOR CARE SE ABAT MULT DE LA MEDIE
Dac n irul de valori exist rezultate extreme care sunt mult diferite fa de marea
majoritate a celorlalte rezultate, este necesar s se analizeze oportunitatea eliminrii acestora
n faza de prelucrare statistic. Aceasta operaie se face pe baza unor teste care impun alegerea
unei probabiliti funcie de care se ia decizia de pstrare sau eliminare a lor.
Verificarea irurilor de date sau a eantionului obinut poart denumirea de analiz critic a
datelor, dou dintre testele cele mai utilizate sunt testele GRUBBS, DIXON i ROMANOWSKI.
3.9.1. Testul GRUBBS (testul g)
Acest test se poate aplica irurilor mici i mari de date care au aproximativ o distribuie
normal i permite testarea unei singure valori care are o abatere mare n raport cu media.
Se ordoneaz setul de date de mrime n n ordine cresctoare, se calculeaz media setului de
date, iar statistica de testare, g, se calculeaz cu una din urmtoarele formule n funcie de cea
mai deprtat valoare fa de media x ( x1 sau xn ):

x x1
x x
,
; g n
s
s

(3.81)

n care:

x
i1

este media irului de date,

x x
i1

n1

este abaterea medie ptratic de selecie.

Dac valoarea g calculat cu una din formulele (3.81) este mai mare dect valoarea critic gcritic
(din tabelul 1) pentru un nivel de risc (uzual =0,05), valoarea extrem considerat se
elimin din irul de date.
n caz contrar, se impune concluzia c nu exist motive suficiente pentru eliminarea valorii
respective.
Dac valoarea a fost eliminat, se repet algoritmul pentru cele n 1 valori rmase pn cnd
nu mai sunt eliminate date ale irului.

Statistic aplicat n inginerie


Tabelul 1
n

Riscul
=0,05

=0,01

1,1531

1,1546

1,4625

Riscul
=0,05

=0,01

15

2,4090

2,7049

1,4925

16

2,4433

1,6714

1,7489

17

1,8221

1,9442

1,9381

Riscul
=0,05

=0,01

80

3,1319

3,5208

2,7470

90

3,1733

3,5632

2,4748

2,7854

100

3,2095

3,6002

18

2,5040

2,8208

120

3,2706

3,6619

2,0973

19

2,5312

2,8535

140

3,3208

3,7121

2,0317

2,2208

20

2,5566

2,8838

160

3,3633

3,7542

2,1096

2,3231

25

2,6629

3,0086

180

3,4001

3,7904

10

2,1761

2,4097

30

2,7451

3,1029

200

3,4324

3,8220

11

2,2339

2,4843

40

2,8675

3,2395

300

3,5525

3,9385

12

2,2850

2,5494

50

2,9570

3,3366

400

3,6339

4,0166

13

2,3305

2,6070

60

3,0269

3,4111

500

3,6952

4,0749

14

2,3717

2,6585

70

3,0839

3,4710

600

3,7442

4,1214

3.9.2. Testul DIXON (testul q)


Acest test se poate aplica irurilor mici de date ( n 10 ) care au aproximativ o distribuie
normal i permite testarea unei singure valori care are o abatere mare n raport cu media.
Se ordoneaz setul de date de mrime n n ordine cresctoare, se calculeaz media setului de
date, iar statistica de testare, q, se calculeaz cu una din urmtoarele formule n funcie de cea
mai deprtat valoare fa de media x ( x1 sau xn ):

x 2 x1
x x
; q n n1 ,
xn x1
xn x1

(3.82)

Dac valoarea q calculat cu una din formulele (3.82) este mai mare dect valoarea critic qcritic
(din tabelul 2) pentru un nivel de risc (uzual =0,05), valoarea extrem considerat se
elimin din irul de date.
n caz contrar, se impune concluzia c nu exist motive suficiente pentru eliminarea valorii
testate.
Dac valoarea a fost eliminat, se repet algoritmul pentru cele n 1 valori rmase pn cnd
nu mai sunt eliminate date ale irului.

Statistic aplicat n inginerie


Tabelul 2
Riscul

=0,05

=0,04

=0,02

=0,01

0,970

0,976

0,988

0,994

0,829

0,846

0,889

0,926

0,710

0,729

0,780

0,821

0,625

0,644

0,698

0,740

0,568

0,586

0,637

0,680

0,526

0,543

0,590

0,634

0,493

0,510

0,555

0,598

10

0,466

0,483

0,527

0,568

3.9.3. Testul ROMANOWSKI (testul t)


Acest test se aplic irurilor mici de date ( n 20 ) care au aproximativ o distribuie normal i
permite testarea unei singure valori care are o abatere mare n raport cu media.
Se ordoneaz setul de date de mrime n n ordine cresctoare, iar statistica de testare, t, se
calculeaz cu una din urmtoarele formule, funcie de cea mai deprtat valoare fa de
media x ( x1 sau xn ):
t

x x1
x x
; t n
,
n
n
s
s
n1
n1

n care:

i 2

n1

sau x

Tabelul 3

n1

xi

(3.83)

xi x

x
i1

n 1

,
n1

i 2

n2

sau s

x x
i1

n2

!!! din calculul mediei i dispersiei se exclude valoarea testat.


Dac valoarea t calculat cu una din formulele (3.83) este mai
mare dect valoarea critic tcritic (din tabelul 3) pentru un nivel de
risc (uzual =0,05), valoarea extrem considerat se elimin
din irul de date.
n caz contrar, se impune concluzia c nu exist motive suficiente
de eliminare a valorii testate.
Dac valoarea a fost eliminat, se repet algoritmul pentru cele n 1 valori rmase pn cnd
nu mai sunt eliminate date ale irului.
3

Statistic aplicat n inginerie


Exemplul 2. S-a extras o selecie de 22
probe pentru a cerceta grosimea peretelui
evilor de oel de dimensiune 146 7.

7,70
7,60
7,50

Valorile obinute sunt urmtoarele:

7,40

7,00; 7,10; 7,05; 7,05; 6,90; 7,20; 7,20;


7,25; 7,05; 7,20; 7,25; 7,15; 7,20; 6,95;
7,20; 7,50;7,65; 7,40; 7,20; 6,90; 7,10; 7,40.

7,30
7,20
7,10

Rezolvare

7,00

TESTUL GRUBBS

6,90

1. Valorile ordonate cresctor (SORT)

6,80

6,90; 6,90; 6,95; 7,00; 7,05; 7,05; 7,05;


7,10; 7,10; 7,15; 7,20; 7,20; 7,20; 7,20;
7,20; 7,20; 7,25; 7,25; 7,40; 7,40; 7,50; 7,65

1 2 3 4 5 6 7 8 9 10111213141516171819202122

2. media de selecie este (AVERAGE): x 7,177


3. cea mai deprtat valoare n raport cu media: xn 7,65
4. se calculeaz statistica g:

xn x
s

7,65 7,177

2,52

0,1875

unde s este abaterea medie ptratic de selecie este (STDEV): s 0,1875


5. din tabelul 1, pentru =0,05 i n=22 se gsete g 0 ,05;22
8. deoarece g 2,52 g 0 ,05;22

2,6

2,6 valoarea 7,65 nu se exclude din setul de date.

3.10. CRITERIUL COCHRAN PENTRU ELIMINAREA DISPERSIEI CARE DIFER SEMNIFICATIV DE


CELELALTE
Adesea procesele studiate permit extragerea doar a unor selecii compuse dintr-un numr
relativ mic de uniti. De aceea estimarea dispersiei generale 2 trebuie s se fac pe baza mai
multor dispersii de selecie si2 .
Fie s12 , s22 , , sk 2 , k dispersii de selecie obinute pe baza datelor a k selecii compuse din
acelai numr de uniti, n. Potrivit teoremei adunrii pentru distribuia dispersiei, dispersia
general 2 se poate calcula ca o medie aritmetic a dispersiilor de selecie si2 ponderate cu
numrul gradelor de libertate respective fi numai dac dispersiile de selecie sunt omogene,
adic sunt estimaiile uneia i aceleiai dispersii generale ( s12 s22 .... sk 2 2 ):
k

s2

f s
i

i1

2
i

(3.84)

f
i1

Statistic aplicat n inginerie


Testul (criteriul) lui Cochran se aplic indiferent de numrul de selecii (k) avut la dispoziie n
scopul eliminrii dispersiei de selecie care difer semnificativ de celelalte (testarea celei mai
mari dispersii).
Statistica de testare, c, se calculeaz cu formula:

max si2
k

s
i1

(3.85)

2
i

Se compar valoare statisticii c din datele cercetrii cu valoarea lui c corespunztoare riscului
= 0,05, f = n 1 i k (tabelul 4), respectiv riscului = 0,01, f = n 1 i k (tabelul 5):
a) dac c c0,05 se consider c dispersia are valoarea mare datorit ntmplrii i prin
urmare se utilizeaz la calculul dispersiei s 2 ;
b) dac c0,05 c c0 ,01 se pune la ndoial faptul c valoarea mare a dispersiei ar fi
ntmpltoare; pentru mai mult siguran este preferabil s se renune la aceast
dispersie, adic s nu fie utilizat la calculul dispersiei s 2 ;
c) dac c c0,01 se consider c dispersia are o valoare mare care nu se poate pune pe
seama ntmplrii i ca atare se exclude de la calculul dispersiei s 2 .

Tabelul 4

Statistic aplicat n inginerie


Tabelul 5

Exemplul 2. Pentru a caracteriza precizia unei


maini care produce hrtie de ziar n ceea ce
privete gramajul, intereseaz mai ales dac
dispersia
este tipic pentru maina
respectiv, deci dac n condiii normale ea este
aceeai. De aceea trebuie s se studieze
dispersia gramajului pentru mai multe suluri de
hrtie produse n schimburi i zile diferite.
2

S-au considerat 12 astfel de selecii. Din suluri


produse n schimburi i zile diferite s-a luat cte
o band de hrtie avnd o lungime de 40 metri.
Din metru n metru, de la mijlocul bandei, s-au
luat probe pentru determinarea gramajului.
Rezultatele s-au trecut n fia urmtoare.
S se estimeze dispersia general a gramajului

i s se elimine eventualele selecii


nesemnificative.
2

Rezolvare
1. Mediile de selecie x i :
n

xi

ij

j 1

Statistic aplicat n inginerie


2

2. Dispersiile de selecie si :

x
n

xi

ij

j 1

s i2

n1

Sel.

10

11

12

xi

48,825

50,275

49,338

49,538

49,938

49,100

46,613

49,938

51,125

49,463

51,413

50,675

s i2

1,4824

0,9234

1,0701

0,4419

3,1188

1,7343

0,8791

0,8239

0,7350

1,0060

0,4483

0,6106

fi

39

39

39

39

39

39

39

39

39

39

39

39

3. Calculul lui c 5
Din tabel observm c cea mai mare dispersie este cea corespunztoare seleciei 5, adic s 5 3, 1188 .
2

c5

s5

3,1188
13,2738

0,235

i 1

Pentru 0 ,05 , f = 39 36 i k = 12, din tabelul 4 se gsete c0 ,05 0,14 .


Deoarece c 0,235 calculat este mai mare dect c0 ,05 0,14 , dispersia s 5 3, 1188 se exclude.
2

4. Calculul lui c 6
Din tabel observm c cea mai mare dintre dispersiile rmase este cea corespunztoare seleciei 6, adic
s 6 1, 7343 .
2

c6

s6

s1 s2 ... sk
2

1,7343
10,155

0,171

Pentru 0 ,05 , f = 39 36 i k = 11, din tabelul 4 se gsete c0 ,05


Deoarece

0,15 .

c6 0,171 calculat este mai mare dect c0 ,05 0,15 , dispersia s6 2 1,7343 = se exclude.

5. Calculul lui c1
Din tabel observm c cea mai mare dintre dispersiile rmase este cea corespunztoare seleciei 1, adic
s1 1, 4824 .
2

c1

s1

s1 s 2 ... sk
2

1,4824
8,4207

0,176

Pentru 0 ,05 , f = 39 36 i k = 10, din tabelul 4 se gsete c0 ,05


Deoarece c1 0,176 calculat este mai mare dect c0 ,05

0,16 .

0,16 , dispersia s1 1, 4824 se exclude.


2

Statistic aplicat n inginerie


6. Calculul lui c 3
Din tabel observm c cea mai mare dintre dispersiile rmase este cea corespunztoare seleciei 3, adic
s 3 1, 0701 .
2

c3

s1

s 2 ... sk
2

1,0701
6,9383

0,154

Pentru 0 ,05 , f = 39 36 i k = 9, din tabelul 4 se gsete c0 ,05

0,18 .

Deoarece c3 0,154 calculat este mai mic dect deci dispersia s 3 = 1,0701 nu difer semnificativ de celelalte
2

dispersii.
7. n concluzie putem spune c cele 9 dispersii rmase sunt omogene i ca atare sunt estimaii ale uneia i aceleai
dispersii generale , care va fi estimat ca media ponderat a acestora:
2

f s
i

s
2

i 1
k

fi

2
i

39

s
9 39

2
i

i 1

6,9383
9

0,7709

i 1

s 0,7709
2

3.11. CORELAII. COVARIANA I COEFICIENTUL DE CORELAIE PEARSON


Covariana ofer o msur a gradului de corelaie ntre dou sau mai multe seturi de variabile
aleatorii. Covariana pentru dou variabile aleatorii X i Y, fiecare cu dimensiunea eantionului
n, este definit de valoarea ateptrilor.
Se calculeaz cu relaia:
n

cov(X,Y)

x x y y
i1

n1

(3.86)

unde n reprezint volumul eantionului.


Pentru variabile necorelate covariana este 0.
n cazul n care variabilele sunt corelate ntr-o oarecare msur, covariana lor va fi diferit de
zero:
Dac cov(X,Y) > 0, atunci Y tinde s creasc dac crete X;
Dac cov(X,Y) < 0, atunci Y tinde s descreasc dac X crete;
Dac Y = X covariana devine dispersie (varian).
O posibil corelaie ntre dou seturi de variabile aleatorii poate fi pus n mai bine n eviden
prin coeficientul de corelaie.

Statistic aplicat n inginerie


Coeficientul de corelaie (Pearson) se utilizeaz atunci cnd se dorete a se afla dac ntre
dou variabile din acelai eantion exist o corelaie (relaie) i care este intensitatea acesteia.
Dac relaia exist, se vor deosebi dou feluri: pozitiv i negativ.
Corelaia este pozitiv atunci cnd creterea valorilor unei variabile determin
creterea valorilor celeilalte variabile;
Corelaie negativ apare atunci cnd creterea valorilor unei variabile determin
scderea valorilor pentru a doua variabil;
Felul corelaiei se exprim prin semnul coeficientului de corelaie Pearson, r, iar intensitatea
legturii dintre cele dou variabile se exprim prin valoarea acestuia.
Este de reinut faptul c valorile lui r pot varia doar n intervalul [-1, +1]:
O valoare pozitiv a lui r demonstreaz o corelaie pozitiv ntre variabile, iar o valoarea
negativ o corelaie negativ;
Cu ct valoarea absolut a lui r este mai mare (tinde ctre 1), cu att legtura dintre
variabile este mai puternic:

pentru | r | < 0,3 corelaia este foarte slab;

pentru | r | = 0,30,5 corelaia este slab;

pentru | r | = 0,50,7 corelaia este moderat;

pentru | r | = 0,70,9 corelaia este puternic;

pentru | r | = 0,91 corelaia este foarte puternic.

Dac valoarea lui r este nul, se spune c cele dou variabile nu sunt corelate sau c
sunt necorelate.
Expresia coeficientului de corelaie este:
n

zx zy
i1

xi x yi y
i1

x x yi y
n i
n
n
i1
n

x x y y
i

i1

x x y y
i1

unde: r este coeficientul de corelaie pentru variabilele X i Y;

zx

xi x
este scorul (valoarea normat) z al variabilei X;
sx

zy

xi y
este scorul (valoarea normat) z al variabilei Y;
sy

n reprezint volumul eantionului.

(3.87)

Statistic aplicat n inginerie


Exemplul 3. n tabelul urmtor sunt date rezultatele obinute de un eantion de 9 studeni la un test aplicat pe
parcurs, respectiv nota final la examen.
1.

S se determine media, mediana, modulul, dispersia de selecie i abaterea medie ptratic de selecie ale
variabilei test, respectiv not final;

2.

S se afle dac rezultatele obinute de cei 9 studeni la testul aplicat pe parcurs au influenat notele lor
finale la examen.
Nr. de puncte obinute la test
(variabila X)
230
310
250
310
150
180
80
350
230

Nota la examen
(variabila Y)
8
10
9
10
7
7
6
10
8

Pentru calculul medie folosii funcia AVERAGE, al medianei funcia MEDIAN, al modulului funcia MODE, al
dispersiei de selecie funcia VAR i al abaterii medie ptratice de selecie cu funcia STDEV, al covarianei cu
funcia COVAR, al coeficientului de corelaie cu funcia CORREL sau PEARSON, din aplicaia Excel.
Rezultate

Concluzie: deoarece coeficientul de corelaie r 0,974 se poate aprecia c ntre variabila X = Nr. puncte obinute
la test i variabila Y = Nota la examen exist o foarte bun corelaie, ceea ce nseamn c punctele obinute la
testul aplicat pe parcurs au influenat notele finale la examen

10

Statistic aplicat n inginerie


3.12. TESTUL KOLMOGOROV PENTRU VERIFICAREA CORESPONDENEI DINTRE DISTRIBUIA
EMPIRIC I CEA TEORETIC
Cercetnd convergena funciei de distribuie empiric Fn(x) ctre funcia de distribuie
teoretic F(x), A.N. Kolmogorov a demonstrat urmtoarea teorem:

2 2

k

limP dn

1 e2k , x ,

n
n

(3.88)

unde: dn max Fn x F x .
Adic pentru valori mari ale lui n, probabilitatea ca valoarea absolut a celei mai mari
diferene dintre valoarea funciei de distribuie empiric F n(x) i celei a funciei de distribuie
teoretic F(x), s nu depeasc o valoare dat, este egal cu .
n baza acestei teoreme se poate formula un criteriu pentru a verifica dac distribuia empiric
urmeaz sau nu legea de distribuie presupus (ipotetic).
S presupunem c avem distribuia empiric:
x1 ,x 2 ,...,x k

,
n1 ,n2 ,...,nk

i se face ipoteza c variabila X are o distribuie a crei funcie de frecven este f(x) (normal
sau binomial sau Poisson etc.).
Atunci se pot calcula frecvenele relative cumulate, adic valorile funciei de distribuie
empirice:

Fn x1 ,Fn x2 ,...,Fn xk ,

(3.89)

n1 n2 ... ni
.
n

(3.90)

unde: Fn xi

Se calculeaz valorile funciei de distribuie F(x) corespunztoare valorilor xi , (i = 1, 2,, k),

F x1 ,F x2 ,...,F xk ,
unde: F x P X x

(3.91)

f x dx .

(3.92)

Dac caracteristica X urmeaz legea de distribuie f(x), atunci frecvenele relative cumulate
(valorile funciei de distribuie empirice)

Fn xi

au valori apropiate de valorile

corespunztoare ale funciei de distribuie F xi , respectiv se calculeaz diferenele:


Fn x1 F x1 ; Fn x2 F x2 ;...; Fn xk F xk ,

i se gsete maximul acestor diferene.

11

(3.93)

Statistic aplicat n inginerie


Pentru un nivel de semnificaie (risc) = 0,05:
1. Dac dn max Fn x F x

1,36
se accept ipoteza c variabila X urmeaz legea de
n

distribuie teoretic f(x);


2. Dac dn max Fn x F x

1,36
se respinge ipoteza c variabila X urmeaz legea de
n

distribuie considerat f(x).


Pentru un nivel de semnificaie (risc) = 0,01:
1. Dac dn max Fn x F x

1,63
se accept ipoteza c variabila X urmeaz legea de
n

distribuie teoretic f(x);


2. Dac dn max Fn x F x

1,63
se respinge ipoteza c variabila X urmeaz legea de
n

distribuie considerat f(x).


Exemplul 4. S-a cercetat un lot de 130 de arje de font maleabil
cenuie din punct de vedere al coninutului de carbon.

FR. ABS.

1,70

1,80

Rezultatele determinrilor, grupate n 11 clase sunt prezentate n


tabelul alturat.

1,80

1,90

1,90

2,00

S se verifice cu ajutorul criteriului lui Kolmogorov normalitatea


distribuiei.

2,00

2,10

2,10

2,20

14

2,20

2,30

34

2,30

2,40

28

2,40

2,50

19

2,50

2,60

2,60

2,70

2,70

2,80

Rezolvare
Calculele s-au realizat n Excel.

12

Statistic aplicat n inginerie


n coloanele A i B: limitele intervalelor;
n coloana C: mijloacele intervalelor;
n coloana D: frecvenele absolute;
n coloana E: frecvenele relative;
n coloana F: frecvenele relative cumulate (funcia de distribuie empiric);
n coloana G: media mijloacele intervalelor;
n coloana H: ptratul diferenelor dintre fiecare mijloc de interval i medie;
n coloana I: abaterea medie ptratic (abaterea standard);
n coloana J: funcia de distribuie teoretic corespunztoare valorilor
=NORMDIST(C3;G$3;I$3;TRUE), =NORMDIST(C4;G$3;I$3;TRUE)

mijloacelor

intervalelor:

n coloana K: modulele diferenelor dintre funcia de distribuie empiric i funcia de distribuie teoretic;
n coloana L: valoarea maxim a modulelor diferenelor.
Concluzie: deoarece max Fn x F x 0,102 este mai mic dect

1,36
n

1,36

0,119 ( 0,05 ), se conchide

130

c distribuia arjelor de font maleabil cenuie, din punct de vedere al coninutului de carbon, urmeaz legea de
distribuie normal.
Concluzia este ntrit i de graficul celor dou distribuii.
DISTR. EMPIRICA

DISTR. TEORETICA

1,0
0,8
0,6
0,4
0,2
0,0
1

10

11

BIBLIOGRAFIE
1. *** Probabiliti i statistic, www.edumanager.ro
2. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
3. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
4. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963

13

S-ar putea să vă placă și