Documente Academic
Documente Profesional
Documente Cultură
pdf
CURS 2.pdf
CURS 3.pdf
CURS 4.pdf
CURS 5.pdf
CURS 6.pdf
CURS 7.pdf
CURS 1
1. ELEMENTE DE TEORIA PROBABILITILOR
1.1. NOIUNI UTILIZATE N TEORIA PROBABILITILOR
Teoria probabilitilor studiaz experienele aleatoare, acele experiene care reproduse de
mai multe ori se desfoar de fiecare dat n mod diferit, rezultatul neputnd fi anticipat.
Exemple de experiene aleatoare: aruncarea unui zar, tragerile la int, durata de funcionare a
unei maini etc.
n teoria probabilitilor se opereaz cu o serie de noiuni specifice:
Experimentul reprezint realizarea unui ansamblu de condiii conform unui criteriu de
cercetare.
Evenimentul reprezint rezultatul unui experiment.
Exemplul 1: Aruncarea unui zar. Experimentul este reprezentat de realizarea tuturor
condiiilor: zarul este simetric i omogen, suprafaa pe care se arunc zarul este plan i are
un coeficient de frecare uniform. Apariia cifrei 5 reprezint un eveniment.
Exemplul 2: Extragerea unei bile dintr-o urn n care se gsesc bile albe i negre. Acest tip de
experiment este analog cu extragerea unei piese defecte dintr-un lot de fabricaie n care se
gsesc piese bune (bile albe) i piese defecte (bile negre). Criteriul de cercetare
(experimentul) impune ca bilele s aib aceeai dimensiune, s fie uniform amestecate, iar
persoana care face extragerea s nu observe culoarea acestora. Apariia unei bile de
culoare alb reprezint un eveniment.
Teoria probabilitilor opereaz cu trei tipuri de evenimente:
1. Evenimentul sigur este evenimentul care se realizeaz n mod obligatoriu ntr-un
experiment. Acest eveniment se noteaz cu litera E;
2. Evenimentul imposibil este evenimentul cere nu se realizeaz niciodat n cadrul unui
experiment. Acest eveniment este notat cu ;
3. Evenimentul aleator este evenimentul care se poate realiza n cadrul unui experiment.
Evenimentele aleatoare se noteaz cu litere mari: A, B, X, sau A1, A2, A3. n cazul
aruncrii unui zar, apariia cifrei 5 se poate nota astfel: A 5 , iar extragerea din urn a
unei bile albe: X alb ;
Evenimentul contrar evenimentului A se noteaz i este evenimentul care se realizeaz
numai atunci cnd nu se realizeaz evenimentul A.
Pentru a putea rezolva aplicaiile n care intervin probabiliti este necesar clasificarea
evenimentelor (figura 1):
COMPATIBILE
INCOMPATIBILE
EVENIMENTE
DEPENDENTE
INDEPENDENTE
1. Evenimente compatibile: sunt dou sau mai multe evenimente care pot avea loc
simultan n cadrul unui experiment;
2. Evenimente incompatibile: sunt evenimentele care nu pot avea loc simultan n
cadrul unui experiment. n cazul n care realizarea unui eveniment exclude
posibilitatea de realizare a altui eveniment, cele dou poart denumirea de
evenimente contrarii;
Exemplul 4: Se consider experimentul n care se arunc o singur dat o moned. Notm
cu A evenimentul apariiei capului i cu B evenimentul apariiei pajurii. Deoarece
aruncarea monedei se face o singur dat, din cele dou evenimente nu poate avea loc
dect unul singur. n concluzie, cele dou evenimente sunt incompatibile, mai mult ele se
exclud reciproc, deci sunt evenimente contrarii.
Dac experimentul presupune aruncarea monedei de trei ori, cele dou evenimente (A i
B) se produc simultan n cadrul experimentului, deci ele sunt compatibile.
3. Evenimente dependente sunt evenimente ale cror realizri depind de realizarea unui
alt eveniment. Notaia folosit este B|A (realizarea evenimentului B depinde de
realizarea evenimentului A);
dac bila extras prima dat (alb sau neagr) nu este reintrodus n urn, cel de-al
doilea eveniment este dependent de primul, deoarece n urma extragerii unei bile
la prima extragere compoziia urnei se modific; din punct de vedere al
compatibilitii sau incompatibilitii, cele dou evenimente sunt compatibile
deoarece se pot desfura simultan n cadrul experimentului;
dac bila extras prima dat (alb sau neagr) este reintrodus napoi n urn, cel
de-al doilea eveniment este independent de primul, deoarece n urma extragerii
unei bile la prima extragere i reintroducerea ei, compoziia urnei nu se modific.
Exemplul 6: n cazul experimentului aruncrii unui zar de dou ori, fie evenimentele A 5
i B 6 . Evenimentele sunt independente deoarece apariia cifrei 6 nu depinde de faptul
c la aruncarea anterioar a fost sau nu obinut cifra 5. Din punct de vedere al
compatibilitii sau incompatibilitii cele dou evenimente sunt compatibile deoarece se
pot desfura simultan n cadrul experimentului, zarul fiind aruncat de dou ori. Dac
zarul ar fi aruncat o singur dat ar fi fost posibil un singur eveniment, deci cele dou
evenimente ar fi incompatibile.
1.2. OPERAII CU EVENIMENTE
Dou sau mai multe evenimente pot defini printr-o operaie un alt eveniment. Deoarece
evenimentelor li se pot asocia numere, operaiile care se pot face cu evenimente sunt similare
operaiilor din teoria mulimilor.
ntre evenimentele asociate unei experiene pot exista relaii.
1.2.1. Implicarea evenimentelor
Spunem c evenimentul A implic evenimentul B i scriem A B , dac realizarea
evenimentului A atrage dup sine i realizarea evenimentului B.
1.2.2. Reuniunea evenimentelor (suma evenimentelor1)
Considernd evenimentele A i B, reuniunea evenimentelor (suma evenimentelor) nseamn
realizarea cel puin unuia din evenimentele A sau B. Notaia folosit este:
R A B , sau R A B .
A2
An
i1
An A i .
Ai , sau R A1 A2
i1
Exemplul 7: S presupunem c se trag 5 gloane asupra unei inte. Evenimentele posibile sunt:
A 0 = niciun glon nu lovete inta;
Atunci: B A0
A1
C A3
A4
A B , sau A B .
n cazul unui sistem de n evenimente Ai (i = 1, 2, ..., n) intersecia (produsul) se determin
astfel:
A1
A2
An
n
i1
Ai , sau A1 A2
An A i .
i1
A 2 , 4 , 6 ;
B 1 , 2 , 3 , 5 .
Atunci: C A \ B 4 , 6 ;
D B \ A 1 , 3 , 5 .
1.2.5. Operaii cu evenimente
Tabelul 1. Principalele operaii cu evenimente
Enun
Relaii
AA
A B si B C A C
A B si B A A B
AA
AA
A B B A
A B B A
A
A
A
A
B
B
B C A
B
B
B C A
A
B A
C A
A A E
A A
C A B
A E E A A E E
A EA A E
A B A
A B A
B
B
Aceast formul se poate aplica n cazul sistemelor n care fiecare caz posibil are aceeai
probabilitate de realizare i compoziia sistemului este cunoscut.
Exemplul 9: Se tie c ntr-un lot format din 100 de buci exist 7 piese defecte. Care este
probabilitatea alegerii unei piese defecte?
7
0,07 .
100
0 P A 1
P 0
P E 1
P A 1 PA
P A \ B P A P A B
A B P A P B
P A B P A P B P A B
Definiia
evenimentului
Relaii de calcul
2 1
n
P Ai P Ai 1 P A i
i1 i1
i j
n
Compatibile i
dependente
(formula lui
Poincar):
31
P A
i j k
Aj
Ak ... 1
P A B P A P B P A B
Reuniunea
n
P Ai 1 1 P Ai
i1
i1
n
Compatibile i
independente
n
i 1
Ai
P A B 1 1 P A 1 P B
n
P Ai P Ai
i1 i1
n
Incompatibile
P A B P A P B
n
i1
P Ai P Ai | Ai
i1 i1 i1
n
Compatibile i
dependente
P A B P A P B|A
n
P Ai P A i
i1 i1
n
Compatibile i
independente
P A B P A P B
Intersecia
Incompatibile
Compatibile
dependente sau
independente
Incompatibile
(inegalitatea lui
Boole)
n
i 1
Ai
n
P Ai 0
i1
P A B 0
n
P A i P A i n 1
i1 i1
n
P A B P A P B 1
Aj
n1
n
P Ai
i1
A1
N1 A2 A1
3. Evenimentele A1
A2 i N1
A2
N1
A2 .
A2
N1
A 2 P A1
A2 P N1
A2 P A1 P A 2 |A1 P N1 P A 2 |N1
30 16 10 15 480 150
630
0,525
40 30 40 30 1200 1200 1200
P B P Ai P B|Ai .
i1
Format din evenimente incompatibile ntre ele, a cror reuniune este evenimentul sigur E.
X3 ,X2
X3 i X1
X2
X3 E .
P Y P Xi P Y|Xi
i1
30 3
20 2
50 1
90
40
50
18
100 100 100 100 100 100 10000 10000 10000 1000
P Ai |B
P Ai P B|Ai
n
P A P B|A
i1
10
90 1
100
100
P X1 |Z n
30 3
20 2
50 1
180
2
P Xi P Z|X i
Probabilitatea ca o pies defect extras din lot s provin de la maina 2 (X2), respectiv
P X2 |Z este:
20 2
40 2
100
100
P X2 |Z n
30 3
20 2
50 1
180
9
P Xi P Z|X i
Probabilitatea ca o pies defect extras din lot s provin de la maina 3 (X3), respectiv
P X3 |Z este:
50 1
50
5
100 100
P X 3 |Z n
30 3
20 2
50 1
180 18
P Xi P Z|X1
Verificare:
1 2 5
9
4
5 18
1.
2 9 18 18 18 18 18
Tem: La unul din examenele din sesiunea de iarn, n cazul unei grupe de 25 de studeni,
situaia notelor este urmtoarea:
5 studeni au primit nota 9 sau 10;
8 studeni au primit nota 7 sau 8;
7 studeni au primit nota 5 sau 6.
Care este probabilitatea ca 3 studeni luai la ntmplare din cei 25 ai grupei s fi primit not
mai mic dect 5?
BIBLIOGRAFIE
1. *** Probabiliti i statistic, www.edumanager.ro
2. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
3. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
11
CURS 2
2. STATISTIC MATEMATIC. DISTRIBUII DE PROBABILITATE
2.1. INTRODUCERE
Statistica reprezint un corp de metode utilizate pentru a colecta, descrie i analiza date
numerice din observaii sau investigaii tiinifice i se bazeaz pe aplicarea metodelor
statistice.
Metodele statistice sunt formate din tehnicile utilizate n descrierea sub aspect cantitativ a
caracteristicilor unei colectiviti.
Statistica se mparte n dou categorii majore:
A. Statistica descriptiv: este constituit din totalitatea metodelor utilizate n descrierea
caracteristicilor unei populaii.
B. Statistica inferenial: este reprezentat de totalitatea metodelor statistice utilizate pentru
extinderea/generalizarea observaiilor emise pe baza unui eantion asupra ntregii populaii.
Deopotriv, statistica descriptiv, ct i cea inferenial, utilizeaz indicatori statistici
reprezentativi care caracterizeaz tendina datelor statistice de a se grupa n jurul valorii
centrale, medii sau mijlocii (indicatorii tendinei centrale) i de a identifica tendinele datelor
aflate la periferia distribuiei statistice (indicatorii tendinei dispersionale).
2.2. DISTRIBUIA EMPIRIC
2.2.1. Fia de observaie, diagrame prin puncte i gruparea observaiilor
Rezultatele observrilor, ncercrilor, determinrilor, se nregistreaz, pe msura obinerii, lor n
fia de observare. Aceste date constituie ceea ce numim date iniiale.
Exemplul 1. n tabelul 1 sunt prezentate rezultatele observrii rezistenei Ia rupere a 130 de
arje de font maleabil neagr.
Tabelul 1
Fig.1
Tabelul 2 i figura 1 dau o descriere mai clar a distribuiei rezistenei la rupere dect simpla
niruire neordonat a celor 130 de valori iniiale. Se vede astfel c exist tendina de grupare a
valorilor n jurul unei valori, dar colectivitatea este mult prea frmiat i ca urmare tendina
este foarte slab scoas n eviden. O descriere mai bun a distribuiei se poate obine cu
ajutorul gruprii observaiilor n clase.
Prin grupare sau clasificare se nelege distribuirea celor n observaii a1, a2,..., ai,..., n k
intervale numite intervale de grupare.
Dac h1, h2,, hk reprezint mrimile intervalelor i x1, x2,, xk centrele intervalelor, atunci
observaia ai face parte din intervalul i dac satisface inegalitile:
xi
hi
h
ai xi i .
2
2
(2.1)
ni
, adic raportul dintre frecvena absolut i numrul total n al
n
observaiilor;
frecvena relativ cumulat Fn(xi), adic suma frecvenelor relative corespunztoare
intervalului i i intervalelor precedente, sau raportul dintre:
o numrul observaiilor crora le corespund valori mai mici sau cel mult egale cu
h
limita superioar xi i a intervalului i i;
2
o numrul tuturor observaiilor n.
Tabelul 3
Mrimea intervalelor trebuie astfel stabilit nct domeniul de variaie a observaiilor s fie
mprit n aproximativ 10 intervale. Numrul intervalelor ns poate varia de la caz la caz n
funcie de condiiile concrete n care se desfoar cercetarea, dar nu trebuie s fie mai mic de
5 i mai mare de 20.
Mrimea intervalului trebuie s aib n vedere numrul observaiilor. Cnd numrul
observaiilor este mai mic, caracterul distribuiei nu poate fi scos n evident dect dac avem
un numr mai mic de intervale, respectiv mrimea acestora este mai mare. Cu ct numrul
intervalelor este mai mare, respectiv mrimea acestora este mai mic, ies n eviden oscilaiile
m 1 3,322 log n ,
(2.2)
1
5
m 4 n 1 .
4
(2.3)
m n .
(2.4)
S-a constatat c pentru n < 250 este suficient gruparea n zece clase. Dac u i v sunt limitele
intervalului de grupare intervalul se consider ntotdeauna semi-nchis, fie (u,v] fie [u,v).
Mrimea intervalului se calculeaz astfel:
xmax xmin
.
m
(2.5)
Exemplul 2. Se scrie distribuia rezistenei la rupere a celor 130 de arje. n tabelul 4 sunt date
frecvenele absolute, frecvenele absolute cumulate, frecvenele relative, i frecvenele relative
54,5 28
cumulate, m 10 , h
2,65 3 kg/mm2.
10
Tabelul 4
Rezistena
la rupere
Centrul
intervalelor
Frecv. abs.
Frecv. abs.
cum.
Frecv. rel.
Frecv. rel.
cum.
[27-30)
28,50
0,008
0,008
[30-33)
31,50
0,031
0,038
[33-36)
34,50
24
29
0,185
0,223
[36-39)
37,50
42
71
0,323
0,546
[39-42)
40,50
28
99
0,215
0,762
[42-45)
43,50
16
115
0,123
0,885
[45-48)
46,50
123
0,062
0,946
[48-51)
49,50
127
0,031
0,977
[51-54)
52,50
129
0,015
0,992
[54-57]
55,50
130
0,008
1,000
130
1,000
Fig.2
Fig.3
Fig.4
1
h ,
1 2
(2.6)
unde: Lim_inf_int = limita inferioar a intervalului care are cele mai multe valori;
1 = diferena dintre frecvena absolut corespunztoare intervalului care are cele mai
multe valori i cea a intervalului anterior (atunci cnd seria este cresctoare);
2 = diferena dintre frecvena absolut corespunztoare intervalului care are cele mai
multe valori i cea a intervalului urmtor;
h = mrimea intervalului de clas.
Pentru datele din tabelul 1 grupate n tabelul 4 valoarea modulului este:
1
h
1 2
42 24
18
36
3 36
3 36 1,68 37,68
18 14
42 24 42 28
Mo Lim_inf_int
(2.7)
x1 ,x 2 ,...,x i ,..., xk
Mediana. Fie
o distribuie empiric.
n1 ,n2 ,...,ni ,..., nk
Mediana este valoarea care mparte seria statistica ordonat (cresctor sau descresctor) n
doua subserii de volume egale, volumele fiind msurate n numr de uniti statistice.
Me
38 38,5
38,25 .
2
(2.8)
Cnd valorile variabilei sunt grupate n intervale, exist dou metode pentru stabilirea
medianei:
A. Mediana se consider centrul intervalului care cuprinde valoarea de rang p + 1 dac n este
impar, sau media valorilor centrelor intervalelor care cuprind valorile de rang p i p + 1 dac n
este par. Pentru datele din tabelul 1 grupate n tabelul 4 valoarea medianei, deoarece valorile
corespunztoare rangurilor 65 i 66 aparin aceluiai interval [36,39) este:
Me
37,5 37,5
37,5 .
2
(2.9)
CotaMe
N
;
2
(2.10)
CotaMe
N1
.
2
(2.11)
CotaMe fc
h ,
fi
(2.12)
unde: Lim_inf_int = limita inferioar a intervalului real care conine elementul median;
CotaMe = cota calculat pentru elementul median;
fc = frecvena absolut cumulat a clasei anterioare celei care cuprinde
elementul median;
fi = frecvena absolut corespunztoare clasei care cuprinde elementul median;
h = mrimea intervalului de clas.
CotaMe
N 130
65 ,
2
2
Me Lim_inf_int
(2.13)
CotaMe fc
65 29
h 36
3 36 2,57 38,57.
fi
42
(2.14)
Media aritmetic. Media se definete ca suma valorilor variabilei empirice mprit la numrul
lor. Dac x1 ,x2 ,...,xi ,..., xn sunt valorile observate, atunci media este:
n
x
i1
(2.15)
x ,x ,...,x i ,..., xk
Dac 1 2
este distribuia empiric a caracteristicii X, atunci media este:
n1 ,n2 ,...,ni ,..., nk
k
x n x n
i
i1
n
i 1
i1
(2.16)
Cnd valorile variabilei sunt grupate n intervale, xi reprezint centrul fiecrui interval, iar ni
reprezint frecvena absolut a fiecrui interval.
Pentru datele din tabelul 1 grupate n tabelul 4 valoarea mediei aritmetice este 39,369.
Dispersia. Abaterea medie ptratic. Pe lng cunoaterea centrului de grupare al variabilei
ntmpltoare este necesar s se calculeze un parametru care s arate cum se mprtie
valorile variabilei n jurul centrului de grupare (parametrul mprtierii sau concentraiei).
Dac centrul de grupare este caracterizat prin media aritmetic x , atunci drept parametru al
mprtierii se consider dispersia distribuiei:
n cazul n care dispunem de date asupra ntregii populaii (lotului) sau dispunem de o
selecie de mrime mare n 40 :
k
xi x
i1
n
i1
ni
x x
i1
ni
(2.17)
s
2
xi x
i1
ni
n 1
x x
i1
ni
n1
(2.18)
i1
Cnd valorile variabilei sunt grupate n intervale, xi reprezint centrul fiecrui interval, iar ni
reprezint frecvena absolut a fiecrui interval.
Pentru a avea un parametru al mprtierii cu aceeai dimensiune cu variabila empiric se
folosete rdcina ptrat a dispersiei care se numete abatere medie ptratic (abatere
standard):
k
xi x ni
i1
n
i1
x x
i1
ni
.
(2.19)
xi x ni
i1
n 1
i1
x x
i1
ni
.
n1
(2.20)
R xmax xmin .
(2.21)
Coeficient de variaie
Prin definiie se numete coeficient de variaie, raportul dintre abaterea medie ptratic i
media aritmetic, adic:
CV
s
.
x
(2.22)
Prezint mai intuitiv dect abaterea standard gradul de mprtiere a rezultatelor n jurul
mediei deoarece este o expresie procentual a mpririi abaterii standard la medie. Cu ct
valoarea lui CV este mai aproape de zero cu att variaia este mai slab, colectivitatea este mai
omogen, media avnd un grad ridicat de reprezentativitate. Cu ct valoarea lui CV este mai
mare cu att variaia este mai intens, colectivitatea este mai eterogen, iar media are un nivel
9
n n n 2
n n n 3
,
n,
n.
4 4 4 4
4 4 4 4
(2.23)
10
x-3
x-2
x-1
x0
x1
x2
x3
P(x)
P(x-3)
P(x-2)
P(x-1)
P(x0)
P(x1)
P(x2)
P(x3)
P X xi P xi f x i .
(2.24)
... A3
A2
A1
A0
A1
A2
A3 ... E ,
(2.25)
... P x 3 P x 2 P x 1 P x 0 P x1 P x2 P x3 ... 1 ,
(2.26)
Px 1 .
(2.27)
11
B ... A3
A2
A1
A0
A1
A2
A3... Ak ,
(2.28)
P B ... P A 3 P A 2 P A 1 P A 0 P A1 ... P Ak P Ai .
(2.29)
Dar P B reprezint probabilitatea ca valorile variabilei X s fie mai mici sau cel puin egale cu o
valoare dat X xk , adic P X xk aa nct se poate scrie:
P X xk ... P x 3 P x 2 P x 1 P x 0 P x1 ... P xk ,
(2.30)
P X xk P x i .
(2.31)
F xk P X xk P x i .
(2.32)
F x a F xb ,
prin urmare
cresctoare.
funcia
de
(2.33)
distribuie
este
strict
F x 0 .
(2.34)
Fig.5
0 F x 1 ,
(2.35)
adic funcia de distribuie (cumulativ), ca orice probabilitate, este cuprins ntre zero i unu.
12
P x a X xb .
(2.36)
P X xb P X x a P x a X x b ,
(2.37)
P x a X xb P X x b P X x a ,
(2.38)
de unde:
P x a X xb F x b F x a .
(2.39)
Dar
b
F xb P x i , iar F x a P x i ,
(2.40)
rezult:
b
P x a X xb P x i P x i
Px .
i a 1
(2.41)
Prin urmare probabilitatea ca valorile variabilei X s fie cuprinse ntre dou valori date a i b
este egal cu suma probabilitilor corespunztoare valorilor lui X care satisfac inegalitatea
xa X xb .
2.3.2. Distribuii de probabilitate de tip continuu
Variabila ntmpltoare X care poate lua orice valoare ntr-un interval dat se numete variabil
de tip continuu. O variabil de tip continuu are o distribuie de tip continuu dac funcia de
distribuie (cumulativ) F x este continu peste tot, sau aproape peste tot n intervalul dat.
Din punct de vedere practic, o variabil continu se poate prezenta ca o variabil discret, i
h
h
h
h
xi x xi .
2
2
(2.42)
F x P X x .
(2.43)
13
, ,
astfel nct
F 0 i F 1 . n figura 6 se d graficul
unui exemplu de funcie de distribuie continu.
Dac funcia de distribuie este continu i are o
derivat continu, atunci se spune c att variabila
ntmpltoare X, ct i distribuia ei sunt continue.
Fig.6
f x
dF x
,
dx
(2.44)
Fig.7
Fx
f x dx .
(2.45)
f x dx 1 ,
(2.46)
adic masa de probabilitate distribuit pe ntreaga arie limitat de funcia de frecven i axa
absciselor este egal cu unitatea.
n general, ori de cte ori se d funcia de frecven sau funcia de distribuie, se spune c s-a
dat legea de distribuie a variabilei ntmpltoare.
2.3.3. Quantile
n cazul distribuiilor empirice, quantilul a fost definit ca valoarea variabilei corespunztoare
unei valori date a frecvenei relative cumulate.
Quantilele pot fi definite ca valori ale variabilei ntmpltoare corespunztoare unei valori
date a funciei de distribuie.
14
P P X xp F xp
xp
f x ,
(2.47)
xp
f x dx .
(2.48)
Pentru legile de distribuie utilizate sunt ntocmite tabele n care se dau valorile funciei de
distribuie corespunztoare valorilor X = x ale variabilei ntmpltoare. Prin urmare quantilul xp
se gsete n tabele i reprezint valoarea lui x care corespunde valorii date a probabilitii
P F x p . n aplicaiile software dedicate calculului statistic, pentru majoritatea distribuiilor de
Dac X este o variabil discret care ia valorile X xi (i = -, ..., -3, -2, -1, 0, 1, 2, ..., +),
valoarea medie M[X] a variabilei X se calculeaz cu ajutorul formulei:
M x x i f x i .
(2.49)
Dac X este o variabila este continu, valoarea medie M[X] a variabilei X se calculeaz cu
ajutorul formulei:
M X
x f x dx ,
(2.50)
x n
j
j1
n
j1
(2.51)
unde x j reprezint valorile variabilei dac variabila este discret, sau centrele intervalelor dac
variabila este continu, iar nj indic de cte ori se repet aceeai valoare dac distribuia este
15
n nj se obine:
j1
x n
j
j1
j1
nj
j1
xj
j
p
xj r x j ,
(2.52)
j1
n
unde r x j sunt frecvenele relative corespunztoare valorilor x j .
n baza teoremei lui Bernoulli1 probabilitile P xi f xi se nlocuiesc n practic cu
p
n
frecvenele relative
j 1
nj
n
n cazul n care numrul observaiilor este mare, n cazul variabilelor discrete putem scrie:
p
j1
M X x i f x i x x j r x j
x n
j
j1
n
j1
(2.53)
M X
j1
x f x dx x x r x
j
x n
j
j1
(2.54)
n
j1
Dac X i Y sunt dou variabile ntmpltoare, atunci media aritmetic a sumei celor dou
variabile, X+Y, este egal cu suma mediilor variabilelor, adic:
MX Y MX MY .
(2.55)
Dac se consider un eveniment A a crui probabilitate de realizare este p, frecvena relativ, adic raportul
dintre numrul ni care indic de cte ori s-a realizat evenimentul A i numrul total n al probelor, tinde ctre p n
probabilitate. Teorema lui Bernoulli este cunoscut i sub denumirea de legea numerelor mari care se enun
astfel: ntr-un numr mare de ncercri, repetate n aceleai condiii, frecvena relativ a fiecruia din evenimentele
posibile este foarte apropiat de probabilitatea fiecrui eveniment. Apropierea este cu att mai mare cu ct
numrul ncercrilor este mai mare. Reiese din cele de mai sus c precizia msurrii empirice (cu ajutorul frecvenei
relative) a probabilitii este cu att mai mare cu ct numrul ncercrilor este mai mare.
16
(2.56)
MX Y MX MY .
(2.57)
n general, media produsului mai multor variabile ntmpltoare independente dou cte
dou este egal cu produsul mediilor fiecrei variabile, adic:
(2.58)
Mr xri f x i ,
(2.59)
Mr
x f x dx .
r
(2.60)
mr x i M1 f x i ,
r
(2.61)
mr
x M f x dx .
r
(2.62)
m1 xi M1 f xi xi f x i M1 f x i M1 M1 0 ,
i
M1
17
(2.63)
m1
x M1 f x dx x f x dx M1 f x dx M1 M1 0 ,
1
M1
(2.64)
Prin urmare, media diferenelor dintre valorile variabilei i media variabilei este egal cu zero.
Pentru r =2, pentru cazul distribuiei discrete se obine:
m2 x i M1 f x i ,
2
(2.65)
m2
x M f x dx .
2
(2.66)
Momentul centrat de ordinul doi sau media ptratelor diferenelor dintre valorile variabilei i
media aritmetic se numete dispersie i se noteaz cu D X :
2
D X M x M1 .
(2.67)
Se demonstreaz c dispersia mai este egal cu diferena dintre momentul de ordinul doi i
ptratul momentului de ordinul nti:
DX M2 M12 .
(2.68)
X D X .
(2.69)
CV
M X
(2.70)
F x i are media M[X] i dispersia de D[X]. Variabila Z ale crei valori zi se calculeaz cu
formula:
zi
xi M X
(2.71)
18
(2.72)
MZ
1
0 0 .
X
(2.73)
x M X 2
2
1
D Z M Z M
2 M x MX .
X X
(2.74)
2
M x M X D X 2 X ,
(2.75)
Dar:
prin urmare:
D Z
X
2
2 X 1 .
(2.76)
Concluzie: variabila ntmpltoare normat are media 0 i dispersia, deci i abaterea medie
ptratic egale cu 1 !!!
BIBLIOGRAFIE
1. *** Probabiliti i statistic, www.edumanager.ro
2. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
3. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
4. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963
19
CURS 3
2. STATISTIC MATEMATIC. DISTRIBUII DE PROBABILITATE
2.4. DISTRIBUII DE PROBABILITATE TEORETICE
2.4.1. Distribuia binomial
Este o distribuie de probabilitate discret care se aplic atunci cnd exist numai dou
rezultate posibile: succes sau eec, admis sau respins, promovat sau nepromovat, produs
conform sau produs neconform (rebut), alb sau negru, zero sau unu, adevrat sau fals etc.
De exemplu, variabila probabilist considerat este reprezentat de numrul experimentelor cu
succes: dac probabilitatea p a succesului este aceeai pentru fiecare din cele n
experimente, iar experimentele sunt independente, atunci funcia de probabilitate
(frecvenele relative) este definit prin probabilitatea ca numrul experimentelor de succes s
fie egal cu o anumit valoare xi i poate fi calculat cu expresia:
f x i Cnxi pxi (1 p)nxi
n!
n!
pxi (1 p)nxi
pxi qnxi (2.77)
x i ! n x i !
x i ! n x i !
p q
n!
n x
p x 1 p .
x 0 x! n x !
F xi P X xi
Funcia de probabilitate
(2.78)
Funcia de distribuie
MX m n p ,
(2.79)
DX 2 n p 1 p .
(2.80)
APLICAIE. ntr-o turntoriei, din cercetri anterioare s-a stabilit c probabilitatea ca o arj s fie
necorespunztoare este egal cu 0,2. Considernd c ntr-un schimb se elaboreaz 10 arje, s se studieze
distribuia numrului de arje necorespunztoare/schimb.
Pentru
generarea
distribuiei
teoretice
bimomiale,
se
folosete
din
aplicaia
Excel
funcia
BINOMDIST(numar_s,incercari,probabilitate_s,val_logica):
Sintaxa funciei BINOMDIST are urmtoarele argumente:
numar_s
incercari
probabilitate_s
val_logica
Rezolvare
Variabila X (numrul de arje necorespunztoare ntr-un schimb) poate lua valorile 0, 1, 2,..., 10. Probabilitile
corespunztoare acestor valori se calculeaz cu ajutorul formulelor:
Pn x
n!
n x
p q
x
x! n x !
10
0,2
DISTRIBUTIA BINOMIALA
Nr. sarjelor
Functia de Functia de
necoresp.
frecventa distributie
(x)
0
0,107374182 0,1073742
1
0,268435456 0,3758096
2
0,301989888 0,6777995
3
0,201326592 0,8791261
4
0,088080384 0,9672065
5
0,026424115 0,9936306
6
0,005505024 0,9991356
7
0,000786432 0,9999221
8
7,3728E-05 0,9999958
9
4,096E-06 0,9999999
10
1,024E-07
1
M[x]
D[X]
1,6
M X n p 10 0,2 2
DX n p q 10 0,2 0,8 1,6
Valorii x = 4 i corespunde o valoare mare a funciei de distribuie, adic probabilitatea ca numrul arjelor
necorespunztoare s fie mai mic sau cel mult egal cu 4 este egal cu 0,967:
F 4 P X 4 0,967 ,
iar probabilitatea ca numrul arjelor necorespunztoare s fie mai mare dect 4 este:
P X 4 1 0,967 0,033 .
n!
p1x1 p2x2 ... pkxk ,
x1 ! x2 ! ... xk !
(2.81)
xi e
,
xi !
(2.82)
x e
.
x!
x 0
xi
F xi P X xi f x
x 0
Funcia de probabilitate
(2.83)
Funcia de distribuie
Se arat c media i dispersia variabilei X distribuit dup legea Poisson sunt egale cu
parametrul :
MX m ,
(2.84)
DX 2 .
(2.85)
APLICAIE. S se verifice dac distribuia numrului ruperilor firului n cazul unui ring cu 400 de fuse n timpul unui
schimb de 8 ore respect distribuia lui Poisson. Datele cercetrii sunt date n tabelul urmtor.
Nr. ruperi
xi
0
1
2
3
4
5
6
7
8
Total
Numrul de ruperi
xi*ni
0
110
214
216
148
80
24
0
8
800
media
val_logica
Rezolvare
n timp de 8 ore Ia cele 400 fuse s-au constatat 800 ruperi. Aa c numrul mediu al ruperilor/fus este:
800
400
2,0 .
(2.86)
Comparnd cele dou iruri de valori ale funciei de frecven, valorile empirice (coloana 5) i valorile teoretice
(coloana 6), respectiv ale funciei de distribuie empiric (coloana 7) i teoretic (coloana 8), se vede c valorile
corespunztoare unui x dat sunt foarte apropiate ntre ele. Se poate conchide c numrul de ruperi ale firului
pentru cele 400 fuse se distribuie dup legea lui Poisson.
53
110
107
72
37
16
4
0
1
400
Numrul de
ruperi
DISTRIBUTIA POISSON
Numarul
Valorile
mediu de
empirice ale
ruperi/fus
functiei de
frecventa
xi*ni
0
110
214
216
148
80
24
0
8
800
Valorile
teoretice ale
functiei de
frecventa
Functia de Functia de
distributie distributie
empirica
teoretica
0,132500
0,275000
0,267500
0,180000
0,092500
0,040000
0,010000
0,000000
0,002500
1
0,135335
0,270671
0,270671
0,180447
0,090224
0,036089
0,012030
0,003437
0,000859
0,999763
0,132500
0,407500
0,675000
0,855000
0,947500
0,987500
0,997500
0,997500
1,000000
0,135335
0,406006
0,676676
0,857123
0,947347
0,983436
0,995466
0,998903
0,999763
f x 1 pentru 0 x 1
0 pentru x>1
(2.87)
F x x pentru 0 x 1
1 pentru x>1
(2.88)
0
1
f x
b a
0
pentru x<a
pentru a x b
(2.89)
pentru x>b
0
x a
Fx
b a
1
pentru x<a
pentru a x b
(2.90)
pentru x>b
Funcia de probabilitate
Funcia de distribuie
M X m
D X
ab
,
2
(2.91)
b a
12
(2.92)
x a
2
b a c a
f x
bx
2
b a b c
pentru x<a
pentru a x c
(2.93)
pentru c<x b
pentru x>b
pentru x<a
0
2
x a
pentru a x c
b a c a
Fx
2
b x
1 b a b c pentru c<x b
1
pentru x>b
Funcia de probabilitate
(2.94)
Funcia de distribuie
M X m
ab c
,
3
(2.95)
D X 2
a2 b2 c2 a b a c b c
.
18
(2.96)
f x ex ,
(2.97)
F x P X x 1 ex ,
(2.98)
Rezult c P X x ex .
Funcia de probabilitate
Funcia de distribuie
MX m 1 ,
(2.99)
DX 2 2 .
(2.100)
f x
1
2
x m2
22
(2.101)
f x dx
e
2
x m2
22
dx .
(2.102)
F x 0 ,
(2.103)
F x1 F x2 , x1 x2 ,
(2.104)
F P X 0 ,
(2.105)
F P X
e
2
x m2
22
dx 1 .
(2.106)
Funcia de probabilitate
Funcia de distribuie
2
Modulul i mediana variabilei ntmpltoare care urmeaz legea normal coincid cu media:
MoX MeX MX m .
(2.107)
1
f z
e 2 ,
2
(2.108)
1
2
F z f z dz
e
dz .
(2.109)
care
reprezint
Fig.9
0 i 1,25 se citete din tabelul 5 din celula de pe linia 1.20 i coloana 0.05, adic:
P 0 Z 1,25 0,3944 .
10
F z P Z z 0,5 P 0 Z z ,
(2.110)
F z P Z z 0,5 P 0 Z z .
(2.111)
F x PX x P Z
.
(2.112)
Probabilitatea ca valoarea unei variabile probabiliste X s fie cuprins n intervalul [a, b] este:
b m
a m
P a X b =P X b P X a P Z
P Z
.
(2.113)
i
1
f zi
e 2 ; i 1, 2,..., f .
2
(2.114)
11
(2.115)
i1
f
2
2
f
2
f
2 2 1
1
2
e 2
(2.116)
x 1
e tdt .
(2.117)
n n 1! .
Relaia de recuren este:
n 1 n n .
1
Pentru x n , unde n este numr ntreg pozitiv:
2
1 2n 1 !!
n
,
2
2n
;
2
3
;
4
15
3 2! 2; 7 / 2
; 4 3! 6;
8
2 1! 1; 5 / 2
n matematic, funcia gamma, reprezentat prin litera greceasc = gamma majuscul, este o funcie care
extinde noiunea de factorial de la numerele ntregi la numerele reale i complexe.
12
are
Fig.10
Potrivit teoremei limitei centrale, distribuia variabilei ntmpltoare 2 tinde ctre distribuia
normal cu media M 2 f i dispersia D 2 2 f cnd f (vezi figura 11 n care se d
reprezentarea grafic a distribuiei, pentru cazurile cnd numrul gradelor de libertate este: 1,
2, 4, 10, 20).
Din figura 11 se poate vedea c pe msura creterii numrului gradelor de libertate f, adic a
numrului ptratelor care se nsumeaz, distribuia 2 tinde spre distribuia normal, dar acest
proces este lent.
Fig.11
Quantilii distribuiei 2
n aplicaiile practice este util s determinm probabilitatea P astfel nct valorile variabilei 2
s fie mai mici sau cel puin egale cu o valoare dat P2 , adic:
P 2 P2 P2 .
(2.118)
13
P
P2
P2
P2
P2
1
f
2
2
f
2
f
2 2 1
1
2
e 2 d 2
(2.119)
Pentru aplicaii practice s-au ntocmit tabele n care se dau valorile funciei de distribuie F P2
pentru valori ale numrului gradelor de libertate f. n practic ns, de cele mai multe ori se
stabilete n prealabil probabilitatea P. De aceea n asemenea cazuri se pune problema
determinrii valorii lui 2 , adic a quantilului P2 . Quantilii depind att de valoarea dat a lui P
ct i de numrul gradelor de libertate f. Pentru a pune n eviden aceasta, se folosete
notaia P2 f .
2.4.10. Distribuia t (Student)
S presupunem c dintr-o colectivitate general distribuit normal din punct de vedere al
caracteristicii X cu media m i dispersia 2 s-a extras o selecie de mrime n. Fie x1 , x2 ,..., xn
valorile caracteristicii obinute pentru selecia dat.
Media aritmetic (de selecie) x se supune ea nsi unei legi de repartiie normale, dar cu o
dispersie mai mic dect repartiia valorilor individuale.
Se demonstreaz ca abaterea medie ptratic a mediei, notat cu 0 , este:
0
.
n
(2.120)
x m x m
,
0
n
2
, mrimea:
n
(2.121)
x x x2 x
1
2
... xn x
n1
14
(2.122)
x m
.
s
n
(2.123)
Aceast mrime nu se mai distribuie dup legea normal, ci are o distribuie numit distribuia
Student sau distribuia t.
Se scrie mrimea t sub forma:
t
x m x m z
.
s
s s
n
n
(2.124)
2 2
t
2 1
f t
,
f
f
f
2
(2.125)
Fig.12
n figura 13 se d reprezentarea grafic a
distribuiei normale standard Z, respectiv
a distribuiei t.
Comparnd cele dou curbe se constat
c, curba distribuiei t se apropie mai
ncet de axa absciselor atunci cnd t tinde
ctre sau , mai ales pentru
valorile mici ale numrului gradelor de
libertate f.
Fig.13
15
F t P t tP
0
f 1
f 1
2 2
t
2
1
dt .
f
f
f
2
(2.126)
Ca urmare a simetriei distribuiei t, quantilul tP, adic valoarea lui t corespunztoare valorii P a
funciei de frecven F(t), este egal cu quantilul t1-P (valoarea lui t corespunztoare valorii
F t 1 P ), adic:
tP t1P
(2.127)
BIBLIOGRAFIE
1. *** Probabiliti i statistic, www.edumanager.ro
2. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
3. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
4. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963
16
CURS 4
3. VERIFICAREA IPOTEZELOR. CRITERII DE SEMNIFICAIE
3.1. CONSIDERAII GENERALE PRIVIND INTERVALELE DE NCREDERE
S considerm o caracteristic X a crei lege de distribuie este cunoscut i s presupunem c
trebuie s estimm, pe baza datelor unei selecii de mrime n, valoarea unui parametru u (de
exemplu media) al distribuiei caracteristicii X. Parametrul poate fi estimat cu ajutorul unor
anumite mrimi care se pot calcula pe baza datelor seleciei.
Obs. Este greit s considerm c estimaia obinut este nsi valoarea parametrului u.
Estimaia ne d ns posibilitatea s gsim un interval care acoper cu o probabilitate dat
valoarea parametrului estimat u. Intervalul astfel determinat se numete interval de
ncredere.
S presupunem c urmrim o anumit operaie care se execut la o main-unealt dat. n
urma acestei operaii, piesa care se prelucreaz trebuie s aib diametrul 9,200,1 mm.
Caracteristica studiat este n acest caz diametrul nominal 9,2mm.
Se tie c distribuia acestei caracteristici este normal cu media m i dispersia 2 . Dac
maina este reglat corect i dac precizia mainii este corespunztoare toleranelor fixate,
atunci media m coincide cu mijlocul cmpului de toleran i are valoarea m m0 9,15mm ,
iar abaterea medie ptratic este aproximativ egal cu 0,0167 .
max min 6
0,0167 .
6
6
La nceputul lucrului maina trebuie reglat astfel nct diametrul mediu al pieselor s fie egal
cu 9,15mm. Dup ce s-a produs un numr de n piese, s zicem cinci, se msoar diametrul
acestora. De fapt s-a realizat o selecie de volum n = 5 i s-au obinut datele seleciei. Pe baza
acestor date (diametrele celor cinci piese), se pot determina anumite mrimi - parametri de
selecie - ca media, mediana, diferena dintre numrul pieselor care au diametrul mai mare
dect 9,2mm i numrul pieselor care au diametrul mai mic dect 9,1mm.
S presupunem c se determin media de selecie x i c s-a obinut valoarea x 9,13 mm.
Mrimea x 9,13mm estimeaz centrul de reglare i deci nu trebuie considerat c 9,13 este
centrul de reglare. Estimaia obinut, 9,13mm , permite ns s se conchid dac maina este
corect reglat, deoarece pentru ca centrul de reglare s fie m0 9,15mm , media seleciei
trebuie s se gseasc ntr-un interval care acoper centrul de reglare. Deoarece centrul de
reglare este o constant, intervalul m1 , m2 , n care trebuie s se gseasc mediile de
selecie, se poate determina cu o probabilitate dat.
x1 x 2 ... xn
.
n
(3.1)
2
.
n
x m x m
.
0
n
(3.2)
1 z2
f z
e .
2
Dac se d intervalul
z1 , z2 ,
(3.3)
atunci
probabilitatea ca variabila Z s se
gseasc n acest interval (figura 1) se
obine cu ajutorul relaiei:
Fig.1
P z1 Z z2 P Z z2 P Z z1 0,5 P 0 Z z2 0,5 P 0 Z z1 z2 z1
(3.4)
2
P m z1
x m z2
z2 z1 .
n
n
(3.5)
x m z2
selecie x se gsesc n intervalul m z1
.
n
n
inegalitile x m z1
i x m z2
se numete "interval critic".
n
n
Pm z
x mz
2 z .
n
n
(3.6)
Exemplu. Trebuie s se verifice dac media m a diametrelor unui lot de piese obinute n aceleai condiii de
producie este m0 = 2,00mm, tiind din cercetri anterioare c abaterea medie ptratic este = 0,03mm i c
distribuia pieselor dup diametrul cercetat este una normal. Se vor folosi datele unei selecii compus din n = 9
piese.
n aceste condiii diametrul mediu x al celor 9 produse trebuie s se gseasc n intervalul determinat de
urmtoarea relaie:
P m0 z
x m0 z
Alegnd pentru P valoarea 0,9973, din rel. (3.6) rezult c z = 0,9973/2 = 0,49865; n tabelul 1, ANEXA 1, se
gsete c z = 3. Limitele intervalului de ncredere corespunztor probabilitii P = 0,9973 vor fi:
23
0,03
9
1,97mm; 2 3
0,03
2,03mm
n exemplul anterior s-a pus problema estimrii mediei generale cu ajutorul a n observaii, mai
exact s-a dat o colectivitate a crei medie m este necunoscut i vrem s verificm cu ajutorul
unei selecii dac aceast medie este egal cu m0. Trebuie s verificm prin urmare dac
ipoteza m m0 este just; aceast verificare se face cu ajutorul mediei de selecie i anume:
dac media seleciei x verific relaia (3.6), atunci se poate afirma, cu probabilitatea P, c
ipoteza este just. Dac media seleciei x se gsete n afara limitelor determinate cu ajutorul
relaiei (3.6), ipoteza se respinge.
S-a artat c probabilitatea P trebuie s aib o valoare apropiat de 1 i aceasta pentru ca
limitele de ncredere fixate s cuprind ntre ele majoritatea mediilor seleciilor care s-ar putea
1P .
(3.7)
Fig.2
x m
0
m m1 P
z
x m0
z 1 z 1 z 1
(3.8)
unde:
1
m1 m0
n
n
(3.9)
1 m .
Funcia de putere depinde de m i deci de 1 . Dup cum se poate vedea n tabelul 2,
ANEXA 2, unde sunt date valorile funciei de putere n funcie de valorile absolute ale abaterii
m m0
sistematice normate 1 1
pentru diferite nivele de semnificaie , funcia de
n
putere a criteriului este funcie cresctoare de 1 .
Exemplu. Pentru a verifica dac gramajul mediu al hrtiei de ziar (caracteristic care urmeaz legea normal)
produs la un moment dat este m0 50g / m , cu abaterea medie ptratic a gramajului 0,67g / m , ct
2
0,02 1 P m0 z
x m0 z
unde m0 50 ; 0,67 ; n 4 .
1 2 z ,
1 0,02
2
0,49 ;
m0 z
50 2,32
0,67
49,2 g / m
4
50 2,32
0,67
50,8 g / m
n 4 probe), n
98 media x se va gsi ntre 49,2 i 50,8g/m i numai n dou cazuri n afara acestor dou limite, adic vor fi 2
cazuri din 100 de neacceptare a ipotezei cnd ea este just i spunem c se comite o eroare de spea I.
S presupunem acum c maina care produce hrtia de ziare lucreaz cu o abatere sistematic 0,5g / m .
2
m1 m0
0,5
0,67
4
0,5
0,67
1
0,67
1,5
50,5 1 2,32 1,5 2,32 1,5 1 3,82 0,82 1 0,499933 0,29389 0,206043
Funcia puterii are valoarea 50,5 0,206 .
Aceasta nseamn c dac lum un numr de 100 de selecii de mrime n 4 , ipoteza fals m m0 50g / m se
2
va respinge n 20,6% din cazuri i se va accepta n mod greit n 79,4% din cazuri; n aceste cazuri spunem c se
comite o eroare de spea II ( = 79,4%).
0,01 . Din cercetri prealabile se tie c abaterea medie ptratic a sarcinii de rupere este de 4g .
Pentru un risc 0,01 Ia verificarea ipotezei m m0 130g , ntr-un caz din 100 se va respinge ipoteza cnd ea
este just. Pentru a gsi probabilitatea acceptri ipotezei atunci cnd ea nu este just, trebuie s calculm valoarea
funciei de putere.
S presupunem o eroare sistematic 4 g .
n acest caz media este: m m1 130 4 134g
Pentru 0,01 din tabelul 2, ANEXA 2: z z0 ,01 2,58
Limitele de ncredere sunt:
m0 z
m0 z
130 2,58
124,84g ,
130 2,58
135,16g .
m1 m0
4
4
Rezult c pentru 0,01 i un numr de n 4 probe (rezult limitele 124,84g i 135,16g) suntem n msur s
sesizm n 28,1% din cazuri c sarcina de rupere difer cu 4g de sarcina admis m 0=130g i vom accepta n 71,9%
cazuri c sarcina de rupere este 130g cnd de fapt ea este cu 4g mai mare.
S determinm valoarea funciei de putere n cazul cnd selecia luat ar fi compus din 9 probe elementare,
celelalte condiii rmnnd aceleai.
Limitele de ncredere sunt:
m0 z q
m0 z q
130 2,58
126,56g ,
9
130 2,58
m1 m0
133,44g .
4
4
m0 z q
m0 z q
130 2,58
127,42g ,
16
130 2,58
m1 m0
132,58g .
16
4
16
Reiese din acest exemplu c puterea criteriului crete pe msur ce crete mrimea seleciei.
S-a pus n eviden dependena valorilor funciei de putere de mrimea seleciei, n, pentru a
folosi aceast proprietate a funciei de putere la planificarea experienelor, i anume pentru a
determina mrimea seleciei astfel nct s avem o putere dat a criteriului.
3.3. CRITERIUL DE SEMNIFICAIE Z, UNILATERAL
n practica cercetrilor industriale se ntlnesc cazuri n care trebuie s se verifice ipotezele
m m0 , respectiv m m0 unde m0 este o valoare dat.
3.3.1. Ipoteza m < m0
Intervalul critic este definit de inegalitatea:
x m0
z ,
(3.10)
Fig.3
x m
x m
1
1
0
0
P
z 1 P
z 1 z z . (3.11)
2
2
n
n
.
n
(3.12)
Dac este nivelul de semnificaie, atunci ipoteza m m0 se respinge n 100% cazuri cnd ea
este just.
Dar n afar de intervalul de semnificaie pentru fiecare criteriu trebuie s evalum i riscul de a
accepta ipoteza fals, adic probabilitatea acceptrii ipotezei cnd de fapt ea nu este just
1 , unde n cazul verificrii ipotezei m m1 m0 puterea criteriului se determin cu
ajutorul formulei:
1
m1 z 1 .
2
unde 1
(3.13)
m1 m0
.
(3.14)
Fig.4
Nivelul de semnificaie i puterea criteriului se calculeaz cu ajutorul formulelor:
x m
1
0
P
z z ;
2
(3.15)
1
m1 z 1 ,
2
unde 1
(3.16)
m1 m0
.
trebuie s ia valori ct mai apropiate de zero. Procesul tehnologic poate fi considerat n parametri normali dac
media caracteristicii pentru o selecie este mai mic dect 0,025mm. Dispersia care caracterizeaz procesul
tehnologic, determinat pe baza unor cercetri anterioare, este 0,000335 .
2
1
2
0,025 2,05
0,000335
0,0257 .
30
Deoarece x 0,021 este mai mic dect limita de semnificaie calculat pentru 0,02 , se poate afirma c
procesul se desfoar normal i este controlabil din punct de vedere statistic.
Puterea criteriului se calculeaz cu ajutorul formulei (3.13) pentru m m1 x :
m1 m0
m1
1
2
0,021 0,025
1,20 .
0,000335
30
z 1
1
2
2,05 1,20
1
2
1 m1 1 0,0006 0,9994 ,
ceea ce nseamn c datorit diferenei mici dintre m1 i m0 numai n 0,06% cazuri vom respinge ipoteza cnd ea
nu este just i n 99,94% o acceptm chiar atunci cnd ea nu este just.
BIBLIOGRAFIE
1. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
2. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
3. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963
10
11
12
13
14
CURS 5
3. VERIFICAREA IPOTEZELOR. CRITERII DE SEMNIFICAIE (CONTINUARE)
3.4. CRITERIUL DE SEMNIFICAIE Z. COMPARAREA A DOU MEDII
S presupunem c se cerceteaz caracteristica X a unitilor care compun dou colectiviti, iar
aceasta este distribuit normal.
S notm cu m1, m2 mediile i cu 1 , 2 abaterile medii ptratice (standard) corespunztoare
celor dou colectiviti. Cunoatem din cercetri anterioare abaterile medii ptratice i ne
propunem s verificm, cu ajutorul mediilor a dou selecii extrase din cele dou colectiviti,
dac mediile necunoscute m1 i m2 sunt egale. Prin urmare trebuie s verificm ipoteza
m1 m2 .
Exemple:
a. avem dou suluri de hrtie de ziar i ne intereseaz lungimea de rupere. Abaterile medii
ptratice ale lungimii la rupere a hrtiei obinute la dou maini se cunosc din cercetri
prealabile: 1 20 m i 2 25 m. Pentru ca hrtia s fie corespunztoare, din punct de vedere
al procesului tehnic, media lungimii la rupere trebuie s fie de 3.000m. De aceea ne propunem s
verificm dac lungimea la rupere medie a celor dou suluri m1 i m2 sunt egale ntre ele i egale
cu m0 = 3.000m.
b. avem dou loturi de piese turnate obinute din dou arje executate n dou cubilouri diferite.
Ne intereseaz rezistena medie a pieselor aparinnd celor dou arje. Cunoscnd abaterile
medii ptratice ale rezistenei pieselor produse din arjele obinute la cele dou cubilouri trebuie
s verificm dac rezistenele medii a pieselor celor dou arje sunt egale.
Fie:
valorile caracteristicii obinute pentru unitile care compun cele dou selecii de mrimi n1 i
n2 extrase din colectivitile studiate.
Se calculeaz mediile de selecie:
n1
x1
x1i
i1
n1
n2
i x2
x
i1
n2
2i
Md m1 m2 ,
(3.17)
Dd
12 22
.
n1 n2
(3.18)
x1 x2
12 22
n1 n2
(3.19)
2 2
2 2
P P z 1 2 x1 x2 z 1 2 2 z
n1 n2
n1 n2
(3.20)
Intervalul critic determinat pentru o valoare dat a nivelului de semnificaie (risc) este
definit de inegalitile:
x1 x2 z
12 22
2 2
; x1 x2 z 1 2 .
n1 n2
n1 n2
(3.21)
Probabilitatea acestor inegaliti este egal cu nivelul de semnificaie, iar z se determin din
relaia:
2 2
2 2
1 P z 1 2 x1 x2 z 1 2 1 2 z
n1 n2
n1 n2
(3.22)
Prin urmare, ipoteza m1 m2 , sau d 0 , este fals cnd diferena dintre cele dou medii de
selecie d x1 x2 satisface inegalitile (3.21), adic se afl n intervalul critic.
Pentru un nivel de semnificaie ales ipoteza just se respinge n 100% cazuri i se accept
n 100(1 )% cazuri.
Exemplu. n filaturile de bumbac, 6 fire produse la carde se unesc la flyere pentru a da un fir. Numrul metric al
1
firului pentru firele produse la dou maini diferite, trebuie s fie acelai. Pentru a verifica acest lucru lum cte o
selecie compus din cinci probe elementare. Din cercetrile prealabile se cunosc abaterile medii ptratice ale
"numrului metric al firului" la cele dou carde: 1 0,005 i 2 0,0045 .
n urma determinrilor fcute asupra probelor elementare s-au obinut urmtoarele valori ale numrului metric:
0,240; 0,240; 0,235; 0,250; 0,235 pentru probele luate de la prima card i
0,220; 0,225; 0,220; 0,225; 0,235 pentru probele luate la a doua card.
Indicator de apreciere a grosimii firelor, exprimat n sistemul indirect, conform cruia gradul de subirime al firelor se exprim
prin lungimea unitii de mas, denumit prescurtat finee sau numr. Numrul metric al unui fir indic ci metri (km) sunt
cuprini ntr-un gram (kg) din acel fir.
1
2
1 0,02
2
0,98
0,49 ,
n1
1
n1
2
2
n2
; 2,33
n2
5
2
; 2,33
0,005
0,005
5
0,0045
5
0,007
0,0045
5
0,007
Prin urmare se consider c numrul mediu al firului la cele dou carde este acelai, adic se accept ipoteza
x m0
,
(3.23)
se nlocuiete cu mrimea:
t
x m0
,
s
n
(3.24)
x x
i1
n1
(3.25)
n care xi sunt valorile caracteristicii care compun selecia, x este media seleciei, iar n este
mrimea seleciei.
Mrimea definit de relaia (3.24) are o distribuie t (Student) cu f = n 1 grade de libertate.
Intervalul critic corespunztor unui nivel de semnificaie pentru criteriul t este definit de
inegalitile:
x m0
x m0
t i
t
s
s
n
n
(3.26)
P t t P t t
f t dt f t dt ,
(3.27)
P t t P t t
2 f t dt .
2 2
t
(3.28)
F t P t t
f t dt ,
(3.29)
iar:
f t dt 1 f t dt ,
(3.30)
P t t P t t 2 1 f t dt 2 1 P t t .
(3.31)
rezult:
2 1 P t t P t t 1
.
2
(3.32)
t t t ,
(3.33)
P t t t 1 ;
(3.34)
Cum inegalitile (3.33) se pot scrie, innd seam de relaia (3.24) sub forma:
m0 t
s
s
,
x m0 t
n
n
(3.35)
s
s
,
, m0 t
n
n
(3.36)
prin urmare ipoteza m m0 se accept atunci cnd media de selecie x se gsete ntre
limitele de semnificaie (3.36), unde m0 este o valoare dat, s este abaterea media ptratic
calculat pe baza datelor seleciei, iar n este mrimea seleciei;
n legtur cu alegerea valorii nivelului de semnificaie este important s se fac urmtoarea
remarc: valoarea se alege n fiecare caz cercetat n funcie de domeniul n care se face
cercetarea i bineneles, de precizia pe care dorim s-o obinem.
n practica cercetrilor industriale s-a dovedit c n toate cazurile cnd nivelul de semnificaie
nu depete valoarea 0,05 se pot formula concluzii care corespund realitii. Aadar
pentru se aleg valori cuprinse ntre 0 i 0,05. Valorile cele mai utilizate ale nivelului de
semnificaie sunt: 0,01 i 0,05, iar n cazurile cnd se urmrete o precizie mare, 0,001 i
uneori 0,002 (sau 0,0027). Faptul c aceste valori s-au ncetenit n practica cercetrilor
industriale nu ne poate mpiedica s alegem i alte valori, pentru nivelul de semnificaie;
important este ca valorile alese s nu fie mai mari dect 0,05;
Valorile nivelului de semnificaie se stabilesc innd seama de condiiile concrete n care se
face cercetarea:
cnd dispunem de date din cercetri prealabile, bunoar n controlul statistic al
calitii produciei industriale care are ca scop verificarea ipotezei m m0 (m0 fiind
mijlocul cmpului de toleran), pentru stabilirea nivelului de semnificaie trebuie s
se in seam de procentul rebutului de la maina respectiv i se aplic criteriul Z;
x m0
,
s
n
1 m1 ,
(3.37)
t 1
t 2
1
2f
(3.38)
s
s
n
n
n
xi
i 1
x x
2,42 , s
i 1
n1
0,1517
Se calculeaz mrimea t:
t calc
x m0
s
n
2,42 2,35
0,1517
0,07
0,034
2,059
20
m1 m0
m1 m0
s
0,07
0,1517
2,064
20
t
1
m1 1
2
t
1
2f
t 1
2
t
1
2f
2,093 2,064
2,093 2,064
1
2
2
2,093
2,093
1
2 19
2 19
cele dou sisteme de observaii obinute prin cercetarea caracteristicii X a n1 uniti extrase din
prima colectivitate i a n2 uniti extrase din a doua colectivitate.
Mediile de selecie x1 , x2 estimeaz mediile m1, m2 i dispersiile de selecie s12 i s22
estimeaz dispersiile 12 , 22 . Dac mediile m1, m2 sunt egale, atunci diferena dintre mediile
de selecie x1 , x2 se datoreaz ntmplrii, adic d x1 x2 este ntmpltoare.
Conform teoremei adunrii pentru distribuia normal, mrimea d se distribuie normal cu
media Md m1 m2 i dispersia Dd
12 22
.
n1 n2
x1 x2
12 22
n1 n2
(3.39)
x1 x2
12 22
n1
n2
x1 x2
.
1 1
n1 n2
(3.40)
Dar ntruct abaterea medie ptratic este necunoscut trebuie s-o nlocuim cu estimaia s,
calculat pe baza datelor seleciilor.
Dac s12 , s22 sunt dispersiile a dou selecii extrase din dou colectiviti cu 12 22 ,
estimaia s2 a lui 2 este media aritmetic a dispersiilor s12 , s22 ponderate cu numrul
gradelor de libertate corespunztoare (teorema adunrii pentru distribuia s2 ):
s2
f1 s12 f2 s22
,
f1 f2
(3.41)
unde: f1 n1 1; f2 n2 1; f1 f2 n1 n2 2 .
Prin nlocuirea lui cu s, mrimea z se transform n mrimea t:
x1 x2
,
1 1
s
n1 n2
(3.42)
0,05
0,01
0,975 , iar pentru 0,01 P 1
0,995 .
2
2
Dac cele dou selecii se extrag din aceeai colectivitate general i dac ipoteza m1 m2 m
este just, atunci pentru media m i dispersia 2 ale colectivitii generale se pot calcula
estimaiile:
x
n1 x1 n2 x2
m,
n1 n2
n1
s02
x
i1
x1 x2i x2
2
1i
n2
(3.43)
i1
n1 n2 1
2 .
(3.44)
2
Deoarece media x se distribuie normal cu media m i dispersia
, mrimea:
n1 n2
t
x m
,
s0
n1 n2
(3.45)
s0
s0
P x t
m x t
n1 n2
n1 n2
10
1 ,
(3.46)
x t
s0
n1 n2
; x t
s0
n1 n2
0,05
0,01
0,975 , iar pentru 0,01 P 1
0,995 .
2
2
x1 x2
(3.47)
12 22
n1
n2
x1 x2
s12 s22
n1 n2
(3.48)
1
c 1 c
f1
f2
2
(3.49)
s 12
n1
s12 s 2 2
n1 n2
(3.50)
11
f1
f2
1. dac t t0,05 se consider c diferena dintre cele dou medii d x1 x2 este
ntmpltoare i nu se datoreaz unei diferene dintre mediile m1 i m2, iar ca atare
ipoteza m1 m2 se accept ca just;
2. dac t0,05 t t0,01 considerm ipoteza ndoielnic, iar pentru a decide dac diferena
dintre cele dou medii este ntmpltoare sau sistematic este necesar o nou selecie
care se recomand s cuprind un numr mai mare de uniti;
3. t t0,01 se consider c diferena dintre cele dou medii nu este ntmpltoare ci se
datoreaz diferenei care exist ntre mediile m1 i m2 i ipoteza egalitii celor dou
medii se respinge.
Obs. Pentru 0,05 P 1
0,05
0,01
0,975 , iar pentru 0,01 P 1
0,995 .
2
2
BIBLIOGRAFIE
1. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
2. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
3. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963
12
13
14
15
16
CURS 6
3. VERIFICAREA IPOTEZELOR. CRITERII DE SEMNIFICAIE (CONTINUARE)
3.7. CRITERIUL DE SEMNIFICAIE F
Ipoteza 1 2
2
12
se verific pe baza criteriul de verificare a raportului 2 1
2
Pentru a verifica ipoteza se folosesc datele unei cercetri selective i anume, se extrage o
selecie de mrime n1 din colectivitatea general a crei dispersie este 12 (necunoscut) i o
selecie de mrime n2 din colectivitatea general a crei dispersie este 22 (necunoscut).
Fie:
s 12
x
i 1
1i
n1 1
n2
s 22
x1
x
i 1
Raportul dispersiilor
2i
x2
(3.51)
(3.52)
n2 1
12
s12
se
estimeaz
cu
ajutorul
raportului
dispersiilor
de
selecie
(se
s 22
22
s12
s aib o valoare cuprins ntre dou valori bine
s 22
determinate F1 i F2.
Se demonstreaz c pentru un nivel de semnificaie (risc) i dac se consider probabilitatea
ca valorile raportului s fie mai mici dect F1 egal cu probabilitatea ca valorile raportului s
fie mai mare dect F2, atunci intervalul critic este definit de inegalitile:
s12
s1 2
F
F2 F ,
i
1
2
;f1 ;f2
1 ;f1 ;f2
s22
s
2
2
2
(3.53)
s12
s se gseasc n intervalul de ncredere este, pentru un nivel de
s 22
Probabilitatea ca raportul
s1 2
P F1 F
2 F2 F 1 .
;f1 ;f2
1 ;f1 ;f2
s2
2
2
(3.54)
n ANEXA 2, Tabelul 2 (n care se dau valorile lui F corespunztor unui risc 0,05
0,05
P 1
0,975 ) se caut valoarea lui F situat la intersecia coloanei corespunztoare lui
2
f1 cu rndul corespunztor lui f2. Valoarea gsit reprezint limita superioar a intervalului de
ncredere: F2 F .
1 ;f1 ;f2
2
Apoi, n acelai tabel, se caut valoarea lui F situat la intersecia coloanei corespunztoare lui
f2 cu rndul corespunztor lui f1. mprind pe 1 la valoarea gsit, obinem limita inferioar a
1
intervalului de ncredere: F1
.
F
1 ;f2 ;f1
2
Observaie: dac dispersia s12 i este mai mic dect dispersia s22 , atunci se studiaz raportul
s 22
1
, dar acest criteriu duce la aceleai rezultate, deoarece F
2
;f
;f
1 2
s1
F
2
1 ;f2 ;f1
2
n felul acesta se poate stabili criteriul pe baza unui singur raport i anume pe baza raportului
dintre dispersia mai mare i dispersia mai mic; acest raport se compar cu limita superioar
de ncredere:
F2 F
1 ;f1 ;f2
2
(3.55)
(3.56)
unde f1 reprezint gradele de liberate ale dispersiei de selecie mai mari, iar f2 gradele de
libertate ale dispersiei de selecie mai mici.
Dac valoarea raportului dispersiilor de selecie determinat ca n relaia (3.56) este mai mic
x1
n2
x 1i
1097 ore, x2
i 1
n1
2i
1108 ore.
i 1
n2
2. Dispersiile de selecie:
n1
s1
2
1i
x1
n2
4432,63 , s 2
i 1
x2
3157,26
i 1
n1 1
2i
n1 1
4432,63
1,44 ;
3157,26
gradele de libertate: f1 n1 1 20 1 19 , f2 n2 1 20 1 19 ;
f1 s1 f2 s 2
2
f1 f2
19 4432,63 19 3157,26
19 19
4432,63 3157,26
2
61,6 ore.
4.2. Verificm dac diferena celor dou medii de selecie este ntmpltoare cu ajutorul criteriului t. Criteriul t se
va calcula dup formula (3.42) Curs 5:
x1 x2
t
s
1
n1
1
n2
1093 1108
61,6
1
20
1
20
1093 1108
61,6
0,77 0,77 ;
1
10
f f1 f2 n1 n2 2 20 20 2 38 grade de libertate.
m x
n1 x1 n2 x2
n1 n2
n1
s0
2
s0
x1
2
1i
i 1
x1 x2
1093 1108
n2
2i
x2
1100,5 ore;
3695,9 ;
i 1
n1 n2 1
7. Avnd aceste date putem determina, folosindu-ne de formula (3.46) Curs 5, limitele intervalului de ncredere
pentru media general necunoscut m. Alegnd ca nivel de semnificaie = 0,05, gsim n ANEXA 1, Tabelul 1
pentru f n1 n2 1 39 40 i P 0,975 , t0,05=2,021, iar pentru intervalul de ncredere obinem:
s0
x t 0 ,05
n1 n2
m x t 0 ,05
s0
1100,5 2,021
n1 n2
60,79
m 1100,5 2,021
60,79
40
1081,1 m 1119,9
40
x1
n2
1i
104,76 ml, x2
i 1
n1
2i
112,2 ml.
i 1
n2
2. Dispersiile de selecie:
n1
s1
2
1i
x1
n2
5,19 , s 2
i 1
n1 1
2i
x2
i 1
n2 1
27,54
Se schimb indicii:
n2
x1
n1
x 2i
i 1
n2
112,2 , x2
n2
x 1i
i 1
n1
104,76 , s1
2
x 2i x2
i 1
n1
27,54 , s 2
2
n2 1
1i
x1
i 1
n1 1
5,19
27,54
5,19
5,31 ;
gradele de libertate: f1 n1 1 20 1 19 , f2 n2 1 25 1 24 ;
n ANEXA 2, Tabelul 2, pentru f1 = 19, f2 = 24 (pentru = 0,05) gsim F0,975;19;24 = 2,35, mai mic dect
F = 5,31. Rezult, cu o probabilitate de 0,95, c cele dou dispersii generale 1 , 2 se deosebesc
2
semnificativ.
4. Verificarea ipotezei m1 m2 cnd 1 2
2
4.1. Revenim la notaiile iniiale. Verificm dac diferena celor dou medii de selecie este ntmpltoare cu
ajutorul criteriului t. Criteriul t se va calcula dup formula (3.48) Curs 5:
x1 x2
s1
s2
n1
104,76 112,20
5,19
25
n2
5,11 5,11 .
27,54
20
4.2. Numrul gradelor de libertate pentru acest t se calculeaz dup formula (3.49) Curs 5:
f
c
f1
1 c
0,13103
f2
24
1 0,13103
24,7 25 ,
19
s1
c
5,19
n1
s1
n1
s2
n2
25
0,13103 .
27,54
25
20
5,19
0,05
x1
x1i
i1
n1
n
s12
x
i1
, x2
x
i1
n2
1i x1
n1 1
2i
(3.57)
n
, s22
x
i1
x2
2i
n2 1
(3.58)
x1 x2
,
1 1
s
n1 n2
(3.59)
x1 x2
x x
1 2 n.
1 1 s 2
s
n n
(3.60)
2
2
f1 s12 f2 s22 n 1 s1 n 1 s2 s12 s22
f1 f2
2
n 1 n 1
(3.61)
x1 x2
s12 s22
n1 n2
(3.62)
1
c 1 c
f1
f2
2
grade de libertate ( f1 n1 1 i
f2 n2 1 ), unde:
s1 2
n1
(3.63)
s1 2 s 2 2
n1 n2
x1 x2
2
1
x1 x2
s12 s22
s
s
2
n1 n2
1
c2 1 c
f1
f2
s12
n1
s12 s22
n1 n2
n,
(3.64)
1 c
c2
n 1
n 1
n1
c 1 c
2
s12
.
s12 s22
(3.65)
(3.66)
Pentru a verifica dac cele dou metode de cercetare permit obinerea unor rezultate identice,
trebuie ca mrimea t calculat, pe baza datelor cercetrii, dup formula (3.64) s aib valori
mai mici dect valoarea t0,05 corespunztoare nivelului de semnificaie = 0,05 (ANEXA 1,
Tabelul 1, P 0,975 ):
1. dac t < t0,05 se consider c diferena dintre cele dou medii d x1 x2 nu este
semnificativ, prin urmare rezultatele obinute prin cele dou metode nu difer
semnificativ;
2. dac t0,05 < t < t0,01 considerm ipoteza d x1 x2 ndoielnic, iar pentru a decide dac
rezultatele obinute prin cele dou metode este ntmpltoare sau sistematic este
necesar o nou selecie care se recomand s cuprind un numr mai mare de uniti;
3. t > t0,01 se consider c diferena dintre cele dou medii d x1 x2 obinute prin cele
dou metode nu este ntmpltoare i ipoteza se respinge.
Exemplul 3. Coninutul de siliciu al arjelor s-a determinat prin dou
metode: chimic i colorimetric. Se analizeaz dac cele dou
metode dau rezultate identice. Pentru aceasta s-au luat apte probe
duble din aceeai arj de oel folosind metoda chimic i
colorimetric. Rezultatele cercetrii sunt date n tabelul alturat.
Rezolvare
1. Mediile de selecie sunt:
n
x1
1i
1,253 , x2
i 1
x
i 1
2i
1,267 .
2. Dispersiile de selecie:
n
s1
2
1i
x1
i 1
0,01852 , s 2
2
n1
2i
x2
0,02895 .
i 1
n1
0,02895
0,01852
1,56 ;
gradele de libertate
f1 f2 n 1 7 1 6 .
din ANEXA 2, Tabelul 2, pentru f1 = 6, f2 = 6 (pentru un nivel de semnificaie de 0,05) gsim F0,975;6;6 = 5,82,
mai mare dect F = 1,56. Cu o probabilitate de 95% se poate afirma c cele dou dispersii generale 1 ,
2
2 sunt egale.
2
s
2
0,01852 0,02895
2
0,02374 ;
5. Calculul mrimii t
t
x1 x2
s 2
1,253 1,267
0,02374 2
7 0,17 0,17 ;
f 2 n 1 2 7 1 12 grade de libertate.
Din tabel pentru f = 12 i P = 0,975 gsim t0,05 = 2,179 care este mult mai mare dect t = 0,17, prin urmare
rezultatele obinute prin cele dou metode nu difer semnificativ, ipoteza se accept.
M1 i respectiv M2. S-a notat cu xi1 valoarea caracteristicii corespunztoare unitii din
i1
(3.67)
d2
, iar mrimea:
n
d
,
d
n
(3.68)
sd
d d
i1
n1
, f n1,
(3.69)
obinem mrimea
t
d
.
sd
n
(3.70)
10
di d xi1 x1 xi2 x2 ,
(3.71)
d d
2
1 n
x i1 x1 x i2 x2
n1
n 1 i1
1 n
1 n
2 n
2
2
xi1 x1
xi2 x2
xi1 x1 xi2 x2 .
n 1 i1
n 1 i1
n 1 i1
s d2
i1
(3.72)
Notnd cu:
s12
1 n
2
xi1 x1
n 1 i1
(3.73)
s22
1 n
2
xi2 x2 .
n 1 i1
(3.74)
s12
1 n
xi1 x1 xi2 x2 ,
n 1 i1
(3.75)
Se noteaz cu:
momentul de ordinul doi corelat al celor dou iruri de valori xi1 i xi2 , estimaia sd2 se poate
scrie:
sd2 s12 s22 2 s12 .
(3.76)
Acest rezultat arat c sd2 , dispersia diferenelor di d , depinde de corelaia dintre valorile
xi1 i xi2 obinute ca rezultat al cercetrii caracteristicii prin metodele M1 i M2; dispersia sd2
are valoarea minim atunci cnd momentul de ordinul doi corelat are valoarea maxim, adic
1. Momentul de ordinul doi corelat are valoarea egal cu 1 atunci cnd ntre cele dou variabile
exist o corelaie strns.
Pentru a verifica dac cele dou metode de cercetare permit obinerea unor rezultate identice,
trebuie ca mrimea t calculat, pe baza datelor cercetrii, dup formula (3.70) s aib valori
mai mici dect valoarea t0,05 corespunztoare nivelului de semnificaie = 0,05 (ANEXA 1,
Tabelul 1, P 0,975 ):
1. dac t < t0,05 se consider c diferenele dintre perechile de valori nu sunt semnificative,
prin urmare rezultatele obinute prin cele dou metode nu difer semnificativ;
2. dac t0,05 < t < t0,01 considerm ipoteza ndoielnic, iar pentru a decide dac diferena
dintre rezultatele obinute prin cele dou metode este ntmpltoare sau sistematic
11
t 1
t2
1
2f
(3.77)
n cazul n care n1 n2 n :
1
m1 m2
s 2
n
e
s 2
n
(3.78)
t
t
t 1 1 1 ,
t 2
t 2
1
1
f
f
(3.79)
unde:
1
m1 m2
e
.
sd
sd
n
n
(3.80)
Se observ c puterile criteriului aplicnd cele dou scheme de organizare expuse mai sus sunt
diferite i anume puterea criteriului pentru cazul cnd se utilizeaz perechi de uniti este mai
mare.
Pentru a ne convinge de avantajul celui de-al doilea mod de selecionare vom considera
urmtorul exemplu.
12
x1
1.
32,72 , x2
i 1
n
n
2.
s1
3.
x1
1i
2i
31,89 ;
i 1
1,326 , s 2
i 1
1i
n1
1,326
0,618
2i
x2
0,618 ;
i 1
n1
2,14 ;
gradele de libertate
f1 f2 n 1 10 1 9 ;
din ANEXA 2, tabelul 2, pentru f1 = 9, f2 = 9 (pentru un nivel de semnificaie de 0,05) gsim F0,975;9;9 = 4,03,
mai mare dect F = 2,14. Cu o probabilitate de 95% se poate afirma c cele dou dispersii generale 1 ,
2
2 sunt egale.
2
s1 s 2
2
4.
5.
x1 x2
1,326 0,618
2
32,72 31,89
0,9725 2
0,9725 ;
10 1,88 ;
n
6.
f 2 n 1 2 10 1 18 grade de libertate.
Din ANEXA 1, Tabelul 1, pentru f = 18 i P = 0,975 gsim t0,05 = 2,101 care este mai mare dect t = 1,88, prin urmare
rezultatele obinute prin cele dou metode nu difer semnificativ, ipoteza se accept cu o probabilitate de 95%.
B. Schema comparrii diferenelor
n
1.
2.
sd
2
i1
=0,83;
n
d d
n1
0,667 ;
i 1
13
3.
d
sd
n
4.
0,83
3,2 ;
o,667
10
f = n 1 = 10 1 = 9.
Din ANEXA 1, Tabelul 1 pentru f = 9 i P = 0,975 gsim t0,05 = 2,262 care este mai mic dect t = 3,2, pentru f = 9 i
P = 0,995 gsim t0,01 = 3,25 care este mai mare dect t = 3,2 (adic 2,262 < 3,2 < 3,25), deci considerm ipoteza
ndoielnic, iar pentru a decide dac diferena dintre rezultatele obinute prin cele dou metode este
ntmpltoare sau sistematic este necesar o nou selecie care se recomand s cuprind un numr mai mare de
uniti.
BIBLIOGRAFIE
1. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
2. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
3. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963
14
15
16
17
18
CURS 7
3. VERIFICAREA IPOTEZELOR. CRITERII DE SEMNIFICAIE (CONTINUARE)
3.9. ELIMINAREA VALORILOR CARE SE ABAT MULT DE LA MEDIE
Dac n irul de valori exist rezultate extreme care sunt mult diferite fa de marea
majoritate a celorlalte rezultate, este necesar s se analizeze oportunitatea eliminrii acestora
n faza de prelucrare statistic. Aceasta operaie se face pe baza unor teste care impun alegerea
unei probabiliti funcie de care se ia decizia de pstrare sau eliminare a lor.
Verificarea irurilor de date sau a eantionului obinut poart denumirea de analiz critic a
datelor, dou dintre testele cele mai utilizate sunt testele GRUBBS, DIXON i ROMANOWSKI.
3.9.1. Testul GRUBBS (testul g)
Acest test se poate aplica irurilor mici i mari de date care au aproximativ o distribuie
normal i permite testarea unei singure valori care are o abatere mare n raport cu media.
Se ordoneaz setul de date de mrime n n ordine cresctoare, se calculeaz media setului de
date, iar statistica de testare, g, se calculeaz cu una din urmtoarele formule n funcie de cea
mai deprtat valoare fa de media x ( x1 sau xn ):
x x1
x x
,
; g n
s
s
(3.81)
n care:
x
i1
x x
i1
n1
Dac valoarea g calculat cu una din formulele (3.81) este mai mare dect valoarea critic gcritic
(din tabelul 1) pentru un nivel de risc (uzual =0,05), valoarea extrem considerat se
elimin din irul de date.
n caz contrar, se impune concluzia c nu exist motive suficiente pentru eliminarea valorii
respective.
Dac valoarea a fost eliminat, se repet algoritmul pentru cele n 1 valori rmase pn cnd
nu mai sunt eliminate date ale irului.
Riscul
=0,05
=0,01
1,1531
1,1546
1,4625
Riscul
=0,05
=0,01
15
2,4090
2,7049
1,4925
16
2,4433
1,6714
1,7489
17
1,8221
1,9442
1,9381
Riscul
=0,05
=0,01
80
3,1319
3,5208
2,7470
90
3,1733
3,5632
2,4748
2,7854
100
3,2095
3,6002
18
2,5040
2,8208
120
3,2706
3,6619
2,0973
19
2,5312
2,8535
140
3,3208
3,7121
2,0317
2,2208
20
2,5566
2,8838
160
3,3633
3,7542
2,1096
2,3231
25
2,6629
3,0086
180
3,4001
3,7904
10
2,1761
2,4097
30
2,7451
3,1029
200
3,4324
3,8220
11
2,2339
2,4843
40
2,8675
3,2395
300
3,5525
3,9385
12
2,2850
2,5494
50
2,9570
3,3366
400
3,6339
4,0166
13
2,3305
2,6070
60
3,0269
3,4111
500
3,6952
4,0749
14
2,3717
2,6585
70
3,0839
3,4710
600
3,7442
4,1214
x 2 x1
x x
; q n n1 ,
xn x1
xn x1
(3.82)
Dac valoarea q calculat cu una din formulele (3.82) este mai mare dect valoarea critic qcritic
(din tabelul 2) pentru un nivel de risc (uzual =0,05), valoarea extrem considerat se
elimin din irul de date.
n caz contrar, se impune concluzia c nu exist motive suficiente pentru eliminarea valorii
testate.
Dac valoarea a fost eliminat, se repet algoritmul pentru cele n 1 valori rmase pn cnd
nu mai sunt eliminate date ale irului.
=0,05
=0,04
=0,02
=0,01
0,970
0,976
0,988
0,994
0,829
0,846
0,889
0,926
0,710
0,729
0,780
0,821
0,625
0,644
0,698
0,740
0,568
0,586
0,637
0,680
0,526
0,543
0,590
0,634
0,493
0,510
0,555
0,598
10
0,466
0,483
0,527
0,568
x x1
x x
; t n
,
n
n
s
s
n1
n1
n care:
i 2
n1
sau x
Tabelul 3
n1
xi
(3.83)
xi x
x
i1
n 1
,
n1
i 2
n2
sau s
x x
i1
n2
7,70
7,60
7,50
7,40
7,30
7,20
7,10
Rezolvare
7,00
TESTUL GRUBBS
6,90
6,80
1 2 3 4 5 6 7 8 9 10111213141516171819202122
xn x
s
7,65 7,177
2,52
0,1875
2,6
s2
f s
i
i1
2
i
(3.84)
f
i1
max si2
k
s
i1
(3.85)
2
i
Se compar valoare statisticii c din datele cercetrii cu valoarea lui c corespunztoare riscului
= 0,05, f = n 1 i k (tabelul 4), respectiv riscului = 0,01, f = n 1 i k (tabelul 5):
a) dac c c0,05 se consider c dispersia are valoarea mare datorit ntmplrii i prin
urmare se utilizeaz la calculul dispersiei s 2 ;
b) dac c0,05 c c0 ,01 se pune la ndoial faptul c valoarea mare a dispersiei ar fi
ntmpltoare; pentru mai mult siguran este preferabil s se renune la aceast
dispersie, adic s nu fie utilizat la calculul dispersiei s 2 ;
c) dac c c0,01 se consider c dispersia are o valoare mare care nu se poate pune pe
seama ntmplrii i ca atare se exclude de la calculul dispersiei s 2 .
Tabelul 4
Rezolvare
1. Mediile de selecie x i :
n
xi
ij
j 1
2. Dispersiile de selecie si :
x
n
xi
ij
j 1
s i2
n1
Sel.
10
11
12
xi
48,825
50,275
49,338
49,538
49,938
49,100
46,613
49,938
51,125
49,463
51,413
50,675
s i2
1,4824
0,9234
1,0701
0,4419
3,1188
1,7343
0,8791
0,8239
0,7350
1,0060
0,4483
0,6106
fi
39
39
39
39
39
39
39
39
39
39
39
39
3. Calculul lui c 5
Din tabel observm c cea mai mare dispersie este cea corespunztoare seleciei 5, adic s 5 3, 1188 .
2
c5
s5
3,1188
13,2738
0,235
i 1
4. Calculul lui c 6
Din tabel observm c cea mai mare dintre dispersiile rmase este cea corespunztoare seleciei 6, adic
s 6 1, 7343 .
2
c6
s6
s1 s2 ... sk
2
1,7343
10,155
0,171
0,15 .
c6 0,171 calculat este mai mare dect c0 ,05 0,15 , dispersia s6 2 1,7343 = se exclude.
5. Calculul lui c1
Din tabel observm c cea mai mare dintre dispersiile rmase este cea corespunztoare seleciei 1, adic
s1 1, 4824 .
2
c1
s1
s1 s 2 ... sk
2
1,4824
8,4207
0,176
0,16 .
c3
s1
s 2 ... sk
2
1,0701
6,9383
0,154
0,18 .
Deoarece c3 0,154 calculat este mai mic dect deci dispersia s 3 = 1,0701 nu difer semnificativ de celelalte
2
dispersii.
7. n concluzie putem spune c cele 9 dispersii rmase sunt omogene i ca atare sunt estimaii ale uneia i aceleai
dispersii generale , care va fi estimat ca media ponderat a acestora:
2
f s
i
s
2
i 1
k
fi
2
i
39
s
9 39
2
i
i 1
6,9383
9
0,7709
i 1
s 0,7709
2
cov(X,Y)
x x y y
i1
n1
(3.86)
Dac valoarea lui r este nul, se spune c cele dou variabile nu sunt corelate sau c
sunt necorelate.
Expresia coeficientului de corelaie este:
n
zx zy
i1
xi x yi y
i1
x x yi y
n i
n
n
i1
n
x x y y
i
i1
x x y y
i1
zx
xi x
este scorul (valoarea normat) z al variabilei X;
sx
zy
xi y
este scorul (valoarea normat) z al variabilei Y;
sy
(3.87)
S se determine media, mediana, modulul, dispersia de selecie i abaterea medie ptratic de selecie ale
variabilei test, respectiv not final;
2.
S se afle dac rezultatele obinute de cei 9 studeni la testul aplicat pe parcurs au influenat notele lor
finale la examen.
Nr. de puncte obinute la test
(variabila X)
230
310
250
310
150
180
80
350
230
Nota la examen
(variabila Y)
8
10
9
10
7
7
6
10
8
Pentru calculul medie folosii funcia AVERAGE, al medianei funcia MEDIAN, al modulului funcia MODE, al
dispersiei de selecie funcia VAR i al abaterii medie ptratice de selecie cu funcia STDEV, al covarianei cu
funcia COVAR, al coeficientului de corelaie cu funcia CORREL sau PEARSON, din aplicaia Excel.
Rezultate
Concluzie: deoarece coeficientul de corelaie r 0,974 se poate aprecia c ntre variabila X = Nr. puncte obinute
la test i variabila Y = Nota la examen exist o foarte bun corelaie, ceea ce nseamn c punctele obinute la
testul aplicat pe parcurs au influenat notele finale la examen
10
2 2
k
limP dn
1 e2k , x ,
n
n
(3.88)
unde: dn max Fn x F x .
Adic pentru valori mari ale lui n, probabilitatea ca valoarea absolut a celei mai mari
diferene dintre valoarea funciei de distribuie empiric F n(x) i celei a funciei de distribuie
teoretic F(x), s nu depeasc o valoare dat, este egal cu .
n baza acestei teoreme se poate formula un criteriu pentru a verifica dac distribuia empiric
urmeaz sau nu legea de distribuie presupus (ipotetic).
S presupunem c avem distribuia empiric:
x1 ,x 2 ,...,x k
,
n1 ,n2 ,...,nk
i se face ipoteza c variabila X are o distribuie a crei funcie de frecven este f(x) (normal
sau binomial sau Poisson etc.).
Atunci se pot calcula frecvenele relative cumulate, adic valorile funciei de distribuie
empirice:
Fn x1 ,Fn x2 ,...,Fn xk ,
(3.89)
n1 n2 ... ni
.
n
(3.90)
unde: Fn xi
F x1 ,F x2 ,...,F xk ,
unde: F x P X x
(3.91)
f x dx .
(3.92)
Dac caracteristica X urmeaz legea de distribuie f(x), atunci frecvenele relative cumulate
(valorile funciei de distribuie empirice)
Fn xi
11
(3.93)
1,36
se accept ipoteza c variabila X urmeaz legea de
n
1,36
se respinge ipoteza c variabila X urmeaz legea de
n
1,63
se accept ipoteza c variabila X urmeaz legea de
n
1,63
se respinge ipoteza c variabila X urmeaz legea de
n
FR. ABS.
1,70
1,80
1,80
1,90
1,90
2,00
2,00
2,10
2,10
2,20
14
2,20
2,30
34
2,30
2,40
28
2,40
2,50
19
2,50
2,60
2,60
2,70
2,70
2,80
Rezolvare
Calculele s-au realizat n Excel.
12
mijloacelor
intervalelor:
n coloana K: modulele diferenelor dintre funcia de distribuie empiric i funcia de distribuie teoretic;
n coloana L: valoarea maxim a modulelor diferenelor.
Concluzie: deoarece max Fn x F x 0,102 este mai mic dect
1,36
n
1,36
130
c distribuia arjelor de font maleabil cenuie, din punct de vedere al coninutului de carbon, urmeaz legea de
distribuie normal.
Concluzia este ntrit i de graficul celor dou distribuii.
DISTR. EMPIRICA
DISTR. TEORETICA
1,0
0,8
0,6
0,4
0,2
0,0
1
10
11
BIBLIOGRAFIE
1. *** Probabiliti i statistic, www.edumanager.ro
2. Bulgaru, M., Elemente de teoria probabilitilor, www.cermi.utcluj.ro
3. Pop, M., .a., Probabiliti i statistic-teorie i aplicaii, Editura RISOPRINT, Cluj-Napoca,
2008
4. Rancu, N., Tovissi, L., Statistic matematic cu aplicaii n producie, Editura Academiei
Romne, 1963
13