Sunteți pe pagina 1din 101

Probabiliti i Statistic matematic (Draft)

Probabiliti i Statistic
matematic

Noiuni teoretice i Aplicaii

Bucureti
2016

1
Probabiliti i Statistic matematic (Draft)

Contents
Introducere .......................................................................................................................... 4
1. Terminologie ................................................................................................................... 5
2. Variabile aleatoare ........................................................................................................ 13
3. Cteva repartiii clasice ................................................................................................. 18
3.1. Repartiii discrete .......................................................................................................... 18
3.1.1 Repartiia uniform ................................................................................................. 18
3.1.2. Repartiia binomial ............................................................................................... 18
3.1.3. Repartiia geometric ............................................................................................. 18
3.1.4. Repartiia Poisson .................................................................................................. 18
3.2. Repartiii continue ......................................................................................................... 19
3.2.1. Repartiia uniform ................................................................................................ 19
3.2.2. Repartiia normal .................................................................................................. 19
3.2.3. Repartiia lognormal............................................................................................. 19
3.2.4. Repartiia exponenial de parametru ................................................................ 20
3.2.5. Repartiia gamma ................................................................................................... 20
3.2.6. Repartiia beta ........................................................................................................ 20
3.2.7. Repartiia 2 ......................................................................................................... 21
3.2.8. Repartiia Student................................................................................................... 21
3.2.9. Repartiia Fisher-Snedecor..................................................................................... 22
3.2.10. Repartiii de tip Gumbel....................................................................................... 22
4. Caracteristici ale variabilei aleatoare ............................................................................ 24
4.1. Tendina central de grupare ......................................................................................... 24
4.1.1. Valoarea medie ...................................................................................................... 24
4.1.2. Valoarea median................................................................................................... 26
4.1.3. Modul ..................................................................................................................... 26
4.1.4. Momente i medii de ordin superior ...................................................................... 28
4.2. mprtierea distribuiei variabilei aleatoare. Dispersia................................................ 29
4.2.1. Intervalul de variaie .............................................................................................. 30
4.2.2. Abaterea. Abaterea absolut medie........................................................................ 31
4.2.3. Dispersia. Abaterea medie patratic ...................................................................... 31
4.2.4. Momente centrate i medii centrate ....................................................................... 32
4.2.5. Covariana. Coeficientul de corelaie ..................................................................... 32
4.2.6. Coeficientul de mprtiere (coeficientul de vatiaie) ............................................ 33
4.3. Caracteristici ale formei distribuiei.............................................................................. 33
4.3.1. Simetrie i asimetrie ............................................................................................... 33
4.3.2. Boltirea (Turtirea) curbelor de distribuie (Kurtosis)............................................. 35
4.4. Simularea numeric a unor variabile aleatoare ............................................................. 35
4.5. Legea slab a numerelor mari ....................................................................................... 37
5. Statistic descriptiv ..................................................................................................... 38
5.1. Vocabular ...................................................................................................................... 38
5.2. Reprezentarea datelor.................................................................................................... 39
5.2.1. Tabele ..................................................................................................................... 39
5.2.2. Reprezentarea grafic a repartiiilor de frecvene .................................................. 40
5.3. Depistarea datelor afectate de erori aberante i sistematice.......................................... 42
5.3.1. Identificarea valorilor afectate de erori aberante i eliminarea lor ........................ 42
Testul Chauvenet ............................................................................................................. 42
5.3.2. Depistarea erorilor sistematice dintr-un set de date ............................................... 45
2
Probabiliti i Statistic matematic (Draft)
Testul Young .................................................................................................................... 45
5.4. Prezentare sumar a modulului Data Analysis din Excel ............................................. 48
5.4.1. Simularea numeric a variabilei aleatoare Exp() ................................................. 48
5.4.2. Simularea numeric a unei variabile aleatoare discrete ......................................... 50
5.5. Ajustarea datelor de msurtoare .................................................................................. 51
5.5.1. Dreapta de regresie punerea problemei............................................................... 51
5.5.2. Funcia de regresie ................................................................................................. 52
5.5.3. Polinomul de interpolare al lui Lagrange............................................................... 53
5.5.4. Prezentare general a pachetului de programe CurveExpert ................................. 54
6. Elemente de teoria estimaiei ........................................................................................ 58
6.1. Estimatori ...................................................................................................................... 58
6.2. Metoda verosimilitii maxime ..................................................................................... 59
6.2.1. Estimatorul de verosimilitate maxim ................................................................... 59
6.2.2. Estimator de verosimilitate maxim pentru parametrul repartiiei Poisson ........... 60
6.2.3. Estimator de verosimilitate maxim pentru parametrul repartiiei exponeniale ... 61
6.2.4. Estimatori de verosimilitate maxim pentru parametrii repartiiei normale,
N , ........................................................................................................................... 61
6.3. Intervale de ncredere pentru medie i dispersie ........................................................... 62
6.3.1. Intervale de ncredere pentru medie ....................................................................... 64
6.3.2. Intervale de ncredere pentru frecven.................................................................. 69
6.3.3. Intervale de ncredere pentru dispersie .................................................................. 70
7. Elemente de decizii statistice ........................................................................................ 72
7.1. Ipoteze statistice ............................................................................................................ 72
7.2. Etapele verificrii ipotezelor statistice .......................................................................... 73
7.3. Teste statistice ............................................................................................................... 73
7.3.1. Testul variabilei reduse Z al ipotezei nule ............................................................. 73
7.3.2. Procedeul intervalelor de ncredere ....................................................................... 75
7.3.3. Aplicaii.................................................................................................................. 75
7.3.3.1. Compararea mediei cu o valoare......................................................................... 75
7.3.3.2. Compararea a dou medii empirice .................................................................... 77
7.3.3.3. Compararea unei frecvene relative cu o probabilitate ....................................... 79
7.3.3.4. Compararea a dou frecvene relative................................................................. 80
7.4. Concordana dintre o distribuie empiric i una teoretic ........................................... 81
7.4.1. Testul de concordan ...................................................................................... 82
2

7.4.2.Testul lui Kolmogorov ............................................................................................ 88


8. Elemente de analiz dispersional ................................................................................ 93
8.1. Concepte ....................................................................................................................... 93
8.2. Testarea omogenitii cnd aceasta este caracterizat de mediile de selecie ............... 94
8.2.1. Testarea omogenitii populaiei ............................................................................ 94
8.2.2 Procedur practic de aplicare a testului F: ............................................................ 95
8.3. Cercetarea aciunii simultane a doi factori.................................................................... 95
ntrebri pentru colocviul la disciplina Probabiliti i Statistic matematic ................ 98
Chestiuni teoretice ............................................................................................................... 98
Exemplu de aplicaie practic ............................................................................................ 100
Bibliografie ..................................................................................................................... 101

3
Probabiliti i Statistic matematic (Draft)

Introducere

n lumea real incertitudinea este inevitabil. Sursele de incertitudine pot fi grupate n dou
categorii: cele datorate factorului natural aleator i cele datorate inacurateii prediciei i
estimrii realitii [1]. Probabilitile i statistica asigur instrumente corespunztoare
modelrii i analizei incertitudinii n inginerie n diferite domenii, cum ar fi:
- planificarea i proiectarea infrastructurii transporturilor,
- planificarea i proiectarea hidrosistemelor,
- planificarea i managementul proiectelor n consrucii,
- msurtori fotogrametrice, geodezice i topografice,
- controlul calitii,
- proiectarea sistemelor geotehnice.
Proprietile solurilor sunt eterogene i variabile, depozitele de pmnturi fiind caracterizate
de diferite straturi de materiale: argil, nisip, nmol, pietri sau combinaii ale acestora cu
densiti i coninut de umiditate diferite i alte proprieti ale solului care afecteaz rezistena
i compresibilitatea depozitului. La fel i formaiunile de roci sunt caracterizate de sisteme
neregulate de defecte geologice i fisuri care afectez capacitatea portant a rocii. Datorit
eterogenitii i neregularitii depozitelor de sol i roci capacitatea subsolului va varia serios
peste situl fundaiei. Avnd date puine la dispoziie este posibil ca estimrile capacitii de
ncrcare s fie prea optimiste sau prea pesimiste, ambele situaii fiind nedorite. Pentru a
obine mai multe informaii se impun mai multe investigaii i implicit creterea costurilor
care se poate s nu fie proporional cu reducerea riscului. Astfel, limita de siguran
optimal necesar pentru proiectare poate fi privit ca o problem care implic un echilibru
ntre cost i probabilitaea de defectare acceptat.

4
Probabiliti i Statistic matematic (Draft)
Partea nti
Calculul probabilitilor

1. Terminologie
Prin experien n teoria probabilitilor se nelege orice act care poate fi repetat n condiii
date. Nu se poate preciza rezultatul exact al unei experiene ! Vom considera n cele ce
urmeaz doar experiene care au un numr finit de rezultate.
Toate situaiile legate de experien i despre care putem spune cu certitudine c s-au produs
sau nu, dup efectuarea experienei poart numele de evenimente.
Evenimentul sigur este un eveniment care se realizeaz cu certitudine la fiecare efectuare a
experienei. l notm cu .
Evenimentul imposibil, notat cu , nu se produce la nici o efectuare a experienei.
ntotdeauna unui eveniment A i corespunde un eveniment contrar, B, a crui producere
nseamn prin definiie nerealizarea primului, B=CA.
Exemplu: evenimentul sigur i evenimentul imposibil sunt contrare.
Evenimentele A i B sunt compatibile dac se pot produce simultan, adic exist rezultate
care favorizeaz att pe A ct i pe B.
Evenimentele A i B se numesc incompatibile dac nu se pot produce simultan, adic nu
exist rezultate care favorizeaz att pe A ct i pe B.
Fiind date dou evenimente A i B, numim reuniunea lor A B , evenimentul a crui
producere const n producerea a cel puin unul dintre cele dou evenimente A i B.
Intersecia a dou evenimente A i B const n producerea simultan a evenimentelor A i B.
Spaiul de selecie al unei experiene este o mulime de elemente astfel nct orice eveniment
rezultat n urma unei experiene corespunde unui singur element al acestei mulimi.
Cmpul de evenimente este format din pri ale unei mulimi date .
Fie mulime dat i K o familie de pri (submulimi) ale lui . K se numete cmp
complet aditiv dac sunt verificate axiomele:
1. X K , CX K
2. X K , dac X K, I , I cel mult numrabil
I

(de exemplu I este o submulime a lui N).


Observaie. , K dac familia K este cmp complet aditiv.
Definiia probabilitii n axiomatic lui A.N. Kolmogorov (devenit clasic).
Fie funcia de mulime P : K R , cu proprietile:

5
Probabiliti i Statistic matematic (Draft)
i) X K P(X) 0 ,
ii) I mulime de indici cel mult numrabil, X K , pentru I i

X X , , I , P X P X ,
I I
iii) P 1 .
Tripletul , K, P se numete cmp de probabilitate complet aditiv.
Fie o experien i un eveniment A corespunztor acestei experiene. Dac se repet
experiena de n ori n condiii identice i evenimentul A se produce de ori, iar contrarul

sau de ( n ) ori, atunci numrul f n se numete frecvena relativ a evenimentului
n
A.
Probabilitatea ca frecven
Exemplul 1.
Un constructor vrea s achiziioneze echipamente de construcii, incluznd i buldozere
pentru un nou proiect. Din experiena proprie cu buldozere similare, el estimeaz c sunt
anse 50% ca fiecare buldozer s rmmn operaional dup 6 luni. Dac el ar cumpra 3
buldozere, care este probabilitatea ca numai un buldozer s fie operaional dup 6 luni n
acest proiect? [1]
Rezolvare
La sfritul celor 6 luni pot fi operaionale 0, 1, 2 sau 3 buldozere. Atunci 0, 1, 2, 3=
spaiul posibilitilor. Notm strile buldozerului cu O= operaional i N=neoperaional.
Dup 6 luni se pot nregistra situaiile: OOO, OON, ONO, NOO, ONN, NON, NNO, NNN.
Aadar, sunt posibile 8 situaii, deoarece ele sunt reciproc exclusive i sunt i egal probabile.
Numai n 3 situaii un singur buldozer va fi operaional dup 6 luni, deci numrul cazurilor
3
favorabile este 3. Atunci, probabilitatea cerut este p .
8
Exempul 2.
O inspecie pe o autastrad a descoperit c s dintre oricare N eantioane testate pot fi sub
standard. Dac m eantioane sunt alese aleator dintr-o mulime de N eantioane, care este
probabilitatea ca r dintre ele s fie sub standard? [1]
Rezolvare
a) Exist C Nm posibiliti de alegere a celor m eantioane dintre cele N. Numrul cazurilor

favorabile este Ckr C Nm sr , deoarece cazurile favorabile sunt acelea n care r teste sub

6
Probabiliti i Statistic matematic (Draft)
standard sunt gsite printre cele s, adic Csr i restul de (m-r) teste sunt corespunzatoare

dintre cele (N-s) teste, adic C Nm sr . Aadar, probabilitatea cerut este numrul cazurilor

Csr C Nm sr
favorabile supra numrul cazurilor posibile p
C Nk

b) Exist C Nm posibiliti de alegere a celor m eantioane dintre cele N. Numrul cazurilor


favorabile poate fi rezultatul a 2 operaii:
i. Numrul testelor sub standard poate fi rezultatul primei operaii: numrul
combinaiilor de r elemente dintre s, Csr ;
ii. A doua operaie este selectarea a (m-r) eantioane dintre cele m eantioane care nu
vor fi sub standard. Exist C Nm sr combinaii posibile printre cele care nu sunt sub
standard.
Atunci numrul cazurilor favorabile este produsul celor dou numere rezultate din cele dou
operaii Csr C Nm sr .

Exemplul 3.
Se construiete un baraj cruia i se d o nlime suficient pentru a suporta nivelul creterilor
apelor nregistrat n ultimii 75 de ani. Presupund c nu exist variaii de climat de-a lungul
perioadei avute n vedere, care este probabilitatea c barajul s fie corespunztor de-a lungul
urmtorilor 25 de ani de la data construirii lui?
Rezolvare
este mulimea celor 75+25=100 de ani luai n considerare. Anul cu cea mai mare
cretere a apelor poate fi considerat ca unul dintr-o mulime de ani echiprobabili. Barajul este
corespunztor dac anul luat n considerare este unul din cei 75. Probabilitatea cerut este
75
0.75 sau cu o probabilitate de 75% barajul va fi corespunztor pe urmtoarea
100
perioad de 75 de ani.
Probabilitatea ca raport de arii
Fie A R n , n 1, 2, 3 mulimi cu msur finit. Dac faptul c un punct M s se
gseasc n este un eveniment sigur, atunci probabilitatea ca punctul M s se afle i n

mulimea A este definit ca fiind PM A


mes( A)
. Aceast probabilitate se numete
mes()
probabilitate geometric.
Exemplul 4.

7
Probabiliti i Statistic matematic (Draft)
Daca w este ochiul (patrat) al unei site de srm cu diametrul D, care este probabilitatea ca
o particul sferic de diametru d s loveasc srm dac particula ar cdea perpendicular pe
planul sitei?
Rezolvare
Cazurile favorabile depind de poziia centrului sferei fa de careiaj. Proabilitatea ca sfera s
ating careiajul poate fi msurat prin probabilitatea ca centrul sferei s ating un ptrat cu
d
laturile paralele cu careiajul, dar la distana de srm. Situaiile posibile sunt date de aria
2
ptratului mare w D 2
, iar situaiile favorabile de aria ptratului mare minus aria

ptratului mic, w d 2
, adic w D 2
w d . Aadar, probabilitatea ca particula s
2

wd
2

loveasc careiajul este p 1 , iar proabilitatea de a trece prin ochiul plasei este
w D

wd
2

de pT .
w D

Observaie. P 0 .
Proprieti
a) P A B P A PB P A B
b) P A B P A P A B
c) P AB P A PB 2P A B , unde AB A B B A
Probabilitate condiionat. Fie , K, P un cmp de probabilitate complet aditiv i
A, B K . Se numete probabilitatea evenimentului A condiionat de evenimentul B i

P A B
se noteaz PB (A) sau PA B raportul: PB ( A) , dac P ( B ) 0 .
P( B)
Proprietate. , K, PB este un cmp de probabilitate complet aditiv dac P ( B ) 0 .
Evenimentele A i B sunt independente dac P A B P( A) P( B) .
Exemplul 5. [1]
Un eantion de pietri de la o carier de nisip este examinat pentru a determina dac agregatul
furnizat de carier este corespunztor pentru beton. Specificaiile cer ca s fie respins cariera
dac cel puin o particul necorespunztoare este descoperit printre 5 particule alese la
ntmplare din eantion. Care este probabilitatea ca s fie considerat acceptabil cariera dac
un specimen de 100 particule din eantion conin 5 particule necorespunztoare?
Rezolvare
8
Probabiliti i Statistic matematic (Draft)
Fie Ai evenimentul ca o particul corespunztoare a fost gsit n extragerea i.
Probabilitatea de acceptare este probabilitatea comun a tuturor extraciilor P A1 A2 ...A5 .

95
Probabilitatea ca s nu gsim nici o particul necorespunztoare este P ( A1 ) , deoarece
100
sunt 100 de particule dintre care 5 sunt necorespunztoare, iar 95 acceptabile. Dup prima
extragere mai rmn 99 particule dintre care 94 nu sunt necorespunztoare; aadar,

P A2 A1
94
. Continund raionamentul
99

P A3 A1 A2 , P A4 A1 A2 A3 , PA5 A1 A2 A3 4
93 92 91
.
98 97 96
Se obine probabilitatea cerut
95 94 93 92 91
P(acceptare)
100 99 98 97 96
Acelai rezultat se obinea dac fceam raportul cazurilor favorabile C 955 mprit la cazurile
5
posibile C100 .

Exemplul 6. [1]
Se studiaz capacitatea portant a fundaiei unei cldiri. Din experiena anterioar se impune
ca fundaia s aib capacitatea portant 4000 pfs (1 pound = 0.4536kg x 47.88 Newton/m2)
cu probabilitaatea de 95%. Dac sunt necesare 16 tlpi de fundare, care este probabilitatea
ca toate cele 16 tlpi de fundare s aib cel puin 4000 pfs capacitatea portant?
Invers, care este probabilitatea ca cel puin o talp de fundare s aib capacitatea portant mai
mic de 4000 pfs ?
Rezolvare. Sunt posibile 216 65536 situaii. Presupunnd c fiecare talp fundare are
probabilitatea 0.95 de a avea capacitatea portant mai mare ca 4000 pfs. Atunci,
considernd capacitile portante ale tlpilor de fundare independente statistic, probabilitatea
ca toate cele 16 tlpi de fundare s aib capacitatea portant cel puin 4000 pfs va fi
0.9516 0.44 .
Evenimentul ca mcar o talp de fundare s aib capacitatea portant mai mic dect 4000
pfs este contrar primului i atunci probabilitatea cerut este p 1 0.9516 0.56 .

Exemplul 7. [1]
Fundaia unei cldiri nalte poate s cedeze din cauza capacitii portante neadecvate sau
tasare excesiv. Fie B i S modelele de cedare ale fundaiei i presupunem c

9
Probabiliti i Statistic matematic (Draft)
P( B ) 0.001, P( S ) 0.008 , iar P( B S ) 0.10 care reprezint probabilitatea condiionat

a cedrii capacitii portante tiind c exist tasare excesiv. Care este probabilitatea de
cedare a fundaiei ? Care este probabilitatea tsrii excesive fr cedarea capacitii portante a
cldirii?
Rezolvare
Probabilitatea de cedare a fundaiei este
PB S P( B ) P( S ) P( B S ) P( B ) P( S ) PB S P( S )
0.001 0.008 0.1 0.008 0.008
Probabilitatea de tasare excesiv a cldirii fr cedarea capacitii portante este

P( S B ) P B S P( S ) 1 P( B S )P( S ) 1 0.1 0.008 0.0072

Comentariu: Probabilitatea PB S , deoarece avem:


1
8
P B S PB S
PB S , PS B , sau PB S P( S ) PS B P( B )
P( S ) P( B )
Atunci:

PB S
P( B ) 0.001 1
P( S B ) P( S B ) .
P( S ) 0.008 8

Probabilitate total. Fie , K, P un cmp de probabilitate complet aditiv i A1 , ... , An o

desfacere a lui , adic Ai Aj , pentru i j , i, j 1, 2,... , n i


n

A i
, iar
i 1

X K . Atunci: P( X ) P Ai PX Ai se numete formula probabilitii totale.


n

i 1

Exemplul 8. Se consider 6 blocuri de locuine care au apartamente astfel:


- 2 blocuri au cte 4 apartamente cu 4 camere i 2 garsoniere
- 3 blocuri au cte 8 apartamente cu 4 camere i 2 garsoniere
- 1 bloc are 2 apartamente cu 4 camere i 6 garsoniere
Se alege la ntmplare o unitate locativ pentru a testa piaa i se cere probabilitatea ca s fie
garsonier.
Rezolvare
Notm:
X evenimentul ca s fie aleas o garsonier.

10
Probabiliti i Statistic matematic (Draft)
A1 evenimentul ca garsonier s fie de la un din cele 2 blocuri cu 2 garsoniere i 2
apartamente cu 4 camere.
A2 evenimentul ca garsonier s fie de la una din cele 3 blocuri cu 8 garsoniere i 2
apartamente cu 4 camere.
A3 evenimentul ca garsonier s fie de la blocul cu 2 garsoniere i 6 apartamente cu 4
camere.
Atunci:
2 1 3 1 1
P( A1 ) ; P ( A2 ) ; P ( A3 ) ;
6 3 6 2 6

P X A1
2
(s-a ales o garsonier de la unul din primele 2 blocuri
6
2 garsoniere
)
6 apartamente cu 4 camere

P X A2 ; P X A3 .
2 6
10 8
Atunci:
P( X ) P( A1 ) P( X A1 ) P( A2 ) P( X A2 ) P( A3 ) P( X A3 )

1 1 1 1 1 3 121
.
3 3 2 5 6 4 360
Formula lui Bayes. Fie A1 , ... , An , evenimente care realizeaz o desfacere a spaiului total
i care reprezint cauzele producerii unui eveniment necunoscut X. Presupunem c se

cunosc probabilitile apriorice: P Ai , i 1, n i PA X , i 1, n .


i

n urma efecturii experienei se obine evenimentul X i trebuie determinate probabilitile:


PX Ai , i 1, n , numite probabiliti aposteriori. Formula lui Bayes precizeaz cum se
calculeaz aceste probabiliti:
P Ai PX Ai P Ai PX Ai
PAi X .
P A PX A
n
P( X )
k k
k 1

Exemplul 9.
n condiiile problemei precedente s se determine probabilitatea ca garsoniera s provin din
blocul cu 2 garsoniere i 6 apartamente cu 4 camere.
Rezolvare
Cu notaiile din problema precedent avem:

; P ( A2 ) ; P ( A3 ) ; P X A1 ; P X A2 ; P X A3 .
2 1 3 1 1 2 2 6
P( A1 )
6 3 6 2 6 6 10 8
11
Probabiliti i Statistic matematic (Draft)
Atunci formula lui Bayes d:
1 3
P A3 PX A3 6 4 45
PA3 X .
P X 121 121
360

12
Probabiliti i Statistic matematic (Draft)

2. Variabile aleatoare
O variabil a crei valoare este un numr determinat de evenimentul rezultat n urma unei
experiene este numit variabil aleatoare. Altfel spus, orice msur a unei mrimi ale crei
valori depind de hazard este o variabil aleatoare. Prin urmare, variabila aleatoare real este o
aplicaie X : R .
O variabil aleatoare poate s fie discret i atunci nu ia dect anumite valori, ca n exemplul
de mai jos, sau continu, putnd lua toate valorile posibile ntre nite limite date.
Funcia de repartiie. Se numete lege de probabilitate sau de repartiie sau de distribuie
a variabilei aleatoare X, funcia definita de x P X () x pentru x aparinnd
domeniului de definiie. Legea de probabilitate a unei variabile aleatoare se poate pune sub
forma unei formule matematice P X () x p( x) . n cazul discret o numim funcia de
frecven.
Dac X este o variabil aleatoare discret care poate s ia valorile x1 , x2 ,..., xn cu

probabilitile p1 , p2 ,..., pn , atunci mulimea ale crei elemente sunt perechile ordonate

( x1 , p1 ) , ( x2 , p2 ) ,..., ( xn , pn ) definete repartiia variabilei aleatoare X i se noteaz

x x2 xn
X : 1 ,
p1 p2 pn

notaie numit tabloul de repartiie al variabilei aleatoare X.

Exemplul 1.
Un bloc de locuine dintr-un cartier rezidenial poate avea 0, 1, 2, 3 sau 4 etaje. Numrul de
etaje este o variabil aleatoare care poate lua valorile conform cu tabelul urmtor
Numr de etaje 0 1 2 3 4
1 3 1 1 1
Probabilitatea asociat
4 8 8 8 8
i al crei tablou de repartiie este:
0 1 2 3 4
X :1 3 1 1 1 .

4 8 8 8 8

Exemplul 2.
Pe 1, 2, 3, 4, 5 s se determine legea de probabilitate P, astfel nct

13
Probabiliti i Statistic matematic (Draft)
P1, 2, 3 P4, 5 ; P1, 2 P2, 3 ; P2 P5 ; P1, 3 P4, 5 .
Rezolvare
Notm pi P
i ; se obine sistemul

p1 p2 p3 p4 p5 1
p1 p2 p3 p4 p5

p1 p2 p2 p3
p2 p5

p1 p3 p4 p 5

1 1 1
a crui soluie este legea de probabilitate cerut: p1 , p2 0 , p3 , p4 , p5 0 .
4 4 2
Funcia de repartiie empiric
n cazul n care se cunosc valorile de msurtoare, X 1 , X 2 , ... , X n , asupra unei variabile
aleatoare, X, funcia de repartiie empiric a acestei variabile aleatoare se definete ca
numarul valorilor X i x
fiind dat de Fn x .
n

Exemplul 3. Funcie de repartiie pentru variabila aleatoare din Exemplul 1 este:


0 daca x 0
1
daca x 0,1
4
5 daca x 1, 2

F ( x) 8
daca x 2, 3
3

4
7 daca x 3, 4
8
1 daca x 4

Deci, dac X este o variabila aleatoare discret, F ( x) P( X x ) .
xi x
i

14
Probabiliti i Statistic matematic (Draft)

F(x)

1
7
8
3
4
5
8 reprezint
1
4

0 1 2 3 4 x

Se numete funcie de repartiie sau de distribuie sau cumulativ a unei variabile aleatoare X,
funcia definit prin F : R 0, 1 , F ( x) P X () x .

Proprieti ale funciei de repartiie:


1) Px1 X x2 F x2 F x1
2) Px1 X x2 F x2 F x1 P X x1
3) Px1 X x2 F x2 F x1 P X x1 P X x2
4) Px1 X x2 F x2 F x1 P X x2
5) F x1 F x2 , x1 x2 , (F este cresctoare)
6) xlim F ( x) 0 , lim F ( x) 1 , 0 F ( x) , F este nedescresctoare
x

7) lim F ( x) F x0 este continu la stnga.


x x 0
x x0

Exemplul 4. Revenim la problema din Exemplul 1 din capitolul precedent i anume


Un constructor vrea s achiziioneze echipamente de construcii, incluznd i buldozere
pentru un nou proiect. Din experiena proprie cu buldozere similare, el estimeaz c sunt

15
Probabiliti i Statistic matematic (Draft)
anse 50% ca fiecare buldozer s rmmn operaional dup 6 luni. Dac el ar cumpra 3
buldozere, care este probabilitatea ca numai un buldozer s fie operaional dup 6 luni n
acest proiect ?
Rezolvare
Fie X variabila aleatoare care ia ca valori numarul de buldozere care mai sunt operaionale
dup 6 luni. Tabloul de variaie al acestei variabile aleatoare discrete este:
0 x0
1
8 0 x 1
0 1 2 3 1
X : 1 3 3 1 , iar funcia de repartiie empiric este F ( x ) 1 x 2
2
8 8 8 8
7 2 x 3
8
1 x3

1 4 3
P X 1 P 1 X P X 2 1 F (1) F (2) 1 .
8 8 8

Densitatea de repartiie. Dac exist o funcie nenegativ ( y) astfel nct


x

F ( x) ( y )dy pentru orice x, atunci funcia se numete densitate de repartiie sau


densitate de probabilitate.
Dac F admite o densitate de probabilitate, atunci
F ( x x) F ( x) P( x X x x)
( x) F ( x) lim lim
x0
x x0
x
Proprieti ale densitii de probabilitate:
1) ( x) 0 , x R
x2

2) pentru x1 , x2 P x1 X x ( x)dx
x1

3) ( x)dx 1 .

Exemplul 5. S presupunem c densitatea de repartiie este dat de ( x) Ae x , definit


pentru x>0 i 0. Ct este A n acest caz ? Care este funcia de repartiie
corespunztoare?
Din proprietatea 3) avem

16
Probabiliti i Statistic matematic (Draft)

1
( x)dx 1 A e dx 1 A 1 A ( x) e x .
x
e x
0
x x
x
F ( x) ( y )dy e y dy e y 1 e x
0
pentru x>0. Atunci
0 pentru x 0
F ( x)
1 e pentru x 0
x

Exemplul 6. S se determine a R astfel nct


0 daca x 0

F ( x ) a x 2 daca 0 x 1
1 daca x 1

s fie funcie de repartiie i n acest caz s i se determine densitatea de probabilitate
corespunztoare.
F(x) trebuie s fie continu, deoarece F ( x) ( x) . Pe de alta parte a 12 1 i astfel
a 1.
Atunci funcia de repartiie i ensitatea de probabilitate n acest caz sunt
0 daca x 0 0 daca x 0

F ( x) x 2 daca 0 x 1 , ( x) 2 x daca 0 x 1
1 daca x 1 0 daca x 1

Graficele celor dou funcii:

F(x) (x)

1
2

0 1 x 0 1 x

Funcia de repartiie Densitatea de repartiie

17
Probabiliti i Statistic matematic (Draft)

3. Cteva repartiii clasice

3.1. Repartiii discrete

3.1.1 Repartiia uniform


se mai numete i repartiia evenimentelor echiprobabile i are tabloul de distribuie
x1 x2 xn
X : 1 1 1

n n n
3.1.2. Repartiia binomial
are tabloul de repartiie

0 1 2 n
x
X : x x n x
Cn p q n n(n 1) 2 n2 n
q n p q n1 p q p
2
i tinde la repartiia normal pentru n tinznd la infinit. Aa cum am artat mai nainte
M X n p , DX n p q , q 1 p.

3.1.3. Repartiia geometric


are tabloul de repartiie
0 1 2 n
X : , p q 1
p pq pq 2
p q n

M X , DX n p q .
q
p

3.1.4. Repartiia Poisson


este repartiia evenimentelor rare, de exemplu sosiri la un sistem de ateptare pe unitatea de
timp. Se poate demonstra c intervalele de timp dintre dou sosiri consecutive constitue o
variabil aleatoare de tip exponenial de parametru .
Tabloul de variaie este

0 1 2 n i

X : sau X : i 0,1, 2, ...
0 1 2 n i
e e e e e
0! 1! 2! n! i!

18
Probabiliti i Statistic matematic (Draft)
Media i disperia variabilei aleatoare de tip Poisson sunt M X , DX .

3.2. Repartiii continue

3.2.1. Repartiia uniform

Variabila aleatoare X este repartizat uniform pe intervalul a, b R i se noteaz

X ~ U a, b dac are densitatea de repartiie dat de

1
x a, b
( x) b a
0 in rest

ab
Pentru acesat variabila aleatoare media este M X i dispersia D X b a .
1 2

2 12

3.2.2. Repartiia normal


Variabila aleatoare este repartizat N ( , ) dac are densitatea de repartiie
1 x
2

x R , M X , D X
1
( x) e 2

2
i funcia de repartiie
x t 2
1
F ( x)
2
e

2 2
dt .

x t2
1
Dac X ~ N (0,1) , funcia de repartiie ( x) e 2
dt este tabelat n cri de
2

statistic. Dac X ~ N (0,1) i Z X atunci Z ~ N ( , ) i invers, dac


Z
Z ~ N ( , ) atunci X ~ N 0,1 , numit i variabila redus.

3.2.3. Repartiia lognormal


Variabila aleatoare X este repartizat lognormal dac Y = lnX este o variabil aleatoare
normal. Densitatea de repartiie a variabilei aleatoare X este
2
1 ln x Y

1
( x) e 2 Y

x Y 2

unde Y M Y , Y2 DY .
Legatura cu normala este dat de relaiile:


Y2
Y
M[X ] e X , Var[ X ] M [ X ] e Y 1 D[ X ] .
2 2
2

19
Probabiliti i Statistic matematic (Draft)
3.2.4. Repartiia exponenial de parametru

Variabila aleaoare X este repartizat exponenial de parametru , notat X ~ Exp( ) ,


dac are densitatea de repartiie dat de
e x x 0, 0
( x)
0 x0
iar funcia de repartiie
0 x0
F ( x) x
.
1 e x 0, 0

Media variabilei aleatoare este M X , iar dispersia DX


1 1
.
2
Pentru 1 variabila aleatoare este numit variabila aleatoare exponenial standard.

3.2.5. Repartiia gamma


O variabil aleatoare care are densitatea de repartiie dat de relaia
x 1e x
x 0 , 0, 0
( x) ( )

0 x0

se spune c este repartizat gamma de parametri ( , ) , unde ( ) x 1e x dx este


0


funcia lui Euler de spea a dou. Media acestei variabile aleatoare este M X , iar


dispersia DX .

3.2.6. Repartiia beta


Variabila aleatoare a crei densitate de repartiia este dat de
1
x a 1 (1 x)b 1 0 x 1 1
( x ) B ( a, b )

0 in rest

1
Daca Y , atunci Y ( 1 X ) X
20
Probabiliti i Statistic matematic (Draft)
(a) (b)
este repartizat beta de parametri (a, b), unde B(a, b) este funcia lui Euler de
( a b)

M X
a
spea nti. Pentru aceast variabil aleatoare media este , iar dispersia
ab
a b
D X .
a b a b 1
2

3.2.7. Repartiia 2

Repartiia 2 cu grade de libertate are densitatea de repartiie



1 1
x

x 2
e 2
0 x
( x) 2 2
2
0 in rest

Media unei variabile aleatoare repartizat 2 este M X , iar dispersia DX 2 .

Proprietate. Dac N * , atunci variabila aleatoare X, de tip 2 poate fi obinut ca o


sum de ptrate de variabile aleatoare normale standard,

X ~ 2 , X Z i2 , Z i ~ N (0,1) .
i 1

3.2.8. Repartiia Student


Spunem c vatiabila aleatoare t este repartizat Student cu grade de libertate dac
densitatea de repartiie
1

2
1 , x R
1 1
( x)

x 2
2

1

2


Media acestei variabile aleatoare este M t 0 , iar dispersia este Dt .
2
Proprietate. Variabila aleatoare Student cu grade de libertate se poate obine cu ajutorul
unei variabile aleatoare normale standard i al unei variabile aleatoare 2 , conform cu

, Z ~ N ( 0,1 ) si 2 variabila 2 cu grade de libertate .


Z
relaia t
2

21
Probabiliti i Statistic matematic (Draft)
3.2.9. Repartiia Fisher-Snedecor

O variabil aleatoare F 1 , 2 este repartizat Fisher Snedecor cu 1 , 2 grade de libertate

dac are densitatea de repartiie

1 1 2
1 2 1
2 2 x 2 1 1 1
, x 0 .
2
( x) 1 x
2
1 2 2

2 2
Aceast repartiie este important prin aplicaiile care le are testul F bazat pe aceast
repartiie.
Proprietate. Legtura variabilei aleatoare F 1 , 2 Fisher-Snedecor cu 1 , 2 grade de

libertate cu variabilele aleatoare 21 i 22 este dat de relaia

2
2

F 1 , 2 . 1

1 2 2

Observaie: Repartiiile 2 , Student i Fisher-Snedecor sunt foarte utile pentru c pe baza lor
se construiesc testele statistice: 2 , t i F.

3.2.10. Repartiii de tip Gumbel


n statistica extremelor intervin variabile aleatoare ale cror funcii de repartiie au fost
studiate de Gumbel.
Repartiia valorilor maxime
de tip Gumbel sau dublu exponenial

, x R , , u 0
( x u )
F ( x; , u) e e
- de tip Frechet
k
v

F ( x; v, k ) e x
, x 0 , v , k 0
Repartiia valorilor minime
- de tip Weibull
k
x

F ( x; v, k ) e v
, x 0 , v 0 , k 0 .
Cu schimbarile de variabile:
y ( x u ) repartiia Gumbel devine F ( y ) e e
y

, repartiia dublu exponenial


standard,

22
Probabiliti i Statistic matematic (Draft)
x
y k ln repartiia Frechet devine F ( y ) e e , repartiia dublu exponenial
y

v
standard,
v
y k ln repartiia Weibull devine F ( y ) e e , repartiia dublu exponenial
y

x
standard, fapt ce permite tratarea unitar a repartiiilor valorilor extreme.

23
Probabiliti i Statistic matematic (Draft)

4. Caracteristici ale variabilei aleatoare


n prezena unor mulimi de numere, acestea reprezentnd valorile argumentului unei
variabile aleatoare n coresponden cu probabilitile respective, se pune problema de a
sintetiza aceste mulimi de numere prin cteva date numerice de dorit ar fi printr-un singur
numr care s aib proprietatea de a reprezenta ct mai fidel variabila aleatoare considerat.
O astfel de reducere a mai multor date numerice la ct mai puine numere, devine absolut
necesar, mai ales atunci cnd se urmrete compararea ntre ele a diferite fenomene sau
proprieti genernd variabile aleatoare.
Fixarea caracteristicilor numerice legate de o variabil aleatoare reprezint un mare grad de
arbitrar, ceea ce nseamn c astfel de valori pot fi diferite, fr a se putea preciza ntotdeauna
care dintre ele este cea mai convenabil de ales. Problema practic ne conduce de regul spre
caracteristica de ales. Anumite condiii generale impuse de logic i de caracterul tiinific
trebuie ndeplinite de orice valoare caracteristic.
Cteva dintre aceste condiii ar trebui s fie:
- valoarea caracteristic s fie definit n mod obiectiv,
- s aib o semnificaie concret legat de variabila aleatoare respectiv,
- s fie puin sensibil la fluctuaiile de eantionare de volum apropiate,
- valoarea respectiv s fie uor de calculat,
- s se preteze la calcule algebrice.
Aceste caracteristici pot fi grupate dup nota dominant pe care o pun n eviden astfel:
- tendina central de grupare
- mprtierea distribuiei,
- forma graficului de distribuie.

4.1. Tendina central de grupare

4.1.1. Valoarea medie


Valoarea medie a unei variabile aleatoare X este dat de:
.
Proprieti
1) M aX b aM X b
2) M X Y M X M Y
3) M X Y M X M Y dac X i Y sunt independente.

24
Probabiliti i Statistic matematic (Draft)
Exemplul 1. Variabila aleatoare geometric
Se numete prob Bernoulli sau experien Bernoulli o experien n care sunt posibile
numai 2 tipuri de rezultate numite succese (A) cu probabilitatea P(A)=p, i eecuri (B), cu
probabilitatea q P( B) 1 p .
ntr-un ir de probe Bernoulli, notm cu X variabila aleatoare care reprezint numrul de
eecuri nregistrate pn la apariia primului succes. X se numete variabil aleatoare
geometric. Aceast variabil poate caracteriza, de exemplu, numrul pieselor
corespunztoare gsite ca urmare a controlrii unei mulimi de piese pn la apariia primului
rebut, numrul nou-nscuilor biei la o maternitate pn la apariia unei feite etc.
Funcia de frecven pentru variabila aleatoare X este
f ( x) P X x p q x , x 0, 1, 2, ... ,
iar funcia sa de repartiie este
x 1
F x P X x p q i 1 q x
i 0

(fiind suma unei progresii geometrice, de unde i numele repartiiei).


Valoarea medie a variabilei aleatoare X este

M X i f (i) i p q i p i q i .
i 0 i 0 i 0


1 1 1
Dar qi
i 0

1 q p
i derivnd aceast relaie avem i q
i 0
i 1

1 q 2
. nmulind


. Aadar M X p 2 .
q q q q
aceast relaie cu q se obine i q
i 0
i
2
1 q p 2
p p

Exemplul 2. Variabila aleatoare exponenial negativ, Exp( ) , 0 , are densitatea de


probabilitate
e x x0
( x) .
0 x0

Cum am artat ntr-un exemplu anterior, funcia sa de repartiie este


0 x0
F ( x) .
1 e x0
x

Valoarea medie a variabilei aleatoare Exp( ) , 0 este



e x 1
M X x ( x)dx x e x dx x e x dx x e x e x dx
0 0 0 0 0
Aadar
25
Probabiliti i Statistic matematic (Draft)
M X
1
.

4.1.2. Valoarea median


Valoarea median a variabilei aleatoare X este numrul Me care satisface ecuaia:
P X M e P X M e
adic, acea valoare pentru care variabila are aceeai probabilitate de a fi mai mic sau mai
mare ca ea.
n termeni de funcie de repartiie, relaia de mai sus se poate scrie:
F M e 1 F M e sau 2 F M e 1

1
De aici rezult c mediana este soluia ecuaiei F ( x) .
2

Exemplul 3. S se determine mediana variabilei aleatoare continue:


x
X : 1 0 x3
2 x 1
12
Me

12 2 x 1dx 12 M M e 1 3 , M e 2 2 ,
1 1 1
2
e Me
0
2

dar cum 3 0, 3 , rezult c soluia este M e 2 .

4.1.3. Modul
Modul sau valoarea cea mai probabil a variabilei aleatoare X este acea valoare pentru care
funcia de probabilitate, f(x), respectiv, densitatea de probabilitate (x) este maxim.

Exemplul 4. Variabila aleatoare binomial


Dac ntr-un ir de n probe Bernoulli notm cu X variabila care reprezint numrul de
succese, atunci X se numete variabil binomial de parametri (n, p), notat Bi ( p, q ) .
Funcia sa de frecven este
f ( x) Cnx p x qn x , x 0, 1, 2, ..., n .
Tabloul de repartiie pentru aceast variabil aleatoare este

0 1 2 n
x
X : x x n x .
Cn p q n n(n 1) 2 n2
q n p q n1 p q p n
2
26
Probabiliti i Statistic matematic (Draft)
Repartiia binomial are aplicaii practice, n special n controlul statistic al calitii, unde X
reprezint numrul de piese corespunztoare n n probe (aici p este probabilitatea ca
extrgnd la ntmplare o pies dintr-un lot de volum n - mare, aceasta s fie
corespunztoare), sau X reprezint numrul copiilor dintr-o gradini care sunt infectai cu
virus la un anumit moment etc.

Exemplul 5. tiind c un student de la specializarea Inginerie geotehnic ar opta cu


probabilitatea 0.1 s urmeze disciplina opional D, care este numrul minim de studeni
astfel ca s existe 5 dintre acetia cu probabilitatea 0.98 care s opteze pentru disciplina
optionala D?
Rezolvare
Fie n numrul de studeni cutat. Acest numr n este o variabil aleatoare repartizat
9
binomial Bi n, . Avem Pn 5 0.98 sau Pn 4 0.02 . Rescriem ultima
10
inegalitate astfel
i ni
4
91

i 0
C
i
n
10 10
0.02 1 9 Cn1 81 Cn2 729 Cn3 6561 Cn4 2 10n2 .

Problema revine la a gsi cel mai mic numr n pentru care inegalitatea de mai sus este
satisfacut. Ultimul termen al sumei de mai sus 6561Cn4 2 10n2 implic n 4 . Se
constat c pentru n=8 inegalitatea este satisfcut i numrul minim cutat este 8.

Exemplul 6. S se determine modul variabilei aleatoare binomiale.


Fie x N astfel nct f(x) este maxim i atunci avem:
f ( x 1) f ( x) , f ( x) f ( x 1) .
nlocuind obinem:
f ( x) n x 1 p
f ( x 1) x q
1
x n p p
f ( x 1) n x p
1 x n p q
f ( x) x 1 q

adic Mo modulul pentru repartiia binomial satisface dubla inegalitate:


n p q Mo n p p .

Se iau inegalitile i cu egalitate, deoarece lungimea intervalului n p q, n p p este 1


i deci Mo este unul din capetele intervalului.

27
Probabiliti i Statistic matematic (Draft)
Generalizare. Cuantilele de ordin n
i
Noiunea de median se poate generaliza considernd ecuaia F ( x) , i 1, 2, ..., n 1 .
n
Rdcinile acestor ecuaii se numesc cuantile de ordin n. Pentru n = 2 se obine mediana,
pentru n = 4 sunt 3 ecuaii i deci 3 rdcini i ele se mai numesc i quartile.
Cuantilele de ordin 10 se numesc decile, cele de ordin 100 centile.

n tabelele statistice se gsesc listate pentru principalele tipuri de repartiii -cuantilele.


Aceste -cuantilele pot fi obinute i cu ajutorul unor funcii implementate n diferite pachete
de programe. De exemplu, n MathCAD, funcia qnorm( , , ) returneaz -cuantila

repartiiei normale N ( , ) . Acelai rezultat l returneaz i funcia NORMINV(,,)


din Excel. n MathCAD funciile qlnorm( , , ) , qexp( , ) , qchisq( , ) , qpois( , )
returneaz -cuantilele repartiiilor lognormal, exponenial, 2 cu grade de libertate i
respectiv Poisson. n Excel functiile LOGINV(,,), CHIINV(,) returneaz -cuantilele
repartiiilor lognormal i 2 cu grade de libertate.

4.1.4. Momente i medii de ordin superior


Se numete momentul de ordin r al variabilei aleatoare X, expresia:

M r X xir f ( xi ) cazul variabilei aleatoare X discrete,


n

i 1

M r X x r ( x)dx cazul variabilei aleatoare X continu.


Se numete moment absolut de ordin r al unei variabile aleatoare X valoarea medie a


r
variabilei X , unde X este variabila care ia valoarea xi atunci cnd X ia valoarea xi.

x x ( x)dx .
n
r r r r
M X i
f ( xi ) , respectiv M X
i 1

Se numete valoare medie de ordin r a variabilei aleatoare X, expresia:


n

r r
x
i 1
i
r
f ( xi ) , respectiv r r
x ( x)dx
r

atunci cnd radicalii au sens.

Exemplul 7. S se calculeze momentul i media de ordinul doi al variabilei aleatoare


binomiale X.

28
Probabiliti i Statistic matematic (Draft)
n
Conform definiiei avem: M 2 x 2Cnx p x q n x . Folosim identitatea
x 0

p t q
n
Cnx p x q n xt x
n

x 0

pe care o derivm de dou ori n raport cu t. Obinem:

n p t q p xCnx p x q n xt x1 nn 1 p t q p 2 xx 1Cnx p x q n xt x2
n n
n1 n2

x 0 x 0

Pentru t = 1 avem:

nn 1 p 2 x 2Cnx p x q n x xCnx p x q n x
n n

x 0 x 0

sau
nn 1 p 2 M 2 M1 .
Dar M1 n p (a fost calculat anterior) i astfel

M 2 n(n 1) p2 n p n pn p p 1 n p(n p q) .
Deci:
M 2 n p(n p q) si 2 n p(n p q) .
Observaii
1. Dac i sunt valoarea minim, respectiv valoarea maxim ale argumentului

variabilei aleatoare X, pozitiv, atunci are loc relaia r .


2. Mediile r sunt ordonate n acelai sens cu valorile ordinului r, adic, dac i
sunt dou valori ale lui r, astfel nct , atunci . Proprietatea rmne

valabil i pentru momente M M .

4.2. mprtierea distribuiei variabilei aleatoare. Dispersia


Caracteristicele numerice ale tendinei centrale de grupare nu dau nici o indicaie asupra
mprtierii, respectiv concentraiei valorilor variabilei, adic n ce msur diversele date se
abat ntre ele i n ce msura se abat de la poziia centrului de grupare.
De exemplu, dac avem X i Y dou variabile aleatoare simetrice ale cror distribuii sunt
date de graficele:

29
Probabiliti i Statistic matematic (Draft)

0.2
Y
Y
0.15

( x 3 2)

( x 3 4) 0.1

0.05
X

0
10 5 0 5 10 15
x

se observ c au acelai centru de grupare, dei distribuiile lor sunt puternic diferite,
variabila aleatoare X avnd valorile mai mprtiate dect variabila aleatoare Y.
Apar astfel necesare caracteristici numerice care s permit s se compare ntre ele
mprtierea, respectiv concentrarea distribuiilor pentru diferite variabile aleatoare.
Printre acestea se folosesc:
extinderea sau intervalul de variaie,
abaterea absolut medie,
dispersia,
abaterea medie patratic,
coeficientul de variaie,
coeficientul de oblicitate etc.

4.2.1. Intervalul de variaie


Intervalul de variaie (numit i amplitudinea sau extinderea) variabilei aleatoare X se
definete ca fiind w xmax xmin .
Acestei caracteristici i se pot reproa urmtoarele:
nu depinde de toate valorile variabilei X, ci numai cele extreme,
nu arat modul de repartizare n jurul centrului de grupare,
nu se poate folosi pentru variabile cu valori nemrginite.

30
Probabiliti i Statistic matematic (Draft)
4.2.2. Abaterea. Abaterea absolut medie
Se numete abatere a variabilei aleatoare X o nou variabila aleatoare al crei argument
este dat de diferen dintre argumentul lui X i , adic:
x x
: i sau : i .
pi f ( xi ) ( x)
De obicei ca valoare pentru se ia M X (valoarea medie) sau M e X (mediana).

Proprietate
M M X M X 0 .
n

Abaterea absolut medie se definete ca fiind xi m f ( xi ) sau


i 1
x m ( x)dx , unde

m M X .

4.2.3. Dispersia. Abaterea medie patratic


Se numete dispersia lui X valoarea medie

M X M X X2 DX .
2

Avem

DX xi m f ( xi ) sau DX x m ( x)dx .
n
2 2

i 1

Abaterea medie patratic se definete ca fiind X DX .


Dispersia se mai numete i variana (notat i Var[X]).
Proprieti
1. Fie X, Y dou variabile aleatoare independente. Atunci:
DX Y DX DY .
2. Dac c este o constant Dc 0 .
3. Fie X o variabil aleatoare i c o constant. Atunci:
DX c DX , Dc X c 2 DX .
Observaie
Aceast translaie este important atunci cnd variabila aleatoare ia valori negative i n
analiza care se ntreprinde, datele trebuie s fie pozitive.
4. Fie X 1 , X 2 , ..., X n , n variabile aleatoare independente i identic repartizate (i.i.d.) avnd
n

X n X D X i d
M X i m i DX i d , X . Atunci DX D i
i
i 1
.
n i1 n n n

31
Probabiliti i Statistic matematic (Draft)

Exemplul 8. Calculul dispersiei variabilei aleatoare exponenial negativ


Fie
X ~ ( x) e x , 0 , x 0 ,


DX M X M X M X 2 2 X M X M X
2 2


M X 2 2M X M X M X M X 2 M X
2
2

Dar


M X 2 x 2 ( x)dx x 2 e x dx x 2 e x dx
0 0 0

x 2e x 2 x e x dx x e x dx
2
0 0 0
2 x x 2 x 2 2
xe e dx e dx 2 e x 2
0 0 0 0

Aadar

DX
2 1 1 1
X .
2
2

2

4.2.4. Momente centrate i medii centrate


Se numete moment centrat de ordin r pentru variabila aleatoare X, valoarea
n
mr xi M X r f ( xi ) sau mr x M X
r
( x)dx .
i 1

Se numete medie centrat de ordin r pentru variabila aleatoare X, valoarea r r mr .

4.2.5. Covariana. Coeficientul de corelaie


Fiind date variabilele aleatoare X i Y, se numete covariaa lor i se noteaz cu
cov( X , Y ) valoarea M X M X Y M Y cov( X ,Y ) .
cov( X , Y )
Coeficientul de corelaie se definete ca fiind r .
X Y
Observaii
1. Dac X i Y sunt variabile aleatoare independente atunci cov( X , Y ) 0 ,
2. 1 r 1 ,
3. DX Y DX DY 2 cov( X ,Y ) .

32
Probabiliti i Statistic matematic (Draft)
4.2.6. Coeficientul de mprtiere (coeficientul de variaie)
n cazul variabilelor aleatoare ce exprim mrimi diferite, dimensiunile nefiind aceleai
(lungimi, greuti, valori) influena naturii variabilelor studiate asupra msurii mprtierii se
nltur folosind coeficientul de mprtiere sau coeficientul de variaie (V sau CV):

D X X
V ,
M X M X
definit pentru cazurile cnd M X 0 .

4.3. Caracteristici ale formei distribuiei

4.3.1. Simetrie i asimetrie

Distribuia unei variabile aleatoare X este simetric fa de valoarea medie M X , dac

x M X x M X x R .
n caz contrar se spune c distribuia este asimetric.

Exemplul 9. Repartiia normal standard N (0,1) are densitatea de repartiie


x2

( x) e 2
x R
i este simetric.

Repartitie simetrica

0.4

0.3

( x)
0.2

0.1

3 2 1 0 1 2 3
x

Exemplul 10. Repartiia normal (Laplace, Gauss, Moivre) N ( , ) are densitatea de


repartiie
33
Probabiliti i Statistic matematic (Draft)
1 x
2

x R , M X , DX
1
( x) e 2

2
i este simetric.

Repartitie simetrica

0.2

0.15

( x 3 2)

0.1

0.05

2 0 2 4 6 8
x

Exemplul 11. Repartiia 2 (hi patrat cu grade de libertate), are densitatea de repartiie
x
1
( x)
1
x 2
e 2
x 0 , N * .

2 2
2
Pentru 4 , aceast repartiie are graficul din figura (repartiia este asimetric).

Repartitie asimetrica

0.2

0.15

( x 4)

0.1

0.05

0 2 4 6 8 10 12 14
x

34
Probabiliti i Statistic matematic (Draft)
Aceast variabil aleatoare este important prin aplicaiille pe care le are testul 2 n

verificarea tipului funciei de repartiie (test de concordan).


Coeficientul care msoar asimetria, notat , este astfel definit nct pentru distribuia
simetric 0, iar pentru cea asimetric 0 . Msoar asimetria urmtorii
coeficieni:
M X M o X
- Coeficientul de asimetrie al lui Pearson: 1 .
DX
- Coeficientul de asimetrie al lui Fisher (oblicitatea sau skewness):
n
xi M X f ( xi )
3

i 1

caz discret
DX
3


2 .

x M X ( x)dx
3



caz continuu

3
D X

4.3.2. Boltirea (Turtirea) curbelor de distribuie (Kurtosis)


Boltirea curbei de distribuie a unei variabile aleatoare se msoar cu coeficientul de boltire
m4
al lui Fisher, definit astfel: .
4
Boltirea se compar de obicei cu cea a normalei pentru care este =3.
Excesul distribuiei se definete ca fiind E 3 .
Dac E 0 3 distribuia se numete leptocurtic.
Dac E 0 3 distribuia se numete platicurtic.

4.4. Simularea numeric a unor variabile aleatoare


n situaia n care datele de msurori nu sunt n numr suficient de mare, ns am reuit s
stabilim legea de probabilitate, se pot obine realizri ale acelei variabile aleatoare cu ajutorul
unor algoritmi cunoscui sub numele de generatoare de numere (cvasi)aleatoare. D. E.
Knuth n Art of Programming, vol. 3 Seminumerical algorithms, prezinta fundamentele
teoretice ale unor generatoare bune de numere aleatoare, n sensul condiiilor pe care trebuie
s le ndeplineasc un generator pentru avea:
- perioada mare,
- dependen slab ntre numerele generate,
- independen statistic.

35
Probabiliti i Statistic matematic (Draft)
Avnd n vedere c numerele generate nu pot fi practic complet aleatoare fiind obinute cu un
algoritm, aceste numere mai sunt cunoscute i sub numele de cvasialeatoare sau
pseudoaleatoare. O clas de generatoare de numere aleatoare uniform repartizate pe o
submulime a numerelor naturale o constituie generatoarele mixte congrueniale liniare, care
au la baz relaia
X n1 a X n c mod M , n 0
unde: a multiplicatorul, c translaia i M factorul modulo, X0 smna sunt
numere naturale care trebuie s ndeplineasc anumite condiii pentru a respecta cerinele
unui bun generator de numere aleatoare (conform D. E. Knuth). Cu acest generator se pot
obine numere aleatoare uniforme ntre 0 i (M-1). Pentru a avea numere uniform
repartizate ntre 0 i 1 este suficient s se mpart numerele obinute cu acest generator
la numrul M.
De regul, generatorul liniar mixt congruenial se noteaz astfel X 0 , a, c, M . Exemplu

de generatoare liniare mixt congrueniale:, X 0 ,16807 , 0, 231 1 .


Majoritatea limbajelor de programare i a pachetelor de programe specializate au
ncorporate generatoare de numere aleatoare uniforme. De exemplu, n MathCAD exist
funcia rnd(), n C++ rand, iar n Matlab funcia rand produce numere aleatoare avnd
perioada 21492.
Este important s existe un bun generator de numere aleatoare uniforme, deoarece
pornind de la numerele aleatoare uniforme se pot obine numere aleatoare repartizate
dup alte legi de probabilitate.
O metod simpl de a obine numere aleatoare ca fiind realizri ale unei variabile
aleatoare neuniforme care are funcia de repartiie inversabil este metoda invers care are
la baz urmtoarea lem.
Lema Smirnov-Hincin. Fie X ~ F ( x) , o variabil aleatoare a crei funcie de
repartiie este inversabil i U ~ U (0, 1) , un numr aleator uniform repartizat pe

intervalu l (0, 1). Atunci Y F 1 (U ) ~ F ( x) este o realizare a variabilei aleatoare X.

Demonstraie. PF 1 (U ) x PF F 1 (U ) F ( x) PU F ( x) F ( x) .

4.4.1. Simularea numeric a variabilei aleatoare Exp() folosind metoda invers


Fie X ~ Exp( ) , o variabil aleatoare repartizat Exp(), i U ~ U (0, 1) , o
variabil aleatoare uniform repartizat pe intervalul (0, 1). Atunci:

36
Probabiliti i Statistic matematic (Draft)
1
1 e X U e X 1 U X ln(1 U ) X ln(1 U ) .

4.4.2. Simularea numeric a variabilei aleatoare dublu exponenial folosind metoda
invers
n paragraful 3.2.10. au fost prezentate variabile aleatoare de tip Gumbel i cum acestea
pot fi reduse la variabila aleatoare dublu exponenial. Aadar, dac se poate simula cu
calculatorul variabila aleatoare dublu exponenial, atunci folosind transformrile din
3.2.10. se pot obine variabile aleatoare de tip Gumbel.

U e X ln(U ) X ln ln(U ) X ln ln(U ) .


X
e e

4.5. Legea slab a numerelor mari


Pentru orice variabil aleatoare are loc inegalitatea:
DX DX
P X M X 1 sau P X M X , 0 .
2
2
cunoscut sub numele de inegalitatea lui Cebev.
Activitatea practic impune uneori cunoaterea condiiilor n care aciunea mai multor factori
ntmplatori conduce la un rezultat care s ne permit s prevedem evoluia unui anumit
fenomen.
Dei despre fiecare variabil aleatoare nu se poate ti dinainte ce valoare va lua ntr-o
experien, totui media aritmetic a unui numr suficient de mare de variabile aleatoare n
condiii destul de puin restrictive i pierde caracterul ntmplator. Astfel de condiii se dau
n teoreme cunoscute sub numele generic de legea numerelor mari.
Teorema lui Cebsev (legea slab a numerelor mari).
Dac X1, X2,..., Xn, sunt variabile aleatoare discrete sau continue, reciproc independente, ale
cror dispersii sunt mai mici dect o constant K, atunci pentru 0 au loc relaiile

n n

Xi M X i

lim P i 1
i 1
1 , sau
n n n

n

X i

M X i m , i 1, n lim P i 1
m 1.
n n


Rezult c media aritmetic a unui numr suficient de mare de variabile aleatoare cu
dispersiile mrginite i pierde caracterul aleator. Aceast teorem st la baza teoriei seleciei.

37
Probabiliti i Statistic matematic (Draft)
Partea a dou

5. Statistic descriptiv

5.1. Vocabular
Noiunea fundamental n statistica matematic este populaia care desemneaz o mulime,
grup, colectivitate.
Exemple de populaii: populaia omerilor, a automobilelor Dacia, bacterii, precipitaii
atmosferice etc. Elementele populaiei se numesc indivizi. Trstura comun a tuturor
indivizilor unei populaii se numete caracteristic i poate fi cantitativ sau calitativ.

Exemplul 1. Locuitorii unui ora au nlime, greutate, vrst, numr de persoane de


ntreinut, venit etc. Fiecare dintre acestea constitue o caracteristic de tip cantitativ.

Aceiai indivizi au caracteristici de tip calitativ cum ar fi: sex, culoarea ochilor, localitatea
naterii, origine social, apartenen politic etc.
O caracteristic cantitativ poart numele de variabil, iar cea calitativ numele de atribut.
O variabil poate fi discret, lund un numr discret de valori sau continu i atunci este
posibil s ia orice valoare dintr-un interval.
Statistica matematic este o ramur a matematicilor aplicate care se ocupa cu studiul
proprietilor populaiilor.
Colectarea informaiei
Pentru a prelucra informaia, ea trebuie colectat. Pentru aceasta se face o anchet al crei
obiectiv trebuie bine stabilit nainte de demararea aciunii.
Datele sunt culese prin observaii directe sau indirecte (datele sunt culese din alte rapoarte).
Pentru culegerea datelor se ntocmesc chestionarele care trebuie s prevad toate situaiile
nct s nu fie ntrebri fr rspuns.
Moduri de colectare a informatiei
ancheta exhaustiv (recensmnt)
prin sondaj numai anumii indivizi selectai sunt chestionai. Ei formeaz o selecie
care trebuie s fie reprezentativ. Reprezentativitatea seleciei se asigur cnd
structura seleciei este identic cu structura populaiei din care s-a fcut selecia.

38
Probabiliti i Statistic matematic (Draft)
5.2. Reprezentarea datelor

5.2.1. Tabele
Tabel statistic este forma de prezentare a rezultatelor prelucrrii statistice prin care se
caracterizeaz populaia.
Tabelul este un ansamblu de judeci despre subiect (populaia i grupele ei) i despre
predicat (caracteristicile statistice).
Se disting
tabele simple - reprezint populaia negrupat,
tabele pe grupe - reprezint populaia desparit n grupe omogene dup o singur
caracteristic. Mrimea intervalului este dat de formula lui H. A. Sturges:
w x xmin
h max ,
1 3.322 lg n 1 3.322 lg n
unde w este aplitudinea.
tabele combinate - reprezint populaia desparit n grupe dup dou sau mai multe
caracteristici
tabele cu dubl intrare n care se reprezint frecvenele bidimensionale.

Exemplul 2.

Numrul de copii al familiilor profesorilor din liceul L


Numrul de apariii
Numrul de copii Frecven relativa Frecven cumulat
(de familii)
0 42 0.42 0.42
1 18 0.18 0.60
2 33 0.33 0.93
3 5 0.05 0.98
4 2 0.02 1
Total 100

39
Probabiliti i Statistic matematic (Draft)
Exemplul 3. Tablou cu dubl intrare.
Situaia colar la sfritul anului universitar
Medie
An studii
m<5 5m<7 7 m <9 9 m 10
I 4 5 10 6
II 5 4 11 5
III 7 3 9 6
IV 2 8 8 7

Se poate raspunde la ntrebri de genul:


1) Ce situaie colar au studenii anului a ?
2) Care este proveniena studenilor cu note n intervalul [a, b) ?
Exemplul 4. Tabele pe grupe
Urmtoarele date reprezint salariile orare a 115 muncitori n euro:
3.9 4.9 4.1 5.5 5.1 4.5 6.9 4.8 4.9 5.2
4.3 5.8 5.0 6.6 5.7 5.5 5.7 5.3 5.6 5.1
6.9 3.9 3
Gruparea datelor : w 0.4 .
1 3.322 lg115 7.846
Salariu orar Numr de apariii Frecvena relativ Frecvena cumulat
3.9-4.3 9 0.07826 0.07826
4.4-4.7 14 0.12174 0.2
4.8-5.1 18 0.15652 0.35652
5.2-5.5 21 0.18261 0.53913
5.6-5.9 23 0.2 0.73913
6.0-6.3 16 0.13913 0.87826
6.4-6.7 10 0.08696 0.96522
6.8-7.1 4 0.03478 1

5.2.2. Reprezentarea grafic a repartiiilor de frecvene


Histograma este reprezentarea grafic a datelor trecnd pe orizontal intervalele de valori,
iar pe vertical frecvenele acestor valori.
Exemplul 5 . Pentru exemplul de mai sus histograma este reprezentat de figura urmtoare.

40
Probabiliti i Statistic matematic (Draft)

Poligonul frecvenelor se obine unind printr-o linie frnt extremitile segmentelor


perpendiculare ridicate din mijloacele intervalelor de variaie, segmente a cror lungime este
proporional cu frecven.
Exemplul 6. Pentru datele de mai sus, poligonul frecvenelor este

Diagrame cu sectoare. n acest mod de reprezentare a datelor sectoarele sunt proporionale


cu procentajele. Pot fi nsoite de legend sau dac se poate se scrie chiar n sector procentul
i ceea ce reprezint. Pentru exemplu de mai nainte se prezint diagrama cu sectoare n
figura urmtoare. Sunt reprezentate i frecvenele relative pe sectoare.

41
Probabiliti i Statistic matematic (Draft)

Diagrame figurative. O figur reprezint un individ al populaiei i poate lua diferite


dimensiuni dup procentajul sau numrul de realizri pe care l reprezint.

5.3. Depistarea datelor afectate de erori aberante i sistematice

5.3.1. Identificarea valorilor afectate de erori aberante i eliminarea lor

Testul Chauvenet

Fiind date valorile observate, x1 , ..., xn , se consider c valoarea xi este afectat de erori

aberante (outliers) dac verific relaia: | xi x | z , unde:


n

x
xi x 2 , z 0,435 0,862a 2 ; a 2n 1 .
i
1 n
x i 1
n
, 2
n i 1 1 3,604a 3,213a 4n
42
Probabiliti i Statistic matematic (Draft)
Dac n urma aplicrii testului una dintre valori este afectat de erori aberante, valoarea
respectiv se elimin din eantion. Se recalculeaz x i pentru valorile rmase i se reia
procedeul.

n continuare este dat programul MathCAD pentru depistarea i eliminarea erorilor


aberante dintr-o mulime de date aflate ntr-un fisier de tip text. Datele sunt memorate una pe
linie. Datele sunt sortate cresctor i se testeaz dac cea mai mic i cea mai mare dintre
valori verific relaia | xi x | z . Dac da, se deplaseaz indicele de nceput spre dreapta
cu o poziie dac cea mai mic valoare este aberant sau indicele de sfrit spre stnga cu o
poziie dac cea mai mare valoare este aberant i se reia procedeul pn nu mai sunt erori
aberante n datele de analizat.

43
Probabiliti i Statistic matematic (Draft)

Eliminarea datelor afectate de erori aberante utilizand criteriul Chauvenet

Datele de intrare se citesc in variabila X dintr-un fisier text cu extensia prn


Fisierul poate fi creat cu Notepad si atentie la extensie; se alege All files

Chauvenet ( X ) sw 1
I1
N length ( X )
w hile sw 1
X sort ( X )
nNI 1
N

X
i
iI

NI 1
N

Xi
2

i I

NI
2n 1
a
4n
0.435 0.862a

z
2
1 3.604a
3.213a

er1 X
I
er2 X
N
if ( er1 er2) ( er1 z)
II 1
sw 1
if ( er2 er1) ( er2 z)
NN1
sw 1
sw 0 if ( er1 z ) ( er2 z )
T
Y submatrix X 1 1 I N
return Y

44
Probabiliti i Statistic matematic (Draft)

X READPRN("j:\intervale\debite.prn" )

Apelul subprogarmului Y Chauvenet (X)

Depunerea datelor fara outliere intr-un fisier de tip text cu extensia prn

WRITEPRN"Date_outliers.prn"
( ) Y

Fisierul poate fi citit cu Notepad!

Exemplul 7. n simularea utilizrii unei imprimante conectate la o reea se urmrete


repartiia numrului maxim de fiiere care sunt n lista de ateptare pentru listare pe o
perioada de 20 de zile, nregistrndu-se valorile:

spt L Ma Mi J V spt L Ma Mi J V
I 15 19 13 18 20 III 13 13 13 14 17
II 12 21 22 19 21 IV 19 21 13 23 17

S se verifice dac acest eantion are valori aberante i dac exist, s se elimine!
Soluie.
Se creaz un fiier de tip text cu datele dim tabel i se apeleaz programul MathCAD de mai
sus.

5.3.2. Depistarea erorilor sistematice dintr-un set de date

Testul Young
Pentru depistarea erorilor sistematice dintr-un set de date rezultate din msurtori se poate
folosi testul lui Young, dat de urmtoarea procedur.

Pas 1. Intrare: x1, x2 , ... , xn - irul de date experimentale i probabilitatea de acceptare


(coeficient de ncredere);
1 n 1 2
Se calculeaz mrimile: 2
i 1 ix x 2
i M ;
n 1 i 1 2
45
Probabiliti i Statistic matematic (Draft)
Pas 2. Se compar M cu valoarea critic (VCI) inferioar i valoarea critic superioar
(VCS), adic VCI<M<VCS, valori luate din tabele n funcie de n i sau determinate cu
relaiile urmtoare pentru n 25 :
a) Dac 0.95 atunci VCI 0.491 0.081n 0.003n 2 i
0.341
VCS 3.317 1.057e 8.919n
192.883 1.269n 2.33
b) Dac 0.99 atunci VCI i
411.427 n 2.33
1.388
VCS 3.484 0.882e 33.574 n
Dac inegalitatea este satisfcut, atunci se consider c irul de date experimentale are un
caracter aleator (nu este afectat de erori sistematice) cu probabilitatea .
Pas 3. Stop!
Exemplul 8.
Pentru mulimea de date din tabelul urmtor s-a aplicat testul lui Young (algoritmul scris n
MatCAD) i s-a dovedit ca datele conin erori sistematice (cum de altfel se poate constata!).

-15 0.682123818 0.595609553 0.392426015 0.321975779


21 -15 0.627846396 0.974649047 0.15684995
0.909757557 21 -15 0.914830915 0.025001649
0.41547236 0.251197983 21 -15 0.496712891
0.94781265 0.370345386 0.992439736 21 0.425054046

46
Probabiliti i Statistic matematic (Draft)
Criteriul Young pentru depistarea erorilor sistematice

Datele de intrare se citesc dintr-un fisier de tip text avand extensia prn
Fisierul poate fi creat cu NotePad; atentie la extensie: se alege All files
Volumul de date trebuie sa fie n<=25

Young ( X ) n length ( X )
sw 1
if 0.95
2
VCI 0.491 0.081n 0.003n
0.341
8.919 n
VCS 3.317 1.057e
if 0.99
2.33
192.883 1.269n
VCI
2.33
411.427 n
1.388
33.57 n
VCS 3.484 0.882e
sw 2 otherwise
n1

i 1 i
2
1
2 X X
n 1
i 1
2
2 Stdev ( X )
2
M
2
sw 0 if VCI M VCS
return sw

Daca sw=0 nu sunt erori sistematice in datele de intrare


Daca sw=1 sunt erori sistematice in datele de intrare
Daca sw=2 s-a ales o valoare pentru diferita de 0.95 sau 0.99

X READPRN("I:\Statisica Curs\young.prn" )

sw Young(X 0.99) sw 1

47
Probabiliti i Statistic matematic (Draft)
5.4. Prezentare sumar a modulului Data Analysis din Excel

Componenta Excel a MicroSoft Office are modulul Data Analysis care conine proceduri
pentru simularea variabilelor aleatoare (uniforme, normale, discrete, Poisson), determinarea
caracteristicilor variabilelor aleatoare, histograma etc.

5.4.1. Simularea numeric a variabilei aleatoare Exp()


1
n cele ce urmeaz vom genera o variabil aleatoare X ~ Exp , prin metoda invers,
3
utiliznd Excel i i vom determina caracteristicile, vom reprezenta histograma, densitatea de
repartiie i funcia de repartiie folosind modulul Data Analysis.
n coloana A am generat, folosind generatorul de numere aleatoare uniforme pe (0, 1), 300
de numere aleatoare. Folosind metoda invers am generat, n coloana B, 300 de numere
1
aleatoare urmnd repartiia Exp . Pentru aceasta, n celula B2 introducem =-ln(A2) , pe
3
care apoi o copiem pn n celula B301.
Cu ajutorul modulului Data Analysis din Excel, se pot obine caracteristicile unei variabile
aleatoare astfel:
- Valorile de selecie se depun ntr-o coloan sau linie (n exemplul de mai sus coloana B);
- Din submeniul Data se selecteaz Data Analysis, iar din fereastra care apare se selecteaz
Descriptive Statistics.
- Se iniiaz un dialog printr-o caset n care trebuie precizat unde se afl datele, apoi unde se
vor depune caracteristicile;
- Se selecteaz Summary Statistics i se precizeaz pragul de semnificaie (implicit este
95%), ca n figura de mai jos.

48
Probabiliti i Statistic matematic (Draft)

-Se afieaz caracteristicile variabilei de selecie ca n figura urmtoare.

Pentru a reprezenta densitatea i funcia de repartiie, din bara de meniu principal se


selecteaz submeniul Data, apoi Data Analysis i de aici Histogram. Se iniiaz un dialog
printr-o caset n care trebuie precizat domeniul cu datele de intrare, unde s fie depus
histograma, funcia de repartiie i reprezentarea grafic.

Se afieaz intervalele (coloana Bin), frecvenele absolute i valorile funciei de repartiie


empirice relative la intervalele calculate automat. Dac se dorete ca lrgimea intervalului s
fie cea rezultat din formula lui Sturges, atunci valorile acestor intervale se depun ntr-o
coloan sau linie i se precizeaz n zona Bin Range domeniul unde au fost depuse. Atunci n
49
Probabiliti i Statistic matematic (Draft)
coloana Bin din figura de mai jos vor fi trecute aceste intervale i alturi frecvenele absolute
corespunztoare precum i valorile funciei de repartiie empirice relative la aceste intervale.

Exerciii. S se simuleze folosind metoda invers variabile aleatoare de tip: Gumbel, Frechet
i Weibull.

5.4.2. Simularea numeric a unei variabile aleatoare discrete


Modulul Data Analysis din Excel permite simularea numeric a unei variabile aleatoare
discrete. Vom exemplifica modalitatea de simulare pentru variabila aleatoare discret
0 1 2 3
X : 1 3 3 1

8 8 8 8
din exemplul 4 din capitolul al doilea. Calculm media i dispersia acestei variabile aleatoare
4 4
M X X i pi 1.5 i DX X i M X pi 0.75 .
2

i 1 i 1

Se introduc valorile variabilei aleatoare discrete i probabilitile corespunztoare, ca n


figura de mai jos. Din modulul Data Analysis se selecteaz Random Number Generation.

Se precizeaz numrul de eantioane, unul n acest exemplu, apoi volumul eantionului (3000
n acest exemplu), tipul repartiiei - Discrete, celulele cu valorile variabilei aleatoare discrete
i probabilitile corespunztoare. Dup precizarea celulelor unde s se depun numerele
generate, se selecteaz Descriptive Statistics i n caseta de dialog afiat se precizeaz
celulele cu datele generate, celulele unde s se afieze statistica i Summary Statistics.

50
Probabiliti i Statistic matematic (Draft)

Constatm c media i dispersia de selecie sunt destul de apropiate de cele teoretice.

Exerciii. S se simuleze variabile aleatoare de tip lognormal, 2, Student i Fisher-


Snedecor, innd seama de legtura acestora cu variabila aleatoare normal, exprimat n
3.2.3, 3.2.7, 3.2.8, 3.2.9 .

5.5. Ajustarea datelor de msurtoare

5.5.1. Dreapta de regresie punerea problemei

Fiind date, ntr-un sistem cartezian, punctele M i ( xi , yi ) , i 1,6 , s se gseasc o dreapt


care trece cel mai aproape de aceste puncte.
51
Probabiliti i Statistic matematic (Draft)
Rezolvare: considerm dreapta y a x b f (x) i punem condiia ca punctele s se

situeze pe aceast dreapt, adic yi a xi b , i 1,6 , unde parametrii a, b sunt


n
S ( x) yi f ( xi ) , n
2
necunoscui. Problema revine la a determina minimul funciei
i 1

fiind numrul de puncte. Dac min S ( x) 0 , atunci yi f ( xi ) , i 1, n . Pentru aceasta se


rezolv sistemul de ecuaii liniare n a i b, obinnd punctele staionare

S n
n 2 n n
xi yi axi b 0 xi yi
a 0 2 a x i b xi
i 1 i 1 i 1 i 1
S , adic n , de unde n n cu soluia
0 2 yi axi b 0 a xi b n yi
b i 1 i 1 i 1

n n n n

xi yi
i 1
xi
i 1
xi2
i 1
x y
i 1
i i

n n n

y
i 1
i n x
i 1
i y
i 1
i
a n n
b n n

xi2
i 1
x
i 1
i x x
i 1
2
i
i 1
i

n n

x
i 1
i n x
i 1
i n

5.5.2. Funcia de regresie


Funcia de regresie este o expresie matematic dedus n urma prelucrrii unor date
experimentale ce aproximeaz dependenele dintre dou sau mai multe variabile ale unui
sistem dat. Funcia de regresie este necesar atunci cnd dependenele dintre variabilele
respective nu pot fi stabilite suficient de precis pe cale teoretic.
Una dintre cele mai populare metode pentru determinarea funciei de regresie este metoda
celor mai mici ptrate.
Fiind dat o mulime de perechi de puncte ( xi , yi ) , i 1, n , se pune problema determinrii
unei funcii y=f(x), f numit funcie de regresie, ale crei valori n punctele xi s
aproximeze ct mai bine valoarea yi . Drept criteriu de aproximare vom lua suma ptratelor
n
coreciilor min S ( x) min yi f ( xi ) .
2

i 1

Aadar, determinarea expresiei f const n determinarea unor coeficieni i atunci trebuie


S ( x)
rezolvat sistemul 0 , j 1, m , m fiind numrul de coeficieni necunoscui ai
ci

funciei f. Un exemplu l constituie dreapta de regresie prezentat mai nainte.

52
Probabiliti i Statistic matematic (Draft)
Alte forme pentru funcia de regresie
1) f ( x) a x 2 b x c
b
2) f ( x) a
x
3) f ( x) a e x b
4) f ( x) a ln( x) b
a
5) f ( x)
1
b
x
1
6) f ( x) x
ae b
7) f ( x) a x b
b
8) f ( x) a c x

9) f ( x) a eb x .a.

5.5.3. Polinomul de interpolare al lui Lagrange


Un exemplu de aproximare a datelor provenite din msurtori l constitue polinomul de
interpolare al lui Lagrange pentru care n anumite condiii se poate da o margine a erorii de
aproximare.
Teorem. Fie f : [a, b] R i x0 , x1 , ... , xn , (n+1) puncte din intrervalul [a,b]. Atunci

exist un polinom unic Pn de gradul n care aproximeaz funcia f n punctele xi


n n
x xj
i 0, n , f ( xi ) Pn ( xi ) , Pn ( x) f ( xi ) . Acest polinom se numete polinomul
i 0 j 0 xi x j
j i

de interpolare al lui Lagrange. n plus, dac f C n 1 a, b , atunci pentru x [a, b]


f ( n 1) ( ) n
exist (a, b) astfel nct f ( x) Pn ( x)
(n 1)!
x x .
i 0
i

Observaie. Dac f este un polinom de gradul n i se cunosc valori ale lui f ntr-o
mulime de (n+1) puncte, atunci polinomul de interpolare al lui Lagrange coincide cu f .

53
Probabiliti i Statistic matematic (Draft)

5.5.4. Prezentare general a pachetului de programe CurveExpert

CurveExpert este un produs software care permite determinarea expresiei unei funcii de
regresie univariabil. Dup lansare apare fereatra principal care are o zon de date, prima
coloan reprezentnd valorile variabilei independente, iar cea de-a doua valorile
corespunztoare ale variabilei dependente.

Datele pot fi luate dintr-un fiier text, a crui extensie trebuie s fie dat (File, Open), iar la
crearea fiierului (de exemplu: NotePad), pentru separarea celor dou valori pe linie se
folosete Tab-ul. Dac fiierul conine mai multe coloane trebuie s specificm coloanele cu
coordonatele punctelor, cele dou coloane trebuie s fie succesive, iar variabila independent
trebuie s fie prima coloan.

Meniul Data permite reprezentarea grafic a punctelor prin comanda Plot, modificarea
valorilor punctelor prin multiplicare (Scale), translatare (Translate), eliminarea punctelor din
afara unui interval (Clip), recalcularea unor indicatori statistici, cum ar fi: media, abaterea
medie ptratic (Reexamine) sau afiarea unor informaii statistice asupra datelor
(Information).
Datele pot fi interpolate utiliznd meniul Interpolate prin interpolare polinomial (polinomul
lui Lagrange) sau funcii spline (liniare, patratice, cubice).
Cutarea funciei de regresie se poate face cu una din opiunile meniului ApplyFit. Dac se
dorete o form de funcie de regresie diferit de cele pe care le propune CurveExpert, prin
54
Probabiliti i Statistic matematic (Draft)
comanda User Model, se poate defini o funcie proprie de regresie cu maximum 19
coeficieni.
Meniul Tools permite alocarea de ponderi n cadrul regresiei (Weighting Scheme), calcularea
estimaiilor iniiale utilizate n algoritmii de determinare a funciilor de regresie neliniare
(AutoGuest On), tergerea listei funciilor de regresie pentru o nou refacere a calcullelor
(Clear CurveFits), vizualizarea rezultatelor iteraiilor ultimei funcii de regresie (View
History File), editarea fiierului de date (Edit Current File), baleierea tuturor funciilor de
regresie disponibile pentru acel set de date i sortarea lor n ordinea descresctoare a
adecvanei (CurveFinder) i configurarea programului (Options).

Selectarea unei funcii din list va afia graficul funciei, calitateta adecvanei dat de
coeficienii S i r, iar selectnd Info obinem coeficienii funciei de regresie.
Calitatea aproximrii (adecvana) se poate msura cu unul dintre coeficienii de mai jos:
n

y f ( xi )
2
i
- deviaia standard (eroare standard) (S) : S i 1
n nc

coeficientul de corelaie (r) : r St S r


-
St
unde: nc reprezint numrul de parametri ai funciei de regresie,
n
S r yi f ( xi ) ,
2

i 1

y

n i
St y yi
2
, iar y
i 1 .
i 1 n

55
Probabiliti i Statistic matematic (Draft)
Cu ct S este mai apropiat de zero, respectiv r de 1, cu att aproximarea dat de f este mai
bun.

Semnificaia erorii standard este apropiat de cea a parametrului 2 i caracterizeaz


mprtierea punctelor experimentale n jurul graficului funciei de regresie i avnd o valoare
ct mai apropiat de zero atunci cnd punctele sunt mai aproape de grafic.
Coeficientul de corelaie reprezint o msur a raportului dintre gradul de mprtiere al
punctelor experimentale n jurul graficului funciei de regresie i gradul de mprtiere al
acelorai puncte n raport cu media aritmetic a ordonatelor.
Valoarea acestui coeficient reprezint o msur mai exact a calitii funciei de regresie
obinut n situaia n care abaterea standard a valorii experimentale este relativ mare. Funcia
de regresie face o bun aproximare cu ct coeficientul de corelaie este mai apropiat de 1.

Salvarea i exportarea sunt necesare pentru a pstra, respectiv pentru a exporta datele ntr-un
fiier text, coninnd informaii privitoare la expresia i coeficienii funciei de regresie.
Odat cu salvarea i exportarea se salveaz coeficientul de corelaie i ali coeficieni. Putem
s vedem forma funciei i putem stabili forma liniei graficului i culoarea acestuia. Le putem
salva.

Exemplul 9. S se determine valoarea funciei f f ( x) x5 3x 1 n x 0.5 dac i se


cunosc valorile n punctele date n tabelul de mai jos :
x -3 -2 -1 0 1 2
y -233 -25 3 1 -1 27
Polinomul de interpolare al lui Lagrange ne d valoarea -0.46875 care este de fapt valoarea
exact a funciei f n 0.5 .
56
Probabiliti i Statistic matematic (Draft)
Utiliznd CurveExpert obinem coeficienii polinomului iniial ca n figura urmtoare.

57
Probabiliti i Statistic matematic (Draft)

6. Elemente de teoria estimaiei

6.1. Estimatori
Pentru culegerea de informaii despre o populaie statistic se pot folosi dou meode:
recensmntul (mai rar datorit costului, iar n unele situaii concrete este imposibil),
de exemplu controlul calitii epruvetelor de beton - nu pot fi toate experimentate
pentru a vedea rezistena acestora i
metoda sondajelor cnd se examineaz un eantion (selecie) din populaie i pentru
care trebuie avut grij s fie reprezentativ.
Cnd se efectueaz un sondaj nu se poate atinge cunoaterea perfect a parametrilor
populaiei totale. Se caut numai s se estimeze aceti parametri cu o precizie cunoscut: se
determin un interval de ncredere n care se gsete parametrul cu un risc de eroare cunoscut.
Teorema lui Glivenko stabilete legatura dintre funcia de repartiie teoretic F(x) i funcia
empiric de repartiie Fn(x)

P lim sup Fn ( x) F ( x) 0 1
n xR
sau cu ct volumul de selecie este mai mare cu att funcia empiric de repartiie
aproximeaz mai bine funcia teoretic de repartiie.
Principiul de baz al teoriei seleciei - variabila de selecie converge n lege Fn F
ctre variabila teoretic, iar caracteristicile variabilei de selecie converg n probabilitate ctre
caracteristicile analoage ale variabilei teoretice.
Din datele numerice de care se dispune se calculeaz valori aproximative ale caracteristicilor
legii de distribuie respective.
Fie parametrul sau caracteristica teoretic pe care trebuie s o determinm din datele
numerice avute la dispoziie n variabila de selecie X*.
Se numete estimator al lui o anumit funcie (statistic) *=*(X1,...,Xn) care depinde de
rezultatul seleciei, adic de variabilele X j , j 1, n .

O astfel de funcie se mai spune c definete o statistic sau estimatorul * este un estimator
exhaustiv al parametrului .
Observaie. * este o variabila aleatoare deoarece depinde de X1,...,Xn, n vreme ce este
o constant.
Trebuie ca * s convearg n probabilitate ctre , adic
58
Probabiliti i Statistic matematic (Draft)

lim P * 1 ,
n

* se numete estimator consistent.
Se numete coeficient de siguran, probabilitatea P * .
Estimator corect este estimatorul pentru care au loc relaiile
M [* ] , D[* ] 0 .
Estimator absolut corect este estimatorul pentru care se verific relaiile
M [* ] , D[* ] 0 .

Deplasarea lui * (bias) este definit ca fiind M [* ] . Dac deplasarea este 0 spunem
c estimatorul este nedeplasat.
Dac pentru acelai parametru dispunem de doi estimatori 1* i *2 spunem c

estimatorul 1* este mai bun dect estimatorul *2 dac mprtierea lui 1* fa de

este mai mic dect mprtierea lui *2 fa de , adic D[1* ] D[*2 ] .


Se numete estimator eficient estimatorul de dispersie minim.

6.2. Metoda verosimilitii maxime

6.2.1. Estimatorul de verosimilitate maxim


Fie X variabila aleatoare a crei densitate de probabilitte ( x; ) depinde de parametrul
ce urmeaz a se determina din datele de selecie X*=( X1,..., Xn), iar
( X j ; ) PX X j , j 1, n .

X X ,
n
Deoarece variabila de selecie presupune realizat evenimentul j rezult c
j 1

realizarea variabilei de selecie constituie un eveniment care are grad nalt de reprezentare a
variabilei teoretice, acesta costituind verosimilitatea de reflectare a variabilei teoretice X de
ctre variabila de selecie X* i se msoar prin probabilitatea
n
L X 1 ,..., X n P X X j
j 1
adic prin funcia

L X 1 ,..., X n ; X j ;
n

j 1

numit funcia de verosimilitate a seleciei X*.

59
Probabiliti i Statistic matematic (Draft)
Impunnd condiia ca verosimilitatea s fie maxim se obine un nou criteriu de determinare a
unui estimator pentru .
Maximul se gsete printre punctele staionare, soluii ale ecuaiei (sistemului, n cazul n
care este un vector):
LX 1 ,..., X n ;
0

sau cum maximul lui L este obinut ca i maximul lui lnL avem
ln LX 1 ,..., X n ; n
ln X 1 ,..., X n ;
0 0.
j 1
Aceast ultim ecuaie se numete ecuaia de verosimilitate.
O soluie a ecuaiei de verosimilitate se numete estimator de maxim verosimilitate, iar
metoda de determinare se numete metoda verosimilitii maxime. A fost introdus de
Fisher n 1912.
Au loc urmtoarele rezultate :
Propoziia 1. Dac pentru un parametru exist un estimator eficient, atunci acesta este i
estimator de maxim verosimilitate.
Propoziia 2. n condiiile destul de generale n ceea ce privete X 1 ,..., X n ; estimatorul

de maxim verosimilitate pentru este i estimator consistent.

6.2.2. Estimator de verosimilitate maxim pentru parametrul repartiiei Poisson


n cele ce urmeaz vom determina estimatorul de maxim verosimilitate pentru parametrul
repartiiei Poisson. Folosind funcia de densitate de probabilitate
x
x; e , x 0,1, 2, ...
x!
funcia de verosimilitate devine:



, ln L X j ln ln X j !
n Xj n
LX 1 ,..., X n ; e
j 1 X ! j j 1

Ecuaia de verosimilitate pentru acest caz este


ln L n 1
1 X j 0
j 1
sau
n

1 n X j

n

X j 0 *
j 1
j 1

n
,

60
Probabiliti i Statistic matematic (Draft)
adic, media de selecie n cazul repartiiei Poisson este i estimator de verosimilitate maxim
pentru parametrul repartiiei.

6.2.3. Estimator de verosimilitate maxim pentru parametrul repartiiei exponeniale

Vom determina estimatorul de maxim verosimilitate pentru parametrul repartiiei Exp().


Considerm funcia de densitate de repartiie pentru Exp()
0 x0
x; x
e x0
i obinem funcia de verosimilitate:
n
n Xi n
LX 1 ,..., X n ; e X i ne i 1
, ln L n ln X i .
j 1 i 1

Trebuie s determinm max lnLX 1 , X 2 , ... , X n ; . Ecuaia de verosimilitate pentru acest


caz este
ln L n n
Xi 0
i 1
sau
n

1
X
j 1
j


* n
adic, inversul mediei de selecie n repartiia Exp() este estimator de verosimilitate
maxim pentru parametrul repartiiei.

6.2.4. Estimatori de verosimilitate maxim pentru parametrii repartiiei normale,


N ,

Fie
1 x
2

x; , , x R
1
e 2
2
densitatea de probabilitate a variabilei aleatoare repartizat normal de parametri i i

selecia X 1 ,..., X n X * .
Vom determina estimaiile parametrilor i prin metoda verosimilitii maxime pentru
aceast repartiie.
Funcia de verosimilitate este

61
Probabiliti i Statistic matematic (Draft)
X j
n 2


1


LX 1 ,..., X n ; ,
1 2 j 1
e
n 2 2
n

Logaritmm i avem

ln L X1 ,..., X n ; , n ln ln(2 ) 2 X j
n 1 n 2

2 2 j 1
Avnd doi parametri, avem un sistem de ecuaii de verosimilitate

1 2 n
2 X j 1 0
ln L
0
2 j 1

ln L
X j 2
n

0


n 1 2 j 1 0
2 3
sau

X
n
2

X 0 ,
n j
j 1
n
j 1
j
2
Aadar,
n

n n X j

X j
j 1 j 1
* j 1

n
media de selecie i

X X
n n
2 2
j j
j 1 j 1
n *
2 n
dispersia de selecie sunt estimatori de maxim verosimilitate.

6.3. Intervale de ncredere pentru medie i dispersie


Fie P populaie format din n indivizi care posed o caracteristic de tip cantitativ (un
parametru al su, de exemplu sau ), iar X1, X2, ..., Xn valorile observate ale
caracteristicii pentru indivizii populaiei i g X 1 , X 2 , ..., X n , h X 1 , X 2 , ..., X n dou

statistici, astfel nct g X 1 , X 2 , ..., X n h X 1 , X 2 , ..., X n , adic oricare ar fi selecia X1,

X2, ..., Xn s avem g X 1 , X 2 , ..., X n h X 1 , X 2 , ..., X n . Spunem c intervalul [ g , h] este

un interval de ncredere pentru parametrul de nivel de ncredere dac


Pg h ,

62
Probabiliti i Statistic matematic (Draft)
1 se numete prag de ncredere i de obicei se exprim n procente
( 0.95 sau 0.05 ) .
Cum se interpreteaz inegalitatea de mai sus?
Dac dup un numr N mare de seturi de selecii (X1, X2, ..., Xn ), K dintre acestea dau

intervale cu proprietatea c g, h , atunci


K
, adic intervalul [g, h] acoper pe
N
n proproie de cel puin %.
Definiie. Pentru un dat, un interval de ncredere g , h de lungime minim, adic:

Pg h , se numete interval de ncredere eficient relativ la .

Consider urmtorii estimatori pentru media i dispersia caracteristicii X :


n n

X X M X
2
i i
x n M X i 1
, 2 i 1
.
n n
Presupunem c oricare individ din populaie ar putea face parte din selecia de volum n, i
atunci X k , k 1, n , poate fi privit ca o variabil aleatoare avnd aceeai repartiie ca i X
i cu media i dispersia de selecie date de relaiile de mai sus.
n cele ce urmeaz sunt folosite rezultatele precizate de urmtoarea teorem.
Teorem [5]. Fie X o variabil aleatoare normal, X ~ N , , iar X1, X2, ..., Xn
variabile de selecie asociate cu X. Atunci:
X 1 ... X n
a) Variabila x n X ~ N , ,
n n

X X
2 2

b) Variabila 1 ... n ~ n
2
(hi patrat cu n grade de libertate)

2 2
X1 X X X
c) Variabila ... n ~ n21 (hi patrat cu (n-1) grade de

libertate) sau
(n 1) s 2
2
~ n21 , s
1 n

n 1 i 1

2
Xi X ;
X
d) Variabila (n 1)n ~ tn 1 (Student cu (n-1) grade de
X 1 X ... X
2
n X 2

libertate)

63
Probabiliti i Statistic matematic (Draft)
2
Media i dispersia mediei de selecie sunt M X i respectiv
n


M x n M X , D x n
2
.
n

Observaie. Din inegalitatea lui Cebsev


P xn M xn
D xn 1
1
2
obinem

P x n
s

M xn xn
s 1
1 2

n n
lund ca aproximant pentru D[X] valoarea

s2
1
n 1
2
X i xn .
Cu ct este mai mare cu att probabilitatea inegalitii

xn
s
n

M xn xn
s
n
este mai apropiat de 1.
Astfel, pentru parametrul necunoscut M[X], intervalul
s s
xn , xn
n n
este un interval de ncredere.
n concluzie: media de selecie x n pentru n suficient de mare este repartizat normal

N M X ,
s
, lund .
n n n

6.3.1. Intervale de ncredere pentru medie


A. Interval bilateral pentru medie
A.1. Cazul cnd se cunoate dispersia
Presupunem c se cunosc valorile de msurtoare X 1 , X 2 , ... , X n , n 30 , asupra
variabilei aleatoare X. innd seama de teorema de mai sus media aritmetic
xn
x n ~ N M X , , iar Z ~ N (0,1) . Atunci cnd se pune problema preciziei
n
n

64
Probabiliti i Statistic matematic (Draft)
x t2
1
estimaiei, se poate folosi tabela funciei (x)
2 e

2
dt pentru a gsi proporia

cazurilor n care ne putem atepta s obinem o medie de selecie la distana d,



d x n M X de M[X], P Z Z Z 1 . Deoarece Z 1 1 i
2 1
2 2 2


Z 1 1 , avem P x n Z xn Z 1 . Aadar,
n

1
2 2 2 n 1
2


1 x n Z , xn Z am obinut un interval de ncredere cu prag de
n

1
2 n 2

semnificaie ( 1 ) pentru media variabilei aleatoare X pe baza valorilor de selecie


X 1 , X 2 , ... , X n , n 30 .

S calculm un interval pe baz de selecie, interval care are de exemplu ansa de 95% de a
conine media populaiei, n ipoteza c se cunoate abaterea medie standard . Binenteles,
c nu se tie pentru o determinare particular oarecare c intervalul acoper media populaiei,
dar dac estimm n mod repetat M[X] atunci intervalele vor acoperi pe M[X] n 95% din
cazuri.
Fie Z cuantila de ordin a repartiiei normale standard adic PZ Z , unde

Z ~ N 0,1 , atunci z0.025 1.96 i z0.975 1.96 . Intervalul de ncredere de

1 100 % se scrie

65
Probabiliti i Statistic matematic (Draft)

xn Z , xn Z .
1 n
2 n 2

Exemplul 1. [1]
Presupunem c specificatiile pentru rezistena armturii cer o valoare medie de 38 psi
(1 psi = 1 pound/inch2 ; 1 Newton/m2 = 1 N/m2 = 6895psi). Este esenial ca armturile
folosite pentru structura de beton armat s aib rezistena medie cerut. Dintre armturile
livrate, s-au verificat 25 i s-a constatat c rezistena medie a acestor bare este
37.5 psi . Se tie c 3.0 psi . S determinm un interval de ncredere de 95%
pentru media rezistenei armturilor.
Determinm valoarea critic inferioar Z Z 0.025 1 (0.975) 1.96 i valoarea critic
2

superioar Z Z 0.925 1 (0.975) 1.96 . Astfel, intervalul de ncredere pentru medie


1
2

este
3.0 3.0
R 37.5 1.96 , 37.5 1.96 psi
25 25
sau
R 36.32 , 38.68 psi .
Interpretare: intervalul de mai sus, cu probabilitatea de 95%, acoper valoarea medie real
a rezistenei armturilor.
A.2. Cazul cnd nu se cunoate dispersia
Dac este necunoscut, atunci pentru intervalul de ncredere se folosete repartiia Student
cu (n 1) grade de libertate, unde se nlocuiete cu s, un estimator al lui :

s
1 n

X i xn
n-1 i 1

2
. Se calculeaz statistica Tn
xn
s
~ tn- 1 (repartizat Student cu

n


xn
(n-1) grade de libertate. Atunci P t t 1 ne conduce la urmtorul
2 ; n 1 s 1 ; n 1
2

n
interval pentru estimatorul mediei pe baza seleciei X 1 , X 2 , ... , X n , n 30 :

s s
x n t , x n t
; n 1 1 ; n 1
2 n 2 n
sau
66
Probabiliti i Statistic matematic (Draft)
s s
1 x n t , xn t ,
2
; n 1 n 1 ; n 1
2 n

interval de ncredere bilateral pentru medie cu prag de semnificaie 1 , unde t ; n 1 este

cuantila corespunztoare repartiiei Student cu (n 1) grade de libertate.


s
Din condiia ca d t , se poate obine volumul de selecie astfel nct abaterea de
; n 1 n
2

T s
2

la media real s fie d cu nivelul dorit de precizie 1 100 %, anume n 2 +1.


d

n exemplul anterior, dac nu se cunoate abaterea medie ptratic a rezistenei armturilor,
vom considera o valoare aproximativ, de exemplu s=3.5 psi . Atunci, intervalul de ncredere
cu pragul de semnificaie 95% pentru rezistena medie a armturilor este determinat astfel:
R
- se consider statistica Tn ~ tn 1 i din tabela repartiiei Student se gsete
s
n
t0.025; 24 2.064 i t0.975;24 2.064 ;

- se calculeaz intervalul de ncredere pentru medie

0.95 t 0.025; 24 , t0.025; 24 psi 37.5 2.064


3.5 3.5
, 37.5 2.064 psi
25 25

sau 0.95 36.06 , 38.94 psi .


Comentariu. Dac se compar intervalele obinute pentru situaia cu dispersie cunoscut cu
cea cu dispersie necunoscut, se constat c n cea de-a doua situaie intervalul este mai larg.
Dac s-ar mri volumul eantionului intervalul ar deveni mai mic!

B. Interval unilateral pentru medie margine inferioar


B.1. Cazul cnd se cunoate dispersia
Avnd la dispoziie valorile de selecie X 1 , X 2 , ... , X n , n 30 , asupra variabilei aleatoare
X, se poate determina o margine inferioar pentru valoarea medie a variabilei aleatoare X,


xn
astfel: P Z1 1 , unde Z1 1 ( ) . Rezult P x n Z1 1 ,
n

n

67
Probabiliti i Statistic matematic (Draft)
adic marginea inferioar pentru media teoretic obinut pe baza seleciei

X 1 , X 2 , ... , X n , este 1 x n Z1 .
n
Exemplul 2.[1] Se verific 100 de specimene de bar de oel A36 cu diametrul de 1 cm i
se constat c: rezistena medie este 2200 kgf i s 220 kgf . Pentru scopurile
specificate, fabricantul trebuie s dea limita inferioar a intervalului de ncredere a mediei
rezistenei cu pragul de 95%. Cum volumul eantionului este rezonabil de mare este natural
s presupunem c abaterea standard este chiar s. Atunci: din (1 )% 95% , rezult
220
0.05 i Z0.95 1 (0.95) 1.65 , iar 1 0.95 2200 1.65 2164 kgf .
100
Aadar, fabricantul de bare de oel A36 poate cu un prag de ncredere de 95% , poate fi
sigur c rezistena medie a barelor este cel puin 2164 kgf.
B.2. Cazul cnd nu se cunoate dispersia
xn
Procednd analog ca mai sus, dar considernd statistica Tn ~ tn- 1 se obine din
s
n


xn s
P t1 ; n 1 1 , marginea inferioar, 1 x n t1 ; n 1 , pentru media
s n

n

teoretic obinut pe baza seleciei X 1 , X 2 , ... , X n , unde s


1 n
n-1 i 1

X i xn
2
este un

estimator nedeplasat pentru .

68
Probabiliti i Statistic matematic (Draft)
B. Interval unilateral pentru medie margine superioar
B.3. Cazul cnd se cunoate dispersia
Aa cum s-a determinat marginea inferioar pentru media teoretic, se poate determina i


xn
marginea superioar cu pragul de semnificaie ( 1 ), P Z1 1 ,


n

obinndu-se 1 x n Z1 .
n

B.4. Cazul cnd se nu cunoate dispersia


Marginea superioar cu pragul de semnificaie ( 1 ) pentru media teoretic, adic


x s
P t1 ; n 1 1 , este 1 x n t1 ; n 1
n
.
s n

n

6.3.2. Intervale de ncredere pentru frecven


Fie X o variabil aleatoare care numr succesele ntr-o experien Bernoulli, al crei tablou
0 1 numarul succeselor
de repartiie este X : , p , fiind probabilitatea
1 p p numarul de repetari

succesului, iar media sa este M X 0 (1 p) 1 p p . n urma efecturii experienei de


n ori se obine p , un estimator al lui p, ale crui medie i dispersie sunt:

69
Probabiliti i Statistic matematic (Draft)
1 n 1 n
M p M X i M X i (n p) p , adic
1
p este un estimator nedeplasat,
n i 1 n i 1 n

p1 p
1 n 1 n

Var p Var X i 2 VarX i 2 M X i2 M X i 2 n p p 2
1 n 2 1
,
n i 1 n i 1 n i 1 n n


deoarece M X i2 02 (1 p) 12 p p . Pentru n suficient de mare (mai mare dect 30) se

p (1 p )
presupune c se obine repartiia normal pentru P , P ~ N p, i se pot aplica

n


p p
formulele: P Z Z 1 . De aici rezult c:
2 p (1 p ) 1
2

n
p (1 p ) p (1 p )
p1 p Z , p Z , unde Z 1 1 , Z 1 1 .
n 1 n 2 1 2 2
2 2 2

Exemplul 3. Pentru un control de calitate al compactrii fundaiei unei autostrzi s-au


pregtit i testat 50 de specimene de sol. Trei dintre ele au fost sub standard. S se determine
un interval de ncredere de 95% al proporiei fundaiei autostrzii bine compactat.
Rezolvare. Pe baza rezultatelor testului estimm proporia fundaiei care satisface
47
compactarea conform standardului, astfel: p 0.94 . Ne ateptm ca 94% din
50
fundaia autostrzii s fie bine compactat. Intervalul de ncredere de 95% al proporiei
fundaiei autostrzii bine compactate este Z0.025 1 (0.975) 1.96 i

Z 0.975 1 (0.975 ) 1.96 . Asadar,

0.94 1 0.94 0.94 1 0.94


p 0.94 1.96 , 0.94 1.96 0.934, 0.942 .
50 50

6.3.3. Intervale de ncredere pentru dispersie


innd seama de punctul d) al teoremei de mai sus, putem determina un interval bilateral de
ncredere cu pragul de semnificaie (1 ) , pentru dispersie:

(n 1) s 2
P 2 2 1
2 ; n 1 2
1 ; n 1
2

70
Probabiliti i Statistic matematic (Draft)

(n 1) s 2 (n 1) s 2 1 n 2 2 1 n
anume: 2
1 2 , , unde s
2
Xi nX , X Xi .
1 ; n 1 2
; n 1
n 1 i 1 n i 1
2 2
Fr dificultate se pot obine i intervalele unilaterale:
(n 1) s 2
a) Limita inferioar pentru dispersie 2 ,
12 ; n 1

(n 1) s 2
b) Limita superioar pentru dispersie 2 .
2 ; n 1

Exemplul 4. S se determine un interval de ncredere pentru 2 avnd la dispoziie o


populaie cu un volum de selecie n = 11, cu un prag de ncredere 20 0 0 .

Atunci vom avea cazul 2 cu n 1 10 grade de libertate, 2 902 ,10 5.578 , iar
1 ,
2

2 102 ,10 17.275 pentru 20 0 0 .


,10
2

s2
Astfel n 80% din cazuri 0.557 1.727 , sau rastunnd relaia i separnd pe 2 ,
2

avem
s2 s2
2
1.727 0.557
care este un interval de ncredere 80% pentru estimarea lui 2 .

71
Probabiliti i Statistic matematic (Draft)
Partea a treia

7. Elemente de decizii statistice

7.1. Ipoteze statistice


n practic apare necesitatea comparrii a dou procese tehnologice diferite, a dou metode
de cercetare diferite, etc. Este necesar s se cunoasc dac metodele comparate dau rezultate
identice, iar dac nu care este mai eficace.
n statistica matematic o diferen semnificativ este aceea care nu poate fi pus pe seama
ntmplrii la un anumit nivel de probabilitate sau de ncredere. De exemplu, cu ct este mai
mic diferen dintre dou medii, cu att este mai mare probabilitatea ca ele s aparin unor
selecii extrase din aceeai colectivitate de baz.
Se numete ipotez statistic orice presupunere cu privire la caracteristicile unei variabile
aleatoare, fa de legea ei de distribuie sau fa de parametrii ce o determin.
Mijloacele de verificare a ipotezelor statistice se numesc teste statistice.
Cnd ipoteza este facut asupra parametrilor unei distribuii, testele respective se numesc
teste parametrice, iar cnd ipoteza nu face referiri la natura distribuiei, testele sunt numite
teste neparametrice.
Cnd ipoteza privete valori estimate ale caracteristicilor unei variabile aleatoare, atunci
testele se numesc teste de semnificaie.
Cnd ipoteza se refer la natura repartiiei, de exemplu, se afirm c o variabil empiric are
o anumit repartiie teoretic, testul se numete test de concordan.
S considerm un anumit parametru al legii de repartiie a variabilei aleatoare teoretice X,
sau o caracteristic a acestei variabile aleatoare cum ar fi: media, dispersia, abaterea standard
i pe care s o notm .
Considerm dou funcii de estimaie 1* i *2 ale valorii teoretice , estimaiile fiind

considerate absolut corecte: M [1* ] M [*2 ] , D[1* ] 0 , D[*2 ] 0 .

Notnd cu d 1* *2 , afirmaia: d este o variabila aleatoare cu media 0 este ipoteza


nul i se noteaz H0.
Altfel spus: H0= Nu exist diferen semnificativ ntre 1* i *2 .

Alternativa ipotezei nule H1 H 0 = Exist diferen semnificativ ntre 1* i *2 .

72
Probabiliti i Statistic matematic (Draft)
Testul de verificare a ipotezei nule se numete testul ipotezei nule i reprezint o regul de
descompunere a spaiului ndimensional al seleciilor Rn (n volumul seleciei) n dou
regiuni: Rn Rn1 Rn0 cu Rn1 Rn0 astfel nct dac valorile observate X1,..., X n Rn1
se accept ipoteza H0, iar dac X 1 ,..., X n Rn0 se respinge ipoteza H0.

Domeniul Rn0 se numete domeniul critic sau regiunea critic a testului.


Probabilitile:
PRn0 H 0 Presping H 0 cand H 0 este adevarata

PR1 H1 Paccept H 0 cand H 0 este falsa


se numesc riscul de genul nti i respectiv riscul de genul al doilea sau probabilitatea
erorii de genul nti i respectiv probabilitatea erorii de genul al doilea.
se mai numete i prag de semnificaie i se consider n practic de obicei 0,05 (5%).

7.2. Etapele verificrii ipotezelor statistice


1. Enunarea ipotezei
2. n modul ideal se specific i . Acestea vor determina numrul de observaii pe
care trebuie s le facem pentru a calcula statistica pe care am ales-o. n practic se dau i
n.
3. Se determin ce valori ale unei anumite statistici, valori ce formeaz regiunea critic,
determin respingerea ipotezei i care anume conduc la acceptarea ipotezei.
4. Se calculeaz valoarea statisticii din selecii.
5. Se accept sau nu ipoteza, dup cum valoarea obinut pentru statistic este n afar sau n
interiorul regiunii critice.

Not: Testul ipotezei nule se aplic dac populaia din care s-a extras selecia urmrete legea
normal sau volumul seleciei este suficient de mare (n>30).

7.3. Teste statistice

7.3.1. Testul variabilei reduse Z al ipotezei nule

Reamintim c prin test de semnificaie se nelege acel test statistic ce verific ipoteza privind
valori estimate ale caracteristicilor unei variabile aleatoare.

73
Probabiliti i Statistic matematic (Draft)
Aplicaie. Fie X ~ F ( x, ) , parametrul (parametrii) repartiiei i 1* , *2 doi

estimaori pentru , cu proprietile : M 1* M *2 i Var1* 0 , Var*2 0 ,


adic sunt absolut coreci. Notm d 1* *2 i formulm ipoteza nul
H 0 : " d este o variabila aleatoarecu M [d ] 0" i alternativa

H1 : " Exista diferenta semnificativa intre 1* si *2 "

Acesta se numete testul ipotezei nule care se aplic astfel:


d M [d ]
- Se formeaz variabila redus Z , care are M [ Z ] 0 i atunci

H 0 : " M [ Z ] 0" .

- Pentru n 30 se presupune c Z ~ N (0, 1) i atunci

t2 t2
t0
2 2
e e
P( Z t0 ) (t0 )
2
dt , sau P( Z t0 ) 1 (t0 )
t0 2
dt

- Daca P Z t 0 1 se accept ipoteza H0, adic se cunoate intervalul

(t0 , t0 ) i dac Z calculat t0 , t0 se accept ipoteza H0 , cu pragul de semnificaie

1 % , altfel se respinge.

Vom exemplifica aplicarea testului n dou situaii [1]:


A) cazul cnd se cunoate dispersia i
B) cnd nu se cunoate dispersia.
A) Presupunem c specificaiile pentru rezistena armturii cer o valoare medie de
38 psi (1 psi = 1 pound/inch2 ; 1 Newton/m2 = 1 N/m2 = 6895psi). Este esenial ca
armturile folosite pentru structura de beton armat s aib rezistena medie cerut. Dintre
armturile livrate s-au verificat 25 i s-a constatat c rezistena medie a acestor bare este
37.5 psi. Se tie c 3.0 psi. Deoarece inginerul constructor dorete s verifice numai
barele care au rezistena specific mai mic dect 38 psi, atunci se va aplica testul
unilateral. n acest caz, ipoteza H0 se formuleaz astfel:

H 0 : " R 38 psi " i alternativa sa H1 : " R 38 psi" .

74
Probabiliti i Statistic matematic (Draft)
Se presupune c repartiia rezistenei barelor este repartiia normal. Se consider variabila
R 37.5 38
redus Z calculat 0.833 . Alegng 0.05 5% , din tabelele
3
n 25
repartiiei normale standard gsim Z 1 (0.05) 1 (0.95) 1.95 . Deoarece

Z calculat Z se accept ipoteza nul!


B) n exemplul anterior presupunem c nu se cunoate dispersia i atunci acesta trebuie
estimat, anume s 3.5 psi . n acest caz, Z se nlocuiete cu

R 37.5 38
T ~ t n1 , Tcalculat 0.714 . Pentru acest caz, numrul gradelor de
s 3.5
n 25
libertate este n 1 25 1 24 i atunci din tabela repartiiei Student gsim
t24;0.05 t 24;0.95 1.7109 . Tcalculat tn; se accept ipoteza nul!

7.3.2. Procedeul intervalelor de ncredere

Se consider un coeficient de ncredere i se determin intervalele pentru 1* i *2 . n


cazul n care intervalele de ncredere au o parte comun ipoteza H0 se accept. Dac nu au
nici o parte comun, ipoteza H0 se respinge.

7.3.3. Aplicaii

7.3.3.1. Compararea mediei cu o valoare


n acest caz ipoteza H0 este media populaiei este egal cu o valoare i testul de
semnificaie se aplic n dou moduri:
1) se admite pentru Z repartiia normal dac n>30,
2) se admite pentru Z repartiia Student (n<30). n acest caz Z se noteaz cu t (notaie
consacrat).
Exemplul 1. La recepionarea sacilor de ciment, care trebuie s aib greutatea netto 40 Kg,
se efectueaz un control prin sondaj, cntrindu-se la ntmplare 15 saci, pentru care au fost

75
Probabiliti i Statistic matematic (Draft)
gsite urmtoarele greuti: 39.75 ; 40.25; 39.50; 39,50; 40.25; 40.50; 40.00; 39.75; 40.00;
40.00; 39.25; 39.25; 39.50; 40.00; 39.50 .
Poate fi considerat marfa primit corespunznd comenzii fcute cu un prag de 95%?
Soluie. Trebuie verificat ipoteza H 0 : m 40 . Dispersia D este necunoscut i va fi
estimat. Cum n=15<30, vom considera pentru variabila redus repartiia Student.
Avem
M [ X ] 40 , x n x15 39.80 , n 15 , n 1 14 ,

X
n 15

X 39.80
2
xn
2
i i
2.025
s i 1
i 1
0.1446 0.3803.
n 1 14 14
Calculm statistica tcalc pentru a putea s o comparm cu valoarea teoretic

M [ X ] x15 40 39.80
tcalc 2.0367 ,
x15 0.1446
15
s2
Deoarece tim c dispersia mediei de selecie verific relaia . Valoarea teoretic a2

n
lui t corespunztoare pragului de semnificaie 0.05 i 14 este 2.145 i atunci

intervalul de acceptare corespunztor l gsim ca fiind t , t t0.025 , t0.975 adic

2 1 2
(-2.145 , 2.145) . n figur reprezint suma ariilor haurate.

Valoarea calculat tcalc=2.0367 cade n acest interval, ceea ce nseamn c diferena dintre
media empiric i cea teoretic nu este semnificativ, adic marfa primit se accept c fiind
corespunztoare comenzii fcute.

Exemplul 2. [1] Presupunem c specificaiile pentru rezistena armturii pentru beton armat
cer ca valoarea medie s fie de 38 psi. Este esenial ca armturile folosite s aib rezistena
76
Probabiliti i Statistic matematic (Draft)
medie cerut. Dintre armturile livrate de ctre furnizor pentru constructor, s-au testat 25 de
bare i s-a constatat c media rezistenei armturilor testate este 37.5 psi.
a) Se presupune c se cunoate deviaia standard a rezistenei armturilor, 3 psi .
Constructorul este interesat doar de armturile cu rezistena medie mai mic dect 38 psi.
Soluie. Este indicat formularea ipotezei nule urmtoare:
H 0 : R 38 psi cu alternativa H1 : R < 38 psi
cnd se poate folosi test unilateral. Presupunnd c rezistena celor 25 de armturi este o

variabil aleatoare normal, R ~ N R , , atunci R ~ N R , , iar variabila
n

R R 37.5 38
redus Z ~ N 0, 1 . Atunci Z calc 0.833 . Pentru un nivel de
3
n 25
semnificaie de 5%, valoarea critic luat din tabela repartiiei normale standard
Z Z0.05 1 (0.05) 1 (0.95) 1.95 . Deoarece valoarea Z calc > Z 0.05 , adic se afl
n afara regiunii de respingere a ipotezei H0 , sau n zona de acceptare a ipotezei H0 , ceea
ce revine la a considera c armtura dat de furnizor respect specificaiile constructorului.
b) Se presupune c nu se cunoate deviaia standard a rezistenei armturilor.
Constructorul este interesat doar de armturile cu rezistena medie mai mic dect 38 psi.
Soluie. Este indicat formularea ipotezei nule urmtoare:
H 0 : R 38 psi cu alternativa H1 : R < 38 psi

R R
Din cele 25 de date se estimeaz s=3.5 psi i atunci variabila redus, T ~ t24 ,
s
n

R R 37.5 38
este repartizat Student cu (n-1)=24 grade de libertate. T 0.714 .
s 3.5
n 25
Pentru un nivel de semnificaie de 5%, valoarea critic luat din tabela repartiiei Student
T T0.05 t 1 (0.05) t 1 (0.95) 1.711. Deoarece valoarea Tcalc > T0.05 , adic se afl n
afara regiunii de respingere a ipotezei H0 , sau n zona de acceptare a ipotezei H0 , ceea ce
revine la a considera c armtura dat de furnizor respect specificaiile constructorului.

7.3.3.2. Compararea a dou medii empirice

Se cosider dou populaii P1 i P2 pentru care se studiaz aceeai proprietate ce determin


variabilele aleatoare X1 i X2 cu mediile M [ X i ] mi , i 1, 2 , i eantioanele Ei de

77
Probabiliti i Statistic matematic (Draft)
volum ni obinute prin sondaj n Pi , i 1, 2 , care determin variabilele de selecie X i* cu

mediile mi* M [ X i* ] . Sondajele le presupunem non-exhautive.


Ipoteza H0 :m1=m2 (cele dou medii nu difer semnificativ).
m1* m2*
Se consider variabila redus Z i se evideniaz urmtoarele situaii:
m m* *
1 2

i) Dispersiile Di D[ X i ] , i 1, 2 sunt cunoscute. Se tie c atunci cnd n1 , n2 30 sau

n1 , n2 30 dar X1, X2 sunt repartizate normal, mediile de selecie m1* , m2* au repartiii
normale i atunci Z este repartizat nornal.
ii) Dispersiile Di D[ X i ] , i 1, 2 sunt necunoscute. n acest caz se folosesc estimatorii

~
absolut coreci: Di
1 ni

ni 1 j 1
X i j mi*
2
, i 1, 2 .

Dac n1 , n2 30 atunci estimaia dispersiei lui d este

X X
n n
2 2
~ ~
j
m1* j
m2*

1 2
D1 D2 j 1 j 1
D m1 m2 D m1 D m2
* * * *

n1 n2 n1 n1 1 n2 n2 1

d 2 Dm1* m2* .

m1* m2*
Dac n1 , n2 30 , atunci Z nu mai are repartiia normal i fluctuaiile de
m m
* *
1 2

eantionare influenteaz substanial legea respectiv. Pentru a putea rezolva problema facem
ipoteza suplimentar c dispersiile necunoscute D1 , D2 sunt egale D1=D2=D i nu neaprat
cunoscute.
Se poate demonstra c dac variabila aleatoare teoretic are repartiia normal i sondajul este
d
non-exhaustiv, variabila redus Z are repartiia Student i deci se poate aplica testul t.
d
~
Lum pentru D media ponderat a estimatorilor lui D1 , D2, ponderile fiind date de
numrul gradelor de libertate 1 n1 1 , 2 n2 1 ,

X m1* X 2j m2*
n1 n2
j 2 2
~
~ D D
~
D 1 1 2 2 1
n 1D~1 n2 1D~2 j 1
1
j 1

1 2 n1 n2 2 n1 n2 2
adic
~ ~
D1 D2 ~ n1 n2
D[d ] D .
n1 n2 n
1 2
n

78
Probabiliti i Statistic matematic (Draft)
Variabila redus creia i se va aplica testul t este:

d d n1 n2 ~
t ~ , unde: ~ D , variabil aleatoare repartizat Student cu (n1+n2-2)
d n1 n2
grade de libertate.
Dac, n plus, cele dou selecii sunt de acelai volum, n1=n2=n , atunci

m1* m2* n
t , 2(n 1) .
~ 2
Exemplul 3. Pentru planificarea produciei unui anumit articol (de exemplu : ui metalice, ui
din lemn, tmplrie PVC etc.) s-a efectuat o anchet n rndul populaiei a dou regiuni, cu
scopul de a cunoate numrul eventualilor cumpratori ai articolului respectiv, obinndu-se
datele din tabelul urmtor:
Numr de persoane Eventualii beneficiari
Regiune Deviaia standard
chesionate (%)
R1 n1 =1200 m1* 72 ~1 10
R2 n2=250 m2* 70 ~2 9
Cum se va face planificarea calculndu-se o medie comun pentru cele dou regiuni sau
separat pentru fiecare regiune ?
Soluie. Volumele seleciilor fiind mari, se formeaz ipoteza nul H 0 m1 m2 .

d m1* m2* 2% ,
~ ~
D1 D2 102 92 d 2
D[d ] 0.41, d 0.41 0.64% , Z c 3.13 .
n1 n2 1200 250 d 0.64
0.99
Cu pragul de semnificaie 0.01, ( Z ) 0.495 , sau 2 ( Z ) 0.99 , iar din tabela
2
repartiiei normale standard avem Z 2.58 . Intervalul de acceptare a ipotezei H0 este
2

2.58 , 2.58 , iar valoarea statisticii este 3.13 n afara acestui interval, se respinge ipoteza
H0 , adic planificarea trebuie fcut pe regiuni.

7.3.3.3. Compararea unei frecvene relative cu o probabilitate


Fiind dat o populaie P ai crei indivizi au sau nu o caracteristic. Notnd cu A
evenimentul ca individul ales la ntmplare s posede caracteristica avut n vedere, avem

P(A)=p, iar pentru evenimentul contrar A , P A 1 p . Suntem n cazul unei experiene

Bernoulli. Estimm probabilitatea p prin frecvena p * f n .

79
Probabiliti i Statistic matematic (Draft)
Ipoteza nula: H 0 : p* p .

p(1 p)
Se poate demonstra c f n ~ N p,
pentru n , cu p cunoscut. Se
n
fn p
formeaz variabila redus Z calculat , se fixeaz se ia din tabela repartiiei
p (1 p )
n
normale standard cuantila Z i dac Z calculat Z a se accept ipoteza H0 , altfel se

respinge!
Exemplul 4. Se iau la ntmplare 100 de traverse de beton precomprimat de la o
ntreprindere de prefabricate i se constat c 12 au defecte. Se poate admite c proporia de
1
traverse defecte este de aa cum a fost stabilit prin contract cu un risc de 5% ?
6
1
Soluie. Frecvena observat este p* 0.12 . Se dorete a fi comparat cu p 0.17 .
6
Ipoteza H 0 : p* p i alternativa sa H 0 : p* p .

Admind c numrul de piese defecte este repartizat dup legea binomial Bi(100 ;p),

p(1 p) p* p
abaterea standard a frecvenei este s , Z calculat . Se face aproximarea cu
n s
legea normal i avem: PZ calculat Z a , 0.05 , Z 1 (0.975) 1.96 ,
1
2

p* p
Z 1 (0.025) 1.96 de unde reult c P Z :

2 s
p 1.96 s p* p 1.96 s , sau 0.0932 p* 0.2402 . Deoarece frecvena observat
aparine intervalului de ncredere se accept ipoteza H0, deci i contractul se deruleaz.

7.3.3.4. Compararea a dou frecvene relative

Fie p1 i p2 probabilitile realizrii aceluiai eveniment A, n dou populaii. Se pune


problema verificrii ipotezei: H 0 : p1 p2 , adic n cele dou populaii probabilitatea

evenimentului A este aceeai.


x1 x2
Verificarea ipotezei H0 se face au ajutoul frecvenelor relative f1 i f2 , de
n1 n2

apariie a evenimentului A n prima i a dou selecie.

80
Probabiliti i Statistic matematic (Draft)
f1 f 2
Se consider variabila redus Z care pentru volume mari n1 , n2 30 are
f 1 f2

repartiia normal.
p1 (1 p1 ) p2 (1 p2 )
D[ f1 f 2 ] D[ f1 ] D[ f 2 ] .
n1 n2

Deoarece acceptarea ipotezei H0 exprim numai egalitatea celor dou probabiliti p1 i

p2 , dar nu determin mrimea p, n cazul acceptrii ipotezei nule, va trebui estimat


probabilitatea p pe baza rezultatelor seleciilor. Ca estimaie a lui p se ia
n1 f1 n2 f 2 x1 x2
p* .
n1 n2 n1 n2

Exemplul 5. Pentru prevenirea coroziunii unor conducte se pot face preventiv dou
tratamente distincte T1 i T2. Tratamentul T1 s-a aplicat la 200 conducte i 10% dintre ele
au fost corodate. Tratamentul T2 s-a aplicat la 800 conducte i 15% dintre ele au fost
corodate. Se poate accepta cu riscul de 5% c diferena tratamentelor are o influen asupra
faptului de a fi corodate conductele ?
Soluie. Se aproximeaz legea binomial cu legea normal, volumele eantioanelor fiind
mari. Diferena proporiilor va fi o variabil aleatoare normal. Se pune problema dac
proporia conductelor corodate este semnificativ diferit n cele dou eantioane.
Ipoteza H0 : p1* p2* d p1* p2* ~ N 0, d .

0.1 0.9 0.15 0.85


Abaterea estimat a diferenei celor dou proporii : d 0.02469.
200 800
Intervalul de ncredere este n acest caz 1.96 d d 1.96 d 0.0484 d 0.0484 ,

iar diferena calculat dcalculat 0.15 0.1 0.05 nu cade n acest interval de ncredere.

Deci, ipoteza nul este respins la pragul de semnificaie de 5%.

7.4. Concordana dintre o distribuie empiric i una teoretic


Se pune problema racordrii unei variabile empirice Xe la o variabil teoretic X, care are
tabloul de repartiie
x1 x2 xn
n
x
X : , cu N N , sau X :
( x)
i
N N n
i 1
1 N2

81
Probabiliti i Statistic matematic (Draft)
adic se cerceteaz dac irul numeric al frecvenelor absolute empirice N i .. reflect
legitatea ipotetic a variabilei aleatoare teoretice. Rspunsul respectiv este util n aprecierea
caracteristicilor variabilei empirice prin prisma legitii variabilei teoretice.
Rezolvarea acestei probleme impune urmtoarele etape:
i) Estimarea parametrilor, facut innd seama de eventualele semnificaii ce le pot avea n
legtur cu caracteristicile repartiiei teoretice.
ii) Se construiete dup estimarea parametrilor variabila pseudoteoretic:
x1 x2 xn
~ n
X : , N N
i ,
N N 2 N n
i 1
1
facndu-se astfel legtura ntre variabila empiric Xe i cea teoretic X.
Determinarea frecvenelor absolute calculate N i se face cu ajutorul funciei de
probabilitate:
N i
f ( xi ) N N f ( xi ) , i 1, n .
N
iii) Verificarea concordanei dintre distribuia empiric i cea teoretic, adic se stabilete
dac diferenele ( N i N i ) sunt datorate unei simple ntmplri, deci nu sunt semnificative
sau diferenele sunt semnificative i atunci exist o neconcordan ntre repartiia teoretic i
cea empiric.
Verificarea concordanei se face prin teste de concordan aa cum s-a precizat nainte.

7.4.1. Testul de concordan


2

Testul de concordan 2 (hi ptrat) este datorat lui Karl Pearson. Pearson a artat c n
cazul unui sondaj nonexhaustiv n populaia chestionat, cnd probabilitile pi nu sunt
apropiate de 0 sau 1 iar produsele N i N pi , unde pi f ( xi ) , dup estimarea

parametrilor, nu sunt prea mici Ni 5 statistica de mai sus are repartiia 2 cu


n 1 k , n fiind numrul clase de valori observate, iar k numrul parametrilor estimai.
Cardinalul unei clase trebuie s fie mai mare dect 5 !
Pentru a aplica acest test se calculeaz statistica

calc
2

n
Ni Ni2
i 1 N i
Not. Numrul gradelor de libertate este strns legat de cantitatea de informaie de care se
dispune n cercetarea care se efectueaz; ea se reflect n volumul n al datelor

82
Probabiliti i Statistic matematic (Draft)
n
experimentale; (n-1) informaii independente, deoarece N
i 1
i N, i se mai pierde

informaie pentru determinarea celor k parametri estimai.



Pentru 30 i dat se determin cuantila 2; din tabele, P 2 2; i dac
calc
2
2; exist concordan, iar dac calc
2
2; nu exist concordan ntre cele dou

repartiii.
Exemplul 5. Se msoar diametrele a 500 de conducte din material plastic, luate la
ntamplare, i se obin rezultatele trecute Tabelul 1.
Tabelul 1
Diametrul
n <45 [45-47) [47-49) [49-51) [51-53) [53-55) [55-57) >57 Total
centimetri
Nr.
35 53 76 100 88 78 42 28 500
conducte

Se poate considera c repartiia diametrului conductelor este normal?


Soluie. Pentru determinarea estimatorilor pentru medie i dispersie, x , sn folosim datele
din Tabeleul 2.
Tabelul 2
Intervalul Mijlocul intervalului ~xi Frecvena absolut Ni
(43-45) 44 35
(45-47) 46 53
(47-49) 48 76
(49-51) 50 100
(51-53) 52 88
(53-55) 54 78
(55-57) 56 42
(57-59) 58 28
Total 500
n

N ~xi i
Estimarea mediei se face cu media aritmetic a valorilor observate: x i 1
50.78 .
N

83
Probabiliti i Statistic matematic (Draft)
n

x N
2
2
i i x
Estimarea dispersiei: sn i 1
14,0236 i abaterea medie patratic se estimeaz
N
cu 3.74 .

Se formuleaz ipoteza H0: Diametrul conductelor este o variabil aleatoare N (50.78, 3.74)

xi x xi 50.78
Se consider variabila redus Zi , ale crei valori sunt trecute n
sn 3.74
Tabelul 3, mpreun cu probabilitile teoretice corespunztoare.
Tabelul 3
Interval
diametrelor Zi (Z i ) pi N i
conductelor
45 -1,54 0.061 0.061 30.679
(45-47] -1,01 0.156 0.095 47.517
(47-49] -0,48 0.317 0.161 80.443
(49-51] 0,06 0.523 0.206 103.073
(51-53] 0,59 0.723 0.2 99.963
(53-55] 1,13 0.87 0.147 73.378
(55-57] 1,66 0.952 0.082 40.767
(57-59] 2,20 0.986 0.048 24.18
unde: pi ( xi ) ( xi1 ) , (x) fiind funcia de repartiie a variabilei aleatoare normale

standard, N i pi N 500 pi . Numrul gradelor de libertate n 1 k 8 1 2 5 .

Pentru 0.05 se gsete n tabelul repartiiei 2 cuantila 52;0.05 11.070 . Cu formula

calc
2

Ni Ni2 gsim valoarea calc
2
3.942 5;0.05
2
11.070 i cu pragul de
Ni

semnificaie de 5% ipoteza c repartiia empiric provine dintr-o populaie repartizat


N (50.78,3.74) nu poate fi respins. Ipoteza H0 se accept!

Urmtorul document MathCAD rezolva exemplul de mai sus.

84
Probabiliti i Statistic matematic (Draft)
Exemplu de aplicare a testului 2

Frecventele absolute

Numar conducte testate

Numarul claselor

Mijloacele intervalelor claselor

Determinam parametrii medie si dispersie

85
Probabiliti i Statistic matematic (Draft)

Abaterea medie patratica

Numarul gradelor de libertate =n-1-k ; k=2 numarul parametrilor determinati

H0: Diametrul conductelor este o variabila aleatoare repartizata N(50.78; 3.745)

Consideram variabila redusa

Probabilitatile teoretice

86
Probabiliti i Statistic matematic (Draft)
Calculam calculat

2 cu 5 grade de libertate in tabela repartitiei 2 este

Daca 2calculat este mai mic decat 2 se accepta ipoteza de normalitate

altfel se respinge

87
Probabiliti i Statistic matematic (Draft)
7.4.2.Testul lui Kolmogorov
Acest test are la baz urmtoarea teorem.
Teorema lui Kolmogorov. Fie X o variabil a crei funcie de repartiie F (x ) este

continu i X 1 , X 2 , ... , X n o selecie efectuat asupra sa. Fie Fn (x) funcia de repartiie
empiric (de selecie) asociat seleciei date, adic
numarul valorilor X i x
Fn ( x)
n

Atunci:

(1) e
k 2 2 k 2
lim P max Fn ( x) F ( x) K ( )
n
x n k
Funcia K ( ) se numete funcia lui Kolmogorov i exist tabele cu cuantilele ei.

Practic, testul lui Kolmogorov se aplic dup urmtoarea procedur:


- se formuleaz ipoteza H0: X are funcia de repartiie F (x ) ,
- se fixeaz un prag de semnificaie (de exemplu 0.05 ; 0.01; 0.025)
- se determina din tabelele funciei K ( ) astfel nct K ( ) 1 ,

- se ordoneaz crescator X (1) X ( 2) ... X ( n) ,

- se calculeaz Fn X (i ) i F X (i ) i diferentele di Fn X (i ) F X (i ) i 1, n ,

- se determina d max di
1 i n


- dac d se accept ipoteza H0 , altfel se respinge.
n
Observatie: parametrii repartitiei teoretice trebuie sa fie cunoscuti si nu determinati din
datele de observatie! In general acestia se determina prin simulare.

Exemplul 6. Direcia de organizare a unei bnci comerciale vrea s analizeze, n vederea unei
organizri mai raionale a personalului de servire, activitatea desfasurat la o agenie. n acest
scop se fac sondaje privind timpul de servire a unui depunator oarecare. Datele sunt trecute n
Tabelul 4, care conine intervalele de timp de servire msurate n minute, centrele
intervalelor, frecvenele absolute i apoi adaugat coloana xN x .
Pe baza datelor culese (coninute n Tabelul 4) s se stabileasc natura timpului de servire a
unui depuntor.

88
Probabiliti i Statistic matematic (Draft)
Rezolvare. Pentru a stabili alura repartiiei teoretice, vom face histograma timpilor de servire
a unui depuntor.
Tabelul 4
de servire Centrul intervalului Frecvena absolut xN x
xi 1, xi x Nx

(1.5 - 2) 1,75 49 85.75


(2 2.5) 2,25 30 67.5
(2.5 3) 2,75 10 27.5
(3 3.5) 3,25 5 16.25
(3.5 4) 3,75 5 18.75
(4 4.5) 4,25 4 18
(4.5 5) 4,75 2 9.5
(5 5.5) 5,25 2 10.5
(5.5 6) 5,75 1 5.75
(6 6.5) 6,25 0 0
(6.5 7) 6,75 0 0
(7 7.5) 7,25 1 7.25
(7.5 8) 7,75 2 15.5
(8 8.5) 8,25 1 8.25
Total 112 observaii 289.5
Reprezentarea grafic a frecvenelor

Observnd alura putem formula ipoteza


H0: timpul de servire este o variabila exponenial Exp( )

89
Probabiliti i Statistic matematic (Draft)
Presupunem ca timpul de servire a unui client este ts 2.5 min , parametrul repartiiei
1
0.4 depunatori servii pe minut.
2 .5
Funcia de repartiie teoretic este : Exp( 0.4 ) , adic F ( x ) 1 e x 1 e 0.4 x
Calculele necesare aplicrii testului Kolmogorov le trecem n Tabelul 5.
Tabelul 5
Funcia empiric
Interval de Frecvena de repartiie Funcia de
servire absolut Ny repartiie teoretic di Fn X (i ) F X (i )
xi 1, xi Nx Fn ( x) y x F ( x ) 1 e 0.4x
Nx
(1.5 - 2) 49 0.438 0.503415 0.065415
(2 2.5) 30 0.705 0.59343 0.11157
(2.5 3) 10 0.794 0.667129 0.126871
(3 3.5) 5 0.840 0.727468 0.112532
(3.5 4) 5 0.884 0.77687 0.10713
(4 4.5) 4 0.920 0.817316 0.102684
(4.5 5) 2 0.938 0.850431 0.087569
(5 5.5) 2 0.955 0.877544 0.077456
(5.5 6) 1 0.964 0.899741 0.064259
(6 6.5) 0 0.964 0.917915 0.046085
(6.5 7) 0 0.964 0.932794 0.031206
(7 7.5) 1 0.973 0.944977 0.028023
(7.5 8) 2 0.991 0.954951 0.036049
(8 8.5) 1 1 0.963117 0.036883
Total 112
Max=0.126871
observaii
Lund pragul de semnificaie 0.01, se gsete n tabela funciei
K ( ) , K 0.99 , 1.63 . n exemplul de mai sus n=14 i atunci

1.63 1.63
0.436 . Deoarece d = 0.126871< 0.436 se accept ipoteza H0, potrivit
n 14 3.74
creia timpul de servire al unui depuntor este o variabil aleatoare exponenial de
parametru 0.4 i n calculele privind optimizarea se poate folosi pentru timpul de
servire, legea Exp( 0.4 ) .
Urmtorul document MathCAD rezolva exemplul de mai sus.

90
Probabiliti i Statistic matematic (Draft)
Testul Kolmogorov

Mijlocul intervalelor de timp Frecvente absolute

1.75 49

2.25 30
2.75 10

3.25 5
3.75 5

4.25 4
4.75 2
Tmij Fr_abs
5.25 2
5.75 1

6.25 0
6.75 0

7.25 1
7.75 2

8.25 1

Numar de intervale
Numar de observatii

n last( Tmij) n 14
N
Fr_abs N 112

Media timpilor observati


ts=2.5

Parametrul repartitiei exponentiale

=0.4 x
F ( x) 1 e

91
Probabiliti i Statistic matematic (Draft)
Ipoteza H0 : Timpii observati pot fi considerati repartizati Exp()

Distanta dintre functia empirica de repartitie si cea teoretica

i 1 n Fr_absj
j1
di F Tmiji 0.25
N

D max( d) D=0.126871

Functia lui Kolmogorov

10000
k 2 k
2 2
K ( ) ( 1) e
k 10000

Determinarea lui pentru un dat

0.99 1

root(K ( ) )

1.628
0.435
n


Deoarece 0.435 > D= 0.126871se accepta ipoteza H0
n

92
Probabiliti i Statistic matematic (Draft)

Partea a patra

8. Elemente de analiz dispersional

8.1. Concepte
Este frecvent situaia n care trebuie comparate ntre ele mai mult dect dou caracteristici
ale unei populaii statistice.
Punerea problemei: Se dispune de eantioanele E1 , E2 , ..., El de volume ni , i 1, l ale

unei populaii, care determina variabilele de selecie X i* i pentru care pot fi determinate
~
mediile de selecie mi* i chiar dispersiile de selecie Di , i 1, l , astfel


ni
1 ~ 1 ni
X i, j , Di
2
mi* X i , j mi*
ni j 1 ni 1 j 1
organizate sub forma tabelului
Mediile Grade de
Volumul Valorile de selecie Dispersiile
Eantion de libertate
eantionului (experimentale) de selecie
selecie i ni 1
E1 n1
X 1* X 1,1, X 1, 2 ,..., X1, n1 m1*
~
D1 1 n1 1

X
E2 n2 ~ 2 n2 1
X 2* 2,1 , X 2, 2 ,..., X 2,n2 m2* D2


El nl
X l* X l ,1 , X l , 2 ,..., X l ,nl ml*
~
Dl l nl 1

Problema care se pune se poate referi la mediile de selecie mi* sau la dispersiile de selecie
~
Di , i 1, l .

Presupunnd c proprietatea cercetat caracterizeaz mediile de selecie mi* se pune


ntrebarea dac pot fi considerate ca estimaie ale aceleiai medii teoretice m, adic
eantioanele Ei provin din aceeai populaie P .
Avem de fapt ipoteza nula: H0 : m1* m2* ... ml* cu alternativa H1 = mediile nu sunt
toate egale
n caz c H0 se accept se spune c populaia este omogen relativ la caracteristica
studiat. n caz contrar, populaia este eterogen.

93
Probabiliti i Statistic matematic (Draft)
La fel se pune problema cnd caracteristica studiat este determinat de dispersiile
~
Di , i 1, l , dar metodele sunt deosebite.

8.2. Testarea omogenitii cnd aceasta este caracterizat de mediile de selecie


Metoda aceasta este datorat lui Student i Fischer.
Se consider c populaia este repartizat normal, sondajul este non-exhaustiv i se admite
ipoteza c exist dispersia teoretic D.
Definim n cele ce urmeaz noiuni necesare n testarea omogeneitii.
1 l ni l
- medie de selecie global: m* i, j
N i 1 j 1
X , N
i 1
ni ;

- dispersia intraclase (sau rezidual Dr): Fiecare eantion Ei, corespunztor unei
~
subpopulaii Pi , are ca estimatori absolut coreci pentru dispersia Di, Di , i 1, l ,
absolut coreci. Se ia ca estimator al lui D,
l n
1 ~
Dr
r

i 1
i Di , i ni 1 , i 1, l , r i N l .
i 1

Acest estimator se numete dispersia intraclase, deoarece folosete dispersiile


~
Di , i 1, l din interiorul eantioanelor.

Facnd nlocuirile obinem: Dr


1 l ni

N l i 1 j 1
2
X i , j mi* .
- dispersia interclase Dc. Mediile mi* pot fi considerate ca valori ale mediei globale

m* . Exist pentru fiecare eantion (clas) o abatere mi* m* realizat cu frecvena ni.

Se numete dispersia interclase valoarea Dc


1 l
l 1 i 1

mi* m*
2
.

- dispersia global: Variabila global de selecie X * X i , j i l are o medie de


1 j ni

~
selecie global m* i o dispersie global Dg
1 l ni

N 1 i 1 j 1
2
X i , j mi* .

8.2.1. Testarea omogenitii populaiei


Dispersia intraclase Dr att n cazul omogenitii ct i n cazul eterogenitii constitue un
estimator absolut corect al dispersiei comune D, n timp ce dispersia interclase Dc,
estimeaz absolut corect dispersia D numai n cazul omogenitii.
94
Probabiliti i Statistic matematic (Draft)
Verificarea omogenitii mediilor de clas (eantioane) se face prin compararea a dou
dispersii: Dr i Dc folosind testul F. Aceast metoda de lucru se numete analiz
dispersional.

8.2.2 Procedur practic de aplicare a testului F:

Dr
- se determin Dr i Dc , r N l , c l 1 , Fcalculat , pentru Dr Dc sau
Dc

Dc
Fc pentru Dr Dc ;
Dr

- se fixeaz un prag de semnificaie pentru i se ia din tabela repartiiei Fisher-


Snedecor Fa ; c , r , -cuantila corespunztoare pentru c , r grade de libertate;

- dac Fcalculat Fa; c , r se accept ipoteza de omogenitate, altfel se respinge.

8.3. Cercetarea aciunii simultane a doi factori


Vom folosi metoda analizei dispersionale privind studiul simultan a doi factori.
Se consider doi factori A i B susceptibili de a avea l i respectiv n modaliti de
aplicare asupra elementelor unei populaii P , i o anumit caracteristic a acestor elemente
care este sau nu este influenat de unul sau ambii factori.
n urma observaiilor s-a constatat c fiecrui cuplu A , B , 1 i l , 1 j n
i j i

corespunde o valoare Xi,j i aceste date s-au trecut ntr-un tabel de forma:
Bj 1 n
Ai
B1 B2 Bn X i, j
n j 1
A1 X1,1 X1,2 c X1,n m1*, 0

A2 X2,1 X2,2 X2, n m2*, 0


Al Xl,1 Xl,2 Xl, n ml*, 0
l

m *
i, 0
1 l i 1
X i, j
n i1
m0*,1 m0*, 2 m0*, n
n

m
j 1
*
0, j

Ultima coloana conine mediile pe linii, iar ultima linie mediile pe coloane.

95
Probabiliti i Statistic matematic (Draft)
l n l n

X i , j
i 1 j 1
m *
i, 0 m
j 1
*
0, j

Media global: m* i 1

l n l n
Metoda analizei dispersionale const n urmtorii pai:
- construirea unor estimatori ai dispersiei comune D a populaiei P ( P se consider
omogen relativ la factorii A i B; variabila aleatoare X se consider repartizat
normal).
- Se testeaz ipoteza H0: privind egalitatea mediilor.

Se pornete de la identitatea: X i , j m* m0*, i m* m*j , 0 m* X i , j m0*, i m*j , 0 m* i
notm i , j X i , j m0*, i m*j , 0 m* . Rezult X i , j m* m0*, i m m
* *
j, 0
m* i , j .

Ridicm la ptrat, nsumm dup i i j i renunm la termenii micti, i obinem ecuaia


analizei dispersionale relativ la doi factori:

X
l n l n l n
m* n m0*, i m* l m*j , 0 m* i , j
2 2 2
i, j
i 1 j 1 i 1 j 1 i 1 j 1

Se noteaz :


l n
variaia global S g2 X i , j m* ,
2
-
i 1 j 1

- variaia interclase relativ la componentele factorului A (variaia interlinii)


l
Sic2 n m0*, i m* S A2 ,
2

i 1

- variaia interclase relativ la componentele factorului B (variaia intercoloane)


n
S 2jc l m*j , 0 m* S B2 ,
2

j 1

l n
- variaia rezidual S i , j . 2
r
i 1 j 1

Cu aceste notaii ecuaia analizei dispersionale pentru doi factori se poate scrie:
S g2 S A2 S B2 Sr2 .

Se consider urmtoarele ipoteze de lucru:


a) omogenitatea relativ la ambii factori,
b) repartiia teoretic este cea normal,
c) dispersia comun este D.
Se consider ca estimatori ai dispersiei comune urmtoarele cantiti:

96
Probabiliti i Statistic matematic (Draft)
i) dispersia global: Dg
1 l n
i, j
N 1 i 1 j 1
X m* 2
S g2

S g2
n l 1 g
, g n l 1 , unde g

reprezint numrul gradelor de libertate;

ii) dispersia interlinii: DA


1 l

i, 0
l 1 i 1
m *
m
* 2

S A2

l 1 A
S A2
, A l 1,

unde A reprezint numrul gradelor de libertate;

iii) dispersia intercoloane: DB


1 n *
0, j
n 1 j 1
m m * 2

S B2

n 1 B
S B2
, B n 1

unde B reprezint numrul gradelor de libertate;


iv) dispersia rezidual:

S r2 S2
l n
r , r n 1l 1 .
1

2
Dr X i , j mi*, 0 m0*, j m*
n 1l 1 i 1 j 1 n 1l 1 r
Remarc. Dispersiile DA i DB sunt estimatori absolut coreci n cazul omogenitii i nu
sunt absolut coreci n cazul eterogenitii: M DA D , M DB D .
Dr este un estimator absolut corect fie c este sau nu este ndeplinit omogenitatea
populaiei.

Pentru a testa absena sau prezena interveniei factorului A n valorile empirice Xi, j , se va
compara dispersia DA cu Dr folosind testul F:

DA S2 l 1
FA (n 1) A2 cu A .
Dr Sr r (l 1)(n 1)

DB S2 n 1
Analog pentru factorul B: FB (l 1) B2 cu B .
Dr Sr r ( l 1 )( n 1 )

97
Probabiliti i Statistic matematic (Draft)
Partea a IV-a

ntrebri pentru colocviul la disciplina Probabiliti i Statistic matematic

Chestiuni teoretice
1. Ce se nelege prin evenimente independente?
2. Ce se nelege prin evenimente contrare? Dai exemple!
3. Ce se nelege prin probabilitatea evenimentului A condiionat de evenimentul B?
Cum se calculeaz aceast probabilitate?
4. Ce se nelege prin variabil aleatoare?
5. Cum se defineste funcia de repartiie a unei variabile aleatoare?
6. Ce este densitatea de repartiie?
7. S se calculeze funcia de repartiie a variabilei aleatoare definit prin tabelul de
repartiie de mai jos:
0 1 2 3 4
X :1 2 1 5 3

8 8 8 16 16
8. Care sunt caracteristicile unei variabile aleatoare incluse n clasa tendina central de
grupare i ce semnificaie au?
9. Care sunt caracteristicile unei variabile aleatoare incluse n clasa forma graficului de
distribuie i ce semnificaie au?
10. Care sunt caracteristicile unei variabile aleatoare incluse n clasa mprtierea
distribuiei i ce semnificaie au?
11. Cum se masoar asimetria unei repartiii?
12. Cum se msoar boltirea unei repartiii? Cu cine se compar acest coeficient?
13. Ce repartiii discrete utilizate frecvent n inginerie cunoatei?
14. Ce repartiii continue utilizate frecvent n inginerie cunoatei?
15. Care este densitatea de repartiie pentru o variabil aletoare normal standard?
16. Ce se nelege prin variabila aleatoare redus?
17. Care este legatura dintre o variabil aleatoare lognormal i normal?
18. Care este legatura dintre o variabil aleatoare Student i normala standard?
19. Care este legatura dintre o variabil aleatoare Ficher-Snedecor F , i normala
1 2

standard?
20. Care este legatura dintre o variabil aleatoare 2 i normala standard?

98
Probabiliti i Statistic matematic (Draft)
21. Ce se nelege prin populaie statistic ? Ce moduri de colectare a informaiei asupra
unei populaii statistice cunoatei ?
22. Ce se nelege prin eantion reprezentativ asupra unei populaii statistice ?
23. Ce modaliti de reprezentare grafic a repartiiilor de frecven cunoatei ?
24. Ce este histograma? Dar poligonul frecvenelor?
25. Ce se nelege prin estimator al unui parametru statistic?
26. Cnd un estimator este absolut corect? Dar nedeplasat?
27. Cnd un estimator este consistent? Dar corect?
28. Avnd 1* i 2* , 2 estimatori pentru parametrul , cnd 1* este mai bun dect 2*?
29. Ce este funcia de verosimilitate ?
30. Ce se nelege prin estimator de verosimilitate maxim? Dar prin estimator eficient?
31. Care sunt estimatorii de verosimilitate maxim pentru parametrii repartiiei normale?
32. Ce estimator pentru medie cunoatei? Dar pentru dispersie?
33. Ce se nelege prin ipotez statistic?
34. Ce se nelege prin ipoteza nul?
35. Ce se nelege prin test statistic ?
36. Ce este domeniul critic sau regiunea critic a unui test statistic?
37. Ce este riscul de genul nti? Dar de genul al doilea?
38. Care sunt etapele verificrii ipotezelor statistice?
39. Ce se nelege prin test de concordan ? Ce test de concordan cunoatei?
40. Cum se testeaz concordana dintre repartiia teoretic i cea empiric?
41. n ce situaie se recomand utilizarea testului t ?
42. n ce situaie se recomand utilizarea testului 2 ?
43. Ce se nelege prin interval de ncredere pentru un parametru ?
44. Ce se nelege prin funcie de regresie?
45. n ce const Metoda celor mai mici ptrate?
46. Ce erori pot afecta datele rezultate din msurtori?
47. Cum de poate verifica dac un set de date de msurtori este afectat de erori aberante?
48. Cum de poate verifica dac un set de date de msurtori este afectat de erori
sistematice?
49. Ce soft-ware cunoatei pentru ajustarea datelor de msurtori?
50. Cum se cuantific adecvana funciei de regresie propus?

99
Probabiliti i Statistic matematic (Draft)

Exemplu de aplicaie practic


Tema 1

1. S se determine funcia de regresie pentru datele aflate n fiierul Tema1.dat,


precizndu-se adecvana funciei alese.
2. S se stabileasc dac datele din fiierul Tema1.prn sunt afectate de erori aberante
3. S se determine:
a. Histograma cu funcia empiric de repartiie
b. Media
c. Mediana
d. Modul (dac este cazul!)
e. Dispersia
f. Abaterea medie patratic
g. Amplitudinea
h. Skewness-ul
i. Kurtosis-ul
j. Intervalul de ncredere inter pentru medie corespunztoare datelor din fiierul
Tema1.xls

100
Probabiliti i Statistic matematic (Draft)

Bibliografie
1. Ang, A. H-S. i Tang, W. H.: Probability Concepts in Engineering, Emphasis on
Application to Civil and Environmental Engineering, John Wiley & Sons, Inc. 2007.
2. Armeanu, I. i Petrehu, V.: Probabiliti i statistic aplicate n biologie, Ed.
MatrixROM, Bucureti, 2006.
3. Ciuiu, D.: Teoria probabilitilor i statistic matematic, Ed. Conspress, Bucureti,
2008.
4. Costinescu, C., Popescu, S.-A., Mierlu-Mazilu,I.: Probabiliti i statistic
matematic, Ed. Conspress, Bucureti, 2005.
5. Petrehu, V. i Popescu , A.-S. Popescu: Probabiliti i Statistic (teorie, exemple,
probleme), Ed. UTCB, 1997.

101

S-ar putea să vă placă și