Documente Academic
Documente Profesional
Documente Cultură
Teoria probabilitatilor elaboreaza modele matematice ale proceselor si sistemelor influentate de factori aleatori.
Statistica matematica confrunta aceste modele cu realitatea, pentru a determina daca ele sunt potrivite pentru
diverse scopuri practice. Aceasta se face prin predictii, decizii si actiuni, spre exemplu n analiza pietei, planificarea
productiei, cumpararea de echipamente, investitii, etc. Procesul de verificare a modelelor matematice se numeste
deductie statistica.
n acest scop, din populatia studiata se aleg selectii aleatoare (sau esantioane), acestea fiind o submultime
a populatiei studiate. Spre exemplu, se masoara diametrele a 10 suruburi dintr-un lot de suruburi, se nregistreaza
venitul mediu a 100 familii dintr-o anumita zona, sau se nregistreaza valorile aruncarii de 5 ori a unui zar.
Cele mai importante dintre deductii statistice sunt estimarea parametrilor si testarea ipotezelor, cu apli-
catii n controlul calitatii productiei si al acceptarii/respingerii loturilor de produse.
9.1 Introducere
Statistica matematica consta n diverse metode avnd ca scop de a obtine informatii despre diverse probleme
practice (spre exemplu explorarea legaturilor dintre continutul de fier si densitatea unui zacamnt de fier, calitatea
produselor, eficienta anumitor aparate, performantele anumitor masini, reactia consumatorilor la aparitia unui nou
produs, etc).
Variabilele aleatoare apar n mod natural n diverse probleme statistice practice n inginerie. Spre exemplu,
proprietatile produselor (becuri, suruburi, etc) au ntotdeauna variatii aleatoare de la valorile exacte, datorita unor
variatii mici, incontrolabile, n materia bruta folosita sau datorita procesului de productie. Spre exemplu, diametrul
unui surub este o variabila aleatoare , si consideram ca surubul este fara defectiuni daca diametrul este n limitele
de toleranta sau cu defectiuni, daca diametrul acestuia depaseste limitele de toleranta admise. n acest caz, ne
putem pune problema determinarii distributiei variabilei aleatoare , a procentului mediu de suruburi defecte/fara
defecte produse, sau a necesitatii mbunatatirii calitatii productiei (spre exemplu prin achizitionarea de echipamante
cu o precizie mai buna).
n acest scop, alegem un esantion din populatia n cauza (20 de suruburi dintr-un lot de 1000, 100 de votanti
din ntreaga populatie de 5000, etc), deoarece inspectarea ntregii populatii ar fi prea costisitoare (att din punct
de vedere financiar ct si al timpului necesar), imposibila, sau fara rost (spre exemplu testarea ntregii productii de
becuri a unei fabrici ar duce la falimentarea acesteia!).
Pentru ca rezultatele statistice obtinute sa fie valide, esantionul trebuie ales n mod aleator. Aceasta nseamna
spre exemplu ca fiecare din cele 1000 de suruburi ar trebui sa aiba aceeasi probabilitate de a fi ales n esantionul
de 20 de suruburi selectat. Numai n acest caz media de selectie = 1 ++ 20
20
a valorilor selectate va fi o buna
estimare a medie reale a ntregii populatii de suruburi. Crescnd voumul al esantionului, aproximarea va deveni
n general mai buna.
De asemenea, valorile esantionului trebuie sa fie independente. Valorile selectate sunt n general independente
daca populatia studiata este infinita si daca selectia se face cu nlocuire. n cazul unei populatii mari (finite), daca
se alege un esantion de volum mic (spre exemplu 5 sau 10 din 1000 obiecte), valorile obtinute sunt de asemenea
aproximativ independente. Daca nsa se alege un esantion de volum mare dintr-o populatie finita, sau daca alegerea
esantionului se face fara nlocuire, efectul dependentei este considerabil (deductiile statistice obtinute pot fi n acest
caz eronate).
Diversele generatoare de numere aleatoare (din Excel, Maple, Mathematica, sau din alte produse software)
sunt utile n alegerea unei esantion care sa reprezinte o selectie aleatoare din populatia considerata. Spre exemplu,
daca celor 1000 obiecte ale unei populatii le sunt atribuite numere de la 1 la 1000 si se genereaza 20 de numere
aleatoare din multimea {1 2 1000}, alegnd obiectele corepunzatoare din populatie se obtine o selectie aleatoare
de volum 20 din populatia considerata.
Diversele caracteristici ale esantionului ales pot fi descrise prin reprezentari grafice (histograme, reprezentari prin
puncte, etc) sau prin caracteristici numerice (spre exemplu prin media de selectie = ++
sau prin dispersia
2 1
P 2
de selectie = 1 =1 ( ) , unde 1 sunt valorile numerice ale selectiei, iar reprezinta volumul
selectiei).
41
Un estimator punctual al unui parametru este un numar (un punct pe axa reala) calculat folosind valorile
esantionului considerat, ce serveste ca o aproximare a parametrului necunoscut.
Un interval de estimare este un interval (numit si interval de ncredere) calculat folosind valorile esantionului
considerat, si care contine parametrul necunoscut cu o anumita probabilitate.
Spre exemplu, ca o aproximare a mediei a unei populatii putem considera media de selectie . Aceasta conduce
la estimatorul = al lui , adica
1 + +
= = (48)
unde 1 sunt valorile observate ale selectiei iar este volumul acesteia.
Similar, un estimator c2 al dispersiei 2 al unei populatii este dispersia de selectie 2 , adica
c2 = 2 = 1 X 2
( ) (49)
1 =1
Formulele anterioare sunt estimatori ai parametrilor pentru distributii n care si 2 apar explicit ca parametrii,
spre exemplu n cazul distributiei normale sau a distributiei Poisson. n cazul distributiei binomiale avem parametru
necunoscut , si cum n acest caz avem = (sau echivalent = ) obtinem pentru estimatorul
= (50)
Formulele anterioare sunt cazuri particulare de estimatori obtinuti prin metoda momentelor. n aceasta
metoda de estimare a parametrilor, parametrul necunoscut se scrie n functie de momentele distributiei populatiei.
nlocuind n formula rezultata momentele de ordin prin momentele de ordin ale selectiei
1X
=
=1
42
Observatia 9.1 n practica este deseori utila urmatoarea observatie. Deoarece functia logaritm este o functie strict
crescatoare, functia ln si atinge maximul n acelasi punct cu functia . Pentru determina punctul n care
functia si atinge maximul, putem echivalent determina punctul n care functia ln si atinge maximul. Putem
deci nlocui ecuatia (53) prin ecuatia
ln
= 0 (54)
ecuatie care este echivalenta cu (53), dar este n general mai usor de rezolvat.
n cazul n care functia depinde de mai multi parametrii necunoscuti 1 , rezolvam ecuatiile (53)
corespunzatoare fiecaruia din parametrii necunoscuti 1 , sau echivalent ecuatiile (54), adica rezolvam
sistemul
1 = 0
(55)
= 0
sau echivalent sistemul ln
1 =0
(56)
ln
= 0
n raport cu 1 .
Valorile astfel determinate dau estimatorii de verosimilitate maxima b1 b pentru parametrii necunoscuti
1 .
Exemplul 9.2 Sa se determine estimatorii de verosimilitate maxima pentru media si abaterea patratica medie
n cazul distributiei normale.
n acest caz, folosind faptul ca functia de densitate a variabilei aleatoare N 2 este
1 ()2
() = 22
2
obtinem ca functia de verosimilitate este
= (1 ) ( )
1 (1 )2 1 ( )2
= 22 22
2 2
1 (1 )2 ++( )2
= 22
2
Logaritmnd, obtinem
(1 )2 + + ( )2
ln = ln 2 ln
2 2
Sistemul (56) devine n acest caz
ln (
(1 )++( )
=0 2 =0
ln (1 )2 ++( )2
=0 + 3 = 0
Din prima ecuatie din sistem se obtine 1 + + = 0, si deci estimatorul al lui este dat de
1 + +
= =
Din a doua ecuatie din sistem se obtine
(1 )2 + + ( )2
2 =
si nlocuind pe prin estimatorul din relatia anterioara obtinem pentru estimatorul
s
2 2
(1 ) + + ( )
=
43
Exercitii
Exercitiul 9.1 Sa se determine estimatorul de verosimilitate maxima al dispersiei distributiei normale N 0 2
cu medie = 0.
Exercitiul 9.2 Sa se determine estimatorul de verosimilitate maxima al medie a distributiei normale N 20
cu dispersie cunsocuta 0 .
Exercitiul 9.3 Sa se estimeze parametrul al distributiei Poisson prin metoda verosimilitatii maxime.
Exercitiul 9.5 Sa se calculeze estimatorul punctual obtinut n exercitiul anterior n cazul esantionului 19, 04,
07, 06, 14. Sa se reprezinte grafic functia de distributie () corepunzatoare esantionului si functia de distributie
() a variabilei aleatoare pentru = . Sunt cele doua grafice aproximativ egale?
Exercitiul 9.6 Acelasi exercitiu n cazul esantionului 04, 07, 02, 11, 01.
Exercitiul 9.8 Sa se estimeze parametrul al distributiei binomiale prin metoda versoimilitatii maxime.
Exercitiul 9.9 n exercitiul anterior, sa presupunem ca n 4 ncercari succesul a aparut de 2 ori, n alte 4 ncercari
succesul a aparut de 3 ori, iar n alte 4 ncercari experimentul a aparut de 2 ori. Sa se estimeze probabilitatea de
aparitie a succesului.
Exercitiul 9.10 Mai general, sa presupunem ca s-au efectuat de ori cte ncercari, si ca n primele ncercari
succesul a aparut de 1 ori, n urmatoarele ncercari succesul a aparut de 2 ori, . . . , n ultimele ncercari
succesul a aparut de ori. Sa se estimeze probabilitatea de aparitie a succesului.
Exercitiul 9.11 ntr-un sir de ncercari de tip Bernoulli, consideram variabila aleatoare reprezentnd numarul
de ncercari pna la aparitia succesului.
a) Sa se arate ca functia de probabilitate a variabilei aleatoare este
1 {1 2 3 }
() =
0 rest
Exercitiul 9.13 La aruncarea unui zar, sa presupunem ca primul sase a aparut la a saptea ncercare, si ca repetnd
din nou experimentul, primul sase a aparut la a sasea ncercare. Sa se estimeze probabilitatea de aparitie a fetei
sase.
Indicatie: a se vedea cele doua exercitii anterioare.
44