Sunteți pe pagina 1din 4

9 Statistica matematica

Teoria probabilitatilor elaboreaza modele matematice ale proceselor si sistemelor influentate de factori aleatori.
Statistica matematica confrunta aceste modele cu realitatea, pentru a determina daca ele sunt potrivite pentru
diverse scopuri practice. Aceasta se face prin predictii, decizii si actiuni, spre exemplu n analiza pietei, planificarea
productiei, cumpararea de echipamente, investitii, etc. Procesul de verificare a modelelor matematice se numeste
deductie statistica.
n acest scop, din populatia studiata se aleg selectii aleatoare (sau esantioane), acestea fiind o submultime
a populatiei studiate. Spre exemplu, se masoara diametrele a 10 suruburi dintr-un lot de suruburi, se nregistreaza
venitul mediu a 100 familii dintr-o anumita zona, sau se nregistreaza valorile aruncarii de 5 ori a unui zar.
Cele mai importante dintre deductii statistice sunt estimarea parametrilor si testarea ipotezelor, cu apli-
catii n controlul calitatii productiei si al acceptarii/respingerii loturilor de produse.

9.1 Introducere
Statistica matematica consta n diverse metode avnd ca scop de a obtine informatii despre diverse probleme
practice (spre exemplu explorarea legaturilor dintre continutul de fier si densitatea unui zacamnt de fier, calitatea
produselor, eficienta anumitor aparate, performantele anumitor masini, reactia consumatorilor la aparitia unui nou
produs, etc).
Variabilele aleatoare apar n mod natural n diverse probleme statistice practice n inginerie. Spre exemplu,
proprietatile produselor (becuri, suruburi, etc) au ntotdeauna variatii aleatoare de la valorile exacte, datorita unor
variatii mici, incontrolabile, n materia bruta folosita sau datorita procesului de productie. Spre exemplu, diametrul
unui surub este o variabila aleatoare , si consideram ca surubul este fara defectiuni daca diametrul este n limitele
de toleranta sau cu defectiuni, daca diametrul acestuia depaseste limitele de toleranta admise. n acest caz, ne
putem pune problema determinarii distributiei variabilei aleatoare , a procentului mediu de suruburi defecte/fara
defecte produse, sau a necesitatii mbunatatirii calitatii productiei (spre exemplu prin achizitionarea de echipamante
cu o precizie mai buna).
n acest scop, alegem un esantion din populatia n cauza (20 de suruburi dintr-un lot de 1000, 100 de votanti
din ntreaga populatie de 5000, etc), deoarece inspectarea ntregii populatii ar fi prea costisitoare (att din punct
de vedere financiar ct si al timpului necesar), imposibila, sau fara rost (spre exemplu testarea ntregii productii de
becuri a unei fabrici ar duce la falimentarea acesteia!).
Pentru ca rezultatele statistice obtinute sa fie valide, esantionul trebuie ales n mod aleator. Aceasta nseamna
spre exemplu ca fiecare din cele 1000 de suruburi ar trebui sa aiba aceeasi probabilitate de a fi ales n esantionul
de 20 de suruburi selectat. Numai n acest caz media de selectie = 1 ++ 20
20
a valorilor selectate va fi o buna
estimare a medie reale a ntregii populatii de suruburi. Crescnd voumul al esantionului, aproximarea va deveni
n general mai buna.
De asemenea, valorile esantionului trebuie sa fie independente. Valorile selectate sunt n general independente
daca populatia studiata este infinita si daca selectia se face cu nlocuire. n cazul unei populatii mari (finite), daca
se alege un esantion de volum mic (spre exemplu 5 sau 10 din 1000 obiecte), valorile obtinute sunt de asemenea
aproximativ independente. Daca nsa se alege un esantion de volum mare dintr-o populatie finita, sau daca alegerea
esantionului se face fara nlocuire, efectul dependentei este considerabil (deductiile statistice obtinute pot fi n acest
caz eronate).
Diversele generatoare de numere aleatoare (din Excel, Maple, Mathematica, sau din alte produse software)
sunt utile n alegerea unei esantion care sa reprezinte o selectie aleatoare din populatia considerata. Spre exemplu,
daca celor 1000 obiecte ale unei populatii le sunt atribuite numere de la 1 la 1000 si se genereaza 20 de numere
aleatoare din multimea {1 2 1000}, alegnd obiectele corepunzatoare din populatie se obtine o selectie aleatoare
de volum 20 din populatia considerata.
Diversele caracteristici ale esantionului ales pot fi descrise prin reprezentari grafice (histograme, reprezentari prin
puncte, etc) sau prin caracteristici numerice (spre exemplu prin media de selectie = ++

sau prin dispersia
2 1
P 2
de selectie = 1 =1 ( ) , unde 1 sunt valorile numerice ale selectiei, iar reprezinta volumul
selectiei).

9.2 Estimarea parametrilor


Una din problemele statisticii matematice este estimarea parametrilor. n problemele practice se presupune n
general ca populatia studiata are o distributie cunoscuta ce depinde de anumiti parametrii ce urmeaza a fi estimati.
Spre exemplu, parametrul n cazul distributiei binomiale, sau parametrii si 2 n cazul distributiei normale.

41
Un estimator punctual al unui parametru este un numar (un punct pe axa reala) calculat folosind valorile
esantionului considerat, ce serveste ca o aproximare a parametrului necunoscut.
Un interval de estimare este un interval (numit si interval de ncredere) calculat folosind valorile esantionului
considerat, si care contine parametrul necunoscut cu o anumita probabilitate.
Spre exemplu, ca o aproximare a mediei a unei populatii putem considera media de selectie . Aceasta conduce
la estimatorul = al lui , adica
1 + +
= = (48)

unde 1 sunt valorile observate ale selectiei iar este volumul acesteia.
Similar, un estimator c2 al dispersiei 2 al unei populatii este dispersia de selectie 2 , adica

c2 = 2 = 1 X 2
( ) (49)
1 =1

Formulele anterioare sunt estimatori ai parametrilor pentru distributii n care si 2 apar explicit ca parametrii,
spre exemplu n cazul distributiei normale sau a distributiei Poisson. n cazul distributiei binomiale avem parametru
necunoscut , si cum n acest caz avem = (sau echivalent = ) obtinem pentru estimatorul

= (50)

Formulele anterioare sunt cazuri particulare de estimatori obtinuti prin metoda momentelor. n aceasta
metoda de estimare a parametrilor, parametrul necunoscut se scrie n functie de momentele distributiei populatiei.
nlocuind n formula rezultata momentele de ordin prin momentele de ordin ale selectiei

1X
=
=1

se obtine un estimator al parametrului necunoscut.

9.3 Metoda verosimilitatii maxime


O alta metoda de estimare a parametrilor este metoda verosimilitatii maxime, metoda introdusa de R. A.
Fischer.
Sa consideram o variabila aleatoare discreta (sau continua) avnd functia de probabilitate (densitate) ()
ce depinde de un anumit parametru necunoscut. Pentru a-l estima pe , consideram un esantion 1 de
volum .
n cazul discret, probabilitatea ca valori ale variabilei aleatoare sa fie exact valorile 1 ale esantionului
ales este
= ( = 1 ) ( = ) = (1 ) ( ) (51)
n cazul continuu, probabilitatea ca variabila aleatoare sa ia valori n intervalele [ + ] este
Z 1 + Z 1 +
(1 1 + ) ( + ) = () () (1 ) ( ) = (
1 1
(52)
Cum functia depinde de , functia depinde de 1 si de . Functia
= (1 ) = (1 ) ( )
se numeste functia de verosimilate.
Metoda verosimilitatii maxime presupune estimarea parametrului necunoscut prin acea valoare ce maxi-
mizeaza valoarea functiei de verosimilate .
n ipoteza ca este o functie derivabila, valoarea ce maximizeaza pe este o solutie a ecuatiei

=0 (53)

(adica este un punct critic al functiei ).
Rezolvnd ecuatia anterioara n raport cu se obtine o solutie = (1 ). Un estimator de verosim-
ilate maxima pentru este n acest caz = (1 ).

42
Observatia 9.1 n practica este deseori utila urmatoarea observatie. Deoarece functia logaritm este o functie strict
crescatoare, functia ln si atinge maximul n acelasi punct cu functia . Pentru determina punctul n care
functia si atinge maximul, putem echivalent determina punctul n care functia ln si atinge maximul. Putem
deci nlocui ecuatia (53) prin ecuatia
ln
= 0 (54)

ecuatie care este echivalenta cu (53), dar este n general mai usor de rezolvat.
n cazul n care functia depinde de mai multi parametrii necunoscuti 1 , rezolvam ecuatiile (53)
corespunzatoare fiecaruia din parametrii necunoscuti 1 , sau echivalent ecuatiile (54), adica rezolvam
sistemul
1 = 0
(55)

= 0
sau echivalent sistemul ln
1 =0
(56)
ln
= 0
n raport cu 1 .
Valorile astfel determinate dau estimatorii de verosimilitate maxima b1 b pentru parametrii necunoscuti
1 .
Exemplul 9.2 Sa se determine estimatorii de verosimilitate maxima pentru media si abaterea patratica medie
n cazul distributiei normale.
n acest caz, folosind faptul ca functia de densitate a variabilei aleatoare N 2 este
1 ()2
() = 22
2
obtinem ca functia de verosimilitate este
= (1 ) ( )
1 (1 )2 1 ( )2
= 22 22
2 2

1 (1 )2 ++( )2
= 22
2
Logaritmnd, obtinem
(1 )2 + + ( )2
ln = ln 2 ln
2 2
Sistemul (56) devine n acest caz
ln (
(1 )++( )
=0 2 =0
ln (1 )2 ++( )2
=0 + 3 = 0
Din prima ecuatie din sistem se obtine 1 + + = 0, si deci estimatorul al lui este dat de
1 + +
= =

Din a doua ecuatie din sistem se obtine
(1 )2 + + ( )2
2 =

si nlocuind pe prin estimatorul din relatia anterioara obtinem pentru estimatorul
s
2 2
(1 ) + + ( )
=

43
Exercitii

Exercitiul 9.1 Sa se determine estimatorul de verosimilitate maxima al dispersiei distributiei normale N 0 2
cu medie = 0.

Exercitiul 9.2 Sa se determine estimatorul de verosimilitate maxima al medie a distributiei normale N 20
cu dispersie cunsocuta 0 .

Exercitiul 9.3 Sa se estimeze parametrul al distributiei Poisson prin metoda verosimilitatii maxime.

Exercitiul 9.4 Sa se determine estimatorul de verosimilitate maxima a parametrului necunoscut al densitatii



0
() =
0 0

Exercitiul 9.5 Sa se calculeze estimatorul punctual obtinut n exercitiul anterior n cazul esantionului 19, 04,
07, 06, 14. Sa se reprezinte grafic functia de distributie () corepunzatoare esantionului si functia de distributie
() a variabilei aleatoare pentru = . Sunt cele doua grafice aproximativ egale?

Exercitiul 9.6 Acelasi exercitiu n cazul esantionului 04, 07, 02, 11, 01.

Exercitiul 9.7 Consideram functia de densitate



0
() =
0 0

a) Sa se determine media a variabilei aleatoare corepunzatoare.


b) Sa se scrie densitatea n functie de media determinata la punctul anterior.
c) Sa se estimeze folosind metoda verosimilitatii maxime.

Exercitiul 9.8 Sa se estimeze parametrul al distributiei binomiale prin metoda versoimilitatii maxime.

Exercitiul 9.9 n exercitiul anterior, sa presupunem ca n 4 ncercari succesul a aparut de 2 ori, n alte 4 ncercari
succesul a aparut de 3 ori, iar n alte 4 ncercari experimentul a aparut de 2 ori. Sa se estimeze probabilitatea de
aparitie a succesului.

Exercitiul 9.10 Mai general, sa presupunem ca s-au efectuat de ori cte ncercari, si ca n primele ncercari
succesul a aparut de 1 ori, n urmatoarele ncercari succesul a aparut de 2 ori, . . . , n ultimele ncercari
succesul a aparut de ori. Sa se estimeze probabilitatea de aparitie a succesului.

Exercitiul 9.11 ntr-un sir de ncercari de tip Bernoulli, consideram variabila aleatoare reprezentnd numarul
de ncercari pna la aparitia succesului.
a) Sa se arate ca functia de probabilitate a variabilei aleatoare este

1 {1 2 3 }
() =
0 rest

unde este probabilitatea de aparitie a succesului si = 1 .


b) Sa se estimeze parametrul prin metoda verosimilitatii maxime folosind un esantion de volum 1, 1 .

Exercitiul 9.12 n exercitiul anterior, sa se estimeze parametrul folosind un esantion 1 .

Exercitiul 9.13 La aruncarea unui zar, sa presupunem ca primul sase a aparut la a saptea ncercare, si ca repetnd
din nou experimentul, primul sase a aparut la a sasea ncercare. Sa se estimeze probabilitatea de aparitie a fetei
sase.
Indicatie: a se vedea cele doua exercitii anterioare.

44

S-ar putea să vă placă și