Sunteți pe pagina 1din 176

INTRODUCERE

Etimologic, statistica i are rdcina n cuvntul latinesc status care nseamn situaie,
stare social, dar i stat. Analiznd n sintez retrospectiv, procesul evolutiv al dezvoltrii
statisticii, se contureaz distinct urmtoarele etape: evidena statistic statistica descriptiv
aritmetica politic statistica modern. Deci, statistica reprezint o ramur a matematicii
care, folosind calculul probabilitilor, elaboreaz noiunile i metodele specifice studiului
cantitativ al colectivitilor i al fenomenelor de mas.
Folosirea metodelor statistico-matematice ca instrumente practice de investigare i de
analiz socio-economic i mai ales orientarea cercetrilor statistice spre descoperirea
legitilor care guverneaz variabilitatea fenomenelor social-economice de mas, au conferit
statisticii caracterul su tiinific.
Teoria probabilitilor i statistica furnizeaz, astzi, unul dintre cele mai importante
instrumente de cunoatere uman. Putem afirma, fr s greim, c aproape c nu exist
domeniu de activitate cu care s nu aib un contact nemijlocit: fizica, chimia, biologia, geologia,
medicina, economia, sociologia, ingineria, analiza operaional, teoria informaiei, teoria
jocurilor, teoria ateptrii, controlul statistic al proceselor i fiabilitatea.
De aceea, cursul intitulat Statistic aplicat a fost structurat pornind de la consideraiile
prezentate anterior i conine dou pri:
I.

Prima parte este dedicat studiului principalelor noiuni i relaii de calcul utilizate la
calculul probabilitilor.
Teoria probabilitilor reprezint studiul matematic al fenomenelor caracterizate de
incertitudine i de ntmplare. Ea i are originea n anul 1654 cnd doi celebri
matematicieni francezi, Blaise Pascal (16231662) i Pierre de Fermat (16011665), au
purtat o lung coresponden ncercnd s rezolve dou probleme legate de jocurile cu
zaruri, foarte la mod n acea perioad. Antoine Gombaud, Chevalier de Mr un nobil
francez, mptimit al jocurilor de noroc, i cere ajutorul lui Pascal n ncercarea lui de a
rezolva o serie de contradicii aparente cu privire la popularul joc de zaruri.
Jocul const n aruncare unei perechi de zaruri de 24 de ori. Prima problem, formulat
de Antoine Gombaud, a fost de a decide dac este rentabil s parieze o sum de bani pe
reuita obinerii a cel puin unei "duble de ase" n timpul celor 24 de aruncri. O regul
a jocurilor de noroc, aparent bine stabilit, n acea perioad, la condus de Mr s cread
c un astfel de pariu ar fi profitabil, dar calculele lui Pascal au indicat exact opusul.
O partid de zaruri, inclusiv miza pus n joc, era nsuit de juctorul care ctig un
numr de jocuri. Ce-a de-a doua problem s-a referit la modalitatea de a mpri ct
mai corect miza (ntre cei doi juctori), dac din motive de for major jocul trebuie
ntrerupt la un scor intermediar.
1

Aceste probleme formulate de Antoine Gombaud au condus la o disput ntre Pascal i


Fermat, n urma creia principiile fundamentale ale teoriei probabilitii au fost
formulate pentru prima dat.
Metoda matematic dezvoltat, cu prilejul rezolvrii acestor dou probleme, este
cunoscut n cadrul teoriei probabilitilor sub denumirea de abordarea clasic a calcului
probabilitilor i presupune, n cazul unui joc cu rezultate echiprobabile, din care
rezultate sunt ctigtoare, probabilitatea de a ctiga este /.
Trebuie menionat, de asemenea, c nc din secolele XV i XVI unii matematicieni
italieni (Fra Luca Bartolomeo de Pacioli, 14471517 i Girolamo Cardano, 15011576)
au rezolvat cteva probleme speciale privind jocurile de noroc, ns nici o teorie
general nu a fost elaborat nainte de aceast faimoas coresponden.
Christian Huygens (16291695), om de tiin olandez i profesor la Leibniz, fiind la
curent cu aceast coresponden, public la scurt timp dup aceea (n 1657) prima
lucrare despre calculul probabilitilor, intitulat De Ratiociniis n Ludo Aleae. Aceasta
reprezint un tratat privind problemele asociate jocurilor de noroc.
Datorit interesului deosebit acordat jocurilor de noroc, teoria probabilitii devine n
curnd foarte popular i subiectul este dezvoltat rapid n secolul al XVIII-lea,
contribuii majore n aceast perioad au adus Jakob Bernoulli (16541705) i Abraham
de Moivre (16671754).
O alt metod de abordare a calculului probabilitilor, cunoscut sub denumirea de
metoda frecvenelor este de asemenea utilizat n aceast perioad. Metoda const n
repetarea unui joc de un numr mare de ori, n aceleai condiii. Probabilitatea de a
ctiga este aproximativ egal cu raportul dintre numrul de victorii i numrul de
repetri. Aceast metod a fost folosit i de Pascal i Fermat pentru a verifica
rezultatele obinute prin metoda clasic. Jakob Bernoulli, n lucrarea sa Ars Conjectandi
(publicat postum n 1713), demonstreaz c cele dou metode conduc spre aceleai
rezultate.
n 1812, Pierre de Laplace (1749-1827) a introdus o serie de noi idei i tehnici
matematice n cartea sa, Theorie des Analytique Probabilits. Dac nainte de Laplace,
teoria probabilitilor s-a preocupat exclusiv de analiza din punct de vedere matematic
a jocurilor de noroc, aceast lucrare deschide noi orizonturi i subiecte de analiz prin
abordarea unor probleme tiinifice i practice.
Cu toate acestea, urmeaz o perioad de stagnare a dezvoltrii calcului probabilitilor
i ncepnd cu anul 1850, muli matematicieni gsesc metoda clasic nerealist pentru
uzul general i ncerc s redefineasc noiunea de probabilitate prin prisma metodei de
frecvenelor.

Calculul erorilor i mecanica statistic sunt exemple ale unora dintre aplicaiile
importante ale teoriei probabilitilor dezvoltate n secolul al XIX-lea.
Ca n multe alte ramuri ale matematicii, dezvoltarea teoriei probabilitilor a fost
stimulat de varietatea de aplicaii ale sale. Fiecare pas realizat n aceast teorie a extins
i mai mult sfera de aplicare. Astfel, statistica matematic este o ramur important a
teoriei probabilitilor aplicate; alte aplicaii apar n domenii foarte diferite cum ar fi:
genetica, psihologia, economia i ingineria.
Muli oameni de tiin i-au adus contribuia la dezvoltarea teoriei publicate de
Laplace, printre cei mai importani putem s-i amintim pe Cebev, Markov, Hincin,
von Mises i Kolmogorov.
Una dintre dificultile majore n dezvoltarea unei teorii matematice a probabilitilor,
a fost aceea de a formula o definiie a probabilitii suficient de precis pentru a fi
utilizat n matematic, dar i suficient de cuprinztoare pentru a fi aplicabil unei game
largi de fenomene.
Cutarea unei definiii larg acceptate a durat aproape trei secole i a fost marcat de
multe controverse. Problema a fost rezolvat n cele din urm n secolul XX prin tratarea
teoriei probabilitilor pe o baz axiomatic. Aceast abordare modern a calculului
probabilitilor, ncadrat ntr-un domeniu mult mai larg al matematicii, teoria msurii,
a aprut n anul 1933, n monografia matematicianului rus Andrey Kolmogorov
(19031987), Grundbegriffe der Wahrscheinlichkeitsrechnun.
Unitile de nvare dedicate acestei prime pri conin principalele noiuni i relaii de
calcul utilizate la calculul probabilitilor i sunt structurate conform figurii 1.
II.

Cea de-a doua parte este dedicat studiului principalelor tehnici i instrumente utilizate
n analiza statistic modern.
Astzi termenul statistica a intrat n limbajul universal al tiinei i al vieii cotidiene. n
decursul timpului, aceast noiune a cptat mai multe accepiuni, care desemneaz
diversele ipostaze parcurse de la simple descrieri i nregistrri pn la statistica
modern, instrument indispensabil n procesul de conducere al oricrui domeniu specific
activitii umane.
Procesul de conturare al statisticii, n accepiunea de astzi, a fost marcat de parcurgerea
mai multor etape semnificative, [TAR 98], [CSI 11], [HIS 11]:
a. Etapa pre-statistic, coincide cu apariia primelor forme de eviden statistic i
dateaz nc din antichitate. Aceast etap se caracterizeaz, n esen, prin aceea
c datele statistice servesc pentru informarea organismelor statului despre nivelul,
sau stadiul atins la un moment dat de fenomenele social-economice subordonate, n
special unor scopuri fiscale, demografice, militare sau administrative. Exemplele
cele mai cunoscute de evidene statistice, din aceast perioad, sunt: inventarierea

aurului i pmntului la egipteni, recensmintele populaiei la sumerieni i romani,


recensmintele produciilor agricole la chinezi, stabilirea impozitelor la greci, sau
tabelele de la Roma privind evidena populaiei, produciei i consumului.

Experien Experiment

Probe

Evenimente elementare,

Spaiul de eantionaj,
=

Elemente de algebra
mulimilor
Tipuri de
evenimente,
Definiia
probabilitilor

Probabilitate
condiionat
Regula de nmulire a
probabilitilor;
Formula probabilitii totale;
Teorema lui Bayes.

Evenimente compatibile;
Evenimente incompatibile;
Evenimente compuse - evenimente;
Evenimentul sigur, ;
Evenimentul imposibil, ;
Evenimente independente;
Evenimente dependente.

Definiia clasic;
Definiia statistic;
Probabilitate subiectiv
(opinia unui expert);
Definiia geometric;
Definiia axiomatic Kolmogorov.

Elemente de analiz
combinatorie:
Permutri;
Aranjamente;
Combinri.

Variabile aleatorii:
Discrete;
Continue.

Funcia de
repartiie

Modele de repartiii a
variabilelor aleatorii

Valori numerice ale


variabilelor aleatorii

Funcia de
probabilitate;
Funcia densitate
de probabilitate.

Figura 1. Structura primei pri a cursului Statistic aplicat


ncepnd cu secolul XIII, datele statistice devin din ce n ce mai numeroase. Odat
cu dezvoltarea meteugurilor i a comerului, are loc o prim scindare a
informaiilor: cele culese pentru a fi puse la dispoziia conducerii statului i cele
inute n interesul negustorilor comercianilor privai cu ajutorul contabilitii.

Astfel, negustorii din Veneia colectau date despre comerul exterior, pentru a putea
s evalueze riscurile transportului maritim.
n secolul al XVI-lea apar primele evidene ale naterilor nregistrate n Frana i
mai apoi registrele de cstorii i nateri din Anglia. Aceste nregistrri erau
realizate de ctre preoi. Totui, progresele fundamentale nregistrate de statistic
vor apare ncepnd cu secolul al XVII-lea.
b. Statistica descriptiv. Aceast etap s-a dezvoltat n secolele XVI XVIII cnd, n
Germania, s-a constituit o adevrat coal cunoscut sub denumirea de coala
descriptiv german. Descrierea statului a devenit, n aceast perioad, disciplin
de predare academic, ncadrat ntr-un sistem construit dup norme teoretice i
practice, cu accent pus pe dezvoltarea mijloacelor de investigare a fenomenelor
sociale i economice, precum i pe mijloacele de informare a organismelor statale.
Statistica descriptiv a fost continuu mbogit, restructurat i perfecionat,
punndu-se din ce n ce mai mult accent pe determinrile numerice i pe limbajul
cifric. Progresele statisticii descriptive sunt n mare msur legate de introducerea
noiunii de coordonate, n geometrie, de ctre Descartes n anul 1637.
Trsturile eseniale ale statisticii descriptive sunt definite de caracterul su analitic;
sunt prezentate descrieri complexe ale statelor, sunt efectuate analize comparative
ale diferitelor situaii socio-economice. Toate erau ns orientate n scopuri
informaionale. Deci, nici statistica descriptiv, cu toate c coala german o
ridicase la rangul de tiin, nu avea drept scop descoperirea i cunoaterea
legitilor statistice.
Cu toate acestea, statistica descriptiv constituie o realizare de seam a domeniului,
fiind o etap foarte bine conturat i integrat n procesul ndelungat al dezvoltrii
statisticii ca tiin.
n rile Romne, prima i cea mai reprezentativ lucrare de acest gen este
Descriptio antiqui et hodierni status Moldaviae, elaborat de Dimitrie Cantemir - o
expunere monografic pe plan geografic, politic, economic, social i cultural.
Lucrarea l-a impus pe autor ateniei contemporanilor, care l-au considerat printre
fruntaii statisticii descriptive europene.
c. Aritmetica politic. n timp ce n Germania, statistica se constituise ca disciplin
descriptiv a statului, n Anglia se ntea, n afara universitilor, o statistic cu totul
deosebit, cunoscut sub numele de aritmetica politic. Caracteristic aritmeticii
politice i este faptul c pentru prima oar analiza datelor nregistrate se face prin
procedee matematice, urmrindu-se desprinderea regularitilor care domin
schimbrile eseniale de ordin calitativ n structura i dezvoltarea raporturilor dintre
fenomenele social-economice. Folosirea metodei analitice, utilizarea unor
instrumente matematice, precum i cutarea legitilor care guverneaz fenomenele
social-economice marcheaz un substanial progres, al statisticii, prefigurnd
apariia elementelor statisticii moderne. Acest salt calitativ n dezvoltarea statisticii
se datoreaz i faptului c n aceast perioad calculul probabilitilor ncepe s se
contureze ca o teorie matematic de sine stttoare, iar diverse elemente, ale ei, sunt
preluate i utilizate n statistic.

Reprezentanii aritmeticii politice din Anglia n frunte cu John Graunt (1620


1674), William Petty (1623 1687) i Edmuad Halley (1656 1742) au pus accent,
mai ales, pe studiul i descoperirea legitilor fenomenelor demografice: creterea
numrului populaiei, ale echilibrului numeric dintre sexe, ale fertilitii,
mortalitii, durata probabil a vieii, calculul rentei viagere anuale n funcie de
vrst i evaluarea posibilitilor comerciale i maritime ale Angliei.
d. Statistica inferenial. Descoperirile din domeniul calculului probabilitilor i
introducerea lor treptat, n statistic, au determinat o cotitur radical n conturarea
i dezvoltarea statisticii ca tiin. Astfel, n secolul al XIX-lea i n prima jumtate
a secolului XX constatm utilizarea metodelor matematice, mai ales a teoriei
probabilitilor, pentru investigarea fenomenelor de mas.
Primele ncercri de valorificare a noilor descoperiri, n analiza statistic a
fenomenelor economice i sociale, au fost fcute de Jacob Bernoulli (1654 1705),
profesor de matematic la Universitatea din Basel i mai ales de Pierre-Simon
Laplace (1749 1827), matematician, fizician i astronom francez, care a efectuat
n Frana, n 1801, un recensmnt pe baz de eantionaj, calculnd i coeficientul
de eroare. Bernoulli a formulat legea numerelor mari folosit mai trziu ca
fundament teoretic al sondajelor statistice.
Karl Friedrich Gauss (1775 1855), matematician, fizician i astronom german,
propune metoda celor mai mici ptrate, publicnd o serie de consideraii privind
aplicarea matematicii n investigarea fenomenelor demografice.
Contribuii de seam la dezvoltarea statisticii infereniale au avut Moivre, Fourier
i Poisson. Cel care a dominat, ca statistician, epoca sa a fost Lambert Adolphe
Jacques Quetelet (1796 1874), matematician, statistician i astronom belgian. Prin
contribuiile sale, a produs o nou cotitur n evoluia statisticii, fiind considerat
fondatorul statisticii moderne. Elementele eseniale care au revoluionat substanial
gndirea statistic sunt concretizate n utilizarea noiunilor: medie, dispersie,
repartiie, observare de mas, regularitate.
n secolul XIX, o remarcabil contribuie la progresul statisticii au avut i alte coli
naionale:
Statistica rus a fost reprezentat de D. P. Juravski dup care statistica este
o tiin material, avnd ca obiect studiul vieii sociale i n acelai timp, o
tiin metodologic. Contribuii de seam au adus i P. L. Cebev (1821
1894) precum i A. A. Markov (1866 1922).
Reprezentanii statisticii romneti au avut contribuii valoroase la promovarea
statisticii att pe plan teoretic, ct i pe linia instituionalizrii ei. Principalii
precursori fiind: Ion Ionescu de la Brad (1818 1891), agronom, economist i
statistician i Dionisie Pop Marian (1829 1865), economist i statistician.
Astfel, statistica nregistreaz o nou etap a evoluiei sale, prin extinderea i perfecionarea
metodelor specifice de investigare, prin introducerea pe scar larg a instrumentului matematic
al teoriei probabilitilor, n prelucrarea i analiza statistic a datelor, prin orientarea gndirii
statistice spre interpretarea analitic a fenomenelor de mas i obinerea de concluzii inductive.
n aceste condiii, statistica ncepe s fie folosit nu doar pentru studierea trecutului i
6

prezentului, ci i pentru elaborarea unor ipoteze asupra modului n care se vor comporta, n
viitor, aceleai fenomene.
Noile metode introduse n analiza statistic au fost elaborate, n mare parte, de coala anglosaxon de statistic matematic, fondat de F. Galton (1822 1911) i K. Pearson (1857
1936) i continuat de R. A. Fisher (1890 1962), F. Y. Edgeworth (1845 1926), G. U. Yule
(1871 1951), M. G. Kendall (1907 1983). Contribuiile lor sunt hotrtoare pentru
constituirea statisticii moderne, fiind dezvoltate capitole de baz ca: analiza dispersional,
teoria estimaiei, calculul corelaiilor, verificarea ipotezelor, teoria eantionajului. Sub impulsul
colii create de Pearson i Fischer, statistica a fcut progrese remarcabile gsindu-i
fundamentri foarte precise, ca disciplin tiinific, n toate rile lumii.
Analiznd procesul evolutiv, al dezvoltrii statisticii, se constat c trecerea de la o etap la alta
nu a avut loc prin negarea a tot ceea ce s-a ctigat pn la un moment dat, ci printr-o
perfecionare continu a metodelor de culegere, prelucrare i analiz a datelor, printr-o
extindere i diversificare continu a posibilitilor de valorificare a informaiilor statistice.
Scopul statisticii este acela de dezvolta i aplica metodologiile de obinere a unor informaii
utile pornind de la serii de date colectate, sau de la efectuarea unor experimente. Aceste
activiti presupun colectarea sistematic a datelor, prelucrarea, sistematizarea, sintetizarea,
reprezentarea lor precum i analiza acestora. n plus, un rol important n analiza datelor l au
raionamentul statistic i inferena statistic. Aceste activiti majore implic: proiectarea
experimentelor i a metodelor de eantionaj; modelarea stocastic a fenomenelor; prognoze
bazate pe modele adecvate; dezvoltarea teoriei statistice i aplicarea de noi metode. Deci,
analiza statistic modern a datelor poate fi divizat n dou categorii:

Statistica descriptiv se ocup cu explorarea, vizualizarea i rezumarea datelor


statistice, dar fr asocierea lor cu un model statistic. Cu toate acestea, ea reprezint o
etap foarte important a analizei datelor care poate pune n eviden multe caracteristici
interesante ale fenomenului analizat.

Statistica inferenial este urmtoarea etap n analiza datelor i n procesul de luare a


deciziilor. Ea presupune identificarea unui model statistic adecvat, prin: estimarea
parametrilor modelului; validarea ipotezelor statistice; analiza dispersional; regresie i
corelaie; previziune statistic; controlul aplicrii deciziilor i verificarea rezultatelor.
Statistica inferenial face deci, trecerea de la statistica descriptiv a unui eantion, la
descrierea statistic a ntregii populaii a fenomenului respectiv.

n funcie de domeniul de cercetare aceste fenomene, de tip colectiv, prezint anumite


particulariti care conduc la diferenierea metodelor de cercetare. Astfel, statistica poate fi
clasificat n:
Statistica matematic sau statistica teoretic, cea care are ca obiect de studiu
dezvoltarea procedeelor i metodelor de abordare i analiz statistic a fenomenelor
de mas;
Statistica aplicat sau statistica de ramur, prin care se face particularizarea i
adaptarea procedeelor sau metodelor la specificul domeniului cercetat (statistic
economic, statistic demografic, statistic industrial etc.)
Structura prii a doua a cursului Statistic aplicat este prezentat n figura 2.

Populaie

Indivizi

Inferen
statistic

Eantionaj
Eantion
reprezentativ

Eantionaj
Eantion

Statistica
descriptiv

Statistica
inferenial

Tehnici i metode de
reprezentate a datelor

Estimarea parametrilor
repartiiilor statistice

Punctual;
Cu interval de
ncredere.

Verificarea caracterului
aleatoriu

Calculul i reprezentarea
histogramei

Repartiia empiric a datelor


de eantionaj

Calculul valorilor tipice de


eantionaj

Eliminarea valorilor
aberante

Verificarea ipotezelor
statistice

Regresie i corelaie

Teste de concordan
Verificarea ipotezelor
statistice referitoare la:
Parametrii
repartiiei;
Indicatorii statistici.

Figura 2. Structura prii a doua a cursului Statistic aplicat

Curs 1.
1.3. SPAIUL DE EANTIONAJ
Metoda de cercetare utilizat n tiin i n inginerie pentru studiul fenomenelor naturale, se
bazeaz pe efectuarea de experiene. Experimentele reprezint un instrument deosebit de util
deoarece se bazeaz pe principiul fundamental c, dac vom efectua experimente n mod
repetat, n condiii aproximativ identice, acestea ne conduc la aceleai rezultate. Astfel, suntem
capabili s controlm valoarea variabilelor care afecteaz rezultatul experienei, [BLU 05].
Cu toate acestea, n unele experimente, nu suntem n msur s verificm sau s controlm
valoarea anumitor variabile, astfel nct rezultatele vor varia de la o realizare a experimentului
la alta, chiar dac condiiile, n care se desfoar experiena, sunt aceleai.
Definiia 1.1:

O aciune clar specificat i care poate fi repetat n condiii date se numete


experien, sau experiment.

n decursul realizrii unui experiment se pot obine trei feluri de rezultate:


Rezultatul sigur: reprezint rezultatul unui experiment care se realizeaz cu certitudine n
cursul efecturii unei experiene.
b. Rezultatul imposibil: reprezint rezultatul unui experiment care n mod obligatoriu nu se
realizeaz n cursul unui experiment.
c. Rezultatul aleatoriu (ntmpltor): reprezint rezultatul care se poate produce, sau nu, ntro experien.
a.

Acest ultim caz l reprezint experimentele care sunt considerate ca fiind aleatorii.
Definiia 1.2:

O experien care conduce la rezultate ce difer semnificativ, chiar dac se


repet, n condiii aproximativ identice, se numete un experiment aleatoriu.

Pentru a evita confuziile, ce pot s apar, este necesar s introducem o nou noiune, cea de
prob.
Definiia 1.3:

Prin prob, se nelege orice realizare efectiv, consumat sau viitoare a


experienei.

Prin urmare, proba nu se confund cu experiena nsi ci cu unul din rezultatele sale previzibile
(cazuri posibile ale rezultatelor unui experiment aleatoriu).
Dezvoltarea logic a teoriei probabilitilor trebuie s nceap deci, cu luarea n considerare a
experimentelor aleatorii, deoarece acest tip de experiene genereaz rezultate incerte i la care
va trebui s asociem valori ale probabilitilor.
Caracteristica cea mai important a experimentelor aleatorii o reprezint faptul c rezultatul nu
poate fi determinat cu certitudine, n avans.
nainte de a asocia fiecrui rezultat o valoare numeric, numit probabilitate, este absolut
necesar s cunoatem totalitatea rezultatelor posibile ale experimentului considerat.

Exemplul 1.1:
Considerm o serie de experiene aleatorii simple. La fiecare s se precizeze
totalitatea rezultatelor posibile.
Soluie:

1. Experiena: aruncarea succesiv a unei monede i nregistrarea feei care


apare.
Rezultate: {, },
unde, reprezint capul i reprezint pajura.
2. Experimentul: dou aruncri succesive a unei monede.
Rezultate: dac notm ca n exemplul anterior, obinem:
{(, ), (, ), (, ), (, )}
3. Experiena: aruncrii succesive a unui zar.
Rezultate: {1; 2; 3; 4; 5; 6}, conform figurii 1.3.

Figura 1.1:

Rezultate obinute n urma aruncrii unui zar


4. Experimentul: aruncarea succesiv a dou zaruri.
Rezultate: {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12},
dac ne intereseaz suma celor dou fete care apar n decursul efecturii
probelor.
5. Experiena: extragerea a trei mostre dintr-un lot de piese i examinarea
lor.
Rezultate:{(, , ), (, , ), (, , ), (, , ), (, , ), (, , ),
(, , ), (, , )}, dac notm cu , piesele conforme i cu ,
piesele neconforme.
6. Experiena: aruncarea succesiv a unei monede, pn cnd obinem pajura
(P).
Rezultate: {1, 2, 3, 4, , },
dac ne intereseaz, n acest caz, numrul de probe efectuate.
7. Experimentul: cantitatea de precipitaii czut cu prilejul ploilor
nregistrate n decursul unui deceniu.
Rezultate: {| , 0 120}, dac cea mai mare cantitate de ap
czut n intervalul studiat este 120 l/m2.

Definiia 1.4:

O mulime alctuit din totalitatea rezultatelor asociate unui eveniment real


sau conceptual se numete spaiul de eantionaj, sau mulimea total a
probelor.

Din definiia 1.4 rezult c, de fapt, spaiul de eantionaj reprezint o mulime de rezultate ale
experimentului, obinute n urma unei singure probe, iar fiecare rezultat al experimentului
reprezint un punct, sau un element al mulimii totale a probelor.
Din analiza experienelor prezentate anterior, putem constata trei categorii de experiene, i
anume:

Experiene avnd spaiul de eantionaj finit, deoarece conin un numr finit de elemente.
Acestea reprezint cazul exemplului 1.1, punctele 1 5, prezentate anterior;
Experimente cu spaiul de eantionaj infinit numrabil (n cazul exemplului 1.1, punctul
6); Dac intre elementele unei mulimi infinite i mulimea numerelor ntregi se poate
stabili o relaie bijectiv, atunci mulimea poart numele de mulime infinit numrabil.
Experimente cu spaiul de eantionaj infinit nenumrabil (n cazul exemplului 1.1,
punctul 7). Dac ntre elementele unei mulimi infinite nu poate fi stabilit o relaie de
tipul celei prezentate anterior, atunci mulimea poart numele de mulime infinit
nenumrabil.
Vom denumi, n continuare, spaiile de eantionaj finite i infinit numrabile, ca spaii de
eantionaj discrete, iar pe cele infinit nenumrabile ca spaii de eantionaj continue.
Exemplul 1.2:
Considerm un experiment ce const n extragerea a dou bile dintr-o
urn, ce conine 4 bile identice, numerotate cu cifrele de la 1 la 4.
a) S se determine spaiul de eantionaj, n condiiile n care prima bil
extras este reintrodus n urn nainte de cea de-a doua extragere;
b) S se determine spaiul de eantionaj, n condiiile n care prima bil
extras nu mai este reintrodus n urn nainte de cea de-a doua
extragere.
Soluie:

Cazul a.
(1,1)
(2,1)
={
(3,1)
(4,1)

(1,2)
(2,2)
(3,2)
(4,2)

(1,3)
(2,3)
(3,3)
(4,3)

(1,4)
(2,4)
}
(3,4)
(4,4)

Cazul b.
(1,2)
(2,1)
={
(3,1)
(4,1)

(1.3)
(2,3)
(3,2)
(4,2)

(1,4)
(2,4)
}
(3,4)
(4,3)

Chiar i pentru analiza din punct de vedere probabilist a rezultatelor, unui experiment aleatoriu,
spaiul de eantionaj nu este n mod unic determinat. El depinde de obiectivele propuse, ale
studiului.

Exemplul 1.3:
Considerm un experiment ce const n prelevarea unei piese executate din tabl
prin tanare, n cadrul unui atelier i analiza calitii prin evaluarea grosimii.
Soluie:

a. Valorile obinute prin msurare depind de echipamentul de msurare


utilizat, precum i de precizia de msurare a acestuia. Putem spune c
spaiul de eantionaj este alctuit din evenimente elementare ce reprezint
numere reale pozitive:
= {| + }.
b. Dac tim, din msurtori efectuate anterior, c grosimea pieselor este
cuprins n intervalul [6,7] mm, atunci:
= {|6 7, }
c. Dac obiectivul analizei este acela de a determina dac piesa este conform
(C), sau neconform (N), atunci:
= {, }
d. Dac dorim s sortm piesele n: piese de calitatea I (1), calitatea a II a
(2) i rebuturi (), atunci:
= {1, 2, }.

n concluzie, prin experien (experiment), n teoria probabilitilor, nelegem a efectua o


alegere a unui element dintr-o mulime dat, utiliznd un procedeu susceptibil de a fi repetat.

1.4. EVENIMENTE
Analiza din punct de vedere probabilist al rezultatelor unui experiment aleatoriu presupune, de
cele mai multe ori, calculul probabilitii unor colecii de rezultate ale experienei considerate.
Din acest motiv a fost introdus o nou noiune, cea de eveniment, [CRS 83],[SOO 04].
Definiia 1.5:

Prin eveniment, se nelege producerea sau neproducerea unui fenomen ntro experien oarecare, sau rezultatul unui experiment.

n funcie de ansa de apariie, un eveniment oarecare, asociat unei experiene, poate fi:
Evenimentul sigur () este evenimentul care se produce cu certitudine la efectuarea
unei probe. De fapt, evenimentul sigur reprezint spaiul de eantionaj:
= .
Evenimentul imposibil () este evenimentul care nu se produce cu siguran la
efectuarea de probe. i n acest caz putem concluziona c:
.
Evenimentul aleatoriu, sau ntmpltor (, , . ..): evenimentul care se poate produce, sau
nu, ntr-un experiment.

Analiznd definiia 1.5 putem trage concluzia c n decursul efecturii unui experiment, un
eveniment aleatoriu reprezint, de fapt, o submulime a spaiului de eantionaj asociat unei
experiene aleatorii.
Evenimentele aleatorii, n funcie de modul lor de apariie, se pot clasifica n:
Evenimentele care pot fi realizate de o prob i numai de una, reprezint evenimentele
elementare. Pentru acest tip de evenimente vom utiliza notaia: ,
1, .
Evenimentele compuse. Acestea reprezint o colecie de unul sau mai multe evenimente
elementare.
Rezult deci, c n general, un eveniment poate fi identificat cu o mulime i anume cu mulimea
probelor respective, iar evenimentele compuse, asociate unui spaiu de eantionaj, se pot obine
prin utilizarea operaiilor specifice algebrei mulimilor.
Pornind de la terminologia folosit de teoria mulimilor, n tabelul 1.1 este prezentat dualitatea

de limbaj i relaiile utilizate la operarea cu evenimente.


Dualitatea limbajului utilizat n teoria probabilitilor, [CRS 81]

Tabelul 1.1

Limbajul teoriei mulimilor

Limbajul evenimentelor

Mulimea total sau, mulime de


referin,
Mulimea prilor mulimii de
referin, ()
Submulime a lui
Mulimea vid,
reunit cu ,
intersectat cu ,
Complementara lui , ,

Spaiul de eantionaj,
Evenimentul sigur,
Cmp de evenimente, (, )
Eveniment,
Evenimentul imposibil,
<< sau >>
<< i >>
<< non >>, , S
<< implic >>
<< echivalent cu >>
<< i incompatibile >>
<< i compatibile >>

inclus n ,
=
i disjuncte, =
i nedisjuncte,

Conform tabelului 1.1, observm c este necesar s definim, n continuare, cteva tipuri de noi
evenimente cu proprieti speciale:
Definiia 1.6:

Evenimentelor i , asociate unei experiene, le putem face s corespund


un nou eveniment, , numit reuniunea lor:
= ,
i a crui realizare const n realizarea a cel puin unuia dintre cele dou
evenimente.

Definiia 1.7:

Evenimentelor i , asociate unei experiene, le putem face s corespund


un nou eveniment, , numit intersecia lor:

= ,
i a crui realizare const n realizarea simultan a ambelor evenimente.
Definiia 1.8:

Dou, sau mai multe evenimente, , asociate experimentului care nu se pot


realiza simultan:
= ,
se numesc evenimente incompatibile.

Definiia 1.9:

Dou, sau mai multe evenimente, , asociate experimentului care se pot


realiza simultan:
,
se numesc evenimente compatibile.

Definiia 1.10:

Fiecrui eveniment asociat unei experiene i corespunde un eveniment,


notat cu , cu proprietatea c dac se realizeaz evenimentul , atunci
evenimentul nu se realizeaz cu certitudine. Cele dou evenimente se
numesc evenimente complementare.
Spunem, despre evenimentul , c se numete contrariul (opusul, sau
complementul) evenimentului :
= S = S\

Definiia 1.11:

Spunem c evenimentul implic evenimentul (sau este implicat de


evenimentul ) i notm , dac se realizeaz de fiecare dat cnd se
realizeaz .

Definiia 1.12:

Dou evenimente i , se numesc echivalente (notat = ), dac ntre ele


exist simultan relaiile:
i .

Calculul probabilitilor, ca teorie matematic, a fost dezvoltat cu scopul de a permite asocierea


fiecrui eveniment, al unei experiene, o valoare a probabilitii. Din cele prezentate anterior
constatm c, dac n cadrul unei experiene aleatorii ne concentrm asupra unui eveniment, de
fapt, ne fixm atenia asupra unei pri din mulimea probelor experimentului. Astfel, un
eveniment poate fi identificat cu un element din mulimea prilor spaiului de eantionaj
corespunztor.
Exemplul 1.4:
Considerm experimentul ce cost n aruncarea unui zar. S se determine
spaiul de eantionaj i s se evidenieze toate tipurile de evenimente definite
anterior, precum i cmpul de evenimente asociat.
Soluie:

Spaiul de eantionaj: = {1,2,3,4,5,6}.


Tipuri de evenimente:

: {1}, {2}, {3}, {4}, {5}, {6}.


Evenimente elementare, , 1,6

Evenimentul sigur: = {1,2,3,4,5,6}.

Evenimentul imposibil: = {7}.

Evenimente: = {3,5}, = {4,6}, = {1,3,5},


= {2,4,6}, 1 = {1}, 2 = {2}.

Reuniunea evenimentelor: = 1 , sau = 2 .

Intersecia evenimentelor: = 1 , sau = 2 .

Evenimente incompatibile: = , = , sau 1 2 .

Evenimente compatibile: 1 , sau 2 .

Evenimente contrare: = \ = .

Dintre toate tipurile de evenimente, definite anterior, o importan deosebit o au evenimentele


elementare, deoarece ele stau la baza construciei tuturor celorlalte. De aceea, n continuare,
vom preciza proprietile remarcabile pe care la au aceste evenimente:
a. , =
1, i , atunci relaia = sau = ;
b. Evenimentul este elementar dac i numai dac , avem:
= , sau = .
c. Dou evenimente elementare distincte sunt incompatibile.
d. ntr-un cmp de evenimente, fiind dat un eveniment compus, , exist cel puin un
eveniment elementar , =
1, astfel nct:
.
e.

Un eveniment oarecare, , al unui cmp de evenimente poate fi exprimat n mod unic


ca reuniunea unui numr finit/infinit de evenimente elementare:
= .

f. ntr-un cmp de evenimente, evenimentul sigur este reuniunea tuturor evenimentelor


elementare:
=1 = .
Exemplul 1.5:
Considerm trei evenimente A,B i C, aparinnd unui spaiu de
eantionaj, S, conform figurii de mai jos. S se reprezinte urmtoarele
evenimente:

a) ;

b) ;
c) ( ) ;
( );
d)
e) ( )\;

f) (
);

Soluie:

b)

a)

c)

e)

d)

f)

1.5 ELEMENTE DE COMBINATORIC


Combinatorica, cunoscut i sub numele de analiza combinatorie, studiaz
modul configurare a mulimilor finite sau a combinaiilor de mulimi finite i,
de asemenea, furnizeaz instrumente de numrare a elementelor. Aceste
instrumente de numrare a elementelor au la baz dou principii, [MEM 80]:
Principiul multiplicativ: dac,
un eveniment , se poate produce n moduri;
un eveniment , se poate produce n moduri;
un eveniment , se poate produce n moduri;

i toate aceste evenimente sunt independente (adic, apariia unuia dintre ele,
nu este influenat de apariia celorlalte), atunci numrul total, , de moduri
diferite de producere a evenimentului combinat, , , , , este:
=

(1.1)

Exemplul 1.6:
n dulap avem trei cmi, dou cravate i dou costume. n cte moduri
diferite ne putem mbrca?
Soluie:

= = 3 2 2 = 12 moduri, dac nu inem seama de modul de


asortare al hainelor.

Pentru a descrie spaiile de eantionaj care se compun din evenimente elementare, alctuite din
mai multe etape sau stadii succesive, putem utiliza arborele de evenimente. Arborele de
evenimente reprezint un instrument grafic ce are la baz principiul multiplicativ i se
construiete reprezentnd sub forma ramurilor unui copac cele modaliti de completare ale
pasului . Fiecare dintre modalitile de completare a etapei poate fi reprezentat ca ramuri
pornind de la capetele ramurii originare, ale evenimentului precedent, , i aa mai departe.
n figura 1.2 este prezentat arbore de evenimente, corespunztor exemplului 1.6.

Ev.

Ev.

2 = 2, r. de cravate

Ev.

1
Figura 1.2

1 = 3, r. de cmi

1 = 2, r. de costume

Arborele de evenimente pentru exemplul 1.6

Principiul aditiv: dac,


un eveniment , se poate produce n moduri;
un eveniment , se poate produce n moduri;
un eveniment , se poate produce n moduri;

i dac, toate aceste evenimente nu sunt simultane, atunci numrul total, , de moduri diferite
de producere a evenimentului combinat, , , , , este:
(1.2)
=+++
Exemplul 1.7:
La catedra de Analiz matematic exist 3 cadre didactice, de sex
feminin i 5 cadre didactice, de sex masculin. S se determine cte posibiliti
au studenii de anul I de a avea un profesor de matematic.
Soluie:

= + = 3 + 5 = 8.

Determinarea spaiului de eantionaj n unele cazuri, mai complicate, devine mai dificil prin
utilizarea, doar a unor raionamente logice. De asemenea, pentru a asocia probabiliti
evenimentelor din aceste situaii, e nevoie de cunoaterea numrul de evenimente, att pentru
evenimentul analizat ct i pentru spaiul de eantionaj. Astfel de cazuri presupun utilizarea
regulilor simple ale analizei combinatorii pentru a simplifica calculele.

1.5.1. PERMUTRI
Definiia 1.13:

Permutrile a obiecte, notate cu !, nseamn numrul tuturor grupelor care


se pot forma cu cele obiecte diferite, dou permutri diferind numai prin
ordinea n care sunt aezate obiectele ntr-o grup.

Numrul de permutri a obiecte se poate determina foarte simplu, conform figurii 1.3.
Constatm c primul obiect, ntr-o permutare, l putem alege n moduri. Cel de-al doilea
obiect, se poate alege n 1 feluri, cel de-al treilea n 2 feluri, i aa mai departe, iar
pentru ultimul obiect ne rmne o singur opiune. Deci:
! = 123 ( 1).

( 1)
Figura 1.3

poziii

obiecte

(1.3)

( 4) 1

Calculul numrului de permutri a obiecte


Exemplul 1.8:
La edina unei asociaii se alege un prezidiu alctuit din cinci persoane
diferite. n cte feluri se pot aeza aceste persoane, la masa prezidiului pentru a
conduce edina?

Soluie:

= 5! = 5 4 3 2 1 = 120 de moduri.

Dac avem, ntre cele obiecte, grupe de elemente identice, atunci numrul de permutri este
mai mic dect n cazul n care toate elementele sunt diferite.
De exemplu, n cazul a patru elemente (, , , ), cele 4! = 24 de permutri care se pot realiza
sunt:
(1 , 2 , 1 , 2 ), (1 , 1 , 2 , 2 ), (1 , 2 , 1 , 2 ), (1 , 1 , 2 , 2 ), (1 , 1 , 2 , 2 ), (1 , 1 , 2 , 2 ),
(2 , 1 , 1 , 2 ), (2 , 1 , 1 , 2 ), (1 , 2 , 2 , 1 ), (1 , 2 , 2 , 1 ), (1 , 2 , 1 , 2 ), (2 , 1 , 2 , 1 ),
(1 , 2 , 2 , 1 ), (1 , 2 , 2 , 1 ), (2 , 1 , 1 , 2 ), (2 , 1 , 1 , 2 ), (2 , 1 , 2 , 1 ), (1 , 2 , 1 , 2 ),
(2 , 1 , 2 , 1 ), (2 , 2 , 1 , 1 ), (2 , 1 , 2 , 1 ), (2 , 2 , 1 , 1 ), (2 , 2 , 1 , 1 ), (2 , 2 , 1 , 1 ).

10

Ordonrile diferite ale elementelor , ca i cele ale elementelor , sunt socotite egale. Deoarece,
acestea reprezint 2! i respectiv 2! permutri, numrul total al permutrilor diferite este egal
cu:
4!
1234
=
= 6,
2! 2! 1 2 1 2
iar acestea sunt:
(, , , ); (, , , ); (, , , ), (, , , ), (, , , ), (, , , ).
Relaia anterioar se poate simplu generaliza pentru elemente, mprite n grupe, formate
din 1 , 2 , , elemente identice, numrul total de permutri rezult, n acest caz, egal cu:
!
,
1 ! 2 ! !

(1.4)

unde: 1 + 2 + + = .
Exemplul 1.9:
La prelucrarea unui reper, executat din tabl, trebuie realizate trei
alezaje de acelai diametru, precum i dou crestturi, de asemenea identice. S
se calculeze numrul de variante posibile, ale succesiunii de operaii, ce trebuie
luate n considerare la stabilirea tehnologiei de prelucrare.
5!

Soluie:

= 3!2! = 10.

1.5.2. ARANJAMENTE
Definiia 1.14:

Aranjamentele a obiecte, luate cte (notate cu ), reprezint numrul


tuturor grupelor distincte, alctuite din elemente, care se pot forma cu cele
elemente diferite, innd seama de ordinea elementelor dintr-o grup.

Numrul de aranjamente obinute din obiecte luate cte se poate determina folosind
raionamentul prezentat n figura 1.4.
Constatm c primul obiect, ntr-un aranjament, l putem alege n moduri. Cel de-al doilea
obiect, se poate alege n 1 feluri, cel de-al treilea n 2 feluri, i aa mai departe, iar
obiectul din poziia , n + 1 moduri. Deci:
= ( 1) ( 2) ( + 1) =

!
.
( )!

(1.5)

Exemplul 1.10:
n cte moduri se pot aeza cinci persoane pe o canapea cu trei locuri?
Soluie:

5!

= 35 = (53)! = 60 de moduri diferite.

11

obiecte

poziii

( 1) ( + 1)

Figura 1.4

Calculul numrului de aranjamente a obiecte, luate cte

Dac sunt permise repetiiile de elemente, obinem un nou tip de aranjamente, i anume,
aranjamente cu repetiie, notate: . Numrul de aranjamente cu repetiie de obiecte luate
cte , este, conform figurii 1.5:
(1.6)
= ,
Deoarece, primul element dintr-o grup poate fi ales n moduri, cel de-al doilea element n
moduri, la fel i cel de-al element dintr-o grup.

Figura 1.5

poziii

obiecte

obiecte

obiecte

Calculul numrului de permutri cu repetiie a obiecte, luate cte

12

Exemplul 1.11:
Cte autovehicule pot fi nmatriculate ntr-un jude innd cont de faptul
c numerotarea actual presupune, pe lng o abreviere a judeului, un numr
din dou cifre i un cod obinut din trei litere?
3
2
= (10
1) 26
= (102 1) 263 = 1740024.

Soluie:

1.5.3. COMBINRI
Definiia 1.15:

Combinrile a obiecte luate cte , , nseamn numrul tuturor


grupelor distincte, alctuite din elemente, care se pot forma cu cele
elemente diferite, indiferent de ordinea elementelor dintr-o grup.

Numrul de combinri a elemente luate cte se noteaz cu . Din tabelul 1.2 se constat
c numrul de combinri este mai mic dect numrul de aranjamente, datorit faptului c numai
inem cont de ordinea n care apar elementele. Deci, dac permutm elementele fiecrei
combinri obinem aranjamente. Relaia de calcul al numrului de combinri este:

!
=
=
.
! ! ( )!

(1.7)

Exemplul 1.12:
La un examen cadrul didactic a pregtit 15 bilete cu subiecte. Fiecare
student trebuie s rspund la 6 subiecte. Calculai cte situaii diferite pot
exista.
15!

Soluie:

6
= 15
= 6!(156)! = 5005.

Tabelul 1.2

Relaia dintre numrul de aranjamente, 34 i cel al combinrilor, 43


Aranjamente

Combinri

{, , }, {, , }, {, , }, {, , }, {, , }, {, , }

{, , }

{, , }, {, , }, {, , }, {, , }, {, , }, {, , }

{, , }

{, , }, {, , }, {, , }, {, , }, {, , }, {, , }

{, , }

{, , }, {, , }, {, , }, {, , }, {, , }, {, , }

{, , }

Dac sunt permise repetiiile elementelor, obinem n cazul a obiecte {1 , 2 , , }, luate


cte dou:
{1 , 1 }

{1 , 2 }

13

{1 , 3 }

{1 , }

{2 , 2 }

{2 , 3 }

{2 , }

{3 , 3 }

{3 , }

{ , }

Acestea reprezint cazul combinrilor cu repetiie, notate: . Numrul de combinri cu


repetiie de obiecte luate cte 2, este:
2
2 = 1 + 2 + 3 + + ( 1) + = +1

(1.8)

Prin generalizare, ecuaia (1.8), devine:


2
= +1

(1.9)

Exemplul 1.13:
Reconsiderm problema din exemplul 1.2 i dorm s calculm n
continuare numrul de evenimente elementare, distincte ale spaiului de
eantionaj.
Soluie:

5!

2
a) = 42 = 4+21
= 2!(52)! = 10.
4!

b) = 42 = 2!(42)! = 6, deoarece evenimentele elementare de tipul


{1,2} i {2,1} se consider identice.

14

Curs 2.

2.3 PROBABILITI
Probabilitatea reprezint noiunea central a teoriei matematice a calculului probabilitilor. n
orice experiment aleatoriu exist ntotdeauna o incertitudine cu privire la faptul c un eveniment
particular al spaiului de eantionaj se va realiza, sau nu. Ca o msur a ansei, sau a gradului
de realizare, cu care ne putem atepta ca evenimentul s produc, este convenabil s utilizm o
valoare numeric cuprins ntre 0 i 1. Dac suntem siguri c anumite evenimente vor avea loc,
spunem c probabilitatea lor este de 1, sau 100%. Dac suntem siguri ca evenimentul nu va
avea loc, spunem c probabilitatea este zero. Dac, de exemplu, probabilitatea este 14, vom
spune c exist o ans de 25%, pentru ca acesta s se realizeze i o ans de 75% ca acesta s
nu se produc. Echivalentul afirmaiei anterioare, putem spune ca ansele sunt mpotriva
apariiei evenimentului, cu un scor de 75% la 25%, sau 3 la 1.
Definiia 2.1

Un numr real, pozitiv, asociat unui eveniment , notat cu (), sau ()


se numete probabilitatea evenimentului .

Dei probabilitatea reprezint conceptul de baz al acestei teorii matematice, exist mai multe
accepiuni ale acestei noiuni, [MON 03], [KEL 97], [TAR 89]. n continuare, vom prezenta
aceste interpretri diferite, ale noiunii probabilitate, pentru cazul spaiilor de eantionaj
discrete, deoarece acestea ofer o soluie mai simpl din punct de vedere matematic.

2.3.1 DEFINIIA CLASIC A PROBABILITII


Aceast definiie reprezint, din punct de vedere istoric, prima ncercare, realizat de Pascal i
Fermat, pentru a defini probabilitile.
n tentativa lor de a defini ansa de realizare a unui eveniment, legat de jocul cu zaruri, cei doi
matematicieni au pornit de la natura simetric a experimentului. Dac aruncm un zar perfect,
din punct de vedere geometric, i realizat dintr-un material omogen, este logic c apariia unei
fee, dintre cele ase, este la fel de probabil, n comparaie cu celelalte.
Definiia 2.2

Dac considerm un spaiu de eantionaj alctuit din evenimente


elementare, echiprobabile, atunci probabilitatea oricrui rezultat al
experimentului este 1.
Exemplul 2.1:
Presupunem c avem o urm cu 8 bile identice, numerotate cu cifrele de la unu
la opt. Se fac extrageri de dou bile, fr s reintroducem n urn prima bil
extras. S se calculeze probabilitatea evenimentelor elementare. Dar dac
reintroducem prima bil extras?

Soluie:

8!

Spaiul de eantionaj este alctuit din = 28 = 6! = 56 evenimente


elementare echiprobabile.
Probabilitatea evenimentelor elementare este:
( ) =

1
1
=
= 0.017857,
1,56.
56

n cel de-al doilea caz spaiul de eantionaj este alctuit din = 82 = 82 = 64 evenimente
elementare echiprobabile.
Probabilitatea evenimentelor elementare este, n acest caz:
( ) =

1
1
.
=
= 0.015625, 1,64
64

Pornind de la valoarea probabilitii evenimentelor elementare, se pot calcula probabilitile


tuturor celorlalte evenimente, ca fiind reuniuni ale acestora.
Definiia 2.3

Pentru un spaiu de eantionaj finit i la care evenimentele elementare sunt


echiprobabile, probabilitatea unui eveniment oarecare, , este raportul dintre
numrul de cazuri favorabile evenimentului considerat, i numrul
cazurilor posibile, :
() =

(2.1)

Exemplul 2.2:
O bil este extras dintr-o urn ce conine 6 bile roii, 4 bile albe i 5 bile
galbene. S se calculeze probabilitatea ca aceasta s fie:
a. roie;
b. alb;
c. galben;
d. s nu fie roie;
Soluie:

Spaiul de eantionaj conine = 6 + 4 + 5 = 15 evenimente elementare.


a. () =
b. () =
c. () =
d. Pr( ) =

= 15 = 5 ;
4

= 15;
5

= 15 = 3 ;
=

4+5
15

= 5;

Definiiile 2.2 i 2.3 prezint o serie de inconveniente:


a) Se aplic doar spaiilor de eantionaj finite, sau infinit numrabile;
b) Definiia clasic a probabilitilor reduce noiunea de probabilitate, a evenimentelor, la
noiunea de egal posibilitate de apariie a evenimentelor elementare;
c) Nu la toate aplicaiile se poate aplica ipoteza cazurilor egal posibile;

2.3.2 DEFINIIA STATISTIC A PROBABILITII


Aprut aproape simultan cu definiia clasic a probabilitilor, aceast accepiune, a noiunii
probabilitate, provine din noiunea de frecven, noiune cu un caracter preponderent
experimental.
Exemplul 2.3:
Presupunem c aruncm de = 100 de ori cu un zar. Dup fiecare aruncare
se nregistreaz faa care apare. Constatm, n final c fiecare din cele ase fee
, ori i 6=1 = 100.
au aprut de , 1,6
Soluie:

Dac ne intereseaz probabilitatea unui eveniment elementar, de exemplu


apariia feei cu numrul 5, 5 , frecvena relativ a apariiei acestui eveniment
elementar:
(5 ) =

5
,

ne poate furniza informaii privind ansa de apariie a acestui eveniment, deci


informaii privind probabilitatea lui de apariie.
Dac realizm o serie mare de probe n cadrul unei experiene i vom calcula frecvena relativ
de apariie a unui eveniment elementar, asociat experimentului, vom constata c frecvenele
relative vor oscila n jurul unei valori constante fixe, iar deviaiile n jurul acestei valori vor fi,
n cazul mririi numrului de probe, din ce n ce mai mici, figura 2.1.

( ) =

( )

Figura 2.1

Relaia dintre probabilitate i frecvena relativ

n tabelul 2.1, este prezentat o serie de rezultate obinute n urma aruncrii unei monede i
urmririi apariiei feei cu pajura.

Tabelul 2.1

Calculul frecvenei de apariie a unei fee a banului


() =

Buffon

4040

2048

0,507

K. Pearson

12000

6019

0,5016

K. Pearson

24000

12012

0,5005

Aceast valoare fix poate fi considerat ca fiind probabilitatea evenimentului analizat.


Definiia 2.4

n cazul unui numr suficient de mare de probe, , n care evenimentul


apare de ori, frecvena relativ poate fi socotit ca valoare a probabilitii
evenimentului :

() = lim

(2.2)

Aceast valoare poart denumirea de probabilitate statistic i face posibil utilizarea teoriei
probabilitilor la analiza statistic a fenomenelor aleatorii.
Exemplul 2.4:
O instalaie pilot a produs diferite loturi de oel cu urmtoarele caracteristici:
Rezistena la
rupere sczut

Rezistenta la
rupere ridicat

43

Nivel sczut de
impuriti

Nivel ridicat de
7
6
impuriti
Considernd c aceste rezultate sunt reprezentative pentru producia firmei,
s se calculeze probabilitatea ca produsele s fie:
a. Cu un nivel sczut de impuriti;
b. Cu rezisten ridicat la rupere;
c. Cu nivel ridicat de impuriti i rezisten la rupere ridicat;
d. Cu nivel sczut de impuriti i rezisten la rupere sczut.
Soluie:

47

a.

() = 60 = 0.7833.

a.

() = 60 = 0.8166

49
6

b. () = 60 = 0.1.
c.

() = 60 = 0.0666.

De asemenea, pornind de la frecvena relativ se pot determina cu uurin cteva dintre


proprietile probabilitilor. Pentru a le deduce, considerm datele din exemplul 2.3. Rezult:
1.

Probabilitatea evenimentului imposibil este:


() =

2.

0
= = 0.

Probabilitatea reuniunii a dou sau mai multe evenimente elementare. De exemplu,


considerm evenimentul A={3 , 5 , 6 }. Vom obine, aplicnd definiia statistic a
probabilitilor:
() =

Definiia 2.5

3 + 5 + 6 3 5 6
=
+
+
= Pr(3 ) + Pr(5 ) + Pr(6 ).

Pentru un spaiu de eantionaj de tip discret, probabilitatea unui eveniment


oarecare este egal cu suma probabilitilor evenimentelor elementare ce
compun evenimentul considerat.

3. Aplicnd relaia anterioar, se poate determina probabilitatea evenimentului sigur, :


6

() = Pr( ) =
=1

=1
= = 1.

Exemplul 2.5:
Considerm problema din exemplul 2.1. S se calculeze probabilitatea
evenimentului ce const din extragerea primei bile numerotate cu cifra unu, iar
pentru cea de-a doua bil nu conteaz numrul inscripionat pe ea.
Soluie:

Notm evenimentul considerat cu, . Constatm c n cazul n care nu


reintroducem n urn prima bil extras, evenimentul considerat este de
forma:
= {(), (), (), (), (), (), ()}.
1

Deci, () = 7 56 = 0.125.
Pentru cazul al doilea, cnd reintroducem n urn bila extras, evenimentul
considerat este de forma:
= {(), (), (), (), (), (), (), ()}.
1

Deci, () = 8 64 = 0.125.
Se constat c i aceast definiie prezint o serie de neajunsuri:
a. Nu caracterizeaz ntr-un mod unic ansa de realizare a unui eveniment. Ne d doar
posibilitatea de a compara frecvena apariiei unui eveniment, ntr-o serie de probe, cu
alt serie, pentru care numrul de probe este mai mic sau mai mare;

b. Definiia statistic a probabilitii nu reflect dect stabilitatea asimptotic constatat


experimental, a frecvenei relative, ntr-un numr arbitrar de mare de probe
independente, ale experimentului;
c. Definiia 2.4 are un caracter mai mult descriptiv dect matematic;
d. Este aplicabil doar n cazul spaiilor de eantionaj finite;

2.3.3 DEFINIIA GEOMETRIC A PROBABILITII


Datorit neajunsurilor pe care le au definiiile prezentate anterior, o dat cu dezvoltarea teoriei
matematice a msurii, definiia statistic a probabilitilor a putut fi extins i prezentat ntr-o
form mult mai general, [TAR 89].
Aceast form a definiiei probabilitilor are la baz noiunea matematic de msur.
Definiia 2.6

O msur este o funcie care asociaz un numr, de exemplu o mrime, un


volum, sau o suprafa, unei submulimi a unei mulimi date.

Acest concept a fost dezvoltat datorit necesitii de a realiza integrri pe mulimi arbitrare, i
nu numai pe intervalele reale, pe care se integra de obicei. Conceptul e important n analiza
matematic i reprezint un fundament riguros pentru teoria probabilitilor i statistic.
Definiia 2.7

Probabilitatea geometric a unui eveniment oarecare , reprezint raportul


dintre msura evenimentului considerat, () i msura evenimentului sigur,
():
() =

()
.
()

(2.3)

Msurile ce intervin n expresia geometric se adopt n funcie de natura experienei.


Exemplul 2.6:
Dou persoane, X i Y, i dau ntlnire ntre orele 12:00 i 13:00, ntr-un anumit
loc, venind fiecare independent. n plus, cele dou persoane mai fac i
urmtoarea convenie, primul venit l ateapt pe cel de-al doilea 15 minute i
dac acesta nu vine, pleac.
Care este probabilitatea ca cele dou persoane s se ntlneasc?
Soluie:

Conform figurii 2.2, rezult:


() = 1 1 = 1 i reprezint suprafaa ptratului din figura de mai jos.
1 3 3

() = () 2 2 4 4 = 1 16 = 16 i reprezint suprafaa haurat din


figura 1.10. Deci, () =

()
()

16


1300
1245

1200
Figura 2.2

1300

1215

Schia pentru rezolvarea exemplului 2.6

Cu tot suportul consistent al teoriei msurii i acestei definiii i-au fost aduse numeroase critici,
n special, privind modului arbitrar de alocare al valorii probabilitii, pentru un eveniment
oarecare. Aceast accepiune reprezint, totui, un pas nainte pentru calculul probabilitilor
ntruct permite abordarea probabilitilor i pentru cazul spaiilor de eantionaj infinite.

Considerm un spaiu de eantionaj finit, iar evenimentele elementare


sunt echiprobabile. Definii n aceste condiii probabilitatea unui
eveniment A.
Precizai avantajele i dezavantajele acestei definiii a probabilitilor.
Precizai relaia de calcul pentru definiia statistic a probabilitii.
Precizai avantajele i dezavantajele acestei definiii a probabilitilor,
precum i principalele proprieti ce rezult din aceast accepiune a
probabilitilor.
Probabilitatea unui eveniment A este dat de relaia:
()
() =
.
()
Precizai semnificaia factorilor ce intervin n expresia de mai sus,
precum i avantajele i dezavantajele acestei definiii a probabilitilor.
S se determine probabilitatea p, pentru urmtoarele evenimente:
a. Un numr impar apare ca urmare a aruncrii unui zar;
b. n urma extragerii unei cri dintr-un pachet de 52 cri de joc
obinem un K;
b. Obinem cel puin o pajur, n urma aruncrii de trei ori
consecutiv, a unei monede;

O bil este extras aleatoriu dintr-o urn ce conine 10 bile roii, 8 bile
albe i 6 bile albastre. Calculai probabilitatea ca aceast bil s fie:
a. Roie;
b. Alb;
c. Albastr;
d. S nu fie alb;
e. S nu fie roie sau alb.
n magazia unei companii se afl un lot de materie prim alctuit din
500 de piese. tiind c 4 dintre ele sunt piese neconforme, calculai
probabilitatea ca extrgnd aleatoriu o pies aceasta s fie conform.

2.3.4 DEFINIIA AXIOMATIC A PROBABILITILOR


Forma sub care se utilizeaz astzi noiunea de probabilitate a fost dezvoltat, acum aproximativ
77 de ani de ctre matematicianul rus Andrey Kolmogorov, n condiiile n care teoria
probabilitilor a nceput s fie intens utilizat n modelarea fenomenelor tiinelor naturii,
tehnicii i a fenomenelor economice.
Astfel, a devenit absolut necesar studiul sistematic al conceptelor de baz ale teoriei
probabilitilor i de a stabili o modalitate de aplicare, a acestei teorii, ntr-o structur
axiomatic.
Kolmogorov a reuit crearea acestei structuri axiomatice, apropiind conceptul de probabilitate
de teoria mulimilor, teoria msurii i de analiza funcional.

2.3.4.1 SISTEMUL DE AXIOME AL LUI KOLMOGOROV

Teoria se bazeaz pe un spaiu de eantionaj S, finit sau infinit i un sistem (), de submulimi
ale lui , vezi tabelul 1.1. Elementele sistemului (, ), adic submulimile lui S sunt denumite
evenimente aleatorii, [BER 00], [MON 03].
Pe baza sistemului (, ), de evenimente aleatorii, n care = ,reprezint evenimentul sigur,
, evenimentul imposibil, iar i evenimente complementare, probabilitatea de apariie a
unui eveniment este definit pe baza sistemului de axiome al lui Kolmogorov:
Axioma 1:

De existen i unicitate
Fiecrui eveniment aleatoriu, , din cmpul de evenimente i este ataat un
numr real nenegativ (), numit probabilitatea lui .

Axioma 2:

A unitii de msur
Probabilitatea evenimentului sigur, , este unu, () = 1.

Axioma 3:

De aditivitate
Dac evenimentele 1 , 2 , . . . , , . . . , sunt incompatibile dou cte dou,
= , , =
1, , atunci:

(1 2 3 ) = ( ).

(2.4)

=1

Sistemul de axiome nu este contradictoriu, iar teoria modern a probabilitilor se bazeaz pe


el.
Acest concept teoretic al probabilitilor, mpreun cu o interpretare, n sens larg, a frecvenei
relative de apariie a evenimentelor aleatorii, ce apar n urma unei experiene, este baza
statisticii matematice.
2.3.4.2 CONSECINELE SISTEMULUI DE AXIOME AL LUI KOLMOGOROV
Calculul probabilitilor, ca teorie matematic, a fost dezvoltat cu scopul de a permite asocierea
fiecrui eveniment, al unei experiene, o valoare a probabilitii. Din cele prezentate anterior
constatm c, dac n cadrul unei experiene aleatorii ne concentrm asupra unui eveniment, de
fapt, ne fixm atenia asupra unei pri din mulimea probelor experimentului. Astfel, un
eveniment poate fi identificat cu un element din mulimea prilor spaiului de eantionaj
corespunztor.
De aceea, cadrul conceptual al evenimentelor a fost completat cu o nou noiune i anume,
cmp de evenimente, [MIH 80], [CRS 81]. n funcie de tipul spaiului de eantionaj, putem
distinge un cmp de evenimente finit, sau un cmp de evenimente infinit.
Definiia 2.8:

Fie o mulime nevid, iar () o familie de pri ale lui . Cuplul format
din (, ) se numete cmp finit de evenimente, dac familia verific
condiiile:
1. () i ().
2. A () ().
3. A, B () ()i ().
4. A, B (), dac \ ().

Definiia 2.9:

Fie o mulime nevid, iar () o familie de pri ale lui . Cuplul format
din (, ) se numete cmp infinit de evenimente, dac familia verific
condiiile:
1. () i ().
2. A () ().
3. A, B () ()i ().
4. A, B (), dac \ ().

5. (),
=1 () =1 ().

Avnd la baz operaiile algebrice ale teoriei mulimilor, precum i axiomele enunate mai sus,

pentru un cmp de evenimente finit sau infinit, se pot deduce urmtoarele consecine ale
probabilitilor, ataate acestor evenimente:
1. Probabilitatea evenimentului imposibil este zero:
() = 0.

(2.5)

Considerm un eveniment oarecare , ce aparine unui spaiu de eantionaj , ().


Din figura 2.3, se observ c:
= ,
adic, cele dou evenimente sunt incompatibile. De asemenea, se constat c:
= , adic ( ) = ().

Figura 2.3

Diagrama Euler Venn pentru un eveniment oarecare i contrariul lui,

Aplicnd cea de-a treia axiom asupra relaiei precedente, obinem:


() + () = ().
Ecuaia anterioar este adevrat doar n situaia n care () = 0, deoarece
probabilitatea oricrui eveniment este un numr real nenegativ, conform primei axiome.
2. Probabilitatea unui eveniment oarecare este un numr real cuprins n intervalul [0,1]:
0 (A) 1.

(2.6)

Considerm un eveniment oarecare , ce aparine unui spaiu de eantionaj , ,


precum i evenimentul contrar lui, . Din figura 2.3, se observ c:
= ,
A
adic, cele dou evenimente sunt incompatibile. De asemenea, se constat c:
= , adic ( A
) = ().
A
Aplicnd a doua i a treia axiom asupra relaiei precedente, obinem:
) = 1.
() + (A

(2.7)

)
Ecuaia anterioar este adevrat doar n situaia n care 0 () 1, i 0 (A
1, deoarece probabilitatea oricrui eveniment este un numr real nenegativ, conform
primei axiome.
3. Considerm un eveniment oarecare , (). Probabilitatea evenimentului contrar,
este:
(2.8)
() = 1 (),
Aceast proprietate rezult din ecuaia (2.7).
10

4. Probabilitatea este subtractil:


(\) = () (),

(2.9)

dac cele dou evenimente i se afl ntr-o relaie de forma .


Considerm dou evenimente i , , (), astfel nct . Conform figurii
2.4 observm c:
(\) = ,

Figura 2.4

Diagrama Euler Venn pentru dou evenimente oarecare , (),

Aplicnd cea de-a treia axiom asupra relaiei anterioare i aranjnd, apoi, termenii se
obine relaia (2.9).
5. Probabilitatea este monoton:
() (),

(2.10)

dac i , ().
Pornind de la ecuaia (2.9) i de la prima axiom a lui Kolmogorov, adic:
0 (\) 1,
rezult tocmai relaia (2.10).
6. Considerm dou evenimente oarecare i , , (). Atunci:
(\) = () ( )

(2.11)

Conform figurii 2.5, vom scrie expresia evenimentului ca o combinaie de dou


evenimente incompatibile. Se observ c:
(\) ( ) = .
De asemenea,
= (\) ( ) i () = (\) + ( ).
\

Figura 2.5

Diagrama Euler Venn pentru cazul consecinei 6


11

7. Pentru oricare dou evenimente i , , (), avem:


( ) = () + () ( )

(2.12)

Conform schiei din figura 2.6, observm c:


(\) = ,
adic cele dou evenimente, i \ sunt incompatibe. De asemenea, putem scrie, ntre
aceleai dou evenimente, relaia:
(\) = i
[ (\)] = ( ).
Aplicnd asupra relaiei anterioare axioma III, rezult:
() + (\) = ( ).

(2.13)

Figura 2.6

Diagrama Euler Venn pentru cazul consecinei 7

Tot din figura 2.6, se observ c:


\ = \( ) i
( ) .
Dac, asupra celor dou evenimente din relaiile anterioare aplicm ecuaia (2.11), vom
obine:
(\) = () ( ).
nlocuind rezultatul precedent n relaia (2.13) i aranjnd termenii, rezult proprietatea
(2.12).
Exemplul 2.7:
Considerm dou evenimente A i B, aparinnd unui cmp de
evenimente P(S). Dac probabilitile de apariie ale acestor evenimente sunt:
() = 0.25, () = 0.35 i ( ) = 0.15, s se calculeze:
a. ().
c. ( ).

b. ( ).
d. ( ).

12


e. (
).
Soluie:

f. ( ).

Conform figurii 2.7, rezult:


f. () = 1 Pr() = 1 0.25 = 0.75;
g. ( ) = () + () ( ) = 0.25 + 0.35 0.15 =
0.45;
h. ( ) = () ( ) = 0.35 0.15 = 0.2;
i. ( ) = () ( ) = 0.25 0.15 = 0.1;

j. (
) = 1 ( ) = 1 0.45 = 0.55;
k. ( ) = Pr() + Pr( ) Pr(A ) = 0.25 + 0.65 0.1 = 0.8,
sau
( ) = 1 (B) + ( ) = 1 0.35 + 0.15 = 0.8.
\

Diagrama Euler Venn pentru exemplul 2.7

Figura 2.7

8. Considerm evenimente, (),


1, . Probabilitatea reuniunii celor n
evenimente este:

( ) = ( ) ( ) +
=1

=1

(2.14)

( ) + + (1)1 (1 2 ).

Ecuaia (2.14) reprezint generalizarea relaiei (2.12), pentru cazul a evenimente.


Proprietatea (2.14) se demonstreaz prin inducie matematic complet. Fr a demonstra
aceast ecuaie, n continuare vom deduce relaia de calcul a probabilitii pentru
reuniunea a trei mulimi, , i:
( ) = ( ) + () [( ) ].
Dar, conform ecuaiei (2.12):
( ) = () + () ( ).

13

Introducnd aceast ecuaie n prima i folosind proprietatea de distributivitate a


interseciei fa de reuniune, rezult:
( ) = () + () ( ) + ()
[( ) ( )].
Deoarece:
[( ) ( )] = ( ) + ( ) ( ),
rezult:
( ) = () + () + () ( )
( ) ( ) + ( ).

(2.15)

Exemplul 2.8:
Considerm experimentul aruncrii unui zar la care urmrim
evenimentele: = {1,2,3}, = {2,3} i = {2,4}.
S se determine probabilitatea evenimentului: .
Soluie:

Varianta I
{ } = {1,2,3,4}. ntruct evenimentele {1}, {2}, {3}, {4}, sunt
evenimente elementare, deci incompatibile, obinem:
4

{ } = {1} + {2} + {3} + {4} = 6 = 3.


Varianta II:
3

() = 6 = 2 , () = 6 = 3i() = 6 = 3 .
2

( ) = {2,3} = 6 = 3 ;( ) = ( ) = {2} = 6
1

i ( ) = {2} = 6.
Rezult, utiliznd ecuaia (2.15):
1

{ } = 2 + 3 + 3 3 6 6 + 6 = 2 + 6 = 3.
9. Considerm evenimente, (),
1, . Probabilitatea interseciei celor n
evenimente este:

( ) = ( ) ( ) +
=1

=1

(2.16)

( ) + + (1)1 (1 2 ).

innd cont de distributivitatea reuniunii fa de intersecie, ecuaia (2.16) reprezint


generalizarea relaiei (2.12) scris sub forma:

14

( ) = () + () ( ),

(2.17)

pentru cazul a evenimente.


Proprietatea (2.17) se demonstreaz, de asemenea, prin inducie matematic complet.

2.3.5 PROBABILITATE SUBIECTIV


n foarte multe aplicaii practice ale teoriei probabilitilor, rezultatele experimentelor nu sunt
echiprobabile, nu exist nici un fel de istoric privind rezultatele obinute prin efectuarea de
probe, sau nu exist informaii cantitative asupra probabilitii de apariie a unui eveniment,
insuficient studiat.
Dac, n asemenea cazuri, trebuie estimate probabilitile evenimentelor, nu exist alt soluie
dect s facem apel la aa numitele probabiliti subiective. n esen, este vorba de
probabiliti atribuite evenimentelor, n mod subiectiv, pe baza ansei cu care credem c
evenimentul studiat se va produce, sau pe baza intuiiei. De regul apelm la opinia unui expert,
care poate s ne furnizeze informaii subiective despre ansa evenimentelor de a se realiza, pe
baza unor evaluri personale.

15

Curs 3.

3.3 PROBABILITI CONDIIONATE


Definiiile probabilitilor enunate n UI 2 se bazeaz pe ipoteze ferme, adic ansa de apariie
a unui eveniment, sau condiiile de experimentare nu se modific n timpul efecturii probelor.
Probabilitile de acest tip se mai numesc i probabiliti necondiionate.
Sunt, ns, anumite situaii n care probabilitatea de apariie a unui eveniment, , este
condiionat de realizarea anterioar a unui alt eveniment, cu o anumit probabilitate. O astfel
de probabilitate se numete probabilitate condiionat i se noteaz cu (|). Notaia
probabilitii condiionate se citete probabilitatea evenimentului condiionat de evenimentul
.
Exemplul 3.1
ntr-o urn se gsesc bile. Dintre acestea, sunt bile negre () i
sunt bile albe (). Dac extragem o bil i apoi o reintroducem n urn,
apoi extragem din nou etc. probabilitile de extragere a unei bile albe sau
negre sunt probabiliti necondiionate, ntruct configuraia bilelor din urn se
pstreaz neschimbat la fiecare extragere.
Soluie:

Dac extragem o bil (evenimentul ) i fr s o introducem napoi mai


extragem o a doua bil (evenimentul ) atunci, vom obine probabiliti
condiionate de rezultatul primei extrageri:
Evenimentul

()

Evenimentul

(|)

1
1

1
1

Se constat c probabilitatea evenimentului depinde de realizarea


anterioar a evenimentului .
Pentru a deduce expresia de calcul a probabilitilor condiionate vom considera un alt exemplu.
Exemplul 3.2
Considerm o comunitate uman, alctuit din persoane. n cadrul
acestei comuniti triesc , femei i persoane care sunt pensionare, vezi
figura 3.1.

Figura 3.1

Diagrama Euler Venn pentru exemplul 3.2

Soluie:

Dac, notm evenimentul ca o persoan aleas aleatoriu, din aceast


populaie, este pensionar, cu i cu , evenimentul ca aceast persoan s
fie de sex feminin, rezult:

() =

() = .

Dac notm cu , numrul de femei are sunt pensionare, n comunitatea


respectiv, putem calcula probabilitatea ca printr-o alegere aleatorie a unui
pensionar din comunitatea respectiv, acesta s fie de sex feminin:
(|) =


( )
=

=
.


()

Rezult c relaia de calcul a probabilitilor condiionate este, prin definiie:


Definiia 3.1

Probabilitatea condiionat a unui eveniment , de realizarea anterioar a


unui alt eveniment , () 0, este:
(|) =

( )
.
()

Din relaia (3.1), prin simetrie, putem scrie:


( )
(|) =
.
()

(3.1)

(3.2)

innd cont de proprietatea de comutativitate a interseciei, din ecuaiile (3.1) i (3.2), rezult:
(|) (|)
( )
(3.3)
=
=
.
()
()
() ()
Tot pe baza ecuaiilor (3.1) i (3.2) putem deduce i regula de nmulire a dou evenimente
oarecare, i :
(3.4)
(|) () = (|) () = ( ).

Soluie:

Exemplul 3.3
ntr-un atelier care produce piese de schimb, utilajul de baz
funcioneaz 95% din timpul de lucru n condiii optime de mediu (evenimentul
A). De asemenea, se cunoate c n condiii optime de lucru procentul de
rebuturi este 1%, iar n condiii de lucru neconforme, utilajul produce 10%
rebuturi. S se determine probabilitatea ca o pies realizat n atelier s fie
neconform.
() = 0.95 i () = 0.05.
Dac notm cu evenimentul producerii de rebuturi, putem scrie:
(|) = 0.01 i (|) = 0.1.
Conform figurii 3.2, rezult:
() = ( ) + ( ) = 0.095 + 0.005 = 0.01.
Deoarece, ( ) = () (|) = 0.95 0.01 = 0.0095
i ( ) = () (|) = 0.05 0.1 = 0.005.

() = 0.95

() = 0.05

(|) = 0.99

(|) = 0.9

(|) = 0.1

(|) = 0.01

( )

Condiiile de funcionare
ale utilajului

( )

( )

Calitatea produselor

( )

Figura 3.2

Arborele de evenimente pentru exemplul 3.3

Definiia 3.2

Dou evenimente, i se numesc evenimente dependente, dac


probabilitatea de apariie a unuia este influeneaz probabilitatea de apariie a
celui de-al doilea printr-o relaie de forma (3.1).
n caz contrar, evenimentele se numesc evenimente independente.

Definiia 3.3

Dou evenimente, i se numesc evenimente independente, dac


probabilitatea de apariie a unuia nu este influeneaz probabilitatea de
apariie a celui de-al doilea.

Pentru a putea deduce relaia dintre probabilitile a dou evenimente independente considerm
ecuaiile (3.1) i (3.2).
Conform definiiei 3.3, rezult c:
(|) = ()

i
(|) = ().
Introducnd expresiile anterioare n ecuaiile (3.1) i (3.2), obinem pentru cazul a dou
evenimente independente:
() () = ( ).

(3.5)

Deci, pentru dou evenimente independente probabilitatea interseciei acestor evenimente este
egal cu produsul probabilitilor lor.
Exemplul 3.4
O companie cu 488 de angajai, din care 122 de femei, la finalul anului
trecut a promovat ntr-o clas superioar de salarizare 96 de angajai, din care
24 de femei. Precizai dac decizia de cretere a salariului este
nediscriminatorie ntre brbai i femei.
Soluie:

Considerm urmtoarele evenimente:


angajatul este femeie;
angajatul este brbat;
un angajat s fie promovat;
un angajat s nu fie promovat.
Cu date problemei putem construi urmtorul tabel:
Angajai:

Promovai:

Nepromovai:

TOTAL:

Brbai:

72

294

366

Femei:

24

98

122

TOTAL:

96

392

488

Vom calcula probabilitile evenimentelor:


122
366
() =
= 0.25 () =
= 0.75
488
488
24
72
Pr(|) =
= 0.25. Pr(|) =
= 0.75.
96
96

Observm c () = (|). Deci, decizia de cretere a salariului este


nediscriminatorie.
Proprietatea de independen a evenimentelor poate fi generalizat pentru cazul a evenimente
independente:
Definiia 3.4

evenimente 1 , 2 , , sunt independente dac i numai dac, oricare


submulime 1 , 2 , , , a acestor evenimente ndeplinete condiia,
[ROS 04]:

(1 ) (2 ) ( ) = (1 2 ).

(3.6)

Exemplul 3.5
Considerm ansamblul mecanic prezentat n figura 3.3. S se calculeze
probabilitatea ca ansamblul s funcioneze, tiind c probabilitatea de
funcionare a fiecrui element component este cea prezentat n figur, iar
defectrile componentelor sunt independente.
Soluie:

() = ( ) = 0.999875 0.85 0.99 = 0.8414.


Deoarece:
() = 1 (1 2 3 )
3

= 1 ( ) = 1 0.053 = 0.999875.
=1

() = 0.85.
() = 1 (1 2 ) = 1 (1 ) (2 ) = 1 0.12 = 0.99.
(1 ) = 0.95
(2 ) = 0.95

(1 ) = 0.90
() = 0.85
(2 ) = 0.90

(3 ) = 0.95

Figura 3.3

Schema componentelor pentru exemplul 3.5

3.4 REGULA GENERAL DE NMULIRE A PROBABILITILOR


Regula general de nmulire a probabilitilor reprezint o generalizare a ecuaiilor (3.4),
pentru cazul a evenimente despre care nu putem face precizarea c sunt sau nu independente.
n acest caz:
Dac considerm evenimente, 1 , 2 , , , atunci probabilitatea
interseciei acestor evenimente este:

Definiia 3.5

) = Pr(1 ) (2 |1 ) (3 |1 2 )

=1

(3.7)

( |1 2 1).
Ecuaia (3.7) reprezint doar una din cele ! relaii echivalente care pot fi stabilite n acest caz
i se deduce, dup cum urmeaz.

Pornind de la relaia de definiie a probabilitilor condiionate, (3.1), putem scrie urmtoarele


expresii echivalente innd cont de comutativitatea operaiei de intersecie:
(1 ) = (1 ) ;
(2 |1 ) =
(3 |1 2 ) =

(1 2 )
;
(1 )
(1 2 3 )
;
(1 2 )

(1 |1 2 2 ) =
( |1 2 1 ) =

Pr(1 2 1 )
;
Pr(1 2 2 )

Pr(1 2 )
.
Pr(1 2 1 )

Dac nmulim relaiile precedente, membru cu membru i efectum simplificrile factorilor


care intervin n expresia produsului, obinem ecuaia (3.7).
Exemplul 3.6
Considerm o urn ce conine 5 bile roii, (R), 6 bile galbene, (G) i 14
bile albastre, (A). S se calculeze probabilitatea ca extrgnd succesiv trei bile,
fr a introduce bila extras n urn, s obinem n final trei bile de culori
diferite. Dar dac ne intereseaz ca cele trei bile s n urmtoarea succesiune:
(G,A,R)?
Soluie:

a. Varianta I: utiliznd relaia (3.7), obinem:


( ) = 3! [() (|) (| )] =
= 3!

6 14 5

= 0.18206.
25 24 23

Varianta II: utiliznd ecuaia (2.1):


( ) =

3! 16 114 15
= 0.18206.
325

b. Varianta I: utiliznd relaia (3.7), obinem:


( ) = () (|) (| ) =
=

6 14 5

= 0.0304.
25 24 23

Varianta II: utiliznd ecuaia (2.1):


16 114 15
( ) =
= 0.0304.
325

3.5 FORMULA PROBABILITII TOTALE


Aplicaiile practice ale teoriei probabilitilor au condus la analiza unor situaii n care, pentru
un anumit experiment, nu mai putem distinge sau delimita, toate cazurile posibile, deoarece n
aceste cazuri evenimentele elementare i pierd consistena. Cu ale cuvinte, nu mai putem
identifica evenimentele elementare. De aceea, a fost introdus o nou noiune, cea de sistem
complet de evenimente.
Definiia 3.6:

Sistemul de evenimente { }=1 , (),se numete sistem complet de


evenimente, dac:
, = , i =1 = .

Fie un sistem complet de evenimente { }=1 , definit pe un cmp evenimente, (, ) i un


eveniment oarecare, , aparinnd aceluiai cmp de evenimente, (, ), vezi figura 3.4.
Atunci:
Definiia 3.7

Probabilitatea de apariie a evenimentului se calculeaz cu relaia:

() =

( ) (| ).

(3.8)

=1

Ecuaia (3.8) reprezint formula probabilitii totale.

Figura 3.4

Schema pentru demonstrarea formulei probabilitii totale

Deoarece { }=1, reprezint un sistem complet de evenimente, putem scrie urmtoarele relaii:
=1 = i = .
De asemenea, conform figurii 3.4, rezult:

= = A (

) =

=1

( ).

=1

Se constat c evenimentele: ( ), 1, , sunt incompatibile:


( ) ( ) = .
Deci,

( ).

() =

=1

Dac n ecuaia precedent nlocuim valoarea probabilitii, ( ), cu expresia (3.4),

adic:
( ) = ( ) (| ),
n final se obine:

() =

( ) (| ),

=1

formula probabilitii totale.


Exemplul 3.7
n magazia unei firme se afl dou loturi de piese de acelai tip. Primul
lot este alctuit din 100 de piese, din care, 12 piese sunt neconforme, iar n cel
de-al doilea lot compus din 150 de piese, se afl 25 piese neconforme. Se iau la
ntmplare, dintr-unul din cele dou loturi, 20 piese. Care este probabilitatea
ca ntre piesele prelevate s gsim 12 piese conforme i 8 neconforme?
Soluie:

Pentru rezolvarea problemei vom utiliza formula probabilitii totale,


particularizat pentru cazul unui sistem complet de evenimente alctuit din
dou evenimente:
() = () (|) + ( ) (|)

(3.9)

Notm:
evenimentul prelevrii pieselor din primul lot, () = 0.5;
evenimentul prelevrii pieselor din cel de-al doilea lot, , ( ) = 0.5;
evenimentul ca din cele 20 piese prelevate 12 sunt conforme i 8
neconforme.
8
8
12
20! 12
88
12
88 12
(|) =

=
= 0.000189;
20
20
12! 8!
100
100
12
8
125
25
(| ) =
= 0.005246.
20
150
Rezult:
() = 0.5 0.000189 + 0.5 0.005246 = 0.002717.

3.6 FORMULA LUI BAYES


Definiia 3.8

Dac evenimentele { }=1, formeaz un sistem complet de evenimente pe un


cmp evenimente (, ), atunci pentru orice eveniment (, ):

( |) =
=

Pr( ) Pr(| )
.
Pr(1 ) Pr(|1) + Pr(2 ) Pr(|2) + + Pr( ) Pr(| )

(3.10)

Ecuaia (3.10) poart denumirea de formula lui Bayes.


Conform regulii de nmulire a probabilitilor, ecuaia (3.4), obinem:
( ) = ( ) (| ),
( ) = () ( |).
Din egalitile precedente, rezult:
( |) =

( ) (| )
.
()

Dac, n aceast relaie, nlocuim numitorul cu expresia formulei probabilitii totale, relaia
(3.8), se obine:
( ) (| )
( |) =
,
=1 ( ) (| )
formula lui Bayes.
Exemplul 3.8
O anumit Societate comercial se aprovizioneaz cu materiale de la 4
furnizori, conform tabelului alturat.
Presupunnd c procentul de neconformiti realizat de fiecare dintre aceti
furnizori este, respectiv 5%, 3%, 2%8%, s se determine probabilitatea ca
un produs aprovizionat, ales aleatoriu din magazia unde sunt depozitate acestea,
s fie neconform i s provin de la furnizorul .

Soluie:

Furnizorul

Cantitate

60%

20%

5%

15%

Notm cu:
- evenimentul ca un produs aprovizionat s fie neconform;
- evenimentul ca un produs aprovizionat s provin de la furnizorul B.
Conform teoremei lui Bayes, rezult:
{|} =

{|} {}
.
{}

= {|}

Deci,
{|} =

0.03 0.20
= 0.122.
0.05 0.6 + 0.03 0.20 + 0.02 0.05 + 0.08 0.15

Exemplul 3.9
ntr-o anumit comunitate, recensmntul populaiei a evideniat
urmtoarea situaie, referitoare la numrul de copii din cadrul unei familii:

Numrul de copii/familie:
Probabilitatea:

0.20

0.50

0.25

0.05

tiind, de asemenea, c probabilitatea de a se nate un biat, sau o fat, este


de 50%, s se calculeze:
a. Probabilitatea ca ntr-o familie, aleas n mod aleatoriu, s existe doar
un biat;
b. Probabilitatea ca ntr-o familie cu doi copii, aleas n mod aleatoriu,
unul dintre copii s fie biat.
Soluie:

a. Conform formulei probabilitii totale:


3

{1} = {| } { }
=0

Unde s-a notat cu , = 0,3 numrul de copii dintr-o familie i cu


evenimentul ca ntr-o familie s fie un biat. Rezult, conform formulei
probabilitii totale:
3!
{} = 0 0.2 + 0.5 0.5 + 2! 0.52 0.25 +
0.53 0.05
2! 1!
= 0.39375.
b. Notm cu evenimentul ca ntr-o familie s fie doi copii i cu ,
evenimentul ca n familia respectiv s existe un biat. Rezult, conform
definiiei probabilitilor condiionate:
Pr( ) = {|} ().
Dar,
{|} = {(B, F), (F, B)} = 2! 0.52 = 0.5
i
( ) = 0.5 0.25 = 0.125.
Rezult:
{|} =

( ) 0.25 0.5
=
= 0.3174.
{}
0.39375

10

Curs 4.

4.3 VARIABILE ALEATORII


Metoda de calcul a probabilitilor, prezentat pe larg n unitile de nvare precedente este o
metod descriptiv, ce difer foarte mult de situaiile reale n care studiem fenomene aleatorii.
Acest lucru rezult din majoritatea exemplelor de experimente aleatorii prezentate n care
spaiul de eantionaj a fost definit pe baza unei descrieri a mulimii rezultatelor posibile ale
experimentelor. Pornind de la valorile atribuite probabilitilor evenimentelor elementare i
folosind conceptele de baz ale calcului probabilitilor, ulterior s-au determinat probabilitile
diferitelor tipuri de evenimente.
n studiul fenomenelor naturale ntlnim, frecvent, mrimi care iau valori numerice reale, n
funcie de o serie de factori aleatorii/ntmpltori, astfel nct cercetarea acestor fenomene se
realizeaz prin diferite procedee de msurare.
Exemplul 4.1
Considerm urmtoarele experimente aleatorii:
a. Analiza numrului zilnic al absenilor ntr-o instituie;
b. Determinarea numrul cumprtorilor dintr-un magazin, ntr-o or;
c. Aruncarea unei monede pn apare pajura;
d. Msurarea dimensiunilor unor piesele executate pe maini-unelte;
e. Determinarea nlimii persoanelor dintr-un grup;
f. Msurarea cantitii zilnice, de benzin, vndut ntr-o benzinrie.
Soluie:

Observm din exemplul 4.1, c n studiul acestor experiene aleatorii apar


diferite de mrimi caracterizate de valori ntmpltoare, iar valorile pe care le
iau sunt funcii de rezultatul experimentului. n unele cazuri, descrieri ale
rezultatelor probelor sunt suficiente, dar n alte cazuri, este util s se asocieze
un numr fiecrui rezultat al spaiului de eantionaj, prin care rezumm
rezultatul unei probe efectuate n cadrul unui experiment.

Deoarece rezultatul obinut, n urma efecturii de probe n cadrul unui experiment, nu este
cunoscut n avans, valoarea rezultat a variabilei noastre nu este nici ea cunoscut n avans. Din
acest motiv, n teoria probabilitilor a fost introdus un nou concept, de baz, pentru variabila
care asociaz o valoare numeric fiecrui rezultat al unui experiment aleatoriu. Este vorba de
variabila aleatorie, [GIB 76], [MET 76], [SPI 01]:
Definiia 4.1:

Variabila aleatorie reprezint o mrime care n funcie de rezultatul unui


experiment poate lua orice valoare dintr-o mulime bine determinat de valori
numit mulimea valorilor posibile.

O variabil aleatorie se noteaz cu majuscule, de exemplu . Dup ce efectum o prob, n


cadrul experimentului considerat, valoarea msurat a variabilei aleatorii este notat cu o liter
mic, .
Exemplul 4.2
ntr-un depozit cu piese de calitate (50%) i cu piese neconforme (50%)
se extrag succesiv trei piese punnd dup fiecare extragere, piesa la loc.
Ca valoare asociat unui eveniment aleatoriu se consider numrul
pieselor de calitate, obinut n urma a trei extrageri.
n urma extragerii celor trei piese se obin opt evenimente elementare (23 )
echiprobabile. Aceste evenimente i probabilitile asociate, precum i
valorile variabilei aleatorii sunt prezentate n tabelul de mai jos.

Soluie:

=
=
=
=
=
=
=
{, , } {, , } {, , } {, , } {, , } {, , } {, , }

=
{, , }

1 = 0

2 = 1

2 = 1

2 = 1

2 = 2

2 = 2

2 = 2

3 = 3

( ):

1
8

1
8

1
8

1
8

1
8

1
8

1
8

1
8

n figura 4.1 este prezentat metoda de definire a unei variabile aleatorii


pentru cazul exemplului 4.2.

2 = {, , }

5 = {, , }
8 = {, , }

3 = {, , }

6 = {, , }

1 = {, , }
4 = {, , } 7 = {, , }

:
0
Figura 4.1:

Definirea variabilei aleatorii pentru cazul exemplului 4.2.

Aceast procedur, nu numai c ne permite s nlocuim un spaiu eantionaj alctuit din


elemente arbitrare printr-un nou spaiu eantionaj, avnd ca elemente numerele reale, dar ne
permite, de asemenea, s folosim procedeele algebrice, prezentate n UI 1, pentru calculul
probabilitilor. n plus, cele mai multe probleme n domeniul tiinei i ingineriei au la baz
diferite rezultate experimentale cantitative obinute n urma msurrilor.
Definiia 4.1 reprezint una dintre primele definiii atribuite acestui concept. Ulterior, odat cu
dezvoltarea teoriei axiomatice a probabilitilor, a putut fi formulat o nou definiie, mult mai
2

riguroas, pentru noiunea de variabil aleatorie.


Definiia 4.2:

O variabil aleatorie este o funcie msurabil care atribuie un numr real


pentru fiecare eveniment elementar al spaiului eantionaj asociat unui
experiment aleatoriu:
:

Se poate demonstra c dac i sunt dou variabile aleatorii, n sensul definiiei 4.2, atunci
+ , , , , 1, sau , unde , sunt de asemenea variabile aleatorii.
Variabilele aleatorii le putem clasifica n funcie de tipul spaiului de eantionaj pe care sunt
definite. Distingem astfel:
a. Variabile aleatorii discrete.
n unele experimente, putem nregistra n urma efecturii de probe, serii finite de valori
numerice reale, limitate la valorile discrete ce aparin unui domeniu al axei reale, cum ar
fi cazul exemplului 4.1, punctele a i b. n alte experiene, cum ar fi cazul exemplului 4.1,
punctul c, putem obine un numr infinit de valori numerice distincte.
Definiia 4.3:

O variabil aleatorie discret este o variabil aleatorie definit pe un spaiu


de eantionaj finit sau infinit numrabil.

b. Variabile aleatorii continue.


n alte experimente, valorile variabilei aleatorii , obinute prin msurare sunt de fapt
distincte, dar, deoarece gama de valori posibile este att de mare, ar fi mai convenabil s
se considere , ca o variabil aleatorie continu. S analizm cazul exemplului 4.1,
punctele d, e i f. Msurtorile care sunt efectuate se realizeaz prin intermediul unor
echipamente de msurare care au o anumit precizie, iar rezultatele obinute sunt limitate
la anumite valori care, ne-ar putea conduce la concluzia c variabila aleatorie este de tip
discret. Cu toate acestea, pentru analiza din punct de vedere probabilist, a experimentului,
este mai convenabil s presupunem c msurtorile actuale sunt valorile unei variabile
aleatorii ce poate lua orice valoare dintr-un interval finit sau infinit al axei numerelor reale.
Definiia 4.4:

O variabil aleatorie continu este o variabil aleatorie definit pe un spaiu


de eantionaj infinit nenumrabil.

Variabila aleatorie, ca i concept fundamental al teoriei probabilitilor, este o noiune ce


cuprinde dou aspecte eseniale:
1. Un prim aspect se refer la valorile pe care variabila aleatorie le poate lua, ca expresie
a evenimentelor elementare asociate unui experiment. Analiza din punct de vedere
probabilist al fenomenelor aleatorii nu opereaz cu variabila aleatorie n sine, ci doar cu
valorile pe care aceasta le poate lua.
2. Cel de-al doilea aspect se refer la probabilitile cu care variabila aleatorie poate lua
valorile din mulimea valorilor posibile, vezi figura 4.2.
Definiia 4.5:

Se numete repartiia unei variabile aleatorii corespondena dintre valorile


posibile ale variabilei aleatorii i probabilitile corespunztoare.

2 = {, , } 5 = {, , }
3 = {, , }

( ) = ( = )

8 = {, , }

6 = {, , }

1 = {, , }
4 = {, , } 7 = {, , }

0
Figura 4.2:

Repartiia unei variabile aleatorii

Aceast coresponden dintre valorile posibile ale variabilei aleatorii i probabilitile


corespunztoare se realizeaz prin intermediul funciei de repartiie, vezi figura 4.3.

4.3.1 FUNCIA DE REPARTIIE


Pentru a putea calcula valorile probabilitilor evenimentelor asociate unei variabile aleatorii a
fost introdus noiunea de funcie de repartiie, [MIH 80].
Definiia 4.6:

Fie o variabil aleatorie, , definit pe un spaiu de eantionaj . Dac definim


evenimentul ca fiind mulimea evenimentelor elementare pentru care
, adic:
(4.1)
= { |( ) }
sau, folosind o notaie simplificat
= { }

(4.2)

i
(4.3)
( ) = { },
atunci, probabilitatea (4.3) definete o nou funcie, : [0.1], numit
funcia de repartiie a variabilei aleatorii , notat cu:
(4.4)
() = { }.
2 = {, , } 5 = {, , }
3 = {, , }

() = ( )

8 = {, , }

6 = {, , }

1 = {, , }
4 = {, , } 7 = {, , }

Figura 4.3:

Funcia de repartiie unei variabile aleatorii

Exemplul 4.3
Considerm problema din exemplul 4.2. S se calculeze funcia de
repartiie.
Soluie:
1

(0) = 8 , ntruct evenimentul 0 reprezint submulimea {0};


1

(1) = 2 , ntruct evenimentul 1 reprezint submulimea {0,1};


7

(2) = 8 , ntruct evenimentul 2 reprezint submulimea {0,1,2}.


8

(3) = 8, ntruct evenimentul 3 reprezint mulimea {0,1,2,3} = .


Proprietile

funciei de repartiie:

a. Funcia de repartiie, , este nedescresctoare pe adic, 1 , 2 i 1 < 2 , atunci


(1 ) (2 ).
Pentru a demonstra aceast proprietate vom utiliza proprietatea de monotonie a
probabilitilor, vezi UI 2, punctul 2.3.4.2.
Pentru aceasta considerm dou intervale, pe axa real, de forma: { 1 } i { 2 }.
Deoarece 1 < 2 , rezult c { 1 } { 2 }. Deci:
{ 1 } { 2 } i (1 ) (2 ).
b. Valoarea funciei de repartiie pentru este:
() = lim () = 0

(4.5)

Aceast proprietate rezult din considerentul c un eveniment de forma { } este,


evident, evenimentul imposibil, iar probabilitatea evenimentului imposibil este zero.
c. Valoarea funciei de repartiie pentru este:
(+) = lim () = 1
+

(4.6)

La fel ca n cazul punctului b, un eveniment de forma { } este, evident, evenimentul


sigur, iar probabilitatea evenimentului sigur este unu.
d. Funcia de repartiie este continu la stnga, 0 :
(0 0) = lim () = (0 ).
0

(4.7)

Fie un ir strict cresctor de numere reale, { } , convergent ctre valoarea 0 .


Considerm urmtoarele evenimente, vezi figura 4.4:
= {|() 0 }, 0 = {|() 1 }, , = {|1 < () }, , =
{|1 < () }.
ntre aceste evenimente se pot stabili urmtoarele relaii:
= , ,
i
5

= 0 1
Dar:

() = ( ) i (0 ) = (),
=0

De asemenea,
(1 ) = (0 ),
( ) (1 ) = (|() ) (|() 1 ) = ( )
Rezult, c
(0 ) = (1 ) + [(2 ) (1 )] + + [(+1 ) ( )] +
Deci, (0 ) = lim ( ), adic () este continu la stnga n orice punct 0 .

1
Figura 4.4:

+1

11 +1 0

Demonstrarea proprietii de continuitate la stnga a funciei ()

Din relaia (4.4), tragem concluzia c funcia de repartiie ne permite s calculm probabilitile
asociate tuturor valorilor pe care le poate lua variabila aleatorie, utiliznd intervale de forma
(4.2).
S-a preferat definirea funciei de repartiie sub forma ecuaiei (4.4), deoarece ea ne permite s
determinm cu uurin probabiliti de forma: ( = ), ( < ), ( < < ) i
( ).
Cu alte cuvinte, pentru a cunoate probabilitile tuturor evenimentelor de forma { }, unde
reprezint un interval al dreptei reale, este suficient s cunoatem probabilitile
evenimentelor de forma { }, pentru orice .
Pentru a ilustra modul de calcul al probabilitii, pentru cazul n care variabila aleatorie ia valori
cuprinse ntr-un interval al axei reale, delimitat de dou puncte i , vom evidenia
urmtoarele evenimente, conform schiei alturate:
= { < }, = { < }; = { = } i = { = }
ntre cele patru mulimi se pot stabili urmtoarele relaii:
; ( ) ; ( ) i ( ) ( ).

Figura 4.5:

Calculul probabilitii ca s aparin unui interval al axei reale

Rezult :
a. ( < ) = [(B D)\(A C)] = ( ) ( ) =
= ( ) ( ) = () ().
b.

( < < ) = [B\(A C)] = () ( ) =


= ( < ) ( ) = () () ( = ).

c.

( < ) = [B\A] = () () =
= () () ( = ) + ( = ).

d.

( ) = [(B D)\A] = ( ) () =
= () () + ( = ).

e.

( > ) = 1 ( ) = 1 ().

f.

( ) = 1 ( ) + ( = ) = 1 () + ( = ).

Deoarece, alura funciei de repartiie, precum i modul de definire i de utilizare al funciei de


repartiie depinde de tipul variabilei aleatorii, n continuare vom detalia aceste aspecte pentru
cele dou tipuri de variabile aleatorii.

4.3.2 VARIABILE ALEATORII DISCRETE


Considerm o variabil aleatorie discret, . Conform definiiei 4.3, aceast variabil aleatorie
poate lua un numr finit, sau infinit numrabil de valori:
1 < 2 < 3 < < < .
Definiia 4.7:

Aplicaia , : [0,1], unde = {1 , 2 , 3 , , , }, care face ca


fiecrei valori pe care o poate lua variabila aleatorie s-i corespund o
valoare a probabilitii:
(4.8)
( ) = ( = ),
se numete funcia de probabilitate, sau funcia de mas a probabilitii.
n mod uzual, funcia de probabilitate a variabilei aleatorii discrete se definete sub forma unui
tabel (tablou) de repartiie:
1 2 3
(4.9)
: (
).
1
2
3

Din ecuaia (4.9) se observ c tabloul repartiiei unei variabile aleatorii discrete caracterizeaz
complet evenimentele elementare ce se pot asocia lui , din punctul de vedere al valorilor
variabilei aleatorii, precum i probabilitii lor de apariie. De asemenea:
( ) [0,1]

(4.10)

( ) = 1,

(4.11)

=1

deoarece, =1 reprezint probabilitatea ntregului spaiu de eantionaj, sau probabilitatea


evenimentului sigur.
Reprezentat grafic, funcia de probabilitate are alura unei diagrame cu bare, ca cea din figura
4.6.
( )

1
Figura 4.6:

Alura funciei de probabilitate, ( ), pentru o variabil aleatorie discret

Cunoscnd tabloul de repartiie al unei variabile aleatorii , se poate determina cu uurin


funcia de repartiie, pe baza definiiei 4.6:

() = { } =

0,
dac < < 1
1 ,
dac 1 < 2
1 + 2 ,
dac 2 < 3
1 + 2 + 3 , dac 3 < 4

dac 3 < 4

=1

dac

{ 1,
Mai concis, ecuaia anterioar se poate scrie:
() = { } =

( ).

(4.12)

n cazul unei variabile aleatorii discrete, funcia de repartiie, ecuaia (4.12), trebuie s respecte
8

cele patru proprieti precizate la punctul 4.1. De aceea, alura funciei de repartiie este sub
forma unei scri, vezi figura 4.7.
()
=1 = 1.0

1
Figura 4.7:

Alura funciei de repartiie, (), pentru o variabil aleatorie discret


Exemplul 4.4
Un eantion din trei piese este extras, fr rentoarcerea piesei extrase,
dintr-un lot format din 15 piese, dintre care dou sunt neconforme. Dac notm
cu numrul de piese neconforme din eantion, s se determine:
a) Funcia de probabilitate;
b) Tabloul repartiiei variabilei aleatorii discrete, X;
c) Funcia de repartiie a variabilei aleatorii discrete, X;
d) S se calculeze ( 0.5), (0 1.5), ( > 0.5).
e) S se reprezinte grafic funcia de repartiie i cea de probabilitate.

Soluie:

13

12

11

22

a) ( = 0) = (15) (14) (13) = 35


( = 1) = (, , ) + (, , ) + (, , ) =
13

12

13

12

13

12

12

15

14

13

15

14

13

15

14

13

35

=( )( )( )+( )( )( )+( )( )( )=

( = 2) = (, , ) + (, , ) + (, , ) =
13

13

13

= (15) (14) (13) + (15) (14) (13) + (15) (14) (13) = 35.
0
b) : (22

12

35

35

35

0
22

c) () =

35
34
35

{1

1 );

<0
0<1
1<2
2

d)
0.7

1.2

()

0.6

()

0.5

0.8

0.4

0.6

0.3

0.4

0.2

0.2

0.1

0
0

0
-2

22

e) ( 0.5) = (0) = 35.


34

(0 1.5) = (2) = 35.


13

( > 0.5) = 1 ( 0.5) = 1 (0) = 35.

4.3.3 VARIABILE ALEATORII CONTINUE


Considerm o variabil aleatorie continu, . Conform definiiei 4.4, aceast variabil poate
lua toate valorile din interiorul unui interval finit sau infinit al axei reale. S presupunem, c
poate lua orice valoare n intervalul real i + , unde , reprezint un numr arbitrar,
pozitiv. Putem scrie:
( < + ) ( + ).
n termeni de probabiliti, relaia anterioar devine:
( < + ) ( + ).
Probabilitatea ( < + ) poate fi exprimat prin intermediul funciei de repartiie
(vezi punctul 4.1):
( < + ) = ( + ) ().
Rezult:
( + ) () ( + ).
Deoarece s-a demonstrat anterior c funcia de repartiie este continu, membrul stng al
ecuaiei anterioare este zero dac, 0. De asemenea, membrul drept al ecuaiei anterioare
devine ( = ), dac 0. Se obine, deci, n cazul unei variabile aleatorii continue:
( = ) = 0, .

(4.13)

Ecuaia (4.13) indic faptul c, n cazul unei variabile aleatorii continue valoarea probabilitii
unui eveniment elementar este zero. Afirmaia anterioar nu presupune faptul c acestea
reprezint evenimentul imposibil. n cazul unei variabile aleatorii continue, evenimentele
elementare, de forma = , unde , reprezint evenimente ale spaiului de eantionaj
avnd probabilitatea de apariie zero.

10

Ca o consecin a ecuaiei (4.13) rezult i urmtoarele relaii adevrate, pentru cazul unei
variabile aleatorii continue:
( ) = ( < ) = ( < ) = ( < < )

(4.14)

De asemenea, observm c n cazul unei variabile aleatorii continue, datorit proprietii (4.13)
nu mai putem utiliza o funcie de tipul celei de probabilitate, ca n cazul variabilelor aleatorii
discrete, pentru a exprima legea de repartiie, indicnd pentru fiecare valoare pe care o poate
lua variabila aleatorie i probabilitatea ei de apariie.
Totui, pentru a pstra analogia cu cazul discret, n situaia unei variabile aleatorii continue
funcia de repartiie se exprim prin intermediul unei noi funcii, numite densitate de
probabilitate, [CRS 81].
Definiia 4.8:

Spunem c variabila aleatorie are o densitate de probabilitate, dac exist


o aplicaie , : [0, +),astfel ca:

() = () ,

(4.15)

unde este funcia de repartiie a variabilei aleatorii continue .


n acest caz funcia , se numete densitatea de probabilitate, sau densitatea de repartiie a
variabilei aleatorii continue .
i n cazul unei variabile aleatorii continue, funcia de repartiie, ecuaia (4.15), trebuie s
respecte cele patru proprieti precizate la punctul 4.3.1. De aceea, alura funciei de repartiie
este de forma figurii 4.8.

()

Figura 4.8:

Alura funciei de repartiie, F(x), pentru o variabil aleatorie continu

Proprietile

funciei densitate de probabilitate:

a. Funcia densitate de probabilitate reprezint derivata funciei de repartiie (dac aceasta


exist). Din relaia de definiie (4.15), a funciei densitate de probabilitate rezult, prin
derivare:

11

b.
c.

(4.16)
[ ()] = ().

() 0, , deoarece, conform definiiei 4.8, densitatea de probabilitate
reprezint derivata unei funcii nedescresctoare.
Deoarece,

() = ( ) = () = () = 1,

rezult:

() = () = 1.

(4.17)

d. O funcie, (), ce ndeplinete proprietile precizate prin definiia 4.8 i prin ecuaia
(4.17) are o alur ca cea din figura 4.9, adic este definit pe axa real, sau pe un domeniul
al acestei axe, este pozitiv, iar suprafaa delimitat de curba () i axa are suprafaa
egal cu 1.
e. Conform ecuaiilor de definiie (4.3) i (4.15), rezult:

() = ( ) = ()

(4.18)

0.6

()

0.5
0.4
0.3
0.2
0.1

0
-2

Figura 4.9:

-1

Alura funciei densitate de probabilitate, ()

f. Semnificaia geometric a relaiei (4.18) rezult din figura 4.10. i anume, probabilitatea
( ) = () reprezint suprafaa de sub curba densitate de probabilitate cuprins
ntre i verticala trasat n punctul .
g. Valoarea probabilitii ( < ) se calculeaz cu relaia:

( < ) = () () = () ,

conform figurii 4.11.

12

(4.19)

()

() = ()

Figura 4.10:

Semnificaia geometric a relaiei dintre funcia de repartiie i cea de


densitate de probabilitate

De asemenea, innd cont i de ecuaiile (4.14), putem scrie:


( < ) = ( < < ) = ( ) =

= ( < ) = () ,

(4.20)

()
()

() ()

Figura 4.11:

Valoarea probabilitii ( < )

h. Valoarea probabilitii Pr( > ) se calculeaz cu relaia:

( > ) = 1 () = () ,

(4.21)

Din figura 4.12, se observ c evenimentele ( > ) i ( ) sunt


complementare, i:

() = () + () = 1.

13

()

()

1 ()

Valoarea probabilitii ( > )

Figura 4.12:

i. Conform ecuaiei (4.13), rezult c probabilitatea unei variabile aleatorii continue, de a


lua o anumit valoare particular , este zero. Dac totui dorim s calculm
probabilitatea ca variabila aleatorie continu s ia o anumit valoare , se vom utiliza
relaia, vezi figura 4.13:
() = Pr( < + ).

(4.22)

n relaia (4.23), expresia, () , poart denumirea de probabilitate elementar.

()

Probabilitatea elementar

Figura 4.13:

j. Fie o variabil aleatorie, , definit pe un interval, [, ]. i n acest caz:

() = 1

(4.23)

Deoarece,

() = () + () + () = 1

n ecuaia anterioar, integralele:

14

() = () = 0

fiindc pe cele dou domenii, (, ) i (, ), funcia () nu este definit.


Exemplul 4.5
O anumit caracteristic de calitate a unui produs este descris de
variabila aleatorie X, avnd densitatea de probabilitate:
,
dac 0 < 10
() = { (20 ), dac 10 < 20
0,
dac 0 > > 20
S se determine:
a) Valoarea parametrului , astfel nct () s reprezinte o densitate de
probabilitate;
b) S se traseze graficul funciei densitate de probabilitate;
c) S se traseze graficul funciei de repartiie;
d) S se calculeze ( 10) i (5 15).
Soluie:

a) () reprezint o funcie densitate de probabilitate, dac: () 0,

, i () = 1, deci:
10

20

+ (20 ) = 1
0

10

Rezult:
=10

=20

2
( 20)2
|
+
|
= 100 = 0.01
2 =0
2
=10
b)
0.12

()

0.1
0.08
0.06

0.04
0.02

0
-20

-10

10

20

30

0.01 ,
dac 0 < 10
() = {0.01 (20 ), dac 10 < 20
0,
dac 0 > > 20
c) Funcia de repartiie are expresia:

15

40

0
dac 0
0.005 2
dac 0 < 10
() = () = {
.
2
0.2 0.005 1.0 dac 10 < < 20

1
dac 20

1.2

()

1
0.8
0.6
0.4
0.2
0
-20

d)

-10

-0.2

10

20

20

( 10) = 0.01 (20 ) =


10

30

40

1
, sau
2

10

1
( 10) = 1 0.01 = , sau
2
0

( 10) = 1 (10) = 1 0.005 102 = 0.5


(5 15) = (15) (5) =
= 0.2 15 0.005 152 1.0 0.005 52 = 0.75

16

Curs 5.

5.3 VALORI TIPICE ALE VARIABILELOR ALEATORII


Orice variabil aleatorie poate fi studiat prin intermediul funciei sale de repartiie. De multe
ori, ns, cunoaterea corespondenei dintre valorile posibile ale variabilei aleatorii i
probabilitile corespunztoare nu ne permite s tragem concluzii din punct de vedere teoretic
i practic asupra variabilelor aleatorii studiate. n astfel de situaii se prefer caracterizarea
variabilelor aleatorii prin intermediul unor caracteristici numerice, sau valori tipice, care pot
prezenta ntr-un mod mai concis anumite aspectele eseniale, ale variabilelor aleatorii.
Aceti indicatori numerici se refer la trei aspecte eseniale ale variabilelor aleatorii, [GIB 76],
[HAH 67], [KEC 91]:

Tendina de grupare (sau de poziionare) a valorilor variabilelor aleatorii;


Tendina de mprtiere (sau de variaie) a valorilor variabilelor aleatorii;
Forma repartiiei.

Pentru precizarea, n continuare, a expresiilor analitice ale acestor caracteristici numerice, vom
considera cele dou cazuri distincte:
a. Cazul unei variabile aleatorii discrete, , avnd tabloul repartiiei de probabilitate de
forma:
1 2
: ( ) ,
1, .
1
2

b. Cazul unei variabile aleatorii continue, , caracterizat printr-o funcie densitate de


probabilitate, ().
Principalele caracteristici numerice, utilizate pentru caracterizarea unei variabile aleatorii (v.a.),
se obin ca valori particulare ale momentelor de ordinul i ale momentelor centrate de ordinul
, valori tipice pe care le vom prezenta n continuare.

5.3.1 MOMENTELE DE ORDINUL


Definiia 5.1:

Fie o variabil aleatorie i . Se numete momentul de ordinul q al


variabilei aleatorii n raport cu originea, sau simplu momentul de ordinul q
al variabilei aleatorii i se noteaz cu , valoarea:

,
=

pentru o v.a. X, discret

=1

() , pentru o v.a. X, continu


{

(5.1)

5.3.2 MOMENTELE CENTRATE DE ORDINUL


Definiia 5.2:

Fie o variabil aleatorie i . Se numete moment centrat de ordinul


al variabilei aleatorii i se noteaz cu , valoarea:

( ) ,
=

pentru o v.a. X, discret

=1

(5.2)

( ) () , pentru o v.a. X, continu


{

unde , reprezint media teoretic a variabilei aleatorii , vezi punctul 5.4.1.

5.4 PARAMETRII TENDINEI DE GRUPARE


Din categoria caracteristicilor numerice ale tendinei de grupare fac parte media, ca cel mai
important parametru alt tendinei de poziionare i mai rar utilizate, mediana i moda.
5.4.1 VALOAREA MEDIE TEORETIC
Definiia 5.3:

Se numete medie teoretic a variabilei aleatorii , valoarea numeric:

,
() = =

pentru o v.a. , discret

=1

(5.3)

() , pentru o v.a. , continu


{
n literatura de specialitate, media teoretic a unei variabile aleatorii mai poate fi ntlnit i sub
denumirile echivalente: media unei repartiii de probabilitate, sperana matematic, sau
simplu, media.
Dac n relaia de definiie a mediei teoretice, nlocuim la numitor ecuaiile (4.11), pentru
variabilele aleatorii discrete i (4.17), pentru cele continue, relaii a cror valoare este unu,
rezult c expresia mediei teoretice, (5.3), poate fi scris sub forma echivalent:

() = =

=1
,
=1

pentru o v.a. , discret


.

()

{ ()

(5.4)

, pentru o v.a. , continu

Din ecuaia (5.4) rezult semnificaia fizic a mediei teoretice. Acesta reprezint de fapt, centrul
de greutate al valorilor variabilei aleatorii.
Definiia 5.4:

Dac X este o variabil aleatorie, atunci noua variabil aleatorie definit prin
relaia:

= ()

(5.5)

poart numele de abaterea variabilei aleatorii i media ei este () = 0.


Deci, media teoretic poate fi considerat un fel de valoare central a variabilei aleatorii, prin
intermediul creia se pot trage concluzii asupra poziiei variabilei aleatorii pe axa real, oferind
de asemenea, informaii despre modul n care sunt poziionate celelalte valori ale variabilei
aleatorii, astfel ca media abaterilor de la aceast valoare este zero.
Proprietile

mediei teoretice:

1. Media unei variabile aleatorii reprezint momentul de ordinul unu.


() = = 1 .

(5.6)

Folosind semnificaia i notaiile utilizate pentru medie, momentul de ordinul i moment


centrat de ordinul se pot redefini, ca:
Definiia 5.5:

Fie o variabil aleatorie i . Dac valoarea medie a variabilei aleatorii


exist, atunci aceast valoare medie se numete momentul de ordinul q al
variabilei aleatorii:
= ( ).

(5.7)

Definiia 5.6:
Fie o variabil aleatorie i . Dac valoarea medie a abaterii variabilei
aleatorii, [ ()] exist, atunci aceast valoare medie se numete momentul centrat de
ordinul q al variabilei aleatorii:
= [ ()] = ( ) .

(5.8)

2. Fie i dou variabile aleatorii, atunci:


( + ) = () + ()

(5.9)

Demonstraie: Fie i dou variabile aleatorii discrete:


1 2
1
: ( ) i : (
1
2

2
2


),

atunci variabila aleatorie + , va avea tabloul de repartiie:


+

+ : (
, =
1, , i , = Pr{( = ) ( = )},
), unde = 1,
,
iar,
( + ) = ( + ) , = , + , =
,

= , + ,

Dar,
, = {( = ) ( = )} = {[( = ) ( = )]} =

= [( = ) (( = ))] = [( = ) ] = Pr( = ) = .

Analog, rezult i:
, = ( = ) = .

Deci,
( + ) = + = () + ().

3.

Proprietatea 2 se poate extinde la un numr oarecare, , de variabile aleatorii, , =


1, :

(1 + 2 + + ) = ( )

(5.10)

=1

4.

Fie o variabil aleatorie i . Atunci:

( ) = ()
Demonstraie: Noua variabil aleatorie este de forma:
1 2
: (
2

1
Deci,

(5.11)

).

( ) = = = ()
=1

5.

=1

Fie o variabil aleatorie i , . Atunci:

( + ) = () +
Demonstraie: Noua variabil aleatorie + este de forma:
+ 1 + 2 +
+ : (
1
2

Deci,

(5.12)
+
).

( + ) = ( + ) = + = () +
=1

6.

=1

=1

Fie 1 , 2 , , , variabile aleatorii i 1 , 2 , , , constante reale, arbitrare,


atunci:

(1 1 + 2 2 + + ) = ( )

(5.13)

=1

Aceast ecuaie reprezint o generalizare a proprietilor 3 i 4.


7.

Dac i sunt variabile aleatorii independente, atunci:


( ) = () ()

Demonstraie: Noua variabil aleatorie are tabloul repartiiei:



: ( ), unde =
1, , =
1, ,
,
i

(5.14)

, = Pr{( = ) ( = )} = .
Deci,

( ) = , = = = () ().
,

8.

=1

=1

Dac i sunt variabile aleatorii, astfel nct , atunci:


() ()

(5.15)

Demonstraie: Fie = . Este evident c 0 i () 0. Atunci, aplicnd


proprietatea 1, rezult:
() = () () 0, adic () ().
9.

Dac exist momentele de ordinul doi ale variabilelor aleatorii i , atunci momentul
variabilei aleatorii Y este:
(5.16)

|( Y)| ( 2 ) ( 2 )
Inegalitatea (5.16) poart numele de inegalitatea lui Schwartz.

Demonstraie: Fie variabila aleatorie = ( )2 , unde . Se observ c


aceast nou variabil aleatorie este pozitiv, pe tot domeniul ei de
definiie. n continuare vom calcula valoarea medie teoretic a acestei
variabile aleatorii:
() = [( )2 ] = ( 2 2 + 2 2 ) =
= ( 2 ) 2 ( ) + 2 ( 2 ).
Deoarece variabila aleatorie, Z, este pozitiv, atunci i () 0, adic
discriminantul ecuaiei de gradul II, anterioare, este 0:
( ) ( 2 ) ( 2 ) 0.
Din ecuaia anterioar rezult:
|( )| ( 2 ) ( 2 ).
10. Valoarea mediei unei funcii a variabilei aleatorii, (), se determin similar:

( ) ,
(()) =

pentru o v.a. , discret

=1

(5.17)

() () , pentru o v.a. , continu


{
11. Folosind proprietile operatorului mediei teoretice, se poate deduce i legtura care
exist ntre momentele de ordinul i momentele centrate de ordinal :

= (1)

(5.18)

=0

Demonstraie: Pornind de la definiia momentului centrat de ordinul i aplicnd


proprietile mediei, rezult:

= [( ) ] = [(1) ] =
=0

= (1) ( ) = (1) .
=0

=0

Exemplul 5.1
O variabil aleatorie are funcia densitate de probabilitate:
1
() =
i 20 40.
20
S se calculeze:
a. Media i momentul de ordinul doi al variabilei aleatorii ;
b. Momentul centrat de ordinul doi al variabilei aleatorii .
Soluie:

40

40

a. = 20 () = 20

40 2

40

=40

= 40|
20

2 = 20 2 () = 20

20

=20
3 =40

= 60|

=20

40 (30)2

40

c. 2 = 20 ( )2 () = 20
=

20
(30)3 =40
60

1600400

40
56000
60

= 30.

= 933.333.

= 33.333.

=20

= 33.333.

Acelai rezultat se obine i dac utilizm ecuaia (5.18), particularizat


pentru cazul = 2, adic:
2 = 2 2 = 933.333 302 = 33.333.

5.4.2 MEDIANA

Definiia 5.7:

Fie o variabil aleatorie. Se numete median, valoarea numeric notat cu


i definit prin relaia:
1
Pr( ) = Pr( > ) = ,
2

(5.19)

Particulariznd ecuaia (5.19) pentru cazul variabilelor aleatorii continue, se obine:

1
() = () = .
2

(5.20)

Geometric, mediana reprezint valoarea cea mai probabil a variabilei aleatorii, fiind egal cu
abscisa punctului prin care o paralel la axa mparte n dou pri egale aria delimitat de
curba () i axa absciselor, vezi figura 5.1.

()

0.5
0.5

Figura 5.1:

Semnificaia geometric a medianei

n cazul unei variabile aleatorii discrete, prin particularizarea ecuaiei (5.19) se obine:
1

( ) =
( ) = .
(5.21)
2

>
Exemplul 5.2
S se determine valoarea mediei i medianei pentru variabila aleatorie:
2
: ( 1
36
Soluie:

2+12
36

3
2
36

2(3+11)
36

4 5
6
3 4
5
36 36 36
+

3(4+10)

36

7 8
6 5
36 36

4(5+9)
36

9 10 11
2
4 3
36 36 36

5(6+8)
36

67
36

252
36

12
1)
36
= 7.

= 7.
Pentru o variabil aleatorie continu mediana este unic determinat de relaia (5.20). n cazul
variabilelor aleatorii discrete, pot exista situaii n care mediana nu este unic determinat.
Exemplul 5.3
S se determine valoarea mediei i medianei pentru variabila aleatorie:
1 2 3 4 5 6
: (1 1 1 1 1 1)
6 6 6 6 6 6
Soluie:

=6+6+6+6+6+6=

21
6

= 3.5.

Dac corelm acest rezultat cu cel obinut la exemplul 5.2 i utilizm


proprietile mediei teoretice putem s afirmm c = 2 . ntr-adevr,
rezultatul este corect pentru c , reprezint variabila aleatorie asociat
aruncrii unui zar, iar reprezint cazul n care sunt aruncate, simultan, dou
zaruri.

= 3, dac utilizm ecuaia ( ) = 2.


1

= 4, dac utilizm ecuaia > ( ) = 2.


Prin convenie, mediana se determin ca media aritmetic a acestor dou
valori: =

3+4
2

= 3.5.

5.4.3 MODA
Definiia 5.8:

Valoarea (sau valorile) unei variabile aleatorii discrete corespunztoare unui


maxim al funciei de probabilitate:
() =max ( ),

(5.22)

i, valoarea (sau valorile) unei variabile aleatorii continue, corespunztoare


unui maxim local al funciei de densitate de repartiie:
() = ( ),

(5.23)

se numete moda variabilei aleatorii i se noteaz cu .


Ecuaia (5.23) se mai poate scrie i sub formele:
() = 0,
sau,
2
() = 2 () = 0.

(5.24)
(5.25)

n funcie de numrul de mode ale variabilei aleatorii, repartiiile pot fi:

Antimodale, dac repartiia de probabilitate a variabilei aleatorii nu are mod, vezi


cazul exemplului 5.3;
Unimodale, dac repartiia de probabilitate a variabilei aleatorii are o singur mod;
Multimodale, sau plurimodale, dac repartiia de probabilitate a variabilei aleatorii are
mai multe mode.
()

Figura 5.1:

Moda unei variabile aleatorii continue

Exemplul 5.4
Considerm variabila aleatorie din exemplul 5.2. S se determine
valoarea modei pentru variabila aleatorie, .
Soluie:

Rezult, = 7.

5.5 PARAMETRII TENDINEI DE MPRTIERE


Din categoria caracteristicilor numerice ale tendinei de mprtiere a valorilor unei variabile
aleatorii, fac parte dispersia (sau variana), abaterea standard (sau abaterea medie ptratic),
cuantilele i coeficientul de variaie.
5.5.1 DISPERSIA
Definiia 5.9:

Se numete dispersie, sau variana unei variabile aleatorii , valoarea


numeric:

( )2 ,
() = 2 =

pentru o v.a. , discret

=1

(5.26)

( )2 () , pentru o v.a. , continu


{
n ecuaia (5.26), prin s-a notat media variabilei aleatorii .
Dispersia unei variabile aleatorii poate fi interpretat ca momentul de inerie al repartiiei
probabilitii n raport cu centrul su de greutate.
Deci, dispersia ne permite caracterizarea gradului de mprtiere a valorilor variabilei aleatorii
n jurul valorii medii.
Proprietile

dispersiei:

a. Legtura dintre operatorul mediei, () i cel al dispersiei, (), este:


() = [( )2 ] = {[ ()]2 }.

(5.27)

Ecuaia (5.27) indic faptul c dispersia unei variabile aleatorii reprezint momentul de
ordinul doi al abaterii variabilei aleatorii.
b. Dispersia unei variabile aleatorii reprezint momentul centrat de ordinul = 2.
() = 2 .

(5.28)

c. Conform ecuaiei (5.18), particularizate pentru valoarea = 2, se obine:


() = 2 = 2 2 = ( 2 ) [()]2 .

(5.29)

Demonstraie: Utiliznd proprietatea 11, demonstrat pentru medie, prin particularizare


pentru = 2, rezult:
2 = (1)0 20 0 2 + (1)1 21 1 1 + (1)2 22 2 0 =

= 2 2 + 2 = 2 2 .
d. Din relaia de definiie a dispersiei, (5.26), rezult:
() 0.

(5.29)

Demonstraie: Conform proprietii a, se constat c [ ()]2 0, deci, {[


()]2 } 0.
e. Fie o variabil aleatorie i , o constant arbitrar, atunci:
(5.30)
( ) = 2 ().
Demonstraie: Vom defini o nou variabil aleatorie, = . Pentru aceast variabil
aleatorie:
() = () i ( 2 ) = [( )2 ] = 2 ( 2 ),
deci:
( ) = () = ( 2 ) [()]2 = 2 [( 2 ) ()2 ] =
= 2 ().
f. Fie o variabil aleatorie i dou constante arbitrare , , atunci dispersia variabilei
aleatorii , unde = + , este:
() = 2 ().

(5.31)

Demonstraie: Pentru noua variabil aleatorie Y, obinem:


() = () + i [()]2 = 2 [()]2 + 2 ()+ 2
( 2 ) = [( + )2 ] = (2 2 + 2 + 2 ) =
= 2 ( 2 ) + 2 () + 2 ,
deci:
() = ( 2 ) [()]2 =
= 2 [()]2 + 2 () + 2 2 ( 2 ) 2 () 2
= 2 [( 2 ) [()]2 ] = 2 ().
g. Fie i , dou variabile aleatorii independente, atunci:
( + ) = () + ().

(5.32)

Demonstraie: Dac vom defini o nou variabil aleatorie, Z = X + Y. Pentru aceast


variabil aleatorie:
() = ( 2 ) [()]2 .
( 2 ) = [( + )2 ] = ( 2 + 2 + 2 ) =
= ( 2 ) + 2 ( ) + ( 2 ).
X i Y fiind variabile aleatorii independente, atunci E(X Y) = E(X)
E(Y), iar
( 2 ) = ( 2 ) + 2 () () + ( 2 ).
[()]2 = [( + )]2 = [()]2 + 2() () + [()]2 .
Rezult:

10

() = ( 2 ) [()]2 = ( 2 ) [()]2+ ( 2 ) [()]2 =


= () + ().
h. Fie 1 , 2 , , , variabile aleatorii, independente dou cte dou, i 1 , 2 , , ,
constante arbitrare, atunci:

( ) = 2 ( ).
=1

(5.33)

=1

Aceast ecuaie reprezint o generalizare a proprietilor e i g.


Exemplul 5.5
Considerm variabila aleatorie din exemplul 5.3. S se determine
dispersia variabilei aleatorii .
Soluie:

() = 2 = 6 [(1 3.5)2 + (2 3.5)2 + (3 3.5)2 + (4 3.5)2 +


+(5 3.5)2 + (6 3.5)2 ] = 2.917.

Utilizarea indicatorilor numerici de poziionare i ai celor de mprtiere pot furniza informaii


asupra repartiiei unei variabile aleatorii, ns acetia nu ne permit evaluarea probabilitilor
corespunztoare apartenenei valorilor variabilei aleatorii la anumite intervale. O evaluare
simpl a probabilitilor corespunztoare unor abateri de la medie se poate realiza prin
intermediul inegalitii lui Markov i/sau a inegalitii lui Cebev.
5.5.2 INEGALITATEA LUI MARKOV
Fie o variabil aleatorie, ale crei valori sunt pozitive, + , atunci , > 0,
inegalitatea lui Markov ne permite calculul probabilitilor pentru evenimente de forma
( ), folosind relaia:
()
(5.34)
( )
,

sau pentru evenimentul contrar,


()
(5.35)
( < ) 1

n cazul unei variabile aleatorii continue, ecuaia (5.34) se obine pornind de la definiia mediei:

() = () = () + ()
0

() () = () = Pr( ) .

Pentru cazul variabilelor aleatorii discrete, demonstraia este identic, doar c se vor utiliza
sumele n locul integralelor.

11

5.5.3 INEGALITATEA LUI CEBEV


Fie o variabil aleatorie avnd media teoretic i dispersia 2 , atunci, probabilitatea unor
evenimente de forma (, ] [ + , ), unde reprezint o valoare oarecare, real i
pozitiv, este mai mic sau egal cu ctul dintre dispersia, 2 i ptratul lui :
{| | }

2
.
2

(5.36)

n cazul unei variabile aleatorii continue, ecuaia (5.36) se deduce pornind de la definiia
dispersiei:

2 = ( )2 () = ( )2 () + ( )2 ()

( )2 () + ( )2 ()

2 () + 2 ().

Rezult, conform figurii 5.3:


2
( ) + 1 ( + ) {| | }.
2
Pentru cazul variabilelor aleatorii discrete, demonstraia este identic, doar c se vor utiliza
sumele n locul integralelor.
Inegalitatea lui Cebev se poate scrie i pentru evenimentul contrar, adic evenimentul
( , + ), i anume:
2
{| | < } 1 2

(5.37)

| | <
()
( )

1 ( + )

Figura 5.3

Inegalitatea lui Cebev

12

n cazul repartiiilor simetrice, probabilitatea aproximativ furnizat de inegalitatea lui Cebev


poate fi mbuntit, prin utilizarea ecuaiei:
2
(5.38)
{| | }
,
2 2
sau:
2
(5.39)
{| | < } 1
,
2 2
pentru evenimentul contrar.
Exemplul 5.6
Producia medie sptmnal n cadrul unui atelier este de 50 de
produse. S se calculeze probabilitatea:
a. Ca ntr-o sptmn producia s fie mai mare de 75 de produse;
b. Ca ntr-o sptmn producia s fie ntre 40 i 60 de produse. Presupunem,
n acest caz, c dispersia produciei este de 25.
c. Aceeai ntrebare ca la punctul b, n condiiile unei repartiii simetrice.
Soluie:

a. Conform ecuaiei (5.34), rezult:


50 2
( 75)
= .
75 3
b. Conform inecuaiei lui Cebev:
2
3
(| 50| < 10) 1 2 = .
10
4
c. Vom utiliza o ecuaie de tipul (5.39):
2
7
(| 50| < 10) 1
= .
2
2 10
8

Pentru situaiile n care este necesar s calculm probabilitile ca variabila aleatorie s aparin
unor intervale, ale cror limite sunt exprimate sub forma unor multipli ai dispersiei, vom utiliza
inecuaia lui Cebev scris sub forma:
1
(5.40)
{| | } 2 ,

sau
1
(5.41)
{| | < } 1 2 .

Relaiile (5.40) i (5.41) se obin prin utilizarea ecuaiei:


= , > 0.

13

Curs 6.

6.3 PARAMETRII TENDINEI DE MPRTIERE


6.3.1 LEGEA NUMERELOR MARI
n teoria probabilitilor, legea numerelor mari reprezint o teorem care descrie rezultatul
efecturii unui numr mare de probe din cadrul aceluiai experiment.
Considerm variabile aleatorii independente, 1 , 2 , , , , , fiecare avnd aceeai
medie i dispersie:
(1 ) = (2 ) = = ( ) = = ( ) = ,
(1 ) = (2 ) = = ( ) = = ( ) = 2 .
Cu ajutorul celor variabile aleatorii construim o nou variabil aleatorie, notat cu, i
denumit medie aritmetic:

1
= .

=1

Definiia 6.1:

Probabilitatea ca media aritmetic s tind spre valoarea medie a populaiei:


lim {| | < } = 1, + ,

(6.1)

este unu, dac numrul variabilelor aleatorii, este suficient de mare.


Ecuaia (6.1) reprezint legea numerelor mari.
Pentru a demonstra aceast lege este necesar s calculm media i dispersia variabilei aleatorii
:
1
= (1 + 2 + + + + ),

Adic:
1
() = [(1 ) + (2 ) + + ( ) + + ( )] = ,

1
2
() = 2 [(1 ) + (2 ) + + ( ) + + ( )] = .

Dac, aceste rezultate le introducem n inegalitatea lui Cebev, relaia (5.36), obinem:
()
[| ()| > ] 2 ,

sau,
[| | > ]
Trecnd la limit pentru , rezult:

2
.
2

lim [| | > ] = 0.

Pentru evenimentul contrar, adic | | , relaia anterioar devine:


lim [| | ] = 1,

tocmai legea numerelor mari.


Conform acestei legi, media valorilor de eantionaj, obinut la un numr mare de extrageri
independente, tinde spre valoarea medie a populaiei.
Exemplul 6.1
S se determine, cu o probabilitate de minim 95%, volumul unui eantion
ce trebuie prelevat dintr-o populaie de dimensiuni foarte mari, avnd = 10
i 2 = 2, astfel nct media de eantionaj s difere de cea a populaiei cu 5%:
Soluie:

Folosind datele problemei, precum i legea numerelor mari, rezult:


2
[| | 0.05 ] > 1
.
(0.05 10)2
Rezult:
2
= 0.05, adic 160.
(0.05 10)2

6.3.2 ABATEREA MEDIE PTRATIC

n aplicaiile practice ale teoriei probabilitilor, variabilele aleatorii au o anumit semnificaie,


ele reprezentnd diferite mrimi fizice: lungimi, fore, timp etc. Valoarea numeric, cea mai
important, a unei variabile aleatorii care ofer informaii despre gradul de mprtiere, i
anume dispersia, aa cum este definit n subcapitolul 5.5.1, este exprimat printr-o mrime
care dimensional reprezint ptratul variabilei aleatorii analizate. Eliminarea acestui
inconvenient se realizeaz prin utilizarea, ca msur a gradului de mprtiere, a unei noi
caracteristici numerice, numit abatere medie ptratic sau abatere standard. Abaterea standard
joac n cadrul teoriei probabilitilor acelai rol ca i raza de inerie n mecanic.
Definiia 6.2:

Se numete abatere medie ptratic, sau abatere standard a variabilei


aleatorii , rdcina ptrat pozitiv a dispersiei:

pentru o v.a., , discret

( )2 ,
=1

= () =

( )2 () , pentru o v.a., , continu


{

(6.2)

6.3.3 COEFICIENTUL DE VARIAIE


O alt caracteristic numeric important, care furnizeaz informaii despre mprtierea
asociat unei variabile aleatorii, relativ la valoarea mediei, este aceea de coeficient de variaie.
Definiia 6.3:

Se numete coeficientul de variaie a variabilei aleatorii, , valoarea numeric


notat cu i definit ca raportul dintre abaterea standard i media variabilei

()
= =
()

=1( )2
,
=1
=

pentru o v.a., , discret


.

( )2 ()
{

()

(6.3)

, pentru o v.a., , continu

6.3.4 CUANTILE
Cuantilele (cvantilele) de ordin ( 2), reprezint cele 1 valori reale:

Definiia 6.4:

1 < 2 < 3 < < < < 1 ,


ataate variabilei aleatorii , pentru care este ndeplinit relaia:
[ 1 ] = [1 < 2 ] = = [1 < ] =
1
[2 < 1 ] = [ > 1 ] = .

(6.4)

Ecuaia (6.4) se mai poate scrie, n cazul variabilelor aleatorii continue i sub forma:
1

() = () = () =

1
() = .

(6.5)

Geometric, cuantilele reprezint punctele de pe axa cu ajutorul crora se mparte aria de sub
curba densitate de probabilitate n pri egale, vezi figura 6.1.
Tot din figura 6.1 rezult i metoda de calcul ce trebuie utilizat pentru determinarea valorii
unei cuantile, :
( ) = .

(6.6)

Deci, cuantila de ordinul , , reprezint valoarea variabilei aleatorii pentru care funcia de
repartiie este egal cu (0 1), sau "sare" de la o valoare inferioar lui , la o valoare
superioar a lui , n cazul unei variabile aleatorii discrete:
( )

+1
, ( + 0)
, 1 1.

(6.7)

n acest caz, al variabilelor aleatorii discrete, cuantilele de ordinul nu sunt unic determinate.

0.45
0.4

()

0.35
0.3
0.25
0.2

0.15
0.1
0.05
0

1 2 2 1
Figura 6.1

Cuantilele de ordinul

n funcie de valoare lui , cuantilele pot avea diferite denumiri:

Pentru = 2 obinem mediana.


Pentru = 4 obinem cuartilele. Prin intermediul acestor trei cuartile, notate
0.25 , 0.50 , 0.75 se poate construi un indicator al mprtierii valorilor variabilei
aleatorii:
= 0.75 0.25 .

(6.8)

El poat numele de intervalul intercuartilic de variaie. De asemenea:


0.50 = .

Pentru = 10 obinem decile;

Pentru = 100 obinem percentila (centila). Dac probabilitatea este exprimat n


procente, centilele se mai pot ntlni i sub denumirea de cuantile procentuale;
Exemplul 6.2
O variabil aleatorie are funcia densitate de probabilitate:
1

+
, 0 1
() = {
.
2
0,
(, 0) (1, )
a) S se determine ();
b) S se determine coeficientul de variaie;
c) S se calculeze valoare intervalului intercuartilic.

1
1
. () = ( + ) = ( + 2 ) , deci
2
2
0

0,
<0
1
() = { ( + 2 ) , 0 1.
2
1, > 1
1

1
1 =1
7
. = ( + ) = 2 ( + )|
= .
2
3 4 =0 12
0

7 2

7 3

31

=1

2 = 0 ( 12) ( + 2) = ( 12) (4 + 144)|

=0

11

= = 144
c.

12
7

11

= 144.

= 0.4738.

1
2 )
(0.25 + 0.25
= 0.25 0.25 = 0.3660.
2
1
2 )
(0.75 + 0.75
= 0.75 0.75 = 0.8228.
2
= 0.75 0.25 = 0.8228 0.3660 = 0.4568.

6.4 CARACTERISTICI NUMERICE ALE FORMEI REPARTIIEI


Forma, sau alura unei repartiii de probabilitate poate fi caracterizat prin simetrie/asimetrie
i/sau prin boltire. n acest sens se utilizeaz doi coeficieni, este vorba de coeficientul de
asimetrie i de cel de boltire. Aceti coeficieni se construiesc prin intermediul momentelor
centrate i furnizeaz informaii relative la forma repartiiei normale.
De asemenea, simetria sau asimetria unei repartiii o putem deduce din poziia relativ pe care
o au cei trei parametrii de poziionare: media, mediana i modul. Astfel:
a. Dac valorile celor trei indicatori de poziionare coincid:
= = ,
atunci repartiia variabilei aleatorii este simetric, figura 6.2.
0.35

()

0.3
0.25

= =

0.2
0.15
0.1
0.05

0
0

Figura 6.2

Repartiie simetric: = =

10

12

b. Dac valorile clor trei indicatori de poziionare se afl ntr-o relaie de forma:
< < ,
atunci repartiia variabilei aleatorii are asimetrie dreapta, figura 6.3.
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0

()

Figura 6.3

Repartiie cu asimetrie dreapta: < <

c. Dac valorile celor trei indicatori de poziionare se afl ntr-o relaie de forma:
< < ,
atunci repartiia variabilei aleatorii are asimetrie stnga, figura 6.4.
1.2

()

0.8

0.6
0.4
0.2

0
1

Figura 6.4

1.5

2.5

3.5

Repartiie cu asimetrie stnga: < <

6.4.1 COEFICIENTUL DE ASIMETRIE

Definiia 6.5:

Se numete asimetrie, sau coeficient de asimetrie al variabilei aleatorii ,


raportul dintre momentul centrat de ordinul trei i abaterea standard la puterea
a treia:

=1 ( )3

3 =

3,

2
[=1 ( ) ]2

( )3 ()

3
=
3

pentru o v.a., , discret

3 , pentru o v.a., , continu

(6.9)

[( )2 () ]
{
Asimetria furnizeaz urmtoarele informaii despre repartiia unei variabile aleatorii:

Valoarea 3 = 0, indic o repartiie simetric a valorilor variabilei aleatorii, adic:


= = , figura 6.2;
Valori 3 < 0, indic o asimetrie negativ (stnga) a valorilor variabilei aleatorii,
adic: < < , figura 6.4;
Valori 3 > 0, indic o asimetrie pozitiv (dreapta) a valorilor variabilei aleatorii,
adic: < < , figura 6.3.

6.4.2 COEFICIENTUL DE BOLTIRE


Definiia 6.6:
Se numete exces, sau coeficient de boltire, al variabilei aleatorii , raportul
dintre momentul centrat de ordinul patru i abaterea standard la puterea a patra:
4
4 = 4 =

=1 ( )4
,
[=1 ( )2 ]2

pentru o v.a., , discret

( )4 ()

{[( )2 () ]

.
2 , pentru o v.a., , continu

(6.10)

Excesul, sau coeficient de boltire servete la compararea gradului de mprtiere al unei


variabile aleatorii n raport cu mprtierea unei variabile aleatorii normal repartizate, vezi UI
8. Astfel o variabil aleatorie normal repartizat are excesul egal cu valoarea trei, figura 6.5.
Deci:
Valori 4 = 3, indic o repartiie avnd boltirea normal, sau mezocurtic (cazul
repartiiei normale);
Valori 4 > 3, indic o repartiie avnd boltirea leptocurtic, adic o repartiie cu o
mprtiere, a valorilor variabilei aleatorii, mai mici dect repartiia normal;
Valori 4 < 3, indic o repartiie avnd boltirea platicurtic, adic o repartiie cu o
mprtiere, a valorilor variabilei aleatorii, mai mari dect repartiia normal.
Exemplul 6.3
S se determine asimetria i excesul variabilei aleatorii , avnd funcia
densitate de probabilitate:
0,
dac < 1
2
() = {1.5 + 1, dac 1 1.
0,
dac > 1

Soluie:

a. = 1 () = 1 (1.5 2 + 1) =
=1

2
= ( 0.375 4 )|

2
=1

= 0.

(1.5 2 + 1) = 0.5 3 + 0.5


1

0.5 3 + 0.5 = 0.5 = 0.

(1.5 2 + 1) = 3 3 = 0 = 0.

Repartiia variabilei aleatorii , este simetric, deoarece = = = 0.


La aceeai concluzie se ajunge i dac calculm coeficientul de asimetrie:
3
0
3 = 3 =
= 0.

0.2582
1
1
3 = 1( )3 () = 1 3 (1.5 2 + 1) =
4

= ( 4 0.25 6 )|

=1

=1

= 0.

2 = 1( )2 () = 1 3 (1.5 2 + 1) =
3

= ( 3 0.3 5 )|

=1

=1

= 0.0666.

. 4 = ( )4 () = 4 (1.5 2 + 1) =
1

1
=1

5 1.5 7
=(
)|
= 0.02857
5
7
=1
4
0.02857
4 = 4 =
= 6.428, deci repartiia este platicurtic.

0.00443556
0.6

()
0.5

Repartiie
leptocurtic

0.4

Repartiie
platicurtic

Repartiie
mezocurtic

0.3
0.2
0.1

0
0

Figura 6.5

Tipuri de exces

10

6.5 COVARIAN I CORELAIE


Dac, pe un spaiu de eantionaj sunt definite dou sau mai multe variabile aleatorii, analiza
lor, din punctul de vedere al teoriei probabilitilor, poate conduce la necesitatea cunoaterii
relaiilor care exist ntre acestea, [TAR 81]. O msur a relaiei care exist ntre dou variabile
aleatorii o reprezint covariana.
Fie i dou variabile aleatorii independente. Prin relaia (5.32) s-a demonstrat c:
( + ) = () + ().
n cazul n care cele dou variabile aleatorii sunt oarecare, deci nu se poate afirma c sunt ntro relaie de independen, vom obine:
( + ) = [( + )2 ] [( + )]2 .
Adic:
[( + )2 ] = ( 2 + 2 + 2 ) = ( 2 ) + 2 ( ) + ( 2 ),
iar
[( + )]2 = [()]2 + 2 () () + [()]2 .
Rezult c valoarea dispersiei sumei a dou variabile aleatorii oarecare este:
( + ) = ( 2 ) [()]2 + ( 2 ) [()]2 + 2 ( ) 2 () ().
Deci:
( + ) = () + () + 2 {[ ()] [ ()]}.
Definiia 6.7:

(6.11)

Fie i dou variabile aleatorii, astfel nct avem (), (), (), ()
i ( ). Se numete covariana, variabilelor aleatorii i , numrul real
notat cu (, ) i definit de relaia:
(, ) = {[ ()] [ ()]}

(6.12)

Dac particularizm ecuaia (6.12) pentru cazul a dou variabile aleatorii, i , obinem:
(, ) =
( ) ( ) [ = , = ] , pentru v.a. discrete
,

(6.13)

[ ] [ ] , (, ) , pentru v.a continue


{
n ecuaia (6.13) s-a considerat, pentru cazul discret, variabilele aleatorii:

: ( ) , : ( ) , ,

Pentru cazul continuu, , (, ) reprezint funcia densitate de probabilitate bidimensional a


vectorului de variabile aleatorii (, ), iar i , reprezint mediile teoretice ale celor dou
variabile aleatorii.
Proprietile

covarianei:

1. Fie i dou variabile aleatorii, atunci:


(, ) = ( ) () ()

(6.14)

Demonstraie: Pornind de la relaia de definiie a covarianei, (6.12), rezult:


(, ) = {[ ()] [ ()]}
= [ () () + () ()]
= ( ) () () () () + () ()
= ( ) () ().
2. Fie i dou variabile aleatorii independente, atunci:
(, ) = 0,

(6.15)

Demonstraie: n cazul a dou variabile aleatorii independente, conform ecuaiei (5.14):


( ) = () ().
Dac introducem aceast relaie n ecuaia (6.14), rezult:
(, ) = ( ) ( ) = 0.
3. Pentru dou variabile aleatorii oarecare:
( + ) = () + () + 2(, ),

(6.16)

Demonstraie: Aceast proprietate rezult prin nlocuirea expresiei de definiie a covarianei


n ecuaia (6.11).
4. Fie variabile aleatorii: , =
1, , atunci:

( ) = ( ) + 2 ( , )
=1

=1

(6.17)

Demonstraie: Pentru a demonstra aceast proprietate, se calculeaz dispersia variabilei


aleatorii =1 . Rezult:

( ) = [ ( )] = {[ ( )]} =
=1

=1

=1

=1

= { 2 [( )]2 + 2 [ ( )] [ ( )]} =

= [ ( )]2 + 2 {[ ( )] [ ( )]} =

= ( ) + 2 ( , ).

5. Fie i dou variabile aleatorii i , , atunci:


( , ) = (, ),

10

(6.18)

Demonstraie: Dac se calculeaz covariana pentru variabilele aleatorii i , se


obine:
( , ) = ( ) ( ) ( ) =
= [( ) () ()] =
= (, ).
Din ecuaia de definiie a covarianei, (6.12) se observ c, n funcie de valorile celor dou
variabile aleatorii, covariana are valori reale negative sau pozitive. Din acest motiv covariana
poate fi utilizat ca un indicator al relaiei ce exist ntre cele dou variabile aleatorii.
Pentru a exprima aceast relaie ntr-o form mult mai convenabil, a fost introdus o alt
noiune. Este vorba de coeficientul de corelaie.
Definiia 6.8:

Se numete coeficientul de corelaie dintre dou variabile aleatorii i ,


raportul:
(, )
(, ) =
.
(6.19)
() ()

Proprietile

coeficientului de corelaie:

a. Dac (, ) exist, atunci:


2 (, ) 1,

(6.20)

1 (, ) 1.

(6.21)

sau
Demonstraie: Ptratul covarianei, are expresia:
[(, )]2 = {[ ()] [ ()]}2 .
Conform inegalitii lui Schwartz, (aplicat variabilelor aleatorii [ ()]
i [ ()], rezult:
{[ ()] [ ()]}2 [ ()]2 [ ()]2.
Membrul drept al inecuaiei anterioare reprezint, de fapt, () (). Deci:
[(, )]2 () (),
iar, ptratul coeficientului de corelaie, rezult:

2 (,

[(, )]2 () ()
) =

= 1.
() ()
() ()

b. (, ) = 1
Demonstraie: Pentru a demonstra aceast proprietate, calculm expresia (, ):
(, ) = {[ ()] [ ()]} = {[ ()]2 } = ().
Deci,
(, ) =

(, )
() ()

11

()
= 1.
()

c. (, ) = 1
Demonstraie: Demonstraia acestei proprieti este similar cazului anterior:
(, ) =

()
= 1.
()

d. Dac (, ) exist, atunci ntre dou variabile aleatorii i este o relaie liniar, adic
, , 0, astfel nct = + , dac i numai dac 2 (, ) = 1.
Demonstraie: Dac = + , atunci:
{[ ()] [ + () ]}2
2 (, ) =
=
() () ||
{[ ()] [ ()]}2

=
=
= 1.
||
() () ||
Aceast proprietate indic faptul c att covariana ct i coeficientul de corelaie reprezint
dou msuri relevante ale unei relaii liniare dintre dou variabile aleatorii.
Dac, relaia dintre cele dou variabile aleatorii este neliniar, aceti doi indicatori nu pot
oferi informaii consistente.
e. Dac: (, ) = 0, atunci (, ) = 0.
n acest caz, cele dou variabile aleatorii se numesc necorelate, vezi figura 6.6.
Demonstraie: Dac, (, ) = 0, atunci din ecuaia de definiie a coeficientului de
corelaie, (6.19), rezult: (, ) = 0.

Figura 6.6

Variabile aleatorii necorelate

f. Dac: (, ) > 0, cele dou variabile au o corelaie pozitiv, vezi figura 6.7a.
Demonstraie: Similar cazului e dac, (, ) > 0, atunci (, ) > 0, deoarece:
() () > 0.
g. Dac: (, ) < 0, cele dou variabile au o corelaie negativ, vezi figura 6.7b.
Demonstraie: Similar cazului f dac, (, ) < 0, atunci (, ) < 0.

12

b. corelaie negativ

a. corelaie pozitiv
Figura 6.7

Variabile aleatorii corelate


Exemplul 6.4
Funciile de probabilitate a dou variabile aleatorii discrete, X i Y sunt:
1
, dac 1
4
1
, dac 2
Pr( = ) = 8
1
, dac 3
2
1
{8 , dac 4
a.
b.

=1
=2
=3
=4

1
, dac 1 = 2
4
1
, dac 2 = 4
Pr( = ) = 8
.
1
, dac 3 = 6
2
1
{8 , dac 4 = 8

S se calculeze (, ).
S se calculeze (, ).

Soluie:
1
1
1
1
1
1+ 2+ 3+ 4= 2 ;
4
8
2
8
2
1
1
1
1
() = 2 + 4 + 6 + 8 = 5;
4
8
2
8
2
1
1
1 2 1
1 2 1
1 2 1
() = (1 2 ) + (2 2 ) + (3 2 ) + (4 2 ) = 1;
2
4
2
8
2
2
2
8
1
1
1
1
() = (2 5)2 + (4 5)2 + (6 5)2 + (8 5)2 = 4;
4
8
2
8
(, ) = {[ ()] [ ()]} =
1
1
= (1 2.5) (2 5) + (2 2.5) (4 5)
4
8
1
1
+(3 2.5) (6 5) + (4 2.5) (8 5) = 2;
2
8
(, )
2
(, ) =
=
= 1.
() () 1 4
() =

13

Curs 7.

7.3 LEGI DE REPARTIIE PENTRU VARIABILE ALEATORII


DISCRETE
Sub aceast denumire se pot ntlni cteva experimente-model i legi de repartiie, care conduc
la calculul rapid al probabilitilor unor evenimente care se produc sau apar n condiii analoage
celor ce definesc experimentele-model. Cu alte cuvinte, pot fi calculate anumite probabiliti
pe baza unor formule sau scheme de calcul, indiferent de natura experimentului considerat, fr
a mai recurge de fiecare dat la procedeele greoaie sugerate de formula dat de definiia clasic,
[MIH 80].

7.3.1 MODELUL REPARTIIEI BINOMIALE


7.3.1.1 SCHEMA LUI BERNOULLI CU BILA REVENIT
Se aplic n cazul n care se fac repetri independente ale unui experiment i la fiecare repetare
se are n vedere apariia unui eveniment bine precizat, numit succes. Se cere determinarea
probabilitii ca din repetri ale experimentului, evenimentul considerat s apar de ori.
Modelul probabilistic se realizeaz printr-o urn ce conine bile de dou culori (albe i negre).
Se extrag bile din urn una cte una, fiecare bil este reintrodus n urn dup constatarea
culorii. Se cere determinarea probabilitii ca din bile extrase, s fie de culoare alb.
Fie evenimentul ca la extragerea de rang s se obin o bil alb i evenimentul ca la
extragerea de rang s se obin o bil neagr. Dac n urn se afl bile, din care bile albe
i bile negre, avem:
= ( ) =

, = ( ) = i evident + = 1

Notm cu , evenimentul ca dup extrageri s obinem de ori bil alb i apoi de


ori bil neagr, avem:
(, ) = (1 2
+1
) = .
de ori

de ori

Dac reprezint evenimentul ca din cele bile extrase exact s fie albe, vezi figura 7.1,
obinem:
() = (, ) = =

!

! ( )!

(7.1)

=1

=3

= 3

= 2

= 2

= 2

= 3

Figura 7.1

(3,3 ):

=2

Schema bernoullian cu bila revenit, pentru = 3

Dac se consider formula binomului lui Newton:

( + ) =

= () ,

=0

=0

deci () este coeficientul lui din dezvoltarea binomial ( + ) , de aici i denumirea


de schema binomial.
De asemenea:

() = = ( + ) = 1,
=0

=0

=0

deoarece + = 1.
Exemplul 7.1
n urma realizrii unui studiu de pia, pentru promovarea unui nou tip
de produs electrocasnic, s-a stabilit c din zece persoane, care ncearc acest
produs, dou se decid s cumpere. S se determine probabilitatea ca din opt
persoane crora li se prezint noul produs:
a. jumtate s cumpere acest produs;
b. exact trei s nu cumpere;
Soluie:

Notm cu , respectiv probabilitatea ca o persoan care ncearc noul tip


produs s cumpere, respectiv s nu cumpere acest produs. Prin urmare avem:
2
8
=
= 0.2 i =
= 0.8.
10
10
Problema descrie un experiment cu dou rezultate posibile:
- persoana care cumpr produsul, cu probabilitatea = 0.2;
- persoana care nu cumpr produsul, cu probabilitatea = 0.8;;
Se realizeaz acest experiment de opt ori.

a. () = 84 0.24 0.884 = 0.045875;


b. () = 85 0.25 0.885 = 0.009175;
7.3.1.2 REPARTIIA BINOMIAL
Definiia 7.1:

O variabil aleatorie discret , este repartizat binomial cu parametrii i


, dac funcia de probabilitatea este de forma:
!
Pr( = ) = =
(1 ) ,
(7.2)
! ( )!
pentru , [0,1], + = 1 i = 0,1, ,
i se noteaz, ~(, , ).

Funcia de probabilitate a repartiiei binomiale ne furnizeaz valoarea probabilitii ca un


eveniment dorit (a crui probabilitate de apariie este ) s se realizeze de exact ori din
ncercri bernoulliene cu revenire.
Tabloul repartiiei binomiale este, deci de forma:
: (

1
1 1

2 2 2

),

(7.3)

Semnificaia parametrilor (, i ) acestui model statistic este:


, reprezint numrul de ncercri bernoulliene cu revenire;
, reprezint probabilitatea ca un eveniment dorit s se produc ntr-o ncercare
bernoullien cu revenire (se mai numete i probabilitatea de succes);
1 = , reprezint probabilitatea ca evenimentul dorit s nu se produc ntr-o
ncercare bernoulliene cu revenire (se mai numete i probabilitatea de eec).
Semnificaia valorilor, , pe care le poate lua variabila aleatorie , este: numrul de succese
nregistrate n urma a ncercri bernoulliene cu revenire.
Alura funciei de probabilitate, a repartiiei binomiale, pentru = 10 i diferite valori ale
parametrului , este prezentat n figura 7.2.
0.3

0.3

( = )

( = )
0.25

0.25

0.2

0.2

0.15

0.15

0.1

0.1

0.05

0.05

0
0

10

a) = 10 i = 0.3

Figura 7.2

0
1

b) = 10 i = 0.5

Funcia de probabilitate a repartiiei binomiale

10

0.3

( = )
0.25
0.2
0.15
0.1

0.05

0
0

10

c) = 10 i = 0.7

Funcia de probabilitate a repartiiei binomiale

Figura 7.2

Funcia de repartiie a modelului statistic binomial este de forma:


0, dac < 0

F() = Pr( ) = (1 ) , dac 0 <


=0

(7.4)

1, dac

Alura funciei de repartiie, a modelului statistic binomial, pentru diferite valori ale parametrului
p, este prezentat n figura 7.3.
1.2

1.2

()

()
1

0.8

0.8

0.6

0.6

0.4

0.4
0.2

0.2

-2

10

-2

12

a) = 10 i = 0.3

b) = 10 i = 0.5

1.2

()
1

0.8
0.6
0.4

0.2

0
-2

c) = 10 i = 0.7

Figura 7.3.

Funcia de repartiie binomial

10

12

10

12

n anexa II, de la finalul crii, se afl calculate valorile funciei de repartiie binomiale, pentru
parametrul n = 5 25 i pentru p = 0.01 0.99.
Valorile tipice

ale variabilei aleatorii binomial repartizate, [GIB 76], [HAS 75], [WIK 10]:

1. Media teoretic:

= () = (1 ) = .

(7.5)

=0

2. Mediana:
1

(7.6)

( + 1) 1 ( + 1)

(7.7)

2 = () = ( )2 (1 ) = (1 ).

(7.8)

3. Moda:
4. Dispersia:

=0

5. Abaterea medie ptratic:


= () = (1 )

(7.9)

Exemplul 7.2
Dintr-un lot de piese, ce conine 10 % produse neconforme, sunt extrase
aleator 4 piese. Dup fiecare extragere piesa este reintrodus n lot. S se
calculeze probabilitatea ca:
a) exact dou piese extrase s fie neconforme.
b) cel puin dou piese s fie neconforme.
Soluie:

a) = 10% = 0.1 i = 1 0.1 = 0.9.


Pr( = 2) = 24 0.12 0.942 = 0.0486.
b) ( 2) = ( = 2) + ( = 3) + ( = 4) =
= 24 0.12 0.942 + 34 0.13 0.943 + 44 0.14 0.944 = 0.0523.
sau, ( 2) = 1 ( 1) =
1

= 1 4 0.1 0.94 = 1 0.9477 = 0.0523.


=0

Observaii:

a. n cazul repartiiei binomiale, ntre medie i dispersie exist relaia:


(7.10)
() < ().
b. Valori mari ale parametrului , pot conduce la dificulti de calcul a
valorilor probabilitilor repartiiei binomiale. n aceste situaii se
recomand utilizarea formulei lui Stirling pentru calculul aproximativ al
valorii lui !:

(7.11)
! 2 ( ) .

Exemplul 7.3
Statisticile existente ntr-un magazine de piese auto arat c 40% dintre
clieni achiziioneaz produse folosind cardul de credit. tiind c ntr-o
diminea magazinul a avut 15 de clieni, s se determine:
a. Probabilitatea ca maxim 5 clieni s foloseasc cardul de credit;
b. Probabilitatea ca cel puin 13 clieni s utilizeze cardul de credit;
c. Probabilitatea ca cel puin 3 i maxim 8 clieni s utilizeze cardul de credit;
Soluie:

= 40% = 0.4, q = 1 0.4 = 0.6 i = 15.


a. ( 5) = (5) = 0.4032, conform valorilor din tabelul II.1, anexa II.
b. ( 13) = 1 ( 12) = 1 (12) = 1 0.9997 = 0.0003,
conform valorilor din tabelul II.1, anexa II. Sau, folosind ecuaia (3.18):
13
14
15
( 13) = 15
13 1513 + 15
14 1514 + 15
15 1515 =
15 15

215( )

13 13
2 2
213( ) 22()

15 15

13

0.4

0.6 +

215( )

14 14
1 1
214( ) 21()

0.414 0.61 +

+ 0.415 0.60 = 0.0002919.


a. (3 8) = ( 8) ( 2) =
= 0.9050 0.0271 = 0.8779.
Repartiia binomial reprezint cea mai important repartiie, pentru o variabil aleatorie
discret, avnd multiple utilizri n statistica inferenial, teoria fiabilitii i controlul statistic
al proceselor.
Domeniile de utilizare ale repartiiei binomiale:

Modelarea din punct de vedere probabilist a experimentelor avnd urmtoarele


caracteristici:
1. Experimentul const dintr-un numr fixat apriori de probe, ();
2. Efectuarea de probe n cadrul experimentului conduce la obinerea a dou tipuri
de evenimente, complementare, clasificate n: succes i eec;
3. Probele efectuate n cadrul experimentului sunt independente;
4. Probabilitile de apariie a evenimentelor succes sau eec rmn constante pe
parcursul efecturii probelor, ( i );

Este frecvent utilizat pentru a determina probabilitatea unui numr de succese


constatate ntr-un eantion de volum , prelevat dintr-o populaie de dimensiune . Cu
toate c, n acest caz, probele nu sunt independente (fiind vorba de eantionare fr
nlocuire), pentru , mult mai mare dect , distribuia binomial reprezint o bun
aproximaie, i este utilizat pe scar larg;
Calculul exact al valorilor funciei empirice de repartiie, utilizate la estimaiile punctuale
i cu interval de ncredere avnd la baz metodele celor mai mici ptrate i grafice;

Estimarea neparametric punctual i cu interval de ncredere a indicatorilor de fiabilitate


ai produselor;
Calcul aproximativ al probabilitilor evenimentelor hipergeometric repartizate;
Controlul statistic de recepie i n metodele de inspecie prin atribute;
Calculul i construcia fielor de control pentru proporia de produse neconforme i a
celor pentru numrul de produse neconforme, n cadrul controlului statistic al proceselor.

7.3.2 REPARTIIA POISSON


Definiia 7.2:

O variabil aleatorie discret , este repartizat Poisson cu parametrul , dac


funcia de probabilitatea este de forma:

, pentru > 0 i = 0,1, ,
!
i se noteaz, ~(, ).

(7.12)

( = ) =

Alura funciei de probabilitate, a repartiiei Poisson, pentru diferite valori ale parametrului ,
este prezentat n figura 7.4.
( = )

( = )
0.7

0.4

0.6

0.35
0.3

0.5

0.25

0.4

0.2
0.3

0.15

0.2

0.1

0.1

0.05

a) = 0.5

b) = 1.0

( = )

( = )

0.3

0.16
0.14

0.25

0.12
0.2

0.1

0.15

0.08

0.1

0.06

0.04
0.05

0.02

0
0

10

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

c) = 2.0

Figura 7.4

c) = 8.0

Funcia de probabilitate a repartiiei Poisson

n teoria probabilitilor i statistic, repartiia Poisson, sau repartiia evenimentelor rare, este
un model statistic discret care exprim probabilitatea ca o serie de evenimente s apar ntr-o
perioad fixat de timp, dac aceste evenimente apar cu o rata medie cunoscut i independent
de timp, de la ultimul eveniment nregistrat. Repartiia Poisson poate fi utilizat, de asemenea
i pentru numrul de evenimente n alte tipuri de intervale specificate, cum ar fi distant,
suprafa sau de volum.
Deci, valorile, , pe care le poate lua variabila aleatorie , reprezint numrul de evenimente
care apar ntr-un anumit interval.
Funcia de repartiie, a modelului statistic Poisson este de forma:
0, dac < 0

F() = Pr( ) =

=0


, dac 0 <
!

(7.13)

{1, dac
Alura funciei de repartiie, a modelului statistic Poisson, pentru diferite valori ale parametrului
, este prezentat n figura 7.5.
1.2

()

1.2

()

0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

-5

10

-5

a) = 0.1
()

0.8

0.8

0.6

0.6

0.4

0.4
0.2

10

-10

c) = 2.0

Figura 7.5

10

1.2

0.2

-5

b) = 1.0

1.2

()

10

c) = 8.0

Funcia de repartiie Poisson

20

30

n anexa III, de la finalul crii, se afl valorile funciei de repartiie Poisson, calculate pentru
parametrul = 0.1 15.0.
Valorile tipice

ale variabilei aleatorii Poisson repartizate, [GIB 76], [HAS 75], [WIK 10]:

1. Media teoretic:

= () =
=0


= .
!

(7.14)

2. Mediana:
+

1 0.02

(7.15)

3. Moda:
Dac valoarea parametrului este un numr natural, atunci:
1 = 1 i 2 =
Dac valoarea parametrului nu este un numr natural, atunci:
=
n ecuaia (7.15) i (7.17), prin , s-a notat partea ntreag a valorii .

(7.16)
(7.17)

4. Dispersia:

= () = ( )2
=0


= .
!

(7.18)

5. Abaterea medie ptratic:


= () = .

(7.19)

Exemplul 7.4
Numrul de defecte de material constatate ntr-un atelier de estorie
este Poisson repartizat cu media de 0.1 defecte/m2. S se determine
probabilitatea ca:
a) ntr-un m2 s determinm 2 defecte de material?
b) n 10 m2 s avem doar un defect?
c) n 20 m2 s nu existe nici un defect?
Soluie:

a)

= 0.1 ( = 2) =

0.1 0.12
2!

b) = 0.1 10 = 1 ( = 1) =

= 0.0045.
1 11
1!
2

c) = 0.1 20 = 2 ( = 0) =
Observaii:

= 1 = 0.3679.
= 0.1353.

a. Repartiia Poisson reprezint un caz limit al repartiiei binomiale, pentru


cazul n care este suficient de mare ( ) i este suficient de mic
( 0), astfel nct produsul: , s poat fi considerat constant, adic:
=

(7.20)

Dac n funcia de probabilitate a repartiiei binomiale nlocuim valoarea


lui , obinut din ecuaia (7.20):
=
obinem:



Pr( = ) =
( ) (1 )
=

( 1) ( 1) ( + 1)


=
(1 ) (1 )
!

( 1) ( 1) ( + 1)

=
(1 )
(1 )
!

1 [1 (1)] [1 ( 1)]
=
(1 )
.
[1 ()]
!

Dac trecem la limit cnd , obinem:



lim (1 ) =

i
1 [1 (1)] [1 ( 1)]
= 1.

[1 ()]
Rezult:

Pr( = ) =
.
!
lim

n aplicaiile practice se recomand ca > 20 i < 0.1.


b. n cazul repartiiei Poisson, ntre medie i dispersie exist relaia:
() = ().

(7.21)

Exemplul 7.5
O firm realizeaz filtre de ulei n condiiile n care 2% din produse sunt
neconforme. S se determine probabilitatea ca ntr-un container, conine 100 de
produse, s existe maxim trei filtre neconforme.
Soluie:

a. Utiliznd repartiia Poisson cu parametrul = 0.02 100 = 2:


3

2 2
( 3) = (3) =
= 0.857,
!
=0

conform anexei III, tabelul III.1.


b. Utiliznd repartiia binomial cu parametrii = 100, = 0.02 i =
0.98:
3

( 3) = (3) = 100
0.02 0.98100 = 0.859.
=0

10

Domeniile de utilizare ale repartiiei Poisson:

Modelarea din punct de vedere probabilist a experimentelor avnd urmtoarele


caracteristici:
Considerm un interval oarecare de pe axa real, n care presupunem c evenimentul
ateptat apare n mod aleatoriu, cu o valoare medie . Dac mprim acest interval n
subintervale disjuncte, cu o lungime suficient de mic, astfel nct:
a) Probabilitatea ca evenimentul ateptat s apar ntr-un astfel de interval tinde spre
zero;
b) Probabilitatea ca evenimentul ateptat s apar ntr-un subinterval este aceeai
pentru toate subintervalele i este proporional cu lungimea intervalului;
c) Apariia evenimentului ateptat, ntr-un subinterval, este independent de apariia
lui n celelalte subintervale,
atunci, variabila aleatorie , a crei valoare reprezint numrul de evenimente ateptate
pe acest interval, este repartizat Poisson cu parametrul > 0.

Prima aplicaie a repartiiei Poisson se refer la numrul de decese din armata Prusac,
cauzate de loviturile cailor;
Teoria ateptrii;
Calcul aproximativ al probabilitilor evenimentelor binomial repartizate;
Controlul statistic de recepie i n metodele de inspecie prin atribute;
Calculul i construcia fielor de control pentru numrul de neconformiti/unitatea de
produs i pentru numrul de neconformiti, n cadrul controlului statistic al proceselor.
Modelarea apariiei bolilor rare (de exemplu leucemia), cu excepia celor infecioase, la
care apariia mbolnvirilor nu este independent;
Accidente de main i modelarea distanei optime dintre autovehicule n trafic;
Rspndirea animalelor pe cale de dispariie;
Defectarea mainilor-unelte.

7.3.3 MODELUL REPARTIIEI HIPERGEOMETRICE


7.3.3.1 SCHEMA LUI BERNOULLI CU BILE NEREVENITE
Se consider o urn care conine bile de dou culori, bile albe i bile negre:
=+
Se extrag bile din urn, una cte una, fr ntoarcerea bilelor extrase napoi n urn. Se cere s
se determine probabilitatea ca din bile extrase ( < ), s fie de culoare alb i de
culoare neagr.
Exist + posibiliti de a lua bile din totalul de + bile, cte sunt n urn la nceput.
Numrul posibilitilor de a lua bile albe din cele existente, la nceput n urn, este , iar
pentru a lua bile negre, din cele bile negre ce se afl n urn la nceput este
, deci:

11

(, ) =

!


!

=
,

! ( )! +
! ( )! +
+

(7.22)

unde , i + .
7.3.3.2 REPARTIIA HIPERGEOMETRIC
Definiia 7.3:

O variabil aleatorie discret , este repartizat hipergeometric cu parametrii


, , , dac funcia de probabilitatea este de forma:

( = ) =


, pentru = 0,1, , i , , + .

(7.23)

Forma cea mai utilizat a repartiiei hipergeometrice se obine pornind de la ecuaia (7.23), prin
utilizarea notaiilor:
=+
{
.
=
Rezult:


( = ) =
, pentru = 0,1, ,

(7.24)
i , , , < , < .
i se noteaz, ~(, , , ).
Semnificaia valorilor variabilei aleatorii hipergeometric repartizate este:

Considerm o mulime ce conine obiecte de dou tipuri:


- obiecte a cror extragere se consider succes;
- obiecte a cror extragere se consider eec.
Se extrag aleatoriu obiecte, fr rentoarcere, din mulimea de obiecte;
Valoarea a variabilei aleatorii, , reprezint numrul de succese nregistrate n cele
obiecte extrase.

Alura funciei de probabilitate, a repartiiei hipergeometrice, pentru diferite valori ale


parametrilor , i , este prezentat n figura 7.6.
0.45

( = )

( = )

0.4

0.4

0.35

0.35

0.3

0.3

0.25

0.25

0.2

0.2

0.15

0.15
0.1

0.1

0.05

0.05

a) = 5, = 5 i = 10

Figura 7.6

b) = 30, = 5 i = 50

Funcia de probabilitate a repartiiei hipergeometrice

12

( = )
0.7
0.6
0.5

0.4
0.3

0.2
0.1

c) = 5, = 5 i = 50

Funcia de probabilitate a repartiiei hipergeometrice

Figura 7.6

Funcia de repartiie, a modelului statistic hipergeometric, este de forma:


0, dac < 0

F() = Pr( ) =

, dac 0 < .

(7.25)

=0

{ 1, dac
Alura funciei de repartiie, a modelului statistic hipergeometric, pentru diferite valori ale
parametrilor , i , este prezentat n figura 7.7.
1.2

1.2

()

0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

-4

-2

-4

-2

()

1
0.8

0.6
0.4
0.2

0
-4

-2

c) = 5, = 5 i = 50

Figura 7.7

b) = 30, = 5 i = 50

a) = 5, = 5 i = 10
1.2

()

Funcia de repartiie hipergeometric

13

Valorile tipice

ale variabilei aleatorii hipergeometric repartizate, [GIB 76], [HAS 75],


[WIK 10]:

1. Media teoretic:

= () =
=0

=
= .

(7.26)

n ecuaia (7.26), cu s-a notat:


=

(7.27)

2. Moda:
=

( + 1) ( + 1)
+2

(7.28)

3. Dispersia:

= () = ( )2
=0

=
.

(7.29)

n ecuaia (7.29), cu s-a notat:


=

i = .

(7.30)

4. Abaterea medie ptratic:


= () =

.
1

(7.31)

Exemplul 7.6
Dintr-un lot avnd = 100 de piese, ce conine 5% produse
neconforme, este extras aleator un eantion de = 5 piese. S se calculeze
probabilitatea ca eantionul s conin exact o pies neconform:
Soluie:

= 100, = 5, = 0.05 = 5 i = = 95
51
1 1 51 95
5! 95! 5! 95!
Pr( = 1) =
=
=
= 0.2114.

4! 1! 4! 91! 100!
100

Observaii:

a. Repartiia hipergeometric reprezint un caz limit al repartiiei binomiale,


pentru cazul n care este suficient de mare ( ):

(7.32)
lim 2 = lim (
) = .

1
n aplicaiile practice se recomand utilizarea acestei aproximri, pentru:

(7.33)
< 0.1.

b. Factorul, ( 1), ce apare n expresia dispersiei, n cazul repartiiei

14

hipergeometrice, poart numele de factor de corecie pentru populaii


finite.
c. Spre deosebire de cazul repartiiei binomiale, n cazul repartiiei
hipergeometrice probele nu sunt independente.
d. n cazul repartiiei hipergeometrice, ntre medie i dispersie exist relaia:
() < ().

(7.34)

Exemplul 7.7
Un eantion de trei produse este extras, fr nlocuire, dintr-o populaie
de = 50 de produse, din care 6 sunt neconforme. S se calculeze
probabilitatea ca n acest eantion s existe maxim un produs neconform:
a. Utiliznd repartiia hipergeometric;
b. Utiliznd repartiia binomial.
Soluie:

a. Utiliznd repartiia hipergeometric cu parametrii = 50, = 6 i


= 3:
1

( 1) = (1) =
=0

3
6 506
= 0.9653,
3
50
6

b. Utiliznd repartiia binomial cu parametrii = 3, = 50 = 0.12 i


= 0.88:
1

( 1) = (1) = 3 0.12 0.883 = 0.9602.


=0

Domeniile de utilizare ale repartiiei hipergeometrice:


Repartiia hipergeometric se utilizeaz n statistic, fiabilitate, controlul statistic de recepie,
metodele de inspecie prin atribute i controlul statistic al proceselor, fiind modelul statistic ce
descrie, din punct de vedere probabilist, situaia n care se preleveaz un eantion dintr-o
populaie alctuit dintr-un numr finit de indivizi.
Din pcate expresia matematic, destul de complex, a acestui model statistic face ca pentru
aceste situaii s se prefere aproximarea cu modelul repartiiei binomiale.

15

Curs 8.

8.3 LEGI DE REPARTIIE PENTRU VARIABILE ALEATORII


CONTINUE
8.3.1 REPARTIIA NORMAL
Definiia 8.1: O variabil aleatorie continu , este normal repartizat cu parametrii i ,
dac funcia densitate de probabilitatea este de forma:
() =

1
2

1 2
)

2(

pentru < < , < <


(8.1)
i > 0.

i se noteaz, ~(, , ).
Aceast repartiie statistic mai poate fi ntlnit i sub denumirea de repartiia Gauss Laplace.
Alura funciei densitate de probabilitate, a repartiiei normale, pentru diferite valori ale celor
doi parametri, este prezentat n figura 8.1.
Din analiza acestui model statistic se poate concluziona c:

Repartiia normal este simetric fa de o vertical trasat n punctul de abscis = ;

reprezint un parametru de poziionare, deoarece determin poziia pe axa a curbei


densitate de probabilitate;
reprezint un parametru de scal, deoarece influena lui asupra alurii funciei densitate
de probabilitate este identic cu modificarea scalei de reprezentare grafic pe axa .

()

0.9
0.8
0.7

= 2.0, 2 = 0.5

= 0, 2 = 0.2

0.6

0.5
0.4

= 0, 2 = 1

0.3
0.2

= 0, 2 = 5

0.1

0
-5

Figura 8.1

-4

-3

-2

-1

Funcia densitate probabilitate a repartiiei normale

Funcia de repartiie, a modelului statistic normal, rezult de forma:

() = ( ) =

1 2
(
2 )

1
2

(8.2)

Alura funciei de repartiie, pentru diferite valori ale celor doi parametri, este prezentat n
figura 8.2.
1.2

()
1

= 2.0, 2 = 0.5

= 0, 2 = 5

0.8

0.6

= 0, 2 = 1
0.4

0.2

= 0, 2 = 0.2

0
-5

Figura 8.2

-4

-3

-2

-1

Funcia de repartiie normal

Calculul valorilor probabilitilor, prin utilizarea relaiei (8.2), reprezint o operaie destul de
dificil deoarece prin integrare nu se poate ajunge la o expresie explicit. Pentru a nltura acest
neajuns, este nevoie s apelm la schimbarea de variabil aleatorie:
=
Rezult:

(8.3)
+

1
( ) = (
) = ( + ) =
2 .

Variabila aleatorie Z, definit prin relaia (8.3), poart numele de variabil aleatorie normal
normat i are funcia densitate de probabilitate:
2
1
(8.4)
() =
2 .
2
Ecuaia (8.4) reprezint densitatea de probabilitate pentru o variabil aleatorie normal
repartizat cu = 0 i = 1. ntr-adevr:

1
() = (
) = [() ] = 0.

De asemenea
1
1
( 2 ) = 2 ( 2 2 + 2 ) = 2 [ 2 + 2 2 2 + 2 ] = 1.

Conform ecuaiei (5.28), rezult:


2 = ( 2 ) [()]2 = 1.
Prin intermediul densitii de probabilitate (8.4), probabilitile corespunztoare diferitelor

valori ale variabilei aleatorii se pot determina cu relaia:


() = ( ) = () =

1
2

(8.5)

Funcia (), definit prin ecuaia (8.5), poart numele de funcia integral Laplace. Aceast
funcie, mpreun cu ecuaia (8.3) permite calculul probabilitilor pentru diferite valori ale unei
variabile aleatorii normal repartizate, indiferent de combinaia de valori ale celor doi parametri,
i .
De asemenea, dac considerm dou valori reale, i , < , atunci:
( < < ) = (

) (
)

(8.6)

n anexa IV, de la finalul crii, tabelele IV.1 i IV.2 se gsesc calculate valorile funciei
integrale Laplace.
Exemplul 8.1
n cadrul unui atelier, pe un strung se realizeaz o pies cilindric cu
diametrul de 15+0.05
0.05 . Care este probabilitatea producerii de rebuturi tiind
c diametrul piesei este normal repartizat cu = 15.02 i = 0.02 .
Soluie:

Probabilitatea ca piesa s fie conform cu specificaia tehnic este, conform


figurii 3.17:
(14.95 15.05) = (15.05) (14.95) =
15.05 15.02
14.95 15.02
= (
) (
) = (1.5) (3.5) =
0.02
0.02
= 0.9332 0.0002 = 0.933.
Deci, probabilitatea ca piesele s rezulte rebut, este:
1 (14.95 15.05) = 1 0.933 = 0.067 = 6.7%.

()

14.95

15

= 15.02 15.05

Figura 8.3

Cazul exemplului 8.1

Valorile tipice

ale variabilei aleatorii normal repartizate, [GIB 76], [HAS 75], [KEC 93]:

1. Media teoretic:
= () =

1
2

1 2
)

2(

(8.7)

2. Mediana:
= .

(8.8)

= .

(8.9)

3. Moda:
4. Dispersia:
2 = () =

1
2

( )2

1 2
(
)
2

= 2 .

(8.10)

5. Abaterea medie ptratic:


= () = 2 = .

(8.11)

Exemplul 8.2
Fie variabila aleatorie , normal repartizat, avnd funcia densitate de
probabilitate:
1 8 2
1
(
() =
2 2 ) .
2 2
S se determine:
a. Media i dispersia variabilei aleatorii, ;
b. S se determine cuantilele 0.05 i 0.95 .
Soluie:

a. = 8 i 2 = 22 = 4.
b. Cuantilele variabilei aleatorii normale normate sunt, conform anexei IV:
0.05 = 1.64 i 0.95 = 1.64.
Rezult:
0.05 = 0.05 + = 2 (1.64) + 8 = 4.72 ;
0.95 = 0.95 + = 2 1.64 + 8 = 11.28.

Observaii:

a. Fiind vorba de o repartiie pentru o variabil aleatorie continu, repartiia


normal respect condiia:
1
2

1 2
(
2 )

= 1.

b. Considerm variabile aleatorii independente, 1 , 2 , , , normal


repartizate cu mediile 1 , 2 , , i dispersiile 12 , 22 , , 2 . Atunci,
variabila aleatorie

= ,
=1

este normal repartizat cu media = =1 i dispersia 2 = =1 2 .


c. Fie , o constant real pozitiv, conform ecuaiei (8.6), rezult:

( < < + ) = ( ) ( ).

Datorit simetriei repartiiei normale:

( ) = 1 ( ).

Deci:

(| | < ) = 2 ( ) 1.

(8.12)

d. Particulariznd relaia (8.12) pentru = 3 , obinem:


3
(| | < 3 ) = 2 (
) 1 = 2 (3) 1.

Deoarece, (3) = 0.9986501, atunci:


(| | < 3 ) = 0.9973.

(8.13)

Ecuaia (8.13) poart numele de regula celor ase sigma.


e. Tot, datorit simetriei repartiiei normale, ntre cuantilele repartiiei se
poate stabili urmtoarea relaie:
= 1 .
e. Pentru o variabil aleatorie normal repartizat, ~(, , ), suprafaa
delimitat de funcia densitate de probabilitate i de dou drepte verticale,
trasate de o parte i de alta a mediei, la distane egale cu multipli ntregi ai
abaterii medii ptratice, are valorile prezentate n figura 8.4.
Aceste valori se pot determina utiliznd relaia (8.12).

()

68.3%

95.5%

99.7%

Figura 8.4

Probabilitatea abaterilor fa de medie

+ 2 + 3

Exemplul 8.3
O ferm ambaleaz cartofi n saci. Presupunem c greutatea unui sac de
cartofi este normal repartizat cu = 30 i abaterea medie ptratic =
2 . S se determine numrul de saci, ce trebuie ncrcai la o livrare de 6 ,
astfel nct greutatea transportului s nu depeasc cantitatea nominal cu mai
mult de 10%.
Soluie:

() = 0.10 1 (

600030
2

0.90 = 1.28

6000 30
2

6000 30
2

) = 0.10.

= 1.28. Rezult 199 .

Domeniile de utilizare ale repartiiei normale:


Repartiia normal reprezint modelul cel mai frecvent utilizat n statistic. Dintre domeniile n
care repartiia normal i-a gsit aplicaie, se pot enumera:

Modelarea tuturor fenomenelor a cror variaie poate fi considerat ca fiind rezultatul


aciunii unui numr mare factori, ce acioneaz independent unii fat de alii, sau a unui
ir de cauze nlnuite ale cror efecte pot fi nsumate;

Modelarea proprietilor fizice ale materialelor (oeluri, materiale semiconductoare,


ceramic, sticl, mase plastice, porelan, grafit, hrtie, fibre textile), proprieti care sunt
continue n timp sau spaiu;

Calculul statistic al erorilor de msurare, al erorilor de prelucrare i al erorilor de


orientare;

Variaiile datorate erorii preciziei de msurare;

Controlul statistic al proceselor;

Fenomenele de mbtrnire mecanic, electric i termic a elementelor componente ale


sistemelor;

Tensiunea de rupere (deformare) a materialelor metalice i textile;

Numrul de cicluri de funcionare pn la defectare datorat oboselii, sau tensiunilor


interne ale materialelor, pentru componente mecanice, electrice i electronice;

Modelarea duratei de via pentru bunuri de larg consum: nclminte, mbrcminte,


mobil, becuri de iluminat i aparatur electrocasnic;

Media valorilor a observaii din orice tip de repartiie statistic, sau din repartiii
diferite avnd o medie i o abatere standard finite, aproximeaz o repartiie normal i nu
depinde de forma repartiiei iniiale;

Realizarea inferenelor statistice pentru media de eantionaj;

Este utilizat n fizica statistic: vectorul vitez al moleculelor unui gaz are componentele
variabile aleatorii independente, normal repartizate;

n micarea brownian, schimbarea poziiei unei particule n orice direcie, ntr-un


interval de timp [0, ], urmeaz o repartiie normal cu media = 0 i dispersia
proporional cu (raportul de proporionalitate reprezint valoarea coeficientului de
difuzie).

8.3.2 TEOREMA LIMIT CENTRAL


n teoria probabilitii, teorema limit central stipuleaz condiiile n care valoarea medie a
unui numr suficient de mare de variabile aleatorii independente, fiecare avnd media i
dispersia finite, va fi de aproximativ normal repartizat. De aceea, aceast teorem joac un rol
deosebit n aplicaiile statistice, fiind considerat, mpreun cu legea numerelor mari, una din
cele dou teoreme fundamentale ale teoriei probabilitilor, [GIB 76], [WIK 10].
Definiia 8.2:

Fie variabile aleatorii independente, 1 , 2 , , , normal repartizate cu


mediile:
(1) = (2 ) = = ( ) =
i dispersiile:
(1 ) = (2 ) = = ( ) = 2 ,
atunci:

lim (
) =


= lim ( + + ) =

(8.14)
=

1
2

2
2

n ecuaia (8.14), prin s-a notat variabila aleatorie:

= ,
=1

avnd media ( ) = i dispersia ( ) = 2 .


Deci, teorema limit central indic faptul c legea de repartiie a variabilei aleatorii:

,

tinde asimptotic spre repartiia normal normat, dac .
Exemplul 8.4
Se arunc o moned de 100. S se determine, utiliznd repartiia
normal, care este probabilitatea ca numrul de steme s fie mai mare de 60.
Soluie:

reprezint o variabil aleatorie, binomial repartizat cu:

= = 1 0.5 = 0.5 i 2 = (1 ) = 1 0.5 0.5 = 0.25.


Variabila aleatorie:
100

= , este repartizat, cu:


=1
100

100

= = = 100 0.5 = 50 i

=1

= 2 = 2 = 25
=1

60 50
( > 60) = 1 ( 60) = 1 (60) = 1 (
)=
25
= 1 (2) = 1 0.97725 = 0.02275.
Definiia 8.2, reprezint de fapt, un caz particular al teoremei limit central. Versiunea cu un
grad mai mare de generalitate, a teoremei limit central, aplicabil n anumite condiii iniiale,
atunci cnd variabilele aleatorii sunt independente, dar nu sunt identic repartizate, este:
Definiia 8.3:

Fie variabile aleatorii independente, 1 , 2 , , , repartizate cu mediile,


1 , 2 , , i dispersiile, 12 , 22 , , 2 , n anumite condiii, conduc la:
lim (

( )
( )

) =

1
2

(8.15)

n ecuaia (8.15), prin s-a notat variabila aleatorie:

= ,

=1

avnd media ( ) = i dispersia ( ) = 2 .


=1

=1

Referitor la condiiile n care ecuaia (8.15) este valabil, putem afirma c:

Aproximaia este satisfctoare, pentru cazul repartiiilor simetrice, chiar dac 8;


n cazul repartiiilor asimetrice se recomand ca > 8.

8.3.3 REPARTIIA LOGNORMAL


Definiia 8.3: O variabil aleatorie continu , este lognormal repartizat cu parametrii i ,
dac funcia densitate de probabilitatea este de forma:
1
1 1()2
() =
2
,
(8.16)
2
pentru > 0, < < i > 0.
i se noteaz, ~(, , ).
Repartiia lognormal este o repartiie derivat din modelul statistic normal.
Definiia 8.4:

O variabil aleatorie continu , este lognormal repartizat cu parametrii i

, dac logaritmul ei, , este normal repartizat cu parametrii i .


Considerm, deci, o variabil aleatorie , ~(, , ), astfel nct:

= = =

Rezult:
() = ( ) = ( ) = ( ) =
=

1
2

2 = (

(8.17)


).

Alura funciei densitate de probabilitate, a repartiiei lognormale, pentru diferite valori ale celor
doi parametri, este prezentat n figura 8.5.
1.6

()

=0
= 0.3

1.4
1.2

=0
= 1.0

=0
= 0.5

0.8

=0
= 0.3

0.6
0.4

=0
= 0.3

0.2

0
0

0.5

1.5

2.5

3.5

4.5

Funcia densitate de probabilitate a repartiiei lognormale

Figura 8.5

Funcia de repartiie, a modelului statistic lognormal, rezult de forma:


() = ( ) =

1 2
1
2( )
2

(8.18)

Alura funciei de repartiie, pentru diferite valori ale celor doi parametri, este prezentat n
figura 8.6.
Valorile tipice

ale variabilei aleatorii lognormal repartizate, [GIB 76], [KEC 93], [WIK 10]:

1. Media teoretic:
= () =

1
2

1 2
(
2 )

1 2

= +2

(8.19)

2. Mediana:
= .
3. Moda:

(8.20)

= .

(8.21)

4. Dispersia:
2

= () =

1
2

1 2 2

( +2 )

1 2
(
2 )

=
2

(8.22)

= 2+ ( 1).
5. Abaterea medie ptratic:
2

= () = 2+ ( 1).

(8.23)

1.2

()
1

0.8

=0
= 0.3

0.6

=0
= 0.3
=0
= 0.3

0.4

=0
= 0.3
=0
= 0.3

0.2

0
0

0.5

1.5

2.5

3.5

4.5

Figura 8.6

Funcia de repartiie lognormal

Observaii:

a. Pe baza definiiei 8.4 i anume, dac o variabil aleatorie , ~(, , ),


atunci ~(, , ), se pot calcula probabilitile i cuantilele
variabilei aleatorii lognormal repartizate, folosind tabelele IV.1 i IV.2 din
anexa IV, de la finalul crii.
c. Fie 1 , 2 , , , variabile aleatorii independente i lognormal
repartizate. Atunci, produsul = =1 , este de asemenea o variabil
aleatorie lognormal:

~ (, , 2 ).
=1

=1

d. Dac ~(, , ) atunci, variabila aleatorie = , > 0, este


repartizat:
~(, + , ).

10

Exemplul 8.5
Fie variabila aleatorie , lognormal repartizat, avnd = 5 i = 3.
S se determine:
a. ( 500);

b. ( > 1000);

c. (300 9000);

d. 0.50 ;

e. Media i dispersia variabilei aleatorii, ;


Soluie:

5005

a. ( 500) = (

) = (0.405) = 0.6554217
10005

b. ( > 1000) = 1 ( 1000) = 1 (

)=

= 1 (0.636) = 1 0.7356527 = 0.2643473.


90005

3005

c. (300 9000) = (

) 1 + (

)=

= (1.368) 1 + (0.234) = 0.9146 1 + 0.5909 = 0.5056.


d. 0.50 = 0 = + = 5+03 = 148.4131.
1

e. () = +2 = 5+2 = 13364.73.
2
2
() = 2+ ( 1) = 25+9 ( 9 1) = 1446078581990.51.
Domeniile de utilizare ale repartiiei lognormale:

Repartiia lognormal se utilizeaz cu bune rezultate n modelarea unei game largi de


procese legate ndeosebi de uzura materialelor, de solicitrile de durat, de studiul
durabilitii materialelor;
Modelul lognormal se utilizeaz n domeniul polurii atmosferei, pentru descrierea
concentrrii unor particule poluante n diferite zone industriale;
Modelarea concentraiei unor elemente din scoara terestr i a radioactivitii lor;
Caracterizeaz rezistena la rupere a materialelor;
Modelarea unor fenomene biologice;
Perioada de incubaie (de la infectare pn la debut) a bolilor infecioase;
Modelarea durabilitii unor tranzistori;
Modelarea duratei de via, a produselor, dup solicitri extreme;
Analize economice asupra distribuiei veniturilor i a altor indicatori economici;
Modelarea cifrelor de afaceri ale ntreprinztorilor.
Caracterizarea unor structuri n domeniul tehnologiei alimentare i cel al proceselor din
domeniul ingineriei alimentare.

8.3.4 REPARTIIA UNIFORM CONTINU


Definiia 8.5:

O variabil aleatorie continu , este uniform repartizat cu parametrii i


, dac funcia densitate de probabilitatea este de forma:

11

() =

1
, pentru , , > i [, ].

(8.24)

i se noteaz, ~(, , ).
Alura funciei densitate de probabilitate, a repartiiei uniforme, pentru = 2 i = 6, este
prezentat n figura 8.7. Se constat c cei doi parametri ai repartiiei sunt:
- , reprezint un parametru de poziionare;
- , reprezint un parametru de scal;
- , reprezint amplitudinea domeniului de definiie al variabilei aleatorii .
Repartiia uniform continu, datorit formei sale, mai poate fi ntlnit i sub denumirea de
repartiia dreptunghiular sau rectangular.
0.3

()
0.25
0.2
0.15
0.1
0.05

0
0

Figura 8.7

Funcia densitate de probabilitate a repartiiei uniforme continue

Funcia de repartiie, a modelului statistic uniform continuu, rezult de forma:

() = ( ) =

=
,

(8.25)

pentru , , > i [, ].
ntr-adevr:

() = ( ) =

1
=
=
|
=
.

Reprezentat grafic, funcia de repartiie, a modelului uniform continuu, are alura din figura
8.8, dac = 2 i = 6.
Valorile tipice

ale variabilei aleatorii uniforme continue, [GIB 76], [KEC 94], [WIK 10]:

1. Media teoretic:

1
+
= () =
=
.

12

(8.26)

2. Mediana:
+
.
2

(8.27)

(8.28)

=
3. Moda:
4. Dispersia:

( )2
+ 2
= () = (
)
=
.
2

12

(8.29)

5. Abaterea medie ptratic:


= () =

.
2 3

(8.30)

1.2

()
1
0.8
0.6
0.4
0.2

0
0

Figura 8.8

Funcia de repartiie uniform continu

Observaii:

a. Probabilitatea unei variabile aleatorii, , uniform repartizate pe un interval


[, ], (, , ), de a lua valori ntr-un interval [, ] [, ], este
direct proporional cu lungimea relativ a intervalului:

( ) =

=
.

b. Valorile funciei de repartiie, (), a unei variabile aleatorii , sunt


uniform repartizate pe intervalul [0, 1]. Aceast proprietate st la baza
tehnicilor numerice de simulare Monte-Carlo.
c. Dac o variabil aleatorie urmeaz o repartiie uniform n intervalul
[0,1], iar () este o funcie de repartiie atunci variabila aleatorie =
1 () are funcia de repartiie ().
ntr-adevr:

13

() = () = 1 = .

Rezult:
() = ( ) = [ 1 () ] = [ ()] = ().
d. Generarea valorilor unei variabile aleatorii , provenind dintr-o repartiie
(), se realizeaz prin intermediul funciei inverse de repartiie i prin
utilizarea numerelor aleatorii uniform repartizate n intervalul [0, 1],
(, 0,1), vezi figura 8.9:
= 1 [( , 0,1)].
()
1.0

Figura 8.9

1 [(

, 0,1)]

Generarea valorilor unei variabile aleatorii


Exemplul 8.6
Considerm o variabil aleatorie , repartizat cu funcia densitate de
probabilitate:
1
() =
, pentru 0 100.
100
S se determine:
a. ( > 60);
b. (20 40).

Soluie:

= 0 i = 100.
60 0
= 1 0.6 = 0.4;
100 0
40
20
b. (20 40) = (40) (20) =

= 0.2.
100 100
a. ( > 60) = 1 (60) = 1

Domeniile de utilizare ale repartiiei uniforme:

Modelarea evenimentelor a cror probabilitate de apariie, n timp, este direct


proporional cu lungimea intervalului de timp, sau a cror probabilitate de apariie este
constant de-a lungul unui interval;

14

Studiul comportrii, n timp, a sistemelor complexe, atunci cnd comportarea elementelor


componente este cunoscut;
Tehnicile Monte-Carlo, pentru generarea aleatorie a eantioanelor provenind din repartiii
statistice complet specificate;
Generarea aleatorie a valorilor unei variabile aleatorii, provenind dintr-o repartiie
complet specificat, prin utilizarea funciei inverse de repartiie;

15

Curs 9.

9.3 STATISTICA
Atunci cnd omul nu a mai putut intui a nceput s msoare. Msurtorile i observaiile au
devenit prima treapt spre nelegerea legilor naturii. Dar, n acest fel, omul nu mai poate s
cunoasc direct realitatea, el poate numai s o aproximeze succesiv prin modele fizice si apoi
prin modele matematice. Dar aceste modele nu descriu exact realitatea. Ele o aproximeaz i
apar aa numitele erori. Unele erori sunt previzibile, altele ns sunt ntmpltoare (aleatorii).
Acest ultim tip de erori (aleatorii) au si ele legile lor de manifestare. Apar deci, fenomenele
aleatorii descrise prin variabilele aleatorii.
Teoria probabilitilor pleac de la ipoteza c se cunosc exact aceste variabile aleatorii (prin
funciile de probabilitate, funciile de repartiie, funciile caracteristice, etc.). Statistica pleac
de la msurtorile brute i caut s regseasc modelul probabilist, teoretic exact, care se afl
n spatele acestor msurtori.
Exemplul 9.1
Pentru determinarea expresiei ale funciei de probabilitate a repartiiei
hipergeometrice, raionamentul matematic a pornit de la o urn ce conine un
numr de N bile, din care a sunt bile albe i b sunt bile negre. Apoi, s-a stabilit
semnificaia variabilei aleatorii binomial repartizate: se extrag bile din urn,
una cte una, fiecare bil nu este reintrodus n urn dup constatarea culorii.
Valorile variabilei aleatorii astfel obinute reprezint evenimentele ca din n bile
extrase, k s fie de culoare alb.
Soluie:

n cazul utilizrii statisticii se pornete de la o urn ce cuprinde un numr


oarecare de bile, albe i negre, dar configuraia exact nu se cunoate. Prin
extrageri succesive de bile, fr revenire i prelucrarea statistic a
rezultatelor obinute se ncearc determinarea, ct mai exact a configuraiei
iniiale a urnei, precum i expresia matematic a modelului statistic ce poate
fi utilizat n astfel de situaii.

Partea empiric a statisticii care se ocup de prelucrarea datelor obinute prin msurtori sau
observaii se numete statistic descriptiv. Aparatul matematic al teoriei probabilitilor, pus
n funciune pentru a studia i interpreta aceste date, n dorina de a specifica modelul
probabilistic real, care guverneaz fenomenul msurat sau observat, formeaz inferena
statistic. Dup ce cercettorul capt informaii suficient de clare despre fenomenul
probabilistic studiat, el va trebui s acioneze optim potrivit acestor informaii. Apare deci teoria
deciziei statistice, care este o ramur important a statisticii.

Definiia 9.1:

Statistica este disciplina care se ocup cu culegerea, nregistrarea, gruparea,


analiza i interpretarea datelor referitoare la un anumit fenomen precum i cu
formularea unor previziuni privind comportarea viitoare a acestuia.

Statistica, de asemenea, este alctuit din dou pri distincte:


Statistica descriptiv, avnd ca scop principal i specific sintetizarea i structurarea, ntro manier ct mai direct i mai intuitiv, datele de observaie i informaia coninut n
acestea. n acest sens utilizeaz, de regul, tabele, grafice, indicatori numerici etc.
Statistica inferenial, creia i revine rolul de a extinde rezultatele obinute pe baza
datelor din eantion la nivelul populaiei generale i de a confirma sau invalida ipotezele
emise apriori, formulate dup faza exploratorie.
Urmrind etapele oricrui proces de cunoatere, pentru rezolvarea problemelor care fac obiectul
su de studiu, statistica, ca orice tiin, i-a elaborat procedee, tehnici i metode speciale de
cercetare, cum sunt cele de investigare statistic a fenomenelor, de observare fenomenelor de
mas, de centralizare i grupare, modele de analiz i interpretare statistic.
Toate aceste elemente formeaz metoda sau metodologia statisticii. Metoda utilizat n
cercetarea statistic presupune parcurgerea urmtoarelor etape, vezi fig. 9.1:

observarea statistic etap n care se culeg date i informaii statistice de la unitile


colectivitii, pentru toate caracteristicile urmrite;

Definiia 9.2:

Observarea statistic reprezint aciunea de culegere, de la unitile statistice,


a informaiilor referitoare la caracteristicile urmrite, dup criterii riguros
stabilite.

Identificarea i descrierea
problemei studiate;
Identificarea factorilor de influen
Delimitarea populaiei i a
caracteristicii statistice;
Stabilirea volumului de eantionaj
i a metodei de prelevare;
Prelevarea datelor de eantionaj

Sintetizarea i
structurarea informaiei
obinute;
Reprezentarea datelor de
eantionaj;
Calculul principalilor
parametri i indicatori
statistici.

Adoptarea unui model


statistic;
Estimarea punctual a
parametrilor modelului;
Testarea concordanei;
Inferene statistice privind
parametrii i indicatorii
statistici.

1.
OBSERVAREA
STATISTIC

2.
PRELUCRAREA
STATISTIC

3.
ANALIZA I
INTERPRETAREA
REZULTATELOR

METODA STATISTICII
Figura 9.1:

Metoda utilizat n cercetarea statistic

Observarea se efectueaz dup un plan riguros, care trebuie s cuprind:

scopul observrii;
stabilirea caracteristicilor ce vor fi nregistrate;
alegerea formularelor de nregistrare;
delimitarea timpului i locului observrii;
stabilirea msurilor organizatorice;
prelevarea datelor de eantionaj.

Pentru a putea asigura corectitudinea datelor, etapa propriu-zis de observare statistic,


trebuie s fie precedat de:
1. Identificarea i descrierea clar i concis a problemei studiate.
2. Identificarea, cel puin cu titlu de ncercare, a factorilor importani care afecteaz
aceast problem, sau care poate juca un rol n soluie sale.
3. Delimitarea populaiei i identificarea caracteristicii /caracteristicilor statistice de
studiat.
4. Stabilirea volumului de eantion i a metodei de prelevare a datelor de eantionaj.

prelucrarea statistic, etap n care datele sunt sistematizate, reprezentate grafic i sunt
calculai principalii indicatorii statistici ce caracterizeaz fenomenul studiat;

analiza i interpretarea rezultatelor, etap n care sunt alese modele statistice, estimai
parametrii acestor modele, verificate ipotezele, formulate concluzii sau recomandri
bazate pe soluia problemei i fundamentate procesele decizionale.

9.4 NOIUNI STATISTICE FUNDAMENTALE


Rigoarea care trebuie s caracterizeze studiul din cadrul unei tiine este condiionat de
aplicarea ntr-o manier unitar a procedeelor de cercetare. ndeplinirea acestei condiii impune
ca toate conceptele utilizate n cercetare s fie definite n mod precis. n ceea ce privete tiina
statisticii, cercetarea din cadrul acesteia are la baz mai multe concepte:
a.
b.
c.
d.
e.
f.

populaia statistic;
unitatea statistic;
caracteristic statistic;
valoare observat;
eantion;
inferen statistic.

Populaia statistic (numit i colectivitate statistic) este reprezentat de o mulime de


elemente studiate cu scopul de a cerceta starea la un moment dat, sau evoluia n timp a unuia
sau mai multor fenomene. Populaiile statistice pot mbrca diferite forme, n funcie de
scopurile i modalitile de cercetare a fenomenelor colective. Atunci cnd se studiaz starea
unui fenomen la un moment dat, elementele populaiei statistice reflect manifestarea din acel
moment a fenomenului (de exemplu, dac se analizeaz salariul mediu, ntr-o anumit lun,

pentru o ramur a economiei naionale, populaia statistic este format din ansamblul
salariailor care lucreaz, n luna respectiv, n acea ramur). n schimb, dac se cerceteaz
evoluia n timp a unui fenomen, elementele populaiei statistice trebuie s reflecte dinamica
manifestrii fenomenului n perioada de timp studiat (de exemplu, pentru a se analiza evoluia
unei dimensiuni a unei piese, pe parcursul unei serii de fabricaie, populaia statistic poate fi
format din valorile cotei respective, nregistrate pe toat durata de fabricaie, a seriei
respective).
Definiia 9.3:

Totalitatea indivizilor care se iau n considerare poart numele de populaie.

De asemenea, n cazul unei variabile aleatorii, se consider c repartiia de probabilitate a


acesteia definete populaia variabilei.
O unitate statistic este o component a mulimii care formeaz populaia statistic. n funcie
de metodele i scopurile cercetrii, o unitate statistic poate corespunde unui element indivizibil
al populaiei statistice, fiind numit, n acest caz, unitate simpl, sau poate consta dintr-un grup
de astfel de elemente, situaie n care este numit unitate compus. De exemplu, dac populaia
statistic este reprezentat de ansamblul studenilor de la o anumit specializare, pot fi stabilite
uniti simple, fiecare dintre acestea corespunznd unui student, sau pot fi definite uniti
compuse, constnd n grupe, ani de studiu etc.
Definiia 9.4:

Entitate (unitate statistic sau individ) reprezint ceea ce poate fi descris i


considerat n mod individual.

Numrul total al unitilor statistice care compun populaia se noteaz cu: .


Caracteristicile statistice reprezint nsuirile prin care sunt descrise, n cadrul unei cercetri,
unitile statistice.
Definiia 9.5:

Caracteristica statistic reprezint proprietatea care permite identificarea sau


diferenierea entitilor unei populaii date.

n raport cu modul de descriere, pot fi delimitate dou tipuri de caracteristici statistice:

caracteristici calitative, care descriu unitile statistice prin atribute;


caracteristici cantitative, care descriu unitile statistice prin variabile, sau prin valori
numerice.

Caracteristicile statistice pot fi difereniate dup mai multe criterii si anume:


1. Dup coninut, pot fi:

de timp: exprim apartenena unitii n timp;


de spaiu;
atributive: exprima trsturi specifice unitilor (vrsta, sex, profit, fonduri fixe).

2. Dup natura variaiei, pot fi:

Cu variaie continu, care pot lua orice valoare din scala lor de variaie (exemple:
nlime, greutate, cifr de afaceri etc.);
Cu variaie discret, care nu pot lua dect anumite valori pe scala lor de variaie, de
regul numere ntregi (exemple: numrul de copii dintr-o familie, numrul de sate
dintr-un jude etc.).

3. Dup numrul de caracteristici (variabile) la care se refer aceste date, distingem:


Caracteristici unidimensionale (univariate) sunt cele care se refer la o singur
variabil statistic. Avem deci o singur informaie pentru fiecare unitate statistic.
Caracteristici multidimensionale (multivariate), sunt cele care se refer la dou sau
mai multe variabile statistice.
Definiia 9.6:

Valoare observat reprezint valoarea unei caracteristici, obinut ca rezultat


al unei singure observaii.

Definiia 9.7:

Totalitatea valorilor diferite ale unei caracteristici, sau intervalul n care sunt
coninute acestea (domeniu de valori observate ale variabilei), se numete
scal.

Calitatea valorilor observate este un factor important care condiioneaz calitatea informaiilor
ce rezult dintr-un studiu statistic, realismul cunoaterii i eficienta deciziilor de aciune.
Prin urmare, veridicitatea (autenticitatea) valorilor observate printr-o metod oarecare
(specific cercetrii) concordanta acestora cu datele reale ale fenomenelor investigate
constituie un obiectiv fundamental (int) a oricrei metode de nregistrare (observare)
statistic. Acest obiectiv este, ns, greu de realizat deoarece chiar i prin respectarea tuturor
principiilor tiinifice de pregtire i de organizare a colectrii datelor nu se obin ntotdeauna
date absolut reale, n concordan cu manifestrile reale ale fenomenului investigat.
Aceasta nseamn ca n observarea statistica se nregistreaz i erori.
n general, prin eroare de nregistrare (observare) statistic, exprimat absolut sau relativ, se
nelege diferena dintre rezultatul obinut prin nregistrare si mrimea reala a caracteristicilor
(variabilelor) observate.
Aceste diferene (erori) sunt determinate de volumul nregistrrilor, de precizia mijloacelor de
msurare a datelor provenite din diverse surse (cunoscute sau necunoscute).
Sursele de erori se regsesc i n activitile care vizeaz nregistrarea i metodele de
nregistrare. Dintre acestea exemplificam:

Mobilitatea (inconstana) n timp a unitii observate (determinat de factori conduc la


rspunsuri inexacte sau aproximative);
Puterea uman limitat de nregistrare (observare), de exemplu, perceperea eronat a
rspunsurilor, transcrierea greit a acestora etc.;
Neclaritatea definirii unitilor de observare i a variabilelor de nregistrat;
Imperfeciunea metodelor i mijloacelor de observare sau de nregistrare;
Factori subiectivi etc.

Exemplele de mai sus sugereaz faptul c sunt factori obiectivi i subiectivi care conduc la erori
de nregistrare ntmpltoare, sistematice i de asemenea, la greeli de nregistrare.
Principale tipuri de erori statistice n etapa de observare sunt:
-

Erorile ntmpltoare sunt cele care provoac abateri n sensul mririi sau micorrii
nivelului real al fenomenului. Acestea pot surveni din neatenie i nu au un caracter
premeditat. n cazul populaiilor mari, acest tip de erori au un caracter redus.

Erorile sistematice sunt cele care produc abateri semnificative, de regul ntr-un singur
sens, de la realitatea observat. Sunt generate din nenelegere sau din rea credin.
Mrimea absolut a acestor erori este necunoscut, deoarece necunoscut este valoarea
adevrat a valorilor observate.
Erorile grosiere (greelile) se datoreaz fie lipsei de experien, fie incompetentei, fie
altor cauze. Diferena esenial dintre erori i greeli este aceea c acestea din urm pot fi
depistat i eliminat. Acest lucru presupune analiza sistematic (aprofundat) a datelor
nregistrate i un studiu detaliat a cazurilor n care valorile observate depesc limitele
admisibile.

Fr a fi o regul general, prevenirea erorilor se poate realiza prin aciuni suplimentare de


genul:
-

testrii tehnicilor i formularelor de nregistrare;


selectarea optim i pregtirea profesional a persoanelor care efectueaz nregistrarea;
inspectarea (controlul), pe teren, a nregistrrilor de date;
pregtirea psihologica a persoanelor care efectueaz nregistrarea;
popularizarea scopului nregistrrii i formarea convingerilor pentru exprimarea datelor
reale, etc.

n multe situaii practice, fenomenul pe care l analizm poate fi caracterizat printr-o mulime
de date care fie sunt greu de obinut, fie obinerea acestor date cost prea mult sau dureaz un
timp prea ndelungat. n aceste cazuri, din mulimea de date se extrag eantioane i informaiile
asupra eantioanelor se utilizeaz pentru inferena statistic. Un eantion este o submulime de
date extrase dintr-o populaie.
Definiia 9.8:

Una sau mai multe uniti de eantionare prelevate dintr-o populaie i


destinate s furnizeze informaii despre aceast populaie poart numele de
eantion.

Definiia 9.9:

Procesul de prelevare sau de constituire a eantionului poart numele de


eantionaj.
S remarcm faptul c n literatura de specialitate, pentru noiunea de eantion
se mai folosesc termenii de selecie sau sondaj.

Definiia 9.10:

Numrul unitilor de eantionare care compun eantionul poart numele de


efectivul eantionului sau de volumul eantionului.
Volumul eantionului se noteaz cu .

Definiia 9.11:

Reprezentativitatea (eantionului) reprezint proprietatea eantionului de a


reprezenta fidel populaia.

Pentru ca metodele statistice s conduc la concluzii valabile, eantionul trebuie s fie


reprezentativ pentru populaia analizat. Pentru a realiza acest obiectiv este de dorit ca pentru
fiecare unitate statistic, ce compune eantionul, s i se asigure aceeai ans de extragere din
cadrul populaiei, n procesul de eantionaj.
Prin urmare, obinerea unui eantion este un experiment aleatoriu i fiecare valoare colectat

reprezint o valoare observat pentru o variabil aleatorie, iar observaiile din populaie
determin repartiia de probabilitate a variabilei aleatorii ce modeleaz fenomenul studiat.
Pentru a defini un eantion aleatoriu, se consider o variabil aleatorie care reprezint
rezultatul prelevrii unui element al populaiei. Presupunem, de asemenea, c cele valori ce
compun eantionul se obin independent, fr schimbarea condiiilor, sau a ansei de extragere
(extrageri independente). n aceste condiii, valorile de eantionaj pot fi considerate ca fiind
realizrile a variabile aleatorii independente:
1 , 2 , , , ,
n afara tipologiei de erori prezentat, mai pot fi amintite erorile de reprezentativitate (efective
sau poteniale ntlnite n cercetarea statistic).
Definiia 9.12:

Inferena statistic reprezint procedeul de a obine informaii privind


ntreaga populaie, pornind de la date incomplete.

9.5 METODE GRAFICE PENTRU DESCRIEREA DATELOR CALITATIVE


Pentru a descrie observaiile calitative efectuate asupra unei mulimi de date (respectiv datele
nregistrate referitoare la acea mulime de date) se definesc categorii, astfel nct fiecare
observaie (adic fiecare dat nregistrat) s aparin unei singure categorii. Mulimea de date
este descris prin determinarea numrului de observaii (sau a proporiei din total a numrului
de observaii) care aparin fiecrei categorii.
Definiia 9.13:

Frecvena absolut este numrul de realizri (apariii) ale unui tip dat de
evenimente, sau numrul de observaii care aparin unei clase.

Frecvena absolut se noteaz cu , unde reprezint indicele categoriei, sau clasei respective,

1, .
Conform definiiei 9.13, rezult:

= ,

(9.1)

=1

unde: , reprezint volumul eantionului.


Definiia 9.14:

Rezult,

Frecvena relativ, , reprezint valoarea obinut prin mprirea frecvenei


absolute la numrul total de realizri (apariii) sau de observaii:

(9.2)
= ,
1, .

= 1.0.

(9.3)

=1

Frecvena relativ a unei categorii este deci, proporia din numrul total de observaii, al
numrului de observaii care aparin acelei categorii.

Cele mai uzuale metode de descriere i reprezentare grafic a mulimilor de date calitative sunt
graficele (diagramele) cu bare, graficele circulare i graficele liniare.
Graficele cu bare constau din reprezentarea frecvenei absolute (sau a frecvenei relative),
corespunztoare fiecrei categorii, ntr-un sistem de axe de coordonate, n care pe o ax
figureaz categoriile, iar pe cealalt se traseaz proporional, prin bare sau dreptunghiuri,
valorile de frecven absolut (sau frecven relativ), ale fiecrei categorii.
Graficele circulare se obin prin mprirea unui cerc ntr-un numr de sectoare de cerc egal
cu numrul de categorii, unghiurile la centru ale acestor sectoare fiind proporionale cu
frecvena absolut (sau frecvena relativ) a fiecrei categorii.
Graficele liniare se utilizeaz mai ales pentru a descrie evoluia unui anumit fenomen i se
obin prin reprezentarea prin linii (drepte sau curbe) a dinamicii parametrilor statistici pe care
i reprezentm n sistemul de axe de coordonate.
Exemplul 9.2
Repartizarea angajailor pe departamente ntr-o societate comercial
este dat n tabelul de mai jos:
Departamentul

Numrul de angajai

Frecvena relativ

1120

0.56

540

0.27

200

0.10

140

0.07

2000

1.0

Total:
Soluie:

n tabelul de mai sus, categoriile sunt date de cele 4 departamente denumite


, , , iar frecvena absolut a fiecrei categorii este dat de numrul de
salariai din fiecare departament.
Frecvena relativ a fiecrei clase din ultima coloan a tabelului de mai sus se
obine prin mprirea numrului de angajai din fiecare departament la
numrul total de angajai. Graficul cu bare corespunztor frecvenei absolute
este reprezentat n Figura 9.2.

Figura 9.2:

Grafic cu bare

Graficul circular corespunztor pentru datele anterioare, este reprezentat n


Figura 9.3.

Figura 9.3:

Grafic circular

9.6 METODE GRAFICE PENTRU DESCRIEREA DATELOR CANTITATIVE


Cea mai utilizat metod grafic pentru descrierea datelor cantitative o reprezint histograma
frecvenei relative/absolute, denumit i repartiia empiric a datelor de eantionaj. Acest
instrument statistic se recomand a fi utilizat n cazul eantioanelor de volum mare,
(30)35.
S considerm un eantion de volum , valorile de eantionaj fiind:
1 , 2 , ,
Pentru construirea histogramei frecvenei relative se utilizeaz urmtorul algoritm:
ALGORITM PENTRU CONSTRUCIA HISTOGRAMEI FRECVENELOR
Etapa 1:

Se preleveaz valorile de eantionaj:


1 , 2 , 3 , , , ,
prin observarea unui eantion de volum ;

Etapa 2:

Se formeaz irul statisticilor de ordine:


(1) (2) (3) () () ,
unde
1, ;

Definiia 9.15:

Funcie care depinde de variabilele aleatorii ale unui eantion poart numele
de statistic

Definiia 9.16:

Cnd observaiile asupra unui eantion sunt ordonate cresctor, dup valorile
lor:
(1) (2) (3) () () ,
fiecare dintre aceste observaii ordonate, este o valoare a unei variabile
aleatorii numit statistic de ordine.

Etapa 3:

Se determin valoarea minim, respectiv maxim de eantionaj:


= (1) ;
= () .

Etapa 4:

Se calculeaz amplitudinea de eantionaj, :


= = () (1)

Definiia 9.17:

Diferena dintre cea mai mare valoare i cea mai mic valoare, observate la o
caracteristic cantitativ, poat numele de amplitudine.

Etapa 5:

Se determin numrul de clase, .

Definiia 9.18:

Pentru o caracteristic calitativ, grupuri de indivizi formate n acelai mod,


fiecare grup avnd atribute comune, grupurile fiind disjuncte dou cte dou
i exhaustive, poart numele de clas.

Definiia 9.19:

Pentru o caracteristic cantitativ, fiecare dintre intervalele consecutive


disjuncte, n care este mprit ntregul interval de variaie al caracteristicii,
poart numele de clas.
Numrul de clase se determin cu relaia empiric (relaia lui Sturges):
=1+

10
3

10 (),

(9.4)

sau cu relaia:
(9.5)
= ,
n general se recomand ca numrul de clase s fie .
Valorile obinute cu relaiile (9.4) i (9.5) se rotunjesc la valoarea ntreag cea
apropiat.
Etapa 6:

Calculul mrimii clasei, amplitudinii clasei, :

Etapa 7:

Calculul limitelor claselor, marginilor claselor, :


1 = (1) ;
2 = (1) + ;
3 = (1) + 2 ;
...
= (1) + ( 1) ;
...
+1 = (1) + ;
2

+1

= (1)

+1
= ()

Clasa j

Figura 9.4:

Schi pentru calculul limitelor claselor

10

Etapa 9:

Calculul valorilor centrale ale clasei, .

Definiia 9.20:

Media aritmetic a limitelor superioar i inferioar ale clasei, pentru o


caracteristic cantitativ:
=

+ +1
,
1,
2

(9.6)

se numete centrul clasei.


Etapa 10:

Determinarea frecvenei absolute, .

Etapa 11:

Determinarea frecvenei relative, :


=

Etapa 12:

Determinarea repartiiei de frecvene.

Definiia 9.21:

Relaia empiric ntre valorile unei caracteristici i frecvenele absolute sau


relative ale acestora se numete repartiie de frecvene.

Repartiia de frecvene poate fi reprezentat grafic sub form de histogram, grafic cu bare
sau poligon al frecvenelor cumulate.
Definiia 9.22:

Reprezentarea grafic a repartiiei de frecvene a unei caracteristici


cantitative, constnd dintr-un ansamblu de dreptunghiuri alturate, fiecare
avnd baza egal cu mrimea clasei i aria proporional cu frecvena clasei
se numete histogram, vezi figura 9.5.

Definiia 9.23:

Reprezentarea grafic a repartiiei de frecvene a unei caracteristici


cantitative, constnd dintr-un ansamblu de bare de aceeai lime i cu
lungimea proporional cu frecvena se numete diagram cu bare, vezi
figura 9.6.

Definiia 9.24:

Linia poligonal obinut prin unirea punctelor care au ca abscise limitele


superioare ale claselor i au ca ordonate frecvenele absolute sau relative
cumulate se numete poligonul frecvenelor cumulate, vezi figura 9.7.

1
Figura 9.5:

+1

Histograma

11

1
Figura 9.6:

+1

Diagrama cu bare

+1

Figura 9.7:

Poligonul frecvenelor cumulate

Definiia 9.25:

Numrul de membri ai unui ansamblu de observaii care au valori mai mici


sau egale cu o valoare dat se numete frecven absolut cumulat, ,

1, .

Cu datele grupate n clase, frecvena absolut cumulat este definit numai de limitele clasei
i are expresia:
0
dac X<1

dac +1

(9.7)

=1

{ 1
Definiia 9.26:

dac > +1

Frecvena relativ cumulat reprezint raportul dintre frecvena absolut


cumulat i volumul de eantion.
0
dac X<1

dac +1
=1

{1

dac > +1

12

(9.8)

Exemplul 9.3
Se consider urmtorul eantion reprezentativ:
49.14, 48.19, 48.83, 49.74, 53.14, 50.37, 50.30, 48.89, 52.11, 50.25, 49.09,
51.42, 49.68, 48.11, 49.36, 48.38, 48.65, 49.92, 49.82, 49.00, 50.23, 49.75,
50.49, 49.18, 49.24, 51.93, 47.93, 48.36, 50.06, 50.32, 49.33, 51.27, 50.02,
50.45, 52.41, 51.64, 50.54, 49.30, 50.47, 50.40, 49.01, 51.92, 50.42, 48.77,
50.17, 52.89, 49.58, 50.66, 50.10, 50.26, 50.50, 49.83, 46.49, 50.08, 49.66,
50.90, 50.60, 50.71, 50.57, 49.14.
S se determine i s se reprezinte grafic repartiia de frecvene a datelor de
eantionaj.
Soluie:

(1) = 46.49
() = 53.14
= 60
= () (1) = 53.14 46.49 = 6.65
10
=1+
log(60) = 1 + 5.927 7
3
6.65
= =
= 0.95

7
Clasa

Limita
inferioar

Limita
superioar

Valoarea
central

1
2
3
4
5
6
7

46.49
47.44
48.39
49.34
50.29
51.24
52.19

47.44
48.39
49.34
50.29
51.24
52.19
53.14

46.965
47.915
48.865
49.815
50.765
51.715
52.665

1
5
13
17
15
6
3

0.017
0.083
0.217
0.283
0.250
0.100
0.050

1
6
19
36
51
57
60

0.017
0.100
0.317
0.600
0.850
0.950
1.000

Diagrama cu bare

Histograma
0.3

18
16
14
12
10
8
6
4
2
0

0.25
0.2
0.15
0.1
0.05
0
46.965 47.915 48.865 49.815 50.765 51.715 52.665

46.965 47.915 48.865 49.815 50.765 51.715 52.665

13

Poligonul frecvenelor cumulate

1.2
1
0.8
0.6
0.4
0.2
0
45

47

49

51

14

53

55

57

Curs 10.

10.3 METODE NUMERICE PENTRU DESCRIEREA DATELOR


CANTITATIVE
Gruparea datelor de eantionaj, alctuirea seriei statistice i reprezentarea sa grafic sub forma
histogramei, diagramei cu bare sau poligonul frecvenelor cumulate, nu sunt suficiente pentru
analiza din punct de vedere statistic i pentru obinerea concluziilor privind legea creia i se
supune fenomenul de mas observat. Este necesar ca datele existente s fie sintetizate sub forma
unor indicatori numerici de eantionaj, care s le exprime sau s le reprezinte.
Observm ns, c n condiiile variabilitii mrimilor obinute ca rezultat al procesului de
eantionaj, exist totui o serie de tendine a datelor, de:

a se grupa n jurul frecvenei maxime;


a fi mprtiate n jurul frecvenei maxime;
a se ordona sub diferite forme: simetrice, asimetrice, mai aplatizate etc.

Deci, la fel ca i n cazul valorilor tipice ale variabilelor aleatorii, dezvoltate la calculul
probabilitilor, cu ajutorul datelor de eantionaj este necesar s se determine trei tipuri de
indicatori statistici de eantionaj:

ai tendinei de grupare (sau de poziionare) a valorilor de eantionaj;


ai tendinei de mprtiere (sau de variaie) a valorilor de eantionaj;
ai formei repartiiei de frecvene.

Deoarece, valorile observate ale caracteristicilor statistice cantitative se pot prezenta sub dou
forme:
Serie statistic n care valorile sunt distincte ntre ele;
Serie statistic la care valorile sunt grupate n clase, fiecare clas avnd centrele
clasei yj i frecvenele absolute/relative, Nj /fj , i
1, k,
metodele de calcul al indicatorilor statistici de eantionaj au fost dezvoltate pentru aceste dou
situaii.
-

O alt precizare, deosebit de important, ce trebuie fcut se refer la faptul c datorit


ipotezelor efectuate la descrierea noiunii de eantionaj, indicatorii statistici de eantionaj sunt
la rndul lor variabile aleatorii, caracterizate de repartiii statistice, numite de eantionaj.
La aceeai concluzie se poate ajunge dac considerm, n cazul prelevrii unui eantion de
volum , dintr-o populaie de volum , mulimea tuturor eantioanelor ce se pot obine. Dac
pentru fiecare eantion din aceast mulime se calculeaz indicatorii statistici de eantionaj,
valorile obinute reprezint repartiia statistic de eantionaj a acestor indicatori.

10.3.1 METODE NUMERICE PENTRU DESCRIEREA DATELOR


CANTITATIVE NEGRUPATE
Msurile numerice descriptive sunt valori numerice calculate avnd la dispoziie o mulime de
date de eantionaj:
1 , 2 , 3 , , , , ,

(10.1)

obinute prin msurarea caracteristicii unui eantion de volum . Aceste valori reprezint
realizrile a variabile aleatorii:
1 , 2 , 3 , , , , ,

(10.2)

identic repartizate.
Principalii indicatori statistici de eantionaj sunt cazuri particulare, ca i n cazul valorilor tipice
ale unei variabile aleatorii, a momentelor de ordinul sau a momentelor centrate de ordinul .
Definiia 10.1:

Momentul de ordinul , a unui eantion cu un efectiv de valori,


1 , 2 , 3 , , , , este prin definiie:
=

1 + 2 + 3 + +
.

(10.3)

Deci, pe baza datelor de eantionaj (10.1) i pe baza notaiilor (10.2), din ecuaia (10.3), rezult:
1 + 2 + 3 + + =1
=
=
.

Definiia 10.2:

(10.4)

Momentul centrat de ordinul , a unui eantion cu un efectiv de valori,


1 , 2 , 3 , , , , este prin definiie:

(1 ) + (2 ) + (3 ) + + ( )
.

n ecuaia (10.5), prin s-a notat media de eantionaj, ecuaia (10.7).


=

(10.5)

Deci, pe baza datelor de eantionaj (10.1) i pe baza notaiilor (10.2), din ecuaia (10.5), rezult:

(1 ) + (2 ) + + ( ) =1( )
=
=
,

(10.6)

unde reprezint media aritmetic i este dat de ecuaia (10.8).


Indicatorii statistici de eantionaj ai tendinei de grupare (sau de poziionare) sunt: media de
eantionaj, mediana de eantionaj i moda de eantionaj.
Considernd cele variabile aleatorii (10.2), media aritmetic de eantionaj se definete:
1 + 2 + 3 + +
.

Deci, pe baza datelor de eantionaj (10.1) i pe baza ecuaiei (10.7), rezult:


= =

Definiia 10.3:

(10.7)

Media aritmetic, a unui eantion cu un efectiv de valori,


1 , 2 , 3 , , , , este prin definiie:

= =
Observaii:

1 + 2 + 3 + + =1
=
,

(10.8)

a. Valoarea medie a mediilor de eantionaj obinute prin utilizarea ecuaiei


(10.8), notat cu :
() = = ,

(10.9)

este identic cu valoarea , a populaiei din care a fost prelevat eantionul.


Demonstraie:

Considerm variabile aleatorii:


1 , 2 , 3 , , , , ,
identic repartizate cu media , adic:
( ) = ,
1, .
Deoarece media de eantionaj este de finit sub forma ecuaiei (10.7), rezult:
1
1
() = [(1 ) + (2 ) + + ( )] = ( ) = .

b. Dac populaia este infinit, sau dac extragerea eantionului se execut cu


revenire, atunci dispersia mediei de eantionaj, notat cu 2 , este egal cu:
[( )2 ] = 2 =

2
,

(10.10)

unde, prin 2 s-a notat dispersia populaiei din care a fost prelevat eantionul.
Demonstraie:

Conform relaiei (10.7), scris sub forma:


1 2

=
+ + + ,

rezult:
(1 ) (2 )
( )
1
2
2
() =
+
+

+
=

)
=
,
2
2
2
2

deoarece cele variabile aleatorii se consider a fi independente i identic


repartizate, adic:
( ) = 2 ,
1, .
c. Dac prelevarea eantionului se efectueaz fr revenire dintr-o populaie
finit, de volum , atunci:
2
sX2 =
(
).
1
d. Dac populaia din care s-a prelevat eantionul este normal repartizat cu
media i dispersia 2 , atunci media de eantionaj, , este normal
repartizat:
~(, , ),
cu media i abaterea medie ptratic .
e. Valoarea numeric:

,
poart numele de eroare standard.

f. Dac se preleveaz un eantion, de volum , dintr-o populaie avnd media


i dispersia 2 , dar care nu este normal repartizat atunci, conform teoremei
limit centrale, variabila aleatorie:

=
,

este asimptotic normal repartizat:


lim ( ) =

1
2

2 .

g. Aproximaia anterioar conduce la rezultate precise, dac 30.


Definiia 10.4:

Mediana unui eantion cu un efectiv de valori, 1 , 2 , 3 , , , , este


prin definiie:
(+1) ,

dac este par

= {() + (+1)
2

(10.11)

, dac este impar


2
unde, () , reprezint statistica de ordine .
Observaii:

a. Mediana de eantionaj obinut prin utilizarea ecuaiei (10.11) este de


asemenea asimptotic normal repartizat, dac 30, cu media:
= ,
i cu abaterea standard:

1.2533
=
=
.
2

Definiia 10.5:

Moda (sau dominanta) unui eantion ordonat cresctor cu un efectiv de n


valori: (1) (2) (3) () () , este prin definiie valoarea
sau valorile cu cea mai mare frecven de apariie, adic:

= {() = (+1) = (+2) = = (+) } unde = , 0.

(10.12)

Moda (modul, sau dominanta) este dat de valoarea eantionului care se repet de cel mai mare
numr de ori.
Deoarece datele de eantionaj, n marea majoritate a situaiilor. sunt valori individuale, definiia
10.5 nu poate fi aplicat n aceast situaie. De aceea, pentru astfel de cazuri se recomand
utilizarea relaiei aproximative, [MIH 80]:
= 3 ( ).

(10.13)

Indicatorii statistici de eantionaj ai tendinei de mprtiere (sau de variaie) sunt:


amplitudinea, dispersia de eantionaj, abaterea medie ptratic, cuantilele i coeficientul de
variaie de eantionaj.
Definiia 10.6: Amplitudinea, , unui eantion, 1 , 2 , 3 , , , , , cu un volum este
prin definiie diferena dintre cea mai mare i cea mai mic valoare de
eantionaj, adic:

= = () (1) ,

(10.14)

unde:
- = max { },
1

= min { },

(1) , reprezint prima statistic de ordine,


() , reprezint statistica de ordine .

Considernd cele variabile aleatorii (10.2), dispersia de eantionaj se definete:


(1 )2 + (2 )2 + + ( )2
(10.15)
,

Deci, pe baza datelor de eantionaj (10.1) i pe baza ecuaiei (10.5), rezult:


2 =

Definiia 10.7:

Dispersia, 2 a unui eantion cu un efectiv de valori, 1 , 2 , 3 , , , ,


este prin definiie:

(1 )2 + (2 )2 + + ( )2 =1( )2
=
=
,

Observaii:

(10.16)

a. Valoarea numeric obinut prin utilizarea ecuaiei (10.16), reprezint un


estimator deplasat al dispersiei de eantionaj, vezi UI 11 (Estimarea
parametrilor), adic:
( 2 ) = 2 2 .
De aceea, relaia (10.16) se utilizeaz doar pentru calcul dispersiei populaiei:
2 =

=1( )2
.

(10.17)

b. Pentru determinarea valorii dispersiei de eantionaj se utilizeaz relaia


corectat:
=1( )2
=
.
1
2

(10.18)

Ecuaia (10.18) reprezint un estimator nedeplasat al dispersiei de eantionaj


i se obine pe baza relaiei (10.17):
1 2
(10.19)
( 2 ) = 2 =
,

adic:
(1 )2 + (2 )2 + + ( )2
( 2 ) = 2 =
.
1
Demonstraie:

Conform relaiei (10.15) i (10.7):


1 = 1

1 + 2 + 3 + +
=

1
[( 1) 1 2 ] =

1
= [( 1) (1 ) (2 ) ( )],

iar:
(1 )2 =

1
[( 1)2 (1 )2 + (2 )2 + + ( )2 +
2
+2 ( 1) (1 ) (2 ) + ].

Deoarece variabilele aleatorii ,


1, , sunt independente, mediile celor
2
produse de tipul:
2 ( 1) [(1 ) (2 )] = 0.
Rezult,
[(1 )2 ] =
1
= 2 {( 1)2 [(1 )2 ] + [(2 )2 ] + + [( )2 ]} =

1
= 2 [( 1)2 2 + 2 + + 2 ] =

1
1 2
= 2 [( 1)2 2 + ( 1) 2 ] =
.

Similar, vom obine pentru oricare termen de forma:


1 2
[( )2 ] =
,
1, .

Rezult,
1 1 2
1 2
1 2
( 2 ) = 2 = [
+ +
]=
.

c. Pentru eantioane de volum 100, repartiia dispersiei de eantionaj este


foarte apropiat de repartiia normal cu parametrii:
2 2 ,
2

22 = 2 , dac populaia din care se preleveaz eantionul este


normal, sau:
4 4

22 =

, dac populaia din care se preleveaz eantionul nu este

normal.
d. Dac se preleveaz un eantion de volum dintr-o populaie normal,
atunci variabila aleatorie:
( 1) 2 (1 )2 + (2 )2 + + ( )2
=
2
2
este hi-ptrat repartizat cu 1 grade de libertate.
e. O variabil aleatorie , este repartizat hi-ptrat cu grade de libertate,
dac funcia densitate de probabilitate are forma:
2 () =

2
2

22 ( )
2
Repartiia variabilei aleatorii se noteaz simplificat, sub forma:

(10.20)

~ 2 (, ).
Repartiia hi-ptrat reprezint modelul statistic al sumei ptratelor a
variabile aleatorii normale normate:

2
=1

2
= (
)

(10.21)

=1

n ecuaia (10.20), funcia gama, (), are expresia:

() = 1 ,

(10.22)

n anexa V, de la finalul crii, tabelul V.1, se gsesc calculate, pentru diferite


grade de libertate, valorile cuantilelor repartiiei hi-ptrat.
f. Dac prelevarea eantionului se efectueaz fr revenire dintr-o populaie
finit, de volum , atunci media dispersiei de eantionaj se determin cu
relaia:

1
( 2 ) = 2 = (
)(
) 2.
1

Definiia 10.8:

Abaterea standard a unui eantion cu un efectiv de n valori,


1 , 2 , 3 , , , , este prin definiie rdcina ptrat a dispersiei,
respectiv:
( )2
= =1
,
1

Observaii:

(10.23)

a. Pentru eantioane de volum 100, repartiia abaterii standard de


eantionaj este foarte apropiat de repartiia normal cu parametrii:
,

2 =
, dac populaia din care se preleveaz eantionul este normal
2

repartizat, sau:
4

4
2 = 4
2 , dac populaia din care se preleveaz eantionul nu este

normal.
Exemplul 10.1
Fie o populaie alctuit din elementele: 2, 3, 6, 8, 11. Considernd toate
eantioanele de volum = 2, ce pot fi obinute cu cele = 5 elemente ale
populaiei, s se determine media i dispersia populaiei, repartiia de
eantionaj a mediei i cea a dispersiei, dac:
a) Extragerea eantioanelor se realizeaz cu revenire.
b) Extragerea eantioanelor se realizeaz fr revenire.
Soluie:

a) Cu revenire:

2 + 3 + 6 + 8 + 11 30
=
= 6.0
5
5
(2 6)2 + (3 6)2 + (6 6)2 + (8 6)2 + (11 6)2
2 =
= 10.8
5
Numrul total de eantioane ce pot fi prelevate cu revenire, este:
52 = 52 = 25
=

Aceste eantioane sunt:


Es.

Es.

14

2.5

0.25

15

11

8.5

6.25

16

17

5.5

6.25

11

6.5

20.25

18

2.5

0.25

19

20

11

9.5

2.25

4.5

2.25

21

11

6.5

20.25

5.5

6.25

22

11

16

10

11

16

23

11

8.5

6.25

11

24

11

9.5

2.25

12

4.5

2.25

25

11

11

11

13

150

135

Repartiia de eantionaj a mediei:


25
150
=1
=
= 6.0
25
25
2
25
135
=1( )
2
=
=
= 5.4
25
25
La acelai rezultat ajungem dac utilizm relaia:
=

2 10.8
=
= 5.4

2
Repartiia de eantionaj a dispersiei:
2 =

2
25
135
=1
=
= 5.4
25
25
La acelai rezultat ajungem dac utilizm relaia:
1
21
2 = (
) 2 = (
) 10.8 = 5.4

2
2
2
25
975.75
=1( 2 )
22 =
=
= 39.03.
25
25

2 =

2
2
25
=1( 2 )
= 39.03 = 6.2474
25

b) Fr revenire:
Numrul total de eantioane ce pot fi prelevate cu revenire, este: 25 = 20.
Repartiia de eantionaj a mediei:
25
120
=1
=
= 6.0
20
20
2
25
81
=1( )
2
=
=
= 4.05
20
20
La acelai rezultat ajungem dac utilizm relaia:
=

2
10.8 5 2
(
)=
(
) = 4.05
1
2
51

2 =
Aceste eantioane sunt:
Es.

Es.

2.5

0.25

11

12

11

8.5

6.25

13

11

6.5

20.25

14

5.5

6.25

2.5

0.25

15

4.5

2.25

16

11

9.5

2.25

5.5

6.25

17

11

6.5

20.25

11

16

18

11

16

19

11

8.5

6.25

10

4.5

2.25

20

11

9.5

2.25

120

135

Repartiia de eantionaj a dispersiei:

2
25
135
=1
2 =
=
= 6.75
20
20
La acelai rezultat ajungem dac utilizm relaia:

1
5
21
2 = (
)(
) 2 = (
)(
) 10.8 =
1

51
2
= 6.75.

22 =
2

2
2
25
733.5
=1( 2 )
=
= 39.675.
20
20

2
2
25
=1( 2 )
= 39.675 = 6.23
20

Definiia 10.9:

Se numete coeficientul de variaie de eantionaj, valoarea numeric notat


cu i definit ca raportul dintre abaterea standard de eantionaj i media
variabilei:
=1( )2

1
=
= =
,
=1

(10.24)

Definiia 10.10: Dac considerm irul statisticilor de ordine pentru un eantion de volum :
(1) (2) (3) () ()
atunci, cuantila de ordinul , , a acestor valori este statistica de ordine:
= ((+1)) ,
Observaii:

(10.25)

Dac expresia ( + 1) nu rezult cu valoare ntreag, atunci pentru


determinarea cuantilei se recomand utilizarea interpolrii liniare.
Presupunem c dup evaluarea expresiei ( + 1), constatm c valoarea
cuantilei este cuprins n intervalul [() , (+1) ].
Pentru determinarea valorii cuantilei , se utilizeaz relaia:
= () + [ ( + 1) ] [(+1) () ],

(10.26)

Exemplul 10.2
S se determine cuantilele 0.25 , 0.50 i 0.75 , pe baza urmtoarelor date
de eantionaj:
107, 98. 119, 76, 95, 87, 101, 122, 103, 112.
Soluie:

a) 0.25 = (0.25(10+1)) = (2.75) (2.75) [(2) , (3) ]


0.25 = 87 + (2.75 2.0) (95 87) = 87 + 0.75 8 = 93,
deoarece, irul statisticilor de ordine este:
76 87 95 98 101 103 107 112 119 122
b) 0.50 = (0.50(10+1)) = (5.5) (5.5) [(5) , (6) ]
0.50 = 101 + (5.5 5.0) (103 101) = 101 + 0.5 2 = 102,
ntr-adevr, 0.50 = i
(10) + (10+1)
(5) + (6) 101 + 103
2
= 2
=
=
= 102.
2
2
2
c) 0.75 = (0.75(10+1)) = (8.25) (8.25) [(8) , (9) ]
0.50 = 112 + (8.25 8.0) (119 112) = 112 + 0.25 7 = 113.75

10

Indicatorii statistici de eantionaj ai formei repartiiei de frecvene sunt: coeficientul de


asimetrie i coeficientul de boltire.
Definiia 10.11: Se numete asimetrie de eantionaj, valoarea numeric notat cu 3 i definit
ca raportul dintre momentul centrat de eantionaj i abaterea standard de
eantionaj la puterea a treia:
=1( )3

3 = 3 =
3,
(10.27)

2
=1( ) 2
(
)
1
Observaii:

Valoarea obinut prin utilizarea ecuaiei (10.27), este de asemenea deplasat.


De aceea, pentru a obine estimaii nedeplasate pentru asimetrie se recomand
utilizarea expresiei corectate:

( 1)

3
3 =
3 =
(
)
( 1) ( 2)
2

=1

Definiia 10.12: Se numete coeficient de boltire de eantionaj, raportul dintre momentul


centrat de ordinul patru de eantionaj i abaterea standard de eantionaj la
puterea a patra:
=1( )4

4 = 4 3 =
3.
(10.28)

=1( )2 2
(
)
1
Observaii:

Valoarea obinut prin utilizarea ecuaie (10.28), este de asemenea deplasat.


De aceea, pentru a obine estimaii nedeplasate pentru boltire se recomand
utilizarea expresiei corectate:

( + 1)
4
3 ( 1)2
4 =
(
)
.
( 1) ( 2) ( 3)
( 2) ( 3)

=1

Exemplul 10.3
S se determine principalii indicatori statistici de eantionaj folosind
urmtorul eantion:
49.14, 48.19, 48.83, 49.74, 53.14,
51.42, 49.68, 48.11, 49.36, 48.38,
50.49, 49.18, 49.24, 51.93, 47.93,
50.45, 52.41, 51.64, 50.54, 49.30,
50.17, 52.89, 49.58, 50.66, 50.10,
50.90, 50.60, 50.71, 50.57, 49.14.
Soluie:

50.37,
48.65,
48.36,
50.47,
50.26,

50.30,
49.92,
50.06,
50.40,
50.50,

48.89,
49.82,
50.32,
49.01,
49.83,

52.11,
49.00,
49.33,
51.92,
46.49,

50.25,
50.23,
51.27,
50.42,
50.08,

49.09,
49.75,
50.02,
48.77,
49.66,

Volumul eantionului: = 60
irul statisticilor de ordine:
46.49 47.93 48.11 48.19 48.36 48.38 48.65 48.77 48.78
48.83 48.89 49.00 49.01 49.09 49.14 49.18 49.24 49.30

11

49.33 49.36 49.58 49.66 49.68 49.74 49.75


49.92 50.02 50.06 50.08 50.10 50.17 50.23
50.30 50.32 50.37 50.40 50.42 50.45 50.47
50.54 50.57 50.60 50.66 50.71 50.90 51.27
51.92 51.93 52.11 52.41 52.89 53.14
Valoarea minim de eantionaj: = (1) = 46.49
Valoarea maxim de eantionaj: = () = 53.14
Media:
=

=1

49.82
50.25
50.49
51.42

49.83
50.26
50.50
51.64

=49.994

Mediana:
=

() + (+1)
2

(30) + (31) 50.06 + 50.08


=
= 50.07
2
2

2
Moda:
= 3 ( ) =50.223
Dispersia:
=1( )2
2 =
= 1.520
1
Abaterea standard:
( )2
= =1
= 1.233
1
Eroarea standard:

=
= 0.159153627

Coeficientul de variaie:

= = 0.025

Asimetria:

3
3 =
(
) = 0.173
( 1) ( 2)

=1

Coeficient de boltire:
( + 1)
4 =
( 1) ( 2) ( 3)

(
=1

4
3 ( 1)2
)
= 0.803
( 2) ( 3)

10.3.2 METODE NUMERICE PENTRU DESCRIEREA DATELOR


CANTITATIVE GRUPATE
Dup cum am vzut n UI 9, plecnd de la un eantion de date negrupate:
1 , 2 , , , ,

12

i construind histograma frecvenei relative, obinem o mulime de date grupate, n intervale


de clas. Fiecare clas ,
1, fiind determinat de limita inferioar, , o limit superioar a
clasei +1 , o valoare central a clasei i avnd amplitudinea , precum i o frecven
absolut, i/sau o frecven relativ .
Sunt de asemenea, diferite metode de eantionare care conduc la obinerea unor date de
eantionaj grupate pe clase.
Pentru astfel date grupate vom studia msurile tendinei centrale i msurile variaiei, precum
i modul de a calcula probabiliti pentru diferite evenimente, utiliznd histograma.
i n acest caz, principalii indicatori statistici de eantionaj sunt cazuri particulare, ca i n cazul
valorilor tipice ale unei variabile aleatorii, a momentelor de ordinul sau a momentelor centrate
de ordinul .
Definiia 10.13: Momentul de ordinul , a unui eantion cu un efectiv de valori, grupate
n clase, este prin definiie:
=

=1 ( )

= ( ) ,
1, ,

(10.29)

=1

unde:
reprezint valorile centrale ale claselor;
reprezint frecvena relativ;
reprezint frecvena absolut;
reprezint volumul de eantion.
Definiia 10.14: Momentul centrat de ordinul , a unui eantion cu un efectiv de valori,
grupate n clase, este prin definiie:

=1 ( )

= ( ) ,
1, ,

(10.30)

=1

unde:
reprezint valorile centrale ale claselor;
reprezint frecvena relativ;
reprezint frecvena absolut;
reprezint volumul de eantion;
reprezint media de eantion, respectiv momentul de ordinul = 1, ecuaia (10.31).
Analiznd ecuaiile (10.29) i (10.30), constatm c datorit modului de grupare a datelor,
respectiv a modalitii de alegere a numrului de clase i a calculului intervalelor de clas, am
nlocuit valorile efective de eantionaj, , cu mijloacele intervalelor de clas , iar frecvenele
relative i/sau absolute corespunztoare unei clase se consider concentrate n centrul clasei, nu
uniform repartizate pe limea unei clase, ca n cazul histogramei. Aceste ipoteze
simplificatoare introduc o serie de aproximaii care induc erori de calcul semnificative pentru

13

momente de ordin superior lui = 2. De aceea nu se recomand utilizarea acestei metode la


calcul momentelor de ordin superior.
Indicatorii statistici de eantionaj ai tendinei de grupare (sau de poziionare) sunt: media de
eantionaj, mediana de eantionaj i moda de eantionaj.
Definiia 10.15: Media aritmetic, a unui eantion cu un efectiv de valori, grupate n
clase, este prin definiie:
=
Observaii:

=1

= ,
1, ,

(10.31)

=1

a. Media aritmetic de eantionaj obinut prin utilizarea ecuaiei (10.31)


reprezint momentul de ordinul unu.
Dac n cazul datelor negrupate, mediana reprezenta acea valoare care avea
la stnga i la dreapta sa acelai numr de valori ale eantionului, n cazul
datelor grupate, se aplic un principiu similar.

Definiia 10.16: Mediana este valoarea pentru care ariile delimitate de histograma frecvenei
relative situate la dreapta i la stnga acestei valori sunt egale, fig. 10.1:
= +

1
=1
2
= +

(10.32)

Deci, pentru a determina valoarea medianei trebuie s identificm clasa median. Acesta
reprezint clasa ce conine frecvena relativ cumulat egal cu 0.50. n ecuaia (10.32) s-au
folosit urmtoarele notaii:
- reprezint limita inferioar a clasei mediane;
+1- reprezint limita superioar a clasei mediane;
- reprezint frecvena absolut a clasei mediane;
- reprezint distana dintre limita inferioar a clasei mediane i median;

+1
Figura 10.1

Schema de calculul a medianei pentru date grupate

14

Moda reprezint valoarea de eantionaj cu frecvena de apariie maxim. Deci, pentru date
grupate n clase, valoarea modei se poate determina aproximativ, ca fiind valoarea central a
clasei cu frecvena relativ/absolut maxim:

+ +1
(10.33)
=
,
2
unde:
= = .
1

Mai precis, mediana se poate determina, n situaia valorilor de eantionaj grupate n clase,
conform schiei din figura 10.2.

Figura 10.2

+1


+1
Schema de calculul a modei
pentru date grupate

Deci, pentru a determina valoarea modei trebuie s identificm clasa modal. Acesta reprezint
clasa cu frecvena relativ/absolut maxim. Pentru calculul valorii modale se utilizeaz
ecuaia:
1
1
(10.34)
= +
= +
,
1 + 2
2 1 +1
n ecuaia (10.34) s-au folosit urmtoarele notaii:
- reprezint limita inferioar a clasei modale;
+1- reprezint limita superioar a clasei modale;
- reprezint frecvena relativ a clasei modale;
1- reprezint frecvena relativ a clasei anterioare celei modale;
+1- reprezint frecvena relativ a clasei posterioare celei modale i
1 = 1
2 = +1
Indicatorii statistici de eantionaj ai tendinei de mprtiere (sau de variaie) sunt:
amplitudinea, dispersia de eantionaj, abaterea medie ptratic i coeficientul de variaie de
eantionaj.

15

Definiia 4.42:

Amplitudinea, , unui eantion cu un efectiv de valori, grupate n clase,


este prin definiie:
(10.35)
= +1 1

unde:
-

+1 , reprezint limita superioar a clasei ,

1 , reprezint limita inferioar a primei clase.

Definiia 10.17: Dispersia, 2 , a unui eantion cu un efectiv de valori, grupate n clase,


este prin definiie:
2

=1 ( )

= ( ) ,
1, ,

(10.36)

=1

unde:
- reprezint valorile centrale ale claselor;
-

reprezint frecvena relativ;

reprezint frecvena absolut;

reprezint volumul de eantion;

reprezint media de eantion, respectiv momentul de ordinul = 1, ecuaia (10.31).

Observaii:

a. Valoarea numeric obinut prin utilizarea ecuaiei (10.36), reprezint un


estimator deplasat al dispersiei de eantionaj, vezi UI 12 (Estimarea
parametrilor), adic:
( 2 ) = 2 2 .
De aceea, relaia (10.36) se utilizeaz doar pentru calcul dispersiei populaiei:
2 =

=1 ( )

= ( ) ,
1, ,.

(10.37)

=1

b. Pentru determinarea valorii dispersiei de eantionaj se utilizeaz relaia


corectat:
2

=1 ( )

2
=
( ) ,
1, .
1

(10.38)

=1

Ecuaia (10.38) reprezint un estimator nedeplasat al dispersiei de eantionaj i se obine pe


baza relaiilor (10.19) i (10.36), astfel nct, n final, s fie verificat ecuaia:
1 2
( 2 ) = 2 =
.

Definiia 10.18: Abaterea standard, , a unui eantion cu un efectiv de valori, grupate n


clase, este prin definiie rdcina ptrat a dispersiei, respectiv:
=

=1 ( )
1

2
=
( ) ,
1, .
1
=1

16

(10.39)

Definiia 10.19: Se numete coeficientul de variaie de eantionaj, valoarea numeric notat


cu i definit ca raportul dintre abaterea standard de eantionaj i media
variabilei:

= =

=1 ( )
1

( )

2
2

1 =1 ( )
,
=1

(10.40)

=1

Prin intermediul repartiiei empirice obinut prin determinarea histogramei se pot calcula
valori ale probabilitilor, de forma:
( ).
Se procedeaz, astfel:
a) n funcie de valoarea variabilei aleatorii, se determin clasa n care se situeaz aceast
valoare. Vom nota cu i +1 limitele acestei clase i cu frecvena relativ
corespunztoare a clasei.
b) Valoarea probabilitii se determin cu relaia:
( ) = + = +
<

<

(10.41)

Conform figurii 10.3:


+1
=
.

n relaia anterioar observm c, +1 = . Rezult:



=

+1
Figura 10.3

Schema de calculul a modei pentru date grupate

17

Curs 11.

11.3 ESTIMAREA PARAMETRILOR


Modelarea fenomenelor reale care utilizeaz aparatul matematic al teoriei statisticii matematice
sau al teoriei fiabilitii presupune asocierea dintre o lege de repartiie i un sistem real concret.
Considerm o variabil aleatorie , la care legea repartiiei este exprimat printr-o funcie dat:
densitatea de probabilitate, (, ), sau funcia de repartiie, (, ).
Aceast funcie este:
a) nespecificat - dac expresia matematic a repartiiei nu se cunoate;
b) specificat - dac conine anumii parametri necunoscui, , care intervin n expresia legii
de repartiie;
c) complet specificat - dac la o funcie specificat se cunosc i valorile numerice ale tuturor
parametrilor.
Definiia 11.1

Operaia prin care se determin valorile parametrilor, , ai modelului statistic,


se numete estimarea parametrilor.

Definiia 11.2

Pentru a efectua estimarea parametrilor, formula, regula aleas sau statistica


utilizat, avnd la baz un eantion de volum :
1 , 2 , , , ,
prelevat aleatoriu din populaia variabilei , se numete estimator.

Estimaia este, la rndul su, o variabil aleatorie dependent de eantion. Estimaiile pot fi:
a) Estimaii neparametrice - dac estimaia se refer la probabilitatea necunoscut de apariie
a fenomenului sau la valoarea unui indicator statistic i a crei aplicare nu necesit
identificarea legii de repartiie.
b) Estimaie parametric - dac estimaia se refer la un parametru necunoscut al modelului
statistic utilizat.
c) Estimaie punctual - dac parametrul necunoscut al populaiei se estimeaz printr-o
valoare numeric, calculat pe baza unui estimator de forma:
(11.1)
= (1 , 2 , , , , , ).
b) Estimaie cu interval de ncredere - dac se stabilete un interval care s includ, cu o
probabilitate dat (1 ), valoarea adevrat a parametrului necunoscut.
Construcia acestor intervale de ncredere presupune cunoaterea repartiiei statistice a
estimaiei punctuale, pentru parametrul estimat: (|).
Intervalele de ncredere pot fi:
a. Unilaterale cu o limit superioar. Acestea se obin ca soluie a ecuaiei, vezi figura 11.1:
(11.2)
( ) = 1 ,

iar intervalul unilateral cu limit superioar rezult sub forma:


< ,
unde:
reprezint limita superioar a intervalului de ncredere;
1 reprezint nivelul de ncredere;
reprezint nivelul de semnificaie.
(|)

1
Figura 11.1

Determinarea intervalelor de ncredere unilaterale cu o limit superioar

b. Unilaterale cu o limit inferioar. Acestea se obin ca soluie a ecuaiei, vezi figura 11.2:
( ) = 1 ,
iar intervalul unilateral cu limit superioar rezult sub forma:
<
unde:
reprezint limita inferioar a intervalului de ncredere;
< ,
( |)

(11.3)

Figura 11.2

Determinarea intervalelor de ncredere unilaterale cu o limit inferioar

c. Bilaterale simetrice. Acestea se obin ca soluie a ecuaiei, vezi figura 11.3:

( ) = 1 ,
iar intervalul bilateral simetric rezult sub forma:
unde:
reprezint limita superioar a intervalului de ncredere;
reprezint limita inferioar a intervalului de ncredere;

(11.4)

( |)

Figura 11.3

Determinarea intervalelor de ncredere bilaterale

S-au pus la punct mai multe metode, pentru estimarea parametrilor, care caracterizeaz
diferitele modele statistice:
A. Metode grafice;
B. Metode analitice:
- metoda celor mai mici ptrate;
- metoda momentelor;
- metoda verosimilitii maxime;
C. Metode bayesiene de estimare.
Aprecierea calitii estimatorilor se realizeaz, de regul, pe baza unor criterii statistice, definite
ca proprieti ale estimatorilor:
1. Nedeplasarea. Estimaia se numete nedeplasat, dac valoarea medie teoretic coincide
cu valoarea adevrat a parametrului:
( ) = .
Deplasarea estimaiei - (), se definete ca fiind:
() = |() |.
2. Consistena. O estimaie se numete consistent, dac ea converge n probabilitate ctre
valoarea adevrat a parametrului, adic:
(| | < ) = 1, > 0.

3. Eroarea medie ptratic MSE , (Mean Squared Eror). Aceast proprietate definit ca:
2
2
() = [( ) ] = () + [()] ,

unde:
2
() = {[ ()] },

reflect discrepana dintre valoarea real a parametrului i estimaia lui, cuantificat prin
dispersie i deplasare.
4. Eficiena. O estimaie a parametrului se numete eficient, dac este nedeplasat i are
dispersia minim.

11.4 METODE DE ESTIMARE PUNCTUAL


11.4.1 METODE GRAFICE
Metoda grafic de estimare a parametrilor modelului statistic se bazeaz pe utilizeaz reelelor
de probabilitate. Procedura general de construire a reelelor de probabilitate const n
liniarizarea convenabil a funciei de repartiie, a modelului statistic, presupus adecvat
reprezentrii datelor.
Reeaua de probabilitate reprezint, de fapt, o coal gradat dup un anumit trasaj pe cele doua
axe de coordonate, de obicei, simplu sau dublu logaritmat, pe care se reprezint punctele
[() , (() )], unde () reprezint statisticile de ordine ale valorilor observate, ale
eantionului de volum , ( =
1, ), iar (() ) reprezint valorile probabilitilor
corespunztoare.
Valorile aproximative ale lui (() ) se determin, utiliznd una din relaiile, [MON 11a],
[MON 11b], [KEC 91], [KEC 93]:
(() ) =

0.3
+ 0.4

(11.5)

sau,
0.5
(11.6)
.

Printre punctele astfel obinute, se traseaz o dreapt. Valorile estimate ale parametrilor
repartiiei se obin prin intermediul acestei drepte, direct de pe reeaua de probabilitate n funcie
de proprietile modelului statistic estimat.
(() ) =

Metoda prezint o serie de avantaje:


este rapid;
se poate constitui ntr-un test de concordan, vezi fig. 11.4. Dac punctele de pe reea
au o tendin liniar de dispunere, putem afirma c modelul statistic ales este adecvat
modelrii datelor de eantionaj. Pentru modele statistice neadecvate se observ c
dispunerea punctelor poate fi concav, convex sau sub form de ,

i o serie de dezavantaje:
nu este aplicabil la volume mari de eantion;
prezint un grad mare de subiectivism la trasarea dreptei printre puncte, ceea ce conduce
la diferene ntre valorile estimate ale parametrilor.
(() )

(() )

Repartiie cu
asimetrie negativ

Repartiie
normal
Z

(() )

(() )

Repartiia
uniform

Repartiie cu
asimetrie pozitiv

Z
Z

Figura 11.4

Dispunerea punctelor pe o reea de probabilitate normal

11.4.2 METODA CELOR MAI MICI PTRATE


Ca i n cazul metodelor grafice de estimare, metoda celor mai mici ptrate se bazeaz pe
liniarizarea convenabil a funciei de repartiie a modelului statistic.
Aceast metod const n determinarea parametrilor unei drepte, i , vezi fig. 11.5:
(11.7)
=+
ce trece printre punctele care conin observaiile statistice, astfel nct suma ptratelor abaterilor
existente ntre dreapta astfel trasat i mulimea punctelor, , s fie minim (Principiul GaussLegendre):

2 =

=1

( + )2 = .

=1

Punnd condiia de minim relaiei (11.8):

(11.8)


=0
{
,

=0

se obine:

2 ( + ) = 0
=1

(11.9)

2 ( + ) = 0
{ =1
Prin rezolvarea sistemul de ecuaii (11.9), se obin estimaiile i ale parametrilor dreptei:
=1 =1 =1
=1 2 (=1 )2
.
=1 =1 2 =1 =1
=
=1 2 (=1 )2
{
=

(11.10)

y
yn

Pn(xn,yn)
Pi1(xi,yi)

Pn-1(xn-1,yn-1)

yi
=
Pi2(xi,A+Bxi)

P2(x2,y2)
y2

= +

P3(x3,y3
)

y1

P1(x1,y1)

x1

x2

xi

xn

Fig. 11.5 Utilizarea principiului celor mai mici ptrate n cazul regresiei liniare
Aceste relaii, (11.10), mpreun cu ecuaiile rezultate din liniarizarea modelului statistic permit
estimarea parametrilor repartiiilor.

11.4.3 METODA MOMENTELOR


Metoda momentelor a fost dezvoltat de K. Pearson i const n egalarea momentelor teoretice,
, pn la ordinul , ale repartiiei ( , 1 , , , ), cu momentele de eantionaj, :
(11.11)
= , =
1, .

Se obine astfel un sistem de ecuaii a crui rezolvare furnizeaz valorile estimate ale
parametrilor, , =
1, .
Observaii:
1. Acest procedeu de estimare este o metoda intuitiv, avnd o slab
justificare teoretic.
2. Metoda nu se poate utiliza la estimarea parametrilor n cazul eantioanelor
incomplete.
3. Nu se recomand utilizarea acestei metode pentru modele statistice care
prezint asimetrie pronunat.
4. Nu se recomand utilizarea acestei metode pentru modele statistice care au
mai mult de doi parametri necunoscui, ntruct erorile introduse sunt, adesea,
foarte mari.
5. Estimaiile obinute prin metoda momentelor nu prezint proprietatea
numit eficient. De aceea, nu se recomand utilizarea lor dect n absena
altor estimatori.

11.4.4 METODA VEROSIMILITII MAXIME


Aceasta metod a fost dezvoltat de R.A. Fisher, care a introdus conceptul de funcie de
verosimilitate pentru un eantion de observaii independente:

(1 , , , ) = ( , ).

(11.12)

=1

Principiul metodei verosimilitii maxime const n determinarea valorilor estimate ale


parametrilor necunoscui:
= (1 , , , , ),
care asigur maximul funciei de verosimilitate, construit pe baza valorilor de eantionaj,
, =
1, .
Pentru comoditatea calcului se obinuiete a se lucra cu logaritmul funciei de verosimilitate:
[( , )] = (1 , ) + (2 , ) + + ( , ).

(11.13)

Estimaiile de verosimilitate maxim reprezint, deci, soluiile urmtorului sistem de ecuaii


normale:
[( , )]
1
(1 , )
1
( , )
=

+ +

(1 , )

( , ) ( , )

(11.14)

=
1, i =
1, .
Funcia de verosimilitate pentru un eantion de observaii independente, dat de ecuaia
(11.11) este valabil doar pentru cazul variabilelor aleatorii continue. n cazul variabilelor
aleatorii discrete, aceast ecuaie devine:

(1 , , , ) = ( = , ),

(11.15)

=1

prin nlocuirea funciei densitate de probabilitate cu cea a funciei de probabilitate.


Observaii:
1. Estimatorii de verosimilitate maxim sunt consisteni i asimptotic
eficieni.
2. Estimatorii de verosimilitate maxim prezint proprietatea de suficien.
3. Estimatorii de verosimilitate maxim sunt asimptotic nedeplasai.
4. Variabila aleatorie:
( ),
este asimptotic normal repartizat cu media zero i dispersia:
2 ( , )
lim ( ) = { [
]}

Utilizarea acestei proprieti face posibil construirea intervalelor de


ncredere pentru valorile estimate ale parametrilor, .
n cazul eantioanelor de volum mic, utilizarea proprietilor asimptotice
ale estimaiilor de verosimilitate maxim, la determinarea limitelor de
ncredere nu este recomandat, ntruct intervalele de ncredere rezult cu
dimensiuni foarte mari.
5. n cazul eantioanelor de volum mic, incomplete, estimaiile de
verosimilitate maxim sunt deplasate.

11.5 ESTIMAREA PARAMETRILOR REPARTIIEI BINOMIALE


a. Estimarea punctual a parametrilor prin metoda verosimilitii maxime
Dac dintr-o populaie binomial repartizat (variabila aleatorie poate avea doar dou stri:
succes sau eec) necunoscut ca structur, realizm extrageri bernoulliene cu revenire i
obinem succese i eecuri, funcia de verosimilitate este:
() = (1 ) ,
Logaritmul funciei de verosimilitate este:
() = ( ) + + ( ) (1 ).
Estimaia punctual de verosimilitate maxim se obine din condiia de maxim:
()
=
= 0,

1
rezult:

= .

(11.16)

Conform ecuaiei (11.16), constatm c estimaia parametrului necunoscut , reprezint de fapt


proporia de indivizi, ai populaiei, ce prezint o anumit proprietate, astfel nct extragerea

acestora s fie considerat un succes.


Observaii:

a. Valoarea estimat , reprezint un estimator nedeplasat al proporiei:


= .
b. Repartiia de eantionaj a proporiei, , este caracterizat de o abatere
standard:
(1 )
=
.

c. Pentru valori mari ale lui ( 30), repartiia de eantionaj al proporiei


este asimptotic normal repartizat, conform teoremei limit central.

b. Estimarea cu interval de ncredere


Dac numrul de extrageri bernoulliene, , este mare, atunci variabila aleatorie:


=
=
(1 ) (1 )

este aproximativ normal repartizat.

(11.17)

Intervalul de ncredere bilateral simetric rezult ca soluie a ecuaiei:


( 1 ) = 1 .
2

Dac n ecuaia anterioar se nlocuiete cu expresia (11.17) se obine:



2


(1 )

=1

i
(1 )
(1 )
( +
+1
) = 1 ,

2
2
iar intervalul de ncredere bilateral simetric, al parametrului , corespunztor unui nivel de
ncredere (1 ), este:
+
2

(1 )
(1 )
+1
.

Exemplul 11.1
Din procesul de fabricaie al unei piese se extrag = 85 de repere. n
urma analizei, rezult c un numr de = 10 prezint defecte de suprafa. S
se determine intervalul de ncredere 95% pentru procentul de repere
neconforme.

Soluie:

1 = 0.95 = 0.05 i 2 = 0.025


0.025 = 1.96.
0.975 = 1.96
10
= =
= 0.12
85
Rezult:
0.12 1.96

0.12 (1 0.12)
0.12 (1 0.12)
0.12 + 1.96
85
85
0.05 0.19.

11.6 ESTIMAREA PARAMETRILOR REPARTIIEI NORMALE


a. Estimarea punctual a parametrilor prin metoda grafic
Liniarizarea modelului repartiiei normale se poate realiza pornind de la egalitatea:

() = (
),

prin inversarea funciei integrale Laplace:



1 [()] = .

(11.18)

Ecuaia (11.18) reprezint ecuaia unei drepte, (11.7), dac considerm urmtoarele relaii de
echivalen:
= 1 [()]

=
(11.19)
.

1
{ =
Ultimele dou relaii din sistemul (11.19) ne furnizeaz i regulile pentru trasarea reelei de
probabilitate normal.
n anexa VII, se afl un model pentru reeaua de probabilitate normal.
Dup ce sunt parcurse etapele prezentate la punctul 11.4.1, valorile estimate ale parametrilor
repartiiei normale se obin folosindu-ne de proprietile repartiiei normale:
datorit faptului c acest model este simetric, iar axa de simetric este valoarea medie,
rezult:
= 0.50 .
(11.20)
conform fig. 8.4, estimaia abaterii standard se poate obine cu una din relaiile:
= 0.841
= 0.159
(11.21)
{
0.841 0.159 .
=
2
b. Estimarea punctual a parametrilor prin metoda celor mai mici ptrate:
Deoarece i aceast metod utilizeaz liniarizarea modelului statistic, valorile probabilitilor

10

corespunztoare datelor de eantionaj, (() ), sunt transformate n valorile ordonatelor


punctelor situate pe o dreapt prin utilizare primei ecuaii a sistemului (11.19):
() = 1 [(() )].
Pe baza acestor valori, (() , () ), se estimeaz parametrii dreptei de regresie, folosind aceleai
ecuaii (11.19). Valorile estimate ale parametrilor repartiiei normale, prin aceast metod se
obin conform sistemului (11.19), adic:
1
=
{
.

=
c. Estimarea punctual a parametrilor prin metoda momentelor
Pe baza unui eantion de volum , prelevat dintr-o populaie normal repartizat:
1 , , ,
estimaiile prin metoda momentelor se obin prin aplicarea principiului ce st la baza acestei
metode:
=
(11.22)
{ = ,
2
2
adic egalarea primelor dou momente teoretice cu cele de eantionaj.
Dar:
2 = 2 2
2 = 2 2 ,
iar ecuaiile (11.22), devin:
=
(11.23)
{ 2
,
= 2
i expresiile estimaiilor punctuale prin metoda momentelor, sunt:

1
=

=1

1
2 =
( )2

1
{
=1

(11.24)

d. Estimarea punctual a parametrilor prin metoda verosimilitii maxime


Pe baza unui eantion de volum , prelevat dintr-o populaie normal repartizat:
1 , , ,
funcia de verosimilitate, sau densitatea de probabilitate a datelor de eantionaj, este:

( , , ) = ( , , ) =
=1

1
2

(11.25)
1 1 2
2( )

1
2

1 2
2( )

11

1
2

1 2
2( )

2)2

(2

1
( )2
22 =1

Logaritmul funciei de verosimilitate, ( , , ), se obine logaritmnd ecuaia (11.25):

1
( , , ) = (2 2 )
( )2 .
2
2
2
=1

Estimaiile punctuale de verosimilitate maxim se obin din condiia de maxim a ecuaiei


anterioare:

( , , )
1
= 2 ( ) = 0

=1

( , , )

1
=
+
( )2 = 0
2
2
4
)
(
2

{
=1
Rezolvnd acest sistem de ecuaii, obinem:

1
=

=1

1
2 = ( )2

{
=1

(11.26)

Ecuaiile (11.26) reprezint estimaiile punctuale, de verosimilitate maxim, a parametrilor


repartiiei normale.
Se constat c, aceste ecuaii sunt asemntoare celor obinute prin metoda momentelor, cu
diferena c n cazul dispersiei estimatorul, astfel obinut, este deplasat.
Exemplul 11.2
Pe baza datelor de eantionaj:
30, 66, 72, 81, 102, 114,
s se estimeze parametrii repartiiei normale, prin:
Metoda grafic;
Metoda celor mai mici ptrate;
Metoda momentelor;
Metoda verosimilitii maxime.
Soluie:

a. n tabelul de mai jos s-au determinat probabilitile corespunztoare


datelor de eantionaj:

()

1
2
3
4
5
6

30
66
72
81
102
114

(() ) =

0.3

0.109375
0.265625
0.421875
0.578125
0.734375
0.890625

12

+0.4

Reeaua de probabilitate corespunztoare acestor valori este cea din fig.


11.6. Rezult
= 0.50 = 78 i
0.841 0.159 109 47
=
=
= 31.
2
2

()

78

47

109

Reeaua de probabilitate normal pentru exemplu 11.2

Figura 11.6

b. Prin metoda celor mai mici ptrate, se obin:


0.3

()

(() ) = +0.4.

() = 1 [(() )]

1
2
3
4
5
6

30
66
72
81
102
114

0.109375
0.265625
0.421875
0.578125
0.734375
0.890625

-1.230
-0.626
-0.197
0.197
0.626
1.230

-0.1345
-0.1663
-0.0832
0.1139
0.4598
1.0953

465

1.2851

= 77.5
{ = 2.26668
{

= 34.19
= 0.02924
c. Prin metoda momentelor, se obin:
{

= 77.5
.
= 29.54
13

() ()

d. Prin metoda verosimilitii maxime:


= 77.5
{
.
= 26.97

14

Curs 12.

12.3 ESTIMAREA PARAMETRILOR REPARTIIEI NORMALE


12.3.1. INTERVALE DE NCREDERE PENTRU MEDIE
Cazul 1 valoarea dispersiei este cunoscut, 2
Considerm un eantion de volum , prelevat dintr-o populaie normal repartizat:
1 , , ,
cu valoarea parametrului , cunoscut.
n acest caz, estimatorul mediei:

1
= ,

=1

este normal repartizat cu media i dispersia 2 , adic variabila aleatorie:



=
~(, 0,1).

(12.1)

Intervalul de ncredere, [ , ] ce conine valoarea adevrat a parametrului , cu o


probabilitate (1 ), reprezint soluia ecuaiei:
(12.2)
( ) = 1 .
Deci, pe baza relaiei (12.1), ecuaia (12.2), devine:

(
1 ) = 1 .
2
2

Prelucrnd ecuaia anterioar, rezult:


( + 1 ) = 1 ,
2

dar:
= 1 .
2

Intervalul de ncredere, [ , ], bilateral simetric, ce conine valoarea adevrat a


parametrului , cu o probabilitate (1 ), rezult de forma:
[ + ].
2

(12.3)

Intervalul de ncredere, [ , ], unilateral cu o limit inferioar, ce conine valoarea


adevrat a parametrului , cu o probabilitate (1 ), are expresia:
[ + ].

(12.4)

Intervalul de ncredere, [, ], unilateral cu o limit superioar, ce conine valoarea


adevrat a parametrului , cu o probabilitate (1 ), rezult:

[ ].

(12.5)

Exemplul 12.1
S se determine intervalul de ncredere bilateral simetric pentru medie,
cu un nivel de ncredere 95%, folosind urmtoarele date de eantionaj:
29.4, 27.5, 30.5, 32.6, 32.4, 33.5, 25.6, 29.5, 32.2, 27.8,
prelevate dintr-o populaie normal repartizat avnd = 1.6.
Soluie:

= 10

1
301
= = =
= 30.1

10
=1

= 0.05
= 1.96
2

30.1 1.96 1.610 30.1 + 1.96 1.610


29.1 31.1
= 29.1 i = 31.1
Cazul 2 valoarea dispersiei este necunoscut, dar este estimat, 2 , pe baza unui eantion de
volum mare.
Dac volumul de eantion este mare ( 30), atunci variabila aleatorie:

~(, 0,1),

(12.6)

unde:

1
=
( )2 .
1
2

=1

Dac procedm la fel ca n cazul 1, vom obine:

Intervalul de ncredere, [ , ], bilateral simetric, ce conine valoarea adevrat


a parametrului , cu o probabilitate (1 ):
[ + ].
2

Intervalul de ncredere, [ , ], unilateral cu o limit inferioar, ce conine


valoarea adevrat a parametrului , cu o probabilitate (1 ):
[ + ].

(12.7)

(12.8)

Intervalul de ncredere, [, ], unilateral cu o limit superioar, ce conine


valoarea adevrat a parametrului , cu o probabilitate (1 ):
[ ].

(12.9)

Cazul 3 valoarea dispersiei este necunoscut, dar este estimat, 2 , pe baza datelor de
eantionaj.
Considerm un eantion de volum , prelevat dintr-o populaie normal repartizat:
1 , , ,
cu parametrii i necunoscui, atunci variabila aleatorie:

=
,

(12.10)

este repartizat Student .


O variabil aleatorie , este repartizat Student t, cu grade de libertate, dac
funcia densitate de probabilitate este de forma:
+1
+1

2
( 2 )
2
(12.11)
() =

(
+
1)
, pentru < < , > 0.

(2)
n anexa VI, de la finalul crii, tabelul VI.1, se gsesc calculate, pentru diferite
grade de libertate, valorile cuantilelor repartiiei Student t.
Intervalul de ncredere, [ , ] ce conine valoarea adevrat a parametrului , cu
o probabilitate (1 ), reprezint soluia ecuaiei:
( ) = 1 .

(12.12)

Deci, pe baza relaiei (12.10), ecuaia (12.12), devine:


(,1
2

1,1 ) = 1 .
2

Prelucrnd ecuaia anterioar, rezult:


( + ,1 + 1,1 ) = 1 ,
2

deoarece:
,1 = 1,1 .
2

Intervalul de ncredere, [ , ], bilateral simetric, ce conine valoarea adevrat a


parametrului , cu o probabilitate (1 ), rezult de forma:
[ + ,1 + 1,1 ].
2

(12.13)

Intervalul de ncredere, [ , ], unilateral cu o limit inferioar, ce conine valoarea


adevrat a parametrului , cu o probabilitate (1 ), are expresia:
[ + ,1 ].
2

(12.14)

Intervalul de ncredere, [, ], unilateral cu o limit superioar, ce conine


valoarea adevrat a parametrului , cu o probabilitate (1 ), rezult:

[ + 1,1 ].

(12.15)

12.3.2 INTERVALE DE NCREDERE PENTRU DISPERSIE I ABATEREA


STANDARD
Considerm un eantion de volum , prelevat dintr-o populaie normal repartizat:
1 , , ,
cu parametrii i necunoscui, atunci variabila aleatorie:
2 =

( 1) 2
,
2

(12.16)

este repartizat hi-ptrat cu = ( 1) grade de libertate.


Intervalul de ncredere, [2 , 2 ] ce conine valoarea adevrat a parametrului 2 , cu o
probabilitate (1 ), reprezint soluia ecuaiei:
(2 2 2 ) = 1 .

(12.17)

Deci, pe baza relaiei (12.16), ecuaia (12.17), devine:


( 1) 2
2
(2,1
1
) = 1 .

2
,1

2
2
Prelucrnd ecuaia anterioar, rezult:
( 1) 2
( 1) 2
2
( 2

) = 1 .

2
1 2 ,1

2 ,1

Intervalul de ncredere, [2 , 2 ], bilateral simetric, ce conine valoarea adevrat a parametrului


2 , cu o probabilitate (1 ), rezult de forma:
[

( 1) 2
2

( 1) 2
2

1 2 ,1

].

(12.18)

2 ,1

Intervalul de ncredere, [2 , ], unilateral cu o limit inferioar, ce conine valoarea adevrat


a parametrului 2 , cu o probabilitate (1 ), are expresia:
[

( 1) 2
2

2 ].

(12.19)

1 2 ,1

Intervalul de ncredere, [, 2 ], unilateral cu o limit superioar, ce conine valoarea


adevrat a parametrului 2 , cu o probabilitate (1 ), rezult:
[ 2

( 1) 2
2

2 ,1

].

(12.20)

Pentru a determina intervalele de ncredere pentru abaterea standard se utilizeaz relaia care
exist ntre dispersie i abaterea standard:
= 2 .
Rezult:

intervalul de ncredere, [ , ], bilateral simetric, ce conine valoarea adevrat a


parametrului , cu o probabilitate (1 ):
[

( 1) 2
2

1 2 ,1

( 1) 2
2

].

(12.21)

2 ,1

intervalul de ncredere, [ , ], unilateral cu o limit inferioar, ce conine valoarea


adevrat a parametrului , cu o probabilitate (1 ):
( 1) 2
[ 2
].

(12.22)

1 2 ,1

intervalul de ncredere, [, ], unilateral cu o limit superioar, ce conine valoarea


adevrat a parametrului , cu o probabilitate (1 ):
[

( 1) 2
2

].

(12.23)

2 ,1

Exemplul 12.2
S se determine intervalul de ncredere bilateral simetric pentru medie,
dispersie i abaterea standard, cu un nivel de ncredere 90%, folosind
urmtoarele date de eantionaj:
51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1

51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1

51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1

51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1

51.3
59.0
51.8
41.7
56.7
38.1
54.5
47.4
47.1

54.0

54.0

54.0

54.0

54.0

prelevate dintr-o populaie normal repartizat.


Soluie:

= 50.

1
2524.6
= = =
= 50.49

50
=1

1
808.99
= =
( )2 =
= 16.51
1
49
2

=1

1
= =
( )2 = 16.51 = 4.064
1
=1

= 0.10 = 1.64485
2

Pentru medie cazul 2:


50.49 1.64485 4.06450 50.49 + 1.64485 4.06450
49.545 51.435
Pentru medie cazul 3
1,1 = 0.95,49 = 1.6765 i ,1 = 0.05,49 = 1.6765
2

50.49 1.6765 4.06450 50.49 + 1.6765 4.06450


49.526 51.453
Pentru dispersie:
2
2,1 = 0.05,49
= 34.764
2
2
1

,1
2

2
= 0.95,49
= 67.505

49 16.51
49 16.51
2
67.505
34.764
11.984 2 23.271
3.461 4.824

Pentru abaterea standard:

12.4 VERIFICAREA IPOTEZELOR STATISTICE


Ipotez statistic orice ipotez care se face cu privire la parametrii, tipul repartiiei unor
variabile aleatorii sau o supoziie despre modelele probabiliste din care sunt extrase datele
analizate.
Test statistic procedura de verificare a unei ipoteze statistice, respectiv, procedura al crei
obiect este de a decide respingerea sau acceptarea unei ipoteze statistice.
Decizia adoptat rezult din valoarea uneia sau mai multor statistici, adecvate, calculate pe baza
valorilor de eantionaj. Valoarea statisticii fiind supus variaiilor aleatorii, exist riscul de a
lua o decizie eronat.
Se cunosc dou forme de ipoteze statistice:

Ipoteza nul, H0 ipoteza statistic iniial asupra repartiiei populaiei studiate, care
trebuie respins, sau acceptat pe baza rezultatului unui test.

Ipoteza alternativ, H1 ipoteza statistic ce se opune ipotezei nule, H0.

Nivelul de semnificaie (al unui test) valoarea , ce limiteaz probabilitatea de respingere a


unei ipoteze nule, cnd ea este adevrat.

Eroare de genul nti eroarea comis cnd se decide respingerea ipotezei nule, atunci cnd
ipoteza nul este adevrat.
Riscul de genul nti probabilitatea , de a comite eroarea de genul nti:
= (respinge 0 |0 este adevrat)
Eroare de genul al doilea eroarea comis cnd se decide s nu se resping ipoteza nul, atunci
cnd ipoteza nul este fals.
Riscul de genul doi probabilitatea , de a comite eroarea de genul al doilea:
= (accept 0 |0 este fals)
Valori estimate
Valori reale
0
adevrat
0
fals

0
adevrat

0
fals

Decizie corect;
Probabilitatea = 1
Eroare de tip II
Probabilitatea =

Eroare de tip I
Probabilitatea =
Decizie corect;
Probabilitatea = 1

Regula de decizie se exprim, de obicei printr-o inegalitate de forma:



sau

Din punct de vedere practic, pentru a verifica o anumit ipotez statistic, este necesar a fi
parcurse urmtoarele etape:
Stabilirea ipotezelor:
0 i 1
Stabilirea nivelului de
semnificaie:
Se determin regula de
decizie :
| ()
Colectarea datelor de
eantionaj, i specificarea
statisticii:
| ()
Decizia statistic:
Accept 0 ,
sau
Accept 1 .

Verificarea ipotezelor statistice reprezint o operaie matematic strns legat de estimarea cu


interval de ncredere. n general, cunoaterea unui interval de ncredere pentru un parametru al
unei repartiii teoretice ne permite s construim teste de verificare a ipotezelor statistice, vezi
fig. 12.1.
| ()

| ()

| ()

Figura 12.1

Legtura dintre intervalele de ncredere i regiunile critice utilizate la testarea


ipotezelor statistice

Fie (, ) o densitate de probabilitate ce depinde de parametrul necunoscut . S presupunem


c pentru orice valoare 1 a probabilitii exist un interval de ncredere:
(1 , 2 , , , , , ) < (1 , 2 , , , , , ),
astfel nct acesta s respecte ecuaia:

( (1 , 2 , , , , , ) (1 , 2 , , , , , )) = 1 .
S considerm ipoteza nul:
: = 0 .
Atunci, pentru o probabilitate dat, , se poate construi un test statistic, bazat pe o regiune
critic:
(1 , 2 , , , , , 1 ) > 0 ,
sau:
(1 , 2 , , , , , 1 ) < 0 ,
la pragul de semnificaie .
Rezult deci, c putem construi teste de verificare a ipotezelor statistice referitoare la parametrii
repartiiilor statistice utiliznd intervalele de ncredere construite anterior, vezi fig. 6.1.
Modalitatea de calcul a erorii de tip II, , este prezentat n figura 6.2.
Valori estimate:

Valori reale:

| ()

Figura 6.2

Determinarea erorii de tip II,

12.4.1 TEST DE COMPARARE A MEDIILOR DE EANTIONAJ


(CND SE CUNOATE DISPERSIA)
Ipotezele statistice:

ipoteza nul H0: = 0 ;

ipoteza alternativ H1: = 1 ;


Notaii utilizate:
0 reprezint media de referin;
reprezint nivelul de semnificaie al testului;
; 1 reprezint valorile cuantilelor repartiiei normale normate;
reprezint volumul eantionului;
1

= =1 reprezint media de eantionaj;


0 reprezint valoarea abaterii medii ptratice a populaiei de baz din care s-a
prelevat eantionul.
Decizia statistic:
Ipotezele alternative
H1: = 1 ,
unde:

Se respinge H0 dac:
| 0 | >

12

0
< 0 +

0
> 0 +
1

1 0
1 < 0
1 > 0

Exemplul 12.3
S se testeze, cu un nivel de semnificaie = 5%, ipoteza, H0: = 50,
cu altenativa H1: 50, dac prin prelevarea unui eantion de volum = 25
s-au obinut n urma prelucrrii datelor de eantionaj 1 = 51.3. Se cunoate,
de asemenea, abaterea standard a populaiei, 0 = 2.
Soluie:

H0: = 50 i H1: 50.


0 = 50 1 = 51.3 i = 25
1 = 95%

2 = 0.025% i 1 2 = 0.975.

12 = 1.96 i 2 = 1.96
0
0
0 +
2 > > 0 +
12 49.216 > = 51.3 > 50.784

Se respinge H0.

10

12.4.2 TEST DE COMPARARE A MEDIILOR DE EANTIONAJ


(CND NU SE CUNOATE DISPERSIA)
Ipotezele statistice:

ipoteza nul H0: = 0 ;


ipoteza alternativ H1: = 1 ;
Notaii utilizate:
0 reprezint media de referin;
reprezint nivelul de semnificaie al testului;
, ; 1, reprezint valorile cuantilei repartiiei Student t;

= 1 reprezint numrul gradelor de libertate;


reprezint volumul eantionului;
1

= =1 reprezint media de eantionaj;


1

2 = 1 =1( )2 reprezint estimaia dispersiei pentru populaia din care sa prelevat eantionul.
Decizia statistic:
Ipotezele alternative
H1: = 1 ,
unde:

Se respinge H0 dac:
| 0 | >

12,1

< 0
,1

< 0 +
1,1

1 0
1 < 0
1 > 0

Exemplul 12.4
S se testeze, cu un nivel de semnificaie = 10%, ipoteza, H0: = 25,
cu alternativa H1: < 25, dac prin prelevarea unui eantion de volum = 36
s-au obinut n urma prelucrrii datelor de eantionaj 1 = 25.7 = 3.
Soluie:

H0: = 25 i H1: < 25.


0 = 25 i 1 = 24.6 i = 36.
= 10% , = 1.306
< 0

,1 = 25.7 > 25.653

Se accept H0.

11

12.4.3 TEST DE COMPARARE A DISPERSIEI UNEI POPULAII NORMALE


Ipotezele statistice:

ipoteza nul H0: 2 = 02 ;


ipoteza alternativ H1: 2 = 12 ;
Notaii utilizate:
reprezint nivelul de semnificaie al testului;
02 reprezint dispersia de referin;
2
2
1
2, ; 2, reprezint valorile repartiiei Hi-ptrat;

= 1 reprezint numrul gradelor de libertate;


reprezint volumul eantionului;
1

2 = 1 =1( )2 reprezint estimaia dispersiei pentru populaia din care sa prelevat eantionul.
Decizia statistic:
Ipotezele alternative
H1: 2 = 12 ,
unde:

Se respinge H0 dac:

12 02

( 1) 2
< 22,1
02
( 1) 2
2
> 1
2,1
02
( 1) 2
2
> 1,1
2
0
( 1) 2
2
< ,1
02

12 > 02
12 < 02

Exemplul 12.5
S se testeze, cu un nivel de semnificaie = 0.05%, ipoteza, H0: = 3,
cu alternativa H1: > 3, dac prin prelevarea unui eantion de volum = 46
s-au obinut n urma prelucrrii datelor de eantionaj 1 = 25 = 3.15.
Soluie:

H0: = 3 i H1: > 3.


2
1 = 95% 1,1
= 1.306

( 1) 2
2
> 1,1
49.6125 < 61.6562
02
Se accept H0.

12

S-ar putea să vă placă și