Sunteți pe pagina 1din 558

Cristin – Olimpiu MORARIU

STATISTICĂ
APLICATĂ
2014
STATISTICĂ
APLICATĂ

dr. ing. Cristin Olimpiu MORARIU,


Departamentul Ingineria fabricației,
Facultatea de Inginerie tehnologică și management industrial,
Universitatea Transilvania din Brașov

Universitatea TRANSILVANIA din Brașov

2014
Introducere

Etimologic, statistica își are rădăcina în cuvântul latinesc status care înseamnă situație,
stare sociala, dar și stat. Analizând în sinteză retrospectivă, procesul evolutiv al dezvoltării
statisticii, se conturează distinct următoarele etape: evidența statistică  statistica descriptivă
 aritmetica politică  statistica modernă. Deci, statistica reprezintă o ramură a matematicii
care, folosind calculul probabilităților, elaborează noțiunile și metodele specifice studiului
cantitativ al colectivităților și al fenomenelor de masă.
Folosirea metodelor statistico-matematice ca instrumente practice de investigare și de
analiză socio-economică și mai ales orientarea cercetărilor statistice spre descoperirea
legităților care guvernează variabilitatea fenomenelor social-economice de masă, au conferit
statisticii caracterul său științific.
Teoria probabilităților și statistica furnizează, astăzi, unul dintre cele mai importante
instrumente de cunoaștere umană. Putem afirma, fără să greșim, că aproape că nu există
domeniu de activitate cu care să nu aibă un contact nemijlocit: fizica, chimia, biologia, geologia,
medicina, economia, sociologia, ingineria, analiza operațională, teoria informației, teoria
jocurilor, teoria așteptării, controlul statistic al proceselor și fiabilitatea.
De aceea, cursul intitulat Statistică aplicată a fost structurat pornind de la considerațiile
prezentate anterior și conține două părți:
I. Prima parte este dedicată studiului principalelor noțiuni și relații de calcul utilizate la
calculul probabilităților.
Teoria probabilităților reprezintă studiul matematic al fenomenelor caracterizate de
incertitudine și de întâmplare. Ea își are originea în anul 1654 când doi celebri
matematicieni francezi, Blaise Pascal (1623÷1662) și Pierre de Fermat (1601÷1665), au
purtat o lungă corespondență încercând să rezolve două probleme legate de jocurile cu
zaruri, foarte la modă în acea perioadă. Antoine Gombaud, Chevalier de Méré un nobil
francez, împătimit al jocurilor de noroc, îi cere ajutorul lui Pascal în încercarea lui de a
rezolva o serie de contradicții aparente cu privire la popularul joc de zaruri.
Jocul constă în aruncare unei perechi de zaruri de 24 de ori. Prima problemă, formulată
de Antoine Gombaud, a fost de a decide dacă este rentabil să parieze o sumă de bani pe
reușita obținerii a cel puțin unei "duble de șase" în timpul celor 24 de aruncări. O regulă
a jocurilor de noroc, aparent bine stabilită, în acea perioadă, la condus de Méré să creadă
că un astfel de pariu ar fi profitabil, dar calculele lui Pascal au indicat exact opusul.
O partidă de zaruri, inclusiv miza pusă în joc, era însușită de jucătorul care câștigă un
număr 𝑛 de jocuri. Ce-a de-a doua problemă s-a referit la modalitatea de a împărți cât
mai corect miza (între cei doi jucători), dacă din motive de forță majoră jocul trebuie
întrerupt la un scor intermediar.

1
Aceste probleme formulate de Antoine Gombaud au condus la o dispută între Pascal și
Fermat, în urma căreia principiile fundamentale ale teoriei probabilității au fost
formulate pentru prima dată.
Metoda matematică dezvoltată, cu prilejul rezolvării acestor două probleme, este
cunoscută în cadrul teoriei probabilităților sub denumirea de abordarea clasică a calcului
probabilităților și presupune, în cazul unui joc cu 𝑛 rezultate echiprobabile, din care 𝑚
rezultate sunt câștigătoare, probabilitatea de a câștiga este 𝑚/𝑛.
Trebuie menționat, de asemenea, că încă din secolele XV și XVI unii matematicieni
italieni (Fra Luca Bartolomeo de Pacioli, 1447÷1517 și Girolamo Cardano, 1501÷1576)
au rezolvat câteva probleme speciale privind jocurile de noroc, însă nici o teorie
generală nu a fost elaborată înainte de această faimoasă corespondență.
Christian Huygens (1629÷1695), om de știință olandez și profesor la Leibniz, fiind la
curent cu această corespondență, publică la scurt timp după aceea (în 1657) prima
lucrare despre calculul probabilităților, intitulată De Ratiociniis în Ludo Aleae. Aceasta
reprezintă un tratat privind problemele asociate jocurilor de noroc.
Datorită interesului deosebit acordat jocurilor de noroc, teoria probabilității devine în
curând foarte populară și subiectul este dezvoltat rapid în secolul al XVIII-lea,
contribuții majore în această perioadă au adus Jakob Bernoulli (1654÷1705) și Abraham
de Moivre (1667÷1754).
O altă metodă de abordare a calculului probabilităților, cunoscută sub denumirea de
metoda frecvențelor este de asemenea utilizată în această perioadă. Metoda constă în
repetarea unui joc de un număr mare de ori, în aceleași condiții. Probabilitatea de a
câștiga este aproximativ egală cu raportul dintre numărul de victorii și numărul de
repetări. Această metodă a fost folosită și de Pascal și Fermat pentru a verifica
rezultatele obținute prin metoda clasică. Jakob Bernoulli, în lucrarea sa Ars Conjectandi
(publicată postum în 1713), demonstrează că cele două metode conduc spre aceleași
rezultate.
În 1812, Pierre de Laplace (1749-1827) a introdus o serie de noi idei și tehnici
matematice în cartea sa, Theorie des Analytique Probabilités. Dacă înainte de Laplace,
teoria probabilităților s-a preocupat exclusiv de analiza din punct de vedere matematic
a jocurilor de noroc, această lucrare deschide noi orizonturi și subiecte de analiză prin
abordarea unor probleme științifice și practice.
Cu toate acestea, urmează o perioadă de stagnare a dezvoltării calcului probabilităților
și începând cu anul 1850, mulți matematicieni găsesc metoda clasică nerealistă pentru
uzul general și încercă să redefinească noțiunea de probabilitate prin prisma metodei de
frecvențelor.

2
Teoria de erorilor și mecanica statistică sunt exemple ale unora dintre aplicațiile
importante ale teoriei probabilităților dezvoltate în secolul al XIX-lea.
Ca în multe alte ramuri ale matematicii, dezvoltarea teoriei probabilităților a fost
stimulată de varietatea de aplicații ale sale. Fiecare pas realizat în această teorie a extins
și mai mult sfera de aplicare. Astfel, statistica matematică este o ramură importantă a
probabilității aplicate; alte aplicații apar în domenii foarte diferite cum ar fi: genetica,
psihologia, economia și ingineria.
Mulți oameni de știință și-au adus contribuția la dezvoltarea teoriei publicate de
Laplace, printre cei mai importanți putem să-i amintim pe Cebîșev, Markov, Hincin,
von Mises și Kolmogorov.
Una dintre dificultățile majore în dezvoltarea unei teorii matematice a probabilităților,
a fost aceea de a formula o definiție a probabilității suficient de precisă pentru a fi
utilizată în matematică, dar și suficient de cuprinzătoare pentru a fi aplicabilă unei game
largi de fenomene.
Căutarea unei definiții larg acceptate a durat aproape trei secole și a fost marcată de
multe controverse. Problema a fost rezolvată în cele din urmă în secolul XX prin tratarea
teoriei probabilităților pe o bază axiomatică. Această abordare modernă a calculului
probabilităților, încadrată într-un domeniu mult mai larg al matematicii, teoria măsurii,
a apărut în anul 1933, în monografia matematicianului rus Andrey Kolmogorov
(1903÷1987), Grundbegriffe der Wahrscheinlichkeitsrechnun.
Unitățile de învățare dedicate acestei prime părți conțin principalele noțiuni și relații de
calcul utilizate la calculul probabilităților și sunt structurate conform figurii 1.
II. Cea de-a doua parte este dedicată studiului principalelor tehnici și instrumente utilizate
la analiza statistică modernă.
Astăzi termenul statistica a intrat în limbajul universal al științei și al vieții cotidiene. În
decursul timpului, această noțiune a căpătat mai multe accepțiuni, care desemnează
diverse ipostaze parcurse de la simple descrieri și înregistrări până la statistica modernă,
instrument indispensabil în procesul de conducere al oricare domeniu specific activității
umane.
Procesul de conturare a statisticii, în accepțiunea de astăzi, a fost marcat de parcurgerea
mai multor etape semnificative, [TAR 98], [CSI 11], [HIS 11]:
a. Etapa prestatistică, coincide cu apariția primelor forme de evidență statistică și
datează încă din antichitate. Această etapă se caracterizează, în esență, prin aceea
că datele statistice servesc pentru informarea organismelor statului despre nivelul,
sau stadiul atins la un moment dat de fenomenele social-economice subordonate, în
special unor scopuri fiscale, demografice, militare sau administrative. Exemplele
cele mai cunoscute de evidențe statistice, din această perioadă, sunt: inventarierea

3
aurului și pământului la egipteni, recensămintele populației la sumerieni și romani,
recensămintele producțiilor agricole la chinezi, stabilirea impozitelor la greci, sau
tabelele de la Roma privind evidența populației, producției și consumului.

Experienţă -
Experiment
𝑒𝑖

𝑨
Probe

Evenimente elementare,
𝑒𝑖

 Evenimente compatibile;
Spaţiul de eşantionaj, 𝑆  Evenimente incompatibile;
 Evenimente compuse - evenimente;
 Evenimentul sigur, ;
 Evenimentul imposibil, ;
Tipuri de  Evenimente independente;
evenimente, 𝐴  Evenimente dependente.

 Definiţia empirică;
Elemente de algebra  Definiţia clasică;
 Definiţia statistică;
mulțimilor  Opinia unui expert;
 Definiţia geometrică; Modele de repartiții a
 Definiţia axiomatică -
variabilelor aleatorii
Kolmogorov.
Definiția
probabilităților
Elemente de analiză
combinatorie: Valori numerice ale
 Permutări;
 Aranjamente;
variabilelor aleatorii
Probabilitate
condiționată  Combinări.

 Regula de înmulțire a Funcția de


Variabile aleatorii:
probabilităților; Funcția de probabilitate;
 Formula probabilității totale;  Discrete; Funcția densitate
 Continue.
repartiție
 Teorema lui Bayes. de probabilitate.

Figura 1. Structura primei părți a cursului Statistică aplicată

Începând cu secolul XIII, datele statistice devin din ce în ce mai numeroase. Odată
cu dezvoltarea meșteșugurilor și a comerțului, are loc o primă scindare a
informațiilor: cele culese pentru a fi puse la dispoziția conducerii statului și cele
ținute în interesul negustorilor comercianților privați cu ajutorul contabilității.

4
Astfel, negustorii din Veneția colectau date despre comerțul exterior, pentru a putea
să evalueze riscurile transportului maritim.
În secolul al XVI-lea apar primele evidențe ale nașterilor înregistrate în Franța și
mai apoi registrele de căsătorii și nașteri din Anglia. Aceste înregistrări erau
realizate de către preoți. Totuși, progrese fundamentale înregistrate de statistică vor
apare în secolul al XVII-lea.
b. Statistica descriptivă. Această etapă s-a dezvoltat în secolele XVI ÷ XVIII când, în
Germania, s-a constituit o adevărată școală cunoscută sub denumirea de școala
descriptivă germană. Descrierea statului a devenit, în această perioadă, disciplină
de predare academică, încadrată într-un sistem construit după norme teoretice și
practice, cu accent pus pe dezvoltarea mijloacelor de investigare a fenomenelor
sociale si economice, precum și pe mijloacele de informare a organismelor statale.
Statistica descriptivă a fost continuu îmbogățită, restructurată și perfecționată,
punându-se din ce în ce mai mult accent pe determinările numerice și pe limbajul
cifric. Progresele statisticii descriptive sunt în mare măsură legate de introducerea
noțiunii de coordonate, în geometrie, de către Descartes în anul 1637.
Trăsăturile esențiale ale statisticii descriptive sunt definite de caracterul său analitic;
sunt prezentate descrieri complexe ale statelor, sunt efectuate analize comparative
ale diferitelor situații socio-economice. Toate erau însă orientate în scopuri
informaționale. Deci, nici statistica descriptivă, cu toate că școala germană o
ridicase la rangul de știință, nu avea drept scop descoperirea și cunoașterea
legităților statistice.
Cu toate acestea, statistica descriptivă constituie o realizare de seamă a domeniului,
fiind o etapă foarte bine conturată și integrată în procesul îndelungat al dezvoltării
statisticii ca știință.
În Țările Române, prima și cea mai reprezentativă lucrare de acest gen este
Descriptio antiqui et hodierni status Moldaviae, elaborată de Dimitrie Cantemir - o
expunere monografică pe plan geografic, politic, economic, social și cultural.
Lucrarea l-a impus pe autor atenției contemporanilor, care l-au considerat printre
fruntașii statisticii descriptive europene.
c. Aritmetica politică. În timp ce în Germania, statistica se constituise ca disciplină
descriptivă a statului, în Anglia se năștea, în afara universităților, o statistică cu totul
deosebită, cunoscută sub numele de aritmetica politică. Caracteristic aritmeticii
politice îi este faptul că pentru prima oară analiza datelor înregistrate se face prin
procedee matematice, urmărindu-se desprinderea regularităților care domină
schimbările esențiale de ordin calitativ în structura și dezvoltarea raporturilor dintre
fenomenele social-economice. Folosirea metodei analitice, utilizarea unor
instrumente matematice, precum și căutarea legităților care guvernează fenomenele
social-economice marchează un substanțial progres, al statisticii, prefigurând
apariția elementelor statisticii moderne. Acest salt calitativ în dezvoltarea statisticii
se datorează și faptului că în această perioadă calculul probabilităților începe să se
contureze ca o teorie matematică de sine stătătoare, iar diverse elemente, ale ei, sunt
preluate și utilizate în statistică.

5
Reprezentanții aritmeticii politice din Anglia în frunte cu John Graunt (1620 ÷
1674), William Petty (1623 ÷ 1687) și Edmuad Halley (1656 ÷ 1742) au pus accent,
mai ales, pe studiul și descoperirea legităților fenomenelor demografice: creșterea
numărului populației, ale echilibrului numeric dintre sexe, ale fertilității,
mortalității, durata probabilă a vieții, calculul rentei viagere anuale în funcție de
vârstă și evaluarea posibilităților comerciale și maritime ale Angliei.
d. Statistica inferențială. Descoperirile din domeniul calculului probabilităților și
introducerea lor treptată, în statistică, au determinat o cotitură radicală în conturarea
și dezvoltarea statisticii ca știință. Astfel, în secolul al XIX-lea și în prima jumătate
a secolului XX constatăm utilizarea metodelor matematice, mai ales a teoriei
probabilităților, pentru investigarea fenomenelor de masă.
Primele încercări de valorificare a noilor descoperiri, în analiza statistică a
fenomenelor economice și sociale, au fost făcute de Jacob Bernoulli (1654 ÷ 1705),
profesor de matematică la Universitatea din Basel și mai ales de Pierre-Simon
Laplace (1749 ÷ 1827), matematician, fizician și astronom francez, care a efectuat
în Franța, în 1801, un recensământ pe bază de eșantionaj, calculând și coeficientul
de eroare. Bernoulli a formulat legea numerelor mari folosită mai târziu ca
fundament teoretic al sondajelor statistice.
Karl Friedrich Gauss (1775 ÷ 1855), matematician, fizician și astronom german,
propune metoda celor mai mici pătrate, publicând o serie de considerații privind
aplicarea matematicii în investigarea fenomenelor demografice.
Contribuții de seamă la dezvoltarea statisticii matematice au avut Moivre, Fourier
și Poisson. Cel care a dominat, ca statistician, epoca sa a fost Lambert Adolphe
Jacques Quetelet (1796 ÷ 1874), matematician, statistician și astronom belgian. Prin
contribuțiile sale, a produs o nouă cotitură în evoluția statisticii, fiind considerat
fondatorul statisticii moderne. Elementele esențiale care au revoluționat substanțial
gândirea statistică sunt concretizate în utilizarea noțiunilor: medie, dispersie,
repartiție, observare de masă, regularitate.
În secolul XIX, o remarcabilă contribuție la progresul statisticii au avut și alte școli
naționale:
 Statistica rusă a fost reprezentată de D. P. Juravski — după care statistica este
o știință materială, având ca obiect studiul vieții sociale și în același timp, o
știință metodologică. Contribuții de seamă au avut P. L. Cebîşev (1821 ÷ 1894)
şi A. A. Markov (1866 ÷ 1922).
 Reprezentanții statisticii românești au avut contribuții valoroase la promovarea
statisticii atât pe plan teoretic, cât și pe linia instituționalizării ei. Principalii
precursori fiind: Ion Ionescu de la Brad (1818 ÷ 1891), agronom, economist și
statistician și Dionisie Pop Marțian (1829 ÷ 1865), economist și statistician.
Astfel, statistica înregistrează o nouă etapă a evoluției sale, prin extinderea și
perfecționarea metodelor specifice de investigare, prin introducerea pe scară largă a
instrumentului matematic al teoriei probabilităților, în prelucrarea și analiza statistică a
datelor, prin orientarea gândirii statistice spre interpretarea analitică a fenomenelor de
masă și obținerea de concluzii inductive. În aceste condiții, statistica începe să fie

6
folosită nu doar pentru studierea trecutului și prezentului, ci și pentru elaborarea unor
ipoteze asupra modului în care se vor comporta, în viitor, aceleași fenomene.
Noile metode introduse în analiza statistică au fost elaborate, în mare parte, de școala
anglo-saxonă de statistică matematică, fondată de F. Galton (1822 ÷ 1911) și K. Pearson
(1857 ÷ 1936) și continuată de R. A. Fisher (1890 ÷ 1962), F. Y. Edgeworth (1845 ÷
1926), G. U. Yule (1871 ÷ 1951), M. G. Kendall (1907 ÷ 1983). Contribuțiile lor sunt
hotărâtoare pentru constituirea statisticii moderne, fiind dezvoltate capitole de bază ca:
analiza dispersională, teoria estimației, calculul corelaţiilor, verificarea ipotezelor,
teoria eșantionajului. Sub impulsul școlii create de Pearson și Fischer, statistica a făcut
progrese remarcabile găsindu-și fundamentări foarte precise, ca disciplină ştiinţifică, în
toate țările lumii.
Analizând procesul evolutiv, al dezvoltării statisticii, se constată că trecerea de la o etapă
la alta nu a avut loc prin negarea a tot ceea ce s-a câștigat până la un moment dat, ci printr-o
perfecționare continuă a metodelor de culegere, prelucrare și analiză a datelor, printr-o
extindere și diversificare continuă a posibilităților de valorificare a informațiilor statistice.
Scopul statisticii este acela de dezvolta și aplica metodologiile de obținere a unor
informații utile pornind de la serii de date colectate, sau de la efectuarea unor experimente.
Aceste activități presupun colectarea sistematică a datelor, prelucrarea, sistematizarea,
sintetizarea, reprezentarea lor precum și analiza acestora. În plus, un rol important în analiza
datelor îl au raționamentul statistic și inferența statistică. Aceste activități majore implică:
proiectarea experimentelor și a metodelor de eșantionaj; modelarea stocastică a fenomenelor;
prognoze bazate pe modele adecvate; dezvoltarea teoriei statistice și aplicarea de noi metode.
Deci, analiza statistică modernă a datelor poate fi divizată în două categorii:
 Statistica descriptivă se ocupă cu explorarea, vizualizarea și rezumarea datelor
statistice, dar fără asocierea lor cu un model statistic. Cu toate acestea, ea reprezintă o
etapă foarte importantă a analizei datelor care poate pune în evidență multe caracteristici
interesante ale fenomenului analizat.
 Statistica inferențială este următoarea etapă în analiza datelor și în procesul de luare a
deciziilor. Ea presupune identificarea unui model statistic adecvat, prin: estimarea
parametrilor modelului; validarea ipotezelor statistice; analiza dispersională; regresie și
corelație; previziune statistică; controlul aplicării deciziilor și verificarea rezultatelor.
Statistica inferențială face deci, trecerea de la statistica descriptivă a unui eșantion, la
descrierea statistică a întregii populații a fenomenului respectiv.
În funcție de domeniul de cercetare aceste fenomene de tip colectiv prezintă anumite
particularități care conduc la diferențierea metodelor de cercetare. Astfel, statistica poate fi
clasificată în:
 Statistica matematică sau statistica teoretică, cea care are ca obiect de studiu
dezvoltarea procedeelor și metodelor de abordare și analiză statistică a fenomenelor
de masă;
 Statistica aplicată sau statistica de ramură, prin care se face particularizarea și
adaptarea procedeelor sau metodelor la specificul domeniului cercetat (statistică
economică, statistică demografică, statistică industrială etc.)
Structura părții a doua a cursului Statistică aplicată este prezentată în figura 2.

7
Indivizi Populaţie Eşantion
Inferenţă
reprezentativ
statistică

Eşantionaj

Eşantionaj

Eşantion

Statistica Statistica
descriptivă Inferenţială

Estimarea parametrilor  Punctuală;


Tehnici şi metode de  Cu interval de
repartiţiilor statistice încredere.
reprezentate a datelor
Verificarea caracterului
aleatoriu
Calculul şi reprezentatea
histogramei Eliminarea valorilor
aberante
Verificarea ipotezelor
statistice Teste de concordanţă
Repartiţia empirică a datelor
de eşantionaj
Verificarea ipotezelor
statistice referitoare la:
 Parametrii
repartiţiei;
Calculul valorilor tipice de  Indicatorii statistici.
eşantionaj Regresie şi corelaţie

Figura 2. Structura părții a doua a cursului Statistică aplicată

Obiectivele cursului
Efectuarea de calcule, demonstrații și aplicații pentru rezolvarea de sarcini
specifice ingineriei și managementului, utilizând cunoștințele specifice statisticii

8
descriptive și/sau inferențiale și prin utilizarea tehnicilor și instrumentelor
software adecvate.

Competențe conferite
După parcurgerea materialului studentul va fi capabil să:
 Definească principiile, teoremele și metodele de bază ale calculul
probabilităților și ale statisticii aplicate;
 Utilizeze cunoștințele, din teoria probabilităților și statistică, pentru
explicarea și interpretarea unor rezultate teoretice, a unor teoreme, fenomene
sau procese de masă specifice domeniului;
 Utilizeze adecvat tehnici, metode și instrumente de evaluare standard, pentru
analiza și aprecierea calitativă și cantitativă a unor fenomene și procese
aleatorii, precum și pentru prelucrarea și interpretarea rezultatelor
caracteristice domeniului;
 Elaboreze de modele și proiecte profesionale prin selectarea și utilizarea
unor principii, metode și soluții consacrate din teoria probabilităților și
statistica aplicată.

Resurse şi mijloace de lucru


Metoda pedagogică recomandată pentru parcurgerea cursului este studiul
individual al aspectelor teoretice și rezolvarea problemelor propuse;
Pentru rezolvarea aplicațiilor specifice statisticii, deoarece manopera este
destul de mare se recomandă utilizarea pachetului software Microsoft Excel, parte
componentă a aplicației Microsoft Office 2010 sau 2013, vezi Anexa I.

Structura cursului
Cursul Statistică aplicată este compus din 12 UI.
De asemenea, sunt prevăzute două teme de control. Prima temă de control este
alcătuită din 50% din problemele propuse la finalul UI 1÷4, în testele de
autoevaluare. Cea de-a doua temă de control este alcătuită din 50% din problemele
propuse la finalul UI 5÷8, în testele de autoevaluare.
Transmiterea temelor de control, către cadrul didactic, se va realiza prin
încărcarea aplicațiilor pe platforma eLearning.

9
Pentru evaluarea cunoștințelor asimilate, pe lângă examen, sunt prevăzute două
evaluări pe parcurs, sub formă de teste grilă, alcătuite din 10 întrebări. Primul test
este prevăzut după parcurgerea UI 1÷4, iar cel de-al doilea după parcurgerea UI
5÷8.

Cerinţe preliminare
Disciplinele necesare a fi parcurse în vederea asimilării materialului
aferent acestui curs sunt: algebra (mulțimi, algebra mulțimilor, combinatorică) și
analiza matematică.
Discipline deservite
Discipline din planul de învățământ care se dezvoltă pe baza cunoștințelor
dobândite în cadrul disciplinei curente sunt: Toleranțe și control tehnic,
Economia firmei, Ingineria calității, Fiabilitate și mentenanță.

Durata medie de studiu individual


Durata de studiu individual al fiecărei UI este de 2÷3 ore și este prezentată
la începutul fiecărei UI. Durata medie de studiu individual este de circa 32 de ore.

Evaluarea
– ponderea evaluării finale este de 40%;
– ponderea evaluărilor pe parcurs este de 30%;
– ponderea temelor de control este de 20%;
– ponderea prezenței este de 10%.

10
Principalele notații și simboluri

ELEMENTE DE TEORIA MULŢIMILOR 𝐹(𝑥), 𝐹𝑋 (𝑥) - Funcţia de repartiţie a


variabilei aleatorii 𝑋
𝑎∈𝐴 - Elementul 𝑎 aparţine
mulţimii 𝐴 𝐹(𝑥, 𝑦) - Funcția de repartiţie
bidimensională
𝐴∪𝐵 - Reuniunea mulțimilor 𝐴 şi
𝐵 𝐹(𝑥, 𝑦, 𝑧, … ) - Funcţia de repartiţie
multidimensională
𝐴∩𝐵 - Intersecția mulțimilor 𝐴 şi 𝐵
𝑝𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛 - Funcţia de probabilitate;
𝐴\𝐵 - Diferența mulțimilor 𝐴 şi 𝐵 funcţia de masă a
ℳ - Mulțimea totală, sau probabilităţii
mulțimea de referință 𝑓(𝑥), 𝑓𝑋 (𝑥) - Funcţia densitate de
𝐴⊂𝐵 - Mulțimea 𝐴 inclusă în probabilitate a variabilei
mulţimea 𝐵 aleatorii 𝑋
𝒫(ℳ) - Mulțimea pârților mulțimii 𝑓(𝑥, 𝑦) - Funcţia densitate de
de referință probabilitate bidimensională
ELEMENTE DE COMBINATORICĂ 𝑓(𝑥, 𝑦, 𝑧, … ) - Funcţia densitate de
probabilitate
𝑛! - Permutări de 𝑛 obiecte; multidimensională
factorial de 𝑛
𝐶𝑂𝑉(𝑋, 𝑌) - Covarianța variabilelor
𝐴𝑘𝑛 - Aranjamente de 𝑛 obiecte aleatorii 𝑋 şi 𝑌
luate câte 𝑘
𝜇 = 𝐸(𝑋) - Media unei variabile
𝐴𝑟𝑛𝑘 - Aranjamente cu repetiție de aleatorii, sau a unei repartiții
𝑛 obiecte luate câte 𝑘 de probabilitate; speranța
𝐶𝑛𝑘 - Combinări de 𝑛 obiecte matematică; valoarea medie
luate câte 𝑘 teoretică
𝐶𝑟𝑛𝑘 - Combinări cu repetiție de 𝑛 𝜎 2 = 𝑉(𝑋) - Dispersia unei variabile
obiecte luate câte 𝑘 aleatorii, sau a unei repartiții
de probabilitate; varianța
ELEMENTE DE TEORIA
𝜎 = √𝑉(𝑋) - Abaterea standard a unei
PROBABILITĂŢILOR
variabile aleatorii, sau a
̅̅̅̅̅
𝐸𝑖 , 𝑖 = 1, 𝑛 - Evenimente elementare unei repartiții de
probabilitate; abaterea
𝐴, 𝐵, 𝐶 - Evenimente medie pătratică
Ω - Evenimentul sigur
𝐶𝑣 = 𝜎⁄𝜇 - Coeficientul de variație
Φ - Evenimentul imposibil 𝜇𝑞 = 𝐸(𝑋 𝑞)
- Momentul de ordinul 𝑞;
𝑃𝑟(𝐴); 𝑝(𝐴) - Probabilitatea momentul de ordinul 𝑞 în
evenimentului 𝐴 raport cu originea
𝐴∩𝐵 =Φ - 𝐴 şi 𝐵 evenimente 𝜇𝑞′ = 𝐸[(𝑋 − 𝜇)𝑞 ] - Momentul centrat de ordinul
incompatibile 𝑞
𝐴̅, 𝐶Ω 𝐴 - Evenimentul complementar 𝑥𝑝 - Cuantila de ordinul 𝑝 a
lui 𝐴 variabilei aleatorii 𝑋
𝑃𝑟(𝐴|𝐵) - Probabilitatea 𝑀𝑒 - Mediana unei variabilei
evenimentului 𝐴 condiţionat aleatorii
de 𝐵 𝑀𝑜 - Mod; moda unei variabile
𝑋, 𝑌, 𝑍 - Variabile aleatorii aleatorii
𝑥, 𝑦, 𝑧 - Valorile variabilelor
aleatorii 𝑋, 𝑌, 𝑍

11
REPARTIŢII STATISTICE 𝑓𝑖 - Frecvența relativă

ℬ(𝑥, 𝑝, 𝑛) - Repartiția binomială 𝑁𝑖 - Frecvența absolută

ℋ(𝑥, 𝑘, 𝑛, 𝑁) - Repartiția hipergeometrică 𝑓𝑖′ - Frecvența relativă cumulată

𝒫(𝑥, 𝜆) - Repartiția Poisson 𝑁𝑖′ - Frecvența absolută cumulată

𝒩(𝑥, 𝜇, 𝜎) - Repartiția normală; 𝑚, 𝑥̅ - Media de eșantionaj


2
repartiția Gauss-Laplace 𝑠 - Dispersia de eșantionaj
Φ(𝑧) - Funcția integrală Laplace 𝑠 - Abaterea medie pătratică de
𝒩(𝑥, 0,1) - Repartiția normală standard; eșantionaj
repartiția Gauss – Laplace 𝑚𝑞 - Momentul de eșantionaj de
normată ordinal 𝑞 în raport cu
ℒ𝓃(𝑥, 𝜇, 𝜎) - Repartiția log - normală originea

𝒰𝑐(𝑥, 𝑎, 𝑏) - Repartiția uniformă 𝑚𝑞′ - Momentul centrat de ordinal


continuă; repartiția 𝑞 de eșantionaj
dreptunghiulară 𝛼3 - Coeficientul de asimetrie
2 2
𝜒 (𝑥, 𝜈) - Repartiția hi – pătrat, 𝜒 𝛼4 - Coeficientul de boltire
𝓉(𝑡, 𝜈) - Repartiția 𝑡; repartiţia 𝛼 - Nivel de semnificație, riscul
Student de tip I
ℱ(𝑓, 𝜈1 , 𝜈2 ) - Repartiția 𝐹; repartiţia 1−𝛼 - Nivelul de încredere
Fisher - Snedecor 𝛽 - Riscul de tip II
ELEMENTE DE STATISTICĂ 𝜐 - Numărul gradelor de
libertate
𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛 - Valorile observate (de
eșantionaj) ale variabilei ℒ(… ) - Funcția de verosimilitate
aleatorii 𝜃 - Parametrul de estimat
𝑛 - Volumul (efectivul) 𝜃̂ - Valoarea estimată a
eșantionului parametrului 𝜃
𝑅 - Amplitudinea eșantionului 𝐹𝑛 (𝑡𝑖 ) - Funcția empirică de
𝑘 - Numărul de clase repartiție
𝑤 - Amplitudinea clasei

12
Cuprins

Introducere ................................................................................................................................. 1
Principalele notații și simboluri ............................................................................................... 11
Chestionar evaluare prerechizite ............................................................................................. 17
Unitatea de învățare 1. ............................................................................................................. 19
1.1. Introducere ............................................................................................................. 19
1.2. Competențe ............................................................................................................ 19
1.3. Spațiul de eșantionaj .............................................................................................. 19
1.4. Evenimente ............................................................................................................. 23
1.5. Elemente de combinatorică.................................................................................... 27
1.5.1. Permutări ................................................................................................................ 29
1.5.2. Aranjamente ............................................................................................................ 30
1.5.3. Combinări............................................................................................................... 32
1.6. Rezumat ................................................................................................................. 34
1.7. Test de autoevaluare.............................................................................................. 34
Unitatea de învățare 2. ............................................................................................................. 37
2.1. Introducere ............................................................................................................. 37
2.2. Competențe ............................................................................................................ 37
2.3. Probabilități ........................................................................................................... 37
2.3.1. Definiția clasică a probabilității............................................................................ 38
2.3.2. Definiția statistică a probabilității......................................................................... 39
2.3.3. Definiția geometrică a probabilității...................................................................... 42
2.3.4. Definiția axiomatică a probabilităților .................................................................. 44
2.3.4.1. Sistemul de axiome al lui Kolmogorov ..................................................... 45
2.3.4.2. Consecințele sistemului de axiome al lui Kolmogorov .............................. 45
2.3.5. Probabilitate subiectivă ......................................................................................... 51
2.4. Rezumat ................................................................................................................. 53
2.5. Test de autoevaluare.............................................................................................. 53
Unitatea de învățare 3. ............................................................................................................. 56
3.1. Introducere ............................................................................................................. 56
3.2. Competențe ............................................................................................................ 56
3.3. Probabilități condiționate ...................................................................................... 56
3.4. Regula generală de înmulțire a probabilităților ................................................... 61
3.5. Formula probabilității totale ................................................................................ 62
3.6. Formula lui Bayes ................................................................................................ 64
3.7. Rezumat ................................................................................................................. 67
3.8. Test de autoevaluare.............................................................................................. 67
Unitatea de învățare 4. ............................................................................................................. 71

13
4.1. Introducere ............................................................................................................. 71
4.2. Competențe ............................................................................................................ 71
4.3. Variabile aleatorii .................................................................................................. 71
4.3.1. Funcția de repartiție .............................................................................................. 75
4.3.2. Variabile aleatorii discrete .................................................................................... 78
4.3.3. Variabile aleatorii continue ................................................................................... 81
4.4. Rezumat ................................................................................................................. 88
4.5. Test de autoevaluare.............................................................................................. 88
Unitatea de învățare 5. ............................................................................................................. 93
5.1. Introducere ............................................................................................................. 93
5.2. Competențe ............................................................................................................ 93
5.3. Valori tipice ale variabilelor aleatorii ................................................................... 94
5.3.1. Momentele de ordinul q ......................................................................................... 94
5.3.2. Momentele centrate de ordinul q ........................................................................... 95
5.4. Parametrii tendinței de grupare ........................................................................... 95
5.4.1. Valoarea medie teoretică ....................................................................................... 95
5.4.2. Mediana ................................................................................................................. 99
5.4.3. Moda .................................................................................................................... 101
5.5. Parametrii tendinței de împrăștiere ................................................................... 102
5.5.1. Dispersia .............................................................................................................. 102
5.5.2. Inegalitatea lui Markov ....................................................................................... 104
5.5.3. Inegalitatea lui Cebîşev ....................................................................................... 105
5.6. Rezumat ............................................................................................................... 107
5.7. Test de autoevaluare............................................................................................ 108
Unitatea de învățare 6.. .......................................................................................................... 112
6.1. Introducere ........................................................................................................... 112
6.2. Competențe .......................................................................................................... 112
6.3. Parametrii tendinței de împrăștiere ..................................................................... 113
6.3.1. Legea numerelor mari ......................................................................................... 113
6.3.2. Abaterea medie pătratică..................................................................................... 114
6.3.3. Coeficientul de variație ........................................................................................ 114
6.3.4. Cuantile................................................................................................................ 115
6.4. Caracteristici numerice ale formei repartiției .................................................... 117
6.4.1. Coeficientul de asimetrie ...................................................................................... 118
6.4.2. Coeficientul de boltire ......................................................................................... 119
6.5. Covarianță și corelație ....................................................................................... 120
6.6. Rezumat ............................................................................................................... 126
6.7. Test de autoevaluare............................................................................................ 127
Unitatea de învățare 7. ........................................................................................................... 130
7.1. Introducere ........................................................................................................... 130

14
7.2. Competențe .......................................................................................................... 130
7.3. Legi de repartiție pentru variabile aleatorii discrete .......................................... 131
7.3.1. Modelul repartiției binomiale .............................................................................. 131
7.3.1.1. Schema lui Bernoulli cu bila revenită .................................................... 131
1337.3.1.2. Repartiția binomială ......................................................................... 133
7.3.2. Repartiția Poisson................................................................................................ 137
7.3.3. Modelul repartiției hipergeometrice .................................................................... 141
7.3.3.1. Schema lui Bernoulli cu bila nerevenită ................................................. 141
7.3.3.2. Repartiția hipergeometrică..................................................................... 142
7.4. Rezumat ............................................................................................................... 146
7.5. Test de autoevaluare............................................................................................ 147
Unitatea de învățare 8. ........................................................................................................... 150
8.1. Introducere ........................................................................................................... 150
8.2. Competențe .......................................................................................................... 150
8.3. Legi de repartiție pentru variabile aleatorii continue ......................................... 151
8.3.1. Repartiția normală ............................................................................................... 151
8.3.2. Teorema limită centrală....................................................................................... 157
8.3.3. Repartiția lognormală .......................................................................................... 158
8.3.4. Repartiția uniformă continuă ............................................................................... 161
8.4. Rezumat ............................................................................................................... 165
8.5. Test de autoevaluare............................................................................................ 166
Unitatea de învățare 9. ........................................................................................................... 169
9.1. Introducere ........................................................................................................... 169
9.2. Competențe .......................................................................................................... 169
9.3. Statistica............................................................................................................... 170
9.4. Noțiuni statistice fundamentale ........................................................................... 172
9.5. Metode grafice pentru descrierea datelor calitative ........................................... 176
9.6. Metode grafice pentru descrierea datelor cantitative ......................................... 178
9.7. Rezumat ............................................................................................................... 184
9.8. Test de evaluare ................................................................................................... 184
Unitatea de învățare 10. ......................................................................................................... 186
10.1. Introducere ......................................................................................................... 186
10.2. Competențe ........................................................................................................ 186
10.3. Metode numerice pentru descrierea datelor cantitative .................................... 187
10.3.1. Metode numerice pentru descrierea datelor cantitative negrupate ................. 188
10.3.2. Metode numerice pentru descrierea datelor cantitative grupate ..................... 198
10.4. Rezumat ............................................................................................................. 205
10.5. Test de evaluare ................................................................................................. 205
Unitatea de învățare 11. ......................................................................................................... 207
11.1. Introducere ......................................................................................................... 207

15
11.2. Competențe ........................................................................................................ 207
11.3. Estimarea parametrilor ..................................................................................... 208
11.4. Metode de estimare punctuală........................................................................... 211
11.4.1. Metode grafice.................................................................................................. 211
11.4.2. Metoda celor mai mici pătrate ......................................................................... 212
11.4.3. Metoda momentelor.......................................................................................... 213
11.4.4. Metoda verosimilității maxime ......................................................................... 214
11.5. Estimarea parametrilor repartiției binomiale ................................................... 215
11.6. Estimarea parametrilor repartiției normale ..................................................... 217
11.7. Rezumat ............................................................................................................. 221
11.8. Test de evaluare ................................................................................................. 222
Unitatea de învățare 12. ......................................................................................................... 223
12.1. Introducere ......................................................................................................... 223
12.2. Competențe ........................................................................................................ 223
12.3. Estimarea parametrilor repartiției normale ...................................................... 224
12.3.1. Intervale de încredere pentru medie ................................................................ 224
12.3.2. Intervale de încredere pentru dispersie și abaterea standard.......................... 227
12.4. Verificarea ipotezelor statistice......................................................................... 229
12.4.1. Test de comparare a mediilor de eșantionaj
(când se cunoaște dispersia) ........................................................................... 233
12.4.2. Test de comparare a mediilor de eșantionaj
(când nu se cunoaște dispersia) ...................................................................... 234
12.4.3. Test de comparare a dispersiei unei populații normale ................................... 235
12.5. Rezumat ............................................................................................................. 237
12.6. Test de evaluare ................................................................................................. 237
Bibliografie............................................................................................................................. 239
Anexe .................................................................................................................................... 242

16
Chestionar evaluare prerechizite

1. Considerăm două mulțimi, 𝐴 = {2,4,6,8} și 𝐵 = {6,4,8,2}. Despre cele două mulțimi putem
afirma că sunt egale?
a. Da; b. Nu; c. Nu știu.
2. Considerăm două mulțimi, 𝐴 = {𝑎, 𝑏, 𝑐, 𝑑} și 𝐵 = {𝑏, 𝑑, 𝑎, 𝑐}. Între cele două mulțimi putem
afirma că există relația 𝐴 ⊂ 𝐵 ?
a. Da; b. Nu; c. Nu știu.
3. Considerăm două mulțimi A și B. Dacă între aceste două mulțimi există relația:
𝑋 ⊂ 𝑌 și 𝑌 ⊂ 𝑋,
atunci cele două mulțimi sunt egale?
a. Da; b. Nu; c. Nu știu.
4. Fie mulțimea ℳ = {1,2,3}. Precizați care este dintre mulțimile de mai jos reprezintă
mulțimea părților lui ℳ, notată 𝒫(ℳ):
a. 𝒫(ℳ) = {Φ, {1}, {2}, {3}, {1,2}, {1,3}, {2,3}, {1,2,3}};
b. 𝒫(ℳ) = {Φ, {1}, {2}, {3}, {1,2}, {1,3}, {2,3}};
c. 𝒫(ℳ) = {{1}, {2}, {3}, {1,2}, {1,3}, {2,3}, {1,2,3}}.
5. Considerăm două mulțimi A și B. Se numește intersecția mulțimilor 𝐴 și 𝐵, mulțimea 𝐼, a
elementelor, definită prin expresia:
𝑑𝑒𝑓
a. 𝐼 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∈ 𝐴 ș𝑖 𝑥 ∈ 𝐵};
𝑑𝑒𝑓
b. 𝐼 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∈ 𝐴 𝑠𝑎𝑢 𝑥 ∈ 𝐵};
𝑑𝑒𝑓
c. 𝐼 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∈ 𝐴 ș𝑖 𝑥 ∉ 𝐵}.
6. Considerăm două mulțimi A și B. Se numește reuniiunea mulțimilor 𝐴 și 𝐵, mulțimea 𝑆, a
elementelor, definită prin expresia:
𝑑𝑒𝑓
a. 𝑆 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∉ 𝐴 ș𝑖 𝑥 ∈ 𝐵};
𝑑𝑒𝑓
b. 𝑆 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∈ 𝐴 𝑠𝑎𝑢 𝑥 ∈ 𝐵};
𝑑𝑒𝑓
c. 𝑆 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∉ 𝐴 ș𝑖 𝑥 ∈ 𝐵}.
7. Considerăm două mulțimi A și B. Se numește diferența mulțimilor 𝐴 și 𝐵, mulțimea 𝐷, a
elementelor, definită prin expresia:
𝑑𝑒𝑓
a. 𝐷 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∉ 𝐴 𝑠𝑎𝑢 𝑥 ∈ 𝐵};
𝑑𝑒𝑓
b. 𝐷 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∈ 𝐴 𝑠𝑎𝑢 𝑥 ∈ 𝐵};
𝑑𝑒𝑓
c. 𝐷 = 𝐴 ∩ 𝐵 ⇔ {𝑥|𝑥 ∈ 𝐴 ș𝑖 𝑥 ∉ 𝐵}.
8. Se numește complementara mulțimii 𝐴 față de mulțimea de referință ℳ, mulțimea, 𝐴̅, dată
de relația:
𝑎. 𝐴̅ = ℳ\𝐴; b. 𝐴̅ = 𝐴 ⊂ ℳ; c. 𝐴̅ = 𝐴\ℳ.

17
9. Permutările a 𝑛 obiecte, notate cu 𝑛!, sunt egale cu:
a. 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ … ∙ (𝑛 − 𝑘 + 1);
b. 𝑛! = 123 … (𝑛 − 1);
c. 𝑛! = 123 … (𝑛 − 1)𝑛.
10. Aranjamentele a 𝑛 obiecte, luate câte 𝑘 (notate cu 𝐴𝑘𝑛 ), sunt egale cu:
a. 𝐴𝑘𝑛 = 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ … ∙ (𝑛 − 𝑘 + 2);
b. 𝐴𝑘𝑛 = 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ … ∙ (𝑛 − 𝑘 + 1);
c. 𝐴𝑘𝑛 = 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ … ∙ (𝑛 − 𝑘).
11. Combinările a 𝑛 obiecte luate câte 𝑘 (notate cu 𝐶𝑛𝑘 ), sunt egale cu:
𝑛! 𝑛! 𝑛!
a. 𝐶𝑛𝑘 = 𝑘!∙(𝑘−𝑛)!; b. 𝐶𝑛𝑘 = 𝑘!∙(𝑛−𝑘)! ; c. 𝐶𝑛𝑘 = (𝑛−𝑘)!.

18
Unitatea de învățare 1.

Cuprins
1.1. Introducere ............................................................................................................. 19
1.2. Competențe ............................................................................................................ 19
1.3. Spațiul de eșantionaj .............................................................................................. 19
1.4. Evenimente ............................................................................................................. 23
1.5. Elemente de combinatorică.................................................................................... 27
1.5.1. Permutări .................................................................................................................29
1.5.2. Aranjamente .............................................................................................................30
1.5.3. Combinări................................................................................................................32
1.6. Rezumat ................................................................................................................. 34
1.7. Test de autoevaluare.............................................................................................. 34

1.1. Introducere
Conținutul unității de învățare curente se referă la prezentarea și definirea
unor noțiuni fundamentale ale calculului probabilităților, precum și la prezentarea
unor tehnici și metode, adecvate, de calculul și evaluare.

1.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să definească noțiunile
de experiență, experiment aleatoriu, probă, spațiu de eșantionaj și diferitele tipuri
de evenimente.
De asemenea, va fi capabil să utilizeze tehnici și metode adecvate pentru
determinarea elementelor unui spațiu de eșantionaj și a evenimentelor asociate
acestuia.

Durata medie de parcurgere a primei unități de învățare este de 2 ore.

1.3. SPAȚIUL DE EȘANTIONAJ

Metoda de cercetare utilizată în știință și în inginerie pentru studiul fenomenelor naturale, se


bazează pe efectuarea de experiențe. Experimentele reprezintă un instrument deosebit de util
deoarece se bazează pe principiul fundamental că, dacă vom efectua experimente în mod
repetat, în condiții aproximativ identice, acestea ne conduc la aceleași rezultate. Astfel, suntem
capabili să controlăm valoarea variabilelor care afectează rezultatul experienței, [BLU 05].

19
Cu toate acestea, în unele experimente, nu suntem în măsură să verificăm sau să controlăm
valoarea anumitor variabile, astfel încât rezultatele vor varia de la o realizare a experimentului
la alta, chiar dacă condițiile, în care se desfășoară experiența, sunt aceleași.
Definiția 1.1: O acțiune clar specificată și care poate fi repetată în condiții date se numește
experiență, sau experiment.
În decursul realizării unui experiment se pot obține trei feluri de rezultate:
a. Rezultatul sigur: reprezintă rezultatul unui experiment care se realizează cu certitudine în
cursul efectuării unei experiențe.
b. Rezultatul imposibil: reprezintă rezultatul unui experiment care în mod obligatoriu nu se
realizează în cursul unui experiment.
c. Rezultatul aleatoriu (întâmplător): reprezintă rezultatul care se poate produce, sau nu, într-
o experiență.
Acest ultim caz îl reprezintă experimentele care sunt considerate ca fiind aleatorii.
Definiția 1.2: O experiență care conduce la rezultate ce diferă semnificativ, chiar dacă se
repetă, în condiții aproximativ identice, se numește un experiment aleatoriu.
Pentru a evita confuziile, ce pot să apară, este necesar să introducem o nouă noțiune, cea de
probă.
Definiția 1.3: Prin probă, se înțelege orice realizare efectivă, consumată sau viitoare a
experienței.
Prin urmare, proba nu se confundă cu experiența însăși ci cu unul din rezultatele sale previzibile
(cazuri posibile ale rezultatelor unui experiment aleatoriu).
Dezvoltarea logică a teoriei probabilităților trebuie să înceapă deci, cu luarea în considerare a
experimentelor aleatorii, deoarece acest tip de experiențe generează rezultate incerte și la care
va trebui să asociem valori ale probabilităților.
Caracteristica cea mai importantă a experimentelor aleatorii o reprezintă faptul că rezultatul nu
poate fi determinat cu certitudine, în avans.
Înainte de a asocia fiecărui rezultat o valoare numerică, numită probabilitate, este absolut
necesar să cunoaștem totalitatea rezultatelor posibile ale experimentului considerat.

Exemplul 1.1:
Considerăm o serie de experiențe aleatorii simple. La fiecare să se precizeze
totalitatea rezultatelor posibile.
Soluție: 1. Experiența: aruncarea succesivă a unei monede și înregistrarea feței care
apare.
Rezultate: {𝐶, 𝑃},
unde, 𝐶 – reprezintă capul și 𝑃 – reprezintă pajura.
2. Experimentul: două aruncări succesive a unei monede.
Rezultate: dacă notăm ca în exemplul anterior, obținem:

20
{(𝐶, 𝐶), (𝐶, 𝑃), (𝑃, 𝐶), (𝑃, 𝑃)}
3. Experiența: aruncării succesive a unui zar.
Rezultate: {1; 2; 3; 4; 5; 6}, conform figurii 1.3.

Figura 1.1: Rezultate obținute în urma aruncării unui zar

4. Experimentul: aruncarea succesivă a două zaruri.


Rezultate: {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12},
dacă ne interesează suma celor două fete care apar în decursul efectuării
probelor.
5. Experiența: extragerea a trei mostre dintr-un lot de piese și examinarea
lor.
Rezultate:{(𝐶, 𝐶, 𝐶), (𝐶, 𝐶, 𝑁), (𝐶, 𝑁, 𝐶), (𝑁, 𝐶, 𝐶), (𝐶, 𝑁, 𝑁), (𝑁, 𝐶, 𝑁),
(𝑁, 𝑁, 𝐶), (𝑁, 𝑁, 𝑁)}, dacă notăm cu 𝐶, piesele conforme și cu 𝑁,
piesele neconforme.
6. Experiența: aruncarea succesivă a unei monede, până când obținem pajura
(P).
Rezultate: {1, 2, 3, 4, … , ∞},
dacă ne interesează, în acest caz, numărul de probe efectuate.
7. Experimentul: cantitatea de precipitații căzută cu prilejul ploilor
înregistrate în decursul unui deceniu.
Rezultate: {𝑥|𝑥 ∈ ℛ, 0 ≤ 𝑥 ≤ 120}, dacă cea mai mare cantitate de apă
căzută în intervalul studiat este 120 l/m2.

Definiția 1.4: O mulțime 𝑆 alcătuită din totalitatea rezultatelor asociate unui eveniment real
sau conceptual se numește spațiul de eșantionaj, sau mulțimea totală a
probelor.
Din definiția 1.4 rezultă că, de fapt, spațiul de eșantionaj reprezintă o mulțime de rezultate ale
experimentului, obținute în urma unei singure probe, iar fiecare rezultat al experimentului
reprezintă un punct, sau un element al mulțimii totale a probelor.
Din analiza experiențelor prezentate anterior, putem constata trei categorii de experiențe, și
anume:
 Experiențe având spațiul de eșantionaj finit, deoarece conțin un număr finit de elemente.
Acestea reprezintă cazul exemplului 1.1, punctele 1 ÷ 5, prezentate anterior;
 Experimente cu spațiul de eșantionaj infinit numărabil (în cazul exemplului 1.1, punctul
6); Dacă intre elementele unei mulțimi infinite și mulțimea numerelor întregi se poate
stabili o relație bijectivă, atunci mulțimea poartă numele de mulțime infinit numărabilă.

21
 Experimente cu spațiul de eșantionaj infinit nenumărabil (în cazul exemplului 1.1,
punctul 7). Dacă între elementele unei mulțimi infinite nu poate fi stabilită o relație de
tipul celei prezentate anterior, atunci mulțimea poartă numele de mulțime infinit
nenumărabilă.
Vom denumi, în continuare, spațiile de eșantionaj finite și infinit numărabile, ca spații de
eșantionaj discrete, iar pe cele infinit nenumărabile ca spații de eșantionaj continue.

Exemplul 1.2:
Considerăm un experiment ce constă în extragerea a două bile dintr-o
urnă, ce conține 4 bile identice, numerotate cu cifrele de la 1 la 4.
a) Să se determine spațiul de eșantionaj, în condițiile în care prima bilă
extrasă este reintrodusă în urnă înainte de cea de-a doua extragere;
b) Să se determine spațiul de eșantionaj, în condițiile în care prima bilă
extrasă nu mai este reintrodusă în urnă înainte de cea de-a doua
extragere.
Soluție: Cazul a.
(1,1) (1,2) (1,3) (1,4)
(2,1) (2,2) (2,3) (2,4)
𝑆={ }
(3,1) (3,2) (3,3) (3,4)
(4,1) (4,2) (4,3) (4,4)
Cazul b.
(1,2) (1.3) (1,4)
(2,1) (2,3) (2,4)
𝑆={ }
(3,1) (3,2) (3,4)
(4,1) (4,2) (4,3)

Chiar și pentru analiza din punct de vedere probabilist a rezultatelor, unui experiment aleatoriu,
spațiul de eșantionaj nu este în mod unic determinat. El depinde de obiectivele propuse, ale
studiului.

Exemplul 1.3:
Considerăm un experiment ce constă în prelevarea unei piese executate din tablă
prin ștanțare, în cadrul unui atelier și analiza calității prin evaluarea grosimii.
Soluție: a. Valorile obținute prin măsurare depind de echipamentul de măsurare
utilizat, precum și de precizia de măsurare a acestuia. Putem spune că
spațiul de eșantionaj este alcătuit din evenimente elementare ce reprezintă
numere reale pozitive:
𝑆 = {𝑥|𝑥 ∈ ℛ+ }.
b. Dacă știm, din măsurători efectuate anterior, că grosimea pieselor este
cuprinsă în intervalul [6,7] mm, atunci:
𝑆 = {𝑥|6 ≤ 𝑥 ≤ 7, }

22
c. Dacă obiectivul analizei este acela de a determina dacă piesa este conformă
(C), sau neconformă (N), atunci:
𝑆 = {𝐶, 𝑁}
d. Dacă dorim să sortăm piesele în: piese de calitatea I (𝐶1), calitatea a II – a
(𝐶2) și rebuturi (𝑅), atunci:
𝑆 = {𝐶1, 𝐶2, 𝑅}.
În concluzie, prin experiență (experiment), în teoria probabilităților, înțelegem a efectua o
alegere a unui element dintr-o mulțime dată, utilizând un procedeu susceptibil de a fi repetat.

Specificați spațiul de eșantionaj pentru următoarele experimente:


a. La solicitarea unui împrumut, banca intervievează clienții în privința stării
civile;
b. Se aruncă o monedă de trei ori, succesiv;
c. Se aruncă două zaruri simultan;
d. Numărul zilnic de clienți, ai unui restaurant, care servesc masa, știind că
restaurantul are 6 mese cu patru scaune, iar durata servirii mesei este de
circa 30 de minute, în condițiile în care restaurantul este deschis 12 ore zilnic;
e. Se intervievează un număr de 6 clienți, ai unui hipermarket, dacă sunt sau nu
mulțumiți de accesul cu autoturismul în parcare;
f. Dacă grupele de sânge sunt 𝐴, 𝐵, 𝐴𝐵, 𝑂 și fiecare dintre ele poate fi cu 𝑅ℎ+
și 𝑅ℎ− ;
g. O urnă conține trei bile: una roșie (𝑅), una albastră (𝐴) și una galbenă (𝐺).
Se extrag două bile;
h. Cazul g, cu condiția că înainte de a extrage a doua bilă prima este reintrodusă
în urnă;
i. Angajații dintr-un cabinet de avocatură sunt clasificați după sex (𝐵 sau 𝐹),
după vechimea în cabinet (stagiari, juniori și seniori) și in funcție de numărul
orelor lucrate (full-time sau part-time);
j. Cantitatea de benzină vândută zilnic de o stație de benzină, știind că stația
are un rezervor de 5000 l, iar acesta este umplut în fiecare dimineață.

1.4. EVENIMENTE

Analiza din punct de vedere probabilist al rezultatelor unui experiment aleatoriu presupune, de
cele mai multe ori, calculul probabilității unor colecții de rezultate ale experienței considerate.
Din acest motiv a fost introdusă o nouă noțiune, cea de eveniment, [CRS 83],[SOO 04].

Definiția 1.5: Prin eveniment, se înțelege producerea sau neproducerea unui fenomen într-
o experiență oarecare, sau rezultatul unui experiment.
În funcție de șansa de apariție, un eveniment oarecare, asociat unei experiențe, poate fi:
 Evenimentul sigur () – este evenimentul care se produce cu certitudine la efectuarea
unei probe. De fapt, evenimentul sigur reprezintă spațiul de eșantionaj:
Ω = 𝑆.

23
 Evenimentul imposibil () – este evenimentul care nu se produce cu siguranță la
efectuarea de probe. Și în acest caz putem concluziona că:
Φ ∉ 𝑆.
 Evenimentul aleatoriu, sau întâmplător (𝐴, 𝐵, . ..): evenimentul care se poate produce, sau
nu, într-un experiment.
Analizând definiția 1.5 putem trage concluzia că în decursul efectuării unui experiment, un
eveniment aleatoriu reprezintă, de fapt, o submulțime a spațiului de eșantionaj asociat unei
experiențe aleatorii.
Evenimentele aleatorii, în funcție de modul lor de apariție, se pot clasifica în:
 Evenimentele care pot fi realizate de o probă și numai de una, reprezintă evenimentele
̅̅̅̅̅
elementare. Pentru acest tip de evenimente vom utiliza notația: 𝐸𝑖 , 𝑖 ∈ 1, 𝑛.
 Evenimentele compuse. Acestea reprezintă o colecție de unul sau mai multe evenimente
elementare.
Rezultă deci, că în general, un eveniment poate fi identificat cu o mulțime și anume cu mulțimea
probelor respective, iar evenimentele compuse, asociate unui spațiu de eșantionaj, se pot obține
prin utilizarea operațiilor specifice mulțimilor.
Pornind de la terminologia folosită de teoria mulțimilor, în tabelul 1.1 este prezentată dualitatea
de limbaj și relațiile utilizate la operarea cu evenimente.

Tabelul 1.1 Dualitatea limbajului utilizat în teoria probabilităților, [CRS 81]


Limbajul teoriei mulțimilor Limbajul evenimentelor
Mulțimea totală sau, mulțime de Spațiul de eșantionaj, 𝑆
referință, ℳ Evenimentul sigur, 
Mulțimea părților mulțimii de
Câmp de evenimente, (𝑆, 𝒦)
referință, 𝒫(ℳ)
Submulțime a lui ℳ Eveniment, 𝐴
Mulțimea vidă,  Evenimentul imposibil, 
𝐴 reunit cu 𝐵, 𝐴⋃𝐵 << 𝐴 sau 𝐵 >>
𝐴 intersectat cu 𝐵, 𝐴 ∩ 𝐵 << 𝐴 și 𝐵 >>
Complementara lui 𝐴, 𝐶ℳ 𝐴, 𝐴̅ << non 𝐴 >>, 𝐴̅, 𝐶S 𝐴
𝐴 inclus în 𝐵, 𝐴 ⊂ 𝐵 << 𝐴 implică 𝐵 >>
𝐴=𝐵 <<𝐴 echivalent cu 𝐵>>
𝐴 și 𝐵 disjuncte, 𝐴 ∩ 𝐵 = Φ << 𝐴 și 𝐵 incompatibile >>
𝐴 și 𝐵 nedisjuncte, 𝐴 ∩ 𝐵 ≠ Φ << 𝐴 și 𝐵 compatibile >>

Conform tabelului 1.1, observăm că este necesar să definim, în continuare, câteva tipuri de noi
evenimente cu proprietăți speciale:
Definiția 1.6: Evenimentelor 𝐴 și 𝐵, asociate unei experiențe, le putem face să corespundă
un nou eveniment, 𝑅, numit reuniunea lor:
𝑅 = 𝐴 ∪ 𝐵,

24
și a cărui realizare constă în realizarea a cel puțin unuia dintre cele două
evenimente.
Definiția 1.7: Evenimentelor 𝐴 și 𝐵, asociate unei experiențe, le putem face să corespundă
un nou eveniment, 𝐼, numit intersecția lor:
𝐼 = 𝐴 ∩ 𝐵,
și a cărui realizare constă în realizarea simultană a ambelor evenimente.
Definiția 1.8: Două, sau mai multe evenimente, 𝐵𝑖 , asociate experimentului care nu se pot
realiza simultan:
⋂𝐵𝑖 = Φ,
se numesc evenimente incompatibile.
Definiția 1.9: Două, sau mai multe evenimente, 𝐶𝑖 , asociate experimentului care se pot
realiza simultan:
⋂𝐶𝑖 ≠ Φ,
se numesc evenimente compatibile.
Definiția 1.10: Fiecărui eveniment 𝐴 asociat unei experiențe îi corespunde un eveniment,
notat cu 𝐴̅, cu proprietatea că dacă se realizează evenimentul 𝐴, atunci
evenimentul 𝐴̅ nu se realizează cu certitudine. Cele două evenimente se
numesc evenimente complementare.
Spunem, despre evenimentul 𝐴̅, că se numește contrariul (opusul, sau
complementul) evenimentului 𝐴:
𝐴̅ = 𝐶S 𝐴 = S\𝐴
Definiția 1.11: Spunem că evenimentul 𝐴 implică evenimentul 𝐵 (sau 𝐵 este implicat de
evenimentul 𝐴) și notăm 𝐴 ⊂ 𝐵, dacă 𝐵 se realizează de fiecare dată când se
realizează 𝐴.
Definiția 1.12: Două evenimente 𝐴 și 𝐵, se numesc echivalente (notat 𝐴 = 𝐵), dacă între ele
există simultan relațiile:
𝐴 ⊂ 𝐵 și 𝐵 ⊂ 𝐴.

Calculul probabilităților, ca teorie matematică, a fost dezvoltat cu scopul de a permite asocierea


fiecărui eveniment, al unei experiențe, o valoare a probabilității. Din cele prezentate anterior
constatăm că, dacă în cadrul unei experiențe aleatorii ne concentrăm asupra unui eveniment, de
fapt, ne fixăm atenția asupra unei părți din mulțimea probelor experimentului. Astfel, un
eveniment poate fi identificat cu un element din mulțimea părților spațiului de eșantionaj
corespunzător.

Exemplul 1.4:
Considerăm experimentul ce costă în aruncarea unui zar. Să se determine
spațiul de eșantionaj și să se evidențieze toate tipurile de evenimente definite
anterior, precum și câmpul de evenimente asociat.

25
Soluție: Spațiul de eșantionaj: 𝑆 = {1,2,3,4,5,6}.
Tipuri de evenimente:
 ̅̅̅̅: {1}, {2}, {3}, {4}, {5}, {6}.
Evenimente elementare, 𝐸𝑖 , 𝑖 ∈ 1,6
 Evenimentul sigur: Ω = {1,2,3,4,5,6}.
 Evenimentul imposibil: Φ = {7}.
 Evenimente: 𝐴 = {3,5}, 𝐵 = {4,6}, 𝐶 = {1,3,5},
𝐷 = {2,4,6}, 𝐸1 = {1}, 𝐸2 = {2}.
 Reuniunea evenimentelor: 𝐶 = 𝐸1 ∪ 𝐴, sau 𝐷 = 𝐸2 ∪ 𝐵.
 Intersecția evenimentelor: 𝐴 = 𝐶 ∩ 𝐸1 , sau 𝐵 = 𝐷 ∩ 𝐸2 .
 Evenimente incompatibile: 𝐴 ∩ 𝐵 = Φ, 𝐶 ∩ 𝐷 = Φ, sau 𝐸1 ∩ 𝐸2 .
 Evenimente compatibile: 𝐸1 ∩ 𝐶 ≠ Φ, sau 𝐸2 ∩ 𝐷 ≠ Φ.
 Evenimente contrare: 𝐷 = 𝑆\𝐶 = 𝐶̅ .

Dintre toate tipurile de evenimente, definite anterior, o importanță deosebită o au evenimentele


elementare, deoarece ele stau la baza construcției tuturor celorlalte. De aceea, în continuare,
vom preciza proprietățile remarcabile pe care la au aceste evenimente:
a. ∀𝐸𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛 și 𝐵 ∈ 𝑆, atunci relația 𝐵 ⊂ 𝐸𝑖 ⇒ 𝐵 = Φ sau 𝐵 = 𝐸𝑖 ;
b. Evenimentul 𝐸𝑖 este elementar dacă și numai dacă ∀𝐵 ∈ 𝑆, avem:
𝐸𝑖 ∩ 𝐵 = 𝐸𝑖 , sau 𝐸𝑖 ∩ 𝐵 = Φ.
c. Două evenimente elementare distincte sunt incompatibile.
d. Într-un câmp de evenimente, fiind dat un eveniment compus, 𝐵 ∈ 𝑆, există cel puțin un
eveniment elementar 𝐸𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛 astfel încât:
𝐸𝑖 ⊂ 𝐵.
e. Un eveniment oarecare, 𝐵, al unui câmp de evenimente poate fi exprimat în mod unic
ca reuniunea unui număr finit de evenimente elementare:
𝐴 = ⋃𝐸𝑖 .
f. Într-un câmp de evenimente, evenimentul sigur este reuniunea tuturor evenimentelor
elementare:
⋃𝑛𝑖=1 𝐸𝑖 = Ω.

Exemplul 1.5:
Considerăm trei evenimente A,B și C, aparținând unui spațiu de
eșantionaj, S, conform figurii de mai jos. Să se reprezinte următoarele
evenimente:
̅
a) 𝐴; 𝐴 𝐵
b) 𝐴 ∩ 𝐵;
c) (𝐴 ∩ 𝐵) ∪ 𝐶;
d) ̅̅̅̅̅̅̅̅̅̅
(𝐵 ∪ 𝐶);
e) (𝐴 ∩ 𝐵)\𝐶;
̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
f) (𝐴 ∪ 𝐵 ∪ 𝐶);

𝐶 𝑆

26
Soluție: a) b) c)
𝐴 𝐵 𝐴 𝐵 𝐴 𝐵

𝐶 𝑆 𝐶 𝑆 𝐶 𝑆

d) e) f)
𝐴 𝐵 𝐴 𝐵 𝐴 𝐵

𝐶 𝑆 𝐶 𝑆 𝐶 𝑆

Fie trei evenimente, A, B și C, definite pe un spațiu de eșantionaj.


Precizați expresiile pentru următoarele evenimente:
a. Nu se realizează nici unul din cele trei;
b. Doar evenimentul A se realizează;
c. Se realizează doar unul din cele trei evenimente;
d. Cel puțin unul din cele trei evenimente se realizează;
e. Evenimentul A se realizează, împreună cu unul dintre celelalte două;
f. B sau C se realizează, iar evenimentul A, nu ;
g. Cel puțin două dintre ele se realizează; 𝑆
h. Se realizează maxim două dintre ele; 𝐴 𝐵
i. Toate cele trei evenimente se realizează;
Să se reprezinte cele nouă evenimente 𝐶
utilizând diagrama Euler – Venn.

1.5 ELEMENTE DE COMBINATORICĂ

Combinatorica, cunoscută și sub numele de analiza combinatorie, studiază


modul configurare a mulțimilor finite sau a combinațiilor de mulțimi finite și,
de asemenea, furnizează instrumente de numărare a elementelor. Aceste
instrumente de numărare a elementelor au la bază două principii, [MEM 80]:
Principiul multiplicativ: dacă,
 un eveniment 𝐴, se poate produce în 𝑎 moduri;
 un eveniment 𝐵, se poate produce în 𝑏 moduri;
 …

27
și toate aceste evenimente sunt independente (adică, apariția unuia dintre ele,
nu este influențată de apariția celorlalte), atunci numărul total, 𝑛, de moduri
diferite de producere a evenimentului combinat, 𝐴, 𝐵, 𝐶, … , este:
𝑛 =𝑎∙𝑏∙𝑐∙… (1.1)

Exemplul 1.6:
În dulap avem trei cămăși, două cravate și două costume. În câte moduri
diferite ne putem îmbrăca?
Soluție: 𝑛 = 𝑎 ∙ 𝑏 ∙ 𝑐 = 3 ∙ 2 ∙ 2 = 12 moduri, dacă nu ținem seama de modul de
asortare al hainelor.

Pentru a descrie spațiile de eșantionaj care se compun din evenimente elementare, alcătuite din
mai multe etape sau stadii succesive, putem utiliza arborele de evenimente. Arborele de
evenimente reprezintă un instrument grafic ce are la bază principiul multiplicativ și se
construiește reprezentând sub forma ramurilor unui copac cele 𝑎 modalități de completare ale
pasului 𝐴. Fiecare dintre modalitățile de completare a etapei 𝐵 poate fi reprezentat ca 𝑏 ramuri
pornind de la capetele ramurii originare, ale evenimentului precedent, 𝐴, și așa mai departe.
În figura 1.2 este prezentat arbore de evenimente, corespunzător exemplului 1.6.

Ev. 𝐴 𝐴1 𝐴2 𝐴3 𝑛1 = 3, 𝑛r. de cămăşi

Ev. 𝐵 𝐵1 𝐵2 𝐵1 𝐵2 𝐵1 𝐵2 𝑛2 = 2, 𝑛r. de cravate

Ev. 𝐶 𝑛1 = 2, 𝑛r. de costume

𝐶1 𝐶2 𝐶1 𝐶2 𝐶1 𝐶2 𝐶1 𝐶2 𝐶1 𝐶2 𝐶1 𝐶2

Figura 1.2 Arborele de evenimente pentru exemplul 1.6

Principiul aditiv: dacă,


 un eveniment 𝐴, se poate produce în 𝑎 moduri;
 un eveniment 𝐵, se poate produce în 𝑏 moduri;
 un eveniment 𝐶, se poate produce în 𝑐 moduri;
 …
și dacă, toate aceste evenimente nu sunt simultane, atunci numărul total, 𝑛, de moduri diferite
de producere a evenimentului combinat, 𝐴, 𝐵, 𝐶, … , este:
𝑛 =𝑎+𝑏+𝑐+⋯ (1.2)

28
Exemplul 1.7:
La catedra de Analiză matematică există 3 cadre didactice, de sex
feminin și 5 cadre didactice, de sex masculin. Să se determine câte posibilități
au studenții de anul I de a avea un profesor de matematică.
Soluție: 𝑛 = 𝑎 + 𝑏 = 3 + 5 = 8.

Determinarea spațiului de eșantionaj în unele cazuri, mai complicate, devine mai dificilă prin
utilizarea, doar a unor raționamente logice. De asemenea, pentru a asocia probabilități
evenimentelor din aceste situații, e nevoie de cunoașterea numărul de evenimente, atât pentru
evenimentul analizat cât și pentru spațiul de eșantionaj. Astfel de cazuri presupun utilizarea
regulilor simple ale analizei combinatorii pentru a simplifica calculele.

1.5.1. PERMUTĂRI

Definiția 1.13: Permutările a 𝑛 obiecte, notate cu 𝑛!, înseamnă numărul tuturor grupelor care
se pot forma cu cele 𝑛 obiecte diferite, două permutări diferind numai prin
ordinea în care sunt așezate obiectele într-o grupă.
Numărul de permutări a 𝑛 obiecte se poate determina foarte simplu, conform figurii 1.3.
Constatăm că primul obiect, într-o permutare, îl putem alege în 𝑛 moduri. Cel de-al doilea
obiect, se poate alege în 𝑛 − 1 feluri, cel de-al treilea în 𝑛 − 2 feluri, și așa mai departe, iar
pentru ultimul obiect ne rămâne o singură opțiune. Deci:
𝑛! = 123 … (𝑛 − 1)𝑛. (1.3)
𝒏 obiecte
𝒏 poziţii

     …
𝑛 × (𝑛 − 1) × … × (𝑛 − 4) × … × 1

Figura 1.3 Calculul numărului de permutări a 𝑛 obiecte

29
Exemplul 1.8:
La ședința unei asociații se alege un prezidiu alcătuit din cinci persoane
diferite. În câte feluri se pot așeza aceste persoane, la masa prezidiului pentru a
conduce ședința?
Soluție: 𝑁 = 5! = 5 ∙ 4 ∙ 3 ∙ 2 ∙ 1 = 120 de moduri.

Dacă avem, între cele 𝑛 obiecte, grupe de elemente identice, atunci numărul de permutări este
mai mic decât în cazul în care toate elementele sunt diferite.
De exemplu, în cazul a patru elemente (𝑎, 𝑎, 𝑏, 𝑏), cele 4! = 24 de permutări care se pot realiza
sunt:
(𝑎1 , 𝑎2 , 𝑏1 , 𝑏2 ), (𝑎1 , 𝑏1 , 𝑎2 , 𝑏2 ), (𝑏1 , 𝑏2 , 𝑎1 , 𝑎2 ), (𝑏1 , 𝑎1 , 𝑏2 , 𝑎2 ), (𝑏1 , 𝑎1 , 𝑎2 , 𝑏2 ), (𝑎1 , 𝑏1 , 𝑏2 , 𝑎2 ),
(𝑎2 , 𝑎1 , 𝑏1 , 𝑏2 ), (𝑎2 , 𝑏1 , 𝑎2 , 𝑏2 ), (𝑏1 , 𝑏2 , 𝑎2 , 𝑎1 ), (𝑏1 , 𝑎2 , 𝑏2 , 𝑎1 ), (𝑏1 , 𝑎2 , 𝑎1 , 𝑏2 ), (𝑎2 , 𝑏1 , 𝑏2 , 𝑎1 ),
(𝑎1 , 𝑎2 , 𝑏2 , 𝑏1 ), (𝑎1 , 𝑏2 , 𝑎2 , 𝑏1 ), (𝑏2 , 𝑏1 , 𝑎1 , 𝑎2 ), (𝑏2 , 𝑎1 , 𝑏1 , 𝑎2 ), (𝑏2 , 𝑎1 , 𝑎2 , 𝑏1 ), (𝑎1 , 𝑏2 , 𝑏1 , 𝑎2 ),
(𝑎2 , 𝑎1 , 𝑏2 , 𝑏1 ), (𝑎2 , 𝑏2 , 𝑎2 , 𝑏1 ), (𝑏2 , 𝑏1 , 𝑎2 , 𝑎1 ), (𝑏2 , 𝑎2 , 𝑏1 , 𝑎1 ), (𝑏2 , 𝑎2 , 𝑎1 , 𝑏1 ), (𝑎2 , 𝑏2 , 𝑏1 , 𝑎1 ).
Ordonările diferite ale elementelor 𝑎, ca și cele ale elementelor 𝑏, sunt socotite egale. Deoarece,
acestea reprezintă 2! și respectiv 2! permutări, numărul total al permutărilor diferite este egal
cu:
4! 1∙2∙3∙4
= = 6,
2! ∙ 2! 1 ∙ 2 ∙ 1 ∙ 2
iar acestea sunt:
(𝑎, 𝑎, 𝑏, 𝑏); (𝑎, 𝑏, 𝑎, 𝑏); (𝑏, 𝑏, 𝑎, 𝑎), (𝑏, 𝑎, 𝑏, 𝑎), (𝑏, 𝑎, 𝑎, 𝑏), (𝑎, 𝑏, 𝑏, 𝑎).
Relația anterioară se poate simplu generaliza pentru 𝑛 elemente, împărțite în 𝑚 grupe, formate
din 𝑝1 , 𝑝2 , … , 𝑝𝑚 elemente, numărul total de permutări rezultă, în acest caz, egal cu:
𝑛!
, (1.4)
𝑝1 ! ∙ 𝑝2 ! ∙ … ∙ 𝑝𝑚 !
unde: 𝑝1 + 𝑝2 + … + 𝑝𝑚 = 𝑛.

Exemplul 1.9:
La prelucrarea unui reper, executat din tablă, trebuie realizate trei
alezaje de același diametru, precum și două crestături, de asemenea identice. Să
se calculeze numărul de variante posibile, ale succesiunii de operații ce trebuie
luate în considerare la stabilirea tehnologiei de prelucrare.
5!
Soluție: 𝑁 = 3!∙2! = 10.

1.5.2. ARANJAMENTE

Definiția 1.14: Aranjamentele a 𝑛 obiecte, luate câte 𝑘 (notate cu 𝐴𝑘𝑛 ), reprezintă numărul
tuturor grupelor distincte, alcătuite din 𝑘 elemente, care se pot forma cu cele

30
𝑛 elemente diferite, ținând seama de ordinea elementelor dintr-o grupă.
Numărul de aranjamente obținute din 𝑛 obiecte luate câte 𝑘 se poate determina folosind
raționamentul prezentat în figura 1.4.

𝒏 obiecte
𝒌 poziţii
  …
𝑛 × (𝑛 − 1) × … × (𝑛 − 𝑘 + 1)

Figura 1.4 Calculul numărului de aranjamente a 𝑛 obiecte, luate câte 𝑘

Constatăm că primul obiect, într-un aranjament, îl putem alege în 𝑛 moduri. Cel de-al doilea
obiect, se poate alege în 𝑛 − 1 feluri, cel de-al treilea în 𝑛 − 2 feluri, și așa mai departe, iar
obiectul din poziția 𝑘, în 𝑛 − 𝑘 + 1 moduri. Deci:
𝑛!
𝐴𝑘𝑛 = 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ … ∙ (𝑛 − 𝑘 + 1) = . (1.5)
(𝑛 − 𝑘)!

Exemplul 1.10:
În câte moduri se pot așeza cinci persoane pe o canapea cu trei locuri?

5!
Soluție: 𝑁 = 𝐴35 = (5−3)! = 60 de moduri diferite.

Dacă sunt permise repetițiile de elemente, obținem un nou tip de aranjamente, și anume,
aranjamente cu repetiție, notate: 𝐴𝑟𝑛𝑘 . Numărul de aranjamente cu repetiție de 𝑛 obiecte luate
câte 𝑘, este, conform figurii 1.5:
𝐴𝑟𝑛𝑘 = 𝑛𝑘 , (1.6)
Deoarece, primul element dintr-o grupă poate fi ales în 𝑛 moduri, cel de-al doilea element în 𝑛
moduri, la fel și cel de-al 𝑘 element dintr-o grupă.

Exemplul 1.11:
Câte autovehicule pot fi înmatriculate într-un județ ținând cont de faptul
că numerotarea actuală presupune, pe lângă o abreviere a județului, un număr
din două cifre și un cod obținut din trei litere?

31
2 3
Soluție: 𝑁 = (𝐴𝑟10 − 1) ∙ 𝐴𝑟26 = (102 − 1) ∙ 263 = 1740024.

𝒏 obiecte
𝒏 obiecte

𝒏 obiecte
𝒌 poziţii
  …
𝑛 × 𝑛 × … × 𝑛 = 𝑛𝑘

Figura 1.5 Calculul numărului de permutări cu repetiție a 𝑛 obiecte, luate câte 𝑘

1.5.3. COMBINĂRI

Definiția 1.15: Combinările a 𝑛 obiecte luate câte 𝑘 înseamnă numărul tuturor grupelor
distincte, alcătuite din 𝑘 elemente, care se pot forma cu cele 𝑛 elemente
diferite, indiferent de ordinea elementelor dintr-o grupă.

Numărul de combinări a 𝑛 elemente luate câte 𝑘 se notează cu 𝐶𝑛𝑘 . Din tabelul 1.2 se constată
că numărul de combinări este mai mic decât numărul de aranjamente, datorită faptului că numai
ținem cont de ordinea în care apar elementele. Deci, dacă permutăm elementele fiecărei
combinări obținem aranjamente. Relația de calcul al numărului de combinări este:
𝐴𝑘𝑛 𝑛!
𝐶𝑛𝑘 = = . (1.7)
𝑘! 𝑘! ∙ (𝑛 − 𝑘)!

Exemplul 1.12:
La un examen cadrul didactic a pregătit 15 bilete cu subiecte. Fiecare
student trebuie să răspundă la 6 subiecte. Calculați câte situații diferite pot
exista.
6 15!
Soluție: 𝑁 = 𝐶15 = 6!∙(15−6)! = 5005.

32
Tabelul 1.2 Relația dintre numărul de aranjamente, 𝐴34 și cel al combinărilor, 𝐶43
Aranjamente Combinări

{𝑎, 𝑏, 𝑐}, {𝑎, 𝑐, 𝑏}, {𝑏, 𝑎, 𝑐}, {𝑏, 𝑐, 𝑎}, {𝑐, 𝑎, 𝑏}, {𝑐, 𝑏, 𝑎} {𝑎, 𝑏, 𝑐}
{𝑎, 𝑏, 𝑑}, {𝑎, 𝑑, 𝑏}, {𝑏, 𝑎, 𝑑}, {𝑏, 𝑑, 𝑎}, {𝑑, 𝑎, 𝑏}, {𝑑, 𝑏, 𝑎} {𝑎, 𝑏, 𝑑}
{𝑏, 𝑐, 𝑑}, {𝑏, 𝑑, 𝑐}, {𝑐, 𝑏, 𝑑}, {𝑐, 𝑑, 𝑏}, {𝑑, 𝑐, 𝑏}, {𝑑, 𝑏, 𝑐} {𝑏, 𝑐, 𝑑}
{𝑎, 𝑐, 𝑑}, {𝑎, 𝑑, 𝑐}, {𝑐, 𝑎, 𝑑}, {𝑐, 𝑑, 𝑎}, {𝑑, 𝑐, 𝑎}, {𝑑, 𝑎, 𝑐} {𝑎, 𝑐, 𝑑}

Dacă sunt permise repetițiile elementelor, obținem în cazul a 𝑛 obiecte {𝑎1 , 𝑎2 , … , 𝑎𝑛 }, luate
câte două:
{𝑎1 , 𝑎1 } {𝑎1 , 𝑎2 } {𝑎1 , 𝑎3 } … {𝑎1 , 𝑎𝑛 }
{𝑎1 , 𝑎2 } {𝑎2 , 𝑎3 } … {𝑎2 , 𝑎𝑛 }
{𝑎3 , 𝑎3 } … {𝑎3 , 𝑎𝑛 }

{𝑎𝑛 , 𝑎𝑛 }

Acestea reprezintă cazul combinărilor cu repetiție, notate: 𝐶𝑟𝑛𝑘 . Numărul de combinări cu


repetiție de 𝑛 obiecte luate câte 2, este:
2
𝐶𝑟𝑛2 = 1 + 2 + 3 + ⋯ + (𝑛 − 1) + 𝑛 = 𝐶𝑛+1 (1.8)
Prin generalizare, ecuația (1.8), devine:
2
𝐶𝑟𝑛𝑘 = 𝐶𝑛+𝑘−1 (1.9)

Exemplul 1.13:
Reconsiderăm problema din exemplul 1.2 și dorm să calculăm în
continuare numărul de evenimente elementare, distincte ale spațiului de
eșantionaj.
5!
Soluție: a) 𝑁 = 𝐶𝑟42 = 𝐶4+2−1
2
= 2!∙(5−2)! = 10.
4!
b) 𝑁 = 𝐶42 = 2!∙(4−2)! = 6, deoarece evenimentele elementare de tipul
{1,2} și {2,1} se consideră identice.

Folosind datele de la prima aplicație de tip To do, punctele b, c, e, f, g,


h, i și j, să se calculeze numărul de evenimente elementare ce compun spațiul de
eșantionaj.

33
Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin material până la
momentul curent sunt:

 Experiență, sau experiment;  Eveniment;


 Experiment aleatoriu;  Evenimentul sigur ();
 Probă;  Evenimentul imposibil ();
 Spațiul de eșantionaj, sau  Evenimentele elementare;
mulțimea totală:  Evenimentele compuse
 Spațiul de eșantionaj finit; (evenimente aleatorii);
 Spațiul de eșantionaj infinit  Evenimente incompatibile;
numărabil;  Evenimente compatibile;
 Spațiul de eșantionaj infinit  Evenimente complementare;
nenumărabil;  Contrariul (opusul, sau
 Spații de eșantionaj discrete; complementul) unui eveniment;
 Spații de eșantionaj continue.  Evenimente echivalente.

Rezumat
În această unitate de învățare au fost prezentată și detaliată serie de
noțiuni introductive, absolut necesare, pentru abordarea calculului
probabilităților. Este vorba de spațiu de eșantionaj și evenimente. De asemenea,
au fost recapitulate și dezvoltate elementele analizei combinatorii ce permit
evaluarea, pentru cazuri concrete și finite, a numărului diferitelor tipuri de
evenimente. Odată cunoscute aceste elemente, în continuare, se poate aborda
noțiunea de probabilitate.

Test de autoevaluare a cunoștințelor


P.1.1 Pe spațiul de eșantionaj, 𝑆 = {1,2,3, … ,10}, se consideră evenimentele: 𝐴 =
{1,3,5}, 𝐵 = {1,4,6} și 𝐶 = {2,5,7}. Să se determine următoarele evenimente:
a. 𝑆 ∪ 𝐶; b. 𝐴 ∪ 𝐵;
c. 𝐴̅ ∩ 𝐶; d. 𝐴̅ ∪ (𝐵 ∩ 𝐶);
e. ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
(𝐴 ∩ 𝐵 ∩ 𝐶); f. ̅̅̅̅̅̅̅
𝐴̅ ∩ 𝐵̅;
g. (𝐴 ∩ 𝐵) ∪ (𝐵 ∩ 𝐶) ∪ (𝐶 ∩ 𝐴).

R: a. 𝑆 ∪ 𝐶 = 𝑆 b. 𝐴 ∪ 𝐵 = {1,3,4,5,6}
c. 𝐴̅ ∩ 𝐶 = {2,7} d. 𝐴̅ ∪ (𝐵 ∩ 𝐶) = 𝐴̅ ∪ Φ = 𝐴̅
e. ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
(𝐴 ∩ 𝐵 ∩ 𝐶) = Φ ̅ =𝑆 f. ̅̅̅̅̅̅̅
𝐴̅ ∩ 𝐵̅ = {1,2,3,5,7}
g. (𝐴 ∩ 𝐵) ∪ (𝐵 ∩ 𝐶) ∪ (𝐶 ∩ 𝐴) = {1}
P.1.2 Fie trei evenimente, 𝐴, 𝐵 și 𝐶 definite pe un spațiu de eșantionaj. Precizați care
dintre afirmațiile următoare sunt corecte și care sunt incorecte. Reprezentați aceste
evenimente sub forma unor diagrame Euler - Venn:

34
a. 𝐴 ∩ 𝐵 ∩ 𝐶 = 𝐴 ∩ 𝐵 ∩ (𝐶 ∪ 𝐵); b. ̅̅̅̅̅̅̅
𝐴 ∩ 𝐵 = 𝐴̅ ∪ 𝐵̅ ;
c. ̅̅̅̅̅̅̅
𝐴 ∪ 𝐵 = 𝐴̅ ∩ 𝐵̅; ̅̅̅̅̅̅̅̅̅̅
d. (𝐴 ∪ 𝐵) ∩ 𝐶 = 𝐴̅ ∩ 𝐵̅ ∩ 𝐶;
e. 𝐴 ∩ 𝐵̅ ⊂ 𝐴 ∪ 𝐵; f. (𝐴 ∩ 𝐵) ∩ (𝐴̅ ∪ 𝐶) = Φ.

R: a. Incorectă b. Corectă
c. Corectă d. Corectă
e. Corectă f. Corectă
P.1.3 Pe spațiul de eșantionaj, 𝑆 = {𝑥|0 ≤ 𝑥 ≤ 20}, se consideră evenimentele: 𝐴 =
{𝑥|2 ≤ 𝑥 ≤ 10}, 𝐵 = {𝑥|4 ≤ 𝑥 ≤ 15} și 𝐶 = {𝑥|2 ≤ 𝑥 ≤ 18}. Să se determine
aceleași evenimente ca la problema P.1.1.
R: a. 𝑆 ∪ 𝐶 = 𝑆 b. 𝐴 ∪ 𝐵 = {𝑥|2 ≤ 𝑥 ≤ 15}
c. 𝐴̅ ∩ 𝐶 = {𝑥|10 < 𝑥 ≤ 18} d. 𝐴̅ ∪ (𝐵 ∩ 𝐶) =
e. ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
(𝐴 ∩ 𝐵 ∩ 𝐶) = = {𝑥|𝑥 ∈ [0,2) ∪ [4,20]}
= {𝑥|𝑥 ∈ [0,4) ∪ (10,20]} ̅̅̅̅̅̅̅
f. 𝐴̅ ∩ 𝐵̅ = {𝑥|2 ≤ 𝑥 ≤ 15}
g. (𝐴 ∩ 𝐵) ∪ (𝐵 ∩ 𝐶) ∪ (𝐶 ∩ 𝐴) = {𝑥|2 ≤ 𝑥 ≤ 15}
P.1.4 Utilizând diagramele Euler – Venn, reprezentați următoarele relații care pot fi
stabilite între două evenimente oarecare, 𝐴 și 𝐵, definite pe un spațiu de eșantionaj
𝑆:
a. 𝐴 și 𝐵 evenimente oarecare; b. Dacă 𝐴 se realizează, atunci se
c. 𝐴 și 𝐵 evenimente incompatibile; realizează și 𝐵;
d. Dacă 𝐴 se realizează, atunci 𝐵 nu se realizează;
P.1.5 Considerăm un produs alcătuit din două subansambluri. Definim următoarele
evenimente:
𝐴: primul subansamblu funcționează; 𝐴̅: primul subansamblu este defect;
𝐵: cel de-al doilea component funcționează; 𝐵̅: cel de-al doilea component
este defect.
Folosind notațiile anterioare descrieți următoarele evenimente:
a. Cel puțin o componentă a produsului funcționează;
b. Un subansamblu funcționează și unul este defect.
R: a. 𝐴 ∪ 𝐵; b. (𝐴 ∩ 𝐵̅) ∪ (𝐴̅ ∩ 𝐵)
P.1.6 Pe un raft al unei biblioteci se află 5 cărți de matematică, 6 cărți de chimie și 8 de
mecanică. Știind că nu se pot împrumuta decât două cărți din două domenii diferite,
în câte feluri se pot împrumuta cele 19 cărți?
R: 5 ∙ 6 + 5 ∙ 8 + 6 ∙ 8 = 118
P.1.7 O fundație alcătuită din 25 de membri își alege anual președintele, secretarul și
trezorierul. Să se calculeze în câte moduri diferite se poate alege comitetul director.
Dar, dacă pentru președinte sunt doar trei candidați, pentru secretar cinci
candidaturi, iar pentru trezorier sunt depuse șase candidaturi?
3
R: a. 𝐶25 ;
b. 3 ∙ 5 ∙ 6.
P.1.8 Patru cărți diferite de matematică, șase cărți diferite de fizică și opt de beletristică
trebuie aranjate pe raftul unei biblioteci. În câte feluri pot fi aranjate cărțile, dacă:
a. Nu se are în vedere nici un criteriu de aranjare?

35
b. Dar, dacă cărțile trebuie aranjate pe domenii în următoarea ordine: fizică,
matematică și apoi beletristica?
c. Dar, dacă aranjăm cărțile pe domenii?
d. Dar, dacă doar cărțile de beletristică sunt aranjate împreună?

R: a. (4 + 6 + 8)! = 18! b. 6! ∙ 4! ∙ 8! = 696729600


c. 3! ∙ 6! ∙ 4! ∙ 8! = 4180377600 d. 8! ∙ (4 + 6)! = 146313216000
P.1.9 Un dispozitiv optic este alcătuit din patru lentile. Știind că fiecare lentilă poate fi
̅̅̅̅), în câte moduri putem achiziționa
conformă, sau neconformă (𝐶𝑖 , 𝑁𝑖 , 𝑖 ∈ 1,4
dispozitivul?
𝐴𝑟24 = 24 = 16
1 × (𝐶1, 𝐶2, 𝐶3, 𝐶4) 1 × (𝑁1, 𝑁2, 𝑁3, 𝑁4)
4! 4!
= 4 × (𝐶1, 𝑁2, 𝑁3, 𝑁4) = 4 × (𝑁1, 𝑁2, 𝑁3, 𝐶4)
1!∙3! 3!∙1!
4!
2!∙2!
= 6 × (𝐶1, 𝐶2, 𝑁3, 𝑁4)

R: 𝐴𝑟24 = 24 = 16, adică:


4! 4!
(𝐶1, 𝐶2, 𝐶3, 𝐶4) + (𝐶1, 𝑁2, 𝑁3, 𝑁4) + (𝑁1, 𝑁2, 𝑁3, 𝐶4) +
1! ∙ 3! 3! ∙ 1!
4!
+ (𝐶1, 𝐶2, 𝑁3, 𝑁4) = 16.
2! ∙ 2!
P.1.10 Dacă repetițiile nu sunt permise, câte numere de trei cifre pot fi formate cu
următoarele șase cifre, 2, 3, 5, 6, 7 și 9? Câte dintre acestea sunt mai mici de 400?
Câte dintre ele sunt impare? Dar, câte sunt pare? Câte sunt multiplu de 5?
R: a. 𝐴3 = 6 ∙ 5 ∙ 4 = 120 b. 5 ∙ 4 ∙ 4 = 80
6
c. 5 ∙ 4 ∙ 2 = 40 d. 5 ∙ 4 ∙ 1 = 20

36
Unitatea de învățare 2.

Cuprins
2.1. Introducere ............................................................................................................. 37
2.2. Competențe ............................................................................................................ 37
2.3. Probabilități ........................................................................................................... 37
2.3.1. Definiția clasică a probabilității .............................................................................38
2.3.2. Definiția statistică a probabilității..........................................................................39
2.3.3. Definiția geometrică a probabilității.......................................................................42
2.3.4. Definiția axiomatică a probabilităților ...................................................................44
2.3.4.1. Sistemul de axiome al lui Kolmogorov ......................................................45
2.3.4.2. Consecințele sistemului de axiome al lui Kolmogorov ...............................45
2.3.5. Probabilitate subiectivă ..........................................................................................51
2.4. Rezumat ................................................................................................................. 53
2.5. Test de autoevaluare.............................................................................................. 53

2.1. Introducere
Conținutul a unității de învățare curente se referă la prezentarea
cronologică a apariției, precum și diferitele accepțiuni pe care le are astăzi
noțiunea de probabilitate. În finalul unității de învățare este prezentată și definiția
modernă, axiomatică, a probabilității împreună cu consecințele și proprietățile ei,
ce decurg din această definiție unanim acceptată.

2.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să definească
noțiunea de probabilitate a evenimentelor ce aparțin unui spațiu de eșantionaj.
De asemenea, va fi capabil să utilizeze tehnici și metode adecvate pentru calculul
valorilor probabilităților, unor evenimente, în funcție de informația disponibilă.

Durata medie de parcurgere a primei unități de învățare este de 3 ore.

2.3 PROBABILITĂȚI

Probabilitatea reprezintă noțiunea centrală a teoriei matematice a calculului probabilităților. În


orice experiment aleatoriu există întotdeauna o incertitudine cu privire la faptul că un eveniment
particular al spațiului de eșantionaj se va realiza, sau nu. Ca o măsură a șansei, sau a gradului

37
de realizare, cu care ne putem aștepta ca evenimentul să producă, este convenabil să utilizăm o
valoare numerică cuprinsă între 0 și 1. Dacă suntem siguri că anumite evenimente vor avea loc,
spunem că probabilitatea lor este de 1, sau 100%. Dacă suntem siguri ca evenimentul nu va
avea loc, spunem că probabilitatea este zero. Dacă, de exemplu, probabilitatea este 1⁄4, vom
spune că există o șansă de 25%, pentru ca acesta să se realizeze și o șansă de 75% ca acesta să
nu se producă. Echivalentul afirmației anterioare, putem spune ca șansele sunt împotriva
apariției evenimentului, cu un scor de 75% la 25%, sau 3 la 1.
Definiția 2.1 Un număr real, pozitiv, asociat unui eveniment 𝐴, notat cu 𝑃𝑟(𝐴), sau 𝑝(𝐴)
se numește probabilitatea evenimentului 𝐴.
Deși probabilitatea reprezintă conceptul de bază al acestei teorii matematice, există mai multe
accepțiuni ale acestei noțiuni, [MON 03], [KEL 97], [TAR 89]. În continuare, vom prezenta
aceste interpretări diferite, ale noțiunii probabilitate, pentru cazul spațiilor de eșantionaj
discrete, deoarece acestea oferă o soluție mai simplă din punct de vedere matematic.

2.3.1 DEFINIȚIA CLASICĂ A PROBABILITĂȚII

Această definiție reprezintă, din punct de vedere istoric, prima încercare, realizată de Pascal și
Fermat, pentru a defini probabilitățile.
În tentativa lor de a defini șansa de realizare a unui eveniment, legat de jocul cu zaruri, cei doi
matematicieni au pornit de la natura simetrică a experimentului. Dacă aruncăm un zar perfect,
din punct de vedere geometric, și realizat dintr-un material omogen, este logic că apariția unei
fețe, dintre cele șase, este la fel de probabilă, în comparație cu celelalte.
Definiția 2.2 Dacă considerăm un spațiu de eșantionaj alcătuit din 𝑁 evenimente
elementare, echiprobabile, atunci probabilitatea oricărui rezultat al
experimentului este 1⁄𝑁.

Exemplul 2.1:
Presupunem că avem o urmă cu 8 bile identice, numerotate cu cifrele de la unu
la opt. Se fac extrageri de două bile, fără să reintroducem în urnă prima bilă
extrasă. Să se calculeze probabilitatea evenimentelor elementare. Dar dacă
reintroducem prima bilă extrasă?
8!
Soluție: Spațiul de eșantionaj este alcătuit din 𝑁 = 𝐴28 = 6! = 56 evenimente
elementare echiprobabile.
Probabilitatea evenimentelor elementare este:
1 1
𝑃𝑟(𝐸𝑖 ) = = = 0.017857, 𝑖 ∈ ̅̅̅̅̅̅
1,56.
𝑁 56
În cel de-al doilea caz spațiul de eșantionaj este alcătuit din 𝑁 = 𝐴𝑟82 = 82 = 64 evenimente
elementare echiprobabile.

38
Probabilitatea evenimentelor elementare este, în acest caz:
1 1
𝑃𝑟(𝐸𝑖 ) = = ̅̅̅̅̅̅.
= 0.015625, 𝑖 ∈ 1,64
𝑁 64

Pornind de la valoarea probabilității evenimentelor elementare, se pot calcula probabilitățile


tuturor celorlalte evenimente, ca fiind reuniuni ale acestora.
Definiția 2.3 Pentru un spațiu de eșantionaj finit și la care evenimentele elementare sunt
echiprobabile, probabilitatea unui eveniment oarecare, 𝐴, este raportul dintre
numărul de cazuri favorabile evenimentului considerat, 𝑛𝑓 și numărul
cazurilor posibile, 𝑁:
𝑛𝑓
𝑃𝑟(𝐴) = . (2.1)
𝑁

Exemplul 2.2:
O bilă este extrasă dintr-o urnă ce conține 6 bile roșii, 4 bile albe și 5 bile
galbene. Să se calculeze probabilitatea ca aceasta să fie:
a. roșie; b. albă;
c. galbenă; d. să nu fie roșie;
Soluție: Spațiul de eșantionaj conține 𝑁 = 6 + 4 + 5 = 15 evenimente elementare.
𝑛𝑓 6 2
a. 𝑃𝑟(𝑅) = = 15 = 5 ;
𝑁
𝑛𝑓 4
b. 𝑃𝑟(𝐴) = = 15;
𝑁
𝑛𝑓 5 1
c. 𝑃𝑟(𝐺) = = 15 = 3 ;
𝑁
𝑛𝑓 4+5 3
d. Pr(𝑅̅ ) = = = 5;
𝑁 15

Definițiile 2.2 și 2.3 prezintă o serie de inconveniente:


a) Se aplică doar spațiilor de eșantionaj finite, sau infinit numărabile;
b) Definiția clasică a probabilităților reduce noțiunea de probabilitate, a evenimentelor, la
noțiunea de egal posibilitate de apariție a evenimentelor elementare;
c) Nu la toate aplicațiile se poate aplica ipoteza cazurilor egal posibile;

2.3.2 DEFINIȚIA STATISTICĂ A PROBABILITĂȚII

Apărută aproape simultan cu definiția clasică a probabilităților, această accepțiune, a noțiunii


probabilitate, provine din noțiunea de frecvență, noțiune cu un caracter preponderent
experimental.

39
Exemplul 2.3:
Presupunem că aruncăm de 𝑛 = 100 de ori cu un zar. După fiecare aruncare
se înregistrează fața care apare. Constatăm, în final că fiecare din cele șase fețe
̅̅̅̅, ori și ∑6𝑖=1 𝑚𝑖 = 100.
au apărut de 𝑚𝑖 , 𝑖 ∈ 1,6
Soluție: Dacă ne interesează probabilitatea unui eveniment elementar, de exemplu
apariția feței cu numărul 5, 𝐸5 , frecvența relativă a apariției acestui eveniment
elementar:
𝑚5
𝑓(𝐸5 ) = ,
𝑛
ne poate furniza informații privind șansa de apariție a acestui eveniment, deci
informații privind probabilitatea lui de apariție.

Dacă realizăm o serie mare de probe în cadrul unei experiențe și vom calcula frecvența relativă
de apariție a unui eveniment elementar, asociat experimentului, vom constata că frecvențele
relative vor oscila în jurul unei valori constante fixe, iar deviațiile în jurul acestei valori vor fi,
în cazul măririi numărului de probe, din ce în ce mai mici, figura 2.1.

𝑛𝑖
𝑓(𝐸𝑖 ) =
𝑛

𝑃𝑟(𝐸𝑖 ) 𝑛

Figura 2.1 Relația dintre probabilitate și frecvența relativă

În tabelul 2.1, este prezentată o serie de rezultate obținute în urma aruncării unei monede și
urmăririi apariției feței cu pajura.
Tabelul 2.1 Calculul frecvenței de apariție a unei fețe a banului
𝑚
n m 𝑃𝑟(𝐴) =
𝑛
Buffon 4040 2048 0,507

K. Pearson 12000 6019 0,5016

K. Pearson 24000 12012 0,5005

Această valoare fixă poate fi considerată ca fiind probabilitatea evenimentului analizat.

40
Definiția 2.4 În cazul unui număr suficient de mare de probe, 𝑛, în care evenimentul 𝐸
apare de 𝑚 ori, frecvența relativă poate fi socotită ca valoare a probabilității
evenimentului 𝐸:
𝑚
𝑃𝑟(𝐸) = lim . (2.2)
𝑛→∞ 𝑛

Această valoare poartă denumirea de probabilitate statistică și face posibilă utilizarea teoriei
probabilităților la analiza statistică a fenomenelor aleatorii.

Exemplul 2.4:
O instalație pilot a produs diferite loturi de oțel cu următoarele caracteristici:

Rezistența la Rezistenta la
rupere scăzută rupere ridicată
Nivel scăzut de
impurități 4 43
Nivel ridicat de
impurități 7 6
Considerând că aceste rezultate sunt reprezentative pentru producția firmei,
să se calculeze probabilitatea ca produsele să fie:
a. Cu un nivel scăzut de impurități;
b. Cu rezistență ridicată la rupere;
c. Cu nivel ridicat de impurități și rezistență la rupere ridicată;
d. Cu nivel scăzut de impurități și rezistență la rupere scăzută.
47
Soluție: a. 𝑃𝑟(𝐴) = 60 = 0.7833.
49
a. 𝑃𝑟(𝐵) = 60 = 0.8166
6
b. 𝑃𝑟(𝐶) = 60 = 0.1.
4
c. 𝑃𝑟(𝐷) = 60 = 0.0666.

De asemenea, pornind de la frecvența relativă se pot determina cu ușurință câteva dintre


proprietățile probabilităților. Pentru a le deduce, considerăm datele din exemplul 2.3. Rezultă:
1. Probabilitatea evenimentului imposibil este:
𝑚Φ 0
𝑃𝑟(Φ) = = = 0.
𝑛 𝑛
2. Probabilitatea reuniunii a două sau mai multe evenimente elementare. De exemplu,
considerăm evenimentul A={𝐸3 , 𝐸5 , 𝐸6 }. Vom obține, aplicând definiția statistică a
probabilităților:
𝑚3 + 𝑚5 + 𝑚6 𝑚3 𝑚5 𝑚6
𝑃𝑟(𝐴) = = + + = Pr(𝐸3 ) + Pr(𝐸5 ) + Pr(𝐸6 ).
𝑛 𝑛 𝑛 𝑛

41
Definiția 2.5 Pentru un spațiu de eșantionaj de tip discret, probabilitatea unui eveniment
oarecare este egală cu suma probabilităților evenimentelor elementare ce
compun evenimentul considerat.
3. Aplicând relația anterioară, se poate determina probabilitatea evenimentului sigur, Ω:
6
∑𝑛𝑖=1 𝑛𝑖 𝑛
𝑃𝑟(Ω) = ∑ Pr(𝐸𝑖 ) = = = 1.
𝑛 𝑛
𝑖=1

Exemplul 2.5:
Considerăm problema din exemplul 2.1. Să se calculeze probabilitatea
evenimentului ce constă din extragerea primei bile numerotate cu cifra unu, iar
pentru cea de-a doua bilă nu contează numărul inscripționat pe ea.
Soluție: Notăm evenimentul considerat cu, 𝐵. Constatăm că în cazul în care nu
reintroducem în urnă prima bilă extrasă, evenimentul considerat este de
forma:
𝐵 = {(❶❷), (❶❸), (❶❹), (❶❺), (❶❻), (❶❼), (❶❽)}.
1
Deci, 𝑃𝑟(𝐵) = 7 ∙ 56 = 0.125.

Pentru cazul al doilea, când reintroducem în urnă bila extrasă, evenimentul


considerat este de forma:
𝐵 = {(❶❶), (❶❷), (❶❸), (❶❹), (❶❺), (❶❻), (❶❼), (❶❽)}.
1
Deci, 𝑃𝑟(𝐵) = 8 ∙ 64 = 0.125.

Se constată că și această definiție prezintă o serie de neajunsuri:


a. Nu caracterizează într-un mod unic șansa de realizare a unui eveniment. Ne dă doar
posibilitatea de a compara frecvența apariției unui eveniment, într-o serie de 𝑛 probe, cu
altă serie, pentru care numărul de probe este mai mic sau mai mare;
b. Definiția statistică a probabilității nu reflectă decât stabilitatea asimptotică constatată
experimental, a frecvenței relative, într-un număr arbitrar de mare de probe
independente, ale experimentului;
c. Definiția 2.4 are un caracter mai mult descriptiv decât matematic;
d. Este aplicabilă doar în cazul spațiilor de eșantionaj finite;

2.3.3 DEFINIȚIA GEOMETRICĂ A PROBABILITĂȚII

Datorită neajunsurilor pe care le au definițiile prezentate anterior, o dată cu dezvoltarea teoriei


matematice a măsurii, definiția statistică a probabilităților a putut fi extinsă și prezentată într-o
formă mult mai generală, [TAR 89].

42
Această formă a definiției probabilităților are la bază noțiunea matematică de măsură.
Definiția 2.6 O măsură este o funcție care asociază un număr, de exemplu o mărime, un
volum, sau o suprafață, unei submulțimi a unei mulțimi date.
Acest concept a fost dezvoltat datorită necesității de a realiza integrări pe mulțimi arbitrare, și
nu numai pe intervalele reale, pe care se integra de obicei. Conceptul e important în analiza
matematică și reprezintă un fundament riguros pentru teoria probabilităților și statistică.
Definiția 2.7 Probabilitatea geometrică a unui eveniment oarecare 𝐴, reprezintă raportul
dintre măsura evenimentului considerat, 𝜇(𝐴) și măsura evenimentului sigur,
𝜇(Ω):
𝜇(𝐴)
𝑃𝑟(𝐴) = . (2.3)
𝜇(Φ)
Măsurile ce intervin în expresia geometrică se adoptă în funcție de natura experienței.
Exemplul 2.6:
Două persoane, X și Y, își dau întâlnire între orele 12:00 și 13:00, într-un anumit
loc, venind fiecare independent. În plus, cele două persoane mai fac și
următoarea convenție, primul venit îl așteaptă pe cel de-al doilea 15 minute și
dacă acesta nu vine, pleacă.
Care este probabilitatea ca cele două persoane să se întâlnească?
Soluție: Conform figurii 2.2, rezultă:
𝜇(Ω) = 1 ∙ 1 = 1 și reprezintă suprafața pătratului din figura de mai jos.
1 3 3 9 7
𝜇(𝐴) = 𝜇(Ω) − 2 ∙ 2 ∙ 4 ∙ 4 = 1 − 16 = 16 și reprezintă suprafața hașurată din
𝜇(𝐴) 7
figura 1.10. Deci, 𝑃𝑟(𝐴) = 𝜇(Φ) = .
16

𝑌
1300

1245

𝛀
𝑋
1200 1215 1300

Figura 2.2 Schița pentru rezolvarea exemplului 2.6

43
Cu tot suportul consistent al teoriei măsurii și acestei definiții i-au fost aduse numeroase critici,
în special, privind modului arbitrar de alocare al valorii probabilității, pentru un eveniment
oarecare. Această accepțiune reprezintă, totuși, un pas înainte pentru calculul probabilităților
întrucât permite abordarea probabilităților și pentru cazul spațiilor de eșantionaj infinite.

 Considerăm un spațiu de eșantionaj finit, iar evenimentele elementare


sunt echiprobabile. Definiți în aceste condiții probabilitatea unui
eveniment A.
Precizați avantajele și dezavantajele acestei definiții a probabilităților.
 Precizați relația de calcul pentru definiția statistică a probabilității.
Precizați avantajele și dezavantajele acestei definiții a probabilităților,
precum și principalele proprietăți ce rezultă din această accepțiune a
probabilităților.
 Probabilitatea unui eveniment A este dată de relația:
𝜇(𝐴)
𝑃 𝑟(𝐴) = .
𝜇(Φ)
Precizați semnificația factorilor ce intervin în expresia de mai sus,
precum și avantajele și dezavantajele acestei definiții a probabilităților.
 Să se determine probabilitatea p, pentru următoarele evenimente:
a. Un număr impar apare ca urmare a aruncării unui zar;
b. În urma extragerii unei cărți dintr-un pachet de 52 cărți de joc
obținem un K;
b. Obținem cel puțin o pajură, în urma aruncării de trei ori
consecutiv, a unei monede;
 O bilă este extrasă aleatoriu dintr-o urnă ce conține 10 bile roșii, 8 bile
albe și 6 bile albastre. Calculați probabilitatea ca această bilă să fie:
a. Roșie;
b. Albă;
c. Albastră;
d. Să nu fie albă;
e. Să nu fie roșie sau albă.
 În magazia unei companii se află un lot de materie primă alcătuit din
500 de piese. Știind că 4 dintre ele sunt piese neconforme, calculați
probabilitatea ca extrăgând aleatoriu o piesă aceasta să fie conformă.

2.3.4 DEFINIȚIA AXIOMATICĂ A PROBABILITĂȚILOR

Forma sub care se utilizează astăzi noțiunea de probabilitate a fost dezvoltată, acum aproximativ
77 de ani de către matematicianul rus Andrey Kolmogorov, în condițiile în care teoria

44
probabilităților a început să fie intens utilizată în modelarea fenomenelor științelor naturii,
tehnicii și a fenomenelor economice.
Astfel, a devenit absolut necesar studiul sistematic al conceptelor de bază ale teoriei
probabilităților și de a stabili o modalitate de aplicare, a acestei teorii, într-o structură
axiomatică.
Kolmogorov a reușit crearea acestei structuri axiomatice, apropiind conceptul de probabilitate
de teoria mulțimilor, teoria măsurii și de analiza funcțională.

2.3.4.1 SISTEMUL DE AXIOME AL LUI KOLMOGOROV

Teoria se bazează pe un spațiu de eșantionaj S, finit sau infinit și un sistem 𝒫(𝑆), de submulțimi
ale lui 𝑆, vezi tabelul 1.1. Elementele sistemului (𝑆, 𝒫), adică submulțimile lui S sunt denumite
evenimente aleatorii, [BER 00], [MON 03].
Pe baza sistemului (𝑆, 𝒫), de evenimente aleatorii, în care Ω = 𝑆, reprezintă evenimentul sigur,
Φ, evenimentul imposibil, iar 𝐴 și 𝐴̅ evenimente complementare, probabilitatea de apariție a
unui eveniment este definită pe baza sistemului de axiome al lui Kolmogorov:
Axioma 1: De existență și unicitate
Fiecărui eveniment aleatoriu, 𝐴, din câmpul de evenimente îi este atașat un
număr real nenegativ 𝑃𝑟(𝐴), numit probabilitatea lui 𝐴.
Axioma 2: A unității de măsură
Probabilitatea evenimentului sigur, Ω, este unu, 𝑃𝑟(Ω) = 1.
Axioma 3: De aditivitate
Dacă evenimentele 𝐴1 , 𝐴2 , . . . , 𝐴𝑖 , . . . , 𝐴𝑛 sunt incompatibile două câte două,
𝐸𝑖 ∩ 𝐸𝑗 = 𝛷, 𝑖, 𝑗 = ̅̅̅̅̅
1, 𝑛 ș𝑖 𝑖 ≠ 𝑗, atunci:
𝑛

𝑃𝑟(𝐸1 ∪ 𝐸2 ∪ 𝐸3 … ∪ 𝐸𝑖 … ∪ 𝐸𝑛 ) = ∑ 𝑃𝑟(𝐸𝑖 ). (2.4)


𝑖=1

Sistemul de axiome nu este contradictoriu, iar teoria modernă a probabilităților se bazează pe


el.
Acest concept teoretic al probabilităților, împreună cu o interpretare, în sens larg, a frecvenței
relative de apariție a evenimentelor aleatorii, ce apar în urma unei experiențe, este baza
statisticii matematice.

2.3.4.2 CONSECINȚELE SISTEMULUI DE AXIOME AL LUI KOLMOGOROV

Calculul probabilităților, ca teorie matematică, a fost dezvoltat cu scopul de a permite asocierea


fiecărui eveniment, al unei experiențe, o valoare a probabilității. Din cele prezentate anterior
constatăm că, dacă în cadrul unei experiențe aleatorii ne concentrăm asupra unui eveniment, de
fapt, ne fixăm atenția asupra unei părți din mulțimea probelor experimentului. Astfel, un

45
eveniment poate fi identificat cu un element din mulțimea părților spațiului de eșantionaj
corespunzător.
De aceea, cadrul conceptual al evenimentelor a fost completat cu o nouă noțiune și anume,
câmp de evenimente, [MIH 80], [CRS 81]. În funcție de tipul spațiului de eșantionaj, putem
distinge un câmp de evenimente finit, sau un câmp de evenimente infinit.
Definiția 2.8: Fie 𝑆 o mulțime nevidă, iar 𝒫(𝑆) o familie de părți ale lui 𝑆. Cuplul format
din (𝑆, 𝒫) se numește câmp finit de evenimente, dacă familia 𝒫 verifică
condițiile:
1. Ω ∈ 𝒫(𝑆) și Φ ∈ 𝒫(𝑆).
2. ∀ A ∈ 𝒫(𝑆) ⇒ 𝐴̅ ∈ 𝒫(𝑆).
3. ∀ A, B ∈ 𝒫(𝑆) ⇒ 𝐴 ∪ 𝐵 ∈ 𝒫(𝑆) și 𝐴 ∩ 𝐵 ∈ 𝒫(𝑆).
4. ∀ A, B ∈ 𝒫(𝑆), dacă 𝐴 ⊂ 𝐵 ⇒ 𝐵\𝐴 ∈ 𝒫(𝑆).
Definiția 2.9: Fie 𝑆 o mulțime nevidă, iar 𝒫(𝑆) o familie de părți ale lui 𝑆. Cuplul format
din (𝑆, 𝒫) se numește câmp infinit de evenimente, dacă familia 𝒫 verifică
condițiile:
1. Ω ∈ 𝒫(𝑆) și Φ ∈ 𝒫(𝑆).
2. ∀ A ∈ 𝒫(𝑆) ⇒ 𝐴̅ ∈ 𝒫(𝑆).
3. ∀ A, B ∈ 𝒫(𝑆) ⇒ 𝐴 ∪ 𝐵 ∈ 𝒫(𝑆) și 𝐴 ∩ 𝐵 ∈ 𝒫(𝑆).
4. ∀ A, B ∈ 𝒫(𝑆), dacă 𝐴 ⊂ 𝐵 ⇒ 𝐵\𝐴 ∈ 𝒫(𝑆).
5. ∀ 𝐴𝑖 ∈ 𝒫(𝑆), 𝑖 ∈ 𝒩 ⇒ ⋃∞ ∞
𝑖=1 𝐴𝑖 ∈ 𝒫(𝑆) ș𝑖 ⋂𝑖=1 𝐴𝑖 ∈ 𝒫(𝑆).

Având la bază operațiile algebrice ale teoriei mulțimilor, precum și axiomele enunțate mai sus,
pentru un câmp de evenimente finit sau infinit, se pot deduce următoarele consecințe ale
probabilităților, atașate acestor evenimente:
1. Probabilitatea evenimentului imposibil este zero:
𝑃𝑟(Φ) = 0. (2.5)
Considerăm un eveniment oarecare 𝐴, ce aparține unui spațiu de eșantionaj 𝑆, 𝐴 ∈ 𝒫(𝑆).
Din figura 2.3, se observă că:
𝐴 ∩ Φ = Φ,
adică, cele două evenimente sunt incompatibile. De asemenea, se constată că:
𝐴 ∪ Φ = 𝐴, adică 𝑃𝑟( 𝐴 ∪ Φ) = 𝑃𝑟(𝐴).

𝑆 𝐴̅

Figura 2.3 Diagrama Euler – Venn pentru un eveniment oarecare 𝐴 și contrariul lui, 𝐴̅

46
Aplicând cea de-a treia axiomă asupra relației precedente, obținem:
𝑃𝑟(𝐴) + 𝑃𝑟(Φ) = 𝑃𝑟(𝐴).
Ecuația anterioară este adevărată doar în situația în care 𝑃𝑟(Φ) = 0, deoarece
probabilitatea oricărui eveniment este un număr real nenegativ, conform primei axiome.
2. Probabilitatea unui eveniment oarecare este un număr real cuprins în intervalul [0,1]:
0 ≤ 𝑃𝑟(A) ≤ 1. (2.6)
Considerăm un eveniment oarecare 𝐴, ce aparține unui spațiu de eșantionaj 𝑆, 𝐴 ∈ 𝑆,
precum și evenimentul contrar lui, 𝐴̅. Din figura 2.3, se observă că:
̅ = Φ,
𝐴∩A
adică, cele două evenimente sunt incompatibile. De asemenea, se constată că:
̅ = Ω, adică 𝑃𝑟( 𝐴 ∪ A
𝐴∪A ̅ ) = 𝑃𝑟(Ω).

Aplicând a doua și a treia axiomă asupra relației precedente, obținem:


̅) = 1.
𝑃𝑟(𝐴) + 𝑃𝑟(A (2.7)
̅) ≤
Ecuația anterioară este adevărată doar în situația în care 0 ≤ 𝑃𝑟(𝐴) ≤ 1, și 0 ≤ 𝑃𝑟(A
1, deoarece probabilitatea oricărui eveniment este un număr real nenegativ, conform
primei axiome.
3. Considerăm un eveniment oarecare 𝐴, 𝐴 ∈ 𝒫(𝑆). Probabilitatea evenimentului contrar,
𝐴̅ este:
𝑃𝑟(𝐴̅) = 1 − 𝑃𝑟(𝐴), (2.8)
Această proprietate rezultă din ecuația (2.7).
4. Probabilitatea este subtractilă:
𝑃𝑟(𝐵\𝐴) = 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴), (2.9)
dacă cele două evenimente 𝐴 și 𝐵 se află într-o relație de forma 𝐴 ⊂ 𝐵.
Considerăm două evenimente 𝐴 și 𝐵, 𝐴, 𝐵 ∈ 𝒫(𝑆), astfel încât 𝐴 ⊂ 𝐵. Conform figurii
2.4 observăm că:
𝐴 ∩ (𝐵\𝐴) = Φ,

𝐵\𝐴
𝐵
𝐴

Figura 2.4 Diagrama Euler – Venn pentru două evenimente oarecare 𝐴, 𝐵 ∈ 𝒫(𝑆), 𝐴 ⊂ 𝐵

Aplicând cea de-a treia axiomă asupra relației anterioare și aranjând, apoi, termenii se

47
obține relația (2.9).
5. Probabilitatea este monotonă:
𝑃𝑟(𝐵) ≥ 𝑃𝑟(𝐴), (2.10)
dacă 𝐴 ⊂ 𝐵 și 𝐴, 𝐵 ∈ 𝒫(𝑆).
Pornind de la ecuația (2.9) și de la prima axiomă a lui Kolmogorov, adică:
0 ≤ 𝑃𝑟(𝐵\𝐴) ≤ 1,
rezultă tocmai relația (2.10).
6. Considerăm două evenimente oarecare 𝐴 și 𝐵, 𝐴, 𝐵 ∈ 𝑃(𝑆). Atunci:
𝑃𝑟(𝐴\𝐵) = 𝑃𝑟(𝐴) − 𝑃𝑟(𝐴 ∩ 𝐵) (2.11)
Conform figurii 2.5, vom scrie expresia evenimentului 𝐴 ca o combinație de două
evenimente incompatibile. Se observă că:
(𝐴\𝐵) ∩ (𝐴 ∩ 𝐵) = Φ.
De asemenea,
𝐴 = (𝐴\𝐵) ∪ (𝐴 ∩ 𝐵) și 𝑃𝑟(𝐴) = 𝑃𝑟(𝐴\𝐵) + 𝑃𝑟(𝐴 ∩ 𝐵).
𝐴\𝐵

𝐴 𝐵

𝐴∩𝐵

Figura 2.5 Diagrama Euler – Venn pentru cazul consecinței 6

7. Pentru oricare două evenimente 𝐴 și 𝐵, 𝐴, 𝐵 ∈ 𝑃(𝑆), avem:


𝑃𝑟(𝐴 ∪ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵) (2.12)
Conform schiței din figura 2.6, observăm că:
𝐴 ∩ (𝐵\𝐴) = Φ,
adică cele două evenimente, 𝐴 și 𝐵\𝐴 sunt incompatibe. De asemenea, putem scrie, între
aceleași două evenimente, relația:
𝐴 ∪ (𝐵\𝐴) = 𝐴 ∪ 𝐵 și
𝑃𝑟[𝐴 ∪ (𝐵\𝐴)] = 𝑃𝑟(𝐴 ∪ 𝐵).
Aplicând asupra relației anterioare axioma III, rezultă:
𝑃𝑟(𝐴) + 𝑃𝑟(𝐵\𝐴) = 𝑃𝑟(𝐴 ∪ 𝐵). (2.13)

48
𝐵\𝐴

𝐴
𝐵

𝐴∩𝐵

Figura 2.6 Diagrama Euler – Venn pentru cazul consecinței 7

Tot din figura 2.6, se observă că:


𝐵\𝐴 = 𝐵\(𝐴 ∩ 𝐵) și
(𝐴 ∩ 𝐵) ⊂ 𝐵.
Dacă, asupra celor două evenimente din relațiile anterioare aplicăm ecuația (2.11), vom
obține:
𝑃𝑟(𝐵\𝐴) = 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵).
Înlocuind rezultatul precedent în relația (2.13) și aranjând termenii, rezultă proprietatea
(2.12).

Exemplul 2.7:
Considerăm două evenimente A și B, aparținând unui câmp de
evenimente P(S). Dacă probabilitățile de apariție ale acestor evenimente sunt:
𝑃𝑟(𝐴) = 0.25, 𝑃𝑟(𝐵) = 0.35 și 𝑃𝑟(𝐴 ∩ 𝐵) = 0.15, să se calculeze:
a. 𝑃𝑟(𝐴̅). b. 𝑃𝑟(𝐴 ∪ 𝐵).
c. 𝑃𝑟(𝐴̅ ∩ 𝐵). d. 𝑃𝑟(𝐴 ∩ 𝐵̅ ).
̅̅̅̅̅̅̅
e. 𝑃𝑟(𝐴 ∪ 𝐵 ). f. 𝑃𝑟(𝐴 ∪ 𝐵̅ ).
Soluție: Conform figurii 2.7, rezultă:
f. 𝑃𝑟(𝐴̅) = 1 − Pr(𝐴) = 1 − 0.25 = 0.75;
g. 𝑃𝑟(𝐴 ∪ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵) = 0.25 + 0.35 − 0.15 =
0.45;
h. 𝑃𝑟(𝐴̅ ∩ 𝐵) = 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵) = 0.35 − 0.15 = 0.2;
i. 𝑃𝑟(𝐴 ∩ 𝐵̅ ) = 𝑃𝑟(𝐴) − 𝑃𝑟(𝐴 ∩ 𝐵) = 0.25 − 0.15 = 0.1;
̅̅̅̅̅̅̅
j. 𝑃𝑟(𝐴 ∪ 𝐵 ) = 1 − 𝑃𝑟(𝐴 ∪ 𝐵) = 1 − 0.45 = 0.55;
k. 𝑃𝑟(𝐴 ∪ 𝐵̅ ) = Pr(𝐴) + Pr(𝐵̅ ) − Pr(A ∩ 𝐵̅ ) = 0.25 + 0.65 − 0.1 = 0.8,
sau
𝑃𝑟(𝐴 ∪ 𝐵̅ ) = 1 − 𝑃 𝑟(B) + 𝑃𝑟(𝐴 ∩ 𝐵) = 1 − 0.35 + 0.15 = 0.8.

49
𝐴\𝐵 𝐵\𝐴

𝐴 𝐵

𝐴∩𝐵

Figura 2.7 Diagrama Euler – Venn pentru exemplul 2.7

8. Considerăm 𝑛 evenimente, 𝐴𝑖 ∈ 𝒫(𝑆), 𝑖 ∈ ̅̅̅̅̅


1, 𝑛. Probabilitatea reuniunii celor n
evenimente este:
𝑛 𝑛

𝑃𝑟 (⋃ 𝐴𝑖 ) = ∑ 𝑃𝑟(𝐴𝑖 ) − ∑ 𝑃𝑟(𝐴𝑖 ∩ 𝐴𝑗 ) +
𝑖=1 𝑖=1 1≤𝑖≤𝑗≤𝑛
(2.14)
+ ∑ 𝑃𝑟( 𝐴𝑖 ∩ 𝐴𝑗 ∩ 𝐴𝑘 ) + ⋯ + (−1)𝑛−1 𝑃𝑟(𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑛 ).
1≤𝑖≤𝑗≤𝑘≤𝑛

Ecuația (2.14) reprezintă generalizarea relației (2.12), pentru cazul a 𝑛 evenimente.


Proprietatea (2.14) se demonstrează prin inducție matematică completă. Fără a demonstra
această ecuație, în continuare vom deduce relația de calcul a probabilității pentru
reuniunea a trei mulțimi, 𝐴, 𝐵 și 𝐶:
𝑃𝑟(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃𝑟(𝐴 ∪ 𝐵) + 𝑃𝑟(𝐶) − 𝑃𝑟[(𝐴 ∪ 𝐵) ∩ 𝐶].
Dar, conform ecuației (2.12):
𝑃𝑟(𝐴 ∪ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃 𝑟(𝐴 ∩ 𝐵).
Introducând această ecuație în prima și folosind proprietatea de distributivitate a
intersecției față de reuniune, rezultă:
𝑃𝑟(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵) + 𝑃𝑟(𝐶) −
−𝑃 𝑟[(𝐴 ∩ 𝐶) ∪ (𝐵 ∩ 𝐶)].
Deoarece:
𝑃𝑟[(𝐴 ∩ 𝐶) ∪ (𝐵 ∩ 𝐶)] = 𝑃𝑟(𝐴 ∩ 𝐶) + 𝑃𝑟(𝐵 ∩ 𝐶) − 𝑃𝑟(𝐴 ∩ 𝐵 ∩ 𝐶),
rezultă:
𝑃𝑟(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) + 𝑃𝑟(𝐶) − 𝑃𝑟(𝐴 ∩ 𝐵) −
(2.15)
−𝑃𝑟(𝐴 ∩ 𝐶) − 𝑃𝑟(𝐵 ∩ 𝐶) + 𝑃𝑟(𝐴 ∩ 𝐵 ∩ 𝐶).

50
Exemplul 2.8:
Considerăm experimentul aruncării unui zar la care urmărim
evenimentele: 𝐴 = {1,2,3}, 𝐵 = {2,3} și 𝐶 = {2,4}.
Să se determine probabilitatea evenimentului: 𝐴 ∪ 𝐵 ∪ 𝐶.
Soluție: Varianta I
𝑃𝑟{𝐴 ∪ 𝐵 ∪ 𝐶} = 𝑃𝑟{1,2,3,4}. Întrucât evenimentele {1}, {2}, {3}, {4}, sunt
evenimente elementare, deci incompatibile, obținem:
4 2
𝑃𝑟{𝐴 ∪ 𝐵 ∪ 𝐶} = 𝑃𝑟{1} + 𝑃𝑟{2} + 𝑃𝑟{3} + 𝑃𝑟{4} = 6 = 3.

Varianta II:
3 1 2 1 2 1
𝑃𝑟(𝐴) = 6 = 2 , 𝑃𝑟(𝐵) = 6 = 3 și 𝑃𝑟(𝐶) = 6 = 3 .
2 1 1
𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟{2,3} = 6 = 3 ; 𝑃𝑟(𝐴 ∩ 𝐶) = 𝑃𝑟(𝐵 ∩ 𝐶) = 𝑃𝑟{2} = 6
1
și 𝑃𝑟(𝐴 ∩ 𝐵 ∩ 𝐶) = {2} = 6.

Rezultă, utilizând ecuația (2.15):


1 1 1 1 1 1 1 1 1 2
𝑃𝑟{𝐴 ∪ 𝐵 ∪ 𝐶} = 2 + 3 + 3 − 3 − 6 − 6 + 6 = 2 + 6 = 3.

9. Considerăm 𝑛 evenimente, 𝐴𝑖 ∈ 𝒫(𝑆), 𝑖 ∈ ̅̅̅̅̅


1, 𝑛. Probabilitatea intersecției celor n
evenimente este:
𝑛 𝑛

𝑃𝑟 (⋂ 𝐴𝑖 ) = ∑ 𝑃𝑟(𝐴𝑖 ) − ∑ 𝑃𝑟(𝐴𝑖 ∪ 𝐴𝑗 ) +
𝑖=1 𝑖=1 1≤𝑖≤𝑗≤𝑛
(2.16)
+ ∑ 𝑃𝑟( 𝐴𝑖 ∪ 𝐴𝑗 ∪ 𝐴𝑘 ) + ⋯ + (−1)𝑛−1 𝑃𝑟(𝐴1 ∪ 𝐴2 ∪ ⋯ ∪ 𝐴𝑛 ).
1≤𝑖≤𝑗≤𝑘≤𝑛

Ținând cont de distributivitatea reuniunii față de intersecție, ecuația (2.16) reprezintă


generalizarea relației (2.12) scrisă sub forma:
𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃 𝑟(𝐴 ∪ 𝐵), (2.17)
pentru cazul a 𝑛 evenimente.
Proprietatea (2.17) se demonstrează, de asemenea, prin inducție matematică completă.

2.3.5 PROBABILITATE SUBIECTIVĂ

În foarte multe aplicații practice ale teoriei probabilităților, rezultatele experimentelor nu sunt
echiprobabile, nu există nici un fel de istoric privind rezultatele obținute prin efectuarea de
probe, sau nu există informații cantitative asupra probabilității de apariție a unui eveniment,
insuficient studiat.
Dacă, în asemenea cazuri, trebuie estimate probabilitățile evenimentelor, nu există altă soluție

51
decât să facem apel la așa numitele probabilități subiective. În esență, este vorba de
probabilități atribuite evenimentelor, în mod subiectiv, pe baza șansei cu care credem că
evenimentul studiat se va produce, sau pe baza intuiției. De regulă apelăm la opinia unui expert,
care poate să ne furnizeze informații subiective despre șansa evenimentelor de a se realiza, pe
baza unor evaluări personale.

 Presupunem că avem un spațiu de eșantionaj alcătuit din 4 evenimente


elementare, 𝑆 = {𝑎1 , 𝑎2 , 𝑎3 , 𝑎4 , }. Care din următoarele situații definesc
probabilitățile pe spațiul de eșantionaj 𝑆?
1 1 1 1
a. 𝑃𝑟(𝑎1 ) = 2 , 𝑃𝑟(𝑎2 ) = 3 , 𝑃𝑟(𝑎3 ) = 4 , 𝑃𝑟(𝑎4 ) = 5;
1 1 1 1
b. 𝑃𝑟(𝑎1 ) = 2 , 𝑃𝑟(𝑎2 ) = 4 , 𝑃𝑟(𝑎3 ) = − 4 , 𝑃𝑟(𝑎4 ) = 2;
1 1 1 1
c. 𝑃𝑟(𝑎1 ) = 2 , 𝑃𝑟(𝑎2 ) = 4 , 𝑃𝑟(𝑎3 ) = 8 , 𝑃𝑟(𝑎4 ) = 8;
1 1 1
d. 𝑃𝑟(𝑎1 ) = 2 , 𝑃𝑟(𝑎2 ) = 4 , 𝑃𝑟(𝑎3 ) = 4 , 𝑃𝑟(𝑎4 ) = 0;
 Demonstrați următoarea relație ce poate fi stabilită între trei evenimente
oarecare:
𝑃𝑟(𝐴 ∩ 𝐵 ∩ 𝐶) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) + 𝑃𝑟(𝐶) − 𝑃𝑟(𝐴 ∪ 𝐵) −
−𝑃𝑟(𝐴 ∪ 𝐶) − 𝑃𝑟(𝐵 ∪ 𝐶) + 𝑃𝑟(𝐴 ∪ 𝐵 ∪ 𝐶).
 Fie A și B două evenimente aparținând unui spațiu de eșantionaj. Știind
3 5 3
că: 𝑃𝑟(𝐴) = 8 , 𝑃𝑟(𝐵) = 8 și 𝑃𝑟(𝐴 ∪ 𝐵) = 4, să se calculeze:
𝑃𝑟(𝐴 ∩ 𝐵).

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Definiția clasică a probabilității;  Definiția axiomatică a


 Definiția statistică a probabilităților;
probabilității;  Consecințele sistemului de
 Definiția geometrică a axiome al lui Kolmogorov:
probabilității;  𝑷𝒓(𝚽) = 𝟎;
 Probabilitate subiectivă;  𝟎 ≤ 𝑷𝒓(𝑨) ≤ 𝟏;
 Câmp finit de evenimente;  𝑷𝒓(𝑨 ̅ ) = 𝟏 − 𝑷𝒓(𝑨);
 Câmp infinit de evenimente  Proprietatea de subtracti-
 Axiomele teoriei probabilităților: litate a probabilităților;
 Axioma 1 - de existență și  Proprietatea de monotonie a
unicitate; probabilităților;
 Axioma 2 - a unității de  Probabilitatea diferenței a
măsură; două evenimente;

52
 Axioma 3 - de aditivitate.  Probabilitatea reuniunii a n
 Definiția axiomatică a evenimente oarecare;
probabilităților;  Probabilitatea intersecției a n
evenimente.

Rezumat
Deși probabilitatea reprezintă conceptul de bază, al teoriei matematice
a calculului probabilităților, există mai multe accepțiuni ale acestei noțiuni. De
aceea, în această unitate de învățare au fost prezentate și detaliate diferitele
interpretări ale noțiunii probabilitate. Este vorba de definiția clasică a
probabilității, definiția statistică a probabilității, definiția geometrică a
probabilității și de probabilitatea subiectivă. De asemenea, a fost acordat un
spațiu generos pentru definiția axiomatică a probabilităților și a consecințelor
pe care această definiție le presupune, pentru calculul probabilităților. Odată
cunoscute, aceste accepțiuni, în continuare se poate aborda studiul noțiunii de
probabilitate condiționată.

Test de autoevaluare a cunoștințelor


P.2.1 Un zar este aruncat de 100 de ori. Se obțin următoarele rezultate:
Fața numărul: 1 2 3 4 5 6
Frecvența: 14 18 16 14 18 20

Calculați probabilitățile evenimentelor:


a. Apariția feței cu numărul 4;
b. Apariția fețelor cu număr impar;
c. Apariția fețelor care sunt numere prime.
R: a. 𝑃𝑟(4) = 14 = 0.14 b. 𝑃𝑟(1,3,5) =
14+16+18
= 0.48
100 100
14+18+16+18 66
c. 𝑃𝑟(1,2,3,5) = 100
= 100 = 0.66

P.2.2 Calculați probabilitatea cu care un trăgător cu arcul, care nimerește ținta de


diametru R, la fiecare tragere, nimerește în zona centrală a acesteia.
R: 𝑅 2
𝜋 ∙ (2) 1 𝑅
𝑃𝑟(𝐴) = = 𝑅
𝜋∙ 𝑅2 4
2

P.2.3 Extragem două cărți dintr-un pachet de 52 de cărți de joc bine amestecate.
Calculați probabilitatea ca:
a. Amândouă cărțile să fie de pică;

53
b. Una să fie caro și una treflă.
R: 𝐴2 13∙12 1 2!∙13∙13 13
a. 𝑃𝑟(𝐴) = 𝐴13
2 = 52∙51 = 17; b. 𝑃𝑟(𝐴) = = 102;
52 𝐴252

P.2.4 Extragem cinci cărți dintr-un pachet de 52 de cărți de joc, bine amestecate. Să se
determine probabilitatea de a extrage:
a. Patru ași; b. Patru ași și un K;
c. Trei de 10 și 2 de J; d. 9,10, J,Q și K;
e. Trei cărți de o culoare și 2 cărți de ală culoare; f. nici un as.
R: 5! 𝐴4 ∙𝐴1 𝐶 4 ∙𝐶 1 1
a. 𝑃𝑟(𝐴) = 4!∙1! ∙ 4𝐴5 48 = 4𝐶 5 48 = 54145
52 52
5! 𝐴44 ∙𝐴14 𝐶44 ∙𝐶41 1
b. 𝑃𝑟(𝐵) = ∙ = =
4!∙1! 𝐴552 𝐶525 649740
5! 𝐴34 ∙𝐴24 𝐶43 ∙𝐶42 1
c. 𝑃𝑟(𝐶) = 3!∙2! ∙ 𝐴552
= 𝐶525 = 108290
𝐴14 ∙𝐴14 ∙𝐴14 ∙𝐴14 ∙𝐴14 𝐶41 ∙𝐶41 ∙𝐶41 ∙𝐶41 ∙𝐶41 64
d. 𝑃𝑟(𝐷) = 5! ∙ 𝐴552
= 5
𝐶52
= 162435
5! 4∙𝐴313 ∙3∙𝐴213 3 ∙3∙𝐶 2
4∙𝐶13 13 429
e. 𝑃𝑟(𝐸) = 3!∙2! ∙ 𝐴552
= 5
𝐶52
= 4165
𝐴548 5
𝐶48 35673
f. 𝑃𝑟(𝐸) = = = .
𝐴552 5
𝐶52 54145

P.2.5 Trei becuri sunt extrase aleatoriu dintr-o cutie ce conține 15 becuri, din care 5
sunt defecte. Calculați probabilitatea ca:
a. Nici unul să nu fie defect;
b. Unul singur să fie defect;
c. Cel puțin unu să nu fie defect.
R: 𝐴310 24 3!∙ 5∙𝐴210 45
a. 𝑃𝑟(𝐴) = = ; b. 𝑃𝑟(𝐵) = =
𝐴315 91 2!∙1! 𝐴315 91
24 67
𝑐. 𝑃𝑟(𝐶) = 1 − 𝑃𝑟(𝐴) = 1 − 91 = 91, sau
45 3! 10∙𝐴25 20
𝑃𝑟(1 𝑑𝑒𝑓𝑒𝑐𝑡) = 91, 𝑃𝑟(2 𝑑𝑒𝑓𝑒𝑐𝑡𝑒) = 2!∙1! ∙ 𝐴315
= 91,
𝐴35 2 45 20 2 67
𝑃𝑟(3 𝑑𝑒𝑓𝑒𝑐𝑡𝑒) = = ⇒ 𝑃𝑟(𝐶) = + + = .
𝐴315 91 91 91 91 91

P.2.6 O bilă este extrasă aleatoriu dintr-o urnă ce conține 10 bile roșii, 20 de bile verzi,
15 bile albastre și 5 bile portocalii. Să de calculeze probabilitățile ca bila extrasă:
a. să fie portocalie sau roșie; b. să nu fie albastră;
c. să nu fie roșie sau albastră; d. să fie verde;
d. să fie roșie, verde sau albastră.
R: 15 3 35
a. 𝑃𝑟(𝑃 ∪ 𝑅) = 50 = 10 b. 𝑃𝑟(𝐵) = 𝑃𝑟(𝑅 ∪ 𝑉 ∪ 𝑃) = 50
25 1 20 2
c. 𝑃𝑟(𝐶) = 𝑃𝑟(𝑉 ∪ 𝑃) = 50 = 2 d. 𝑃𝑟(𝑉) = =
50 5
45 9
d. 𝑃𝑟(𝑅 ∪ 𝑉 ∪ 𝐴) = 50 = 10.

P.2.7 O urnă conține 7 bile roșii și 3 albe. Trei bile sunt extrase succesiv din urnă.
Calculați probabilitatea ca primele două bile extrase să fie roșii și a 3-a, albă.

54
R: 𝐴27 ∙ 𝐴13 7∙6∙3 7
Pr(𝐴) = 3 = = .
𝐴10 10 ∙ 9 ∙ 8 40
P.2.8 Pe un raft de bibliotecă se află 10 cărți de matematică și 5 cărți de fizică.
Determinați probabilitatea ca din cele 5 cărți de fizică, anumite trei cărți se află
laolaltă.

R: 3!∙13! 1
𝑃𝑟(𝐴) = 15!
= 35.

P.2.9 Fie 𝐴 și 𝐵 două evenimente aparținând unui spațiu de eșantionaj. Știind că:
3 1 1
𝑃𝑟(𝐴) = 8 , 𝑃𝑟(𝐵) = 2 și 𝑃𝑟(𝐴 ∩ 𝐵) = 4, să se calculeze:

a. 𝑃𝑟(𝐴 ∪ 𝐵); b. 𝑃𝑟(𝐴̅) ș𝑖 𝑃𝑟(𝐵̅);


c. 𝑃𝑟(𝐴̅ ∩ 𝐵̅); d. 𝑃𝑟(𝐴̅ ∪ 𝐵̅);
e. 𝑃𝑟(𝐴 ∩ 𝐵̅); f. 𝑃𝑟(𝐴̅ ∩ 𝐵).
3 1 1 5
R: a. 𝑃𝑟(𝐴 ∪ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵) = 8 + 2 − 4 = 8
5 1
b. 𝑃𝑟(𝐴̅) = 1 − 𝑃𝑟(𝐴) = 8 ; 𝑃𝑟(𝐵̅) = 1 − 𝑃𝑟(𝐵) = 2
3
c. 𝑃𝑟(𝐴̅ ∩ 𝐵̅) = 𝑃𝑟(𝐴
̅̅̅̅̅̅̅
∪ 𝐵) = 1 − 𝑃𝑟(𝐴 ∪ 𝐵) = 8
3
d. 𝑃𝑟(𝐴̅ ∪ 𝐵̅) = 𝑃𝑟(𝐴
̅̅̅̅̅̅̅
∩ 𝐵) = 1 − 𝑃𝑟(𝐴 ∩ 𝐵) = 4, sau
5 1 3 3
𝑃𝑟(𝐴̅ ∪ 𝐵̅) = 𝑃𝑟(𝐴̅) + 𝑃𝑟(𝐵̅) − 𝑃𝑟(𝐴̅ ∩ 𝐵̅) = + − =
8 2 8 4
3 1 1
𝑒. 𝑃𝑟(𝐴 ∩ 𝐵̅) = 𝑃𝑟(𝐴\𝐵) = 𝑃𝑟(𝐴) − 𝑃𝑟(𝐴 ∩ 𝐵) = − =
8 4 8
1 1 1
f. 𝑃𝑟(𝐴̅ ∩ 𝐵) = 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵) = − = .
2 4 4

P.2.10 Fie 𝐴 și 𝐵 două evenimente aparținând unui spațiu de eșantionaj. Știind că:
3 2 1
𝑃𝑟(𝐴 ∪ 𝐵) = 4 , 𝑃𝑟(𝐴̅) = 3 și 𝑃𝑟(𝐴 ∩ 𝐵) = 4, să se calculeze:

a. 𝑃𝑟(𝐴); b. 𝑃𝑟(𝐵);
c. 𝑃𝑟(𝐴 ∩ 𝐵̅);
2 1
R: a. 𝑃𝑟(𝐴) = 1 − 𝑃𝑟(𝐴̅) = 1 − 3 = 3
3 1 1 1
b. 𝑃𝑟(𝐵) = 𝑃𝑟(𝐴 ∪ 𝐵) − 𝑃𝑟(𝐴) + 𝑃𝑟(𝐴 ∩ 𝐵) = 4 − 3 + 4 = 2
1 1 1
c. 𝑃𝑟(𝐴 ∩ 𝐵̅) = 𝑃𝑟(𝐴\𝐵) = 𝑃𝑟(𝐴) − 𝑃𝑟(𝐴 ∩ 𝐵) = − = .
3 4 12

55
Unitatea de învățare 3.

Cuprins
3.1. Introducere ............................................................................................................. 56
3.2. Competențe ............................................................................................................ 56
3.3. Probabilități condiționate ...................................................................................... 56
3.4. Regula generală de înmulțire a probabilităților ................................................... 61
3.5. Formula probabilității totale ................................................................................ 62
3.6. Formula lui Bayes ................................................................................................ 64
3.7. Rezumat ................................................................................................................. 67
3.8. Test de autoevaluare.............................................................................................. 67

3.1. Introducere
Conținutul unității de învățare curente se referă la definirea noțiunii de
probabilitate condiționată. Acest tip de probabilitate permite definirea unor noi
tipuri de evenimente, este vorba de evenimente dependente și independente.
De asemenea, pornind de la definiția probabilității condiționate, în continuare, se
pot demonstra câteva reguli și teoreme importante pentru calculul probabilităților:
regula generală de înmulțire a probabilităților, formula probabilității totale și
teorema lui Bayes.

3.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să definească
noțiunea de probabilitate a unor evenimente dependente, ce aparțin unui spațiu de
eșantionaj. De asemenea, va fi capabil să utilizeze tehnici și metode adecvate
pentru calculul valorilor probabilităților condiționate ale evenimentelor, pe baza
regulii generale de înmulțire a probabilităților, formulei probabilității totale și
teoremei lui Bayes.

Durata medie de parcurgere a primei unități de învățare este de 2 ore.

3.3 PROBABILITĂȚI CONDIȚIONATE

Definițiile probabilităților enunțate în UI 2 se bazează pe ipoteze ferme, adică șansa de apariție


a unui eveniment, sau condițiile de experimentare nu se modifică în timpul efectuării probelor.

56
Probabilitățile de acest tip se mai numesc și probabilități necondiționate.
Sunt, însă, anumite situații în care probabilitatea de apariție a unui eveniment, 𝐸, este
condiționată de realizarea anterioară a unui alt eveniment, 𝐹 cu o anumită probabilitate. O astfel
de probabilitate se numește probabilitate condiționată și se notează cu 𝑃𝑟(𝐸|𝐹). Notația
probabilității condiționate se citește probabilitatea evenimentului 𝐸 condiționat de evenimentul
𝐹.
Exemplul 3.1
Într-o urnă se găsesc 𝑛 bile. Dintre acestea, 𝑚 sunt bile negre (𝑁) și
𝑛 − 𝑚 sunt bile albe (𝐴). Dacă extragem o bilă și apoi o reintroducem în urnă,
apoi extragem din nou etc. – probabilitățile de extragere a unei bile albe sau
negre sunt probabilități necondiționate, întrucât configurația bilelor din urnă se
păstrează neschimbată la fiecare extragere.
Soluție: Dacă extragem o bilă (evenimentul 𝐹) și fără să o introducem înapoi mai
extragem o a doua bilă (evenimentul 𝐸) atunci, vom obține probabilități
condiționate de rezultatul primei extrageri:

Evenimentul 𝐹 𝑁 𝑁 𝐴 𝐴
𝑚 𝑚 𝑛−𝑚 𝑛−𝑚
𝑃𝑟(𝐹)
𝑛 𝑛 𝑛 𝑛
Evenimentul 𝐸 𝑁 𝐴 𝑁 𝐴
𝑚−1 𝑛−𝑚 𝑚 𝑛−𝑚−1
𝑃𝑟(𝐸|𝐹)
𝑛−1 𝑛−1 𝑛−1 𝑛−1
Se constată că probabilitatea evenimentului 𝐸 depinde de realizarea
anterioară a evenimentului 𝐹.
Pentru a deduce expresia de calcul a probabilităților condiționate vom considera un alt exemplu.

Exemplul 3.2
Considerăm o comunitate umană, alcătuită din 𝑁 persoane. În cadrul
acestei comunități trăiesc 𝑁𝐹 , femei și 𝑁𝑃 persoane care sunt pensionare, vezi
figura 3.1.
𝑁𝑃

𝑁𝐹𝑃

𝑁𝐹

Figura 3.1 Diagrama Euler – Venn pentru exemplul 3.2

57
Soluție: Dacă, notăm evenimentul ca o persoană aleasă aleatoriu, din această
populație, este pensionară, cu 𝑃 și cu 𝐹, evenimentul ca această persoană să
fie de sex feminin, rezultă:
𝑁𝑃
𝑃𝑟(𝑃) =
𝑁
și
𝑁𝐹
𝑃𝑟(𝐹) = .
𝑁
Dacă notăm cu 𝑁𝐹𝑃 , numărul de femei are sunt pensionare, în comunitatea
respectivă, putem calcula probabilitatea ca printr-o alegere aleatorie a unei
femei din comunitatea respectivă, aceasta să fie pensionară:
𝑁𝐹𝑃 𝑁𝐹𝑃 𝑁 𝑃𝑟(𝐹 ∩ 𝑃)
𝑃𝑟(𝑃|𝐹) = = ∙ = .
𝑁𝐹 𝑁 𝑁𝐹 𝑃𝑟(𝐹)
Rezultă că relația de calcul a probabilităților condiționate este, prin definiție:
Definiția 3.1 Probabilitatea condiționată a unui eveniment 𝐸, de realizarea anterioară a
unui alt eveniment 𝐹, 𝑃𝑟(𝐹) ≠ 0, este:
𝑃𝑟(𝐸 ∩ 𝐹)
𝑃𝑟(𝐸|𝐹) = . (3.1)
𝑃𝑟(𝐹)
Din relația (3.1), prin simetrie, putem scrie:
𝑃𝑟(𝐹 ∩ 𝐸)
𝑃𝑟(𝐹|𝐸) = . (3.2)
𝑃𝑟(𝐸)
Ținând cont de proprietatea de comutativitate a intersecției, din ecuațiile (3.1) și (3.2), rezultă:
𝑃𝑟(𝐹|𝐸) 𝑃𝑟(𝐸|𝐹) 𝑃𝑟(𝐸 ∩ 𝐹)
= = . (3.3)
𝑃𝑟(𝐹) 𝑃𝑟(𝐸) 𝑃𝑟(𝐸) ∙ 𝑃𝑟(𝐹)
Tot pe baza ecuațiilor (3.1) și (3.2) putem deduce și regula de înmulțire a două evenimente
oarecare, 𝐸 și 𝐹:
𝑃𝑟(𝐸|𝐹) ∙ 𝑃𝑟(𝐹) = 𝑃𝑟(𝐹|𝐸) ∙ 𝑃𝑟(𝐸) = 𝑃𝑟(𝐸 ∩ 𝐹). (3.4)

Exemplul 3.3
Într-un atelier care produce piese de schimb, utilajul de bază
funcționează 95% din timpul de lucru în condiții optime de mediu (evenimentul
A). De asemenea, se cunoaște că în condiții optime de lucru procentul de
rebuturi este 1%, iar în condiții de lucru neconforme, utilajul produce 10%
rebuturi. Să se determine probabilitatea ca o piesă realizată în atelier să fie
neconformă.
Soluție: 𝑃𝑟(𝐴) = 0.95 și 𝑃𝑟(𝐴̅) = 0.05.
Dacă notăm cu 𝐵 evenimentul producerii de rebuturi, putem scrie:
𝑃𝑟(𝐵|𝐴) = 0.01 și 𝑃𝑟(𝐵|𝐴̅) = 0.1.

58
Conform figurii 3.2, rezultă:
𝑃𝑟(𝐵) = 𝑃𝑟(𝐴 ∩ 𝐵) + 𝑃𝑟(𝐴̅ ∩ 𝐵) = 0.095 + 0.005 = 0.01.
Deoarece, 𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟(𝐴) ∙ 𝑃𝑟(𝐵|𝐴) = 0.95 ∙ 0.01 = 0.0095
și 𝑃𝑟(𝐴̅ ∩ 𝐵) = 𝑃𝑟(𝐴̅) ∙ 𝑃𝑟(𝐵|𝐴̅) = 0.05 ∙ 0.1 = 0.005.

𝑃𝑟(𝐴) = 0.95 𝑃𝑟(𝐴̅) = 0.05


Condițiile de funcționare
𝐴 𝐴̅ ale utilajului

𝑃𝑟(𝐵̅|𝐴) = 0.99 𝑃𝑟(𝐵̅|𝐴̅) = 0.9


𝑃𝑟(𝐵|𝐴) = 0.01 𝑃𝑟(𝐵|𝐴̅) = 0.1

𝐵 𝐵̅ 𝐵 𝐵̅ Calitatea produselor

(𝐴 ∩ 𝐵) (𝐴 ∩ 𝐵̅) (𝐴̅ ∩ 𝐵) (𝐴̅ ∩ 𝐵̅)

Figura 3.2 Arborele de evenimente pentru exemplul 3.3

Definiția 3.2 Două evenimente, 𝐸 și 𝐹 se numesc evenimente dependente, dacă


probabilitatea de apariție a unuia este influențează probabilitatea de apariție a
celui de-al doilea printr-o relație de forma (3.1).
În caz contrar, evenimentele se numesc evenimente independente.
Definiția 3.3 Două evenimente, 𝐸 și 𝐹 se numesc evenimente independente, dacă
probabilitatea de apariție a unuia nu este influențează probabilitatea de
apariție a celui de-al doilea.
Pentru a putea deduce relația dintre probabilitățile a două evenimente independente considerăm
ecuațiile (3.1) și (3.2).
Conform definiției 3.3, rezultă că:
𝑃𝑟(𝐸|𝐹) = 𝐸
și
𝑃𝑟(𝐹|𝐸) = 𝐹.
Introducând expresiile anterioare în ecuațiile (3.1) și (3.2), obținem pentru cazul a două
evenimente independente:
𝑃𝑟(𝐹) ∙ 𝑃𝑟(𝐸) = 𝑃𝑟(𝐹 ∩ 𝐸). (3.5)
Deci, pentru două evenimente independente probabilitatea intersecției acestor evenimente este
egală cu produsul probabilităților lor.

Exemplul 3.4
O companie cu 488 de angajați, din care 122 de femei, la finalul anului
trecut a promovat într-o clasă superioară de salarizare 96 de angajați, din care

59
24 de femei. Precizați dacă decizia de creștere a salariului este
nediscriminatorie între bărbați și femei.
Soluție: Considerăm următoarele evenimente:
𝐴 – angajatul este bărbat; 𝐴̅ – angajatul este femeie;
𝑃 – un angajat să fie promovat; 𝑃̅ – un angajat să nu fie promovat.
Cu date problemei putem construi următorul tabel:

Angajați: Promovați: Nepromovați: TOTAL:


Bărbați: 72 294 366
Femei: 24 98 122
TOTAL: 96 392 488
Vom calcula probabilitățile evenimentelor:
366
𝑃𝑟(𝐴) = = 0.75
488
72
Pr(𝐴|𝑃) = = 0.75.
96
Observăm că 𝑃𝑟(𝐴) = 𝑃𝑟(𝐴|𝑃). Deci, decizia de creștere a salariului este
nediscriminatorie.

Proprietatea de independență a evenimentelor poate fi generalizată pentru cazul a 𝑛 evenimente


independente:
Definiția 3.4 𝑁 evenimente 𝐴1 , 𝐴2 , … , 𝐴𝑁 sunt independente dacă și numai dacă, oricare
submulțime 𝐴𝑗1 , 𝐴𝑗2 , … , 𝐴𝑗𝑘 , a acestor evenimente îndeplinește condiția,
[ROS 04]:
𝑃𝑟(𝐴𝑗1 ) ∙ 𝑃𝑟(𝐴𝑗2 ) ∙ … ∙ 𝑃𝑟(𝐴𝑗𝑘 ) = 𝑃𝑟(𝐴𝑗1 ∩ 𝐴𝑗2 ∩ … ∩ 𝐴𝑗𝑘 ). (3.6)

Exemplul 3.5
Considerăm ansamblul mecanic prezentat în figura 3.3. Să se calculeze
probabilitatea ca ansamblul să funcționeze, știind că probabilitatea de
funcționare a fiecărui element component este cea prezentată în figură, iar
defectările componentelor sunt independente.
Soluție: 𝑃𝑟(𝑀) = 𝑃𝑟(𝐴 ∩ 𝐵 ∩ 𝐶) = 0.999875 ∙ 0.85 ∙ 0.99 = 0.8414.
Deoarece:
̅̅̅1 ∩ ̅̅̅
𝑃𝑟(𝐴) = 1 − 𝑃𝑟(𝐴 𝐴2 ∩ ̅̅̅
𝐴3 )
3

= 1 − ∏ 𝑃𝑟(𝐴̅𝑖 ) = 1 − 0.053 = 0.999875.


𝑖=1
𝑃𝑟(𝐵) = 0.85.
̅̅̅1 ∩ ̅̅̅
𝑃𝑟(𝐶) = 1 − 𝑃𝑟(𝐶 ̅̅̅1 ) ∙ 𝑃𝑟(𝐶
𝐶2 ) = 1 − 𝑃𝑟(𝐶 ̅̅̅2 ) = 1 − 0.12 = 0.99.

60
𝑃𝑟(𝐴1 ) = 0.95
𝑃𝑟(𝐶1 ) = 0.90

𝑃𝑟(𝐴2 ) = 0.95 𝑃𝑟(𝐵) = 0.85

𝑃𝑟(𝐶2 ) = 0.90
𝑃𝑟(𝐴3 ) = 0.95

𝐴 𝐵 𝐶

Figura 3.3 Schema componentelor pentru exemplul 3.5

3.4 REGULA GENERALĂ DE ÎNMULȚIRE A PROBABILITĂȚILOR

Regula generală de înmulțire a probabilităților reprezintă o generalizare a ecuațiilor (3.4),


pentru cazul a 𝑁 evenimente despre care nu putem face precizarea că sunt sau nu independente.
În acest caz:
Definiția 3.5 Dacă considerăm 𝑁 evenimente, 𝐴1 , 𝐴2 , … , 𝐴𝑁 , atunci probabilitatea
intersecției acestor evenimente este:
𝑁
𝑃𝑟 (⋂ 𝐴𝑖 ) = Pr(𝐴1 ) ∙ 𝑃𝑟(𝐴2 |𝐴1 ) ∙ 𝑃𝑟(𝐴3 |𝐴1 ∩ 𝐴2 ) ∙ ⋯ ∙
𝑖=1 (3.7)
∙ 𝑃𝑟(𝐴𝑛 |𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑛−1).
Ecuația (3.7) reprezintă doar una din cele 𝑁! relații echivalente care pot fi stabilite în acest caz
și se deduce, după cum urmează.
Pornind de la relația de definiție a probabilităților condiționate, (3.1), putem scrie următoarele
expresii echivalente ținând cont de comutativitatea operației de intersecție:
𝑃𝑟(𝐴1 ) = 𝑃𝑟(𝐴1 ) ;
𝑃𝑟(𝐴1 ∩ 𝐴2 )
𝑃𝑟(𝐴2 |𝐴1 ) = ;
𝑃𝑟(𝐴1 )
𝑃𝑟(𝐴1 ∩ 𝐴2 ∩ 𝐴3 )
𝑃𝑟(𝐴3 |𝐴1 ∩ 𝐴2 ) = ;
𝑃𝑟(𝐴1 ∩ 𝐴2 )
….

Pr(𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑁−1 )
𝑃𝑟(𝐴𝑁−1 |𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑁−2 ) = ;
Pr(𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑁−2 )
Pr(𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑁 )
𝑃𝑟(𝐴𝑁 |𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑁−1 ) = .
Pr(𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑁−1 )
Dacă înmulțim relațiile precedente, membru cu membru și efectuăm simplificările factorilor
care intervin în expresia produsului, obținem ecuația (3.7).

61
Exemplul 3.6
Considerăm o urnă ce conține 5 bile roșii, (R), 6 bile galbene, (G) și 14
bile albastre, (A). Să se calculeze probabilitatea ca extrăgând succesiv trei bile,
fără a introduce bila extrasă în urnă, să obținem în final trei bile de culori
diferite. Dar dacă ne interesează ca cele trei bile să în următoarea succesiune:
(G,A,R)?
Soluție: a. Varianta I: utilizând relația (3.7), obținem:
𝑃𝑟(𝐺 ∩ 𝐴 ∩ 𝑅) = 3! ∙ [𝑃𝑟(𝐺) ∙ 𝑃𝑟(𝐴|𝐺) ∙ 𝑃𝑟(𝑅|𝐺 ∩ 𝐴)] =
6 14 5
= 3! ∙ ∙ ∙ = 0.18206.
25 24 23
Varianta II: utilizând ecuația (2.1):
3! ∙ 𝐴16 ∙ 𝐴114 ∙ 𝐴15
𝑃𝑟(𝐺 ∩ 𝐴 ∩ 𝑅) = = 0.18206.
𝐴325
b. Varianta I: utilizând relația (3.7), obținem:
𝑃𝑟(𝐺 ∩ 𝐴 ∩ 𝑅) = 𝑃𝑟(𝐺) ∙ 𝑃𝑟(𝐴|𝐺) ∙ 𝑃𝑟(𝑅|𝐺 ∩ 𝐴) =
6 14 5
= ∙ ∙ = 0.0304.
25 24 23
Varianta II: utilizând ecuația (2.1):
𝐴16 ∙ 𝐴114 ∙ 𝐴15
𝑃𝑟(𝐺 ∩ 𝐴 ∩ 𝑅) = = 0.0304.
𝐴325

3.5 FORMULA PROBABILITĂȚII TOTALE

Aplicațiile practice ale teoriei probabilităților au condus la analiza unor situații în care, pentru
un anumit experiment, nu mai putem distinge, sau delimita, toate cazurile posibile, deoarece în
aceste cazuri evenimentele elementare își pierd consistența. Cu ale cuvinte, nu mai putem
identifica evenimentele elementare. De aceea, a fost introdusă o nouă noțiune, cea de sistem
complet de evenimente.
Definiția 3.6: Sistemul de evenimente {𝐵𝑖 }𝑛𝑖=1 , 𝐵𝑖 ∈ 𝒫(𝑆), se numește sistem complet de
evenimente, dacă:
𝐵𝑖 ≠ Φ, 𝐵𝑖 ⋂𝐵𝑗 = Φ, 𝑖 ≠ 𝑗 și ⋃𝑛𝑖=1 𝐵𝑖 = Ω.
Fie un sistem complet de evenimente {𝐵𝑖 }𝑛𝑖=1 , definit pe un câmp evenimente, 𝐵𝑖 ∈ (𝑆, 𝒫) și un
eveniment oarecare, 𝐴, aparținând aceluiași câmp de evenimente, 𝐴 ∈ (𝑆, 𝒫), vezi figura 3.4.
Atunci:
Definiția 3.7 Probabilitatea de apariție a evenimentului 𝐴 se calculează cu relația:
𝑛
𝑃𝑟(𝐴) = ∑ 𝑃𝑟 (𝐵𝑖 ) ∙ 𝑃𝑟(𝐴|𝐵𝑖 ). (3.8)
𝑖=1

Ecuația (3.8) reprezintă formula probabilității totale.

62
𝐴 𝐵𝑖

𝐴 ∩ 𝐵𝑖

Figura 3.4 Schema pentru demonstrarea formulei probabilității totale

Deoarece {𝐵𝑖 }𝑛𝑖=1, reprezintă un sistem complet de evenimente, putem scrie următoarele relații:
⋃𝑛𝑖=1 𝐵𝑖 = Ω și 𝐵𝑖 ∩ 𝐵𝑗 = Φ.
De asemenea, conform figurii 3.4, rezultă:
𝑛 𝑛
𝐴 = 𝐴 ∩ Ω = A ∩ (⋃ 𝐵𝑖 ) = ⋃ (𝐴 ∩ 𝐵𝑖 ).
𝑖=1 𝑖=1

̅̅̅̅̅
Se constată că evenimentele: (𝐴 ∩ 𝐵𝑖 ), 𝑖 ∈ 1, 𝑛, sunt incompatibile:
(𝐴 ∩ 𝐵𝑖 ) ∩ (𝐴 ∩ 𝐵𝑗 ) = Φ.
Deci,
𝑛
𝑃𝑟(𝐴) = ∑ 𝑃𝑟(𝐴 ∩ 𝐵𝑖 ).
𝑖=1

Dacă în ecuația precedentă înlocuim valoarea probabilității, 𝑃𝑟(𝐴 ∩ 𝐵𝑖 ), cu expresia (3.4),


adică:
𝑃𝑟(𝐴 ∩ 𝐵𝑖 ) = 𝑃𝑟(𝐵𝑖 ) ∙ 𝑃𝑟(𝐴|𝐵𝑖 ),
în final se obține:
𝑛
𝑃𝑟(𝐴) = ∑ 𝑃𝑟 (𝐵𝑖 ) ∙ 𝑃𝑟(𝐴|𝐵𝑖 ),
𝑖=1

formula probabilității totale.

Exemplul 3.7
În magazia unei firme se află două loturi de piese de același tip. Primul
lot este alcătuit din 100 de piese, din care, 12 piese sunt neconforme, iar în cel
de-al doilea lot compus din 150 de piese, se află 25 piese neconforme. Se iau la
întâmplare, dintr-unul din cele două loturi, 20 piese. Care este probabilitatea
ca între piesele prelevate să găsim 12 piese conforme și 8 neconforme?
Soluție: Pentru rezolvarea problemei vom utiliza formula probabilității totale,
particularizată pentru cazul unui sistem complet de evenimente alcătuit din
două evenimente:
𝑃𝑟(𝐴) = 𝑃𝑟(𝐵) ∙ 𝑃𝑟(𝐴|𝐵) + 𝑃𝑟(𝐵̅ ) ∙ 𝑃𝑟(𝐴|𝐵̅) (3.9)
Notăm:

63
𝐵 – evenimentul prelevării pieselor din primul lot, 𝑃𝑟(𝐵) = 0.5;
𝐵̅ – evenimentul prelevării pieselor din cel de-al doilea lot, , 𝑃𝑟(𝐵̅ ) = 0.5;
𝐴 – evenimentul ca din cele 20 piese prelevate 12 sunt conforme și 8
neconforme.
8 8
20! 𝐴12 88 ∙ 𝐴12
12
𝐶88 ∙ 𝐶12
𝑃𝑟(𝐴|𝐵) = ∙ 20 = 20 = 0.000189;
12! ∙ 8! 𝐴100 𝐶100
12 8
𝐶125 ∙ 𝐶25
𝑃𝑟(𝐴|𝐵̅ ) = 20 = 0.005246.
𝐶150
Rezultă:
𝑃𝑟(𝐴) = 0.5 ∙ 0.000189 + 0.5 ∙ 0.005246 = 0.002717.

3.6 FORMULA LUI BAYES

Definiția 3.8 Dacă evenimentele {𝐵𝑖 }𝑛𝑖=1, formează un sistem complet de evenimente pe un
câmp evenimente (𝑆, 𝒫), atunci pentru orice eveniment 𝐴 ∈ (𝑆, 𝒫):
𝑃𝑟(𝐵𝑖 |𝐴) =
Pr(𝐵𝑖 ) ∙ Pr(𝐴|𝐵𝑖 ) (3.10)
= .
Pr(𝐵1 ) ∙ Pr(𝐴|𝐵1) + Pr(𝐵2 ) ∙ Pr(𝐴|𝐵2) + … + Pr(𝐵𝑛 ) ∙ Pr(𝐴|𝐵𝑛 )
Ecuația (3.10) poartă denumirea de formula lui Bayes.
Conform regulii de înmulțire a probabilităților, ecuația (3.4), obținem:
𝑃𝑟(𝐴 ∩ 𝐵𝑖 ) = 𝑃𝑟(𝐵𝑖 ) ∙ 𝑃𝑟(𝐴|𝐵𝑖 ),
𝑃𝑟(𝐵𝑖 ∩ 𝐴) = 𝑃𝑟(𝐴) ∙ 𝑃𝑟(𝐵𝑖 |𝐴).
Din egalitățile precedente, rezultă:
𝑃𝑟(𝐵𝑖 ) ∙ 𝑃𝑟(𝐴|𝐵𝑖 )
𝑃𝑟(𝐵𝑖 |𝐴) = .
𝑃𝑟(𝐴)
Dacă, în această relație, înlocuim numitorul cu expresia formulei probabilității totale, relația
(3.8), se obține:
𝑃𝑟(𝐵𝑖 ) ∙ 𝑃𝑟(𝐴|𝐵𝑖 )
𝑃𝑟(𝐵𝑖 |𝐴) = 𝑛 ,
∑𝑖=1 𝑃𝑟 (𝐵𝑖 ) ∙ 𝑃𝑟(𝐴|𝐵𝑖 )
formula lui Bayes.

Exemplul 3.8
O anumită Societate comercială se aprovizionează cu materiale de la 4
furnizori, conform tabelului alăturat.
Presupunând că procentul de neconformități realizat de fiecare dintre acești
furnizori este, respectiv 5%, 3%, 2% ș𝑖 8%, să se determine probabilitatea ca

64
un produs aprovizionat, ales aleatoriu din magazia unde sunt depozitate acestea,
să fie neconform și să provină de la furnizorul 𝐵.

Furnizorul Cantitate
𝐴 60%
𝐵 20%
𝐶 5%
𝐷 15%
Soluție: Notăm cu:
𝐴 - evenimentul ca un produs aprovizionat să fie neconform;
𝐵 - evenimentul ca un produs aprovizionat să provină de la furnizorul B.
Conform teoremei lui Bayes, rezultă:
𝑃𝑟{𝐴|𝐵} ∙ 𝑃𝑟{𝐵}
𝑃𝑟{𝐵|𝐴} = .
∑𝐷
𝑖=𝐴 𝑃𝑟{𝐴|𝑖}∙ 𝑃𝑟{𝑖}
Deci,
0.03 ∙ 0.20
𝑃𝑟{𝐵|𝐴} = = 0.122.
0.05 ∙ 0.6 + 0.03 ∙ 0.20 + 0.02 ∙ 0.05 + 0.08 ∙ 0.15

Exemplul 3.9
Într-o anumită comunitate, recensământul populației a evidențiat
următoarea situație, referitoare la numărul de copii din cadrul unei familii:

Numărul de copii/familie: 0 1 2 3
Probabilitatea: 0.20 0.50 0.25 0.05
Știind, de asemenea, că probabilitatea de a se naște un băiat, sau o fată, este
de 50%, să se calculeze:
a. Probabilitatea ca într-o familie, aleasă în mod aleatoriu, să existe doar
un băiat;
b. Probabilitatea ca într-o familie cu doi copii, aleasă în mod aleatoriu,
unul dintre copii să fie băiat.
Soluție: a. Conform formulei probabilității totale:
3

𝑃𝑟{1𝐵} = ∑ 𝑃𝑟{𝐵|𝐶𝑗 } ∙ 𝑃𝑟{𝐶𝑗 }


𝑗=0

Unde s-a notat cu 𝐶𝑗 , 𝑗 = ̅̅̅̅


0,3 numărul de copii dintr-o familie și cu 𝐵
evenimentul ca într-o familie să fie un băiat. Rezultă, conform formulei
probabilității totale:
3!
𝑃𝑟{𝐵} = 0 ∙ 0.2 + 0.5 ∙ 0.5 + 2! ∙ 0.52 ∙ 0.25 + ∙ 0.53 ∙ 0.05
2! ∙ 1!
= 0.39375.

65
b. Notăm cu 𝐴 evenimentul ca într-o familie să fie doi copii și cu 𝐵,
evenimentul ca în familia respectivă să existe un băiat. Rezultă, conform
definiției probabilităților condiționate:
Pr(𝐴 ∩ 𝐵) = 𝑃𝑟{𝐵|𝐴} ∙ 𝑃𝑟(𝐴).
Dar,
𝑃𝑟{𝐵|𝐴} = 𝑃𝑟{(B, F), (F, B)} = 2! ∙ 0.52 = 0.5
și
𝑃𝑟(𝐴 ∩ 𝐵) = 0.25 ∙ 0.5 = 0.125.
Rezultă:
𝑃𝑟(𝐴 ∩ 𝐵) 0.25 ∙ 0.5
𝑃𝑟{𝐴|𝐵} = = = 0.3174.
𝑃𝑟{𝐵} 0.39375

 Definiți noțiunea de probabilitate condiționată a unui eveniment E, de


realizarea anterioară a unui alt eveniment F și precizați relația de calcul
a ei.
 Deduceți relația de calcul a regulii de înmulțire a două evenimente
oarecare, E și F.
 Utilizând diagramele Euler – Venn, reprezentați următoarele relații care
pot fi stabilite între două evenimente oarecare, A și B, definite pe un spațiu
de eșantionaj S:
a. A și B evenimente oarecare; b. Dacă A se realizează atunci se
c. A și B evenimente incompatibile; realizează și B;
e. A și B evenimente independente; d. Dacă A se realizează atunci B nu
se realizează.
 Definiți noțiunile: evenimente dependente și evenimente independente.
Care este ecuația de calcul a probabilității intersecției a două evenimente
independente.
 Enunțați regula generală de înmulțire a probabilităților.
 Definiți noțiunea de sistem complet de evenimente și reprezentați într-o
diagramă Euler-Venn un astfel de sistem complet de evenimente.
 Precizați care este formula probabilității totale.
 Demonstrați ecuația (3.9).
 Enunțați teorema lui Bayes.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

66
 Probabilități necondiționate;  Regula generală de înmulțire a
probabilităților;
 Probabilitate condiționată;
 Formula probabilității totale;
 Evenimente dependente;
 Formula lui Bayes.
 Evenimente independente;

Rezumat
În această unitate de învățare au fost introduse și definite două noi tipuri
de evenimente: evenimente dependente și evenimente independente. Asociat
acestor evenimente s-a prezentat relația de calcul a probabilității condiționate,
precum și condiția pe care trebuie să o îndeplinească două sau mai multe
evenimente pentru a putea fi considerate independente. Pornind de la aceste
evenimente s-au definit câteva reguli și formule de calcul: regula generală de
înmulțire a probabilităților, formula probabilității totale și formula lui Bayes.
În continuare, se va defini noțiunea de variabilă aleatorie, noțiune fundamentală
pentru aplicațiile moderne ale probabilităților.

Test de autoevaluare a cunoștințelor


P.3.1 Considerăm trei cutii ce conțin, amestecate, tije filetate cu filet metric și cu
trapezoidal, de aceleași dimensiuni:
 Cutia I: conține 10 tije cu filet metric și 4 cu filet trapezoidal;
 Cutia II: conține 6 tije cu filet metric și 2 cu filet trapezoidal;
 Cutia III: conține 8 tije cu filet metric și 2 cu filet trapezoidal.
La întâmplare, dintr-o cutie, extragem o tijă filetată. Care este probabilitatea ca
acesta să fie cu filet trapezoidal?
1
R: 𝑃𝑟(𝐼) = 𝑃𝑟(𝐼𝐼) = 𝑃𝑟(𝐼𝐼𝐼) = 3.
1 2 1 1 1 1
𝑃𝑟(𝑇𝑟) = 3 ∙ 7 + 3 ∙ 4 + 3 ∙ 5 = 0.245.

5
M
𝑃𝑟(𝑀|𝐼) =
7

1 2
Pr(𝐼) = 𝑃𝑟(𝑇𝑟|𝐼) = Tr.
3 7
3 M
𝑃𝑟(𝑀|𝐼𝐼) =
4
1
Pr(𝐼𝐼) =
3
1
𝑃𝑟(𝑇𝑟|𝐼𝐼) = Tr.
4

4 M
1 𝑃𝑟(𝑀|𝐼𝐼𝐼) =
Pr(𝐼𝐼𝐼) = 5
3

1
𝑃𝑟(𝑇𝑟|𝐼𝐼𝐼) = Tr.
5

67
P.3.2 Fie A și B două evenimente aparținând unui spațiu de eșantionaj. Știind că:
3 5 3
𝑃𝑟(𝐴) = 8 , 𝑃𝑟(𝐵) = 8 și 𝑃𝑟(𝐴 ∪ 𝐵) = 4, să se calculeze: 𝑃𝑟(𝐴|𝐵) și 𝑃𝑟(𝐵|𝐴).

R: 3 5 3 1
𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∪ 𝐵) = + − =
8 8 4 4
𝑃𝑟(𝐴 ∩ 𝐵) 1 8 2
𝑃𝑟(𝐴|𝐵) = = ∙ =
𝑃𝑟(𝐵) 4 5 5
𝑃𝑟(𝐴 ∩ 𝐵) 1 8 2
𝑃𝑟(𝐵|𝐴) = = ∙ =
𝑃𝑟(𝐴) 4 3 3
P.3.3 O cutie conține 8 produse, de același tip, din care, 3 sunt defecte. Cea de-a doua
cutie conține 5 produse, din care, 2 sunt defecte. Extragem aleatoriu câte un
produs din fiecare cutie.
a. Care este probabilitatea ca amândouă produse să nu fie defecte?
b. Care este probabilitatea ca un produs fie defect și unul nu?
c. Dacă un produs este defect și unul, nu, care este probabilitatea ca produsul
defect să provină din prima cutie?
R: a. 𝑃𝑟(𝑁𝐷|𝐼) = 5 și 𝑃𝑟(𝑁𝐷|𝐼𝐼) = 3 ⇒ 𝑝 = 5 ∙ 3 = 3
8 5 8 5 8
3 2 3
b. Probabilitatea de a extrage două produse defecte este 8 ∙ 5 = 20
3 3 19
𝑝 = 1 − 8 − 20 = 40, sau
Din cutia I extragem un produs defect și din cutia II un produs
funcțional:
3 3 9
𝑝1 = ∙ = .
8 5 40
Din cutia II extragem un produs defect și din cutia I un produs
funcțional:
5 2 1 9 1 19
𝑝2 = 8 ∙ 5 = 4, ⇒ 𝑝 = 𝑝1 + 𝑝2 = 40 + 4 = 40
c. Considerăm evenimentul:
𝑋, 𝑋 = {produsul defect provine din prima cutie} și evenimentul
𝑌, 𝑌 = {un produs este defect și unul nu este defect}:
9
𝑃𝑟(𝑋 ∩ 𝑌) = 𝑝1 = 40.
19 𝑃𝑟(𝑋∩𝑌) 9 40 9
𝑃𝑟(𝑌) = 40 ⇒ 𝑝 = 𝑃𝑟(𝑋|𝑌) = 𝑃𝑟(𝑌)
= 40 ∙ 19 = 19

P.3.4 Dacă 𝑃𝑟(𝐴|𝐵) = 0.4 și 𝑃𝑟(𝐵) = 0.8 și 𝑃𝑟(𝐴) = 0.5, atunci evenimentele 𝐴 și
𝐵 sunt independente?
R: Deoarece 𝑃𝑟(𝐴|𝐵) ≠ 𝑃𝑟(𝐴) atunci evenimentele nu sunt independente
P.3.5 Fie 𝑃𝑟(𝐴 ∪ 𝐵) = 0.75 și 𝑃𝑟(𝐴 ∩ 𝐵) = 0.25. Putem determina 𝑃𝑟(𝐴) și 𝑃𝑟(𝐵)?
Răspundeți la întrebarea precedentă, cunoscând următoarele precizări
suplimentare:
a. Evenimentele 𝐴 și 𝐵 sunt independente.
b. Evenimentele 𝐴 și 𝐵 sunt incompatibile.
R: 𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟(𝐴) ∙ 𝑃𝑟(𝐵)
𝑎. {
𝑃𝑟(𝐴 ∪ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵)
0.25 = 𝑃𝑟(𝐴) ∙ 𝑃𝑟(𝐵)
{
0.75 = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 0.25
0.25
𝑃𝑟(𝐴) + = 1.00
𝑃𝑟(𝐴)

68
𝑃𝑟(𝐴)2 − 𝑃𝑟(𝐴) + 0.25 = 0 ⇒ 𝑃𝑟(𝐴) = 0.5 ⇒ 𝑃𝑟(𝐵) = 0.5
b. Imposibil deoarece, evenimentele A și B sunt incompatibile, deci
(𝐴 ∩ 𝐵) = Φ și 𝑃𝑟(𝐴 ∩ 𝐵) = 0.

P.3.6 Fie 𝑃𝑟(𝐴) = 0.4 și 𝑃𝑟(𝐴 ∪ 𝐵) = 0.7. Calculați 𝑃𝑟(𝐵), dacă:


a. Evenimentele 𝐴 și 𝐵 sunt independente.
b. Evenimentele 𝐴 și 𝐵 sunt incompatibile.
R: 𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟(𝐴) ∙ 𝑃𝑟(𝐵)
a. {
𝑃𝑟(𝐴 ∪ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵)
𝑃𝑟(𝐴 ∩ 𝐵) = 0.4 ∙ 𝑃𝑟(𝐵)
{
0.7 = 0.4 + 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∩ 𝐵)
0.3
0.3 = 𝑃𝑟(𝐵) − 0.4 ∙ 𝑃𝑟(𝐵) ⇒ 𝑃𝑟(𝐵) = = 0.5
0.6
b. 𝑃𝑟(𝐴 ∪ 𝐵) = 𝑃𝑟(𝐴) + 𝑃𝑟(𝐵) ⇒ 𝑃𝑟(𝐵) = 0.7 − 0.4 = 0.3.
P.3.7 Fie două evenimente, 𝐴 și 𝐵, incompatibile. Determinați care dintre relațiile
următoare sunt adevărate:
a. 𝑃𝑟(𝐴|𝐵) = 𝑃𝑟(𝐴); b. 𝑃𝑟(𝐴 ∪ 𝐵|𝐶) = 𝑃𝑟(𝐴|𝐶) + 𝑃𝑟(𝐵|𝐶);
c. 𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟(𝐴) ∙ 𝑃𝑟(𝐵); 𝑃𝑟(𝐴|𝐵) 𝑃𝑟(𝐵|𝐴)
𝑑. = .
𝑃𝑟(𝐵) 𝑃𝑟(𝐴)
Dar dacă, evenimentele A și B sunt independente ?
R: I. a. fals; II. a. adevărat;
b. adevărat; b. fals;
c. fals; c. adevărat;
d. adevărat; d. fals.
P.3.8 Dacă 𝑃𝑟(𝐴|𝐵) = 0.3 și 𝑃𝑟(𝐵) = 0.8 și 𝑃𝑟(𝐴) = 0.3, atunci evenimentul 𝐵 și
complementul lui 𝐴 sunt independente?

R: 𝑃𝑟(𝐴̅) = 1 − 𝑃𝑟(𝐴) = 0.7 și 𝑃𝑟(𝐴̅|𝐵) = 1 − 𝑃𝑟(𝐴|𝐵) = 0.7,


deci 𝐴̅ și 𝐵 sunt independente.
P.3.9 Cunoscând că 𝑃𝑟(𝐴|𝐵) = 0.7, 𝑃𝑟(𝐴) = 0.5 și 𝑃𝑟(𝐵) = 0.2, să se determine
𝑃𝑟(𝐵|𝐴).

R: 𝑃𝑟(𝐴 ∩ 𝐵) = 𝑃𝑟(𝐴|𝐵) ∙ 𝑃𝑟(𝐵) = 0.7 ∙ 0.2 = 0.14.


𝑃𝑟(𝐴 ∩ 𝐵) 0.14
𝑃𝑟(𝐵|𝐴) = = = 0.28
𝑃𝑟(𝐴) 0.5
P.3.10 O urnă conține 8 bile roșii, 3 bile albe și 9 bile galbene. Dacă extragem 3 bile,
să se determine probabilitatea ca:
a. toate trei să fie roșii b. toate trei să fie albe;
c. 2 bile să fie roșii și una galbenă; d. cel puțin una să fie albă;
e. cele trei bile să fie câte una din fiecare f. cele trei bile să fie extrase în
culoare; succesiunea: roșie, albă galbenă.

R: 𝑎. 𝑃𝑟(𝐴) = 𝑃 𝑟(𝑅 ∩ 𝑅 ∩ 𝑅) = 𝑃𝑟(𝑅) ∙ 𝑃𝑟(𝑅|𝑅) ∙ 𝑃𝑟(𝑅|𝑅 ∩ 𝑅) =


8 7 6
= ∙ ∙ .
20 19 18
𝑏. 𝑃𝑟(𝐵) = 𝑃 𝑟(𝐴 ∩ 𝐴 ∩ 𝐴) = 𝑃𝑟(𝐴) ∙ 𝑃𝑟(𝐴|𝐴) ∙ 𝑃𝑟(𝐴|𝐴 ∩ 𝐴) =

69
3 2 1
= ∙ ∙ .
20 19 18
3! 𝐴23 ∙ 𝐴19 𝐶32 ∙ 𝐶91 7
𝑐. 𝑃𝑟(𝐶) = ∙ 3 = 3 = .
2! ∙ 1! 𝐴20 𝐶20 95
3 3
𝐴17 𝐶17 34 34 23
̅) =
𝑑. 𝑃𝑟(𝐷 ̅)
3 = 3 = 57 ⟹ 𝑃𝑟(𝐷) = 1 − 𝑃𝑟(𝐷 = 1 − 57 = 57.
𝐴20 𝐶20
𝐴18 ∙ 𝐴13 ∙ 𝐴19 𝐶81 ∙ 𝐶31 ∙ 𝐶91 18
𝑒. 𝑃𝑟(𝐸) = 3! ∙ = = .
𝐴320 3
𝐶20 95
8 3 9 3
𝑓. 𝑃𝑟(𝐹) = 𝑃𝑟(𝑅) ∙ 𝑃𝑟(𝐴|𝑅) ∙ 𝑃𝑟((𝐺)|𝐴 ∩ 𝑅) = ∙ ∙ = .
20 19 18 95

70
Unitatea de învățare 4.

Cuprins
4.1. Introducere ............................................................................................................. 71
4.2. Competențe ............................................................................................................ 71
4.3. Variabile aleatorii .................................................................................................. 71
4.3.1. Funcția de repartiție ...............................................................................................75
4.3.2. Variabile aleatorii discrete .....................................................................................78
4.3.3. Variabile aleatorii continue ....................................................................................81
4.4. Rezumat ................................................................................................................. 88
4.5. Test de autoevaluare.............................................................................................. 88

4.1. Introducere
Metoda de calcul a probabilităților, prezentată pe larg în unitățile de
învățare precedente este o metodă descriptivă și destul de greoaie. De aceea, în
teoria probabilităților a fost introdusă noțiune de variabilă aleatorie.
În cadrul prezentei unități de învățare se definește această noțiune și în funcție de
tipul ei se introduc noi funcții care realizează asocierea dintre spațiul de
eșantionaj, valorile pe care le ia variabila aleatorie și probabilitățile asociate. Sunt,
de asemenea, prezentate și proprietățile pe care aceste funcții le au.

4.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să definească
noțiunea de variabilă aleatorie asociată unor experimente aleatorii. De asemenea,
va fi capabil să utilizeze tehnici și metode adecvate pentru calculul valorilor
probabilităților pentru diferite evenimentele prin utilizarea funcției de repartiție
și/sau a funcției de probabilitate, în cazul variabilelor aleatorii discrete, respectiv
a funcției densitate de probabilitate, în cazul variabilelor aleatorii continue.

Durata medie de parcurgere a primei unități de învățare este de 3 ore.

4.3 VARIABILE ALEATORII

Metoda de calcul a probabilităților, prezentată pe larg în unitățile de învățare precedente este o


metodă descriptivă, ce diferă foarte mult de situațiile reale în care studiem fenomene aleatorii.

71
Acest lucru rezultă din majoritatea exemplelor de experimente aleatorii prezentate în care
spațiul de eșantionaj a fost definit pe baza unei descrieri a mulțimii rezultatelor posibile ale
experimentelor. Pornind de la valorile atribuite probabilităților evenimentelor elementare și
folosind conceptele de bază ale calcului probabilităților se pot determina apoi, probabilitățile
diferitelor evenimente.
În studiul fenomenelor naturale întâlnim, frecvent, mărimi care iau valori numerice reale, în
funcție de o serie de factori aleatorii/întâmplători, astfel încât cercetarea acestor fenomene se
realizează prin diferite procedee de măsurare.

Exemplul 4.1
Considerăm următoarele experimente aleatorii:
a. Analiza numărului zilnic al absenților într-o instituție;
b. Determinarea numărul cumpărătorilor dintr-un magazin, într-o oră;
c. Aruncarea unei monede până apare pajura;
d. Măsurarea dimensiunilor unor piesele executate pe mașini-unelte;
e. Determinarea înălțimii persoanelor dintr-un grup;
f. Măsurarea cantității zilnice, de benzină, vândută într-o benzinărie.
Soluție: Observăm din exemplul 4.1, că în studiul acestor experiențe aleatorii apar
diferite de mărimi caracterizate de valori întâmplătoare, iar valorile pe care le
iau sunt funcții de rezultatul experimentului. În unele cazuri, descrieri ale
rezultatelor probelor sunt suficiente, dar în alte cazuri, este util să se asocieze
un număr fiecărui rezultat al spațiului de eșantionaj, prin care rezumăm
rezultatul unei probe efectuate în cadrul unui experiment.

Deoarece rezultatul obținut, în urma efectuării de probe în cadrul unui experiment, nu este
cunoscut în avans, valoarea rezultată a variabilei noastre nu este nici ea cunoscută în avans. Din
acest motiv, în teoria probabilităților a fost introdus un nou concept, de bază, pentru variabila
care asociază o valoare numerică fiecărui rezultat al unui experiment aleatoriu. Este vorba de
variabila aleatorie, [GIB 76], [MET 76], [SPI 01]:
Definiția 4.1: Variabila aleatorie reprezintă o mărime care în funcție de rezultatul unui
experiment poate lua orice valoare dintr-o mulțime bine determinată de valori
numită mulțimea valorilor posibile.
O variabilă aleatorie se notează cu majuscule, de exemplu 𝑋. După ce efectuăm o probă, în
cadrul experimentului considerat, valoarea măsurată a variabilei aleatorii este notată cu o literă
mică, 𝑥.

Exemplul 4.2
Într-un depozit cu piese de calitate (50%) și cu piese neconforme (50%)
se extrag succesiv trei piese punând după fiecare extragere, piesa la loc.
Ca valoare asociată unui eveniment aleatoriu se consideră numărul
pieselor de calitate, obținut în urma a trei extrageri.
Soluție: În urma extragerii celor trei piese se obțin opt evenimente elementare (23 )

72
echiprobabile. Aceste evenimente și probabilitățile asociate, precum și
valorile variabilei aleatorii sunt prezentate în tabelul de mai jos.
𝑬𝟏 = 𝑬𝟐 = 𝑬𝟑 = 𝑬𝟒 = 𝑬𝟓 = 𝑬𝟔 = 𝑬𝟕 = 𝑬𝟖 =
𝑺:
{𝑵, 𝑵, 𝑵} {𝑵, 𝑵, 𝑪} {𝑵, 𝑪, 𝑵} {𝑪, 𝑵, 𝑵} {𝑪, 𝑪, 𝑵} {𝑪, 𝑵, 𝑪} {𝑵, 𝑪, 𝑪} {𝑪, 𝑪, 𝑪}
𝑿: 𝑥1 = 0 𝑥2 = 1 𝑥2 = 1 𝑥2 = 1 𝑥2 = 2 𝑥2 = 2 𝑥2 = 2 𝑥3 = 3
1 1 1 1 1 1 1 1
𝑷𝒓(𝑬𝒊 ):
8 8 8 8 8 8 8 8

În figura 4.1 este prezentată metoda de definire a unei variabile aleatorii


pentru cazul exemplului 4.2.

𝐸5 = {𝑁, 𝐶, 𝐶}
𝐸2 = {𝑁, 𝑁, 𝐶}
𝐸8 = {𝐶, 𝐶, 𝐶}
𝐸3 = {𝑁, 𝐶, 𝑁}
𝐸6 = {𝐶, 𝑁, 𝐶}
𝐸1 = {𝑁, 𝑁, 𝑁} 𝑆
𝐸4 = {𝐶, 𝑁, 𝑁} 𝐸7 = {𝐶, 𝐶, 𝑁}

𝑋: 𝑆 ⟶ ℛ
0 1 2 3

Figura 4.1: Definirea variabilei aleatorii pentru cazul exemplului 4.2.

Această procedură, nu numai că ne permite să înlocuim un spațiu eșantionaj alcătuit din


elemente arbitrare printr-un nou spațiu eșantionaj, având ca elemente numerele reale, dar ne
permite, de asemenea, să folosim procedeele algebrice, prezentate în UI 1, pentru calculul
probabilităților. În plus, cele mai multe probleme în domeniul științei și ingineriei au la bază
diferite măsurători cantitative.
Definiția 4.1 reprezintă una dintre primele definiții atribuite acestui concept. Ulterior, odată cu
dezvoltarea teoriei axiomatice a probabilităților, a putut fi formulată o nouă definiție, mult mai
riguroasă, pentru noțiunea de variabilă aleatorie.
Definiția 4.2: O variabilă aleatorie este o funcție măsurabilă care atribuie un număr real
pentru fiecare eveniment elementar al spațiului eșantionaj asociat unui
experiment aleatoriu:
𝑋: 𝑆 → ℛ
Se poate demonstra că dacă 𝑋 și 𝑌 sunt două variabile aleatorii, în sensul definiției 4.2, atunci
𝑋 + 𝑌, 𝑋 − 𝑌, 𝑋 ∙ 𝑌, 𝑋⁄𝑌, 1⁄𝑌, 𝑘 ∙ 𝑋 sau 𝑋 𝑘 , unde 𝑘 ∈ ℛ, sunt de asemenea variabile aleatorii.
Variabilele aleatorii le putem clasifica în funcție de tipul spațiului de eșantionaj pe care sunt
definite. Distingem astfel:

73
a. Variabile aleatorii discrete.
În unele experimente, putem înregistra în urma efectuării de probe, serii finite de valori
numerice reale, limitate la valorile discrete ce aparțin unui domeniu al axei reale, cum ar
fi cazul exemplului 4.1, punctele a și b. În alte experiențe, cum ar fi cazul exemplului 4.1,
punctul c, putem obține un număr infinit de valori numerice distincte.
Definiția 4.3: O variabilă aleatorie discretă este o variabilă aleatorie definită pe un spațiu
de eșantionaj finit sau infinit numărabil.
b. Variabile aleatorii continue.
În alte experimente, valorile variabilei aleatorii 𝑋, obținute prin măsurare sunt de fapt
distincte, dar, deoarece gama de valori posibile este atât de mare, ar fi mai convenabil să
se considere 𝑋, ca o variabilă aleatorie continuă. Să analizăm cazul exemplului 4.1,
punctele d, e și f. Măsurătorile care sunt efectuate se realizează prin intermediul unor
echipamente de măsurare care au o anumită precizie, iar rezultatele obținute sunt limitate
la anumite valori care, ne-ar putea conduce la concluzia că variabila aleatorie este de tip
discret. Cu toate acestea, pentru analiza din punct de vedere probabilist, a experimentului,
este mai convenabil să presupunem că măsurătorile actuale sunt valorile unei variabile
aleatorii ce poate lua orice valoare dintr-un interval finit sau infinit al axei numerelor reale.
Definiția 4.4: O variabilă aleatorie continuă este o variabilă aleatorie definită pe un spațiu
de eșantionaj infinit nenumărabil.
Variabila aleatorie, ca și concept fundamental al teoriei probabilităților, este o noțiune ce
cuprinde două aspecte esențiale:
1. Un prim aspect se referă la valorile pe care variabila aleatorie le poate lua, ca expresie
a evenimentelor elementare asociate unui experiment. Analiza din punct de vedere
probabilist al fenomenelor aleatorii nu operează cu variabila aleatorie în sine, ci doar cu
valorile pe care aceasta le poate lua.
2. Cel de-al doilea aspect se referă la probabilitățile cu care variabila aleatorie poate lua
valorile din mulțimea valorilor posibile, vezi figura 4.2.
Definiția 4.5: Se numește repartiția unei variabile aleatorii corespondența dintre valorile
posibile ale variabilei aleatorii și probabilitățile corespunzătoare.

𝑒2 = {𝑁, 𝑁, 𝐶} 𝑒5 = {𝑁, 𝐶, 𝐶} 𝑃𝑟(𝑒𝑖 ) = 𝑃𝑟(𝑋 = 𝑥𝑖 )


𝑒8 = {𝐶, 𝐶, 𝐶}
𝑒3 = {𝑁, 𝐶, 𝑁}
𝑒6 = {𝐶, 𝑁, 𝐶}
𝑒1 = {𝑁, 𝑁, 𝑁}
𝑒4 = {𝐶, 𝑁, 𝑁} 𝑒7 = {𝐶, 𝐶, 𝑁}
𝑆

𝑋
0 1 2 3
Figura 4.2: Repartiția unei variabile aleatorii

74
Această corespondență dintre valorile posibile ale variabilei aleatorii și probabilitățile
corespunzătoare se realizează prin intermediul funcției de repartiție, vezi figura 4.3.

4.3.1 FUNCȚIA DE REPARTIȚIE

Pentru a putea calcula valorile probabilităților evenimentelor asociate unei variabile aleatorii a
fost introdusă noțiunea de funcție de repartiție, [MIH 80].
Definiția 4.6: Fie o variabilă aleatorie, 𝑋, definită pe un spațiu de eșantionaj 𝑆. Dacă definim
evenimentul 𝐴𝑥 ca fiind mulțimea evenimentelor elementare 𝐸 pentru care
𝑋 ≤ 𝑥, adică:
𝐴𝑥 = {𝐸|𝑋(𝐸) ≤ 𝑥} (4.1)
sau, folosind o notație simplificată
𝐴𝑥 = {𝑋 ≤ 𝑥} (4.2)
și
𝑃𝑟(𝐴𝑥 ) = 𝑃𝑟{𝑋 ≤ 𝑎}, (4.3)
atunci, probabilitatea (4.3) definește o nouă funcție, 𝐹𝑋 : ℛ → [0.1], numită
funcția de repartiție a variabilei aleatorii 𝑋, notată cu:
𝐹𝑋 (𝑥) = 𝑃𝑟{𝑋 ≤ 𝑥}. (4.4)

𝑒2 = {𝑁, 𝑁, 𝐶} 𝑒5 = {𝑁, 𝐶, 𝐶} 𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥)


𝑒8 = {𝐶, 𝐶, 𝐶}
𝑒3 = {𝑁, 𝐶, 𝑁}
𝑒6 = {𝐶, 𝑁, 𝐶}
𝑒1 = {𝑁, 𝑁, 𝑁}
𝑒4 = {𝐶, 𝑁, 𝑁} 𝑒7 = {𝐶, 𝐶, 𝑁}
𝑆

𝑋
0 1 2 3
Figura 4.3: Funcția de repartiție unei variabile aleatorii

Exemplul 4.3
Considerăm problema din exemplul 4.2. Să se calculeze funcția de
repartiție.
Soluție:
1
 𝐹(0) = 8 , întrucât evenimentul 𝑋 ≤ 0 reprezintă submulțimea {0};
1
 𝐹(1) = 2 , întrucât evenimentul 𝑋 ≤ 1 reprezintă submulțimea {0,1};
7
 𝐹(2) = 8 , întrucât evenimentul 𝑋 ≤ 2 reprezintă submulțimea {0,1,2}.
8
 𝐹(3) = 8, întrucât evenimentul 𝑋 ≤ 3 reprezintă mulțimea {0,1,2,3} = Ω.

75
Proprietățile funcției de repartiție:

a. Funcția de repartiție 𝐹 este nedescrescătoare pe ℛ adică, ∀𝑥1 , 𝑥2 ∈ ℛ și 𝑥1 < 𝑥2 , atunci


𝐹(𝑥1 ) ≤ 𝐹(𝑥2 ).
Pentru a demonstra această proprietate vom utiliza proprietatea de monotonie a
probabilităților, vezi UI 2, punctul 2.3.4.2.
Pentru aceasta considerăm două intervale, pe axa reală, de forma: {𝑋 ≤ 𝑥1 } și {𝑋 ≤ 𝑥2 }.
Deoarece 𝑥1 < 𝑥2 , rezultă că {𝑋 ≤ 𝑥1 } ⊂ {𝑋 ≤ 𝑥2 }. Deci:
𝑃𝑟{𝑋 ≤ 𝑥1 } ≤ 𝑃𝑟{𝑋 ≤ 𝑥2 } și 𝐹(𝑥1 ) ≤ 𝐹(𝑥2 ).

b. Valoarea funcției de repartiție pentru 𝑥 → −∞ este:


𝐹(−∞) = lim 𝐹(𝑥) = 0 (4.5)
𝑥→−∞

Această proprietate rezultă din considerentul că un eveniment de forma {𝑋 ≤ −∞} este,


evident, evenimentul imposibil, iar probabilitatea evenimentului imposibil este zero.

c. Valoarea funcției de repartiție pentru 𝑥 → ∞ este:


𝐹(+∞) = lim 𝐹(𝑥) = 1 (4.6)
𝑥→+∞

La fel ca în cazul punctului b, un eveniment de forma {𝑋 ≤ ∞} este, evident, evenimentul


sigur, iar probabilitatea evenimentului sigur este unu.

d. Funcția de repartiție este continuă la stânga, ∀ 𝑥0 ∈ ℛ:


𝐹(𝑥0 − 0) = lim 𝐹(𝑥) = 𝐹(𝑥0 ). (4.7)
𝑥↑𝑥0

Fie un șir strict crescător de numere reale, {𝑥𝑛 }𝑛∈𝒩 , convergent către valoarea 𝑥0 ∈ ℛ.
Considerăm următoarele evenimente, vezi figura 4.4:
𝐴 = {𝐸|𝑋(𝐸) ≤ 𝑥0 }, 𝐴0 = {𝐸|𝑋(𝐸) ≤ 𝑥1 }, … , 𝐴𝑖 = {𝐸|𝑥𝑖−1 < 𝑋(𝐸) ≤ 𝑥𝑖 }, … , 𝐴𝑛 =
{𝐸|𝑥𝑛−1 < 𝑋(𝐸) ≤ 𝑥𝑛 }.
Între aceste evenimente se pot stabili următoarele relații:
𝐴𝑖 ∩ 𝐴𝑗 = Φ, ∀ 𝑖 ≠ 𝑗,
și
𝐴 = 𝐴0 ∪ 𝐴1 ∪ … ∪ 𝐴𝑖 … ∪ 𝐴𝑛 ∪ …
Dar:
𝑛

𝑃𝑟(𝐴) = ∑ 𝑃𝑟(𝐴𝑖 ) și 𝐹(𝑥0 ) = 𝑃𝑟(𝐴), 𝐹(𝑥1 ) = 𝑃𝑟(𝐴0 ),


𝑖=0
𝐹(𝑥𝑖 ) − 𝐹(𝑥𝑖−1 ) = 𝑃𝑟(𝐸|𝑋(𝐸) ≤ 𝑥𝑖 ) − 𝑃𝑟(𝐸|𝑋(𝐸) ≤ 𝑥𝑖−1 ) = 𝑃𝑟(𝐴𝑖 )
Rezultă, că
𝐹(𝑥0 ) = 𝐹(𝑥1 ) + [𝐹(𝑥2 ) − 𝐹(𝑥1 )] + … + [𝐹(𝑥𝑛+1 ) − 𝐹(𝑥𝑛 )] + …
Deci, 𝐹(𝑥0 ) = lim 𝐹(𝑥𝑛 ), adică 𝐹(𝑥) este continuă la stânga în orice punct 𝑥0 ∈ ℛ.
𝑛→∞

76
𝐴

𝐴1 𝐴𝑖 𝐴𝑛−1 𝐴𝑛 𝐴𝑛+1
𝐴0

𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑛−11 𝑥𝑛 𝑥𝑛+1 𝑥0

Figura 4.4: Demonstrarea proprietății de continuitate la stânga a funcției 𝐹(𝑥)

Din relația (4.4), tragem concluzia că funcția de repartiție ne permite să calculăm probabilitățile
asociate tuturor valorilor pe care le poate lua variabila aleatorie, utilizând intervale de forma
(4.2).
S-a preferat definirea funcției de repartiție sub forma ecuației (4.4), deoarece ea ne permite să
determinăm cu ușurință probabilități de forma: 𝑃𝑟(𝑋 = 𝑥), 𝑃𝑟(𝑋 < 𝑥), 𝑃𝑟(𝑎 < 𝑋 < 𝑏) și
𝑃𝑟(𝑋 ≥ 𝑥).
Cu alte cuvinte, pentru a cunoaște probabilitățile tuturor evenimentelor de forma {𝑋 ∈ 𝐼}, unde
𝐼 reprezintă un interval al dreptei reale, este suficient să cunoaștem probabilitățile
evenimentelor de forma {𝑋 ≤ 𝑥}, pentru orice 𝑥 ∈ ℛ.
Pentru a ilustra modul de calcul al probabilității, pentru cazul în care variabila aleatorie ia valori
cuprinse într-un interval al axei reale, delimitat de două puncte 𝑎 și 𝑏, vom evidenția
următoarele evenimente, conform schiței alăturate:
𝐴 = {𝑋 < 𝑎}, 𝐵 = {𝑋 < 𝑏}; 𝐶 = {𝑋 = 𝑎} și 𝐷 = {𝑋 = 𝑏}

𝐵
𝐴 𝐶 𝐷

𝑎 𝑏

Figura 4.5: Calculul probabilității ca 𝑋 să aparțină unui interval al axei reale

Între cele patru mulțimi se pot stabili următoarele relații:


𝐴 ⊂ 𝐵; (𝐴 ∪ 𝐶) ⊂ 𝐵; 𝐴 ⊂ (𝐵 ∪ 𝐷) și (𝐴 ∪ 𝐶) ⊂ (𝐵 ∪ 𝐷).
Rezultă :
a. 𝑃𝑟(𝑎 < 𝑋 ≤ 𝑏) = 𝑃𝑟[(B ∪ D)\(A ∪ C)] = 𝑃𝑟(𝐵 ∪ 𝐷) − 𝑃𝑟(𝐴 ∪ 𝐶) =
= 𝑃𝑟(𝑋 ≤ 𝑏) − 𝑃𝑟(𝑋 ≤ 𝑎) = 𝐹(𝑏) − 𝐹(𝑎).
b. 𝑃𝑟(𝑎 < 𝑋 < 𝑏) = 𝑃𝑟[B\(A ∪ C)] = 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴 ∪ 𝐶) =

77
= 𝑃𝑟(𝑋 < 𝑏) − 𝑃𝑟(𝑋 ≤ 𝑎) = 𝐹(𝑏) − 𝐹(𝑎) − 𝑃𝑟(𝑋 = 𝑏).
c. 𝑃𝑟(𝑎 ≤ 𝑋 < 𝑏) = 𝑃𝑟[B\A] = 𝑃𝑟(𝐵) − 𝑃𝑟(𝐴) =
= 𝐹(𝑏) − 𝐹(𝑎) − 𝑃𝑟(𝑋 = 𝑏) + 𝑃𝑟(𝑋 = 𝑎).
d. 𝑃𝑟(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃𝑟[(B ∪ D)\A] = 𝑃𝑟(𝐵 ∪ 𝐷) − 𝑃𝑟(𝐴) =
= 𝐹(𝑏) − 𝐹(𝑎) + 𝑃𝑟(𝑋 = 𝑎).
e. 𝑃𝑟(𝑋 > 𝑏) = 1 − 𝑃𝑟(𝑋 ≤ 𝑏) = 1 − 𝐹(𝑏).
f. 𝑃𝑟(𝑋 ≥ 𝑏) = 1 − 𝑃𝑟(𝑋 ≤ 𝑏) + 𝑃𝑟(𝑋 = 𝑏) = 1 − 𝐹(𝑏) + 𝑃𝑟(𝑋 = 𝑏).
Deoarece, alura funcției de repartiție, precum și modul de definire și de utilizare al funcției de
repartiție depinde de tipul variabilei aleatorii, în continuare vom detalia aceste aspecte pentru
cele două tipuri de variabile aleatorii.

 Definiți variabila aleatorie și clasificați tipurile de variabile aleatorii.


Precizați spațiile de eșantionaj pe care sunt acestea definite.
 Precizați care sunt cele două aspecte esențiale pe care orice variabilă
aleatorie trebuie să le cuprindă.
 Definiți funcția de repartiție.
 Enumerați proprietățile funcției de repartiție.
 Exprimați, folosind funcția de repartiție, următoarele probabilități:
 𝑃𝑟(𝑋 ≤ 𝑎);
 𝑃𝑟(𝑋 < 𝑎);
 𝑃𝑟(𝑎 < 𝑋 ≤ 𝑏) ;
 𝑃𝑟(𝑎 < 𝑋 < 𝑏);
 𝑃𝑟(𝑎 ≤ 𝑋 < 𝑏);
 𝑃𝑟(𝑎 ≤ 𝑋 ≤ 𝑏)
 𝑃𝑟(𝑋 > 𝑏);
 𝑃𝑟(𝑋 ≥ 𝑏).

4.3.2 VARIABILE ALEATORII DISCRETE

Considerăm o variabilă aleatorie discretă, 𝑋. Conform definiției 4.3, această variabilă aleatorie
poate lua un număr finit, sau infinit numărabil de valori:
𝑥1 < 𝑥2 < 𝑥3 < ⋯ < 𝑥𝑖 < ⋯.
Definiția 4.7: Aplicația 𝑝𝑋 , 𝑝𝑋 : 𝐷 → [0,1], unde 𝐷 = {𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑖 , … }, care face ca
fiecărei valori pe care o poate lua variabila aleatorie 𝑋 să-i corespundă o
valoare a probabilității:
𝑝𝑋 (𝑥𝑖 ) = 𝑃𝑟(𝑋 = 𝑥𝑖 ), (4.8)
se numește funcția de probabilitate, sau funcția de masă a probabilității.
În mod uzual, funcția de probabilitate a variabilei aleatorii discrete se definește sub forma unui

78
tabel (tablou) de repartiție:
𝑥1 𝑥2 𝑥3 … 𝑥𝑖 …
𝑋: (𝑝 𝑝2 𝑝3 … 𝑝𝑖 … ). (4.9)
1

Din ecuația (4.9) se observă că tabloul repartiției unei variabile aleatorii discrete caracterizează
complet evenimentele elementare ce se pot asocia lui 𝑋, din punctul de vedere al valorilor
variabilei aleatorii, precum și probabilității lor de apariție. De asemenea:
𝑝𝑋 (𝑥𝑖 ) ∈ [0,1] (4.10)
și
𝑛

∑ 𝑝𝑋 (𝑥𝑖 ) = 1, (4.11)
𝑖=1

deoarece, ∑𝑛𝑖=1 𝑝𝑖 reprezintă probabilitatea întregului spațiu de eșantionaj, sau probabilitatea


evenimentului sigur.
Reprezentată grafic, funcția de probabilitate are alura unei diagrame cu bare, ca cea din figura
4.6.
Cunoscând tabloul de repartiție al unei variabile aleatorii 𝑋, se poate determina cu ușurință
funcția de repartiție, pe baza definiției 4.6:
0, dacă − ∞ < 𝑥 < 𝑥1
𝑝1 , dacă 𝑥1 ≤ 𝑥 < 𝑥2
𝑝1 + 𝑝2 , dacă 𝑥2 ≤ 𝑥 < 𝑥3
𝑝1 + 𝑝2 + 𝑝3 , dacă 𝑥3 ≤ 𝑥 < 𝑥4
𝐹𝑋 (𝑥) = 𝑃𝑟{𝑋 ≤ 𝑥} = … ,
𝑖

∑ 𝑝𝑖 , dacă 𝑥3 ≤ 𝑥 < 𝑥4
𝑖=1

{ 1, dacă 𝑥𝑛 ≤ 𝑥
Mai concis, ecuația anterioară se poate scrie:

𝐹𝑋 (𝑥) = 𝑃𝑟{𝑋 ≤ 𝑥} = ∑ 𝑝𝑋 (𝑥𝑖 ). (4.12)


𝑥𝑖 ≤𝑥

𝑝𝑋 (𝑥𝑖 )

𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑛 𝑋

Figura 4.6: Alura funcției de probabilitate, 𝑝𝑋 (𝑥𝑖 ), pentru o variabilă aleatorie discretă

79
În cazul unei variabile aleatorii discrete, funcția de repartiție, ecuația (4.12), trebuie să respecte
cele patru proprietăți precizate la punctul 4.1. De aceea, alura funcției de repartiție este sub
forma unei scări, vezi figura 4.7.
𝐹(𝑥)
∑𝑛𝑖=1 𝑝𝑖 = 1.0

𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑛 𝑋

Figura 4.7: Alura funcției de repartiție, 𝐹(𝑥), pentru o variabilă aleatorie discretă

Exemplul 4.4
Un eșantion din trei piese este extras, fără reîntoarcerea piesei extrase,
dintr-un lot format din 15 piese, dintre care două sunt neconforme. Dacă notăm
cu 𝑋 numărul de piese neconforme din eșantion, să se determine:
a) Funcția de probabilitate;
b) Tabloul repartiției variabilei aleatorii discrete, X;
c) Funcția de repartiție a variabilei aleatorii discrete, X;
d) Să se calculeze 𝑃𝑟(𝑋 ≤ 0.5), 𝑃𝑟(0 ≤ 𝑋 ≤ 1.5), 𝑃𝑟(𝑋 > 0.5).
e) Să se reprezinte grafic funcția de repartiție și cea de probabilitate.
13 12 11 22
Soluție: a) 𝑃𝑟(𝑋 = 0) = (15) ∙ (14) ∙ (13) = 35

𝑃𝑟(𝑋 = 1) = 𝑃𝑟(𝐶, 𝑁, 𝐶) + 𝑃𝑟(𝐶, 𝐶, 𝑁) + 𝑃𝑟(𝑁, 𝐶, 𝐶) =


13 2 12 13 12 2 2 13 12 12
= (15) ∙ (14) ∙ (13) + (15) ∙ (14) ∙ (13) + (15) ∙ (14) ∙ (13) = 35,

𝑃𝑟(𝑋 = 2) = 𝑃𝑟(𝐶, 𝑁, 𝑁) + 𝑃𝑟(𝑁, 𝑁, 𝐶) + 𝑃𝑟(𝑁, 𝐶, 𝑁) =


13 2 1 2 1 13 2 13 1 1
= (15) ∙ (14) ∙ (13) + (15) ∙ (14) ∙ (13) + (15) ∙ (14) ∙ (13) = 35.

0 1 2
b) 𝑋: (22 12 1 );
35 35 35

0 𝑥<0
22
0≤𝑥<1
35
c) 𝐹(𝑥) = 34
1≤𝑥<2
35
{1 2≤𝑥

80
d)
0.7 1.2
𝑝(𝑥) 𝐹(𝑥)
0.6 1
0.5
0.8
0.4
0.6
0.3
0.4
0.2
0.1 0.2
𝑋
0 0
0 1 2 𝑋 -2 0 2 4

22
e) 𝑃𝑟(𝑋 ≤ 0.5) = 𝐹(0) = 35.
34
𝑃𝑟(0 ≤ 𝑋 ≤ 1.5) = 𝐹(2) = 35.
13
𝑃𝑟(𝑋 > 0.5) = 1 − 𝑃𝑟(𝑋 ≤ 0.5) = 1 − 𝐹(0) = 35.

4.3.3 VARIABILE ALEATORII CONTINUE

Considerăm o variabilă aleatorie continuă, 𝑋. Conform definiției 4.4, această variabilă poate
lua toate valorile din interiorul unui interval finit sau infinit al axei reale. Să presupunem, că 𝑋
poate lua orice valoare în intervalul real 𝑎 și 𝑎 + Δ, unde ∆, reprezintă un număr arbitrar,
pozitiv. Putem scrie:
(𝑎 < 𝑋 ≤ 𝑎 + Δ) ⊆ (𝑎 ≤ 𝑋 ≤ 𝑎 + Δ).
În termeni de probabilități, relația anterioară devine:
𝑃𝑟(𝑎 < 𝑋 ≤ 𝑎 + Δ) ≤ 𝑃𝑟(𝑎 ≤ 𝑋 ≤ 𝑎 + Δ).
Probabilitatea 𝑃𝑟(𝑎 < 𝑋 ≤ 𝑎 + Δ) poate fi exprimată prin intermediul funcției de repartiție
(vezi punctul 4.1):
𝑃𝑟(𝑎 < 𝑋 ≤ 𝑎 + Δ) = 𝐹(𝑎 + Δ) − 𝐹(𝑎).
Rezultă:
𝐹(𝑎 + Δ) − 𝐹(𝑎) ≤ 𝑃𝑟(𝑎 ≤ 𝑋 ≤ 𝑎 + Δ).
Deoarece s-a demonstrat anterior că funcția de repartiție este continuă, membrul stâng al
ecuației anterioare este zero dacă, Δ → 0. De asemenea, membrul drept al ecuației anterioare
devine 𝑃𝑟(𝑋 = 𝑎), dacă Δ → 0. Se obține, deci, în cazul unei variabile aleatorii continue:
𝑃𝑟(𝑋 = 𝑎) = 0, ∀𝑎 ∈ ℛ. (4.13)
Ecuația (4.13) indică faptul că, în cazul unei variabile aleatorii continue valoarea probabilității
unui eveniment elementar este zero. Afirmația anterioară nu presupune faptul că acestea
reprezintă evenimentul imposibil. În cazul unei variabile aleatorii continue, evenimentele
elementare, de forma 𝑋 = 𝑎, unde 𝑎 ∈ ℛ, reprezintă evenimente ale spațiului de eșantionaj
având probabilitatea de apariție zero.

81
Ca o consecință a ecuației (4.13) rezultă și următoarele relații adevărate, pentru cazul unei
variabile aleatorii continue:
𝑃𝑟(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃𝑟(𝑎 < 𝑋 ≤ 𝑏) = 𝑃𝑟(𝑎 ≤ 𝑋 < 𝑏) = 𝑃𝑟(𝑎 < 𝑋 < 𝑏) (4.14)
De asemenea, observăm că în cazul unei variabile aleatorii continue, datorită proprietății (4.13)
nu mai putem utiliza o funcție de tipul celei de probabilitate, ca în cazul variabilelor aleatorii
discrete, pentru a exprima legea de repartiție, indicând pentru fiecare valoare pe care o poate
lua variabila aleatorie și probabilitatea ei de apariție.
Totuși, pentru a păstra analogia cu cazul discret, în situația unei variabile aleatorii continue
funcția de repartiție se exprimă prin intermediul unei noi funcții, numite densitate de
probabilitate, [CRS 81].
Definiția 4.8: Spunem că variabila aleatorie 𝑋 are o densitate de probabilitate, dacă există
o aplicație 𝑓𝑋 , 𝑓𝑋 : ℛ → [0, +∞),astfel ca:
𝑥

𝐹𝑋 (𝑥) = ∫ 𝑓𝑋 (𝑢) ∙ 𝑑𝑢, (4.15)


−∞

unde 𝐹𝑋 este funcția de repartiție a variabilei aleatorii continue 𝑋.


În acest caz funcția 𝑓𝑋 , se numește densitatea de probabilitate, sau densitatea de repartiție a
variabilei aleatorii continue 𝑋.
Și în cazul unei variabile aleatorii continue, funcția de repartiție, ecuația (4.15), trebuie să
respecte cele patru proprietăți precizate la punctul 4.3.1. De aceea, alura funcției de repartiție
este de forma figurii 4.8.

𝐹(𝑥)

Figura 4.8: Alura funcției de repartiție, F(x), pentru o variabilă aleatorie continuă

Proprietățile funcției densitate de probabilitate:


a. Funcția densitate de probabilitate reprezintă derivata funcției de repartiție (dacă aceasta
există). Din relația de definiție (4.15), a funcției densitate de probabilitate rezultă, prin
derivare:

82
𝑑
[𝐹 (𝑥)] = 𝑓𝑋 (𝑥). (4.16)
𝑑𝑥 𝑥
b. 𝑓𝑋 (𝑥) ≥ 0, ∀𝑥 ∈ ℛ, deoarece, conform definiției 4.8, densitatea de probabilitate
reprezintă derivata unei funcții nedescrescătoare.
c. Deoarece,

∫ 𝑓𝑋 (𝑥) ∙ 𝑑𝑥 = 𝑃𝑟(𝑋 ≤ ∞) = 𝐹𝑋 (∞) = 𝐹𝑋 (Ω) = 1,


−∞
rezultă:


∫ 𝑓𝑋 (𝑥) ∙ 𝑑𝑥 = ∫ 𝑑𝐹𝑋 (𝑥) = 1. (4.17)
−∞
−∞

d. O funcție, 𝑓𝑋 (𝑥), ce îndeplinește proprietățile precizate prin definiția 4.8 și prin ecuația
(4.17) are o alură ca cea din figura 4.9, adică este definită pe axa reală, sau pe un domeniul
al acestei axe, este pozitivă, iar suprafața delimitată de curba 𝑓(𝑥) și axa 𝑂𝑥 are suprafața
egală cu 1.
e. Conform ecuațiilor de definiție (4.3) și (4.17), rezultă:
𝑥
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥 (4.18)
−∞

0.6
𝑓(𝑥)
0.5

0.4

0.3

0.2

0.1
𝑋
0
-2 -1 0 1 2 3 4

Figura 4.9: Alura funcției densitate de probabilitate, 𝑓(𝑥)

f. Conform ecuațiilor de definiție (4.3) și (4.15), rezultă:


𝑥
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥 (4.19)
−∞

g. Semnificația geometrică a relației (4.19) rezultă din figura 4.10. Și anume, probabilitatea
𝑃𝑟(𝑋 ≤ 𝑥) = 𝐹(𝑥) reprezintă suprafața de sub curba densitate de probabilitate cuprinsă
între −∞ și verticala trasată în punctul 𝑥.
h. Valoarea probabilității 𝑃𝑟(𝑎 < 𝑋 ≤ 𝑏) se calculează cu relația:
𝑏

𝑃𝑟(𝑎 < 𝑋 ≤ 𝑏) = 𝐹(𝑏) − 𝐹(𝑎) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥, (4.20)


𝑎

83
conform figurii 4.11.

𝑓(𝑥)
𝑥
𝐹(𝑥) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥
−∞

𝑋
𝑥
Figura 4.10: Semnificația geometrică a relației dintre funcția de repartiție și cea de
densitate de probabilitate

De asemenea, ținând cont și de ecuațiile (4.14), putem scrie:


𝑃𝑟(𝑎 < 𝑋 ≤ 𝑏) = 𝑃𝑟(𝑎 < 𝑋 < 𝑏) = 𝑃𝑟(𝑎 ≤ 𝑋 ≤ 𝑏) =
𝑏
(4.21)
= 𝑃𝑟(𝑎 ≤ 𝑋 < 𝑏) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥,
𝑎

𝑓(𝑥)
𝐹(𝑎)

𝐹(𝑏) − 𝐹(𝑎)

𝑋
𝑎 𝑏

Figura 4.11: Valoarea probabilității 𝑃𝑟(𝑎 < 𝑋 ≤ 𝑏)

i. Valoarea probabilității Pr(𝑋 > 𝑏) se calculează cu relația:


𝑃𝑟(𝑋 > 𝑏) = 1 − 𝐹(𝑏) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥, (4.22)


𝑏

Din figura 4.12, se observă că evenimentele 𝑃𝑟(𝑋 > 𝑏) și 𝑃𝑟(𝑋 ≤ 𝑏) sunt


complementare, și:

84
∞ 𝑎 ∞

∫ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ 𝑓(𝑥) ∙ 𝑑𝑥 + ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 1.


−∞ −∞ 𝑎

𝑓(𝑥)
𝐹(𝑏)

1 − 𝐹(𝑏)

𝑋
𝑏

Figura 4.12: Valoarea probabilității 𝑃𝑟(𝑋 > 𝑏)

j. Conform ecuației (4.13), rezultă că probabilitatea unei variabile aleatorii continue, de a


lua o anumită valoare particulară 𝑥, este zero. Dacă totuși dorim să calculăm
probabilitatea ca variabila aleatorie continuă să ia o anumită valoare 𝑥, se vom utiliza
relația, vezi figura 4.13:
𝑓(𝑥) ∙ 𝑑𝑥 = Pr(𝑥 < 𝑋 ≤ 𝑥 + 𝑑𝑥). (4.23)
În relația (4.23), expresia, 𝑓(𝑥) ∙ 𝑑𝑥, poartă denumirea de probabilitate elementară.

𝑓(𝑥) 𝑑𝑥

𝑋
𝑥

Figura 4.13: Probabilitatea elementară

k. Fie o variabilă aleatorie, 𝑋, definită pe un interval, 𝑋 ∈ [𝑎, 𝑏]. Și în acest caz:


𝑏

∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 1 (4.24)
𝑎
Deoarece,

85
∞ 𝑎 𝑏 ∞

∫ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ 𝑓(𝑥) ∙ 𝑑𝑥 + ∫ 𝑓(𝑥) ∙ 𝑑𝑥 + ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 1


−∞ −∞ 𝑎 𝑏
În ecuația anterioară, integralele:
𝑎 ∞

∫ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 0
−∞ 𝑏
fiindcă pe cele două domenii, (−∞, 𝑎) și (𝑎, ∞), funcția 𝑓(𝑥) nu este definită.

Exemplul 4.5
O anumită caracteristică de calitate a unui produs este descrisă de
variabila aleatorie X, având densitatea de probabilitate:
𝑘 ∙ 𝑥, dacă 0 ≤ 𝑥 < 10
𝑓(𝑥) = { 𝑘 ∙ (20 − 𝑥), dacă 10 ≤ 𝑥 < 20
0, dacă 0 > 𝑥 > 20
Să se determine:
a) Valoarea parametrului 𝑘, astfel încât 𝑓(𝑥) să reprezinte o densitate de
probabilitate;
b) Să se traseze graficul funcției densitate de probabilitate;
c) Să se traseze graficul funcției de repartiție;
d) Să se calculeze 𝑃𝑟(𝑋 ≥ 10) și 𝑃𝑟(5 ≤ 𝑋 ≤ 15).
Soluție: a) 𝑓(𝑥) reprezintă o funcție densitate de probabilitate, dacă: 𝑓(𝑥) ≥ 0, ∀𝑥 ∈

ℛ, și ∫−∞ 𝑓(𝑥) ∙ 𝑑𝑥 = 1, deci:
10 20

∫ 𝑘 ∙ 𝑥𝑑𝑥 + ∫ 𝑘 ∙ (20 − 𝑥) ∙ 𝑑𝑥 = 1
0 10
Rezultă:
𝑥=10 𝑥=20
𝑥2 𝑘 ∙ (𝑥 − 20)2
𝑘∙ | + | = 100 ∙ 𝑘 ⟹ 𝑘 = 0.01
2 𝑥=0 2 𝑥=10

b) 0.12
𝑓(𝑥) 𝑓(𝑥)
0.1

0.08

0.06

0.04 𝑋

0.02
𝑋
0
-20 -10 0 10 20 30 40

c) Funcția de repartiție are expresia:

86
𝑥 0 dacă 𝑥 ≤ 0
0.005 ∙ 𝑥 2 dacă 0 < 𝑥 ≤ 10
𝐹(𝑥) = ∫ 𝑓(𝑢) ∙ 𝑑𝑢 = { 2 .
0.2 ∙ 𝑥 − 0.005 ∙ 𝑥 − 1.0 dacă 10 < 𝑥 < 20
−∞
1 dacă 𝑥 ≥ 20
1.2
𝐹(𝑥)
1
0.8
0.6
0.4
0.2
0
-20 -10 0 10 20 30 𝑋 40
-0.2
d)
20
1
𝑃𝑟(𝑥 ≥ 10) = ∫ 0.01 ∙ (20 − 𝑥) ∙ 𝑑𝑥 = , sau
2
10
10
1
𝑃𝑟(𝑥 ≥ 10) = 1 − ∫ 0.01 ∙ 𝑥 ∙ 𝑑𝑥 = , sau
2
0
𝑃𝑟(𝑥 ≥ 10) = 1 − 𝐹(10) = 1 − 0.005 ∙ 102 = 0.5
𝑃 𝑟(5 ≤ 𝑋 ≤ 15) = 𝐹(15) − 𝐹(5) =
= 0.2 ∙ 15 − 0.005 ∙ 152 − 1.0 − 0.005 ∙ 52 = 0.75

 Precizați care sunt cele două funcții, atașate unei variabile aleatorii
discrete, care permit descrierea completă a acesteia.
 Definiți funcția de probabilitate și precizați care este legătura ei cu
funcția de repartiție.
 Fie X, o variabilă aleatorie discretă, descrisă prin tabloul de repartiție:
0 1 2 3
𝑋: ( ).
0.1 0.2 0.5 𝑝
Precizați următoarele elemente:
a. Care sunt valorile pe care le poate lua variabila aleatorie?
b. Care sunt probabilitățile asociate acestor valori?
c. Care este valoarea parametrului 𝑝 astfel încât X să reprezinte o
variabilă aleatorie discretă?
d. Calculați 𝑃𝑟(𝑋 = 2) și 𝑃𝑟(𝑋 > 1.5).
e. Scrieți expresia funcției de repartiție.
f. Folosind funcția de repartiție, calculați 𝑃𝑟(𝑋 ≤ 2) și 𝑃𝑟(𝑋 > 1.5)
 Precizați care sunt cele două funcții, atașate unei variabile aleatorii
continue, care permit descrierea completă a acesteia.

87
 Definiți funcția densitate de probabilitate și precizați care este legătura
ei cu funcția de repartiție.
 Enumerați proprietățile funcției densitate de probabilitate.
 Calculați 𝑃𝑟(𝑋 = 2), pentru variabila aleatorie continuă 𝑋. Explicați
rezultatul.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Variabila aleatorie;  Funcția de probabilitate sau


 Variabila aleatorie discretă; funcția de masă a probabilității ;
 Variabila aleatorie continuă;  Tabel (tabloul) de repartiție a
 Repartiția unei variabile unei variabile aleatorii discrete;
aleatorii;  Funcția densitate de probabili-
 Funcția de repartiție a variabilei tate, sau densitatea de repartiție a
aleatorii; variabilei aleatorii continue.

Rezumat
În această unitate de învățare a fost introdusă și definită noțiunea de variabilă
aleatorie. Acestea pot fi de două feluri: variabile aleatorii discrete și variabile
aleatorii continue.
Având la bază acest concept, probabilitățile diferitelor evenimente se determină
pe baza funcției de repartiție. De asemenea, pentru caracterizarea completă a
variabilelor aleatorii au mai fost definite două noi funcții: funcția de
probabilitate pentru variabile aleatorii discrete și funcția densitate de
probabilitate pentru variabilele aleatorii continue.
În continuare vor fi introduse valorile tipice ale variabilelor aleatorii, valori
numerice ce permit, de asemenea, caracterizarea variabilelor aleatorii.

Test de autoevaluare a cunoștințelor


P.4.1 Spațiul de eșantionaj al unui experiment aleatoriu este alcătuit din cinci
evenimente elementare echiprobabile, 𝑆 = {𝐸1 , 𝐸2 , 𝐸3 , 𝐸4 , 𝐸5 , }. Știind că
valorile variabilei aleatorii sunt definite conform tabelului următor:
Evenimentul aleatoriu 𝐸1 𝐸2 𝐸3 𝐸4 𝐸5
𝑥𝑖 , 𝑖 ∈ ̅̅̅̅
1,5 0 1 2 2 3
Să se determine:
a. Funcția de probabilitate și tabloul repartiției;
𝑏. 𝑃𝑟(𝑋 = 2); c. 𝑃𝑟(0.5 < 𝑋 ≤ 2);
𝑑. 𝑃𝑟(𝑋 ≥ 1.5).

88
R: a. 𝑃𝑟(𝑋 = 0) = 0.2, 𝑃𝑟(𝑋 = 1) = 0.2, 𝑃𝑟(𝑋 = 2) = 0.4
𝑃𝑟(𝑋 = 3) = 0.2
0 1 2 3
𝑋: ( ).
0.2 0.2 0.4 0.2
𝑏. 𝑃𝑟(𝑋 = 2) = 0.4; c. 𝑃𝑟(0.5 < 𝑋 ≤ 2) = 0.6
d. 𝑃𝑟(𝑋 ≥ 1.5) = 0.6.
P.4.2 Fie variabila aleatorie 𝑋, având tabloul repartiției:
−1 0 1 2 3 4
𝑋: ( )
0.1 0.15 0.2 0.35 0.15 0.05
Să se determine:
a. 𝑃𝑟(𝑋 < 3); b. 𝑃𝑟(𝑋 > 1);
c. 𝑃𝑟(𝑋 = 2); d. 𝑃𝑟[(𝑋 ≤ 3) ∩ (𝑋 ≥ 2)];
e. 𝑃𝑟[(𝑋 = 0) ∪ (𝑋 > 2)]; f. 𝑃𝑟[(𝑋 ≤ 3) ∪ (𝑋 ≥ 2)].
R: a. 𝑃𝑟(𝑋 < 3) = 0.8
b. 𝑃𝑟(𝑋 > 1) = 0.55
c. 𝑃𝑟(𝑋 = 2) = 0.35
d. 𝑃𝑟[(𝑋 ≤ 3) ∩ (𝑋 ≥ 2)] = 𝑃𝑟(2 ≤ 𝑋 ≤ 3) = 0.35 + 0.15 = 0.5
e. 𝑃𝑟[(𝑋 = 0) ∪ (𝑋 > 2)] = 0.15 + 0.15 + 0.05 = 0.35
f. 𝑃𝑟[(𝑋 ≤ 3) ∪ (𝑋 ≥ 2)] = 𝑃𝑟(𝑋 ≤ 3) + 𝑃𝑟(𝑋 ≥ 2) −
−𝑃𝑟[(𝑋 ≤ 3) ∩ (𝑋 ≥ 2)] = 095 + 0.55 − 0.5 = 1.0.
P.4.3 Se consideră funcția de probabilitate, 𝑝𝑖 (𝑥𝑖 ), a variabilei aleatorii discrete 𝑋,
având expresia:
4 1 𝑥𝑖
(𝑥 )
𝑝𝑖 𝑖 = ( ) ∙ ( ) , 𝑥𝑖 = 0,1,2, … , ∞.
5 5
Să se determine:
a. Condiția de existență a funcției de probabilitate;
𝑏. 𝑃𝑟(𝑋 = 2); c. 𝑃𝑟(𝑋 ≤ 1);
d. 𝑃𝑟(𝑋 > 2); e. 𝑃𝑟(𝑋 ≥ 1).
∞ ∞
4 1 𝑖
R: a. ∑ 𝑝𝑖 (𝑥𝑖 ) = ∑ ( ) ∙ ( ) = 1 ;
5 5
𝑖=0 𝑖=0
4 1 2 4
b. 𝑃𝑟(𝑋 = 2) = ( ) ∙ ( ) =
5 5 125
1 1
4 1 𝑖 24
(𝑥 )
c. 𝑃𝑟(𝑋 ≤ 1) = ∑ 𝑝𝑖 𝑖 = ∑ ( ) ∙ ( ) =
5 5 25
𝑖=0 𝑖=0
2
4 1 𝑖 124 1
d. 𝑃𝑟(𝑋 > 2) = 1 − 𝑃𝑟(𝑋 ≤ 2) = 1 − ∑ ( ) ∙ ( ) = 1 − =
5 5 125 125
𝑖=0
4 1 0 4 1
e. 𝑃𝑟(𝑋 ≥ 1) = 1 − 𝑃𝑟(𝑋 < 1) = 1 − ( ) ∙ ( ) = 1 − =
5 5 5 5
P.4.4 Se consideră funcția de probabilitate, 𝑝𝑖 (𝑥𝑖 ), a variabilei aleatorii discrete 𝑋,
având expresia:
𝑥𝑖
𝑝𝑖 (𝑥𝑖 ) = , 𝑥 = 1,2, 3,4,5,6.
21 𝑖
Să se determine:
a. Condiția de existență a funcției de probabilitate;

89
b. Funcția de repartiție a variabilei aleatorii;
c. 𝐹(2); d. 𝑃𝑟(X > 2);
e. 𝐹(3.5); f. 𝑃𝑟(1 ≤ 𝑋 ≤ 5).
R: 6 6
𝑖
a. ∑ 𝑝𝑖 (𝑥𝑖 ) = ∑ =1
21
𝑖=1 𝑖=1
1 0, 𝑑𝑎𝑐ă 𝑥𝑖 < 1
21
, 𝑑𝑎𝑐ă 𝑥𝑖 = 1 1
2 21
, 𝑑𝑎𝑐ă 1 ≤ 𝑥𝑖 < 2
21
, 𝑑𝑎𝑐ă 𝑥𝑖 = 2 1
1 7
, 𝑑𝑎𝑐ă 2 ≤ 𝑥𝑖 < 3
7
, 𝑑𝑎𝑐ă 𝑥𝑖 = 3 2
b. 𝑝𝑖 (𝑥𝑖 ) = 4 𝐹(𝑥𝑖 ) = 7
, 𝑑𝑎𝑐ă 3 ≤ 𝑥𝑖 < 4
21
, 𝑑𝑎𝑐ă 𝑥𝑖 = 4 10
5 , 𝑑𝑎𝑐ă 4 ≤ 𝑥𝑖 < 5
21
21
, 𝑑𝑎𝑐ă 𝑥𝑖 = 5 5
6 7
, 𝑑𝑎𝑐ă 5 ≤ 𝑥𝑖 < 6
{21 , 𝑑𝑎𝑐ă 𝑥𝑖 = 6 { 1, 𝑑𝑎𝑐ă 𝑥𝑖 ≥ 6
1 6
c. 𝐹(2) = 7
; d. 𝑃𝑟(X > 2) = 1 − 𝐹(2) = 7;
2 5
e. 𝐹(3.5) = 𝐹(3.0) = 7; f. 𝑃𝑟(1 ≤ 𝑋 ≤ 5) = 𝐹(5) − 𝐹(0) = 7.
P.4.5 Se consideră funcția de repartiție, a variabilei aleatorii 𝑋, având expresia:
0, dacă 𝑥 < −1
0.1, dacă − 1 ≤ 𝑥 < 0
𝐹(𝑥) = 0.4, dacă 0 ≤ 𝑥 < 1 .
0.8, dacă 1 ≤ 𝑥 < 2
{ 1.0, dacă 𝑥 ≥ 2
Să se calculeze:
a. Tabloul repartiției variabilei aleatorii 𝑋;
𝑏. 𝑃𝑟(𝑋 < 2); c. 𝑃𝑟(0 < 𝑋 ≤ 2);
d. 𝑃𝑟(𝑋 > 1.2); e. 𝑃𝑟(−0.5 ≤ 𝑋 ≤ 1.5).
R: −1 0 1 2
a. 𝑋: ( )
0.1 0.3 0.4 0.2
b. 𝑃𝑟(𝑋 < 2) − 0.8
c. 𝑃𝑟(0 < 𝑋 ≤ 2) = 𝐹(2) − 𝐹(0) = 1.0 − 0.4 = 0.6
d. 𝑃𝑟(𝑋 > 1.2) = 0.2
e. 𝑃𝑟(−0.5 ≤ 𝑋 ≤ 1.5) = 𝐹(1) − 𝐹(−1) = 0.8 − 0.1 = 0.7
P.4.6 Se consideră variabila aleatorie continuă, 𝑋, având funcția densitate de
probabilitate:
𝑥
, dacă 2 ≤ 𝑥 ≤ 6
𝑓(𝑥) = {16 .
0, dacă 2 > 𝑥 > 6
Să se calculeze următoarele probabilități:
𝑎. 𝑃𝑟(𝑋 < 3); b. 𝑃𝑟(𝑋 > 3.5);
c. 𝑃𝑟(3 ≤ 𝑋 < 5); d. 𝑃𝑟[(𝑋 ≤ 4) ∩ (𝑋 > 2)];
e. 𝑃𝑟[(𝑋 < 2.5) ∪ (𝑋 > 5)]; f. 𝑃𝑟[(2 < 𝑋 < 3.5) ∪ (𝑋 > 3)].
2
R: 𝑥 1
𝐹(𝑥) = −
32 8
𝑥=3
𝑥2 5
𝑎. 𝑃𝑟(𝑋 < 3) = 𝐹(3) = | =
32 𝑥=2 32

90
𝑥=6
𝑥2
𝑏. 𝑃𝑟(𝑋 > 3.5) = | = 0.7421875
32 𝑥=3.5
3.5

𝑃𝑟(𝑋 > 3.5) = 1 − 𝐹(3.5) = 1 − ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 0.7421875


−∞
𝑥=5 𝑥=3
𝑥2 𝑥2 16
𝑐. 𝑃𝑟(3 ≤ 𝑋 < 5) = 𝐹(5) − 𝐹(3) = | − | = = 0.5
32 𝑥=2 32 𝑥=2 32
5 𝑥=5
𝑥 𝑥2
𝑃𝑟(3 ≤ 𝑋 < 5) = ∫ ∙ 𝑑𝑥 = | = 0.5
16 32 𝑥=3
3
𝑥=4
𝑥2
𝑑. 𝑃𝑟[(𝑋 ≤ 4) ∩ (𝑋 > 2)] = 𝑃𝑟(2 < 𝑋 ≤ 4) = | = 0.375
32 𝑥=2
𝑒. 𝑃𝑟[(𝑋 < 2.5) ∪ (𝑋 > 5)] = 𝐹(2.5) + 1 − 𝐹(5) = 0.4140625
𝑓. 𝑃𝑟[(2 < 𝑋 < 3.5) ∪ (𝑋 > 3)] = 1
P.4.7 Se consideră variabila aleatorie continuă, 𝑋, având funcția densitate de
probabilitate:
𝑥
+ 𝑘, dacă 0 ≤ 𝑥 ≤ 3
𝑓(𝑥) = {6 .
0, dacă 0 > 𝑥 > 3
Să se calculeze:
a. Valoarea parametrului 𝑘; b. 𝑃𝑟(1 ≤ 𝑋 ≤ 2).
R: ∞ 3 𝑥=3
𝑥 𝑥2
𝑎. ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ ( + 𝑘) ∙ 𝑑𝑥 = 1 ⟹ ( + 𝑘 ∙ 𝑥)| =1
6 12 𝑥=0
−∞ 0
9 3 1
+𝑘∙3=1⟹𝑘 = =
12 12 ∙ 3 12
𝑥 1
𝑓(𝑥) = { 6 + 12 , dacă 0 ≤ 𝑥 ≤ 3
0, dacă 0 > 𝑥 > 3
2 𝑥=2
𝑥 1 𝑥2 𝑥 1
𝑏. 𝑃𝑟(1 ≤ 𝑋 ≤ 2) = ∫ ( + ) ∙ 𝑑𝑥 = ( + )| = .
6 12 12 12 𝑥=1 3
1

P.4.8 Cererea zilnică de apă minerală dintr-un magazin reprezintă o variabilă aleatorie
având funcția densitate de probabilitate:
0, dacă 300>x≥500
𝑓(𝑥) = { .
𝑘, dacă 300≤x<500
Să se calculeze:
a. Valoarea parametrului 𝑘, astfel încât 𝑓(𝑥) să reprezinte o densitate de
probabilitate;
b. Expresia funcției de repartiție; c. 𝑃𝑟(𝑋 > 450).
∞ 500
R:
𝑥=500
𝑎. ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ 𝑘 ∙ 𝑑𝑥 = 1 ⟹ 𝑘 ∙ 𝑥|𝑥=300 =1
−∞ 300
1
200 ∙ 𝑘 = 1 ⟹ 𝑘 =
200
0, dacă 300>x≥500
𝑓(𝑥) = { 1 .
, dacă 300≤x<500
200

91
𝑥 𝑥
1 𝑢 𝑢=𝑥 𝑥 − 300
𝑏. 𝐹(𝑥) = ∫ 𝑓(𝑢) ∙ 𝑑𝑢 = ∫ ∙ 𝑑𝑢 = | =
200 200 𝑢=300 200
−∞ 300
𝑐. 𝑃𝑟(𝑋 > 450) = 1 − 𝑃𝑟(𝑋 ≤ 450) = 1 − 𝐹(450) = 0.25
P.4.9 Variabila aleatorie 𝑋 are funcția densitate de probabilitate:
0, dacă 𝑥 < 0.5
1, dacă 0.5 ≤ 𝑥 ≤ 1
𝑓(𝑥) = { .
𝑘, dacă 1 ≤ 𝑥 ≤ 2
0, dacă 𝑥 > 2
Să se calculeze:
a. Valoarea parametrului 𝑘, astfel încât 𝑓(𝑥) să reprezinte o densitate de
probabilitate;
b. Expresia funcției de repartiție;
c. 𝑃𝑟(0.75 ≤ 𝑋 ≤ 1.5).
∞ 1 2
R:
𝑎. ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 1 ⟹ ∫ 1 ∙ 𝑑𝑥 + ∫ 𝑘 ∙ 𝑑𝑥 = 1
−∞ 0.5 1
𝑥=1 𝑥=2
⟹ 𝑥|𝑥=0.5 + 𝑘 ∙ 𝑥|𝑥=1 = 0.5 + 2𝑘 − 𝑘 = 1
𝑘 = 0.5
𝑥

𝑏. Dacă 0.5 ≤ 𝑥 ≤ 1 ⟹ 𝐹(𝑥) = ∫ 1 ∙ 𝑑𝑢 = 𝑢|𝑢=𝑥


𝑢=0.5 = 𝑥 − 0.5.
0.5
Dacă 1 ≤ 𝑥 ≤ 2 ⟹
𝑥

𝐹(𝑥) = 0.5 + ∫ 𝑘 ∙ 𝑑𝑢 = 0.5 + 𝑘 ∙ 𝑢|𝑢=𝑥


𝑢=1 = 0.5 ∙ 𝑥
1
0, dacă 𝑥 < 0.5
𝑥 − 0.5, dacă 0.5 ≤ 𝑥 ≤ 1
𝐹(𝑥) = { .
0.5 ∙ 𝑥, dacă 1 ≤ 𝑥 ≤ 2
1, dacă 𝑥 > 2
𝑐. 𝑃𝑟(0.75 ≤ 𝑋 ≤ 1.5) = 𝐹(𝑋 ≤ 1.5) − 𝐹(𝑋 ≤ 0.75) = 0.5
P.4.10 Funcția densitate de probabilitate a variabilei aleatorii 𝑋, este:
0, dacă 𝑥 < 100
𝑓(𝑥) = {100 .
2
, dacă 𝑥 ≥ 100
𝑥
Să se calculeze:
a. Funcția de repartiție, 𝐹(𝑥);
b. 𝑃𝑟(𝑋 > 200).
𝑥
R: 100 100 𝑢=𝑥 100
𝑎. 𝐹(𝑥) = ∫ 2
∙ 𝑑𝑢 = − | =1 −
𝑢 𝑢 𝑢=100 𝑥
100
0, dacă 𝑥 < 100
𝐹(𝑥) = { 100 .
1− , dacă 𝑥 ≥ 100
𝑥
𝑏. 𝑃𝑟(𝑋 > 200) = 1 − 𝐹(200) = 0.5.

92
Unitatea de învățare 5.

Cuprins
5.1. Introducere ............................................................................................................. 93
5.2. Competențe ............................................................................................................ 93
5.3. Valori tipice ale variabilelor aleatorii ................................................................... 94
5.3.1. Momentele de ordinul q ..........................................................................................94
5.3.2. Momentele centrate de ordinul q ............................................................................95
5.4. Parametrii tendinței de grupare ........................................................................... 95
5.4.1. Valoarea medie teoretică ........................................................................................95
5.4.2. Mediana ..................................................................................................................99
5.4.3. Moda .....................................................................................................................101
5.5. Parametrii tendinței de împrăștiere ................................................................... 102
5.5.1. Dispersia ...............................................................................................................102
5.5.2. Inegalitatea lui Markov ........................................................................................104
5.5.3. Inegalitatea lui Cebîşev ........................................................................................105
5.6. Rezumat ............................................................................................................... 107
5.7. Test de autoevaluare............................................................................................ 108

5.1. Introducere
În multe situații, în special la aplicațiile practice, se preferă caracterizarea
variabilelor aleatorii prin intermediul unor caracteristici numerice, sau valori
tipice, care pot prezenta într-un mod mai concis anumite aspectele esențiale, ale
variabilelor aleatorii.
În cadrul prezentei unități de învățare se definesc, la început, noțiunile de moment
de ordinul q și moment centrat de ordinul 𝑞, deoarece principalele caracteristici
numerice utilizate pentru caracterizarea unei variabile aleatorii se obțin ca și
cazuri particulare a acestor momente. În continuare sunt prezentați parametrii
tendinței de grupare: media, media și moda. Din categoria parametrii tendinței de
împrăștiere este prezentată dispersia variabilelor aleatorii, pentru ca în final să se
demonstreze două teoreme importante, teorema lui Markov și Cebîșev care permit
evaluarea probabilităților corespunzătoare unor abateri de la medie.

5.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să definească
noțiunile de moment de ordinul 𝑞, moment centrat de ordinul 𝑞, medie, mediană,
modă și dispersie, precum și a semnificației și proprietățile acestor valori tipice.
De asemenea, va fi capabil să utilizeze tehnici și metode adecvate pentru calculul
valorilor probabilităților unor abateri de la medie prin utilizarea teoremei lui
Markov și a teoremei lui Cebîșev.

93
Durata medie de parcurgere a acestei unități de învățare este de 3 ore.

5.3 VALORI TIPICE ALE VARIABILELOR ALEATORII

Orice variabilă aleatorie poate fi studiată prin intermediul funcției sale de repartiție. De multe
ori, însă, cunoașterea corespondenței dintre valorile posibile ale variabilei aleatorii și
probabilitățile corespunzătoare nu ne permite să tragem concluzii din punct de vedere teoretic
și practic asupra variabilelor aleatorii studiate. În astfel de situații se preferă caracterizarea
variabilelor aleatorii prin intermediul unor caracteristici numerice, sau valori tipice, care pot
prezenta într-un mod mai concis anumite aspectele esențiale, ale variabilelor aleatorii.
Acești indicatori numerici se referă la trei aspecte esențiale ale variabilelor aleatorii, [GIB 76],
[HAH 67], [KEC 91]:
 Tendința de grupare (sau de poziționare) a valorilor variabilelor aleatorii;
 Tendința de împrăștiere (sau de variație) a valorilor variabilelor aleatorii;
 Forma repartiției.
Pentru precizarea, în continuare, a expresiilor analitice ale acestor caracteristici numerice, vom
considera cele două cazuri distincte:
a. Cazul unei variabile aleatorii discrete, 𝑋, având tabloul repartiției de probabilitate de
forma:
𝑥1 𝑥2 ⋯ 𝑥𝑖 ⋯ 𝑥𝑛
𝑋: (𝑝 𝑝 ⋯ 𝑝 ⋯ 𝑝 ) , 𝑖 ∈ ̅̅̅̅̅ 1, 𝑛.
1 2 𝑖 𝑛
b. Cazul unei variabile aleatorii continue, 𝑋, caracterizată printr-o funcție densitate de
probabilitate, 𝑓(𝑥).
Principalele caracteristici numerice, utilizate pentru caracterizarea unei variabile aleatorii (v.a.),
se obțin ca valori particulare ale momentelor de ordinul 𝑞 și ale momentelor centrate de ordinul
𝑞, valori tipice pe care le vom prezenta în continuare.

5.3.1 MOMENTELE DE ORDINUL 𝑞

Definiția 5.1: Fie o variabilă aleatorie 𝑋 și 𝑞 ∈ 𝒩. Se numește momentul de ordinul q al


variabilei aleatorii în raport cu originea, sau simplu momentul de ordinul q
al variabilei aleatorii și se notează cu 𝜇𝑞 , valoarea:
𝑛

∑ 𝑝𝑖 ∙ 𝑥𝑖 𝑞 , pentru o v.a. X, discretă


𝑖=1
𝜇𝑞 = ∞ . (5.1)
∫ 𝑥 𝑞 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 , pentru o v.a. X, continuă
{−∞

94
5.3.2 MOMENTELE CENTRATE DE ORDINUL 𝑞

Definiția 5.2: Fie o variabilă aleatorie 𝑋 și 𝑞 ∈ 𝒩. Se numește moment centrat de ordinul


𝑞 al variabilei aleatorii 𝑋 și se notează cu 𝜇𝑞′ , valoarea:
𝑛

∑ 𝑝𝑖 ∙ (𝑥𝑖 − 𝜇)𝑞 , pentru o v.a. X, discretă


𝑖=1
𝜇𝑞′ = ∞ , (5.2)
∫ (𝑥 − 𝜇)𝑞 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 , pentru o v.a. X, continuă
{−∞
unde 𝜇, reprezintă media teoretică a variabilei aleatorii 𝑋, vezi punctul 5.4.1.

5.4 PARAMETRII TENDINȚEI DE GRUPARE

Din categoria caracteristicilor numerice ale tendinței de grupare fac parte media, ca cel mai
important parametru alt tendinței de poziționare și mai rar utilizate, mediana și moda.

5.4.1 VALOAREA MEDIE TEORETICĂ

Definiția 5.3: Se numește medie teoretică a variabilei aleatorii 𝑋, valoarea numerică:


𝑛

∑ 𝑝𝑖 ∙ 𝑥𝑖 , pentru o v.a. 𝑋, discretă


𝑖=1
𝐸(𝑋) = 𝜇 = ∞ . (5.3)
∫ 𝑥 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 , pentru o v.a. 𝑋, continuă
{−∞
În literatura de specialitate, media teoretică a unei variabile aleatorii mai poate fi întâlnită și sub
denumirile echivalente: media unei repartiții de probabilitate, speranța matematică, sau
simplu, media.
Dacă în relația de definiție a mediei teoretice, înlocuim la numitor ecuațiile (4.11), pentru
variabilele aleatorii discrete și (4.17), pentru cele continue, relații a căror valoare este unu,
rezultă că expresia mediei teoretice, (5.3), poate fi scrisă sub forma echivalentă:
∑𝑛𝑖=1 𝑝𝑖 ∙ 𝑥𝑖
, pentru o v.a. 𝑋, discretă
∑𝑛𝑖=1 𝑝𝑖
𝐸(𝑋) = 𝜇 = ∞ . (5.4)
∫−∞ 𝑥 ∙ 𝑓(𝑥) ∙ 𝑑𝑥
∞ , pentru o v.a. 𝑋, continuă
{ ∫−∞ 𝑓(𝑥)𝑑𝑥
Din ecuația (5.4) rezultă semnificația fizică a mediei teoretice. Acesta reprezintă de fapt, centrul
de greutate al valorilor variabilei aleatorii.
Definiția 5.4: Dacă X este o variabilă aleatorie, atunci noua variabilă aleatorie definită prin
relația:

95
𝑌 = 𝑋 − 𝐸(𝑋) (5.5)
poartă numele de abaterea variabilei aleatorii și media ei este 𝐸(𝑌) = 0.
Deci, media teoretică poate fi considerată un fel de valoare centrală a variabilei aleatorii, prin
intermediul căreia se pot trage concluzii asupra poziției variabilei aleatorii pe axa reală, oferind
de asemenea, informații despre modul în care sunt poziționate celelalte valori ale variabilei
aleatorii, astfel ca media abaterilor de la această valoare este zero.
Proprietățile mediei teoretice:
1. Media unei variabile aleatorii reprezintă momentul de ordinul unu.
𝐸(𝑋) = 𝜇 = 𝜇1 . (5.6)
Folosind semnificația și notațiile utilizate pentru medie, momentul de ordinul 𝑞 și moment
centrat de ordinul 𝑞 se pot redefini, ca:
Definiția 5.5: Fie o variabilă aleatorie 𝑋 și 𝑞 ∈ 𝒩. Dacă valoarea medie a variabilei aleatorii
𝑋 𝑞 există, atunci această valoare medie se numește momentul de ordinul q al
variabilei aleatorii:
𝜇𝑞 = 𝐸(𝑋 𝑞 ). (5.7)
Definiția 5.6: Fie o variabilă aleatorie 𝑋 și 𝑞 ∈ 𝒩. Dacă valoarea medie a abaterii variabilei
aleatorii, [𝑋 − 𝐸(𝑋)]𝑞 există, atunci această valoare medie se numește momentul centrat de
ordinul q al variabilei aleatorii:
𝜇𝑞′ = 𝐸[𝑋 − 𝐸(𝑋)]𝑞 = 𝐸(𝑋 − 𝜇)𝑞 . (5.8)
2. Fie 𝑋 și 𝑌 două variabile aleatorii, atunci:
𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌) (5.9)
Demonstrație: Fie 𝑋 şi 𝑌 două variabile aleatorii discrete:
𝑥1 𝑥2 ⋯ 𝑥𝑖 ⋯ 𝑥𝑛 𝑦1 𝑦2 ⋯ 𝑦𝑗 ⋯ 𝑦𝑚
𝑋: (𝑝 𝑝 ⋯ 𝑝 ⋯ 𝑝 ) şi 𝑌: (𝑞 𝑞2 ⋯ 𝑞𝑗𝑖 ⋯ 𝑞𝑚 ),
1 2 𝑖 𝑛 1

atunci variabila aleatorie 𝑋 + 𝑌, va avea tabloul de repartiţie:


𝑥𝑖 + 𝑦𝑗
𝑋 + 𝑌: ( 𝑠 ̅̅̅̅̅
), unde 𝑖 = 1, 𝑛, 𝑗 = ̅̅̅̅̅̅
1, 𝑚, şi 𝑠𝑖,𝑗 = Pr{(𝑋 = 𝑥𝑖 ) ∩ (𝑌 = 𝑦𝑖 )},
𝑖,𝑗
iar,
𝐸(𝑋 + 𝑌) = ∑(𝑥𝑖 + 𝑦𝑗 ) ∙ 𝑠𝑖,𝑗 = ∑ 𝑥𝑖 ∙ 𝑠𝑖,𝑗 + ∑ 𝑦𝑗 ∙ 𝑠𝑖,𝑗 =
𝑖,𝑗 𝑖,𝑗 𝑖,𝑗

= ∑ 𝑥𝑖 ∙ ∑ 𝑠𝑖,𝑗 + ∑ 𝑦𝑗 ∙ ∑ 𝑠𝑖,𝑗
𝑖 𝑗 𝑗 𝑖
Dar,

∑ 𝑠𝑖,𝑗 = ∑ 𝑃𝑟{(𝑋 = 𝑥𝑖 ) ∩ (𝑌 = 𝑦𝑗 )} = 𝑃𝑟 {⋃[(𝑋 = 𝑥𝑖 ) ∩ (𝑌 = 𝑦𝑖 )]} =


𝑖 𝑖 𝑖

= 𝑃𝑟 [(𝑌 = 𝑦𝑗 ) ∩ (⋃(𝑋 = 𝑥𝑖 ))] = 𝑃𝑟[(𝑌 = 𝑦𝑗 ) ∩ Ω] = Pr(𝑌 = 𝑦𝑗 ) = 𝑞𝑗 .


𝑖

96
Analog, rezultă și:
∑ 𝑠𝑖,𝑗 = 𝑃𝑟(𝑋 = 𝑥𝑖 ) = 𝑝𝑖 .
𝑗
Deci,
𝐸(𝑋 + 𝑌) = ∑ 𝑥𝑖 ∙ 𝑝𝑖 + ∑ 𝑦𝑗 ∙ 𝑞𝑗 = 𝐸(𝑋) + 𝐸(𝑌).
𝑖 𝑗

3. Proprietatea 2 se poate extinde la un număr oarecare de variabile aleatorii, 𝑋𝑖 , 𝑖 = ̅̅̅̅̅


1, 𝑘:
𝑘

𝐸(𝑋1 + 𝑋2 + ⋯ + 𝑋𝑘 ) = ∑ 𝐸( 𝑋𝑖 ) (5.10)
𝑖=1

4. Fie 𝑋 o variabilă aleatorie și 𝑎 ∈ ℛ. Atunci:


𝐸(𝑎 ∙ 𝑋) = 𝑎 ∙ 𝐸(𝑋) (5.11)
Demonstrație: Noua variabilă aleatorie 𝑎 ∙ 𝑋 este de forma:
𝑎 ∙ 𝑥1 𝑎 ∙ 𝑥2 ⋯ 𝑎 ∙ 𝑥𝑖 ⋯ 𝑎 ∙ 𝑥𝑛
𝑎 ∙ 𝑋: ( 𝑝 𝑝2 ⋯ 𝑝𝑖 ⋯ 𝑝𝑛 ).
1
Deci,
𝑛 𝑛

𝐸(𝑎 ∙ 𝑋) = ∑ 𝑎 ∙ 𝑥𝑖 ∙ 𝑝𝑖 = 𝑎 ∙ ∑ 𝑥𝑖 ∙ 𝑝𝑖 = 𝑎 ∙ 𝐸(𝑋)
𝑖=1 𝑖=1

5. Fie 𝑋 o variabilă aleatorie și 𝑎, 𝑏 ∈ ℛ. Atunci:


𝐸(𝑎 ∙ 𝑋 + 𝑏) = 𝑎 ∙ 𝐸(𝑋) + 𝑏 (5.12)
Demonstrație: Noua variabilă aleatorie 𝑎 ∙ 𝑋 + 𝑏 este de forma:
𝑏 + 𝑎 ∙ 𝑥1 𝑏 + 𝑎 ∙ 𝑥2 ⋯ 𝑏 + 𝑎 ∙ 𝑥𝑖 ⋯ 𝑏 + 𝑎 ∙ 𝑥𝑛
𝑎 ∙ 𝑋 + 𝑏: ( ).
𝑝1 𝑝2 ⋯ 𝑝𝑖 ⋯ 𝑝𝑛
Deci,
𝑛 𝑛 𝑛

𝐸(𝑎 ∙ 𝑋 + 𝑏) = ∑(𝑎 ∙ 𝑥𝑖 + 𝑏) ∙ 𝑝𝑖 = 𝑎 ∙ ∑ 𝑥𝑖 ∙ 𝑝𝑖 + 𝑏 ∙ ∑ 𝑝𝑖 = 𝑎 ∙ 𝐸(𝑋) + 𝑏


𝑖=1 𝑖=1 𝑖=1

6. Fie 𝑋1 , 𝑋2 , , 𝑋𝑛 , 𝑛 variabile aleatorii și 𝑎1 , 𝑎2 , , 𝑎𝑛 , 𝑛 constante reale, arbitrare,


atunci:
𝑛

𝐸(𝑎1 ∙ 𝑋1 + 𝑎2 ∙ 𝑋2 + ⋯ + 𝑎𝑛 ∙ 𝑋𝑛 ) = ∑ 𝑎𝑖 ∙ 𝐸(𝑋𝑖 ) (5.13)


𝑖=1
Această ecuație reprezintă o generalizare a proprietăților 3 și 4.
7. Dacă 𝑋 și 𝑌 sunt variabile aleatorii independente, atunci:
𝐸(𝑋 ∙ 𝑌) = 𝐸(𝑋) ∙ 𝐸(𝑌) (5.14)
Demonstrație: Noua variabilă aleatorie 𝑋 ∙ 𝑌 are tabloul repartiției:
𝑥𝑖 ∙ 𝑦𝑗
𝑋 ∙ 𝑌: ( 𝑠 ), unde 𝑖 = ̅̅̅̅̅1, 𝑛, 𝑗 = ̅̅̅̅̅̅
1, 𝑚,
𝑖,𝑗
şi

97
𝑠𝑖,𝑗 = Pr{(𝑋 = 𝑥𝑖 ) ∩ (𝑌 = 𝑦𝑗 )} = 𝑝𝑖 ∙ 𝑞𝑗 .
Deci,
𝑛 𝑚

𝐸(𝑋 ∙ 𝑌) = ∑ 𝑥𝑖 ∙ 𝑦𝑗 ∙ 𝑠𝑖,𝑗 = ∑ 𝑥𝑖 ∙ 𝑦𝑗 ∙ 𝑝𝑖 ∙ 𝑞𝑗 = ∑ 𝑥𝑖 ∙ 𝑝𝑖 ∙ ∑ 𝑦𝑗 ∙ 𝑞𝑗 = 𝐸(𝑋) ∙ 𝐸(𝑌).


𝑖,𝑗 𝑖,𝑗 𝑖=1 𝑗=1

8. Dacă 𝑋 și 𝑌 sunt variabile aleatorii, astfel încât 𝑋 ≤ 𝑌, atunci:


𝐸(𝑋) ≤ 𝐸(𝑌) (5.15)
Demonstrație: Fie 𝑍 = 𝑋 − 𝑌. Este evident că 𝑍 ≤ 0 şi 𝐸(𝑍) ≤ 0. Atunci, aplicând
proprietatea 1, rezultă:
𝐸(𝑍) = 𝐸(𝑋) − 𝐸(𝑌) ≤ 0, adică 𝐸(𝑋) ≤ 𝐸(𝑌).
9. Dacă există momentele de ordinul doi ale variabilelor aleatorii 𝑋 și 𝑌, atunci momentul
variabilei aleatorii 𝑋 ∙ Y este:

|𝐸(𝑋 ∙ Y)| ≤ √𝐸(𝑋 2 ) ∙ 𝐸(𝑌 2 ) (5.16)

Inegalitatea (5.15) poartă numele de inegalitatea lui Schwartz.


Demonstrație: Fie variabila aleatorie 𝑍 = (𝑋 − 𝛼 ∙ 𝑌)2 , unde 𝛼 ∈ ℛ. Se observă că
această nouă variabilă aleatorie este pozitivă, pe tot domeniul ei de
definiție. În continuare vom calcula valoarea medie teoretică a acestei
variabile aleatorii:
𝐸(𝑍) = 𝐸[(𝑋 − 𝛼 ∙ 𝑌)2 ] = 𝐸(𝑋 2 − 2 ∙ 𝛼 ∙ 𝑋 ∙ 𝑌 + 𝛼 2 ∙ 𝑌 2 ) =
= 𝐸(𝑋 2 ) − 2 ∙ 𝛼 ∙ 𝐸(𝑋 ∙ 𝑌) + 𝛼 2 ∙ 𝐸(𝑌 2 ).
Deoarece variabila aleatorie, Z, este pozitivă, atunci şi 𝐸(𝑍) ≥ 0, adică
discriminantul ecuaţiei de gradul II, anterioare, este Δ ≤ 0:
𝐸(𝑋 ∙ 𝑌) − 𝐸(𝑋 2 ) ∙ 𝐸(𝑌 2 ) ≤ 0.
Din ecuația anterioară rezultă:
|𝐸(𝑋 ∙ 𝑌)| ≤ √𝐸(𝑋 2 ) ∙ 𝐸(𝑌 2 ).
10. Valoarea mediei unei funcții a variabilei aleatorii, 𝑔(𝑋), se determină similar:
𝑛

∑ 𝑔(𝑥𝑖 ) ∙ 𝑝𝑖 , pentru o v.a. 𝑋, discretă


𝑖=1
𝐸(𝑔(𝑋)) = 𝜇 = ∞ . (5.17)
∫ 𝑔(𝑋) ∙ 𝑓(𝑥) ∙ 𝑑𝑦 , pentru o v.a. 𝑋, continuă
{−∞
11. Folosind proprietățile operatorului mediei teoretice, se poate deduce și legătura care
există între momentele de ordinul 𝑞 și momentele centrate de ordinal 𝑞:
𝑞

𝜇𝑞′ = ∑(−1)𝑘 ∙ 𝐶𝑞𝑘 ∙ 𝜇 𝑘 ∙ 𝜇𝑞−𝑘 (5.18)


𝑘=0
Demonstrație: Pornind de la definiția momentului centrat de ordinul 𝑞 și aplicând
proprietățile mediei, rezultă:

98
𝑞

𝜇𝑞′ = 𝐸[(𝑋 − 𝜇)𝑞 ] = 𝐸 [∑(−1)𝑘 ∙ 𝐶𝑞𝑘 ∙ 𝜇 𝑘 ∙ 𝑋 𝑞−𝑘 ] =


𝑘=0
𝑞 𝑞

= ∑(−1)𝑘 ∙ 𝐶𝑞𝑘 ∙ 𝜇 𝑘 ∙ 𝐸(𝑋 𝑞−𝑘 ) = ∑(−1)𝑘 ∙ 𝐶𝑞𝑘 ∙ 𝜇 𝑘 ∙ 𝜇𝑞−𝑘 .


𝑘=0 𝑘=0

Exemplul 5.1
O variabilă aleatorie 𝑋 are funcția densitate de probabilitate:
1
𝑓(𝑥) = și 20 ≤ 𝑋 ≤ 40.
20
Să se calculeze:
a. Media și momentul de ordinul doi al variabilei aleatorii 𝑋;
b. Momentul centrat de ordinul doi al variabilei aleatorii 𝑋.
𝑥=40
40 40 𝑥 𝑥2 1600−400
Soluție: a. 𝜇 = ∫20 𝑥 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫20 ∙ 𝑑𝑥 = 40| = = 30.
20 𝑥=20 40

40 40 𝑥 2 𝑥 3 𝑥=40 56000
𝜇2 = ∫20 𝑥 2 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫20 ∙ 𝑑𝑥 = 60| = = 933.333.
20 𝑥=20 60
40 40 (𝑥−30)2
c. 𝜇2′ = ∫20 (𝑥 − 𝜇)2 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫20 ∙ 𝑑𝑥 = 33.333.
20
(𝑥−30) 𝑥=40
3
= | = 33.333.
60 𝑥=20
Același rezultat se obține și dacă utilizăm ecuația (2.45), particularizată
pentru cazul 𝑞 = 2, adică:
𝜇2′ = 𝜇2 − 𝜇 2 = 933.333 − 302 = 33.333.

5.4.2 MEDIANA

Definiția 5.7: Fie 𝑋 o variabilă aleatorie. Se numește mediană, valoarea numerică notată cu
𝑀𝑒 și definită prin relația:
1
Pr(𝑋 ≤ 𝑀𝑒) = Pr(𝑋 > 𝑀𝑒) = , (5.19)
2
Particularizând ecuația (5.19) pentru cazul variabilelor aleatorii continue, se obține:
𝑀𝑒 ∞
1
∫ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑓(𝑥)𝑑𝑥 = . (5.20)
2
−∞ 𝑀𝑒

Geometric, mediana reprezintă valoarea cea mai probabilă a variabilei aleatorii, fiind egală cu
abscisa punctului prin care o paralelă la axa 𝑂𝑦 împarte în două părți egale aria delimitată de
curba 𝑓(𝑥) și axa absciselor, vezi figura 5.1.

99
𝑓(𝑥)

0.5
0.5
𝑋
𝑀𝑒

Figura 5.1: Semnificația geometrică a medianei

În cazul unei variabile aleatorii discrete, prin particularizarea ecuației (5.19) se obține:
1
∑ 𝑝𝑋 (𝑥𝑖 ) = ∑ 𝑝𝑋 (𝑥𝑖 ) = . (5.21)
𝑥𝑖 ≤𝑀𝑒 𝑥𝑖 >𝑀𝑒 2

Exemplul 5.2
Să se determine valoarea mediei și medianei pentru variabila aleatorie:
2 3 4 5 6 7 8 9 10 11 12
𝑋: ( 1 2 3 4 5 6 5 4 3 2 1)
36 36 36 36 36 36 36 36 36 36 36
2+12 2∙(3+11) 3∙(4+10) 4∙(5+9) 5∙(6+8) 6∙7 252
Soluție: 𝜇= + + + + + = = 7.
36 36 36 36 36 36 36
𝑀𝑒 = 7.

Pentru o variabilă aleatorie continuă mediana este unic determinată de relația (5.20). În cazul
variabilelor aleatorii discrete, pot exista situații în care mediana nu este unic determinată.

Exemplul 5.3
Să se determine valoarea mediei și medianei pentru variabila aleatorie:
1 2 3 4 5 6
𝑌: (1 1 1 1 1 1)
6 6 6 6 6 6
1 2 3 4 5 6 21
Soluție: 𝜇 =6+6+6+6+6+6= = 3.5.
6

Dacă corelăm acest rezultat cu cel obținut la exemplul 5.2 și utilizăm


proprietățile mediei teoretice putem să afirmăm că 𝑋 = 2 ∙ 𝑌. Într-adevăr,
rezultatul este corect pentru că 𝑌, reprezintă variabila aleatorie asociată
aruncării unui zar, iar 𝑋 reprezintă cazul în care sunt aruncate, simultan, două
zaruri.

100
1
𝑀𝑒 = 3, dacă utilizăm ecuația ∑𝑥𝑖 ≤𝑀𝑒 𝑝𝑋 (𝑥𝑖 ) = 2.
1
𝑀𝑒 = 4, dacă utilizăm ecuația ∑𝑥𝑖 >𝑀𝑒 𝑝𝑋 (𝑥𝑖 ) = 2.
Prin convenție, mediana se determină ca media aritmetică a acestor două
3+4
valori: 𝑀𝑒 = = 3.5.
2

5.4.3 MODA

Definiția 5.8: Valoarea (sau valorile) unei variabile aleatorii discrete corespunzătoare unui
maxim al funcției de probabilitate:
𝑃𝑟(𝑀𝑜) =max 𝑝𝑋 (𝑥𝑖 ), (5.22)
𝑖

și, valoarea (sau valorile) unei variabile aleatorii continue, corespunzătoare


unui maxim local al funcției de densitate de repartiție:
𝑓(𝑀𝑜) =𝑚𝑎𝑥𝑖 𝑓(𝑥𝑖 ), (5.23)
se numește moda variabilei aleatorii și se notează cu 𝑀𝑜.
Ecuația (5.22) se mai poate scrie și sub formele:
𝑓′(𝑀𝑜) = 0, (5.24)
sau,
𝑑2
𝐹′′(𝑀𝑜) = 2 𝐹(𝑀𝑜) = 0. (5.25)
𝑑𝑥
În funcție de numărul de mode ale variabilei aleatorii, repartițiile pot fi:
 Antimodale, dacă repartiția de probabilitate a variabilei aleatorii nu are modă, vezi
cazul exemplului 5.3;
 Unimodale, dacă repartiția de probabilitate a variabilei aleatorii are o singură modă;
 Multimodale, sau plurimodale, dacă repartiția de probabilitate a variabilei aleatorii are
mai multe mode.

𝑓(𝑥)

𝑋
𝑀𝑜

Figura 5.1: Moda unei variabile aleatorii continue

101
Exemplul 5.4
Considerăm variabila aleatorie din exemplul 5.2. Să se determine
valoarea modei pentru variabila aleatorie, 𝑋.
Soluție: Rezultă, 𝑀𝑜 = 7.

5.5 PARAMETRII TENDINȚEI DE ÎMPRĂȘTIERE

Din categoria caracteristicilor numerice ale tendinței de împrăștiere a valorilor unei variabile
aleatorii, fac parte dispersia (sau varianța), abaterea standard (sau abaterea medie pătratică),
cuantilele și coeficientul de variație.

5.5.1 DISPERSIA

Definiția 5.9: Se numește dispersie, sau varianța unei variabile aleatorii 𝑋, valoarea
numerică:
𝑛

∑(𝑥𝑖 − 𝜇)2 ∙ 𝑝𝑖 , pentru o v.a. 𝑋, discretă


𝑖=1
𝑉(𝑋) = 𝜎 2 = ∞ . (5.26)
∫ (𝑥 − 𝜇)2 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 , pentru o v.a. 𝑋, continuă
{−∞
În ecuația (5.26), prin 𝜇 s-a notat media variabilei aleatorii 𝑋.
Dispersia unei variabile aleatorii poate fi interpretată ca momentul de inerție al repartiției
probabilității în raport cu centrul său de greutate.
Deci, dispersia ne permite caracterizarea gradului de împrăștiere a valorilor variabilei aleatorii
în jurul valorii medii.
Proprietățile dispersiei:
a. Legătura dintre operatorul mediei, 𝐸(𝑋) și cel al dispersiei, 𝑉(𝑋), este:
𝑉(𝑋) = 𝐸[(𝑋 − 𝜇)2 ] = 𝐸{[𝑋 − 𝐸(𝑋)]2 }. (5.27)
Ecuația (5.26) indică faptul că dispersia unei variabile aleatorii reprezintă momentul de
ordinul doi al abaterii variabilei aleatorii.
b. Dispersia unei variabile aleatorii reprezintă momentul centrat de ordinul 𝑞 = 2.
𝑉(𝑋) = 𝜇2′ . (5.28)
c. Conform ecuației (5.18), particularizate pentru valoarea 𝑞 = 2, se obține:
𝑉(𝑋) = 𝜇2′ = 𝜇2 − 𝜇 2 = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2 . (5.29)
Demonstrație: Utilizând proprietatea 9, demonstrată pentru medie, prin particularizare
pentru 𝑞 = 2, rezultă:
𝜇2′ = (−1)0 ∙ 𝐶20 ∙ 𝜇 0 ∙ 𝜇2 + (−1)1 ∙ 𝐶21 ∙ 𝜇1 ∙ 𝜇1 + (−1)2 ∙ 𝐶22 ∙ 𝜇 2 ∙ 𝜇0 =

102
= 𝜇2 − 2 ∙ 𝜇 ∙ 𝜇 + 𝜇 2 = 𝜇2 − 𝜇 2 .
d. Din relația de definiție a dispersiei, (5.25), rezultă:
𝑉(𝑋) ≥ 0. (5.29)
Demonstrație: Conform proprietății a, se constată că [𝑋 − 𝐸(𝑋)]2 ≥ 0, deci, 𝐸{[𝑋 −
𝐸(𝑋)]2 } ≥ 0.
e. Fie 𝑋 o variabilă aleatorie şi 𝑎 ∈ ℛ, o constantă arbitrară, atunci:
𝑉(𝑎 ∙ 𝑋) = 𝑎2 ∙ 𝑉(𝑋). (5.30)
Demonstrație: Vom defini o nouă variabilă aleatorie, 𝑌 = 𝑎 ∙ 𝑋. Pentru această variabilă
aleatorie:
𝐸(𝑌) = 𝑎 ∙ 𝐸(𝑋) şi 𝐸(𝑌 2 ) = 𝐸[(𝑎 ∙ 𝑋)2 ] = 𝑎2 ∙ 𝐸(𝑋 2 ),
deci:
𝑉(𝑎 ∙ 𝑋) = 𝑉(𝑌) = 𝐸(𝑌 2 ) − [𝐸(𝑌)]2 = 𝑎2 ∙ [𝐸(𝑋 2 ) − 𝐸(𝑋)2 ] =
= 𝑎2 ∙ 𝑉(𝑋).
f. Fie 𝑋 o variabilă aleatorie şi două constante arbitrare 𝑎, 𝑏 ∈ ℛ, atunci dispersia variabilei
aleatorii 𝑌, unde 𝑌 = 𝑎𝑋 + 𝑏, este:
𝑉(𝑌) = 𝑎2 ∙ 𝑉(𝑋). (5.31)
Demonstrație: Pentru noua variabilă aleatorie Y, obținem:
𝐸(𝑌) = 𝑎 ∙ 𝐸(𝑋) + 𝑏 și [𝐸(𝑌)]2 = 𝑎2 [𝐸(𝑋)]2 + 2𝑎 ∙ 𝑏 ∙ 𝐸(𝑋)+𝑏 2
𝐸(𝑌 2 ) = 𝐸[(𝑎 ∙ 𝑋 + 𝑏)2 ] = 𝐸(𝑎2 ∙ 𝑋 2 + 2𝑎𝑏𝑋 + 𝑏 2 ) =
= 𝑎2 𝐸(𝑋 2 ) + 2𝑎 ∙ 𝑏 ∙ 𝐸(𝑋) + 𝑏 2 ,
deci:
𝑉(𝑌) = 𝐸(𝑌 2 ) − [𝐸(𝑌)]2 =
= 𝑎2 [𝐸(𝑋)]2 + 2𝑎 ∙ 𝑏 ∙ 𝐸(𝑋) + 𝑏 2 − 𝑎2 𝐸(𝑋 2 ) − 2𝑎 ∙ 𝑏 ∙ 𝐸(𝑋) − 𝑏 2
= 𝑎2 [𝐸(𝑋 2 ) − [𝐸(𝑋)]2 ] = 𝑎2 ∙ 𝑉(𝑋).
g. Fie 𝑋 şi 𝑌, două variabile aleatorii independente, atunci:
𝑉(𝑋 + 𝑌) = 𝑉(𝑋) + 𝑉(𝑌). (5.32)
Demonstrație: Dacă vom defini o nouă variabilă aleatorie, Z = X + Y. Pentru această
variabilă aleatorie:
𝑉(𝑍) = 𝐸(𝑍 2 ) − [𝐸(𝑍)]2 .
𝐸(𝑍 2 ) = 𝐸[(𝑋 + 𝑌)2 ] = 𝐸(𝑋 2 + 2𝑋𝑌 + 𝑌 2 ) =
= 𝐸(𝑋 2 ) + 2 ∙ 𝐸(𝑋 ∙ 𝑌) + 𝐸(𝑌 2 ).
X şi Y fiind variabile aleatorii independente, atunci E(X ∙ Y) = E(X) ∙
E(Y), iar
𝐸(𝑍 2 ) = 𝐸(𝑋 2 ) + 2 ∙ 𝐸(𝑋) ∙ 𝐸(𝑌) + 𝐸(𝑌 2 ).
[𝐸(𝑍)]2 = [𝐸(𝑋 + 𝑌)]2 = [𝐸(𝑋)]2 + 2𝐸(𝑋) ∙ 𝐸(𝑌) + [𝐸(𝑌)]2 .
Rezultă:

103
𝑉(𝑍) = 𝐸(𝑍 2 ) − [𝐸(𝑍)]2 = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2+ 𝐸(𝑌 2 ) − [𝐸(𝑌)]2 =
= 𝑉(𝑋) + 𝑉(𝑌).
h. Fie 𝑋1 , 𝑋2 , , 𝑋𝑛 , 𝑛 variabile aleatorii, independente două câte două, şi 𝑎1 , 𝑎2 , , 𝑎𝑛 , 𝑛
constante arbitrare, atunci:
𝑛 𝑛

𝑉 (∑ 𝑎𝑖 ∙ 𝑋𝑖 ) = ∑ 𝑎𝑖2 ∙ 𝑉(𝑋𝑖 ). (5.33)


𝑖=1 𝑖=1

Această ecuație reprezintă o generalizare a proprietăților e și g.

Exemplul 5.5
Considerăm variabila aleatorie din exemplul 5.3. Să se determine
dispersia variabilei aleatorii 𝑋.
1
Soluție: 𝑉(𝑋) = 𝜎 2 = 6 ∙ [(1 − 3.5)2 + (2 − 3.5)2 + (3 − 3.5)2 + (4 − 3.5)2 +

+(5 − 3.5)2 + (6 − 3.5)2 ] = 2.917.

Utilizarea indicatorilor numerici de poziționare și ai celor de împrăștiere pot furniza informații


asupra repartiției unei variabile aleatorii, însă aceștia nu ne permit evaluarea probabilităților
corespunzătoare apartenenței valorilor variabilei aleatorii la anumite intervale. O evaluare
simplă a probabilităților corespunzătoare unor abateri de la medie se poate realiza prin
intermediul inegalității lui Markov și/sau a inegalității lui Cebîşev.

5.5.2 INEGALITATEA LUI MARKOV

Fie 𝑋 o variabilă aleatorie, ale cărei valori sunt pozitive, 𝑥 ∈ ℛ+ , atunci ∀𝑎 ∈ ℛ, 𝑎 > 0,
inegalitatea lui Markov ne permite calculul probabilităților pentru evenimente de forma
(𝑋 ≥ 𝑎), folosind relația:
𝐸(𝑋)
𝑃𝑟(𝑋 ≥ 𝑎) ≤ , (5.34)
𝑎
sau pentru evenimentul contrar,
𝐸(𝑋)
𝑃𝑟(𝑋 < 𝑎) ≥ 1 − (5.35)
𝑎
În cazul unei variabile aleatorii continue, ecuația (5.34) se obține pornind de la definiția mediei:
∞ 𝑎 ∞

𝐸(𝑋) = ∫ 𝑥 ∙ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 ∙ 𝑓(𝑥)𝑑𝑥 + ∫ 𝑥 ∙ 𝑓(𝑥)𝑑𝑥


0 0 𝑎
∞ ∞ ∞

≥ ∫ 𝑥 ∙ 𝑓(𝑥)𝑑𝑥 ≥ ∫ 𝑎 ∙ 𝑓(𝑥)𝑑𝑥 = 𝑎 ∫ 𝑓(𝑥)𝑑𝑥 = 𝑎 ∙ Pr(𝑋 ≥ 𝑎) .


𝑎 𝑎 𝑎

Pentru cazul variabilelor aleatorii discrete, demonstrația este identică, doar că se vor utiliza
sumele în locul integralelor.

104
5.5.3 INEGALITATEA LUI CEBÎŞEV

Fie 𝑋 o variabilă aleatorie având media teoretică µ şi dispersia 𝜎 2 , atunci, probabilitatea unor
evenimente de forma (−∞, 𝜇 − 𝑎] ∪ [𝜇 + 𝑎, ∞), unde 𝑎 reprezintă o valoare oarecare, reală și
pozitivă, este mai mică sau egală cu câtul dintre dispersia, 𝜎 2 şi pătratul lui 𝑎:
𝜎2
𝑃𝑟{|𝑋 − 𝜇| ≥ 𝑎} ≤ . (5.36)
𝑎2
În cazul unei variabile aleatorii continue, ecuația (5.36) se deduce pornind de la definiția
dispersiei:
∞ 𝜇 ∞

𝜎 2 = ∫ (𝑥 − 𝜇)2 ∙ 𝑓(𝑥)𝑑𝑥 = ∫(𝑥 − 𝜇)2 ∙ 𝑓(𝑥)𝑑𝑥 + ∫ (𝑥 − 𝜇)2 ∙ 𝑓(𝑥)𝑑𝑥 ≥


−∞ −∞ 𝜇
𝜇−𝑎 ∞

≥ ∫ (𝑥 − 𝜇)2 ∙ 𝑓(𝑥)𝑑𝑥 + ∫ (𝑥 − 𝜇)2 ∙ 𝑓(𝑥)𝑑𝑥 ≥


−∞ 𝜇+𝑎
𝜇−𝑎 ∞

≥ 𝑎2 ∫ 𝑓(𝑥)𝑑𝑥 + 𝑎2 ∫ 𝑓(𝑥)𝑑𝑥.
−∞ 𝜇+𝑎

Rezultă, conform figurii 5.3:


𝜎2
≥ 𝐹(𝜇 − 𝑎) + 1 − 𝐹(𝜇 + 𝑎) ≥ 𝑃𝑟{|𝑋 − 𝜇| ≥ 𝑎}.
𝑎2
Pentru cazul variabilelor aleatorii discrete, demonstrația este identică, doar că se vor utiliza
sumele în locul integralelor.
Inegalitatea lui Cebîşev se poate scrie și pentru evenimentul contrar, adică evenimentul 𝑋 ∈
(𝜇 − 𝑎, 𝜇 + 𝑎), şi anume:
𝜎2
𝑃𝑟{|𝑋 − 𝜇| < 𝑎} ≥ 1 − 2 (5.37)
𝑎
|𝑋 − 𝜇| < 𝑎

𝑓(𝑥)
𝐹(𝜇 − 𝑎)

1 − 𝐹(𝜇 + 𝑎)

𝑋
µ−𝑎 µ µ+𝑎

Figura 5.3 Inegalitatea lui Cebîșev

105
În cazul repartițiilor simetrice, probabilitatea aproximativă furnizată de inegalitatea lui Cebîşev
poate fi îmbunătățită, prin utilizarea ecuației:
𝜎2
𝑃𝑟{|𝑋 − 𝜇| ≥ 𝑎} ≤ , (5.38)
2 ∙ 𝑎2
sau:
𝜎2
𝑃𝑟{|𝑋 − 𝜇| < 𝑎} ≤ 1 − , (5.39)
2 ∙ 𝑎2
pentru evenimentul contrar.

Exemplul 5.6
Producția medie săptămânală în cadrul unui atelier este de 50 de
produse. Să se calculeze probabilitatea:
a. Ca într-o săptămână producția să fie mai mare de 75 de produse;
b. Ca într-o săptămână producția să fie între 40 și 60 de produse. Presupunem,
în acest caz, că dispersia producției este de 25.
c. Aceeași întrebare ca la punctul b, în condițiile unei repartiții simetrice.
Soluție: a. Conform ecuației (5.34), rezultă:
50 2
𝑃𝑟(𝑋 ≥ 75) ≤ = .
75 3
b. Conform inecuației lui Cebîşev:
𝜎2 3
𝑃𝑟(|𝑋 − 50| < 10) ≥ 1 − 2 = .
10 4
c. Vom utiliza o ecuaţie de tipul (5.39):
𝜎2 7
𝑃𝑟(|𝑋 − 50| < 10) ≥ 1 − 2
= .
2 ∙ 10 8

Pentru situațiile în care este necesar să calculăm probabilitățile ca variabila aleatorie să aparțină
unor intervale, ale căror limite sunt exprimate sub forma unor multipli ai dispersiei, vom utiliza
inecuația lui Cebîșev scrisă sub forma:
1
𝑃𝑟{|𝑋 − 𝜇| ≥ 𝑘 ∙ 𝜎} ≤ 2 , (5.40)
𝑘
sau
1
𝑃𝑟{|𝑋 − 𝜇| < 𝑘 ∙ 𝜎} ≥ 1 − 2 . (5.41)
𝑘
Relațiile (5.40) și (5.41) se obțin prin utilizarea ecuației:
𝑎 = 𝑘 ∙ 𝜎, 𝑘 > 0.

 Precizați care sunt cele trei aspecte esențiale ale unei variabile aleatorii
ce pot fi caracterizate prin intermediul valorilor tipice.
 Definiți momentul de ordinul q al variabilei aleatorii și momentul centrat

106
de ordinul 𝑞 în cazul unei variabile aleatorii continue și în cazul unei
variabile aleatorii discrete.
 Definiți valoarea medie teoretică a variabilelor aleatorii și precizați
semnificația fizică a acesteia.
 Definiți abaterea unei variabilei aleatorii.
 Enumerați proprietățile mediei teoretice.
 Definiți mediana și moda unei variabile aleatorii.
 Clasificați tipurile de repartiții în funcție de numărul de mode.
 Definiți dispersia unei variabile aleatorii și precizați semnificația fizică
a acesteia.
 Enumerați proprietățile dispersiei.
 Enunțați inegalitatea lui Markov și inegalitatea lui Cebîșev și precizați
în ce situații pot fi utilizate aceste relații.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Momentul de ordinul q;  Moda;


 Momentul centrat de ordinul 𝑞;  Dispersia;
 Valoarea medie teoretică;  Inegalitatea lui Markov;
 Abaterea unei variabilei aleatorii;  Inegalitatea lui Cebîșev.
 Mediana;

Rezumat
În această unitate de învățare s-a început prezentarea valorilor tipice asociate
unei variabile aleatorii. Astfel au fost definite noțiunile de momentul de ordinul q
și momentul centrat de ordinul 𝑞.
Din categoria parametrilor tendinței de poziționare, ai unei variabile aleatorii s-
au definit parametrii: media teoretică, media și moda. De asemenea, s-au
demonstrat principalele proprietăți ale acestor valori tipice precum și
semnificația fizică a lor. Din categoria parametrilor tendinței de împrăștiere s-a
definit dispersia și s-au demonstrat principale proprietăți ale ei. La final, s-au
prezentat inegalitățile lui Markov și Cebîșev, relații ce permit estimarea
probabilităților unor abateri de la medie.
În continuare se vor prezenta alți parametri ai tendinței de împrăștiere, a
parametrilor formei repartiției precum și corelația și covarianța variabilelor
aleatorii.

107
Test de autoevaluare a cunoștințelor
P.5.1 Funcția densitate de probabilitate a variabilei aleatorii 𝑋, este:
𝑥, dacă 0 ≤ 𝑥 ≤ 1
1
𝑓(𝑥) = { , dacă 1 < 𝑥 ≤ 2 .
2
0, dacă 0 > 𝑥 > 2
Să se calculeze:
a. Media variabilei aleatorii 𝑋;
b. Media variabilei aleatorii 𝑌 = 𝑋⁄4 ;
c. Mediana variabilei aleatorii 𝑋;
d. Moda variabilei aleatorii 𝑋.
1 2
R:
2
𝑥
𝑎. 𝐸(𝑥) = ∫ 𝑥 𝑑𝑥 + ∫ 𝑑𝑥 = 1.08333
2
0 1
1 2
𝑥 𝑥 1
𝑏. 𝐸(𝑋⁄4) = ∫ ∙ 𝑥 ∙ 𝑑𝑥 + ∫ ∙ 𝑑𝑥 = 0.270833
4 4 2
0 1
0, 0 > 𝑥
𝑥2
,0 ≤ 𝑥 ≤ 1
𝑐. 𝐹(𝑥) = 2 ⇒ 𝑀𝑒 = 1.0
𝑥
,1 < 𝑥 ≤ 2
2
{ 1, 𝑥 > 2
d. 𝑀𝑜 = 1.
P.5.2 Variabila aleatorie 𝑋 are funcția densitate de probabilitate:
0, dacă 𝑥 < 1
𝑥
, dacă 1 ≤ 𝑥 ≤ 2
3
𝑓(𝑥) = 1
, dacă 2 < 𝑥 ≤ 3
2
{ 0, dacă 𝑥 > 3
Să se calculeze:
a. 𝐸(𝑋); b. Mediana variabilei aleatorii 𝑋
c. Moda variabilei aleatorii 𝑋; d. 𝑉(𝑋).
R: 2 3
𝑥2 𝑥
𝑎. 𝐸(𝑋) = ∫ 𝑑𝑥 + ∫ 𝑑𝑥 = 2.027778
3 2
1 2
0, dacă 𝑥 < 1
𝑥2 1
− , dacă 1 ≤ 𝑥 ≤ 2
𝑏. 𝐹(𝑥) = 6 6 ⇒ 𝑀𝑒 = 2
1 𝑥
− + , dacă 2 < 𝑥 ≤ 3
2 2
{ 1, dacă 𝑥 > 3
𝑐. 𝑀𝑜 = 2
2
(𝑥 − 2.027778)2 ∙ 𝑥
𝑑. 𝑉(𝑋) = ∫ 𝑑𝑥 +
3
1

108
3
(𝑥 − 2.027778)2
+∫ 𝑑𝑥 = 0.304784
2
2

P.5.3 Funcția densitate de probabilitate a variabilei aleatorii 𝑋, este:


𝑓(𝑥) = 1, dacă 0 ≤ 𝑥 ≤ 1 .
Să se calculeze media variabilei aleatorii 𝑌, știind că :
a. 𝑌 = 5 ∙ 𝑋 + 2;
b. 𝑌 = 𝑋 2 ;
c. 𝑌 = 𝑒 𝑋 .
1 𝑥=1
𝑥2
R: 𝑎. 𝐸(𝑋) = ∫ 𝑥 ∙ 𝑑𝑥 = | = 0.5 ⇒ 𝐸(𝑌) = 𝐸(5 ∙ 𝑋 + 2)
2 𝑥=0
0
= 5 ∙ 𝐸(𝑋) + 2 = 0.5 ∙ 5 + 2 = 4.5
1
𝑓(𝑦) = , dacă 2 ≤ 𝑥 ≤ 7 .
5
7 𝑦=7
𝑦 𝑦2 49 − 4
𝐸(𝑌) = ∫ ∙ 𝑑𝑥 = | = = 4.5
5 10 𝑦=2 10
2
1 𝑥=1
5 ∙ 𝑥2 5
𝐸(𝑌) = ∫(5 ∙ 𝑥 + 2) ∙ 𝑑𝑥 = ( + 2 ∙ 𝑥)| = + 2 = 4.5
2 𝑥=0
2
0
1 𝑥=1
𝑥3 1
𝑏. 𝐸(𝑌) = ∫ 𝑥 2 ∙ 𝑑𝑥 = | =
3 𝑥=0 3
0
1
𝑓(𝑦) = , dacă 0 ≤ 𝑥 ≤ 1 .
2 ∙ √𝑦
1 3 𝑦=1
𝑦
𝑦2 1
𝐸(𝑌) = ∫ 𝑑𝑦 = | =
2 ∙ √𝑦 3 3
0 𝑦=0
1
𝑥=1
𝑐. 𝐸(𝑌) = ∫ 𝑒 𝑥 ∙ 𝑑𝑥 = 𝑒 𝑥 |𝑥=0 = 𝑒 − 1 = 1.718
0
1
𝑓(𝑦) = , dacă 1 ≤ 𝑥 ≤ 𝑒 .
𝑦
𝑒
𝑦 𝑦=𝑒
𝐸(𝑌) = ∫ ∙ 𝑑𝑦 = 𝑦|𝑦=1 = 𝑒 − 1 = 1.718.
𝑦
1
P.5.4 Fie 𝑋 și 𝑌 două variabile aleatorii independente având funcțiile densitate de
probabilitate:
𝑒 −𝑥 , dacă 𝑥 ≥ 0
𝑓(𝑥) = { .
0, dacă 𝑥 < 0
Să se calculeze:
a. 𝐸(𝑋); b. 𝑉(𝑋 + 𝑌);
c. 𝑉(2 ∙ 𝑋 − 𝑌); d. 𝐸(𝑋 ∙ 𝑌);
R: ∞
𝑥=∞
𝑎. 𝐸(𝑋) = 𝐸(𝑌) = ∫ 𝑥 ∙ 𝑒 −𝑥 ∙ 𝑑𝑥 = −𝑒 −𝑥 ∙ (𝑥 + 1)|𝑥=0 =1
0

109

𝑥=∞
𝑏. 𝑉(𝑋) = 𝑉(𝑌) = ∫ (𝑥 − 1)2 ∙ 𝑒 −𝑥 ∙ 𝑑𝑥 = 𝑒 −𝑥 ∙ (𝑥 2 + 1)|𝑥=0 =1
0
𝑐. 𝑉(2 ∙ 𝑋 − 𝑌) = 4 ∙ 𝑉(𝑋) + 𝑉(𝑋) = 5
𝑑. 𝐸(𝑋 ∙ 𝑌) = 𝐸(𝑋) ∙ 𝐸(𝑌) = 1 ∙ 1 = 1.
P.5.5 Fie X o variabilă aleatorie având următoarele valori ale momentelor:
8
𝜇1 = , 𝜇2 = 3;
5
216 27
𝜇3 = , 𝜇4 =
35 2
Să se determine valorile primelor patru momente centrate.
R:
𝜇1′ = 0;
8 2 11
𝜇2′ = 3 − ( ) = ;
5 25
216 8 8 3 32
𝜇3′ = −3∙3∙ +2∙( ) =− ;
35 5 5 875
27 216 8 8 2 8 4 3693
𝜇4′ = −4∙ ∙ +6∙3∙( ) −3∙( ) = .
2 35 5 5 5 8750
P.5.6 Fie variabila aleatorie discretă, 𝑋, având funcția de probabilitate:
1
𝑝𝑋 (𝑥𝑖 ) = , 𝑥 = 𝑎, 𝑎 + 1, 𝑎 + 2, … , 𝑎 + 𝑛.
𝑛+1 𝑖
Să se calculeze media și dispersia variabilei aleatorii.
R: 𝑛 𝑛(𝑛 + 1)
𝑎+𝑖 𝑎 + 𝑖 𝑎(𝑛 + 1) + 2 𝑛
𝐸(𝑋) = ∑ = = =𝑎+
𝑛+1 𝑛+1 𝑛+1 2
𝑖=1
𝑛 𝑛 2 𝑛
(𝑎 + 𝑖 − 𝑎 − 2 ) (2𝑖 − 𝑛)2 𝑛(𝑛 + 2)
𝑉(𝑋) = ∑ =∑ =
𝑛+1 4(𝑛 + 1) 12
𝑖=1 𝑖=1

P.5.7 Se consideră variabila aleatorie discretă, 𝑋, definită prin tabloul:


1 2 3 4 5 6
𝑋: ( 1 2 3 4 5 6)
21 21 21 21 21 21
Să se calculeze:
a. Media variabilei aleatorii 𝑋; b. Media variabilei aleatorii 𝑌 = 2 ∙ 𝑋 − 1;
c. Mediana variabilei aleatorii 𝑋; d. Moda variabilei aleatorii 𝑋;
e. Dispersia variabilei aleatorii 𝑋;
R: 1 2 3 4 5 6
𝑎. 𝐸(𝑋) = 1 ∙ +2∙ +3∙ +4∙ +5∙ +6∙ = 4.333
21 21 21 21 21 21
𝑏. 𝐸(𝑌) = 2 ∙ 𝐸(𝑋) − 1 = 2 ∙ 4.333 − 1 = 7.666
1 2 3
𝐸(𝑌) = (2 ∙ 1 − 1) ∙ + (2 ∙ 2 − 1) ∙ + (2 ∙ 3 − 1) ∙ +
21 21 21
4 5 6
+(2 ∙ 4 − 1) ∙ + +(2 ∙ 5 − 1) ∙ + (2 ∙ 6 − 1) ∙ = 7.666
21 21 21
𝑐. 𝑀𝑒 = 5
𝑑. 𝑀𝑜 = 6

110
1 2
𝑒. 𝑉(𝑋) = (1 − 4.333)2 ∙ + (2 − 4.333)2 ∙ +
21 21
3 4
+(3 − 4.333)2 ∙ + (4 − 4.333)2 ∙ +
21 21
5 6
+(5 − 4.333)2 ∙ + (6 − 4.333)2 ∙ = 2.222.
21 21
P.5.8 Se consideră variabila aleatorie discretă, X, definită prin tabloul:
−1 0 1 2 3 4
𝑋: ( )
0.1 0.15 0.2 0.35 0.15 0.05
Să se calculeze:
a. Media variabilei aleatorii 𝑋; b. Media variabilei aleatorii 𝑌 = 2 ∙ 𝑋 2 ;
c. Mediana variabilei aleatorii 𝑋; d. Moda variabilei aleatorii 𝑋;
e. Dispersia variabilei aleatorii 𝑋;
R: 𝑎. 𝐸(𝑋) = −1 ∙ 0.1 + 0 ∙ 0.15 + 1 ∙ 0.2 + 2 ∙ 0.35 + 3 ∙ 0.15 +
+4 ∙ 0.05 = 1.45
2]
𝑏. 𝐸(𝑌) = ∙[2 (−1) ∙ 0.1 + ∙ 0 ∙ 0.15 + ∙ 12 ) ∙ 0.2 +
(2 2) (2
+(2 ∙ 2 ∙ 0.35 + (2 ∙ 32 ) ∙ 0.15 + (2 ∙ 42 ) ∙ 0.05 = 7.7
2)

𝑐. 𝑀𝑒 = 2
𝑑. 𝑀𝑜 = 2
𝑒. 𝑉(𝑋) = (−1 − 1.45)2 ∙ 0.1 + (0 − 1.45)2 ∙ 0.15 +
+(1 − 1.45)2 ∙ 0.2 + (2 − 1.45)2 ∙ 0.35 +
+(3 − 1.45)2 ∙ 0.15 + (4 − 1.45)2 ∙ 0.05 = 1.748.
P.5.9 Funcția densitate de probabilitate a variabilei aleatorii X este de forma:
0 dacă 𝑥 < 0
1
𝑓(𝑥) = { ∙ 𝑥 dacă 0 ≤ 𝑥 ≤ 2
2
0 dacă 𝑥 > 2
Să se calculeze:
a. Media variabilei aleatorii 𝑋;
b. 𝐸(3 ∙ 𝑋 2 − 2 ∙ 𝑋);
c. Dispersia variabilei aleatorii 𝑋.
∞ 2
2
R: 𝑥2 𝑥3 4
a. 𝐸(𝑥) = ∫ 𝑥 ∙ 𝑓(𝑥) = ∫ = | = ;
0 2 6 0 3
−∞

10
b. 𝐸(3 ∙ 𝑋2 − 2 ∙ 𝑋) = ∫(3 ∙ 𝑥2 − 2 ∙ 𝑥) ∙ 𝑓(𝑥) ∙ 𝑑𝑥 = ;
3
−∞
4 2 2
4 2𝑥 2
c. 𝑉(𝑋) = 𝐸 [(𝑋 − ) ] = ∫ (𝑥 − ) ∙ 𝑑𝑥 = .
3 0 3 2 9
P.5.10 Fie variabila aleatoria 𝑋, având media 𝜇 și dispersia 𝜎 2 . Să se determine
probabilitatea unor abateri ale variabilei aleatorii mai mari de 2 ∙ 𝜎 față de medie.

R: 1
𝑃𝑟(|𝑋 − 𝜇| ≥ 2 ∙ 𝜎) ≤ ⇒ 𝑃𝑟(|𝑋 − 𝜇| ≥ 2 ∙ 𝜎) ≤ 0.25,
22
sau, pentru evenimentul contrar:
𝑃𝑟(|𝑋 − 𝜇| < 2 ∙ 𝜎) ≥ 0.75.

111
Unitatea de învățare 6.

Cuprins
6.1. Introducere ........................................................................................................... 112
6.2. Competențe .......................................................................................................... 112
6.3. Parametrii tendinței de împrăștiere ..................................................................... 113
6.3.1. Legea numerelor mari ..........................................................................................113
6.3.2. Abaterea medie pătratică......................................................................................114
6.3.3. Coeficientul de variație .........................................................................................114
6.3.4. Cuantile.................................................................................................................115
6.4. Caracteristici numerice ale formei repartiției .................................................... 117
6.4.1. Coeficientul de asimetrie .......................................................................................118
6.4.2. Coeficientul de boltire ..........................................................................................119
6.5. Covarianță și corelație ....................................................................................... 120
6.6. Rezumat ............................................................................................................... 126
6.7. Test de autoevaluare............................................................................................ 127

6.1. Introducere
În această unitate de învățare se continuă studiul parametrilor tendinței de
împrăștiere. Se vor studia: legea numerelor mari, Abaterea medie pătratică,
Coeficientul de variație și cuantilele.
De asemenea, pentru a caracteriza forma repartițiilor statistice se vor introduce
două noi valori tipice. Este vorba de coeficientul de asimetrie și de coeficientul de
boltire. Ultima parte a acestei unități de învățare este destinată analizei relației ce
poate exista între două variabile aleatorii, adică covarianța și corelația.

6.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să definească și să
cunoască semnificația și proprietățile a trei noi caracteristici numerice asociate
unei variabile aleatorii: abaterea medie pătratică, coeficientul de variație și
cuantilele. Aceste valori critice caracterizează, împreună cu dispersia, tendința de
împrăștiere a variabilelor aleatorii. De asemenea, va fi capabil să utilizeze tehnici
și metode adecvate pentru caracterizarea formei unei repartiții statistice, precum
și să analizeze tipul de relație ce poate exista între două variabile aleatorii prin
calculul covarianței și a coeficientului de corelație.

Durata medie de parcurgere a acestei unități de învățare este de 3 ore.

112
6.3 PARAMETRII TENDINȚEI DE ÎMPRĂȘTIERE

6.3.1 LEGEA NUMERELOR MARI

În teoria probabilităților, legea numerelor mari reprezintă o teoremă care descrie rezultatul
efectuării unui număr mare de probe din cadrul aceluiași experiment.
Considerăm 𝑛 variabile aleatorii independente, 𝑋1 , 𝑋2 , … , 𝑋𝑖 , … , 𝑋𝑛 , fiecare având aceeași
medie și dispersie:
𝐸(𝑋1 ) = 𝐸(𝑋2 ) = … = 𝐸(𝑋𝑖 ) = … = 𝐸(𝑋𝑛 ) = 𝜇,
𝑉(𝑋1 ) = 𝑉(𝑋2 ) = … = 𝑉(𝑋𝑖 ) = … = 𝑉(𝑋𝑛 ) = 𝜎 2 .
Cu ajutorul celor 𝑛 variabile aleatorii construim o nouă variabilă aleatorie, notată cu, 𝑋̅ și
denumită medie aritmetică:
𝑛
1
𝑋̅ = ∙ ∑ 𝑋𝑖 .
𝑛
𝑖=1

Definiția 6.1: Probabilitatea ca media aritmetică să tindă spre valoarea medie a populației:
lim 𝑃𝑟{|𝑋̅ − 𝜇| < 𝜀} = 1, ∀𝜀 ∈ ℛ+ , (6.1)
𝑛→∞

este unu, dacă numărul variabilelor aleatorii, 𝑛 este suficient de mare.


Ecuația (6.1) reprezintă legea numerelor mari.
Pentru a demonstra această lege este necesar să calculăm media și dispersia variabilei aleatorii
𝑋̅:
1
𝑋̅ = ∙ (𝑋1 + 𝑋2 + … + 𝑋𝑖 + … + 𝑋𝑛 ),
𝑛
Adică:
1
𝐸(𝑋̅) = ∙ [𝐸(𝑋1 ) + 𝐸(𝑋2 ) + … + 𝐸(𝑋𝑖 ) + … + 𝐸(𝑋𝑛 )] = 𝜇,
𝑛
1 𝜎2
̅
𝑉(𝑋) = 2 ∙ [𝑉(𝑋1 ) + 𝑉(𝑋2 ) + … + 𝑉(𝑋𝑖 ) + … + 𝑉(𝑋𝑛 )] = .
𝑛 𝑛
Dacă, aceste rezultate le introducem în inegalitatea lui Cebîşev, relația (5.36), obținem:
𝑉(𝑋̅)
𝑃𝑟[|𝑋̅ − 𝐸(𝑋̅)| > 𝜀] ≤ 2 ,
𝜀
sau,
𝜎2
𝑃𝑟[|𝑋̅ − 𝜇| > 𝜀] ≤ .
𝑛 ∙ 𝜀2
Trecând la limită pentru 𝑛 → ∞, rezultă:
lim 𝑃𝑟[|𝑋̅ − 𝜇| > 𝜀] = 0.
𝑛→∞
Pentru evenimentul contrar, adică |𝑋̅ − 𝜇| ≤ 𝜀, relația anterioară devine:
lim 𝑃𝑟[|𝑋̅ − 𝜇| ≤ 𝜀] = 1,
𝑛→∞

113
tocmai legea numerelor mari.
Conform acestei legi, media valorilor de eșantionaj, obținută la un număr mare de extrageri
independente, tinde spre valoarea medie a populației.

Exemplul 6.1
Să se determine, cu o probabilitate de minim 95%, volumul unui eșantion
ce trebuie prelevat dintr-o populație de dimensiuni foarte mari, având 𝜇 = 10
și 𝜎 2 = 2, astfel încât media de eșantionaj să difere de cea a populației cu 5%:
Soluție: Folosind datele problemei, precum și legea numerelor mari, rezultă:
2
𝑃𝑟[|𝑋̅ − 𝜇| ≤ 0.05 ∙ 𝜇] > 1 − .
𝑛 ∙ (0.05 ∙ 10)2
Rezultă:
2
= 0.05, adică 𝑛 ≥ 160.
𝑛 ∙ (0.05 ∙ 10)2

6.3.2 ABATEREA MEDIE PĂTRATICĂ

În aplicațiile practice ale teoriei probabilităților, variabilele aleatorii au o anumită semnificație,


ele reprezentând diferite mărimi fizice: lungimi, forțe, timp etc. Valoarea numerică, cea mai
importantă, a unei variabile aleatorii care oferă informații despre gradul de împrăștiere, și
anume dispersia, așa cum este definită în subcapitolul 5.5.1, este exprimată printr-o mărime
care dimensional reprezintă pătratul variabilei aleatorii analizate. Eliminarea acestui
inconvenient se realizează prin utilizarea, ca măsură a gradului de împrăștiere, a unei noi
caracteristici numerice, numită abatere medie pătratică sau abatere standard. Abaterea standard
joacă în cadrul teoriei probabilităților același rol ca și raza de inerție în mecanică.
Definiția 6.2: Se numește abatere medie pătratică, sau abatere standard a variabilei
aleatorii 𝑋, rădăcina pătrată pozitivă a dispersiei:

√∑(𝑥𝑖 − 𝜇)2 ∙ 𝑝𝑖 , pentru o v.a., 𝑋, discretă


𝑖=1
𝜎 = √𝑉(𝑋) = . (6.2)

√ ∫ (𝑥 − 𝜇)2 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 , pentru o v.a., 𝑋, continuă


{ −∞

6.3.3 COEFICIENTUL DE VARIAȚIE

O altă caracteristică numerică importantă, care furnizează informații despre împrăștierea


asociată unei variabile aleatorii, relativ la valoarea mediei, este aceea de coeficient de variație.

114
Definiția 6.3: Se numește coeficientul de variație a variabilei aleatorii, 𝑋, valoarea numerică
notată cu 𝐶𝑣 și definită ca raportul dintre abaterea standard şi media variabilei

√𝑉(𝑋) 𝜎
𝐶𝑣 = = =
𝐸(𝑋) 𝜇
√∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2 ∙ 𝑝𝑖
, pentru o v.a., 𝑋, discretă
∑𝑛𝑖=1 𝑝𝑖 ∙ 𝑥𝑖 (6.3)
= ∞ .
√∫−∞(𝑥 − 𝜇)2 ∙ 𝑓(𝑥) ∙ 𝑑𝑥
∞ , pentru o v.a., 𝑋, continuă
{ ∫−∞ 𝑥 ∙ 𝑓(𝑥) ∙ 𝑑𝑥

6.3.4 CUANTILE

Definiția 6.4: Cuantilele (cvantilele) de ordin 𝑛 (𝑛  2), reprezintă cele 𝑛 − 1 valori reale:
𝑥𝐶1 < 𝑥𝐶2 < 𝑥𝐶3 < ⋯ < 𝑥𝐶𝑖 < ⋯ < 𝑥𝐶𝑛−1 ,
atașate variabilei aleatorii 𝑋, pentru care este îndeplinită relaţia:
𝑃𝑟[𝑋 ≤ 𝑥𝐶1 ] = 𝑃𝑟[𝑥𝐶1 < 𝑋 ≤ 𝑥𝐶2 ] = ⋯ = 𝑃𝑟[𝑥𝐶𝑖−1 < 𝑋 ≤ 𝑥𝐶𝑖 ] = ⋯
1 (6.4)
𝑃𝑟[𝑥𝐶𝑛−2 < 𝑋 ≤ 𝑥𝐶𝑛−1 ] = 𝑃𝑟[𝑋 > 𝑥𝐶𝑛−1 ] = .
𝑛
Ecuația (6.4) se mai poate scrie, în cazul variabilelor aleatorii continue şi sub forma:
𝑥𝐶 1 𝑥𝐶 2 𝑥𝐶 𝑖 ∞
1
∫ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑓(𝑥)𝑑𝑥 = ⋯ ∫ 𝑓(𝑥)𝑑𝑥 ⋯ = ∫ 𝑓(𝑥)𝑑𝑥 = . (6.5)
𝑛
−∞ 𝑥𝐶 1 𝑥𝐶𝑖−1 𝑥𝐶𝑛−1

Geometric, cuantilele reprezintă punctele de pe axa 𝑂𝑥 cu ajutorul cărora se împarte aria de sub
curba densitate de probabilitate în 𝑛 părți egale, vezi figura 6.1.

0.45
𝑓(𝑥)
0.4
0.35
0.3
0.25 1 1
0.2 𝑛 𝑛
0.15
0.1
0.05
0
𝑥𝐶1 𝑥𝐶2 … 𝑥𝐶𝑖 … 𝑥𝐶𝑛−2 𝑥𝐶𝑛−1 𝑋

Figura 6.1 Cuantilele de ordinul 𝑛

115
Tot din figura 6.1 rezultă și metoda de calcul ce trebuie utilizată pentru determinarea valorii
unei cuantile, 𝑥𝑝 :

𝐹(𝑥𝑝 ) = 𝑝. (6.6)
Deci, cuantila de ordinul 𝑝, 𝑥𝑝 , reprezintă valoarea variabilei aleatorii pentru care funcţia de
repartiţie este egală cu 𝑝 (0 ≤ 𝑝 ≤ 1), sau "sare" de la o valoare inferioară lui 𝑝, la o valoare
superioară a lui 𝑝, în cazul unei variabile aleatorii discrete:
𝑖 𝑖+1
𝐹(𝑥𝐶𝑖 ) ≤ , 𝐹(𝑥𝐶𝑖 + 0) ≥ , 1 ≤ 𝑖 ≤ 𝑛 − 1. (6.7)
𝑛 𝑛
În acest caz, al variabilelor aleatorii discrete, cuantilele de ordinul 𝑛 nu sunt unic determinate.
În funcție de valoare lui 𝑛, cuantilele pot avea diferite denumiri:
 Pentru 𝑛 = 2 obţinem mediana.
 Pentru 𝑛 = 4 obținem cuartilele. Prin intermediul acestor trei cuartile, notate
𝑞0.25 , 𝑞0.50 , 𝑞0.75 se poate construi un indicator al împrăștierii valorilor variabilei
aleatorii:
𝐼𝑞 = 𝑞0.75 − 𝑞0.25 . (6.8)
El poată numele de intervalul intercuartilic de variație. De asemenea:
𝑞0.50 = 𝑀𝑒.
 Pentru 𝑛 = 10 obţinem decile;
 Pentru 𝑛 = 100 obţinem percentila (centila). Dacă probabilitatea 𝑝 este exprimată în
procente, centilele se mai pot întâlni și sub denumirea de cuantile procentuale;

Exemplul 6.2
O variabilă aleatorie 𝑋 are funcția densitate de probabilitate:
1
𝑥 + , 𝑑𝑎𝑐ă 0 ≤ 𝑥 ≤ 1
𝑓𝑋 (𝑥) = { 2 .
0, 𝑑𝑎𝑐ă 𝑥 ∈ (−∞, 0) ∪ (1, ∞)
a) Să se determine 𝐹𝑋 (𝑥);
b) Să se determine coeficientul de variație;
c) Să se calculeze valoare intervalului intercuartilic.
𝑥
1 1
𝑆𝑜𝑙𝑢ț𝑖𝑒: 𝑎. 𝐹𝑋 (𝑥) = ∫ (𝑢 + ) ∙ 𝑑𝑢 = (𝑥 + 𝑥 2 ) , deci
0 2 2
0, 𝑥<0
1
𝐹𝑋 (𝑥) = { ∙ (𝑥 + 𝑥 2 ) , 0 ≤ 𝑥 ≤ 1.
2
1, 𝑥 > 1
1
1 𝑥 1 𝑥=1 7
𝑏. 𝜇 = ∫ 𝑥 ∙ (𝑥 + ) ∙ 𝑑𝑥 = 𝑥 2 ∙ ( + )| = .
2 3 4 𝑥=0 12
0

116
𝑥=1
1 7 2 1 7 3 𝑥 31 11
𝜎 2 = ∫0 (𝑥 − 12) ∙ (𝑥 + 2) ∙ 𝑑𝑥 = (𝑥 − 12) ∙ (4 + 144)| = 144.
𝑥=0

𝜎 11 12
𝐶𝑣 = 𝜇 = √144 ∙ = 0.4738.
7

1 2 )
c. ∙ (𝑞0.25 + 𝑞0.25 = 0.25 ⇒ 𝑞0.25 = 0.3660.
2
1 2 )
∙ (𝑞0.75 + 𝑞0.75 = 0.75 ⇒ 𝑞0.75 = 0.8228.
2
𝐼𝑞 = 𝑞0.75 − 𝑞0.25 = 0.8228 − 0.3660 = 0.4568.

6.4 CARACTERISTICI NUMERICE ALE FORMEI REPARTIŢIEI

Forma, sau alura unei repartiții de probabilitate poate fi caracterizată prin simetrie/asimetrie
și/sau prin boltire. În acest sens se utilizează doi coeficienți, este vorba de coeficientul de
asimetrie și de cel de boltire. Acești coeficienți se construiesc prin intermediul momentelor
centrate și furnizează informații relative la forma repartiției normale.
De asemenea, simetria sau asimetria unei repartiții o putem deduce din poziția relativă pe care
o au cei trei parametrii de poziționare: media, mediana și modul. Astfel:
a. Dacă valorile celor trei indicatori de poziționare coincid:
𝜇 = 𝑀𝑒 = 𝑀𝑜,
atunci repartiția variabilei aleatorii este simetrică, figura 6.2.

0.35
𝑓(𝑥)
0.3
0.25
𝜇 = 𝑀𝑒 = 𝑀𝑜
0.2
0.15
0.1
0.05
𝑋
0
0 2 4 6 8 10 12

Figura 6.2 Repartiție simetrică: 𝜇 = 𝑀𝑒 = 𝑀𝑜

b. Dacă valorile clor trei indicatori de poziționare se află într-o relație de forma:
𝑀𝑜 < 𝑀𝑒 < 𝜇,
atunci repartiția variabilei aleatorii are asimetrie dreapta, figura 6.3.

117
𝑓(𝑥)
0.5
0.45 𝑀𝑜
0.4
𝑀𝑒
0.35
0.3 𝜇
0.25
0.2
0.15
0.1
0.05
0 𝑋
0 1 2 3 4 5 6
Figura 6.3 Repartiție cu asimetrie dreapta: 𝑀𝑜 < 𝑀𝑒 < 𝜇

c. Dacă valorile celor trei indicatori de poziționare se află într-o relație de forma:
𝜇 < 𝑀𝑒 < 𝑀𝑜,
atunci repartiția variabilei aleatorii are asimetrie stânga, figura 6.4.

1.2
𝑓(𝑥) 𝑀𝑒
1
𝑀𝑜
0.8
𝜇
0.6

0.4

0.2
𝑋
0
1 1.5 2 2.5 3 3.5 4

Figura 6.4 Repartiție cu asimetrie stânga: 𝜇 < 𝑀𝑒 < 𝑀𝑜

6.4.1 COEFICIENTUL DE ASIMETRIE

Definiția 6.5: Se numește asimetrie, sau coeficient de asimetrie al variabilei aleatorii 𝑋,


raportul dintre momentul centrat de ordinul trei şi abaterea standard la puterea
a treia:
∑𝑛𝑖=1 𝑝𝑖 ∙ (𝑥𝑖 − 𝜇)3
3, pentru o v.a., 𝑋, discretă
[∑ 𝑛 (𝑥 2 ]2
𝑝
𝑖=1 𝑖 ∙ 𝑖 − 𝜇)
𝜇3′ ∞
𝛼3 = 3 = ∫−∞(𝑥 − 𝜇)3 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 . (6.9)
𝜎 , pentru o v.a., 𝑋, continuă
3

[√∫−∞(𝑥 − 𝜇)2 ∙ 𝑓(𝑥) ∙ 𝑑𝑥]
{

Asimetria furnizează următoarele informații despre repartiția unei variabile aleatorii:

118
 Valoarea 𝛼3 = 0, indică o repartiție simetrică a valorilor variabilei aleatorii, adică:
𝜇 = 𝑀𝑒 = 𝑀𝑜, figura 6.2;
 Valori 𝛼3 < 0, indică o asimetrie negativă (stânga) a valorilor variabilei aleatorii,
adică: 𝜇 < 𝑀𝑒 < 𝑀𝑜, figura 6.4;
 Valori 𝛼3 > 0, indică o asimetrie pozitivă (dreapta) a valorilor variabilei aleatorii,
adică: 𝑀𝑜 < 𝑀𝑒 < 𝜇, figura 6.3.

6.4.2 COEFICIENTUL DE BOLTIRE

Definiția 6.6: Se numește exces, sau coeficient de boltire, al variabilei aleatorii 𝑋, raportul
dintre momentul centrat de ordinul patru şi abaterea standard la puterea a patra:
∑𝑛𝑖=1 𝑝𝑖 ∙ (𝑥𝑖 − 𝜇)4
, pentru o v.a., 𝑋, discretă
𝜇4′ [∑𝑛𝑖=1 𝑝𝑖 ∙ (𝑥𝑖 − 𝜇)2 ]2
𝛼4 = 4 = ∞
∫−∞(𝑥 − 𝜇)4 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 . (6.10)
𝜎
∞ 2 , pentru o v.a., 𝑋, continuă
{[∫−∞(𝑥 − 𝜇)2 ∙ 𝑓(𝑥) ∙ 𝑑𝑥]
Excesul, sau coeficient de boltire servește la compararea gradului de împrăștiere al unei
variabile aleatorii în raport cu împrăștierea unei variabile aleatorii normal repartizate, vezi UI
8. Astfel o variabilă aleatorie normal repartizată are excesul egal cu valoarea trei, figura 6.5.
Deci:
 Valori 𝛼4 = 3, indică o repartiţie având boltirea normală, sau mezocurtică (cazul
repartiției normale);
 Valori 𝛼4 > 3, indică o repartiție având boltirea leptocurtică, adică o repartiție cu o
împrăștiere, a valorilor variabilei aleatorii, mai mici decât repartiția normală;
 Valori 𝛼4 < 3, indică o repartiție având boltirea platicurtică, adică o repartiție cu o
împrăștiere, a valorilor variabilei aleatorii, mai mari decât repartiția normală.

0.6
𝑓(𝑥)
0.5 Repartiție
leptocurtică
0.4
Repartiție
Repartiție platicurtică
0.3
mezocurtică
0.2

0.1
𝑋
0
0 2 4 6 8 10

Figura 6.5 Tipuri de exces

119
Exemplul 6.3
Să se determine asimetria și excesul variabilei aleatorii 𝑋, având funcția
densitate de probabilitate:
0, dacă 𝑥 < −1
2
𝑓(𝑥) = {−1.5 ∙ 𝑥 + 1, dacă − 1 ≤ 𝑥 ≤ 1.
0, dacă 𝑥 > 1
1 1
Soluție: a. 𝜇 = ∫−1 𝑥 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫−1 𝑥 ∙ (−1.5 ∙ 𝑥 2 + 1) ∙ 𝑑𝑥 =
𝑥=1
𝑥2
= ( − 0.375 ∙ 𝑥 4 )| ⇒ 𝜇 = 0.
2 𝑥=−1
𝑢

∫(−1.5 ∙ 𝑥 2 + 1) ∙ 𝑑𝑥 = 𝑢 − 0.5 ∙ 𝑢3 + 0.5


−1
⇒ 𝑀𝑒 − 0.5 ∙ 𝑀𝑒 3 + 0.5 = 0.5 ⇒ 𝑀𝑒 = 0.
𝑑
(−1.5 ∙ 𝑥 2 + 1) = −3 ∙ 𝑥 ⇒ −3 ∙ 𝑀𝑜 = 0 ⇒ 𝑀𝑜 = 0.
𝑑𝑥
Repartiția variabilei aleatorii 𝑋, este simetrică, deoarece 𝜇 = 𝑀𝑒 = 𝑀𝑜 = 0.
La aceeași concluzie se ajunge și dacă calculăm coeficientul de asimetrie:
𝜇3′ 0
𝛼3 = 3 = = 0.
𝜎 0.2582
1 1
𝜇3′ = ∫−1(𝑥 − 𝜇)3 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫−1 𝑥 3 ∙ (−1.5 ∙ 𝑥 2 + 1) ∙ 𝑑𝑥 =
𝑥=1
𝑥4
= ( 4 − 0.25 ∙ 𝑥 6 )| = 0.
𝑥=−1
1 1
𝜎 2 = ∫−1(𝑥 − 𝜇)2 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫−1 𝑥 3 ∙ (−1.5 ∙ 𝑥 2 + 1) ∙ 𝑑𝑥 =
𝑥=1
𝑥3
= ( 3 − 0.3 ∙ 𝑥 5 )| = 0.0666.
𝑥=−1
1 1

𝑏. 𝜇4′ = ∫(𝑥 − 𝜇)4 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ 𝑥 4 ∙ (−1.5 ∙ 𝑥 2 + 1) ∙ 𝑑𝑥 =


−1 −1
𝑥=1
𝑥 5 1.5 7
=( − ∙ 𝑥 )| = −0.02857
5 7 𝑥=−1
𝜇4′ −0.02857
𝛼4 = 4 = = −6.428, deci repartiția este platicurtică.
𝜎 0.00443556

6.5 COVARIANȚĂ ȘI CORELAȚIE

Dacă, pe un spațiu de eșantionaj sunt definite două sau mai multe variabile aleatorii, analiza
lor, din punctul de vedere al teoriei probabilităților, poate conduce la necesitatea cunoașterii

120
relațiilor care există între acestea, [TAR 81]. O măsură a relației care există între două variabile
aleatorii o reprezintă covarianța.
Fie 𝑋 şi 𝑌 două variabile aleatorii independente. Prin relația (5.32) s-a demonstrat că:
𝑉(𝑋 + 𝑌) = 𝑉(𝑋) + 𝑉(𝑌).
În cazul în care cele două variabile aleatorii sunt oarecare, deci nu se poate afirma că sunt într-
o relație de independență, vom obține:
𝑉(𝑋 + 𝑌) = 𝐸[(𝑋 + 𝑌)2 ] − [𝐸(𝑋 + 𝑌)]2 .
Adică:
𝐸[(𝑋 + 𝑌)2 ] = 𝐸(𝑋 2 + 2𝑋𝑌 + 𝑌 2 ) = 𝐸(𝑋 2 ) + 2 ∙ 𝐸(𝑋 ∙ 𝑌) + 𝐸(𝑌 2 ),
iar
[𝐸(𝑋 + 𝑌)]2 = [𝐸(𝑋)]2 + 2 ∙ 𝐸(𝑋) ∙ 𝐸(𝑌) + [𝐸(𝑌)]2 .
Rezultă că valoarea dispersiei sumei a două variabile aleatorii oarecare este:
𝑉(𝑋 + 𝑌) = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2 + 𝐸(𝑌 2 ) − [𝐸(𝑌)]2 + 2 ∙ 𝐸(𝑋 ∙ 𝑌) − 2 ∙ 𝐸(𝑋) ∙ 𝐸(𝑌).
Deci:
𝑉(𝑋 + 𝑌) = 𝑉(𝑋) + 𝑉(𝑌) + 2 ∙ 𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑌 − 𝐸(𝑌)]}. (6.11)
Definiția 6.7: Fie 𝑋 şi 𝑌 două variabile aleatorii, astfel încât avem 𝐸(𝑋), 𝐸(𝑌), 𝑉(𝑋), 𝑉(𝑌)
şi 𝐸(𝑋 ∙ 𝑌). Se numește covarianța, variabilelor aleatorii 𝑋 şi 𝑌, numărul real
notat cu 𝐶𝑂𝑉(𝑋, 𝑌) și definit de relația:

𝐶𝑂𝑉(𝑋, 𝑌) = 𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑌 − 𝐸(𝑌)]} (6.12)

Dacă particularizăm ecuația (6.12) pentru cazul a două variabile aleatorii, 𝑋 şi 𝑌, obţinem:
𝐶𝑂𝑉(𝑋, 𝑌) =

∑(𝑥𝑖 − 𝜇𝑋 ) ∙ (𝑦𝑗 − 𝜇𝑌 ) ∙ 𝑃𝑟[𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 ] , pentru v.a. discrete


𝑖,𝑗 (6.13)
= ∞ ∞ .
∫ ∫ [𝑥𝑖 − 𝜇𝑋 ] ∙ [𝑦𝑗 − 𝜇𝑌 ] ∙ 𝑓𝑋,𝑌 (𝑥, 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦 , pentru v.a continue
{−∞ −∞
În ecuația (6.13) s-a considerat, pentru cazul discret, variabilele aleatorii:
𝑥𝑖 𝑦𝑗
𝑋: (𝑝 ) , 𝑌: (𝑞 ) , 𝑖, 𝑗 ∈ 𝒩
𝑖 𝑗

Pentru cazul continuu, 𝑓𝑋,𝑌 (𝑥, 𝑦) reprezintă funcţia densitate de probabilitate bidimensională a
vectorului de variabile aleatorii (𝑋, 𝑌), iar 𝜇𝑋 și 𝜇𝑌 , reprezintă mediile teoretice ale celor două
variabile aleatorii.
Proprietățile covarianței:
1. Fie 𝑋 şi 𝑌 două variabile aleatorii, atunci:
𝐶𝑂𝑉(𝑋, 𝑌) = 𝐸(𝑋 ∙ 𝑌) − 𝐸(𝑋) ∙ 𝐸(𝑌) (6.14)
Demonstrație: Pornind de la relația de definiție a covarianței, (6.12), rezultă:

121
𝐶𝑂𝑉(𝑋, 𝑌) = 𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑌 − 𝐸(𝑌)]}
= 𝐸[𝑋 ∙ 𝑌 − 𝑌 ∙ 𝐸(𝑋) − 𝑋 ∙ 𝐸(𝑌) + 𝐸(𝑋) ∙ 𝐸(𝑌)]
= 𝐸(𝑋 ∙ 𝑌) − 𝐸(𝑋) ∙ 𝐸(𝑌) − 𝐸(𝑋) ∙ 𝐸(𝑌) + 𝐸(𝑋) ∙ 𝐸(𝑌)
= 𝐸(𝑋 ∙ 𝑌) − 𝐸(𝑋) ∙ 𝐸(𝑌).
2. Fie 𝑋 şi 𝑌 două variabile aleatorii independente, atunci:
𝐶𝑂𝑉(𝑋, 𝑌) = 0, (6.15)
Demonstrație: În cazul a două variabile aleatorii independente, conform ecuației (5.14):
𝐸(𝑋 ∙ 𝑌) = 𝐸(𝑋) ∙ 𝐸(𝑌).
Dacă introducem această relație în ecuația (5.13), rezultă:
𝐶𝑂𝑉(𝑋, 𝑌) = 𝐸(𝑋 ∙ 𝑌) − 𝐸(𝑋 ∙ 𝑌) = 0.
3. Pentru două variabile aleatorii oarecare:
𝑉(𝑋 + 𝑌) = 𝑉(𝑋) + 𝑉(𝑌) + 2𝐶𝑂𝑉(𝑋, 𝑌), (6.16)
Demonstrație: Această proprietate rezultă prin înlocuirea expresiei de definiție a covarianței
în ecuația (6.11).
̅̅̅̅̅
4. Fie 𝑛 variabile aleatorii: 𝑋𝑖 , 𝑖 = 1, 𝑛, atunci:
𝑛 𝑛

𝑉 (∑ 𝑋𝑖 ) = ∑ 𝑉(𝑋𝑖 ) + 2 ∑ ∑ 𝐶𝑂𝑉(𝑋𝑖 , 𝑋𝑗 ) (6.17)


𝑖=1 𝑖=1 𝑖 𝑗
Demonstrație: Pentru a demonstra această proprietate, se calculează dispersia variabilei
aleatorii ∑𝑛𝑖=1 𝑋𝑖 . Rezultă:
𝑛 𝑛 𝑛 2 𝑛 2

𝑉 (∑ 𝑋𝑖 ) = 𝐸 [∑ 𝑋𝑖 − 𝐸 (∑ 𝑋𝑖 )] = 𝐸 {∑[𝑋𝑖 − 𝐸(𝑋𝑖 )]} =


𝑖=1 𝑖=1 𝑖=1 𝑖=1

= 𝐸 {∑ 𝑋𝑖2 − ∑[𝐸(𝑋𝑖 )]2 + 2 ∑ ∑[𝑋𝑖 − 𝐸(𝑋𝑖 )] ∙ [𝑋𝑗 − 𝐸(𝑋𝑗 )]} =


𝑖 𝑖 𝑖 𝑗

= ∑ 𝐸[𝑋𝑖 − 𝐸(𝑋𝑖 )]2 + 2 ∑ ∑ 𝐸{[𝑋𝑖 − 𝐸(𝑋𝑖 )] ∙ [𝑋𝑗 − 𝐸(𝑋𝑗 )]} =


𝑖 𝑖 𝑗

= ∑ 𝑉( 𝑋𝑖 ) + 2 ∑ ∑ 𝐶𝑂𝑉(𝑋𝑖 , 𝑋𝑗 ).
𝑖 𝑖 𝑗

5. Fie 𝑋 şi 𝑌 două variabile aleatorii şi 𝑎, 𝑏 ∈ ℛ, atunci:


𝐶𝑂𝑉(𝑎 ∙ 𝑋, 𝑏 ∙ 𝑌) = 𝑎 ∙ 𝑏 ∙ 𝐶𝑂𝑉(𝑋, 𝑌), (6.18)
Demonstrație: Dacă se calculează covarianța pentru variabilele aleatorii 𝑎 ∙ 𝑋 și 𝑏 ∙ 𝑌, se
obține:
𝐶𝑂𝑉(𝑎 ∙ 𝑋, 𝑏 ∙ 𝑌) = 𝐸(𝑎 ∙ 𝑏 ∙ 𝑋 ∙ 𝑌) − 𝐸(𝑎 ∙ 𝑋) ∙ 𝐸(𝑏 ∙ 𝑌) =
= 𝑎 ∙ 𝑏 ∙ [𝐸(𝑋 ∙ 𝑌) − 𝐸(𝑋) ∙ 𝐸(𝑌)] =
= 𝑎 ∙ 𝑏 ∙ 𝐶𝑂𝑉(𝑋, 𝑌).

122
Din ecuația de definiție a covarianței, (6.12) se observă că, în funcție de valorile celor două
variabile aleatorii, covarianța are valori reale negative sau pozitive. Din acest motiv covarianța
poate fi utilizată ca un indicator al relației ce există între cele două variabile aleatorii.
Pentru a exprima această relație într-o formă mult mai convenabilă, a fost introdusă o altă
noțiune. Este vorba de coeficientul de corelație.
Definiția 6.8: Se numește coeficientul de corelație dintre două variabile aleatorii 𝑋 şi 𝑌,
raportul:
𝐶𝑂𝑉(𝑋, 𝑌)
𝜌(𝑋, 𝑌) = . (6.19)
√𝑉(𝑋) ∙ 𝑉(𝑌)
Proprietățile coeficientului de corelație:
a. Dacă 𝜌(𝑋, 𝑌) există, atunci:
𝜌2 (𝑋, 𝑌) ≤ 1, (6.20)
sau
−1 ≤ 𝜌(𝑋, 𝑌) ≤ 1. (6.21)
Demonstrație: Pătratul covarianței, are expresia:
[𝐶𝑂𝑉(𝑋, 𝑌)]2 = 𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑌 − 𝐸(𝑌)]}2 .
Conform inegalității lui Schwartz, (aplicată variabilelor aleatorii [𝑋 − 𝐸(𝑋)]
și [𝑌 − 𝐸(𝑌)], rezultă:
𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑌 − 𝐸(𝑌)]}2 ≤ 𝐸[𝑋 − 𝐸(𝑋)]2 ∙ 𝐸[𝑌 − 𝐸(𝑌)]2.
Membrul drept al inecuației anterioare reprezintă, de fapt, 𝑉(𝑋) ∙ 𝑉(𝑌). Deci:
[𝐶𝑂𝑉(𝑋, 𝑌)]2 ≤ 𝑉(𝑋) ∙ 𝑉(𝑌),
iar, pătratul coeficientului de corelație, rezultă:

2 (𝑋,
[𝐶𝑂𝑉(𝑋, 𝑌)]2 𝑉(𝑋) ∙ 𝑉(𝑌)
𝜌 𝑌) = ≤ = 1.
𝑉(𝑋) ∙ 𝑉(𝑌) 𝑉(𝑋) ∙ 𝑉(𝑌)
b. 𝜌(𝑋, 𝑋) = 1
Demonstrație: Pentru a demonstra această proprietate, calculăm expresia 𝐶𝑂𝑉(𝑋, 𝑋):
𝐶𝑂𝑉(𝑋, 𝑋) = 𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑋 − 𝐸(𝑋)]} = 𝐸{[𝑋 − 𝐸(𝑋)]2 } = 𝑉(𝑋).
Deci,
𝐶𝑂𝑉(𝑋, 𝑋) 𝑉(𝑋)
𝜌(𝑋, 𝑋) = = = 1.
√𝑉(𝑋) ∙ 𝑉(𝑋) 𝑉(𝑋)

c. 𝜌(𝑋, −𝑋) = −1
Demonstrație: Demonstrația acestei proprietăți este similară cazului anterior:
−𝑉(𝑋)
𝜌(𝑋, 𝑋) = = −1.
𝑉(𝑋)

123
d. Dacă 𝜌(𝑋, 𝑌) există, atunci între două variabile aleatorii 𝑋 şi 𝑌 este o relaţie liniară, adică
∃ 𝑎, 𝑏 ∈ 𝑅, 𝑎 ≠ 0, astfel încât 𝑌 = 𝑎 ∙ 𝑋 + 𝑏, dacă şi numai dacă 𝜌2 (𝑋, 𝑌) = 1.
Demonstrație: Dacă 𝑌 = 𝑎 ∙ 𝑋 + 𝑏, atunci:
𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑎𝑋 + 𝑏 − 𝑎𝐸(𝑋) − 𝑏]}2
𝜌2 (𝑋, 𝑌) = =
𝑉(𝑋) ∙ 𝑉(𝑋) ∙ |𝑎|
𝑎 ∙ 𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑋 − 𝐸(𝑋)]}2 𝑎
= = = 1.
𝑉(𝑋) ∙ 𝑉(𝑋) ∙ |𝑎| |𝑎|

𝑌 𝑌

𝑋 𝑋
Figura 6.6 Variabile aleatorii necorelate

Această proprietate indică faptul că atât covarianța cât și coeficientul de corelație reprezintă
două măsuri relevante ale unei relații liniare dintre două variabile aleatorii.
Dacă, relația dintre cele două variabile aleatorii este neliniară, acești doi indicatori nu pot
oferi informații consistente.
e. Dacă: 𝐶𝑂𝑉(𝑋, 𝑌) = 0, atunci 𝜌(𝑋, 𝑌) = 0.
În acest caz, cele două variabile aleatorii se numesc necorelate, vezi figura 6.6.
Demonstrație: Dacă, 𝐶𝑂𝑉(𝑋, 𝑌) = 0, atunci din ecuația de definiție a coeficientului de
corelație, (6.19), rezultă: 𝜌(𝑋, 𝑌) = 0.
f. Dacă: 𝜌(𝑋, 𝑌) > 0, cele două variabile au o corelație pozitivă, vezi figura 6.7a.
Demonstrație: Similar cazului e dacă, 𝐶𝑂𝑉(𝑋, 𝑌) > 0, atunci 𝜌(𝑋, 𝑌) > 0, deoarece:
𝑉(𝑋) ∙ 𝑉(𝑌) > 0.

𝑌 𝑌

𝑋 𝑋

a. corelație pozitivă b. corelație negativă


Figura 6.7 Variabile aleatorii corelate

124
g. Dacă: 𝜌(𝑋, 𝑌) < 0, cele două variabile au o corelație negativă, vezi figura 6.7b.
Demonstrație: Similar cazului f dacă, 𝐶𝑂𝑉(𝑋, 𝑌) < 0, atunci 𝜌(𝑋, 𝑌) < 0.

Exemplul 6.4
Funcțiile de probabilitate a două variabile aleatorii discrete, X și Y sunt:
1 1
, dacă 𝑥1 =1 , dacă 𝑦1 = 2
4 4
1 1
, dacă 𝑥2 =2 , dacă 𝑦2 = 4
)
Pr(𝑋 = 𝑥𝑖 = 8 )
Pr(𝑌 = 𝑦𝑖 = 8 .
1 1
, dacă 𝑥3 =3 , dacă 𝑦3 = 6
2 2
1 1
{8 , dacă 𝑥4 =4 {8 , dacă 𝑦4 = 8
a. Să se calculeze 𝐶𝑂𝑉(𝑋, 𝑌).
b. Să se calculeze 𝜌(𝑋, 𝑌).
Soluție:
1 1 1 1 1
𝐸(𝑋) = ∙1+ ∙2+ ∙3+ ∙4= 2 ;
4 8 2 8 2
1 1 1 1
𝐸(𝑌) = ∙ 2 + ∙ 4 + ∙ 6 + ∙ 8 = 5;
4 8 2 8
2
1 1 1 2 1 1 2 1 1 2 1
𝑉(𝑋) = (1 − 2 ) ∙ + (2 − 2 ) ∙ + (3 − 2 ) ∙ + (4 − 2 ) ∙ = 1;
2 4 2 8 2 2 2 8
1 1 1 1
𝑉(𝑌) = (2 − 5)2 ∙ + (4 − 5)2 ∙ + (6 − 5)2 ∙ + (8 − 5)2 ∙ = 4;
4 8 2 8
𝐶𝑂𝑉(𝑋, 𝑌) = 𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑌 − 𝐸(𝑌)]} =
1 1
= (1 − 2.5) ∙ (2 − 5) ∙ + (2 − 2.5) ∙ (4 − 5) ∙
4 8
1 1
+(3 − 2.5) ∙ (6 − 5) ∙ + (4 − 2.5) ∙ (8 − 5) ∙ = 2;
2 8
𝐶𝑂𝑉(𝑋, 𝑌) 2
𝜌(𝑋, 𝑌) = = = 1.
√𝑉(𝑋) ∙ 𝑉(𝑌) √1 ∙ 4

 Enunțați legea numerelor mari și precizați semnificația ei în aplicațiile


statistice.
 Definiți abaterea medie pătratică în cazul unei variabile aleatorii
continue și în cazul unei variabile aleatorii discrete.
 Definiți coeficientul de variație.
 Definiți noțiunea de cuantilă în cazul unei variabile aleatorii continue și
în cazul unei variabile aleatorii discrete și precizați ecuația de calcul
utilizată în cazul aplicațiilor practice.

125
 Descrieți modul în care asimetria unei repartiții poate fi apreciată prin
poziția relativă a celor trei indicatori de poziționare.
 Definiți coeficientul de asimetrie și coeficientul de boltire și clasificați
repartițiile statistice în funcție de diferitele valori pe care aceștia le pot
lua.
 Definiți covarianța. Enumerați proprietățile covarianței.
 Definiți coeficientul de corelație. Enumerați proprietățile covarianței.
 Descrieți tipurile de corelație liniară ce pot exista între două variabile
aleatorii: corelație pozitivă, negativă și variabile aleatorii necorelate.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Legea numerelor mari;  Coeficientul de asimetrie;


 Abaterea medie pătratică;  Coeficientul de boltire;
 Coeficientul de variație;  Covarianța;
 Cuantile;  Coeficientul de corelație.
 Intervalul intercuartilic;

Rezumat
În această unitate de învățare, la început, s-a demonstrat legea numerelor mari
și s-a evidențiat importanța ei pentru alegerea volumului eșantioanelor în cazul
aplicațiilor statistice. Apoi, s-a continuat prezentarea valorilor tipice asociate
unei variabile aleatorii. Astfel, au fost definite noțiunile de abaterea medie
pătratică, coeficientul de variație și cuantile, ca valori tipice ale tendinței de
împrăștiere.
Caracteristice numerice ale formei repartițiilor: coeficientul de asimetrie și
coeficientul de boltire, au fost definite în continuare. De asemenea, din această
categorie a fost analizat și cazul în care asimetria repartițiilor poate fi apreciată
prin poziția relativă a valorilor tipice ale tendinței de grupare. Ultima parte a
prezentei UI a fost destinată definirii noțiunii de covarianță, pentru aprecierea
relației de dependență ce poate exista între două variabile aleatorii. Pentru a
obține informații asupra intensității corelației liniare, a fost definit un alt
indicator numeric, numit coeficientul de corelație.
În continuare se vor prezenta principalele modele de repartiții statistice ale
variabilelor aleatorii discrete.

126
Test de autoevaluare a cunoștințelor
P.6.1 Variabila aleatorie 𝑋 are funcția densitate de probabilitate:
0, dacă 𝑥 < 1
𝑥
, dacă 1 ≤ 𝑥 ≤ 2
3
𝑓(𝑥) = 1 .
, dacă 2 < 𝑥 ≤ 3
2
{ 0, dacă 𝑥 > 3
Să se calculeze:
a. 𝑉(𝑋); b. 𝜎𝑋 ; c. 𝐶𝑣(𝑋).
2 3
R: 𝑥2 𝑥
𝑎. 𝐸(𝑋) = ∫ 𝑑𝑥 + ∫ 𝑑𝑥 = 2.027778 ;
3 2
1 2
2 3
(𝑥 − 2.027778)2 ∙ 𝑥 (𝑥 − 2.027778)2
𝑉(𝑋) = ∫ 𝑑𝑥 + ∫ 𝑑𝑥 =
3 2
1 2
= 0.304784;
b. 𝜎𝑋 = √𝑉(𝑋) = √0.304784 = 0.552072;
𝜎𝑋 0.552072
𝑐. 𝐶𝑣(𝑋) = = = 0.272255.
𝐸(𝑋) 2.027778
P.6.2 Fie 𝑋 și 𝑌 două variabile aleatorii independente având funcțiile densitate de
probabilitate:
𝑒 −𝑥 , dacă 𝑥 ≥ 0
𝑓(𝑥) = { .
0, dacă 𝑥 < 0
Să se calculeze:
a. 𝑉(𝑋); b. 𝜎𝑋 ; c. 𝐼𝑞 (𝑋); d. 𝐶𝑣(𝑋).
R: ∞
𝑥=∞
𝑎. 𝐸(𝑋) = ∫ 𝑥 ∙ 𝑒 −𝑥 ∙ 𝑑𝑥 = −𝑒 −𝑥 ∙ (𝑥 + 1)|𝑥=0 = 1;
0

𝑥=∞
𝑉(𝑋) = ∫ (𝑥 − 1)2 ∙ 𝑒 −𝑥 ∙ 𝑑𝑥 = 𝑒 −𝑥 ∙ (𝑥 2 + 1)|𝑥=0 = 1;
0
𝑏. 𝜎𝑋 = √𝑉(𝑋) = √1 = 1.0;
𝑥

𝑐. 𝐹(𝑥) = ∫ 𝑒 −𝑥 ∙ 𝑑𝑥 = 1 − 𝑒 −𝑥
0
𝐼𝑞 (𝑋) = 𝑞0.75 − 𝑞0.25 = 1.3863 − 0.2877 = 1.0986;
1 − 𝑒 −𝑞0.75 = 0.75 ⇒ 𝑞0.75 = 1.3863;
1 − 𝑒 −𝑞0.25 = 0.25 ⇒ 𝑞0.25 = 0.2877;
√𝑉(𝑋) √1
𝑑. 𝐶𝑣(𝑋) = = = 1.
𝐸(𝑋) 1
P.6.3 Fie variabila aleatorie 𝑋, având tabloul repartiției:
−1 0 1 2 3 4
𝑋: ( )
0.1 0.15 0.2 0.35 0.15 0.05

127
Să se calculeze:
a. Dispersia variabilei aleatorii 𝑋; b. Coeficientul de variație;
c. Asimetria repartiției.
𝑎. 𝐸(𝑋) = −1 ∙ 0.1 + 0 ∙ 0.15 + 1 ∙ 0.2 + 2 ∙ 0.35 + 3 ∙ 0.15 +
R:
+4 ∙ 0.05 = 1.45.
2 2
𝑉(𝑋) = (−1 − 1.45) ∙ 0.1 + (0 − 1.45) ∙ 0.15 +
+(1 − 1.45)2 ∙ 0.2 + (2 − 1.45)2 ∙ 0.35 +
+(3 − 1.45)2 ∙ 0.15 + (4 − 1.45)2 ∙ 0.05 = 1.748.
𝑏. 𝜎𝑋 = √𝑉(𝑋) = √1.748 = 1.3221.
𝜎𝑋 1.3221
𝐶𝑣(𝑋) = = = 1.
𝐸(𝑋) 1.45
𝜇3′ −0.5
𝑐. 𝛼3 = 3 = = −0.21635.
𝜎𝑋 1.32213
𝜇3′ = (−1 − 1.45)3 ∙ 0.1 + (0 − 1.45)3 ∙ 0.15 + (1 − 1.45)3 ∙ 0.2 +
+(2 − 1.45)3 ∙ 0.35 + (3 − 1.45)3 ∙ 0.15 +
+(4 − 1.45)3 ∙ 0.05 = −0.5.
P.6.4 Două variabile aleatorii discrete, 𝑋 și 𝑌, au următoarele funcții de probabilitate:
1 1
, dacă 𝑥1 = 1 , dacă 𝑦1 = 2
3 3
1 1
𝑝𝑋 (𝑥𝑖 ) = , dacă 𝑥2 = 2 𝑝𝑌 (𝑦𝑖 ) = , dacă 𝑦2 = 3
3 3
1 1
{3 , dacă 𝑥3 = 3 {3 , dacă 𝑦3 = 4
Să se calculeze:
a. 𝐶𝑜𝑣(𝑋, 𝑌); b. 𝜌(𝑋, 𝑌); c. 𝑉(𝑋 + 𝑌).
R: 1 1 1
𝑎. 𝐸(𝑋) = ∙ 1 + ∙ 2 + ∙ 3 = 2;
3 3 3
1 1 1
𝐸(𝑌) = ∙ 2 + ∙ 3 + ∙ 4 = 3;
3 3 3
1 1 1 2
𝑉(𝑋) = (1 − 2)2 ∙ + (2 − 2)2 ∙ + (3 − 2)2 ∙ = ;
3 3 3 3
1 1 1 2
𝑉(𝑌) = (2 − 3)2 ∙ + (3 − 3)2 ∙ + (4 − 3)2 ∙ = ;
3 3 3 3
𝐶𝑂𝑉(𝑋, 𝑌) = 𝐸{[𝑋 − 𝐸(𝑋)] ∙ [𝑌 − 𝐸(𝑌)]} =
1 1
= (1 − 2) ∙ (2 − 3) ∙ + (2 − 2) ∙ (3 − 3) ∙ +
3 3
1 2
+(3 − 2) ∙ (4 − 3) ∙ = ;
3 3
2
𝐶𝑂𝑉(𝑋, 𝑌)
𝑏. 𝜌(𝑋, 𝑌) = = 3 = 1.
√𝑉(𝑋) ∙ 𝑉(𝑌) √2 2

3 3
2 2 2 8
𝑐. 𝑉(𝑋 + 𝑌) = 𝑉(𝑋) + 𝑉(𝑌) + 2𝐶𝑂𝑉(𝑋, 𝑌) = + + 2 ∙ = .
3 3 3 3

128
P.6.5 Funcția densitate de probabilitate bidimensională a variabilelor aleatorii 𝑋 și 𝑌
este:
𝑓𝑋,𝑌 (𝑥, 𝑦) = 6 ∙ 𝑥 ∙ 𝑦 ∙ (2 − 𝑥 − 𝑦), dacă 0 ≤ 𝑥 ≤ 1 și 0 ≤ 𝑦 ≤ 1.
Să se calculeze:
a. 𝐶𝑜𝑣(𝑋, 𝑌); b. 𝜌(𝑋, 𝑌);.
R: ∞ ∞

𝑎. 𝐸(𝑋, 𝑌) = ∫ ∫ 𝑥 ∙ 𝑦 ∙ 𝑓𝑋,𝑌 (𝑥, 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦


−∞ −∞
1 1
1
= ∫ ∫ 6 ∙ 𝑥 2 ∙ 𝑦 2 ∙ (2 − 𝑥 − 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦 =
3
0 0
∞ ∞

𝐸(𝑋) = ∫ ∫ 𝑥 ∙ 𝑓𝑋,𝑌 (𝑥, 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦


−∞ −∞
1 1
7
= ∫ ∫ 6 ∙ 𝑥 2 ∙ 𝑦 ∙ (2 − 𝑥 − 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦 =
12
0 0
∞ ∞

𝐸(𝑌) = ∫ ∫ 𝑦 ∙ 𝑓𝑋,𝑌 (𝑥, 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦


−∞ −∞
1 1
7
= ∫ ∫ 6 ∙ 𝑥 ∙ 𝑦 2 ∙ (2 − 𝑥 − 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦 =
12
0 0
1 7 7
𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋, 𝑌) − 𝐸(𝑋) ∙ 𝐸(𝑌) = − ∙ = −0.00694
3 12 12
∞ ∞
2)
𝑏. 𝐸(𝑋 = ∫ ∫ 𝑥 2 ∙ 𝑓𝑋,𝑌 (𝑥, 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦
−∞ −∞
1 1
2
= ∫ ∫ 6 ∙ 𝑥 3 ∙ 𝑦 ∙ (2 − 𝑥 − 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦 =
5
0 0
∞ ∞

𝐸(𝑌 2 ) = ∫ ∫ 𝑦 2 ∙ 𝑓𝑋,𝑌 (𝑥, 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦


−∞ −∞
1 1
2
= ∫ ∫ 6 ∙ 𝑥 ∙ 𝑦 3 ∙ (2 − 𝑥 − 𝑦) ∙ 𝑑𝑥 ∙ 𝑑𝑦 =
5
0 0
2 7 2
𝑉(𝑋) = 𝐸(𝑋 2 ) − [𝐸(𝑋)]2 = − ( ) = 0.05972
5 12
2) 2
2 7 2
𝑉(𝑌) = 𝐸(𝑌 − [𝐸(𝑌)] = − ( ) = 0.05972
5 12
𝐶𝑜𝑣(𝑋, 𝑌) −0.00694
𝜌(𝑋, 𝑌) = = = −0.11621.
√𝑉(𝑋) ∙ 𝑉(𝑌) √0.05972 ∙ 0.05972

129
Unitatea de învățare 7.

Cuprins
7.1. Introducere ........................................................................................................... 130
7.2. Competențe .......................................................................................................... 130
7.3. Legi de repartiție pentru variabile aleatorii discrete .......................................... 131
7.3.1. Modelul repartiției binomiale ...............................................................................131
7.3.1.1. Schema lui Bernoulli cu bila revenită .....................................................131
7.3.1.2. Repartiția binomială ................................................................................133
7.3.2. Repartiția Poisson.................................................................................................137
7.3.3. Modelul repartiției hipergeometrice .....................................................................141
7.3.3.1. Schema lui Bernoulli cu bila nerevenită..................................................141
7.3.3.2. Repartiția hipergeometrică......................................................................142
7.4. Rezumat ............................................................................................................... 146
7.5. Test de autoevaluare............................................................................................ 147

7.1. Introducere
Prezenta unitate de învățare este destinată prezentării principalelor legi de
repartiție pentru variabile aleatorii discrete.
Este vorba de repartiția binomială, repartiția Poisson și repartiția hipergeometrică.
Pentru deducerea expresiei funcției de probabilitate a repartițiilor binomiale și
hipergeometrice se pornește de la prezentarea schemei bernoulliene cu bila
revenită, respectiv a schemei bernoulliene cu bila ne revenită. De asemenea, la
fiecare model statistic sunt prezentate funcția de repartiție, funcția de probabilitate
precum și expresiile valorilor tipice ale variabilei aleatorii. Studiul fiecărei
repartiții se încheie cu precizarea principalelor domeniile de utilizare a modelului
respectiv.

7.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să definească și să
cunoască semnificația, proprietățile și domeniile de utilizare a principalelor legi
de repartiție pentru variabile aleatorii discrete. De asemenea, va fi capabil să
utilizeze tehnici și metode adecvate pentru calculul anumitor probabilități pe baza
unor formule sau scheme de calcul, indiferent de natura experimentului
considerat, fără a mai recurge de fiecare dată la procedeele greoaie sugerate de
formula dată de definiția clasică.

130
Durata medie de parcurgere a acestei unități de învățare este de 2 ore.

7.3 LEGI DE REPARTIȚIE PENTRU VARIABILE ALEATORII


DISCRETE

Sub această denumire se pot întâlni câteva experimente-model și legi de repartiție, care conduc
la calculul rapid al probabilităților unor evenimente care se produc sau apar în condiții analoage
celor ce definesc experimentele-model. Cu alte cuvinte, pot fi calculate anumite probabilități
pe baza unor formule sau scheme de calcul, indiferent de natura experimentului considerat, fără
a mai recurge de fiecare dată la procedeele greoaie sugerate de formula dată de definiția clasică,
[MIH 80].

7.3.1 MODELUL REPARTIȚIEI BINOMIALE


7.3.1.1 SCHEMA LUI BERNOULLI CU BILA REVENITĂ

Se aplică în cazul în care se fac repetări independente ale unui experiment și la fiecare repetare
se are în vedere apariția unui eveniment bine precizat, numit succes. Se cere determinarea
probabilității ca din 𝑛 repetări ale experimentului, evenimentul considerat să apară de 𝑘 ori.
Modelul probabilistic se realizează printr-o urnă ce conține bile de două culori (albe şi negre).
Se extrag bile din urnă una câte una, fiecare bilă este reintrodusă în urnă după constatarea
culorii. Se cere determinarea probabilității ca din 𝑛 bile extrase, 𝑘 să fie de culoare albă.
Fie 𝐴𝑖 evenimentul ca la extragerea de rang 𝑖 să se obţină o bilă albă şi 𝐴̅𝑖 evenimentul ca la
extragerea de rang 𝑖 să se obţină o bilă neagră. Dacă în urnă se află 𝑁 bile, din care 𝑎 bile albe
şi 𝑏 bile negre, avem:
𝑎 𝑏
𝑝 = 𝑃𝑟(𝐴𝑖 ) = , 𝑝 = 𝑃𝑟(𝐴̅𝑖 ) = și evident 𝑝 + 𝑞 = 1
𝑁 𝑁
Notăm cu 𝑋𝑛,𝑛−𝑘 evenimentul ca după 𝑛 extrageri să obţinem de 𝑘 ori bilă albă şi apoi de 𝑛 − 𝑘
ori bilă neagră, avem:
𝑃𝑟(𝑋𝑛,𝑛−𝑘 ) = 𝑃𝑟(𝐴1 ∩ 𝐴2 ∩ … ∩ 𝐴𝑘 ∩ ̅̅̅̅̅̅
𝐴𝑘+1 ∩ … ∩ ̅̅̅̅
𝐴𝑛 ) = 𝑝𝑘 ∙ 𝑞 𝑛−𝑘 .

de 𝑘 ori de 𝑛 − 𝑘 ori
Dacă 𝑋 reprezintă evenimentul ca din cele 𝑛 bile extrase exact 𝑘 să fie albe, vezi figura 7.1,
obținem:
𝑛!
𝑃𝑟(𝑋) = 𝐶𝑛𝑘 ∙ 𝑃𝑟(𝑋𝑛,𝑛−𝑘 ) = 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ 𝑞 𝑛−𝑘 = ∙ 𝑝𝑘 ∙ 𝑞 𝑛−𝑘 (7.1)
𝑘! ∙ (𝑛 − 𝑘)!

131
𝑖=1 𝑖=2 𝑖=3 𝑃𝑟(𝑋3,3−𝑘 ): 𝑋=

𝑝 𝑝 = 𝑝3 3
𝑝 𝑞 = 𝒑𝟐 ∙ 𝒒 2

𝑝 = 𝒑𝟐 ∙ 𝒒 2

𝑞 𝑞 = 𝑝 ∙ 𝑞2 1
𝑝 𝑝 = 𝒑𝟐 ∙ 𝒒 2

𝑞 = 𝑝 ∙ 𝑞2 1

𝑞 𝑝 = 𝑝 ∙ 𝑞2 1

𝑞 𝑞 = 𝑞3 0

Figura 7.1 Schema bernoulliană cu bila revenită, pentru 𝑛 = 3

Dacă se consideră formula binomului lui Newton:


𝑛 𝑛
𝑛
(𝑝 ∙ 𝑥 + 𝑞) = ∑ 𝐶𝑛𝑘 𝑘 𝑘
∙𝑝 ∙𝑥 ∙𝑞 𝑛−𝑘
= ∑ 𝑃𝑟(𝑋) ∙ 𝑥 𝑘 ,
𝑘=0 𝑘=0
deci 𝑃𝑟(𝑋) este coeficientul lui 𝑥 din dezvoltarea binomială (𝑝 ∙ 𝑥 + 𝑞)𝑛 , de aici şi denumirea
𝑘

de schema binomială.
De asemenea:
𝑛 𝑛 𝑛

∑ 𝑃𝑟(𝑋) = ∑ 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ 𝑞 𝑛−𝑘 = ∑(𝑝 + 𝑞)𝑛 = 1,


𝑘=0 𝑘=0 𝑘=0
deoarece 𝑝 + 𝑞 = 1.

Exemplul 7.1
În urma realizării unui studiu de piață, pentru promovarea unui nou tip
de produs electrocasnic, s-a stabilit că din zece persoane, care încearcă acest
produs, două se decid să cumpere. Să se determine probabilitatea ca din opt
persoane cărora li se prezintă noul produs:
a. jumătate să cumpere acest produs;
b. exact trei să nu cumpere;
Soluție: Notăm cu 𝑝, respectiv 𝑞 probabilitatea ca o persoană care încearcă noul tip
produs să cumpere, respectiv să nu cumpere acest produs. Prin urmare avem:
2 8
𝑝= = 0.2 și 𝑞 = = 0.8.
10 10
Problema descrie un experiment cu două rezultate posibile:
 𝐴 - persoana care cumpără produsul, cu probabilitatea 𝑝 = 0.2;
 𝐴̅- persoana care nu cumpără produsul, cu probabilitatea 𝑞 = 0.8;;
Se realizează acest experiment de opt ori.

132
a. 𝑃𝑟(𝑋) = 𝐶84 ∙ 0.24 ∙ 0.88−4 = 0.045875;
b. 𝑃𝑟(𝐵) = 𝐶85 ∙ 0.25 ∙ 0.88−5 = 0.009175;

7.3.1.2 REPARTIȚIA BINOMIALĂ

Definiția 7.1: O variabilă aleatorie discretă 𝑋, este repartizată binomial cu parametrii 𝑝 și


𝑛, dacă funcţia de probabilitatea este de forma:
𝑛!
Pr(𝑋 = 𝑥) = 𝐶𝑛𝑥 ∙ 𝑝 𝑥 ∙ 𝑞 𝑛−𝑥 = ∙ 𝑝 𝑥 ∙ (1 − 𝑝)𝑛−𝑥 ,
𝑥! ∙ (𝑛 − 𝑥)! (7.2)
pentru 𝑝, 𝑞 ∈ [0,1], 𝑝 + 𝑞 = 1 și 𝑥 = 0,1, … , 𝑛
și se notează, 𝑋~ℬ(𝑥, 𝑝, 𝑛).
Funcția de probabilitate a repartiției binomiale ne furnizează valoarea probabilității ca un
eveniment dorit (a cărui probabilitate de apariție este 𝑝) să se realizeze de „exact” 𝑥 ori din
𝑛 încercări bernoulliene cu revenire.
Tabloul repartiției binomiale este, deci de forma:
0 1 2 … 𝑘 … 𝑛
𝑋: ( 𝑝𝑛 ), (7.3)
𝑞𝑛 𝐶𝑛1 ∙ 𝑝 ∙ 𝑞 𝑛−1 𝐶𝑛2 ∙ 𝑝2 ∙ 𝑞 𝑛−2 … 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ 𝑞 𝑛−𝑘 …
Semnificația parametrilor (𝑝, 𝑞 şi 𝑛) acestui model statistic este:
 𝑛, reprezintă numărul de încercări bernoulliene cu revenire;
 𝑝, reprezintă probabilitatea ca un eveniment dorit să se producă într-o încercare
bernoullienă cu revenire (se mai numește și probabilitatea de succes);
 1 − 𝑝 = 𝑞, reprezintă probabilitatea ca evenimentul dorit să nu se producă într-o
încercare bernoulliene cu revenire (se mai numește și probabilitatea de eșec).
Semnificația valorilor, 𝑥, pe care le poate lua variabila aleatorie 𝑋, este: numărul de succese
înregistrate în urma a 𝑛 încercări bernoulliene cu revenire.
Alura funcției de probabilitate, a repartiției binomiale, pentru 𝑛 = 10 și diferite valori ale
parametrului 𝑝, este prezentată în figura 7.2.
0.3 0.3
𝑃𝑟(𝑋 = 𝑥) 𝑃𝑟(𝑋 = 𝑥)
0.25 0.25

0.2 0.2

0.15 0.15

0.1 0.1

0.05 0.05
𝑋 𝑋
0 0
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

a) 𝑛 = 10 și 𝑝 = 0.3 b) 𝑛 = 10 și 𝑝 = 0.5

Figura 7.2 Funcția de probabilitate a repartiției binomiale

133
0.3
𝑃𝑟(𝑋 = 𝑥)
0.25

0.2

0.15

0.1

0.05
𝑋
0
0 1 2 3 4 5 6 7 8 9 10

c) 𝑛 = 10 și 𝑝 = 0.7

Figura 7.2 Funcția de probabilitate a repartiției binomiale

Funcția de repartiție a modelului statistic binomial este de forma:


0, dacă 𝑥 < 0
𝑥

F(𝑥) = Pr(𝑋 ≤ 𝑥) = ∑ 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−𝑘 , dacă 0 ≤ 𝑥 < 𝑛 (7.4)


𝑘=0
{ 1, dacă 𝑥 ≥ 𝑛
Alura funcției de repartiție, a modelului statistic binomial, pentru diferite valori ale parametrului
p, este prezentată în figura 7.3.

1.2 1.2
𝐹(𝑥) 𝐹(𝑥)
1 1

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2
𝑋 𝑋
0 0
-2 0 2 4 6 8 10 12 -2 0 2 4 6 8 10 12

a) 𝑛 = 10 și 𝑝 = 0.3 b) 𝑛 = 10 și 𝑝 = 0.5
1.2
𝐹(𝑥)
1

0.8

0.6

0.4

0.2
𝑋
0
-2 0 2 4 6 8 10 12

c) 𝑛 = 10 și 𝑝 = 0.7

Figura 7.3. Funcția de repartiție binomială

134
În anexa II, de la finalul cărții, se află calculate valorile funcției de repartiție binomiale, pentru
parametrul n = 5 ÷ 25 și pentru p = 0.01 ÷ 0.99.
Valorile tipice ale variabilei aleatorii binomial repartizate, [GIB 76], [HAS 75], [WIK 10]:
1. Media teoretică:
𝑛

𝜇𝑋 = 𝐸(𝑋) = ∑ 𝑘 ∙ 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−𝑘 = 𝑛 ∙ 𝑝. (7.5)


𝑘=0

2. Mediana:
〈𝑛 ∙ 𝑝〉 − 1 ≤ 𝑀𝑒 ≤ 〈𝑛 ∙ 𝑝〉 (7.6)
3. Moda:
𝑝 ∙ (𝑛 + 1) − 1 ≤ 𝑀𝑜 ≤ 𝑝 ∙ (𝑛 + 1) (7.7)
4. Dispersia:
𝑛

𝜎𝑋2 = 𝑉(𝑋) = ∑(𝑘 − 𝑛 ∙ 𝑝)2 ∙ 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−𝑘 = 𝑛 ∙ 𝑝 ∙ (1 − 𝑝). (7.8)


𝑘=0

5. Abaterea medie pătratică:


𝜎𝑋 = √𝑉(𝑋) = √𝑛 ∙ 𝑝 ∙ (1 − 𝑝) (7.9)

Exemplul 7.2
Dintr-un lot de piese, ce conține 10 % produse neconforme, sunt extrase
aleator 4 piese. După fiecare extragere piesa este reintrodusă în lot. Să se
calculeze probabilitatea ca:
a) exact două piese extrase să fie neconforme.
b) cel puțin două piese să fie neconforme.
Soluție: a) 𝑝 = 10% = 0.1 şi 𝑞 = 1 − 0.1 = 0.9.
Pr(𝑋 = 2) = ∁24 ∙ 0.12 ∙ 0.94−2 = 0.0486.
b) 𝑃𝑟(𝑋 ≥ 2) = 𝑃𝑟(𝑋 = 2) + 𝑃𝑟(𝑋 = 3) + 𝑃𝑟(𝑋 = 4) =
= ∁24 ∙ 0.12 ∙ 0.94−2 + ∁34 ∙ 0.13 ∙ 0.94−3 + ∁44 ∙ 0.14 ∙ 0.94−4 = 0.0523.
sau, 𝑃𝑟(𝑋 ≥ 2) = 1 − 𝑃𝑟(𝑋 ≤ 1) =
1

= 1 − ∑ ∁𝑘4 ∙ 0.1𝑘 ∙ 0.94−𝑘 = 1 − 0.9477 = 0.0523.


𝑘=0

Observații: a. În cazul repartiției binomiale, între medie și dispersie există relația:


𝑉(𝑋) < 𝐸(𝑋). (7.10)
b. Valori mari ale parametrului 𝑛, pot conduce la dificultăți de calcul a
valorilor probabilităților repartiției binomiale. În aceste situații se
recomandă utilizarea formulei lui Stirling pentru calculul aproximativ al
valorii lui 𝑛!:
𝑛 𝑛
𝑛! ≅ √2 ∙ 𝜋 ∙ 𝑛 ∙ ( ) . (7.11)
𝑒

135
Exemplul 7.3
Statisticile existente într-un magazine de piese auto arată că 40% dintre
clienți achiziționează produse folosind cardul de credit. Știind că într-o
dimineață magazinul a avut 15 de clienți, să se determine:
a. Probabilitatea ca maxim 5 clienți să folosească cardul de credit;
b. Probabilitatea ca cel puțin 13 clienți să utilizeze cardul de credit;
c. Probabilitatea ca cel puțin 3 și maxim 8 clienți să utilizeze cardul de credit;
Soluție: 𝑝 = 40% = 0.4, q = 1 − 0.4 = 0.6 și 𝑛 = 15.
a. 𝑃𝑟(𝑋 ≤ 5) = 𝐹(5) = 0.4032, conform valorilor din tabelul II.1, anexa II.
b. 𝑃𝑟(𝑋 ≥ 13) = 1 − 𝑃𝑟(𝑋 ≤ 12) = 1 − 𝐹(12) = 1 − 0.9997 = 0.0003,
conform valorilor din tabelul II.1, anexa II. Sau, folosind ecuația (3.18):
13 14 15
𝑃𝑟(𝑋 ≥ 13) = 𝐶15 ∙ 𝑝13 ∙ 𝑞15−13 + 𝐶15 ∙ 𝑝14 ∙ 𝑞15−14 + 𝐶15 ∙ 𝑝15 ∙ 𝑞15−15 =
15 15 15 15
√2∙𝜋∙15∙( 𝑒 ) 13 2 √2∙𝜋∙15∙( 𝑒 )
= 13 13 2 2
∙ 0.4 ∙ 0.6 + 14 14 1 1
∙ 0.414 ∙ 0.61 +
√2∙𝜋∙13∙( 𝑒 ) ∙√2∙𝜋∙2∙(𝑒) √2∙𝜋∙14∙( 𝑒 ) ∙√2∙𝜋∙1∙(𝑒)

+ 0.415 ∙ 0.60 = 0.0002919.


c. 𝑃𝑟(3 ≤ 𝑋 ≤ 8) = 𝑃𝑟(𝑋 ≤ 8) − 𝑃𝑟(𝑋 ≤ 2) =
= 0.9050 − 0.0271 = 0.8779.

Repartiția binomială reprezintă cea mai importantă repartiție, pentru o variabilă aleatorie
discretă, având multiple utilizări în statistica inferențială, teoria fiabilității și controlul statistic
al proceselor.
Domeniile de utilizare ale repartiției binomiale:
 Modelarea din punct de vedere probabilist a experimentelor având următoarele
caracteristici:
1. Experimentul constă dintr-un număr fixat apriori de probe, (𝑛);
2. Efectuarea de probe în cadrul experimentului conduce la obținerea a două tipuri
de evenimente, complementare, clasificate în: succes și eșec;
3. Probele efectuate în cadrul experimentului sunt independente;
4. Probabilitățile de apariție a evenimentelor succes sau eșec rămân constante pe
parcursul efectuării probelor, (𝑝 și 𝑞);
 Este frecvent utilizată pentru a determina probabilitatea unui număr de 𝑘 succese
constatate într-un eșantion de volum 𝑛, prelevat dintr-o populație de dimensiune 𝑁. Cu
toate că, în acest caz, probele nu sunt independente (fiind vorba de eşantionare fără
înlocuire), pentru 𝑁, mult mai mare decât 𝑛, distribuţia binomială reprezintă o bună
aproximație, şi este utilizată pe scară largă;
 Calculul exact al valorilor funcției empirice de repartiție, utilizate la estimațiile punctuale
și cu interval de încredere având la bază metodele celor mai mici pătrate și grafice;

136
 Estimarea neparametrică punctuală și cu interval de încredere a indicatorilor de fiabilitate
ai produselor;
 Calcul aproximativ al probabilităților evenimentelor hipergeometric repartizate;
 Controlul statistic de recepție și în metodele de inspecție prin atribute;
 Calculul și construcția fișelor de control pentru proporția de produse neconforme și a
celor pentru numărul de produse neconforme, în cadrul controlului statistic al proceselor.

7.3.2 REPARTIȚIA POISSON

Definiția 7.2: O variabilă aleatorie discretă 𝑋, este repartizată Poisson cu parametrul 𝜆, dacă
funcţia de probabilitatea este de forma:
𝑒 −𝜆 ∙ 𝜆𝑥
𝑃𝑟(𝑋 = 𝑥) = , pentru 𝜆 > 0 și 𝑥 = 0,1, … , 𝑛 (7.12)
𝑥!
și se notează, 𝑋~𝒫(𝑥, 𝜆).
Alura funcției de probabilitate, a repartiției Poisson, pentru diferite valori ale parametrului 𝜆,
este prezentată în figura 7.4.

𝑃𝑟(𝑋 = 𝑥) 𝑃𝑟(𝑋 = 𝑥)
0.7 0.4

0.6 0.35

0.3
0.5
0.25
0.4
0.2
0.3
0.15
0.2
0.1
0.1 0.05
0 𝑋 0 𝑋
0 1 2 3 4 5 6 0 1 2 3 4 5 6 7

a) 𝜆 = 0.5 b) 𝜆 = 1.0

𝑃𝑟(𝑋 = 𝑥) 𝑃𝑟(𝑋 = 𝑥)
0.3 0.16

0.14
0.25
0.12
0.2
0.1
0.15 0.08

0.1 0.06

0.04
0.05
0.02
𝑋 𝑋
0 0
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
c) 𝜆 = 2.0 c) 𝜆 = 8.0

Figura 7.4 Funcția de probabilitate a repartiției Poisson

137
În teoria probabilităților și statistică, repartiția Poisson, sau repartiția evenimentelor rare, este
un model statistic discret care exprimă probabilitatea ca o serie de evenimente să apară într-o
perioadă fixată de timp, dacă aceste evenimente apar cu o rata medie cunoscută și independentă
de timp, de la ultimul eveniment înregistrat. Repartiția Poisson poate fi utilizată, de asemenea
și pentru numărul de evenimente în alte tipuri de intervale specificate, cum ar fi distantă,
suprafață sau de volum.
Deci, valorile, 𝑥, pe care le poate lua variabila aleatorie 𝑋, reprezintă numărul de evenimente
care apar într-un anumit interval.
Funcția de repartiție, a modelului statistic Poisson este de forma:
0, dacă 𝑥 < 0
𝑥
𝑒 −𝜆 ∙ 𝜆𝑥
F(𝑥) = Pr(𝑋 ≤ 𝑥) = ∑ , dacă 0 ≤ 𝑥 < ∞ (7.13)
𝑥!
𝑘=0
{1, dacă 𝑥 → ∞
Alura funcției de repartiție, a modelului statistic Poisson, pentru diferite valori ale parametrului
𝜆, este prezentată în figura 7.5.

1.2 1.2
𝐹(𝑥) 𝐹(𝑥)
1 1

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0
𝑋 𝑋
0
-5 0 5 10 -5 0 5 10

a) 𝜆 = 0.1 b) 𝜆 = 1.0
1.2
1.2 𝐹(𝑥)
𝐹(𝑥) 1
1
0.8
0.8

0.6
0.6

0.4
0.4

0.2
0.2

𝑋 0
𝑋
0
-10 0 10 20 30
-5 0 5 10

c) 𝜆 = 2.0 c) 𝜆 = 8.0

Figura 7.5 Funcția de repartiție Poisson

138
În anexa III, de la finalul cărții, se află valorile funcției de repartiție Poisson, calculate pentru
parametrul 𝜆 = 0.1 ÷ 15.0.
Valorile tipice ale variabilei aleatorii Poisson repartizate, [GIB 76], [HAS 75], [WIK 10]:
1. Media teoretică:

𝑒 −𝜆 ∙ 𝜆𝑘
𝜇𝑋 = 𝐸(𝑋) = ∑ 𝑘 ∙ = 𝜆. (7.14)
𝑘!
𝑘=0

2. Mediana:
1 0.02
𝑀𝑒 ≅ 〈𝜆 + − 〉 (7.15)
3 𝜆
3. Moda:
 Dacă valoarea parametrului 𝜆 este un număr natural, atunci:
𝑀𝑜1 = 𝜆 − 1 și 𝑀𝑜2 = 𝜆 (7.16)
 Dacă valoarea parametrului 𝜆 nu este un număr natural, atunci:
𝑀𝑜 = 〈𝜆〉 (7.17)
În ecuația (7.15) și (7.17), prin 〈𝜆〉, s-a notat partea întreagă a valorii 𝜆.
4. Dispersia:

𝑒 −𝜆 ∙ 𝜆𝑘
𝜎𝑋2 = 𝑉(𝑋) = ∑(𝑘 − 𝜆)2 ∙ = 𝜆. (7.18)
𝑘!
𝑘=0

5. Abaterea medie pătratică:


𝜎𝑋 = √𝑉(𝑋) = √𝜆. (7.19)

Exemplul 7.4
Numărul de defecte de material constatate într-un atelier de ţesătorie
este Poisson repartizat cu media de 0.1 defecte/m2. Să se determine
probabilitatea ca:
a) Într-un m2 să determinăm 2 defecte de material?
b) În 10 m2 să avem doar un defect?
c) În 20 m2 să nu existe nici un defect?
𝑒 −0.1 ∙0.12
Soluție: a) 𝜆 = 0.1 ⇒ 𝑃𝑟(𝑋 = 2) = = 0.0045.
2!
𝑒 −1 ∙11
b) 𝜆 = 0.1 ∙ 10 = 1 ⇒ 𝑃𝑟(𝑌 = 1) = = 𝑒 −1 = 0.3679.
1!
−2
c) 𝜆 = 0.1 ∙ 20 = 2 ⇒ 𝑃𝑟(𝑊 = 0) = 𝑒 = 0.1353.

Observații: a. Repartiția Poisson reprezintă un caz limită al repartiției binomiale, pentru


cazul în care 𝑛 este suficient de mare (𝑛 → ∞) şi 𝑝 este suficient de mic
(𝑝 → 0), astfel încât produsul: 𝑛 ∙ 𝑝, să poată fi considerat constant, adică:
𝜆 =𝑛∙𝑝 (7.20)

139
Dacă în funcția de probabilitate a repartiției binomiale înlocuim valoarea
lui 𝑝, obținută din ecuația (7.20):
𝜆
𝑝=
𝑛
obținem:
𝜆 𝑥 𝜆 𝑛−𝑥
Pr(𝑋 = 𝑥) = ∁𝑛𝑥
∙ ( ) ∙ (1 − ) =
𝑛 𝑛
𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 1) ⋯ (𝑛 − 𝑥 + 1) 𝜆𝑥 𝜆 𝑛 𝜆 −𝑥
= ∙ 𝑥 ∙ (1 − ) ∙ (1 − )
𝑥! 𝑛 𝑛 𝑛
𝜆𝑥 𝜆 𝑛 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 1) ⋯ (𝑛 − 𝑥 + 1) 𝜆 −𝑥
= ∙ (1 − ) ∙ ∙ (1 − )
𝑥! 𝑛 𝑛𝑥 𝑛
𝑥 𝑛
𝜆 𝜆 1 ∙ [1 − (1⁄𝑛)] ∙ ⋯ ∙ [1 − (𝑘 − 1)⁄𝑛]
= ∙ (1 − ) ∙ .
𝑥! 𝑛 [1 − (𝜆⁄𝑛)]𝑥
Dacă trecem la limită când 𝑛 → ∞, obţinem:
𝜆 𝑛
lim (1 − ) = 𝑒 −𝜆
𝑛→∞ 𝑛
și
1 ∙ [1 − (1⁄𝑛)] ∙ ⋯ ∙ [1 − (𝑘 − 1)⁄𝑛]
lim = 1.
𝑛→∞ [1 − (𝜆⁄𝑛)]𝑥
Rezultă:
𝑒 −𝜆 ∙ 𝜆𝑥
Pr(𝑋 = 𝑥) = .
𝑥!
În aplicațiile practice se recomandă ca 𝑛 > 20 și 𝑝 < 0.1.
b. În cazul repartiției Poisson, între medie și dispersie există relația:
𝑉(𝑋) = 𝐸(𝑋). (7.21)

Exemplul 7.5
O firmă realizează filtre de ulei în condițiile în care 2% din produse sunt
neconforme. Să se determine probabilitatea ca într-un container, conține 100 de
produse, să existe maxim trei filtre neconforme.
Soluție: a. Utilizând repartiția Poisson cu parametrul 𝜆 = 0.02 ∙ 100 = 2:
3
𝑒 −2 ∙ 2𝑘
𝑃𝑟(𝑋 ≤ 3) = 𝐹(3) = ∑ = 0.857,
𝑘!
𝑘=0
conform anexei III, tabelul III.1.
b. Utilizând repartiția binomială cu parametrii 𝑛 = 100, 𝑝 = 0.02 și 𝑞 =
0.98:
3
𝑘
𝑃𝑟(𝑋 ≤ 3) = 𝐹(3) = ∑ 𝐶100 ∙ 0.02𝑘 ∙ 0.98100−𝑘 = 0.859.
𝑘=0

140
Domeniile de utilizare ale repartiției Poisson:
 Modelarea din punct de vedere probabilist a experimentelor având următoarele
caracteristici:
Considerăm un interval oarecare de pe axa reală, în care presupunem că evenimentul
așteptat apare în mod aleatoriu, cu o valoare medie 𝜆. Dacă împărțim acest interval în
subintervale disjuncte, cu o lungime suficient de mică, astfel încât:
a) Probabilitatea ca evenimentul așteptat să apară într-un astfel de interval tinde spre
zero;
b) Probabilitatea ca evenimentul așteptat să apară într-un subinterval este aceeași
pentru toate subintervalele și este proporțională cu lungimea intervalului;
c) Apariția evenimentului așteptat, într-un subinterval, este independentă de apariția
lui în celelalte subintervale,
atunci, variabila aleatorie 𝑋, a cărei valoare reprezintă numărul de evenimente aşteptate
pe acest interval, este repartizată Poisson cu parametrul 𝜆 > 0.
 Prima aplicație a repartiției Poisson se referă la numărul de decese din armata Prusacă,
cauzate de loviturile cailor;
 Teoria așteptării;
 Calcul aproximativ al probabilităților evenimentelor binomial repartizate;
 Controlul statistic de recepție și în metodele de inspecție prin atribute;
 Calculul și construcția fișelor de control pentru numărul de neconformități/unitatea de
produs și pentru numărul de neconformități, în cadrul controlului statistic al proceselor.
 Modelarea apariției bolilor rare (de exemplu leucemia), cu excepția celor infecțioase, la
care apariția îmbolnăvirilor nu este independentă;
 Accidente de mașină și modelarea distanței optime dintre autovehicule în trafic;
 Răspândirea animalelor pe cale de dispariție;
 Defectarea mașinilor-unelte.

7.3.3 MODELUL REPARTIȚIEI HIPERGEOMETRICE


7.3.3.1 SCHEMA LUI BERNOULLI CU BILE NEREVENITE

Se consideră o urnă care conține 𝑁 bile de două culori, 𝑎 bile albe şi 𝑏 bile negre:
𝑁 =𝑎+𝑏
Se extrag bile din urnă, una câte una, fără întoarcerea bilelor extrase înapoi în urnă. Se cere să
se determine probabilitatea ca din 𝑛 bile extrase (𝑛 < 𝑁), 𝑘 să fie de culoare albă şi 𝑛 − 𝑘 de
culoare neagră.
Există 𝐴𝑛𝑎+𝑏 posibilităţi de a lua 𝑛 bile din totalul de 𝑎 + 𝑏 bile, câte sunt în urnă la început.
Numărul posibilităţilor de a lua 𝑘 bile albe din cele 𝑎 existente, la început în urnă, este 𝐴𝑘𝑎 , iar
pentru a lua 𝑛 − 𝑘 bile negre, din cele 𝑏 bile negre ce se află în urnă la început este 𝐴𝑛−𝑘
𝑏 , deci:

141
𝑛! 𝐴𝑘𝑎 ∙ 𝐴𝑛−𝑘
𝑏 𝐴𝑘𝑎 𝐴𝑛−𝑘
𝑏 𝑛! 𝐶𝑎𝑘 ∙ 𝐶𝑏𝑛−𝑘
𝑃𝑟(𝑛, 𝑘) = = ∙ ∙ = ,
𝑘! ∙ (𝑛 − 𝑘)! 𝐴𝑛𝑎+𝑏 𝑘! (𝑛 − 𝑘)! 𝐴𝑛𝑎+𝑏 𝑛
𝐶𝑎+𝑏 (7.22)
unde 𝑎 ≥ 𝑘, 𝑏 ≥ 𝑛 − 𝑘 și 𝑎 + 𝑏 ≥ 𝑛.

7.3.3.2 REPARTIȚIA HIPERGEOMETRICĂ

Definiția 7.3: O variabilă aleatorie discretă 𝑋, este repartizată hipergeometric cu parametrii


𝑎, 𝑏, 𝑛, dacă funcţia de probabilitatea este de forma:
𝐶𝑎𝑥 ∙ 𝐶𝑏𝑛−𝑥
𝑃𝑟(𝑋 = 𝑥) = 𝑛 , pentru 𝑥 = 0,1, … , 𝑛 și 𝑎, 𝑏 ∈ 𝒩, 𝑎 + 𝑏 ≥ 𝑛. (7.23)
𝐶𝑎+𝑏
Forma cea mai utilizată a repartiției hipergeometrice se obține pornind de la ecuația (7.23), prin
utilizarea notațiilor:
𝑁 =𝑎+𝑏
{ .
𝑘=𝑎
Rezultă:
𝐶𝑘𝑥 ∙ 𝐶𝑁−𝑘
𝑛−𝑥
𝑃𝑟(𝑋 = 𝑥) = , pentru 𝑥 = 0,1, … , 𝑛
𝐶𝑁𝑛 (7.24)
și 𝑘, 𝑛, 𝑁 ∈ 𝒩, 𝑛 < 𝑁, 𝑛 < 𝑘.
și se notează, 𝑋~ℋ(𝑥, 𝑘, 𝑛, 𝑁).
Semnificația valorilor variabilei aleatorii hipergeometric repartizate este:
 Considerăm o mulțime ce conține 𝑁 obiecte de două tipuri:
- 𝑘 obiecte a căror extragere se consideră succes;
- 𝑁 − 𝑘 obiecte a căror extragere se consideră eșec.
 Se extrag aleatoriu 𝑛 obiecte, fără reîntoarcere, din mulțimea de 𝑁 obiecte;
 Valoarea 𝑥 a variabilei aleatorii, 𝑋, reprezintă numărul de succese înregistrate în cele
𝑛 obiecte extrase.
Alura funcției de probabilitate, a repartiției hipergeometrice, pentru diferite valori ale
parametrilor 𝑘, 𝑛 și 𝑁, este prezentată în figura 7.6.

𝑃𝑟(𝑋 = 𝑥) 𝑃𝑟(𝑋 = 𝑥)
0.45 0.4
0.4 0.35
0.35 0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1 0.1

0.05 0.05
𝑋 𝑋
0 0
0 1 2 3 4 5 0 1 2 3 4 5
a) 𝑘 = 5, 𝑛 = 5 și 𝑁 = 10 b) 𝑘 = 30, 𝑛 = 5 și 𝑁 = 50

Figura 7.6 Funcția de probabilitate a repartiției hipergeometrice

142
𝑃𝑟(𝑋 = 𝑥)
0.7

0.6

0.5

0.4

0.3

0.2

0.1
𝑋
0
0 1 2 3 4 5
c) 𝑘 = 5, 𝑛 = 5 și 𝑁 = 50

Figura 7.6 Funcția de probabilitate a repartiției hipergeometrice

Funcția de repartiție, a modelului statistic hipergeometric, este de forma:


0, dacă 𝑥 < 0
𝑥
𝐶𝑘𝑡 ∙ 𝐶𝑁−𝑘
𝑛−𝑡
F(𝑥) = Pr(𝑋 ≤ 𝑥) = ∑ , dacă 0 ≤ 𝑥 < 𝑛 . (7.25)
𝐶𝑁𝑛
𝑡=0
{ 1, dacă 𝑥 ≥ 𝑛
Alura funcției de repartiție, a modelului statistic hipergeometric, pentru diferite valori ale
parametrilor 𝑘, 𝑛 și 𝑁, este prezentată în figura 7.7.
1.2 1.2
𝐹(𝑥) 𝐹(𝑥)
1 1

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

𝑋 𝑋
0 0
-4 -2 0 2 4 6 8 -4 -2 0 2 4 6 8
a) 𝑘 = 5, 𝑛 = 5 și 𝑁 = 10 b) 𝑘 = 30, 𝑛 = 5 și 𝑁 = 50
1.2
𝐹(𝑥)
1

0.8

0.6

0.4

0.2
𝑋
0
-4 -2 0 2 4 6 8
c) 𝑘 = 5, 𝑛 = 5 și 𝑁 = 50
Figura 7.7 Funcția de repartiție hipergeometrică

143
Valorile tipice ale variabilei aleatorii hipergeometric repartizate, [GIB 76], [HAS 75],
[WIK 10]:
1. Media teoretică:
𝑛
𝐶𝑘𝑡 ∙ 𝐶𝑁−𝑘
𝑛−𝑡
𝑘∙𝑛
𝜇𝑋 = 𝐸(𝑋) = ∑ 𝑡 ∙ 𝑛 = = 𝑝 ∙ 𝑛. (7.26)
𝐶𝑁 𝑁
𝑡=0
În ecuația (7.26), cu 𝑝 s-a notat:
𝑘
𝑝= . (7.27)
𝑛
2. Moda:
(𝑛 + 1) ∙ (𝑘 + 1)
𝑀𝑜 = (7.28)
𝑁+2
3. Dispersia:

𝐶𝑘𝑡 ∙ 𝐶𝑁−𝑘
𝑛−𝑡
𝑁−𝑛
𝜎𝑋2 = 𝑉(𝑋) = ∑(𝑘 − 𝜇𝑋 )2 ∙ 𝑛 =𝑛∙𝑝∙𝑞∙ . (7.29)
𝐶𝑁 𝑁−1
𝑘=0
În ecuația (7.29), cu 𝑝 s-a notat:
𝑎 𝑏
𝑝= și 𝑞 = . (7.30)
𝑁 𝑁
4. Abaterea medie pătratică:

𝑁−𝑛
𝜎𝑋 = √𝑉(𝑋) = √𝑛 ∙ 𝑝 ∙ 𝑞 ∙ . (7.31)
𝑁−1

Exemplul 7.6
Dintr-un lot având 𝑁 = 100 de piese, ce conţine 5% produse
neconforme, este extras aleator un eșantion de 𝑛 = 5 piese. Să se calculeze
probabilitatea ca eşantionul să conţină exact o piesă neconformă:
Soluție: 𝑚 = 100, 𝑛 = 5, 𝑎 = 0.05 ∙ 𝑚 = 5 şi 𝑏 = 𝑚 − 𝑎 = 95
𝐶𝑎1 ∙ 𝐶𝑏𝑛−1 𝐶51 ∙ 𝐶95
5−1
5! ∙ 95! ∙ 5! ∙ 95!
Pr(𝑋 = 1) = 𝑛 = 5 = = 0.2114.
𝐶𝑚 𝐶100 4! ∙ 1! ∙ 4! ∙ 91! ∙ 100!

Observații: a. Repartiția hipergeometrică reprezintă un caz limită al repartiției binomiale,


pentru cazul în care 𝑁 este suficient de mare (𝑛 → ∞):
𝑁−𝑛
lim 𝜎𝑋2 = lim 𝑛 ∙ 𝑝 ∙ 𝑞 ∙ ( ) = 𝑛 ∙ 𝑝 ∙ 𝑞. (7.32)
𝑁→∞ 𝑁→∞ 𝑁−1
În aplicațiile practice se recomandă utilizarea acestei aproximări, pentru:
𝑛
< 0.1. (7.33)
𝑁
𝑁−𝑛
b. Factorul, ( 𝑁−1), ce apare în expresia dispersiei, în cazul repartiției

144
hipergeometrice, poartă numele de factor de corecție pentru populații
finite.
c. Spre deosebire de cazul repartiției binomiale, în cazul repartiției
hipergeometrice probele nu sunt independente.
d. În cazul repartiției hipergeometrice, între medie și dispersie există relația:
𝑉(𝑋) < 𝐸(𝑋). (7.34)

Exemplul 7.7
Un eșantion de trei produse este extras, fără înlocuire, dintr-o populație
de 𝑁 = 50 de produse, din care 6 sunt neconforme. Să se calculeze
probabilitatea ca în acest eșantion să existe maxim un produs neconform:
a. Utilizând repartiția hipergeometrică;
b. Utilizând repartiția binomială.
Soluție: a. Utilizând repartiția hipergeometrică cu parametrii 𝑁 = 50, 𝑘 = 6 și
𝑛 = 3:
1
𝐶6𝑡 ∙ 𝐶50−6
3−𝑡
𝑃𝑟(𝑋 ≤ 1) = 𝐹(1) = ∑ 3 = 0.9653,
𝐶50
𝑡=0
6
b. Utilizând repartiția binomială cu parametrii 𝑛 = 3, 𝑝 = 50 = 0.12 și
𝑞 = 0.88:
1

𝑃𝑟(𝑋 ≤ 1) = 𝐹(1) = ∑ 𝐶3𝑘 ∙ 0.12𝑘 ∙ 0.883−𝑘 = 0.9602.


𝑘=0

Domeniile de utilizare ale repartiției hipergeometrice:


Repartiția hipergeometrică se utilizează în statistică, fiabilitate, controlul statistic de recepție,
metodele de inspecție prin atribute și controlul statistic al proceselor, fiind modelul statistic ce
descrie, din punct de vedere probabilist, situația în care se prelevează un eșantion dintr-o
populație alcătuită dintr-un număr finit de indivizi.
Din păcate expresia matematică, destul de complexă, a acestui model statistic face ca pentru
aceste situații să se prefere aproximarea cu modelul repartiției binomiale.

 Descrieți schema bernoulliană cu bile revenite și deduceți probabilitatea


evenimentelor specifice.
 Definiți funcția de probabilitate și funcția de repartiție a repartiției
binomiale.
 Precizați care sunt ecuațiile pentru determinarea mediei teoretice,
dispersiei și abaterii medii pătratice a repartiției binomiale.

145
 Definiți funcția de probabilitate și funcția de repartiție a repartiției
Poisson.
 Precizați care sunt ecuațiile pentru determinarea mediei teoretice,
dispersiei și abaterii medii pătratice a repartiției Poisson.
 În ce condiții repartiția Poisson reprezintă un caz particular al repartiției
binomiale.
 Precizați semnificația fizică a evenimentelor de tip Poisson.
 Descrieți schema bernoulliană cu bile nerevenite și deduceți
probabilitatea evenimentelor specifice.
 Definiți funcția de probabilitate și funcția de repartiție a repartiției
hipergeometrice.
 Precizați care sunt ecuațiile pentru determinarea mediei teoretice,
dispersiei și abaterii medii pătratice a repartiției binomiale
hipergeometrice.
 În ce condiții repartiția binomială reprezintă un caz particular al
repartiției hipergeometrice.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Schema bernoulliană cu bile  Schema bernoulliană cu bile


revenite; nerevenite;
 Repartiția binomială;  Repartiția hipergeometrică.
 Repartiția Poisson;

Rezumat
În prima parte a acestei UI este prezentată schema bernoulliană cu bile revenite
și sunt calculate probabilitățile evenimentelor specifice asociate.
Pornind de la expresiile acestor evenimente , în continuare este definit modelul
statistic al repartiției binomiale: funcția de probabilitate, funcția de repartiție
precum și expresiile principalelor valori tipice.
În continuare, s-a definit modelul repartiției Poisson, ca și caz particular al
repartiției binomiale. De asemenea, sunt prezentate pentru această repartiție
funcția de probabilitate, funcția de repartiție precum și expresiile principalelor
valori tipice.
În finalul prezentei UI este prezentată schema bernoulliană cu bile nerevenite și
sunt calculate probabilitățile evenimentelor specifice asociate.

146
Pornind de la expresiile acestor evenimente , în continuare este definit modelul
statistic al repartiției hipergeometrice: funcția de probabilitate, funcția de
repartiție precum și expresiile principalelor valori tipice.
În continuare se vor prezenta principalele modele de repartiții statistice
ale variabilelor aleatorii continue.

Test de autoevaluare a cunoștințelor


P.7.1 Fie 𝑋 o variabilă aleatorie binomial repartizată cu media 𝜇 = 1.0 și dispersia
𝜎 2 = 0.9. Să se calculeze următoarele probabilități:
a. 𝑃𝑟(𝑋 > 5); b. 𝑃𝑟(1 < 𝑋 < 4);
c. 𝑃𝑟(3 ≤ 𝑋 ≤ 5).
R: 𝑛 ∙ 𝑝 = 1.0
{ ⇒ 1 − 𝑝 = 0.9 ⇒ 𝑝 = 0.1, 𝑛 = 10.
𝑛 ∙ 𝑝 ∙ (1 − 𝑝) = 0.9
𝑎. 𝑃𝑟(𝑋 > 5) = 1 − 𝑃𝑟(𝑋 ≤ 5) = 1 − 𝐹(5) =
= 1 − 0.9999 = 0.0001
b. 𝑃𝑟(1 < 𝑋 < 4) = 𝐹(3) − 𝐹(1) = 0.9872 − 0.7361 = 0.2511
c. 𝑃𝑟(3 ≤ 𝑋 ≤ 5) = 𝐹(5) − 𝐹(2) = 0.9999 − 0.9298 = 0.0701
P.7.2 Fie 𝑋 o variabilă aleatorie binomial repartizată cu parametrii 𝑛 = 5.0 și 𝑝 = 0.3.
Să se calculeze următoarele probabilități:
a. 𝑃𝑟(1 < 𝑋 < 3); b. 𝑃𝑟(𝑋 ≥ 4);
c. 𝑃𝑟(2 ≤ 𝑋 ≤ 4).
R: a. 𝑃𝑟(1 < 𝑋 < 3) = 𝐹(2) − 𝐹(1) = 0.8369 − 0.5282 = 0.3087
sau
𝑃𝑟(1 < 𝑋 < 3) = 𝑃𝑟(𝑋 = 2) = 𝐶52 ∙ 0.32 ∙ (1 − 03)5−2 =
= 10 ∙ 0.32 ∙ 0.23 = 0.3087
b. 𝑃𝑟(𝑋 ≥ 4) = 1 − 𝐹(3) = 1 − 0.9692 = 0.0308
c. 𝑃𝑟(2 ≤ 𝑋 ≤ 4) = 𝐹(4) − 𝐹(1) = 0.9976 − 0.8369 = 0.1607
P.7.3 Care este valoarea cea mai probabilă a unei variabile aleatorii binomial
repartizate, 𝑋, pentru zece extrageri, având probabilitatea de eșec, 𝑞 = 0.1.
𝑝 = 1 − 𝑞 = 1 − 0.1 = 0.9
R: 𝑛 = 10
〈𝑛 ∙ 𝑝〉 ≤ 𝑀𝑒 ≤ 〈𝑛 ∙ 𝑝〉 + 1 ⇒ 𝑀𝑒 = 9
P.7.4 Fie X o variabilă aleatorie binomial repartizată. Să se calculeze următoarele
probabilități:
a. 𝑃𝑟(𝑋 = 3), dacă 𝑛 = 5 și 𝑝 = 0.2;
b. 𝑃𝑟(𝑋 = 2), dacă 𝑛 = 6 și 𝑝 = 0.3;
c. 𝑃𝑟(𝑋 = 3), dacă 𝑛 = 7 și 𝑞 = 0.75.
R: a. 𝑃𝑟(𝑋 = 3) = 𝐶53 ∙ 0.23 ∙ (1 − 0.2)5−3 = 0.0512
b. 𝑃𝑟(𝑋 = 2) = 𝐶62 ∙ 0.32 ∙ (1 − 0.3)6−2 = 0.324135
c. 𝑃𝑟(𝑋 = 4) = 𝐶74 ∙ (1 − 0.75)4 ∙ 0.757−4 = 0.05767
P.7.5 Să se determine funcția de probabilitate a variabilei aleatorii, 𝑋, binomial
repartizată cu 𝑛 = 4 și 𝑝 = 1/2.
R: 0 1 2 3 4
𝑋: ((1 )
− 𝑝)4 𝐶41 ∙ 𝑝 ∙ (1 − 𝑝)3 𝐶42 ∙ 𝑝2 ∙ (1 − 𝑝)2 𝐶43 ∙ 𝑝3 ∙ (1 − 𝑝)1 𝑝4

147
0 1 2 3 4
𝑋: ( )
0.0625 0.25 0.375 0.25 0.0625
P.7.6 Să se determine funcția de repartiție a variabilei aleatorii, 𝑋, binomial
1
repartizată cu 𝑛 = 3 și 𝑝 = 3.
R: 𝐹(𝑥) =
0, 𝑑𝑎𝑐ă 𝑥 < 0
(1 − 𝑝) ,3
𝑑𝑎𝑐ă 0 ≤ 𝑥 < 1
(1 3 1 (1 2
= − 𝑝) + 𝐶3 ∙ 𝑝 ∙ − 𝑝) , 𝑑𝑎𝑐ă 1 ≤ 𝑥 < 2
(1 − 𝑝)3 + 𝐶31 ∙ 𝑝 ∙ (1 − 𝑝)2 + 𝐶32 ∙ 𝑝2 ∙ (1 − 𝑝), 𝑑𝑎𝑐ă 2 ≤ 𝑥 < 3
{ 1, 𝑑𝑎𝑐ă 𝑥 ≥ 3
0, 𝑑𝑎𝑐ă 𝑥 < 0
0.29629, 𝑑𝑎𝑐ă 0 ≤ 𝑥 < 1
𝐹(𝑥) = 0.74074, 𝑑𝑎𝑐ă 1 ≤ 𝑥 < 2
0.96263, 𝑑𝑎𝑐ă 2 ≤ 𝑥 < 3
{ 1, 𝑑𝑎𝑐ă 𝑥 ≥ 3
P.7.7 Fie 𝑋 o variabilă aleatorie Poisson repartizată. Să se calculeze următoarele
probabilități:
a. 𝑃𝑟(𝑋 = 3), dacă 𝜆 = 2.5; b. 𝑃𝑟(𝑋 ≤ 5), dacă 𝜆 = 5.0
c. 𝑃𝑟(𝑋 < 5), dacă 𝜆 = 4.0; d. 𝑃𝑟(𝑋 > 4), dacă 𝜆 = 6.5;
e. 𝑃𝑟(𝑋 ≥ 5.5), dacă 𝜆 = 4.5;
R: 𝑒 −𝜆 ∙𝜆𝑥 𝑒 −2.5 ∙2.53
a. 𝑃𝑟(𝑋 = 3) = = = 0.213763
𝑥! 3!
𝑃𝑟(𝑋 = 3) = 𝐹(3) − 𝐹(2) = 0.757576 − 0.543813 = 0.213763
𝑒 −𝜆 ∙𝜆𝑥𝑘 𝑒 −5 ∙5𝑘
b. 𝑃𝑟(𝑋 ≤ 5) = ∑5𝑘=0 = ∑5𝑘=0 =
𝑘! 𝑘!
= 0.006738 + 0.03369 + 0.084224 + 0.140374 +
+0.175467 + 0.175467 = 0.615961
𝑃𝑟(𝑋 ≤ 5) = 𝐹(5) = 0.6159
𝑒 −4 ∙4𝑘
c. 𝑃𝑟(𝑋 < 5) = ∑4𝑘=0 𝑘!
=
= 0.018316 + 0.073263 + 0.146525 + 0.195367 +
+0.195367 = 0.628837
𝑃𝑟(𝑋 < 5) = 𝐹(4) = 0.629
𝑒 −6.5 ∙6.5𝑘
d. 𝑃𝑟(𝑋 > 4) = 1 − 𝐹(4) = 1 − ∑5𝑘=0 𝑘!
=
= 1 − 0.001503 − 0.009772 − 0.03176 − 0.068814 −
−0.111822 = 0.776328
𝑃𝑟(𝑋 > 4) = 1 − 𝐹(4) = 1 − 0.224 = 0.776
e. 𝑃𝑟(𝑋 ≥ 5.5) = 1 − 𝐹(5) = 1 − 0.703 = 0.297
P.7.8 Numărul de apeluri înregistrate între orele 1:00 și 3:00 A.M., de către angajații
unui Room service este Poisson repartizat cu 𝜆 = 12. Să se calculeze
probabilitatea ca:
a. Numărul de apeluri telefonice, primite între orele 1:00 și 3:00 A.M., să fie
mai mic de 8.
b. Numărul de apeluri telefonice, primite între orele 1:30 și 2:00 A.M., să fie
mai mic de 8.
c. Numărul de apeluri telefonice, primite între orele 2:00 și 3:00 A.M., să fie
exact unu.

148
R: a. 𝜆 = 12 ⇒ 𝑃𝑟(𝑋 < 8) = 𝐹(7) = 0.155
b. 𝜆 = 3 ⇒ 𝑃𝑟(𝑋 < 8) = 𝐹(7) = 0.988
c. 𝜆 = 6 ⇒ 𝑃𝑟(𝑋 = 1) = 𝐹(1) − 𝐹(0) = 0.017 − 0.002 = 0.015
𝑒 −6 ∙ 61
𝑃𝑟(𝑋 = 1) = = 0.0148
1!
P.7.9 Numărul de opriri accidentale ale unei linii de montaj autovehicule este Poisson
repartizată cu 𝜆 = 3/săptămână. Să se calculeze probabilitatea ca:
a. Într-o anumită săptămână să nu se înregistreze nici o oprire accidentală,
b. Într-o anumită săptămână să se înregistreze exact cinci opriri accidentale;
c. Într-o lună să se înregistreze maxim trei opriri accidentale,
d. Să se calculeze numărul mediu de opriri accidentale înregistrate într-un an.
R: a. 𝜆 = 3 ⇒ 𝑃𝑟(𝑋 = 0) = 𝐹(0) = 0.050
b. 𝜆 = 3 ⇒ 𝑃𝑟(𝑋 = 5) = 𝐹(5) − 𝐹(4) = 0.916 − 0.815 = 0.101
c. 𝜆 = 4 ∙ 3 = 12 ⇒ 𝑃𝑟(𝑋 ≤ 3) = 𝐹(3) = 0.002
365
d. 𝜇 = ∙ 𝜆 ≅ 52 ∙ 𝜆 = 52 ∙ 3 = 156
7
P.7.10 Fie 𝑋, o variabilă aleatorie binomial repartizată cu 𝑛 = 20 și 𝑝 = 0.01. Să se
calculeze următoarele probabilități: 𝑃𝑟(𝑋 = 0), 𝑃𝑟(𝑋 > 2) ş𝑖 𝑃𝑟(𝑋 ≤ 5).
a. Utilizând repartiția binomială;
b. Utilizând repartiția Poisson.
R: a. Utilizând repartiția binomială:
𝑃𝑟(𝑋 = 0) = (1 − 𝑝)𝑛 = 0.9920 = 0.81790
𝑃𝑟(𝑋 > 2) = 1 − 𝐹(2) = 1 − 0.999 = 0.001
𝑃𝑟(𝑋 ≤ 5) = 𝐹(5) = 1.0
b. Utilizând repartiția Poisson.
𝜆 = 𝑛 ∙ 𝑝 = 20 ∙ 0.01 = 0.20
𝑃𝑟(𝑋 = 0) = 0.819
𝑃𝑟(𝑋 > 2) = 1 − 𝐹(2) = 1 − 0.999 = 0.001
𝑃𝑟(𝑋 ≤ 5) = 𝐹(5) = 1.0
P.7.11 Considerăm variabila aleatorie 𝑋, hipergeometric repartizată, cu parametrii 𝑁 =
100, 𝑛 = 4 și 𝑘 = 20. Să se determine:
a. 𝑃𝑟(𝑋 = 1); b. 𝑃𝑟(𝑋 ≤ 3);
c. 𝑃𝑟(𝑋 > 2).
1 4−1
R: 𝐶20 ∙ 𝐶100−20
𝑎. 𝑃𝑟(𝑋 = 1) = 4 = 0.419053
𝐶100
3 𝑡 4−𝑡
𝐶20 ∙ 𝐶100−20
𝑏. 𝑃𝑟(𝑋 ≤ 3) = ∑ 4 = 0.998764
𝐶100
𝑡=0
2 𝑡 4−𝑡
𝐶20 ∙ 𝐶100−20
𝑐. 𝑃𝑟(𝑋 > 2) = 1 − 𝐹(2) = 1 − ∑ 4 = 0.024494
𝐶100
𝑡=0
P.7.12 Considerăm variabila aleatorie 𝑋, hipergeometric repartizată, cu parametrii 𝑁 =
20, 𝑛 = 4 și 𝑘 = 15. Să se determine tabloul variabilei aleatorii 𝑋.
R: 0 1 2 3 4
𝑋: ( )
0.00103 0.0309 0.21671 0.46955 0.28173

149
Unitatea de învățare 8.

Cuprins
8.1. Introducere ........................................................................................................... 150
8.2. Competențe .......................................................................................................... 150
8.3. Legi de repartiție pentru variabile aleatorii continue ......................................... 151
8.3.1. Repartiția normală ................................................................................................151
8.3.2. Teorema limită centrală........................................................................................157
8.3.3. Repartiția lognormală ...........................................................................................158
8.3.4. Repartiția uniformă continuă ................................................................................161
8.4. Rezumat ............................................................................................................... 165
8.5. Test de autoevaluare............................................................................................ 166

8.1. Introducere
Prezenta unitate de învățare este destinată prezentării principalelor legi de
repartiție pentru variabile aleatorii continue.
Este vorba de repartiția normală și repartiția normală normată. La acest model
statistic sunt prezentate funcția de repartiție, funcția de probabilitate precum și
expresiile valorilor tipice ale variabilei aleatorii. Studiul repartiției normale se
încheie cu precizarea principalelor domeniile de utilizare ale acestui model
statistic. De asemenea, în legătură cu repartiția normală este prezentată teorema
limită centrală. Funcția de repartiție, funcția de probabilitate precum și expresiile
valorilor tipice ale variabilei aleatorii precum și principalele domenii de utilizare
sunt prezentate și pentru repartiția log-normală și uniformă.

8.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să definească și să
cunoască semnificația, proprietățile și domeniile de utilizare a principalelor legi
de repartiție pentru variabile aleatorii continue. De asemenea, va fi capabil să
utilizeze tehnici și metode adecvate pentru calculul anumitor probabilități pe baza
unor formule sau scheme de calcul, indiferent de natura experimentului
considerat, fără a mai recurge de fiecare dată la procedeele greoaie sugerate de
formula dată de definiția clasică.

Durata medie de parcurgere a acestei unități de învățare este de 2 ore.

150
8.3 LEGI DE REPARTIȚIE PENTRU VARIABILE ALEATORII
CONTINUE
8.3.1 REPARTIȚIA NORMALĂ

Definiția 8.1: O variabilă aleatorie continuă 𝑋, este normal repartizată cu parametrii 𝜇 și 𝜎,


dacă funcţia densitate de probabilitatea este de forma:
1 1 𝑥−𝜇 2
𝑒 −2∙( )
𝑓(𝑥) = 𝜎 , pentru − ∞ < 𝑥 < ∞, −∞ < 𝜇 < ∞
𝜎 ∙ √2 ∙ 𝜋 (8.1)
și 𝜎 > 0.
și se notează, 𝑋~𝒩(𝑥, 𝜇, 𝜎).
Această repartiție statistică mai poate fi întâlnită și sub denumirea de repartiția Gauss – Laplace.
Alura funcției densitate de probabilitate, a repartiției normale, pentru diferite valori ale celor
doi parametri, este prezentată în figura 8.1.
Din analiza alurii acestui model statistic se poate concluziona că:
 Repartiția normală este simetrică față de o verticală trasată în punctul de abscisă 𝑥 = 𝜇;
 𝜇 reprezintă un parametru de poziționare, deoarece determină poziția pe axa 𝑂𝑥 a curbei
densitate de probabilitate;
 𝜎 reprezintă un parametru de scală, deoarece influența lui asupra alurii funcției densitate
de probabilitate este identică cu modificarea scalei de reprezentare grafică pe axa 𝑂𝑥.

1
𝑓(𝑥)
0.9

0.8

0.7
𝜇 = −2.0, 𝜎 2 = 0.5 𝜇 = 0, 𝜎 2 = 0.2
0.6

0.5

0.4

0.3
𝜇 = 0, 𝜎 2 = 1
0.2
𝜇 = 0, 𝜎 2 = 5
0.1

0
𝑋
-5 -4 -3 -2 -1 0 1 2 3 4 5

Figura 8.1 Funcția densitate probabilitate a repartiției normale

Funcția de repartiție, a modelului statistic normal, rezultă de forma:


𝑥
1 1 𝑢−𝜇 2
∫ 𝑒 −2∙( )
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = 𝜎 ∙ 𝑑𝑢 (8.2)
𝜎 ∙ √2 ∙ 𝜋
−∞

Alura funcției de repartiție, pentru diferite valori ale celor doi parametri, este prezentată în
figura 8.2.

151
1.2
𝐹(𝑥)
1

𝜇 = −2.0, 𝜎 2 = 0.5 0.8 𝜇 = 0, 𝜎 2 = 5

0.6

𝜇 = 0, 𝜎 2 = 1
0.4

0.2
𝜇 = 0, 𝜎 2 = 0.2
𝑋
0
-5 -4 -3 -2 -1 0 1 2 3 4 5

Figura 8.2 Funcția de repartiție normală

Calculul valorilor probabilităților, prin utilizarea relației (8.2), reprezintă o operație destul de
dificilă deoarece prin integrare nu se poate ajunge la o expresie explicită. Pentru a înlătura acest
neajuns, este nevoie să apelăm la schimbarea de variabilă aleatorie:
𝑋−𝜇
𝑍= . (8.3)
𝜎
Rezultă:
𝜇+𝜎∙𝑧
𝑋−𝜇 1 𝑣2

𝑃𝑟(𝑍 ≤ 𝑧) = 𝑃𝑟 ( ≤ 𝑧) = 𝑃𝑟(𝑋 ≤ 𝜇 + 𝜎 ∙ 𝑧) = ∫ 𝑒 2 ∙ 𝑑𝑣.
𝜎 √2 ∙ 𝜋
−∞

Variabila aleatorie Z, definită prin relația (8.3), poartă numele de variabilă aleatorie normală
normată și are funcția densitate de probabilitate:
1 𝑧2

𝑓(𝑧) = ∙𝑒 2. (8.4)
√2 ∙ 𝜋
Ecuația (8.4) reprezintă densitatea de probabilitate pentru o variabilă aleatorie normal
repartizată cu 𝜇 = 0 și 𝜎 = 1. Într-adevăr:
𝑋−𝜇 1
𝐸(𝑍) = 𝐸 ( ) = ∙ [𝐸(𝑋) − 𝜇] = 0.
𝜎 𝜎
De asemenea
1 1
𝐸(𝑍 2 ) = 2 ∙ 𝐸(𝑋 2 − 2 ∙ 𝑋 ∙ 𝜇 + 𝜇 2 ) = 2 ∙ [𝜇 2 + 𝜎 2 − 2 ∙ 𝜇 2 + 𝜇 2 ] = 1.
𝜎 𝜎
Conform ecuației (5.28), rezultă:
𝜎 2 = 𝐸(𝑍 2 ) − [𝐸(𝑍)]2 = 1.
Prin intermediul densității de probabilitate (8.4), probabilitățile corespunzătoare diferitelor
valori ale variabilei aleatorii 𝑍 se pot determina cu relația:
𝑧
1 𝑢2

𝐹(𝑧) = 𝑃𝑟(𝑍 ≤ 𝑧) = Φ(𝑧) = ∙ ∫𝑒 2 ∙ 𝑑𝑢 (8.5)
√2 ∙ 𝜋
−∞

152
Funcția Φ(𝑧), definită prin ecuația (8.5), poartă numele de funcția integrală Laplace. Această
funcție, împreună cu ecuația (8.3) permit calculul probabilităților pentru diferite valori ale unei
variabile aleatorii normal repartizate, indiferent de combinația de valori ale celor doi parametri,
𝜇 și 𝜎.
De asemenea, dacă considerăm două valori reale, 𝑎 și 𝑏, 𝑎 < 𝑏, atunci:
𝑏−𝜇 𝑎−𝜇
𝑃𝑟(𝑎 < 𝑋 < 𝑏) = Φ ( ) − Φ( ) (8.6)
𝜎 𝜎
În anexa IV, de la finalul cărții, tabelele IV.1 și IV.2 se găsesc calculate valorile funcției
integrale Laplace.

Exemplul 8.1
În cadrul unui atelier, pe un strung se realizează o piesă cilindrică cu
diametrul de 15+0.05
−0.05 𝑚𝑚. Care este probabilitatea producerii de rebuturi știind
că diametrul piesei este normal repartizat cu 𝜇 = 15.02 𝑚𝑚 și 𝜎 = 0.02 𝑚𝑚.
Soluție: Probabilitatea ca piesa să fie conformă cu specificația tehnică este, conform
figurii 3.17:
𝑃𝑟(14.95 ≤ 𝑋 ≤ 15.05) = 𝐹(15.05) − 𝐹(14.95) =
15.05 − 15.02 14.95 − 15.02
= Φ( ) − Φ( ) = Φ(1.5) − Φ(−3.5) =
0.02 0.02
= 0.9332 − 0.0002 = 0.933.
Deci, probabilitatea ca piesele să rezulte rebut, este:
1 − 𝑃𝑟(14.95 ≤ 𝑋 ≤ 15.05) = 1 − 0.933 = 0.067 = 6.7%.

𝑓(𝑥)

14.95 15 𝜇 = 15.02 15.05 𝑋

Figura 8.3 Cazul exemplului 8.1

Valorile tipice ale variabilei aleatorii normal repartizate, [GIB 76], [HAS 75], [KEC 93]:
1. Media teoretică:

1 1 𝑥−𝜇 2
∫ 𝑥 ∙ 𝑒 −2∙( )
𝜇𝑋 = 𝐸(𝑋) = 𝜎 ∙ 𝑑𝑥 = 𝜇 (8.7)
𝜎 ∙ √2 ∙ 𝜋
−∞

153
2. Mediana:
𝑀𝑒 = 𝜇. (8.8)
3. Moda:
𝑀𝑜 = 𝜇. (8.9)
4. Dispersia:

1 1 𝑥−𝜇 2
∫ (𝑥 − 𝜇)2 ∙ 𝑒 −2∙( )
𝜎𝑋2 = 𝑉(𝑋) = 𝜎 ∙ 𝑑𝑥 = 𝜎 2 . (8.10)
𝜎 ∙ √2 ∙ 𝜋
−∞

5. Abaterea medie pătratică:


𝜎𝑋 = √𝑉(𝑋) = √𝜎 2 = 𝜎. (8.11)

Exemplul 8.2
Fie variabila aleatorie 𝑋, normal repartizată, având funcția densitate de
probabilitate:
1 1 𝑥−8 2
𝑓(𝑥) = 𝑒 −2∙( 2 ) .
2 ∙ √2 ∙ 𝜋
Să se determine:
a. Media și dispersia variabilei aleatorii, 𝑋;
b. Să se determine cuantilele 𝑥0.05 și 𝑥0.95 .
Soluție: a. 𝜇 = 8 și 𝜎 2 = 22 = 4.
b. Cuantilele variabilei aleatorii normale normate sunt, conform anexei IV:
𝑧0.05 = −1.64 și 𝑧0.95 = 1.64.
Rezultă:
𝑥0.05 = 𝜎 ∙ 𝑧0.05 + 𝜇 = 2 ∙ (−1.64) + 8 = 4.72 ;
𝑥0.95 = 𝜎 ∙ 𝑧0.95 + 𝜇 = 2 ∙ 1.64 + 8 = 11.28.
Observații: a. Fiind vorba de o repartiție pentru o variabilă aleatorie continuă, repartiția
normală respectă condiția:

1 1 𝑥−𝜇 2
∫ 𝑒 −2∙( )
𝜎 ∙ 𝑑𝑥 = 1.
𝜎 ∙ √2 ∙ 𝜋
−∞

b. Considerăm 𝑛 variabile aleatorii independente, 𝑋1 , 𝑋2 , … , 𝑋𝑛 , normal


repartizate cu mediile 𝜇1 , 𝜇2 , … , 𝜇𝑛 și dispersiile 𝜎12 , 𝜎22 , … , 𝜎𝑛2 . Atunci,
variabila aleatorie
𝑛

𝑌 = ∑ 𝑋𝑖 ,
𝑖=1
este normal repartizată cu media 𝜇𝑌 = ∑𝑛𝑖=1 𝜇𝑖 și dispersia 𝜎𝑌2 = ∑𝑛𝑖=1 𝜎𝑖2 .
c. Fie 𝑎, o constantă reală pozitivă, conform ecuației (8.6), rezultă:
𝑎 𝑎
𝑃𝑟(𝜇 − 𝑎 < 𝑋 < 𝜇 + 𝑎) = Φ ( ) − Φ (− ).
𝜎 𝜎

154
Datorită simetriei repartiției normale:
𝑎 𝑎
Φ (− ) = 1 − Φ ( ).
𝜎 𝜎
Deci:
𝑎
𝑃𝑟(|𝑋 − 𝜇| < 𝑎) = 2 ∙ Φ ( ) − 1. (8.12)
𝜎
d. Particularizând relația (8.12) pentru 𝑎 = 3 ∙ 𝜎, obținem:
3∙𝜎
𝑃𝑟(|𝑋 − 𝜇| < 3 ∙ 𝜎) = 2 ∙ Φ ( ) − 1 = 2 ∙ Φ(3) − 1.
𝜎
Deoarece, Φ(3) = 0.9986501, atunci:
𝑃𝑟(|𝑋 − 𝜇| < 3 ∙ 𝜎) = 0.9973. (8.13)
Ecuația (8.13) poartă numele de regula celor șase sigma.
e. Tot, datorită simetriei repartiției normale, între cuantilele repartiției se
poate stabili următoarea relație:
𝑥𝑝 = −𝑥1−𝑝 .
e. Pentru o variabilă aleatorie normal repartizată, 𝑋~𝒩(𝑥, 𝜇, 𝜎), suprafața
delimitată de funcția densitate de probabilitate și de două drepte verticale,
trasate de o parte și de alta a mediei, la distanțe egale cu multipli întregi ai
abaterii medii pătratice, are valorile prezentate în figura 8.4.
Aceste valori se pot determina utilizând relația (8.12).

𝑓(𝑋)

68.3%
𝑋

𝜇 − 3𝜎 𝜇 − 2𝜎 𝜇−𝜎 𝜇 𝜇+𝜎 𝜇 + 2𝜎 𝜇 + 3𝜎
95.5%
99.7%

Figura 8.4 Probabilitatea abaterilor față de medie

Exemplul 8.3
O fermă ambalează cartofi în saci. Presupunem că greutatea unui sac de
cartofi este normal repartizată cu 𝜇 = 30 𝑘𝑔 și abaterea medie pătratică 𝜎 =
2 𝑘𝑔. Să se determine numărul de saci, ce trebuie încărcați la o livrare de 6 𝑡,

155
astfel încât greutatea transportului să nu depășească cantitatea nominală cu mai
mult de 10%.
Soluție:

6000 − 30 ∙ 𝑛
∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 0.10 ⇒ 1 − Φ ( ) = 0.10.
6000−30∙𝑛
2 ∙ √𝑛
2∙√𝑛
6000 − 30 ∙ 𝑛
𝑧0.90 = 1.28 ⇒ = 1.28. Rezultă 𝑛 ≅ 199 𝑑𝑒 𝑠𝑎𝑐𝑖.
2 ∙ √𝑛

Domeniile de utilizare ale repartiției normale:


Repartiția normală reprezintă modelul cel mai frecvent utilizat în statistică. Dintre domeniile în
care repartiția normală și-a găsit aplicație, se pot enumera:
 Modelarea tuturor fenomenelor a căror variație poate fi considerată ca fiind rezultatul
acțiunii unui număr mare factori, ce acționează independent unii fată de alții, sau a unui
șir de cauze înlănțuite ale căror efecte pot fi însumate;
 Modelarea proprietăților fizice ale materialelor (oțeluri, materiale semiconductoare,
ceramică, sticlă, mase plastice, porțelan, grafit, hârtie, fibre textile), proprietăți care sunt
continue în timp sau spațiu;
 Calculul statistic al erorilor de măsurare, al erorilor de prelucrare și al erorilor de
orientare;
 Variațiile datorate erorii preciziei de măsurare;
 Controlul statistic al proceselor;
 Fenomenele de îmbătrânire mecanică, electrică și termică a elementelor componente ale
sistemelor;
 Tensiunea de rupere (deformare) a materialelor metalice și textile;
 Numărul de cicluri de funcționare până la defectare datorată oboselii, sau tensiunilor
interne ale materialelor, pentru componente mecanice, electrice și electronice;
 Modelarea duratei de viață pentru bunuri de larg consum: încălțăminte, îmbrăcăminte,
mobilă, becuri de iluminat și aparatură electrocasnică;
 Media valorilor a 𝑛 observaţii din orice tip de repartiție statistică, sau din 𝑛 repartiţii
diferite având o medie şi o abatere standard finite, aproximează o repartiție normală și nu
depinde de forma repartiției inițiale;
 Realizarea inferențelor statistice pentru media de eșantionaj;
 Este utilizată în fizica statistică: vectorul viteză al moleculelor unui gaz are componentele
variabile aleatorii independente, normal repartizate;
 În mișcarea browniană, schimbarea poziției unei particule în orice direcție, într-un
interval de timp [0, 𝑡], urmează o repartiție normală cu media 𝜇 = 0 şi dispersia
proporţională cu 𝑡 (raportul de proporţionalitate reprezintă valoarea coeficientului de
difuzie).

156
8.3.2 TEOREMA LIMITĂ CENTRALĂ

În teoria probabilității, teorema limită centrală stipulează condițiile în care valoarea medie a
unui număr suficient de mare de variabile aleatorii independente, fiecare având media și
dispersia finite, va fi de aproximativ normal repartizată. De aceea, această teoremă joacă un rol
deosebit în aplicațiile statistice, fiind considerată, împreună cu legea numerelor mari, una din
cele două teoreme fundamentale ale teoriei probabilităților, [GIB 76], [WIK 10].
Definiția 8.2: Fie 𝑛 variabile aleatorii independente, 𝑋1 , 𝑋2 , … , 𝑋𝑛 , normal repartizate cu
mediile:
𝐸(𝑋1) = 𝐸(𝑋2 ) = ⋯ = 𝐸(𝑋𝑛 ) = 𝜇
și dispersiile:
𝑉(𝑋1 ) = 𝑉(𝑋2 ) = ⋯ = 𝑉(𝑋𝑛 ) = 𝜎 2 ,
atunci:
𝑆𝑛 − 𝑛 ∙ 𝜇
lim 𝑃𝑟 (𝑎 ≤ ≤ 𝑏) =
𝑛→∞ 𝜎 ∙ √𝑛
= lim (𝑎 ∙ 𝜎 ∙ √𝑛 + 𝑛 ∙ 𝜇 ≤ 𝑆𝑛 ≤ 𝑏 ∙ 𝜎 ∙ √𝑛 + 𝑛 ∙ 𝜇) =
𝑛→∞ (8.14)
𝑏
1 𝑢2
= ∙ ∫ 𝑒 − 2 ∙ 𝑑𝑢.
√2 ∙ 𝜋
𝑎

În ecuația (8.14), prin 𝑆𝑛 s-a notat variabila aleatorie:


𝑛

𝑆𝑛 = ∑ 𝑋𝑖 ,
𝑖=1

având media 𝐸(𝑆𝑛 ) = 𝑛 ∙ 𝜇 și dispersia 𝑉(𝑆𝑛 ) = 𝑛 ∙ 𝜎 2 .


Deci, teorema limită centrală indică faptul că legea de repartiție a variabilei aleatorii:
𝑆𝑛 − 𝑛 ∙ 𝜇
,
𝜎 ∙ √𝑛
tinde asimptotic spre repartiția normală normată, dacă 𝑛 → ∞.

Exemplul 8.4
Se aruncă o monedă de 100. Să se determine, utilizând repartiția
normală, care este probabilitatea ca numărul de steme să fie mai mare de 60.
Soluție: 𝑋𝑖 reprezintă o variabilă aleatorie, binomial repartizată cu:
𝜇𝑖 = 𝑛 ∙ 𝑝 = 1 ∙ 0.5 = 0.5 și 𝜎𝑖 2 = 𝑛 ∙ 𝑝 ∙ (1 − 𝑝) = 1 ∙ 0.5 ∙ 0.5 = 0.25.
Variabila aleatorie:
𝑛

𝑆𝑛 = ∑ 𝑋𝑖 , este repartizată, cu:


𝑖=1
𝑛 𝑛

𝜇𝑆𝑛 = ∑ 𝜇𝑖 = 𝑛 ∙ 𝜇𝑖 = 100 ∙ 0.5 = 50 și 𝜎𝑆2𝑛 = ∑ 𝜎𝑖 2 = 𝑛 ∙ 𝜎𝑖 2 = 25


𝑖=1 𝑖=1

157
60 − 50
𝑃𝑟(𝑆𝑛 > 60) = 1 − 𝑃𝑟(𝑆𝑛 ≤ 60) = 1 − 𝐹(60) = 1 − Φ ( )=
√25
= 1 − Φ(2) = 1 − 0.97725 = 0.02275.

Definiția 8.2, reprezintă de fapt, un caz particular al teoremei limită centrală. Versiunea cu un
grad mai mare de generalitate, a teoremei limită centrală, aplicabilă în anumite condiții inițiale,
atunci când variabilele aleatorii sunt independente, dar nu sunt identic repartizate, este:
Definiția 8.3: Fie 𝑛 variabile aleatorii independente, 𝑋1 , 𝑋2 , … , 𝑋𝑛 , repartizate cu mediile,
𝜇1 , 𝜇2 , … , 𝜇𝑛 și dispersiile, 𝜎12 , 𝜎22 , … , 𝜎𝑛2 , în anumite condiții, conduc la:
𝑏
𝑆𝑛 − 𝐸(𝑆𝑛 ) 1 −
𝑢2
lim 𝑃𝑟 (𝑎 ≤ ≤ 𝑏) = ∙ ∫𝑒 2 ∙ 𝑑𝑢 (8.15)
𝑛→∞ √𝑉(𝑆𝑛 ) √2 ∙ 𝜋
𝑎

În ecuația (8.15), prin 𝑆𝑛 s-a notat variabila aleatorie:


𝑛

𝑆𝑛 = ∑ 𝑋𝑖 ,
𝑖=1
𝑛 𝑛

având media 𝐸(𝑆𝑛 ) = ∑ 𝜇𝑖 și dispersia 𝑉(𝑆𝑛 ) = ∑ 𝜎𝑖2 .


𝑖=1 𝑖=1

Referitor la condițiile în care ecuația (8.15) este valabilă, putem afirma că:
 Aproximația este satisfăcătoare, pentru cazul repartițiilor simetrice, chiar dacă 𝑛 ≤ 8;
 În cazul repartițiilor asimetrice se recomandă ca 𝑛 > 8.

8.3.3 REPARTIȚIA LOGNORMALĂ

Definiția 8.3: O variabilă aleatorie continuă 𝑋, este lognormal repartizată cu parametrii 𝜇 și 𝜎,


dacă funcţia densitate de probabilitatea este de forma:
1 1 −1∙(𝑙𝑛𝑥−𝜇)2
𝑓(𝑥) = ∙ ∙𝑒 2 𝜎 ,
𝜎 ∙ √2 ∙ 𝜋 𝑥 (8.16)
pentru 𝑥 > 0, −∞ < 𝜇 < ∞ şi 𝜎 > 0.
și se notează, 𝑋~ℒ𝓃(𝑥, 𝜇, 𝜎).
Repartiția lognormală este o repartiție derivată din modelul statistic normal.
Definiția 8.4: O variabilă aleatorie continuă 𝑋, este lognormal repartizată cu parametrii 𝜇 și
𝜎, dacă logaritmul ei, 𝑙𝑛𝑋, este normal repartizată cu parametrii 𝜇 și 𝜎.
Considerăm, deci, o variabilă aleatorie 𝑌, 𝑌~𝒩(𝑦, 𝜇, 𝜎), astfel încât:
𝑑𝑥
𝑋 = 𝑒 𝑌 ⇒ 𝑌 = 𝑙𝑛𝑋 ş𝑖 𝑑𝑦 =
𝑥
Rezultă:
𝐹𝑋 (𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = 𝑃𝑟(𝑒 𝑌 ≤ 𝑥) = 𝑃𝑟(𝑌 ≤ 𝑙𝑛𝑥) = (8.17)

158
𝑙𝑛𝑥−𝜇
𝜎
1 𝑢2 𝑙𝑛𝑥 − 𝜇
= ∫ 𝑒 − 2 ∙ 𝑑𝑢 = Φ ( ).
√2 ∙ 𝜋 𝜎
−∞

Alura funcției densitate de probabilitate, a repartiției lognormale, pentru diferite valori ale celor
doi parametri, este prezentată în figura 8.5.

1.6
𝑓(𝑥)
1.4 𝜇=0
𝜎 = 0.3
1.2

1 𝜇=0
𝜎 = 1.0 𝜇=0
0.8
𝜎 = 0.5
0.6 𝜇=0
𝜎 = 0.3
0.4 𝜇=0
𝜎 = 0.3
0.2
𝑋
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Figura 8.5 Funcția densitate de probabilitate a repartiției lognormale

Funcția de repartiție, a modelului statistic lognormal, rezultă de forma:


𝑥
1 −1∙(𝑙𝑛𝑢−𝜇)2
1
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = ∫ ∙𝑒 2 𝜎 ∙ 𝑑𝑢 (8.18)
𝜎 ∙ √2 ∙ 𝜋 𝑥
0

Alura funcției de repartiție, pentru diferite valori ale celor doi parametri, este prezentată în
figura 8.6.

1.2
𝐹(𝑥)
1

0.8
𝜇=0 𝜇=0
0.6 𝜎 = 0.3 𝜎 = 0.3
𝜇=0
𝜇=0 𝜎 = 0.3
0.4
𝜎 = 0.3
𝜇=0
0.2 𝜎 = 0.3

𝑋
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Figura 8.6 Funcția de repartiție lognormală

159
Valorile tipice ale variabilei aleatorii lognormal repartizate, [GIB 76], [KEC 93], [WIK 10]:
1. Media teoretică:

1 1 𝑙𝑛𝑥−𝜇 2 1 2
∫ 𝑒 −2∙( )
𝜇𝑋 = 𝐸(𝑋) = 𝜎 ∙ 𝑑𝑥 = 𝑒 𝜇+2∙𝜎 (8.19)
𝜎 ∙ √2 ∙ 𝜋
−∞

2. Mediana:
𝑀𝑒 = 𝑒 𝜇 . (8.20)
3. Moda:
2
𝑀𝑜 = 𝑒 𝜇−𝜎 . (8.21)
4. Dispersia:
1 2
∞ 𝜇+ ∙𝜎2
1 (𝑥 − 𝑒 2 ) 1 𝑙𝑛𝑥−𝜇 2
∙ 𝑒 −2∙( )
𝜎𝑋2 = 𝑉(𝑋) = ∫ 𝜎 ∙ 𝑑𝑥 =
𝜎 ∙ √2 ∙ 𝜋 𝑥 (8.22)
−∞
2 2
= 𝑒 2∙𝜇+𝜎 ∙ (𝑒 𝜎 − 1).
5. Abaterea medie pătratică:
2 2
𝜎𝑋 = √𝑉(𝑋) = √𝑒 2∙𝜇+𝜎 ∙ (𝑒 𝜎 − 1). (8.23)

Observații: a. Pe baza definiției 8.4 și anume, dacă o variabilă aleatorie 𝑋, 𝑋~ℒ𝓃(𝑥, 𝜇, 𝜎),
atunci 𝑙𝑛𝑋~𝒩(𝑙𝑛𝑥, 𝜇, 𝜎), se pot calcula probabilitățile și cuantilele
variabilei aleatorii lognormal repartizate, folosind tabelele IV.1 și IV.2 din
anexa IV, de la finalul cărții.
c. Fie 𝑋1 , 𝑋2 , … , 𝑋𝑛 , 𝑛 variabile aleatorii independente și lognormal
repartizate. Atunci, produsul 𝑌 = ∏𝑛𝑖=1 𝑋𝑖 , este de asemenea o variabilă
aleatorie lognormală:
𝑛 𝑛

𝑌~ℒ𝓃 (𝑦, ∑ 𝜇𝑖 , √∑ 𝜎𝑖2 ).


𝑖=1 𝑖=1

d. Dacă 𝑋~ℒ𝓃(𝑥, 𝜇, 𝜎) atunci, variabila aleatorie 𝑌 = 𝑎 ∙ 𝑋, 𝑎 > 0, este


repartizată:
𝑌~ℒ𝓃(𝑦, 𝑙𝑛𝑎 + 𝜇, 𝜎).

Exemplul 8.5
Fie variabila aleatorie 𝑋, lognormal repartizată, având 𝜇 = 5 și 𝜎 = 3.
Să se determine:
a. 𝑃𝑟(𝑋 ≤ 500); b. 𝑃𝑟(𝑋 > 1000);
c. 𝑃𝑟(300 ≤ 𝑋 ≤ 9000); d. 𝑥0.50 ;
e. Media și dispersia variabilei aleatorii, 𝑋;

160
𝑙𝑛500−5
Soluție: a. 𝑃𝑟(𝑋 ≤ 500) = Φ ( ) = Φ(0.405) = 0.6554217
3
𝑙𝑛1000−5
b. 𝑃𝑟(𝑋 > 1000) = 1 − 𝑃𝑟(𝑋 ≤ 1000) = 1 − Φ ( )=
3
= 1 − Φ(0.636) = 1 − 0.7356527 = 0.2643473.
𝑙𝑛9000−5 𝑙𝑛300−5
c. 𝑃𝑟(300 ≤ 𝑋 ≤ 9000) = Φ ( ) − 1 + Φ( )=
3 3
= Φ(1.368) − 1 + Φ(0.234) = 0.9146 − 1 + 0.5909 = 0.5056.
d. 𝑧0.50 = 0 ⇒ 𝑥𝑝 = 𝑒 𝜇+𝑧𝑝 ∙𝜎 = 𝑒 5+0∙3 = 148.4131.
1 2 9
e. 𝐸(𝑋) = 𝑒 𝜇+2∙𝜎 = 𝑒 5+2 = 13364.73.
2 2
𝑉(𝑋) = 𝑒 2∙𝜇+𝜎 ∙ (𝑒 𝜎 − 1) = 𝑒 2∙5+9 ∙ (𝑒 9 − 1) = 1446078581990.51.

Domeniile de utilizare ale repartiției lognormale:


 Repartiția lognormală se utilizează cu bune rezultate în modelarea unei game largi de
procese legate îndeosebi de uzura materialelor, de solicitările de durată, de studiul
durabilității materialelor;
 Modelul lognormal se utilizează în domeniul poluării atmosferei, pentru descrierea
concentrării unor particule poluante în diferite zone industriale;
 Modelarea concentrației unor elemente din scoarța terestră și a radioactivității lor;
 Caracterizează rezistența la rupere a materialelor;
 Modelarea unor fenomene biologice;
 Perioada de incubație (de la infectare până la debut) a bolilor infecțioase;
 Modelarea durabilității unor tranzistori;
 Modelarea duratei de viață, a produselor, după solicitări extreme;
 Analize economice asupra distribuției veniturilor și a altor indicatori economici;
 Modelarea cifrelor de afaceri ale întreprinzătorilor.
 Caracterizarea unor structuri în domeniul tehnologiei alimentare și cel al proceselor din
domeniul ingineriei alimentare.

8.3.4 REPARTIȚIA UNIFORMĂ CONTINUĂ

Definiția 8.5: O variabilă aleatorie continuă 𝑋, este uniform repartizată cu parametrii 𝑎 și


𝑏, dacă funcţia densitate de probabilitatea este de forma:
1
𝑓(𝑥) = , pentru 𝑎, 𝑏 ∈ ℛ, 𝑏 > 𝑎 și 𝑋 ∈ [𝑎, 𝑏]. (8.24)
𝑏−𝑎
și se notează, 𝑋~𝒰𝑐(𝑥, 𝑎, 𝑏).
Alura funcției densitate de probabilitate, a repartiției uniforme, pentru 𝑎 = 2 și 𝑏 = 6, este
prezentată în figura 8.7. Se constată că cei doi parametri ai repartiției sunt:
- 𝑎, reprezintă un parametru de poziționare;
- 𝑏, reprezintă un parametru de scală;
- 𝑏 − 𝑎, reprezintă amplitudinea domeniului de definiție al variabilei aleatorii 𝑋.

161
Repartiția uniformă continuă, datorită formei sale, mai poate fi întâlnită și sub denumirea de
repartiția dreptunghiulară sau rectangulară.
0.3
𝑓(𝑥)
0.25

0.2

0.15

0.1

0.05
𝑋
0
0 1 2 3 4 5 6 7 8

Figura 8.7 Funcția densitate de probabilitate a repartiției uniforme continue

Funcția de repartiție, a modelului statistic uniform continuu, rezultă de forma:


𝑥
𝑑𝑢 𝑥−𝑎
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = ∫ = ,
𝑏−𝑎 𝑏−𝑎 (8.25)
𝑎

pentru 𝑎, 𝑏 ∈ ℛ, 𝑏 > 𝑎 și 𝑋 ∈ [𝑎, 𝑏].


Într-adevăr:
𝑥
1 𝑥 𝑢=𝑥 𝑥 − 𝑎
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = ∫ ∙ 𝑑𝑢 = | = .
𝑏−𝑎 𝑏 − 𝑎 𝑢=𝑎 𝑏 − 𝑎
𝑎

Reprezentată grafic, funcția de repartiție, a modelului uniform continuu, are alura din figura
8.8, dacă 𝑎 = 2 și 𝑏 = 6.

1.2
𝐹(𝑥)
1

0.8

0.6

0.4

0.2

𝑋
0
0 1 2 3 4 5 6 7 8

Figura 8.8 Funcția de repartiție uniformă continuă

162
Valorile tipice ale variabilei aleatorii uniforme continue, [GIB 76], [KEC 94], [WIK 10]:
1. Media teoretică:
𝑏
1 𝑎+𝑏
𝜇𝑋 = 𝐸(𝑋) = ∙ ∫ 𝑥 ∙ 𝑑𝑥 = . (8.26)
𝑏−𝑎 2
𝑎

2. Mediana:
𝑎+𝑏
𝑀𝑒 = . (8.27)
2
3. Moda:
𝑎 ≤ 𝑀𝑜 ≤ 𝑏. (8.28)
4. Dispersia:
𝑏
𝑎 + 𝑏 2 𝑑𝑥 (𝑏 − 𝑎)2
𝜎𝑋2 = 𝑉(𝑋) = ∫ (𝑥 − ) ∙ = . (8.29)
2 𝑏−𝑎 12
𝑎

5. Abaterea medie pătratică:


𝑏−𝑎
𝜎𝑋 = √𝑉(𝑋) = . (8.30)
2 ∙ √3
Observații: a. Probabilitatea unei variabile aleatorii, 𝑋, uniform repartizate pe un interval
[𝑎, 𝑏], 𝑋  𝑈𝑐(𝑥, 𝑎, 𝑏), de a lua valori într-un interval [𝑐, 𝑑]  [𝑎, 𝑏], este
direct proporțională cu lungimea relativă a intervalului:
𝑑
𝑑𝑥 𝑑−𝑐
𝑃𝑟(𝑐 ≤ 𝑋 ≤ 𝑑) = ∫ = .
𝑏−𝑎 𝑏−𝑎
𝑐

b. Valorile funcției de repartiție, 𝐹(𝑥), a unei variabile aleatorii 𝑋, sunt


uniform repartizate pe intervalul [0, 1]. Această proprietate stă la baza
tehnicilor numerice de simulare Monte-Carlo.
c. Dacă o variabilă aleatorie 𝑈 urmează o repartiţie uniformă în intervalul
[0,1], iar 𝐹(𝑥) este o funcţie de repartiţie atunci variabila aleatorie 𝑋 =
𝐹 −1 (𝑈) are funcția de repartiție 𝐹(𝑥).
Într-adevăr:
𝑥 𝑥

𝐹𝑈 (𝑥) = ∫ 𝑓(𝑢)𝑑𝑢 = ∫ 1 ∙ 𝑑𝑥 = 𝑥 .
−∞ 0
Rezultă:
𝐹𝑋 (𝑥) = 𝑃𝑟(𝑋 ≤ 𝑥) = 𝑃𝑟[𝐹 −1 (𝑈) ≤ 𝑥] = 𝑃𝑟[𝑈 ≤ 𝐹𝑋 (𝑥)] = 𝐹𝑋 (𝑥).
d. Generarea valorilor unei variabile aleatorii 𝑋, provenind dintr-o repartiție
𝐹(𝑥), se realizează prin intermediul funcţiei inverse de repartiţie şi prin
utilizarea numerelor aleatorii uniform repartizate în intervalul [0, 1],
𝑈𝒰𝒸(𝑢, 0,1), vezi figura 8.9:
𝑥𝑖 = 𝐹 −1 [𝒰𝒸(𝑢𝑖 , 0,1)].

163
𝐹(𝑥)
1.0

𝑢𝑖

𝑋
−1 [𝒰𝒸(𝑢
𝑥𝑖 = 𝐹 𝑖 , 0,1)]

Figura 8.9 Generarea valorilor unei variabile aleatorii 𝑋

Exemplul 8.6
Considerăm o variabilă aleatorie 𝑋, repartizată cu funcția densitate de
probabilitate:
1
𝑓(𝑥) = , pentru 0 ≤ 𝑥 ≤ 100.
100
Să se determine:
a. 𝑃𝑟(𝑋 > 60);
b. 𝑃𝑟(20 ≤ 𝑋 ≤ 40).
Soluţie: 𝑎 = 0 și 𝑏 = 100.
60 − 0
a. 𝑃𝑟(𝑋 > 60) = 1 − 𝐹(60) = 1 − = 1 − 0.6 = 0.4;
100 − 0
40 20
b. 𝑃𝑟(20 ≤ 𝑋 ≤ 40) = 𝐹(40) − 𝐹(20) = − = 0.2.
100 100

Domeniile de utilizare ale repartiției uniforme:


 Modelarea evenimentelor a căror probabilitate de apariție, în timp, este direct
proporțională cu lungimea intervalului de timp, sau a căror probabilitate de apariție este
constantă de-a lungul unui interval;
 Studiul comportării, în timp, a sistemelor complexe, atunci când comportarea elementelor
componente este cunoscută;
 Tehnicile Monte-Carlo, pentru generarea aleatorie a eșantioanelor provenind din repartiții
statistice complet specificate;
 Generarea aleatorie a valorilor unei variabile aleatorii, provenind dintr-o repartiție
complet specificată, prin utilizarea funcției inverse de repartiție;

 Definiți funcția densitate de probabilitate și funcția de repartiție a


repartiției normale.
 Descrieți influența pe care o au cei doi parametri, 𝜇 și 𝜎, o au asupra
repartiției normale.

164
 Precizați care sunt ecuațiile pentru determinarea mediei teoretice,
dispersiei și abaterii medii pătratice a repartiției normale.
 Definiți variabila normală normată și definiți funcția densitate de
probabilitate, funcția de repartiție a repartiției, valoarea mediei și
valoarea dispersiei, în acest caz.
 Deduceți expresia regulii celor șase sigma.
 Enunțați cele două forme ale teoremei limită centrală.
 Definiți funcția densitate de probabilitate și funcția de repartiție a
repartiției lognormale.
 Precizați legătura care există între repartiția lognormală și repartiția
normală.
 Precizați care sunt ecuațiile pentru determinarea mediei teoretice,
dispersiei și abaterii medii pătratice a repartiției lognormale.
 Definiți funcția densitate de probabilitate și funcția de repartiție a
repartiției uniforme continue.
 Precizați care sunt ecuațiile pentru determinarea mediei teoretice,
dispersiei și abaterii medii pătratice a repartiției uniforme continue.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Repartiția normală;  Repartiția lognormală;


 Repartiția normală normată;  Repartiția uniformă continuă.
 Teorema limită centrală;

Rezumat
În prima parte a acestei UI este prezentată repartiția normală. Sunt descrise
cele două forme ale acestei repartiții: repartiția normală și repartiția normală
normată.
Modelul statistic al repartiției normale este definit sub forma: funcției densitate
de probabilitate, funcției de repartiție, precum și expresiile principalelor valori
tipice.
În continuare, s-a definit modelul repartiției lognormale, ca și caz particular al
repartiției normale. De asemenea, sunt prezentate pentru această repartiție
funcția densitate de probabilitate, funcția de repartiție precum și expresiile
principalelor valori tipice.

165
La finalul prezentei UI este prezentată repartiția uniformă continuă. Acest
model statistic este definit prin: funcția densitate de probabilitate, funcția de
repartiție precum și expresiile principalelor valori tipice.
În continuare, în următoarele UI, vor fi abordate principalele elemente
ale statisticii descriptive și ale statisticii inferențiale.

Test de autoevaluare a cunoștințelor


P.8.1 Fie 𝑍, o variabilă aleatorie normal repartizată cu 𝜇 = 0 și 𝜎 = 1. Să se
determine următoarele probabilități:
a. 𝑃𝑟(𝑍 < 1.32); b. 𝑃𝑟(𝑍 ≤ 3.0);
c. 𝑃𝑟(𝑍 > 1.45); d. 𝑃𝑟(𝑍 ≥ −2.15);
e. 𝑃𝑟(−2.34 < 𝑍 ≤ 1.76); f. 𝑃𝑟(−2.0 < 𝑍 ≤ 2.0);
R: a. 𝑃𝑟(𝑍 < 1.32) = 0.9065825
b. 𝑃𝑟(𝑍 ≤ 3.0) = 0.9986501
c. 𝑃𝑟(𝑍 > 1.45) = 1 − Φ(1.45) = 0.0735293
d. 𝑃𝑟(𝑍 ≥ −2.15) = 1 − Φ(2.15) = 0.0157776
e. 𝑃𝑟(−2.34 < 𝑍 ≤ 1.76) = 0.9511542
f. 𝑃𝑟(−2.0 < 𝑍 ≤ 2.0) = 0.958941
P.8.2 Fie 𝑋, o variabilă aleatorie normal repartizată cu 𝜇 = 10 și 𝜎 = 2. Să se
determine următoarele probabilități:
a. 𝑃𝑟(𝑋 < 14); b. 𝑃𝑟(𝑋 > 8);
c. 𝑃𝑟(8 < 𝑋 ≤ 12); d. 𝑃𝑟(𝑋 ≥ 16);
e. 𝑃𝑟(4 < 𝑍 ≤ 16).
R: 14−10
a. 𝑃𝑟(𝑋 < 14) = Φ ( ) = Φ(2) = 0.9772499
2
8−10
b. 𝑃𝑟(𝑋 > 8) = 1 − Φ ( 2 ) = 1 − Φ(−1) = 0.8413447
12−10 8−10
c. 𝑃𝑟(8 < 𝑋 ≤ 12) = Φ ( 2 ) − Φ ( 2 ) = 0.6826894
16 − 10
𝑑. 𝑃𝑟(𝑋 ≥ 16) = 1 − Φ ( ) = 1 − Φ(3) = 1 − 0.9986501 =
2
= 0.0013499
16 − 10 4 − 10
𝑒. 𝑃𝑟(4 < 𝑍 ≤ 16) = Φ ( ) − Φ( ) = 0.9973002
2 2
P.8.3 Fie 𝑋, o variabilă aleatorie normal repartizată cu 𝜇 = 8 și 𝜎 = 2. Să se determine
valoarea, x, a variabilei aleatorii, pentru care:
a. 𝑃𝑟(𝑋 < 𝑥) = 0.5; b. 𝑃𝑟(𝑋 < 𝑥) = 0.95;
c. 𝑃𝑟(𝑋 > 𝑥) = 0.99; d. 𝑃𝑟(𝑋 ≥ 𝑥) = 0.6.
a. 𝑥 = 0 ∙ 2 + 8 = 8
R: b. 𝑥 = 1.65 ∙ 2 + 8 = 16.25
c. 𝑥 = −2.33 ∙ 2 + 8 = 3.34
d. 𝑥 = −1.75 ∙ 2 + 8 = 4.5
P.8.4 Un studiu statistic efectuat în cadrul unei universități a condus la concluzia că
greutatea corporală a studenților este normal repartizată cu media de 75 kg și

166
abaterea medie pătratică egală cu 5 kg. Să se calculeze:
a. Probabilitatea de a întâlni studenți cu o greutate mai mică de 60 kg.
b. Probabilitatea de a întâlni studenți cu o greutate mai mică de 85 kg.
c. Probabilitatea de a întâlni studenți cu o greutate mai mare de 80 kg.
d. Probabilitatea de a întâlni studenți cu o greutate cuprinsă între 70 kg şi
90 kg.
e. Probabilitatea de a întâlni studenți cu o greutate mai mică de 65 kg şi mai
mare de 85 kg.
R: 60−75
a. 𝑃𝑟(𝑋 < 60) = Φ ( 5
) = Φ(−3) = 0.0013499
85−75
b. 𝑃𝑟(𝑋 < 85) = Φ ( 5 ) = Φ(2) = 0.9772499
80−75
c. 𝑃𝑟(𝑋 > 80) = 1 − Φ ( 5 ) = 1 − Φ(1) = 0.1586553
90−75 70−75
d. 𝑃𝑟(70 < 𝑋 < 90) = Φ ( 5 ) − Φ ( 5 ) = 0.8399948
65−75 85−75
e. 𝑃𝑟(65 > 𝑋 > 85) = Φ ( )+ 1 − Φ( ) = 0.0455002
5 5
P.8.5 Fie variabila aleatorie 𝑋, lognormal repartizată, având 𝜇 = 6 și 𝜎 = 2. Să se
determine:
a. 𝑃𝑟(𝑋 ≤ 200); b. 𝑃𝑟(𝑋 > 100);
c. 𝑃𝑟(400 ≤ 𝑋 ≤ 1500);
𝑙𝑛200−6
R: a. 𝑃𝑟(𝑋 ≤ 200) = Φ ( 2
) = 0.3631693
𝑙𝑛100−6
b. 𝑃𝑟(𝑋 > 100) = 1 − 𝑃𝑟(𝑋 ≤ 100) = 1 − Φ ( ) = 0.7580363
2
𝑙𝑛1500−6 𝑙𝑛300−6
c. 𝑃𝑟(200 ≤ 𝑋 ≤ 1000) = Φ ( )− 1+ Φ( ) = 0.1825362
2 2
P.8.6 Fie variabila aleatorie 𝑋, lognormal repartizată, având 𝜇 = 6 și 𝜎 = 2. Să se
determine valoarea, 𝑥, a variabilei aleatorii, pentru care:
a. 𝑃𝑟(𝑋 < 𝑥) = 0.05; b. 𝑃𝑟(𝑋 < 𝑥) = 0.95;
c. 𝑃𝑟(𝑋 > 𝑥) = 0.90; d. 𝑃𝑟(𝑋 ≥ 𝑥) = 0.6.
R: 𝑎. 𝑧0.05 = −1.64 ⇒ 𝑥𝑝 = 𝑒 𝜇+𝑧𝑝 ∙𝜎 = 𝑒 6−1.64∙2 = 15.18.
𝑏. 𝑧0.95 = 1.65 ⇒ 𝑥𝑝 = 𝑒 𝜇+𝑧𝑝 ∙𝜎 = 𝑒 6+1.65∙2 = 10938.021.
c. 𝑧0.10 = −1.28 ⇒ 𝑥𝑝 = 𝑒 𝜇+𝑧𝑝 ∙𝜎 = 𝑒 6−1.28∙2 = 31.187.
d. 𝑧0.40 = −0.25 ⇒ 𝑥𝑝 = 𝑒 𝜇+𝑧𝑝 ∙𝜎 = 𝑒 6−0.25∙2 = 244.692.
P.8.7 Considerăm variabila aleatorie continuă X, uniform repartizată pe intervalul
[2,8]. Să se calculeze:
a. 𝐸(𝑋) și 𝑉(𝑋); b. 𝑃𝑟(𝑋 < 3.5);
c. 𝑃𝑟(𝑋 ≤ 5.5); d. 𝑃𝑟(2.5 ≤ 𝑋 < 6.5).
R: 𝑎 = 2, 𝑏 = 8
2+8 (8−2)2
36
a. 𝐸(𝑋) = 2
= 5, 𝑉(𝑋) =
12
= 12 = 3
3.5−2 1.5
b. 𝑃𝑟(𝑋 < 3.5) = 𝐹(3.5) = 8−2 = 6 = 0.25
5.5−2 3.5
c. 𝑃𝑟(𝑋 ≤ 5.5) = 𝐹(5.5) = 8−2 = 6 = 0.583
6.5−2 2.5−2 4
d. 𝑃𝑟(2.5 ≤ 𝑋 < 6.5) = 𝐹(6.5) − 𝐹(2.5) = 8−2 − 8−2 = 6 = 0.666

167
P.8.8 Considerăm variabila aleatorie continuă 𝑋, uniform repartizată pe intervalul [-
2,2]. Să se determine expresia funcției de repartiție și valoarea 𝑥, a variabilei
aleatorii pentru care:
𝑃𝑟(−𝑥 ≤ 𝑋 ≤ 𝑥) = 0.96.
R: 𝑃𝑟(−𝑥 ≤ 𝑋 ≤ 𝑥) = 0.96.
𝑎 = −2, 𝑏 = 2
𝑥+2 𝑥+2
𝐹(𝑥) = =
2+2 4
Datorită simetriei:
𝑃𝑟(𝑋 ≤ 𝑥) = 0.98 ⇒ 𝑥0.98 = 𝑥𝑝 = −2 + 0.98 ∙ (2 + 2) = 1.92
⇒ 𝑃𝑟(−1.92 ≤ 𝑋 ≤ 1.92) = 𝐹(1.92) − 𝐹(−1.92) = 0.96.
P.8.9 Considerăm variabila aleatorie continuă 𝑍, normal repartizată cu media 0 și
dispersia 1. Să se determine valoarea variabilei aleatorii 𝑧1 , pentru care
𝑃𝑟(𝑍 ≥ 𝑧1 ) = 0.84.
R: 𝑃𝑟(𝑍 ≥ 𝑧1 ) = 1 − 𝐹(𝑧1 ) = 0.84 ⇒ 𝐹(𝑧1 ) = 0.16
𝑧1 = 𝑧0.16 = −0.99.
P.8.10 Considerăm variabila aleatorie continuă 𝑋, normal repartizată media 5 și
abaterea medie pătratică 2. Să se determine probabilitatea:
𝑃𝑟(𝑋 > 8) ?
R: 8−5
𝑃𝑟(𝑋 > 8) = 1 − 𝐹(8) = 1 − Φ ( ) = 0.0669.
2

168
Unitatea de învățare 9.

Cuprins
9.1. Introducere ........................................................................................................... 169
9.2. Competențe .......................................................................................................... 169
9.3. Statistica............................................................................................................... 170
9.4. Noțiuni statistice fundamentale ........................................................................... 172
9.5. Metode grafice pentru descrierea datelor calitative ........................................... 176
9.6. Metode grafice pentru descrierea datelor cantitative ......................................... 178
9.7. Rezumat ............................................................................................................... 184
9.8. Test de evaluare ................................................................................................... 184

9.1. Introducere
În cadrul prezentei unități de învățare se definește, la început, noțiunea de
statistică și cele două părți distincte ale ei, statistica descriptivă și cea inferențială
precum și metodologia statisticii. Apoi, sunt prezentate, definite și clasificate
noțiunile statistice fundamentale: populația statistică, unitatea statistică,
caracteristică statistică, valoare observată, eșantionul și inferența statistică.
În continuare, sunt descrise câteva metode grafice pentru descrierea datelor
calitative și cantitative: graficele cu bare, graficele circulare, graficele liniare,
histograma, diagrama cu bare și poligonul frecvențelor cumulate. Cu această
ocazie sunt prezentate și două noțiuni fundamentale utilizate în statistică:
frecvența absolută și frecvența relativă.

9.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să utilizeze noțiunile
statistice fundamentale pentru explicarea și interpretarea unor rezultate teoretice
sau procese specifice domeniului.
De asemenea, va fi capabil să utilizeze adecvat metode de reprezentare a datelor
statistice pentru analiza și aprecierea calitativă și cantitativă a unor fenomene de
masă, precum și pentru prelucrarea și interpretarea rezultatele proceselor
caracteristice domeniului.
Aceste metode specifice statisticii descriptive permit, de asemenea, elaborarea de
modele și proiecte profesionale prin selectarea și utilizarea unor principii, metode
și soluții consacrate din statistică.

Durata medie de parcurgere a acestei unități de învățare este de 3 ore.

169
9.3 STATISTICA

Atunci când omul nu a mai putut intui a început să măsoare. Măsurătorile și observațiile au
devenit prima treaptă spre înțelegerea legilor naturii. Dar, în acest fel, omul nu mai poate să
cunoască direct realitatea, el poate numai să o aproximeze succesiv prin modele fizice si apoi
prin modele matematice. Dar aceste modele nu descriu exact realitatea. Ele o aproximează și
apar așa numitele erori. Unele erori sunt previzibile, altele însă sunt întâmplătoare (aleatorii).
Acest ultim tip de erori (aleatorii) au si ele legile lor de manifestare. Apar deci, fenomenele
aleatorii descrise prin variabilele aleatorii.
Teoria probabilităților pleacă de la ipoteza că se cunosc exact aceste variabile aleatorii (prin
funcțiile de probabilitate, funcțiile de repartiție, funcțiile caracteristice, etc.). Statistica pleacă
de la măsurătorile brute și caută să regăsească modelul probabilist, teoretic exact, care se află
în spatele acestor măsurători.

Exemplul 9.1
Pentru determinarea expresiei ale funcției de probabilitate a repartiției
hipergeometrice, raționamentul matematic a pornit de la o urnă ce conține un
număr de N bile, din care a sunt bile albe și b sunt bile negre. Apoi, s-a stabilit
semnificația variabilei aleatorii binomial repartizate: se extrag bile din urnă,
una câte una, fiecare bilă nu este reintrodusă în urnă după constatarea culorii.
Valorile variabilei aleatorii astfel obținute reprezintă evenimentele ca din n bile
extrase, k să fie de culoare albă.
Soluție: În cazul utilizării statisticii se pornește de la o urnă ce cuprinde un număr
oarecare de bile, albe și negre, dar configurația exactă nu se cunoaște. Prin
extrageri succesive de 𝑛 bile, fără revenire și prelucrarea statistică a
rezultatelor obținute se încearcă determinarea, cât mai exactă a configurației
inițiale a urnei, precum și expresia matematică a modelului statistic ce poate
fi utilizat în astfel de situații.

Partea empirică a statisticii care se ocupă de prelucrarea datelor obținute prin măsurători sau
observații se numește statistică descriptivă. Aparatul matematic al teoriei probabilităților, pus
în funcțiune pentru a studia și interpreta aceste date, în dorința de a specifica modelul
probabilistic real, care guvernează fenomenul măsurat sau observat, formează inferența
statistică. După ce cercetătorul capătă informații suficient de clare despre fenomenul
probabilistic studiat, el va trebui să acționeze optim potrivit acestor informații. Apare deci teoria
deciziei statistice, care este o ramură importantă a statisticii.
Definiția 9.1: Statistica este disciplina care se ocupă cu culegerea, înregistrarea, gruparea,
analiza și interpretarea datelor referitoare la un anumit fenomen precum şi cu
formularea unor previziuni privind comportarea viitoare a acestuia.
Statistica, de asemenea, este alcătuită din două părți distincte:

170
 Statistica descriptivă, având ca scop principal și specific sintetizarea și structurarea, într-
o manieră cât mai directă și mai intuitivă, datele de observație și informația conținută în
acestea. În acest sens utilizează, de regulă, tabele, grafice, indicatori numerici etc.
 Statistica inferențială, căreia îi revine rolul de a extinde rezultatele obținute pe baza
datelor din eșantion la nivelul populației generale și de a confirma sau invalida ipotezele
emise apriori, formulate după faza exploratorie.
Urmărind etapele oricărui proces de cunoaștere, pentru rezolvarea problemelor care fac obiectul
său de studiu, statistica, ca orice știință, și-a elaborat procedee, tehnici și metode speciale de
cercetare, cum sunt cele de investigare statistică a fenomenelor, de observare fenomenelor de
masă, de centralizare și grupare, modele de analiză și interpretare statistică.
Toate aceste elemente formează metoda sau metodologia statisticii. Metoda utilizată în
cercetarea statistică presupune parcurgerea următoarelor etape, vezi fig. 9.1:
 observarea statistică — etapă în care se culeg date și informații statistice de la unitățile
colectivității, pentru toate caracteristicile urmărite;
Definiția 9.2: Observarea statistică reprezintă acțiunea de culegere, de la unitățile statistice,
a informațiilor referitoare la caracteristicile urmărite, după criterii riguros
stabilite.

 Identificarea și descrierea  Sintetizarea și  Adoptarea unui model


problemei studiate; structurarea informației statistic;
 Identificarea factorilor de influență obținute;  Estimarea punctuală a
 Delimitarea populației și a  Reprezentarea datelor de parametrilor modelului;
caracteristicii statistice; eșantionaj;  Testarea concordanței;
 Stabilirea volumului de eșantionaj  Calculul principalilor  Inferențe statistice privind
și a metodei de prelevare; parametri și indicatori parametrii și indicatorii
 Prelevarea datelor de eșantionaj statistici. statistici.

1. 2. 3.
ANALIZA ŞI
OBSERVAREA PRELUCRAREA INTERPRETAREA
STATISTICĂ STATISTICĂ REZULTATELOR

METODA STATISTICII

Figura 9.1: Metoda utilizată în cercetarea statistică

Observarea se efectuează după un plan riguros, care trebuie să cuprindă:


 scopul observării;
 stabilirea caracteristicilor ce vor fi înregistrate;
 alegerea formularelor de înregistrare;

171
 delimitarea timpului și locului observării;
 stabilirea măsurilor organizatorice;
 prelevarea datelor de eșantionaj.
Pentru a putea asigura corectitudinea datelor, etapa propriu-zisă de observare statistică,
trebuie să fie precedată de:
1. Identificarea și descrierea clară și concisă a problemei studiate.
2. Identificarea, cel puțin cu titlu de încercare, a factorilor importanți care afectează
această problemă, sau care poate juca un rol în soluție sale.
3. Delimitarea populației și identificarea caracteristicii /caracteristicilor statistice de
studiat.
4. Stabilirea volumului de eșantion și a metodei de prelevare a datelor de eșantionaj.
 prelucrarea statistică, etapă în care datele sunt sistematizate, reprezentate grafic și sunt
calculați principalii indicatorii statistici ce caracterizează fenomenul studiat;
 analiza și interpretarea rezultatelor, etapă în care sunt alese modele statistice, estimați
parametrii acestor modele, verificate ipotezele, formulate concluzii sau recomandări
bazate pe soluția problemei și fundamentate procesele decizionale.

9.4 NOȚIUNI STATISTICE FUNDAMENTALE

Rigoarea care trebuie să caracterizeze studiul din cadrul unei științe este condiționată de
aplicarea într-o manieră unitară a procedeelor de cercetare. Îndeplinirea acestei condiții impune
ca toate conceptele utilizate în cercetare să fie definite în mod precis. În ceea ce privește știința
statisticii, cercetarea din cadrul acesteia are la bază mai multe concepte:
a. populația statistică;
b. unitatea statistică;
c. caracteristică statistică;
d. valoare observată;
e. eșantion;
f. inferență statistică.
Populația statistică (numită și colectivitate statistică) este reprezentată de o mulțime de
elemente studiate cu scopul de a cerceta starea la un moment dat, sau evoluția în timp a unuia
sau mai multor fenomene. Populațiile statistice pot îmbrăca diferite forme, în funcție de
scopurile și modalitățile de cercetare a fenomenelor colective. Atunci când se studiază starea
unui fenomen la un moment dat, elementele populației statistice reflectă manifestarea din acel
moment a fenomenului (de exemplu, dacă se analizează salariul mediu, într-o anumită lună,
pentru o ramură a economiei naționale, populația statistică este formată din ansamblul
salariaților care lucrează, în luna respectivă, în acea ramură). În schimb, dacă se cercetează
evoluția în timp a unui fenomen, elementele populației statistice trebuie să reflecte dinamica
manifestării fenomenului în perioada de timp studiată (de exemplu, pentru a se analiza evoluția
unei dimensiuni a unei piese, pe parcursul unei serii de fabricație, populația statistică poate fi

172
formată din valorile cotei respective, înregistrate pe toată durata de fabricație, a seriei
respective).
Definiția 9.3: Totalitatea indivizilor care se iau în considerare poartă numele de populație.
De asemenea, în cazul unei variabile aleatorii, se consideră că repartiția de probabilitate a
acesteia definește populația variabilei.
O unitate statistică este o componentă a mulțimii care formează populația statistică. În funcție
de metodele și scopurile cercetării, o unitate statistică poate corespunde unui element indivizibil
al populației statistice, fiind numită, în acest caz, unitate simplă, sau poate consta dintr-un grup
de astfel de elemente, situație în care este numită unitate compusă. De exemplu, dacă populația
statistică este reprezentată de ansamblul studenților de la o anumită specializare, pot fi stabilite
unități simple, fiecare dintre acestea corespunzând unui student, sau pot fi definite unități
compuse, constând în grupe, ani de studiu etc.
Definiția 9.4: Entitate (unitate statistică sau individ) reprezintă ceea ce poate fi descris şi
considerat în mod individual.
Numărul total al unităților statistice care compun populația se notează cu: 𝑁.
Caracteristicile statistice reprezintă însușirile prin care sunt descrise, în cadrul unei cercetări,
unitățile statistice.
Definiția 9.5: Caracteristica statistică reprezintă proprietatea care permite identificarea sau
diferențierea entităților unei populații date.
În raport cu modul de descriere, pot fi delimitate două tipuri de caracteristici statistice:
 caracteristici calitative, care descriu unitățile statistice prin atribute;
 caracteristici cantitative, care descriu unitățile statistice prin variabile, sau prin valori
numerice.
Caracteristicile statistice pot fi diferențiate după mai multe criterii si anume:
1. După conținut, pot fi:
 de timp: exprimă apartenența unității în timp;
 de spațiu;
 atributive: exprima trăsături specifice unităților (vârsta, sex, profit, fonduri fixe).
2. După natura variației, pot fi:
 Cu variație continuă, care pot lua orice valoare din scala lor de variație (exemple:
înălțime, greutate, cifră de afaceri etc.);
 Cu variație discretă, care nu pot lua decât anumite valori pe scala lor de variație, de
regulă numere întregi (exemple: numărul de copii dintr-o familie, numărul de sate
dintr-un județ etc.).
3. După numărul de caracteristici (variabile) la care se referă aceste date, distingem:
 Caracteristici unidimensionale (univariate) sunt cele care se referă la o singură
variabilă statistică. Avem deci o singură informație pentru fiecare unitate statistică.
 Caracteristici multidimensionale (multivariate), sunt cele care se referă la două sau
mai multe variabile statistice.

173
Definiția 9.6: Valoare observată reprezintă valoarea unei caracteristici, obținută ca rezultat
al unei singure observații.
Definiția 9.7: Totalitatea valorilor diferite ale unei caracteristici, sau intervalul în care sunt
conținute acestea (domeniu de valori observate ale variabilei), se numește
scală.
Calitatea valorilor observate este un factor important care condiționează calitatea informațiilor
ce rezultă dintr-un studiu statistic, realismul cunoașterii și eficienta deciziilor de acțiune.
Prin urmare, veridicitatea (autenticitatea) valorilor observate printr-o metodă oarecare
(specifică cercetării) – concordanta acestora cu datele reale ale fenomenelor investigate –
constituie un obiectiv fundamental („țintă”) a oricărei metode de înregistrare (observare)
statistică. Acest obiectiv este, însă, greu de realizat deoarece chiar și prin respectarea tuturor
principiilor științifice de pregătire și de organizare a colectării datelor nu se obțin întotdeauna
date „absolut reale”, în concordanță cu manifestările reale ale fenomenului investigat.
Aceasta înseamnă ca în observarea statistica se înregistrează și erori.
În general, prin eroare de înregistrare (observare) statistică, exprimată absolut sau relativ, se
înțelege diferența dintre rezultatul obținut prin înregistrare si mărimea reala a caracteristicilor
(variabilelor) observate.
Aceste diferențe (erori) sunt determinate de volumul înregistrărilor, de precizia mijloacelor de
măsurare a datelor provenite din diverse surse (cunoscute sau necunoscute).
Sursele de erori se regăsesc și în activitățile care vizează înregistrarea și metodele de
înregistrare. Dintre acestea exemplificam:
 Mobilitatea (inconstanța) în timp a unității observate (determinată de factori conduc la
răspunsuri inexacte sau aproximative);
 Puterea umană limitată de înregistrare (observare), de exemplu, perceperea eronată a
răspunsurilor, transcrierea greșită a acestora etc.;
 Neclaritatea definirii unităților de observare și a variabilelor de înregistrat;
 Imperfecțiunea metodelor și mijloacelor de observare sau de înregistrare;
 Factori subiectivi etc.
Exemplele de mai sus sugerează faptul că sunt factori obiectivi și subiectivi care conduc la erori
de înregistrare întâmplătoare, sistematice și de asemenea, la greșeli de înregistrare.
Principale tipuri de erori statistice în etapa de observare sunt:
- Erorile întâmplătoare sunt cele care provoacă abateri în sensul măririi sau micșorării
nivelului real al fenomenului. Acestea pot surveni din neatenție și nu au un caracter
premeditat. În cazul populațiilor mari, acest tip de erori au un caracter redus.
- Erorile sistematice sunt cele care produc abateri semnificative, de regulă într-un singur
sens, de la realitatea observată. Sunt generate din neînțelegere sau din rea credință.
Mărimea absolută a acestor erori este necunoscută, deoarece necunoscută este valoarea
adevărată a valorilor observate.

174
- Erorile grosiere (greșelile) se datorează fie lipsei de experiență, fie incompetentei, fie
altor cauze. Diferența esențială dintre erori și greșeli este aceea că acestea din urmă pot fi
depistată și eliminată. Acest lucru presupune analiza sistematică (aprofundată) a datelor
înregistrate și un studiu detaliat a cazurilor în care valorile observate depășesc limitele
admisibile.
Fără a fi o regulă generală, prevenirea erorilor se poate realiza prin acțiuni suplimentare de
genul:
- testării tehnicilor și formularelor de înregistrare;
- selectarea optimă și pregătirea profesională a persoanelor care efectuează înregistrarea;
- inspectarea (controlul), pe teren, a înregistrărilor de date;
- pregătirea psihologica a persoanelor care efectuează înregistrarea;
- popularizarea scopului înregistrării și formarea convingerilor pentru exprimarea datelor
reale, etc.
În multe situații practice, fenomenul pe care îl analizăm poate fi caracterizat printr-o mulțime
de date care fie sunt greu de obținut, fie obținerea acestor date costă prea mult sau durează un
timp prea îndelungat. În aceste cazuri, din mulțimea de date se extrag eșantioane și informațiile
asupra eșantioanelor se utilizează pentru inferența statistică. Un eșantion este o submulțime de
date extrase dintr-o populație.
Definiția 9.8: Una sau mai multe unități de eșantionare prelevate dintr-o populație și
destinate să furnizeze informații despre această populație poartă numele de
eșantion.
Definiția 9.9: Procesul de prelevare sau de constituire a eșantionului poartă numele de
eșantionaj.
Să remarcăm faptul că în literatura de specialitate, pentru noțiunea de eșantion
se mai folosesc termenii de selecție sau sondaj.
Definiția 9.10: Numărul unităților de eșantionare care compun eșantionul poartă numele de
efectivul eșantionului sau de volumul eșantionului.
Volumul eșantionului se notează cu 𝑛.
Definiția 9.11: Reprezentativitatea (eșantionului) reprezintă proprietatea eșantionului de a
reprezenta fidel populația.
Pentru ca metodele statistice să conducă la concluzii valabile, eșantionul trebuie să fie
reprezentativ pentru populația analizată. Pentru a realiza acest obiectiv este de dorit ca pentru
fiecare unitate statistică, ce compune eșantionul, să i se asigure aceeași șansă de extragere din
cadrul populației, în procesul de eșantionaj.
Prin urmare, obținerea unui eșantion este un experiment aleatoriu și fiecare valoare colectată
reprezintă o valoare observată pentru o variabilă aleatorie, iar observațiile din populație
determină repartiția de probabilitate a variabilei aleatorii ce modelează fenomenul studiat.
Pentru a defini un eșantion aleatoriu, se consideră o variabilă aleatorie 𝑋 care reprezintă
rezultatul prelevării unui element al populației. Presupunem, de asemenea, că cele 𝑛 valori ce

175
compun eșantionul se obțin independent, fără schimbarea condițiilor, sau a șansei de extragere
(extrageri independente). În aceste condiții, valorile de eșantionaj pot fi considerate ca fiind
realizările a 𝑛 variabile aleatorii independente:
𝑋1 , 𝑋2 , ⋯ , 𝑋𝑖 , ⋯ , 𝑋𝑛
În afara tipologiei de erori prezentată, mai pot fi amintite erorile de reprezentativitate (efective
sau potențiale întâlnite în cercetarea statistică).
Definiția 9.12: Inferența statistică reprezintă procedeul de a obține informații privind
întreaga populație, pornind de la date incomplete.

9.5 METODE GRAFICE PENTRU DESCRIEREA DATELOR CALITATIVE

Pentru a descrie observațiile calitative efectuate asupra unei mulțimi de date (respectiv datele
înregistrate referitoare la acea mulțime de date) se definesc categorii, astfel încât fiecare
observație (adică fiecare dată înregistrată) să aparțină unei singure categorii. Mulțimea de date
este descrisă prin determinarea numărului de observații (sau a proporției din total a numărului
de observații) care aparțin fiecărei categorii.
Definiția 9.13: Frecvența absolută este numărul de realizări (apariții) ale unui tip dat de
evenimente, sau numărul de observații care aparțin unei clase.
Frecvența absolută se notează cu 𝑁𝑗 , unde 𝑗 reprezintă indicele categoriei, sau clasei respective,
𝑗 ∈ ̅̅̅̅̅
1, 𝑘.
Conform definiției 9.13, rezultă:
𝑘

∑ 𝑁𝑗 = 𝑛, (9.1)
𝑗=1
unde: 𝑛, reprezintă volumul eșantionului.
Definiția 9.14: Frecvența relativă, 𝑓𝑗 , reprezintă valoarea obținută prin împărțirea frecvenței
absolute la numărul total de realizări (apariții) sau de observații:
𝑁𝑗
𝑓𝑗 = , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘. (9.2)
𝑛
Rezultă,
𝑘

∑ 𝑓𝑗 = 1.0. (9.3)
𝑗=1

Frecvența relativă a unei categorii este deci, proporția din numărul total de observații, al
numărului de observații care aparțin acelei categorii.
Cele mai uzuale metode de descriere și reprezentare grafică a mulțimilor de date calitative sunt
graficele (diagramele) cu bare, graficele circulare și graficele liniare.
Graficele cu bare constau din reprezentarea frecvenței absolute (sau a frecvenței relative),
corespunzătoare fiecărei categorii, într-un sistem de axe de coordonate, în care pe o axă
figurează categoriile, iar pe cealaltă se trasează proporțional, prin bare sau dreptunghiuri,

176
valorile de frecvență absolută (sau frecvență relativă), ale fiecărei categorii.
Graficele circulare se obțin prin împărțirea unui cerc într-un număr de sectoare de cerc egal
cu numărul de categorii, unghiurile la centru ale acestor sectoare fiind proporționale cu
frecvența absolută (sau frecvența relativă) a fiecărei categorii.
Graficele liniare se utilizează mai ales pentru a descrie evoluția unui anumit fenomen și se
obțin prin reprezentarea prin linii (drepte sau curbe) a dinamicii parametrilor statistici pe care
îi reprezentăm în sistemul de axe de coordonate.

Exemplul 9.2
Repartizarea angajaților pe departamente într-o societate comercială
este dată în tabelul de mai jos:
Departamentul Numărul de angajați Frecvența relativă
A 1120 0.56
B 540 0.27
C 200 0.10
D 140 0.07
Total: 2000 1.0

Soluție: În tabelul de mai sus, categoriile sunt date de cele 4 departamente denumite
𝐴, 𝐵, 𝐶 ş𝑖 𝐷, iar frecvenţa absolută a fiecărei categorii este dată de numărul de
salariați din fiecare departament.
Frecvența relativă a fiecărei clase din ultima coloană a tabelului de mai sus se
obține prin împărțirea numărului de angajați din fiecare departament la
numărul total de angajați. Graficul cu bare corespunzător frecvenței absolute
este reprezentat în Figura 9.2.

Figura 9.2: Grafic cu bare

Graficul circular corespunzător pentru datele anterioare, este reprezentat în


Figura 9.3.

177
Figura 9.3: Grafic circular

9.6 METODE GRAFICE PENTRU DESCRIEREA DATELOR CANTITATIVE

Cea mai utilizată metodă grafică pentru descrierea datelor cantitative o reprezintă histograma
frecvenței relative/absolute, denumită și repartiția empirică a datelor de eșantionaj. Acest
instrument statistic se recomandă a fi utilizat în cazul eșantioanelor de volum mare, 𝑛 ≥
(30)35.
Să considerăm un eșantion de volum 𝑛, valorile de eșantionaj fiind:
𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛
Pentru construirea histogramei frecvenței relative se utilizează următorul algoritm:

ALGORITM PENTRU CONSTRUCȚIA HISTOGRAMEI FRECVENŢELOR

Etapa 1: Se prelevează valorile de eșantionaj:


𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛
prin observarea unui eșantion de volum 𝑛;
Etapa 2: Se formează șirul statisticilor de ordine:
𝑥(1) ≤ 𝑥(2) ≤ 𝑥(3) ≤ ⋯ ≤ 𝑥(𝑖) ≤ ⋯ 𝑥(𝑛) ,
̅̅̅̅̅
unde 𝑖 ∈ 1, 𝑛 ;
Definiția 9.15: Funcție care depinde de variabilele aleatorii ale unui eșantion poartă numele
de statistică
Definiția 9.16: Când observațiile asupra unui eșantion sunt ordonate crescător, după valorile
lor:
𝑥(1) ≤ 𝑥(2) ≤ 𝑥(3) ≤ ⋯ ≤ 𝑥(𝑖) ≤ ⋯ 𝑥(𝑛) ,
fiecare dintre aceste observații ordonate, este o valoare a unei variabile
aleatorii numită statistică de ordine.
Etapa 3: Se determină valoarea minimă, respectiv maximă de eșantionaj:
𝑥𝑚𝑖𝑛 = 𝑥(1) ;
𝑥𝑚𝑎𝑥 = 𝑥(𝑛) .
Etapa 4: Se calculează amplitudinea de eșantionaj, 𝑅:

178
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 𝑥(𝑛) − 𝑥(1)
Definiția 9.17: Diferența dintre cea mai mare valoare și cea mai mică valoare, observate la o
caracteristică cantitativă, poată numele de amplitudine.
Etapa 5: Se determină numărul de clase, 𝑘.
Definiția 9.18: Pentru o caracteristică calitativă, grupuri de indivizi formate în același mod,
fiecare grup având atribute comune, grupurile fiind disjuncte două câte două
și exhaustive, poartă numele de clasă.
Definiția 9.19: Pentru o caracteristică cantitativă, fiecare dintre intervalele consecutive
disjuncte, în care este împărțit întregul interval de variație al caracteristicii,
poartă numele de clasă.
Numărul de clase se determină cu relația empirică (relația lui Sturges):
10
𝑘 =1+ ∙ 𝑙𝑜𝑔10 (𝑛), (9.4)
3
sau cu relația:
𝑘 = √𝑛, (9.5)
În general se recomandă ca numărul de clase să fie 612.
Valorile obținute cu relațiile (9.4) și (9.5) se rotunjesc la valoarea întreagă cea
apropiată.
Etapa 6: Calculul mărimii clasei, amplitudinii clasei, 𝑤:
𝑅
𝑤=
𝑘
Etapa 7: Calculul limitelor claselor, marginilor claselor, 𝑦𝑖 :
𝑦1 = 𝑥(1) ;
𝑦2 = 𝑥(1) + 𝑤;
𝑦3 = 𝑥(1) + 2 ∙ 𝑤;
…………………..….
𝑦𝑗 = 𝑥(1) + (𝑗 − 1) ∙ 𝑤;
……………………...
𝑦𝑘+1 = 𝑥(1) + 𝑘 ∙ 𝑤;

𝑦1 𝑦2 … 𝑦𝑗 𝑦𝑗+1 … 𝑦𝑘+1

𝑥𝑚𝑖𝑛 = 𝑥(1) 𝑥𝑚𝑎𝑥 = 𝑥(𝑛)


Clasa j
𝑤 𝑤 𝑤

Figura 9.4: Schiță pentru calculul limitelor claselor

179
Etapa 9: Calculul valorilor centrale ale clasei, 𝑦𝑗′ .
Definiția 9.20: Media aritmetică a limitelor superioară și inferioară ale clasei, pentru o
caracteristică cantitativă:
𝑦𝑗 + 𝑦𝑗+1
𝑦𝑗′ = , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘 (9.6)
2
se numește centrul clasei.
Etapa 10: Determinarea frecvenței absolute, 𝑁𝑗 .
Etapa 11: Determinarea frecvenței relative, 𝑓𝑗 :
𝑁𝑗
𝑓𝑗 = .
𝑛
Etapa 12: Determinarea repartiției de frecvențe.
Definiția 9.21: Relația empirică între valorile unei caracteristici și frecvențele absolute sau
relative ale acestora se numește repartiție de frecvențe.
Repartiția de frecvențe poate fi reprezentată grafic sub formă de histogramă, grafic cu bare
sau poligon al frecvențelor cumulate.
Definiția 9.22: Reprezentarea grafică a repartiției de frecvențe a unei caracteristici
cantitative, constând dintr-un ansamblu de dreptunghiuri alăturate, fiecare
având baza egală cu mărimea clasei și aria proporțională cu frecvența clasei
se numește histogramă, vezi figura 9.5.
Definiția 9.23: Reprezentarea grafică a repartiției de frecvențe a unei caracteristici
cantitative, constând dintr-un ansamblu de bare de aceeași lățime și cu
lungimea proporțională cu frecvența se numește diagramă cu bare, vezi
figura 9.6.
Definiția 9.24: Linia poligonală obținută prin unirea punctelor care au ca abscise limitele
superioare ale claselor și au ca ordonate frecvențele absolute sau relative
cumulate se numește poligonul frecvențelor cumulate, vezi figura 9.7.

𝑁𝑗 /𝑓𝑗

𝑦1′  𝑦𝑗′ 𝑦𝑗+1



 𝑦𝑘′

Figura 9.5: Histograma

180
12
𝑁𝑗 /𝑓
10𝑗

2
𝑋
0
𝑦11′ 2  3 4𝑦 ′ 5′
𝑦𝑗+1 6 7 8 𝑦𝑘9′
𝑗

Figura 9.6: Diagrama cu bare


50

𝑁𝑗 /𝑓
45
𝑗
40
35
30
25
20
15
10
5 𝑋
0
𝑦11′ 2  3 𝑦𝑗4′ 𝑦𝑗+1
′5 6 7 8 𝑦9𝑘′

Figura 9.7: Poligonul frecvențelor cumulate

Definiția 9.25: Numărul de membri ai unui ansamblu de observații care au valori mai mici
sau egale cu o valoare dată se numește frecvență absolută cumulată, 𝑁𝑗′ , 𝑗 ∈
̅̅̅̅̅
1, 𝑘 .
Cu datele grupate în 𝑘 clase, frecvența absolută cumulată este definită numai de limitele clasei
și are expresia:
0 dacă X<𝑦1
𝑘

𝑁𝑗′ = ∑ 𝑁𝑘 dacă 𝑦𝑗 ≤ 𝑋 ≤ 𝑦𝑗+1 (9.7)


𝑗=1
{ 1 dacă 𝑋 > 𝑦𝑘+1
Definiția 9.26: Frecvența relativă cumulată reprezintă raportul dintre frecvența absolută
cumulată și volumul de eșantion.
0 dacă X<𝑦1
𝑘

𝑓𝑗′ = ∑ 𝑓𝑘 dacă 𝑦𝑗 ≤ 𝑋 ≤ 𝑦𝑗+1 (9.8)


𝑗=1
{1 dacă 𝑋 > 𝑦𝑘+1

181
Exemplul 9.3
Se consideră următorul eșantion reprezentativ:
49.14, 48.19, 48.83, 49.74, 53.14, 50.37, 50.30, 48.89, 52.11, 50.25, 49.09,
51.42, 49.68, 48.11, 49.36, 48.38, 48.65, 49.92, 49.82, 49.00, 50.23, 49.75,
50.49, 49.18, 49.24, 51.93, 47.93, 48.36, 50.06, 50.32, 49.33, 51.27, 50.02,
50.45, 52.41, 51.64, 50.54, 49.30, 50.47, 50.40, 49.01, 51.92, 50.42, 48.77,
50.17, 52.89, 49.58, 50.66, 50.10, 50.26, 50.50, 49.83, 46.49, 50.08, 49.66,
50.90, 50.60, 50.71, 50.57, 49.14.
Să se determine și să se reprezinte grafic repartiția de frecvențe a datelor de
eșantionaj.
Soluție: 𝑥(1) = 46.49
𝑥(𝑛) = 53.14
𝑛 = 60
𝑅 = 𝑥(𝑛) − 𝑥(1) = 53.14 − 46.49 = 6.65
10
𝑘 = [√𝑛] + 1 = [1 + ∙ log(60)] + 1 = [6.927] + 1 = 7
3
𝑅 6.65
𝑤= = = 0.95
𝑘 7

Limita Limita Valoarea


Clasa 𝑁𝑗 𝑓𝑗 𝑁𝑗′ 𝑓𝑗′
inferioară superioară centrală
1 46.49 47.44 46.965 1 0.017 1 0.017
2 47.44 48.39 47.915 5 0.083 6 0.100
3 48.39 49.34 48.865 13 0.217 19 0.317
4 49.34 50.29 49.815 17 0.283 36 0.600
5 50.29 51.24 50.765 15 0.250 51 0.850
6 51.24 52.19 51.715 6 0.100 57 0.950
7 52.19 53.14 52.665 3 0.050 60 1.000

Histograma Diagrama cu bare


20 0.3

15
0.2
10
0.1
5

0 0
46.965 47.915 48.865 49.815 50.765 51.715 52.665 46.965 47.915 48.865 49.815 50.765 51.715 52.665

182
Poligonul frecvențelor cumulate
1.2
1
0.8
0.6
0.4
0.2
0
45 47 49 51 53 55 57

 Definiți statistica, precum și cele două păți distincte ale ei: statistica
descriptivă și statistica inferențială.
 Descrieți metoda sau metodologia statisticii.
 Definiți principalele noțiuni statistice: populația statistică, unitatea
statistică, valoare observată, scală, eșantion și inferența statistică.
 Definiți și clasificați noțiunea de caracteristică statistică.
 Enumerați sursele de erori ce pot apărea în cazul înregistrărilor
statistice, precum și principalele tipuri de erori.
 Definiți frecvența absolută și frecvența relativă.
 Enumerați metodele grafice utilizate pentru descrierea datelor calitative.
 Precizați algoritmul pentru construcția histogramei frecvențelor și
detaliați etapele ce trebuie parcurse.
 Definiți noțiunile ce intervin în metodologia de construcție a histogramei:
șirul statisticilor de ordine, statistică, amplitudine, clasă, amplitudinea
clasei, limitele claselor, centrul clasei, frecvența absolută cumulată,
frecvența relativă cumulată și repartiție de frecvențe.
 Enumerați și definiți formele grafice prin care o repartiție de frecvențe
poate fi reprezentată grafic.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Statistica;  Frecvența absolută;


 Statistica descriptivă;  Frecvența relativă;
 Statistica inferențială;  Graficele cu bare;
 Metoda sau metodologia  Graficele circulare;
statisticii;  Graficele liniare;
 Populația statistică;  Statistică de ordine;

183
 Unitatea statistică;  Clasă;
 Caracteristica statistică:  Amplitudinii clasei;
 caracteristici calitative;  Limitelor claselor;
 caracteristici cantitative,  Centrul clasei;
 Valoare observată;  Frecvența absolută cumulată;
 Scală;  Frecvența relativă cumulată;
 Eșantion, eșantionaj;  Histogramă;
 Inferență statistică;  Diagramă cu bare;
 Eroare de înregistrare  Poligonul frecvențelor
(observare) statistică; cumulate.

Rezumat
În această unitate de învățare s-a început prezentarea tehnicilor și metodelor de
investigație statistică a fenomenelor de masă.
De aceea, la început, au fost prezentate cele două părți distincte ce alcătuiesc
statistica modernă, statistica descriptivă și statistica inferențială, precum și
metoda sau metodologia utilizată în cercetarea statistică. Apoi, au fost definite și
clasificate principalele noțiuni utilizate în statistică.
În continuare, au fost prezentate metodele grafice specifice statisticii descriptive,
pentru descrierea caracteristicilor calitative și cantitative. La acestea din urmă,
este vorba de calculul, construcția și reprezentarea repartiției de frecvențe.
Elemente specifice statisticii descriptive vor fi definite și în următoarea UI. Este
vorba de metodele numerice pentru descrierea datelor cantitative.

Test de evaluare a cunoștințelor


P.9.1 Un studiu statistic a fost desfășurat pe un eșantion alcătuit din 670 angajați care
au răspuns întrebării: cât de mult utilizați Internetul în activitatea
dumneavoastră?
Rezultatele obținute sunt:
Răspunsuri Persoane
Foarte mult 265
Mult 129
Normal 105
Puțin 75
Foarte puțin 65
Deloc 31
Reprezentați grafic rezultate studiului sub forma unui grafic cu bare și sub
forma unui grafic circular.

184
P.9.2 În tabelul de mai jos sunt date vânzările de CD ale unei case de discuri pe genuri
de muzică:
Număr de discuri,
Gen de muzică
[106 bucăți]
R&B 14.64
Alternativă 10.26
Rap 7.37
Rock ’N’ Roll 6.45
Country 5.64
Soundtrack 2.66
Metal 1.48
Clasică 1.45
Latino 1.03

Reprezentați grafic aceste date sub forma unui grafic cu bare și sub forma unui
grafic circular.
P.9.3Structura pe grupe de vârstă a 50 de angajați dintr-o companie este:

Vârsta Număr de angajați


18 ÷ 30 12
31 ÷ 43 19
44 ÷ 56 14
57 ÷ 65 5
Să se determine:
a. Limitele claselor;
b. Numărul de clase;
c. Amplitudinea claselor este egală?
d. Frecvența relativă.
e. Frecvența relativă cumulată și frecvența absolută cumulată.
P.9.4 Să se reprezinte grafic, sub forma unei histograme, diagrame cu bare și poligonul
frecvențelor cumulate, următoarele date de eșantionaj:

44.91 44.99 44.92 45.00 44.85


44.88 45.03 44.82 45.02 44.91
45.16 44.93 44.94 45.05 45.22
45.11 44.96 45.08 45.01 45.15
44.90 44.98 45.00 45.07 44.96
44.78 45.09 44.87 44.97 44.99
45.13 45.18 45.05 45.07 44.95
45.03 45.04 44.97 45.10 45.06
44.95 45.12 45.09 45.01 45.04
45.02 44.93 44.89 44.84 44.98

185
Unitatea de învățare 10.

Cuprins
10.1. Introducere ......................................................................................................... 186
10.2. Competențe ........................................................................................................ 186
10.3. Metode numerice pentru descrierea datelor cantitative .................................... 187
10.3.1. Metode numerice pentru descrierea datelor cantitative negrupate ..................188
10.3.2. Metode numerice pentru descrierea datelor cantitative grupate ......................198
10.4. Rezumat ............................................................................................................. 205
10.5. Test de evaluare ................................................................................................. 205

10.1. Introducere
Prezenta unitate de învățare continuă prezentarea tehnicilor specifice
statisticii descriptive. Astfel, sunt prezentate metodele numerice pentru descrierea
datelor cantitative negrupate și metodele numerice pentru descrierea datelor
cantitative grupate. Este vorba de calculul celor trei tipuri de indicatori statistici
de eșantionaj:
 ai tendinței de grupare (sau de poziționare) a valorilor de eșantionaj: media
de eșantionaj, mediana de eșantionaj și moda de eșantionaj.
 ai tendinței de împrăștiere (sau de variație) a valorilor de eșantionaj:
amplitudinea, dispersia de eșantionaj, abaterea standard de eșantionaj,
coeficientul de variație de eșantionaj și cuantilele de eșantionaj.
 ai formei repartiției de frecvențe: asimetria de eșantionaj și coeficientul de
boltire de eșantionaj.
Tot în această UI se face trecerea spre statistica inferențială, deoarece la principalii
indicatorii statistici de eșantionaj sunt precizate și repartițiile statistice. Cu această
ocazie este prezentată o nouă repartiție statistică auxiliară, repartiția hi-pătrat.

10.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să utilizeze
principalii indicatorii statistici de eșantionaj pentru explicarea și interpretarea
unor rezultate teoretice sau procese specifice domeniului.
De asemenea, va fi capabil să utilizeze adecvat metode de calcul ale indicatorilor
statistici de eșantionaj pentru aprecierea calitativă și cantitativă a unor fenomene
de masă, precum și pentru prelucrarea și interpretarea rezultatelor proceselor
caracteristice domeniului.
Aceste metode specifice statisticii descriptive permit, de asemenea, elaborarea de
modele și proiecte profesionale prin selectarea și utilizarea unor principii, metode
și soluții consacrate din statistică.

186
Durata medie de parcurgere a acestei unități de învățare este de 3 ore.

10.3 METODE NUMERICE PENTRU DESCRIEREA DATELOR


CANTITATIVE

Gruparea datelor de eșantionaj, alcătuirea seriei statistice și reprezentarea sa grafică sub forma
histogramei, diagramei cu bare sau poligonul frecvențelor cumulate, nu sunt suficiente pentru
analiza din punct de vedere statistic și pentru obținerea concluziilor privind legea căreia i se
supune fenomenul de masă observat. Este necesar ca datele existente să fie sintetizate sub forma
unor indicatori numerici de eșantionaj, care să le exprime sau să le reprezinte.
Observăm însă, că în condițiile variabilității mărimilor obținute ca rezultat al procesului de
eșantionaj, există totuși o serie de tendințe a datelor, de:
 a se grupa în jurul frecvenței maxime;
 a fi împrăștiate în jurul frecvenței maxime;
 a se ordona sub diferite forme: simetrice, asimetrice, mai aplatizate etc.
Deci, la fel ca și în cazul valorilor tipice ale variabilelor aleatorii, dezvoltate la calculul
probabilităților, cu ajutorul datelor de eșantionaj este necesar să se determine trei tipuri de
indicatori statistici de eșantionaj:
 ai tendinței de grupare (sau de poziționare) a valorilor de eșantionaj;
 ai tendinței de împrăștiere (sau de variație) a valorilor de eșantionaj;
 ai formei repartiției de frecvențe.
Deoarece, valorile observate ale caracteristicilor statistice cantitative se pot prezenta sub două
forme:
- Serie statistică în care valorile sunt distincte între ele;
- Serie statistică la care valorile sunt grupate în 𝑘 clase, fiecare clasă având centrele
clasei yj′ și frecvențele absolute/relative, Nj /fj , i ∈ ̅̅̅̅̅
1, k,
metodele de calcul al indicatorilor statistici de eșantionaj au fost dezvoltate pentru aceste două
situații.
O altă precizare, deosebit de importantă, ce trebuie făcută se referă la faptul că datorită
ipotezelor efectuate la descrierea noțiunii de eșantionaj, indicatorii statistici de eșantionaj sunt
la rândul lor variabile aleatorii, caracterizate de repartiții statistice, numite de eșantionaj.
La aceeași concluzie se poate ajunge dacă considerăm, în cazul prelevării unui eșantion de
volum 𝑛, dintr-o populație de volum 𝑁, mulțimea tuturor eșantioanelor ce se pot obține. Dacă
pentru fiecare eșantion din această mulțime se calculează indicatorii statistici de eșantionaj,
valorile obținute reprezintă repartiția statistică de eșantionaj a acestor indicatori.

187
10.3.1 METODE NUMERICE PENTRU DESCRIEREA DATELOR
CANTITATIVE NEGRUPATE

Măsurile numerice descriptive sunt valori numerice calculate având la dispoziție o mulțime de
date de eșantionaj:
𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , (10.1)
obținute prin măsurarea caracteristicii unui eșantion de volum 𝑛. Aceste valori reprezintă
realizările a 𝑛 variabile aleatorii:
𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑖 , ⋯ , 𝑋𝑛 , (10.2)
identic repartizate.
Principalii indicatori statistici de eșantionaj sunt cazuri particulare, ca și în cazul valorilor tipice
ale unei variabile aleatorii, a momentelor de ordinul 𝑞 sau a momentelor centrate de ordinul 𝑞.
Definiția 10.1: Momentul de ordinul 𝑞, 𝑚𝑞 a unui eşantion cu un efectiv de 𝑛 valori,
𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑖 , ⋯ , 𝑋𝑛 este prin definiţie:
𝑋1𝑞 + 𝑋2𝑞 + 𝑋3𝑞 + ⋯ + 𝑋𝑛𝑞
𝑚𝑞 = . (10.3)
𝑛
Deci, pe baza datelor de eșantionaj (10.1) și pe baza notațiilor (10.2), din ecuația (10.3), rezultă:
𝑥1𝑞 + 𝑥2𝑞 + 𝑥3𝑞 + ⋯ + 𝑥𝑛𝑞 ∑𝑛𝑖=1 𝑥𝑖𝑞
𝑚𝑞 = = . (10.4)
𝑛 𝑛
Definiția 10.2: Momentul centrat de ordinul 𝑞, 𝑚𝑞′ a unui eşantion cu un efectiv de 𝑛 valori,
𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑖 , ⋯ , 𝑋𝑛 este prin definiţie:
(𝑋1 − 𝑋̅)𝑞 + (𝑋2 − 𝑋̅)𝑞 + (𝑋3 − 𝑋̅)𝑞 + ⋯ + (𝑋𝑛 − 𝑋̅)𝑞
𝑚𝑞′ = . (10.5)
𝑛
În ecuația (10.5), prin 𝑋̅ s-a notat media de eșantionaj, ecuația (10.7).
Deci, pe baza datelor de eșantionaj (10.1) și pe baza notațiilor (10.2), din ecuația (10.5), rezultă:
(𝑥1 − 𝑚)𝑞 + (𝑥2 − 𝑚)𝑞 + ⋯ + (𝑥𝑛 − 𝑚)𝑞 ∑𝑛𝑖=1(𝑥𝑖 − 𝑚)𝑞
𝑚𝑞′ = = , (10.6)
𝑛 𝑛
unde 𝑚 reprezintă media aritmetică și este dată de ecuația (10.8).

Indicatorii statistici de eșantionaj ai tendinței de grupare (sau de poziționare) sunt: media de


eșantionaj, mediana de eșantionaj și moda de eșantionaj.
Considerând cele 𝑛 variabile aleatorii (10.2), media aritmetică de eșantionaj se definește:
𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑛
𝑋̅ = 𝑚 = . (10.7)
𝑛
Deci, pe baza datelor de eșantionaj (10.1) și pe baza ecuației (10.7), rezultă:
Definiția 10.3: Media aritmetică, 𝑚 a unui eşantion cu un efectiv de 𝑛 valori,
𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 este prin definiție:

188
𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛 ∑𝑛𝑖=1 𝑥𝑖
𝑥̅ = 𝑚 = = , (10.8)
𝑛 𝑛
Observații: a. Media de eșantionaj obținută prin utilizarea ecuației (10.8), notată cu 𝑚𝑋̅ :
𝐸(𝑋̅) = 𝑚𝑋̅ = 𝜇𝑋̅ = 𝜇, (10.9)
este identică cu valoarea 𝜇, a populației din care a fost prelevat eșantionul.
Demonstrație: Considerăm 𝑛 variabile aleatorii:
𝑋1 , 𝑋2 , 𝑋3 , ⋯ , 𝑋𝑖 , ⋯ , 𝑋𝑛 ,
identic repartizate cu media 𝜇, adică:
𝐸(𝑋𝑖 ) = 𝜇, 𝑖 ∈ ̅̅̅̅̅ 1, 𝑛.
Deoarece media de eșantionaj este de finită sub forma ecuației (10.7),
rezultă:
1 1
𝐸(𝑋̅) = ∙ [𝐸(𝑋1 ) + 𝐸(𝑋2 ) + ⋯ + 𝐸(𝑋𝑛 )] = ∙ (𝑛 ∙ 𝜇) = 𝜇.
𝑛 𝑛
b. Dacă populația este infinită, sau dacă extragerea eșantionului se execută cu
revenire, atunci dispersia mediei de eșantionaj, notată cu 𝑠𝑋2̅ , este egală cu:
𝜎2
𝐸[(𝑋̅ − 𝜇)2 ] = 𝑠𝑋2̅ = , (10.10)
𝑛
unde, prin 𝜎 2 s-a notat dispersia populației din care a fost prelevat eșantionul.
Demonstrație: Conform relației (10.7), scrisă sub forma:
𝑋1 𝑋2 𝑋𝑛
𝑋̅ = + + ⋯+ ,
𝑛 𝑛 𝑛
rezultă:
𝑉(𝑋1 ) 𝑉(𝑋2 ) 𝑉(𝑋𝑛 ) 1 𝜎2
𝑉(𝑋̅) = + + ⋯ + = 𝑛 ∙ ( ∙ 𝜎 2
) = ,
𝑛2 𝑛2 𝑛2 𝑛2 𝑛
deoarece cele 𝑛 variabile aleatorii se consideră a fi independente și identic
repartizate, adică:
𝑉(𝑋𝑖 ) = 𝜎 2 , 𝑖 ∈ ̅̅̅̅̅
1, 𝑛.
c. Dacă prelevarea eșantionului se efectuează fără revenire dintr-o populație
finită, de volum 𝑁, atunci:
𝜎2 𝑁 − 𝑛
sX2̅ = ∙( ).
𝑛 𝑁−1
d. Dacă populația din care s-a prelevat eșantionul este normal repartizată cu
media 𝜇 și dispersia 𝜎 2 , atunci media de eșantionaj, 𝑚, este normal
repartizată:
𝑚~𝒩(𝑚, 𝜇, 𝜎⁄√𝑛),
cu media 𝜇 și abaterea medie pătratică 𝜎⁄√𝑛.
e. Valoarea numerică:
𝜎
√𝑛,
poartă numele de eroare standard.

189
f. Dacă se prelevează un eșantion, de volum 𝑛, dintr-o populație având media
𝜇 și dispersia 𝜎 2 , dar care nu este normal repartizată atunci, conform teoremei
limită centrale, variabila aleatorie:
𝑋̅ − 𝜇
𝑍= ,
𝜎⁄√𝑛
este asimptotic normal repartizată:
𝑧
1 𝑢2
lim 𝑃𝑟(𝑍 ≤ 𝑧) = ∙ ∫ 𝑒 − 2 ∙ 𝑑𝑢.
𝑛→∞ √2 ∙ 𝜋
−∞

g. Aproximația anterioară conduce la rezultate precise, dacă 𝑛 > 8.


Definiția 10.4: Mediana unui eșantion cu un efectiv de 𝑛 valori, 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 este
prin definiție:
𝑥(𝑛+1) , dacă 𝑛 este par
2
𝑥𝑀𝑒 = {𝑥(𝑛) + 𝑥(𝑛+1) , (10.11)
2 2
, dacă 𝑛 este impar
2
unde, 𝑥(𝑖) , reprezintă statistica de ordine 𝑖.
Observații: a. Mediana de eșantionaj obținută prin utilizarea ecuației (10.11) este de
asemenea asimptotic normal repartizată, dacă 𝑛 ≥ 30, cu media:
𝑚𝑀𝑒 = 𝜇,
și cu abaterea standard:
𝜋 1.2533 ∙ 𝜎
𝑠𝑀𝑒 = 𝜎 ∙ √ = .
2∙𝑛 √𝑛
Definiția 10.5: Moda (sau dominanta) unui eșantion ordonat crescător cu un efectiv de n
valori: 𝑥(1) ≤ 𝑥(2) ≤ 𝑥(3) ≤ ⋯ ≤ 𝑥(𝑖) ≤ ⋯ 𝑥(𝑛) , este prin definiţie valoarea
sau valorile cu cea mai mare frecvență de apariție, adică:
𝑥𝑀𝑜 = {𝑥(𝑘) , 𝑥(𝑘+1) , 𝑥(𝑘+2) , ⋯ , 𝑥(𝑘+𝑙) }, 𝑙 = 𝑚𝑎𝑥{𝑥𝑖 }, 𝑙 ≠ 0, 𝑖 ∈ ̅̅̅̅̅
1, 𝑛. (10.12)
Moda (modul, sau dominanta) este dată de valoarea eșantionului care se repetă de cel mai mare
număr de ori.
Deoarece datele de eșantionaj sunt valori individuale, definiția 10.5 nu poate fi aplicată în
această situație. De aceea, pentru astfel de cazuri se recomandă utilizarea relației aproximative:
𝑥𝑀𝑜 = 𝑥̅ − 3 ∙ (𝑥̅ − 𝑥𝑀𝑒 ). (10.13)

Indicatorii statistici de eșantionaj ai tendinței de împrăștiere (sau de variație) sunt:


amplitudinea, dispersia de eșantionaj, abaterea medie pătratică, cuantilele și coeficientul de
variație de eșantionaj.
Definiția 10.6: Amplitudinea, 𝑅, unui eșantion, 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , cu un volum 𝑛 este
prin definiție diferența dintre cea mai mare și cea mai mică valoare de
eșantionaj, adică:
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 𝑥(𝑛) − 𝑥(1) , (10.14)

190
unde:
- 𝑥𝑚𝑎𝑥 = max {𝑥𝑖 },
1≤𝑖≤𝑛
- 𝑥𝑚𝑖𝑛 = min {𝑥𝑖 },
1≤𝑖≤𝑛
- 𝑥(1) , reprezintă prima statistică de ordine,
- 𝑥(𝑛) , reprezintă statistica de ordine 𝑛.
Considerând cele 𝑛 variabile aleatorii (10.2), dispersia de eșantionaj se definește:
(𝑋1 − 𝑋̅)2 + (𝑋2 − 𝑋̅)2 + ⋯ + (𝑋𝑛 − 𝑋̅)2
𝑠2 = , (10.15)
𝑛
Deci, pe baza datelor de eșantionaj (10.1) și pe baza ecuației (10.5), rezultă:
Definiția 10.7: Dispersia, 𝑠 2 a unui eşantion cu un efectiv de 𝑛 valori, 𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛
este prin definiție:
(𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥)2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑚)2
𝑠2 = = , (10.16)
𝑛 𝑛
Observații: a. Valoarea numerică obținută prin utilizarea ecuației (10.16), reprezintă un
estimator deplasat al dispersiei de eșantionaj, vezi UI 11 (Estimarea
parametrilor), adică:
𝐸(𝑠 2 ) = 𝜇𝑠2 ≠ 𝜎 2 .
De aceea, relația (10.16) se utilizează doar pentru calcul dispersiei populației:
∑𝑛𝑖=1(𝑥𝑖 − 𝑚)2
𝜎2 = . (10.17)
𝑁
b. Pentru determinarea valorii dispersiei de eșantionaj se utilizează relația
corectată:
∑𝑛𝑖=1(𝑥𝑖 − 𝑚)2
𝑠2 = . (10.18)
𝑛−1
Ecuația (10.18) reprezintă un estimator nedeplasat al dispersiei de eșantionaj
și se obține pe baza relației (10.17):
𝑛−1 2
𝐸(𝑠 2 ) = 𝜇𝑠2 = ∙𝜎 ,
𝑛
adică:
(𝑋1 − 𝑋̅)2 + (𝑋2 − 𝑋̅)2 + ⋯ + (𝑋𝑛 − 𝑋̅)2
𝐸(𝑠 2 ) = 𝜇𝑠2 = .
𝑛−1
Demonstrație: Conform relației (10.15) și (10.7):
𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑛
𝑋1 − 𝑋̅ = 𝑋1 − =
𝑛
1
= ∙ [(𝑛 − 1) ∙ 𝑋1 − 𝑋2 − ⋯ − 𝑋𝑛 ] =
𝑛
1
= ∙ [(𝑛 − 1) ∙ (𝑋1 − 𝜇) − (𝑋2 − 𝜇) − ⋯ − (𝑋𝑛 − 𝜇)],
𝑛
iar:

191
1
(𝑋1 − 𝑋̅)2 = ∙ [(𝑛 − 1)2 ∙ (𝑋1 − 𝜇)2 + (𝑋2 − 𝜇)2 + ⋯ + (𝑋𝑛 − 𝜇)2 +
𝑛2
+2 ∙ (𝑛 − 1) ∙ (𝑋1 − 𝜇) ∙ (𝑋2 − 𝜇) + ⋯ ].
Deoarece variabilele aleatorii 𝑋𝑖 , 𝑖 ∈ ̅̅̅̅̅
1, 𝑛, sunt independente, mediile celor
2
𝐶𝑛 produse de tipul:
2 ∙ (𝑛 − 1) ∙ 𝐸[(𝑋1 − 𝜇) ∙ (𝑋2 − 𝜇)] = 0.
Rezultă,
𝐸[(𝑋1 − 𝑋̅)2 ] =
1
= 2 ∙ {(𝑛 − 1)2 ∙ 𝐸[(𝑋1 − 𝜇)2 ] + 𝐸[(𝑋2 − 𝜇)2 ] + ⋯ + 𝐸[(𝑋𝑛 − 𝜇)2 ]} =
𝑛
1
= 2 [(𝑛 − 1)2 ∙ 𝜎 2 + 𝜎 2 + ⋯ + 𝜎 2 ] =
𝑛
1 𝑛−1 2
= 2 [(𝑛 − 1)2 ∙ 𝜎 2 + (𝑛 − 1) ∙ 𝜎 2 ] = ∙𝜎 .
𝑛 𝑛
Similar, vom obține pentru oricare termen de forma:
𝑛−1 2
𝐸[(𝑋𝑖 − 𝑋̅)2 ] = ̅̅̅̅̅
∙ 𝜎 , 𝑖 ∈ 1, 𝑛.
𝑛
Rezultă,
1 𝑛−1 2 𝑛−1 2 𝑛−1 2
𝐸(𝑠 2 ) = 𝜇𝑠2 = ∙ [ ∙ 𝜎 + ⋯+ ∙𝜎 ]= ∙𝜎 .
𝑛 𝑛 𝑛 𝑛
c. Pentru eșantioane de volum 𝑛 ≥ 100, repartiția dispersiei de eșantionaj este
foarte apropiată de repartiția normală cu parametrii:
 𝜇𝑆 2 ≈ 𝜎 2 ,
2
 𝜎𝑆22 = 𝜎 2 ∙ √𝑛, dacă populația din care se prelevează eșantionul este
normală, sau:
𝜇4 −𝜎4
 𝜎𝑆22 = √ , dacă populația din care se prelevează eșantionul nu este
𝑛
normală.
d. Dacă se prelevează un eșantion de volum 𝑛 dintr-o populație normală,
atunci variabila aleatorie:
(𝑛 − 1) ∙ 𝑠 2 (𝑋1 − 𝑋̅)2 + (𝑋2 − 𝑋̅)2 + ⋯ + (𝑋𝑛 − 𝑋̅)2
=
𝜎2 𝜎2
este hi-pătrat repartizată cu 𝑛 − 1 grade de libertate.
e. O variabilă aleatorie 𝑋, este repartizată hi-pătrat cu 𝜈 grade de libertate,
dacă funcția densitate de probabilitate are forma:
𝜈−2
𝑥 2 1
𝑓𝜒2 (𝑥) = 𝜈 ∙ 𝑒 −2∙𝑥 (10.19)
𝜈
22 ∙ Γ (2)
Repartiția variabilei aleatorii 𝑋 se notează simplificat, sub forma:
𝑋~𝜒 2 (𝑥, 𝜈).

192
Repartiția hi-pătrat reprezintă modelul statistic al sumei pătratelor a 𝜈
variabile aleatorii normale normate:
𝜈 𝜈
𝑋𝑖 − 𝜇𝑖 2
2
𝜒 = ∑ 𝑍𝑖2 = ∑( ) (10.20)
𝜎𝑖
𝑖=1 𝑖=1
În ecuația (10.19), funcția gama, Γ(𝑘), are expresia:

Γ(𝑘) = ∫ 𝑡 𝑘−1 ∙ 𝑒 −𝑡 ∙ 𝑑𝑡, (10.21)


0

În anexa V, de la finalul cărții, tabelul V.1, se găsesc calculate, pentru diferite


grade de libertate, valorile cuantilelor repartiției hi-pătrat.
f. Dacă prelevarea eșantionului se efectuează fără revenire dintr-o populație
finită, de volum 𝑁, atunci media dispersiei de eșantionaj se determină cu
relația:
𝑁 𝑛−1
𝐸(𝑠 2 ) = 𝜇𝑠2 = ( )∙( ) ∙ 𝜎2.
𝑁−1 𝑛
Definiția 10.8: Abaterea standard a unui eșantion cu un efectiv de n valori,
𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 este prin definiție rădăcina pătrată a dispersiei,
respectiv:
∑𝑛 (𝑥𝑖 − 𝑚)2
𝑠 = √ 𝑖=1 , (10.22)
𝑛−1

Observații: a. Pentru eșantioane de volum 𝑛 ≥ 100, repartiția abaterii standard de


eșantionaj este foarte apropiată de repartiția normală cu parametrii:
 𝜇𝑆 ≈ 𝜎,
𝜎
 𝜎𝑆2 = , dacă populația din care se prelevează eșantionul este normal
√2∙𝑛
repartizată, sau:
𝜇 −𝜎4
 𝜎𝑆2 = √ 4∙𝑛∙𝜎
4
2 , dacă populația din care se prelevează eșantionul nu este

normală.

Exemplul 10.1
Fie o populație alcătuită din elementele: 2, 3, 6, 8, 11. Considerând toate
eșantioanele de volum 𝑛 = 2, ce pot fi obținute cu cele 𝑁 = 5 elemente ale
populației, să se determine media și dispersia populației, repartiția de
eșantionaj a mediei și cea a dispersiei, dacă:
a) Extragerea eșantioanelor se realizează cu revenire.
b) Extragerea eșantioanelor se realizează fără revenire.
Soluție: a) Cu revenire:
2 + 3 + 6 + 8 + 11 30
𝜇= = = 6.0
5 5

193
(2 − 6)2 + (3 − 6)2 + (6 − 6)2 + (8 − 6)2 + (11 − 6)2
𝜎2 = = 10.8
5
Numărul total de eșantioane ce pot fi prelevate cu revenire, este:
𝐴𝑟52 = 52 = 25
Aceste eșantioane sunt:

Es. 𝑥1 𝑥2 𝑚𝑖 𝑠𝑖2 Es. 𝑥1 𝑥2 𝜇 𝑠2


1 2 2 2 0 14 6 8 7 1
2 2 3 2.5 0.25 15 6 11 8.5 6.25
3 2 6 4 4 16 8 2 5 9
4 2 8 5 9 17 8 3 5.5 6.25
5 2 11 6.5 20.25 18 8 6 7 1
6 3 2 2.5 0.25 19 8 8 8 0
7 3 3 3 0 20 8 11 9.5 2.25
8 3 6 4.5 2.25 21 11 2 6.5 20.25
9 3 8 5.5 6.25 22 11 3 7 16
10 3 11 7 16 23 11 6 8.5 6.25
11 6 2 4 4 24 11 8 9.5 2.25
12 6 3 4.5 2.25 25 11 11 11 0
13 6 6 6 0  150 135

Repartiția de eșantionaj a mediei:


∑25𝑖=1 𝑚𝑖 150
𝜇𝑋̅ = = = 6.0
25 25
2
∑25𝑖=1(𝑚𝑖 − 𝜇𝑋̅ )
2
135
𝜎𝑋̅ = = = 5.4
25 25
La același rezultat ajungem dacă utilizăm relația:
𝜎 2 10.8
𝜎𝑋2̅ =
= = 5.4
𝑛 2
Repartiția de eșantionaj a dispersiei:
∑25 2
𝑖=1 𝑠𝑖 135
𝜇𝑠 2 = = = 5.4
25 25
La același rezultat ajungem dacă utilizăm relația:
𝑛−1 2−1
𝜇𝑠 2 = ( ) ∙ 𝜎2 = ( ) ∙ 10.8 = 5.4
𝑛 2
∑25 2
𝑖=1(𝑠𝑖 − 𝜇𝑠2 )
2
975.75
𝜎𝑠22 = = = 39.03.
25 25
∑25 2
𝑖=1(𝑠𝑖 − 𝜇𝑠2 )
2
𝜎𝑠2 =√ = √39.03 = 6.2474
25

b) Fără revenire:

194
Numărul total de eșantioane ce pot fi prelevate cu revenire, este: 𝐴25 = 20.
Repartiția de eșantionaj a mediei:
∑25
𝑖=1 𝑚𝑖 120
𝜇𝑋̅ = = = 6.0
20 20
2
∑25
𝑖=1(𝑚𝑖 − 𝜇𝑋̅ )
2
81
𝜎𝑋̅ = = = 4.05
20 20
La același rezultat ajungem dacă utilizăm relația:
𝜎2 𝑁 − 𝑛 10.8 5 − 2
𝜎𝑋2̅ = ∙( )= ∙( ) = 4.05
𝑛 𝑁−1 2 5−1
Aceste eșantioane sunt:

Es. 𝑥1 𝑥2 𝑚𝑖 𝑠𝑖2 Es. 𝑥1 𝑥2 𝜇 𝑠2


1 2 3 2.5 0.25 11 6 8 7 1
2 2 6 4 4 12 6 11 8.5 6.25
3 2 8 5 9 13 8 2 5 9
4 2 11 6.5 20.25 14 8 3 5.5 6.25
5 3 2 2.5 0.25 15 8 6 7 1
6 3 6 4.5 2.25 16 8 11 9.5 2.25
7 3 8 5.5 6.25 17 11 2 6.5 20.25
8 3 11 7 16 18 11 3 7 16
9 6 2 4 4 19 11 6 8.5 6.25
10 6 3 4.5 2.25 20 11 8 9.5 2.25

 120 135
Repartiția de eșantionaj a dispersiei:
∑25 2
𝑖=1 𝑠𝑖 135
𝜇𝑠 2 = = = 6.75
20 20
La același rezultat ajungem dacă utilizăm relația:
𝑁 𝑛−1 5 2−1
𝜇𝑠 2 = ( )∙( ) ∙ 𝜎2 = ( )∙( ) ∙ 10.8 =
𝑁−1 𝑛 5−1 2
= 6.75.
∑25 2
𝑖=1(𝑠𝑖 − 𝜇𝑠2 )
2
733.5
𝜎𝑠22 = = = 39.675.
20 20

∑25 2
𝑖=1(𝑠𝑖 − 𝜇𝑠2 )
2
𝜎𝑠2 =√ = √39.675 = 6.23
20

Definiția 10.9: Se numește coeficientul de variație de eșantionaj, valoarea numerică notată


cu 𝐶𝑉 și definită ca raportul dintre abaterea standard de eșantionaj și media
variabilei:

195
∑𝑛𝑖=1(𝑥𝑖 − 𝑚)2
√𝑠 2
𝑠 √
𝑛−1
𝐶𝑉 = = = , (10.23)
𝑚 𝑚 ∑𝑛𝑖=1 𝑥𝑖
𝑛
Definiția 10.10: Dacă considerăm șirul statisticilor de ordine pentru un eșantion de volum 𝑛:
𝑥(1) ≤ 𝑥(2) ≤ 𝑥(3) ≤ ⋯ ≤ 𝑥(𝑖) ≤ ⋯ 𝑥(𝑛)
atunci, cuantila de ordinul 𝒑, 𝑥𝑝 , a acestor valori este statistica de ordine:
𝑥𝑝 = 𝑥(𝑝∙(𝑛+1)) , (10.24)
Observații: Dacă expresia 𝑝 ∙ (𝑛 + 1) nu rezultă cu valoare întreagă, atunci pentru
determinarea cuantilei 𝑝 se recomandă utilizarea interpolării liniare.
Presupunem că după evaluarea expresiei 𝑝 ∙ (𝑛 + 1), constatăm că valoarea
cuantilei 𝑥𝑝 este cuprinsă în intervalul [𝑥(𝑘) , 𝑥(𝑘+1) ].
Pentru determinarea valorii cuantilei 𝑥𝑝 , se utilizează relația:

𝑥𝑝 = 𝑥(𝑘) + [𝑝 ∙ (𝑛 + 1) − 𝑘] ∙ [𝑥(𝑘+1) − 𝑥(𝑘) ], (10.25)

Exemplul 10.2
Să se determine cuantilele 𝑥0.25 , 𝑥0.50 și 𝑥0.75 , pe baza următoarelor date
de eșantionaj:
107, 98. 119, 76, 95, 87, 101, 122, 103, 112.
Soluție: a) 𝑥0.25 = 𝑥(0.25∙(10+1)) = 𝑥(2.75)  𝑥(2.75) ∈ [𝑥(2) , 𝑥(3) ]
𝑥0.25 = 87 + (2.75 − 2.0) ∙ (95 − 87) = 87 + 0.75 ∙ 8 = 93,
deoarece, șirul statisticilor de ordine este:
76 ≤ 87 ≤ 95 ≤ 98 ≤ 101 ≤ 103 ≤ 107 ≤ 112 ≤ 119 ≤ 122
b) 𝑥0.50 = 𝑥(0.50∙(10+1)) = 𝑥(5.5)  𝑥(5.5) ∈ [𝑥(5) , 𝑥(6) ]
𝑥0.50 = 101 + (5.5 − 5.0) ∙ (103 − 101) = 101 + 0.5 ∙ 2 = 102,
Într-adevăr, 𝑥0.50 = 𝑥𝑀𝑒 și
𝑥(10) + 𝑥(10+1)
𝑥(5) + 𝑥(6) 101 + 103
𝑥𝑀𝑒 = 2 2
= = = 102.
2 2 2
c) 𝑥0.75 = 𝑥(0.75∙(10+1)) = 𝑥(8.25)  𝑥(8.25) ∈ [𝑥(8) , 𝑥(9) ]
𝑥0.50 = 112 + (8.25 − 8.0) ∙ (119 − 102) = 112 + 0.25 ∙ 17 = 116.25

Indicatorii statistici de eșantionaj ai formei repartiției de frecvențe sunt: coeficientul de


asimetrie și coeficientul de boltire.

196
Definiția 10.11: Se numește asimetrie de eșantionaj, valoarea numerică notată cu 𝑔3 și definită
ca raportul dintre momentul centrat de eșantionaj şi abaterea standard de
eșantionaj la puterea a treia:

∑𝑛𝑖=1(𝑥𝑖 − 𝑚)3
𝑚3 𝑛
𝑔3 = 3 = 3, (10.26)
𝑠
∑𝑛𝑖=1(𝑥𝑖 − 𝑚)2 2
( )
𝑛−1
Observații: Valoarea obținută prin utilizarea ecuație (10.26), este de asemenea deplasată.
De aceea, pentru a obține estimații nedeplasate pentru asimetrie se recomandă
utilizarea expresiei corectate:
𝑛
√𝑛 ∙ (𝑛 − 1) 𝑛 𝑥𝑖 − 𝑚 3
𝐺3 = ∙ 𝑔3 = ∙ ∑( )
𝑛−2 (𝑛 − 1) ∙ (𝑛 − 2) 𝑠
𝑖=1

Definiția 10.12: Se numește coeficient de boltire de eșantionaj, raportul dintre momentul


centrat de ordinul patru de eșantionaj și abaterea standard de eșantionaj la
puterea a patra:

∑𝑛𝑖=1(𝑥𝑖 − 𝑚)4
𝑚4 𝑛
𝑔4 = 4 − 3 = − 3. (10.27)
𝑠 ∑𝑛𝑖=1(𝑥𝑖 − 𝑚)2 2
( )
𝑛−1
Observații: Valoarea obținută prin utilizarea ecuație (10.27), este de asemenea deplasată.
De aceea, pentru a obține estimații nedeplasate pentru boltire se recomandă
utilizarea expresiei corectate:
𝑛
𝑛 ∙ (𝑛 + 1) 𝑥𝑖 − 𝑚 4 3 ∙ (𝑛 − 1)2
𝐺4 = ∙ ∑( ) − .
(𝑛 − 1) ∙ (𝑛 − 2) ∙ (𝑛 − 3) 𝑠 (𝑛 − 2) ∙ (𝑛 − 3)
𝑖=1

Exemplul 10.3
Să se determine principalii indicatori statistici de eșantionaj folosind
următorul eșantion:
49.14, 48.19, 48.83, 49.74, 53.14, 50.37, 50.30, 48.89, 52.11, 50.25, 49.09,
51.42, 49.68, 48.11, 49.36, 48.38, 48.65, 49.92, 49.82, 49.00, 50.23, 49.75,
50.49, 49.18, 49.24, 51.93, 47.93, 48.36, 50.06, 50.32, 49.33, 51.27, 50.02,
50.45, 52.41, 51.64, 50.54, 49.30, 50.47, 50.40, 49.01, 51.92, 50.42, 48.77,
50.17, 52.89, 49.58, 50.66, 50.10, 50.26, 50.50, 49.83, 46.49, 50.08, 49.66,
50.90, 50.60, 50.71, 50.57, 49.14.
Soluție: Volumul eșantionului: 𝑛 = 60
Șirul statisticilor de ordine:
46.49 ≤ 47.93 ≤ 48.11 ≤ 48.19 ≤ 48.36 ≤ 48.38 ≤ 48.65 ≤ 48.77 ≤ 48.78 ≤
48.83 ≤ 48.89 ≤ 49.00 ≤ 49.01 ≤ 49.09 ≤ 49.14 ≤ 49.18 ≤ 49.24 ≤ 49.30 ≤
49.33 ≤ 49.36 ≤ 49.58 ≤ 49.66 ≤ 49.68 ≤ 49.74 ≤ 49.75 ≤ 49.82 ≤ 49.83 ≤
49.92 ≤ 50.02 ≤ 50.06 ≤ 50.08 ≤ 50.10 ≤ 50.17 ≤ 50.23 ≤ 50.25 ≤ 50.26 ≤

197
50.30 ≤ 50.32 ≤ 50.37 ≤ 50.40 ≤ 50.42 ≤ 50.45 ≤ 50.47 ≤ 50.49 ≤ 50.50 ≤
50.54 ≤ 50.57 ≤ 50.60 ≤ 50.66 ≤ 50.71 ≤ 50.90 ≤ 51.27 ≤ 51.42 ≤ 51.64 ≤
51.92 ≤ 51.93 ≤ 52.11 ≤ 52.41 ≤ 52.89 ≤ 53.14
Valoarea minimă de eșantionaj: 𝑥𝑚𝑖𝑛 = 𝑥(1) = 46.49
Valoarea maximă de eșantionaj: 𝑥𝑚𝑎𝑥 = 𝑥(𝑛) = 53.14
Media:
∑𝑛
𝑖=1 𝑥𝑖
𝑚= =49.994
𝑛
Mediana:
𝑥(𝑛) + 𝑥(𝑛+1) 𝑥(30) + 𝑥(31) 50.06 + 50.08
2 2
𝑥𝑀𝑒 = = = = 50.07
2 2 2
Moda:
𝑥𝑀𝑜 = 𝑚 − 3 ∙ (𝑚 − 𝑥𝑀𝑒 ) =50.223
Dispersia:
2
∑𝑛𝑖=1(𝑥𝑖 − 𝑚)2
𝑠 = = 1.520
𝑛−1
Abaterea standard:
∑𝑛 (𝑥𝑖 − 𝑚)2
𝑠 = √ 𝑖=1 = 1.233
𝑛−1
Eroarea standard:
𝑠
𝑆𝐸 = = 0.159153627
√𝑛
Coeficientul de variație:
𝑠
𝐶𝑉 = = 0.025
𝑚
Asimetria:
𝑛
𝑛 𝑥𝑖 − 𝑚 3
𝐺3 = ∙ ∑( ) = 0.173
(𝑛 − 1) ∙ (𝑛 − 2) 𝑠
𝑖=1
Coeficient de boltire:
𝑛 ∙ (𝑛 + 1)
𝐺4 =
(𝑛 − 1) ∙ (𝑛 − 2) ∙ (𝑛 − 3)
𝑛
𝑥𝑖 − 𝑚 4 3 ∙ (𝑛 − 1)2
∙ ∑( ) − = 0.803
𝑠 (𝑛 − 2) ∙ (𝑛 − 3)
𝑖=1

10.3.2 METODE NUMERICE PENTRU DESCRIEREA DATELOR


CANTITATIVE GRUPATE

După cum am văzut în UI 9, plecând de la un eșantion de date negrupate:


𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛
și construind histograma frecvenței relative, obținem o mulțime de date grupate, în 𝑘 intervale
de clasă. Fiecare clasă 𝑗, 𝑗 ∈ ̅̅̅̅̅
1, 𝑘 fiind determinată de limita inferioară, 𝑦𝑖 , o limită superioară a

198
clasei 𝑦𝑖+1 , o valoare centrală a clasei 𝑦𝑗′ și având amplitudinea 𝑤, precum și o frecvenţă
absolută, 𝑁𝑗 şi/sau o frecvenţă relativă 𝑓𝑗 .
Sunt de asemenea, diferite metode de eșantionare care conduc la obținerea unor date de
eșantionaj grupate pe clase.
Pentru astfel date grupate vom studia măsurile tendinței centrale și măsurile variației, precum
și modul de a calcula probabilități pentru diferite evenimente, utilizând histograma.
Și în acest caz, principalii indicatori statistici de eșantionaj sunt cazuri particulare, ca și în cazul
valorilor tipice ale unei variabile aleatorii, a momentelor de ordinul 𝑞 sau a momentelor centrate
de ordinul 𝑞.
Definiția 10.13: Momentul de ordinul 𝑞, 𝑚𝑞 a unui eşantion cu un efectiv de 𝑛 valori, grupate
în 𝑘 clase, este prin definiție:
𝑞 𝑘
∑𝑘𝑗=1 𝑁𝑗 ∙ (𝑦𝑗′ ) 𝑞
𝑚𝑞 = = ∑ 𝑓𝑗 ∙ (𝑦𝑗′ ) , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘, (10.28)
𝑛
𝑗=1
unde:
𝑦𝑗′ – reprezintă valorile centrale ale claselor;
𝑓𝑗 – reprezintă frecvența relativă;
𝑁𝑗 – reprezintă frecvența absolută;
𝑛 – reprezintă volumul de eșantion.
Definiția 10.14: Momentul centrat de ordinul 𝑞, 𝑚𝑞′ a unui eșantion cu un efectiv de 𝑛 valori,
grupate în 𝑘 clase, este prin definiție:
𝑞 𝑘
∑𝑘𝑗=1 𝑁𝑗 ∙ (𝑦𝑗′ − 𝑚) 𝑞
𝑚𝑞′ = = ∑ 𝑓𝑗 ∙ (𝑦𝑗′ − 𝑚) , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘, (10.29)
𝑛
𝑗=1
unde:
𝑦𝑗′ – reprezintă valorile centrale ale claselor;
𝑓𝑗 – reprezintă frecvența relativă;
𝑁𝑗 – reprezintă frecvența absolută;
𝑛 – reprezintă volumul de eșantion;
𝑚 – reprezintă media de eșantion, respectiv momentul de ordinul 𝑞 = 1, ecuația (10.30).
Analizând ecuațiile (10.28) și (10.29), constatăm că datorită modului de grupare a datelor,
respectiv modalității de alegere a numărului de clase și a calculului intervalelor de clasă, am
înlocuit valorile efective de eșantionaj, 𝑥𝑖 , cu mijloacele intervalelor de clasă 𝑦𝑗′ , iar frecvențele
relative și/sau absolute corespunzătoare unei clase se consideră concentrate la valoarea
centrului clasei, nu uniform repartizate pe lățimea unei clase, ca în cazul histogramei.
Aceste ipoteze simplificatoare introduc o serie de aproximații care induc erori de calcul
semnificative pentru momente de ordin superior lui 𝑞 = 2. De aceea nu se recomandă utilizarea
acestei metode la calcul momentelor de ordin superior.

199
Indicatorii statistici de eșantionaj ai tendinței de grupare (sau de poziționare) sunt: media de
eșantionaj, mediana de eșantionaj și moda de eșantionaj.
Definiția 10.15: Media aritmetică, 𝑚 a unui eşantion cu un efectiv de 𝑛 valori, grupate în 𝑘
clase, este prin definiție:
𝑘
∑𝑘𝑗=1 𝑁𝑗 ∙ 𝑦𝑗′
𝑚= = ∑ 𝑓𝑗 ∙ 𝑦𝑗′ , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘, (10.30)
𝑛
𝑗=1

Observații: a. Media aritmetică de eșantionaj obținută prin utilizarea ecuației (10.30)


reprezintă momentul de ordinul unu.
Dacă în cazul datelor negrupate, mediana reprezenta acea valoare care avea
la stânga și la dreapta sa același număr de valori ale eșantionului, în cazul
datelor grupate, se aplică un principiu similar.
Definiția 10.16: Mediana este valoarea pentru care ariile de sub histograma frecvenței relative
situate la dreapta și la stânga acestei valori sunt egale, fig. 10.1:
𝑛
− ∑𝑀𝑒−1
𝑗=1 𝑁𝑗
𝑥𝑀𝑒 = 𝑦𝑀𝑒 + 𝑑𝑀𝑒 = 𝑦𝑀𝑒 + 2 ∙𝑤 (10.31)
𝑁𝑀𝑒
Deci, pentru a determina valoarea medianei trebuie să identificăm clasa mediană. Acesta
reprezintă clasa ce conține frecvența relativă cumulată egală cu 0.50. În ecuația (10.31) s-au
folosit următoarele notații:
𝑦𝑀𝑒 - reprezintă limita inferioară a clasei mediane;
𝑦𝑀𝑒+1- reprezintă limita superioară a clasei mediane;
𝑁𝑀𝑒 - reprezintă frecvența absolută a clasei mediane;
𝑑𝑀𝑒 - reprezintă distanța dintre limita inferioară a clasei mediane și mediană;

𝑤
𝑑𝑀𝑒
𝑁𝑀𝑒
𝑁

𝑦𝑀𝑒 𝑥𝑀𝑒 𝑦𝑀𝑒+1

Figura 10.1 Schema de calculul a medianei pentru date grupate

Moda reprezintă valoarea de eșantionaj cu frecvența de apariție maximă. Deci, pentru date
grupate în 𝑘 clase, valoarea modei se poate determina aproximativ, ca fiind valoarea centrală a

200
clasei cu frecvența relativă/absolută maximă:
′ ′
𝑦𝑀𝑜 + 𝑦𝑀𝑜+1
𝑥𝑀𝑜 = , (10.32)
2
unde:
𝑀𝑜 = 𝑚𝑎𝑥 𝑁𝑗 = 𝑚𝑎𝑥 𝑓𝑗 .
1≤𝑗≤𝑘 1≤𝑗≤𝑘

Mai precis, mediana se poate determina, în situația valorilor de eșantionaj grupate în 𝑘 clase,
conform schiței din figura 10.2.

𝑤 𝑓𝑀𝑜
∆1

∆2
𝑓𝑀𝑜−1 𝑓𝑀𝑜+1

𝑦𝑀𝑜 𝑥𝑀𝑜
𝑦𝑀𝑜+1
Figura 10.2 Schema de calculul a modei pentru date grupate

Deci, pentru a determina valoarea modei trebuie să identificăm clasa modală. Acesta reprezintă
clasa cu frecvența relativă/absolută maximă. Pentru calculul valorii modale se utilizează
ecuația:
Δ1 𝑓𝑀𝑜 − 𝑓𝑀𝑜−1
𝑥𝑀𝑜 = 𝑦𝑀𝑜 + ∙ 𝑤 = 𝑦𝑀𝑜 + ∙ 𝑤, (10.33)
Δ1 + Δ2 2 ∙ 𝑓𝑀𝑜 − 𝑓𝑀𝑜−1 − 𝑓𝑀𝑜+1
În ecuația (10.33) s-au folosit următoarele notații:
𝑦𝑀𝑜 - reprezintă limita inferioară a clasei modale;
𝑦𝑀𝑜+1- reprezintă limita superioară a clasei modale;
𝑓𝑀𝑒 - reprezintă frecvența relativă a clasei modale;
𝑓𝑀𝑒−1- reprezintă frecvența relativă a clasei anterioare celei modale;
𝑓𝑀𝑒+1- reprezintă frecvența relativă a clasei posterioare celei modale și
Δ1 = 𝑓𝑀𝑜 − 𝑓𝑀𝑜−1
Δ2 = 𝑓𝑀𝑜 − 𝑓𝑀𝑜+1

Indicatorii statistici de eșantionaj ai tendinței de împrăștiere (sau de variație) sunt:


amplitudinea, dispersia de eșantionaj, abaterea medie pătratică și coeficientul de variație de
eșantionaj.
Definiția 4.42: Amplitudinea, 𝑅, unui eșantion cu un efectiv de 𝑛 valori, grupate în 𝑘 clase,
este prin definiție:

201
𝑅 = 𝑦𝑘+1 − 𝑦1 (10.34)
unde:
- 𝑦𝑘+1 , reprezintă limita superioară a clasei 𝑘,
- 𝑦1 , reprezintă limita inferioară a primei clase.
Definiția 10.17: Dispersia, 𝑠 2 , a unui eşantion cu un efectiv de 𝑛 valori, grupate în 𝑘 clase,
este prin definiție:
2 𝑘
∑𝑘𝑗=1 𝑁𝑗 ∙ (𝑦𝑗′ − 𝑚) 2
𝑠2 = = ∑ 𝑓𝑗 ∙ (𝑦𝑗′ − 𝑚) , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘, (10.35)
𝑛
𝑗=1
unde:
- 𝑦𝑗′ – reprezintă valorile centrale ale claselor;
- 𝑓𝑗 – reprezintă frecvența relativă;
- 𝑁𝑗 – reprezintă frecvența absolută;
- 𝑛 – reprezintă volumul de eșantion;
- 𝑚 – reprezintă media de eșantion, respectiv momentul de ordinul 𝑞 = 1, ecuația (10.30).
Observații: a. Valoarea numerică obținută prin utilizarea ecuației (10.35), reprezintă un
estimator deplasat al dispersiei de eșantionaj, vezi UI 12 (Estimarea
parametrilor), adică:
𝐸(𝑠 2 ) = 𝜇𝑠2 ≠ 𝜎 2 .
De aceea, relația (10.35) se utilizează doar pentru calcul dispersiei populației:
2 𝑘
∑𝑘𝑗=1 𝑁𝑗 ∙ (𝑦𝑗′ − 𝑚) 2
𝜎2 = = ∑ 𝑓𝑗 ∙ (𝑦𝑗′ − 𝑚) , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘 ,. (10.36)
𝑛
𝑗=1

b. Pentru determinarea valorii dispersiei de eșantionaj se utilizează relația


corectată:
2 𝑘
∑𝑘𝑗=1 𝑁𝑗 ∙ (𝑦𝑗′ − 𝑚) 𝑛 2
𝑠2 = = ∙ ∑ 𝑓𝑗 ∙ (𝑦𝑗′ − 𝑚) , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘 . (10.37)
𝑛−1 𝑛−1
𝑗=1

Ecuația (10.37) reprezintă un estimator nedeplasat al dispersiei de eșantionaj și se obține pe


baza relației (10.35):
𝑛−1 2
𝐸(𝑠 2 ) = 𝜇𝑠2 = ∙𝜎 ,
𝑛
Definiția 10.18: Abaterea standard, 𝑠, a unui eșantion cu un efectiv de 𝑛 valori, grupate în 𝑘
clase, este prin definiție rădăcina pătrată a dispersiei, respectiv:

2 𝑘
∑𝑘𝑗=1 𝑁𝑗 ∙ (𝑦𝑗′ − 𝑚) 𝑛 2
𝑠=√ =√ ∙ ∑ 𝑓𝑗 ∙ (𝑦𝑗′ − 𝑚) , 𝑗 ∈ ̅̅̅̅̅
1, 𝑘 . (10.38)
𝑛−1 𝑛−1
𝑗=1

202
Definiția 10.19: Se numește coeficientul de variație de eșantionaj, valoarea numerică notată
cu 𝐶𝑉 și definită ca raportul dintre abaterea standard de eșantionaj şi media
variabilei:
𝑘 ′ 2
√∑𝑗=1 𝑁𝑗 ∙ (𝑦𝑗 − 𝑚) 𝑛 2
√ ∑𝑘 ′
𝑠 𝑛−1 𝑛 − 1 ∙ 𝑗=1 𝑓𝑗 ∙ (𝑦𝑗 − 𝑚) (10.39)
𝐶𝑉 = = 𝑞 = ,
𝑚 ∑𝑘𝑗=1 𝑁𝑗 ∙(𝑦𝑗′ ) ∑𝑘𝑗=1 𝑓𝑗 ∙ 𝑦𝑗′
𝑛
Prin intermediul repartiției empirice obținută prin determinarea histogramei se pot calcula
valori ale probabilităților, de forma:
𝑃𝑟(𝑋 ≤ 𝑥).
Se procedează, astfel:
a) În funcție de valoarea variabilei aleatorii, 𝑥 se determină clasa în care se situează această
valoare. Vom nota cu 𝑦𝑥 şi 𝑦𝑥+1 limitele acestei clase și cu 𝑓𝑥 frecvenţa relativă
corespunzătoare a clasei.
b) Valoarea probabilității se determină cu relația:
𝑥 − 𝑦𝑥
𝑃𝑟(𝑋 ≤ 𝑥) = ∑ 𝑓𝑖 + 𝑝 = ∑ 𝑓𝑖 + ∙ 𝑓𝑥 , (10.40)
𝑤
𝑖<𝑥 𝑖<𝑥
Conform figurii 10.3:
𝑥 − 𝑦𝑥 𝑦𝑥+1 − 𝑦𝑥
= .
𝑝 𝑓𝑥
În relația anterioară observăm că, 𝑦𝑥+1 − 𝑦𝑥 = 𝑤. Rezultă:
𝑥 − 𝑦𝑥
𝑝= ∙ 𝑓𝑥
𝑤

𝑤
𝑓𝑥
𝑝

𝑦𝑥 𝑥 𝑦𝑥+1

Figura 10.3 Schema de calculul a modei pentru date grupate

 Enumerați care sunt cele trei categorii în care pot fi grupați indicatorii
statistici de eșantionaj.
 Definiți momentul de ordinul q de eșantionaj și momentul centrat de

203
ordinul q de eșantionaj.
 Enumerați și definiți indicatorii statistici de eșantionaj ai tendinței de
grupare, pentru date negrupate și precizați la fiecare principalele
proprietăți.
 Enumerați și definiți indicatorii statistici de eșantionaj ai tendinței de
împrăștiere, pentru date negrupate și precizați la fiecare principalele
proprietăți.
 Enumerați și definiți indicatorii statistici de eșantionaj ai formei
repartiției de frecvențe, pentru date negrupate și precizați la fiecare
principalele proprietăți.
 Definiți noțiunea de eroare standard.
 Precizați semnificația variabilei aleatorii hi-pătrat repartizată.
 Enumerați și definiți indicatorii statistici de eșantionaj ai tendinței de
grupare, pentru date grupate și precizați la fiecare principalele
proprietăți.
 Enumerați și definiți indicatorii statistici de eșantionaj ai tendinței de
împrăștiere, pentru date grupate și precizați la fiecare principalele
proprietăți.
 Enumerați și definiți indicatorii statistici de eșantionaj ai formei
repartiției de frecvențe, pentru date grupate și precizați la fiecare
principalele proprietăți.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Indicatori statistici de eșantionaj  Indicatorii statistici de eșantionaj


pentru date negrupate; ai tendinței de împrăștiere (sau
 Indicatori statistici de eșantionaj de variație):
pentru date grupate;  Amplitudinea de eșantionaj;
 Momentul de ordinul 𝑞 de  Dispersia de eșantionaj;
eșantionaj;  Abaterea medie pătratică de
 Momentul centrat de ordinul 𝑞 de eșantionaj;
eșantionaj;  Cuantilele de eșantionaj;
 Indicatori statistici ai tendinței de  Coeficientul de variație de
grupare (sau de poziționare) a eșantionaj;
valorilor de eșantionaj:  Indicatorii statistici de eșantionaj
 Media aritmetică; ai formei repartiției de frecvențe;
 Mediana de eșantionaj;  asimetrie de eșantionaj;

204
 Moda de eșantionaj;  coeficient de boltire de
 Eroare standard; eșantionaj;
 Repartiția hi-pătrat.

Rezumat
În această unitate de învățare s-a continuat prezentarea tehnicilor și metodelor de
investigație statistică descriptivă a fenomenelor de masă.
UI conține definițiile și relațiile de calcul a indicatorilor statistici de eșantionaj
pentru date negrupate și a indicatorilor statistici de eșantionaj pentru date
grupate în 𝑘 clase. Aceștia pot fi grupați în trei categorii:
 Indicatorii statistici de eșantionaj ai tendinței de grupare (sau de
poziționare) sunt: media de eșantionaj, mediana de eșantionaj și moda de
eșantionaj;
 Indicatorii statistici de eșantionaj ai tendinței de împrăștiere (sau de
variație) sunt: amplitudinea, dispersia de eșantionaj, abaterea medie
pătratică, cuantilele și coeficientul de variație de eșantionaj;
 Indicatorii statistici de eșantionaj ai formei repartiției de frecvențe sunt:
coeficientul de asimetrie și coeficientul de boltire.

Test de evaluare a cunoștințelor


P.10.1 Să se calculeze indicatorii statistici pentru următoarele date de eșantionaj
negrupate:
44.91 44.99 44.92 45.00 44.85
44.88 45.03 44.82 45.02 44.91
45.16 44.93 44.94 45.05 45.22
45.11 44.96 45.08 45.01 45.15
44.90 44.98 45.00 45.07 44.96
44.78 45.09 44.87 44.97 44.99
45.13 45.18 45.05 45.07 44.95
45.03 45.04 44.97 45.10 45.06
44.95 45.12 45.09 45.01 45.04
45.02 44.93 44.89 44.84 44.98
P.10.2 Folosind următoarele date de eșantionaj, grupate 8 clase:
Limita inf. Limita sup.
Clasa, 𝑖 𝑁𝑖
𝑦𝑖 𝑦𝑖+1
1 44.00 44.10 3
2 44.10 44.20 8
3 44.20 44.30 13
4 44.30 44.40 16
5 44.40 44.50 11
6 44.50 44.60 9
7 44.60 44.70 6
8 44.70 44.80 4

205
să se calculeze:
a. Frecvența relativă, frecvența absolută cumulată și frecvența relativă
cumulată.
b. Volumul de eșantion;
c. Centrul clasei și amplitudinea unei clase;
d. Valorile principalilor indicatori statistici de eșantionaj;
e. Să se calculeze: 𝑃𝑟(𝑋 ≤ 44.5) și 𝑃𝑟(𝑋 ≥ 44.36875).
P.10.3 Considerăm următoarele date de eșantionaj:
4.2, 4.7, 4.7, 5.0, 3.8, 3.6, 3.0, 5.1, 3.1, 3.8, 4.8, 4.0, 5.2,
4.3, 2.8, 2.0, 2.8, 3.3, 4.8, 5.0.
Să se calculeze:
a. Media aritmetică, mediana și moda de eșantionaj.
b. Dispersia și abaterea medie pătratică de eșantionaj;
c. Cuantilele 𝑥0.25 , 𝑥0.50 și 𝑥0.75 .

206
Unitatea de învățare 11.

Cuprins
11.1. Introducere ......................................................................................................... 207
11.2. Competențe ........................................................................................................ 207
11.3. Estimarea parametrilor ..................................................................................... 208
11.4. Metode de estimare punctuală........................................................................... 211
11.4.1. Metode grafice...................................................................................................211
11.4.2. Metoda celor mai mici pătrate ..........................................................................212
11.4.3. Metoda momentelor...........................................................................................213
11.4.4. Metoda verosimilității maxime ..........................................................................214
11.5. Estimarea parametrilor repartiției binomiale ................................................... 215
11.6. Estimarea parametrilor repartiției normale ..................................................... 217
11.7. Rezumat ............................................................................................................. 221
11.8. Test de evaluare ................................................................................................. 222

11.1. Introducere
Prezenta unitate de învățare este dedicată studierii metodelor de estimare
a parametrilor repartițiilor statistice. UI debutează cu definirea estimatorilor,
clasificarea lor și enumerarea principalelor metode utilizate, precum și cu
descrierea proprietăților estimatorilor. Aceste proprietăți permit departajarea
metodelor de estimare.
În continuare, sunt prezentate principiile și aparatul matematic specific obținerii
estimatorilor punctuali prin metoda grafică, metoda celor mai mici pătrate, metoda
momentelor și metoda verosimilității maxime. În cazul metodei verosimilității
maxime se prezintă și metoda de construire a intervalelor de încredere pentru
estimatorii punctuali.
Unitatea de învățare se încheie cu particularizarea acestor metode de estimare
punctuală și cu interval de încredere pentru repartiția binomială și repartiția
normală.

11.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să utilizeze
principalele metode de estimare punctuală și cu interval de încredere pentru
explicarea și interpretarea unor rezultate teoretice sau procese specifice
domeniului. De asemenea, va fi capabil să utilizeze adecvat metode de estimare
parametrică pentru aprecierea cantitativă a unor fenomene de masă, precum și
pentru prelucrarea și interpretarea rezultatele proceselor caracteristice
domeniului. Aceste metode permit, de asemenea, elaborarea de modele și proiecte

207
profesionale prin selectarea și utilizarea unor principii, metode și soluții
consacrate din statistică.

Durata medie de parcurgere a acestei unități de învățare este de 3 ore.

11.3 ESTIMAREA PARAMETRILOR

Modelarea fenomenelor reale care utilizează aparatul matematic al teoriei statisticii matematice
sau al teoriei fiabilității presupune asocierea dintre o lege de repartiție și un sistem real concret.
Considerăm o variabilă aleatorie 𝑋, la care legea repartiției este exprimată printr-o funcție dată:
densitatea de probabilitate, 𝑓(𝑥, 𝜃), sau funcţia de repartiţie, 𝐹(𝑥, 𝜃).
Această funcție este:
a) nespecificată - dacă expresia matematică a repartiției nu se cunoaște;
b) specificată - dacă conține anumiți parametri necunoscuți, 𝜃, care intervin în expresia legii
de repartiţie;
c) complet specificată - dacă la o funcție specificată se cunosc și valorile numerice ale tuturor
parametrilor.
Definiția 11.1 Operația prin care se determină valorile parametrilor, 𝜃, ai modelului statistic,
se numeşte estimarea parametrilor.
Definiția 11.2 Pentru a efectua estimarea parametrilor, formula, regula aleasă sau statistica
utilizată, având la bază un eșantion de volum 𝑛:
𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛
prelevat aleatoriu din populația variabilei 𝑋, se numeşte estimator.
Estimația este, la rândul său, o variabilă aleatorie dependentă de eșantion. Estimațiile pot fi:
a) Estimații neparametrice - dacă estimația se referă la probabilitatea necunoscută de apariție
a fenomenului sau la valoarea unui indicator statistic și a cărei aplicare nu necesită
identificarea legii de repartiție.
b) Estimație parametrică - dacă estimația se referă la un parametru necunoscut al modelului
statistic utilizat.
c) Estimație punctuală - dacă parametrul necunoscut al populației se estimează printr-o
valoare numerică, calculată pe baza unui estimator de forma:
𝜃̂ = 𝑔(𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , 𝜃). (11.1)
b) Estimație cu interval de încredere - dacă se stabilește un interval care să includă, cu o
probabilitate dată (1 − 𝛼), valoarea adevărată a parametrului necunoscut.
Construcția acestor intervale de încredere presupune cunoașterea repartiției statistice a
estimației punctuale, pentru parametrul estimat: 𝑓(𝜃̂|𝜃).
Intervalele de încredere pot fi:

208
a. Unilaterale cu o limită superioară. Acestea se obțin ca soluție a ecuației, vezi figura 11.1:
𝑃𝑟(𝜃 ≤ 𝜃̂𝑈 ) = 1 − 𝛼, (11.2)
iar intervalul unilateral cu limită superioară rezultă sub forma:
−∞ < 𝜃 ≤ 𝜃̂𝑈 ,
unde:
𝜃̂𝑈 – reprezintă limita superioară a intervalului de încredere;
1 − 𝛼 – reprezintă nivelul de încredere;
𝛼 – reprezintă nivelul de semnificație.
𝑓(𝜃̂|𝜃)

𝜃̂𝑈 𝜃̂
1−𝛼
Figura 11.1 Determinarea intervalelor de încredere unilaterale cu o limită superioară

b. Unilaterale cu o limită inferioară. Acestea se obțin ca soluție a ecuației, vezi figura 11.2:
𝑃𝑟(𝜃̂𝐿 ≥ 𝜃) = 1 − 𝛼, (11.3)
iar intervalul unilateral cu limită superioară rezultă sub forma:
𝜃̂𝐿 ≤ 𝜃 < ∞
unde:
𝜃̂𝐿 – reprezintă limita inferioară a intervalului de încredere;
𝜃̂𝐿 < 𝜃 ≤ 𝜃̂𝑈 ,
𝑓(𝜃̂ |𝜃)

𝜃̂𝐿 𝜃̂
1−𝛼

Figura 11.2 Determinarea intervalelor de încredere unilaterale cu o limită inferioară

209
c. Bilaterale simetrice. Acestea se obțin ca soluție a ecuației, vezi figura 11.3:
𝑃𝑟(𝜃̂𝐿 ≤ 𝜃 ≤ 𝜃̂𝑈 ) = 1 − 𝛼, (11.4)
iar intervalul bilateral simetric rezultă sub forma:
unde:
𝜃̂𝑈 – reprezintă limita superioară a intervalului de încredere;
𝜃̂𝐿 – reprezintă limita inferioară a intervalului de încredere;

𝑓(𝜃̂ |𝜃)

𝛼 𝛼
2 2

𝜃̂𝐿 𝜃̂𝑈 𝜃̂
1−𝛼

Figura 11.3 Determinarea intervalelor de încredere bilaterale

S-au pus la punct mai multe metode, pentru estimarea parametrilor, care caracterizează
diferitele modele statistice:
A. Metode grafice;
B. Metode analitice:
- metoda celor mai mici pătrate;
- metoda momentelor;
- metoda verosimilității maxime;
C. Metode bayesiene de estimare.
Aprecierea calității estimatorilor se realizează, de regulă, pe baza unor criterii statistice, definite
ca proprietăți ale estimatorilor:
1. Nedeplasarea. Estimația se numește nedeplasată, dacă valoarea medie teoretică coincide
cu valoarea adevărată a parametrului:
𝐸(𝜃̂ ) = 𝜃.

Deplasarea estimației - 𝐵(𝜃̂), se definește ca fiind:


𝐵(𝜃̂) = |𝐸(𝜃̂) − 𝜃|.
2. Consistența. O estimație se numește consistentă, dacă ea converge în probabilitate către
valoarea adevărată a parametrului, adică:
𝑙𝑖𝑚 𝑃𝑟(|𝜃̂ − 𝜃| < 𝜖) = 1, ∀ 𝜖 > 0.
𝑛→∞

210

3. Eroarea medie pătratică – MSE ̂ , (Mean Squared Eror). Această proprietate definită ca:
2 2
𝑀𝑆𝐸(𝜃̂) = 𝐸 [(𝜃̂ − 𝜃) ] = 𝑉(𝜃̂) + [𝐵(𝜃̂)] ,
unde:
2
𝑉(𝜃̂) = 𝐸 {[𝜃̂ − 𝐸(𝜃̂)] },
reflectă discrepanța dintre valoarea reală a parametrului și estimația lui, cuantificată prin
dispersie și deplasare.
4. Eficiența. O estimație 𝜃̂ a parametrului 𝜃 se numeşte eficientă, dacă este nedeplasată și are
dispersia minimă.

11.4 METODE DE ESTIMARE PUNCTUALĂ


11.4.1 METODE GRAFICE

Metoda grafică de estimare a parametrilor modelului statistic se bazează pe utilizează rețelelor


de probabilitate. Procedura generală de construire a rețelelor de probabilitate constă în
liniarizarea convenabilă a funcției de repartiție, a modelului statistic, presupus adecvat
reprezentării datelor.
Rețeaua de probabilitate reprezintă, de fapt, o coală gradată după un anumit trasaj pe cele doua
axe de coordonate, de obicei, simplu sau dublu logaritmat, pe care se reprezintă punctele
[𝑥(𝑖) , 𝐹𝑛(𝑥(𝑖) )], unde 𝑥(𝑖) reprezintă statisticile de ordine ale valorilor observate, ale
eșantionului de volum 𝑛, (𝑖 = ̅̅̅̅̅
1, 𝑛), iar 𝐹𝑛(𝑥(𝑖) ) reprezintă valorile probabilităților.
Valorile aproximative ale lui 𝐹𝑛(𝑥(𝑖) ) se determină, utilizând relația:
𝑖 − 0.3
𝐹𝑛(𝑥(𝑖) ) = . (11.5)
𝑛 + 0.4
Printre punctele astfel obținute, se trasează o dreaptă. Valorile estimate ale parametrilor
repartiției se obțin prin intermediul acestei drepte, direct de pe rețeaua de probabilitate în funcție
de proprietățile modelului statistic estimat.
Metoda prezintă o serie de avantaje:
 este rapidă;
 se poate constitui într-un test de concordanță, vezi fig. 11.4. Dacă punctele de pe rețea
au o tendință liniară de dispunere, putem afirma că modelul statistic ales este adecvat
modelării datelor de eșantionaj. Pentru modele statistice neadecvate se observă că
dispunerea punctelor poate fi concavă, convexă sau sub formă de 𝑆,
și o serie de dezavantaje:
 nu este aplicabilă la volume mari de eșantion;
 prezintă un grad mare de subiectivism la trasarea dreptei printre puncte, ceea ce conduce
la diferențe între valorile estimate ale parametrilor.

211
𝐹𝑛(𝑥(𝑖) ) 𝐹𝑛(𝑥(𝑖) )

Repartiție Repartiție cu
normală asimetrie negativă
Z Z

𝐹𝑛(𝑥(𝑖) )
𝐹𝑛(𝑥(𝑖) )

Repartiție cu Repartiția
asimetrie pozitivă uniformă
Z
Z

Figura 11.4 Dispunerea punctelor pe o rețea de probabilitate normală

11.4.2 METODA CELOR MAI MICI PĂTRATE

Ca și în cazul metodelor grafice de estimare, metoda celor mai mici pătrate se bazează pe
liniarizarea convenabilă a funcției de repartiție a modelului statistic.
Această metodă constă în determinarea parametrilor unei drepte, vezi fig. 11.5:
𝑦 =𝐴+𝐵∙𝑥 (11.6)
ce trece printre punctele care conțin observațiile statistice, astfel încât suma pătratelor abaterilor
existente între dreapta astfel trasată și mulțimea punctelor, 𝜀𝑖 , să fie minimă (Principiul Gauss-
Legendre):
𝑛 𝑛
𝜺=∑ 𝜀𝑖2 = ∑ (𝐴 + 𝐵 ∙ 𝑥𝑖 − 𝑦𝑖 )2 = 𝑚𝑖𝑛. (11.7)
𝑖=1 𝑖=1

Punând condiția de minim relației (11.7):


𝜕𝜀
=0
{𝜕𝐴 ,
𝜕𝜀
=0
𝜕𝐵
se obține:

212
𝑛

2 ∙ ∑(𝐴 + 𝐵 ∙ 𝑥𝑖 − 𝑦𝑖 ) = 0
𝑖=1
𝑛 . (11.8)
2 ∙ ∑(𝐴 + 𝐵 ∙ 𝑥𝑖 − 𝑦𝑖 ) ∙ 𝑥𝑖 = 0
{ 𝑖=1
Prin rezolvarea sistemul de ecuații (1.88), se obțin estimațiile 𝐴̂ și 𝐵̂ ale parametrilor dreptei:
𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖 ∙ 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ∙ ∑𝑛𝑖=1 𝑦𝑖
𝐴̂ =
𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2
. (11.9)
𝑛 ∙ ∑𝑛𝑖=1 𝑦𝑖 ∙ ∑𝑛𝑖=1 𝑥𝑖2 − ∑𝑛𝑖=1 𝑥𝑖 ∙ ∑𝑛𝑖=1 𝑥𝑖 ∙ 𝑦𝑖
𝐵̂ =
{ 𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2

y
yn
Pn(xn,yn)
i

Pi1(xi,yi)
Pn-1(xn-1,yn-1)
yi
𝑡𝑔𝛼 = 𝐴

Pi2(xi,A+Bxi)
P2(x2,y2)
y2
P3(x3,y3 𝑦 = 𝐴 + 𝐵 𝑥
)
y1
P1(x1,y1)
B

0 x1 x2  xi  xn x

Fig. 11.5 Utilizarea principiului celor mai mici pătrate în cazul regresiei liniare

Aceste relații, (11.9), împreună cu ecuațiile rezultate din liniarizarea modelului statistic permit
estimarea parametrilor repartițiilor.

11.4.3 METODA MOMENTELOR

Metoda momentelor a fost dezvoltată de K. Pearson și constă în egalarea momentelor teoretice,


𝜇𝑞 , până la ordinul 𝑞, ale repartiţiei 𝑓(𝑥𝑖 , 𝜃1 , ⋯ , 𝜃𝑗 , ⋯ 𝜃𝑞 ), cu momentele de eşantionaj, 𝑚𝑞 :

𝜇𝑖 = 𝑚𝑖 , 𝑗 = ̅̅̅̅̅
1, 𝑞 . (11.10)
Se obține astfel un sistem de ecuații a cărui rezolvare furnizează valorile estimate ale
parametrilor, 𝜃̂𝑗 , 𝑗 = ̅̅̅̅̅
1, 𝑞.

213
Observații: 1. Acest procedeu de estimare este o metoda intuitivă, având o slabă
justificare teoretică.
2. Metoda nu se poate utiliza la estimarea parametrilor în cazul eșantioanelor
incomplete.
3. Nu se recomandă utilizarea acestei metode pentru modele statistice care
prezintă asimetrie pronunțată.
4. Nu se recomandă utilizarea acestei metode pentru modele statistice care au
mai mult de doi parametri necunoscuți, întrucât erorile introduse sunt, adesea,
foarte mari.
5. Estimațiile obținute prin metoda momentelor nu prezintă proprietatea
numită eficientă. De aceea, nu se recomandă utilizarea lor decât în absența
altor estimatori.

11.4.4 METODA VEROSIMILITĂŢII MAXIME

Aceasta metodă a fost dezvoltată de R.A. Fisher, care a introdus conceptul de funcție de
verosimilitate pentru un eșantion de 𝑛 observații independente:
𝑛

ℒ(𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 , 𝚯) = ∏ 𝑓(𝑥𝑖 , 𝚯). (11.11)


𝑖=1

Principiul metodei verosimilității maxime constă în determinarea valorilor estimate ale


parametrilor necunoscuți:
𝚯 = 𝚯(𝜃1 , ⋯ , 𝜃𝑗 , ⋯ , 𝜃𝑞 ),
care asigură maximul funcției de verosimilitate, construită pe baza valorilor de eșantionaj,
𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑛.
Pentru comoditatea calcului se obișnuiește a se lucra cu logaritmul funcției de verosimilitate:
𝑙𝑛[ℒ(𝑥𝑖 , 𝚯)] = 𝑙𝑛𝑓(𝑥1 , 𝚯) + 𝑙𝑛𝑓(𝑥2 , 𝚯) + ⋯ + 𝑙𝑛𝑓(𝑥𝑛 , 𝚯). (11.12)
Estimațiile de verosimilitate maximă reprezintă, deci, soluțiile următorului sistem de ecuații
normale:
𝜕𝑙𝑛[ℒ(𝑥𝑖 , 𝚯)] 1 𝜕𝑙𝑛𝑓(𝑥1 , 𝚯) 1 𝜕𝑙𝑛𝑓(𝑥𝑛 , 𝚯)
= ∙ + ⋯+ ∙ ,
𝜕𝜃𝑗 𝑓(𝑥1 , 𝚯) 𝜕𝜃𝑗 𝑓(𝑥𝑛 , 𝚯) 𝜕𝑓(𝑥𝑛 , 𝚯) (11.13)
𝑖 = ̅̅̅̅̅
1, 𝑛 și 𝑗 = ̅̅̅̅̅
1, 𝑞.
Funcția de verosimilitate pentru un eșantion de 𝑛 observaţii independente, dată de ecuația
(11.11) este valabilă doar pentru cazul variabilelor aleatorii continue. În cazul variabilelor
aleatorii discrete, această ecuație devine:
𝑛

ℒ(𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 , 𝚯) = ∏ 𝑃𝑟(𝑋 = 𝑥𝑖 , 𝚯), (11.14)


𝑖=1
prin înlocuirea funcției densitate de probabilitate cu cea a funcției de probabilitate.

214
Observații: 1. Estimatorii de verosimilitate maximă sunt consistenți și asimptotic
eficienți.
2. Estimatorii de verosimilitate maximă prezintă proprietatea de suficiență.
3. Estimatorii de verosimilitate maximă sunt asimptotic nedeplasați.
4. Variabila aleatorie:

√𝑛 ∙ (𝜃̂ − 𝜃),
este asimptotic normal repartizată cu media zero şi dispersia:
−1
𝜕 2 𝑙𝑛ℒ(𝑥𝑖 , 𝚯)
lim 𝑛 ∙ 𝑉(𝜃̂𝑗 ) = − {𝐸 [ ]}
𝑛→∞ 𝜕𝜃𝑗2
Utilizarea acestei proprietăți face posibilă construirea intervalelor de
încredere pentru valorile estimate ale parametrilor, 𝜃𝑗 .
În cazul eșantioanelor de volum mic, utilizarea proprietăților asimptotice
ale estimațiilor de verosimilitate maximă, la determinarea limitelor de
încredere nu este recomandată, întrucât intervalele de încredere rezultă cu
dimensiuni foarte mari.
5. În cazul eșantioanelor de volum mic, incomplete, estimațiile de
verosimilitate maximă sunt deplasate.

11.5 ESTIMAREA PARAMETRILOR REPARTIȚIEI BINOMIALE

a. Estimarea punctuală a parametrilor prin metoda verosimilității maxime


Dacă dintr-o populație binomial repartizată (variabila aleatorie poate avea doar două stări:
succes sau eșec) necunoscută ca structură, realizăm 𝑛 extrageri bernoulliene cu revenire și
obținem 𝑘 succese și 𝑛 − 𝑘 eșecuri, funcția de verosimilitate este:
ℒ(𝑝) = 𝐶𝑛𝑘 ∙ 𝑝 𝑥 ∙ (1 − 𝑝)𝑛−𝑘 ,
Logaritmul funcției de verosimilitate este:
𝑙𝑛ℒ(𝑝) = 𝑙𝑛(𝐶𝑛𝑘 ) + 𝑘 ∙ 𝑙𝑛𝑝 + (𝑛 − 𝑘) ∙ 𝑙𝑛(1 − 𝑝).
Estimația punctuală de verosimilitate maximă se obține din condiția de maxim:
𝜕𝑙𝑛ℒ(𝑝) 𝑘 𝑛 − 𝑘
= − = 0,
𝜕𝑝 𝑝 1−𝑝
rezultă:
𝑘
𝑝̂ = . (11.15)
𝑛
Conform ecuației (5.11), constatăm că estimația parametrului necunoscut 𝑝, reprezintă de fapt
proporția de indivizi, ai populației, ce prezintă o anumită proprietate, astfel încât extragerea
acestora să fie considerată un succes.
Observații: a. Valoarea estimată 𝑝̂ , reprezintă un estimator nedeplasat al proporției:
𝜇𝑝 = 𝑝.

215
b. Repartiția de eșantionaj a proporției, 𝑝̂ , este caracterizată de o abatere
standard:

𝑝 ∙ (1 − 𝑝)
𝜎𝑝 = √ .
𝑛

c. Pentru valori mari ale lui 𝑛 (𝑛 ≥ 30), repartiția de eșantionaj al proporției


este asimptotic normal repartizată, conform teoremei limită centrală.

b. Estimarea cu interval de încredere


Dacă numărul de extrageri bernoulliene, 𝑛, este mare, atunci variabila aleatorie:
𝑋−𝑛∙𝑝 𝑝̂ − 𝑝
𝑍= =
√𝑛 ∙ 𝑝 ∙ (1 − 𝑝) √𝑝 ∙ (1 − 𝑝) (11.16)
𝑛
este aproximativ normal repartizată.
Intervalul de încredere bilateral simetric rezultă ca soluție a ecuației:
𝑃𝑟 (𝑧𝛼 ≤ 𝑍 ≤ 𝑧1−𝛼 ) = 1 − 𝛼.
2 2

Dacă în ecuația anterioară se înlocuiește 𝑍 cu expresia (11.16) se obține:

𝑝̂ − 𝑝
𝑃𝑟 𝑧𝛼 ≤ ≤ 𝑧1−𝛼 =1−𝛼
√𝑝̂ ∙ (1 − 𝑝̂ )
2 2
( 𝑛 )
și

𝑝̂ ∙ (1 − 𝑝̂ ) 𝑝̂ ∙ (1 − 𝑝̂ )
𝑃𝑟 (𝑝̂ +𝑧𝛼 ∙ √ ≤ 𝑝 ≤ 𝑝̂ +𝑧1−𝛼 ∙ √ ) = 1 − 𝛼,
2 𝑛 2 𝑛

iar intervalul de încredere bilateral simetric, al parametrului 𝑝, corespunzător unui nivel de


încredere (1 − 𝛼), este:

𝑝̂ ∙ (1 − 𝑝̂ ) 𝑝̂ ∙ (1 − 𝑝̂ )
𝑝̂ +𝑧𝛼 ∙ √ ≤ 𝑝 ≤ 𝑝̂ +𝑧1−𝛼 ∙ √ .
2 𝑛 2 𝑛

Exemplul 11.1
Din procesul de fabricație al unei piese se extrag 𝑛 = 85 de repere. În
urma analizei, rezultă că un număr de 𝑥 = 10 prezintă defecte de suprafață. Să
se determine intervalul de încredere 95% pentru procentul de repere
neconforme.
Soluție: 1 − 𝛼 = 0.95 ⇒ 𝛼 = 0.05 și 𝛼 ⁄2 = 0.025
𝑧0.025 = −1.96.
𝑧0.975 = 1.96

216
𝑥 10
𝑝̂ = = = 0.12
𝑛 85
Rezultă:

0.12 ∙ (1 − 0.12) 0.12 ∙ (1 − 0.12)


0.12 − 1.96 ∙ √ ≤ 𝑝 ≤ 0.12 + 1.96 ∙ √
85 85
⇒ 0.05 ≤ 𝑝 ≤ 0.19.

11.6 ESTIMAREA PARAMETRILOR REPARTIȚIEI NORMALE

a. Estimarea punctuală a parametrilor prin metoda grafică


Liniarizarea modelului repartiției normale se poate realiza pornind de la egalitatea:
𝑥−𝜇
𝐹(𝑥) = Φ ( ),
𝜎
prin inversarea funcției integrale Laplace:
𝑥 𝜇
Φ−1 [𝐹(𝑥)] = − . (11.17)
𝜎 𝜎
Ecuația (11.17) reprezintă ecuația unei drepte, (11.6), dacă considerăm următoarele relații de
echivalență:
𝑦 = Φ−1 [𝐹(𝑥)]
𝜇
𝐴=−
𝜎 . (11.18)
1
{𝐵 = 𝜎
Ultimele două relații din sistemul (11.18) ne furnizează și regulile pentru trasarea rețelei de
probabilitate normală.
În anexa VII, se află un model pentru rețeaua de probabilitate normală.
După ce sunt parcurse etapele prezentate la punctul 11.4.1, valorile estimate ale parametrilor
repartiției normale se obțin folosindu-ne de proprietățile repartiției normale:
 datorită faptului că acest model este simetric, iar axa de simetric este valoarea medie,
rezultă:
𝜇̂ = 𝑥0.50 . (11.19)
 conform fig. 8.4, estimația abaterii standard se poate obține cu una din relațiile:
𝜎̂ = 𝑥0.841 − 𝜇̂
𝜎̂ = 𝜇̂ − 𝑥0.159
{ 𝑥0.841 − 𝑥0.159 . (11.20)
𝜎̂ =
2

b. Estimarea punctuală a parametrilor prin metoda celor mai mici pătrate:


Deoarece și această metodă utilizează liniarizarea modelului statistic, valorile probabilităților
corespunzătoare datelor de eșantionaj, 𝐹𝑛(𝑥(𝑖) ), sunt transformate în valorile ordonatelor
punctelor situate pe o dreaptă prin utilizare primei ecuații a sistemului (11.18):

217
𝑦(𝑖) = Φ−1 [𝐹𝑛(𝑥(𝑖) )].
Pe baza acestor valori, (𝑥(𝑖) , 𝑦(𝑖) ), se estimează parametrii dreptei de regresie, folosind
ecuațiile (11.9). Valorile estimate ale parametrilor repartiției normale, prin această metodă se
obțin conform sistemului (11.18), adică:
1
𝜎̂ =
{ 𝐵̂ .
̂
𝜇̂ = −𝐴 ∙ 𝜎̂

c. Estimarea punctuală a parametrilor prin metoda momentelor


Pe baza unui eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:
𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
estimațiile prin metoda momentelor se obțin prin aplicarea principiului acestei metode:
𝜇=𝑚
{𝜇 = 𝑚 , (11.21)
2 2
adică egalarea primelor două momente teoretice cu cele de eșantionaj.
Dar:
𝜎 2 = 𝜇2 − 𝜇 2
𝑠 2 = 𝑚2 − 𝑚 2 ,
iar ecuațiile (11.21), devin:
𝜇=𝑚
{ 2 , (11.22)
𝜎 = 𝑠2
și expresiile estimațiilor punctuale prin metoda momentelor, sunt:
𝑛
1
𝜇̂ = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛 , (11.23)
1
𝜎̂ 2 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2
{ 𝑛 − 1
𝑖=1

d. Estimarea punctuală a parametrilor prin metoda verosimilității maxime


Pe baza unui eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:
𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
funcția de verosimilitate, sau densitatea de probabilitate a datelor de eșantionaj, este:
𝑛

ℒ(𝑥𝑖 , μ, σ) = ∏ 𝑓(𝑥𝑖 , μ, σ) =
𝑖=1
1 1 𝑥1 −𝜇 2 1 1 𝑥𝑖 −𝜇 2 1 1 𝑥𝑛 −𝜇 2
𝑒 −2∙( )
𝑒 −2∙( )
𝑒 −2∙( ) (11.24)
= 𝜎 ⋯ 𝜎 ⋯ 𝜎 =
𝜎 ∙ √2 ∙ 𝜋 𝜎 ∙ √2 ∙ 𝜋 𝜎 ∙ √2 ∙ 𝜋
1 −
1
∙∑𝑛 (𝑥 −𝜇)2
= 𝑛 ∙𝑒 2∙𝜎2 𝑖=1 𝑖
(2 ∙ 𝜋 ∙ 𝜎 2)2
Logaritmul funcției de verosimilitate, 𝑙𝑛ℒ(𝑥𝑖 , μ, σ), se obține logaritmând ecuația (11.24):

218
𝑛
𝑛 1
𝑙𝑛ℒ(𝑥𝑖 , μ, σ) = − ∙ 𝑙𝑛(2 ∙ 𝜋 ∙ 𝜎 2 ) − ∙ ∑(𝑥𝑖 − 𝜇)2 .
2 2 ∙ 𝜎2
𝑖=1
Estimațiile punctuale de verosimilitate maximă se obțin din condiția de maxim a ecuației
anterioare:
𝑛
𝜕𝑙𝑛ℒ(𝑥𝑖 , μ, σ) 1
= − 2 ∙ ∑(𝑥𝑖 − 𝜇) = 0
𝜕𝜇 𝜎
𝑖=1
𝑛
𝜕𝑙𝑛ℒ(𝑥𝑖 , μ, σ) 𝑛 1
2)
= − 2
+ 4
∙ ∑(𝑥𝑖 − 𝜇)2 = 0
{ 𝜕(𝜎 2 ∙ 𝜎 2 ∙ 𝜎
𝑖=1
Rezolvând acest sistem de ecuații, obținem:
𝑛
1
𝜇̂ = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1
𝑛 , (11.25)
1
𝜎̂ 2 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2
{ 𝑛
𝑖=1

Ecuațiile (11.25) reprezintă estimațiile punctuale, de verosimilitate maximă, a parametrilor


repartiției normale.
Se constată că, aceste ecuații sunt asemănătoare celor obținute prin metoda momentelor, cu
diferența că în cazul dispersiei estimatorul, astfel obținut, este deplasat.

Exemplul 11.2
Pe baza datelor de eșantionaj:
30, 66, 72, 81, 102, 114,
să se estimeze parametrii repartiției normale, prin:
 Metoda grafică;
 Metoda celor mai mici pătrate;
 Metoda momentelor;
 Metoda verosimilității maxime.
Soluție: a. În tabelul de mai jos s-au determinat probabilitățile corespunzătoare
datelor de eșantionaj:
𝑖−0.3
𝑖 𝑥(𝑖) 𝐹𝑛(𝑥(𝑖) ) =
𝑛+0.4
.
1 30 0.109375
2 66 0.265625
3 72 0.421875
4 81 0.578125
5 102 0.734375
6 114 0.890625
Rețeaua de probabilitate corespunzătoare acestor valori este cea din fig.
11.6. Rezultă
𝜇̂ = 𝑥0.50 = 78 și

219
𝑥0.841 − 𝑥0.159 109 − 47
𝜎̂ = = = 31.
2 2

𝐹(𝑥)

𝑋
47 78 109

Figura 11.6 Rețeaua de probabilitate normală pentru exemplu 11.2

b. Prin metoda celor mai mici pătrate, se obțin:


𝑖−0.3
𝑖 𝑥(𝑖) 𝐹𝑛(𝑥(𝑖) ) = 𝑛+0.4. 𝑦(𝑖) = Φ−1 [𝐹𝑛(𝑥(𝑖) )] 𝑥(𝑖) ∙ 𝑦(𝑖)

1 30 0.109375 -1.230 -0.1345


2 66 0.265625 -0.626 -0.1663
3 72 0.421875 -0.197 -0.0832
4 81 0.578125 0.197 0.1139
5 102 0.734375 0.626 0.4598
6 114 0.890625 1.230 1.0953
 465 - 0 1.2851
̂ 𝜇̂ = 77.5
{ 𝐴 = −2.26668 ⇒ {
̂
𝐵 = 0.02924 𝜎̂ = 34.19
c. Prin metoda momentelor, se obțin:
𝜇̂ = 77.5
{ .
𝜎̂ = 29.54
d. Prin metoda verosimilității maxime:
𝜇̂ = 77.5
{ .
𝜎̂ = 26.97

220
 Definiți noțiunile de estimare a parametrilor și estimator.
 Enumerați tipurile de estimații.
 Enumerați și definiți tipurile de intervale de încredere.
 Enumerați proprietățile estimatorilor .
 Enumerați metodele de estimare parametrică și precizați, la fiecare,
principiile ce stau la baza aparatului matematic.
 Precizați estimatorul punctual al repartiției binomiale și construiți cele
trei tipuri de intervale de încredere.
 Descrieți metodologia determinării estimațiilor punctuale, prin metoda
grafică, în cazul repartiției normale.
 Precizați expresia estimatorilor punctuali ai repartiției normale, obținuți
prin metoda momentelor și cea a verosimilității maxime.
 Descrieți metodologia determinării estimațiilor punctuale, prin metoda
celor mai mici pătrate, în cazul repartiției normale.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Estimații neparametrice;  Consistența;


 Estimație parametrică;  Eroarea medie pătratică;
 Eficiența
 Estimație punctuală;
 Metode grafice de estimare
 Estimație cu interval de
parametrică;
încredere;
 Metode analitice de estimare
 Intervale de încredere:
parametrică:
 Unilaterale cu o limită
 Metoda celor mai mici
superioară;
pătrate;
 Unilaterale cu o limită  Metoda momentelor;
inferioară;
 Metoda verosimilității
 Bilaterale simetrice; maxime.
 Proprietățile estimatorilor:
 Nedeplasarea;

Rezumat
În această unitate de învățare s-a început prezentarea unui capitol deosebit de
important al statisticii inferențiale, estimarea parametrilor.
La începutul UI se definesc principalele noțiuni cu care acest capitol operează:
estimație punctuală și estimație cu interval de încredere, precum și proprietățile
estimatorilor.

221
În continuare sunt prezentate cele mai uzuale metode de estimare parametrică:
Metode grafice, metoda celor mai mici pătrate, metoda momentelor și metoda
verosimilității maxime.
Particularitățile de aplicare ale acestor metode, pentru estimarea punctuală și cu
interval de încredere, sunt exemplificate în cazul repartiției binomiale și în cazul
repartiției normale.
În următoarea UI se prezintă modul de construire al intervalelor de încredere
pentru parametrii repartiției normale, precum și testarea ipotezelor statistice
pentru parametrii aceleiași repartiții.

Test de evaluare a cunoștințelor


P.11.1 O urnă conține bile albe și roșii în proporție necunoscută. Din urnă se extrag, cu
revenire, 60 de bile. După numărarea lor se constată că în eșantion 70% dintre
ele sunt roșii. Să se calculeze:
a. Intervalul de încredere 90%, unilateral cu o limită inferioară pentru
proporția de bile roșii;
b. Intervalul de încredere 90%, unilateral cu o limită inferioară pentru
proporția de bile albe;
c. Intervalul de încredere 95%, bilateral simetric pentru proporția de bile
roșii;
P.11.2 Pe baza datelor de eșantionaj:
41, 33, 38, 26, 8, 51, 47, 63, 84, 70,
să se estimeze parametrii repartiției normale, prin:
a. Metoda grafică;
b. Metoda celor mai mici pătrate;
c. Metoda momentelor;
d. Metoda verosimilității maxime.
P.11.3 Considerăm următoarele date de eșantionaj:
92 70 32 35 75
52 108 20 78 80
124 44 84 117 5
109 31 81 32 25
79 2 61 79 114
25 53 81 72 72
83 93 96 95 74
43 81 61 37 37
Să se estimeze parametrii repartiției normale, prin:
a. Metoda celor mai mici pătrate;
b. Metoda momentelor;
c. Metoda verosimilității maxime.

222
Unitatea de învățare 12.

Cuprins
12.1. Introducere ......................................................................................................... 223
12.2. Competențe ........................................................................................................ 223
12.3. Estimarea parametrilor repartiției normale ...................................................... 224
12.3.1. Intervale de încredere pentru medie .................................................................224
12.3.2. Intervale de încredere pentru dispersie și abaterea standard...........................227
12.4. Verificarea ipotezelor statistice......................................................................... 229
12.4.1. Test de comparare a mediilor de eșantionaj
(când se cunoaște dispersia) ............................................................................233
12.4.2. Test de comparare a mediilor de eșantionaj
(când nu se cunoaște dispersia) .......................................................................234
12.4.3. Test de comparare a dispersiei unei populații normale ....................................235
12.5. Rezumat ............................................................................................................. 237
12.6. Test de evaluare ................................................................................................. 237

12.1. Introducere
În această unitate de învățare se continuă tratarea unor elemente specifice
ale teoriei estimației. Astfel, sunt prezentate metodele de construcție a intervalelor
de încredere pentru parametrii repartiției normale pentru trei situații întâlnite des
în aplicațiile practice.
UI continuă cu un alt capitol important al statisticii inferențiale: verificarea
ipotezelor statistice. În această parte, la început sunt definiți principalii termeni
utilizați, erorile și riscurile ce pot apare în luarea deciziilor statistice. Este, de
asemenea, prezentat algoritmul ce trebuie urmat pentru rezolvarea oricărei
probleme de decizie statistică, precum și legătura ce există între calcul intervalelor
de încredere și verificarea ipotezelor statistice.
UI se încheie cu prezentarea testelor de verificare a ipotezelor statistice referitoare
la parametrii repartiției normale.

12.2. Competențele unității de învățare


După parcurgerea materialului studentul va fi capabil să utilizeze metode
prin care să poată lua decizii pentru explicarea și interpretarea unor rezultate
teoretice sau procese specifice domeniului. De asemenea, va fi capabil să utilizeze
adecvat diferite teste de verificare a ipotezelor statistice pentru aprecierea
cantitativă a unor fenomene de masă, precum și pentru prelucrarea și interpretarea
rezultatele proceselor caracteristice domeniului. Aceste metode permit, de
asemenea, elaborarea de modele și proiecte profesionale prin selectarea și
utilizarea unor principii, metode și soluții consacrate din statistică.

223
Durata medie de parcurgere a acestei unități de învățare este de 3 ore.

12.3 ESTIMAREA PARAMETRILOR REPARTIȚIEI NORMALE


12.3.1. INTERVALE DE ÎNCREDERE PENTRU MEDIE

Cazul 1 – valoarea dispersiei este cunoscută, 𝜎 2


Considerăm un eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:
𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
cu valoarea parametrului 𝜎, cunoscută.
În acest caz, estimatorul mediei:
𝑛
1
𝜇̂ = ∙ ∑ 𝑥𝑖 ,
𝑛
𝑖=1

este normal repartizat cu media 𝜇 și dispersia 𝜎 2 ⁄𝑛, adică variabila aleatorie:


𝑋̅ − 𝜇
𝑍= ~𝒩(𝑧, 0,1). (12.1)
𝜎⁄√𝑛
Intervalul de încredere, [𝜇𝐿 , 𝜇𝑈 ] ce conține valoarea adevărată a parametrului 𝜇, cu o
probabilitate (1 − 𝛼), reprezintă soluția ecuației:
𝑃𝑟(𝜇𝐿 ≤ 𝜇 ≤ 𝜇𝑈 ) = 1 − 𝛼. (12.2)
Deci, pe baza relației (12.1), ecuația (12.2), devine:
𝑋̅ − 𝜇
𝑃𝑟 (𝑧𝛼 ≤ ≤ 𝑧1−𝛼 ) = 1 − 𝛼.
2 𝜎⁄√𝑛 2

Prelucrând ecuația anterioară, rezultă:


𝑃𝑟 (𝑥̅ + 𝑧𝛼 ∙ 𝜎⁄√𝑛 ≤ 𝜇 ≤ 𝑥̅ − 𝑧1−𝛼 ∙ 𝜎⁄√𝑛) = 1 − 𝛼,
2 2
dar:
−𝑧𝛼 = 𝑧1−𝛼
2 2
și intervalul de încredere, [𝜇𝐿 , 𝜇𝑈 ], bilateral simetric, ce conține valoarea adevărată a
parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:

[𝑥̅ + 𝑧𝛼 ∙ 𝜎⁄√𝑛 ≤ 𝜇 ≤ 𝑥̅ − 𝑧𝛼 ∙ 𝜎⁄√𝑛]. (12.3)


2 2

Intervalul de încredere, [𝜇𝐿 , ∞], unilateral cu o limită inferioară, ce conține valoarea


adevărată a parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:
[𝑥̅ + 𝑧𝛼 ∙ 𝜎⁄√𝑛 ≤ 𝜇 ≤ ∞]. (12.4)
Intervalul de încredere, [−∞, 𝜇𝑈 ], unilateral cu o limită superioară, ce conține valoarea
adevărată a parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:

224
[−∞ ≤ 𝜇 ≤ 𝑥̅ − 𝑧𝛼 ∙ 𝜎⁄√𝑛]. (12.5)

Exemplul 12.1
Să se determine intervalul de încredere bilateral simetric pentru medie,
cu un nivel de încredere 95%, folosind următoarele date de eșantionaj:
29.4, 27.5, 30.5, 32.6, 32.4, 33.5, 25.6, 29.5, 32.2, 27.8,
prelevate dintr-o populație normal repartizată având 𝜎 = 1.6.
Soluție: 𝑛 = 10
𝑛
1 301
𝜇̂ = 𝑥̅ = ∙ ∑ 𝑥𝑖 = = 30.1
𝑛 10
𝑖=1
𝛼 = 0.05
𝑧𝛼 = −1.96
2
30.1 − 1.96 ∙ 1.6⁄√10 ≤ 𝜇 ≤ 30.1 + 1.96 ∙ 1.6⁄√10
29.1 ≤ 𝜇 ≤ 31.1
⇒ 𝜇𝐿 = 29.1 și 𝜇𝑈 = 31.1

Cazul 2 – valoarea dispersiei este necunoscută, dar este estimată, 𝑠̂ 2 , pe baza unui eșantion de
volum mare.
Dacă volumul de eșantion este mare (𝑛 ≥ 30), atunci variabila aleatorie:
𝑋̅ − 𝜇
~𝒩(𝑧, 0,1), (12.6)
𝑠⁄√𝑛
unde:
𝑛
2
1
𝑠 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2 .
𝑛−1
𝑖=1

Dacă procedăm la fel ca în cazul 1, vom obține:


 Intervalul de încredere, [𝜇𝐿 , 𝜇𝑈 ], bilateral simetric, ce conține valoarea adevărată
a parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:

[𝑥̅ + 𝑧𝛼 ∙ 𝑠⁄√𝑛 ≤ 𝜇 ≤ 𝑥̅ − 𝑧𝛼 ∙ 𝑠⁄√𝑛]. (12.7)


2 2

 Intervalul de încredere, [𝜇𝐿 , ∞], unilateral cu o limită inferioară, ce conține


valoarea adevărată a parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:
[𝑥̅ + 𝑧𝛼 ∙ 𝑠⁄√𝑛 ≤ 𝜇 ≤ ∞]. (12.8)
 Intervalul de încredere, [−∞, 𝜇𝑈 ], unilateral cu o limită superioară, ce conține
valoarea adevărată a parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:
[−∞ ≤ 𝜇 ≤ 𝑥̅ − 𝑧𝛼 ∙ 𝑠⁄√𝑛]. (12.9)

225
Cazul 3 – valoarea dispersiei este necunoscută, dar este estimată, 𝑠̂ 2 , pe baza datelor de
eșantionaj.
Considerăm un eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:
𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
cu parametrii 𝜇 și 𝜎 necunoscuți, atunci variabila aleatorie:
𝑋−𝜇
𝑇= , (12.10)
𝑠⁄√𝑛
este repartizată Student 𝑡.
O variabilă aleatorie 𝑇, este repartizată Student t, cu 𝜈 grade de libertate, dacă
funcția densitate de probabilitate este de forma:
𝜈+1 −
𝜈+1
Γ( 2 ) 𝑡2 2
𝑓𝑇 (𝑡) = 𝜈 ∙ ( + 1) , pentru − ∞ < 𝑡 < ∞, 𝜈 > 0. (12.11)
√𝜋 ∙ 𝜈 ∙ Γ (2) 𝜈

În anexa VI, de la finalul cărții, tabelul VI.1, se găsesc calculate, pentru diferite
grade de libertate, valorile cuantilelor repartiției Student t.
Intervalul de încredere, [𝜇𝐿 , 𝜇𝑈 ] ce conține valoarea adevărată a parametrului 𝜇, cu
o probabilitate (1 − 𝛼), reprezintă soluția ecuației:
𝑃𝑟(𝜇𝐿 ≤ 𝜇 ≤ 𝜇𝑈 ) = 1 − 𝛼. (12.12)
Deci, pe baza relației (12.24), ecuația (12.26), devine:
𝑋̅ − 𝜇
𝑃𝑟 (𝑡𝛼,𝑛−1 ≤ ≤ 𝑡1−𝛼,𝑛−1 ) = 1 − 𝛼.
2 𝑠⁄√𝑛 2

Prelucrând ecuația anterioară, rezultă:

𝑃𝑟 (𝑥̅ + 𝑡𝛼,𝑛−1 ∙ 𝑠⁄√𝑛 ≤ 𝜇 ≤ 𝑥̅ + 𝑡𝛼,𝑛−1 ∙ 𝑠⁄√𝑛) = 1 − 𝛼,


2 2
deoarece:
−𝑡𝛼,𝑛−1 = 1 − 𝑡𝛼,𝑛−1
2 2

și intervalul de încredere, [𝜇𝐿 , 𝜇𝑈 ], bilateral simetric, ce conține valoarea adevărată


a parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:

[𝑥̅ + 𝑡𝛼,𝑛−1 ∙ 𝑠⁄√𝑛 ≤ 𝜇 ≤ 𝑥̅ + 𝑡1−𝛼,𝑛−1 ∙ 𝑠⁄√𝑛]. (12.13)


2 2

Intervalul de încredere, [𝜇𝐿 , ∞], unilateral cu o limită inferioară, ce conține valoarea


adevărată a parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:

[𝑥̅ + 𝑡𝛼,𝑛−1 ∙ 𝑠⁄√𝑛 ≤ 𝜇 ≤ ∞]. (12.14)


2

Intervalul de încredere, [−∞, 𝜇𝑈 ], unilateral cu o limită superioară, ce conține


valoarea adevărată a parametrului 𝜇, cu o probabilitate (1 − 𝛼), este:

226
[−∞ ≤ 𝜇 ≤ 𝑥̅ + 𝑡1−𝛼,𝑛−1 ∙ 𝑠⁄√𝑛]. (12.15)
2

12.3.2 INTERVALE DE ÎNCREDERE PENTRU DISPERSIE ȘI ABATEREA


STANDARD

Considerăm un eșantion de volum 𝑛, prelevat dintr-o populație normal repartizată:


𝑥1 , ⋯ 𝑥𝑖 , ⋯ 𝑥𝑛 ,
cu parametrii 𝜇 și 𝜎 necunoscuți, atunci variabila aleatorie:
(𝑛 − 1) ∙ 𝑠 2
𝜒2 = , (12.16)
𝜎2
este repartizată hi-pătrat cu 𝜈 = (𝑛 − 1) grade de libertate.
Intervalul de încredere, [𝜎𝐿2 , 𝜎𝑈2 ] ce conține valoarea adevărată a parametrului 𝜎 2 , cu o
probabilitate (1 − 𝛼), reprezintă soluția ecuației:
𝑃𝑟(𝜎𝐿2 ≤ 𝜎 2 ≤ 𝜎𝑈2 ) = 1 − 𝛼. (12.17)
Deci, pe baza relației (12.16), ecuația (12.17), devine:
(𝑛 − 1) ∙ 𝑠 2
𝑃𝑟 (𝜒𝛼2,𝑛−1 ≤ 2
2
≤ 𝜒1− 𝛼 ) = 1 − 𝛼.
2 𝜎 2
,𝑛−1

Prelucrând ecuația anterioară, rezultă:


(𝑛 − 1) ∙ 𝑠 2 2
(𝑛 − 1) ∙ 𝑠 2
𝑃𝑟 ( 2 ≤𝜎 ≤ ) = 1 − 𝛼,
𝜒 𝛼 𝜒𝛼2
1− 2 ,𝑛−1 2 ,𝑛−1

și intervalul de încredere, [𝜎𝐿2 , 𝜎𝑈2 ], bilateral simetric, ce conține valoarea adevărată a


parametrului 𝜎 2 , cu o probabilitate (1 − 𝛼), este:

(𝑛 − 1) ∙ 𝑠 2 (𝑛 − 1) ∙ 𝑠 2
[ ≤ 𝜎2 ≤ ]. (12.18)
𝜒2 𝛼 𝜒𝛼2
1− 2 ,𝑛−1 2 ,𝑛−1

Intervalul de încredere, [𝜎𝐿2 , ∞], unilateral cu o limită inferioară, ce conține valoarea adevărată
a parametrului 𝜎 2 , cu o probabilitate (1 − 𝛼), este:

(𝑛 − 1) ∙ 𝑠 2
[ ≤ 𝜎 2 ≤ ∞]. (12.19)
𝜒2 𝛼
1− 2 ,𝑛−1

Intervalul de încredere, [−∞, 𝜎𝑈2 ], unilateral cu o limită superioară, ce conține valoarea


adevărată a parametrului 𝜎 2 , cu o probabilitate (1 − 𝛼), este:

(𝑛 − 1) ∙ 𝑠 2
[−∞ ≤ 𝜎 2 ≤ ]. (12.20)
𝜒𝛼2
2 ,𝑛−1

227
Pentru a determina intervalele de încredere pentru abaterea standard se utilizează relația care
există între dispersie și abaterea standard:

𝑠 = √𝑠 2 .
Rezultă:
intervalul de încredere, [𝜎𝐿 , 𝜎𝑈 ], bilateral simetric, ce conține valoarea adevărată a
parametrului 𝜎, cu o probabilitate (1 − 𝛼), este:

(𝑛 − 1) ∙ 𝑠 2 (𝑛 − 1) ∙ 𝑠 2
[√ ≤𝜎≤√ ]. (12.21)
𝜒2 𝛼 𝜒𝛼2
1− 2 ,𝑛−1 2 ,𝑛−1

intervalul de încredere, [𝜎𝐿 , ∞], unilateral cu o limită inferioară, ce conține valoarea adevărată
a parametrului 𝜎, cu o probabilitate (1 − 𝛼), este:

(𝑛 − 1) ∙ 𝑠 2
[√ 2 ≤ 𝜎 ≤ ∞]. (12.22)
𝜒 𝛼
1− 2 ,𝑛−1

intervalul de încredere, [−∞, 𝜎𝑈 ], unilateral cu o limită superioară, ce conține valoarea


adevărată a parametrului 𝜎, cu o probabilitate (1 − 𝛼), este:

(𝑛 − 1) ∙ 𝑠 2
[−∞ ≤ 𝜎 ≤ √ ]. (12.23)
𝜒𝛼2
2 ,𝑛−1

Exemplul 12.2
Să se determine intervalul de încredere bilateral simetric pentru medie,
dispersie și abaterea standard, cu un nivel de încredere 90%, folosind
următoarele date de eșantionaj:
51.3 51.3 51.3 51.3 51.3
59.0 59.0 59.0 59.0 59.0
51.8 51.8 51.8 51.8 51.8
41.7 41.7 41.7 41.7 41.7
56.7 56.7 56.7 56.7 56.7
38.1 38.1 38.1 38.1 38.1
54.5 54.5 54.5 54.5 54.5
47.4 47.4 47.4 47.4 47.4
47.1 47.1 47.1 47.1 47.1
54.0 54.0 54.0 54.0 54.0
prelevate dintr-o populație normal repartizată.
Soluție: 𝑛 = 50.
𝑛
1 2524.6
𝜇̂ = 𝑥̅ = ∙ ∑ 𝑥𝑖 = = 50.49
𝑛 50
𝑖=1

228
𝑛
2 2
1 808.99
𝜎̂ = 𝑠 = ∙ ∑(𝑥𝑖 − 𝜇̂ )2 = = 16.51
𝑛−1 49
𝑖=1

𝑛
1
𝜎̂ = 𝑠 = √ ∙ ∑(𝑥𝑖 − 𝜇̂ )2 = √16.51 = 4.064
𝑛−1
𝑖=1

𝛼 = 0.10 ⇒ 𝑧𝛼 = −1.64485
2
Pentru medie – cazul 2:
50.49 − 1.64485 ∙ 4.064⁄√50 ≤ 𝜇 ≤ 50.49 + 1.64485 ∙ 4.064⁄√50
49.545 ≤ 𝜇 ≤ 51.435
Pentru medie – cazul 3
𝑡1−𝛼,𝑛−1 = 𝑡0.95,49 = 1.6765 și 𝑡𝛼,𝑛−1 = 𝑡0.05,49 = −1.6765
2 2
50.49 − 1.6765 ∙ 4.064⁄√50 ≤ 𝜇 ≤ 50.49 + 1.6765 ∙ 4.064⁄√50
49.526 ≤ 𝜇 ≤ 51.453
Pentru dispersie:
𝜒𝛼2,𝑛−1 = 𝜒0.05,49
2
= 34.764
2
2 2
𝜒1− 𝛼
,𝑛−1
= 𝜒0.95,49 = 67.505
2
49 ∙ 16.51 49 ∙ 16.51
≤ 𝜎2 ≤
67.505 34.764
11.984 ≤ 𝜎 2 ≤ 23.271
Pentru abaterea standard: 3.461 ≤ 𝜎 ≤ 4.824

12.4 VERIFICAREA IPOTEZELOR STATISTICE

Ipoteză statistică – orice ipoteză care se face cu privire la parametrii, tipul repartiției unor
variabile aleatorii sau o supoziție despre modelele probabiliste din care sunt extrase datele
analizate.
Test statistic – procedura de verificare a unei ipoteze statistice, respectiv, procedura al cărei
obiect este de a decide respingerea sau acceptarea unei ipoteze statistice.
Decizia adoptată rezultă din valoarea uneia sau mai multor statistici, adecvate, calculate pe baza
valorilor de eșantionaj. Valoarea statisticii fiind supusă variațiilor aleatorii, există riscul de a
lua o decizie eronată.
Se cunosc două forme de ipoteze statistice:
 Ipoteza nulă, H0 – ipoteza statistică inițială asupra repartiției populației studiate, care
trebuie respinsă, sau acceptată pe baza rezultatului unui test.
 Ipoteza alternativă, H1 – ipoteza statistică ce se opune ipotezei nule, H0.
Nivelul de semnificație (al unui test) – valoarea , ce limitează probabilitatea de respingere a
unei ipoteze nule, când ea este adevărată.

229
Eroare de genul întâi – eroarea comisă când se decide respingerea ipotezei nule, atunci când
ipoteza nulă este adevărată.
Riscul de genul întâi – probabilitatea , de a comite eroarea de genul întâi:
𝛼 = 𝑃𝑟(respinge 𝐻0 |𝐻0 este adevărată)
Eroare de genul al doilea – eroarea comisă când se decide să nu se respingă ipoteza nulă, atunci
când ipoteza nulă este falsă.
Riscul de genul doi – probabilitatea , de a comite eroarea de genul al doilea:
𝛼 = 𝑃𝑟(acceptă 𝐻0 |𝐻0 este falsă)

Valori estimate
𝐻0 𝐻0
adevărată falsă
Valori reale
𝐻0 Decizie corectă; Eroare de tip I
adevărată Probabilitatea = 1 −  Probabilitatea = 
𝐻0 Eroare de tip II Decizie corectă;
falsă Probabilitatea =  Probabilitatea = 1 − 

Regula de decizie se exprimă, de obicei printr-o inegalitate de forma:


„𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡ă  𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑟𝑖𝑡𝑖𝑐ă”
sau
„𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡ă  𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑟𝑖𝑡𝑖𝑐ă”
Din punct de vedere practic, pentru a verifica o anumită ipoteză statistică, este necesar a fi
parcurse următoarele etape:
Stabilirea ipotezelor:
𝐻0 şi 𝐻1

Stabilirea nivelului de
semnificație: 

Se determină regula de
decizie – 𝑆:
𝑓𝑆|𝜃 (𝑥)

Colectarea datelor de
eșantionaj, 𝑛 şi specificarea
statisticii:
𝑓𝑆|𝜃 (𝑥)

Decizia statistică:
 Acceptă 𝐻0 ,
sau
 Acceptă 𝐻1 .

230
Verificarea ipotezelor statistice reprezintă o operație matematică strâns legată de estimarea cu
interval de încredere. În general, cunoașterea unui interval de încredere pentru un parametru al
unei repartiții teoretice ne permite să construim teste de verificare a ipotezelor statistice, vezi
fig. 12.1.

𝑓𝑆|𝜃 (𝑥)

𝑓𝑆|𝜃 (𝑥)

𝑓𝑆|𝜃 (𝑥)

Figura 12.1 Legătura dintre intervalele de încredere și regiunile critice utilizate la testarea
ipotezelor statistice

Fie 𝑓(𝑥, 𝜃) o densitate de probabilitate ce depinde de parametrul necunoscut 𝜃. Să presupunem


că pentru orice valoare 1 − 𝛼 a probabilității există un interval de încredere:
𝜃̂𝐿 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , 𝜃) < 𝜃 ≤ 𝜃̂𝑈 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , 𝜃),
astfel încât acesta să respecte ecuația:

231
𝑃𝑟 (𝜃̂𝐿 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , 𝜃) ≤ 𝜃 ≤ 𝜃̂𝑈 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , 𝜃)) = 1 − 𝛼.

Să considerăm ipoteza nulă:


𝐻𝟎 : 𝜃 = 𝜃0 .
Atunci, pentru o probabilitate dată, 𝛼, se poate construi un test statistic, bazat pe o regiune
critică:
𝜃̂𝐿 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , 1 − 𝛼) > 𝜃0 ,
sau:
𝜃̂𝑈 (𝑥1 , 𝑥2 , ⋯ , 𝑥𝑖 , ⋯ , 𝑥𝑛 , 1 − 𝛼) < 𝜃0 ,
la pragul de semnificație 𝛼.
Rezultă deci, că putem construi teste de verificare a ipotezelor statistice referitoare la parametrii
repartițiilor statistice utilizând intervalele de încredere construite anterior, vezi fig. 6.1.
Modalitatea de calcul a erorii de tip II, 𝛽, este prezentată în figura 6.2.
Valori estimate: Valori reale:

𝑓𝑆|𝜃 (𝑥)

Figura 6.2 Determinarea erorii de tip II, 𝛽

232
12.4.1 TEST DE COMPARARE A MEDIILOR DE EŞANTIONAJ
(CÂND SE CUNOAŞTE DISPERSIA)

Ipotezele statistice:
 ipoteza nulă H0: 𝑚 = 𝑚0 ;
 ipoteza alternativ H1: 𝑚 = 𝑚1 ;
Notații utilizate:
𝑚0 – reprezintă media de referință;
𝛼 – reprezintă nivelul de semnificație al testului;
𝑧 ; 𝑧1− – reprezintă valorile cuantilelor repartiției normale normate;
𝑛 – reprezintă volumul eşantionului;
1
𝑥̅ = 𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖 – reprezintă media de eșantionaj;
𝜎0 – reprezintă abaterea medie pătratică a populației de bază din care s-a prelevat
eșantionul.
Decizia statistică:
Ipotezele alternative
H1: 𝑚 = 𝑚1 , Se respinge H0 dacă:
unde:
𝜎0
𝑚1 ≠ 𝑚0 |𝑥̅ − 𝑚0 | > ∙ 𝑧1−𝛼⁄2
√𝑛
𝜎0
𝑚1 < 𝑚0 𝑥̅ < 𝑚0 + ∙ 𝑧𝛼
√𝑛
𝜎0
𝑚1 > 𝑚0 𝑥̅ > 𝑚0 + ∙ 𝑧1−𝛼
√𝑛

Exemplul 12.3
Să se testeze, cu un nivel de semnificație 𝛼 = 5%, ipoteza, H0: 𝜇 = 50,
cu altenativa H1: 𝜇 ≠ 50, dacă prin prelevarea unui eșantion de volum 𝑛 = 25
s-au obținut în urma prelucrării datelor de eșantionaj 𝑚1 = 51.3. Se cunoaște,
de asemenea, abaterea standard a populației, 𝜎0 = 2.
Soluție: H0: 𝜇 = 50 și H1: 𝜇 ≠ 50.
𝑚0 = 50 𝑚1 = 51.3 și 𝑛 = 25
1 − 𝛼 = 95% ⇒ 𝛼 ⁄2 = 0.025% și 1 − 𝛼 ⁄2 = 0.975.
𝑧1−𝛼⁄2 = 1.96 și 𝛼 ⁄2 = −1.96
𝜎0 𝜎0
𝑚0 + ∙ 𝑧𝛼⁄2 > 𝑥̅ > 𝑚0 + ∙ 𝑧1−𝛼⁄2 ⇒ 49.216 > 𝑥̅ = 51.3 > 50.784
√𝑛 √𝑛
Se respinge H0.

233
12.4.2 TEST DE COMPARARE A MEDIILOR DE EŞANTIONAJ
(CÂND NU SE CUNOAŞTE DISPERSIA)

Ipotezele statistice:
 ipoteza nulă H0: 𝑚 = 𝑚0 ;
 ipoteza alternativă H1: 𝑚 = 𝑚1 ;
Notații utilizate:
𝑚0 – reprezintă media de referință;
𝛼 – reprezintă nivelul de semnificaţie al testului;
𝑡,𝜈 ; 𝑡1−,𝜈 – reprezintă valorile cuantilei repartiției Student t;
 = 𝑛 − 1 – reprezintă numărul gradelor de libertate;
𝑛 – reprezintă volumul eșantionului;
1
𝑥̅ = 𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖 – reprezintă media de eșantionaj;
1
𝑠 2 = 𝑛−1 ∙ ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 – reprezintă estimația dispersiei pentru populația din care s-
a prelevat eșantionul.
Decizia statistică:
Ipotezele alternative
H1: 𝑚 = 𝑚1 , Se respinge H0 dacă:
unde:
𝑠
𝑚1 ≠ 𝑚0 |𝑥̅ − 𝑚0 | > ∙ 𝑡1−𝛼⁄2,𝑛−1
√𝑛
𝑠
𝑚1 < 𝑚0 𝑥̅ < 𝑚0 − ∙ 𝑡𝛼,𝑛−1
√𝑛
𝑠
𝑚1 > 𝑚0 𝑥̅ < 𝑚0 + ∙ 𝑡1−𝛼,𝑛−1
√𝑛

Exemplul 12.4
Să se testeze, cu un nivel de semnificație 𝛼 = 10%, ipoteza, H0: 𝜇 = 25,
cu alternativa H1: 𝜇 < 25, dacă prin prelevarea unui eșantion de volum 𝑛 = 36
s-au obținut în urma prelucrării datelor de eșantionaj 𝑚1 = 25.7 ş𝑖 𝑠 = 3.
Soluție: H0: 𝜇 = 25 și H1: 𝜇 < 25.
𝑚0 = 25 și 𝑚1 = 24.6 și 𝑛 = 36.
𝛼 = 10% 𝑡𝛼,𝜈 = −1.306
𝑠
𝑥̅ < 𝑚0 − ∙ 𝑡𝛼,𝑛−1 ⇒ 𝑥̅ = 25.7 > 25.653
√𝑛
Se acceptă H0.

234
12.4.3 TEST DE COMPARARE A DISPERSIEI UNEI POPULAŢII NORMALE

Ipotezele statistice:
 ipoteza nulă H0: 𝜎 2 = 𝜎02 ;
 ipoteza alternativă H1: 𝜎 2 = 𝜎12 ;
Notații utilizate:
𝛼 – reprezintă nivelul de semnificație al testului;
𝜎02 – reprezintă dispersia de referință;
2 2
𝜒1−𝛼 ⁄2,𝜈 ; 𝜒𝛼⁄2,𝜈 – reprezintă valorile repartiției Hi-pătrat;

 = 𝑛 − 1 – reprezintă numărul gradelor de libertate;


𝑛 – reprezintă volumul eșantionului;
1
𝑠 2 = 𝑛−1 ∙ ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 – reprezintă estimația dispersiei pentru populația din care s-
a prelevat eșantionul.
Decizia statistică:
Ipotezele alternative
H1: 𝜎 2 = 𝜎12 , Se respinge H0 dacă:
unde:
(𝑛 − 1) ∙ 𝑠 2
< 𝜒𝛼2⁄2,𝑛−1
𝜎02
𝜎12 ≠ 𝜎02 și
(𝑛 − 1) ∙ 𝑠 2 2
> 𝜒1−𝛼 ⁄2,𝑛−1
𝜎02
(𝑛 − 1) ∙ 𝑠 2
𝜎12 > 𝜎02 2
2
> 𝜒1−𝛼,𝑛−1
𝜎0
(𝑛 − 1) ∙ 𝑠 2
𝜎12 < 𝜎02 2
< 𝜒𝛼,𝑛−1
𝜎02

Exemplul 12.5
Să se testeze, cu un nivel de semnificație 𝛼 = 0.05%, ipoteza, H0: 𝜎 = 3,
cu alternativa H1: 𝜎 > 3, dacă prin prelevarea unui eșantion de volum 𝑛 = 46
s-au obținut în urma prelucrării datelor de eșantionaj 𝑚1 = 25 ş𝑖 𝑠 = 3.15.
Soluție: H0: 𝜎 = 3 și H1: 𝜎 > 3.
2
1 − 𝛼 = 95% ⇒ 𝜒1−𝛼,𝑛−1 = −1.306
(𝑛 − 1) ∙ 𝑠 2 2
> 𝜒1−𝛼,𝑛−1 ⇒ 49.6125 < 61.6562
𝜎02
Se acceptă H0.

235
 Enumerați care sunt cazurile, pentru repartiția normală, în care au fost
dezvoltate metode de estimare parametrică cu interval de încredere și
precizați diferențele semnificative dintre ele.
 Precizați modul de construcție al intervalelor de încredere, pentru media
repartiției normale, atunci când valoarea dispersiei este cunoscută.
 Precizați modul de construcție al intervalelor de încredere, pentru media
repartiției normale, atunci când valoarea dispersiei este necunoscută,
dar este estimată pe baza unui eșantion de volum mare.
 Precizați modul de construcție al intervalelor de încredere, pentru media
repartiției normale, atunci când valoarea dispersiei este necunoscută,
dar este estimată pe baza unor date de eșantionaj.
 Precizați modul de construcție al intervalelor de încredere, pentru
dispersie și/sau abaterea standard a repartiției normale.
 Definiți noțiunile: ipoteză statistică, test statistic, ipoteza nulă și ipoteza
alternativă.
 Definiți noțiunile: nivelul de semnificație (al unui test), eroare de genul
întâi, riscul de genul întâi, eroare de genul al doilea și riscul de genul
doi.
 Enumerați etapele ce trebuie parcurse în vederea testării unei anumite
ipoteze statistice.
 Descrieți legătura ce există între cunoașterea unui interval de încredere
pentru un parametru al unei repartiții teoretice și verificarea ipotezelor
statistice.
 Precizați care sunt testele de comparare a mediei și dispersiei repartiției
normale, precum și tipurile de ipoteze, pentru fiecare caz în parte, ce pot
fi testate.

Să ne reamintim...
Noțiunile de bază și cele specifice furnizate prin materialul prezentei
unități de învățare până la momentul curent sunt:

 Ipoteză statistică;  Eroare de genul întâi;


 Ipoteza nulă;  Riscul de genul întâi;
 Ipoteza alternativă  Eroare de genul al doilea;
 Test statistic;  Riscul de genul doi;
 Nivelul de semnificație (al unui  Regula de decizie.
test);

236
Rezumat
În această unitate de învățare, la început, s-au prezentat modalitățile de
construcție a intervalelor de încredere pentru parametrii repartiției normale, în
funcție de informația disponibilă.
În continuare, s-a trecut la prezentarea unui nou capitol specific statisticii
inferențiale, verificarea ipotezelor statistice. Astfel, s-au definit principale noțiuni,
s-au prezentat etapele ce trebuie parcurse în vederea testării unei anumite ipoteze
statistice, s-a descris legătura ce există între cunoașterea unui interval de
încredere, pentru un parametru al unei repartiții teoretice și verificarea ipotezelor
statistice, precum și principiile ce stau la baza determinării erorii de tip II.
În ultima parte a UI sunt prezentate, pentru diferite cazuri ce pot apare, testele de
comparare a mediilor și dispersiilor de eșantionaj.

Test de evaluare a cunoștințelor


P.12.1 Se consideră următoarele date de eșantionaj, prelevate dintr-o populație normal
repartizată:
44.91 44.99 44.92 45.00 44.85
44.88 45.03 44.82 45.02 44.91
45.16 44.93 44.94 45.05 45.22
45.11 44.96 45.08 45.01 45.15
44.90 44.98 45.00 45.07 44.96
44.78 45.09 44.87 44.97 44.99
45.13 45.18 45.05 45.07 44.95
45.03 45.04 44.97 45.10 45.06
44.95 45.12 45.09 45.01 45.04
45.02 44.93 44.89 44.84 44.98
Să se determine:
a. Estimația punctuală prin metoda celor mai mici pătrate;
b. Să se traseze rețeaua de probabilitate normală în acest caz;
c. Estimația punctuală prin metoda momentelor;
d. Estimația punctuală prin metoda verosimilității maxime;
e. Intervalul de încredere 95%, bilateral simetric pentru parametrii repartiției
normale (medie, dispersie și abatere standard) utilizând cuantilele
repartiției normale;
f. Intervalul de încredere 90%, bilateral simetric pentru parametrii repartiției
normale (medie, dispersie și abatere standard) utilizând cuantilele
repartiției Student t.
g. Comparați rezultatele obținute.
P.12.2 Să se testeze, cu un nivel de semnificație α = 10%, ipoteza, H0: μ = 80, cu
alternativa H1: μ ≠ 80, dacă prin prelevarea unui eșantion de volum n = 36 s-

237
au obținut în urma prelucrării datelor de eșantionaj m1 = 79.65. Se cunoaște,
de asemenea, abaterea standard a populației, σ0 = 3.
P.12.3 Să se testeze, cu un nivel de semnificație α = 5%, ipoteza, H0: μ = 45, cu
alternativa H1: μ < 45, dacă prin prelevarea unui eșantion de volum n = 64 s-
au obținut în urma prelucrării datelor de eșantionaj m1 = 45.06 şi s = 4.
P.12.3 Să se testeze, cu un nivel de semnificație α = 0.01%, ipoteza, H0: σ = 5, cu
alternativa H1: σ < 5, dacă prin prelevarea unui eșantion de volum n = 60 s-
au obținut în urma prelucrării datelor de eșantionaj m1 = 55.21 şi s = 5.02.

238
Bibliografie

[BER 00] Bertsekas, D.P., Tsitsiklis, J.N., Introduction to Probability, Course 6.041-
6.431. M.I.T., Cambridge, Massachusetts, Athena Scientific, 2000.
[BLU 05] Bluman, A.G., Probability Demystified, McGraw Hill, Inc., New – York, 2005,
ISBN 0-07-144549-8.
[CAT 83] Cătuneanu, V.M., Mihalache, A., Bazele teoretice ale fiabilităţii, Editura
Academiei, Bucureşti, 1983.
[CRS 81] Crstici, B., ş.a., Matematici Speciale, Editura Didactică şi Pedagogică,
Bucureşti, 1981.
[DEC 05] Decoursey, W.J., Statistics and Probability for Engineering Applications with
Microsoft Excel, Newnes, Elsevier Science (SUA), ISBN 0-7506-7618-3.
[GIB 76] Gibra, I.N., Probability and Statistical Inference for Scientist and Engineers,
Prentice-Hall, Inc., Englewood Cliffs, New Jersey, 1976.
[HAH 67] Hahn, G.J., Shapiro, S.S., Statistical Models in Engineering, John Wiley &
Sons, Inc., 1967.
[HAL 91] Hall, O.P., Adelman, H.E., Business Statistics. Text. Cases. Software, Richard
D. Irwin, Inc., Boston, MA 02116, 1991, ISBN 0-256-06089-4.
[HAS 75] Hastings, N.A.J., Peacock, J.B., Statistical Distributions. A Handbook for
Students and Practitioners, John Wiley & Sons, Inc., New York, 1975.
[KEC 91] Kececioglu, D.B., Reliability Engineering Handbook, vol. I şi II, PTR Prentice-
Hall, Inc., Englewood Cliffs, New Jersey, 1991.
[KEC 93] Kececioglu, D. B., Reliability & Life Testing Handbook, vol. I, PTR Prentice-
Hall, Inc., Englewood Cliffs, New Jersey, 1993.
[KEC 94] Kececioglu, D. B., Reliability & Life Testing Handbook, vol. II, PTR Prentice-
Hall, Inc., Englewood Cliffs, New Jersey, 1994.
[KEL 97] Keller, G., Warrack, B., Statistics for Management and Economics, Fourth
Edition, Duxbury Press – An International Thompson Publishing Company,
1997, ISBN 0-534-51584-3.
[KEM 04] Kemp, S.M., Kemp, S., Business Statistics Demystified, McGraw Hill, Inc., New
– York, 2004, ISBN 0-07-144024-0.
[MAN 74] Mann, N.R., ş.a., Methods for Statistical Analysis of Reliability & Life Test
Data, John Wiley & Sons, Inc., 1974.
[MEM 80] ***, Mică enciclopedie matematică, traducere din limba germană. Editura
Tehnică, Bucureşti, 1980.
[MAR 95] Martinescu, I., Popescu, I., Fiabilitate, Editura Gryphon, Brașov, 1995, ISBN
973-604-007-0.

239
[MEY 76] Meyer, S.L., Data Analysis for Scientists and Engineers, Wiley & Sons, Inc.,
New York, 1976.
[MIH 80] Mihoc, Gh., Micu, M., Teoria probabilităţilor şi statistică matematică, Editura
Didactică şi Pedagogică, Bucureşti, 1980.
[MON 11] Montgomery, D.C., Runger, G.C., Hubele, N.F., Engineering Statistics, 5th
Edition, John Wiley & Sons, Inc., New – York, 2011, ISBN 978-0-470-63147-
8.
[MON 11] Montgomery, D.C., Runger, G.C., Applied Statistics Probability Engineers, 5th
Edition, John Wiley & Sons, Inc., New – York, 2011, ISBN 978-0-470-05304-
1.
[MON 03] Montgomery, D.C., Runger, G.C., Applied Statistics and Probability for
Engineers, John Wiley & Sons, Inc., New – York, 2003, ISBN 0-471-20454-4.
[MOR 10] Morariu, C.O., Probabilități și statistică aplicată. Volumul I, Editura
Universităţii „Transilvania”, Braşov, 2010, ISBN 978–973–598–816-6.
[MOR 04a] Morariu, C.O., Păunescu, T., Informatică Aplicată în Inginerie. Mathcad 2001,
Editura Universităţii „Transilvania”, Braşov, 2004, ISBN 973–635–302–8.
[MOR 04b] Morariu, C.O., Elemente de teoria probabilităţilor aplicate în analiza riscurilor
industriale, Universitatea „Transilvania” din Braşov, Fundaţia C.P.V.R.U.,
Braşov, 2004.
[MOR 06] Morariu, C.O., Sistemul de management al calităţii, Editura Universităţii
„Transilvania”, Braşov, 2006, ISBN 973-635-738-4 şi ISBN 973-635-738-1.
[MOR 99] Morariu, C.O., Optimizarea încercărilor de fiabilitate a rulmenţilor. Teză de
doctorat, Universitatea “Transilvania”, Braşov, 1999.
[MOŢ 84] Moţoiu, R., Ingineria Calităţii, Editura Chiminform DATA S.A., Bucureşti,
1994.
[NIS 07] ***, Engineering Statistics Handbook, NIST/SEMATECH e-Handbook of
Statistical Methods, web site: http://www.itl.nist.gov/div898/handbook/, 2007.
[POP 86] Popescu, I., Bazele cercetării experimentale în tehnologia construcţiilor de
maşini. Universitatea "Transilvania", Braşov, 1986.
[POP 93] Popescu, I., ş.a., Fiabilitate. Bazele teoretice, Universitatea "Transilvania" din
Braşov, 1993.
[POR 93] Porojan, D., Statistica şi teoria sondajului, Casa de editură şi presă ŞANSA
S.R.L., Bucureşti, 1993, ISBN 973-95971-6-5.
[ROS 04] Ross, S.M., Introduction to Probability and Statistics for Engineers and
Scientists, Third Edition, Elsevier Inc., Academic Press, Burlington, MA
01803, USA, 2004, ISBN: 0-12-598057-4.
[ROS 97] Ross, S.M., Introduction to Probability Models, 6th Edition, Academic Press
Ltd., San Diego, USA, 1997, ISBN: 0-12-598470-7.

240
[SCH 07] Schay, G. Introduction to Probability with Statistical Applications, Birkha¨user,
Boston, ISBN: 978-0-8176-4497-0.
[SOO 04] Soong, T.T., Fundamentals of Probability and Statistics foe Engineers, John
Wiley & Sons, Ltd., The Atrium, Southern Gate, Chichester, West Sussex PO19
8SQ, England, 2004, ISBN 0-470-86814-7.
[SPI 01] Spiegel, M.R., Probability and Statistics, McGraw Hill Book Company,
Schaum’s Outline Series, New York, 2001, ISBN 0-07-139838-4.
[SPI 75] Spiegel, M.R., Theory and Problems of Probability and Statistics, McGraw Hill
Book Company, New – York, 1975, ISBN 0-07-060220-4.
[SPI 98] Spiegel, M.R.,Stephens, J.L., Theory and Problems of Statistics, McGraw Hill
Book Company, Schaum’s Outline Series, New York, 1998, ISBN 0-07-
060281-6.
[SRI 96] SR ISO 3534-1:1996 Statistică - Vocabular şi simboluri. Partea 1: Termeni de
teoria probabilităţilor şi statistică generală.
[TAR 98] Ţarcă, M., Tratat de statistică aplicată, Editura Didactică şi Pedagogică,
Bucureşti, 1998, ISBN 973-30-5275-2.
[TAR 89] Târcolea, C., Filipoiu, A., Bontaș, S., Tehnici actuale în teoria fiabilității, Ed.
Științifică și enciclopedică, București, 1989, ISBN 973-29-0158-6.
[TOD 76] Todoran, I., Tratarea matematică a datelor experimentale. Funcţii empirice,
Editura Academiei RSR, Bucureşti 1976.
[WIK 10] ***, Wikipedia. The Free Encyclopedia, web site: http://en.wikipedia.org,
2010.
[WMW 10] ***, Wolfram Math World, web site: http://mathworld.wolfram.com/, 2010.

241
Anexe

Anexa I Excel 2010 (2013) ................................................................................. 243


Tabelul I.1 Funcții statistice
Anexa II Repartiția binomială .............................................................................. 249
Tabelul II.1 Valorile funcției de repartiție binomială
Anexa III Repartiția Poisson ................................................................................. 255
Tabelul III.1 Valorile funcției de repartiție Poisson
Anexa IV Repartiția normală normată ................................................................... 257
Tabelul IV.1 Valorile funcției de repartiție normale
normate, pentru valori 𝑧 ≤ 0
Tabelul IV.2 Valorile funcției de repartiție normale
normate, pentru valori 𝑧 ≥ 0
Anexa V Repartiția Hi-pătrat ............................................................................... 261
Tabelul V.1 Valorile cuantilei χ2α,ν, pentru care
𝑃𝑟(χ2 ≤ χ2α,ν ) = α
Anexa VI Repartiția Student .................................................................................. 263
Tabelul VI.1 Valorile cuantilei t1−α,ν, pentru
care 𝑃𝑟(𝑡 ≤ 𝑡1−α,ν ) = 1 − α
Anexa VII Rețea de probabilitate normală ............................................................. 265

242
Anexa I Excel 2010 (2013)

Tabelul I.1 Funcții statistice

Funcția EXCEL: Valoarea returnată


 Sort : Sortează, valorile marcate, în ordine crescătoare sau
descrescătoare

 Implicit, calculează suma valorilor marcate. Funcția poate


fi utilizată și ca alternativă pentru funcțiile: AVERAGE,
COUNT, MAX și MIN.
 𝑰𝑭(𝒆𝒙𝒑. 𝒄𝒐𝒏𝒅, 𝒆𝒙𝒑𝟏, 𝒆𝒙𝒑𝟐)  Dacă 𝑒𝑥𝑝. 𝑐𝑜𝑛𝑑 este adevărată, atunci funcția 𝐼𝐹
returnează valoarea expresiei 𝑒𝑥𝑝1.
 Dacă 𝑒𝑥𝑝. 𝑐𝑜𝑛𝑑 este falsă, atunci funcția 𝐼𝐹 returnează
valoarea expresiei 𝑒𝑥𝑝2.
 𝑨𝑩𝑺(… ) Returnează valoarea absolută (modulul) a argumentului.
 𝑨𝑽𝑬𝑹𝑨𝑮𝑬(… ) Calculează media aritmetică (𝑚) a valorilor marcate:
𝑛
1
𝑚 = ∙ ∑ 𝑥𝑖
𝑛
𝑖=1

 𝑩𝑰𝑵𝑶𝑴. 𝑫𝑰𝑺𝑻(𝒌, 𝒏, 𝒑, 𝒄) Calculează valoarea funcției de repartiție binomiale cu


următorii parametri: 𝑘 succese din 𝑛 extrageri binomiale
având probabilitatea de succes 𝑝 și 𝑐 = 1 sau 𝑐 = ”True”:
𝑘

𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑘) = ∑ 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−𝑘 .


𝑥=0
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
de probabilitate a repartiției binomiale pentru 𝑘 succese din
𝑛 extrageri binomiale având probabilitatea de succes 𝑝:
𝑃𝑟(𝑋 = 𝑘) = 𝐶𝑛𝑘 ∙ 𝑝𝑘 ∙ (1 − 𝑝)𝑛−𝑘 .
 𝑩𝑰𝑵𝑶𝑴. 𝑰𝑵𝑽(𝒏, 𝜶, 𝒑) Returnează cuantilele repartiției binomiale de parametri 𝑛
și 𝑝, corespunzătoare unei probabilități 𝛼.
 𝑪𝑯𝑰𝑺𝑸. 𝑫𝑰𝑺𝑻(𝒙, , 𝒄) Calculează valoarea funcției de repartiție hi-pătrat, având
numărul gradelor de libertate,  și 𝑐 = 1 sau 𝑐 = "True":
𝑥 𝜈−2
𝑢 2 1
𝑃𝑟(𝑋 ≤ 𝑥) = ∫ 𝜈 ∙ 𝑒 −2∙𝑢 ∙ 𝑑𝑢.
𝜈
0 22 ∙ Γ (2)
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
densitate de probabilitate a repartiției hi-pătrat, având
numărul gradelor de libertate, :

243
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată


𝜈−2
𝑢 2 1
𝑓(𝑥) = 𝜈 ∙ 𝑒 −2∙𝑢 .
𝜈
22 ∙Γ( )
2
 𝑪𝑯𝑰𝑺𝑸. 𝑰𝑵𝑽(𝜶, ) Returnează cuantilele repartiției hi-pătrat având numărul
gradelor de libertate, , corespunzătoare unei probabilități
𝛼.
 𝑪𝑶𝑴𝑩𝑰𝑵(𝒏, 𝒌) Calculează valoarea:
𝑛!
𝐶𝑛𝑘 = .
𝑘! ∙ (𝑛 − 𝑘)!
 𝑪𝑶𝑵𝑭𝑰𝑫𝑬𝑵𝑪𝑬. 𝑵𝑶𝑹𝑴(𝜶, 𝒔, 𝒏) Returnează valoarea:
sau forma: 𝑧𝛼 ∙ 𝑠⁄√𝑛,
2
𝑪𝑶𝑵𝑭𝑰𝑫𝑬𝑵𝑪𝑬(𝜶, 𝒔, 𝒏), ce permite calculul intervalului de încredere (1 − 𝛼)% a
existentă la variantele anterioare de valorii medii de eșantionaj pentru un eșantion de volum 𝑛,
Excel. având abaterea standard 𝑠, utilizând cuantilele repartiției
normale, 𝑧𝛼⁄2 .
 𝑪𝑶𝑵𝑭𝑰𝑫𝑬𝑵𝑪𝑬. 𝑻(𝜶, 𝒔, 𝒏) Returnează valoarea:
𝑡1−𝛼,𝑛−1 ∙ 𝑠⁄√𝑛,
2
ce permite calculul intervalului de încredere (1 − 𝛼)% a
valorii medii de eșantionaj pentru un eșantion de volum 𝑛,
având abaterea standard 𝑠, utilizând cuantilele repartiției
Student, 𝑡1−𝛼⁄2,𝑛−1 .
 𝑪𝑶𝑼𝑵𝑻(… ) Returnează numărul de celule ce conțin informații din
domeniul marcat.
 𝑪𝑶𝑼𝑵𝑻𝑰𝑭(𝒅𝒐𝒎, ”𝒆𝒙𝒑”) Returnează numărul de celule ce conțin informații de tipul
“𝑒𝑥𝑝” din domeniul marcat (𝑑𝑜𝑚).
 𝑭𝑨𝑪𝑻(𝒏, ) Calculează valoarea:
𝑛!.
 𝑭𝑹𝑬𝑸𝑼𝑬𝑵𝑪𝒀(𝒗. 𝒆𝒔, 𝒍𝒊𝒎. 𝒄𝒍) Funcția determină frecvențele absolute ale unui șir de valori
de eșantionaj (v.es) organizate în 𝑘 clase având limitele
superioare lim.cl.
Pentru a determina frecvențele absolute comanda este:
[𝐶𝑡𝑟𝑙] + [𝑆ℎ𝑖𝑓𝑡] + [𝐸𝑛𝑡𝑒𝑟].
 𝑯𝑰𝑷𝑬𝑹𝑮𝑬𝑶𝑴. 𝑫𝑰𝑺𝑻(𝒌, 𝒏, 𝒂, 𝑵, 𝒄) Calculează valoarea funcției de repartiție hipergeometrice
cu următorii parametri: 𝑘 succese din 𝑛 extrageri binomiale
fără revenire, dintr-o populație de volum N, în care există a
indivizi a căror extragere este considerată succes și 𝑐 = 1
sau 𝑐 = ”True”:
𝑘
𝐶𝑡𝑎 ∙ 𝐶𝑛−𝑡
𝑁−𝑎
𝐹(𝑥) = 𝑃𝑟(𝑋 ≤ 𝑘) = ∑ 𝑛 .
𝑡=0
𝐶 𝑁

244
Tabelul I.1 (continuare) Funcții statistice

Funcția EXCEL: Valoarea returnată

Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției


de probabilitate a repartiției hipergeometrice:
𝐶𝑘𝑎 ∙ 𝐶𝑛−𝑘
𝑁−𝑎
𝑃𝑟(𝑋 = 𝑘) = 𝑛 .
𝐶𝑁
 𝑰𝑵𝑻𝑬𝑹𝑪𝑬𝑷𝑻(𝒙𝒊 , 𝒚𝒊 ) Determină parametrul 𝐴 al dreprei de regresie:
𝑦 =𝐴+𝐵∙𝑥
trasate printre norul de puncte având coordonatele
(𝑥𝑖 , 𝑦𝑖 ), 𝑖 = ̅̅̅̅̅
1, 𝑛:
∑𝑖 𝑦𝑖 ∙ ∑𝑖 𝑥𝑖2 − ∑𝑖 𝑥𝑖 ∙ ∑𝑖 𝑥𝑖 ∙ 𝑦𝑖
𝐴= .
𝑛 ∙ ∑𝑖 𝑥𝑖2 − (∑𝑖 𝑥𝑖 )2

 𝑳𝑶𝑮𝑵𝑶𝑹𝑴. 𝑫𝑰𝑺𝑻(𝒙, 𝝁, 𝝈, 𝒄) Calculează valoarea funcției de repartiție log-normale,


având parametrii 𝜇 și 𝜎, pentru valoarea 𝑥 a variabilei
aleatorii și 𝑐 = 1 sau 𝑐 = ”True”:
𝑥
1 1 −1∙(𝑙𝑛𝑢−𝜇)2
𝐹(𝑥) = ∫ ∙𝑒 2 𝜎 ∙ 𝑑𝑢
𝜎 ∙ √2 ∙ 𝜋 𝑥
0
Pentru 𝑐 = 0 sau 𝑐 = "False", calculează valoarea funcției
densitate de probabilitate a repartiției log-normale pentru
valoarea 𝑥 a variabilei aleatorii:
1 1 −1∙(𝑙𝑛𝑥−𝜇)2
𝑓(𝑥) = ∙ ∙𝑒 2 𝜎 .
𝜎 ∙ √2 ∙ 𝜋 𝑥
 𝑳𝑶𝑮𝑵𝑶𝑹𝑴. 𝑰𝑵𝑽(𝜶, 𝝁, 𝝈) Returnează cuantilele repartiției log-normale de parametri
𝜇 și 𝜎, corespunzătoare unei probabilități 𝛼.
 𝑴𝑨𝑿(… ) Returnează valoarea maximă a valorilor din domeniul
indicat ca argument al funcției.
 𝑴𝑬𝑫𝑰𝑨𝑵(… ) Returnează valoarea medianei de eșantionaj pe baza
valorilor indicate ca argument al funcției.
 𝑴𝑰𝑵(… ) Returnează valoarea minimă a valorilor din domeniul
indicat ca argument al funcției.
 𝑵𝑶𝑹𝑵. 𝑫𝑰𝑺𝑻(𝒙, 𝝁, 𝝈, 𝒄) Calculează valoarea funcției de repartiție normale, având
media 𝜇 și abaterea medie pătratică 𝜎, pentru valoarea 𝑥 a
sau forma:
variabilei aleatorii și 𝑐 = 1 sau 𝑐 = ”True”:
𝑵𝑶𝑹𝑴𝑫𝑰𝑺𝑻(𝒙, 𝝁, 𝝈, , 𝒄), 𝑥
1 1 𝑢−𝜇 2
∫𝑒 2 𝜎 )
existentă la variantele anterioare de − ∙(
𝐹(𝑥) = ∙ 𝑑𝑢.
Excel. 𝜎 ∙ √2 ∙ 𝜋
−∞
Pe