Sunteți pe pagina 1din 48

Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Curs 3
3. Repartiții clasice de probabilitate

3.1. Repartiții discrete clasice – Repartiția binomială

 Un experiment se repetă în mod independent de 𝑛 ori;


 Există două rezultate posibile: succes sau insucces;
 Probabilitatea unui succes este 𝑝 și nu se modifică de la o încercare la alta;
 Probabilitatea unui insucces este 𝑞 = 1 − 𝑝.

Ne punem problema găsirii probabilității apariției a 𝑘 succese din 𝑛 încercări. Notăm cu 𝑋 numărul
de succese care pot apărea în 𝑛 încercări ale experimentului. Repartiția variabilei aleatoare discrete
𝑋 este următoarea:
𝑛
0 1 2 3 … 𝑛
𝑋: ( … 𝑝𝑛 ) , ∑ 𝑝𝑖 = 1
𝑝0 𝑝1 𝑝2 𝑝3
𝑖=0

Repartiția lui 𝑋 se numește repartiția binomială.


Considerăm deciziile de cumpărare a trei clienți care intră într-un magazin. Din experiență,
managerul estimează că probabilitatea ca un client să cumpere este 0,3 (adică 𝑝 = 0,3; 𝑞 = 1 −
0,3 = 0,7). În această situație, repartiția lui 𝑋 va fi:
3
0 1 2 3
𝑋: ( ), ∑ 𝑝𝑖 = 1
𝑝0 𝑝1 𝑝2 𝑝3
𝑖=0

În continuare, ne propunem să determinăm probabilitățile 𝑝0 , 𝑝1 , 𝑝2 și 𝑝3 .


Numărul de situații posibile pentru a avea oricare 𝑘 succese din 𝑛 încercări este 𝐶𝑛𝑘 :
𝑛!
𝐶𝑛𝑘 =
𝑘! ∗ (𝑛 − 𝑘)!
De exemplu, dacă oricare 2 din 3 clienți cumpără, atunci:
3!
𝐶32 = = 3,
2! ∗ (3 − 2)!

1
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

deci există 3 situații posibile în care 2 clienți din 3 să cumpere. Aceaste situații sunt prezentate în
tabelul următor:
Client 1 Client 2 Client 3
cumpără cumpără nu cumpără
cumpără nu cumpără cumpără
nu cumpără cumpără cumpără

Deciziile de cumpărare a doi clienți luați la întâmplare se consideră a fi independente. Prin urmare,
dacă notăm următoarele evenimente:
𝐴 = “Clientul 1 cumpără”
𝐵 = “Clientul 2 cumpără”
Astfel, probabilitatea de apariție simultană a celor două evenimente independente 𝐴 și 𝐵 (deciziile
independente de cumpărare ale clientului 1 și clientului 2) va fi: 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵).

Așadar, deciziile de cumpărare a trei clienți, considerate și acestea independente între ele, vor fi
exprimate prin următoarele evenimente:
𝐴 = “Clientul 1 cumpără”
𝐵 = “Clientul 2 cumpără”
𝐶 = “Clientul 3 cumpără”
Probabilitatea de apariție simultană a celor trei evenimente independente 𝐴, 𝐵 și 𝐶 (deciziile
independente de cumpărare ale clientului 1, clientului 2 și clientului 3) va fi:
𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) = 𝑃(𝐴) ∗ 𝑃(𝐵) ∗ 𝑃(𝐶)
Revenind la exemplul anterior, vom calcula probabilitatea de apariție a fiecărei situații posibile,
prezentate în tabelul de mai sus, de a cumpăra 2 din 3 clienți.

Client 1 Client 2 Client 3 Probabilitatea


cumpără cumpără nu cumpără 0,3 ∗ 0,3 ∗ 0,7 = (0,3)2 ∗ 0,7 = 𝑝2 𝑞
cumpără nu cumpără cumpără 0,3 ∗ 0,7 ∗ 0,3 = (0,3)2 ∗ 0,7 = 𝑝2 𝑞
nu cumpără cumpără cumpără 0,7 ∗ 0,3 ∗ 0,3 = (0,3)2 ∗ 0,7 = 𝑝2 𝑞
∑ 3 ∗ (0,3)2 ∗ 0,7 = 3 ∗ 𝑝2 𝑞

2
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Observăm, așadar, că rezultatele care conțin două succese au fiecare probabilitatea 𝑝2 𝑞 .


Deci, probabilitatea totală a situațiilor în care am avea 2 succese din 3 încercări, va fi suma celor
trei probabilități individuale, adică:
3 ∗ (0,3)2 ∗ 0,7 = 3 ∗ 𝑝2 𝑞 = 𝐶32 𝑝2 𝑞 3−2
Deducem, astfel că, în general, probabilitatea obținerii a oricare 𝑘 succese din 𝑛 încercări este:
𝐶𝑛𝑘 𝑝𝑘 𝑞 𝑛−𝑘
O variabilă aleatoare discretă X urmează o repartiție Binomială (și notăm 𝑋~𝐵(𝑛, 𝑝),), dacă ea
este de forma:
0 1 2 𝑘 𝑛
𝑋: ( 𝑛 𝑛(𝑛 − 1) 2 𝑛−2 … … 𝑘 𝑘 𝑛−𝑘 … … 𝑛 )
𝑞 𝑛𝑝𝑞𝑛−1 𝑝 𝑞 𝐶𝑛 𝑝 𝑞 𝑝
2
sau
𝑘 𝑘
sau 𝑋(𝑛, 𝑝): ( ), unde 𝑝(𝑘) = 𝐶𝑛 𝑝𝑘 𝑞𝑛−𝑘 , 0 ≤ 𝑘 ≤ 𝑛, 𝑝, 𝑞 > 0 𝑞 = 1 − 𝑝.
𝑝(𝑘)

Calculăm, în continuare, probabilitățile 𝑝0 , 𝑝1 , 𝑝2 și 𝑝3 asociate variabilei aletoare discrete 𝑋:


3!
𝑝0 = 𝑃(𝑋 = 0) = 𝐶30 𝑝0 𝑞 3−0 = 0!∗(3−0)! ∗ 0,30 ∗ 0,73 = 0,343
3!
𝑝1 = 𝑃(𝑋 = 1) = 𝐶31 𝑝1 𝑞 3−1 = 1!∗(3−1)! ∗ 0,31 ∗ 0,72 = 0,441
3!
𝑝2 = 𝑃(𝑋 = 2) = 𝐶32 𝑝2 𝑞 3−2 = 2!∗(3−2)! ∗ 0,32 ∗ 0,71 = 0,189
3!
𝑝3 = 𝑃(𝑋 = 3) = 𝐶33 𝑝3 𝑞 3−3 = 3!∗(3−3)! ∗ 0,33 ∗ 0,70 = 0,027

Se verifică faptul că 𝑝0 + 𝑝1 + 𝑝2 + 𝑝3 = 1, deoarece 0,343 + 0,441 + 0,189 + 0,027 = 1.


Astfel, repartiția variabilei aleatoare discrete 𝑋, care urmează o repartiție binomială va fi:
0 1 2 3
𝑋: ( )
0,343 0,441 0,189 0,027
Calculăm, după definițiile prezentate în cursul anterior, media, varianța și abaterea medie pătratică
a variabilei aleatoare 𝑋:
𝑀(𝑋) = 0 ∗ 0,343 + 1 ∗ 0,441 + 2 ∗ 0,189 + 3 ∗ 0,027 = 0,9
𝜎 2 (𝑋) = (0 − 0,9)2 ∗ 0,343 + (1 − 0,9)2 ∗ 0,441 + (2 − 0,9)2 ∗ 0,189 + (3 − 0,9)2 ∗ 0,027 = 0,63
𝜎(𝑋) = √0,63 = 0,79

3
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Media unei variabile aleatoare discrete 𝑋 care urmează o repartiție binomială este:
𝑀(𝑋) = 𝑛𝑝
Varianța unei variabile aleatoare discrete 𝑋 care urmează o repartiție binomială este:
𝜎 2 (𝑋) = 𝑛𝑝𝑞
Revenind la exemplul anterior, obținem:
𝑀(𝑋) = 3 ∗ 0,3 = 0,9
𝜎 2 (𝑋) = 3 ∗ 0,3 ∗ 0,7 = 0,63
aceleași rezultate obținute anterior, dar calculate mult mai simplu.
Exemplu 1:
Considerăm deciziile de cumpărare a 1000 de clienți care intră într-un magazin. Din experiență,
managerul estimează că probabilitatea ca un client să cumpere este 0,3 (adică 𝑝 = 0,3; 𝑞 = 1 −
0,3 = 0,7). În această situație, repartiția lui 𝑋 va fi:

1000
0 1 2 3 … 1000
𝑋: ( ), ∑ 𝑝𝑖 = 1
𝑝0 𝑝1 𝑝2 𝑝3 … 𝑝1000
𝑖=0

Să se calculeze media, varianța și abaterea medie pătratică a variabilei de tip binomial, 𝑋.

Rezolvare:
Media variabilei aleatoare discrete 𝑋 care urmează o repartiție binomială va fi:
𝑀(𝑋) = 1000 ∗ 0,3 = 300
Varianța unei variabile aleatoare discrete 𝑋 care urmează o repartiție binomială este:
𝜎 2 (𝑋) = 1000 ∗ 0,3 ∗ 0,7 = 210

Exemplu 2:
O afacere de un anumit tip are succes în 60% din cazuri. Presupunem că se înființează 3 astfel de
afaceri, independente între ele.
a) Care este probabilitatea ca toate 3 să aibă succes?
b) Care este probabilitatea ca toate 3 să dea faliment?

4
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

c) Care este probabilitatea ca cel puțin 1 să aibă succes?


d) Care este probabilitatea ca 1 să aibă succes?
e) Care este numărul mediu al afacerilor de succes?
f) Care este abaterea medie pătratică?

Rezolvare:
În această situație, repartiția lui 𝑋 va fi:
3
0 1 2 3
𝑋: ( ), ∑ 𝑝𝑖 = 1
𝑝0 𝑝1 𝑝2 𝑝3
𝑖=0

3!
a) 𝑝3 = 𝑃(𝑋 = 3) = 𝐶33 𝑝3 𝑞 3−3 = 3!∗(3−3)! ∗ 0,63 ∗ 0,40 = 0,216

b) Probabilitatea ca toate 3 să dea faliment este, de fapt probabilitatea ca 0 să aibă succes.


3!
𝑝0 = 𝑃(𝑋 = 0) = 𝐶30 𝑝0 𝑞 3−0 = 0!∗(3−0)! ∗ 0,60 ∗ 0,43 = 0,064

c) Probabilitatea ca cel puțin 1 să aibă succes este probabilitatea ca 1, 2 sau toate 3 să aibă
succes, adică 𝑃((𝑋 = 1) ∪ (𝑋 = 2) ∪ (𝑋 = 3)). Știind că deciziile de cumpărare sunt
independente, obținem:
𝑃(𝑋 ≥ 1) = 𝑃((𝑋 = 1) ∪ (𝑋 = 2) ∪ (𝑋 = 3)) = 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) =
= 𝐶31 𝑝1 𝑞 3−1 + 𝐶32 𝑝2 𝑞 3−2 + 𝐶33 𝑝3 𝑞 3−3 =
3! 3! 3!
= 1!∗(3−1)! ∗ 0,61 ∗ 0,42 + 2!∗(3−2)! ∗ 0,62 ∗ 0,41 + 3!∗(3−3)! ∗ 0,63 ∗ 0,40 = 0,936

Problema putea fi rezolvată, mai ușor, prin următorul raționament:


Toate cazurile posibile în această problemă sunt 𝑋 = 0, 𝑋 = 1, 𝑋 = 2 și 𝑋 = 3.
Deci, (𝑋 = 0) ∪ (𝑋 = 1) ∪ (𝑋 = 2) ∪ (𝑋 = 3) = 𝑆
Deci,
𝑃((𝑋 = 1) ∪ (𝑋 = 2) ∪ (𝑋 = 3)) = 𝑃(𝑆) − 𝑃(𝑋 = 0) = 1 − 𝐶30 𝑝0 𝑞 3−0 =

5
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

3!
= 0!∗(3−0)! ∗ 0,60 ∗ 0,43 = 0,936

3!
d) 𝑃(𝑋 = 1) = 𝐶31 𝑝1 𝑞 3−1 = 1!∗(3−1)! ∗ 0,61 ∗ 0,42 = 0,288

e) 𝑀(𝑋) = 3 ∗ 0,6 = 1,8

f) 𝜎 2 (𝑋) = 3 ∗ 0,6 ∗ 0,4 = 0,72


𝜎(𝑋) = √0,72 = 0,8485

3.1. Repartiții continue clasice – Repartiția normală (Gauss – Laplace)

O variabilă aleatoare 𝑋 urmează repartiția normală dacă densitatea sa de probabilitate este:

1 (𝑥−𝑚)2

𝑓(𝑥) = 𝑒 2𝜎2 , 𝑓(𝑥) ≥ 0, 𝑥 ∈ ℝ, 𝑚, 𝜎 ∈ ℝ, 𝜎>0
𝜎√2𝜋
unde: 𝑚 este media variabilei aleatoare continue 𝑋
𝜎 este abaterea medie pătratică a variabilei aleatoare continue 𝑋

Vom spune că variabila aleatoare continuă 𝑋 urmează o repartiție normală și vom nota astfel:
𝑋~𝑁(𝑚, 𝜎)

În cazul particular în care media lui 𝑋 este 0 și abaterea medie pătratică a lui 𝑋 este 1, vom spune
că 𝑋 este o variabilă aleatoare normală standard și vom nota:
𝑋~𝑁(0,1)
În acest caz, densitatea de probabilitate va fi:
1 𝑥2
𝑓(𝑥) = 𝑒− 2, 𝑥∈ℝ
√2𝜋

Graficul repartiției normale, cunoscut sub denumirea de clopotul lui Gauss este următorul:

6
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Punctul 𝑚 de pe axa 𝑂𝑥 este punctul corespunzător mediei. În cazul repartiției normale, media,
mediana și modul sunt egale. Clopotul lui Gauss are un punct de maxim în punctul 𝑥 = 𝑚 și puncte
de inflexiune în punctele 𝑥 = 𝑚 ± 𝜎. Graficul repartiției normale este simetric față de o paralelă
la axa 𝑂𝑦 care trece prin punctul 𝑚 de pe axa 𝑂𝑥.
În cadrul graficului prezentat în figura anterioară, clopotul efectiv este dat de densitatea de
(𝑥−𝑚)2
1 −
probabilitate a repartiției normale, 𝑓(𝑥) = 𝜎√2𝜋 𝑒 2𝜎2 și deoarece o densitate de probabilitate

este mereu o funcție pozitivă (𝑓(𝑥) ≥ 0), graficul repartiției normale va fi situat întotdeauna
deasupra axei 𝑂𝑥. Aria de sub acest grafic este dată de funcția de repartiție a distribuției normale,
și anume:

∞ ∞ (𝑥−𝑚)2
1 −
𝐹(𝑥) = ∫ 𝑓(𝑥) 𝑑𝑥 = ∫ 𝑒 2𝜎2 𝑑𝑥 = 1
−∞ −∞ 𝜎√2𝜋

O valoare mai mare a abaterii medii pătratice, 𝜎, duce la un clopot mai aplatizat, pe când o valoare
mai mică a lui 𝜎 determină un clopt mai ascuțit, mai înalt. Figura următoare prezintă trei clopote,
cu aceeași medie, dar cu valori diferite ale abaterii medii pătratice. Relația între abaterile medii
pătratice ale celor trei clopote este:
𝜎1 > 𝜎2 > 𝜎3
7
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Figura următoare prezintă graficul unei distribuții normale standard (centrată și redusă):

Următorul grafic prezintă zonele de probabilitate de sub graficul unei distribuții normale:

8
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Pentru o variabilă normală standard graficul anterior va fi:

9
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Orice variabilă normală 𝑋~𝑁(𝑚, 𝜎) poate fi transformată într-o variabilă normală standard
𝑍~𝑁(0,1) astfel:
𝑋−𝑚
𝑍=
𝜎
Exemplu:
Pentru un anumit site, datele precedente indică faptul că durata medie de download este de 7
secunde, iar abaterea medie pătratică este de 2 secunde.
Cu ce probabilitate durata de download va fi:
a) Mai mare de 9 secunde?
b) Între 7 și 9 secunde?
c) Sub 7 secunde sau peste 9 secunde?
d) Între 5 și 9 secunde?

10
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Rezolvare:
𝑋−7 9−7
a) 𝑃(𝑋 > 9) = 𝑃 ( > ) = 𝑃(𝑍 > 1) = 𝑃(𝑍 > 0) − 𝑃(0 < 𝑍 < 1) =
2 2

= 0,5 − 0,341 = 0,159


7−7 𝑋−7 9−7
b) 𝑃(7 < 𝑋 < 9) = 𝑃 ( < < ) = 𝑃(0 < 𝑍 < 1) = 0,341
2 2 2

𝑋−7 7−7 𝑋−7 9−7


c) 𝑃((𝑋 < 7) ∪ (𝑋 > 9)) = 𝑃 (( < )∪( > )) = 𝑃((𝑍 < 0) ∪ (𝑍 > 1)) =
2 2 2 2

= 𝑃(𝑍 < 0) + 𝑃(𝑍 > 1) = 0,5 + 0,159 = 0,659


5−7 𝑋−7 9−7
d) 𝑃(5 < 𝑋 < 9) = 𝑃 ( < < ) = 𝑃(−1 < 𝑍 < 1) = 0,341 + 0,341 = 0,682
2 2 2

11
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Curs 4
4. Obținerea și prelucrarea primară a datelor statistice

4.1. Noțiuni introductive

Populația statistică reprezintă totalitatea elementelor sau evenimentelor similare din punct de
vedere calitativ (de același fel, de aceeași natură) care compun un anumit fenomen sau proces
economic bine individualizat.
Populația statistică este compusă din ansamblul unităților statistice. Unitatea statistică reprezintă
fiecare element, fiecare entitate de sine stătătoare a unei populații statistice. Unitatea statistică
posedă o serie de caracteristici cre îi conferă apartenența la o anumită populație statistică. Unitățile
statistice pot fi:
 Unități statistice simple;
 Unități statistice complexe.
Exemplu: populația statistică a studenților din Universitatea de Vest din Timișoara
Unitate statistică simplă: un student din anul I de la Facultatea de Economie și de Administrare a
Afacerilor
Unitate statistică complexă: tot anul I de la Facultatea de Economie și de Administrare a Afacerilor

Fiecare dintre unitățile statistice ale unei populații statistice prezintă un set de trăsături sau
proprietăți, numite caracteristici statistice. În general, unitățile statistice posedă un număr foarte
mare de însușiri, dar în cadrul analizei statistice se rețin doar acelea care prezintă interes pentru
cercetarea întreprinsă.
După modul de exprimare, caracteristicile statsistice pot fi:
 Cantitative (numerice) – acestea se măsoară (producția, consumul), se numără (numărul de
angajați, numărul de mijloace fixe) sau se calculează (cifra de afaceri, profitul);
 Calitative (atributive) – acestora li se observă frecvența și gradul realizării (starea socială,
calitatea produselor).

1
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Din punct de vedere al numărului de valori pe care le pot lua, caracteristicile statistice pot fi:
 Alternative (valori cu caracter dihotomic);
 Nealternative (valori multiple).
De foarte multe ori, în practică, o cercetare a fiecărui element al unei populații statistice ar implica
un timp foarte îndelungat sau costuri mult prea ridicate. În aceste situații se apelează la cunoștințele
și procedeele specifice statisticii economice, care presupune o abordare asupra întregii populații
statistice, fără însă o cercetare în întregime asupra acesteia. În aceste situații, cercetarea se
realizează doar asupra unei părți a populației de interes, urmând ca rezultatele cercetării,
concluziile desprinse să fie transpuse, extrapolate la nivelul întregii populații.
Acea parte din populația statistică ce face obiectul cercetării se numește eșantion sau selecție și
este o submulțime reprezentativă a populației. Volumul unui eșantion este, de obicei, considerabil
mai mic decât cel al populației studiate.
Procesul de obținere a eșantionului poartă denumirea de sondaj statistic și trebuie să îndeplinească
o serie de condiții care să asigure reprezentativitatea acestuia, adică, la o scară mai mică, eșantionul
trebuie să reproducă trăsăturile populației din care provine.
Prin ordonarea și gruparea datelor statistice după una sau mai multe caracteristici, se obțin seriile
statistice. După conținutul caracteristicii de grupare, seriile statistice pot fi:
 Serii de repartiție (de distribuție sau de frecvență);
 Serii de timp (dinamice sau cronologice);
 Serii de spațiu (teritoriale).
Seria de repartiție, după modul de variație al caracteristicii numerice, poate fi discretă sau
continuă. De fapt, seria de repartiție se referă la natura și repartiția variabilei aleatoare.
Seria de timp prezintă variația unei caracteristici în funcție de timp.
Seria de spațiu este cea în care caracteristica de interes variază în funcție de spațiu.
Cunoașterea evoluției fenomenelor și proceselor economice studiate se realizează prin procedeul
cercetării statistice, care conține trei etape succesive:
1. Observarea statistică sau culegerea datelor
2. Prelucrarea primară a datelor și obținerea indicatorilor statistici sintetici și derivați
3. Analiza și interpretarea economică a rezultatelor prelucrării

2
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

4.2. Observarea statistică

Observarea statistică reprezintă prima etapă a demersului statisticii economice și constă în


ansamblul activităților de culegere a datelor referitoare la caracteristicile unei populații statistice.
Datele culese trebuie să îndeplinească anumite condiții de volum și calitate, pentru a asigura un
grad ridicat de relevanță rezultatelor obținute în urma prelucrării acestora. Astfel, în cadrul
demersului observării statistice trebuie respectate simultan două principii de bază:
 Principiul autenticității datelor, care presupune realizarea concordanței dintre datele
culese și dimensiunea reală a fenomenului observat. Acesta este condiționat de îndeplinirea
următoarelor condiții:
o Condiția de volum – culegerea datelor de la toate unitățile complexe ale populației
statistice studiate;
o Condiția de calitate – impune înregistrarea unor date reale, fără erori;
 Principiul eficienței procesului de observare, care presupune culegerea doar a acelor
date care au relevanță în obținerea informației de care este nevoie în cadrul demersului
cercetării statistice.

În funcție de modul de obținere a datelor, observarea statistică poate fi:


 Observare permanentă – se realizează de către instituții specializate (Institutul Național
de Statistică) sau organisme financiar – bancare (Banca Națională a României) sau diverse
organisme guvernamentale care colectează informații referitoare la principalii indicatori
macroeconomici și financiari necesari cunoașterii unor informații cu privire la nivelul de
dezvoltare a unei țări, nivelul de trai, etc.;
 Observare specială – se organizează în situații specifice, la anumite momente de timp, în
cadrul sondajelor statistice.

După volumul de date obținut în urma observării statistice, aceasta poate fi:
 Observare totală – presupune culegerea de date de la toate unitățile simple ale unei
populații statistice (recensământul);

3
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

 Observare parțială – presupune înregistrarea doar a unei părți din totalul unităților
statistice, numite eșantion.
După momentul efectuării observării, putem avea:
 Observare statică – presupune ca datele culese să se limiteze la un anumit moment al
evoluției fenomenului studiat;
 Observare dinamică – presupune urmărirea caracteristicii de interes pe perioade
succesive de timp.

În cadrul procesului de obținere a datelor statistice, pot exista situații în care datele înregistrate nu
concordă cu realitatea. Aceste neconcordanțe poartă denumirea de erori de observare
(înregistrare). Acestea pot fi:
 Erori întâmplătoare, care se produc nepremeditat, de cele mai multe ori datorită
neatenției operatorului. De obicei, erorile întâmplătoare urmează o repartiție normală;
 Erori sistematice, care se produc în mod repetat în cadrul procesului de observare, de cele
mai multe ori având ca și cauză neînțelegerea corectă a procedeelor de culegere a datelor
sau nerespectarea acestora.
Pe lângă aceste categorii de erori, în cazul observării parțiale, mai pot apărea și erorile de
reprezentativitate, care apar atunci când eșantionul nu a fost bine ales ca volum sau ca structură.

În scopul de a asigura o observare lipsită de erori de orice fel, trebuie efectuat un control riguros,
care poate fi:
 Control cantitativ – realizat prin verificarea culegerii datelor de la toate unitățile statistice
complexe;
 Control calitativ – se efectuează prin aprecierea realității datelor folosind metode logice
sau matematice sau comparând datele culese cu înregistrări similare făcute anterior.

4
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

4.3. Prelucrarea primară a datelor statistice

Această fază a cercetării statistice constă în operațiuni de centralizare, ordonare, grupare și


reprezentare a datelor sub formă de serii, tabele sau grafice.
1. Centralizarea datelor presupune ca datele să reflecte aceeași caracteristică, exprimată în
aceeași unitate de măsură și să nu aibă erori de observare și se realizează prin totalizarea
valorilor individuale ale respectivei caracteristici.
2. Gruparea datelor constă în separarea unităților unei populații în subgrupe omogene în
raport cu una sau mai multe caracteristici.
De obicei, gruparea se realizează după criterii specifice fiecărui fenomen cercetat. În lipsa
unor specificații de acest gen, se utilizează o metodă de grupare pur statistică prin care se
creează un șir de intervale de lungimi, de regulă, egale. Această lungime se notează cu ℎ și
se calculează utilizând formula lui Sturges:
𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
ℎ=
1 + 3,322 ∗ 𝑙𝑔(𝑛)
Valoarea lui ℎ se rotunjește, de obicei, în sus. În continuare, se formează intervalele în
funcție de variația caracteristicii analizate (discretă sau continuă).
În cazul caracteristicilor continue, intervalele se formează pornind de la valoarea minimă
sau de la o valoare puțin mai mică decât aceasta (de exemplu partea întreagă a valorii
minime), la care se adaugă ℎ. Limita superioară a primului interval devine limita inferioară
a următorului interval și așa mai departe, până când se ajunge la un interval care să conțină
valoarea maximă. Se stabilește o regulă prin care intervalele sunt neapărat închise la un
capăt și deschise la celălalt.
Exemplu: Cheltuielile cu publicitatea ale unei firme au fost monitorizate pe o perioadă de
16 luni, obținându-se următoarele date:
10, 9, 12, 10, 14, 11, 16, 9, 12, 14, 11, 10, 17, 10, 14, 13.
Să se grupeze datele pe intervale și să se determine distribuția de frecvență.

5
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Rezolvare:
17 − 9
ℎ= = 1,59 ≈ 2
1 + 3,322 ∗ 𝑙𝑔(16)

Cheltuieli cu publicitatea
(Intervale)
[9,11)
[11,13)
[13,15)
[15,17)
[17,19)

În cazul caracteristicilor discrete, limita inferioară a intervalului următor nu mai coincide


cu limita superioară a intervalului anterior, ci se deplasează cu o unitate în sus.
Exemplu: Angajații a 16 firme cu același obiect de activitate sunt prezentați în cele ce
urmează (ca și număr de angajați):
10, 9, 12, 10, 14, 11, 16, 9, 12, 14, 11, 10, 17, 10, 14, 13.
Să se grupeze datele pe intervale și să se determine distribuția de frecvență.

Rezolvare:
17 − 9
ℎ= = 1,59 ≈ 2
1 + 3,322 ∗ 𝑙𝑔(16)

Cheltuieli cu publicitatea
(Intervale)
9 – 11
12 – 14
15 – 17

Se determină apoi frecvențele absolute, relative, cumulate și cumulate relative.


Frecvența absolută (𝑛𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑘 ) a unui interval arată numărul de valori din seria inițială de
date care se găsesc în intervalul respectiv. Suma frecvențelor absolute este egală cu
volumul eșantionului:

6
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

∑ 𝑛𝑖 = 𝑛
𝑖=1

unde 𝑘 este numărul intervalelor de grupare


Frecvențele relative (𝑓𝑖 ) se determină prin raportul dintre frecvențele absolute și volumul
eșantionului. Suma frecvențelor relative este egală cu 1:
𝑘

∑ 𝑓𝑖 = 1
𝑖=1

Frecvența cumulată a unui interval (𝐶𝑛𝑖 ) se determină prin suma dintre frecvența absolută
a intervalului respectiv și frecvențele absolute ale tuturor intervalelor anterioare. Ultima
frecvență cumulată este egală cu volumul eșantionului:
𝐶𝑛𝑘 = 𝑛
Frecvența cumulată relativă a unui interval (𝐶𝑓𝑖 ) se determină prin raportul dintre frecvența
cumulată și volumul eșantionului. Ultima frecvență cumulată relativă este egală cu 1:
𝐶𝑓𝑖 = 1

Exemplu (caracteristici continue):


Cheltuieli cu publicitatea
(Intervale) 𝑛𝑖 𝑓𝑖 𝐶𝑛𝑖 𝐶𝑓𝑖
[9,11) 6 0.375 6 0.375
[11,13) 4 0.25 10 0.625
[13,15) 4 0.25 14 0.875
[15,17) 1 0.0625 15 0.9375
[17,19) 1 0.0625 16 1
∑ 16 1 * *

Exemplu (caracteristici discrete):


Cheltuieli cu publicitatea
(Intervale) 𝑛𝑖 𝑓𝑖 𝐶𝑛𝑖 𝐶𝑓𝑖
9 – 11 8 0,5 8 0,5

12 – 14 6 0,375 14 0,875

15 – 17 2 0,125 16 1

∑ 16 1 * *

7
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

3. Prezentarea datelor sub formă de serii se realizează printr-un șir dublu. Primul șir se
referă la variația caracteristicii studiate, iar al doilea la frecvența de apariție
corespunzătoare:
𝑥1 𝑥2 𝑥3 … 𝑥𝑘
𝑋: (𝑛 𝑛2 𝑛3 … 𝑛𝑘 )
1

4. Prezentarea datelor sub formă de tabele statistice trebuie să conțină:


 Titlul sau subiectul tabelului;
 Titlurile liniilor și ale coloanelor;
 Unitatea de măsură;
 Sursa datelor;
 Notele.
5. Reprezentarea grafică a seriilor statistice permite o vizualizare rapidă a distribuției seriei
de date. O reprezentare grafică trebuie să conțină următoarele elemente:
 Titlul graficului;
 Axele de coordonate;
 Scara graficului (dacă este cazul);
 Notele;
 Sursa graficului;
 Legenda;
 Rețeaua graficului.

Principalele forme de reprezentare grafică în domeniul statisticii sunt:


 Histograma – construită pe baza frecvențelor absolute;
 Poligonul frecvențelor – construit pe baza frecvențelor absolute;
 Curba cumulativă a frecvențelor – construită pe baza frecvențelor cumulate;
 Graficul tip “plăcintă” – construit pe baza frecvențelor relative.

8
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Exemplu (caracteristici continue):

9
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

10
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Curs 5
5. Parametrii repartițiilor empirice

În vederea cercetării statistice a tendințelor și a regulilor de evoluție ale unui proces sau fenomen
economic, este important să cunoaștem principalii parametrii care caracterizează repartiția
acestuia.
După aspectul pe care îl caracterizează, parametrii repartiției unei variabile aleatoare sunt grupați
astfel:
 Parametrii tendinței centrale;
 Paramaterii variației;
 Parametrii asimetriei și ai boltirii.

5.1. Parametrii tendinței centrale

În cadrul oricărei repartiții de date care caracterizează un fenomen economic, de obicei, valorile
observate manifestă o anumită tendință de grupare în jurul unei anumit valori, numite centru de
grupare.
Caracterizarea acestui centru de grupare se realizează în cadrul analizei statistice cu ajutorul unor
parametrii numiți mărimi medii sau parametrii ai tendinței centrale. Acestea relevă ceea ce este
tipic, generalizant pentru unitățile populației statistice analizate. Mărimile medii trebuie să
îndeplinească urmăoarele condiții:
1) Să fie precis definite, prin formule sau definiții care să conducă de fiecare dată orice
utilizator, orice analist, la același rezultat pe baza acelorași date;
2) Să fie reprezentative pentru toți termenii populației analizate;
3) Să fie stabile, adică să nu comporte influențe majore din partea modului de selecție a
eșantionului (oricum s-ar construi eșantioanele analizate, mărimile medii să nu se modifice
semnificativ de la un eșantion la altul).
După rolul lor, mărimile medii sunt:
 Mărimi obținute prin calcul (media aritmetică, media geometrică, media armonică,
media pătratică);

1
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

 Mărimi de poziție, utilizate pentru identificarea locului centrului de grupare (mediana,


modul, quantilele).
În funcție de modul de calcul, putem avea:
 Mărimi medii simple (în cadrul seriilor simple de date – date negrupate);
 Mărimi medii ponderate (în cazul seriilor grupate pe intervale de frecvență).

5.1.1. Media

Se numește media unei variabile aleatoare 𝑋 acea valoare notată 𝑋̅ care, în urma substituției 𝑥𝑖 =
𝑋̅, 𝑖 = ̅̅̅̅̅
1, 𝑛, nu modifică proprietatea determinantă a variabilei respective.
Prin proprietate determinantă se înțelege acea proprietate a unei populații statistice omogene, care
este valabilă pentru toate unitățile componente ale acesteia.
Pentru exprimarea proprietății determinante, se folosesc momentele de ordin 𝑟.
Media de ordinul 𝑟 este dată de relațiile:
1
𝑟 ∑𝑛 𝑟
𝑖=1 𝑥𝑖 ∑𝑛 𝑟
𝑖=1 𝑥𝑖 𝑟
 Media simplă de ordinul 𝒓 (pentru date negrupate): 𝑋̅𝑟 = √ =( )
𝑛 𝑛

1
𝑟 ∑𝑘 𝑟
𝑖=1 𝑥𝑖 ∗𝑛𝑖 ∑𝑘 𝑟
𝑖=1 𝑥𝑖 ∗𝑛𝑖
𝑟
 Media ponderată de ordinul 𝒓: 𝑋̅𝑟 = √ ∑𝑘
=( ∑𝑘
)
𝑖=1 𝑛𝑖 𝑖=1 𝑛𝑖

unde:
𝑥𝑖 = valorile individuale ale caracteristicii analizate
𝑛 = volumul eșantionului
𝑛𝑖 = frecvențele absolute
𝑘 = numărul categoriilor de grupare
 Media de ordinul 𝒓 pentru date grupate pe intervale de frecvență:
1
𝑟∑𝑘𝑖=1 𝑥𝑖′ 𝑟 ∗ 𝑛𝑖 ∑𝑘𝑖=1 𝑥𝑖′ 𝑟 ∗ 𝑛𝑖 𝑟
̅
𝑋𝑟 = √ =( )
∑𝑘𝑖=1 𝑛𝑖 ∑𝑘𝑖=1 𝑛𝑖

unde:
𝑥𝑖′ = mijloacele intervalelor de grupare
𝑛 = volumul eșantionului

2
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

𝑛𝑖 = frecvențele absolute
𝑘 = numărul categoriilor de grupare

5.1.1.1. Media aritmetică

Media aritmetică este media de ordinul 1 (𝑟 = 1), fiind cea mai cunoscută și cea mai utilizată
medie. Media unui eșantion se notează 𝑋̅, iar media unei populații se notează cu 𝑚.
Media aritmetică se foloseşte atunci când fenomenul supus cercetării înregistrează modificări
aproximativ constante, în progresie aritmetică, prezentând, deci, o tendinţă liniară.
∑𝑛
𝑖=1 𝑥𝑖
 Media aritmetică simplă (pentru date negrupate): 𝑋̅ = 𝑛

Exemplu: Cheltuielile cu publicitatea ale unei firme au fost monitorizate pe o perioadă de


16 luni, obținându-se următoarele date:
10, 9, 12, 10, 14, 11, 16, 9, 12, 14, 11, 10, 17, 10, 14, 13.
Să se calculeze media cheltuielilor cu publicitatea.
10 + 9 + 12 + 10 + 14 + 11 + 16 + 9 + 12 + 14 + 11 + 10 + 17 + 10 + 14 + 13
𝑋̅ =
16
192
= = 12
16

∑ 𝑘
𝑥𝑖 ∗𝑛𝑖
 Media aritmetică ponderată: 𝑋̅ = 𝑖=1
∑𝑘 𝑖=1 𝑛𝑖

Dacă ținem cont de faptul că ∑𝑘𝑖=1 𝑛𝑖 = 𝑛, atunci formula anterioară poate fi scrisă ca:
𝑘 𝑘
∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑛𝑖 ∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑛𝑖 𝑛𝑖
̅
𝑋= = = ∑ 𝑥𝑖 ∗ = ∑ 𝑥𝑖 ∗ 𝑓𝑖
𝑘
∑𝑖=1 𝑛𝑖 𝑛 𝑛
𝑖=1 𝑖=1

unde 𝑓𝑖 = frecvențele relative

Exemplu: Distribuția cheltuielilor cu publicitatea ale unei firme, pe parcursul a 16 luni este
prezentată în tabelul de mai jos:

3
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Numărul lunilor în care cheltuielile


Cheltuieli cu
cu publicitatea au avut valoarea de pe 𝑓𝑖
publicitatea
coloana 1 (𝑛𝑖 )
9 2 0,125
10 4 0,25
11 2 0,125
12 2 0,125
13 1 0,0625
14 3 0,1875
16 1 0,0625
17 1 0,0625
∑ 16 1

Să se calculeze media cheltuielilor cu publicitatea.

2 ∗ 9 + 4 ∗ 10 + 2 ∗ 11 + 2 ∗ 12 + 1 ∗ 13 + 3 ∗ 14 + 1 ∗ 16 + 1 ∗ 17 192
𝑋̅ = = = 12
2+4+2+2+1+3+1+1 16
sau
𝑋̅ = 9 ∗ 0,125 + 10 ∗ 0,25 + 11 ∗ 0,125 + 12 ∗ 0,125 + 13 ∗ 0,0625 + 14 ∗ 0,1875
+ 16 ∗ 0,0625 + 17 ∗ 0,0625 = 12

∑ 𝑘 ′
𝑥𝑖 ∗𝑛𝑖
 Media aritmetică pentru date grupate pe intervale: 𝑋̅ = 𝑖=1
∑𝑘 𝑖=1 𝑛𝑖

𝑥𝑖′ = mijloacele intervalelor de grupare


Exemplu: Tabelul următor prezintă o grupare a cheltuielilor cu publicitatea ale unei firme,
monitorizate pe parcursul a 16 luni. Să se determine valoarea medie lunară a cheltuielilor
cu publicitatea:
Cheltuieli cu
publicitatea
(Intervale) 𝑛𝑖 𝑥𝑖′ 𝑥𝑖′ ∗ 𝑛𝑖
[9,11) 6 10 60
[11,13) 4 12 48
[13,15) 4 14 56
[15,17) 1 16 16
[17,19) 1 18 18
16 198
198
𝑋̅ = = 12,375
16
Observație: Media se situează întotdeauna între valorile extreme ale variabilei studiate (adică este
mai mare decât valoarea minimă și mai mică decât valoarea maximă).

4
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

5.1.1.2. Media pătratică

Media pătratică reprezintă media de odinul 2 (𝑟 = 2) și se notează 𝑋̅𝑝 .


Media pătratică se foloseşte în cazul în care fenomenele înregistrează creşteri, aproximativ, în
progresie exponenţială, adică atunci când creşterea este mai lentă la începutul seriei şi din ce în ce
mai pronunţată spre sfârşitul acesteia, fiind utilizată, deci, în analiza tendinţelor neliniare, de tip
exponenţial.
Se calculează astfel:
∑ 𝑛 2
𝑥𝑖
 Media pătratică simplă (pentru date negrupate): 𝑋̅𝑝 = √ 𝑖=1
𝑛

102 +92 +122 +102 +142 +112 +162 +92 +122 +142 +112 +102 +172 +102 +142 +132
Exemplu: 𝑋̅𝑝 = √ =
16

2394
=√ = 12,23
16

∑ 𝑘 2
𝑥𝑖 ∗𝑛𝑖
 Media pătratică ponderată: 𝑋̅𝑝 = √ 𝑖=1
∑𝑘 𝑖=1 𝑛𝑖

2∗92 +4∗102 +2∗112 +2∗122 +1∗132 +3∗142 +1∗162 +1∗172 2394


Exemplu: 𝑋̅𝑝 = √ =√ = 12,23
2+4+2+2+1+3+1+1 16

2
∑𝑘 ′
𝑖=1 𝑥𝑖 ∗𝑛𝑖
 Media pătratică pentru date grupate pe intervale: 𝑋̅𝑝 = √ ∑𝑘
𝑖=1 𝑛𝑖

Exemplu:
Cheltuieli cu
publicitatea
2 2
(Intervale) 𝑛𝑖 𝑥𝑖′ 𝑥𝑖′ 𝑥𝑖′ ∗ 𝑛𝑖
[9,11) 6 10 100 600
[11,13) 4 12 144 576
[13,15) 4 14 196 784
[15,17) 1 16 256 256
[17,19) 1 18 324 324
∑ 16 * * 2540

5
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

2540
𝑋̅𝑝 = √ = 12,59
16

5.1.1.3. Media armonică

Media armonică este media pentru care 𝑟 = −1, fiind definită ca inversa mediei aritmetice. Ea se
notează 𝑋̅ℎ și se utilizează atunci când se dorește atribuirea unei importanțe mai ridicate valorilor
mai mici. Media armonică se calculează astfel:
𝑛
 Media armonică simplă (pentru date negrupate): 𝑋̅ℎ = 1
∑𝑛
𝑖=1 𝑥𝑖

16 16
Exemplu: 𝑋̅ℎ = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 = 1,38 = 11,56
+ + + + + + + + + + + + + + +
10 9 12 10 14 11 16 9 12 14 11 10 17 10 14 13

∑𝑘
𝑖=1 𝑛𝑖
 Media armonică ponderată: 𝑋̅ℎ = 1
∑𝑘
𝑖=1(𝑥 ∗𝑛𝑖 )
𝑖

2+4+2+2+1+3+1+1 16
Exemplu: 𝑋̅ℎ = 1 1 1 1 1 1 1 1 = 1,38 = 11,56
2∗ +4∗ +2∗ +2∗ +1∗ +3∗ +1∗ +1∗
9 10 11 12 13 14 16 17

∑𝑘
𝑖=1 𝑛𝑖
 Media armonică pentru date grupate pe intervale: 𝑋̅ℎ = 1
∑𝑘
𝑖=1( ′ ∗𝑛𝑖 )
𝑥𝑖

Cheltuieli cu
publicitatea 1 1
∗ 𝑛𝑖
(Intervale) 𝑛𝑖 𝑥𝑖′ 𝑥𝑖′ 𝑥𝑖′
[9,11) 6 10 0.1 0.6
[11,13) 4 12 0.083333 0.333333
[13,15) 4 14 0.071429 0.285714
[15,17) 1 16 0.0625 0.0625
[17,19) 1 18 0.055556 0.055556
∑ 16 * * 1.337103

16
Exemplu: 𝑋̅ℎ = 1,337103 = 11,96

6
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

5.1.1.4. Media geometrică

Media geometrică reprezintă în mod convențional media de ordinul 0 (𝑟 = 0) și se notează cu 𝑋̅𝑔 .


Media geometrică se utilizează atunci când datele analizate prezintă modificări, aproximativ, în
progresie geometrică (diferenţele dintre date sunt mai mari la începutul seriei şi din ce în ce mai
mici spre sfârşitul seriei).
Media geometrică se calculează astfel:

 Media geometrică simplă (pentru date negrupate): 𝑋̅𝑔 = 𝑛√∏𝑛𝑖=1 𝑥𝑖


Exemplu:
16
𝑋̅𝑔 = √10 ∗ 9 ∗ 12 ∗ 10 ∗ 14 ∗ 11 ∗ 16 ∗ 9 ∗ 12 ∗ 14 ∗ 11 ∗ 10 ∗ 17 ∗ 10 ∗ 14 ∗ 13 =
16
= √136939659816960000 = 11,77

∑𝑘
𝑖=1 𝑛𝑖
 Media geometrică ponderată: 𝑋̅𝑔 = √∏𝑘𝑖=1 𝑥𝑖 𝑛𝑖
(2+4+2+2+1+3+1+1)
Exemplu: 𝑋̅𝑔 = √92 ∗ 104 ∗ 112 ∗ 122 ∗ 131 ∗ 143 ∗ 161 ∗ 171 =
16
= √136939659816960000 = 11,77

∑𝑘
𝑖=1 𝑛𝑖
 Media geometrică pentru date grupate pe intervale: 𝑋̅𝑔 = √∏𝑘𝑖=1 𝑥𝑖′ 𝑛𝑖

Cheltuieli cu
publicitatea
𝑛𝑖
(Intervale) 𝑛𝑖 𝑥𝑖′ 𝑥𝑖′
[9,11) 6 10 1000000
[11,13) 4 12 20736
[13,15) 4 14 38416
[15,17) 1 16 16
[17,19) 1 18 18
∑ =16 * ∏ =229419122688000000

16
Exemplu: 𝑋̅𝑔 = √229419122688000000 = 12,16

7
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

5.1.2. Mediana

Mediana unei serii de date (𝑋̅𝑒 ) este acea valoare pentru care probabilitatea ca variabila aleatoare
𝑋 să ia valori inferioare ei este egală cu probabilitatea ca 𝑋 să ia valori superioare ei:
𝑃(𝑋 < 𝑋̅𝑒 ) = 𝑃(𝑋 > 𝑋̅𝑒 )
Deci, mediana este valoarea centrală a unei serii ordonate de date, cea care împarte repartiția în
două părți egale.
Pentru date negrupate, în scopul determinării medianei, trebuie mai întâi ordonate datele
crescător. Apoi:
 Dacă 𝒏 este număr impar, atunci mediana este valoarea centrală a seriei ordonate de date:
𝑛+1
𝑋̅𝑒 = 𝑥𝑛+1 (valoarea cu numărul de ordine 2 ).
2

Exemplu: Deoarece în exemplul utilizat anterior 𝑛 = 16, număr par, nu vom putea utiliza acea
aplicație pentru a exemplifica mediana pe date negrupate cu 𝑛 număr impar. De aceea, vom lua
următoarele date:
10, 9, 12, 10, 14, 11, 16. 𝑛=7
Ordonăm datele crescător: 9, 10, 10, 𝟏𝟏, 12, 14, 16
1, 2, 3, 𝟒, 5, 6, 7
7+1
Deci, mediana este valoarea cu numărul = 4, din seria ordonată de date, adică 𝑋̅𝑒 = 11
2

 Dacă 𝒏 este număr par, atunci mediana este media aritmetică a celor două valori centrale
1 𝑛 𝑛
ale seriei ordonate de date: 𝑋̅𝑒 = 2 (𝑥𝑛 + 𝑥𝑛+1 ) (valorile cu numerele de ordine 2 și 2 + 1).
2 2

Exemplu: Revenim la problema utilizată anterior, cu cheltuieli de publicitate


10, 9, 12, 10, 14, 11, 16, 9, 12, 14, 11, 10, 17, 10, 14, 13. 𝑛 = 16
Ordonăm datele crescător: 9, 9, 10, 10, 10, 10, 11, 𝟏𝟏, 𝟏𝟐, 12, 13, 14, 14, 14, 16, 17.
1, 2, 3, 4, 5, 6, 7, 𝟖, 𝟗, 10, 11, 12, 13, 14, 15, 16
16 16
Deci, mediana este media aritmetică a valorilor cu numerele = 8 și + 1 = 9, din seria
2 2
11+12
ordonată de date, adică 𝑋̅𝑒 = 2 = 11,5

8
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Pentru date grupate, primul pas al determinării medianei constă în identificarea intervalului
𝑛
median. Intervalul median este cel corespunzător primei frecvențe cumulate mai mari decât .
2

Mediana se va calcula conform relației:


𝑛
− 𝐶𝑒−1
𝑋̅𝑒 = 𝑋𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + ℎ𝑒 ∗ 2
𝑛𝑒
𝑋𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = limita inferioară a intervalului median
ℎ𝑒 = lungimea intervalului median
𝐶𝑒−1 = frecvența cumulată a intervalului anterior celui median
𝑛𝑒 = frecvența absolută a intervalului median

Exemplu:
Cheltuieli cu publicitatea
(Intervale) 𝑛𝑖 𝑥𝑖′ 𝐶𝑛𝑖
[9,11) 6 10 6
[11,13) 4 12 10
[13,15) 4 14 14
[15,17) 1 16 15
[17,19) 1 18 16
∑ 16 * *

Intervalul median este [11,13), deoarece frecvența cumulată a acestui interval este 10, prima
16
frecvență cumulată mai mare decât = 8.
2
16
−6
Astfel, mediana este: 𝑋̅𝑒 = 11 + 2 ∗ 2
= 12
4

5.1.3. Modul

Modul este valoarea cu frecvența maximă de apariție.


Pentru variabilele discrete, modul este valoarea cu cea mai mare probabilitate de apariție.
Pentru o variabilă continuă, modul este valoarea corespunzătoare vârfului curbei de frecvență
(vârfului graficului), adică este valoarea corespunzătoarea acelui punct în care se aglomerează
majoritatea datelor.

9
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Pentru date negrupate, modul (𝑋̅0) este valoarea care apare de cele mai multe ori (valoarea cu
frecvența maximă de apariție).
Exemplu: 10, 9, 12, 10, 14, 11, 16, 9, 12, 14, 11, 10, 17, 10, 14, 13
𝑋̅0 = 10, valoarea care se repetă de cele mai multe ori (de 4 ori)
Observație: Dacă există două sau mai multe valori care se repetă de cele mai multe ori, atunci
modul nu se poate determina (repartiție plurimodală).

Pentru datele grupate, prima etapă este cea a determinării intervalului modal. Intervalul modal
este cel care are frecvența absolută maximă. Modul se va calcula conform relației:
∆1
𝑋̅0 = 𝑋𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + ℎ0 ∗
∆1 + ∆2
𝑋𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = limita inferioară a intervalului modal
ℎ0 = lungimea intervalului modal
∆1= diferența dintre frecvența absolută a intervalului modal (cea maximă) și cea anterioară:
∆1 = 𝑛0 − 𝑛0−1
∆2 = diferența dintre frecvența absolută a intervalului modal (cea maximă) și următoarea:
∆2 = 𝑛0 − 𝑛0+1
Observație: ∆1 și ∆2 vor fi întotdeauna strict pozitive, deoarece ele constau în diferența dintre
frecvența absolută maximă (𝑛0 ) și cea anterioară, respectiv posterioară acesteia (𝑛0−1 , 𝑛0+1 ).

Exemplu:
Cheltuieli cu publicitatea
(Intervale) 𝑛𝑖
[9,11) 6
[11,13) 4
[13,15) 4
[15,17) 1
[17,19) 1
∑ 16

Intervalul modal este [9,11), deoarece frecvența absolută a acestui interval este 6, cea mai mare
frecvență absolută.
6−0
Astfel, modul este: 𝑋̅0 = 9 + 2 ∗ (6−0)+(6−4) = 10,5

10
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

!!! la ∆1 se scade 0 din frecvența absolută maximă (6), deoarece intervalul modal este primul
interval, iar frecvența absolută anterioară nu există.
Observație: Dacă există mai mult de un interval cu frecvență absolută maximă, atunci modul nu
se poate determina și spunem că avem o serie de date plurimodală.
Ca aplicabilitate practică, modul poate înlocui media, atunci când aceasta nu poate fi calculată sau
nu are sens calcularea ei. De exemplu, nu are sens determinarea modelului mediu al automobilelor
vândute și se va lua în considerare ca valoare centrală modelul vândut cel mai des, de cele mai
multe ori, adică modul.
Într-o repartiție perfect simetrică și unimodală media, mediana și modul coincid. Acesta este și
cazul repartiției normale, în cadrul căreia media, modul și mediana corespund vârfului clopotului
lui Gauss.

Alegerea celui mai semnificativ parametru central al unei serii de date diferă de la o situație la alta,
existând câteva caracteristici particulare ale valorilor centrale, în funcție de care pot fi diferențiate.
Astfel, media este influențată de fiecare valoare a seriei de date, deoarece toate valorile sunt
implicate calculul mediei. De aceea, media este sensibilă la valorile extreme ale seriei de date.
Astfel, media este recomandată pentru seriile omogene de date, care nu prezintă valori extreme.
Mediana și modul sunt influențate mai mult de numărul de date al seriei și de punctul în care
acestea sunt concentrate, decât de valorile extreme. Astfel, acestea sunt mai potrivite pentru seriile
care prezintă valori extreme.

11
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Curs 1
1. Experiențe aleatoare. Evenimente. Definiția clasică a probabilității

1.1. Noțiuni introductive

Experiență = act sau proces bine definit, care se desfășoară în condiții bine precizate și a cărui
realizare conduce la obținerea unui anumit rezultat

Experiență aleatoare = o experiență al cărei rezultat nu poate fi cunoscut înainte de realizarea


experienței
Exemple:
1. Aruncarea unui zar
2. Auncarea unei monede
3. Extragerea unei bile dintr-o urnă cu bile
4. Extragerea unui număr la 6/49

Eveniment aleator = o situație legată de o experiență aleatoare, despre care putem spune cu
certitudine dacă s-a produs sau nu
Exemple (legate de aruncarea unui zar):
𝐸1 : apare fața cu numărul 1
𝐸2 : apare fața cu numărul 2
𝐸3 : apare fața cu numărul 3
𝐸4 : apare fața cu numărul 4
𝐸5 : apare fața cu numărul 5
𝐸6 : apare fața cu numărul 6
𝐸7 : apare una dintre fețele 1, 2, 3, 4, 5 sau 6
𝐸8 : apare fața cu numărul 7
𝐸9 : apare fața cu numărul 1 sau cu numărul 2
𝐸10 : apare o față impară

1
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

𝐸11 : apare o față pară


𝐸12 : apare una dintre fețele 1, 3, sau 5
𝐸13 : apare una dintre fețele 2, 4, sau 6
𝐸14 : apare una dintre fețele 1, 2 sau 3
𝐸15 : apare una dintre fețele 4, 5, sau 6

Evenimentul sigur (𝑺) se realizează cu certitudine la fiecare efectuare a experienței


Exemplu: 𝐸7 = 𝑆: apare una dintre fețele 1, 2, 3, 4, 5 sau 6

Evenimentul imposibil (∅) nu se produce la nicio efectuare a experienței


Exemplu: 𝐸8 = ∅: apare fața cu numărul 7

Evenimentul elementar este un singur rezultat posibil al experienței


Exemplu: 𝐸1 , 𝐸2 , 𝐸3 , 𝐸4 , 𝐸5 , 𝐸6

Evenimentul compus: apar două sau mai multe rezultate ale experienței
Exemplu: 𝐸7 , 𝐸9 , 𝐸10 , 𝐸11 , 𝐸12 , 𝐸13 , 𝐸14 , 𝐸15

Evenimentul contrar unui anumit eveniment 𝐴, se notează 𝐴̅, se citește “non 𝐴” și este acel
eveniment care nu se realizează cu certitudine atunci când se realizează 𝐴
̅ și 𝑆̅ = ∅
𝑆=∅
Exemple:
𝐸10 este evenimentul contrar al lui 𝐸11 și 𝐸13 , adică ̅̅̅̅
𝐸10 = 𝐸11 și ̅̅̅̅
𝐸10 = 𝐸13
𝐸11 este evenimentul contrar al lui 𝐸10 și 𝐸12 , adică ̅̅̅̅
𝐸11 = 𝐸10 și ̅̅̅̅
𝐸11 = 𝐸12
𝐸12 este evenimentul contrar al lui 𝐸11 și 𝐸13 , adică ̅̅̅̅
𝐸12 = 𝐸11 și ̅̅̅̅
𝐸12 = 𝐸13
𝐸13 este evenimentul contrar al lui 𝐸10 și 𝐸12 , adică ̅̅̅̅
𝐸13 = 𝐸10 și ̅̅̅̅
𝐸13 = 𝐸12
𝐸14 este evenimentul contrar al lui 𝐸15 , adică adică ̅̅̅̅
𝐸14 = 𝐸15
𝐸15 este evenimentul contrar al lui 𝐸14 , adică adică ̅̅̅̅
𝐸15 = 𝐸14

2
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Evenimente compatibile: evenimente care se pot produce simultan


Exemple:
𝐸1 cu 𝐸7 𝐸1 cu 𝐸9 𝐸1 cu 𝐸12 𝐸12 cu 𝐸14
𝐸2 cu 𝐸7 𝐸2 cu 𝐸9 𝐸3 cu 𝐸12 𝐸12 cu 𝐸15
𝐸3 cu 𝐸7 𝐸1 cu 𝐸10 𝐸5 cu 𝐸12 𝐸13 cu 𝐸14
𝐸4 cu 𝐸7 𝐸3 cu 𝐸10 𝐸2 cu 𝐸13 𝐸13 cu 𝐸15
𝐸5 cu 𝐸7 𝐸5 cu 𝐸10 𝐸4 cu 𝐸13 𝐸9 cu 𝐸10
𝐸6 cu 𝐸7 𝐸2 cu 𝐸11 𝐸6 cu 𝐸13 𝐸9 cu 𝐸11
𝐸4 cu 𝐸11 𝐸9 cu 𝐸12
𝐸6 cu 𝐸11 𝐸9 cu 𝐸13
𝐸9 cu 𝐸14

Evenimente incompatibile: evenimente care nu se pot produce simultan


Exemple:
𝐸1 cu 𝐸2 𝐸1 cu 𝐸11 𝐸1 cu 𝐸15 𝐸9 cu 𝐸15
𝐸1 cu 𝐸3 𝐸1 cu 𝐸13 𝐸2 cu 𝐸15
𝐸1 cu 𝐸4 𝐸3 cu 𝐸9 𝐸3 cu 𝐸15
𝐸1 cu 𝐸5 𝐸4 cu 𝐸9 𝐸4 cu 𝐸14
𝐸1 cu 𝐸6 𝐸5 cu 𝐸9 𝐸5 cu 𝐸14
𝐸6 cu 𝐸9 𝐸6 cu 𝐸14
Orice evenimente contrare sunt și incompatibile, dar reciproca nu este adevărată.
Exemplu:
𝐸14 cu 𝐸15 sunt contrare și incompatibile. Sunt contrare deoarece 𝐸14 ∪ 𝐸15 = 𝐸7 = 𝑆
𝐸9 cu 𝐸15 sunt doar incompatibile, fără a fi contrare, deoarece 𝐸9 ∪ 𝐸15 ≠ 𝑆

Deci, pentru a fi contrare, două evenimente trebuie să:


1) Fie incompatibile
2) Reuniunea lor să fie evenimentul sigur.

3
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Spunem că evenimentul 𝐴 implică evenimentul 𝐵 sau că evenimentul 𝐵 este implicat de


evenimentul 𝐴 și notăm 𝐴 ⇒ 𝐵 sau 𝐴 ⊂ 𝐵 dacă 𝐵 se produce ori de câte ori se produce 𝐴.

Exemple:
𝐸1 ⇒ 𝐸7 𝐸1 ⇒ 𝐸9 𝐸3 ⇒ 𝐸14

𝐸2 ⇒ 𝐸7 𝐸2 ⇒ 𝐸9 𝐸4 ⇒ 𝐸15

𝐸3 ⇒ 𝐸7 𝐸1 ⇒ 𝐸10

𝐸4 ⇒ 𝐸7 𝐸1 ⇒ 𝐸12

𝐸5 ⇒ 𝐸7 𝐸2 ⇒ 𝐸11

𝐸6 ⇒ 𝐸7 𝐸2 ⇒ 𝐸13

Orice eveniment este implicat de ∅ și implică 𝑆:


𝐴 ⇒ 𝑆 și ∅ ⇒ 𝐴

Două evenimente sunt echivalente dacă fiecare eveniment îl implică pe celălalt: 𝐴 ↔ 𝐵 sau 𝐴 = 𝐵
Exemplu:
𝐸10 ⇒ 𝐸12

𝐸11 ⇒ 𝐸13

Fie 𝐴 și 𝐵 două evenimente cu 𝑃(𝐴), 𝑃(𝐵) > 0. Dacă apariția evenimentului 𝐴 nu este influențată
de apariția evenimentului 𝐵 și reciproc, atunci evenimentele 𝐴 și 𝐵 sunt independente.

4
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

1.2. Operații cu evenimente

𝑨 ∪ 𝑩 (Reuniunea): evenimentul a cărui producere constă în producerea a cel puțin unuia dintre
cele două evenimente
𝑨 ∩ 𝑩 (Intersecția): evenimentul care constă în producerea simultană a celor două evenimente
𝑨 \ 𝑩 (Diferența): evenimentul a cărui producere constă în apariția evenimentului 𝐴 și neapariția
evenimentului 𝐵
Exemple:
𝐸1 ∪ 𝐸2 = 𝐸9 𝐸9 ∩ 𝐸12 = 𝐸1 𝐸9 \ 𝐸12 = 𝐸2
𝐸9 ∩ 𝐸13 = 𝐸2 𝐸9 \ 𝐸13 = 𝐸1

Dacă 𝐴 și 𝐵 sunt evenimente compatibile, atunci 𝐴 ∩ 𝐵 ≠ ∅


Dacă 𝐴 și 𝐵 sunt evenimente incompatibile, atunci 𝐴 ∩ 𝐵 = ∅
Exemple:
𝐸12 ∩ 𝐸15 = 𝐸5 ≠ ∅ 𝐸9 ∩ 𝐸15 = ∅

1) Dacă 𝐴1 , 𝐴2 , … , 𝐴𝑛 sunt incompatibile două câte două, atunci ele sunt incompatibile și în
totalitate, dar nu și reciproc:
Dacă 𝐴𝑖 ∩ 𝐴𝑗 = ∅, 1 ≤ 𝑖 ≤ 𝑗 ≤ 𝑛, atunci 𝐴1 ∩ 𝐴2 ∩ … ∩ 𝐴𝑛 = ∅
2) Dacă 𝐴1 , 𝐴2 , … , 𝐴𝑛 sunt compatibile în totalitate, atunci ele sunt compatibile două câte
două, dar nu și reciproc:
Dacă 𝐴1 ∩ 𝐴2 ∩ … ∩ 𝐴𝑛 ≠ ∅, atunci 𝐴𝑖 ∩ 𝐴𝑗 ≠ ∅, 1 ≤ 𝑖 ≤ 𝑗 ≤ 𝑛

Evenimente posibile: orice evenimente care pot să apară cu ocazia unei experiențe

Evenimente egal probabile: evenimente care au aceeași șansă de producere

5
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

1.3. Definiția clasică a probabilității

Dacă în urma unei experiențe rezultă 𝑛 evenimente egal probabile, dintre care doar 𝑚 definesc
𝑚
evenimentul 𝐴, atunci probabilitatea de realizare a lui 𝐴, notată 𝑃(𝐴), este 𝑛 .

𝑃(𝐴) ∈ [0,1]
Exemplu:
1
𝑃(𝐸1 ) = 𝑃(𝐸2 ) = 𝑃(𝐸3 ) = 𝑃(𝐸4 ) = 𝑃(𝐸5 ) = 𝑃(𝐸6 ) =
6

𝑃(𝐸7 ) = 1, deci 𝑃(𝑆) = 1


𝑃(𝐸8 ) = 0, deci 𝑃(∅) = 0

Probabilitatea îndeplinește cumulativ următoarele condiții:


1) 𝑃(𝑆) = 1
2) Pentru orice 𝐴 și 𝐵 cu 𝐴 ∩ 𝐵 = ∅, 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

Proprietăți:
1) 𝑃(∅) = 0
2) 𝑃(𝐴̅) = 1 − 𝑃(𝐴)
3) 𝑃(𝐵\𝐴) = 𝑃(𝐵) − 𝑃(𝐴), (∀) 𝐴, 𝐵 cu 𝐴 ⊂ 𝐵
4) 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵), (∀) 𝐴, 𝐵
5) 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) +
+𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)

Observație: Dacă 𝐴 și 𝐵 sunt două evenimente independente, atunci 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵)

6
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Exemplu 1:
Examen promovat la limba
Examen promovat franceză Total
la limba engleză
Da Nu
Da 200 150 350

Nu 100 50 150

Total 300 200 500

Se cere:
a) Dați exemplu de două evenimente elementare
b) Găsiți evenimentele contrare ale evenimentelor identificate la punctul a)
Dacă alegem la întâmplare un student:
c) Care este probabilitatea ca acesta să fi promovat examenul la engleză? Dar contrar?
d) Care este probabilitatea ca acesta să fi promovat examenul la franceză? Dar contrar?
e) Care este probabilitatea ca acesta să fi promovat și la engleză și la franceză?
f) Care este probabilitatea ca acesta să nu fi promovat nici la engleză, nici la franceză?
g) Care este probabilitatea ca acesta să fi promovat la engleză și să nu fi promovat la franceză?
h) Care este probabilitatea ca acesta să fi promovat la franceză și să nu fi promovat la engleză?
i) Care este probabilitatea ca acesta să fi promovat la engleză sau la franceză?
j) Care este probabilitatea ca acesta să fi promovat la engleză sau să nu fi promovat la
franceză?
k) Care este probabilitatea ca acesta să nu fi promovat la engleză sau să fi promovat la
franceză?
l) Care este probabilitatea ca acesta să nu fi promovat la engleză sau să nu fi promovat la
franceză?

Rezolvare:
a) 𝐴: “Studentul a promovat examenul la engleză”
𝐵: “Studentul a promovat examenul la franceză”

7
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

b) 𝐴̅: “Studentul nu a promovat examenul la engleză”


𝐵̅ : “Studentul nu a promovat examenul la franceză”
350 150
c) 𝑃(𝐴) = 500 = 0,7 𝑃(𝐴̅) = 500 = 0,3
300 200
d) 𝑃(𝐵) = 500 = 0,6 𝑃(𝐵̅ ) = 500 = 0,4
200
e) 𝑃(𝐴 ∩ 𝐵) = 500 = 0,4
50
f) 𝑃(𝐴̅ ∩ 𝐵̅ ) = 500 = 0,1
150
g) 𝑃(𝐴 ∩ 𝐵̅ ) = 500 = 0,3
100
h) 𝑃(𝐴̅ ∩ 𝐵) = 500 = 0,2
350 300 200 450
i) 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = 500 + 500 − 500 = 500 = 0,9
350 200 150 400
j) 𝑃(𝐴 ∪ 𝐵̅ ) = 𝑃(𝐴) + 𝑃(𝐵̅ ) − 𝑃(𝐴 ∩ 𝐵̅ ) = 500 + 500 − 500 = 500 = 0,8
150 300 100 350
k) 𝑃(𝐴̅ ∪ 𝐵) = 𝑃(𝐴̅) + 𝑃(𝐵) − 𝑃(𝐴̅ ∩ 𝐵) = 500 + 500 − 500 = 500 = 0,7
150 200 50 300
l) 𝑃(𝐴̅ ∪ 𝐵̅ ) = 𝑃(𝐴̅) + 𝑃(𝐵̅ ) − 𝑃(𝐴̅ ∩ 𝐵̅ ) = 500 + 500 − 500 = 500 = 0,6

Exemplu 2:
Un student are trei examene în sesiune, la Contabilitate, Macroeconomie și Statistică. Astfel:
𝐴1 : “Studentul promovează la Contabilitate”
𝐴2 : “Studentul promovează la Macroeconomie”
𝐴3 : “Studentul promovează la Statistică”

Exprimați următoarele evenimente:


𝐵1 : “Studentul promovează toate examenele”
𝐵2 : “Studentul promovează un singur examen”
𝐵3 : “Studentul promovează două examene”
𝐵4 : “Studentul promovează cel puțin un examen”
𝐵5 : “Studentul promovează cel puțin două examene”

8
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Rezolvare:
𝐵1 : 𝐴1 ∩ 𝐴2 ∩ 𝐴3
𝐵2 : (𝐴1 ∩ ̅̅̅
𝐴2 ∩ ̅̅̅ ̅̅̅1 ∩ 𝐴2 ∩ ̅̅̅
𝐴3 ) ∪ (𝐴 ̅̅̅1 ∩ ̅̅̅
𝐴3 ) ∪ (𝐴 𝐴2 ∩ 𝐴3 )
𝐵3 : (𝐴1 ∩ 𝐴2 ∩ ̅̅̅
𝐴3 ) ∪ (𝐴1 ∩ ̅̅̅ ̅̅̅1 ∩ 𝐴2 ∩ 𝐴3 )
𝐴2 ∩ 𝐴3 ) ∪ (𝐴
𝐵4 : 𝐴1 ∪ 𝐴2 ∪ 𝐴3
sau
𝐵4 : ((𝐴1 ∩ ̅̅̅
𝐴2 ∩ ̅̅̅ ̅̅̅1 ∩ 𝐴2 ∩ ̅̅̅
𝐴3 ) ∪ (𝐴 ̅̅̅1 ∩ ̅̅̅
𝐴3 ) ∪ (𝐴 𝐴2 ∩ 𝐴3 )) ∪
∪ ((𝐴1 ∩ 𝐴2 ∩ ̅̅̅
𝐴3 ) ∪ (𝐴1 ∩ ̅̅̅ ̅̅̅1 ∩ 𝐴2 ∩ 𝐴3 )) ∪ (𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) =
𝐴2 ∩ 𝐴3 ) ∪ (𝐴
= 𝐵2 ∪ 𝐵3 ∪ 𝐵1
𝐵5 : ((𝐴1 ∩ 𝐴2 ∩ ̅̅̅
𝐴3 ) ∪ (𝐴1 ∩ ̅̅̅ ̅̅̅1 ∩ 𝐴2 ∩ 𝐴3 )) ∪ (𝐴1 ∩ 𝐴2 ∩ 𝐴3 ) = 𝐵3 ∪ 𝐵1
𝐴2 ∩ 𝐴3 ) ∪ (𝐴
sau
𝐵5 : (𝐴1 ∩ 𝐴2 ) ∪ (𝐴1 ∩ 𝐴3 ) ∪ (𝐴2 ∩ 𝐴3 )

Exemplu 3:
Se aruncă un zar. Care este probabilitatea să apară un număr par?

Rezolvare:
Numărul cazurilor egal posibile = 𝑛 = 1, 2, 3, 4, 5, 6
Numărul cazurilor favorabile = 𝑚 = 2, 4, 6
3 1
𝑃(𝐴) = =
6 2

Exemplu 4:
Se aruncă două monede. Care este probabilitatea să apară cap la ambele aruncări?

Rezolvare:
Numărul cazurilor egal posibile =
= 𝑛 = {(𝑐𝑎𝑝, 𝑐𝑎𝑝), (𝑐𝑎𝑝, 𝑝𝑎𝑗𝑢𝑟ă), (𝑝𝑎𝑗𝑢𝑟ă, 𝑝𝑎𝑗𝑢𝑟ă), (𝑝𝑎𝑗𝑢𝑟ă, 𝑐𝑎𝑝)}
Numărul cazurilor favorabile = 𝑚 = {(𝑐𝑎𝑝, 𝑐𝑎𝑝)}

9
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

1
𝑃(𝐴) =
4

15 5
𝑃(𝐴) = =
36 12
a) Numărul cazurilor favorabile = 𝑚 =
= {(3,6), (4,5), (4,6), (5, 4), (5,5), (5,6), (6, 3), (6, 4), (6,5), (6,6)}
10 5
𝑃(𝐴) = =
36 18

Exemplu 5:
Se aruncă un zar și o monedă. Care este probabilitatea să apară un număr impar (la zar) și cap (la
monedă)?

Rezolvare:
Numărul cazurilor egal posibile = 𝑛 =
= {(1, 𝑐𝑎𝑝), (2, 𝑐𝑎𝑝), (3, 𝑐𝑎𝑝), (4, 𝑐𝑎𝑝), (5, 𝑐𝑎𝑝), (6, 𝑐𝑎𝑝),
(1, 𝑝𝑎𝑗𝑢𝑟ă), (2, 𝑝𝑎𝑗𝑢𝑟ă), (3, 𝑝𝑎𝑗𝑢𝑟ă), (4, 𝑝𝑎𝑗𝑢𝑟ă), (5, 𝑝𝑎𝑗𝑢𝑟ă), (6, 𝑝𝑎𝑗𝑢𝑟ă)}
Numărul cazurilor favorabile = 𝑚 = {(1, 𝑐𝑎𝑝), (3, 𝑐𝑎𝑝), (5, 𝑐𝑎𝑝)}
3 1
𝑃(𝐴) = =
12 4

10
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Curs 2
2. Variabile aleatoare

2.1. Variabile aleatoare discrete

În cadrul activității economice există anumite mărimi numerice care variază în mod aleator. O
astfel de variabilă, care în urma unei anumite experiențe poate lua o valoare dintr-o mulțime
discretă, se numește variabilă aleatoare discretă.
Exemple: • numărul de produse vândute într-un magazin pe parcursul unei zile;
• numărul de cereri de creditare depuse într-o bancă pe parcursul unei luni.

Funcția de repartiție a unei variabile aleatoare discrete este un tablou cu două linii:
1) Pe prima linie sunt valorile pe care variabila respectivă le poate lua;
2) Pe cea de-a doua linie sunt probabilitățile cu care variabila poate lua valorile de pe prima
linie.
Repartiția variabilei discrete 𝑋 se scrie:
𝑥1 𝑥2 𝑥3 … 𝑥𝑛
𝑋: (𝑝 𝑝2 𝑝3 … 𝑝𝑛 )
1

unde 𝑝𝑖 = 𝑃(𝑋 = 𝑥𝑖 ), 𝑖 = ̅̅̅̅̅


1, 𝑛
𝑝1 + 𝑝2 + 𝑝3 + … + 𝑝𝑛 = 1
(𝑋 = 𝑥1 ) ∪ (𝑋 = 𝑥2 ) ∪ (𝑋 = 𝑥3 ) ∪ … ∪ (𝑋 = 𝑥𝑛 ) = 𝑆

Exemplu: Considerăm experiența aruncării unui zar. Repartiția numărului de puncte care pot să
apară este:
1 2 3 4 5 6
𝑋: (1 1 1 1 1 1)
6 6 6 6 6 6

Media unei variabile aleatoare discrete 𝑋 este:

1
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

𝑀(𝑋) = 𝑥1 𝑝1 + 𝑥2 𝑝2 + … + 𝑥𝑛 𝑝𝑛 = ∑ 𝑥𝑖 𝑝𝑖
𝑖=1

Exemplu: Repartiția numărului de credite imobiliare aprobate într-o săptămână într-o bancă este:
0 1 2 3 4 5 6
𝑋: ( )
0,1 0,1 0,2 0,3 0,15 0,1 0,05
Să se calculeze numărul mediu de credite imobiliare aprobate pe parcursul unei săptămâni.

Rezolvare:
𝑀(𝑋) = 0 ∗ 0,1 + 1 ∗ 0,1 + 2 ∗ 0,2 + 3 ∗ 0,3 + 4 ∗ 0,15 + 5 ∗ 0,1 + 6 ∗ 0,05 = 2,8
Media de 2,8 reprezintă numărul mediu de credite imobiliare aprobate pe parcursul unei săptămâni.

Varianța sau dispersia unei variabile aleatoare discrete 𝑋 este:


𝜎 2 (𝑋) = [𝑥1 − 𝑀(𝑋)]2 ∗ 𝑝1 + [𝑥2 − 𝑀(𝑋)]2 ∗ 𝑝2 + ⋯ + [𝑥𝑛 − 𝑀(𝑋)]2 ∗ 𝑝𝑛 =
𝑛

= ∑[𝑥𝑖 − 𝑀(𝑋)]2 ∗ 𝑝𝑖
𝑖=1

Abaterea medie pătratică a unei variabile aleatoare discrete 𝑋 este:

𝜎(𝑋) = √𝜎 2 (𝑋)

Exemplu: Să se calculeze varianța și abaterea medie pătratică a creditelor imobiliare aprobate pe


parcursul unei săptămâni.
Rezolvare:
𝜎 2 (𝑋) = (0 − 2,8)2 ∗ 0,1 + (1 − 2,8)2 ∗ 0,1 + (2 − 2,8)2 ∗ 0,2 + (3 − 2,8)2 ∗ 0,3 +
+(4 − 2,8)2 ∗ 0,15 + (5 − 2,8)2 ∗ 0,1 + (6 − 2,8)2 ∗ 0,05 = 2,46
𝜎(𝑋) = √2,46 = 1,56

Covarianța a două variabile aleatoare discrete 𝑋 și 𝑌 este:


𝑐𝑜𝑣(𝑋, 𝑌) = 𝑀[(𝑋 − 𝑀(𝑋)) ∗ (𝑌 − 𝑀(𝑌))]
sau
𝑐𝑜𝑣(𝑋, 𝑌) = 𝑀(𝑋𝑌) − 𝑀(𝑋) ∗ 𝑀(𝑌)

2
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

2.2.Variabile aleatoare continue

Valorile pe care le poate lua o variabilă aleatoare continuă aparțin unui interval real, mărginit sau
nu. O variabilă aleatoare continuă este dată de:


𝑥
𝑋: (𝑓(𝑥)) , 𝑥 ∈ ℝ, 𝑐𝑢 𝑓(𝑥) ≥ 0, ∀ 𝑥 ∈ ℝ ș𝑖 ∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞

Funcția f se numește densitate de probabilitate a variabilei aleatoare continue 𝑋.



Funcția 𝐹 = ∫−∞ 𝑓(𝑥)𝑑𝑥 se numește funcție de repartiție a variabilei aleatoare continue 𝑋, fiind
definită ca probabilitatea ca variabila 𝑋 să ia valori mai mici decât o anumită valoare, 𝑥:

𝑥
𝐹(𝑥) = 𝑃(𝑋 < 𝑥) = ∫ 𝑓(𝑦)𝑑𝑦
−∞

Prin urmare, între funcția de repartiție a unei variabile aleatoare continue și funcția de densitate de
probabilitate a sa există următoarea relație: 𝐹 ′ (𝑥) = 𝑓(𝑥)

Pentru orice 𝑎, 𝑏 ∈ ℝ cu 𝑎 < 𝑏, avem:


𝑏
𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎

Exemplu: Determinați constanta 𝑎, astfel încât funcția f,


𝑎
,𝑥 ≥ 1
𝑓(𝑥) = {𝑥 3
0, 𝑥 < 1
să fie densitatea de probabilitate a variabilei aleatoare continue 𝑋.

Rezolvare:
𝑎
𝑓(𝑥) ≥ 0 ⇒ 𝑥 3 ≥ 0
1. }⇒𝑎 ≥ 0
𝐷𝑎𝑟 ș𝑡𝑖𝑚 𝑐ă 𝑥 ≥ 1

3
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ


2. ∫−∞ 𝑓(𝑥)𝑑𝑥 = 1
∞ 1 ∞ ∞
𝑎 −3
𝑥 −2 ∞ 1 𝑎
∫ 𝑓(𝑥)𝑑𝑥 = ∫ 0𝑑𝑥 + ∫ 𝑑𝑥 = 0 + 𝑎 ∫ 𝑥 𝑑𝑥 = 𝑎 | = 𝑎 (0 + ) =
−∞ −∞ 1 𝑥 3
1 −2 1 2 2
1
Deoarece lim 𝑥 −2 = lim =0
𝑥→∞ 𝑥→∞ 𝑥 2

𝑎
Deci, 2 = 1 ⇒ 𝑎 = 2, ceea ce îndeplinește și prima condiție, adică 𝑎 ≥ 0.

Așadar,
2
𝑓(𝑥) = {𝑥 3 , 𝑥 ≥ 1
0, 𝑥 < 1

Media unei variabile aleatoare continue este:



𝑀(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥
−∞

Exemplu: Calculați media variabilei aleatoare continue 𝑋:

𝑥 2
𝑋: (𝑓(𝑥)) , 𝑓(𝑥) = {𝑥 3 , 𝑥 ≥ 1
0, 𝑥 < 1

Rezolvare:
∞ 1 ∞ ∞
2 −2
𝑥 −1 ∞
𝑀(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 ∗ 0𝑑𝑥 + ∫ 𝑥 ∗ 𝑑𝑥 = 0 + 2 ∫ 𝑥 𝑑𝑥 = 2 | = 2(0 + 1) = 2
−∞ −∞ 1 𝑥3 1 −1 1
1
Deoarece lim 𝑥 −1 = lim =0
𝑥→∞ 𝑥→∞ 𝑥

Varianța unei variabile aleatoare continue (dacă există) este:


2
𝜎 2 (𝑋) = 𝑀(𝑋 − 𝑀(𝑋))
sau
𝜎 2 (𝑋) = 𝑀(𝑋 2 ) − 𝑀2 (𝑋)

unde: 𝑀(𝑋 2 ) = ∫−∞ 𝑥 2 𝑓(𝑥)𝑑𝑥

4
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

Exemplu: Calculați varianța și abaterea medie pătratică a variabilei aleatoare continue 𝑋

𝑥 2
𝑋: (𝑓(𝑥)) , 𝑓(𝑥) = {𝑥 3 , 𝑥 ≥ 1
0, 𝑥 < 1

Rezolvare:
∞ 1 ∞ ∞
2 ∞
𝑀(𝑋 2 ) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 2 ∗ 0𝑑𝑥 + ∫ 𝑥 2 𝑑𝑥 = 0 + 2 ∫ 𝑥 −1 𝑑𝑥 = 2𝑙𝑛(𝑥)| = ∞
−∞ −∞ 1 𝑥 3
1
1
Deoarece lim (𝑥) = ∞
𝑥→∞

și
2ln1 = 0


Deci, varianța în acest caz nu există, deoarece ∫−∞ 𝑥 2 𝑓(𝑥)𝑑𝑥 nu este convergentă.

Exemplu 1: Calculați media, varianța și abaterea medie pătratică a variabilei aleatoare discrete 𝑋:
0 1 2
a) 𝑋: ( )
0,1 0,6 0,3
−1 0 1
b) 𝑋: ( )
0,4 0,3 0,3

Rezolvare:
a) 𝑀(𝑋) = 0 ∗ 0,1 + 1 ∗ 0,6 + 2 ∗ 0,3 = 1,2
𝜎 2 (𝑋) = (0 − 1,2)2 ∗ 0,1 + (1 − 1,2)2 ∗ 0,6 + (2 − 1,2)2 ∗ 0,3 = 0,36
𝜎(𝑋) = √0,36 = 0,6
b) 𝑀(𝑋) = −1 ∗ 0,4 + 0 ∗ 0,3 + 1 ∗ 0,3 = −0,1
𝜎 2 (𝑋) = [−1 − (−0,1)]2 ∗ 0,4 + [0 − (−0,1)]2 ∗ 0,3 + [1 − (−0,1)]2 ∗ 0,3 =
= (−1 + 0,1)2 ∗ 0,4 + (0 + 0,1)2 ∗ 0,3 + (1 + 0,1)2 ∗ 0,3 = 0,69
𝜎(𝑋) = √0,69 = 0,83

Exemplu 2: Densitatea de probabilitate a unei variabile aleatoare continue 𝑋 este dată de:

5
Lect. univ. dr. Roxana Ioan
Universitatea de Vest din Timișoara, Facultatea de Economie și de Administrare a Afacerilor

STATISTICĂ

𝑥, 0 < 𝑥 < 1
𝑓(𝑥) = {2 − 𝑥, 1 ≪ 𝑥 < 2
0, î𝑛 𝑟𝑒𝑠𝑡
Determinați media, varianța și abaterea medie pătratică a lui 𝑋.

Rezolvare:
∞ 0 1 2 ∞
2
𝑀(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 ∗ 0𝑑𝑥 + ∫ 𝑥 𝑑𝑥 + ∫ 𝑥(2 − 𝑥)𝑑𝑥 + ∫ 𝑥 ∗ 0𝑑𝑥 =
−∞ −∞ 0 1 2
2 3
1 𝑥 2 𝑥 2 1 7
= +2 | − | = +3− =1
3 2 1 3 1 3 3
∞ 0 1 2 ∞
𝑀(𝑋 2 ) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 2 ∗ 0𝑑𝑥 + ∫ 𝑥 3 𝑑𝑥 + ∫ 𝑥 2 (2 − 𝑥)𝑑𝑥 + ∫ 𝑥 2 ∗ 0𝑑𝑥 =
−∞ −∞ 0 1 2

𝑥4 1 2 2
1 𝑥 3 2 𝑥 4 2 1 14 15
=0+ | + 2 ∫ 𝑥 2 𝑑𝑥 − ∫ 𝑥 3 𝑑𝑥 + 0 = + 2 | − | = + − =
4 0 1 1 4 3 1 4 1 4 3 4
3 + 56 − 45 14 7
= = =
12 12 6
7 1
𝜎 2 (𝑋) = − 12 =
6 6

1 1
𝜎(𝑋) = √ =
6 √6

6
Lect. univ. dr. Roxana Ioan

S-ar putea să vă placă și