Sunteți pe pagina 1din 32

BAZELE STATISTICII

- anul universitar 2019-2020


Programa analitică
1. Noţiuni introductive
2. Analiza unei serii statistice unidimensionale, folosind
metode grafice şi numerice (variabile cantitative:
indicatori ai tendinţei centrale, indicatori ai dispersiei şi
indicatori ai formei; variabile calitative).
3. Analiza unei serii statistice bidimensionale.
Programa analitică
4. Probabilităţi şi distribuţii teoretice
5. Estimarea parametrilor unei populaţii
6. Testarea statistică
7. Indicatori ai seriilor de timp
4. Probabilităţi şi distribuţii teoretice
 4.1. Probabilităţi

 4.2. Variabile aleatoare

 4.3. Distribuţii teoretice


Variabilă statistică – distribuţie statistică
x  22.08 x  34.56
 xi   xi 
X :   X :   s 2  128.99 s 2  100.68
 ni   fi  s  11 .36 s  10.03

x i
n
i
fi
F↓ i x n f F↓
i i i i

5 20 0.17 0.17 10-20 5 0.05 0.05


15 30 0.25 0.42 20-30 35 0.30 0.35
25 45 0.38 0.80 30-40 45 0.39 0.74
35 15 0.12 0.92 40-50 20 0.17 0.91
45 10 0.08 1.00 50-60 10 0.09 1.00
Total 120 1 - Total 115 1 -

Probabilitatile sunt, pentru o distributie teoretica, echivalentul frecventelor relative


pentru o distributie empirica (statistica). Arata procentul de realizare a unei valori
ale unei variabile teoretice.
4. Probabilităţi şi distribuţii teoretice
4.1. Probabilităţi
a. Definiţia clasică a probabilităţii (Bernoulli şi Laplace)
 Probabilitatea ca un eveniment să se realizeze reprezintă raportul dintre
numărul de evenimente elementare favorabile şi numărul evenimentelor
egal posibile.
m
p
n
 unde m este numărul cazurilor favorabile şi n este numărul cazurilor
posibile, unde 0  m  n , ceea ce implică

0 p1
4. Probabilităţi şi distribuţii teoretice

 Valoarea p=0 corespunde imposibilităţii realizării


evenimentului sau evenimentul imposibil, iar valoarea p=1
corespunde evenimentului cert sau sigur.

NB: Aceasta probabilitate mai poarta denumirea de probabilitate a


priori deoarece poate fi calculata pe baza unui rationament logic
cunoscandu-se valoarea ei inaintea producerii experimentului si are
caracter de lege!!!

Exemplu
 În cazul aruncării zarului, să se calculeze probabilitatea de
apariţie a unei feţe cu număr par.
4. Probabilităţi şi distribuţii teoretice
b. Definiţia probabilităţii bazată pe frecvenţă
 Probabilitatea este definită ca un caz limită al frecvenţei, atunci când
numărul de experienţe tinde la infinit, adică este frecvenţa relativă de
apariţie a unui eveniment.

m
p  lim
n  n
Exemplu
 Se presupune urmatoarea experienta: Aruncarea unei monede.
 Evenimentul favorabil este considerat obtinerea fetei care reprezinta
“Cap”-ul.
 Rezultatele obtinute in urma aruncarii monedei de n=10, n=100, n=1.000 si
n=10.000 ori sunt prezentate in tabelul de mai jos:
Frecventa relativa corespunzatoare
Numarul de Frecventa obtinerii obtinerii rezultatului “Cap”
experiente (n) rezultatului “Cap” (m)e (p=m/n)
n = 10 m=4 p=0.4
n = 100 m=55 p=0.55
n = 1000 m=495 p=0.495
n = 10000 m=5995 p=0.5995
… … …
n -> ∞ m->n/2 p->0.5
Exemplu – distribuţie de probabilitate
 Să presupunem că am aruncat un zar de 10 ori, iar faţa cu numărul 6 a apărut de 3
ori. Deci frecvenţa relativă este 0,3. Dacă mărim numărul de aruncări foarte mult
(teoretic la infinit), atunci frecvenţa de apariţie tinde către valoarea 1/6, care este
tocmai probabilitatea de apariţie a feţei cu numărul 6 la aruncarea unui zar.

x i
pi

1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Total 1
4. Probabilităţi şi distribuţii teoretice
4.2. Variabile aleatoare

4.2.1. Definire
 Variabila aleatoare X este o funcţie care asociază fiecărui
eveniment elementar un număr real (o probabilitate).
 Probabilitatea ca variabila aleatoare X să ia o anumită
valoare este p.
 Variabila aleatoare discretă este definită prin:
 xi 
X :  
 pi 
Exemplu
 Să considerăm
aruncarea simultană a x i
p
i

două monede.
0 ¼
 Fie X – numărul de feţe 1 ½
apărute la fiecare 2 ¼

aruncare. Total 1
4. Probabilităţi şi distribuţii teoretice
 Variabilele aleatoare continue sunt definite cu ajutorul unei
funcţii f(x), care se numeşte funcţie densitate de
probabilitate.
 Funcţia densitate de probabilitate are următoarele
() x  R, f ( x)  0
proprietăţi:


 f ( x)  dx  1

4. Probabilităţi şi distribuţii teoretice
4.2.2. Distribuţia unei variabile aleatoare. Funcţia de repartiţie
 Distribuţia sau legea de probabilitate a unei variabile
aleatoare este dată prin funcţia sa de probabilitate P(X).
 Pe baza funcţiei de probabilitate a unei variabile aleatoare,
se determină funcţia sa de repartiţie. În general, funcţia de
repartiţie este definită prin relaţia:

F ( x)  P( X  x), () x  R
4. Probabilităţi şi distribuţii teoretice
 Funcţia de repartiţie are
următoarele proprietăţi:
() x  R, 0  F ( x)  1

() a,b  R, a  b, F(a)  F(b)

lim F ( x)  1
x  

lim F ( x)  0
x  
4. Probabilităţi şi distribuţii teoretice
 Pentru variabila discretă, funcţia de repartiţie este F ( x )   pi
{ xi  x }

x
 Pentru variabila continuă, F ( x)   f (t )  dt , () x  R

4. Probabilităţi şi distribuţii teoretice
4.2.3. Caracteristici numerice ale unei variabile aleatoare
Media şi varianţa unei variabile aleatoare sunt:
  M( X )

 2 V( X )
4. Probabilităţi şi distribuţii teoretice
4.3. Distribuţii utilizate în statistică

a) Distribuţia normală (generalizată)


Repartiţia normală generalizată se simbolizează N (  , 2
) .
Funcţia densitate de probabilitate, în cazul unei repartiţii
normale generalizate, este:
( x   )2
1 
f(x) e 2 2
 2
4. Probabilităţi şi distribuţii teoretice
b) Distribuţia normală standard
 Variabila normală standard se obţine dintr-o variabilă
normală generalizată prin procedeul de standardizare:
X 
Z

 O variabilă aleatoare repartizată după o lege normală
standard, simbolizată N(0,1), are o funcţie densitate de
probabilitate dată de relaţia:
z2
1 
f(z) e 2
2
4. Probabilităţi şi distribuţii teoretice
 Pentru interese practice, de calcul al unor probabilităţi, se
utilizează funcţia lui Laplace, definită pe baza repartiţiei
normale standard. Funcţia lui Laplace este definită de relaţia:
z t2
1 
( z )   e 2 dt
0 2

1
 Funcţia de repartiţie este: F ( z )   ( z )
2
Tabelul de probabilitate pentru variabila normala
standard, Z – valorile zi si probabilitatile acestora, φ(zi)
0.00 0.01 0.02 0.03

0.0 0.0000 0.0040 0.0080 0.0120

0.1 0.0398 0.0438 0.0478 0.0517

0.2 0.0793 0.0832 0.0871 0.0910

Valorile zi sunt pe prima linie si pe prima


coloana – pe prima coloana sunt intregul si 0.3 0.1179 0.1217 0.1255 0.1293
prima zecimala a valorii zi, pe prima
coloana gasiti a doua zecimala a valorii zi.
0.4 0.1554 0.1591 0.1628 0.1664

Probabilitatea asociata fiecarei valori zi,


adica φ(zi), se gaseste la intersectia liniei si 0.5 0.1915 0.1950 0.1985 0.2019

a coloanei care compun valoarea zi.


0.6 0.2257 0.2291 0.2324 0.2357
De exemplu, pentru zi=0.21, φ(zi)=0.0832
Proprietăţile funcţiei lui Laplace, Φ(z)
 Φ(zi)=P(0<Z<zi)
 Φ(0) = 0
 Φ(-zi) = - Φ(zi)
 Dacă z1< z2, atunci P( z1  Z  z2 )  ( z2 )  ( z1 )
 1
F ( zi )  P(Z  z i )    ( zi )
2
1
 P(Z>zi)=1-P(Z<zi)= 2
  ( zi )
4. Probabilităţi şi distribuţii teoretice
 Pe baza funcţiei lui Laplace, se poate determina, de exemplu,
probabilitatea ca variabila aleatoare normală standard să ia
valori într-un interval simetric de tipul (- zi; zi). Această
probabilitate este:

P( zi  Z  zi )   ( zi )   ( zi )  2 ( zi )
Exemplu
Fie X ~ N (22.08, 11.36)
x  22.08, s  11 .36  3.37
 P(X<30)
1
F ( zi )  P(Z  z i )    ( zi )
2

 P(X<30)=P(Z<2.35)=0.5+φ(2.35)=0.5+0.4906 =0.9906
zi=(30-22.08)/3.37=2.35
 Exista 99.06% sanse ca variabila X sa ia valori mai mici
decat 30.
 P(X>30)
1
P(Z>zi)=1-P(Z<zi)= 2
  ( zi )

P(X>30)=1-P(X<30)=0.5- φ(2.35)= 0.5- 0.4906=0.0094


zi=(30-22.08)/3.37=2.35
 Exista 0.94% sanse ca variabila X sa ia valori mai mari decat
30.
 P(20<X<25)
P ( z1  Z  z 2 )   ( z 2 )   ( z1 )

z1=(20-22.08)/3.37= - 0.61
z2=(25-22.08)/3.37=0.86

P(20<X<25)=P(-0.61<Z<0.86)=φ(0.86)-φ(-0.61)=
= φ(0.86)+φ(0.61)=0.3051+0.2291=0.5342
Exista 53.42% sanse ca variabila X sa ia valori intre 20 si 25.
 P(μ-σ<X< μ+σ)=P(0-1<Z<0+1) = P(-1<Z<1)
= φ(1)-φ(-1)=2φ(1)=2*0.3413=0.6826

68.26% dintre valori sunt situate la o abatere


standard fata de media lor.

Analog, 95.45% dintre valori sunt situate la doua


abateri standars fata de medie, iar 99.74% din valori
se situeaza la trei abateri standard fata de medie.
Distribuţia randamentelor anuale (%) ale unui portofoliu de investiţii,
in perioada 1970-2018: X ~ N(12.39, 282.24) (s=16.8%)
4. Probabilităţi şi distribuţii teoretice
c) Distribuţia chi-pătrat
 O variabilă aleatoare repartizată după o lege chi-pătrat este
simbolizată  2
( ,  ).
4. Probabilităţi şi distribuţii teoretice
d). Distribuţia Student
 O variabilă aleatoare repartizată după o lege Student,
simbolizată t(υ), unde υ reprezintă numărul de grade de
libertate, parametrul acestei distribuţii.
n\p 0.10 0.05 0.025 0.01

1 3,078 6,314 12,706 31,821

2 1,886 2,920 4,303 6,965

3 1,638 2,353 3,182 4,541

4 1,533 2,132 2,776 3,747

Valorile variabilei aleatoare t se citesc 5 1,476 2,015 2,571 3,365

in functie de cele doua elemente: de o 6 1,440 1,943 2,447 3,143


probabilitate p si de df, gradele de
libertate care sunt date de n, volumul 7 1,415 1,895 2,365 2,998

esantionului. 8 1,397 1,860 2,306 2,896

9 1,383 1,833 2,262 2,821


De exemplu, t0.025,7=2,365.
4. Probabilităţi şi distribuţii teoretice
e). Distribuţia Snedecor-Fisher
O variabilă aleatoare repartizată după o lege Snedecor-Fisher, simbolizată
(1 , 2 ) , unde υ1 şi υ2 reprezintă grade de libertate, parametrii repartiţiei
Snedecor-Fisher.