Sunteți pe pagina 1din 7

ECONOMETRIE – Suport-Seminar 2

(oct.2020)

Recapitulare. NoŃiuni de TeoriaProbabilităŃilor şi Statistică Matematică

Variabile aleatoare unidimensionale


Variabila aleatoare este o mărime care poate lua orice valoare, necunoscută aprioric, depinzând de
rezultatul efectuării unui anumit experiment, rezultat care este imposibil de precizat. Variabila
aleatoare este o funcŃie reală definită pe mulŃimea Ω , a evenimentelor elementare asociate
experimentului considerat. Orice funcŃie X : Ω → ℝ se numeşte variabilă aleatoare.

Variabila aleatoare discretă are un număr finit de valori sau o mulŃime cel mult numărabilă de valori.
RepartiŃia sau distribuțția de probabilitate a unei variabile aleatoare discrete se scrie sub forma unui
tablou în care prima linie conŃine toate valorile posibile ale variabilei ( x i , i = 1,2,... ), iar a doua linie
conŃine probabilităŃile de apariŃie ale acestor valori ( P( X = xi ) = pi , i = 1,2,... ).
 x x 2 L xi L x 
X :  1  sau X :  i  , i ∈ I ⊂ N *
 p1 p 2 L pi L  pi 
1) pi ≥ 0 (∀) i ∈ I
2) ∑ pi = 1
i∈I

 x 
Variabila aleatoare continuă are un număr infinit de valori X :   , unde x ∈ I ⊂ ℝ
 f ( x) 
FuncŃia densitate de probabilitate: 1) f ( x) ≥ 0, (∀) x ∈ R

2) ∫ f ( x) dx = 1
−∞
b
3) ∫ f ( x)dx = P(a ≤ X ≤ b) = F (b) − F (a)
a

x
FuncŃia de repartiŃie a v. a. X: F ( x) = P( X < x) = ∫ f (t )dt
−∞

Caracteristici numerice ale variabilelor aleatoare:


Valoarea medie: µ = M ( X ) = E ( X )
ProprietăŃi ale mediei:
E (a ) = a (∀) a ∈ R
E (a ⋅ X ) = a ⋅ E ( X )
E (a ⋅ X ± b ⋅ Y ) = a ⋅ E ( X ) ± b ⋅ E (Y )
E ( X ⋅ Y ) = E ( X ) ⋅ E (Y ) numai dacă X,Y − v.a.independente.

1
Dispersia (VarianŃa) şi abaterea medie pătratică: D( X ) = Var ( X ) = σ 2 , σ = σ 2
ProprietăŃi ale dispersiei:
D( a ) = 0 (∀) a ∈ R
D( a ⋅ X ) = a 2 ⋅ D ( X )
D( a ⋅ X ± b ⋅ Y ) = a 2 ⋅ D ( X ) + b 2 ⋅ D (Y ) numai dacă X,Y − v.a.independente.
Variabile aleatoare bidimensionale: ( X , Y ) .
f ( x, y ) = P ( X = x, Y = y )
f ( x | y ) = P( X = x | Y = y )
– Variabile aleatoare condiŃionate
( X | Y = y ) sau (Y | X = x)
– Medii condiŃionate
E ( X | Y = y ) sau E (Y | X = x )
– CovarianŃa dintre X şi Y: cov( X , Y )
cov( X , Y ) E ( XY ) − E ( X ) E (Y )
– Coeficientul de corelaŃie liniară: ρ ( X , Y ) = = ∈ [−1,+1] .
σ XσY D ( X ) D (Y )

DistribuŃii de probabilitate teoretice continue

1) DistribuŃia Normală, cu parametrii µ şi σ 2 ( X ~ N ( µ , σ 2 ) )


Spunem că o v.a. are o distribuŃie normală de parametrii µ şi σ şi notăm prin X ~ N ( µ , σ 2 ) , dacă
are funcŃia densitate de probabilitate (pdf) de forma
2
1  x−µ 
1 −  
2 σ 
f ( x) = e , x ∈ R, µ ∈ R, σ > 0 .
σ 2π
Media variabilei este E ( X ) = µ iar varianŃa (dispersia) este D( X ) = Var ( X ) = σ 2 .
DistribuŃia normală este utilizată atunci când o caracteristică este supusă unui număr mare de influenŃe
întîmplătoare, de slabă intensitate şi independente unele de altele. DistribuŃia normală este cea mai
cunoscută distribuŃie continuă folosită în statistică, pentru că:
– Numeroase variabile continue, folosite în afaceri, au distribuŃii care sunt asemănătoare distribuŃiei
normale.
– DistribuŃia normală poate fi utilizată pentru a aproxima diferite distribuŃii de probabilitate discrete.
– DistribuŃia normală oferă bazele pentru inferenŃa statistică clasică, datorită relaŃiei sale cu teorema
limită centrală.

FuncŃia densitate de probabilitate a distribuŃiei normale cu media µ şi abaterea standard σ are


următoarele proprietăŃi:
– Este simetrică faŃă de dreapta x = µ . Datorită simetriei, modul, mediana şi media distribuŃiei
normale sunt egale. Valoarea medie este cea mai probabilă valoare a unei variabile cu distribuŃie
normală. Cele mai multe valori ale acestei variabile sunt în mijlocul distribuŃiei. Media poate lua orice
valoare: negativă, pozitivă sau zero.
– Este unimodală: derivata lui f este pozitivă pentru x < µ , negativă pentru x > µ şi zero dacă x = µ
– Punctele x = µ − σ şi x = µ + σ sunt puncte de inflexiune (unde derivata de ordinul doi este 0)
– Domeniul valorilor sale este de la − ∞ la + ∞ , astfel încât fiecare interval de numere reale are o
probabilitate diferită de zero. Curba normală se extinde, fără a atinge axa Ox, de la − ∞ la + ∞ .
2
– Aria totală de sub curba care reprezintă f ( x) trebuie să fie egală cu 1.
Media determină poziŃia distribuŃiei în raport cu axa Ox, iar dispersia arată gradul de aplatizare a
conturului reprezentării grafice.

 DistribuŃia normală standard, Z ~ N(0,1), (distribuŃia normală normată sau normală redusă)
Orice distribuŃie normală X ~ N ( µ , σ 2 ) poate fi redusă la distribuŃia normală standard folosind

X −µ
transformarea Z = şi Z ~ N (0,1) .
σ
 Dacă α ∈ (0,1) se numeşte cuantilă de rang α a repartiŃiei normale standard Z, un număr zα cu
următoarea proprietate: P ( Z > zα ) = P ( Z ≥ zα ) = α şi P ( Z < zα ) = 1 − α .

Există tabele care dau P ( Z > zα ) = α .


 CombinaŃiile liniare ale variabilelor normal distribuite sunt normal distribuite.
 Regula empirică şi distribuŃia normală (Regula 68-95-99,7 pentru distribuŃiile normale)

68,2% din observaŃii se vor afla între µ − σ şi µ + σ


95,4% din observaŃii se vor afla între µ − 2σ şi µ + 2σ
99,7% din observaŃii se vor afla între µ − 3σ şi µ + 3σ
P ( µ − σ ≤ X ≤ µ + σ ) = P (−1 ≤ Z ≤ 1) ≈ 0,682
3
P ( µ − 2σ < X < µ + 2σ ) = P (−2 < Z < 2) ≈ 0,954
P( µ − 3σ < X < µ + 3σ ) = P (−3 < Z < 3) ≈ 0,997

Aria de sub fiecare secŃiune a curbei normale poate fi văzută în următoarea diagramă:

Teorema Limită Centrală constituie baza teoretică pentru larga aplicabilitate a distribuŃiei normale.
Fie X 1 , X 2 ,..., X n variabile aleatoare independente, identic distribuite, cu media µ şi dispersia σ 2 .
∑i =1 X i
n
Fie X = . Atunci când n → ∞ avem:
n
σ2
1) X ~ N ( µ , )
n
X − E( X ) X −µ
2) Z = = ~ N (0,1) .
σX σ/ n

Calculul probabilităŃilor:

Aria A1 (aria din stânga lui –1,96) este egală aria A2 (aria din dreapta lui +1,96).
Aria din dreapta lui +1,96 este egală cu 1 minus aria de la stanga lui +1,96

2) DistribuŃia Hi-pătrat (Chi-squared) cu n grade de libertate − χn


2

Teoremă: Fie Z 1 , Z 2 ,..., Z n ~ N (0,1) variabile aleatoare independente. Atunci variabila aleatoare
X = Z 12 + Z 22 + L + Z n2 ~ χ n2
n – număr grade de libertate (corespunde numărului de termeni din sumă).

4
O v. a. cu distribuŃie Hi–pătrat este totdeauna nenegativă şi graficul lui f (x) nu este simetric. Forma sa
grafică, asimetrică spre dreapta, depinde numai de numărul gradelor de libertate.
DistribuŃia Hi–pătrat se foloseşte pentru că apar frecvent situaŃii în care intervin sume de pătrate de v.a.
independente una de alta, urmând fiecare o distribuŃie normală.
Există tabele care dau funcŃia de repartiŃie Hi–pătrat.

(n − 1) s 2
Teoremă: Variabila U = urmează o distribuŃie χ 2 cu (n−1) grade de libertate.
σ2

3) DistribuŃia Student t ~ S n (sau notaŃia t ~ t n )


Este folosită în statistica clasică şi analiza de regresie
ObŃinem o v.a. cu distribuŃie Student dintr-o variabilă normală standard şi una Hi-pătrat.

Teoremă: Fie Z ~ N (0,1) şi X ~ χ n2 v.a. independente. Atunci variabila aleatoare


t=Z X /n are o distribuŃie Student cu n grade de libertate (df=n).

Densitatea de repartiŃie are o formă similară cu cea a distribuŃiei normale standard şi converge spre
distribuŃia normală standard pe măsură ce numărul gradelor de libertate creşte.

X −µ
Teoremă: Variabila t = are o distribuŃie Student cu (n-1) grade de libertate.
s/ n

5
4) DistribuŃia F (Fisher-Snedecor)

Teoremă: Fie două v.a. independente: X 1 ~ χ n21 şi X 2 ~ χ n22 . Atunci, v.a.


( X 1 / n1 )
F= are o distribuŃie F cu (n1 , n2 ) grade de libertate. Notăm F ~ Fn1 ,n2
( X 2 / n2 )
n1 este asociat cu variabila de la numărător; n2 este asociat cu variabila de la numitor.
– DistribuŃia F este asimetrică la dreapta.

– Pătratul unei v.a. t n are o distribuŃie F1,n . Simbolic, t n2 = F1,n

INFERENłA STATISTICĂ
Prin inferenŃă statistică se înŃelege obŃinerea de concluzii bazate pe o evidenŃă statistică, adică pe
informaŃii obŃinute dintr-un eşantion. Concluziile sunt asupra caracteristicilor populaŃiei din care
provine eşantionul.
Estimarea şi testarea ipotezelor constituie cele două ramuri ale inferenŃei statistice clasice.

• ESTIMAREA
Estimarea este operaŃia de stabilire, în baza datelor unui eşantion, a valorilor parametrilor repartiŃiei
populaŃiei din care a fost extras eşantionul.
Putem avea estimare punctuală sau estimare prin interval de încredere.
Estimarea punctuală
Considerăm o populaŃie caracterizată de o v.a. teoretică X, care are o lege de probabilitate cunoscută,
f ( x, θ ) , dar θ este un parametru necunoscut.
Prin parametru al unei populatii întelegem un număr ce descrie, într- un anumit sens, populatia.
Extragem o selecŃie aleatoare ( X 1 , X 2 ,..., X n ) din populaŃie şi folosim datele din eşantion pentru a
estima parametrii necunoscuŃi.
θˆ = f ( X 1 , X 2 ,..., X n ) se numeşte statistică sau estimator. O valoare numerică particulară:
θˆ = f ( x1 , x 2 ,..., x n ) este o estimaŃie a parametrului real θ .
MenŃionăm că θˆ poate fi tratat ca o v.a. deoarece este o funcŃie de datele de selecŃie.
Estimarea punctuală furnizează o singură valoare (estimaŃie ) a lui θ .
Estimatori punctuali se obŃin prin MCMMP şi prin metoda verosimilităŃii maxime.
ProprietăŃi ale estimatorilor
θˆ s.n. estimator nedeplasat pentru parametrul θ dacă E (θˆ) = θ
θˆ este estimator liniar al lui θ dacă este o funcŃie liniară de datele de observaŃie.
6
θˆ este estimator eficient al lui θ dacă este estimator de varianŃă minimă.
θˆ este estimator consistent al lui θ dacă aproximează valoarea reală θ atunci când volumul selecŃiei
creşte indefinit. ConsistenŃa este o proprietate a eşantioanelor mari.

NotaŃii:

Indicatorul PopulaŃia generală Eşantion


∑N X ∑n x
Media µ = i =1 i x = i =1 i
N n
∑N ( X − µ ) ∑n ( x − x )
2 2
VarianŃa (Dispersia) σ 2 = i =1 i s 2 = i =1 i
N n −1
Abaterea medie pătratică σ = σ2 s = s2
(abaterea standard)

Media aritmetică X este estimator nedeplasat pentru media populaŃiei µ .


Abaterea standard s este estimator nedeplasat pentru abaterea standard a populaŃiei, σ .

Estimarea prin Intervale de încredere

În loc să obŃinem o singură estimaŃie a parametrului necunoscut θ , putem obŃine două estimaŃii pentru
θ , construind doi estimatori θˆ1 ( X 1 , X 2 ,..., X n ) şi θˆ2 ( X 1 , X 2 ,..., X n ) . Vom spune cu o încredere
(probabilitate) de 1 − α că intervalul dintre θˆ şi θˆ include valoarea reală a lui θ .
1 2

P (θˆ1 ≤ θ ≤ θˆ2 ) = 1 − α ,

0 < α < 1 s.n. nivel de semnificaŃie (prag de semnificaŃie)


1 − α s.n. coeficient de încredere.

Intervale de încredere pentru valoarea medie a populaŃiei


Dacă dispersia σ 2 este cunoscută, intervalul de încredere pentru media populaŃiei este:
σ σ
(X − zα ≤ µ ≤ X + zα ).
2 n 2 n

Pentru pragul de semnificatie α = 0,05 avem intervalul de încredere 95%:

S-ar putea să vă placă și