Documente Academic
Documente Profesional
Documente Cultură
(oct.2020)
Variabila aleatoare discretă are un număr finit de valori sau o mulŃime cel mult numărabilă de valori.
RepartiŃia sau distribuțția de probabilitate a unei variabile aleatoare discrete se scrie sub forma unui
tablou în care prima linie conŃine toate valorile posibile ale variabilei ( x i , i = 1,2,... ), iar a doua linie
conŃine probabilităŃile de apariŃie ale acestor valori ( P( X = xi ) = pi , i = 1,2,... ).
x x 2 L xi L x
X : 1 sau X : i , i ∈ I ⊂ N *
p1 p 2 L pi L pi
1) pi ≥ 0 (∀) i ∈ I
2) ∑ pi = 1
i∈I
x
Variabila aleatoare continuă are un număr infinit de valori X : , unde x ∈ I ⊂ ℝ
f ( x)
FuncŃia densitate de probabilitate: 1) f ( x) ≥ 0, (∀) x ∈ R
∞
2) ∫ f ( x) dx = 1
−∞
b
3) ∫ f ( x)dx = P(a ≤ X ≤ b) = F (b) − F (a)
a
x
FuncŃia de repartiŃie a v. a. X: F ( x) = P( X < x) = ∫ f (t )dt
−∞
1
Dispersia (VarianŃa) şi abaterea medie pătratică: D( X ) = Var ( X ) = σ 2 , σ = σ 2
ProprietăŃi ale dispersiei:
D( a ) = 0 (∀) a ∈ R
D( a ⋅ X ) = a 2 ⋅ D ( X )
D( a ⋅ X ± b ⋅ Y ) = a 2 ⋅ D ( X ) + b 2 ⋅ D (Y ) numai dacă X,Y − v.a.independente.
Variabile aleatoare bidimensionale: ( X , Y ) .
f ( x, y ) = P ( X = x, Y = y )
f ( x | y ) = P( X = x | Y = y )
– Variabile aleatoare condiŃionate
( X | Y = y ) sau (Y | X = x)
– Medii condiŃionate
E ( X | Y = y ) sau E (Y | X = x )
– CovarianŃa dintre X şi Y: cov( X , Y )
cov( X , Y ) E ( XY ) − E ( X ) E (Y )
– Coeficientul de corelaŃie liniară: ρ ( X , Y ) = = ∈ [−1,+1] .
σ XσY D ( X ) D (Y )
DistribuŃia normală standard, Z ~ N(0,1), (distribuŃia normală normată sau normală redusă)
Orice distribuŃie normală X ~ N ( µ , σ 2 ) poate fi redusă la distribuŃia normală standard folosind
X −µ
transformarea Z = şi Z ~ N (0,1) .
σ
Dacă α ∈ (0,1) se numeşte cuantilă de rang α a repartiŃiei normale standard Z, un număr zα cu
următoarea proprietate: P ( Z > zα ) = P ( Z ≥ zα ) = α şi P ( Z < zα ) = 1 − α .
Aria de sub fiecare secŃiune a curbei normale poate fi văzută în următoarea diagramă:
Teorema Limită Centrală constituie baza teoretică pentru larga aplicabilitate a distribuŃiei normale.
Fie X 1 , X 2 ,..., X n variabile aleatoare independente, identic distribuite, cu media µ şi dispersia σ 2 .
∑i =1 X i
n
Fie X = . Atunci când n → ∞ avem:
n
σ2
1) X ~ N ( µ , )
n
X − E( X ) X −µ
2) Z = = ~ N (0,1) .
σX σ/ n
Calculul probabilităŃilor:
Aria A1 (aria din stânga lui –1,96) este egală aria A2 (aria din dreapta lui +1,96).
Aria din dreapta lui +1,96 este egală cu 1 minus aria de la stanga lui +1,96
Teoremă: Fie Z 1 , Z 2 ,..., Z n ~ N (0,1) variabile aleatoare independente. Atunci variabila aleatoare
X = Z 12 + Z 22 + L + Z n2 ~ χ n2
n – număr grade de libertate (corespunde numărului de termeni din sumă).
4
O v. a. cu distribuŃie Hi–pătrat este totdeauna nenegativă şi graficul lui f (x) nu este simetric. Forma sa
grafică, asimetrică spre dreapta, depinde numai de numărul gradelor de libertate.
DistribuŃia Hi–pătrat se foloseşte pentru că apar frecvent situaŃii în care intervin sume de pătrate de v.a.
independente una de alta, urmând fiecare o distribuŃie normală.
Există tabele care dau funcŃia de repartiŃie Hi–pătrat.
(n − 1) s 2
Teoremă: Variabila U = urmează o distribuŃie χ 2 cu (n−1) grade de libertate.
σ2
Densitatea de repartiŃie are o formă similară cu cea a distribuŃiei normale standard şi converge spre
distribuŃia normală standard pe măsură ce numărul gradelor de libertate creşte.
X −µ
Teoremă: Variabila t = are o distribuŃie Student cu (n-1) grade de libertate.
s/ n
5
4) DistribuŃia F (Fisher-Snedecor)
INFERENłA STATISTICĂ
Prin inferenŃă statistică se înŃelege obŃinerea de concluzii bazate pe o evidenŃă statistică, adică pe
informaŃii obŃinute dintr-un eşantion. Concluziile sunt asupra caracteristicilor populaŃiei din care
provine eşantionul.
Estimarea şi testarea ipotezelor constituie cele două ramuri ale inferenŃei statistice clasice.
• ESTIMAREA
Estimarea este operaŃia de stabilire, în baza datelor unui eşantion, a valorilor parametrilor repartiŃiei
populaŃiei din care a fost extras eşantionul.
Putem avea estimare punctuală sau estimare prin interval de încredere.
Estimarea punctuală
Considerăm o populaŃie caracterizată de o v.a. teoretică X, care are o lege de probabilitate cunoscută,
f ( x, θ ) , dar θ este un parametru necunoscut.
Prin parametru al unei populatii întelegem un număr ce descrie, într- un anumit sens, populatia.
Extragem o selecŃie aleatoare ( X 1 , X 2 ,..., X n ) din populaŃie şi folosim datele din eşantion pentru a
estima parametrii necunoscuŃi.
θˆ = f ( X 1 , X 2 ,..., X n ) se numeşte statistică sau estimator. O valoare numerică particulară:
θˆ = f ( x1 , x 2 ,..., x n ) este o estimaŃie a parametrului real θ .
MenŃionăm că θˆ poate fi tratat ca o v.a. deoarece este o funcŃie de datele de selecŃie.
Estimarea punctuală furnizează o singură valoare (estimaŃie ) a lui θ .
Estimatori punctuali se obŃin prin MCMMP şi prin metoda verosimilităŃii maxime.
ProprietăŃi ale estimatorilor
θˆ s.n. estimator nedeplasat pentru parametrul θ dacă E (θˆ) = θ
θˆ este estimator liniar al lui θ dacă este o funcŃie liniară de datele de observaŃie.
6
θˆ este estimator eficient al lui θ dacă este estimator de varianŃă minimă.
θˆ este estimator consistent al lui θ dacă aproximează valoarea reală θ atunci când volumul selecŃiei
creşte indefinit. ConsistenŃa este o proprietate a eşantioanelor mari.
NotaŃii:
În loc să obŃinem o singură estimaŃie a parametrului necunoscut θ , putem obŃine două estimaŃii pentru
θ , construind doi estimatori θˆ1 ( X 1 , X 2 ,..., X n ) şi θˆ2 ( X 1 , X 2 ,..., X n ) . Vom spune cu o încredere
(probabilitate) de 1 − α că intervalul dintre θˆ şi θˆ include valoarea reală a lui θ .
1 2
P (θˆ1 ≤ θ ≤ θˆ2 ) = 1 − α ,