Documente Academic
Documente Profesional
Documente Cultură
Vegheş Ovidiu
email: ovidiuvro2012@gmail.com
2019.12
3 Bibliografie
Terminologie
Definiţie
i) Fie X o v.a. definită pe câmpul de probabilitate (Ω, K, P). X se numeşte v.a. teoretică în
contextul în care valorile sale sale evidenţiază o caracteristică studiată pe o colectivitate
(populaţie) Ω.
ii) Vom numi selecţie (eşantion) o colectivitate parţială de elemente alese la întâmplare din Ω.
Numărul elementelor dintr-o selecţie îl vom numi volumul selecţiei. Spunem că o selecţie este
repetată (nerepetată), dacă elementul ales la întâmplare este reintrodus (nu mai este reintrodus)
în colectivitatea generală înaintea efectuării următoarei alegeri.
iii) Se numeşte sondaj procesul de prelevare la întâmplare a membrilor colectivităţii pentru a
construi eşantionul.
iv) Valorile caracteristicii studiate observate pe eşantion se numesc date de selecţie. Privite
apriori, valorile X1 , . . . , Xn sunt v.a.i.i. cu v.a. X , în cazul unei selecţii repetate. Privite aposteriori,
valorile de selecţie x1 , . . . , xn sunt valori numerice bine determinate.
v) Orice funcţie de datele de selecţie tn (X1 , . . . , Xn ) o vom numi funcţie de selecţie sau statistică.
Teoremă [Glivenko]. Dacă FX (x) este funcţie teoretică de repartiţie, iar Fn (x) funcţia
empiric
ă de repartiţie, cu n fiind volumul
selecţiei, atunci:
P lim sup |Fn (x) − FX (x)| = 0 = 1. Am considerat pentru x ∈ R:
n→∞ x∈R
FX (x) = P ({ω ∈ Ω | X (ω) < x}),
Fn (x) = nnx unde nx este numărul valorilor de selecţie mai mici decât x.
Vegheş Ovidiu (email: ovidiuvro2012@gmail.com) C URS 11 - M ATEMATICI APLICATE ÎN ECONOMIE 2019.12 3 / 13
Noţiuni fundamentale în statistică Teoria selecţiei
Teoria selecţiei
Definiţie
Fie X1 , . . . , Xn date
se selecţie obţinute
în studiul caracteristicii teoretice X . Considerăm mixul
∗ X1 X2 . . . Xn
probabilist X : 1 1 numit variabila aleatoare de selecţie.
n n
. . . n1
X1r +X2r +...+Xnr
i) mr∗ = n
se numeşte moment de selecţie iniţial de ordin r .
(X1 −X )r +(X2 −X )r +...+(Xn −X )r
ii) µ∗r = n
se numeşte moment centrat de selecţie iniţial de ordin r .
2 2 2
Lemă. Dacă W = X1 − X + X2 − X + . . . + Xn − X , atunci:
M (W ) = (n − 1) µ2
M W 2 = n−1 (n − 1) µ4 + n2 − 2n + 3 µ22
n
Propoziţia 2. M SX2 = M Wn = n−1
n
µ2 şi
W n−1
2
D SX = D n = n3 (n − 1) µ4 − (n − 3) µ22 .
h i
Demonstraţie. D (W ) = M W 2 − (M (W ))2 = n−1 n (n − 1) µ4 − (n − 3) µ22 .
M(W )
M SX2 = M Wn = n = n−1
n µ2 .
h i
D(W )
D SX = D n = 2 = n−1
2 W
(n − 1) µ4 − (n − 3) µ22 .
3
n n h i
W W 1 n−3 2
Propoziţia 3. M sX2 = M = µ2 şi D sX2 = D n−1
n−1
= n
µ4 − µ
n−1 2
.
def.
Demonstraţie. Avem sX2 = W n
n−1 =n−1 SX2 (se numeşte dispersia modificată (corectată) de selecţie).
n n−1
M sX2 = M n−1 n
SX2 = n
n−1 M S 2
X = n−1 n µ2 = µ2 .
n2 n2
h i h i
n−1
D sX2 = D n−1 n
SX2 = 2
D SX = (n − 1) µ4 − (n − 3) µ22 = n1 µ4 − n−3 2
n−1 µ2 .
(n−1)2 (n−1)2 n3
Teoria estimaţiei
Definiţie
Operaţia de evaluare a parametrilor unei repartiţii (incomplet specificată) poartă numele de estimare a
parametrilor, operaţie care se face pe baza unei selecţii de volum n extrasă din populaţia studiată. Valorile
parametrilor sunt estimate cu ajutorul unei statistici tn (X1 , . . . , Xn ) construite cu ajutorul datelor de selecţie
X1 , . . . , Xn .
Definiţie
Fie X o v.a. dată prin densitatea de repartiţie f (x; θ), x ∈ I-interval, dacă este o v.a. continuă ce admite
densitate, sau dată prin repartiţia de probabilitate P (X = x; θ), x ∈ I-finită sau numărabilă, dacă este o v.a.
discretă. Cu ajutorul funcţiei de selecţie tn (X1 , . . . , Xn ) dorim să estimăm parametrul θ (forma fiind cunoscută).
i) En = tn (X1 , . . . , Xn ) − θ se numeşte eroare aleatoare,
iar Bn = M (tn (X1 , . . . , Xn )) − θ se numeşte eroare sistematică (deplasare).
ii) tn este nedeplasat d.n.d. Bn = 0, ∀n ∈ N; tn este asimptotic nedeplasat d.n.d. lim Bn = 0.
n→∞
iii) tn este absolut corect d.n.d. tn este nedeplasat şi lim D (tn (X1 , . . . , Xn )) = 0.
n→∞
P
iv) tn este consistent d.n.d. tn (X1 , . . . , Xn ) −→ θ.
n→∞
1
v) tn este eficient d.n.d. tn este nedeplasat şi D (tn (X1 , . . . , Xn )) = n·I(θ) , unde
∂ ln f (x;θ) 2 ∂ 2 ln f (x;θ)
I (θ) = M ∂θ = −M 2 este informaţia Fisher pentru o probă.
∂θ
P
Propoziţie. Dacă n→∞
lim Bn = 0 şi lim D (tn (X1 , . . . , Xn )) = 0, atunci tn (X1 , . . . , Xn ) −→ θ.
n→∞ n→∞
Observaţii. i) Din cele prezentate rezultă că funcţia de estimaţie este de natură teoretică, în
timp ce estimaţia este de natură empirică.
ii) Dacă tn este
absolut
corect,
atunci tn este consistent.
M sX2 = µ2h = σ 2
(
M X =m
Exemple. i) 2 , ii)
D sX2 = n1 µ4 − n−3
i
µ2 −→ 0
.
D X = σ −→ 0 n−1 2 n→∞
n n→∞
Deci media de selecţie este un estimator absolut corect al mediei v.a. teoretice, iar
dispersia modificată de selecţie este un estimator absolut corect al dispersiei v.a. teoretice.
Ambii estimatori sunt şi consistenţi (conform propoziţiei).
Observaţie. Există două metode de estimare a parametrilor
- metoda momentelor Karl Pearson (1857-1936)
- metoda verosimilităţii maxime Ronald Aylmer Fisher (1890-1962)
Intervale de încredere
Aplicaţie numerică
Problemă. Se ştie că greutatea unor pachete are o repartiţie normală N (m, σ). Cântărind la
întâmplare 25 de pachete se obţin greutăţile (în kg):
xi 4 5 7 9 10
ni 5 4 7 4 5
Se cere: i) determinaţi media şi dispersia modificată de selecţie;
ii) estimaţi parametri repartiţiei normale printr-un interval de incredere 90%.
Soluţie. i) Avem
ni xi ni · xi xi − x (xi − x)2 ni · (xi − x)2
5 4 20 −3 9 45
4 5 20 −2 4 16
7 7 49 0 0 0
4 9 36 2 4 16
5 10 50 3 9 45
25 175 122
şi în consecinţă putem afirma că m ∈ [6, 22852; 7, 77148] cu încredere 90%.
(n−1)s2
Dacă X1 , . . . , Xn v.a.i.i. cu X ∈ N (m, σ), atunci U = X ∈ χ2
n−1 . Avem
1−α
= 1−0,9 = 0, 05.
σ2 2 2
2 2
Soluţiile ecuaţiilor FU χ24;0,05 = 0, 05 şi FU χ24;0,95 = 0, 95 ne furnizează cuantilele
χ224;0,05 = 13, 848 43 şi χ224;0,95 = 36, 415 03.
Avem !
24·s2 24·s2 24·s2
P X 6 σ2 6 X =P χ224;0,05 6 X 6 χ2
24;0,95
χ2 χ2 σ2
24;0,95 24;0,05
= FU χ224;0,95 − FU χ224;0,05
= 0, 95 − 0, 05 = 0, 90.
şi în consecinţă putem afirma că σ 2 ∈ [3, 350 27; 8, 809 67] cu încredere 90%.
Bibliografie