Sunteți pe pagina 1din 4

CURS 12

ELEMENTE DE TEORIA SELECTIEI


Orice cercetare statistica porneste de la o “colectivitate” sau “populatie” alcatuita din elemente sau
indivizi care au o anumita caracteristica generala.

In studiul colectivitatilor statistice, in majoritatea cazurilor, se analizeaza doar parti din intreaga
colectivitate, numite esantioane sau selectii. Apare problema de a studia modul in care valorile tipice (pe
baza carora tragem concluzii) ale colectivitatii partiale investigate pot furniza informatii asupra valorilor
tipice ale intregii colectivitati.

Definitia 1
Esantion sau selectie: colectivitate partiala de elemente alese la intamplare din colectivitatea
generala/populatie.
Volumul selectiei: numarul elementelor selectiei.
Elementele selectiei: date de selectie.

Definitia 2
Spunem ca o selectie este repetata daca elemental ales la intamplare este reintrodus in colectivitatea
generala inaintea efectuarii urmatoarei alegeri. In caz contrar, selectia este nerepetata.

Presupunem ca urmarim o caracteristica unei populatii descrisa de o variabila aleatoare 𝑋 definita pe


un camp borelian de probabilitate {Ω, 𝐾, 𝑃} . Vom spune ca 𝑋 este variabila aleatoare teoretica. Fie o
selectie de volum 𝑛 din aceasta populatie.
Considerate aposteriori (dupa efectuarea selectiei), datele de selectie 𝑥1 , 𝑥2 , … , 𝑥𝑛 sunt valori
observate, bine determinate ale variabilei aleatoare teoretice .
Considerate apriori, datele de selectie 𝑋1 , 𝑋2 , … , 𝑋𝑛 sunt variabile aleatoare identic repartizate, cu
aceeasi repartitie ca a variabilei aleatoare 𝑋 . In plus, daca selectia este repetata, aceste variabile
aleatoare sunt independente.

Observatia 1
Daca volumul colectivitatii generale/populatiei este suficient de mare, iar volumul selectiei suficient de
mic, deosebirea dintre selectia repetata si cea nerepetata este nesemnificativa.

Observatia 2
In cele ce urmeaza, daca nu se specifica altfel, vom considera selectii repetate.

Definitia 3
Orice functie de date de selectie se numeste functie de selectie sau statistica.
Exemplul 1
Consideram o selectie 𝑋1 , 𝑋2 , … , 𝑋𝑛 de volum 𝑛 dintr-o populatie. Scriem in ordine crescatoare aceste
date: 𝑋(1) ≤ 𝑋(2) ≤ ⋯ ≤ 𝑋(𝑛) , obtinand statistici de ordine. Desigur, 𝑋(1) = min(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) ,
𝑋(𝑛) = max(𝑋1 , 𝑋2 , … , 𝑋𝑛 ).
Functia de selectie 𝑊𝑛 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 𝑋(𝑛) − 𝑋(1) se numeste amplitudinea selectiei.

Definitia 4
Consideram o selectie de volum 𝑛 dintr-o populatie caracterizata de o variabila aleatoare 𝑋 . Atunci
𝑛𝑥
𝐹𝑛 (𝑥) = 𝑛
, 𝑥 ∈ ℝ , unde 𝑛𝑥 reprezinta numarul valorilor de selectie mai mici strict decat 𝑥 , se
numeste functia de repartitie de selectie sau functia empirica de repartitie.

Observatia 3
𝐹𝑋 (𝑥) = 𝑃({𝜔|𝑋(𝜔) < 𝑥}) este/se numeste functia de repartitie teoretica a variabilei aleatoare 𝑋 .

Teorema 1 – Glivenko (teorema fundamentala a statisticii matematice)


Consideram o selectie de volum 𝑛 dintr-o populatie caracterizata de o variabila aleatoare 𝑋 , cu
functia de repartitie teoretica 𝐹(𝑥) . Fie 𝐹𝑛 functia de repartitie empirica. Atunci
𝑃 ( lim sup|𝐹𝑛 (𝑥) − 𝐹(𝑥)| = 0) = 1
𝑛→∞ 𝑥∈ℝ

Momente de selectie
Consideram o selectie 𝑋1 , 𝑋2 , … , 𝑋𝑛 de volum 𝑛 dintr-o populatie caracterizata de o variabila aleatoare
𝑋 , cu functia de repartitie 𝐹𝑋 (𝑥) , momentele initiale teoretice de ordin 𝑟 , 𝑚𝑟 (𝑋) = 𝑀(𝑋 𝑟 ) si
𝑟
momentele teoretice centrate de ordin 𝑟 , 𝜇𝑟 (𝑋) = 𝑀((𝑋 − 𝑀(𝑋)) ) (in cazul in care nu se specifica
altceva, vom presupune ca acestea exista).

Definitia 5
1
Momentul de selectie de ordinul 𝑟 este dat de 𝑀𝑟 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 𝑛 ∑𝑛𝑗=1 𝑋𝑗𝑟 .
Observatie: daca nu exista pericol de confuzie, se poate nota 𝑀𝑟 .

Definitia 6
1
Media de selectie este data de 𝑀1 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 𝑛 ∑𝑛𝑗=1 𝑋𝑗 si se noteaza cu 𝑋 .

Propozitia 1
Consideram o selectie 𝑋1 , 𝑋2 , … , 𝑋𝑛 de volum 𝑛 dintr-o populatie caracterizata de o variabila aleatoare
𝑚2𝑟 (𝑋)−𝑚𝑟2 (𝑋)
𝑋 . Notam 𝑀𝑟 momentul de selectie de ordin 𝑟 . Atunci 𝑀(𝑀𝑟 ) = 𝑚𝑟 (𝑋) si 𝐷(𝑀𝑟 ) = 𝑛
,
unde 𝑚𝑟 (𝑋) este momentul teoretic de ordin 𝑟 al variabilei aleatoare teoretice 𝑋 .
Observatia 4
𝑀𝑟 converge in probabilitate la 𝑚𝑟 (𝑋) (i.e. lim𝑛→∞ 𝑃(|𝑀𝑟 − 𝑚𝑟 (𝑋)| < 𝜀) = 1 ) .
Astfel, in aplicatii practice, pentru 𝑛 (volumul selectiei) suficient de mare, momentele teoretice de orice
ordin (daca exista) se pot inlocui cu momentele de selectie/empirice de acelasi ordin.

Definitia 6
1 𝑟
Momentul de selectie centrat de ordinul 𝑟 este dat de 𝜇𝑟 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 𝑛 ∑𝑛𝑗=1(𝑋𝑗 − 𝑋) .
Observatie: daca nu exista pericol de confuzie, se poate nota 𝜇𝑟 .

Definitia 7
Momentul de selectie centrat de ordin 2 se numeste dispersia de selectie si este dat de
1 2
𝑠 2 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 𝜇2 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = ∑𝑛𝑗=1(𝑋𝑗 − 𝑋) .
𝑛
Observatie: daca nu exista pericol de confuzie, se poate nota 𝑠 2 .

Propozitia 2
𝑛−1
Fie 𝑠 2 dispersia de selectie. Atunci 𝑀(𝑠 2 ) = 𝑛
𝐷(𝑋) .

Definitia 8
1 2
𝑠̃ 2 = 𝑠̃ 2 (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = 𝑛−1 ∑𝑛𝑗=1(𝑋𝑗 − 𝑋) se numeste dispersia de selectie corectata.

Observatia 5
Consideram o selectie 𝑋1 , 𝑋2 , … , 𝑋𝑛 de volum 𝑛 dintr-o populatie caracterizata de o variabila aleatoare
𝑋−𝑚
𝑋 , pentru care exista 𝑀(𝑋) = 𝑚 si 𝐷(𝑋) = 𝜎 2 > 0 ( 𝑚 si 𝜎 2 finite) . Atunci 𝜎 ⁄√𝑛
converge in
repartitie la variabila aleatoare 𝑍~𝑁(0,1) (echivalent cu: 𝑋 converge in repartitie la variabila
𝜎
aleatoare cu repartitie 𝑁 (𝑚 , ).
√𝑛
3 𝑀𝑟 −𝑚𝑟 (𝑋)
In plus, daca exista 𝑚𝑟 (𝑋) , 𝑚2𝑟 (𝑋) si 𝑀 (|𝑀𝑟 − 𝑚𝑟 (𝑋)| ) , atunci 1/2 converge in
𝑚 (𝑋)−𝑚2
𝑟 (𝑋)]
[ 2𝑟
𝑛

repartitie la variabila 𝑍~𝑁(0,1) .

Selectii dintr-o populatie normala


Propozitia 3
Fie 𝑋1 , 𝑋2 , … , 𝑋𝑛 o selectie de volum 𝑛 dintr-o populatie caracterizata de o variabila aleatoare
1 𝜎 𝑋−𝑚
𝑋~𝑁(𝑚, 𝜎) . Atunci media de selectie 𝑋 = 𝑛 ∑𝑛𝑗=1 𝑋𝑗 are repartitie 𝑁 (𝑚 , ) (echivalent cu: 𝜎 ⁄√𝑛
√𝑛
are repartitie 𝑁(0,1) .
Propozitia 4
Fie 𝑋1;1 , 𝑋1;2 , … , 𝑋1;𝑛1 o selectie de volum 𝑛1 din populatia caracterizata de variabila aleatoare
𝑋1 ~𝑁(𝑚1 , 𝜎1 ) si 𝑋2;1 , 𝑋2;2 , … , 𝑋2;𝑛2 o selectie de volum 𝑛2 din populatia caracterizata de variabila
𝑛1 1 𝑛2 1
aleatoare 𝑋2 ~𝑁(𝑚2 , 𝜎2 ) ; notam mediile de selectie 𝑋1 = 𝑛 ∑𝑗=1 𝑋1;𝑗 , respectiv 𝑋2 = 𝑛 ∑𝑗=1 𝑋2;𝑗
1 2

𝜎2 𝜎22 𝑋1 −𝑋2 −(𝑚1 −𝑚2 )


Atunci 𝑋1 − 𝑋2 are repartitie 𝑁 (𝑚1 − 𝑚2 , √𝑛1 + 𝑛2
) (echivalent cu ~ 𝑁(0,1) ).
1 𝜎 2𝜎 2
√ 1+ 2
𝑛1 𝑛2

Propozitia 5
Fie 𝑋1 , 𝑋2 , … , 𝑋𝑛 o selectie de volum 𝑛 dintr-o populatie caracterizata de o variabila aleatoare
𝑋~𝑁(0,1) . Atunci ∑𝑛𝑘=1 𝑋𝑘2 are repartitie 𝜒𝑛2 .

Propozitia 6
Fie 𝑋1 , 𝑋2 , … , 𝑋𝑛 o selectie de volum 𝑛 dintr-o populatie caracterizata de o variabila aleatoare
𝑋~𝑁(𝑚, 𝜎) . Atunci:
𝑛∙𝑠2 2 (𝑛−1)∙𝑠̃ 2 2 𝑋−𝑚
a) 𝜎2
~ 𝜒𝑛−1 ; b) 𝜎2
~ 𝜒𝑛−1 ; c) 𝑠̃ ⁄√𝑛
~ 𝑡𝑛−1 (rep. Student cu 𝑛 − 1 grade de libertate).

Observatia 6
Fie 𝑋1;1 , 𝑋1;2 , … , 𝑋1;𝑛1 o selectie de volum 𝑛1 din populatia caracterizata de variabila aleatoare
𝑋1 ~𝑁(𝑚1 , 𝜎) si 𝑋2;1 , 𝑋2;2 , … , 𝑋2;𝑛2 o selectie de volum 𝑛2 din populatia caracterizata de variabila
1
𝑛1 𝑛2 1
aleatoare 𝑋2 ~𝑁(𝑚2 , 𝜎) ; notam mediile de selectie 𝑋1 = 𝑛 ∑𝑗=1 𝑋1;𝑗 , respectiv 𝑋2 = 𝑛 ∑𝑗=1 𝑋2;𝑗
1 2
1 2 1 2
si dispersiile de selectie corectate 𝑠̃12 = ∑𝑛1 (𝑋 − 𝑋1 ) , 𝑠̃22 = ∑𝑛2 (𝑋 − 𝑋2 ) .
𝑛1 −1 𝑗=1 1;𝑗 𝑛2 −1 𝑗=1 2;𝑗
𝑋1 −𝑋2 −(𝑚1 −𝑚2 ) 𝑛1 𝑛2
Atunci √𝑛 ~ 𝑡𝑛1 +𝑛2 −2 .
(𝑛 −1)𝑠̃2 2 1 +𝑛2
√ 1 1 +(𝑛2 −1)𝑠̃2
𝑛1 +𝑛2 −1

S-ar putea să vă placă și