Sunteți pe pagina 1din 26

CURS 2

Distributii de
esantionare

1
Introducere

 In viata reala calculul parameterilor unei populatii


este dificil sau chiar imposibil deoarece
populatiile sunt foarte mari.
 Mai degraba decat a investiga intreaga
populatie, vom lua in considerare esantioane,
vom calcula o statistica relativ la parameterul
ce ne intereseaza, apoi vom face o inferenta.
 Distributi de esantionare a unei statistici este
instrumentul care ne spune cat de aproape este
statistica de parametru.

2
Distribuţia de eşantionare a
mediei

 Un exemplu:
 Un zar este aruncat de un număr infinit de
ori. Notăm cu X numărul arătat la fiecare
aruncare.
 Distribuţia de probabilitate a lui X este:
Media(X) = 1(1/6) +
2(1/6) + 3(1/6)+
x 1 2 3 4 5 6 ………………….= 3.5
p(x) 1/6 1/6 1/6 1/6 1/6 1/6
Dispersie(X) = (1-
3.5)2(1/6) +
(2-3.5)2(1/6) +
3
Aruncarea unui zar de două ori –
media eşantionului

 Presupunem că dorim să estimăm


 din media x a unui eşantion de
mărime n = 2.
 Care este distribuţia lui x ?

4
Aruncarea unui zar de două ori –
media eşantionului

Eşantion
Eşantion Medie Eşantion
Medie Eşantion Medie Eşantion
Medie Eşantion Medie
Medie
11 1,1
1,1 11 13
13 3,1
3,1 22 25
25 5,1
5,1 33
22 1,2 1,5
1,2 1,5 14
14 3,2 2,5
3,2 2,5 26
26 5,2
5,2 3,5
3,5
33 1,3
1,3 22 15
15 3,3
3,3 33 27
27 5,3
5,3 44
44 1,4 2,5
1,4 2,5 16
16 3,4 3,5
3,4 3,5 28
28 5,4
5,4 4,5
4,5
55 1,5
1,5 33 17
17 3,5
3,5 44 29
29 5,5
5,5 55
66 1,6 3,5
1,6 3,5 18
18 3,6 4,5
3,6 4,5 30
30 5,6
5,6 5,5
5,5
77 2,1 1,5
2,1 1,5 19
19 4,1 2,5
4,1 2,5 31
31 6,1
6,1 3,5
3,5
88 2,2
2,2 22 20
20 4,2
4,2 33 32
32 6,2
6,2 44
99 2,3 2,5
2,3 2,5 21
21 4,3 3,5
4,3 3,5 33
33 6,3
6,3 4,5
4,5
10
10 2,4
2,4 33 22
22 4,4
4,4 44 34
34 6,4
6,4 55
11
11 2,5 3,5
2,5 3,5 23
23 4,5 4,5
4,5 4,5 35
35 6,5
6,5 5,5
5,5
12
12 2,6
2,6 44 24
24 4,6
4,6 55 36
36 6,6
6,6 66

5
Eşantion
Eşantion MedieEşantion
Medie Eşantion Medie Eşantion
Medie Eşantion Medie
Medie
11 1,1 11
1,1 13
13 3,1
3,1 22 25
25 5,1
5,1 33

The distribution of x when n = 2


22 1,2 1,5
1,2 1,5 14
14 3,2 2,5
3,2 2,5 26
26 5,2
5,2 3,5
3,5
33 1,3 22
1,3 15
15 3,3
3,3 33 27
27 5,3
5,3 44
44 1,4 2,5
2,5 16 3,4 3,53,5 28 5,4 4,5

1,4 16 3,4 28 5,4 24,5
55
66
1,5 33
1,5 17
17
Notam::    si
1,6 3,5
3,5
3,5
3,5
si  
18 
3,6 4,5
44
4,5
29
29 5,5 2 55
5,5
30 22 5,6
5,6 xx 5,5
5,5
77Notam
1,6
2,1 1,5
2,1 1,5
18
19
19
3,6
x 4,14,1 x 2,5
2,5
30
31 x 6,1
31 6,1 3,5
3,5
22
x x x
88 2,2 22
2,2 20
20 4,2
4,2 33 32
32 6,2
6,2 44
99 2,3 2,5
2,3 2,5 21
21 4,3 3,5
4,3 3,5 33
33 6,3
6,3 4,5
4,5
10
10 2,4 33
2,4 22
22 4,4
4,4 44 34
34 6,4
6,4 55
11
11 2,5 3,5
2,5 3,5 23
23 4,5 4,5
4,5 4,5 35
35 6,5
6,5 5,5
5,5
12
12 2,6 44
2,6 24
24 4,6
4,6 55 36
36 6,6
6,6 66

x
Media( ) =1.0(1/36)+
1.5(2/36)+….=3.5
6/36
5/36
x
Varianta( ) = (1.0-3.5)2
4/36 (1/36)+
3/36 (1.5-3.5)2(2/36)... = 1.46
2/36
1/36
1 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 x 6
Distribuţia de eşantionare a
mediei
n5 n  10 n  25
 x  3.5  x  3.5  x  3.5
 2x  2x  2x
  .5833 (  )
2
x  x  .2917 (  )
2
  .1167 (  )
2
x
5 6 10 25

7
Distributia de esantionare a
mediei de selectie
n5 n  10 n  25
 x  3.5  x  3.5  x  3.5
 2x  2x  2x
 x  .5833 (  )
2   .2917 (  )
2
x   .1167 (  )
2
x
5 10 25

ca 
2 2
Notam that
Notice 2
x x este mai mic
is smaller than .  x.
decat
The larger
Cu cat este the
mai sample
mare size the esantionului,
volumul
este  x x . tends
2
 Astfel,x tinde
2
smaller
cu atat maix . mic
Therefore,
to
safall
fie closer to , asdethe
mai aproape , sample
cu cat
volumul esantionului creste.
8
Distributia de esantionare a
mediei de selectie
Demonstratie: Dispersia mediei esantionului este
mai mica decat dispersia populatiei.

Medie= 1.5 Medie = 2. Medie = 2.5

Populatie 1 1.5
1.5 222 2.5
2.5 3
1.5
1.5 22 2.5
2.5
1.5
Comparam 2 2.5 populatiei
variabilitatea
1.5
1.5 2 2.5
2.5
cu variabilitatea
1.5 2 mediei
2.5de selectie
1.5
1.5 2 2.5
2.5
1.5 2 2.5
Sa alegem esantioane 1.5
1.5 2
2 2.5
2.5
de doua observatii

9
Distributia de esantionare a
mediei de selectie

De asemenea,
Valoarea asteptata in populatie (media)=
(1 + 2 + 3)/3 = 2

Valoarea asteptata a mediei de selectie


(media)=
(1.5 + 2 + 2.5)/3 = 2

10
Teorema Limita Centrala

 Daca un esantion aleator este extras din orice


populatie, distributia de esantionare a mediei
de selectie este aproximativ normala, pentru
un esantion de volum suficient de mare.
 Cu cat este mai mare volumul esantionului, cu
atat mai aproape este distributia de
esantionare a lui x de o distributie normala.

11
Distributia de esantionare a mediei
de selectie

1.  x   x
 2
2.  
2
x
x
n
3. Daca x este normala, x este normala. Daca x nu este
normal distribuita, x este aproximativ normal distribuita
pentru esantioane de volum suficient de mare.

12
Distributia de esantionare a mediei
de selectie
 Exemplu
 Cantitatea de soda din fiecare sticla este normal
distribuita de medie 32.2 grame si deviatie
standard de .3 grame.
 Gasiti probabilitatea ca o sticla cumparata de un
client sa contina mai mult de 32 grame:
 Rezolvare
0.7486
 Variabila aleatoare X este

cantitatea de soda dintr-o sticla.


x   32  32.2
P( x  32)  P(  )
x .3 x = 32  = 32.2
 P( z  .67 )  0.7486
13
Distributia de esantionare a mediei
de selectie
 Gasiti probabilitatea ca o cutie cu 4 sticloe sa aiba o
medie mai mare de 32 grame de soda/sticla.
 Rezolvare
 Definim variabila aleatoare ca fiind cantitatea medie de
soda/sticla.

x   32  32.2
P( x  32)  P(  ) 0.9082
x .3 4
 P( z  1.33 )  0.9082
0.7486
x = 32
x  32  = 32.2
 x  32.2 14
Distributia de esantionare a mediei
de selectie
 Exemplu
 Problema lui Nelu:Venitul mediu lunar al unui
absolvent CSIE, la un an dupa absolvire, este
E600.
 Presupunem ca distributia venitului lunar are o
deviatie standard de E100. Care este
probabilitatea ca 25 de absolventi selectati aleator
sa aiba o medie a venitului lunar mai mica de
E550?
 Rezolvare: x   550  600
P( x  550)  P(  )
x 100 25
 P( z  2.5)  0.0062 15
Distributia de esantionare a mediei
de selectie

 Exemplu– continuare
 Daca un esantion aleator de 25 de absolventi au
acum o medie a venitului lunar de E550, ce putem
concluziona despre validitatea afirmatiei ca media
venitului lunar este 600?
 Rezolvare
 Cu  = 600, probabilitatea de a gasi o medie de selectie
atat de mica precum 550 este foarte mica (0.0062).
Presupunerea ca venitul mediu lunar este E600 este
probabil nejustificata.
 Este mai rezonabil sa presupunem ca  este mai mica de
E600, deoarece, atunci o medie a esantionului de E550
devine mai probabila.
16
Utilizarea distributiilor de
esantionare pentru inferente
 Pentru a face o inferenta despre parametrii unei populatii, folosim
distributii de esantionare (ca si in exemplele anterioare)
 Simetria distributiei normale, impreuna cu distributia de esantionare a
mediei, duce la:

x
P( 1.96  z  1.96 )  .95, or P( 1.96   1.96 )  .95
 n
- Z.025 Z.025
Aceasta poate fi scrisa :
 
P ( 1.96  x    1.96 )  .95
n n
ce devine
 
P (   1.96  x    1.96 )  .95
n n
17
Utilizarea distributiilor de
esantionare pentru inferente

Distributia normala standard Z Distributia normala a lui x


100 100
P(600  1.96  x  600  1.96 )  .95
25 25

.95
.95
.025 .025 .025 .025

Z x
-1.96 0 -1.96 
100 
 P(600
100
 11.96
P(600 .96  1.96
1.96
n
25 n 25
18
Utilizarea distributiilor de
esantionare pentru inferente

100 100
P (600  1.96  x  600  1.96 )  .95
25 25
Ceea ce inseamna P (560.8  x  639.2)  .95

 Concluzii
 Exista 95% sanse ca media de selectie sa pice in
intervalul [560.8, 639.2] daca media populatiei este
600.
 Atata vreme cat media de selectie este 550, media
populatiei generale probabil nu este 600.

19
Distributia de esantionare a
proportiei

 Parametrul ce ne intereseaza pentru data


nominale este proportia aparitiei unui
eveniment particular (succes).
 Pentru a estima proportia populatiei ‘p’,
vom folosi proportia esantionului. Numarul de
succese

^p = x
Estimatia lui p = n

20
Distributia de esantionare a
proportiei

 Atata timp cat X este binomial,


^
probabilitatile lui p poate fi calculata din
distributia binomiala.
 Totusi, pentru inferente despre p ^ vom
prefera sa utilizam aproximarea normala a
distributiei binomiale.

21
Aproximarea normala a
distributiei binomiale
 Aproximarea normala a distributiei binomiale lucreaza
cel mai bine cand:
 Numarul de experimente (volumul esantionului) este
mare, si
 Probabilitatea succesului, p, este aproape de 0.5.

 Pentru ca aproximatia sa ofere bune rezultate, trebuie


sa indeplinim doua conditii:

np  5; n(1 - p)  5

22
Aproximarea normala a
distributiei binomiale

Parametrii distributiei normale folositi


pentru a aproxima distributia binomiala,
sunt:

 = np; 2 = np(1 - p)

23
Aproximarea distributiei de
esantionare pentru proportia
esantionului

 Pornind de la ceea ce stim despre valoarea


asteptata si varianta, poate fi aratat ca
 media( p̂) = p si
 varianta( p̂) =p(1-p)/n
 Daca amandoua np > 5 si np(1-p) > 5, atunci
p̂pp

zz 
pp((11pp))
nn
 Z este aproximativ standard normal distribuit.
24
 Exemplu
 Un politician a primit 52% din voturi la
ultimele alegeri.
 Un an mai tarziu, politicianul doreste sa
studieze popularitatea sa.
 Daca popularitatea sa nu s-a schimbat,
care este probabilitatea ca mai mult de
jumatate dintr-un esantion de 300 de
votanti sa il voteze?
25
 Exemplu
 Rezolvare
 Numarul de respondenti care prefera politicianul
este o distributie binomiala cu n = 300 si p
= .52. Atunci, np = 300(.52) = 156 si
n(1-p) = 300(1-.52) = 144 (amandoua mai mari
decat 5)
 pˆ  p .50  .52 
P ( pˆ  .50)  P    .7549
 p (1  p ) n (.52)(1  .52) 300 

26

S-ar putea să vă placă și