Sunteți pe pagina 1din 8

TEORIA PROBABILITAŢILOR SI STATISTICA

MATEMTICA-UNITATEA DE ÎNVATARE 4
Dr.Liana Manu Iosifescu
Octombrie 2011

CUPRINS

Funcţia empirică de repartiţie.Teorema lui Glivenko……………………..................33


Momente de selecţie…………………………………………………………………….35
Selecţia dintr-o populaţie normală…………………………………………………….36
Exerciţii rezolvate…………………………………………………...………………….37
Exerciţii propuse………………………………………………………………………..40

Orice funcţie de datele de selecţie se numeşte statistica


Considerând o selecţie de volum n: X 1 , X 2 ,..., X n , dacă dispunem în ordine

nedescrescătoare de aceste date X  1  X  2   ...  X  n  , mulţimea X  1 , X  2  ,..., X  n  
constituie o statistică a ordinei.
Vom considera doar selecţii repetate. Un rol deosebit de important în statistica
nx
matematică îl are funcţia empirica de repartiţie, definită ca Fn  x   , x  R , unde n
n
este volumul selecţiei, iar n x este numărul valorilor de selecţie mai mici decât x .
Justificarea teoretică a metodei selecţiei apare în mod natural din teorema lui
V.I.Glivenko, cunoscută sub numele de teorema fundamentală a statisticii matematice.
Teorema lui Glivenko-Cantelli: Fn  x  converge uniform la F  x 
Teorema lui Glivenko
Să presupunem că X 1 , X 2 ,... sunt variabile aleatoare independente şi identic
distribuite, în R cu funcţia de distribuţie cumulativă F  x  . Funcţia de distribuţie
1
empirică pentru este definit de Fn  x     X i  , unde I C este funcţia
n
I
i 1    , x 
n
indicator sau funcţia caracteristică a mulţimii C. Pentru orice x (fixat), Fn  x  este un şir
de variabile aleatoare care converg aproape sigur către F  x  , conform legii tari a
numerelor mari, adica, Fn converge punctual către F. Glivenko şi Cantelli au întărit
acest rezultat prin care dovedesc convergenţa uniforma a lui Fn către F .
Teoremă: Fn  F 
 sup Fn  x   F  x   0 aproape sigur.
xR

TEORIA SELECTIEI
1. Fie Fn  x  funcţia de repartiţie empirică pentru o selectie de volum n. Arătaţi că pentru
x fixat Fn  x   F  x  şi n  Fn  x   F  x    Z  N  0,  x   , determinând   x  .
p s

nF  x  reprezintă numărul variabilelor X k , k  1, n , care iau valori inferioare lui x,

   x  X  . Dacă
n

funcţia empirică de repartiţie fiind Fn  x   i 1 j X  1 , X  2  ,..., X  n 


n
reprezintă statistica ordonată a variabilelor X 1 , X 2 ,..., X n , X  1  min X 1 , X 2 ,..., X n  şi

33
 0 dacã x  X  1
 k
X  n  max X 1 , X 2 ,..., X n  , atunci Fn  x    dacã X  k   x  X  k 1 , k  1,2,..., n  1
 n
 1 dacã x  X  n
Pentru x arbitrar, funcţia empirică de repartiţie Fn  x  este o variabila aleatoare.
     
Cum P  x  X j  1  P x  X j  0  F  x  si P  x  X j  0  1  F  x  , variabilele  
aleatoare   x  X j  , j  1, n sunt independente şi identic repartizate Be F  x   , deci
 1 daca Xk  x
suma acestora nF  x   Bi n, F  x   . Introducând I k  x    , legea
 0 daca Xk  x
1 p
numerelor mari implică: Fn  x      M  I1  x    F  x  . Mai mult,
n
k 1
I k x 
n
 j n j 
nF  x   Bi  n, F  x   implică P Fn  x    Cn  F  x   1  F  x    , j  0, n având
j j

 n 
F  x  1  F  x  
M  Fn  x    F  x  şi D Fn  x    . Teorema limită centrală
n
s
 n  Fn  x   F  x    Z , cu
n  Fn  x   F  x   s
Z  N  0,  x   ,   x   D I1  x    F  x  1  F  x   sau  Z  N  0,1
F  x  1  F  x  
2. Fie X 1 , X 2 ,..., X n identic repartizate. Notând cu X  k  variabila de ordinul k
(presupunem X  1  X  2   ...  X  n  ), arătaţi că FX  k   x   F  k ,n1k   F  x   , unde F este
funcţia de repartiţie comună.
Pentru j  0,1,2,..., n , fie A j  x   {exact j dintre variabilele X 1 , X 2 ,..., X n  x }.
x  X 
 x     
n

Notând F n
* i 1 , unde P  x  X j
j  0   F  x  şi P  x  X j  0  1  F  x 
n
, adica nFn* este o sumă de variabile aleatoare, Be F  x   , conchidem că
Fn*  Bi  n, F  x   . Prin urmare:
 
FX  k   x   P  X  x   x   P j  k Aj  x    j  k P  Aj  x     j  k Cnk  F  x   1  F  x  
n n n j n j

 n  1
 Cnj z j 1  z  y k 1 1  y 
z

n n j nk
Ramâne de arătat  dy , pentru
j 1
 k   n  1  k  0

k  1,2,..., n şi 0  x  1 , z  F  x  .
Pentru k  n , ambii membrii sunt z n .
Vom demonstra prin inducţie, presupunând formula adevarată pentru
n, n  1,..., k şi vom arăta că aceasta este valabilă pentru k  1 .

Cu notaţiile: a j  Cnj z j 1  z  , j  1,2,..., n ,  k   j  k a j , k  1,2,..., n şi


n j n

 n  1
y k 1 1  y 
z

nk
Ik  dy , va trebui arătat că  k 1  I k 1 .
 k   n  1  k  0

34
 n  1
z
  1  k 1 nk 
k  I k      y 1  y   
  k   n  1  k   n  k  1   0
  n  1  k  1 
 y 1  y 
z

 k   n  1  k   n  k  1  0
k 1 n  k 1
  dy 

 n  1  n  1
x k 1 1  z  y k  2 1  y 
z

n  k 1 n  k 1
  dy 
 k   n  2  k   k   n  2  k  0

 n  1
 Cnk 1 z k 1 1  z  y  k 1 1 1  y 
n   k 1 z n   k 1

 k  1  n  1   k  1   0
dy   ak 1  I k 1

deci I k 1   k  ak 1   k 1 
 n  1 F  x
FX  k   x    y  k 1 1 1  y  dy
nk

 k  1  n  1   k  1  0
Observaţie: Daca X  U  0,1 , atunci X  k   B  k , n  1  k  , k  1,2,..., n .
Fiind data selectia de volum n: X 1 , X 2 ,... X n definim urmatoarele variabile aleatoare:
Momente (initiale) de selectie:
1 n k
Vom numi moment de selectie de ordin k, variabila aleatoare k m*
  X i .Avem:
n i 1
 1 n k 1  
 
n
M mk*  M   X i   n M  X i
k
  M k  X  si D  mk*   M 2  mk*   M 2  mk*  
 n i1 i 1 

   
 1 n     1 n
2 2
 1 n 2
 M    X ik     M   X ik    2  M X i2 k  2  M X ik M X kj   
  n i1     n i1  n i1 n i j

 2  M 2  X ik   2  M  X ik M  X kj   2   M 2  X ik   M 2  X ik     M 2 k  X   M k2  X  
1 n 2 1 n 1
n i 1 n i j n i 1 n

Aplicand inegalitatea lui Cebasev, obtinem: P mk*  M k  X     1    M  X   M  X 


2k
2
k
n 2
  P
 lim P mk*  M k  X     1 , ceea ce ne conduce la mk*  M k  X  , fapt care justifica
n
n

inlocuirea in aplicaţii a momentelor teoretice de ordinal k, când acestea exista, cu


momentele empirice de ordinal k, daca n este suficient de mare.(metoda momentelor de
estimare punctuala a parametriilor)
1 n
Pentru k  1 , obtinem media de selecţie 1m *
 X   Xi
n i1
k
1 n
Momente centrate de selecţie: Prin definiţie  k*    X i  X  ; pentru k  2 se
n i 1
1 n
obtine dispersia de selecţie:  2 
*
  X i  X 2  S 2
n i 1
Ca si in cazul momentelor teoretice, momentele centrate de selecţie pot fi exprimate cu
ajutorul momentelor obisnuite de selecţie (si invers):

35
1 n l j j j 1 i j 
l n l
     1 Cl X i X     1 Cl X   X i      1 Cl j X j ml* j
* j j l j j j
k
n i 1 j  0 j 0  n i 1  j 0
Selectia dintr-o populatie normala N  m, 
Teorema: Daca X 1 , X 2 ,..., X n este o selectie de volum n dintr-o populatie caracterizata
  
de o variabila aleataore X  N  m,  , atunci media de selectie X  N  m,  .
 n
X m
Z
Consecinta: variabila abatere normata  este repartizata normal N  0,1 .
n
Teorema: Daca X 1 , X 2 ,..., X n este o selectie de volum n dintr-o populatie normala
N  m,  , atunci X si S 2 sunt variabile aleatoare independente.

Definitie: Variabila aleatoare s 


2 1 n

n  1 k 1
 2

X k  X se numeste dispersie de selecţie

corectata.
Propozitie: : Daca X 1 , X 2 ,..., X n este o selectie de volum n dintr-o colectivitate
normala
1 n n *
N  m,  , iar     X k  m  , atunci
* 2
  n2
n k 1 2
Teorema: Daca X 1 , X 2 ,..., X n este o selectie de volum n dintr-o populatie normala
N  m,  , atunci
nS 2  n  1 s 2
   n21
2 2
Observatii: 1.Din teorema data rezulta ca dispersia de selecţie corectata este estimator
absolute corect al dispersiei unei populaţii normale, pe când dispersia de selecţie S 2 este
doar un estimator corect.
X m
2.variabila s are o lege de repartitie Student cu n-1 grade de libertate.
n
3.Dispunand de doua colectivitati, C1 , C2 , caracterizate de v.a.i. X 1  N m1 ,  1 ,
2
 
 n1 : X 11 , X 12,..., X 1n1
 
respectiv X 2  N m2 , 2 , pe baza unor selecţii de volume: 
2
se
 n2 : X 21 , X 22,..., X 2 n 2

obţin mediile
1 ni
de selecţie X 1 , X 2 si dispersiile de selecţie corectate si 
2
  X ij  X i  2 , i  1,2 .
ni  1 j 1


X 1  X 2  m1  m2    N  0,1
2 2  
Atunci, au loc : 1. X 1  X 2  N  m1  m2 , 1  2   12  22
 n1 n2  
n1 n2

2.Daca  1   2   , atunci
2 2 2  n  1s   n  1s
1
2
1 2
2
2
  n2  n
 2
1 2
2

36
X 1  X 2  m1  m2   n1n2
 tn
  n  1s   n
1
2
1 2

 1 s22 n1  n2 1
 n2  2 , statistici pe care le vom utiliza in costruirea
n1  n2  2
intervalelor de incredere.
Exerciţii rezolvate
1. Determinaţi repartiţia mediei de selecţie a unui eşantion de volum n extras dintr-o
populaţie: a). N  m,  ;b). C  0,1 .
 t
Soluţie:Vom determina  X  t    X   pentru X   N  m,  , C  0,1  .
n

 n
 x2  0 , k  2s  1
1 
 2s !

a). Z  N  0,1  M k  Z  
x2
x e

k 2
dx   2 
x dx  s , k  2 s
2s
2 e 2
  2 2 s!
 0

 itx  k   1 s t 2 s   2s !    1 s  
 x2 s t2
t2 
Z  t   M  e  1  
 e dx  
 2s ! 2s s! 
 e
itZ 2 2
2  k 0
k! s0 s0 s!  2 
n
itm 
 2t 2  i
t
m
 2t 2 
X  N  m,    X  Z  m   X  t   e itm
 Z  t   e 2
 X t   e n 2n 2  
 
 
 2t 2
itm     X m
X t  e 2n
 X  N  m,  . Observaţie: Arătaţi că n  N  0,1
 n 

1 e itx
b). Pentru calculul funcţiei caracteristice a v.a. X  C  0,1   X  t    1  x 2 dx vom
 

1  1 
 x 0
 itx  n e ax dx    itx  n e  ax dx  x y
folosi  L  a   t    eitx  e a dx     
2a   2a   n0
n! 0 n0
n! 

   au 
x
 it  n 
u
1   
 x  y k 
 t2
1
 
  a
     e  u  adu    a 2t 2
n

n!  0 0 
n 2k
  x e dx  n
 y ea
dy    a
2a  n0   a k  0  2k ! 0 n0

1 1 1
deci  L  a   t     L  1  t     eitx  e dx ; dacă t  x , se obţine:
 x

1  a 2t 2 1 t2 2 
  
1 1 1 1 1 1 1
  e
t t t
 eitx  e dt ;  e  itx  e dt    itx
e dt . Cum
1 x 2
2  1 x 2
2   1 x 2
2 

1 1 

f C  0,1  x   , x  R , conform formulei de inversiune: dacă    t  dt 


 1 x 2


n
1

 t   t

f  x  e
 itx
   t  dt , rezultă C  0,1  t   e t
 X t       e n n  e
t
2  n  X


 
 X  C  0,1 .Observaţii: rezolvarea dată generează următoarele probleme:
1.diferenţa a două v.a.i. exp(1) este o v.a. L (1)
2.calculul densitaţii şi a funcţiei caracteristice X  C  m, a   X  aZ  m, Z  C  0,1
   1
3. X  U   ,   Y  tgX  C  0,1   C  0,1
 2 2 Y

37
n
 n n

4. X k  C  mk , ak  , k  1,2,..., n v.a.i.   X k  C   mk ,  ak 
 k 1
k 1 k 1 
2. Calitatea unor aparate este apreciata dupa numărul de puneri in funcţiune până la
prima defectare. S-au analizat 100 de aparate , obţinându-se rezultatele:
xi porniri 1 3 6 8 10
ni aparate 15 20 30 10 25
Calculaţi:a).valoarea funcţiei empirice de repartiţie în punctul x=7
b).media şi dispersia de selecţie
 1 3 6 8 10 
* 
Soluţie: X : 15 20 30 10 25   F100 *
 7   0,65 ;
 
 100 100 100 100 100 
 0, x  1
 0,15, 1  x  3

 0,35, 3  x  6
F100  x   
 0,65, 6  x  8
 0,75, 8  x  10

 1, x  10
5 5

 ni xi 1  15  3  20  6  30  8  10  10  25 n  x  x
i i
x i 1
5
  5,85 , iar  2*  i 1
5
100
 ni
i 1
n
i 1
i

calcule pe care le vom organiza în tabelul:


ni xi xi  x  xi  x  2 ni  xi  x 
2

15 1 -4,85 23,5225 352,8375


20 3 -2,85 8,1225 162,45
30 6 0,15 0,0225 0,675
10 8 2,15 4,6225 46,225
25 10 4,15 17,2225 430,5625
100 x  5,85  2*  9,9275

3. V.a. X  N   ,1 , unde   U   a, a  . Determinaţi limita repartiţiei a posteriori a v. a.


 pe baza unei selecţii de volum n extrasă din populaţia în care caracteristica sub
cercetare este X.

38
Soluţie: Conform exerciţiului rezolvat 1a)., pentru selecţia  X 1 , X 2 ,... X n  asupra v.a.X
n x    2
n  2
e

 X  N  ,
1 
 . Teorema lui Bayes implică: f  x    a
2
n x    2 . Pentru
 n n  2

a 2
e d

n x    2
n   se obţine: f   x   n e 2    N  x , 1 

2  n
4. Dacă selecţia de volum n ,  X 1 , X 2 ,... X n  , este extrasă din populaţia caracterizată de
nX
a). v.a. X  exp  , determinaţi repartiţia statisticii S 

x 2n
b). F  x   1  e   , x  0 , determinaţi repartiţia statisticii S  m*
X  

Soluţie:a). Cum X k
, este suficient de determinat funcţia caracteristică a v.a.
S k 1

X
Y  , X  exp  , ceea ce va conduce la determinarea acesteia pentru statistica dată:

 t  X 
 S  t   Yn  t    Xn   . Dar FY  t   P Y  t   P  t   P X  t   FX t  

    
 
 itx  n  e t dt 
fY  t   f X t   e , t  0 . Prin urmare: Y    0 0 
t t
t  e itx
 e dt 
n 0 n!
 ix  n  n  1 
   ix   1  ix    S  t   1  ix   S   n,1
n 1 n

n0 n! n0

b). Un raţionament identic cu cel anterior conduce succesiv la calculul funcţiei


x
X   2 n 
, cu f X  x   x e  , x  0 întrucât S   X k .

 1
caracteristice a v.a. Y 
   k 1
 1
  1

 2X     x      x   
FY  x   P  Y  x   P  x   P X      FX     
     2     2  
   
1
1  1

1  x    x   
x
  1 
fY  x     e 2 , x  0  Y  t    exp  2   t   1  2it  
1
   fX   
 2  2   2   2
 
 2t 
 S  t   Yn  t    Xn     1  2it   S   2 n . Evident, la aceeaşi concluzie se ajunge
n 2

  
 1
  1
calculând FX  x   P X  x   P X  x    FX  x    X   exp  .

   

Exerciţii propuse
1. Fie X o v.a. continuă cu densitatea de repartiţie simetrică faţă de origine şi
X 1 , X 2 ,... X n

39
o selecţie aleatoare. Determinaţi: P U n  0  Vn  0  şi P U n  0  Vn  0  , unde
U n  X  1  min X 1 , X 2 ,... X n  şi Vn  X  n   max X 1 , X 2 ,... X n  .
2. Pentru a verifica prezenţa studenţilor la un curs, s-a ales un eşantion de n=100 studenţi
şi s-a înregistrat numărul absenţelor acestora la patru cursuri consecutive:
Număr studenenţi xi 50 20 15 8 7
Număr absenţe ni 0 1 2 3 4
Să se scrie repartiţia empirică şi să se calculeze media şi dispersia de selecţie.
3. Fie  X 1 , X 2 ,... X n  o selecţie de volum n extrasă dintr-o populaţie N  0,  . Să se
1 n 2 1 n 2 1 n 2
determine densitatăţile statisticilor: U   k,
n k 1
X V   Xk , S 
n k 1  Xk .
n k 1
4. Fie  X 1 , X 2 ,... X n  o selecţie de volum n extrasă dintr-o populaţie Pa 1,1 . Să se
n
determine repartiţia statisticii S  2n ln X
k 1
k .

5. Punctajul obţinut la un examen poate fi presupus distribuit normal cu m=200 şi


  20. Promovarea examenului presupune obţinerea a minim 230 puncte. Alegând 10
candidaţi (la întâmplare, cu punctajele X 1 , X 2 ,... X 10 ), determinaţi probabilitatea ca sa
treaca examenul a). toţi; b).doar jumătate; c). unul singur;
d). P X  210  ; e). P185  s 2  653
6. Dintr-o populaţie normală de medie 80 şi dispersie 40 se extrage o selecţie de volum
400, iar din altă populaţie normală, independentă de prima, de medie 76 şi dispersie 180
se extrage o selecţie de volum 200. Să se afle probabilitatea ca:
a). Media primei selecţii să fie mai mare decât media celeilalte cu 5 unitaţi.
b). Diferenţa mediilor celor două selecţii în valoare absolută să fie mai mică ca 6.
7. Determinaţi a, b  R a.î. pentru o selecţie de volum 15 dintr-o populaţie normală
N  m,   să aibă loc P  S 2  a   0,95 = 1  P  *  b 

40

S-ar putea să vă placă și