Documente Academic
Documente Profesional
Documente Cultură
Statistica PDF
Statistica PDF
n
*
X2
1
Xj
1
Xn
M(X j) = M(X )
, j = 1,..., n
D ( X j ) = D( X )
, j = 1,..., n
M ( X rj ) = M ( X r )
, j = 1,..., n
n
n
n
n
1
=
i
2
i
k
1
x1 , x 2 , , xi , , x k sunt valorile distincte ale lui X j , j = 1,..., n , iar
n1 , n2 , , ni , , nk sunt frecvenele de apariie. Deci relaiile (1)
devin: (1)
1 k
m * = x = xi ni
n i =1
k
1
D * = ( x i x ) 2 ni
n i =1
1 k
mr* = xir ni
n i =1
1 k
r* = ( xi x ) r ni
n i =1
Repartiii de selecie
O anumit caracteristic (calitativ sau cantitativ) studiat
pe o populaie oarecare poate fi considerat ca o variabil
aleatoare unidimensional X care are o densitate de repartiie f (x )
sau o funcie de reaprtiie F (x ) .
f (x ) i F (x ) se numesc legi teoretice de repartiie a
variabilei aleatoare X .
S considerm acum c pe baza unei selecii de volum n din
populaia obinem valorile X 1 , X 2 , , X n . Cu ajutorul acestor
valori (cu ajutorul acestor date de selecie) putem calcula diferii
indicatori ca de exemplu:
n
Media de selecie : X * = X = 1 X k
n k =1
n
Dispersia de selecie : D * = 1 ( X k X ) 2
n k =1
DEFINIIE:
1
.
( X 1 + X 2 + + X n ) are o repartiie N m,
n
n
Demonstraie:
Deoarece variabila aleatoare de selecie X k , k = 1,..., n ,
este o variabil aleatoare normal N (m, ) , ea are funcia
1
imt 2t 2
Xk
t 1 t2
im 2 2
n 2 n
(deoarece caX (t ) = c X ( at ) ).
1
1
1
1
( X1 + X 2 + + X n ) = X1 + X 2 + + X n
n
n
n
n
i deci, aplicnd proprietatea P3 a funciei caracteristice (vezi
capitolul 3, paragraful 1.6.), avem:
Dar
X =
c X (t ) = e
t
1 t2
i m 2 2
n
2 n
t2
i n m 2 2 n 2
= e i =1
=e
itm
1 2 2
t
2 n
=e
1 2
itm
t
2 n
k =1
n
n
n funcie de X , adic Z =
X
X . Atunci :
n n
X m n
n
M(Z) = M
n = M( X) M m = [M(X) m] = [m m] = 0
n n
n
X m
n 2
=1
D( Z ) = D
n = D
X D
m = D( X ) = 2
X m
Prin urmare, Z =
n are repartiia normal de tip
N (0,1) .
de volum
X1 =
1
n1
n2
n1
X
j =1
1j
X2 =
1
n2
n2
X
k =1
2k
N ( m 2 , 2 ) , i dac
n1
n 2
Demonstraie:
Funcia caracteristic a mediei de selecie
c X (t ) = e
t 2 2
itm1 1
2 n1
X1
este
t 2 22
itm2
2 n2
itm 2
t 2 22
2 n2
, conform proprietii P4 a
itm1
t 2 12
2 n1
itm 2
t 2 22
2 n2
=e
it ( m1 m 2 )
t 2 12 22
+
2 n1 n 2
2
2
n1
n 2
imt
t 2 2
2
CONSECINA 2:
k
x
1
1
2
2
x
e
, x>0
k
k 2
f ( x; k ) = 2
2
0 , x 0
probabilitate :
h( x ) =
1
n
n
2 2
2
x2 e
x
2
, x > 0.
2
Y = X k2 este o variabil aleatoare cu n grade de libertate.
k =1
n 1 k =1
a)
2
repartiie cu n grade de libertate.
Demonstraie:
n
1
n
(X
2
2
i m)
n
n
nD '
Xi m
i =1
U'= 2 =
=
Z i2 ,
=
i =1
i =1
unde Z i este o variabil aleatoare cu repartiia N (0,1) . Conform
2 4
n
D (U ' ) = 2 D( D ' ) = 2n D ( D' ) =
~
Prin urmare, variabila U = ( n 12 ) D are densitatea de
n 1
x
1
1
probabilitate de forma : h( x ) =
x 2 e 2 , x > 0.
n 1 n1
2
2
TEOREMA 3: Dac X 1 , X 2 , , X n este o selecie de
volum n dintr-o populaie normal N (m, ) , atunci variabila
~
m
aleatoare t = X
n , unde ~ = D , are o repartiie Student cu
~
( n 1) grade de libertate.
CONSECIN:
( X 1 X 2 ) ( m1 m2 )
~
~
( n1 1) D + ( n2 1) D
n1 + n2 2
n
i abatere medie ptratic , finite. Atunci X = 1 X k are,
n k =1
pentru n o repartiie normal N m, .
n
n
x
X * : 1
n1
X2
1
x2
n2
Xj
1
xi
ni
Xn
1 , sau
xk
, cu
nk
n
i =1
= 1.
DEFINIIE:
2) D( ) 0
*
x
EXEMPLU: Fie repartiia Poisson X : x , x 0
e
x!
1 n
1 n
1
D ( X ) = D X j = 2 D ( X j ) = 2 n = 0
n
n n
n j =1
n j =1
Deci media de selecie X este un estimator absolut corect
al parametrului din repartiia Poisson.
n
( X = X j ) , rezult c nsi realizarea variabilei de selecie
j =1
constituie un eveniment care are un anumit grad de reprezentare a
variabilei teoretice, constituind astfel verosimilitatea de reflectare a
variabilei teoretice X de ctre variabila de selecie X * .
Aceast verosimilitate este msurat de probabilitatea :
n
n
L( X 1 , X 2 ,..., X n ; ) = f ( X j ; )
, numit funcia de
j =1
verosimilitate a seleciei.
Vom determina (estima) parametrul punnd condiia ca
verosimilitatea s fie maxim. Punem deci condiia
n
L( X 1 ,..., X n; )
= 0 sau
f ( X j ; )
j =1
= 0.
j =1
n ln f ( X ; )
j
Ecuaia
= 0 se numete ecuaia de
j =1
verosimilitate maxim.
DEFINIIE: Orice soluie a ecuaiei de verosimilitate
maxim se numete estimator de maxim verosimilitate .
OBSERVAIE: n general, un estimator de maxim
verosimilitate este i un estimator consistent. Adic
lim P ( * < ) = 1 .
n
EXEMPLU:
x!
x .
f ( x; ) = e
x!
Funcia de verosimilitate este :
X
n
n
j
Logaritmnd,
L( X 1 ,..., X n ; ) = f ( X j ; ) = e
( X j )!
j =1
j =1
obinem: ln L( X 1 ,..., X n ; ) = { + X j ln ln[( X j )!]}.
n
j =1
lnL n
1
= 1+ X j = 0
j=1
sau
n +
1n
X j = 0 * = j=1n * = X .
j=1
1
f ( x ; m, ) =
e 2
2
, > 0 , xR, mR .
L( X 1 , , X n ; m, ) = f ( X i ; m, ) =
i =1
1
n
2
1
2 2
( X i m )2
i =1
n ( 2 )
1 n
n
ln L( X 1 , , X n ; m, ) = n ln ln(2 )
( X i m) 2
2
2
2 i =1
ln L( X 1 ,..., X n ; m, )
1 2 n
= 2 ( X i m)( 1) = 0
m
2 i =1
ln L( X 1 ,..., X n ; m, )
n
1 n
= + 3 ( X i m) 2 = 0
i =1
m* = X
1 n
n
X
X
m
=
m
=
(
)
0
i
n i =1
n
i=1
( Xi m)2
n
1 ( X m)2 = n 2 = 1 ( X m) 2 *
i=1
i
i
2
=
n i =1
i=1
n
f ( x)
xR,
1 x m
1
f ( x; m , ) =
e 2
2
mR,
>0,
Alegem statistica: U ( X 1 , , X n ; m ) = X m n
(1)
g (u ) =
1 2 2
e
2
(2).
u2
u1
u2
2
du = 1
u
u
u
u
(4)
P 1 < X m < 2 X = P X 2 < m < X 1 = 1
n
n
n
(5)
X 2 ,X 1
n
n
cu probabilitatea 1 .
min l = n (u2 u1 )
u
2 g (u )du = 1
u1
Utilizm metoda multiplicatorilor lui Lagrange:
u
Fie L(u1 , u2 ; ) = (u2 u1 ) + [ 2 g (u )du (1 )]
u1
n
L
u = n g (u1 ) = 0
1
g ( u1 ) = g (u 2 ) , care are soluiile
=
+ g (u2 ) = 0
u2
n
u1 = u 2 care nu convine i soluia u1 = u 2
Notm
1
2
u2
z = u2 = u1 .
Atunci
du = 1 F ( z) F (z) = 1 ,
ecuaia
dar
(4)
devine
F ( z) = F ( z) ,
deci 2F( z) 1 = 1 F ( z) = 1 z = F 1 1 .
2
2
u1 = z = z
1
2
2
Dar z = z
1
2
2
u2 = z1
2
X z
<m< X +z
1
1
n
n
2
2
(ii)
S
S
X t
<m< X +t
1 ;n 1
1 ;n 1
n
n
2
2
1
1 n
1
M ( mr* ) = M X rj = M ( X rj ) = n m r = mr
n
n
n j =1
1 n
1 n
m mr2
1
D(mr* ) = D X rj = 2 D( X rj ) = 2 n (m2r mr2 ) = 2r
0
n
n
n
n j=1 n j=1
( + 1)
1 x
X j
n
n j=1
1
*
*
M ( X ) = m =
X j
1
n i=1
OBSERVAIE: Ne putem pune ntrebarea ce moment
empiric este cel mai potrivit pentru estimarea momentului teoretic?
Din exemplul anterior rezult:
1 n
m2 = ( + 1) ( + 1) = X j
n j =1
1 n
m3 = ( + 1)( + 2) ( + 1)( + 2) = X 3j
n j =1
Se observ chiar c valorile lui astfel determinate nu
satisfac (n general) i ecuaiile anterioare, deci metoda se complic.
n aceste situaii este indicat aplicarea metodei intervalelor de
ncredere.
Verificarea ipotezei cu privire la legea de repartiie a
unei variabile aleatoare
ni*
*
= f ( x; a1 ,..., a k ) , de unde ni = ni f ( x; a1 ,..., a k ) , i = 1,..., n .
ni
Testul de concordan 2 :
2
k
Studiind funcia 2 = ( ni n ' i ) , K.Pearson a artat c,
n'i
i =1
n cazul unui sondaj cu revenire n populaia studiat, cnd
probabilitile pi nu sunt apropiate de 0 sau 1, iar produsele
n' i = ni pi , unde pi = f ( xi ) , dup estimarea parametrilor, nu sunt
prea mici (practic nu sunt mai mici dect 5), funcia considerat are
repartiia 2 cu ( s 1) k grade de libertate, s fiind numrul de
valori observate, iar k numrul parametrilor estimai.
OBSERVAII:
Dac legea presupus este legea Poisson, ea are un singur
parametru, deci k = 1 , iar numrul gradelor de libertate va fi
( s 1) 1 = s 2 ; dac legea presupus este legea normal, atunci
k = 2 i avem ( s 1) 2 = s 3 grade de libertate.
Dup cum am precizat mai sus, legea 2 condiia ca
n' i = ni pi s nu fie numere mai mici dect 5. n cazul n care exist
astfel de numere, se vor cumula la prima frecven ni mai mare ca
5. Aceasta face ca numrul s s fie modificat corespunztor noii
situaii, devenind ~
s , iar numrul gradelor de libertate devenind
(~
s 1) k . Dac ntre repartiia de selecie i repartiia teoretic
2 definit n relaia
2 =
i =1
determinat
dac 2 (2s 1) k ;
respingem.
b)
unde > 0
i
lim P d n <
= K ( ) = ( 1) k e 2 k 2 ,
n
n
k =
d n = max Fn ( x ) F ( x ) .
Funcia K ( ) este calculat n tabele pentru diverse valori
ale lui (tabelul distribuiei Kolmogorov) .
Cu ajutorul acestei teoreme se poate da un criteriu de
verificare a ipotezei H 0 c repartiia empiric urmeaz o anumit
lege de repartiie.
Dac ipoteza H 0 este adevrat, atunci diferenele
Fn ( x ) F ( x ) nu vor depi o anumit valoare d ;n pe care o fixm
P d n > = 1 P d n = 1 K ( ) = .
n
n
. Deci:
n
EXEMPLU:
Pentru a organiza mai bine serviciul n perioada de vrf, la
un sector al unui magazin se cerceteaz sosirile cumprtorilor la
raionul respectiv, ct i timpul de servire al unei persoane. Astfel,
considernd intervalele de timp de 5 minute, luate la ntmplare n
perioada de vrf, se numr de fiecare dat cte persoane sosesc la
raionul urmrit. Au fost cercetate 200 perioade de cte 5 minute,
obinndu-se rezultatele din tabelul T1 , n care am notat cu x
numrul care arat n cte perioade din cele 200 cercetate am
observat exact x sosiri. S-a msurat, pe de alt parte, timpul de
servire a 30 cumprtori, luai la ntmplare, n perioada de vrf,
obinndu-se datele din tabelul T2 , unde am notat cu y timpul de
servire al unui cumprtor i cu n y numrul de cumprtori, pentru
care timpul de servire este y. Deoarece variabila aleatoare y este
continu, crecetarea a fost fcut pe intervale de cte 30 secunde
(0,5 minute), pe care le vom reduce n calcule la jumtile lor.
a) S se testeze ipoteza H 0 c sosirile cumprtorilor la
raionul considerat sunt de tip Poisson.
b) S se testeze ipoteza H 0 c timpul de servire a unui
cumprtor are o distribuie exponenial.
Tabelul T1 :
NR. SOSIRI N
5 MIN. (X)
0
1
2
3
4
5
6
7
8
9
10
11
12
Total
FRECVENE
ABSOLUTE ( n x )
1
16
31
37
41
30
23
13
6
1
0
1
0
200
Tabelul T2 :
INTERVAL DE
TIMP ( yi 1 ; yi )
FRECVENE
ABSOLUTE ( n y )
0,5-1
1-1,5
1,5-2
2-2,5
2,5-3
Total
18
8
2
1
1
30
Tabelul T3 :
nx
x nx
n' x
n x n' x
(n x n'x )2
n'x
1
0
1
2
3
4
5
6
7
8
9
10
11
12
Total
2
1
16
31
37
41
30
23
13
6
1
0
1
0
200
3
0
32
62
111
164
150
138
91
48
9
0
11
0
800
4
3,7
14,7
29,3
39
39,1
31,4
20,8
11,9
6,0
2,6
1,0
0,4
0,1
200
5
-1,4
6
0,11
1,7
-2
1,9
1,4
2,2
1,1
0,10
0,11
0,99
0,06
0,29
0,10
-2,1
0,44
2 = 2 ,14
Tabelul T4 :
[ yi 1 yi )
yi
ni
y i ni
Fn ( y )
F ( y)
Fn ( y ) F ( y )
0,5-1
1-1,5
1,5-2
2-2,5
2,5-3
Total
0,75
1,25
1,75
2,25
2,75
18
8
2
1
1
30
13,50
10,00
3,50
2,25
2,75
30,00
0,66
0,87
0,93
0,97
1,00
0,60
0,75
0,84
0,87
0,94
0,00
0,12
0,09
0,10
0,06