Sunteți pe pagina 1din 3

II ELEMENTE DE STATISTIC MATEMATIC

5 Statistic descriptiv i repartiii de eantionare


Clasificarea ramurilor i datelor statisticii matematice
Statistica matematic ansamblu de principii i metode matematice privind extragerea informaiei utile
din anumite mulimi de date (numerice), relative la o populaie. Se studiaz populaia sau eantioane din ea.
Statistica descriptiv: metodele de organizare, totalizare i prezentare a datelor ntr-o form inteligibil.
inferenial: metodele de obinere a caracteristicilor unei populaii, din examinarea eantioanelor.
Variabil statistic mrime asociat unei caracteristici, caracterizat prin anumite date nregistrate.
Datele informaii care rezult din experimente sau observaii asupra populaiei sau eantionului.
Date cantitative se refer la variabile msurabile; numere pentru care au sens operaiile matematice
principale i ntre care se pot defini relaii de ordine i distane.
Datele calitative pt. variabile categoriale mprirea n diferite categorii, bazat pe caliti;
denumiri sau numere (fr ordine sau distane, doar cu proporii i procentaje).
Date ordinale bazate pe criterii mixte (calitative i/sau cantitative); eventual numere ordonate, fr dist.
Repartiii de frecvene
N, n volumul populaiei/eantionului ( n N ). X variabil aleatoare ataat unei caracteristici.
VX = {xi }i =1,...,n , x = ( xi )i =1,...,n valorile de observaie ale lui X ( x1 ... xi ...xn ; n x ordine cresctoare).

Fxi , f xi frecvena absolut/relativ a lui xi : Fxi = card{k | xk = xi ; k = 1,..., n} , f xi = Fxi / n


Grupe intervale I j = [ j , j ) , VX U k =1 I k , I k I k ' = , k k ' ; {I j } j =1,...,m acoperire disjunct pt. VX
m

xmax xmin
lrgimea interv.
m
m
Fj = card{i | xi I j ; i = 1,..., n} frecvenele absolute ale grupelor ( j = 1,..., m) j =1 Fj = n

j = ( j + j ) / 2 valoarea reprezentativ pt. I j ( j j ) = h, j h =

fj =

Fj
n

frecvena relativ ale grupei j ( j = 1,..., m)

f = 1; d j =
j =1 j

j
h

densitatea frecvenei

j
(i , Fj ) j =1,...,m , (i , f j ) j =1,...,m repartiiile frecvenelor absolute/relative grupate ale caracteristicii X.

ni = card{k | xk xi ; k = 1,..., n} frecvena abs. cumulat pt. xi


n
{F ( ) ( xi ) = ni / n}i =1,..., n funcia empiric de repartiie (repartiia frecvenelor relative cumulate).

(( I j , Fj )) , (( j , Fj )) histograma/poligonul frecvenelor grupate;


Ex. 1 X= {3, 2, 8, 8, 4, 9, 4, 8, 2} un ansamblu de N =9 date
xmin = 2, xmax = 9 I = (0, 9] interval acoperitor; m = 3 nr.
de grupe egale h = (9 0) / 3 = 3 lrgime I1 = (0,3] ,

I 2 = (3, 6] ,
= (3, 2, 4) ,

I 3 = (6,9] ,

( j ) j =1,...,3 = (1.5, 4.5, 7.5) ,

( f j ) j =1,...,3 = (3/ 9, 2 / 9, 4 / 9) ,

( Fj ) j =1,...,3 = ,

( F ( j )) j =1,...,7 =
(n)
j

Frecventa

(( j , F ( n ) ( xi ))) ogiv (poligon-bolt).

120%

100%
80%

60%
2

40%

20%

0%
0

Grupa

= (3 / 9,5 / 9,1)
Obs. 1 Repartiia frecvenelor relative (i , f j ) j =1,...,m repartiia de probabilitate ( xi , pi )i =1,...,n .
Repartiia frecvenelor relative cumulate F ( n ) ( xi ) funcie de repartiie (teoretic) F ( x) .
a.s

T4.1 (Glivenko) F ( x) , F ( ) ( x) funcia teoretic/empiric de repartiie pt. X V F ( n ) ( x) F ( x) .


n

Valori tipice empirice ale caracteristicilor populaiei


1 N
1 N
X = M ( X ) = xi media; m = M ( X m ) = xim momentele iniiale de ordin m.( 1 = X ).
N i =1
N i =1
N
N
N
1
1
1
X2 = D( X ) = ( xi X )2 = xi2 ( xi )2 = X 2 X2 dispersia, X abaterea standard;
N i =1
N i =1
N i =1

m = M (( X X )m ) =

1
N

(x
i =1

) m momentele centrate de ordin m ( 2 = 2 ).

1
1 N xi
x

coeficientul
de
asimetrie,

1 = i
=

3 coeficientul de exces.
N i =1
N i =1
x (i ) = inf VX , x ( s ) = sup VX rX = x ( s ) x (i ) amplitudunea (range) sau mprtierea (spread).
N

X , Y caracteristici; x = ( xi )i =1,..., N , X pt. X ; y = ( y j ) j =1,..., M , Y pt. Y . Corelaia, coef. de corelaie:


N

K XY =

1
NM

(( x
i =1 j =1

)( y j Y )) , XY =

K XY
=
D( X ) D(Y )

(( x
i =1 j =1

)( y j Y ))

i =1

j =1

( xi X )2 ( y j Y )2

Ex. 2 X din ex. 1 = 48 / 9 = 5.33 , = 322 / 9 (48 / 9) = 7.33 , = 2.7 .


2

Eantionare i estimare statistic


Repartiii de eantionare
X V (, K , P ) ; mul. elementelor populaiei, K corp borelian de pri ale lui , iar P probab.
finit K = P () . Sel. cu nlocuire P ( | ) = 1/ N (echiprobabilitatea selectrii din ).

X i V (i , K i , Pi ) v.a. a caracteristicii, pt. experimentul i, PX i PX ( i = 1,..., n ). De obicei, X N ( , 2 ) .


X = ( X i )i =1,...,n V n (( n ) , K ( n ) , P ( n ) ) eantion (sample) sau selecie, X : VX [0,1] ( VX R n )

VX spaiul eantionrii (sampling space); ( xi )i =1,...,n VX realizare a lui X. PX repart. de eantionare


n

Eant. cu nlocuire { X i }i =1,...,n ( SK ) (indep.), X i X ( i = 1,..., n ) PX = PX i = PXn (repart. comun)


i =1

Z = ( Z j ) j =1,..., s caracteristic s-dim.; X = ( Xi )i =1,...,n vectorul eantion, Xi = ( X ij ) j =1,..., s Z ( i = 1,..., n )


Clasificare eantioane (dup gruparea/aranjarea elementelor populaiei, nainte de extragerea eantionului):
a) simple (fr nici o grupare sau aranjare), b) stratificate (cu populaia mprit n straturi), c) grupate (cu
populaia mprit n grupuri mari i subgrupuri), d) sistematice (cu populaia aranjat ntr-o anumit ordine).
Statistici de eantionare i estimatori
T ( X) :V n R statistic (de eantionare) (sampling statistics) pe X: T ( X) integrabil pe R n
y = T (x) valoare de eantionare (o realizare a v.a. Y = T ( X) , pt. x R n realizare a lui X ).

Statistici pentru evaluare val. tipice ( , 2 , p ) ale car. populaiilor. T ( X) depinde de metoda de eantionare.
PT ( X ) repartiia de eantionare pt. T ( X) (repartiia tuturor valorilor pe care le poate lua statistica, cnd
ea este calculat din eantioanele de aceeai mrime n, extrase din populaia respectiv) depinde de PX .
a val. adevrat a caract., evaluat prin T ( X) ; a rezultatul evalurii: T ( X) = a .
P

T ( X) consistent: n T ( X) a . = M (T ( X)) a deplasarea (bias) lui T ( X)


T ( X) nedeplasat: M (T ( X)) = a . T ( X) absolut corect: M (T ( X)) = a , lim( D (T ( X))) = 0 .
n

1
T ( X ) corect: M (T ( X)) = a + 0 , lim( D (T ( X)) = 0 ( 0( f ( n)) (n) , lim( ( n)) = 0 )
n
n n
[ n M (T ( X)) a (o statistic absolut corect este corect, dar nu i invers).
X (1 ,..., m ) repartiie specificat: tip cunoscut, dar valorile unor parametri j necun. ( 1 j m )

X (1 ,..., m ) repartiie complet specificat: toate valorile parametrilor sunt cunoscute.

* (X) estimator pt. : X eantion, * (X) statistic consistent, dependent de 1,..., m parametri.
% = * (x) estimaie prin x = ( xi )i =1,...,n ). Estimarea calcularea unei valori particulare a estimatorului.
Estimri: punctuale (rezultat o valoare % ) sau prin intervale de ncredere (i , s ) , % (i , s ) .

Estimatori punctuali i valori tipice de eantionare (de selecie), pt. eantioane simple
1 n
1 n
X = M ( X) = X i , = xi media de eantionare i o realizare a ei.
n i =1
n i =1
1 n
1 n
1 n
2
M ( X ) = M X i = M ( X i ) = M ( X ) = ; D( X ) = D X i =
X nedeplas., abs. cor.
n i =1 n i =1
n i =1 n
F

X V , = M ( X ) , 2 = D( X ) , curs 4 (C3.4, T. lim. centr.) X N ( , 2 / n) ; X N pt. n 30 .


1 n
1 n
X m = M m ( X) = X im , m = xim momentul iniial de eantionare de ordin m i o realizare a lui.
n i =1
n i =1
Curs 4 (T3.16 limit central) X m N ( m , ( 2 m m2 ) / n ) ; X m N pt. n 30 .
F

1 n
1 n
m
(
)
,
X

=
i
( xi )m mom. centrat de e. de ordin m i o realizare a lui
m
n i =1
n i =1
D( X) = Y2 , 2 = 2 dispersia de eantionare i o realizare a ei m , D ( X) corecte (nu absolut cor.)

Ym = M m ( X X ) =

2
1 n 2 1 n
n 1 2
M (Y2 ) = M X i X i =
D ( X) deplasat.
n i =1

n
n
=
1
i

n
n
S2 =
Y2 , s 2 =
2 dispersia corectat de eantionare i realizarea ei; S 2 nedeplas., abs. cor.
n 1
n 1
Ex. 3 X din ex. 1, dar eant. = = 5.33 ; s 2 = (9 / 8)*7.33 = 8.25 = (1/ 8)*(322 (48 / 9)2 ) , s = 2.87 .

X N (0, 2 ) , curs 4, C3.3 X , Y2 independente nY2 H (n 1, 2 ) hi-ptrat.


X N ( , 2 ) (n 1)S 2 / 2 (n 1)
p, x = 1,
X V , PX ( x; p ) =
repartiia succesului ( x = 0 ) de prob. p ntr-un exper.; x = 0 insucces
1 p, x = 0,

K = i =1 X i repartiia nr. de succese k n , de probab. p, n n experimente indep. K B ( n, p )


n

K 1 n
k 1 n
P ( X) = = i =1 X i , p (x) = = i =1 xi proporia succeselor (media lui X) i o realizare a ei
n n
n n
P ( X) nedeplasat, absolut corect pentru p. q = 1 p proporie insuccese, i = nq nr. insuccese
Z = ( Z j ) j =1,..., s caracteristic s-dim., X = ( Xi )i =1,...,n vectorul eantion, Xi = ( X ij ) j =1,..., s Z ( i = 1,..., n )

xi = ( xij ) j =1,..., s realiz. a lui Xi ( i = 1,..., n ). Eantioane simple cu nlocuire {Xi }i =1,...,n ( SK ) (indep.)
Z vectorul mediilor, r1 ...rs momentul iniial, r1 ...rs momentul centrat, de ordin r = (ri )i =1,K, s

K = ( Kij ) j ,k =1,K,n matricea de corelaie, R X = ( X i X j )i , j =1,K,n matricea coeficienilor de corelaie pt. Z

1 n

1 n

vectorul mediilor de eantionare


, = ( j ) j =1,..., s = xij
X = ( X j ) j =1,..., s = X ij
n i =1
j =1,..., s
n i =1 j =1,..., s
1
M ( X j ) = j , D( X j ) = M ( X 2j ), j = 1,..., s X absolut corect
n
s
n
1
1 n s
X r1 ...rs = X ij , r1 ...rs = xij momentul de eantionare iniial de ordin r i realizarea lui
n i =1 j =1
n i =1 j =1

Yr1 ...rs

1 n s
1 n s
rj
r
= ( X ij X j ) , r1 ...rs = ( xij j ) j momentul de eantionare centrat de ordin r
n i =1 j =1
n i =1 j =1

X r1 ...rs absolut corect, Yr1 ...rs doar corect. Matricea de corelaie de eantionare i o realizare a ei:

1 n

1 n

, = ( jk ) j , k =1,..., s = ( x ji j )( xik k )
.
K = ( K jk ) j , k =1,..., s = ( X ji X j )( X ik X k )
n i =1
j ,k =1,..., s
n i =1
j , k =1,..., s

Z N s (, K ) { X j } j =1,..., s , {K jk } j ,k =1,..., s ( SK ) , X N s (, K / n) , K W (n, s, K 1 / n) Wishart n 2 -dim.

S-ar putea să vă placă și