Sunteți pe pagina 1din 4

1.4.

ESTIMAREA PARAMETRILOR I CRITERII DE VERIFICARE STATISTIC


Autor: Daniela FLOREA
Estimarea parametrilor datelor experimentale const n evaluarea valorilor
variabilelor experimentale pentru a verifica concordana dintre modelul repartiiei
teoretice i modelul repartiiei datelor experimentale.
Estimarea se poate face n dou moduri:
Estimarea punctual, cnd pentru parametru estimat se calculeaz o singur
valoare;
Estimarea prin intervale de ncredere cnd, pentru fiecare parametru, se
calculeaz un interval de ncredere.
O variabil aleatoare se consider determinat dac este cunoscut mulimea
valorilor x ale argumentului i funcia de probabilitate sau densitatea de
probabilitate f
) (x p
i
X
(x), dup cum variabila este discret sau continu. Funcia sau
f
) (x p
i
X
(x) se poate realiza n diverse moduri:
- Cu ajutorul teoriei probabilitilor se stabilete schema probabilistic n care se
ncadreaz caracteristica studiat i prin raionament se determin expresia
analitic a funciei sau f ) (x p
i
X
(x). Acestea sunt repartiiile teoretice, de exemplu
repartiiile: binomial, Poisson, geometric, exponenial, normal etc.
- Se nregistreaz sub form de frecvene, valorile caracteristicii studiate pentru
fiecare valoare a argumentului, cnd variabila este discret, sau pe intervale
convenabile, cnd variaia este continu, obinndu-se tabele numerice. Astfel de
repartiii se obin n probleme concrete prin experiene i, de aceea, se numesc
empirice.
ncadrarea unei repartiii empirice ntr-o schem probabilistic cu o anumit
repartiie teoretic corespunde descoperirii unei legiti de desfurare a caracteristicii
studiate. Dac se cunoate modelul matematic al legii respective, pot fi rezolvate
variantele problemelor puse de practic.
Fie, cunoscut, variabila aleatoare X cu repartiia empiric, dat prin frecvenele
absolute:

=
=

n
1 i
i
n 2 1
n 2 1
; N N cu ;
N ..., , N , N
x ..., , x , x
X
sau prin frecvenele relative (probabilitile):

=
= =

n
1 i
i
i i
n 2 1
n 2 1
N
N
p si ; 1 p cu ;
p ..., , p , p
x ..., , x , x
X .
Se ataeaz variabila aleatoare X cu distribuia teoretic:

) (x f
x
X
X
.
Presupunnd c cele dou variabile aleatoare X i X sunt identice, se determin
funcia a repartiiei teoretice, astfel ca: ) (x f
X
n 2 1 i p x f
i X
,..., , , ) ( = = .
Funcia depinde de anumii parametri ) (x f
X
m 2 1 j a
j
,..., , , = , adic are forma:
) ,..., , ; (
m 2 1 X
a a a x f ,
astfel, sistemul se scrie:
n 2 1 i p a a a x f
i m 2 1 X
,..., , ; ) ,..., , , ( = = ,
i devine un sistem de n ecuaii cu m necunoscute, n care, practic, numrul
ecuaiilor este mult mai mare dect cel al necunoscutelor. Problema care se pune este
de a determina care este acea valoare a parametrului pentru care exist probabilitatea
maxim de realizare. Aceast problem de calcul aproximativ se numete estimarea
parametrilor.
Dup estimarea parametrilor repartiiei teoretice se dispune de dou variabile
aleatoare:
- variabila aleatoare cu repartiia empiric:

=
=

n
1 i
i
n 2 1
n 2 1
; N N cu ;
N ..., , N , N
x ..., , x , x
X
- variabila aleatoare cu repartiia teoretic:

=
=

n
1 i
i
n 2 1
n 2 1
; N N cu ;
N ..., , N , N
x ..., , x , x
X
construit cu frecvenele n 2 1 i N
i
,..., , , = ,
i i
p N N = .
Figura 1.5. Reprezentarea grafic a criteriului
2
.
Frecvenele absolute au semnificai: N
i
- numrul valorilor din clasa S
i
, N- numrul
total de valori, n - numrul claselor S
i
.
Practic cele dou repartiii se deosebesc una de alta. Problema care se pune este
de a stabili dac deosebirea dintre cele dou variabile este ntmpltoare,
semnificativ sau nu. Pentru a soluiona aceast problem, se utilizeaz mai multe
criterii de testare statistic. Dintre acestea, cel mai utilizat n teoria traficului rutier este
criteriul Hi-ptrat (
2
) care se poate aplica datelor grupate.
Pentru aplicarea acestui criteriu se determin valoarea lui
2
, dat de suma
abaterilor frecvenelor empirice fa de frecvenele teoretice la ptrat, raportate la
frecvenele teoretice, astfel:
( )
N
N
N
N
N N
n
1 i
i
2
i
n
1 i
i
2
i i 2


=

= =
.
Criteriul
2
are reprezentarea grafic din figura 5. care, aa cum se poate observa,
depinde de valoarea a gradelor de libertate.
Graficul este caracterizat de urmtoarele caracteristici:
Aria de sub curb este egal cu unitatea;
Valoarea de nceput este
2
=0.
Curba nu este simetric; cnd (deci numrul observaiilor) crete, curba devine
similar cu cea normal. Se face precizarea c numrul gradelor de libertate
1 l n = , unde n - este numrul intervalelor de grupare (numrul claselor S
i
), iar l -
numrul parametrilor repartiiei teoretice.
De exemplu, dac repartiia este binomial sau Poisson, distribuii care au un
singur parametru, atunci l = 1 i 2 n 1 1 n = = grade de libertate. Dac ns
legea este normal, care are doi parametri, atunci l = 2 i 3 n 1 2 n = = grade
de libertate. Deci, numrul gradelor de libertate este o noiune statistic strns legat
de cantitatea de informaie de care se dispune n cercetarea care se efectueaz.


Figura 1.6. Variaia lui
2
pentru = 0,05 i = 0,95.
Este recomandabil ca atunci cnd se aplic testul
2
,

s fie N50, N
i
5 i 10 n
20. Cnd au mai puin de cinci elemente clasele extreme se contopesc cu cele
alturate i numrul scade corespunztor ( 3 n = ). Dac numai o clas se
contopete cu cea alturat atunci 2 n = . n situaia cnd toate clasele au mai mult
de cinci elemente atunci 1 n = .
Eficiena testului crete cnd n fiecare clas se afl aproximativ acelai numr de
date. Testul are o mai mare putere de discriminare n cazul repartiiilor simetrice i d
rezultate bune n cazul verificrii parametrilor repartiiilor empirice normale.
Tabelul 1.7 prezint valorile
2
pentru un anumit prag de siguran, sau interval
de ncredere, = 1 , intervalul care acoper cu o probabilitate dat valoarea unui
parametru ce trebuie estimat.
Probabilitatea cunoscut se mai numete coeficient sau nivel de ncredere, iar
se numete nivel de semnificaie i reprezint probabilitatea ca parametrul
teoretic ce trebuie estimat s se afle n afara intervalului de ncredere.
= 1
Cu ct P este mai aproape de valoarea 1, cu att este mai mare sigurana c
parametrul ce trebuie estimat este acoperit cu intervalul de ncredere.
Aplicarea criteriului
2
pentru un anumit prag de siguran , se reduce a verifica
dac:
= < 1 P
2
0
2
) ( ,
unde , este valoarea care se adopt din tabelul 1.7 pentru numrul gradelor de
libertate
2
0

3 n = , unde n este numrul de componente ale variabilelor aleatoare sau


numrul intervalelor de grupare a datelor observate.
Dac , se consider c ntre repartiia empiric i cea teoretic exist
concordan cu coeficientul de ncredere
2
0
2
<
=1 . Figura 1.6 prezint variaia lui
2
n
funcie de pentru = 0,05 i = 0,95.
Figura este divizat n 3 arii notate I, II, III.
Valorile cuprinse n aria I indic o concordan excepional a datelor, nct ne
putem ndoi de faptul c ele sunt aleatoare. Aria III include valori ale lui
2
, care
corespund discrepanelor ntre valorile teoretice i cele experimentale. Cnd valorile
lui
2
, cad n aceast arie se constat o nepotrivire ntre experiment i teorie.
Dac valoarea lui
2
este cuprins[ n domeniul II tinznd spre aria I, atunci exist
dovezi rezonabile c probele testului sunt compatibile. Valorile care tind spre regiunea
III indic concordana ndoielnic a datelor.

Tabelul 1.7: Valorile
2
pentru un anumit prag de siguran .

2
995 , 0

2
99 , 0

2
975 , 0

2
95 , 0

2
05 , 0

2
025 , 0

2
01 , 0

2
005 , 0


1
2
3
4
5

6
7
8
9
10

11
12
13
14
15

16
17
18
19
20

21
22
23
24
25

26
27
28
29
30


0,000
0,010
0,072
0,207
0,412

0,676
0,989
1,344
1,735
2,156

2,609
3,074
3,565
4,075
4,601

5,142
5,697
6,265
6,844
7,434

8,034
8,643
9,260
9,886
10,520

11,160
11,808
12,461
13,121
13,787

0,000
0,020
0,115
0,297
0,554

0,872
1,239
1,646
2,088
2,558

3,053
3,571
4,107
4,660
5,229

5,812
6,408
7,015
7,633
8,260

8,897
9,542
10,196
10,856
11,524

12,198
12,879
13,565
14,256
14,953

0,001
0,051
0,216
0,484
0,831

1,237
1,690
2,180
2,700
3,247

3,816
4,404
5,009
5,629
6,262

6,908
7,564
8,231
8,907
9,591

10,283
10,982
11,689
12,401
13,120

13,844
14,573
15,308
16,047
16,791

0,004
0,103
0,352
0,711
1,145

1,635
2,167
2,733
3,325
3,940

4,575
5,226
5,892
6,571
7,261

7,962
8,672
9,390
10,117
10,851

11,591
12,338
13,091
13,848
14,611

15,379
16,151
16,928
17,708
18,493

3,841
5,991
7,815
9,488
11,070

12,592
14,067
15,507
16,919
18,307

19,675
21,026
22,362
23,685
24,996

26,296
27,587
28,869
30,144
31,410

32,671
33,924
35,172
36,415
37,652

38,885
40,113
41,337
42,557
43,773

5,024
7,378
9,348
11,143
12,832

14,449
16,013
17,535
19,023
20,483

21,920
23,337
24,736
26,119
27,488

28,845
30,191
31,526
32,852
34,170

35,479
36,781
38,076
39,364
40,646

41,923
43,194
44,461
45,722
46,979

6,635
9,210
11,345
13,277
15,086

16,812
18,475
20,090
21,666
23,209

24,725
26,217
27,688
29,141
30,578

32,000
33,409
34,805
36,191
37,566

38,932
40,289
41,638
42,980
44,314

45,642
46,963
48,278
49,588
50,892

7,879
10,597
12,838
14,860
16,750

18,548
20,278
21,955
23,589
25,188

26,757
28,300
29,819
31,319
32,801

34,267
35,718
37,156
38,582
39,997

41,401
42,796
44,181
45,558
46,928

48,290
49,645
50,993
52,336
53,672

1
2
3
4
5

6
7
8
9
10

11
12
13
14
15

16
17
18
19
20

21
22
23
24
25

26
27
28
29
30