Documente Academic
Documente Profesional
Documente Cultură
=
=
n
1 i
i
n 2 1
n 2 1
; N N cu ;
N ..., , N , N
x ..., , x , x
X
sau prin frecvenele relative (probabilitile):
=
= =
n
1 i
i
i i
n 2 1
n 2 1
N
N
p si ; 1 p cu ;
p ..., , p , p
x ..., , x , x
X .
Se ataeaz variabila aleatoare X cu distribuia teoretic:
) (x f
x
X
X
.
Presupunnd c cele dou variabile aleatoare X i X sunt identice, se determin
funcia a repartiiei teoretice, astfel ca: ) (x f
X
n 2 1 i p x f
i X
,..., , , ) ( = = .
Funcia depinde de anumii parametri ) (x f
X
m 2 1 j a
j
,..., , , = , adic are forma:
) ,..., , ; (
m 2 1 X
a a a x f ,
astfel, sistemul se scrie:
n 2 1 i p a a a x f
i m 2 1 X
,..., , ; ) ,..., , , ( = = ,
i devine un sistem de n ecuaii cu m necunoscute, n care, practic, numrul
ecuaiilor este mult mai mare dect cel al necunoscutelor. Problema care se pune este
de a determina care este acea valoare a parametrului pentru care exist probabilitatea
maxim de realizare. Aceast problem de calcul aproximativ se numete estimarea
parametrilor.
Dup estimarea parametrilor repartiiei teoretice se dispune de dou variabile
aleatoare:
- variabila aleatoare cu repartiia empiric:
=
=
n
1 i
i
n 2 1
n 2 1
; N N cu ;
N ..., , N , N
x ..., , x , x
X
- variabila aleatoare cu repartiia teoretic:
=
=
n
1 i
i
n 2 1
n 2 1
; N N cu ;
N ..., , N , N
x ..., , x , x
X
construit cu frecvenele n 2 1 i N
i
,..., , , = ,
i i
p N N = .
Figura 1.5. Reprezentarea grafic a criteriului
2
.
Frecvenele absolute au semnificai: N
i
- numrul valorilor din clasa S
i
, N- numrul
total de valori, n - numrul claselor S
i
.
Practic cele dou repartiii se deosebesc una de alta. Problema care se pune este
de a stabili dac deosebirea dintre cele dou variabile este ntmpltoare,
semnificativ sau nu. Pentru a soluiona aceast problem, se utilizeaz mai multe
criterii de testare statistic. Dintre acestea, cel mai utilizat n teoria traficului rutier este
criteriul Hi-ptrat (
2
) care se poate aplica datelor grupate.
Pentru aplicarea acestui criteriu se determin valoarea lui
2
, dat de suma
abaterilor frecvenelor empirice fa de frecvenele teoretice la ptrat, raportate la
frecvenele teoretice, astfel:
( )
N
N
N
N
N N
n
1 i
i
2
i
n
1 i
i
2
i i 2
=
= =
.
Criteriul
2
are reprezentarea grafic din figura 5. care, aa cum se poate observa,
depinde de valoarea a gradelor de libertate.
Graficul este caracterizat de urmtoarele caracteristici:
Aria de sub curb este egal cu unitatea;
Valoarea de nceput este
2
=0.
Curba nu este simetric; cnd (deci numrul observaiilor) crete, curba devine
similar cu cea normal. Se face precizarea c numrul gradelor de libertate
1 l n = , unde n - este numrul intervalelor de grupare (numrul claselor S
i
), iar l -
numrul parametrilor repartiiei teoretice.
De exemplu, dac repartiia este binomial sau Poisson, distribuii care au un
singur parametru, atunci l = 1 i 2 n 1 1 n = = grade de libertate. Dac ns
legea este normal, care are doi parametri, atunci l = 2 i 3 n 1 2 n = = grade
de libertate. Deci, numrul gradelor de libertate este o noiune statistic strns legat
de cantitatea de informaie de care se dispune n cercetarea care se efectueaz.
Figura 1.6. Variaia lui
2
pentru = 0,05 i = 0,95.
Este recomandabil ca atunci cnd se aplic testul
2
,
s fie N50, N
i
5 i 10 n
20. Cnd au mai puin de cinci elemente clasele extreme se contopesc cu cele
alturate i numrul scade corespunztor ( 3 n = ). Dac numai o clas se
contopete cu cea alturat atunci 2 n = . n situaia cnd toate clasele au mai mult
de cinci elemente atunci 1 n = .
Eficiena testului crete cnd n fiecare clas se afl aproximativ acelai numr de
date. Testul are o mai mare putere de discriminare n cazul repartiiilor simetrice i d
rezultate bune n cazul verificrii parametrilor repartiiilor empirice normale.
Tabelul 1.7 prezint valorile
2
pentru un anumit prag de siguran, sau interval
de ncredere, = 1 , intervalul care acoper cu o probabilitate dat valoarea unui
parametru ce trebuie estimat.
Probabilitatea cunoscut se mai numete coeficient sau nivel de ncredere, iar
se numete nivel de semnificaie i reprezint probabilitatea ca parametrul
teoretic ce trebuie estimat s se afle n afara intervalului de ncredere.
= 1
Cu ct P este mai aproape de valoarea 1, cu att este mai mare sigurana c
parametrul ce trebuie estimat este acoperit cu intervalul de ncredere.
Aplicarea criteriului
2
pentru un anumit prag de siguran , se reduce a verifica
dac:
= < 1 P
2
0
2
) ( ,
unde , este valoarea care se adopt din tabelul 1.7 pentru numrul gradelor de
libertate
2
0