Sunteți pe pagina 1din 42

CAPI TO LU L 9

Verificarea ipotezelor statistice.


Ipoteze parametrice. Teste de concordan
9.1 Ipotezele statistice i verificarea lor.
Variabila aleatoare X este complet determinat numai atunci cnd se cunosc
a) forma funciei de repartiie F i b) valorile parametrilor asociai acestei funcii.
Pentru cunoaterea acestor dou elemente de baz, se fac ipoteze, numite ipoteze statistice. O ipotez
statistic poate fi adevrat sau fals. De aceea ipoteza trebuie verificat. Verificarea se face pe baza unei
selecii x 1 , , x i , , x n de volum n asupra variabilei X . Valoarea lui n este la dispoziia utilizatorului.
Mulimea tuturor valorilor posibile ale lui X formeaz o populaie. Selecia se face din aceast populaie sau
se genereaz cu ajutorul calculatorului valori aleatoare (independente i identic repartizate) asupra lui X
9.1.1 Tipuri de risc ntlnite la verificarea ipotezelor statistice.
n general o ipotez statistic se noteaz cu H . Ipoteza este formulat de ctre utilizatorul seleciei.
Ipoteza poate fi adevrat sau poate fi fals, adic ntotdeauna exist riscul de a formula o ipotez greit.
Prezentm cteva definiii foarte utile la verificarea ipotezelor statistice.
Ipoteza care trebuie verificat se noteaz cu H 0 i se numete ipoteza nul.
Ipoteza alternativ lui H 0 se numete ipoteza contrar i se noteaz prin H 1 .
Se numete test statistic (the test of goodness of fit) orice procedeu de verificare a unei ipoteze.
Din cauza caracterului ntmpltor ale selciei x 1 , , x i , , x n , exist ntotdeauna riscul de a lua o
decizie greit, adic exist riscul s facem o eroare i s respingem ipoteza H 0 , dei n realitate ea este
adevrat, sau s acceptm ipoteza H 0 , dei ea este fals. Aceste riscuri sunt erori probabiliste legate de o
ipotez H i se noteaz prin
P ( Non H / H ) (eroare de genul nti; se respinge ipoteza H , cnd ea este adevrat);
P ( H / Non H ) (eroare de genul doi; se accept ipoteza H , cnd ea este fals).
Valoarea se numete prag sau nivel de semnificaie.
Valoarea 1 se numete nivel de ncredere.
Valoarea 1 de a nu face eroare de genul doi se numete puterea testului. Puterea este cu att mai
mare cu ct este mai mic. Cu o mare probabilitate 1 trebuie s acceptm ipoteza H , cnd ea este
adevrat.
n aplicaii numerice se recomand urmtoarele nivele de semnificaie : 0,001; 0,005; 0,025;0,05; 0,10;
0,20.
Probabilitile i trebuie s fie foarte mici, dar nu exist o regul general care s spun care
valoare s fie mai mic. Doar consideraiile practice pot genera o ierarhizare a mrimilor celor dou tipuri
de erori: se alege rul cel mai mic. De exemplu, a accepta un medicament toxic (eroare de genul doi) este mai
grav dect a respinge un medicament bun (eroare de genul nti) [19; pag 153].
Ipoteza nul H 0 poate fi de trei feluri
a) Ipoteza unilateral stng H 0 : 0 ; ipoteza contrar H1 : 0 ;
b) Ipoteza unilateral dreapt H 0 : 0 ; ipoteza contrar H1 : 0 ;
H 0 : 0 ; ipoteza contrar H 1 : 0 .
c) Ipoteza bilateral

9.1.2 Tipuri de teste ntlnite la verificarea ipotezelor statistice.


Dac ipoteza H 0 formulat este asupra valorii unui parametru R sau R d , atunci testul se
numete test parametric.
Dac ipoteza H 0 formulat este legat de forma funciei de repartiie, atunci testul se numete test de
concordan.
Cele mai des folosite teste de concordan sunt testul Hi ptrat (al lui Karl Pearson) i testul
Kolmogorov.
Prin aceste teste se verific dac exist concordan ntre datele numerice furnizate de experien i forma
legii teoretice propus (formulat) de utilizator. Cu alte cuvinte, funcia ipotetic F 0 ( x) din ipoteza H 0 se
compar cu funcia de repartiie F *n ( x ) a seleciei de date folosite.
Testele de verificare a ipotezelor statistice se aplic la variabile aleatoare discrete sau continue.
9.2 Descrierea algoritmic a testului Hi prtrat n cazul unidimensional.
Descrierea este valabil pentru X variabil aleatoare continu sau discret. Micile diferene specifice vor
fi menionate la locul potrivit.
9.2.1 Descrierea general a testului Hi ptrat, n cazul continuu i n cazul discret.
I. Notm cu R domeniul n care variabila aleatoare X ia valori. Pentru o problem concret acest
domeniu este dat sau este calculat.
II. Notm cu L un numr natural (ales de utilizator) aa nct domeniul are partiia
1 2 L , i j ; i [ ai 1 , ai ), i 1, L , unde punctele de diviziune pot fi echidistante,
cu norma i h, i 1, L constant, sau pot fi neechidistante, cu norma i h i variabil.
III. Se dau sau se calculeaz valorile (punctele) a0 , a1 , , a i , , a L 1 , a L ; a i R ale partiiei.

IV. Utilizatorul alege un numr natural N i selecia x1 , , x j , , x N . Cu ajutorul acestora determin


frecvenele absolute f1 , , f i , , f L ale valorilor x j care cad n intervalul i , i 1, L .
V.a. Cazul specificat, cu parametrii cunoscui. Pentru funcia de repartiie F (continu) propus prin
ipotrza H 0 se calculeaz probabilitile condiionate
pi P ( X i / H )
dF ( x) ; i 1, L (am notat i i ).
i
V.b. Cazul nespecificat, cu parametrii necunoscui. nti se estimeaz parametri necunoscui i
notm estimaiile prin * . Apoi, pentru variabil aleatoare continu se calculeaz probabilitile
condiionate
pi* P ( * , X i / H )
dF ( x, * ) ; i 1, L (am notat i i ).
i
n ambele cazuri trebuie pi 0 i

pi* 0, i 1, L .

VI.a. Cazul specificat. Pentru testul Hi ptrat se calculeaz statistica T i 1

f i N pi 2
N pi

. Statistica T

este o variabil aleatoare care depinde de datele de selecie. Se tie (H. Cramer, 1947; I. Vduva. 1970) c T
este variabil Hi ptrat L2 1 cu L 1 grade de libertate; L 1 1 .
VI.b. Cazul nespecificat. Pentru testul Hi ptrat se calculeaz statistica T
*

2
f i N pi*
L
i 1
N pi*

. Se tie c

este variabil Hi ptrat L2 d 1 cu L d 1 grade de libertate, unde L d 1 1 .


VII. Se alege de ctre rezolvitor pragul de semnificaie (riscul de tipul nti). Din tabelul lui 2 se
alege -cuantila corespunztoare, notat 2 ; L 1 sau 2 ; L d 1 .
T*

VIII.a. Cazul specificat. Pasul de decizie.


Dac

; L 1

(valoarea calculat este mai mic dect valoarea din tabel) atunci ipoteza nul

H 0 este acceptat, cu riscul

Dac

; L 1

(valoarea calculat este mai mare dect valoarea din tabel ) atunci ipoteza

nul H 0 este respins, cu riscul .


VIII.b. Cazul nespecificat. Pasul de decizie.
Dac T * 2 ; L 1 (valoarea calculat este mai mic dect valoarea din tabel) atunci ipoteza nul
H 0 este acceptat, cu riscul .
Dac

T*

; L d 1

(valoarea calculat este mai mare dect valoarea din tabel ) atunci ipoteza

nul H 0 este respins, cu riscul .


Observaia 1. n cazul continuu, alegerea convenabil a punctelor a i din diviziunea poate uura
calcularea probabilitior condiionate pi 0 i pi* 0, i 1, L .
9.2.2 Descrierea general a testului Hi ptrat, n cazul discret.
n aplicaii, cel mai des se ntlnete cazul variabilei aleatoare discrete X . De aceea facem o prezentare a
testului Hi ptrat n cazul discret.
Ipoteza H 0 . Selecia x k asupra variabilei aleatoare X are repartiia:
(urmeaz numele repartiiei).
H

S se verifice ipoteza
.
0 , cu pragul de semnificaie

xk

Pasul 0. Notm variabila aleatoare prin

X
f (x k ; )

, unde legea de probabilitate f ( x k ; ) are form

cunoscut. Eventual se scrie forma lui M ( X ) i D 2 ( X ) .


Valorile numerice x k i f k f ( x k ; ) sunt cunoscute din datele problemei n care se formuleaz ipoteza
H 0 . Valorile f k se numesc frecvene absolute. Notm N k f k suma tuturor frecvenelor absolute.

Dac valoarea parametrului este necunoscut, atunci la nceput se estimeaz cu ajutorul unei
metode de verosimilitate maxim i dispersie minim.
Exemplul 1. Datele de selecie x k au repartiie Poisson

k
X
f (k ; )

f k f ( k ; ) exp ( )

k
k!

; 0 ; k 0 ; sau k 0 ; n .

Se tie c M ( X ) ; D 2 ( X ) ; X

1
N

k xk

f k ; M (X ) X .

Exemplul 2. Datele de selecie x k au repartiie exponenial discretizat

xk

X
f (x k ;)

M (X )

; f ( x ; ) exp ( x) ; x 0 ; 0 ; f k f ( x k ; ) exp ( x k )

1
1
1
1
2
; D (X ) 2 ; ; M (X ) X ; X

X
N

k xk

fk .

Observaia 2. n cazul tabelelor de contingen (problema 3) nu exist parametru . Se formuleaz o


ipotez H 0 de alt tip dect cea definit printr-o lege de repartiie. Pentru verificarea iporezei H 0 se aplic
testul Hi ptrat, numit test neparametric.
Continum descrierea testului Hi ptrat, n cazul parametric sau cel neparametric.
Pasul 1. Pe baza ipotezei H 0 formulate se calculeaz
Varianta 1. frecvenele teoretice f *k ; f *k N f k sau
Varianta 2. probabilitile teoretice p *k ; p *k f ( x k ; ) .
Pasul 2. Se calculeaz i se ntocmete un tabel cu valorile
Varianta 1. k ;

fk

Varianta 1. k ;

fk

*
k

p *k

( f k f *k ) 2 ;

f k f *k

f k N p *k

( f k f *k ) 2

( f k N p *k ) 2 ;

f *k

( f k N p *k ) 2
N p *k

Pasul 3. Se calculeaz statistica T care corespunde datelor de selecie x k i ipotezei H 0 .


Varianta 1. T k
Varianta 2. T k

( f k f *k ) 2
f *k

(suma este extins asupra tuturor valorilor lui k ).

( f k N p *k ) 2
N p *k

(suma este extins asupra tuturor valorilor lui k ).

Variabila aleatoare T are repartiie Hi ptrat.


Pasul 4. Se determin numrul al gradelor de libetate pentru T , cu ajutorul formulei
s 1 , unde s = numrul de vaori de selecie x k . observaii pentru care f *k 5 , iar
= numrul de parametri estimai. .
Observaia 3. Practica celor care lucreaz n domeniul statisticii recomand ca n valoarea s s fie
cuprinse numai valorile x k pentru care f *k 5 .
n cazul tabelelor de contingen (problema 3) cu r linii i c coloane, numrul gradelor de libertate se
calculeaz cu formula ( r 1) (c 1) .
Pasul 5. Dup cunoaterea numrului al gradelor de libertate, statistica T se noteaz T 2 .

Pasul 6. n continuare se folosete pragul de semnificaie ales . Din tabela repartiiei Hi ptrat se ia
valoarea (cuantila) corespunztoare, notat 2 ; sau 2 ( ; ) .
Pasul 7. Pasul de decizie.
Dac

( ; ) (valoarea calculat este mai mic dect valoarea din tabel) atunci ipoteza

nul H 0 este acceptat, cu riscul


Dac

( ; )

(valoarea calculat este mai mare dect valoarea din tabel ) atunci ipoteza

nul H 0 este respins, cu riscul

9.2.3 Generarea variabilelor aleatoare normale i a vectorilor aleatori normali.


n aplicaii foarte des se verific dac un i de date au repartiie normal. Notm variabila normal prin
N ( m, 2 ) i vectorul normal prin N ( M , ) .
a) Variabil aleatoare de tip N (m, 2 ) . nti generm N numere aleatoare X de tip N (0,1) . Notaia
N este de sine stttoare, fr legtur cu semnificaia din seciunile anterioare. Pentru generare folosim, de
exemplu, procedura RJNORM ( NI , X ) , unde NI este un numr oarecare natural impar (odd) necesar la
iniializarea procedurii. Apoi construim N variabile X ' , X ' m X . Variabila X ' are tipul N (m, 2 ) ,
unde m i 2 sunt cunoscute.
b) Vector aleator de tip N ( M , ) . Vectorul M R n i matricea simetric pozitiv definit de tip
n n sunt date. Se activeaz de n ori procedura RJNORM ( NI , X ) i se obine vectorul Y R n , unde
fiecare component este de tip N (0,1) . Astfel, vectorul Y are tipul N ( , I ) , unde R n este vectorul nul,
iar I este matricea unitate. Apoi construim vectorul Y ' R n , de forma
Y ' M C Y ; C C T ; T este operaia de transpunere; C matrice de tipul n n .
Astfel, vectorul Y ' M C Y are repartiie normal multidimensional N ( M , ) , iar C este matrice
inferior triunghiular care se obine unic din matrice cunoscut. Dac notm C c i j i i j ,
atunci
ci1

i1

11

; 1 i n;
i 1

ci i i i k 1 ci2k

; 1 i n;

j 1

ci j

i j k 1 ci k c j k
cjj

, 1 i j n ;

ci i 0 , 1 i j n .

Procedura RJNORM se afl n seciunea RAVAGE din Mathlib Library. n locul lui RJNORM se poate folosi
procedura RNORM din Mathcad Library.
9.3 Testul Hi ptrat n cazul normal unidimensional
Pn acum funcia F a fost orice funcie de repartiie. n continuare F ( x) reprezint repartiia normal
N ( m, 2 ) , care are densitate de probabilitate
( x m) 2
1
f ( x)
exp
, x R ; dF ( x) f ( x)dx .
2 2
2

f ' ( x) 0 x0 m , M ( X ) m, D 2 ( X ) 2 .
n cazul specificat, parametrii m, 2 sunt cunoscui.
n cazul nespecificat, vectorul parametrilor ( m, 2 ) T

este necunoscut i trebuie estimat.

n general, deviaia standard msoar riscul de producere a unui fenomen nedorit [6].
9.3.1 Determinarea coordonatelor punctelor a i din partiia .
Partiia are L 1 puncte i L intervale. Punem a0 i a L . Deci, mai avem de determinat
punctele a1 , , a L 1 . Pentru calaritae uneori notm N 1 N1 .
n general N este un numr foarte mare. De aceea lum un numr natural N1 N din selecia
x1 , , x N 1 , x N 11 , , x N . Pentru unele calcule folosim numai primele N1 N valori din selecie.
a) Se calculeaz numerele A i B definite prin
A min xi B max xi
(1)
1 i N 1 ,
1 i N 1 , A B
BA
; i h ; i 2; L 1
L2
Toate intervalele i au aceeai lungime h .
c) Coordonatele punctelor a i au forma
a0 ; a1 A ; ai A (i 1) h , i=2, L-2

b) Calculm h

(2)

a L 1 B; a L .

9.3.2 Cazul nespecificat. Estimarea parametrilor i calcularea probabilitilor. .


Estimm parametrii m i 2 . Notm cu x *i mijlocul intervalului i .
a ai 1
xi* i
, i 2, L 1 i
x1* a1 h / 2 , x *L a L 1 h / 2 .
2
Estimaia lui m este
m*

*2

1 L *
xi f i
N i 1

m * ; estimaia lui

este * 2 . Folosim formulele


(3)

2
1 L *2
* 2 h
x
f

i i
N i 1
12

(4)

Calcularea probabilitilor pi i pi* .


n cazul specificat N (m, 2 ) calcularea probabilitilor se face cu formula
p1 , p 2 , , pi , , p L 1 , p L , unde
pi

( x m) 2
exp

dx , i=1, L.

2 ai 1
2 2

ai

(5)

n cazul nespecificat se folosesc aceleai formule ca mai sus, dar cu


2 .

m * n loc de

m i *2 n loc de

Folosirea formulei (5) nu este foarte simpl. De aceea nti cercetm cazul m 0 i 2 1 . Pentru
pi

N (0, ) formula (5) devine

1
2

ai

ai 1

x2
exp

dx ,

i=1, L

(6)

Pentru a calcula pi i pi* prin (5) folosim bibliotecile Mathcad sau Mathlib, unde gsim procesurile
(subprogramele) erf (z ) sau erf (z, val) , cu
erf ( z )

0 exp ( x

) dx, z R, z 0

(7)

Asemnarea dintre (6) i (7) genereaz idea de a transforma variabila X de tipul


X m
U de tipul N (0,1) , prin U
. Variabila U are tipul

N ( m, 2 )

n variabila

N (0,1) . Deci reducem formula (5) la (6) i

calculm (6) prin (7).


Propoziia 1. Formula (7) generaz formula:
1

erf
2

0 exp

x2
2

dx , z 0

Demonstraie. . n (7) punem x 2


2

erf ( z )

erf
2

(8)

u2
i obinem
2

u 2
exp
du

z
1
u du
exp

2
2 0

z 2

. (End).

Consecina 1. Intervalele [ai 1 , ai ) , i 1, L pentru variabila X de tipul N (m, 2 ) devin intervalele


[u i 1 , u i ) pentru variabila U de tipul N (0,1) prin translaia
a m
ui i
, i 0, L .
(9)

Analog pentru cazul nespecificat N (m* , *2 ) .


Discuie. Relativ la numerele reale A i B din formula (1) i poziia valorii medii m din funcia lui Gauss
exista trei posibiliti:
A m,
Bm

A m,
Bm

Am
B m.

n fiecare caz trebuie s calculm probabilitile


Notm C
p1
pL

p 1 , , pi ,, p L .

Am
Bm
, D
, C D . Atunci

1
1
sgn(C ) erf
2
2

1
1
sgn( D ) erf
2
2

(10)

2
D

(11)

unde sgn este funcia semn signum.


Consecina 2. Pentru ai i u i exist de asemanea trei posibiliti
ai 1 m, ai m; ai 1 m, ai m ;
u i 1 0, u i 0; u i 1 0, u i 0 ;
ai 1 m, ai m

u i 1 0, u i 0 .

Toate aceste posibiliti genereaz valorile


pi sgn(u i )

u i 1
ui
1
1
; i 2, L 1
sgn(u i 1 ) erf
erf

2
2
2
2

Consecina 3. p L 1 iL11 pi

(12)
(13)

n aplicaii, formulele (11) i (13) trebuie s dea acelai rezultat. Procedura (subrutina) erf poate fi
activate din Mathcad.
9.3.3 Algoritmul Hi ptrat pentru repartiia normal, n cazul specificat.
Algoritmul care urmeaz este numit algoritmul NS (normal specificat).
1 Utilizatorul alege domeniul i valorile numerice N , L 1, m, , N1 N . Se alege din tabela Hi ptrat
valoarea numeric (cuantila) 2 ; L 1 .
2 Se genereaz sau se dau valorile x 1, , x N .
3 Se calculeaz A, B, h cu formulale (1) i (2).
Observaie. n loc s se calculeze A i B prin (1), cu o bun aproximare se poate folosi regula celor 3
(din inegalitatea lui Cebev): A m 3 , B m 3 .
4 Se calculeaz coordonatele ai , i 0, L i se construiesc intervalele i , i 1, L .
5 Se determin sau se dau frecvenele absolute f i , i 1, L ale valorilor xi care cad n intervalul i . Dac
N 1 N , atunci f1 0, f L 0 .
6 Se calculeaz punctele u i , i 1, L 1 cu ajutorul formulei (9) i se adaug u 0 , u L .
7 Se activeaz programul erf i se calculeaz probabilitile p 1, p L prin (10) i (11).
8 Se activeaz programul erf i se calculeaz probabilitile pi , i 2, L 1 prin (12).
9 Opional. a) se verific dac

i 1 pi

1 sau valoarea este chiar 1.

b) se verific dac exist concordan ntre rezultatele de la (11) i (13).


L

10 Se calculeaz statistica T i 1

f i N pi 2
N pi

11 Pasul de decizie. Se compar valoarea T cu valoarea din tabela Hi ptrat


Dac T < 2 ; L 1 , atunci ipoteza H 0 se accept cu riscul .
Dac T > 2 ; L 1 , atunci ipoteza H 0 se respinge cu riscul .

; L 1 .

9.3.4 Algoritmul Hi ptrat pentru repartiia normal, n cazul nespecificat.


Algoritmul care urmeaz este numit algoritmul NNS (normal nespecificat).
1 Utilizatorul alege domeniul i valorile numerice N , L 1, m, , N1 N . Se alege din tabela Hi ptrat
valoarea numeric (cuantila) 2 ; L d 1 = 2 ; L 3 . Numrul gradelor de libertate este L 3 deoarece
avem de estimat 2 parametri.
2.- 5. Paii 2-5 sunt identici cu cei de la algoritmul NS.
Observaia 4. n loc s se calculeze A i B prin (1), cu o bun aproximare se poate folosi regula celor 3

(din inegalitatea lui Cebev): A m * 3 *, B m * 3 * .


xi* , i 1, N

6 Calculm valorile

7 Calculm punctele ui
8 Calculm

A m*

i estimm valorile

ai m *

*
D

, i 1, L 1

B m*

2 prin (3) i (4).

prin (9) i adugm u 0 , u L .

. Activm programul erf i calculm

i (11).
9 Activm programul erf i calculm probabilitile

p *i , i 2, L 1

p 1*, p *
L

prin formulele (10)

prin formula (12).

10 Opional. a) Verificm dac

i 1 p *i 1 sau chiar valoerea 1.

b) Verificm concordana dintre formulele (11) i (13).


11 Calculm statistica T * Li 1

f i N p *i 2 .
N p *i

12 Pasul de decizie. Se compar valoarea T cu valoarea din tabela Hi ptrat


Dac T* < 2 ; L 3 , atunci ipoteza H 0 se accept cu riscul .
Dac T* > 2 ; L 3 , atunci ipoteza H 0 se respinge cu riscul .

;L 3 .

9.3.5 Exemple numerice pentru validarea algoritmului NS i NNS.


Algoritmul NS. Cazul speciticat.
Folosim urmtoarele date de intrare:
( , ) , N =1000, N 1 50 , L=30, m =0,0, 1.0 , 0,05 sau p 0,95 ,
p este probabilitatea ca ipoteza H 0 : datele au repartiie normal, s fie acceptat.
Rezultatele numerice obinute prin calcul sunt

2
0,95 ; L 1

42,6

x 1 0,0219, x 2 1,7810, , x50 0.2489,


A 2,3800

(min), B 1,7328 (max), h 0,1468

f 1 4, f 2 6, , f 9 35, , f 26 25, , f 30 34
p1 0,00865, , p 20 0,05531, , p 30 0,04155
p1 p30 0,99999 , T 31,3025 42,6 ; ipoteza

H 0 este acceptat.

Algoritmul NNS. Cazul nespeciticat.


Folosim urmtoarele date de intrare:
( , ) , N=1000, N 1 50 , L=30, 0,05 sau p 0,95 , 02,95 ; L 3 40,1
p este probabilitatea ca ipoteza H 0 : datele au repartiie normal, s fie acceptat.

Rezultatele numerice obinute prin calcul sunt

A 1,8265 (min), B 1,9074 (max), h 0,1333

f 1 38, f 2 25,.., f 9 49,.., f 26 13,.., f 30 23


m * 0,061003 ; *2 0,905551 (estimaii)
*
*
p1* 0,0260, , p 20
0,04350, , p 30
0,01485
*
p1* p30
0,99999 , T

42,2617 40,1 ; ipoteza

H 0 este respins.

9.4 Testul Hi ptrat n cazul repartiiei lognormale unidimensionale


9.4.1 Repartiia lognormal. Proprieti. [16].
Variabila aleatoare continu X are repartiie lognormal LN (m, 2 ) cu parametrii m i 2 dac
densitatea ei de repartiie are forma
f ( x)

(ln x m) 2
1
exp
, x>0, m R, 0 .
2 x
2 2

Parametrii au semnificaia: m este logaritmul natural al valorii medii, iar


deviaiei standard.
Proprieti.

este logaritmul natural al


2
M M ( X ) exp m

; 0

f ( x ) dx 1

D 2 D 2 ( X ) exp 2 m 2 [ exp 2 1]

m ln
M

, 2 ln

f ' ( x) 0 x0 e m

M D

M2

(graficul funciei f este asimetric) .

9.4.2 Algoritmul Hi ptrat pentru repartiia lognormal n cazul nespecificat.


Algoritmul care urmeaz este numit algoritmul logNNS. [16].
1 Datele algoritmului. Domeniul valorilor este (0, ) i valorile N , L 1, N1 N , valoarea este
aleas de ctre utilizator. Se ia din tabela valorilor Hi ptrat cuantila 2 ; L 3 .
2 Se genereaz selecia x 1, , x N .
3 Se calculeaz valorile A, B, h prin (1) i (2).
4 Se calculeaz coordonatele ai , i 0, L i se construiesc intervalele i , i 1, L .
5 Se dau sau se calculeaz frecvenele absolute f i , i 1, L ale valorilor xi care cad n intervalul i .
Dac N 1 N , atunci f1 0, f L 0 .
6 Se calculeaz valorile xi* , i 1, N i se estimeaz m m * prin (3). Valoarea 2 *2 se estimeaz prin
metoda Peck i Trap method [6] , care este legat de durata medie de via a unui semiconductor care
lucreaz la temperature t .
7. Se calculeaz punctele bi , i 1, L 1 prin formula
bi (ln ai m* ) / *
(14)
b

0
,
b

Apoi adugm punctele 0


.
L
8 Se activeaz Mathcad cu programul erf i se calculeaz probabilitile p 1*, p 2* , , p *L1 , p *L . Pentru
aceasta se folosesc formulele
b1
1

erf

2
2
bi
1
p1* p 2* pi*1 ; i 2, L 1
p *i erf

2
2

p1*

p *L 1 p1* p *2 p *L 1 .

9 Se calculeaz statistica S
*

2
f i N p *i
L
i 1
N p *i

10 Pasul de decizie. Se compar S * cu valoarea 2 ; L 3 luat din tabela Hi ptrat. .


Dac S * 2 ; L 3 atunci se accept ipoteza H 0 cu riscul .
Dac S * 2 ; L 3 atunci se respinge ipoteza H 0 cu riscul .
9.5 Testul Hi ptrat n cazul normal multidimensional. Cazul specificat.
Vectorul aleator Y R n , n 2 are repartiie normal multidimensional N ( M , ) dac densitatea sa
de probabilitate este f (Y )

1
2

exp (Y M ) t 1 (Y M ) , unde
det
2

M R n este vectorul valoare medie, iar

este matrice simetric pozitiv definit de tip n n , numit

matricea de covarian a lui Y .


Ipoteza testului Hi ptrat este
H 0 : datele numerice din vectorul aleator Y R n are distribuia N ( M , ) .
Dac M i sunt cunoscute, atunci testul aparine cazului specificat; dac M i sunt
necunoscute, atunci testul aparine cazului nespecificat.
9.5.1 nlocuirea ipotezei H 0 prin ipoteza echivalent H .
n ambele cazuri descrierea testului Hi ptrat este similar cu testul Hi ptrat din cazul unidimensional,
dar probabilitile p j se calculeaz prin integrale multiple pe domeniile j R n . Calcularea lui p j este foarte
dificil i de aceea ipoteza H 0 se nlocuiete cu ipoteza H .
Pentru a formula noua ipotez H , facem cteva notaii
Z (Y M ) t 1 (Y M ) ,

z
Z
f n ( z)

f n ( z)

1
n

2 n

Z 0 , z z (Y , n) 0

n
z
1 exp
2
2

z^

(15)

a 1 x

0 x e dx , a (0, ) .
Prin aceasta reducem cazul multidimensional la cazul unidimensional.
Se tie c variabla Z este de tip n2 cu n grade de libertate i
M ( Z ) n , D 2 ( Z ) 2n .
Curba f n (z ) are maximul pentru valoarea z n 2 . Graficul lui f n (z ) este foarte asimetric pentru
2 n 10 i devine simetric n 30 . Atunci noua ipotez H are forma
H : variabila Z (Y M ) t 1 (Y M ) are distribuia n2 .
(a )

Prin folosirea ipotezei H , domeniile j R n devin intervalele j pe axa real, adic .


j [0, ) , j [a j 1 , a j ) . Domeniul de variaie al lui j va fi lmurit mai jos.
Punctele reale a j pot fi date a priori de ctre urilizator sau pot fi calculate prin metode matematice.
9.5.2 Calcularea coordonatelor punctelor a j .
Funcia f n (z ) i atinge maximul pentru valoarea cunoscut z n 2 . Prin aceasta putem corela
valoarea n 2 cu intervalele j i cu punctele a j . Un interval foarte important legat de valoarea n 2
este notat c , unde c este un numr natural c 3 ; valoarea c este calculat prin etapele de mai jos.
nti se tie c L este ales de ctre utilizator aa nct L 2 .
Apoi pe axa real se construiesc intervalele j din ce n ce mai mici, situate n partea stng a lui c ,
aa nct a0 0 . n mod similar pe axa real se construiesc intervalele j din ce n ce mai mici, situate n
partea dreapt a lui c , aa nct a L . Poziia intervalelor i a punctelor are forma
1 2 3 ........ c c 1 c 2 ....... L 1 L
a 0 a1 a 2 ...... a c 1 ac a c 1 ...... a L 2 a L 1 a L

j [ a j 1 , a j ) , a j 1 a j , j 1, L .

Notm prin j lungimea intervalului j ; j a j a j 1 j 1, L .


Calcularea coordonatelor punctelor a j se face n paii care urmeaz.
Pasul 1. Alegem numrul natural L 2 . Alegem un numr real pozitiv notat RAILR . Acest numr
reprezint raportul dintre numrul de intervale j din partea stng (S) a lui c i numrul de intervale
j situate n partea dreapt (D) a lui c .
Recomandare:
Dac 2 n 10 atunci RAILR [0.2,0.5] ;
Dac 11 n 29 atunci RAILR [0.55,0.85] ;
Dac n 30 atunci RAILR [0.9,1.25] .
Valoarea c meninat mai sus se calculeaz cu formula
RAILR L 1
RAILR L 1
sau c

+1 ,
RAILR 1
RAILR 1
unde . este funcia parte ntreag. La acest calcul folosim regula lui
c 134 ;
c 103,280 c 103 .
c

Probabilitatea p j pe intervalul
Pasul 2. Se rezolv ecuaia

0,5 . Examplu:

c 133,880

trebuie s fie p j 0 , j 1, L .

j 1 y

j n2

i obinem

2 ( n 2)
. Valoarea
c (c 1)

y este cea mai

mic lungime a intervalelor 1 i L 1 . Ca verificare, lungimea intervalelor j este


j y j , j 1, c (intervalele din partea stng)
c j y ( L c j ) , j 1, L c 1 (intervalele din partea dreapt)
y 2 y 3 y 4 y ... (c 1) y cy ( L c 1) y ... 2 y y .
Pasul 3. Calculm coordonatele punctelor a j
a0 0 , a1 , a 2 , , a L2 , a L1 , a L
(16)
prin folosirea formulelor
j ( j 1)
aj
y , j 1, c (partea stng)
(17)
2
c (c 1)
y
2

j 1

j ( L c)
y
2

j 1, L c 1 (partea dreapt a lui a c ).

ac j

Observaia 5. Ca verificare obinem


a1 y , a 2 3 y, a 3 6 y, , ac

a L 1 a L 2 y . Corect.

(18)

c (c 1)
y
2

9.5.3 Calcularea frecvenelor f j i a probabilitilor p j pe intervalele j .


Pentru vectorii de selecie Y1 , , Yi , , YN notm
z i (Yi M ) t 1 (Yi M ) , z i R , i 1, N
(19)
unde vectorul M i matricea ptrat sunt cunoscute din ipoteza nul H 0 .
Pentru numrul natural dat N i cu ajutorul valorilor de selecie z1 , , z i , , z N , prin formula (19)
calculm frecvenele absolute f1 , , f j , , f L ale valorilor z i care cad n intervalul

j , j [a j 1 , a j ); j 1, L .

Prin folosirea ipotezei H i a formulei (15) calculm probabilitile


a j

pj

f n ( z ) dz , j 1, L

j 1

pj

(n integral am notat a j aj ; a j 1 a ( j 1) )

n
z
1 exp dz
2
2

aj

a( j 1) z ^

(20)
n

2
Pentru a efectua aceste calcule facem cteva artificii.
n lucrarea [9] exist subrutina (procedura) cu numele DQL32 prin care se calculeaz valoarea
integralei

I e x g ( x ) dx (care folosete formula cu 32 de noduri, a lui Gauss-Laguerre , n prcizie dubl).


0
Utilzm aceast formul n calculele care ne intereseaz.
2 n

Notm

z ^ 1 exp dz . Atunci
n i I a
2
a
2
2
2
n

p j K ( I a j 1 I a j )

(21)

Propoziia 2. Integrala I a din formula (21) devine


n
a

I a 2 2 exp

a n

exp (v) v ^
1 dv
2 2

Demonstraie. Din u
Apoi v u

z
obinem
2

Ia

n
22

a / 2

(22)
n

1 du .
2

exp (u ) u ^

a
genereaz
2

a
a n

I a 2 2 exp exp (v) v ^


1 dv (End).
0
2
2
2

n continuare notm f k
(23)
i probabilitile p j din (20) devin

pj

a j 1
1

[ exp

2
n

0 e

g (v, n, a j 1 ) dv

(continuare pe rndul urmtor )

a j v

e g (v, n, a j ) dv ] , j 1, L 1
exp
0
2

a 0 0, a L .

(24)

Probabilitatea p L poate fi calculat prin dou metode :


L 1

pL 1 j

sau

pL

(25)

pj

a j 1
1

exp

2
n

g (v, n, a L 1 ) dv

(26)

Observaia 6. n programul de calculator elaborat de noi notm valoarea p L din (26) prin PILS (un
calcul suplimentar, pentru a valida corectitudinea programului) trebuie s arate c p L PILS .
Alt verificare a programului este legat de integrala

v
1
e g (v, n,0) dv . Rezultatul trebuie s

0
( n / 2)

fie 1 sau aproape 1.


Probabilitile p j , j 1, L conine factorul

1
. Pentru calcularea valorii numerice
( n / 2)

folosete subrutina Gamma (n / 2, G , kod ) .


Rezultatul calculului este notat G (n / 2)

(n / 2) se

(27)

9.5.4 Descrierea testului Hi ptrat normal multidimensional n cazul specificat.


Prin acest test se verific ipoteza de normalitate N ( M , ) , unde M , sunt cunoscute.
1). Datele de intrare sunt: n 3 dimensiunea spaiului din care fac parte vectorii aleatori; vectorul
M R n ; matricea de tipul n n ; N numrul vectorilor de intrare Y1 , , YN ; se genereaz vectorii
aleatori Y1 , , YN ; L reprezint numrul de intervale j , with j 1, L ; din experiena statistic se
recomand 20 L 40 ; a 0 0,0 ; a ( a reprezint un numr foarte mare); RAILR 1 ;
pentru riscul dat

se ia valoarea cuantilei 2 , L 1 , notat

HI 2 RTS .
2 ( n 2)

2). Se calculeaz: matricea invers 1 ; numrul natural c de la pasul 1; y c (c 1) ; coordonatele


a1 , , a L 1 prin formulele (17),(18); G (n / 2) prin formula (27);
valorile z1 , , z i , , z N prin (19); frecvenele absolute f1 , , f j , , f L ;
probabilititile p j , j 1, L 1 din (24); p L din (25) sau (26).
3). Se aclculeaz statistica
T

f j N pj
L
j 1
N pj

(28)

4). Se ia din tabelele Hi ptrat valoarea cuantilei 2 ; L 1 HI 2 RTS


(HI 2 valoare rezultat din tabel n cazul specificat).
4) Pasul de decizie.
Dac T HI 2 RTS atunci ipoteza initial H 0 este acceptat cu riscul .
Dac T HI 2 RTS atunci ipoteza initial H 0 se respinge..
Algoritmul descris mai sus are numele AlgoHI2NormMultdSC (cazul specificat).
9.5.5 Exemple numerice. Cazul specificat.
Exemplul 1. n 3 , N 20 , L 30 , RAILR 0.25

0 1.5 0.5 0.4


M 0 , 0.5 1.1 0.2


0 0 .4 0 .2 1 .7

HI 2 RTS 42.5
T 16.1734 ; T HI 2 RTS ; ipoteza H 0 este acceptat.

Exemplul 2. n 5 , N 300 , L 30 , RAILR 0.45

0

0

1.5 0.5 0.4 0.0 0.0

0.5 1.1 0.2 0.0 0.0

M 0 , 0.4 0.2 1.7 0.0 0.0


0
0.0 0.0 0.0 1.9 0.0
0
0.0 0.0 0.0 0.0 2.5

HI 2 RTS 42.6
T 30.6020 ; T HI 2 RTS ; H 0 este acceptat.

9.6 Testul Hi ptrat n cazul normal multidimensional. Cazul nespecificat. [16].


Fie Y1 , , YN o selecie de volum N, unde N este un numr natural cu valoare mare. n cazul
nespecificat vectorul M i matricea sunt necunoscute. Estimm pe M , i notm estimaiile
,
. Pentru estimare folosim toi cei N vectori sau numai o parte N dinter ei. Not
respectiv prin M
1
prin N1 un numr natural aa nct N1 N sau N1 N . Atunci estimaiile au forma
1
N1
M
Y

i
1 i
N1
1 N 1 (Yi M ) t (Yi M ) .

i 1
N1 1
are tipul n n i trebuie s fie simetric i pozitiv definit
Matricea
,
) .
Ipoteza H 0 : . Vectorii Y au repartiia normal N ( M

Numrul total de parametri necunoscui n vectorul M i matricea este


n (n 1) n (n 3)
d n

.
2
2
.
9.6.1 nlocuirea ipotezei H 0 prin ipoteza echivalent H

Pentru a evita dificultile de calcul pentru probabilitile p j pe j R n folosim un artificiu i


. Pentru acerasta introducem o nou variabil aleatoare
nlocium ipoteza H 0 prin ipoteza echivalent H
U
N (N n)
U 1 1 (Y M )t 1(Y M ) .
n(N1 1)(N1 1)

u
U
h n(u)

, u 0.

Variabila U are distribuia Fisher-Snedecor cu


valoarea medie i dispersia
N1 n
M (U )
, N1 n 3
N1 n 2

n i

N1 n grade de libertate, notat Fn , N1 n , cu

2( N1 n) 2 ( N1 2)
, N1 n 5 .
n( N1 n 4)( N1 n 2)
Condiia final pentru N1 este N1 n 5 .
D 2 (U )

Densitatea de probabilitate a distribuiei Fisher-Snedecor este

h n (u )

=
N1 n

n/2

N
( N 1 / 2)
n
n
u ^ 1 1
u ^ 1
N1 n 2
N n 2
n
1
2
2

Curba h n (u ) i atinge maximul pentru


(n 2)( N1 n)
u
i ntotdeauna avem 0 u 1
n( N1 n 2)
Noua ipotez este
: variabila U are repartiia Fisher-Snedecor
H

(29)

(30)

Fn , N 1 n .

9.6.2 Calcularea punctelor a j i a frecvenelor f j pe intervalele j .


Funcia h n (u ) i atinge maximul pentru abscisa u data de (30).
De aceea corelm aceasta cu intervalele j i puncteles a j . Un interval foarte important legat de
(n 2)( N1 n)
valoarea u
este notat c , c este numr natural c 3 , Valoarea lui c este calculat
n ( N 1 n 2)
mai jos:
RAILR L 1

RAILR 1

RAILR L 1
+1.
RAILR 1

sau c

Deoarece u 1 , atunci valoarea RAILR este aleas aa nct numrul de intervale j din partea stng
(S) a lui c s fie mult mai mic dect numrul de intervale din pareta dreapt (D).
Prin folosirea pasul 2 dintr-o seciune anterioar se rezolv ecuaia
( n 2) ( N n )
2 ( n 2) ( N n )
c
j 1 y j n( N n1 2) i obinem y n ( N n 2)1c (c 1)
1
1
y
Valoarea
este cea mai mic lungime a intervaleleor 1 i L 1 . Atunci punctele a j se
calculeaz cu ajutorul formulelor (16), (17), (18).
Pentru selecia Y1 , , Yi , , Y N notm
N 1 ( N 1 n)
)t
) , u i R , i N1 1, N
1 (Y M
u i
(Yi M
(31)
i
n( N 1 1)( N 1 1)
i matricea ptrat
.
sunt cunoscute prin ipoteza H
unde vectorul M
Pentru numrul natural dat N i valorile de selecie u N 11 , , u i , , u N din (31) se calculeaz
frecvenele absolute f1 , , f j , , f L al valorilor u i care cad n intervalul
j , j [ a j 1 , a j ); j 1, L .
9.6.3 Calcularea probabilitilor p j pe intervalele j .
i a formulei (29) se calculeaz probabilitile
Prin folosirea ipotezei H
pj

a j

a j 1 hn (u ) du ,

p j K

aj

a j 1

N
n
u ^ 1 du
N1 n 2

N
1
n/2
2
n N n
1

2 2
n
1
2

u^

K
N

n
1

j 1, L

(32)

(33)

Pentru a calcula valoerea integralei din formula (32) folosim subrutina DQG23 din lucrarea [9]. Aceast
subrutin este n precizie dubl i calculeaz integrala

cu 32 de noduri. n cazul nostru h(u ) h(u , n, N1 ) este


n n
n
^
h(u ) u ^ 1 1
N1 n 2
2
Astfel p j K

aj

a j 1

h(u , n, N 1 ) du , j 1, L 1 , unde

h(u ) du

prin folosirea formulei Gauss-Laguerre

(34)
L 1

a 0 0 , p L 1 j 1 p j .

Prin subrutina Gamma(a, G, kod ) din [9] se calculeaz valoarea (a ) care intr n factorul K.
9.6.4 Descrierea testului Hi ptrat normal multidimensional n cazul necpecificat.
.
Se verific ipoteza de normalitate H
1). Datele de intrare sunt : n 3 dimensiunea spaiului care conine vectorii aleatori; N numrul total
de vectori aleatori Y1 , , YN ; N1 N un numr natural ales de utilizatorr; se introduce sau se genereaz
vectorii aleatori Y1 , , YN ; L reprezint numrul de intervale j , cu j 1, L i L d 1 ; din experiena

statistic se recomand 20 L 40 ; a 0 0,0 ; a (numr foarte mare); RAILR 1 (valoare descris


ntr-o seciune anterioar); riscul ; se ia din tabela 2 cuantila 2 ; L d 1 , notat HI 2 RTUS
(HI 2 rezultat din tabel n cazul nespecificat).
,
i apoi matricea
1 ; se calculeaz numrul natural c prin pasul 1;
2). Se calculeaz : M
2 (n 2) ( N1 n)
y
; coordonatele a1 , , a L 1 se calculeaz prin formulele (17),(18);
n ( N1 n 2) c (c 1)
N
N n
n
G1 1 , G 2 , G3 1

2
2
2

K
N1 1

n/2

G1
,
G 2 G 3

prin formula (33);

u1 , , u i , , u N prin formula (31); se calculeaz frecvenele


probabilitile p j , j 1, L 1 prin (24) i p L prin (25) sau (26).

f1 , , f j , , f L

3). Se calculeaz statistica


L
T j 1

f j N p j 2

(35)

N pj

4). Se ia din tabele cuantila

; L

n ( n 3)
1
2

HI 2 RTUS

5). Pasul de decizie.


Dac T HI 2 RTUS atunci ipoteza H 0 se accept cu riscul .
Dac T HI 2 RTUS atunci ipoteza H 0 se respinge..
Algoritmul descris mai sus este numit AlgoHI2NormMultdUSC (cazul nespecificat).
9.6.5 Exemplu numeric n cazul nespecificat.
Dare de intrare n 5; N 472; N1 100 ; L 40
Valori estimate M , i 1
M 0.1630 0.01149 0.1040 0.00325 0.1720

1.7138 0.6080 0.0986 0.1112 0.3306

0.6080 1.0844 0.0867 0.6997 .2640

0.0986 0.0867 1.8002 .0659 0.1506

0.1112 0.6997 .0659 1.6642 .3771


0.3306 .2640 0.1506 .3771 2.8415

; se calculeaz

0.8064 .5898 0.0009 0.1654 .1267

.5898 1.7165 .0865 .6526 0.1461


1 0.0009 .0865 0.5641 0.0516 .0312

0.1654 .6526 0.0516 0.8738 0.0333


.1267 0.1461 .0312 0.0333 0.3863

0.8064 .5898 0.0009 0.1654 .1267

.5898 1.7165 .0865 .6526 0.1461


1 0.0009 .0865 0.5641 0.0516 .0312

0.1654 .6526 0.0516 0.8738 0.0333


.1267 0.1461 .0312 0.0333 0.3863

Frecvenele pe intervale sunt


0 0 0 0 0 1 0 0 3 7 8 6 12 8 11 20 13 21 22 19
36 45 30 33 19 22 26 20 10 10 7 7 3 5 5 3 2 0 1 67

Probabilitile au valorile

0.2 E 05 0.2 E 04 0.1E 03


0.7 E 03 0.1E 02 0.2 E 02
0.5 E 02 0.8 E 02 0.1E 01
0.1E 01 0.2 E 01 0.2 E 01
0.3E 01 0.3E 01 0.4 E 01
0.7 E 01 0.7 E 01 0.6 E 01
0.4 E 01 0.4 E 01 0.3E 01
0.2 E 01 0.2 E 01 0.1E 01
0.1E 01 0.9 E 02 0.7 E 02
0.4 E 02 0.2 E 02 0.1E 02

0.1E 03
0.4 E 02
0.1E 01
0.2 E 01
0.4 E 01
0.5 E 01
0.2 E 01
0.1E 01
0.5 E 02
0.150949

T 28.1813, HI 2 RTUS 32.900


T HI 2 RTUS ; ipoteza de normalitate

este acceptat.

9.7 Testul de concordan al lui Kolmogorov.


Andrei N. Kolmogorov (25.05.1903 20.10.1987; a purtat numele de familie al mamei sale Maria
Kolmogorova, care a murit la naterea sa; Kolmogorov - matematician rus; fondator al teoriei moderne a
probabilitilor; professor la Universitatea din Moscova; colaborator al matematicianului rus Nicolae Luzin).
n unele lucrri testul lui Kolmogorov este numit testul lui Kolmogorov Smirnov (Nicolae V. Smirnov).

Fie variabila aleatoare X pentru care se formuleaz ipoteza nul H 0


Testul lui Kolmogorov de verificare a ipotezei formulate se bazeaz pe funcia de repartiie teoretic
F ( x ) (cunoscut ca form) i pe funcia de repartiie empiric F *k ( x ) .
Pasul 0. Dac F ( x) conine unul sau mai muli parametri, nti se determin aceti parametri folosind o
selecie numeric de volum n asupra lui X .
Pasul 1. Folosind selecia dat x 1 , x 2 , , x n se determin frecvenele absolute f k . Acestea sunt
numere naturale. Notm suma tuturoe frecvenelor absolute prin f1 f 2 N
Pasul 2. Caculm valorile funciei empirice F *k ( x ) , care corespunde seleciei date. Exist dou
posibiliti de calcul
F*
k ( x ) = (suma frecvenelor absolute mai mici dect x ) / N sau
*
F k ( x ) = (suma frecvenelor absolute din stnga lui x ) / N.
f
f f f
* f f
Exemplu. Exemplu. F 1* 1 ; F 2 1 2 ; F *3 1 2 3 etc.
N
N
N
Pasul 3. ntocmim tabelul pentru funcia de repartiie empiric
Tabelul cu funcia de repartiie empiric.
k
1
2
3 etc.
fk
f 3 etc.
f1
f2
*
*
Fk
F*
F1
F *2
etc.
3
F
(
x
)
Pasul 4. Calculm valorile
pentru funcia de repartiie teoretic F (x ) cunoscut prin ipoteza
k
H0 .
Exemplu. Dac funcia de repartiie teoretic este F ( x) 1 exp ( x) (n cazul repartiiei
exponeniale) atunci F k F ( x k ) 1 exp ( x k ) ; k 1, 2 , etc. Aranjm rezulatatele sub forma
F1 , F2 , F3 , etc.
Pasul 5. Calculm diferenele sau distanele d k = F *k ( y k ) F k ( y k ) i ntocmim un tabel de sintez
pentru variabila aleatoare d k . Aceast variabil aleatoare depinde esenial de valorile de selecie supra lui X.
Tabelul de sintez. Tabelul distanelor dintre repartiia teoretic i cea empiric.
k
1
2
3
etc.
*
*
*
*
Fk
F3
F1
F2
etc.
Fk
F1
F2
F3
etc.
*
*
*
F*

F
F

F
F

F
F

F
k
k
1
1
2
2
3
3
etc.
d
Pasul 6. Alegem valoarea maxim dintre toate distanele k = F *k ( y k ) F k ( y k ) din tabelul distanelor
de mai sus.
Pasul 7. Alegem un nivel de semnificaie .
Pasul 7. Din tabelul valorilor ecuaiei lui Kolmogorov K (c) = 1 alegem valoarea c c ( ) , care
corespunde valorii cunoscute . Gsim c c ( ) . Funcia K (c) are forma [19; pag 165]
K (c ) = 1 2

( 1) r 1 exp ( 2 r 2 c 2 )
r 1

echivalent

r 1 (1) r 1 exp ( 2 r 2 c 2 ) =

(funcia lui

Kolmogorov), iar ecuaia are forma

este cunoscut, iar valoarea c este necunoscut.

Pasul 8. Calculm statistica T


Dac valoarea calculat T
Dac valoarea calculat T

c ( )

c ( )
n
c ( )
n

i aplcm regula de decizie :

> max d k , atunci ipoteza nul H 0 se accept ;


< max d k , atunci ipoteza nul H 0 se respinge.

Figura 1. Ilustrarea testului lui Kolmogorov.

Linia cu continuitate neted repezint funcia de repartiie teoretic. Linia cu continuitate n scar
reprezint funcia de repartiie empiric. Sgeata reprezint distana pe vertical dintre ele. n testul lui
Kolmogorov se alege distana maxim.
9.8 Probleme rezolvate pentru teste de concordan: Hi ptrat; Kolmogorov.
Problema 1. Repartiie Poisson; testul Hi ptrat; repartiie exponenial; testul Kolmogorov.
Pentru o mai bun organizare a activitii unui magazin de servire a clienilor se cerceteaz sosirile
cumprtorilor i timpul de servire al unei personae. Se are n vedere o perioad de 6 zile, aproximativ 3
ore pe zi, n perioada de vrf a activitii. Timpul este mprit n 200 de intervale consecutive, de cte 5
minute pentru fiecare interval. Se nregistreaz numrul de cumprtori sosii n fiecare interval. Datele sunt
aranjate ca n tabelul 1P1
Tabelul 1P1. Sosirile cumprtorilor n fiecare interval.
Intervalul nr 1 2 3 4 5
197 198 199 200
(nr. total N =200)
Nr de sosiri 0 2 1 3 1
11
5
8
7 (este doar un exemplu de ilustrare)

Apoi s-a msurat intervalul de timp de servire (n uniti de timp u, unde, de exemplu u=1 minut) a 30
de cumprtori , luai la ntmplare i s-a ntocmit tabelul 2P1.
Tabelul 2P1. Intervalul de timp de servire.
Intervalul de timp [0,5-1,0) [1,0-1,5) [1,5-2,0)
Nr de cumprtori
18
8
2

[2,0-2,5)
1

[2,5-3,0)
1

(nr. total N =30)

Se formuleaz dou ipoteze statistice, care trebuie testate (verificate).


a) S se verifice ipoteza H 0 : nr. k de sosiri ale cumprtorilor (adic nr. k de clieni) formeaz o
variabil aleatoare discret X cu repartiie Poisson.
b) S se verifice ipoteza H 0 (timp de servire): timpul de servire al cumprtorilor formeaz o variabil
aleatoare continu Y cu repartiie exponenial.
Enunul problemei este din [23; pag 100].
Soluie. a) Datele culese n tabelul 1P1 sunt numrate sub form de frecvene absolute f k ( X ) (adic
numrul de intervale cu acelai numr de clieni sosii ) n numr de intervale.
1 0 clieni n 1 interval
8
7 clieni n 13 intervale
2 1 client n 16 intervale
9
8 clieni n 6 intervale
3 2 clieni n 31 intervale
10
20 clieni n 1 interval
4 3 clieni n 37 intervale
5 4 clieni n 41 intervale
6 5 clieni n 30 intervale
7 6 clieni n 23 intervale
Se subnelege c frecvenele absolute f k ( X ) sunt numere naturale. Notm f 1 f 2 N .
Variabila aleatoare X (cu 10 poziii) ia valorile 0 1 2 3 4
7 8 20. Pentru uniformizatea
natural a valorilor lui X descompunem poziia 10 n 3 poziii astfel
10
9 clieni n 1 interval
11
10 clieni n 0 intervale
12
11 clieni n 1 interval
n noua variant, variabila aleatoare discret X are 12 poziii i are forma

xk
X
fk

0 1 2 3 4 5 6 7 8 9 10 11

X
1 16 31 37 41 30 23 13 6 1 0 1

Total intervale = 1+16+31+


+6+1+0+1=200=N intervale de cte 5 minute.
Prima linie a lui X reprezint numrul de clieni cu valorile x k , k 0 ;11 . Volumul seleciei este
n 12 .
A doua linie a lui X reprezint frecvenele absolute f k ( X ) ale numrului de sosiri pe intervale ,
notate f k , k 0 ;11 . Exemplu: cte 3 clieni au sosit n 31 de intervale; cte 7 clieni au sosit n 13
intervale etc.
Ipoteza nul H 0 (sosiri clieni) este lagat de repartiia discret Poisson, cu un parametru, , care are
forma general

k
X
f (k ; )

f k f (k ; ) exp ( )

k
k!

; 0 ; k 0 ; . n problema noastr k 0 ;11 .

Se tie c M ( X ) ; D 2 ( X ) .
Pentru verificarea ipotezei H 0 aplicm testul de concordan Hi ptrat.
Forma repartiiei este specificat (Poisson), dar valoarea parametrului 0 este nespecificat, adic
0 are valoare necunoscut.
Pasul 0. nti trebuie s estimm parametrul , unde M ( X ) . Cum folosirea fiecrui interval de 5
minute are aceeai probabilitate, rescriem selecia X sub forma

1 0 1 2 3 4 5 6 7 8 9 10 1

200 1 16 31 37 41 30 23 13 6 1 0 1

(suma probabilitilor este 1).

Folosim media de selecie de mai sus i obinem


X

1
1
800
11
k f (k ; )
(0 1 1 16 2 31 9 1 10 0 11 1)
4

0
200
200
200

M (X ) X 4 ;

4 ; f k f ( k ; 4) exp ( 4)

4k
k!

f k f ( k ;4) 0,0183

4k
k!

Valoarea k 4 este cea mai probabil valoare dintre valorile lui X .


Pasul 1. Urmeaz s calculn statistica T care corespunde datelor numerice ale variabilei X . Pentru
aceasta calculm frecvenele teoretice f *k bazate pe ipoteza nul formulat.
k

4
f *k N f k ; f *k 200 f ( k ; ) = 200 0,0183
k!

Metoda 1. Folosim formula teoretic

4
f *k = 3,66

4
f *k = 3,66

k!

k!

; k 0 ;11 .

; k 0 ;11 .

Metoda 2. Folosim formule de recuren.


Deducem formulele de recuren. inem cont c valoarea medie M ( X ) X 4 a generat valoarea
k 4 ca fiind cea mai probabil. Formulele de recuren se mpart n dou categorii: pentru k 4 i k 4 .
Obinem succesiv:
f *
k 1 = 3,66

4 k 1
; f
( k 1) !

*
k

= 3,66

4k
k!

f *k 1 = 3,66

4 k 1
( k 1) !

f *
k 1

f *k =

f *k 1

f *k =

f *
k 1 =

k 1

f *k 1 =

f *k ; f

k 1

*
k 1

f *k ; f

k
f
4

*
k 1

pentru k 4 ; k 4 ; 3 ; 2 ;1 .

*
k

4
f
k 1

*
k

pentru k 4 ; k 4 ; 5 ; 6 ; 7 ;; 8 ; 9 ;10 .

n ambele formule recurente (napoi i nainte) folosim valoarea

f *4 =

Tabelul 3P1. Frecvenele relative.


k
0
1
2
3
f *k 3,66 14,66 29,28 39,04

44
39,04 .
4!

prin formula teoretic, pentru k 0 ;11 i aranjm

f *k

Metoda 1. Calculm frecvenele relative


valorile obinute prin calcul n tabelul 3P1

3,66

4
5
39,04 31,23

6
20,82

7
11,9

8
5,95

9
2,64

10 11
1,06 0,38

Metoda 2. n cazul k 4 ; k 4 ; 3 ; 2 ;1 obinem succesiv


4
3 *
2
f 3 29,28 ; k 2 ; f 1* =
f *4 39,04 ;
f *2 14,66 etc.
k 3 ; f *2 =
4
4
4
n cazul k 4 ; k 4 ; 5 ; 6 ; 7 ; ; 8 ; 9 ;10 obinem succesiv
4
4
f *5 = 20,82 etc.
k 4 ; f *5 =
k 5 ; f *6 =
f *4 = 31, 23 ;
4 1
5 1

k 4;

f *3 =

Prin cele dou metode rezultatele coincid. Metoda a doua este mai avantajoas la calculele cu valori mari
ale lui k .
Pasul 2. n continuare calculm

fk - f

*
k

( f k f *k ) 2

( f k f *k ) 2
i
f *k

, pentru k 0 ;11 . Ultimele

valori sunt necesare la calcularea statisticii T , de tip Hi ptrat. ntotdeauna frecvenele calculate teoretic
sunt puse jos la numitor. De aceea ele trebuie s fie toate nenule.
Aranjm rezultatele n tabelul 4P1.
Tabelul 4.P1 Tabelul ptratelor diferenelor pentru statistica Hi ptrat.
fk

0
1

1
16

2
31

3
37

f *k

3,66

14,66

29,28

39,04

-2,66

1,34

1,72

7,08

1,79

1,93

0,12

f k f *k

( f k f *k ) 2

( f k f *k ) 2
f *k

4
41

5
30

6
23

7
13

8
6

9
1

39,04 31,23

20,82

11,9

5,95

2,64

-2,04

1,96

-1,23

2,18

1,10 0,05 -1,64 -1,06 0,62

2,96

4,16

3,84

1,51

4,75

1,21 0,002 2,69

1,12 0,38

0,10

0,11

0,10

0,05

0,23

0,10 0,00

1,06 1,00

Proba de corectitudine pentru f *k : suma tuturor valorilor f


3,66+14,66+29,28+..+2,64+1,06+0,38=199,66 (corect).

*
k

1,02

10
0

11
1

1,06 0,38

trebuie s fie egal cu N 200 . Avem

Pasul 3.Statistica T .
Calculm valoarea numeric a statisticii T care nsumeaz toate valorile de pe ultima
linie din tabelul 4, adic

11

T k 0

( f k f *k ) 2
f *k

= 5,82, sau 2 = 5,82 , unde

= numrul gradelor de

libertate ale statisticii T .


Pasul 4. Determinm numrul gradelor de libertate pentru statistica T , cu formula
s 1 , unde s = numrul de observaii pentru care f *k 5 , iar
= numrul de parametri estimai.
n cazul problemei de fa avem s 8 i 1 , deoarece am estimat un parametru notat . Deci
6 , adic exist 6 grade de libertate. Statistica 2 are valoarea 62 5,82 .
Pasul 5. Alegem pragul de semnificaie 0,05 .
Cutm n tabela de valori a repartiiei 2 valoarea care corespunde lui 0,05 i 6 , notat
2
2
2

; ( ; ) = (0,05 ; 6) = 12,592.
Deoarece 62 5,82 < 2 (0,05 ; 6) =12,592 (valoarea calculat este mai mic dect valoarea din
tabel) rezult c se accept ipoteza nul H 0 (sosiri) pe care am formulat-o, adic sosirile clienilor la
cumprturi este o variabil aleatoare X de tip Poisson, cu valoarea medie de M ( X ) 4 clieni ntrun interval cu lungimea de 5 minute.
b) Verificm ipoteza nul H 0 (timp de servire). Pentru rezolvare vom folosi dou metode diferite:
testul Hi ptrat; testul Kolmogorov.
n tabelul 2 nlocuim intervalele de timpi de servire prin media aritmetic a fiecrui interval. Obinem
tabelul 5P1.
Tabelul 5P1. Media aritmetic a intervalului de timp de servire.
Timp de servire
0,75
1,25
1,75
2,25
Nr de cumprtori
18
8
2
1

2,75
1

(total N =30 de cumprtori).

Numrul de cumprtori servii n timpii de mai sus reprezint frecvenele absolute obinute prin
observaii directe m magazin : f k ; k 1, 5 ; n 5 ; f1 f 5 30 N .
Dac se face o reprezentare grafic a punctelor din tabelul 5 rezult o curb discret care are forma funciei
exponeniale e x , cu descretere asimptotic spre plus infinit. De aceea ipoteza H 0 (timp de servire) se refer la

repartiia exponenial. Repartiia este continu, deoarece timpul de servire, notat y , este continuu.
Reamintim elementele de baz ale repartiiei exponeniale

y
Y
f ( y ; )

; f ( y ; ) exp ( y ) ; y 0 ; 0 ; M (Y )

Variabila Y discretizat are forma seleciei

1
1
2
; D (Y ) 2 .

yk y1 0,75 y21,25 y3 1,75 y4 2,25 y5 2,75

Y
f 18 8 2 1 1

1 y1 ,0 75 y 2 1,25 y3 1,75 y 4 ,2 25 y5 ,2 75

30 18 8 2 1 1

(suma probabilitior este 1).

fk

reprezint frecvenele absolute; f k f ( y k ; ) . O alt form a seleciei Y este

Forma repartiiei este specificat (exponenial), dar valoarea parametrului 0 este nespecificat,
adic 0 are valoare necunoscut.
Pasul 0. Facem meniunea c indiferent de tipul de test de concordan folosit, nti trebuie s estimm
parametrul . Folosim media de selecie (care este estimator de verosimilitate maxim, adic are dispersie
1
1
1

, deducem
i obinem succesiv
M (Y ) Y

1
32
1
1
30
Y
k fk
1,067 ; M (Y ) ; Y ;
0,938 .

k
30
30

32
Deci f ( y k ; ) 0,938 exp ( 0,938 y k ) ; 0,938 .

minim). Deoarece M (Y )

Metoda 1. Aplicm testul de concordan Hi ptrat.


Pasul 1. Urmeaz s calculn statistica T care corespunde datelor numerice ale variabilei X . Pentru
aceasta calculm frecvenele relative f *k (teoretice)
*
f *k N f k ; f k 30 f ( y k ; ) 30 exp ( y k ) ; k 1, 2, 3, 4, 5 ; 30 0,938 28,14 .
*
f 1
30 f ( y 1 ; ) = 30 0,938 exp ( 0,938 y 1 ) = 30 0,938 exp ( 0,938 0,75) = 13,49343
*
f 2 30 f ( y 2 ; ) = 30 0,938 exp ( 0,938 y 2 ) = 30 0,938 exp ( 0,938 1,25) = 8,72152
f *
3 30 f ( y 3 ; ) = 30 0,938 exp ( 0,938 y 3 ) = 30 0,938 exp ( 0,938 1,75) = 5,45069

30 0,938 exp ( 0,938 y 4 ) = 30 0,938 exp ( 0,938 2,25) = 3,41015


30 f ( y 5 ; ) = 30 0,938 exp ( 0,938 y 5 ) = 30 0,938 exp ( 0,938 2,75) = 2,13315.

f *
4 30 f ( y 4 ; ) =
f

*
5

fk - f

Pasul 2. n continuare calculm

*
k

* 2
, ( f k f k ) i

( f k f *k ) 2
f *k

, pentru k 1; 5 . Ultimele valori

sunt necesare la calcularea statisticii T , de tip Hi ptrat.


Aranjm rezultatele n tabelul 6P1.
Tabelul 6P1. Tabelul ptratelor diferenelor pentru statistica Hi ptrat.
k
fk
f *k
f k f *k

( f k f *k ) 2
( f k f *k ) 2
f *k

1
18
13,49343
4,50667
20,31007

2
8
8,72152
- 0,72152
0,52059

1,50518

0,05969

3
4
5
2
1
1
5,45069
3,41015
2,13315
- 3,45069 - 2,41015 - 1,13315
11,90726
5,80882
1,28403
2,18454

1,70339

0,60194

Proba de corectitudine pentru f *k : suma tuturor valorilor f *k trebuie s fie egal cu N 30 . Avem
33,49343+8,72152++2,13315=31,2. Aproximaia este bun.
Pasul 3.Statistica T .
Calculm valoarea numeric a statisticii T care nsumeaz toate valorile de pe ultima linie din
tabelul 6, adic

T k 1

( f k f *k ) 2
f *k

= 6,05475, sau 2 = 6,05475 , unde

= numrul gradelor de

libertate ale statisticii T .


Pasul 4. Determinm numrul gradelor de libertate pentru statistica T , cu formula
s 1 , unde s = numrul de observaii pentru care f *k 5 , iar
= numrul de parametri estimai.
n cazul problemei de fa avem s 3 i 1 , deoarece am estimat un parametru notat . Deci
1 , adic exist 1 grad de libertate. Statistica 2 are valoarea 12 6,05475 .
Pasul 5. Alegem nivelul de semnificaie 0,01 .
Cutm n tabela de valori a repartiiei 2 valoarea care corespunde lui 0,01 i 1 , notat
2
2
2

; ( ; ) = (0,01;1) = 6,635.
Pasul 6. Aplicm regula de decizie.
Deoarece 12 6,05475 < 2 (0,01;1) =6,635 (valoarea calculat este mai mic dect valoarea din
tabel) rezult c se accept ipoteza nul H 0 (timp de servire) pe care am formulat-o, adic variabila
aleatoare Y care reprezint timpul de servire al unui cumprtor are o repartiie exponenial cu parametrul
0,938 . Timpul mediu n care este servit un cumprtor este M (Y )

unitate de timp este u=1 minut.


Metoda 2. Aplicm testul de concordan al lui Kolmogorov.

1
=1,067 uniti de timp, unde o

Reamintim elementele de baz ale repartiiei exponeniale

y
Y
f ( y ; )

; f ( y ; ) exp ( y ) ; y 0 ; 0 ; M (Y )

1
1
2
; D (Y ) 2 .

Funcia de repartiie teoretic este F ( y ) 1 exp ( y ) .


Variabila Y discretizat are forma seleciei

yk y1 0,75 y21,25 y3 1,75 y4 2,25 y5 2,75

Y
f 18 8 2 1 1

reprezint frecvenele absolute; f k f ( y k ; ) . Volumul seleciei este n 5 .


Testul lui Kolmogorov se bazeaz pe funcia de repartiie teoretic F ( y ) i pe funcia de repartiie
empiric F *k ( y ) .
Forma repartiiei este specificat (exponenial), dar valoarea parametrului 0 este nespecificat,
adic 0 are valoare necunoscut.
fk

Pasul 0. La metoda 1 am gsit valoarea parametrului 0,938 .


Pasul 1. Aflm valorile funciei empirice F *k ( y ) , care corespunde seleciei din tabelul 5
F*
k ( y ) = (suma frecvenelor absolute mai mici dect y ) / ( N =numrul total de sosiri sau clieni etc.) sau
*
F k ( y ) = (suma frecvenelor absolute din stnga lui y ) / ( N ). La noi N 30 .
18
18 8 26
26 2
0,60 ; F *2

0,867 ; F *3
0,933 ;
30
30
30
30
28 1
29 1
F *4
0,967 ; F *5
1,00 . Rezult tabelul 7P1.
30
30

Exemplu. F 1*

Tabelul 7P1. Funcia de repartiie empiric.


k
1
2
3
fk
18
8
2

4
1

5
1

F *k

0,600
0,867
0,933
0,967
1,000
Pasul 2. Calculm valorile funciei de repartiie teoretic
F ( y ) 1 exp ( y ) ; F k F ( y k ) 1 exp ( 0,938 y k ) pentru fiecare y k din tabelul 5.
F1 F (0,75) 1 exp ( 0,938 0,75) = 0,5052
F 2 F (1,25) 1 exp ( 0,938 1,25) = 0,6904
F 3 F (1,75) 1 exp ( 0,938 1,75) = 0,8063
F 4 F ( 2,25) 1 exp ( 0,938 2,25) = 0,8788
F 5 F ( 2,75) 1 exp ( 0,938 2,75) = 0,9242 .
Pasul 3. Calculm diferenele sau distanele d k = F *k ( y k ) F k ( y k ) i ntocmim tabelul 8.
Tabelul 8P1. Tabloul distanelor dintre repartiia teoretic i cea empiric.
k
1
2
3
4
5
*
Fk
0,600
0,867
0,933
0,967
1,000
Fk
0,5052
0,6904
0,8063
0,8788
0,9242
F*

F
k
k
0,0948
0,1766
0,1267
0,0882
0,0758
Pasul 4. Alegem valoarea maxim dintre toate distanele d k = F *k ( y k ) F k ( y k ) din tabelul 8:
max d k = d 2 = F *2 F 2 = 0,1766; k 1, 5 .
Pasul 5. Alegem nivelul de semnificaie 0,01 .
Pasul 6. Din tabelul valorilor ecuaiei lui Kolmogorov K (c) = 1 alegem valoarea c c ( ) , care
corespunde valorii cunoscute 0,01 . Gsim c c ( ) = c c (0,01) 1,627 .
Funcia K (c) are forma [19; pag 165]
K (c) = 1 2

( 1) r 1 exp (
r 1

echivalent

r 1

(1) r 1 exp ( 2 r 2 c 2 ) =

Pasul 7. Calculm statistica T


Dac valoarea calculat T
Dac valoarea calculat T

2
c ( )

c ( )
n
c ( )
n

2 r 2c 2 )

(funcia lui

Kolmogorov), iar ecuaia are forma

este cunoscut, iar valoarea c este necunoscut.


i aplcm regula de decizie :

> max d k , atunci ipoteza nul H 0 se accept ;


< max d k , atunci ipoteza nul H 0 se respinge.

n cazul problemei de la enunul b) obinem T

c ( )

1,627
0,7276 > max d k = 0,1766.
5

n
H
Ipoteza
Y care reprezint timpul de servire al unui
0 este acceptat, adic variabila aleatoare
f
(
y
;

exp
(

y
)
cumprtor are repartiie exponenial
, cu parametrul 0,938 .
Observaia 7. Prin ambele metode, ipoteza nul H 0 este acceptat cu acelai nivel de semnificaie
0,01 .
Observaia 8. Dac forma funciei de repartiie din ipoteza H 0 este simpl din punctul de vedere al
calculelor, cum este la repartiia exponenial F ( y ) 1 exp ( y ) , atunci repartiia empiric de la testul

lui Kolmogorov se calculeaz mai uor dact frecvenele relative


Kolmogorov este mai avantajos.

f *k

de la testul Hi ptrat i deci testul lui

Problema 2. Test Hi ptrat neparametric; se compar dou mulimi de date; teoretizarea insuccesului.
Studentul S este superstiios. El susine c anumite sli din universitatea n care studiaz i poart ghinion
la examene i de aceea ia numai note de 5 i 6. Pn la absolvire studentul S a dat 120 de examene, n 4 sli
A, B, C, D. Studentul S a urmrit i a notat cte examene a dat n fiecare sal. A rezultat tabelul1P2.
Tabelul 1P2. Datele observate (O)
Sala de examen
Situaia observat (O) cu Numrul de examene

A
24

B
34

C
22

D
40

Total=N=120 de examene.

Decanatul universitii susine c nu exist diferene semnificative ntre cele 4 sli. Studentul S susine
ipoteza contrar. Pentru lmurirea dilemei facem apel la metodele statistice. Formulm ipoteza nul H 0 pe
care urmeaz s o verificm.
Ipoteza nul H 0 : Nu exist diferene semnificative ntre cele 4 sli de examen.
Soluie. Aplicm testul Hi ptrat.
Pentru verificarea ipotezei formulate H 0 folosim testul Hi ptrat. Deoarece nu avem de estimat vreun
parametru , testul este neparametric.
Pasul 1. Calculm frecvenele teoretice. Tabelul 1P2 cu situaia observat (O) a frecvenelor absolute se
completeaz cu situaia probabilistic (P) a frecvenelor teoretice, cnd, teoretic vorbind, studentul S putea
s dea cte 30 de examene n fiecare sal, ca n tabelul 2P2, deoarece, conform ipotezei nu exist diferene
ntre sli.
Tabelul 2P2. Datele observate (O) i datele estimate (P)
Sala de examen
A B
C
Situaia observat (O) cu Numrul de examene
24
34 22
Situaia estimat (P) cu Numrul de examene
30
30 30

D
40
30

Total=N=120 de examene.
Total=N=120 de examene.

Pasul 2. Calculm direct statistica T cerut de testul Hi ptrat


4

T k 1

(Ok Pk ) 2
pentru cele 4 sli. Aranjm calculele pariale n tabelul 3P2
Pk

Tabelul 3P2. Tabel cu calcule pariale pentru statistica Hi ptrat.


Sala de examen
A
B
C
D
Situaia observat (O)
24
34
22
40 Total=N=120 de examene.
Situaia estimat (P)
30
30
30
30 Total=N=120 de examene.
Ok Pk
-6
4
-8
10
2
(Ok Pk )
36
16
64
100
2
(Ok Pk ) / Pk
1,2
0,533 2,133 3,333
Rezult T =7,199 .
Pasul 3. Stabilim numrul gradelor de libertate. Folosim formula

s 1 , unde s = numrul de observaii pentru care Pk f *k 5 , iar

= numrul de parametri estimai.

n cazul problemei de fa avem s 4 i 0 , deoarece am estimat 0 parametrii. Deci 3 , adic


2
2
exist 3 grade de libertate. Statistica are valoarea T 3 7,199 .
Pasul 4. Alegem nivelul de semnificaie 0,05 i cutm n tabela de valori a repartiiei 2
valoarea care corespunde lui 0,05 i 3 , notat
2
2
2

; ( ; ) = (0,05 ; 3) = 7,815.
Pasul 5. Aplicm regula de decizie
Deoarece 32 7,199 < 2 (0,05 ; 3) =7,815 (valoarea calculat este mai mic dect valoarea din
tabel) rezult c se accept ipoteza nul H 0 pe care am formulat-o, adic nu exist diferene
semnificative ntre cele 4 sli de examen. Deci studentul S poate da examen n orice sal, deoarece nu sala
influeneaz rezultatul la examen, ci pregtirea sa pentru examen.
Problema 3. Test Hi ptrat neparametric; se compar dou mulimi de date; analizarea rezultatelor la
un sondaj de atitudine; tabel de contingen.
Problema care urmeaz implic dou grupe de date, rezultate dintr-un sondaj de atitudine.
ntr-o comunitate uman se formuleaz urmroarea ntrebare: suntei de accord ca tinerii s locuiasc
mpreun nainte de cstorie ?.
La ntrebare rspund 450 de persoane, dintre care 200 de persoane sunt religioase i 250 de persoane sunt
nereligioase. Rspunsurile sunt consemnate numeric n tabelul 1P3.
Tabelul 1P3. Frecvene absolute observate (O) la sondaj
1
2
3
Opiunea
Sunt de acord M abin Nu sunt de acord
Persoane religioase
30
46
124
Persoane nereligioase
114
80
56
Total parial
144
126
180

Total1= 200
Total2= 250
Total= 450

Unii dintre respondeni au fcut observaia c nu trebuia fcut separare ntre persoane religioase i
nereligioase, deoarece ntre cele dou grupe nu exist diferene, n timp ce alii sunt de accord cu separarea,
deoarece, spun ei, exist diferene.
a) Pentru lmurirea dilemei facem apel la metodele statistice. Formulm ipoteza nul H 0 pe care
urmeaz s o verificm.
Ipoteza nul H 0 : nu exist diferene ntre cele dou grupe de persoane.
b) S se calculeze reziduul standardizat R k la fiecare tip de rspuns.
Soluie. a) Aplicm testul Hi ptrat.
Tabelul de contingen 1P3 are 2 linii i 3 coloane, adic are tipul 2 x 3.
Deoarece nu avem de estimat vreun parametru , testul este neparametric.
Pasul 1. Calculm frecvenele teoretice. Tabelul 1P3 cu situaia observat (O) a frecvenelor absolute se
completeaz cu situaia probabilistic (P) a frecvenelor teoretice, care se pot calcula pentru 450 de persoane,
deoarece, conform ipotezei H 0 nu exist diferene ntre cele dou grupe.
Rezultatele sunt trecute n tabelul 2P3.
1) La opiunea: Sunt de accord au rspuns 144 de persoane. Procentul este

144
0,32 sau 32%.
450

32% din respondenii religioi nseamn 0,32 x 200= 64 de persoane


32% din respondenii nereligioi nseamn 0,32 x 250= 80 de persoane
2) La opiunea: M abin au rspuns 126 de persoane. Procentul este

126
0,28 sau 28%.
450

28% din respondenii religioi nseamn 0,28 x 200= 56 de persoane


28% din respondenii nereligioi nseamn 0,28 x 250= 70 de persoane
3) La opiunea: Nu sunt de acord au rspuns 180 de persoane. Procentul este

180
0,40 sau 40%.
450

40% din respondenii religioi nseamn 0,40 x 200= 80 de persoane


40% din respondenii nereligioi nseamn 0,40 x 250= 100 de persoane .
Proba procentelor este 32% + 28% + 40% = 100% (corect) .
Tabelul 2P3. Frecvene absolute observate (O) i frecvene teoretice (P)
1
2
3
Opiunea
Sunt de acord M abin Nu sunt de acord
Persoane religioase
30
46
124
Total1= 200
Frecvene teoretice
64
56
80
Total1= 200
Persoane nereligioase
Frecvene teoretice
Total parial

114
80
144

80
70
126

56
100
180

Total2= 250
Total2= 250
Total= 450

Pasul 2. Deoarece, conform ipotezei H 0 nu exist diferene ntre cele dou grupe, unificm datele i
obinem talelul 3P3
Tabelul 3P3. Tabel unificat cu frecvene absolute i frecvene teoretice.
Opiunea Sunt de acord M abin Nu sunt de acord Sunt de acord M abin Nu sunt de acord
Ok
30
46
124
114
80
56
450
Pk
64
56
80
80
70
100
450
Pasul 3. Calculm datele pariale necesare la statistica Hi ptrat i le aranjm n tabelul 4P3.
Tabelul 4P3. Tabel cu calcule pariale pentru statistica Hi ptrat.
k
1
2
3
4
5
6
Ok
30
46
124
114
80
56
Pk
64
56
80
80
70
100
Ok Pk
- 34
- 10
44
34
10
- 44
2
(Ok Pk )
1156
100
1936 1156
100
1936
2
(Ok Pk ) / Pk 18,0625
1,7857
24,2
14,45
1,4286
19,36
Pasul 4. Calculm statistica Hi ptrat

Pasul 5. Stabilim numrul gradelor de libertate.

6 (Ok Pk )
k 1
Pk

= 79,2867 .

Pentru tabelul de contingen (tabelul 1P3), care are r linii (rows) i c coloane (columns) numrul
gradelor de libertate se calculeaz cu formula ( r 1) (c 1) . n cazul problemei noastre obinem
( 2 1) (3 1) 2 ; exista 2 grade de libertate.
Deci statistica 2 are valoarea T 22 79,2867 .
Pasul 6. Alegem nivelul de semnificaie 0,01 i cutm n tabela de valori a repartiiei 2
valoarea care corespunde lui 0,01 i 2 , notat
2
2
2

; ( ; ) = (0,01; 2) = 9,210.
Pasul 7. Aplicm regula de decizie.
Deoarece 22 79,2867 > 2 (0,01; 2) =9,210 (valoarea calculat este mai mare dect valoarea din
tabel) rezult c nu se accept ipoteza nul H 0 pe care am formulat-o, adic exist diferene
semnificative ntre cele 2 grupe de persoane religioase i nereligioase.
b) Reziduul standardizat este un indicator numeric R k R care arat ce categorie a adus o contribuie
major la obinerea unei diferne semnificative la calcularea statisticii 2 .
Reziduul standardizat se calculeaz cu formula

Rk

Ok P k
.
Pk

Dac R k 2 , atunci elementul k are un rol important la obinerea unui 2 semnificativ.


n cazul problemei 3 calculm reziduul standardizat din tabelul 4P3 i aezm rezultatele n talelul 5P3.
Tabelul 5P3. Reziduul standardizat.
k
Ok

Pk
Ok Pk
Rk

1
30
64
- 34
- 4,45

2
46
56
- 10
- 1,33

3
124
80
44
4,88

4
114
80
34
3,77

5
80
70
10
1,19

6
56
100
- 44
- 4,40

| R1 | 2
| R 3 | 2

i | R 4 | 2 se refer la opiunea de rspuns Sunt de acord.


i | R 6 | 2 se refer la opiunea de rspuns Nu sunt de acord.
Aceste dou rspunsuri au un rol important la obinerea unui 2 semnificativ.
Observaie. A) La tabelele de contingen de tip 2 x 2 (ca n problema 3) se recomand ca numrul de
respondeni s fie N >20.
B) Dac tabelul de contingen este, de exemplu, de tip 3 x 3 atunci tabelul 3P3 se completeaz cu nc 3
coloane asemntoare cu cele anterioare. Analog pentru tabele de contingen de alt tip.
Problema 4. [19; pag 164] Repartiie Poisson; testul Hi ptrat.
Pentru o mai bun organizare a activitii la o staie de pompare a apei, ntr-o perioad de 100 de zile s-a
nregistrat numrul k de avarii zilnice i s-a obinut urmtorul rezultat:
0 avarii n
8 zile ; 1 avarie n 28 zile ; 2 avarii n 31 zile
3 avarii n 18 zile ; 4 avarie n 9 zile ; 5 avarii n 6 zile .
Formulm ipoteza nul H 0 pe care trbuie s o verificm.
Ipoteza nul H 0 : Variabila aleatoare X care reprezint numrul de avarii zilnice are repartiie Poisson.
Soluie. Variabil aleatoare X are forma

0 1 2 3 4 5

X
8 28 31 18 9 6

; N 8 28 31 18 9 6 100 .

Linia 1 conine numrul de avarii k ; linia 2 conine frecvenele absolute f k ; k 0 ; 5 .


Repartiia discret Poisson are forma

k
X
f (k ; )

f k f (k ; ) exp ( )

k
k!

; 0 ; k 0 ; . n problema noastr k 0 ; 5 .

Se tie c M ( X ) ; D 2 ( X ) . Repartiia Poisson are un parametru 0 necunoscut.


Verificm ipoteza H 0 cu ajutorul testului Hi ptrat.
Pasul 0. nti trebuie s estimm parametrul . Folosim media de selecie
X

1
N

210

k 0 k f (k ; ) 100 (0 8 1 28 2 31 3 18 4 9 5 6) 100 2,1

M ( X ) X 2,1 ; 2,1 ; f k f ( k ; 2,1) exp ( 2,1)

2,1 k
k!

f k f ( k ;2,1) 0,1225

2,1 k
k!

Pasul 1. Determinm elementele necesare la calculare statisticii T, care corespunde datelor numerice ale
variabilei X .
Statistica T are dou forme echivalente, bazate respectiv pe frecvenele teoretice f *k sau probabilitile
teoretice p *k .
n
Varianta 1. T k 0

( f k f *k ) 2
f *k

, unde f

sunt frecvenele absolute; f

f *k = N f k ;

Varianta 2. T

f *
k N f (x k ; ) ; N
( f k N p *k ) 2
n
, unde
k 0
N p *k

determinat.
Varianta 1. Calculm frecvenele teoretice f

*
k

f1 f2 fn ,
p *k

*
k

sunt frecvenele teoretice;

cu determinat.

= f ( x k ; ) sunt probabilitile teoretice, cu

bazate pe ipoteza nul formulat.


k

2,1
f *k N f k ; f *k 100 f ( k ; ) = 100 f ( k ; 2,1) 100 0,1225
k!

Metoda 1. Folosim formula teoretic ; f *k = 12,25

2,1 k
k!

; k 0;5 .

Punem datele n tabelul 1P4


Tabelul 1P4. Frecvenele absolute i frecvenele teoretice.

2,1 k
f *k = 12,25
k!

; k 0;5 .

0
1
2
3
4
5
fk
8
28
31
18
9
6
(suma=100)
*
f k
12,25 25,725 27,0113 18,9079 9,9266 4,1692 (suma= 98).
Proba frecvenelor calculate f *k : 12,25+25,725+..+ 9,9266+4,1692= 98; aproximaie bun.
Metode 2. Se pot deduce i folosi formule de recuren pentru f *k .
Varianta 2. Calculm probabilitile teoretice p *k bazate pe ipoteza nul formulat
p *k
p *k

= f (x k ; ) ;

p *k

= f (k ; ) ; k 0 ; 5 ;

= f (k ;2,1) exp (2,1)

2,1
k!

p *k

f ( k ; ) exp ( )

= f (k ;2,1) exp (2,1)

k
k!

2,1 k
k!

= 0,1225

2,1 k
k!

Punem rezultatele n tabelul 2P4


Tabelul 2P4. Frecvenele absolute i probabilitile teoretice.
k
0
1
2
3
4
5
fk
8
28
31
18
9
6
(suma=100)
*
pk
0,1225 0,2525 0,270113 0,189079 0,099266 0,041692 (suma= 0,98).
Proba probabilitilor calculate p *k : 0,1225+0,25725++ 0,099266+0,041692= 0,98; aproximaie bun.
Pasul 2. Calculm statistica T , care corespunde datelor numerice ale variabilei X .
Varianta 1.

T k 0

( f k f *k ) 2
f *k

, prin tabelul 3P4

Tabelul 3P4. Frecvenele absolute i frecvenele teoretice.


k
0
1
2
3
4
fk
8
28
31
18
9
*
f k
12,25 25,725 27,0113 18,9079 9,9266
*
fk f k
- 4,25
2,275
3,9887 - 0,9097 - 0,9266
* 2
( f k f k ) 18,0625 5,1756 15,9097
0,8276
0,8586
( f k f *k ) 2
f *k

1,4745

0,2145

0,5890

0,0437

0,0865

5
6
(suma=100)
4,1692 (suma= 98).
1,8830
3,5457
0,8505

T (varianta 1) ; T = 4,49425 .
5
Varianta 2. T k 0

( f k N p *k ) 2
N p *k

, prin tabelul 4P4

Tabelul 4P4. Frecvenele absolute i probabilitile teoretice.


k
0
1
2
3
4
5
fk
8
28
31
18
9
6
(suma=100)
*
f k
12,25
25,725 27,0113 18,9079
9,9266
4,1692
(suma= 98).
*
pk
0,1225 0,2525 0,270113 0,189079 0,099266 0,041692 (suma= 0,98).
f k N p *k
- 4,25
2,275
3,9887 - 0,9097
- 0,9266
1,8830
T (varianta 2) ; T = 4,485 .
Pasul 3. Calculm numrul gradelor de libertate care corespunde datelor numerice ale variabilei X .

s 1 , unde s = numrul de observai , iar

= numrul de parametri estimai.

n cazul problemei de fa avem s 6 i 1 , deoarece am estimat un parametru notat . Deci


4 , adic exist 4 grade de libertate.
Statistica T 2 24 are valoarea 24 4,49425 n varianta 1 de calcul.
Statistica T 2 24 are valoarea 24 4,485 n varianta 2 de calcul.
Pasul 4. Alegem nivelul de semnificaie 0,05 i cutm n tabela de valori a repartiiei 2
valoarea care corespunde lui 0,05 i 4 , notat
2 ; 2 ( ; ) = 2 (0,05 ; 4) = 9,488.
Pasul 5. Aplicm regula de decizie.
Deoarece 24 4,49425 < 2 (0,05 ; 4) =9,488 (valoarea calculat este mai mic dect valoarea din
tabel) rezult c se accept ipoteza nul H 0 pe care am formulat-o, adic variabila aleatoare X care
reprezint numrul de avarii zilnice are repartiie Poisson, cu parametrul
2,1 ; M ( X ) = 2,1 i D 2 ( X ) = 2,1.
9.9 Program surs C++ pentru testul Hi ptrat n cazul normal unidimensional. Cazul specificat.
9.9.1 Descrierea programului surs [17].
// Program 23 Cpp Hi2 TEST Normal Unidimensional
// Calculam: Amin, Bmax ; punctele a0 a1...aL; frecventele frequencies f1 f2fL
#include <iostream.h>;
#include <conio.h>;
#include <math.h>;
// Sectiunea 0:declaram variabilele si vectorii din programul C++
// Nel=nr de elemente pe fiecare linie din cele N1 valori de selecie
int i,j,k,N,N1,Nel,pai,restdate,L,fri[51],paiL1,restaiL1,paiL;
int restfri,sumafri;
float A, Amin, B, Bmax,xjsel[500],estmed,estdisp,fictiv,h;
float a0,ainf,ai[51],ui[51],pi[51],vmed,sigm2,sigma;
void main ()
{ // Inceputul programului
cout<<endl;
cout<<" Introduceti N=nr elementelor de selectie N(0,1)
N= ";
cin>>N;
cout<<" Introduceti N1=nr de elemente din care se calculeza Amin, Bmax N1= ";
cin>>N1;
cout<<" Introduceti Nel=nr de elemente pe fiecare rand de date
Nel=";
cin>>Nel;
cout<<endl;
// Sectiunea 1: Se introduc N valori de selectie notate xjsel de tip N(0,1)
cout<< Introduceti sau incarcati din fisier N vaori de selectie xjsel N(0,1) \n;
for(i=1;i<=N;i++)

{cout<< ;cin>>xjsel[i]; }
cout<<endl;
// Se tiparesc N1 date de intrare , existe Nel valori pe fiecare linie (rand)
pai=floor(N1/Nel); // Instructiunea floor calduleaza Partea Intreaga
cout<<" N1 valori xjsel N(0,1) cu Nel elementse pe fiecare rand: pai= ";
cout<<pai; cout<<endl;
for(k=1;k<=pai;k++)
{cout<<endl;
for(j=(k-1)*Nel+1;j<=k*Nel;j++)
{cout<<" ";cout<<xjsel[j];cout<<" ";}
}
// Se tipareste randul incomplet de elemente xjsel N(0,1)
cout<<endl;
restdate=pai*Nel+1;
for(j=restdate;j<=N1;j++)
{cout<<" ";cout<<xjsel[j];cout<<" ";}
cout<<endl;cout<<endl;
// Section 2:Estimeaza valoarea medie si dispersia pentru N1 date de tip N(0,1)
estmed=0.0;estdisp=0.0;
for (i=1;i<=N1;i++)
{estmed=estmed+xjsel[i];}
estmed=estmed/N1;
cout<<" Valoarea medie estimat pentru N1 xjsel N(0,1) este estmed= ";
cout<<estmed;
cout<<endl;
for(i=1;i<=N1;i++)
{estdisp=estdisp+(xjsel[i]-estmed)*(xjsel[i]-estmed);}
estdisp=estdisp/(N1-1);
cout<<" Dispersia estimat pentru N1 xjsel N(0,1) este estdisp= ";
cout<<estdisp;
cout<<endl;cout<<endl;
// Transforma N date xjsel N(0,1) in N date normale N(vmed,sigm2)
cout<<" Introduceti val medie vmed si dispersia sigm2propuse de utilizator the user \n";
cout<<" vmed= ";cin>>vmed; cout<<" sigm2= ";cin>>sigm2;
for (j=1;j<=N;j++)
{xjsel[j]=vmed+xjsel[j]*sqrt(sigm2);} cout<<endl;
// Print N1 date transformate N(vmed,sigm2),Nel elemente pe fiacre rand
pai=floor(N1/Nel);
cout<<" N1 date transformate xjsel genereaza pai randuri: pai= ";
cout<<pai;
cout<<endl;
for(k=1;k<=pai;k++)
{cout<<endl;

for(j=(k-1)*Nel+1;j<=k*Nel;j++)
{cout<<" ";cout<<xjsel[j];cout<<" ";}
}
// Print randul incomplete din N1 date transformate N(vmed,sigm2)
cout<<endl;
restdate=pai*Nel+1;
for(j=restdate;j<=N1;j++)
{cout<<" ";cout<<xjsel[j];cout<<" ";}
cout<<endl;cout<<endl;
// Sectiunea 3:Estimeaza valoarea medie si dispersia pentru N1 date N(vmed,sigm2)
estmed=0.0;estdisp=0.0;
for (i=1;i<=N1;i++)
{estmed=estmed+xjsel[i];}
estmed=estmed/N1;
cout<<" Valoarea medie estimat pentru N1 xjse N(m,s) este estmed= ";
cout<<estmed;
cout<<endl;
for(i=1;i<=N1;i++)
{estdisp=estdisp+(xjsel[i]-estmed)*(xjsel[i]-estmed);}
estdisp=estdisp/(N1-1);
cout<<" Dispersia estimat pentru N1 xjsel N(m,s) este estdisp= ";
cout<<estdisp;
cout<<endl;cout<<endl;
// Calculeaza A=Amin,B=Bmax pentru N1 date transformate xjsel N(vmed,sigm2)
A=xjsel[1]; B=xjsel[1];
for(i=2;i<=N1;i++)
{if(A-xjsel[i]>=0) A=xjsel[i];
else fictiv=1; // Variabil c este fictiva
if(B-xjsel[i]<=0) B=xjsel[i];
else fictiv=1; }
Amin=A; Bmax=B;
cout<<" Minimum valoare este Amin= ";
cout<<Amin;cout<<endl;
cout<<" Maximum valoare este Bmax= ";
cout<<Bmax;cout<<endl;cout<<endl;
// Calculeaza pasul h de echidistanta
cout<<" Introduceti L<=50, L=nr de intervale deltai L= ";cin>>L;
cout<<endl;
h=(B-A)/(L-2);
cout<<" Valoarea pasului h este h= ";cout<<h;cout<<endl;
cout<<endl;
// Section 4:Calculeaza si tipareste punctele ai:a0 a1...aL
a0=-100000.0;ai[1]=Amin;ai[L-1]=Bmax;ainf=100000.0;ai[L]=ainf;
// Verificare de control

for(i=2;i<=L-2;i++)
{ai[i]=Amin+(i-1)*h;}
cout<<" Punctele a0 a1...aL-1 aL sunt scrise cate Nel elemente pe rand : \n";
cout<<endl;
paiL1=floor((L-1)/Nel); cout<<" paiL1= ";
cout<<paiL1;
cout<<endl; cout<<endl;
cout<<" a0= ";cout<<a0;
for(k=1;k<=paiL1;k++)
{cout<<endl;
for(i=(k-1)*Nel+1;i<=k*Nel;i++)
{cout<<" ";cout<<ai[i]; cout<<" ";}
}
// Print randul incomplet de puncte ai
cout<<endl;
restaiL1=paiL1*Nel+1;
for(i=restaiL1;i<=L-1;i++)
{cout<<" ";cout<<ai[i];cout<<" ";}cout<<endl;
cout<<" aL= "; cout<<ai[L];
cout<<endl;cout<<endl;
// Section 5:Calculeaza si tipareste frecventele s f1...fL pentru N valori N(m,s)
for(i=1;i<=L;i++)
{fri[i]=0;}
// La inceput se calculeaza f1 si fL
for(j=1;j<=N;j++)
{if(xjsel[j]<Amin) fri[1]=fri[1]+1;
else fictiv=1;
if (xjsel[j]>=Bmax) fri[L]=fri[L]+1;
else fictiv=1;}
// Calculeaza frecvaentele f2...fL-1
for (i=2;i<=L-1;i++)
{for(j=1;j<=N;j++)
if ((ai[i-1]<=xjsel[j])&(xjsel[j]<ai[i])) fri[i]=fri[i]+1;
else fictiv=1;}
// Print toate frecventele f1...fL
cout<<" Frecventele f1...fL pentru N val xjsel sunt Nel valori pe rand ";
cout<<endl;
paiL=floor(L/Nel);cout<<" paiL= ";cout<<paiL;cout<<endl;
cout<<endl;
for(k=1;k<=paiL;k++)
{cout<<endl;
for (i=(k-1)*Nel+1;i<=k*Nel;i++)
{cout<<" ";cout<<fri[i];cout<<" ";}
}
// Print randul incomplet de frecvente fi

cout<<endl;
restfri=paiL*Nel+1;
for (i=restfri;i<=L;i++)
{cout<<" ";cout<<fri[i];cout<<" ";}cout<<endl;
// Verificare pentru frecvente f1+f2+...+fL=N
sumafri=0;
for(i=1;i<=L;i++)
{sumafri=sumafri+fri[i];}
cout<<" Verificare frecvente f1+f2+...+fL=N sumafri= ";
cout<<sumafri;
cout<<endl; cout<<endl;
// Section 6: Calculeaza punctele u1...uL-1 de forma ui=(ai- vmed)/sigma
// Punctele u1...uL-1 sunt folosite la calcularea probabilitatilor
sigma=sqrt(sigm2);
ui[1]=(A-vmed)/sigma; ui[L-1]=(B-vmed)/sigma;
for(i=2;i<=L-2;i++)
{ui[i]=(ai[i]-vmed)/sigma;}
// Print toate punctele u1...uL-1
cout<<" Punctele u1...uL-1 sunt cate Nel valori pe rand : \n";
paiL1=floor((L-1)/Nel); cout<<" paiL1= ";cout<<paiL1;
cout<<endl<<endl;
for(k=1;k<=paiL1;k++)
{cout<<endl;
for(i=(k-1)*Nel+1;i<=k*Nel;i++)
{cout<<" ";cout<<ui[i];cout<<" ";}
}
// Print randul incomplet de elemente u1...uL-1
cout<<endl;
restaiL1=paiL1*Nel+1;
for(i=restaiL1;i<=L-1;i++)
{cout<<" ";cout<<ui[i];cout<<" ";}
cout<<endl;cout<<endl;cout<<endl;
getch();
} // Sfarsitul programului
9.9.2 Rezultate numerice obtinute cu programul C++
Programul C++ controleaza toti pasii algoritmului algorithm 1 si tipareste rezultatele (fara
probabilitatil;e pi si statistica T) .
Introducetit N=nr de date de selectie de tip N(0,1)
Introduceti N1=nr de puncte din care se calculeaza ,Bmax
Introduceti Nel=nr de elemente pe fiecare rand

N=10
N1=9
Nel=5

Introduceti sai incarcati din fisier N valori de selctie de tip N(0,1)

N1 valori xjsel N(0,1) cu Nel elemente pe rand pai=1


0.0219 -1.781 -0.5625 -0.6318 -1.1258
0.4843
0.2722 -0.7253 -2.3801
Valoera medie estimata pentru N1 valori xjsel N(0,1) este
estmed=-0.714233
Dispersia estimat pentru N1 valori xjsel N(0,1) este
estdisp= 0.882982
Introduceti val medie vmed si dispersia sigm2 propuse de utilizator
vmed=0.0
sigm2=1.0
N1 valori transformate xjsel genereaza pai randuri : pai=1
0.0219 -1.781 -0.5625 -0.6318 -1.1258
0.4843
0.2722 -0.7253 -2.3801
Valoarea medie estimata pentru r N1 valori xjsel N(m,s) este
estmed= -0.714233
Dispresie estemata pentru N1 valori xjsel N(m,s) este
estdisp=0.882982
Valoarea Minimum este
Amin=-2.3801
Valoerea Maximum este
Bmax=0.4843
Introduceti L<=50, L=nr de intervale deltai

L=14

Valoarea pasului h este h=0.2387


Punctele a0 a1 a2 aL-1 scrise cata Nel valori pe rand
paiL1= 2
a0=-1000000
-2.3801 -2.1414 -1.9027
-1.1866 -0.9479 -0.7092
0.0069
0.0.2456 0.4843
aL=100000
Freventele
pail= 2
0 1 0
0 1 1
0 1 1
Verificare

-1.664 -1.4253
-0.4705 -0.2318

f1 f1fL pentru N valori xjsel sunt Nel pe fiecare rand


1
2
2

0
0

f1+f2++fL=N sumafri= 10

Puncte u1 uL-1 sunt Nel pe fiecare rand


-2.3801 -2.1414 -1.9027 -1.664 -1.4253
-1.1866 -0.9479 -0.7092 -0.4705 -0.2318
0.0069
0.0.2456 0.4843.
9.10 Concluzii
Testele de verificarea ipotezelor statistice ( the tests of goodnes of fit) sunt foarte importante din punct
de vedere teoretic i practic. Cel mai important este testul Hi ptrat pentru repartiia normal
unidimensional sau multidimensional, n cazul specificat sau nespecificat. Acest test se folosete la
estimarea parametrilor de ncredere la funcionarea unor dispositive tehnice, n probleme de risc sau toleran
etc. Capitolul 9 prezint patru algoritmi. Elaborarea programelor de calculator pentru aceti algoritmi este
foarte util n rezolvarea unor probleme tehnice sau economice.

S-ar putea să vă placă și