Sunteți pe pagina 1din 16

TESTUL HI PTRAT

TESTUL HI PTRAT
Analiza frecvenelor pentru variabile msurabile pe o
scar nominal sau ordinal
Test neparametric care verific dac distribuia
observat difer de cea ateptat (teoretic)

TESTUL HI PTRAT
n aplicare testului Hi-ptrat ntotdeauna:

Frecvenele sunt date de numrul de cazuri i nu reprezint


procente sau ranguri
Categoriile sunt exhaustive i mutual exclusive: orice subiect
poate aparine unei categorii i numai uneia
fio -frecvena observat i fit -frecvena teoretice (ateptat),
i=1,2,..,n.
Statistica testului (ecartul ntre cele dou tabele) notat cu 2
se calculeaz prin formula:

0 f t )2
(
f
L

C
2 i t i
f
i1
i

TESTUL HI PTRAT
Servete la compararea a dou distribuii,
urmnd dou modele, care constau n:
compararea unei distribuii observate (sau empirice)
pe un eantion cu o distribuie teoretic. In acest caz,
se caut s se determine dac un eantion se
aseamn cu un anumit model teoretic, fiind astfel
vorba de un test Hi-ptrat de ajustare.
compararea a dou distribuii observate n scopul
stabilirii fie a independenei dintre dou criterii sau
omogenitatea dintr-un tabel de contingen. Este
vorba n acest caz de un test Hi-ptrat de
omogenitate sau de independen.

TESTUL HI PTRAT - PASI


Se formuleaz ipoteza de independen ntre
cele dou caractere M i T (adic ipoteza
nul H0 , n acest caz)
Se calculeaza un tabel de contingen
teoretic care satisface aceast ipotez de
independen.
Se determin abaterea (ecartul) dintre cele
dou tabele de contingen (observat i
teoretic).
Dac aceast abatere este mic atunci ea
este explicat doar prin ntmplare (hazard) i
ipoteza de independen este acceptat.

DISTRIBUIA HI-PATRAT

Se poate arta c dac ipoteza de independen este


satisfcut, atunci 2 determinat prin formula se supune
unei legi de probabilitate (Hi-ptrat) cu (L-1)(C-1) grade
de libertate.
Pentru aceast lege 2, se poate determina valoarea 2 ce
corespunde pragului de semnificaie i care verific
condiia:
Pr(2 2 ) = .
Cu ajutorul acestei valori se definete regiunea critic a
testului [2 ,), unde sub ipoteza nul, 2 are o
probabilitate de a se gsi.

EXEMPLU
Se caut efectul fumatului asupra mbolnvirii de o maladie dat
(M). Pentru aceasta se observ un eantion de 400 de subieci
dintre care:
160 au boala M prezent, 240 nu au boala M prezent
130 sunt fumtori i 270 nu sunt fumtori

Tabelul de contingen observat (cu frecvenele observate)

CALCULUL TABELULUI DE CONTINGEN


TEORETIC

Trebuie s completm un tabel de contingen teoretic


(numit i tabel de contingen calculat)
Ipoteza de independen dintre cele dou caractere M i
F permite s se calculeze probabilitile:
Pr(M F) = Pr(M) Pr(F), unde
- Pr(M F) este probabilitatea de a avea simultan
caracterele M i F
- Pr(M) este probabilitatea de a avea caracterul M
- Pr(F) este probabilitatea de a avea caracterul F.

EXEMPLU-CONTINUARE
Estimri ale acestor probabiliti se obin astfel:
Pr(M) =
Pr(F) =

Numarul de indivizi avind M 160

Numarul total de indivizi


400

i analog,

130
,
400

Numaruldeindiviziavind M siF F ( F , M )

Pr(MF) =
,
Numarultotal deindivizi
400

unde F(F,M) este frecvena teoretic (cutat) din prima


csu a tabelului de contingen teoretic.
Deci F(F,M) se calculeaz prin formula:
F(F,M) = (Pr(M) Pr(F))/n =

130 160
52
400

EXEMPLUCONTINUARE

La fel se calculeaz i celelalte frecvene teoretice

Acest mod de calcul se aplic i n cazul general


cnd cele dou caractere studiate au fiecare un
numr de modaliti (valori) de realizare arbitrar ( 2).

EXEMPLU-CONTINUARE

Se poate astfel constata c pentru un tabel de contingen


teoretic 2x2 este suficient s calculeze o frecven teoretic
pentru a putea determina tabelul n ntregime.

Aceast proprietate se regsete i n cazul general a unui


tabel cu L linii i C coloane, unde este suficient s se calculeze
primele (L-1) x (C-1) frecvene teoretice celelalte obinndu-se
prin diferene. Se va vedea c produsul (L-1) x (C-1) definete
numrul de grade de libertate al lui Hi-patrat.

ETAPELE TESTULUI
In continuare se vor prezenta cele ase etape
testarea independeei a dou caractere.
Cazul general
Problema
Se ncearc s se determine, cu
ajutorul unui eantion de n
subieci, dac dou caractere A
i B avnd L i respectiv C
modaliti de realizare sunt sau
nu independente.
Etapa 1.
Definirea ipotezei H0 : caracterele A i B sunt
independente.
nule H 0

ale testului 2 utilizat pentru


Ilustrarea printr-un exemplu
Fumatul (F) i o maladie (M)
sunt independente? In acest
caz, L=C=2, iar eantionul
observat are n=400 subieci
repartizai n tabelul de
contingen prezentat mai sus.
H0 : fumatul nu are influen
asupra apariiei maladiei M.

ETAPELE TESTULUI
Etapa 2.
Definirea unui
parametru

Etapa 3.
Alegerea unui
prag de
semnificaie
Etapa 4.
Definirea regiunii
critice

0
t 2
(
f

f
)
i
i
2
X
f it
i 1
2 cu (L-1) x
urmeaz o lege

0
t 2
(
f

f
)
i
i
2
X
f it
i 1
2
urmeaz o
lege
cu 1 grad

(C-1) grade de libertate

de libertate .

Fie pragul de semnificaie al


testului.

S-a ales pragul de semnificaie


= 0.05

Tinnd seama de faptul c X2


2 cu (L-1) x
urmeaz legea
(C-1) grade de libertate se
2
determin valoarea
nct

2 i
Pentru pragul =0.05
cu
2
1 grad de libertate valoarea
= 3.84, astfel c n acest caz
regiunea critic este intervalul
[3.84 , ).

LC

2 2 ) = . Regiunea
P(
critic este[2 ,).

LC

ETAPELE TESTULUI
- Se calculeaz frecvenele
Etapa 5.
Calcularea valorii teoretice
total linie total coloana
observate
a
t
fi =
parametrului
n
- Se calculeaz

( f i0 f it ) 2
X
f it
i 1
LC

Etapa 6.
Decizia

Dac X2 [3.84, ) se
respinge H0 cu un risc de
eroare de prima spet .
Dac X2 [3.84, ) atunci
H0 nu se respinge,
acceptndu-se H0 cu un
risc de eroare de spea a
doua

(80 52) 2
Se calculeaz X =
52
2
(50 78) (80 108) 2
+
+
+
78
108
(190 162) 2
+
=37.2
162
2

X2 >> 3.84 aa c ipoteza nul


H0 se respinge cu un risc
inferior lui 5%.
In concluzie, fumatul are
influen asupra maladiei M
favoriznd-o.

OBSERVAII
1) Testul nu se poate aplica dect dac toate
frecvenele teoretice sunt mai mari sau egale dect 5.
2) In cazul tabelelor de contingen 2x2 dac tabelul
de contingen observat este de forma:
a b
c d
n
se poate arta uor c :
2

(ad bc) 2 n

(a b) (c d ) (a c) (b d ) ,
2

ceea ce n anumite cazuri simplific calculele.