Sunteți pe pagina 1din 10

TESTUL HI-PĂTRAT

 compararea a două distribuţii observate în scopul


stabilirii fie a independenţei dintre două criterii
sau omogenitatea dintr-un tabel de contingenţă

 Frecvenţele sunt date de numărul de cazuri şi nu


reprezintă procente sau ranguri
 Categoriile sunt exhaustive şi mutual exclusive:
orice subiect poate aparţine unei categorii dar
numai uneia

Variabila
calitativa

Tabel de Test Chi2


contingenta

Variabila
calitativa
SEMNE DIAGNOSTICE
Esantion Se şi Sp, VPP şi VPN, LR
reprezentativ Prevalenta

Se şi Sp, LR
Caz- VPP 
sensibilit ate  prevalenta
sensibilit ate  prevalenta  (1  specificit ate )  (1  prevalenta )

martor VPN 
specificit ate  (1  prevalenta )
specificit ate  (1  prevalenta )  (1  sensibilit ate )  prevalenta

VPP şi VPN, LR
Expus -
nonexpus

FACTORI DE RISC
Esantion RIE, RIN, RR, RA
reprezentativ Prevalenta

Caz- OR
martor

Expus -
RIE, RIN, RR, RA
nonexpus
EXEMPLU
 Astfel vom presupune că se caută efectul
fumatului asupra îmbolnăvirii de o maladie dată
(M). Pentru aceasta se observă un eşantion de
400 de subiecţi dintre care:
 160 au boala M prezentă ( şi 240 nu au boala
prezentă )
 130 sunt fumători T ( şi 270 nu sunt fumători ).

TABEL DE CONTINGENŢĂ

Maladia M
Fumător T M M Total
T 80 50 130
T 80 190 270
Total 160 240 400
DECI
 Se caută să se stabilească dacă fumatul
influenţează apariţia maladiei M sau dacă
apariţia acesteia este independentă de fumat.
 Tabelul de contingenţă prezentat anterior este
obţinut prin observarea unui eşantion de 400 de
indivizi. Acesta se numeşte tabel de contingenţă
observat, iar frecvenţele pe care le conţine se
numesc frecvenţe observate.

PRINCIPIUL TESTULUI 2

 Astfel dacă se face ipoteza de independenţă între cele două


caractere M şi T (adică ipoteza nulă H0 , în acest caz)
atunci se poate calcula un tabel de contingenţă teoretic care
satisface această ipoteză de independenţă. Se determină
apoi abaterea (ecartul ) dintre cele două tabele de
contingenţă observat şi teoretic.
 Dacă această abatere este mică atunci ea este explicată
doar prin întâmplare (hazard) şi ipoteza de independenţă
este acceptată. Dacă această abatere este foarte importantă
pentru ca doar întâmplarea să o explice atunci ipoteza de
independenţă trebuie să fie respinsă.
 Pentru efectuarea testului este deci necesar să se ştie:
 calcula tabelul de contingenţă teoretic
 determina ecartul dintre cele două tabele de contingenţă.

CALCULUL TABELULUI DE
CONTINGENŢĂ TEORETIC

Maladia M
Fumător T M M Total
T 80 50 130
T 80 190 270
Total 160 240 400

M M Total
T 130  160 130  240 130
400 400
270  160 270  240 270
T 400 400

Total 160 240 400

TABELUL DE CONTINGENŢĂ TEORETIC


M M Total
T 52 130-52 130
T 160-52 270-(160-52) 270
Total 160 240 400

M M Total
T 52 78 130
T 108 162 270
Total 160 240 400
OBSERVAŢIE
 Se poate astfel constata că pentru un tabel de
contingenţă teoretic 2 x 2 este suficient să
calculeze o frecvenţă teoretică pentru a putea
determina tabelul în întregime.
 Această proprietate se regăseşte şi în cazul
general a unui tabel cu L linii şi C coloane, unde
este uşor de constatat că este suficient să se
calculeze primele (L-1) x (C-1) frecvenţe teoretice
celelalte obţinându-se prin diferenţe. Se va vedea
că produsul (L-1) x (C-1) defineşte numărul de
grade de libertate al lui  2

ECARTUL DINTRE CELE DOUĂ TABELE DE


CONTINGENŢĂ

 Fie fio şi fit frecvenţele observate şi teoretice (i=1,2,..,n)


situate în aceleaşi poziţii în cele două tablouri (de
exemplu, f10=80 şi f1t=52). Ecartul între cele două
tabele notat cu X2 se calculează prin formula:

( fi0  fit )2
LC
X 
2

i 1 fit
DISTRIBUŢIA 
2

Se poate arăta că dacă ipoteza de independenţă este satisfăcută atunci X2


determinat prin formula de mai sus se supune unei legi de probabilitate  2 (Hi-pătrat) cu
(L-1) x (C-1) grade de libertate.
Pentru această lege  2 se poate determina valoarea 2 ce corespunde pragului
de semnificaţie  şi care verifică condiţia:
Pr(  2  2 ) =  .
Cu ajutorul acestei valori se defineşte regiunea critică a testului [ 2 ,), unde sub
ipoteza nulă, X2 are o probabilitate  de a se găsi.

ETAPELE TESTULUI

Cazul general Ilustrarea printr-un exemplu


Problema Se încearcă să se determine, cu Fumatul (T) şi o maladie (M) sunt
ajutorul unui eşantion de n independente? In acest caz,
subiecţi, dacă două caractere A şi L=C=2, iar eşantionul observat are
B având L şi respectiv C n=400 subiecţi repartizaţi în tabelul
modalităţi de realizare sunt sau nu de contingenţă prezentat mai sus.
independente.
ETAPA 1

Etapa 1. H0: caracterele A şi B sunt


Definirea independente. H0: fumatul nu are influenţă asupra
ipotezei nule H0 apariţiei maladiei M.

ETAPA 2

Etapa 2. LC
( fi0  fit )2 LC
( f 0  f t )2
urmează o X2   i t i
Definirea unui X  
2
t
urmează o lege
i 1 fi i 1 fi
parametru
lege  2 cu (L-1) x (C-1) grade de  2 cu 1 grad de libertate.
libertate
ETAPA 3

Etapa 3. Fie  pragul de semnificaţie al S-a ales pragul de semnificaţie  =


Pragul de testului. 0.05
semnificaţie

ETAPA 4
Etapa 4. Ţinând seama de faptul că X2 Pentru pragul  =0.05 şi  2 cu 1
Definirea urmează legea  2 cu (L-1) x (C- grad de libertate valoarea 2 =
regiunii critice 1) grade de libertate se determină 3.84, astfel că în acest caz regiunea
valoarea 2 încât critică este intervalul [3.84 , ).
P(  2  2 ) = . Regiunea
critică este [ 2 ,).
ETAPA 5

Etapa 5. - Se calculează frecvenţele (80  52) 2


Calcularea valorii teoretice Se calculează X2= +
52
observate a t total linietotal coloana
fi = (50  78) 2 (80  108) 2
parametrului n + +
78 108
- Se calculează
(190  162) 2
( f 0  f t )2
LC + =37.2
X  i t i
2 162
i 1 fi

ETAPA 6

Etapa 6.  Dacă X2[3.84, ) se X2 >> 3.84 aşa că ipoteza nulă H0


Decizia respinge H0 cu un risc de se respinge cu un risc inferior lui
eroare de prima speţă  . 5%.
 Dacă X2[3.84, ) atunci H0 In concluzie, fumatul se asociază cu
nu se respinge, acceptându-se maladia M favorizând-o.
H0 cu un risc de eroare de
speţa a doua 

S-ar putea să vă placă și