Sunteți pe pagina 1din 27

Distribuia multinomial Teste chi-ptrat

M. Popa

Evenimente probabilistice
binomiale
valori dihotomice (P, Q):
(masculin/feminin, absent/prezent, adevrat/fals, etc.)

multinomiale
mai mult de dou valori (P, Q, R...):
tip de liceu absolvit (real, umanist, artistic, industrial) religia (islamic, ortodox, catolic...) efectul terapiei (ameliorat, nrutit, fr efect)

un exemplu:
tipul de liceu absolvit de studenii la psihologie (N=100)
umanist (P)=60 artistic (Q)=30 real (R)=10
P+Q+R=1 P=1-Q-R

frecvene observate (fO)

dac liceele ar avea acelai numr de absolveni:


P=Q=R=1/3=0.33 (100/3=33.3)

frecvene teoretice (ateptate) (fE)

Tabelul de coresponden (contingen) pentru date categoriale


Liceu umanist Fac. Umaniste Fac. Tehnice Fac. Artistice Total pe coloane 45 14 20 Liceu real 20 60 13 Liceu artistic 30 12 50 Total pe linii

fO

95 86 83 264
frecvene marginale

79

93

92

N
frecvene marginale

Fundamentarea testului statistic

Liceu umanist

Liceu real

Liceu artistic

Total pe linie

Frecvene marginale (95/264)*100=36%

Fac. Umaniste

45
(79*36)/100 fE ? 28.4

20
(93*36)/100

30
(92*36)/100

95

33.4 60
(93*32.5)/100

33.1 12
(92*32.5)/100

Fac. Tehnice

14
(79*32.5)/100

86

(86/264)*100=32,5%

25.6
Fac. Artistice Total pe coloan

30.2 13
(93*31.5)/100

29.9 50
(92*31.5)/100

20
(79*31.5)/100

83

(83/264)*100=31.5%

24.8 79

29.2 93

28.9 92 264

Testul chi-ptrat (2) - Karl Pearson


se bazeaz pe evaluarea distanei dintre fO i fE 2 ( ) X N * P formula este derivat din z: z2 = N * P *Q valorile urmeaz o distribuie special: chi-ptrat (2)
o familie de distribuii; asimetric; originea n zero; form dependent de numrul de grade de libertate.
2 f f ( ) E 2 = O fE

df=(nr. coloane-1)*(nr. linii-1)


formula de calcul

Decizia statistic
Se identific 2 critic pentru alfa ales i df corespunztoare

Respingere
= 0.05

0
abela 2 (parial)
df\aria 1 2 3 ... .100 2.70554 4.60517 6.25139 ... .050 3.84146 5.99146 7.81473 ...

2critic .025 5.02389 7.37776 9.34840 ... .010 6.63490 9.21034 ... .005 7.87944 10.59663 ...

11.34487 12.83816

Tipuri de teste

testul corespondenei (goodness of fit)


compar fO cu fE ale aceleiai variabile obiectiv: testarea diferenei fa de un model de distribuie ateptat

testul asocierii (independenei)


compar fO cu fE ale dou variabile obiectiv: testarea asocierii valorilor celor dou variabile

Chi-ptrat pentru gradul de coresponden (Goodness of Fit)


Exemplu: 100 studeni la psihologie
Frecvena observat Liceu umanist=60 (0.6) Liceu artistic=30 (0.3) Liceu real=10 (0.1) Proporii teoretice (de nul Liceu umanist=33.33 (0.33) Liceu artistic=33.33 (0.33) Liceu real=33.33 (0.33

Problema cercetrii: exist o preferin pentru psihologie n funcie de liceul absolvit? Criterii de decizie: alfa=0.05 df (3-1)=2 2critic=?

Tabela 2 (fragment)
df\aria 1 2 3 4 5 6 7 8 9 10 11 ... .100 2.70554 4.60517 6.25139 7.77944 9.23636 10.64464 12.01704 13.36157 14.68366 15.98718 17.27501 ... .050 3.84146 5.99146 7.81473 9.48773 11.07050 12.59159 14.06714 15.50731 16.91898 18.30704 19.67514 ... .025 5.02389 7.37776 9.34840 11.14329 12.83250 14.44938 16.01276 17.53455 19.02277 20.48318 21.92005 ... .010 6.63490 9.21034 11.34487 13.27670 15.08627 16.81189 18.47531 20.09024 21.66599 23.20925 24.72497 ... .005 7.87944 10.59663 12.83816 14.86026 16.74960 18.54758 20.27774 21.95495 23.58935 25.18818 26.75685 ...

2critic=5.99

Frecvena Frecvena ateptat Calificativ observat (fE) (fO) Umanist 60 33.3% din 100 =33.3 Artistic 30 33.3% din 100 =33.3 Real 10 33.3% din 100 =33.3 100

( fO f E )2 fE

(60 33.3) 2 = 21.38 33.3 (30 33.3) 2 = 0.32 33.3 (10 33.3) 2 = 16.30 33.3

2calculat=38

2 calculat (38) > 2 critic (5.99) H0? H1? Concluzia cercetrii? Acest test nu are un coeficient al mrimii efectului

Testul chi-ptrat al asocierii (independence chi-square)


mai frecvent utilizat compar fO ale unei variabile cu fE ale altei variabile (ambele categoriale) Msoar asocierea a dou variabile nominale (similar
unui test de corelaie pentru date nominale)

obiectiv: exist o relaie ntre cele dou variabile? exemplu:


264 studeni la trei tipuri de faculti (umaniste, artistice, tehnice), care provin de la trei tipuri de licee (umanist, artistic, real) obiectiv: este o legtur ntre tipul de liceu absolvit i facultatea aleas? criterii de decizie: alfa=0.05; df=(3-1)*(3-1)=4; 2critic= 9.48

FU/LU FU/LA FU/LR FT/LU FT/LA FT/LR FA/LU FA/LA FA/LR

45 30 20 14 12 60 20 50 13 N=264

28,4 33,1 33,4 25,6 29,9 30,2 24,8 28,9 29,2

(45 28.4) 2 = 9.70 28.4 (30 33.1) 2 = 0.29 33.1 (20 33.4) 2 = 5.37 33.4 (14 25.6) 2 = 5.25 25.6 (12 29.9) 2 = 10.71 29.9 (60 30.2) 2 = 29.4 30.2 (20 24.8) 2 = 0.92 24.8 (50 28.9) 2 = 15.4 28.9 (13 29.2) 2 = 8.98 29.2

2 calculat =86.06

Interpretarea testului
2 calculat (86.06) > 2 critic (9.48) H0? H1? Concluzia cercetrii?

n primul rnd se decide asupra semnificaiei testului


Apoi:
se analizeaz procentele celulelor tab. de coresponden se scot n eviden procentele relevante pentru ipoteza cercetrii (se constat procente mai mari n cazul concordanei dintre tipul de liceu i tipul de facultate)

Mrimea efectului pentru


Indicele (fi)

Indicele c (fi) Cramer

c =

N ( L 1)

N este volumul eantionului L este valoarea cea mai mic dintre numrul liniilor sau al coloanelor tabelului de coresponden (de exemplu, pentru un tabel de coresponden 4x3 - patru linii i patru coloane - L are valoarea 3-1=2).

Pentru exemplul nostru...


c =
86.06 = = 0.40 N (2 1) 264 * (2 1)

Interpretarea lui
Indice al asocierii. Se interpreteaz similar cu coeficientul de corelaie Prin ridicarea la ptrat poate fi interpretat procentual

0.10 (Cohen) 0.25 0.40

efect mic efect mediu efect mare

Raportarea rezultatelor
Pentru un eantion de 264 de studeni de la trei tipuri de faculti (umaniste, artistice, tehnice) a fost testat relaia cu liceul de provenien (umanist, artistic, real). Testul 2 pentru asocierea variabilelor indic faptul c rezultatele difer semnificativ n funcie de gen, 2(4) =86.06, p >0 .05 (c=0.57), ceea ce arat o asociere ntre tipul de liceu i facultatea aleas

Condiii pentru testul 2


Cele dou variabile nu trebuie s se intersecteze (s nu existe subieci care s fie inclui n mai mult de o celul de tabel) Selecie aleatoare a eantioanelor Frecvena ateptat s nu ia valori mai mici de 5 (sau, cel puin, n nu mai mult de 20% din celule). Nici o celul nu trebuie s aib frecvena ateptat mai mic de 1.
corecia Yeates
2 =

(f

f E 0.5) fE

Utilizarea testului chi-ptrat al asocierii


testarea asocierii a dou variabile categoriale (nominale, ordinale sau... I-R!) nlocuitor pentru testul t sau ANOVA, dac nu sunt ntrunite condiiile
dup transformarea var. dep. n var. categorial

Testul exact Fisher


testul chi-ptrat nu urmeaz cu maxim precizie distribuia 2 cazuri n care rezultatele pot fi alterate suficient de mult pentru a putea fi luate n considerare:
volumul eantionului este redus (N<20); valorile fe pentru una sau mai multe dintre celulele tabelei de coresponden sunt foarte mici.

n aceste situaii, precum i atunci cnd tabelul de coresponden este compus din dou linii i dou coloane
este recomandabil utilizarea testului exact Fisher se bazeaz pe calcularea tuturor tabelelor posibile ce pot fi construite pentru frecvenele marginale testul exact Fisher se efectueaz numai cu ajutorul programelor computerizate.

Sinteza testelor statistice neparametrice nominale


distribuie binomial Variabila dependent categorial (nominal) distribuie multinomial

1 eantion 2 eantioane independente 2 eantioane dependente

z - prop. unui eantion z - prop. a dou eant. testul semnului

chi-ptrat al corespondenei (goodness of fit) chi-ptrat al asocierii (independenei)