Sunteți pe pagina 1din 6

Asocierea variabilelor

calitative (categorice)
Statistică, 28 mai 2003
Tabele de contingenţă
Sex * Ai scutire medicala la educ.fiz.? Crosstabulation
 Problema: există relaţie
Ai scutire medicala la
educ.fiz.?
(asociere) între două
Sex Barbat Count
Da
44
Nu
385
Total
429
variabile calitative
% within Sex
% within Ai scutire
10,3%

29,7%
89,7%

47,1%
100,0%

44,5%
 Valorile unei variabile apar
medicala la educ.fiz.?
% of Total 4,6% 39,9% 44,5% pe linii iar valorile
Femeie Count
% within Sex
104
19,4%
432
80,6%
536
100,0% celeilalte apar pe coloane
% within Ai scutire
medicala la educ.fiz.?
% of Total
70,3%

10,8%
52,9%

44,8%
55,5%

55,5%
 Frecvenţe absolute
Total Count
% within Sex
148
15,3%
817
84,7%
965
100,0%
 Frecvenţe relative pe
% within Ai scutire
medicala la educ.fiz.?
100,0% 100,0% 100,0% rânduri, coloane, totale
% of Total 15,3% 84,7% 100,0%
 Distribuţii marginale şi
condiţionate
Testul χ2 de independenţă
 Este utilizat pentru a testa dacă două variabile sunt sau nu sunt asociate
 Ex. există o relaţie între categoria de gen a adolescenţilor din eşantion şi
evitarea orelor de educaţie fizică cu scutiri medicale?
 Plecăm de la probabilităţi: am învăţat că două evenimente A şi B sunt
independente dacă P(A şi B)=P(A)P(B)
 Aplicând formula la tabelul de mai sus, evenimentul de a fi băiat şi de a
avea scutire medicală sunt independente dacă probabilitatea
evenimentului conjugat este egală cu produsele probabilităţilor celor două
evenimente separate.
 P(Băiat)=0,445
 P(scutire medicală)=0,153
 P(Băiat cu scutire medicală)=0,068, ceea ce este mai mult decât
probabilitatea obţinută de noi, de 0,046
Calcularea lui χ2
 Formula este aceeaşi cu cea din
Sex * Ai scutire medicala la educ.fiz.? Crosstabulation capitolul anterior
Ai scutire medicala la  Χ2=15,35
educ.fiz.?
Da Nu Total
 Numărul gradelor de libertate,
Sex Barbat Count 44 385 429 gl=(numărul liniilor-1)(numărul
Expected Count 65,8 363,2 429,0 coloanelor-1)=1
Residual -21,8 21,8
Femeie Count 104 432 536
 Din tabelul Anexei nr. 3
Expected Count 82,2 453,8 536,0 observăm că nivelul critic al lui
Residual 21,8 -21,8 χ2, la un grad de libertate, este
Total Count 148 817 965 pentru probabilitatea de 0,05 de
Expected Count 148,0 817,0 965,0 3,84. Întrucât valoarea obţinută
de noi este mult mai mare,
spunem că se respinge ipoteza de
nul şi că între cele două variabile
există asociere.
Coeficientul λ (lambda)
Da Nu Nu Tota  Coeficientul Chi-pătrat nu ne oferă
ş informaţii despre intensitatea
t asocierii dintre cele două variabile.
i
u
 Ne referim la exemplul din manual.
În tabel.
Vârsta sub 25 110 40 30 180  Eroare de predicţie a atitudinii:
de ani
 Necunoscând vârsta, şi doar
Vârsta între 40 100 60 200 frecvenţele marginale ale atitudinii:
26 şi 45 e1=380
de ani  Cunoscând vârsta subiectului:
Vârsta peste 50 80 90 220 e2=300
45 de  Λ=(380-300)/380=0,21

λ=(e1-e2)/e1
ani Λ variază între 0 şi 1.
Total 200 220 180 600 Principalul dezavantaj al coeficientului: ia
Semnificaţia coeficientului- reducerea valoarea 0 chiar dacă există asociere, dacă
proporţională a erorii în predicţia una dintre valorile variabilei dependente este
valorilor variabilei efect prin cunoaşterea mult mai frecventă decât celelalte. De exemplu
valorilor variabilei cauză – în cazul anterior, λ=0
Asocierea variabilelor ordinale
 Valorile lor pot fi ordonate. Se poate vorbi de semn al
asocierii, de direcţie, coeficienţii de acest fel variind între -1
şi +1.
 Asociere pozitivă între variabilele ordinale X şi Y: valorilor
mari ale variabilei X le corespund valori mari ale variabilei Y
iar celor mici, în mod analog, le corespund valori mici.
 Asociere negativă: valorilor mici ale variabilei X le
corespund valori mari ale lui Y iar celor mari le corespund
valori mici ale lui Y.
 Coeficientul τ al lui Kendall
 τ=(nc-nd)/nt
 Variabilele trebuie să fie ambele ordinale iar valorile
ordonate în acelaşi fel.