Sunteți pe pagina 1din 13

ASOCIEREA

Asocierea caracteristicilor calitative


ntrebarea: Exist o regularitate statistic a
modului n care indivizii posed anumite
caracteristici, cu alte cuvinte se distribuie
simultan n funcie de mai multe variabile?
A msura asocierea = a analiza distribuia
simultan a indivizilor statistici dup dou sau
mai multe caracteristici calitative. (Rotariu, 1999,
p. 120)

Baza acestei analize o reprezint tabelul de


asociere sau de contingen care red
distribuia observat a indivizilor statistici
n mod simultan n categoriile
variabilelor calitative.
Vom analiza doar cazul asocierii
bivariate.

Asocierea a dou variabile calitative


Tabel de contingen
Variabila B

Cat. B1
Cat. B2

Cat. Bj
Total

Cat. A1
k11
k21

kj1
k.1

Variabila A
Cat. A2

k12

k22

kj2
k.2

Cat. An
k1n
k2n

kjn
k.n

N nr. de indivizi statistici (volumul populaiei sau al eantionului)


n nr. de categorii ale variabilei A
j nr. de categorii ale variabilei B
k11, k12 , kjn frecvene interioare (distribuia SIMULTAN dup var. A i B
k.1, k.2 , k.n Frecvene marginale pentru var. A (distribuia NUMAI dup var. A)
k1., k2. , kj. Frecvene marginale pentru var. B (distribuia NUMAI dup var. B)
Grade de libertate ale tabelului:
(nr. categorii var. A 1) * (nr. categorii var. B 1)

Total
k1.
k2.

Kj.
N

Tabel de asociere 2x2:


Ex. 1: Titanic
Genul:
Nr de femei
Nr de brbai

au supravietuit?
Nr de decese
Nr de supravieuitori

SEX * SURVIV Crosstabulation


Count

SEX
Total

masculin
feminin

SURVIV
decedat
supravietuitor
1364
367
126
344
1490
711

Total
1731
470
2201

Asocierea a dou variabile calitative


Pentru a evalua dac exist sau nu asociere ntre cele dou variabile i a msura
intensitatea acestei asocieri, COMPARM tabelul de contingen cu un tabel teoretic,
construit pstrnd distribuiile marginale ale variabilelor.
Acest tabel teoretic se numete TABEL DE INDEPENDEN.

mjn =

kj. * k.n
N

mjn frecvene teoretice sau frecvene ateptate


(expected frequences).

mjn = (frecven marginal linie * frecven marginal coloane) / total


Putem compara cele dou tabele pe baza diferenelor dintre frecvenele observate (din tab.
de contingen) i frecvenele teoretice (din tab. de independen).

2 (Hi ptrat) = suma diferenelor ptratice dintre kjn i mjn raportate la mjn

Tabel de asociere 2x2:


Ex. 1: frecvenele
teoretice SEX * SURVIV Crosstabulation
Expected Count

SEX

masculin
feminin

Total

Procentele n
situaia de
independen:

SURVIV
decedat
supravietuitor
1171.8
559.2
318.2
151.8
1490.0
711.0

67.7%

32.3%

67.7%

32.3%

Total
1731.0
470.0
2201.0

Ex. 1: frecvenele observate + procente


SEX * SURVIV Crosstabulation

SEX

masculin
feminin

Total

Count
% within SEX
Count
% within SEX
Count
% within SEX

SURVIV
decedat
supravietuitor
1364
367
78.8%
21.2%
126
344
26.8%
73.2%
1490
711
67.7%
32.3%

Total
1731
100.0%
470
100.0%
2201
100.0%

Procente pe
linii
(gen)

SEX * SURVIV Crosstabulation

SEX

masculin
feminin

Total

Count
% within SURVIV
Count
% within SURVIV
Count
% within SURVIV

SURVIV
decedat
supravietuitor
1364
367
91.5%
51.6%
126
344
8.5%
48.4%
1490
711
100.0%
100.0%

Total
1731
78.6%
470
21.4%
2201
100.0%

Procente pe
coloane
(survival)

Asocierea a dou variabile calitative


Testarea semnificaiei asocierii cu ajutorul lui 2
Asumpii:
(a.) dou variabile nominale, (b.) eantion aleatoriu, (c.) cel puin 75% dintre frecvenele
teoretice din tabelul de independen iau valori peste 5.
Ipoteza nul:
H0: Independena statistic a variabilelor (distribuia observat NU difer semnificativ de cea
teoretic, din tabelul de independen)
Indicatorul statistic pentru testarea ipotezei: 2
Nivelul de probabilitate (P): ne arat care este probabilitatea s obinem o anumit valoare a
lui 2 dac ipoteza nul este adevrat. Aceasta depinde de gradele de libertate ale
tabelului de asociere.
Concluzia testului: Dac probabilitatea este mic (sub 0.01 sau 0.05) atunci respingem
ipoteza nul.

Asocierea a dou variabile calitative


Probleme:
Mrimea lui 2 nu are o limit superioar, crete odat cu numrul gradelor de libertate ale
tabelului de contingen i volumul eantionului. Prin urmare, NU ESTE UN COEFICIENT
STATISTIC.
Indicatorul este unul simetric, nu presupune desemnarea unei variabile drept independent
(explicative) i a celeilalte drept dependent (explicat).
Pentru a evalua intensitatea asocierii dintre dou variabile calitative, se utilizeaz coeficieni
bazai pe 2.

Coeficientul (PHI):

Coeficientul V al lui Cramer:

Coeficientul de contingen al lui Pearson:

Asocierea a dou variabile calitative


Exemplu (fictiv): Tabelul de mai jos prezint distribuia opiunii politice pentru partidul
P n funcie de mediul de reziden. Cercetarea a fost realizat pe un eantion
stratificat-aleartor de 1000 de persoane.

Exist o asociere statistic ntre opiunea politic i mediul de reziden?


Care este intensitatea acestei asocieri?
Putem spune c mediul de reziden influeneaz opiunea politic?
Care este utilitatea practic a evalurii relaiei dintre cele dou variabile statistice?
Care este relevana evalurii acestei relaii pentru cercetarea social?

Pentru tabele cu un grad de libertate,


probabilitatea s obinem 2 = 106.66 n
caz de independen statistic a
variabilelor este mai mic dect 0.001.
Prin urmare, putem respinge ipoteza
nul de indepen statistic.
Coeficienii bazai pe 2 indic o asociere
moderat ntre variabile.

Ex. 1 (Titanic): Chi ptrat i intensitatea asocierii


Chi-Square Tests

Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases

Value
456.874b
454.500
434.469
456.667

df
1
1
1

Asymp. Sig.
(2-sided)
.000
.000
.000

Exact Sig.
(2-sided)

Exact Sig.
(1-sided)

.000

.000

.000

2201

a. Computed only for a 2x2 table


b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
151.83.

Symmetric Measures

Nominal by
Nominal

Phi
Cramer's V
Contingency Coefficient

N of Valid Cases

Value
.456
.456
.415
2201

Approx. Sig.
.000
.000
.000

a. Not assuming the null hypothesis.


b. Using the asymptotic standard error assuming the null
hypothesis.

S-ar putea să vă placă și