Sunteți pe pagina 1din 3

Curs 5 – Analiza bivariate a datelor – variabile nominale

Analiza bivariată a datelor presupune analiza simultană a două variabile (a relației dintre ele).
Relația sau asocierea dintre două variabile se analizează prin:
1. Direcția (sensul) ei – relația poate să fie pozitivă, negativă sau inexistentă;
2. Intensitatea ei – relația poate să fie puternică, slabă sau inexistentă;
3. Semnificația ei statistică – relația poate fi semnificativă din punct de vedere statistic sau poate să fie
validă doar la nivelul eșantionului studiat.

1. Tehnici de analiză bivariată – variabile nominale

Analyze => Descriptive Statistics => Crosstabs (demo_cs.sav / inccat & carcat)
În cadrul acestui exercițiu analizăm relația dintre următoarele două variabile:

- Income category: 1. Under 25.000& AND Car category: 1. Economy


2. 25.000 – 49.000 $ 2. Standard
3. 50.000 – 74.000 $ 3. Luxury
4. Over 75.000 $

1. Direcția (sensul) relației:


 Semnul valorii Contingency Coefficient + (pozitiv) – relație pozitivă
- (negativ) – relație negativă
0 (zero) – nici o relației (variabile independente)

2. Intensitatea relației:
 Valoarea ridicată la pătrat a Contingency Coefficient: mai aproape de 1 – relație puternică
mai aproape de 0 – relație slabă
0 – nici o relație

3. Semnificația statistică a relației


 𝑡𝑒𝑠𝑡𝑢𝑙 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐 𝜒 2 𝑒𝑠𝑡𝑒 𝑎𝑝𝑙𝑖𝑐𝑎𝑡, 𝑑𝑢𝑝ă 𝑐𝑢𝑚 𝑢𝑟𝑚𝑒𝑎𝑧ă ∶
a. Se dezvoltă ipotezele statistice:
H0 (Ipoteza nulă) – NU există o relație între cele două variabile
H1 (Ipoteza alternativă) – există o relație între cele două variabile
b. Valoarea lui 𝜒 2 (Pearson Chi-Square) este calculată și comparată (în mod automat de SPSS) cu
o valoare teoretică (preluată din tabelul statistic 𝜒 2 )
c. Dacă (în SPSS), Asymptotic Significance (2-sided) < 0.05, atunci H0 se respinge
altfel H0 se acceptă

Pentru exemplul nostru, avem următorul output:

Symmetric Measures

Approximate
Value Significance

Nominal by Nominal Contingency Coefficient .751 .000


N of Valid Cases 2208

Chi-Square Tests

Asymptotic
Significance (2-
Value Df sided)

Pearson Chi-Square 2853.405a 6 .000


Likelihood Ratio 2855.875 6 .000
Linear-by-Linear Association 1643.332 1 .000
N of Valid Cases 2208

Putem concluziona că relația dintre Income category și Car category este una pozitivă (+0.751, cu cât este
mai ridicată categoria de venit, cu atât este mai ridicată categoria de autoturism), de intensitate medie (0.56)
și semnificativă statistic (Asymptotic Significance < 0.05).
2. Grafice utilizate în cadrul analizei bivariate a datelor – variabile nominale
✓ Bar
Graphs => Chart Builder => Bar =>Clustered Bar/Stacked Bar/Simple 3D Bar/
(demo_cs.sav / inccat & carcat)

✓ Histogram
Graphs => Chart Builder => Histogram => Simple Histogram/Stacked Histogram/Population Pyramid
(demo_cs.sav / inccat & carcat)

S-ar putea să vă placă și