Sunteți pe pagina 1din 4

Curs 5: Analiza bivariată

Putem face o corelaţie între două variabile care nu au aparent legătură.


Ex: Sexul persoanei cu alegerea unei anumite mărci.
Baza de date – Alegerile din SUA din 1992
- Analyze – Descriptive statistics – Crosstabs
Vrem să aflăm:
1. Există vreo legătură între sexul persoanei şi votul exprimat de aceasta?
2. Dacă da, cât de puternică este această legătură?

Bush Perot Clinton Total


Bărbaţi 315 152 337 804
Femei 346 126 571 1043
Total 661 278 908
Ipoteza nulă – presupune întotdeauna că nu există legătură între variabilele pe care le analizez.
(H0): Sexul persoanei nu influenţează votul.
(H1): Sexul persoanei influenţează votul.

Bush Perot Clinton Total Ponderi


Bărbaţi 287,7 121 395 804 43,53%
Femei 373,2 157 512,7 1043 56,47%
Total 661 278 908 100%

(H0): Dacă sexul nu influenţează votul, înseamnă că ponderile se respectă în fiecare căsuţă.
Pentru a putea compara datele din primul tabel care arată valorile reale cu cel din al doilea
tabel care arată valorile aşteptate, vom folosi testul Hi pătrat.
r k O  Aij 
2

  
2 ij
, r - rânduri, k – coloane
i 1 j 1 Aij

- valorile observate de cercetător

- valorile aşteptate de cercetător

-De ce se ridică la pătrat?


- pentru a scăpa de semnul minus;
- diferenţele mici între valorile observate şi cele aşteptate, devin şi mai mici;
- diferenţele mari între aceste 2 valori, devin şi ma mari, astfel se accentuează mai ales
acestea.

Astfel, pentru exemplul nostru, calculul va fi:


Bază de date stabilă, aşteptată
În cadrul tabelului de distribuţie al funcţiei ne uităm după:

- Numărul gradelor de libertate;


- Prababilitatea de garantare a rezultatelor.

Se compară calculat cu tabelar:

- calculat tabelar diferenţa dintre valorile celor două tabele este mică, al doilea

tabel este suficient de bine ales, acceptăm

- calculat tabelar diferenţa dintre valorile celor două tabele este mare, se

acceptă

În SPSS:
Analyze – Descriptive statistics – Crosstabs – Statistics – Chi-square
Rows – sexul persoanei
Columns – vot
s

RESPONDENTS SEX * VOTE FOR CLINTON, BUSH, PEROT Crosstabulation

Count

VOTE FOR CLINTON, BUSH, PEROT

Bush Perot Clinton Total

RESPONDENTS SEX male 315 152 337 804

female 346 126 571 1043

Total 661 278 908 1847

Chi-Square Tests

Asymp. Sig. (2-


Value df sided)

Pearson Chi-Square 33,830a 2 ,000

Likelihood Ratio 33,866 2 ,000

Linear-by-Linear Association 19,360 1 ,000

N of Valid Cases 1847

a. 0 cells (,0%) have expected count less than 5. The minimum expected
count is 121,01.

- În cazul în care valoarea „Asymp. Sig.” 0,05 nivelul de încredere este de peste
95%
- În cazul în care valoarea „Asymp. Sig.” 0,01 nivelul de încredere este de peste
99%
- În cazul testului - nu avem voie să avem mai puţin de 40 de cazuri, de asemenea
fiecare valoare din tabel nu are voie să fie mai mică decât 5.
Crosstabs – Cells – (Observed, Expected, Procente) – pentru a putea vedea datele reale şi cele
aşteptate.

RESPONDENTS SEX * VOTE FOR CLINTON, BUSH, PEROT Crosstabulation

VOTE FOR CLINTON, BUSH, PEROT

Bush Perot Clinton Total

RESPONDENTS SEX male Count 315 152 337 804

Expected Count 287,7 121,0 395,3 804,0

female Count 346 126 571 1043

Expected Count 373,3 157,0 512,7 1043,0

Total Count 661 278 908 1847

Expected Count 661,0 278,0 908,0 1847,0

Gradele de libertate (df) se calculează astfel: (r-1)(k-1) (2-1)(3-1) 1*2 2

Dacă Asymp. Sig. 0,05 se respinge

0,0 se acceptă

S-ar putea să vă placă și