Sunteți pe pagina 1din 12

Analiza bivariata a datelor

Analiza bivariata a datelor


!

Presupune masurarea gradului de asociere a doua variabile sub aspectul:


Directiei (naturii) Intensitatii Semnificatiei statistice

Variabilele nominale
Tabele de frecvente (contingenta) considerata simultan pentru doua sau mai multe variabile caracteristice aceluiasi esantion. Coeficientul de corelatie (valori intre -1 si +1)

rphi =

ad bc [(a + b)(c + d )(a + c )(b + d )]1 / 2

Directia asocierii este data de valoarea lui (rphi)2 Gradul de semnificatie al asocierii dintre opiniile subiectilor constituiti in cele doua esantioane independente este determinat cu ajutorul testului !2, McNemar sau Fisher.

Testul neparametric !2
!

Bazat pe ipoteza nula:


H0: nu exista diferente semnificative intre cele doua variabile. 2 r k

= !! (
2 c i =1 j =1

Oij Aij ) Aij

Valoarea calculata !c2 a testului se compara cu valoarea tabelata !t2 a acestuia, obtinuta in functie de probabilitatea de garantare a rezultatului si gradele de libertate asociate: (r-1)(k-1).
!c2 " !t2 : se accepta ipoteza nula !c2 > !t2 : se respinge ipoteza nula

Testul neparametric !2
!

Pentru mai mult de doua subesantioane independente trebuie ca frecventele Oij > 1 si Oij < 5 sa nu depaseasca 20%. Masurarea gradului de asociere se poate realiza cu ajutorul coeficientului de contingenta:

C=

2 c

N + c2

Testul Fisher
! !

Inlocuieste testul !2 atunci cand dimensiunea esantionului N<40 si k=r=2 Testul probabilitatii exacte (Fisher) are aceiasi ipoteza nula:
H0: nu exista diferente semnificative intre cele doua variabile.

( A + B )!(C + D )!( A + C )!( B + D )! N ! A! B!C! D! Valoarea calculata p a testului se compara cu probabilitatea de garantare a rezultatului (ex.: 95%). p=
p " 0,05 : se respinge ipoteza nula p > 0,05 : se accepta ipoteza nula

Testul McNemar
! !

Inlocuieste testul !2 atunci cand cele doua esantioane investigate nu sunt independente Testul McNemar are aceiasi ipoteza nula:
H0: nu exista diferente semnificative intre cele doua variabile.

a+d a si d reprezinta frecventele subesantioanelor independente. Interpretarea este aceiasi ca si in cazul testului
!2 :
!c2 " !t2 : se accepta ipoteza nula !c2 > !t2 : se respinge ipoteza nula

c2 =

( a d 1) 2

Variabilele ordinale
Tabele de frecvente (contingenta) considerata simultan pentru doua sau mai multe variabile caracteristice aceluiasi esantion. Masurarea gradului de asociere se poate utiliza coeficientul Spearman de corelatie a rangurilor

= 1

6! Di2 n(n 1)
i =1 2

Directia asocierii este data de valoarea lui # sau $. Gradul de semnificatie al asocierii dintre opiniile subiectilor constituiti in cele doua esantioane independente este determinat cu testului semnificatiei coeficientului Spearman.

Coeficientul de corelatie Spearman


!

Bazat pe ipoteza nula:


H0: nu exista o corelatie intre variabilele investigate.

Zc =
!

1 n 1

Valoarea calculata Zc a testului se compara cu valoarea tabelata Zt a acestuia, obtinuta in functie de probabilitatea de garantare a rezultatului.
-Zt " Zc " Zt : se accepta ipoteza nula altfel : se respinge ipoteza nula

Coeficientul de corelatie " al lui Goodman si Kruskall


! !

Se poate utiliza atunci cand coeficientul Spearman nu ofera valori concludente. Valoarea lui $, la fel ca si #, poate lua valori in intervalul -1 si +1.

P se obtine inmultind valoarea frecventei din coltul din stanga sus a tabelului de frecvente asociat cu valorile de pe randul urmator, fara cea care se afla imediat sub ea, si cu celelalte valori ale tabelului, dupa care se insumeaza cu produsul dintre prima valoare a randului urmator si suma frecventelor incepand de pe randul urmator, insa din nou fara valoarea aflata imediat sub ea, iterativ. Q se calculeaza dupa aceleasi reguli, insa incepand din dreapta sus.

PQ = P+Q

Variabilele metrice
Tabele de frecvente (contingenta) considerata simultan pentru doua sau mai multe variabile caracteristice aceluiasi esantion. Masurarea gradului de asociere se poate utiliza coeficientul Pearson de corelatie a rangurilor
r= n ! x i y i ! xi ! y i
i =1 i =1 i =1 n n n

n ! ( xi ) ( ! xi )
2 i =1 i =1

n ! ( y i ) (! y i ) 2
2 i =1 i =1

Directia asocierii este data de valoarea lui r. Gradul de semnificatie al asocierii dintre opiniile subiectilor constituiti in cele doua esantioane este determinat prin testarea semnificatiei statistice a coeficientului r.

Coeficientul de corelatie Pearson


! !

Utilizat pentru variabile continue, normale, cu dispersii asemanatoare Bazat pe ipoteza nula:
H0: nu exista o corelatie intre variabilele investigate (r nu este in mod semnificativ diferit de zero). 1+ r 1,1513 + log10 ( ) 1 r Zc = 1 n3

Valoarea calculata Zc a testului se compara cu valoarea tabelata Zt a acestuia, obtinuta in functie de probabilitatea de garantare a rezultatului.
-Zt2 " Zc2 " Zt2 : se accepta ipoteza nula altfel : se respinge ipoteza nula

S-ar putea să vă placă și