Documente Academic
Documente Profesional
Documente Cultură
datelor
Curs 8
Analiza bivariata a datelor
Presupune masurarea gradului de asociere a
doua variabile sub aspectul:
Semnificatiei statistice
Intensitatii
Directiei (naturii)
Analiza diferentiala bivariata
rphi =ad-bc/[(a+b)(c+d)(a+c)(b+d)]1/2
Χ2|= ((a-d)-1)2/a+d
a si d reprezinta frecventele subesantioanelor independente.
Interpretarea este aceiasi ca si in cazul testuluiχ2 :
χc 2 ≤ χt2 : se accepta ipoteza nula
χc2 > χt2 : se respinge ipoteza nula
Testul Mann Whitney
• Utilizat de preferinta pentru pentru identificarea diferentelor
semnificative intre (doua) variabile ce provin din esantioane
independente, masurate cu ajutorul scalei ordinale (se poate utiliza
insa si in cazul variabilelor proportionale), distribuite normal.
• Ipotezele testului MannWhitney:
H 0 : NU exista diferente semnificative intre cele doua
variabile.
H 1 : Cele doua variabile difera in mod semnificativ.
Testul MannWhitney
• R i reprezinta rangurile asociate valorilor din
esantionul i (primul sau al doilea).
• Pentru esantioane totale (n 1 +n 2 ) mai mici de 30,
valorile lui U t sunt tabelate.
• Pentru esantioane de peste 30 de subiecti se
utilizeaza testul Student pentru stabilirea semnificatiei
statistice a testului U, dupa formula:
Interpretarea testului U pentru esantioane
mai mici de 30 de subiecti:
U c ≤ U t : se accepta ipoteza nula
U c > U t : se accepta ipoteza alternativa
• Interpretarea teoretica a testului U pentru
esantioane mai mici de 30 de subiecti:
z c ≤ z t : se accepta ipoteza nula
z c > z t : se accepta ipoteza alternativa
Testul Wilcoxon
• Testul Wilcoxon este un test nonparametric bivariat utilizat
pentru identificarea semnificatiei statistice a diferentelor
identificate pentru variabile provenite din esantioane
dependente (masuratori repetate sau variabile masurate ale
acelorasi respondenti),
masurate cu ajutorul scalelor ordinale, indiferent de tipul
distributiei.
ρ=1-6∑Di2/n(n2-1)
γ=P-Q/P+Q
! P se obtine inmultind valoarea frecventei din coltul din stanga sus a tabelului
de frecvente asociat cu valorile de pe randul urmator, fara cea care se afla
imediat sub ea, si cu celelalte valori ale tabelului, dupa care se insumeaza cu
produsul dintre prima valoare a randului urmator si suma frecventelor incepand
de pe randul urmator, insa din nou fara valoarea aflata imediat sub ea, iterativ. Q
se calculeaza dupa aceleasi reguli, insa incepand din dreapta sus.
Variabilele metrice
Zc=1,11513+log10(1+r/1-r)/1/(n-3)1/2