2013
Corelatii neparametrice
Pasionat de Jocuri?
www.tocmai.ro
Gaseste-ti Jocul Preferat Acum! Oferte din Toata Tara pe tocmai.ro.
Corelatii neparametrice
n conditiile n care nu sunt ndeplinite conditiile pentru aplicarea unor teste parametrice se pot aplica o serie de tehnici care sa indice gradul de asociere
ntre variabile.Printre cele mai utilizate probe corelationale neparametrice sunt:
Coeficientul de corelatie j (fi) pentru variabile dihotomice de tip 2 x 2;
Coeficientul de contingenta C a lui Pearson pentru date categoriale nominale;
Coeficientul V a lui Cramer pentru date categoriale nominale;
Testul Spearman al corelatiei diferentei rangurilor pentru date ordinale;
Coeficientul t a lui Kendall pentru date ordinale.
Coeficientul de corelatie j
Este aplicat cnd ambele variabile au caracteristici dihotomice, nu datorita unei regrupari ci prin nsasi natura variabilei. Acest coeficient se calculeaza
numai n situatia n care tabelul cu date are forma 2 x 2 (doua variabile cu doua posibilitati de raspuns). Aceste raspunsuri pot mbraca diferite forme
nominale de tipul "da sau nu"; "corect sau gresit"; "ateu sau religios"; "masculin sau feminin" s.a.
Exista n principal doua formule de calcul al coeficientului de corelatie j (fi). Prima este mai usor de folosit n cazul n care cunoastem valoarea lui hi
patrat. Iata formula:
01
00
Total absente x
Total
Total absente
prezente y
y
Exemplu: Se ncearca sa se stabileasca daca exista vreo legatura ntre prezenta unui handicap si aderarea la filosofia integrarii n scoala a acestor
persoane. Asadar avem doua variabile dihotomice, denumite variabila A (persoane care au un handicap vs. persoane care nu au nici un handicap) si
variabila B (persoane care considera integrarea scolara a persoanelor cu handicap ca fiind cea mai buna solutie vs. persoane care se opun acestui
curent). Au fost chestionate un numar de 100 de persoane cu handicap si fara handicap, iar raspunsurile primite sunt prezentate n tabelul de mai jos.
Persoane cu handicap
Persoane fara handicap
Integrare scolara-Da
40 (11)
10
Total integrare = 50 (t3)
Integrare scolara-Nu
20
30
Total separare=50 (t4)
statisticasociala.tripod.com/cor_nepar.htm
1/7
01.12.2013
Corelatii neparametrice
Unde:
X11 este dat de numarul de subiecti care au prezentat ambele caracteristici (11);
T este totalul de subiecti;
t1 este totalul obtinut la prima linie;
t2 este totalul obtinut la cea de a doua linie;
t3 este totalul obtinut la prima coloana;
t4 este suma obtinuta la cea de a doua coloana.
nlocuind n formula amintita cu datele problemei de fata obtinem:
Interpretarea lui j se face la fel ca cea a lui r, deoarece coeficientul de corelatie j este n esenta o varianta a coeficientului de corelatie simpla a lui
Breavis-Person. Pasul urmator este consultarea pragurilor de semnificatie corespunzatoare valorii lui j n tabelul lui r la N-2 df (grade de libertate),
urmarindu-se valorile lui r din dreptul liniei N-2 = 98 pentru problema de fata. Se constata ca j obtinut de 0,40 este semnificativ statistic chiar la un
prag de p <.001. Acest fapt semnifica ca exista o corelatie semnificativa ntre variabilele supuse studiului, observndu-se tendinta persoanelor cu
handicap de a adera la curentul integrarii lor scolare, n timp ce persoanele fara handicap dovedesc mai multa reticenta n aceasta directie, fiind mai
degraba ostile curentului integrationist.
Pentru a depasi acest impas al valorii subunitare, Cramer propune urmatorul coeficient de asociere, marime care poate atinge valoarea 1:
2/7
01.12.2013
Tineri
Adulti
Maturi
Batrni
Corelatii neparametrice
Coping problema
46 (40)
40 (38)
35 (35)
24 (32)
Total coping problema
Coping cognitiv
25 (42)
35 (39)
40 (37)
53 (35)
Total coping cognitiv
145 (39%)
Coping emotional
32 (21)
20 (19)
15 (18)
8 (17)
Total coping emotional
153 (41%)
75 (20%)
R
0,95
0,32
0,00
-1,43
-2,61
-0,64
0,49
3,05
2,39
0,22
-0,69
-2,19
Hi patrat=30,8
Se observa ca hi patrat obtinut de 30,8 este semnificativ statistic din tabel la df=6 grade de libertate la un p mai mic de .001. De asemenea exista patru
valori ale lui R care sunt socotite a fi responsabile pentru obtinerea unui hi patrat semnificativ. Urmarind acele date observam ca ele se refera la modul n
care doua categorii de vrste (batrnii si tinerii) utilizeaza copingul cognitiv si cel emotional. Concluzia care rezulta din inspectarea datelor poate fi
sintetizata astfel: Nu exista diferente semnificative n ce priveste preferinta de a utiliza copingul centrat pe problema ntre cele 4 categorii; batrnii tind sa
utilizeze n comparatie cu tinerii mult mai des copingul cognitiv n defavoarea celui emotional; la tineri situatia este inversa n compararea lor cu tendintele
batrnilor. Nu se observa alte diferente semnificative dinn prelucrarea datelor la alte categorii.
B)Calcularea coeficientilor de asociere C si V n functie de rezultatul lui hi patrat.
s este n aceasta problema egal cu 3 deoarece exista 4 linii de date (tineri, adulti, maturi si batrni) si 3 coloane de date (coping centrat pe problema, pe
evaluare cognitiva si pe emotii). Se alege s egal cu trei deoarece este numarul cel mai mic dintre patru si trei.
Interpretarea lui C, respectiv V se face teoretic pornind de la ideea ca un rezultat cat mai apropiat de 1 indica o corelatie pozitiva, iar un coeficient
negativ indica o asociere inversa. Se poate spune ca ntre cele doua variabile exista o asociere, iar din analiza lui R (rezidul standardizat) se observa
asociatii puternice n special n ce priveste copingul cognitiv si batrnii, respectiv copingul emotional si tinerii.
statisticasociala.tripod.com/cor_nepar.htm
3/7
01.12.2013
Corelatii neparametrice
Rang competitie
4
3
6
8
9
10
5
7
2
1
Rezultat anxietate
43
54
23
27
42
18
25
35
30
30
Rang anxietate
D(diferenta ranguri)
9
10
2
4
8
1
3
7
5,5
5,5
-5
-7
+4
+4
+1
+9
+2
0
-3,5
-4,5
25
49
16
16
1
81
4
0
12,25
20,25
S D2=224,5
Pentru a calcula coeficientul de corelatie a rangurilor notat cu r (ro) utilizam urmatoarea formula:
Unde:
N = Numarul de subiecti (n problema de fata 10);
S D2 = suma patratelor diferentelor dintre ranguri (n acest caz 224,5).
n problema de fata obtinem urmatorul rezultat r :
Ca si r, coeficientul de corelatie poate avea valori ntre 1 si +1. Valorile negative apropiate de 1 ne indica o corelatie inversa. Valorile foarte mici ale
lui ro, apropiate de zero nu sugereaza o asociere semnificativa. Desi coeficientul de corelatie Spearman r si coeficientul de corelatie r a lui Pearson nu
vor avea aceleasi valori pentru acelasi set de date, totusi exista o relativa concordanta (echivalare) ntre valorile lui r si cele ale lui r . Spre exemplu, un
coeficient r de +0,30 este echivalent aproximativ cu un r de +0,31, sau un coeficient r de +0,70 este echivalent cu un r de +0,71.
n cazul problemei de mai sus am obtinut un r = -0.36 la un N = 10. Daca consultam valoarea trecuta n tabelul lui r n dreptul liniei lui N grade de
libertate (unde N este numarul de perechi de subiecti), adica 10, observam ca valoarea obtinuta de noi este mai mica dect valorile trecute n tabel. Ca
urmare putem spune ca nu exista o corelatie semnificativa statistic ntre cele doua tipuri de variabile, deci nivelul de anxietate sociala nu influenteaza
rezultatele la competitiile de dezbateri individuale.
Cu prilejul compararii clasamentelor exista cazuri n care apare frecvent situatia rangurilor egale. Daca exista putine ranguri egale ntr-un esantion
formula lui r functioneaza satisfacator. Daca mai mult de 25% din date sunt egale n ranguri vom apela la o alta formula, a coeficientilor t (tau) a lui
statisticasociala.tripod.com/cor_nepar.htm
4/7
01.12.2013
Corelatii neparametrice
Kendall.
5/7
01.12.2013
2 si 5
2 si 6
2 si 7
2 si 8
3 si 4
Corelatii neparametrice
-1
-1
-1
-1
0
-1
-1
-1
-1
0
C
C
C
C
Txyi
5 si 7
5 si 8
6 si 7
6 si 8
7 si 8
-1
-1
0
-1
-1
-1
-1
-1
-1
+1
C
C
Txi
C
D
Reamintim ca 1 desemneaza situatia n care cuplul A este situat naintea cuplului B dupa variabila respectiva; +1 reda o ordine inversa, iar 0 indica
situatia de ranguri egale n cadrul variabilei respective. De exemplu, n situatia cuplurilor 2 si 3 avem de a face cu (0, -1). Aceasta nseamna ca primul
evaluator a socotit ca cele doua cupluri au facut progrese egale n reducerea violentei familiale, n timp ce al doilea evaluator a considerat ca rangul
(locul) cuplului al doilea este n fata cuplului notat cu numarul trei deoarece a realizat progrese superioare n diminuarea violentei familiale.
Daca vom face un bilant, cele 28 de perechi se distribuie astfel: C = 18; D = 1; Txi = 3; T yi = 5; Txyi = 1. Mai putem calcula si Ty si Tx, astfel avem:
Tx = Txi + Txyi = 4; Ty = Tyi + Txyi = 6
Aplicnd formula amintita pentru calcularea lui t obtinem:
Observatie: Acest coeficient de corelatie este o alternativa viabila la coeficentul lui Sperman n situatiile n care exista multe ranguri egale (peste 25% din
totalul rangurilor). Interpretarea valorii gasite nu dispune de compararea ei cu o valoare corespunzatoare dintr-un tabel propriu
Rezumatul testelor neparametrice de corelatie:
Corelatii de date nominale:
- doua variabile dihotomice de tip 2 x 2: se utilizeaza Coeficientul de corelatie j .
- doua variabile categoriale, peste 2 x 2: Coeficientul V a lui Cramer, respectiv coeficientul de contingenta C a lui Pearson (util n special pentru tabele
peste 5 x 5).
Corelatii de date ordinale (ordonate sub forma de ranguri):
- doua variabile, putine ranguri egale: Coeficientul de corelatie r a lui Spearman.
- doua variabile, mai multe ranguri egale: Coeficientul t a lui Kendall.
PROBLEME
1. Pentru a vedea ce legatura exista ntre consumul de alcol n perioada graviditatii si malformatiile genetice, au fost investigate un numar de 150 de
femei. Rezultatele obtinute sunt prezentate n tabelul urmator:
Au consumat alcool N-au consumat
Copii cu probleme
50
10
Copii sanatosi
30
60
Interpretati rezultatele obtinute.
2. Un psiholog are motive sa creada ca serviciul de psihoterapie de grup pentru delincventi are o influenta pozitiva si este asociat cu scaderea
numarului de recidive. Are el dreptate? Priviti datele din urmatorul tabel:
Au recidivat N-au recidivat
Au beneficiat de psihoterapie
25
35
N-au beneficiat de
50
30
psuhoterapie
3. Care sunt diferentele principale dintre coeficientul C a lui Pearson si coeficientul V al lui Cramer?
4. O statistica efectuata la nivel international releva urmatoarea distributie a copiilor cu cerinte educative speciale:
SUA
Suedia
Romnia
Centre de resurse
42800
3500
400
Clase normale
27200
4100
4900
Clase speciale
24400
2000
500
statisticasociala.tripod.com/cor_nepar.htm
6/7
01.12.2013
Corelatii neparametrice
Scoli speciale
5600
500
3800
Exista o asociere semnificativa ntre tipul de tara si tipul de scolarizare a copiilor cu CES?
5. Un psiholog social doreste sa vada daca exista vreo asociere semnificativa ntre nivelul de scolarizare si atitudinea fata de pedeapsa capitala.
Categoriile de raspuns pentru prima variabila au fost: nescolarizat, 4 clase absolvite, gimnaziu, scoala profesionala, liceu, postliceala si colegii,
studii universitare, studii postuniversitare. Cea de a doua variabila a fost cotata astfel: sunt foarte de acord cu introducerea pedepsei capitale,
sunt relativ de acord, nu stiu, sunt relativ mpotriva, sunt total mportiva introducerii ei. Iata rezultatele:
foarte de relativ nu stiu relativ
total
acord
acord
dezacord mpotriva
Fara scoala
26
15
8
2
6
4 clase
25
10
7
4
5
8 clase
14
12
13
9
9
Sc.profesionala 8
15
10
3
9
Liceu
9
24
4
10
16
Colegiu
7
12
5
14
8
Universitate
10
8
6
23
34
Postuniversitar 2
7
10
16
23
Exista vreo legatura ntre cele doua variabile? Interpretati rezultatele obtinute.
6. Doua cadre didactice sunt rugate sa clasifice cei 11 elevi cu dificultati de nvatare din perspectiva rezultatelor obtinute la Aritmetica, respectiv
Romna. Iata rezultatele:
rang
A B C D E F G H I
J
K
Aritmetica
1 2 3 4 5 6 7 8 9 10 11
Romna
3 1 2 9 4 8 6 5 7 11 10
Se poate spune ca vorbim de tulburari asociate, comune ambelor situatii?
7. Calculati coeficientul de corelatie Spearman daca: N=16, iar suma patratului diferentelor dintre ranguri este 308, la un prag de semnificatie de.01
n cazul unui test bilateral.
8. Exista mai multe programe de terapie comportamentala n scopul reducerii fumatului. O echipa de specialisti a fost rugata sa clasifice eficienta
acestora acordndu-le un calificativ de la 1(deloc eficiente) la 5(foarte eficiente) folosind doua criterii: rapiditatea schimbarii si durata schimbarii.
Exista oare o asociere ntre cele doua criterii?
Programe
Rapiditate
Durata
A
1
2
B
3
3
C
2
2
D
4
1
E
5
5
F
5
5
G
5
3
H
3
4
I
2
3
I. TEHNICI STATISTICE: Statistica descriptiva, Studiul corelational, Metode de comparatie, Tabele, Formule si raspunsuri la intrebari, Bibliografie
recomandata
II. APLICATII STATISTICE: Baze de date - Exemple
III. TESTE
IV. LINK-URI RECOMANDATE
PAGINA DE START
afsava@socio.uvt.ro
statisticasociala.tripod.com/cor_nepar.htm
7/7