Sunteți pe pagina 1din 23

Coeficientul de corelatie Pearson

Introducere

Notele Z fac posibila analiza legaturii dintre doua variabile Corelatia indica existenta unei legaturi intre variabile, legatura care poate fi:

Pozitiva:

Negativa

Scoruri mari -> Scoruri mari Scoruri medii -> Scoruri medii Scoruri mici -> Scoruri mici
Scoruri mari -> Scoruri mici Scoruri medii -> Scoruri medii Scoruri mici -> Scoruri mari

Poate sa nu apara nicio legatura

Introducere

Coeficientul de corelatie = r si indica gradul in care apare patternul unei relatii intre cele doua variabile;

r [-1; +1] Corelatie pozitiva r (0; +1] Corelatie negativa r [-1; 0) Lipsa corelatie r = 0

Painea este periculoasa

Avertisment important pentru consumatorii de paine 1. Mai mult de 98% dintre detinutii condamnati sunt consumatori de paine. 2. Aproape JUMATATE dintre copiii care cresc in gospodarii unde se consuma paine au scoruri sub medie la testele standardizate. 3. In secolul 18, cand aproape toata painea se cocea acasa, speranta medie de viata era de 50 de ani; ratele de moarte spontana erau inacceptabil de mari; numeroase femei mureau la nastere; si boli precum febra tifoida, febra galbena si gripa faceau ravagii in intreaga populatie. 4. Mai mult de 90% dintre crimele violente sunt comise la mai putin de 24 de ore de la consumul de paine. 5. Painea este realizata dintr-o substanta numita aluat. S-a dovedit ca 500 de grame de aluat sunt suficiente pentru a sufoca un soarece. Romanul mediu consuma mai mult decat aceasta cantitate intr-o luna.

Painea este periculoasa

6. Triburile primitive care nu consumau paine prezinta o incidenta scazuta a cancerului, boala Alzheimer, Parkinson si osteoporoza. 7. S-a dovedit ca painea da dependenta. Subiectii care au fost privati de paine si carora li s-a dat doar apa au implorat pentru paine dupa numai doua zile. 8. Sugarii se pot ineca de la paine. 9. Majoritatea romanilor care consuma paine nu pot distinge intre date stiintifice semnificative si aberatii statistice fara sens. In lumina acestor statistici inspaimantatoare, recomandam urmatoarele restrictii:

Sa nu se vanda paine minorilor. O campanie nationala Spuneti nu painii! completata cu sustinerea unor celepritati TV si cu abtibilduri. O taxa de 300% pe toata productia de paine care sa fie directionata pentru prevenirea bolilor care sunt asociate cu painea. Stabilirea zonelor fara paine in jurul scolilor.

Introducere

!!!Observatie: analiza corelatiei dintre doua variabile nu permite stabilirea relatiei de cauzalitate intre aceste variabile.

Fie x poate fi cauza pt y Fie y poate fi cauza pt x Fie a aparut o a treia var care a determinat aparitia simultana a celor doua variabile

Pragul de semnificatie (p)

Pragul de semnificatie p, ne indica in ce masura ne inselam atunci cand afirmam ceva. In cazul corelatiei p indica daca exista o legatura intre doua sau mai multe variabile. In cercetarea stiintifica se lucreaza de obicei cu doua praguri de semnificatie, corespunzatoare procentajului de eroare

p 0.010 (gresim in mai putin de 1% din cazuri) P 0.050 (gresim in mai putin de 5% din cazuri)

Tipuri de eroare
Evenimentul Apare Nu apare

Predictia evenimen tului

Apare Nu apare

Corect

Eroarea I (minciuna)
Corect

Eroarea II (ignoranta)

Tipuri de ipoteze

Ipoteze non-directionale: nu se precizeaza tipul de relatie intre variabile.

Probabilitatea de eroare se imparte la cele doua extremitati ale distributiei => test de semnificatie TWO TAILED Ex: Exista o legatura intre salariul initial si cel final al subiectilor.

Tipuri de ipoteze

Ipoteze directionale: sunt cele in care se precizeaza tipul de relatie, cercetatorul se astepta la un anumit rezultat.

Probabilitatea de eroare se stabileste la una din extremitatile distributiei. Testul de semnificatie este ONE TAILED Ex: Legatura dintre slariul initial si final este pozitiva, cu cat salariul initial este mai mare cu atat salariul final va fi mai mare.

Calcularea corelatiei Pearson cu ajutoru SPSS


Baza de date: sondaj cu privire la dormitoarele de camin S-au adunat raspunsuri de la chestionarele a cinci intrebari privind conditiile din dormitoarele de camin de la 10 studenti de anul I. Chestionarul evalueaza atitudinea fata de zgomot, mobila, zona de studiu, si intimitatea precum si nivelul venitului parintilor acestor studenti. Ipoteza: Exista o legatura intre gradul de satisfactie fata de mediul de locuit al universitatii si situatia materiala a studentilor. Chestionarul contine cinci intrebari cu privire la satisfactie. Acestora li s-au dat raspunsuri pe o scara de 5 puncte gen Likert (de la foarte nemultumit pana la foarte multumit).

Pasul 1. Da click pe Analyze (analizeaza), apoi Correlate (coreleaza), apoi Bivariate (bidimensional). Pasul 2. Muta variabilele pe care doresti sa le corelezi in campul Variables (variabile). Pasul 3. Daca doresti sa listezi mediile si abaterile standard, da apoi click pe Options si selecteaza statisticile dorite. Apoi da click pe Continue si apoi pe OK.

Calcularea corelatiei Pearson cu ajutoru SPSS


Correlations

1
nivel venit parinti in mii nivel venit parinti in mii Pearson Correlation Sig. (2-tailed) 1 satisfactie nivel zgomot in camin -.772**

2
N satisfactie nivel zgomot in camin Pearson Correlation Sig. (2-tailed)

.009

10 -.772**

10 1

.009

N
**. Correlation is significant at the 0.01 level (2-tailed).

10

10

Explicare output

Randul 1: Pearson correlation valorile coeficientilor de corelatie dintre doua variabile Randul 2: Sig (2 TAILED) probabilitatea de eroare la respingerea ipotezei de nul si acceptarea ipotezei de cercetare Randul 3: N contine numarul de subiecti care au scoruri la ambele variabile Celula 4: corelatia dintre var venit parinti cu ea insasi; corelatie perfecta dar lipsita de semnificatie Celula 5: corelatia dintre var zgomot si var venit parinti

Interpretare output

Semnul corelatiei: arata natura legaturii

r>0 => legatura pozitiva; scorurile mici de la prima var. se asociaza cu scorurile mici de la a 2a var.; sc. medii de la prima var. se asociaza cu sc. medii de la a 2a var.; sc. mari de la prima var. se asociaza cu sc. mari de la a 2a var. r<0 => legatura negativa; scorurile mici de la prima var. se asociaza cu scorurile mari de la a 2a var.; sc. medii de la prima var. se asociaza cu sc. medii de la a 2a var.; sc. mari de la prima var. se asociaza cu sc. mici de la a 2a var.

Interpretare output

Marimea absoluta a coeficientului: descrie taria legaturii care apare intre variabile.

|r| < 0.30 => legatura slaba 0.30 < |r| < 0.50 => legatura medie |r| > 0.50 => legatura puternica

Interpretare output

Pragul de semnificatie:

p 0.050 => exista o relatie semnificativa intre cele 2 var. (probabilitatea de a gresi este mai mica de 5%) !Obs: p = .000 => p<0.001; p<0.01 P > 0.050 => nu exista o relatie semnificativa intre cele doua variabile

Interpretare output

Proportia de varianta = r explica la ce procent din populatie apare relatia

Relatia gasita este prezenta la x% din populatie

Rezolvare exercitiu

r = - 0.772 p = 0.009 < 0.01 N = 10 Semnul corelatiei: r = - 0.772 < 0; semnul este negativ => legatura dintre var venit parinti si var zgomot este negativa ceea ce inseamna ca un venit ridicat al parintilor se asociaza cu un nivel scazut al satisfactiei la zgomot, un venit mediu al parintilor se asociaza cu un nivel mediu al satisfactiei la zgomot si un nivel scazut al venitului parintilor se asociaza cu un nivel ridicat al satisfactiei la zgomot.

Rezolvare exercitiu

Marimea absoluta a coef de corelatie:

|r| = 0.772 > 0.50 => taria legaturii intre venitul parintilor si satisfactia la zgomotul din camin este puternica
p = 0.009 < 0.01 => putem spune ca exista o legatura semnificativa intre variabilele venitul parintilor si nivelul de satisfactie la zgomotul din camin.

Pragul de semnificatie:

Rezolvare exercitiu

Proportia de varianta:

r = 0.59 * 100 = 59 => relatia gasita este prezenta la 59% dintre subiecti

Crerea unei diagrame de dispersie pentru perechi de variabile

O diagrama de dispersie este o reprezentare grafica bi-dimensionala a relatiei dintre doua variabile. Acest grafic te ajuta sa evaluezi natura si gradul de relatie dintre variabilele tale. Pasul 1. Pentru a crea o diagrama de dispersie pentru datele tale, sa spunem intre variabila de venit si cea de zgomot, da click pe Graphs (grafice) si apoi pe Scatter (disperseaza). Pasul 2. In meniul Scatterplot, da click pe Simple si apoi pe Define (defineste). Pasul 3. Acum muta variabilele pe axele potrivite. In cazul de fata, ai putea dori sa muti variabila de zgomot in campul axei Y iar variabila de venit in campul axei X. Odata ce ai facut asta, da click pe OK

Dupa cum poti vedea, acest grafic tinde sa indice o satisfactie descrescatoare pe masura ce venitul pe familie al participantului creste.

Grafic corelatie