Sunteți pe pagina 1din 12

Corelatia paerson o utilizam atunci cand variabilele

noastre sunt cantitative si sunt distribuite normal, adica


distributia fiecarei variabile se aseamana cu o distributie
normala sau cu un clopot al lui gaus .
Daca variabilele noastre nu sunt in situatia asta avem
posibilitatea sa facem o corelatie nu pearson ci spearmon
pe care o folosim atunci cand fie variabilele nu sunt
distribuite normal sau atunci cand avem o relatie intre o
variabila cantitativa si o variabila masurata pe o scara
oredinala , pe un nivel de masurare ordinal
Iar daca ambele variabile cu care operam sunt
masurabile sau sunt masurate pe un nivel ordinal folosim
kandel
Daca e sa calculam toate 3 tipurile de corelatii vom vedea
ca au valori similare, interpretarea este la fel valoarea coeficientilor
este intre -1 si 1.Practica stiintelor sociale ne arata ca de cele mai multe ori in sociologie corelatia care
se foloseste este corelatia pearson, chiar daca sunt incalcate unele reguli teoretice se accepta pt simplul
motiv ca sunt esantioane mari iar consistenta datelor provine din volumul esantionului sau din numarul
de respondenti inclusiv variabilele respective .Asta inseamna ca de cele mai multe ori putem sa utilizam
exclusiv coeficientul de corelatie pearson, dar sa retinem si ideea de kandel si de spearmon .

E bine sa fim atenti si la felul in care se utilizeaza anumite scale, mai precis la sensul pe care il are o
anumita scala, pt asta ne uitam la un exemplu concret facand o corelatie intre variabila d2, care zice asa

D2. Cât de mulţumit(ă) sunteţi în general de felul în care trăiţi?

4. Foarte mulţumit 3. Destul de mulţumit 2. Nu prea mulţumit 1. Deloc mulţumit 8. NŞ


9. NR si variabile d9 care imi zice Cum este […] în prezent comparativ cu cea de acum un an?
Mult mai bună Mai bună Aproximativ la fel Mai proastă Mult mai proastă
NR NŞ

D9. ...viaţa dvs. 1 2 3 4 5 8 9

Ne uitam intai la prima intrebare si apoi la cea de-a doua .Ambele variabile sunt masurate ordinal, atunci
folosim coeficientul de corelatie kandel.Intai declaram misingurile la d2 si la d9 apoi, Dam in analyze
correlate bivariate si trecem variabila d2 si d 9 si selectam kendall

Correlations
d9 Cum este
d2 Cât de mul? via?a dvs. în
umit(a) sunte?i prezent
în general de comparativ cu
felul în care trai? cea de acum un
i? an?
Kendall's tau_b d2 Cât de mul?umit(a) sunte? Correlation Coefficient 1.000 -.369**
i în general de felul în care Sig. (2-tailed) . .000
trai?i? N 2076 2076
**
d9 Cum este via?a dvs. în Correlation Coefficient -.369 1.000
prezent comparativ cu cea de Sig. (2-tailed) .000 .
acum un an? N 2076 2092
**. Correlation is significant at the 0.01 level (2-tailed).

Ne uitam prima oara la pragul de semnificatie care trebuie sa fie mai mic decat 0,05 Observam ca pragul
de semnificatie este 0,00 mai mic decat 0,05 si mai mult daca ne uitam sub tabel ne zice ca este mai mic
decat 0,01 apoi ne uitam la coeficientul de corelatie si coeficientul de corelatie este -0,36, ceea ce
inseamna ca daca este intre 0,3 si 0,5 am o corelatie moderata sau modesta.Asta inseamna ca intre cele
2 este o corelatie modesta sau moderata.Ne gandim un pic la logica situatiei, cat de multumiti sunteti in
general de felul in care traiti?Avem o corelatie negativa , asta inseamna ca daca creste nivelul de
multumire fata de felul in care traiesc respondentii si am a doua intrebare Cum este via?a dvs. în prezent
comparativ cu cea de acum un an? Si asta inseamna ca fiind corelatie negativa aici scade .Deci cu cat
creste multumirea fata de felul in care traiesc astazi cu atat scade aprecierea vizavi de viata mea
comparativ cu anul trecut, adica traiesc acuma mai prost decat anul trecut.Se rupe ceva ca si logica ne
uitam la variabila d2 si vedem ca aspectele pozitive ale multumirii , multumirea sau aspectele pozitive au
valori mari pe scala 4 respectiv 3 destul de multumit, foarte multumit si aspectele negative au valori
mici , insa la d9 aspectele pozitive adica viata mult mai buna sau cele de multumiire au de data asta
valori mici si aspectele negative au valori mari ,asta inseamna ca scalele sunt pe invers.La prima avem
valori mici nemultumire, valori mari la multumire nemultumire inseamna deloc multtumit nu prea
multumit astfel am asa la d2, nemultumire-1,2valori mici si multumire 3,4–valori mari .LA D9 AM
NEMULTUMIREA sau aspectele negative mai proasta viata mult mai proasta fata de acum un an am
valori mari adica 4,5 si multumirea aspectele pozitive-am valori mici pe scala 1,2.

Daca nu uitam la cele 2 variabile pe care le avem , scalele sunt pe invers si atunci ca sa putem avea
aceeasi unitate de masura totdeauna recomandarea e sa ne uitam cu atentie la scala .Ar trebui sa
stabilim sa avem aceeasi abordare adica sa avem valori mari in aceasi forma si valori mici in aceasi forma
, sa avem omogenitate intre cele 2 variabile.Atunci trebuie sa schimbam ceva la d9, sa schimbam valorile
, sa recodificam variabila.pt ca in felul asta cand corelam o scala cu sens de la mic la mare si o scala cu
sens de la mare la mic evident ca vom avea o corelatie pe invers, si inseamna ca coeficientului de
corelatie ar trebuii sa-i schimbam semnu si daca-i schimbam semnu ajungem la situatia reala.Deci avem
o eroare.sa ne imaginam diferenta de fus orar de exemplu ca nu avem aceeasi unitate de masura si
trebuie sa avem aceeasi unitate de masura, deci intotdeauna ma uit la valori la variabile sa fie aceleasi si
la mici si la mari, sa ne uitam la scala ca ambele scale si la d2 si la d 9 masoara in acelasi sens, aici vedem
ca ele masoara sensuri diferite si constam ca scala este pe invers si trebuie sa ajungem in acelasi sens sa
folosim valori mari si la d9 la multumire respectiv valori mici la nemultumire ca sa avem acelasi sens al
corelatiei .Pentru a avea acelasi sens al corelatiei valorile mici de la d9 sa le transformam in valori mari.
Si pun 105 104 103 102 101 si voi avea valori mari 104 105 la aspectele pozitive ca si la varibila d 2 si
valori mici de tipul 101 102 la aspectele negative sau la nemultumire.

Apoi vom face recodificarea la transform recode into different variables(cel mai des facem recodificarea
in variabile diferite)

Selectam d9 ca la variabila d9 facem recodificarea la old value 1 new value 105 dam ad apoi 2 aold
values value si new value 104 apoi 3 in 103 4 in 102 si 5 in 101 , apoi mai avem niste misinguri, celelale
variabile alte valori in afara de 1 2 3 4 si 5 , si anume 8 si 9 si le trecem la all other value coltul din stanga
jos si le transformam in system missing devin missing dam sa continue apoi definim variabila d9 in
outpout variable o denumin in d9_c dam change si ok.Apoi refacem analiza de corelatie din analyze
corelate bivariate intre d2 si d9_c care e ultima de jos si bifam kandel.

Vom vedea ca de data asta am ajuns la sensul real al corelatiei, ambele variabile masoara in aceeasi
directie si putem spune ca de data asta relatie e fireasca nivelul meu de multumire fata de felul in care
traiesc astazi creste cu felul in care ti-apreciezi ca viata ta e mai buna decat viata din anul anterior.
In concluzie am folosit acest exemplu sa vedem ca daca avem sensuri diferite la scale ceea ce am avut in
situatia noastra atunci corelatia va fi invers proportionala sau va fi diferit decat ar fi trebuit sa fie
normal.Daca avem acelasi sens la scala si daca exista aceeasi relatie autentice fireasca vom ajunge la o
astfel de corelatie pozitiva direct proportionala.Cum e viata ta astazi fata de anul trecut? Inseamna ca
daca si astzi te declari multumit fata de viata ta inseamna ca ambele cresc in acelssi sens.

Trebuie sa ne uitam cu atentie ca scala de masurare sa fie in acelasi sens la ambele variabile.Sigur ca am
fi putut sa recodificam d2ul numai ca l-am fi recodificat invers daca pastram d9 in forma asta valori
pozitive de multumire valori mici inseamna ca la d 2 ar fi trebuit sa avem 101 102 13 si 104 in loc de 4 2
2 si 1 si corelatia ar fi fost tot o corelatie pozitiva.

EXEMPLU CU CORELATIA SPEARMONMAI JOS

AVEM O VARIABILA CANTITATIVA PE CARE O LUAM IN CALCUL SI ANUME VARIABILA VARSTA .Si hai sa
vedem daca ar putea sa existe o corelatie intre varsta si nivelul de satisfactie fata felul in care traiesc
oamenii?Ar putea sa fie o relatie intre ele?Sa ne gandim la varsta in sine , pe masura ce oamenii
inainteaza in varsta satisfactia fata de felul in care traiesc ar trebuii sa creasca sau ar trebuii sa scada?

Pentru a vedea vom face o corelatie.Avem 2 variabile o variabila cantitativa si o variabila masurata pe un
nivel de masurare ordinal ordinalul este cel de la variabila d2.Cand avem cantitativ si ordinal folosim
coeficientul de corelatie Spearmon .Astfel ne ducem in analyze correlate si bivariate si facem o analiza
de corelatie pe d 2 si pe varsta, insa intai ne asiguram ca am pus misingul la d 2

Correlations
d2 Cât de mul?
umit(a) sunte?i
în general de
felul în care trai? varsta VARSTA
i? (ani)
Spearman's rho d2 Cât de mul?umit(a) Correlation Coefficient 1.000 -.160**
sunte?i în general de felul în Sig. (2-tailed) . .000
care trai?i? N 2076 2076
varsta VARSTA (ani) Correlation Coefficient -.160** 1.000
Sig. (2-tailed) .000 .
N 2076 2092
**. Correlation is significant at the 0.01 level (2-tailed).

A iesit o corelatie invers proportionala care ne spune ca este semnificativa pt ca pragul de semnificatie
este 0,00 mai mic decat 0,005 chiar mai mic decat 0,01 in situatia asta deci corelatie semnificativa din
prisma pragului iar valoarea coeficientului de corelatie este -0,16,corelatia este negativa asta inseamna
ca daca cresc valorile unei variabile scad valorile celeilalte.Cu alte cuvinte, pe masura ce subiectii nostrii
inainteaza in varsta satisfactia fata de nivelul in care traiesc scade,asta inseamna o corelatie invers
proportionala.Cu alte cuvinte pe masura ce imbatranim vom fi parca mai nnemultumiti fata de felul in
care traim.Oare de unde vine nemultumirea asta?Asociem inaintarea in varsta, batranetea cu starea de
sanatate care devine din ce in ce mai precara , respectiv resursele pe care le avem.E fireasca aceasta
situatie, cu cat inaintezi in varsta oamenii devin mai nemultumiti fata de felul in care traiesc.

Mai fortam inca o relatie si punem in relatie varsta si pachetul ala de la d3 la d9, sa vedem de unde vine
nemultumirea.Intai declaram misingurile si ne ducem in analyze corelate bivariate si trecem varsta si de
la d3 pana la d 9pe toate.

Correlations
d9 Cum
este
d4 Cât d5 Cât d8 Cât via?a
d3 Cât de mul? de mul? d6 Cât d7 Cât de mul? dvs. în
de mul? umit(a) umit(a) de mul? de mul? umit(a) prezent
umit(a) sunte?i sunte?i umit(a) umit(a) sunte?i compara
varsta sunte?i de ...? de ...? sunte?i sunte?i de ...? tiv cu
VARS de ...? serviciul banii pe de ...? de ...? localitate cea de
TA sanatate pe care îl care îi familia prietenii a în care acum un
(ani) a dvs. ave?i ave?i dvs. dvs. trai?i an?
Spearma varsta Correlati 1.000 -.464** -.070* -.205** -.078** -.112** .066** .311**
n's rho VARSTA on
(ani) Coeffici
ent
Sig. (2- . .000 .028 .000 .000 .000 .002 .000
tailed)
N 2092 2090 982 2077 2028 1937 2074 2092
** ** ** ** ** **
d3 Cât Correlati -.464 1.000 .354 .422 .190 .218 .079 -.371**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .000 . .000 .000 .000 .000 .000 .000
sanatate tailed)
a dvs. N 2090 2090 981 2075 2026 1936 2072 2090
* ** ** ** ** **
d4 Cât Correlati -.070 .354 1.000 .648 .211 .233 .171 -.380**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .028 .000 . .000 .000 .000 .000 .000
serviciul tailed)
pe care îl N 982 981 982 980 971 951 976 982
ave?i
d5 Cât Correlati -.205** .422** .648** 1.000 .148** .199** .099** -.403**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .000 .000 .000 . .000 .000 .000 .000
banii pe tailed)
care îi N 2077 2075 980 2077 2016 1924 2060 2077
ave?i
d6 Cât Correlati -.078** .190** .211** .148** 1.000 .473** .287** -.175**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .000 .000 .000 .000 . .000 .000 .000
familia tailed)
dvs. N 2028 2026 971 2016 2028 1894 2012 2028
d7 Cât Correlati -.112** .218** .233** .199** .473** 1.000 .355** -.192**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .000 .000 .000 .000 .000 . .000 .000
prietenii tailed)
dvs. N 1937 1936 951 1924 1894 1937 1924 1937
** ** ** ** ** **
d8 Cât Correlati .066 .079 .171 .099 .287 .355 1.000 -.106**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .002 .000 .000 .000 .000 .000 . .000
localitate tailed)
a în care N 2074 2072 976 2060 2012 1924 2074 2074
trai?i
d9 Cum Correlati .311** -.371** -.380** -.403** -.175** -.192** -.106** 1.000
este via? on
a dvs. în Coeffici
prezent ent
compara Sig. (2- .000 .000 .000 .000 .000 .000 .000 .
tiv cu tailed)
cea de N 2092 2090 982 2077 2028 1937 2074 2092
acum un
an?
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).

Ne uitam pe prima linie a tabelului nostrum, matricea de corelatie, avem varsta si observam ca
varsta cu toate celelalte variabile mai putin cu ultima d9 ma intereseazapana la localitate adica
pana la d 8, vedem ca pragurile de semnificatie la toate sunt mai mici decat 0,05 chiar mai mici
decat 0,01 deci avem corelatii semnificative dpdv statistic.
AM VAZUT CA PESTE TOT IN TOATA INTERSECTIA DINTRE VARSTA SI
CELELALTE VARIABILE .e SUFICIENT SA NE UITAM LA PRIMA LINIE PT CA NOI
AM INVATAT CA LA MATRICEA DE CORELATIE AVEM ACEA DIAGONALA SI NE
UITAM DEASUPRA DE DIAGONALA .PE MINE MA INTERESEAZA DOAR VARSTA IN
RELATIE CU CELELALTE..Daca am vazut ca la toate mai putin la serviciu am acolo un prag
de semnificatie pe care il avem 0,02 diferit decat restul care la toate e de 0,00 dar si acolo pragul
de semnificatie e de 0,02 mai mic decat 0,05 deci e semnificativ.
Am povestit despre intensitatea asocierii si am zis ca daca valorile coeficientului de corelatie
sunt intre 0 si 0,1 nu avem corelatie nu este semnificativa dpdv statistic sau relatia este foarte
slaba astfel incat nu exista .Aici avem coeficienti de corelatie care au valori mai mici decat 0,1?
Pt asta ma uit doar la linia cu varsta, varsta cu celelalte-ne uitam pe linie

Cand avem matricea de corelatie, adica imaginea cu tabelul taiem valorile de sub diagonala adiga
se sub correlation coefficient ne uitam doar deasupra diagonalei si pe mine ma interesa sa vad
valorile de la linia sau cum coreleaza varsta cu toate acestea d3 d4 d5 d6 d7 si d8 .Si ma uit in
felul urmator am spus ca daca valoarea coeficientului de corelatie este mai mica decat 0,1
inseamna ca nu avem corelatie.Ne uitam la variabila d4 la serviciu la valoarea coeficientului de
corelatie si vedem ca e 0,07 si vedem ca e mai mic decat 0,1 deci nu are corelatie.Urmatorul la
variabila d5 e 0,20 care e mai mare decat 0,1 iar daca e mai mare decat 0,1 avem tipul de relatie
slaba, adica intre 0,1 si 0,3 .Urmatoarea 0,07 e mai mica decat 0,01 deci nu avem
corelatie.Urmatoare 0,11 e la limita cumva este o corelatie foarte slaba care se aproprie de limita
inferioara a lui 0,1 deci este la limita inferioara a unei corelatii slabe .L aurmatoarea d8 avem
intraver pragul 0,00 care e mai mic decat 0,05 imi spune ca daca exista o corelatie ea este
semnificativa dar pt ca valoare coeficientului este 0,06 este mai mica decat 0,1 nu avem o
corelatie.
NE UITAM SA VEDEM CE TIP DE CORELATII SUNT DACA SUNT NEGATIVE
POZITIVE SLABE MODERATE PUTERNICE SI SA VEDEM CARE E CEA MAI MARE SI
SA CONCLUZIONAM PE CERINTE IN FUNCTIE DE VARIABILE DE EX CUM A FOST
AICI SANATATEA NEMULTUMIREA VINE IN PRIMUL RAND FATA DE SANATATE
Ma uit la variabila din stanga de ex la variabila d 4 si pe linia cu cea cu care vreau sa vad daca
exista o relatie cu d5 la pragul de semnificatie din casuta cu variabila d5 fata in fata cu d4 si asa
mai departe
Deci in momentu de fata am 2 corelatii care prezinta interes si a 3 a care nu prea prezinta
explicatii.M uit la variabila d 3 prima corelatie care e o corelatie negativa de -0,46 care zice ca
atunci cand inaintezi in varsta sau cu cat creste varsta scade nivelul de satisfactue fata de starea
de sanatate , cand imbatranesti evident ca nu esti multumit de starea ta de sanatate.Cu cat creste
varsta cu cat scade satisfactia fata de starea de sanatate.deci corelatia -0,46 e o corelatie negativa
iar daca e o corelatie negativa cat de tare este?0,46 se duce mai degraba catre 0,50 deci este o
corelatie negativa moderata catre puternica, aproape sau tinde sa fie puternica.
Vizavi de corelatie anterioara dt varsta si nemultumirea de felul in care traim vedem ca
nemultumirea vine preponderent din sanatate.apoi ne uitam ce inseamna ce-a dea doua corelatie
care este -0,20 corelatie slaba este negativa deci creste varsta iar satisfactia fata de banii pe care
oamenii ii iau scade.concluzie-Inseamna ca pe masura ce inaintam in varsta devenim mai
nemultumiti fata de starea de sanatate si fata de resursele financiare sau fata de banii pe care ii
avem.Deoarece ambele sunt corelatiile care au coeficientii cei mai mari deci nemuktumirea cea
mai mare si ambele sunt corelatii negative .Ne putem uita si la a 3 a clorelatie adica
nemultumirea fata de prieteni .Pe masura ce inaintam in varsta cercul nostru de prieteniu scade
sau fie ca de la o varsta relatiile de prietenie nu mai au o asa mare importanta.Oricum aceasta
corelatie este la limita unei corelatii slabe, in schimb nemultumirea fta de sanatate si fata de banii
pe care ii avem vedem ca este destul de importanta.

DIAGONALA=CU INTERSECTIA DINTRE VARIABILE


Am matricea asta iar ne uitam deasupra de diagonala si ne interesa cum coreleaza varsta cu
celelalte adica intersectia dintre varsta d3 d4 d5 d6 d7 si d8
Dar putem spune ca in diagonala vad intersectia dt d3 si d4 o relatie pozitiva prag de semnificatie
pozitiv
SUNTEM INTR-O CORELATIE SPEARMON CA SA VEDEM RELATIA DT D3 SI D4 AR
TREBUII SA NE UITAM LA UN COEFICIENT DE CORELATIE KENDAL PT CA
AMBELE SUNT MASURATE PE UN NIVEL DE MASURARE ORDINAL DAR CHIAR SI
ASA VEDEM CA AVEM O CORELATIE CARE ESTE DE INTENSITATE MODERATA
.
Pragurile de semnificatie si corelatiile sunt pe linia de la 3 sa vedem relatia dt d3 si
aceste variabile sunt Cum interpretam relatia dt variabila d3 si d4-cat suntem mai
multumiti de starea naostra de sanatate si aici deja numai vorbim de varsta vorbim de per general
suntem mai multumiti si de jobul pe care il avem.intre d3 si d5si credem ca atunci cand suntem
multumiti de starea noastra de sanatate creste nivelul de multumire si de banii pe care ii avem.e
coeficient mai mare 0,42 tot corelatia moderata
apoi ne uitam la d3 si d6 avem corelatie slaba intre satisfactia fata de sanatatesi familie
coeficient de 0,19
intre d3 si d7 am o corelatie slaba intre nivelul de multumire fata de sanatate si prietenii pe care
ii am si evident ca intre d3 si d8 nu am o corelatie intre nivelul de satisfactie fata de sanatate si
fata de localitate
in schimb ne uitam la cat de tare e corelatia intre serviciu si bani cand sunt multumit de serviciu
pe care il am sunt multumit si de banii pe care ii am e corelatie puternica 0,64
ar fi trebuit sa fie kendel da ma uit si la spearmon ca nu difera foarte mult.
CORELATIA PARTIALA
EXEMPLU-AR PUTEA SA EXISTE O CORELATIE INTRE NOTA DE LA TESTUL DE
STTISTICA SI NUMARUL DE ORE DE EXERCITII INDIVIDUALE –AR TREBUII SA FIE
O RELATIE DIRECT PROPORTIONALA CU CAT AI EXERSAT MAI MULT AI INVATAT
MAI MULT ERA FIRESC SA CREASCA NOTA SA OBTII O NOTA MAI MARE-O
CORELATIE DIRECT PROPORTIONALA, DAR AR FI PUTUT SA INTERVINA IN
ACESTE VARIABILE INTRE VARIABILA NOTA SI EFORTUL PE CARE L-AI DEPUS SA
INTERVINA SI ALTCEVA?DA..Stresul, dispozitia stare de sanatate, conexiunea la net.

!!1âTOTDEAUNA INTRE 2 VARIABILE IN RELATIA DINTRE 2 VARIABILE POT SA


EXISTE SI ALTE VARIABILE CARE NU SE VAD LUCRURI PE CARE NU LE PUTEM
CONTROLA, PE CARE NU LE PUTEM ELIMINA.SI ATUNCI INTERVINE IDEEA DE
CORELATIE PARTIALA
EXEMPLU EXISTA O CORELATIE FOARTE PUTERNICA POZITIVA INTRE NUMARUL
OAMENILOR MORTI MANCATI DE RECHINI SI CONSUMUL DE INGHETATA
CE INSEAMNA CORELATIE POZITIVA DIRECT PROPORTIONALA, INSEAMNA CU
CAT MANCAM MAI MULTA INGHETATA CU ATAT SUNT MAI MULTI OAMENI
MANCATI DE RECHINI .Ar putea fi o relatie intre ele?
Cand mergem la plaja? Cand eccald, astfel cand creste temperatura creste si consumul de
inghetata ?ce mai facem cand creste temperatura ne scaldam in ocean unde sunt rechini mai ulti.
DREPT URMARE DACA TEMPERATURA CRESTE NUMARUL CELOR CARE SE VOR
DUCE SA SE SCALDE IN APA SI EL VA CRESTE.vor fi mai multi oameni mancati vara
decat iarna pt ca iarna nu se sclada nimeni in apa.
EVIDENT CA E O ABERATIE SA EXISTE O RELATIE INTRE CONSUMUL DE
INGHETATA SI OAMENII MANCATI DE RECHINI, DAR EXISTA O VARIABILA
EXPLICATIVA ESTE VORBA DE TEMPERATURA SAU DE NUMARUL GRADELOR SI
VEDEM CA CU CAT CRESTE TEMPERATURA VA CRESTE SI CONSUMUL DE
INGHETATA SI EVIDENT CA CU CAT CRESTE TEMPERATURA VA CRESTE SI NR
OAMENILOR MANCATI DE RECHINI .ASTA INSEAMNA CA INTRE CELE 2
VARIABILE OAMENII CARE SUNT MANCATI DE RECHINI SI CONSUMUL DE
INGHETATA AVEM O VARIABILA INTERMEDIARA O VARIABILA CARE NE AJUTA
SA EXPLICAM LUCRUL ASTA

EXERCITIU
FOLOSIM BAZA DE DATE WORLD 95 SI LUAM VARIABILA BABYMORT-SAU RATA
DE MRTALITATE INFANTILA-copii care mor in primul an de viata SI URBANIZARE-
ponderea populatiei care traieste in mediul urbanVARIABILA URBAN .Ma astept ca intre ELE
SA EXISTE O RELATIE .Care pe care ar putea sa o influenteze? Ar pute sa se influenteze una
pe cealalta?
Cu cat o tara este mai urbanizata sau cu cat ponderea populatiei care traieste in mediul urban este
mai mare atunci mortalitatea infantila probabil va fi mai mica pt ca mediul urban pt ca mediul
urban ar putea sa insemne un sistem de sanatate mai bine pus la punct ceea ce insemna ca si
asistenta copiilor in primul an de viata ar putea sa fie mai buna drept urmare ar putea sa scada nr
deceselor la copii in primul an de viata respectiv mortalitatea infantila

Din pacate in baza noastra de date nu am nicio inf despre sistemul de sanatate in schimb am o
alta variabila care mi-a starnit interesul variabila respectiva este literacy-nivelul de alfabetizare
sau ponderea populatiei care stie sa citeasca si stau sa ma gandesc daca intre aceste 3 variabile
daca nivelul de alfabetizare ar putea sa-mi explice relatia dintre mortalitatea infantila si nivelul
de urbanizare si incerc sa le pun intr-o relatie pe toate 3
Analyze corelate-bivariate-deocamdata le voi pune intr-o corelatie pearson deci bifam pearson

Correlations
babymort Infant
mortality (deaths urban People
per 1000 live living in cities literacy People
births) (%) who read (%)
babymort Infant mortality Pearson Correlation 1 -.718** -.900**
(deaths per 1000 live births) Sig. (2-tailed) .000 .000
N 109 108 107
**
urban People living in cities Pearson Correlation -.718 1 .650**
(%) Sig. (2-tailed) .000 .000
N 108 108 107
** **
literacy People who read (%) Pearson Correlation -.900 .650 1
Sig. (2-tailed) .000 .000
N 107 107 107
**. Correlation is significant at the 0.01 level (2-tailed).

Voi constata ca cu siguranta intre ele va exista o relatie


!!!Am spus ca tai elementele de sub diagonala principala si ma uit exclusiv deasupra
diagonalei principale , adica ma uit la intersectia dintre urban si mortalitatea infantila si vad ca
am o corelatie semnificativa avem o corelatie foarte puternica peste 0,70 adic a-0,71si o corelatie
negativa adica inversa ceea ce inseamna ca cu cat imi creste nivelul de urbanizzare o sa-mi scada
rata de mortalitate infantila .Mai vad ca am o corelatie pozitiva0,65 intre nivelul de urbanizare si
nivelul de alfabetizare .Nu prea stiu care pe care influentezaza daca urbanizarea influenteaza
alfabetizarea adica cu cat traieste mai multa lume la oras creste si nr celor care stiu carte sau
invers .Mai vad o corelatie foarte puternica intre mortalitatea infantila si nivelul de alfabetizare
-0,90 corelatie invers proportionala care imi spune ca cu cat o populatie este mai alfabetiazata cu
cat nr persoanaelot care stiu sa scrie si sa citeasca este mai mare cu atat rata de mortalitate
infantila va fi mai mica.
ATunci INTREBAREA ESTE nivelul de URBANIZARE si mortalitatea infantila aceasta
corelatie daca ma uit la aceasta corelatie vad ca am o corelatie foarte puternica de -0,71 DAR NU
SUNT CONVINS CA RELATIA ESTE O RELATIE FOARTE AUTENCICA INTRE ELE
NUMAI INTERVINE CEVA INTRE ELE SI ELEMENTUL CARE INTERBVINE INTRE
NIVELUL DE URBANIZARE SI RATA DE MORTALITATE INFANTILA CRED EU CA
ESTE NIVELUL DE ALFABETIZARE SI ATUNCI FAC O CORELATIE PARTIALA DIN
ANALYZE CORELATE PARTIAL IN VARIABLES VOI CONTROLA RELATIA DINTRE
NIVELUL DE URBANIZARE SI RATA DE MORTALITATE INFANTILA DECI IN
VARIABLES TREC VARIABILA URBAN SI VARIABILA BABYMORT SI VOI INCERCA
SA ELIMIN INFLUENTA PE CARE O ARE NIVELUL DE ALFABETIZARE, DECI IN
CONTROLING FOR TREC LITERACY .Am vazut ca alfabetizarea coreleaza puternic cu
ambele coreleaza direct proportional si cu urbanizarea si invers proportional cu rata de
mortalitate infantila.Si atnci incerc sa controlez, sa diminuez sa elimin de fapt efectul pe care il
are nivelul de alfabetizare intre cele 2 variabile.De ex cand maine stiu ca am test incerc sa elimin
multe din lucrurile care stiu ca ar putea sa afecteze relatie dt efortul meu si nota pe care
intentionez sa o obtin si elimin bautura conexiunea slaba la net etc.

Correlations
babymort Infant
urban People mortality (deaths
living in cities per 1000 live
Control Variables (%) births)
literacy People who read (%) urban People living in cities Correlation 1.000 -.449
(%) Significance (2-tailed) . .000
df 0 104
babymort Infant mortality Correlation -.449 1.000
(deaths per 1000 live births) Significance (2-tailed) .000 .
df 104 0

Avem valorile coeficientilor de care vorbeam mai devreme


Ar trebui sa fie si prima parte a tabeluilui da o s-o refac care ne a ratat influenta dintre nivelul de
urbanizare si mortalitatea infantila corelatie invers proportionala foarte puternica de 0,73
Dar in momentul in care vreau sa elimin influenta variabilei literacy Ma uit la cea dea doua parte
adica ce am mai sus in care am variabila de control care este literacy ca am eliminat infkuenta pe
care o face nivelul de alfabetizare intre nivelul de urbanizare si mortalitatea infantila adica
parteaa douaa tabelului si parte de interes este itersecia dt nivelul de urbanizare si babymort ,voi
vedea ca initial corelatia care a fost una ft puternica de -0,73 s-a schimbat un pic a devenit o
corelatie moderata care tinde catre a fi puternica 0,44 intre nivelul de alfabetizare si
babymort.daca eliminam influenta nivelului de alfabetizare si sa ajungem la o relatie mai
autentica intre nivelul de urbanizare si mortalitatea infantila fara aceasta influenta vom ajunge șa
coeficientul de corelatie -0,44.Cu siguranta relatia dt nivelul de urbanizare si rata de mortalitate
infantila nu este influentata numai de nivelul de alfabetizare si gdpu ar putea ifluenta relatia
dintre urbanizare si rata de mortalitate infantila, cu cat o tara este mai urbanizata inseamna ca e o
tara bogata in care economia merge si daca e sa mai incerc sa mai elimin inca un element de
influenta am eliminat nivelul de alfabetizare si daca elimin si gdpu vom vedea ca probabil relatia
dt urbanizare si babymort se mentine devine mai pura
Relatia dintre nivelul de urbanizare si cea de mortalitate infantila a devenit -0,34 a ramas tot
corelatie invers proportionala de intensitate moderata
ATUNCI CAND AM ELIMINAT DIN CONTEXTUL INFLUENTELOR NIVELUL DE
ALFABETZIARE SI GDPU CU SIGURANTA ALFABETIZAREA PUTEREA ECONOMICA
A UNEI TARI INTERVIN IN RELATIE DINTRE NIVELUL DE URBANIZARE SI
MORTALITATEA INFANTILA SI ATUNCI CAND LE ELIMINAM AJUNGEM LA
COEFICIENTUL DE –O,34 DECI TOT RAMANE O RELATIE INVERS PROPORTIONALA
SEMNIFICATIVA STATISTIC RELATIE MODERATA INTRE URBANIZARE SI RATA DE
MORTALITATE INFANTILA
!!! IN RELATIA DINTRE 2 VARIABILE INTOTDEAUNA VOR EXISTA SI ALTE
INFLUENTE-alte lucruri care intervin si daca vrem sa vedem ca relatia dt variabile exista
trebuie sa eliminam cat mai multe variabile care intervin si pot influenta acea relatie DREPT
URMARE AJUNGEM LA IDEEA DE CORELATIE PARTIALA
ATUNCI CAND ANALIZAM O RELATIE INTRE VARIABILE SA NE GANDIM DACA NU
CUMVA EXISTA O ALTA VARIABILA IN SPATE CARE EXPLICA RELATIE DINTRE
ELE.Si atunci daca exista un ceva care poate explica incercati sa eliminam acel ceva care explica
si ajungem la relatia autentica dintre variabile
Am plecat de la o relatie fparte puternica invers proportionala si pe masura ce am eliminat biste
influente care poat sa intervina nivelul de alfabetizare si gdp mi am dat seama ca am ajuns la o
relatie mai pura mai autentica mai reala si am ajuns la tot o corelatie dar o corelatie tot invers
proportionala dar mai autentica am eliminat factorii sau variabileel care poat sa influente relatia
dt urbanizare si mortalitatea infantila am eliminat nivelul de alfabetizare gdpu .CAND AM
ELIMINAT NIVELUL DE ALFABETIZARE AM AJUNS LA -0,44 CAND AM ELIMINAT
GDPU AM AJUNS LA -0,34
ELIMINAM SI CALORIILE SI VEDEM CA NIVELUL DE URBANIZARE CORELEAZA
FOARTE TARE SI CU CALORIILE
Cu alte cuvinte daca vrem sa explicam relatie dintre nivelul de alfabetizare si rata de mortalitate
infantila totdeauana trebuie sa icludem gdpu caloriile etc..

Cu cat eliminam mai multe variabile care influenteaza cu atat ajungem la esenta dintre relatia dt
variabile pe care le analizam si putem sa o explicam mai bine
Deci intai facem analiza pe 2 variabile a caror relatie vrem so aflam din analyze corelatie
bivariate si dupa in analize colelate partial si punem 2 sa aflam relatia de ex urban si babymort si
de jos ce vrem sa eliminam
Mortalitatea infantila si fertilitatea nu poat sa mearga decat impreuna
SA REFAC ANALIZA PARTIALA

S-ar putea să vă placă și