Documente Academic
Documente Profesional
Documente Cultură
E bine sa fim atenti si la felul in care se utilizeaza anumite scale, mai precis la sensul pe care il are o
anumita scala, pt asta ne uitam la un exemplu concret facand o corelatie intre variabila d2, care zice asa
Ne uitam intai la prima intrebare si apoi la cea de-a doua .Ambele variabile sunt masurate ordinal, atunci
folosim coeficientul de corelatie kandel.Intai declaram misingurile la d2 si la d9 apoi, Dam in analyze
correlate bivariate si trecem variabila d2 si d 9 si selectam kendall
Correlations
d9 Cum este
d2 Cât de mul? via?a dvs. în
umit(a) sunte?i prezent
în general de comparativ cu
felul în care trai? cea de acum un
i? an?
Kendall's tau_b d2 Cât de mul?umit(a) sunte? Correlation Coefficient 1.000 -.369**
i în general de felul în care Sig. (2-tailed) . .000
trai?i? N 2076 2076
**
d9 Cum este via?a dvs. în Correlation Coefficient -.369 1.000
prezent comparativ cu cea de Sig. (2-tailed) .000 .
acum un an? N 2076 2092
**. Correlation is significant at the 0.01 level (2-tailed).
Ne uitam prima oara la pragul de semnificatie care trebuie sa fie mai mic decat 0,05 Observam ca pragul
de semnificatie este 0,00 mai mic decat 0,05 si mai mult daca ne uitam sub tabel ne zice ca este mai mic
decat 0,01 apoi ne uitam la coeficientul de corelatie si coeficientul de corelatie este -0,36, ceea ce
inseamna ca daca este intre 0,3 si 0,5 am o corelatie moderata sau modesta.Asta inseamna ca intre cele
2 este o corelatie modesta sau moderata.Ne gandim un pic la logica situatiei, cat de multumiti sunteti in
general de felul in care traiti?Avem o corelatie negativa , asta inseamna ca daca creste nivelul de
multumire fata de felul in care traiesc respondentii si am a doua intrebare Cum este via?a dvs. în prezent
comparativ cu cea de acum un an? Si asta inseamna ca fiind corelatie negativa aici scade .Deci cu cat
creste multumirea fata de felul in care traiesc astazi cu atat scade aprecierea vizavi de viata mea
comparativ cu anul trecut, adica traiesc acuma mai prost decat anul trecut.Se rupe ceva ca si logica ne
uitam la variabila d2 si vedem ca aspectele pozitive ale multumirii , multumirea sau aspectele pozitive au
valori mari pe scala 4 respectiv 3 destul de multumit, foarte multumit si aspectele negative au valori
mici , insa la d9 aspectele pozitive adica viata mult mai buna sau cele de multumiire au de data asta
valori mici si aspectele negative au valori mari ,asta inseamna ca scalele sunt pe invers.La prima avem
valori mici nemultumire, valori mari la multumire nemultumire inseamna deloc multtumit nu prea
multumit astfel am asa la d2, nemultumire-1,2valori mici si multumire 3,4–valori mari .LA D9 AM
NEMULTUMIREA sau aspectele negative mai proasta viata mult mai proasta fata de acum un an am
valori mari adica 4,5 si multumirea aspectele pozitive-am valori mici pe scala 1,2.
Daca nu uitam la cele 2 variabile pe care le avem , scalele sunt pe invers si atunci ca sa putem avea
aceeasi unitate de masura totdeauna recomandarea e sa ne uitam cu atentie la scala .Ar trebui sa
stabilim sa avem aceeasi abordare adica sa avem valori mari in aceasi forma si valori mici in aceasi forma
, sa avem omogenitate intre cele 2 variabile.Atunci trebuie sa schimbam ceva la d9, sa schimbam valorile
, sa recodificam variabila.pt ca in felul asta cand corelam o scala cu sens de la mic la mare si o scala cu
sens de la mare la mic evident ca vom avea o corelatie pe invers, si inseamna ca coeficientului de
corelatie ar trebuii sa-i schimbam semnu si daca-i schimbam semnu ajungem la situatia reala.Deci avem
o eroare.sa ne imaginam diferenta de fus orar de exemplu ca nu avem aceeasi unitate de masura si
trebuie sa avem aceeasi unitate de masura, deci intotdeauna ma uit la valori la variabile sa fie aceleasi si
la mici si la mari, sa ne uitam la scala ca ambele scale si la d2 si la d 9 masoara in acelasi sens, aici vedem
ca ele masoara sensuri diferite si constam ca scala este pe invers si trebuie sa ajungem in acelasi sens sa
folosim valori mari si la d9 la multumire respectiv valori mici la nemultumire ca sa avem acelasi sens al
corelatiei .Pentru a avea acelasi sens al corelatiei valorile mici de la d9 sa le transformam in valori mari.
Si pun 105 104 103 102 101 si voi avea valori mari 104 105 la aspectele pozitive ca si la varibila d 2 si
valori mici de tipul 101 102 la aspectele negative sau la nemultumire.
Apoi vom face recodificarea la transform recode into different variables(cel mai des facem recodificarea
in variabile diferite)
Selectam d9 ca la variabila d9 facem recodificarea la old value 1 new value 105 dam ad apoi 2 aold
values value si new value 104 apoi 3 in 103 4 in 102 si 5 in 101 , apoi mai avem niste misinguri, celelale
variabile alte valori in afara de 1 2 3 4 si 5 , si anume 8 si 9 si le trecem la all other value coltul din stanga
jos si le transformam in system missing devin missing dam sa continue apoi definim variabila d9 in
outpout variable o denumin in d9_c dam change si ok.Apoi refacem analiza de corelatie din analyze
corelate bivariate intre d2 si d9_c care e ultima de jos si bifam kandel.
Vom vedea ca de data asta am ajuns la sensul real al corelatiei, ambele variabile masoara in aceeasi
directie si putem spune ca de data asta relatie e fireasca nivelul meu de multumire fata de felul in care
traiesc astazi creste cu felul in care ti-apreciezi ca viata ta e mai buna decat viata din anul anterior.
In concluzie am folosit acest exemplu sa vedem ca daca avem sensuri diferite la scale ceea ce am avut in
situatia noastra atunci corelatia va fi invers proportionala sau va fi diferit decat ar fi trebuit sa fie
normal.Daca avem acelasi sens la scala si daca exista aceeasi relatie autentice fireasca vom ajunge la o
astfel de corelatie pozitiva direct proportionala.Cum e viata ta astazi fata de anul trecut? Inseamna ca
daca si astzi te declari multumit fata de viata ta inseamna ca ambele cresc in acelssi sens.
Trebuie sa ne uitam cu atentie ca scala de masurare sa fie in acelasi sens la ambele variabile.Sigur ca am
fi putut sa recodificam d2ul numai ca l-am fi recodificat invers daca pastram d9 in forma asta valori
pozitive de multumire valori mici inseamna ca la d 2 ar fi trebuit sa avem 101 102 13 si 104 in loc de 4 2
2 si 1 si corelatia ar fi fost tot o corelatie pozitiva.
AVEM O VARIABILA CANTITATIVA PE CARE O LUAM IN CALCUL SI ANUME VARIABILA VARSTA .Si hai sa
vedem daca ar putea sa existe o corelatie intre varsta si nivelul de satisfactie fata felul in care traiesc
oamenii?Ar putea sa fie o relatie intre ele?Sa ne gandim la varsta in sine , pe masura ce oamenii
inainteaza in varsta satisfactia fata de felul in care traiesc ar trebuii sa creasca sau ar trebuii sa scada?
Pentru a vedea vom face o corelatie.Avem 2 variabile o variabila cantitativa si o variabila masurata pe un
nivel de masurare ordinal ordinalul este cel de la variabila d2.Cand avem cantitativ si ordinal folosim
coeficientul de corelatie Spearmon .Astfel ne ducem in analyze correlate si bivariate si facem o analiza
de corelatie pe d 2 si pe varsta, insa intai ne asiguram ca am pus misingul la d 2
Correlations
d2 Cât de mul?
umit(a) sunte?i
în general de
felul în care trai? varsta VARSTA
i? (ani)
Spearman's rho d2 Cât de mul?umit(a) Correlation Coefficient 1.000 -.160**
sunte?i în general de felul în Sig. (2-tailed) . .000
care trai?i? N 2076 2076
varsta VARSTA (ani) Correlation Coefficient -.160** 1.000
Sig. (2-tailed) .000 .
N 2076 2092
**. Correlation is significant at the 0.01 level (2-tailed).
A iesit o corelatie invers proportionala care ne spune ca este semnificativa pt ca pragul de semnificatie
este 0,00 mai mic decat 0,005 chiar mai mic decat 0,01 in situatia asta deci corelatie semnificativa din
prisma pragului iar valoarea coeficientului de corelatie este -0,16,corelatia este negativa asta inseamna
ca daca cresc valorile unei variabile scad valorile celeilalte.Cu alte cuvinte, pe masura ce subiectii nostrii
inainteaza in varsta satisfactia fata de nivelul in care traiesc scade,asta inseamna o corelatie invers
proportionala.Cu alte cuvinte pe masura ce imbatranim vom fi parca mai nnemultumiti fata de felul in
care traim.Oare de unde vine nemultumirea asta?Asociem inaintarea in varsta, batranetea cu starea de
sanatate care devine din ce in ce mai precara , respectiv resursele pe care le avem.E fireasca aceasta
situatie, cu cat inaintezi in varsta oamenii devin mai nemultumiti fata de felul in care traiesc.
Mai fortam inca o relatie si punem in relatie varsta si pachetul ala de la d3 la d9, sa vedem de unde vine
nemultumirea.Intai declaram misingurile si ne ducem in analyze corelate bivariate si trecem varsta si de
la d3 pana la d 9pe toate.
Correlations
d9 Cum
este
d4 Cât d5 Cât d8 Cât via?a
d3 Cât de mul? de mul? d6 Cât d7 Cât de mul? dvs. în
de mul? umit(a) umit(a) de mul? de mul? umit(a) prezent
umit(a) sunte?i sunte?i umit(a) umit(a) sunte?i compara
varsta sunte?i de ...? de ...? sunte?i sunte?i de ...? tiv cu
VARS de ...? serviciul banii pe de ...? de ...? localitate cea de
TA sanatate pe care îl care îi familia prietenii a în care acum un
(ani) a dvs. ave?i ave?i dvs. dvs. trai?i an?
Spearma varsta Correlati 1.000 -.464** -.070* -.205** -.078** -.112** .066** .311**
n's rho VARSTA on
(ani) Coeffici
ent
Sig. (2- . .000 .028 .000 .000 .000 .002 .000
tailed)
N 2092 2090 982 2077 2028 1937 2074 2092
** ** ** ** ** **
d3 Cât Correlati -.464 1.000 .354 .422 .190 .218 .079 -.371**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .000 . .000 .000 .000 .000 .000 .000
sanatate tailed)
a dvs. N 2090 2090 981 2075 2026 1936 2072 2090
* ** ** ** ** **
d4 Cât Correlati -.070 .354 1.000 .648 .211 .233 .171 -.380**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .028 .000 . .000 .000 .000 .000 .000
serviciul tailed)
pe care îl N 982 981 982 980 971 951 976 982
ave?i
d5 Cât Correlati -.205** .422** .648** 1.000 .148** .199** .099** -.403**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .000 .000 .000 . .000 .000 .000 .000
banii pe tailed)
care îi N 2077 2075 980 2077 2016 1924 2060 2077
ave?i
d6 Cât Correlati -.078** .190** .211** .148** 1.000 .473** .287** -.175**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .000 .000 .000 .000 . .000 .000 .000
familia tailed)
dvs. N 2028 2026 971 2016 2028 1894 2012 2028
d7 Cât Correlati -.112** .218** .233** .199** .473** 1.000 .355** -.192**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .000 .000 .000 .000 .000 . .000 .000
prietenii tailed)
dvs. N 1937 1936 951 1924 1894 1937 1924 1937
** ** ** ** ** **
d8 Cât Correlati .066 .079 .171 .099 .287 .355 1.000 -.106**
de mul? on
umit(a) Coeffici
sunte?i ent
de ...? Sig. (2- .002 .000 .000 .000 .000 .000 . .000
localitate tailed)
a în care N 2074 2072 976 2060 2012 1924 2074 2074
trai?i
d9 Cum Correlati .311** -.371** -.380** -.403** -.175** -.192** -.106** 1.000
este via? on
a dvs. în Coeffici
prezent ent
compara Sig. (2- .000 .000 .000 .000 .000 .000 .000 .
tiv cu tailed)
cea de N 2092 2090 982 2077 2028 1937 2074 2092
acum un
an?
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
Ne uitam pe prima linie a tabelului nostrum, matricea de corelatie, avem varsta si observam ca
varsta cu toate celelalte variabile mai putin cu ultima d9 ma intereseazapana la localitate adica
pana la d 8, vedem ca pragurile de semnificatie la toate sunt mai mici decat 0,05 chiar mai mici
decat 0,01 deci avem corelatii semnificative dpdv statistic.
AM VAZUT CA PESTE TOT IN TOATA INTERSECTIA DINTRE VARSTA SI
CELELALTE VARIABILE .e SUFICIENT SA NE UITAM LA PRIMA LINIE PT CA NOI
AM INVATAT CA LA MATRICEA DE CORELATIE AVEM ACEA DIAGONALA SI NE
UITAM DEASUPRA DE DIAGONALA .PE MINE MA INTERESEAZA DOAR VARSTA IN
RELATIE CU CELELALTE..Daca am vazut ca la toate mai putin la serviciu am acolo un prag
de semnificatie pe care il avem 0,02 diferit decat restul care la toate e de 0,00 dar si acolo pragul
de semnificatie e de 0,02 mai mic decat 0,05 deci e semnificativ.
Am povestit despre intensitatea asocierii si am zis ca daca valorile coeficientului de corelatie
sunt intre 0 si 0,1 nu avem corelatie nu este semnificativa dpdv statistic sau relatia este foarte
slaba astfel incat nu exista .Aici avem coeficienti de corelatie care au valori mai mici decat 0,1?
Pt asta ma uit doar la linia cu varsta, varsta cu celelalte-ne uitam pe linie
Cand avem matricea de corelatie, adica imaginea cu tabelul taiem valorile de sub diagonala adiga
se sub correlation coefficient ne uitam doar deasupra diagonalei si pe mine ma interesa sa vad
valorile de la linia sau cum coreleaza varsta cu toate acestea d3 d4 d5 d6 d7 si d8 .Si ma uit in
felul urmator am spus ca daca valoarea coeficientului de corelatie este mai mica decat 0,1
inseamna ca nu avem corelatie.Ne uitam la variabila d4 la serviciu la valoarea coeficientului de
corelatie si vedem ca e 0,07 si vedem ca e mai mic decat 0,1 deci nu are corelatie.Urmatorul la
variabila d5 e 0,20 care e mai mare decat 0,1 iar daca e mai mare decat 0,1 avem tipul de relatie
slaba, adica intre 0,1 si 0,3 .Urmatoarea 0,07 e mai mica decat 0,01 deci nu avem
corelatie.Urmatoare 0,11 e la limita cumva este o corelatie foarte slaba care se aproprie de limita
inferioara a lui 0,1 deci este la limita inferioara a unei corelatii slabe .L aurmatoarea d8 avem
intraver pragul 0,00 care e mai mic decat 0,05 imi spune ca daca exista o corelatie ea este
semnificativa dar pt ca valoare coeficientului este 0,06 este mai mica decat 0,1 nu avem o
corelatie.
NE UITAM SA VEDEM CE TIP DE CORELATII SUNT DACA SUNT NEGATIVE
POZITIVE SLABE MODERATE PUTERNICE SI SA VEDEM CARE E CEA MAI MARE SI
SA CONCLUZIONAM PE CERINTE IN FUNCTIE DE VARIABILE DE EX CUM A FOST
AICI SANATATEA NEMULTUMIREA VINE IN PRIMUL RAND FATA DE SANATATE
Ma uit la variabila din stanga de ex la variabila d 4 si pe linia cu cea cu care vreau sa vad daca
exista o relatie cu d5 la pragul de semnificatie din casuta cu variabila d5 fata in fata cu d4 si asa
mai departe
Deci in momentu de fata am 2 corelatii care prezinta interes si a 3 a care nu prea prezinta
explicatii.M uit la variabila d 3 prima corelatie care e o corelatie negativa de -0,46 care zice ca
atunci cand inaintezi in varsta sau cu cat creste varsta scade nivelul de satisfactue fata de starea
de sanatate , cand imbatranesti evident ca nu esti multumit de starea ta de sanatate.Cu cat creste
varsta cu cat scade satisfactia fata de starea de sanatate.deci corelatia -0,46 e o corelatie negativa
iar daca e o corelatie negativa cat de tare este?0,46 se duce mai degraba catre 0,50 deci este o
corelatie negativa moderata catre puternica, aproape sau tinde sa fie puternica.
Vizavi de corelatie anterioara dt varsta si nemultumirea de felul in care traim vedem ca
nemultumirea vine preponderent din sanatate.apoi ne uitam ce inseamna ce-a dea doua corelatie
care este -0,20 corelatie slaba este negativa deci creste varsta iar satisfactia fata de banii pe care
oamenii ii iau scade.concluzie-Inseamna ca pe masura ce inaintam in varsta devenim mai
nemultumiti fata de starea de sanatate si fata de resursele financiare sau fata de banii pe care ii
avem.Deoarece ambele sunt corelatiile care au coeficientii cei mai mari deci nemuktumirea cea
mai mare si ambele sunt corelatii negative .Ne putem uita si la a 3 a clorelatie adica
nemultumirea fata de prieteni .Pe masura ce inaintam in varsta cercul nostru de prieteniu scade
sau fie ca de la o varsta relatiile de prietenie nu mai au o asa mare importanta.Oricum aceasta
corelatie este la limita unei corelatii slabe, in schimb nemultumirea fta de sanatate si fata de banii
pe care ii avem vedem ca este destul de importanta.
EXERCITIU
FOLOSIM BAZA DE DATE WORLD 95 SI LUAM VARIABILA BABYMORT-SAU RATA
DE MRTALITATE INFANTILA-copii care mor in primul an de viata SI URBANIZARE-
ponderea populatiei care traieste in mediul urbanVARIABILA URBAN .Ma astept ca intre ELE
SA EXISTE O RELATIE .Care pe care ar putea sa o influenteze? Ar pute sa se influenteze una
pe cealalta?
Cu cat o tara este mai urbanizata sau cu cat ponderea populatiei care traieste in mediul urban este
mai mare atunci mortalitatea infantila probabil va fi mai mica pt ca mediul urban pt ca mediul
urban ar putea sa insemne un sistem de sanatate mai bine pus la punct ceea ce insemna ca si
asistenta copiilor in primul an de viata ar putea sa fie mai buna drept urmare ar putea sa scada nr
deceselor la copii in primul an de viata respectiv mortalitatea infantila
Din pacate in baza noastra de date nu am nicio inf despre sistemul de sanatate in schimb am o
alta variabila care mi-a starnit interesul variabila respectiva este literacy-nivelul de alfabetizare
sau ponderea populatiei care stie sa citeasca si stau sa ma gandesc daca intre aceste 3 variabile
daca nivelul de alfabetizare ar putea sa-mi explice relatia dintre mortalitatea infantila si nivelul
de urbanizare si incerc sa le pun intr-o relatie pe toate 3
Analyze corelate-bivariate-deocamdata le voi pune intr-o corelatie pearson deci bifam pearson
Correlations
babymort Infant
mortality (deaths urban People
per 1000 live living in cities literacy People
births) (%) who read (%)
babymort Infant mortality Pearson Correlation 1 -.718** -.900**
(deaths per 1000 live births) Sig. (2-tailed) .000 .000
N 109 108 107
**
urban People living in cities Pearson Correlation -.718 1 .650**
(%) Sig. (2-tailed) .000 .000
N 108 108 107
** **
literacy People who read (%) Pearson Correlation -.900 .650 1
Sig. (2-tailed) .000 .000
N 107 107 107
**. Correlation is significant at the 0.01 level (2-tailed).
Correlations
babymort Infant
urban People mortality (deaths
living in cities per 1000 live
Control Variables (%) births)
literacy People who read (%) urban People living in cities Correlation 1.000 -.449
(%) Significance (2-tailed) . .000
df 0 104
babymort Infant mortality Correlation -.449 1.000
(deaths per 1000 live births) Significance (2-tailed) .000 .
df 104 0
Cu cat eliminam mai multe variabile care influenteaza cu atat ajungem la esenta dintre relatia dt
variabile pe care le analizam si putem sa o explicam mai bine
Deci intai facem analiza pe 2 variabile a caror relatie vrem so aflam din analyze corelatie
bivariate si dupa in analize colelate partial si punem 2 sa aflam relatia de ex urban si babymort si
de jos ce vrem sa eliminam
Mortalitatea infantila si fertilitatea nu poat sa mearga decat impreuna
SA REFAC ANALIZA PARTIALA