Sunteți pe pagina 1din 26

Corelatie negativa pleaca din stanga sus si coboara catre dreapta jos

SA GANDIM CAT MAI COMPLEX SA FACEM PASU 2 SI GRAFICUL

COEFICIENTUL DE CORELATIE R MIC DACA ESTE INTRE 0 SI 0,1 SUNT SANSE SA NU AVEM NICIO
CORELATIE

EXEMPLU CAND AVEM CORELATIE INVERS PROPORTIONALA

CORELATIE NIVELUL DE URBANIZARE SI SPERANTA MEDIE DE VIATA

AVEM 2 VARIABILE, BABYMORT SAU MORTALITATEA INFANTILA

SI GDB PIBUL TARII RESPECTIVE

CARE PE CARE AR TREBUII SA INFLUENTEZE?

PIBUL AR TREBUII SA INFLUENTEZE MORTALITATEA INFANTILA, ADICA O TARA BOGATA CARE ARE UN
PIB MARE AR TREBUII SA AIBA O RATA DE MORTALITATE MICA

CU CAT TARA E MAI BOGATA CU CAT VA ALOCA RESURSE MAI CONSISTENTE ASUPRA CONDITILOR DE
EDUCATIE LA SANATATE.Drept urmare accesul la servicile de sanatate ar trebui sa fie mai facil iar v iata
copiilor rata mortalitatii sa fie mai mica

Gdp-variabila independenta y axis

Babymort variabila dependenta –x axis


Avem o corelatie liniara avem o litera i, e sus si apoi scade nu e o relatie liniara

Putem sa mai adaugam variabila regiune in set marker by region sa vedem daca relatia dintre ele este
doar valabila pentru anumite regiuni

Este influentata de regiune


Ne uitam ca tarile OECD SUNT TARI IN CARE RATA DE MORTALITATE ESTE DESTUL DE MICA , IN SCHIMB
TARILE CU ROSU EUROPA DE EST SI ELE SUNT TOT IN ZONA AIA TARILE CU VERDE AMERICA LATINA ELE
AR PUTEA SA IA O FORMA SUB FORMA UNUI NOR DE PUNCTE , TARILE DIN AFRICA SI ELE AR PUTEA SA
IA O FORMA SUB FORMA UNUI NOR DE PUNCTE

ATUNCI EXCLUDEM DIN ANALIZA OECD SI SELECTAM TOATE CAZURILE CARE AU REGIUNE MAI MARE CA
0 SELECT CASES ALL CASES IF REGIUNE MAI MARE SAU EGAL CU 2

CHIAR DACA DISPARE OECD TOT AVEM CAZURI ATIPICE DAM IAR SELECT CASES ALL CASES SI FAC UN
SPLIT DUPA REGIUNE APOI CALCULEZ CORELATIA INTRE BABY MORT SI GDP
PRIMA DATA CAND NE UITAM LA UN TABEL DE CORELATIE NE UITAM LA P MIC ADICA LA SIG TWO
TAILED LA PRAG DE SEMNIFICATIE, AVEM O CORELATIE DE 0,07 IAR NOI AM SPUS CA SA FIE
SEMNIFICATIVA SA FIE MAI MICA DECAT 0,05 .Deci la oecd clar ca nu este si l stergem , dupa ne uitam la
EUROPA DE EST SA VEDEM DACA AVEM CORELATIE DIN NOU 0,88 DECI NU AVEM CA NU E MAI MIC
DECAT 0,05 DECI IL STERGEM, DUPA PACIFIC ASIA E PRAGUL, 0,05 DECI AVEM CA E MAI MIC SI AVEM O
CORELATIE NEGATIVA PUTERNICA LA PERSON CORELATION ADICA DE -0,64 DECI O MENTINEM

LA AFRICA NU AVEM CORELATIE SEMNIFICATIVA

ORIENTUL MIJLOCIU ARE CORELATIE PUTERNICA CU UN PRAG DE 0,04 MAI MIC DE 0,05 NEGATIVA

IAR LA AMERICA LATINA AVEM CA E 0,02 IAR CORELATIA DE DATA ASTA TINDE A FI CATRE 0,49 TINDE SA
FIE PUTERNICA .

DACA E SA NE UITAM DOAR LA PACIFIC LA ORIENTUL MIJLOCIU SI LA AMERICA LATINA AVEM CORELATII
INVERS PROPORTIONALE, ASTA INSEAMNA CA DACA CRESC VALORILE SI PUTEM SA VEDEM SPRE
EXEMPLU LA SELECT CASES SA VEDEM NORU DE PUNCTE ADICA REGIUNEA SA FIE MAI MARE SAU EGALA
CU 5 SA VEDEM O REPREZENTARE GRAFICA NUMAI PE CELE 3 REGIUN I UNDE AM AVUT CORELATIE

NE UITAM LA GRAFICUL DE MAI JOS LA OREINTUL MIJLOCIU PUNCTELE ALBASTRE SI ELE POT FI PUSE
INTR UN NOR DE LA STANGA SUS CATRE DREAPTA JOS , STANGA SUS INSEAMNA CA PIBUL CU CAT
SCADE PIBUL CU CAT VALORILE DE LA PIB SE INDREAPTA IN JOS, IN CEEA CE PRIVESTE MORTALITATEA
INFANTILA GRAFICUL SE DUCE SPRE DREAPTA UN PIB DE 13000 ARE O MORTALITATE DE 10 LA MIE UN
PIB DE 8000V ARE O MORTALITATE DE 25 LA MIE UN PIB SI MA UIT LA AL ALBASTRU DE 3000 ARE O
MORTALITATE APROAPE DE 40 UN PIB SI MAI MIC SUB 2000 ARE O MORTALITATE DE 40 DECI NORU
ALBASTRU SE DUCE IN FORMA ASTA NORU ROSU AVEM UN OUTLIER AVEM STANGA SUS DREAPTA JOS
DACA ELIMINAM OUTLIERI NORU DE PUNCTE AR FI SI MAI STRANS

COEFICIENTUL DE RELATIE INSEAMNA CA AVEM RELATIE STATISTICA INTRE 2 VARIABILE , CA EA SA


EXISTE SI SA AIBA SEMNIFICATIE STATISTICA TREBUIE CA PRAGUL DE SEMNIFICATIE SA FIE MAI MIC
DECAT 0,05 .Dupa ce ne-am uitat la prag la acel p trebuie sa ne uitam la cat de tare este relatia de
influenta intre cele 2 variabile si vedem ca taria relatiei este data re valoarea lui r si r am zis ca poate lua
valori intre -1 si 1 cu cat su duce catre extreme adica catre -1 si 1 respectiv 1 cu atat corelatia este mai
puternica iar avem

CORELATIE SLABA-CAND VALOAREA COEFICIENTTULUI R ESTE IN INTERVALUL VALORI INTRE 0,10 SI 0,30

CORELATIE MODESTA /MODERATA –VALORI INTRE 0,30 SI 0,50Â

CORELATIE PUTERNICA VALORI INTRE 0,50 SI 0,70

CORELATIE FOARTE PUTERNICA –CAND VALORILE SUNT MAI MARI SAU EGALE CU 0,70

ELEMENTELE SEMNIFICATIE LA O CORELATIE SAU ELEMENTELE DE BAZA SUNT PRAGUL DE SEMNIFICATIE


MAI MIC DECAT 0,05 OBLIGATORIU SI VALOAREA COEFICIENTULUI DE CORELATIE
DEOCAMDATA AM VB DE CORELATIA PERSON IN CARE VARIABILELE TREBUIE SA FIE CANTITATIVE

UNII AUTORI ZIC CA AR TREBUII SA FIE DISTRIBUITE NORMAL

DECI INAINTE AM LUAT UN SPLIT DUPA REGIUNE SI AM VAZUT CA DOAR IN TREI REGIUNI RELATIA ERA
INVERS PROPORTIONALA SAU ERA O CORELATIE AM VAZUT ORIENTUL MIJLOCIU AMERICA LATINA SI
AFRICA. SI APOI AM SELECTAT DOAR REGIUNILE CU COD MAI MARE SAU EGAL CU 5 SI M AM OPRIT LA 2
DINTRE ELE LA ORIENTUL MIJLOCIU SI LA AMERICA LATINA SI AM FACUT ACEA REPREZENTARE GRAFICA
IN CARE AM AVUT NORUL DE PUNCTE
NORUL DE PUNCTE ALBASTRU ERA DIN ORIENTUL MIJLOCIU RESPECTIV NORU DE PUNCTE ROSU. SI MI
AM DAT SEAMA CA SI LA UNII SI LA ALTII LA ROSU SPRE EXEMPLU AVEAM UN OUTLIER

DACA ELIMINAM OULIERII NORU DE PUNCTE ALBASTRU AR AVEA DIRECTIA STANGA SUS DREAPTA JOS

DACA ELIMINAM OUTLIERII SINLA NORU DE PUNCTE ROSU AM AVEA O CORELATIE MAI SLABA CA
INTENSITATE

STATISTICII BIVARIATE IN CARE NE-AM RAPORTAT EXCLUSIV LA O VARIABILA ACUM AFLAM O RELATIE
PE MAI MULTE VARIABILE RESPECTIV 2
CORELATIA INTOTDEAUNA O S O CALCULAM PE VARIABILE CANTITATIVE SI AVEM NISTE CONDITII
LEGATE DE CRELATIE, INAINTE DE CONDII AVEM 3 COEFICIENTI

COEFICIENTUL DE CORELATIE PERSON CELALALT KENDOL SI SPERMON FIECARE DT EI AU NISTE


ELEMENTE SPECIFICE IN SENSUL UN CARE COEFICIEBTUL DE CORELATIE PERSON ESTE CEL MAI DES
UTILIZAT EL SE APLICA EXCLUSIV PE VARIABILE CANTITATIVE ESTE DE PREFERAT CA VARIABILELE SA FIE
DISTRIBUITE NORMAI ADCA FIECARE VARIABILA IN PARTE CAND FACEM ANALIZA DE FRECVENTA SA
VEDEM CA GRAFICUL SEAMANA CU O CURBA NORMALA , DACA LUCRAM PE ESANTIOANE MARI
ACEASTA CONDITIE NU MAI ESTE OBLIGATORIE

O ALTA CONDITIE LA COEFICIENTUL PERSON SA VEM CORELATIE ESTE CA VARIABILELE SA FIE INTRO
RELATIE LINIARA ,INSA SUNT SITUATII IN CARE NU AVEM O RELATIE LINIARA SI TREBUIE SA NE GANDIM
CE E DE FACUT.

VARIABILELE DEPENDENTE DEPIND DE CEVA SAU ASUPRA LOR SAU ALTA VARIABILA MANIFESTA
INFLUENTA DE EX STAREA DE SPIRIT A NOASTRA IN MOMENTU DE FATA ESTE O VARIABILA
DEPENDENTA EA DEPINDE DE ORA VREMEA DE AFARA

DACA VREM SA VEDEM CAT NE INFLUENTEAZA STAREA VREMII FACEM .

INAINTE DE PUNCTU ALA SAU VIRGULA OE CARE NI L ARATA SPSSU EXISTA INTOTDEAUNA UN 0 ESTE 0,
05

CEL MAI IMORTANT ELEMENT ESTE CA PRAGUL SA FIE MAI MIC DECAT 0,05 .EL NE ARATA DACA
CORELATIA ESTE SEMNIFICATIVA SAU NU DIN PUNCT DE VEDERE STATISTIC SI MAI APOI MAI AVEM UN
ELEMENT IMPORTANT VALOAREA COEFICIENTULUI DE CORELATIE CARE NE ARATA CAT DE TARE ESTE
INFLUENTA VARIABILELOR R MIC DACA ESTE INTRE 0 SI 0,1 SUNT SANSE SA NU AVEM NICIO CORELATIE
ADICA CORELATIE SLABA-CAND VALOAREA COEFICIENTTULUI R ESTE IN INTERVALUL VALORI INTRE 0,10
SI 0,30

CORELATIE MODESTA /MODERATA –VALORI INTRE 0,30 SI 0,50

CORELATIE PUTERNICA VALORI INTRE 0,50 SI 0,70

CORELATIE FOARTE PUTERNICA –CAND VALORILE SUNT MAI MARI SAU EGALE CU 0,70

EXEMPLU DE EXERCITIU

AVEM 2 VARIABILE PE CARE AM LUCRAT BABY MORT-MORTALITATEA INFANTILA, ADICA MORTALITATEA


COPIILOR DIN PRIMUL AN DE VIATA , DE OBICEI ACEASTA MORTALITATE ESTE MAI MARE IN TARILA MAI
SLAB DEZVOLTATE ECONOMIC, IN CARE NIVELUL DE EDUCATIE AL PERSOANELOR ESTE PUTIN MAI
SCAZUT APOI LUAM GDP –PIBUL O TARA BOGATA ESTE TARA CARE ARE UN PIB MARE

VREAU SA VAD DACA EXISTA VREO RELATIE INTRE PIB SI RATA DE MORTALITATE INFANTILA
AVEM 2 MODALITATI PRIN CARE IDENTIFICAM RELATIA DINTRE VARIABILE , UNA ERA O
REPREZENTARE GRAFICA SI ALTA ERA EFECTIV CALCULUL COEFICIENTULUI DE CORELATIE

DE DATA ASTA INCEPEM SA CALCULAM COEFICIENTUL DE CORELATIE

ANALYZE-CORELATE GDP VARIABILA INDEPENDENTA SI BABY MORT CEA DEPENDENTA

Correlations

babymort
gdp_cap Gross Infant mortality
domestic (deaths per
product / 1000 live
capita births)

gdp_cap Gross domestic Pearson Correlation 1 -.640**


product / capita
Sig. (2-tailed) .000

N 109 109

babymort Infant mortality Pearson Correlation -.640** 1


(deaths per 1000 live
Sig. (2-tailed) .000
births)
N 109 109

**. Correlation is significant at the 0.01 level (2-tailed).

NE UITAM LA ELEMENTUL PRINCIPAL ADICA LA PRAG DE SEMNIFICATIE SI OBSERVAM CA ESTE 0,00


CARE ESTE MAI MIC DECAT 0,05 SI E CLAR CA AVEM O CORELATIE SEMNIFICATIVA DIN PUNCT DE
VEDERE STATISTIC .MAI IN SUS AVEM VALOAREA COEFICIENTULUI DE CORELATIE R MIC ADICA
PEARSON CORELATION CARE ESTE -0,64 DE PBICEI NE OPRIM LA PRIMELE 2 ZECIMALE DECI ESTE INTEE
0, 5 SI 0,7 DECI AVEM O CORELATIE PUTERNICA ESTE CU MINUS DECI AVEM O CORELATIE NEGATIVA
CAND APARE MINUS INSEAMNA CA O VARIABILA SCADE SI ALTA O SA CREASCA ASTA INSEAMNA CA
RELATIA NOASTRA ESTE INVERS PROPORTIONALA , O VARIABILA SCADE CEALALTA CRESTE .

CA SA NE HOTARAM DACA CHIAR ASA ESTE FACEM SI GRAFICUL RESPECTIV IN GRAPHS

LA GRAFICE AVEM O REGULA AM SPUS CA AVEM 2 VARIABILE INDEPENDENTA SI DEPENDENTA

SI VARIABILA INDEPENDENTA O PUNEAM PE COLOANA DACA O PUNEAM PE COLOANA ATUNCI


INSEAMNA CA COLOANA ESTE OY DEPENDENTA LA NOI ERA BABYMORT EA DEPINDE DE BIP
NORUL NOSTRU DE PUNCTE ESTE UN PIC CIUDAT SI MAI MULT RELATIA DINTRE VARIABILELE
NOASTRE NU ESTE O RELATIE LINIARA.Norul DE PUNCTE DACA IL DESENAM VA ARATA CA LITERA J E
UN VERTICAL CARE COBOARA SPRE DREAPTA ASTA INSEAMNA CA RELATIA NOASTRA NU ESTE
LINIARA ASTA INSEAMNA CA CHIAR DACA COEFICIENTUL DE CORELATIE L AM CALCULAT MAI
DEVREME SI AVEM O VALOARE DE -0,64 CARE ESTE O CORELATIE SEMNIFICATIVA EA PROVINE DIN
NISTE DATE CARE NU SUNT TOCMAI ADECVATE

DE FIECARE DATA CAND CALCULAM O CORELATIE DINCOLO DE CALCULUL CORELATIEI SA FACEM


ACEST GRAFIC SI SA VEDEM DACA INTR-ADEVAR ASA ESTE.

PT CA NU POT SA AM UN NOR DE PUNCTE REGULAT IN CAZUL DE FATA IMI DAU SEAMA CA PUN SUB
SEMNUL INTREBARII ACEASTA INFORMATIE .DAM DUBLU CLICK IN GRAFIC DAM ICONITA A 4A SI
FACEM QUADRATIC

AR TREBUII SA TRASAM O LINIE CARE SA SE APROPRIE DE GRAFICUL NOSTRU ,AM TRASAT DAR LINIA
ESTE DEPARTE CEEA CE INSEMNA CA COEFICIENTUL DE CORELATIE ESTE DISCUTABIL DACA CHIAR ASA
SE INTAMPLA SI REFACEM GRAFICUL CU REGIUNA PUSA DE DATA ASTA .Punem regiunea deoarece ne
intrebam daca norul nostru de puncte nu are un element de specificitate si in momentul in care am
pus regiunea lucrurile s-au schimbat un pic si sa o vedem mai bn mergem in grafic pe legenda un dublu
click si ne punem pe oecd pe punctuletu albastru se activeaza partea cu negru de sus
Le coloram pe toate dan pe fiecare cerculet in parte si cand se activeaza patratu negru alegem de
acolo culorile

Vezi mai jos grafic

Daca ne uitam la cum arata graficul nostru ne dam seama ca faptul ca o tara a fost incadrata intr-o
anumita regiune ne ofera informatii ca relatia dintre variabile are un caracter regional, ne uitam cum
arata punctele albastre la oecd arata ca in general avem o rata mica de mortalitate infantila ea e la 0
si pana la 5 la mie sa zicem si vedem un bip mare dar in acelasi timp foarte eterogen avem cele 2
puncte albastre 7 8 mi avem si pib de 24 de mi ,daca ne raportam doar la variabila pib .Noru nostru de
puncte poate sa ia forme diferite pt fieare regiune in parte asta inseamna ca si coeficientii de corelatie
vor avea valori diferite pt fiecare regiune in parte si ma astept ca oecd sa nu aibe nicio corelatie pt ca
noru de puncte nu are nicio directie si ma asteptam ca directia mea sa fie din stanga sus catre dreapta
jos pt ca am o corelatie negativa

Corelatie negativa pleaca din stanga sus si coboara catre dreapta jos

As putea sa fac un nor de puncte care sa incadreze punctele rosii foarte discutabil in celealte imi dau
seama dar la africa nu ca vad foarte multe valori apropiate de 0 pib mic

Am 2 indicii cand am facut acest grafic prima ca relatia nu este liniara drept urmare daca nu este o
relatie liniara si are forma literei s de data asta inseaman ca coeficientul meu de corelatie pe tot
grupul acel -0,64 este pus sub semnul intrebarii si al doile indiciu este ca in functie de regiune aceasta
relatie intre variabile depinde de regiune si atunci daca depinde de regiune pot calcula coeficientul de
corelatie pe fiecare regiune

Cum calculam coeficientul de corelatie pe fiecare regiune in parte?

Facem split file pe regiune si dupa facem coeficientul de corelatie adica analyze corelate pe cele 2
variabile
Astfel avem coeficientul de corelatie pe gdp si baby mort pe fiecare regiune in parte

Correlations
babymort Infant
gdp_cap Gross mortality (deaths
domestic per 1000 live
region Region or economic group product / capita births)
1 OECD gdp_cap Gross domestic Pearson Correlation 1 -.392
product / capita Sig. (2-tailed) .079
N 21 21
babymort Infant mortality Pearson Correlation -.392 1
(deaths per 1000 live births) Sig. (2-tailed) .079
N 21 21
2 East Europe gdp_cap Gross domestic Pearson Correlation 1 .044
product / capita Sig. (2-tailed) .882
N 14 14
babymort Infant mortality Pearson Correlation .044 1
(deaths per 1000 live births) Sig. (2-tailed) .882
N 14 14
3 Pacific/Asia gdp_cap Gross domestic Pearson Correlation 1 -.648**
product / capita Sig. (2-tailed) .005
N 17 17
**
babymort Infant mortality Pearson Correlation -.648 1
(deaths per 1000 live births) Sig. (2-tailed) .005
N 17 17
4 Africa gdp_cap Gross domestic Pearson Correlation 1 -.420
product / capita Sig. (2-tailed) .074
N 19 19
babymort Infant mortality Pearson Correlation -.420 1
(deaths per 1000 live births) Sig. (2-tailed) .074
N 19 19
5 Middle East gdp_cap Gross domestic Pearson Correlation 1 -.656**
product / capita Sig. (2-tailed) .004
N 17 17
**
babymort Infant mortality Pearson Correlation -.656 1
(deaths per 1000 live births) Sig. (2-tailed) .004
N 17 17
6 Latn America Pearson Correlation 1 -.497*
gdp_cap Gross domestic Sig. (2-tailed) .022
product / capita N 21 21
*
babymort Infant mortality Pearson Correlation -.497 1
(deaths per 1000 live births) Sig. (2-tailed) .022
N 21 21
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).

Dam dublu click pe tabel si luam fiecare regiune in parte .Suntem al OECD NE UITAM PRIMA OARA SA
VEDEM DACA AVEM CORELATIE ADICA LA LA PRAG DE SEMNIFICATIE ADICA SIG TWO TAILED CARE E
0,07 SI NU ESTE MAI MIC DECAT 0,05 ,ESTE MAI MARE DECI NU AVEM CORELATIE SEMNIFICATIVA DIN
PUNCT DE VEDERE STATISTIC SI STERGEM COLOANA TOT CE INSEAMNA OECD ADICA ULTIMILE
COLOANE 2

VEZI MAI JOS ALEA CU NEGRU LE STERGEM

NICI LA EUROPA DE EST NU AVEM O CORELATIE INTRE PIB SI MORTALITATE DECI ELIMINAM

LA PACIFIC ASIA AVEM PRAG DE SEMNIFICATIE MAI MIC DE 0,05 MAI EXACT ESTE 0,005 SI
COEFICIENTUL DE CORELATIE ESTE -0,64 , DECI AVEM CORELATIE NEGATIVA PUTERNICA INVERS
PROPORTIONALA CEEA CE INSEAMNA CA PROBABIL O VARIABILA SCADE IAR UNA CRESTE

SI LA MIDDLE EST AVEM SEMNIFICATIV DE 0,04 IAR COEFICIENTUL DE CORELATIE ACESTA ESTE INVERS
PROPORTIONAL PUTERNIC -0,65

SI IN AMERICA LATINA AVEM IAR COEFICIENTUL DE CORELATIE ESTE -0,49 ESTE UNUL MEDIU ESTE
INVERS PROPORTIONAL NEGATIV

AVEM IN MOMENTU DE FATA 3 SITUATII PACIFIC ASIA ORIENTUL MIJLOCIU SI AMERICA LATINA UNDE
AVEM CORELATII NEGATIVE INVERS PROPORTIONALE CORELATII SEMNIFICATIVE DPDV STATISTIC .AM
PUTEA SPUNE CA RELATIA DINTRE GDP SI BABY MORT DEPINDE FOARTE MULT DE REGIUNEA IN CARE
ESTE INCADRATA TARA RESPECTIVA SI AM IDENTIFICAT DE FAPT DOAR 3 REGIUNI CA AR EXISTA O
RELATIE INTRE ACESTE VARIABILE

DAR DUPA CE CALCULAM COEFICIENTUL DE CORELATIE URMEAZA PASUL 2 ADICA SA SI VERIFICAM


DAACA IMAGINEA NE ARATA CA ESTE INTR-ADEVAR O RELATIE LINIARA INTRE VARIABILE

ASTFEL NU MAI REALIZAM UN GRAFIC PENTRU CA IL AVEM MAI SUS PE CEL COLORAT DIUPA REGIUNE

DACA NE PUNEM PE ORICE PUNCT DE EX PE CEL GALBEN DE LA OECD SI DAM TYPE SA FACEM
PUNCTELE PE CARE LE-AM COLORAT IN DIVERSE FORMEN PATRAT CERC ETC SI IN SIZE IL FACEM MAI
MARE MAI MIC CUM VREM FILU SI BOLDERU SA FIE DE ACEEASI CULOARE SA SE VADA MAI BINE

VEZI GARFICUL DE MAI JOS AL DOILEA DUPA TABEL


DUPA DAM IN CATEGORIES SA ELIMINAM ZONELE IN CARE NU AVEM CORELATIE

ASTFEL ELIMINAM PACIFIC ASIA SI ORIENTUL MIJLOCIU DIN ORDER PE X ALA

SI LASAM AMERICA LATINA CA ACOLO AM AVUT CORELATIE -0,49 AVEM O CORELATIE MODERATA
CATRE PUTERNICA SE APROPRIA DE 0,5 ADICA NORU NOSTRU DE PUNCTE ARE O DIRECTIE DIN
STANGA SUS SI COBOARA SPRE DREAPTA JOS .AVEM 2 CAZURI ATIPICE UNUL IN DREAPTA SI ALTUL IN
STANGA

RELATIA AR PUTEA FI LINIARA DIN STANGA SUS CATRE DREAPTA JOS SI DAM SUS IN ICONITE PE LA A
PATRA ICONITA SI SA DAM OK

TRAGEM O LINIE SA UNEASCA PUNCCTELE DEPINDE UN PIC SI DE CEI 2 OUTLIERI DACA I AM ELIMINA
LINUA AR FI UN PIC MAI JOS

LINIA ESTE DE FAPT O DREAPTA DE REGRESIE SI PE LINIE A APARUT O ECUATIE ADICA PUTEM SA
IDENTIFICAM O RELATIE INTRE CELE 2 VARIABILE DACA CUNOASTEM XUL X ERA VARIABIL
ABABYMORT VARIABILA DEPENDENDTA ASTFEL PUTEM ESTIMA CARE ESTE PIBUL UNEI TARI CARE E Y
UL RATEI DE MORTALITATE SI AM PUTEA SA FIE SI INVERS SA SCHIMBAM VALORILE INTRE ELE ADICA
DACA AM SCHIMBA VALOREA DEPENDENTA SA FIE PIBUL DE DATA ASTA SI INDEPEND RATA DE
MORTALITATE INFANTILA

APOI DAM DUBLU CLICK IN GRAFIC SA VEDEM CATEGORIILE

SCOATEM AMERICA LATINA SI LASAM ORIENTU MIJLOCIU LA ORIENTU MIJLOCIU SE VEDE SI MAI
FRUMOS NORU NOSTRU DE PUNCTE STANGA SUS COBOARA CATRE DREAPTA JOS RELATIA ESTE
INVERS PROPORTIONALA ATUNCI CAND SCADE GDPU CRESTE RATA DE MORTALITATE INFANTILA

SI AICI AVEM 2 OUTLIERI SI DACA I AS ELIMINAAR FI DIRECTIA MAI BUNA

DACA PUNEM PACIFIC ASIA SI SCOATEM ORIENTUL MIJLOCIU SI PUNEM PACIFIC ASIA

DAM PE ICONITA A 4A SI BIFAM CUBIC

AM COMPLICAT GRAFICUL

VEDEM CA DREAPTA NOASTRA ARAMAS IN GRAFIC DAR VEDEM O ALTA DREAPTA CEA NEAGRA CARE
NEA ARATA CA NORUL DE PUNCTE AR FI LITERA J.GRAFICUL NOSTRU NE ARATA CA DE FAPT RELATIA
DT CELE 2 VARIABILE NU ESTE O RELATIE LINIARA .DREPT URMARE DESII AM SPUS MAI DEVREME CA
0,64 IMVERS PROPORTIONALA VEDEM CA RELATIA NU ESTE UNA LINIARA SI ATUNCI AS PUTEA SPUNE
CU CERTITUDINE CA CORELATIA PEARSON NU SE POATE CALCULA PT CA RELATIA NU ESTE LINIARA

CONCLUZIE-RELATII REALE INTRE CELE 2 VARIABILE GASIM DOAR IN ORIENTUL MIJLOCIU SI IN


AMERICA LATINA
ALT EXEMPLU

O ANALIZA DE CORELATIE TOT PE CELE 2 VARIABILE

VEDEM UN ALT GRAFIC CARE NE VA AJUTA FOARTE MULT IN A REALIZA CORELATIA

GRAPSH SI LUAM DE DATA ASTA AL DOILEA SCATTER MATRIX SCATER SUB FORMA DE MATRICE SI
PUNEM LA MATRIX VARIABLES SI GDP SI BABYMORT

CARE DIN ALTE VARIABILE AR MAI PUTEA INFLUENTA GDPU SI MORTALITATEA INFANTILA

FERTILITATEA –PUNEM FERTILITY PT A VEDEA DACA AR PUTEA SA EXISTE O RELATIE INTRE


FERTILITATE SI GDP

REVENIM LA GDP SA VEDEM CARE AR PUTEA FI RELATIA IN GENERAL TARILE BOGATE CAM CUM
ARATA NATALITATEA IN TARILE BOGATE AR PUTEA FI INVERS CU CAT BIPUL ADICA CU CAT SUNT MAI
BOGATI RATELE DE FERTILITATE SA FIE CAT MAI MICA

DAR AM PUTEA RATA DE MORTALITATE INFANTILA INTR O RELATIE DE FERTILITATE, ATUNCI CAND AI
FERTILOTATE MARE CAND SE NASC MULTI COPII EVIDENT CA SUNT SANSE SA AI SI MORTALITATE
MARE INFANTILA , ELE INTRE ELE AU UN ALT TIP DE RELATIE

CE VARIABILA AR MAI PUTEA FI?

CLIMA NU POATE FI DEOARECE E O VARIABILA NOMINALA IAR NOI PUNEM DECAT VARIABILE
CANTITATIVE,ASTFEL VOM PUNE LITERACY ADICA O VARIABILA CARE NE ARATA NIVELUL DE
ALFABETIZARE AL UNEI TARI CATE PERSOANE STIU SA SCRIE SI SA CITEASCA SI VOM PUNE SI URBAN
PE MOTIV CA CU SIGURANTA ESTE O RELATIE INTRE URBAN SI GDP

VEZI MAI JOS TOATE VARIABILELE PUSE

AM PUS MULTE VARIABILE SI VREM SA VEDEM CARE AR FI RELATIE DINTRE ELE DAM OK

IN GRAFICUL DE MAI JOS AVEM UN MATRICE DE CORELATIE NUMAI CA DE DATA ASTA NU AVEM
VALORI CI AVEM GRAFICE .IERI CAND NE AM UITAT LA MATRICEA DE CORELATIE

GRAFICUL ASTA NE ARATA URMATORUL LUCRU .Matricea asta , ca este tabelul avem variabile pe linii
si pe coloane pe care le am introdus cele 5 variabile la fiecare .seamana cu matricea de corelatie

Facem o matricie de corelatie intre aceste variabile

Nu am o relatie liniara intre gdp si rata de mortalitate infantila inseamna ca coeficientul de corelatie
indiferent cum arata -0,64 nu provine dintr-o relatie liniara

Apoi urmatorul grafic am gdp cu fertility la fel relatia mea nu e liniara o corelatie de -0,90 foarte
puternicaa.
Si alfabetizare e acelasi film cu cat ponderea intr-o populatie a oamenilor care stiu sa scrie si sa
citeasca este mai mare cu atat o sa scada nivelul de fertilitate

Fertlitate si alfabetizare e imensa -0,86 este o relatie foarte puternica

As putea sa am un nor de puncte la nivelu de urbanizare si nivelul de alfabetizare.


Corelatie direct proportionala pozitiva

Corelatie negativa ambele invers proportionale

Am facut un grafic scater simplu pe toate aceste variabile

Dar pot pune si set marker by region iar graficul nostru va fi mai complicat

Le coloram dupa regiuni cercurile alea dand click pe fiecare OECD east europe vezi mai jos

Vad o relatie liniara pe turcoaz pe portocaliu relatie liniar din nou si pe galben si probabil si pe verde

Care nu s liniare albastru la OECD NOR DE PUNCTE ALBASTRU IL AVEM LA OECD INTRE PIB SI NIVEL DE
URBANIZARE

ACEST GRAFIC NE OFERA NISTE INDICII MAI CLARE STIIM DEJA UNDE SA NE UITAM LA CORELATII EL
DUBLEAZA MATRICEA

FACEM SPLIT PE REGIUNE SI CALCULAM COEFICIENTII DE CORELATIE DIN ANALYZE PE TOATE


VARIABILELE .LA O CORELATIE POT SA INCLUD MAI MULTE VARIABILE NU DOAR 2.

VEZI TABEL MAI JOS AVEM CORELATIE INTRE GDP SI LITERACY OECD MA UIT DOAR LA PUNCTELE
ALBASTRE

APOI MAI AM VREO CORELATIE LA GDP CU ALTELE LA OECD?NU. MAI AM O CORELATIE LA OECD
INTRE MORTALITAEA INFANTILA SI LITERACY
MAI JOS AM CEA DE JOS E DIRECT PROPORTIONALA UNDE CRESC AMBELE VARIABILE IAR DE SUS
INVERS PROPORTIONALA UNDE UNA CRESTE ALTA SCADE

ASTEA SUNT CELE 2 FORME DE GRAFICE PE CARE ATUNCI CAND LE INTALNIM AVEM UN INDICIU
VIZUAL CARE NE SPUNE CA AVEM O CORELATIE SEMNIFICATIVA DPDV STATISTIC , FIE CA ESTE DIRECT
PROPORTIONALA FIE CA ESTE INVERS PROPORTIONALA

SIGUR GRAFICUL NOSTRU POATE SA MAI FIE DOAR SUB FORME DE PUNCTE SI NU POT FI INCADRATE
IN CELE 2 IMAGINI DACA PUNCTELE SUNT IMPRASTIATE INSEAMNA CA ACELE PUNCTE NE
EVIDENTIAZA FAPTUL CA NU EXISTA O RELATIE DE CORELATIE INTRE CELE 2 VARIABILE.

DECI TREBUIE SA MA UIT PE SIG TWO TAILED SA VADA DACA E MAI MIC DECAT 0,05 DACA AM
CORELATIE SI ALEA CARE AU CORELATIE INSEAMNA CA AU RELATII SI TREBUIE SA VAD CE RELATII AU
CU GDPU IAR DACA SUNT MAI MARI LE STERG.UNDE AM CORELATII RAPORTAT LA REGIUNE
SI DUPA MA UIT LA PAERSON CORELATION SI OBSERV CA AM CORELATIE IN TARILE DEZVOLTATE
INTRE POZITIVA INTRE GDP SI LITERACY SAU NIVELUL DE ALFABETIZARE CORELATIE POZITIVA ASA
CUM MA ASTEPTAM O TARA BOGATA VARIANTA DEPENDENTA DE DATA ASTA CRED EU CA GDPU
INFLUENTEAZA NIVELUL DE ALFABETIZARE INTR-O TARA DEZVOLTATA CU SIGURANTA OAMENII VOR
STII SA SCRIE SI SA CITEASCA MAI MULT.

LA OECD OBSERV CA AM O RELATIE INVERS PROPORTIONALA INTRE BABYMORT MORTALITATEA


INFANTILA SI FERTILITY

S-ar putea să vă placă și