Sunteți pe pagina 1din 4

Asist. univ. drd.

Hodișan Ramona

Laborator 12. CORELAȚII ȘI REGRESII


Obiective:
→ Coeficientul de corelaţie Pearson;
→ Coeficientul de determinare;
→ Graficul de tip nor de puncte (XY Scatter) ;
→ Regresia liniară simplă.
Problema 1.
Pe un lot format din 15 de pacienți se realizează un studiu. Se cunosc următorii
parametrii: Vârsta(ani), Gen (F/M) ,Înălțime (cm.), Greutate (kg.), Colesterol total. Datele se pe
a Prima Foaie a fișierului Excel. Redenumiți Foaie 1 în Problema 1.

Nr. crt. Gen Vârstă Înățime Greutate Colesterol


P01 M 24 170 88 135
P02 F 25 172 68 120
P03 M 38 180 75 150
P04 M 35 181 88 145
P05 M 22 187 72 155
P06 M 27 164 65 160
P07 F 27 162 48 100
P08 M 36 171 104 210
P09 F 32 158 85 220
P10 F 36 174 90 200
P11 M 40 188 98 215
P12 F 20 165 65 150
P13 M 30 184 84 195
P14 M 38 182 79 200
P15 F 32 168 95 220

1. Calculați Coeficientul de corelaţie Pearson (r) dintre Vârstă şi Colesterol și specificați tipul
de corelație.
Indicații
Notați in celula N2 Coeficientul de corelaţie iar în celula O2 inserați funcția =CORREL
Array1 f(x) Selectați valorile din tabelul initial pentru Vârstă
Array2 f(x) Selectați valorile din tabelul initial pentru Colesterol

2. Reprezentaţi grafic relaţia dintre Vârstă şi Colesterol (grafic de tip nor de puncte - Scatter),
adăugaţi pe grafic dreapta de regresie asociată şi coeficientul de determinare. Interpretaţi
graficul, coeficienţii dreptei de regresie şi coeficientul de determinare.

1
Asist. univ. drd. Hodișan Ramona

Indicații
Realizarea unui grafic de tip nor de puncte – diagrama de dispersie (XY Scatter)
1. Selectăm coloanele variabilelor pe care dorim să le reprezentăm grafic ( în cazul nostru
Vârstă și Colesterol)
2. Insert→selectăm diagrama de tip Scatter

3. Modificați Titlul ( Relația dintre vârstă și colesterol )


4. Intoduceți Titlul Axelor.
5. Adăugați dreptei de regresie pe grafic
5.1. Click dreapta pe oricare din punctele norului de puncte, selecți Add Trendline

5.2. În fereastra apărută se selectează Linear (pentru afișarea dreptei de regresie lineare),
se selectează Display Equation on chart (pentru afișarea ecuației dreptei de
regresie) și Display R-squared value on chart (pentru afișarea coeficientului de
determinare)

6. Modificați valoriile minime și maxime afișate pe axele norului de puncte


6.1 Pentru a modifica valorile minime și maxime pentru axa verticală se dă dublu-click
pe valorile axei verticale, la Minimum se alege Fixed și se trece manual o valoare
apropiată de cel mai jos punct din grafic, similar pentru Maximum.
6.2. Similar pentru axa orizontală.

2
Asist. univ. drd. Hodișan Ramona

3. Calculați Coeficientul de corelaţie Pearson (r) dintre Greutate şi Colesterol și specificați tipul
de corelație.
4. Reprezentaţi grafic relaţia dintre Greutate şi Colesterol (grafic de tip nor de puncte - Scatter),
adăugaţi pe grafic dreapta de regresie asociată şi coeficientul de determinare. Interpretaţi
graficul, coeficienţii dreptei de regresie şi coeficientul de determinare.
Teorie(INFORMATICĂ MEDICALĂ ŞI BIOSTATISTICĂ, Tărâţă Mihai, Georgescu Daniel, Badea
Petrică, Alexandru Dragoş Ovidiu, Şerbănescu Mircea-Sebastian, Manea Nicolae Cătălin,2020)
Corelaţia se poate defini ca legătura dintre variabilele observate în populaţii statistice.
Interpretarea coeficientului de corelație Pearson se poate face şi astfel:
r ∈[0; 0.2] → corelaţie foarte slabă, inexistentă
r ∈ [0.2; 0.4] → corelaţie slabă
r ∈ [0.4; 0.6] → corelaţie rezonabilă
r ∈ [0.6; 0.8] → corelaţie înalta
r ∈ [0.8; 1] → corelaţie foarte înaltă - relaţie foarte strînsă între variabile sau eroare de calcul.

Pătratul coeficientului de corelaţie, notat 𝑟 2 , reprezintă coeficientul de determinare între cei


doi parametri, are valori între 0 şi 1 şi măsoară valoarea covariaţiei raportată la volumul total
al variaţiei, rezultând procentul din variaţia totală care este explicată de variabila
independentă.
Dacă
𝑟 2 =1 atunci întraga variație a lui Y este explicată pe baza lui X
𝑟 2 =0 atunci variabila X nu contribuie la explicarea variabilei Y

Problema suplimentara(facultativ):
Pe un lot format din 15 de pacienți se realizează un studiu. Se cunosc următorii
parametrii: Vârsta(ani), Tensiune arterială sistolică (TAS),Tensiune arterială diastolică (TAD).
Redenumiți Foaie 2 în Problema suplimentaă.
Nr. crt. Vârstă TAD TAS
P01 24 75 125
P02 25 65 110
P03 38 80 130
P04 35 75 120
P05 22 70 125
P06 27 65 110
P07 27 80 130
P8 36 90 150
P9 32 95 155

3
Asist. univ. drd. Hodișan Ramona

P10 36 85 145
P11 40 90 150
P12 20 60 100
P13 30 85 160
P14 38 85 135
P15 32 90 140

1. Calculați Coeficientul de corelaţie Pearson (r) dintre Vârstă şi TAS și specificați tipul de
corelație.
2. Reprezentaţi grafic relaţia dintre Vârstă şi TAS (grafic de tip nor de puncte - Scatter), adăugaţi
pe grafic dreapta de regresie asociată şi coeficientul de determinare. Interpretaţi graficul,
coeficienţii dreptei de regresie şi coeficientul de determinare.

S-ar putea să vă placă și