Sunteți pe pagina 1din 7

© Biostatistică și Informatică Medicală

De reţinut:

• Toate rezolvările temelor de laborator TREBUIE salvate în partiţia dvs. de pe server. Această operaţie este
posibilă doar dacă v-aţi catalogat la reţeaua catedrei folosind userul şi parola personale.
• Denumirile fişierelor şi folderelor trebuie să fie în conformitate cu cerinţele.

Calculul coeficientului de corelatie Pearson


o Testarea normalitatii datelor cu ajutorul optiunii Data Analysis
o Se copiază variabilele specificate în enuntul problemei într-o nouă foaie de calcul
(pentru a avea un domeniu continuu de date necesar selecției simultane în Data
analysis) astfel:

o Calcularea coeficientului de corelaţie Pearson dintre două variabile cantitative


cu ajutorul funcţiei CORREL
o Se va realiza prin functia CORREL astfel:
o Pozitionare pe o celula goala din foaia actuala de calcul ( de ex: celula H29)
o Formulas-> Insert Fonction-> ALL->CORREL
1
Page
© Biostatistică și Informatică Medicală

o Selectia variabilelor de studiu, dupa modelul afisat mai jos:

Array1: valorile circumferintei abdominale masurate pe esantionul de pacienti


Array2: valorile IMC pe esantion
o Validare prin OK
• Rezultat obtinut: r=0,60

Interpretarea coeficientului de corelatie Pearson


Regulile empirice de interpretare ale coeficientului de corelaţie ale lui Colton [1] sunt:
• Daca coeficientul r apartine intervalului [-0,25 ; +0,25] → Corelatie liniara slaba sau
inexistentă
• Daca coeficientul r apartine intervalului (0,25; 0,50] ∪ (-0,25 ;-0,50] → corelatie liniara
2

acceptabila
Page
© Biostatistică și Informatică Medicală

• Daca coeficientul r apartine intervalului (0,50; 0,75] ∪ (-0,50 ;-0,75] → corelatie liniara
moderata spre buna
• Daca coeficientul r apartine intervalului (0,75; 1] ∪ (-0,75 ; -1] →corelatie liniara puternică
(f.buna)

Realizarea graficului nor de puncte (Scatter):


o Se vor selecta valorile celor doua variabile de studiu (circumferinta abdominala
si IMC) pe esantion
o INSERT-> Chart-> Scatter

o Graficul obtinut va fi de forma:

o Formatarea gaficului:
o In cele ce urmeaza, graficul va fi formatat astfel (optiunea Design->Add Chart Element)
3

Inserarea unui titlu corespunzator: Relatia dintre Circumferinta abdominala si


Page

IMC
© Biostatistică și Informatică Medicală

Adaugarea titlului de axe


Dezactivarea legendei: click dreapta pe legenda->Delete
Schimbarea originii reperului pentru o interpretare mai facila a graficului: click
dreapta pe axa Ox->Format Axis

o Forma finala a graficului va fi:

4
Page
© Biostatistică și Informatică Medicală

Observatie: Daca cele doua variabile nu sunt corect afisate pe grafic (variabila
independenta pe axa OX) atunci se poate realiza schimbarea schimbarea axelor între ele:
selectia uneia din axe ->click dreapta->Select Data->Butonul Switch Row/Column
Adaugarea pe grafic a dreptei de regresie, ecuatia dreptei si coeficientul de
determinare (r2)
o Se selecteaza un punct oarecare al graficului
o Se alege optiunea Add Trendline:

o Se bifeaza optiunile:

5
Page
© Biostatistică și Informatică Medicală

o Forma finala este afisata mai jos:

Interpretarea coeficientul de determinare (r2)

Coeficientul de determinare (d) este pătratul coeficientului de corelaţie r.


Valoarea lui (in procente) exprima cât la sută din variaţia variabilei dependente (Y) se poate
explica prin relaţia liniară a acesteia cu variabila independenta (X)
Deci r2 = 0,36, deci in esantionul de studiu 36% din variaţia IMC-ului se poate explica prin
relaţia liniară a aceastuia cu circumferinta abdominala.
Interpretarea dreptei de regresie:
Se va interpreta coeficientul variabilei x din ecuația de regresie: pentru fiecare creștere a
variabilei independente (X=Circumferinta abdominala) cu o unitate de măsură (cu 1 cm),
variabila dependenta (Y=IMC (kg/m2)) crește in medie cu 0,238 unitati (kg/m2)
Interpretarea Diagramei de dispersie (Norul de puncte)
O idee privind relaţia între cele două caracteristici se obţine împărţind diagrama de
dispersie în patru cadrane prin două drepte perpendiculare care trec prin punctul (X, Y ),
având coordonatele egale cu mediile celor două variabile.
II I
III IV
Dacă există o relaţie liniară între cele două variabile atunci punctele diagramei se vor
repartiza preferenţial în anumite cadrane (II şi IV sau I şi III). Dacă punctele sunt repartizate
în cadranele I şi III, atunci diagrama de dispersie are o tendinţă crescătoare (dreapta de
regresie va avea un trend ascendent). Dacă punctele sunt repartizate în cadranele II şi IV,
atunci diagrama de dispersie are o tendinţă descrescătoare (dreapta de regresie va avea un
trend descendent). Dacă punctele sunt repartizate în toate cele patru cadrane în mod egal,
6

atunci diagrama de dispersie ne indică o corelaţie nulă.


Page
© Biostatistică și Informatică Medicală

Exemplu de interpretare:

Punctele diagramei sunt repartizate preferenţial în cadranele I şi III. Dependenţa dintre


Circumferinta abdominala şi IMC este pozitivă: o creştere a circumferintei abdominale implică
o creştere a IMC-ului. Dreapta de regresie are un trend ascendent ( tendinţă crescătoare).
Conform valorii estimate a coeficientului de determinare (R2) putem afirma ca aproximativ
36% din variaţia IMC-ului se explică prin relaţia liniară a acestuia cu circumferinta
abdominala. In plus, pentru fiecare creștere a circumferintei abdominale (x) cu o unitate de
măsură (cu 1 cm), IMC-ul (y) crește cu 0,238 unități de măsură (kg/m2) (rezulta din
coeficientul lui x din ecuatia dreptei de regresie).

1
. Colton T. Statistics in Medicine. Little Brown and Company, New York, NY, 1974.
7
Page

S-ar putea să vă placă și