Documente Academic
Documente Profesional
Documente Cultură
4.curs RegresieCorelatie PDF
4.curs RegresieCorelatie PDF
regresie - corelatie
i 1 i 1
Eroarea totală trebuie minimizată în variabilele a şi b pentru a obţine o
aproximare cât mai corectă a valorilor lui y funcţie de x. Condiţia este ca
derivata funcţie de fiecare variabilă în parte să fie zero. Obţinem astfel sistemul
de ecuaţii:
n
a b x y 2
i i n
a 0 i 1
0 2 a b xi yi 0
a
n ni 1
0 a b xi yi 2 2 a b xi yi xi 0
b i 1 i 1
0
b
n
n X Y xi y i
b i 1
n a Y b X
n X 2 xi2 Media variabilei x respectiv media
i 1 variabilei y definesc un punct de pe
linia de regresie!!
Y y=a+bx
amax
a
amin
a X
Figura 2.10 2 - Reprezentarea grafică a suprafeţei de regresie.
Acesta este notat cu b0. Iată repetăm forma generală a dreptei de regresie
pentru analiza multivariată (cu p covariabile) este:
Y=f(x1,x2,…xp)=b0+b1*x1+b2*x2+…bi*xi+…+bp*xp (A)
Dacă toate covariabilele X1, X2, …Xp au valoarea 0 deci x1=0, x2=0 ,,,xp=0
atunci f(0,0,…0)=b0. Practic b0 reprezintă ordonata de intersecție a dreptei –
sau intersecția dreptei cu axa YY`.
De multe ori în practica medicală acest coeficient b0 nu are sens. Iată de
exemplu să considerăm x1=greutatea, x2=IMC-ul, x3=TAS…. etc.
Pot fi aceste valori 0 ? Evident nu – nu există persoană cu greutate=0, IMC=0
…etc.
Legătura dintre două variabile aleatoare în care una dintre ele variază
constant (sau controlat), iar cealaltă variază aleator a fost descrisă de forma
liniară a dreptei de regresie.
Corelaţia caracterizează legătura dintre două variabile aleatoare X şi Y cu
repartiţii normale N x , x2 respectiv N y , y2 .
REȚINEȚI
n
x x y y
Corelația măsoară intensitatea
i i legăturii dintre două variabile
legăturii).
r i 1 aleatoare
Formula
(puterea
prezintă simetrie:
n n
x x y y
2 2 r(x,y)=r(y,x) – comutativitate.
i i Regresia reprezintă un model
i 1 i 1 matematic – putem afla valoarea
Y funcție de covairabilele Xi.
reprezintă coeficientul de corelaţie. Domeniul de variaţie este cuprins
între –1 şi 1, 1, 1 . Practic gradul de dependenţă dintre cele două
variabile aleatoare este definit de acest coeficient de corelaţie (se mai notează şi
cu ,,r”).
Dacă =0, atunci nu există dependenţă între cele două variabile aleatoare,
acestea sunt independente.
Observaţii:
Y Y
Variabilitate
mare implică
corelație
mică !
X
X
Legătură puternică Legătură slabă
,
A,B
A B
,
Dacă valoarea coeficientului de corelaţie este 0 atunci cele două drepte fac
un unghi de 900, sunt perpendiculare.
m
C<0
X
0
Modele hiperbolice
Există modele din cadrul fenomenelor reale biologice care pot lua o formă
hiperbolică.
b
Exprimarea matematică este: y a , pentru x > 0.
x
Graficul funcţiei depinde de semnul coeficientului b (ca şi în celelalte
cazuri). Pentru b < 0 avem dependenţă crescătoare, curba tinzând asimptotic la
valoarea a (y = a ) pentru x tinzând la infinit. Pentru b > 0 avem dependenţă
descrescătoare şi curba tinde asimptotic tot la valoarea a pentru x tinzând la
infinit.
Reprezentarea grafică a hiperbolei este realizată în figura următoare:
Y
b>0
b<0
X
0
b>0
b<0
A(o,a)
Coeficienții de corelație:
r1=0.781 ; r2=0.988
Diferențe mari !
Coeficienții de determinare:
(r1)^2=0.655 ;
(r2)^2=0.978.
Excel – funcții pentru calculul regresiei liniare și a corelației:
EXAMPLES OF REGRESSION