Documente Academic
Documente Profesional
Documente Cultură
regresie - corelatie
i 1 i 1
Eroarea totală trebuie minimizată în variabilele a şi b pentru a obţine o
aproximare cât mai corectă a valorilor lui y funcţie de x. Condiţia este ca
derivata funcţie de fiecare variabilă în parte să fie zero. Obţinem astfel sistemul
de ecuaţii:
n
a b x y 2
i i n
a 0 i 1
0 2 a b xi y i 0
a
n n
i 1
0 a b xi y i 2 2 a b xi y i xi 0
b i 1 i 1
0
b
n
n X Y xi y i
b i 1
n a Y b X
n X 2 xi2
i 1
REGRESIE LINIARĂ
5
4.5
y = 0,628x + 1.209
4 Norul de puncte reprezentat
3.5 grafic formează diagrama de
3 dispersie.
2.5 (xi,yi)
2
1.5
a tg a = b = 0,628
1 ,
0 1 2 3 4 5 6
În concluzie s-au dedus parametrii dreptei: y = a + bx.
Parametrul a reprezintă intersecţia dreptei de regresie cu axa YY’. Dacă x=0
atunci y = a.
Parametrul b este panta dreptei. Dacă valoarea lui b este pozitivă atunci
dependenţa între cele două variabile aleatoare este direct proporţională. Astfel o
creştere a variabilei x va duce la o creştere a variabilei y. Dacă valoarea
parametrului b este negativă atunci dependenţa între cele două variabile aleatoare
este invers proporţională. Cazul în care nu există dependenţă între cele două
variabile x, respectiv y, se obţine pentru b=0. Oricât am modifica variabila x , y va
rămâne constant y = a.
Observaţie:
Atât a cât şi b sunt deduse din eşantioane, deci, la rândul lor, reprezintă
variabile aleatoare. Astfel se poate crea un interval de încredere pentru cele două
necunoscute a şi b.
Prin estimarea parametrilor a şi b se vor obţine pentru intervale simetrice valorile
limită: a a0 a , respectiv b b0 b .
Reprezentând grafic dreapta de regresie pentru cele 4 cazuri limită obţinem o
suprafaţă de regresie.
amin a a , amax a a .
bmin tg a1 b b , bmax tg a 2 b b .
Y y=a+bx
amax
a
amin
a X
Figura 2.10 2 - Reprezentarea grafică a suprafeţei de regresie.
Legătura dintre două variabile aleatoare în care una dintre ele variază
constant (sau controlat), iar cealaltă variază aleator a fost descrisă de forma
liniară a dreptei de regresie.
Corelaţia caracterizează legătura dintre două variabile aleatoare X şi Y cu
repartiţii normale N x , x2 respectiv N y , y2 .
x yi y
n
x i
i 1
n
i x i y
x 2
y 2
i 1
Această formulă de calcul poate fi aplicată doar în cazul a două variabile
aleatoare repartizate normal.
Y Y
X
X
Legătură puternică Legătură slabă
,
A,B
A B
,
Dacă valoarea coeficientului de corelaţie este 0 atunci cele două drepte fac
un unghi de 900, sunt perpendiculare.
m
C<0
X
0
Modele hiperbolice
Există modele din cadrul fenomenelor reale biologice care pot lua o formă
hiperbolică.
b
Exprimarea matematică este: y a , pentru x > 0.
x
Graficul funcţiei depinde de semnul coeficientului b (ca şi în celelalte
cazuri). Pentru b < 0 avem dependenţă crescătoare, curba tinzând asimptotic la
valoarea a (y = a ) pentru x tinzând la infinit. Pentru b > 0 avem dependenţă
descrescătoare şi curba tinde asimptotic tot la valoarea a pentru x tinzând la
infinit.
Reprezentarea grafică a hiperbolei este realizată în figura următoare:
Y
b>0
b<0
X
0
b>0
b<0
A(o,a)