Sunteți pe pagina 1din 4

Curs 4

Modelul regresiei liniare

4.1 Noțiuni introductive

În general regresia statistică constă în determinarea în ce măsură crește în medie o


variabilă considerată dependenta Y dacă o variabilă considerată ca fiind factor X, crește cu o
unitate. Așadar există o relație de condițiune între variabila dependentă Y și variabila
independentă X redată în relația (4.1):

( ) ( ) (4.1)

Variabila Y poate depinde de mai mulți factori (variabile independente), aspect care
rezulta din relația (4.2):

( ) ( ) (4.2)

Prin relația de mai sus este descrisă o funcție de regresie. În ceea ce privește
perfecționarea metodei regresiei statistice, inclusiv a corelației statistice, aceasta s-ar datora
antropologului englez F. Galton dar și altor oameni de știința precum K. Pearson, F.Y.
Edgewoth, Ch. Spearman.
Făcând referire la cazul unifactorial, funcția de regresie redată grafic (figura 5.1), este
reprezentată de linia de regresie:

( ) = a+ bxt (4.3)

unde: ( ) reprezintă funcția de regresie


y reprezintă variabila dependentă
xt reprezintă variabila independentă
a și b reprezintă parametrii de regresie
Figura 4.1: Reprezentarea funcției de regresie

M(y) = a + bx

x
1
Fiecare din punctele de coordonate yt,xt (t=1…n), influențate fiind și de factori
accidentali redați prin simbolul “et” , se vor situa datorită acestor factori deasupra sau sub
linia de regresie (figura 4.1) astfel încât:

yt=a+ bxt + et (4.4)

unde yt, reprezintă variabila efect


xt reprezintă variabila cauza
a, b reprezintă parametrii de regresie
et reprezintă valoare reziduală
Datele, de regula, provin dintr-o secvență de timp sau dintr-un eșantion de unități
(firme, persoane, etc.).
Ca urmare obținem estimațiile statistice.
Parametrii a si b urmează să fie estimați, iar metoda celor mai mici pătrate este frecvent
utilizată în acest sens.
Corectitudinea estimărilor este condiționata de respectarea unor condiții: variabilele
incluse în formule (Y, X, e) urmează o distribuție normală, erorile nu sunt semnificative,
factorii (daca sunt mai mulți) nu evoluează foarte asemănător (sunt realmente variabile
independente).

4.2 Estimarea parametrilor utilizând metoda celor mai mici pătrate

Metoda celor mai mici pătrate este dezvoltată de matematicieni precum Gauss C.F. dar
și de Legendre A.M., Laplace P.L., Markov A.
Estimarea parametrilor a și b din relația (4.4) presupune obținerea valorii minime
privind suma pătratelor erorilor:

∑ [( ( ))] (4.5)

Întrucât se pune problema determinarii unui punct de extrem, se procedează la egalarea


cu zero a derivatelor parțiale de ordin întai, ceea ce conduce la următorul sistem de ecuații
normale:

∑ ∑ (4.6)

∑ ∑ ∑ (4.7)

Sistemul de ecuații (4.6) și (4.7) conduce la obținerea parametrilor de calcul privind


fiecare dintre necunoscutele a și b:

2
∑ ∑ ∑ ∑
∑ (∑ )
(4.8)

∑ ∑ ∑
(4.9)
∑ (∑ )

4.3 Condiții de aplicare

 identificarea variabilelor:
Y = variabila dependentă (rezultativă), definită de seria (yt)t=1,n
X = variabila independentă (explicativă), definită de seria (xt)t=1,n
Parametrii modelului sunt estimați prin intermediul seriilor de date și sunt stabiliți pe
baza estimatorilor printr-o manieră stocastică.

 definirea variabilei reziduale:


Variabila reziduală este notată cu e și este repartizată normal având media 0, iar
dispersia constantă. Necesitatea introducerii în model a variabilei reziduale este condiționată
de următoarele aspecte:
- în analiza fenomenelor economice întâlnim în general o dependență între două
variabile de tip probabilistic și nu una liniară;
- erorile de măsurare afectează seriile de date și în consecință sunt influențate estimările
parametrilor;
- seriile de date sunt stabilite în urma observării eșantioanelor.

 utilizarea modelului de regresie:


Identificăm două domenii de utilizare dacă ne ghidăm după natura seriilor de date:
- unul este cazul în care seriile sunt înregistrate pentru o perioadă sau la un anumit
moment;
- un alt domeniu este legat de utilizarea seriilor de timp când avem un anumit orizont de
timp pentru evidențierea dependenței dintre variabile.

 utilizarea setului de ipoteze:


- seriile de date nu vor fi afectate de erori de măsurare;
- media valorii reziduale este 0

3
- dispersia variabilei individuale este constantă (are proprietatea de homoscedasticitate);
- rezidurile nu sunt autocorelate;
- variabila explicativă nu este corelată cu cea reziduală;
- ( )

S-ar putea să vă placă și