Sunteți pe pagina 1din 4

Seminar2 Econometrie - CSIE

Modele Regresie liniară unifactorială (simplă)


Ex1. Consumul unei familii în funcţie de Venitul disponibil

Pentru a evalua influenţa Venitului disponibil asupra Cheltuielilor de consum ale unei familii, au fost
înregistrate, pentru 10 familii, valorile următoarelor variabile: Venitul disponibil al familiei si Cheltuielile
de Consum ale familiei.
X 80 100 120 140 160 180 200 220 240 260
Y 70 65 90 95 110 115 120 140 155 150
Fiecare familie a fost selectată, la întâmplare, dintr-un grup de familii cu un venit net disponibil fixat.
Valorile celor două variabile sunt exprimate în mii lei, astfel încât prima familie câştigă 80 mii lei şi
consumă 70 mii lei anual. Variabilele sunt:
X – Venitul disponibil al familiei, exprimat în mii lei
(variabila independentă sau variabila explicativă sau variabila exogenă)
Y – Cheltuielile de Consum ale familiei, exprimate în mii lei
(variabila dependentă sau variabila explicată sau variabila endogenă)

1. Să se reprezinte grafic datele de observaţie şi să se comenteze legătura dintre cele două variabile.
2. Măsuraţi intensitatea legăturii dintre cele două variabile folosind coeficientul de corelaţie Pearson.
3. Pe baza datelor din eşantion, estimaţi coeficienţii modelului de regresie adecvat analizei dependenţei
dintre cele două variabile şi interpretaţi valorile obţinute.
4. Estimaţi coeficienţii modelului de regresie în Excel

Rezolvare:
1. Pentru a identifica existenţa unei relaţii de dependenţă între variabilele analizate, ca şi forma şi sensul
relaţiei de dependenţă, construim diagrama împrăştierii datelor. Pentru a crea o diagramă a datelor trebuie
să stabilim care variabilă ar trebui să apară pe axa orizontală. În analiza de regresie, variabila explicativă
apare totdeauna pe axa orizontală iar variabila explicată pe axa verticală.

Folosim Excel pentru a efectua calculele pentru estimarea unui model de regresie.
Valorile observate pentru variabilele X şi Y pot fi introduse în coloanele A şi B.
Reprezentăm grafic perechile de puncte observate (𝑥𝑖 , 𝑦𝑖 ).
În Excel, selectăm: Insert / Chart / XY(Scatter)…

1
Din grafic se observă că între variabilele X şi Y există o legătură liniară, directă.

2. Coeficientul de corelaţie de selecţie caracterizează direcţia şi intensitatea legăturii liniare dintre două
variabile. Semnul acestui coeficient indică direcţia legăturii iar valoarea sa indică intensitatea legăturii.
𝑆𝑥𝑦 ∑(𝑥𝑖 −𝑥̄ )(𝑦𝑖 −𝑦̄ ) 𝑛 ∑ 𝑥𝑖 𝑦𝑖 −∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑟𝑥𝑦 = 𝑆 𝑆 = 2 2
= ∈ [−1, +1]
𝑥 𝑦 √[∑(𝑥𝑖 −𝑥̄ ) ][∑(𝑦𝑖 −𝑦̄ ) ] √[𝑛 ∑ 𝑥𝑖2 −(∑ 𝑥𝑖 )2 ][𝑛 ∑ 𝑦𝑖2 −(∑ 𝑦𝑖 )2 ]

𝑟𝑥𝑦 = 0,9808 ⇒ există o legătură liniară, directă şi foarte puternică între cele două variabile analizate.
În Excel se utilizează funcţia CORREL pentru determinarea coeficientului de corelaţie Pearson.

3. Rezultă că putem considera că între cele două variabile există o relaţie de forma: 𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜀
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 ; 𝑖 = 1,2, . . . , 𝑛.
Notăm estimatorii parametrilor 𝛽0 şi 𝛽1 cu 𝑏0 şi 𝑏1 sau 𝛽̂0 şi 𝛽̂1
Pentru a determina estimatorii 𝑏0 şi 𝑏1 ai parametrilor 𝛽0 şi 𝛽1, rezolvăm sistemul de ecuaţii normale:
𝑏0 𝑛 + 𝑏1 ∑ 𝑥𝑖 = ∑ 𝑦𝑖 10𝑏0 + 1700𝑏1 = 1110
{ 2 {
𝑏0 ∑ 𝑥𝑖 + 𝑏1 ∑ 𝑥𝑖 = ∑ 𝑥𝑖 𝑦𝑖 1700𝑏 0 + 322000𝑏1 = 205500
Soluţiile sistemului se pot obţine folosind metoda determinanţilor:
𝛥𝑏0 ∑ 𝑦𝑖 ∑ 𝑥𝑖2 −∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖 (1110)(322000)−(1700)(205500)
𝑏0 = = ⇒ 𝑏0 = ≈ 24,4545
𝛥 𝑛 ∑ 𝑥𝑖2 −(∑ 𝑥𝑖 )2 (10)(322000)−(1700)2
𝛥𝑏1 𝑛 ∑ 𝑥𝑖 𝑦𝑖 −∑ 𝑥𝑖 ∑ 𝑦𝑖 (10)(205500)−(1700)(1110)
𝑏1 = = ⇒ 𝑏1 = ≈ 0,5091
𝛥 𝑛 ∑ 𝑥𝑖2 −(∑ 𝑥𝑖 )2 (10)(322000)−(1700)2
𝑛 ∑ 𝑥𝑖 ∑ 𝑦𝑖 ∑ 𝑥𝑖 𝑛 ∑ 𝑦𝑖
unde ∆= | |; ∆𝑏0 = | |; ∆𝑏1 = | |
∑ 𝑥𝑖 ∑ 𝑥𝑖2 ∑ 𝑥𝑖 𝑦𝑖 ∑ 𝑥𝑖2 ∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖

Valorile estimatorii 𝑏0 şi 𝑏1 se pot afla și folosind formulele:


∑(𝑥𝑖 −𝑥̄ )(𝑦𝑖 −𝑦̄ ) (16800)
𝑏1 = ⇒ 𝑏1 = ≈ 0,5091
∑(𝑥𝑖 −𝑥̄ )2 √(33000)(8890)
𝑏0 = 𝑦̄ − 𝑏1 𝑥̄ ⇒ 𝑏0 = 111 − (0,5091)(170) ≈ 24,4545

Dreapta de regresie estimată este 𝑦̂𝑖 = 𝑏0 + 𝑏1 ⋅ 𝑥𝑖 sau 𝑦̂𝑖 = 𝛽̂0 + 𝛽̂1 ⋅ 𝑥𝑖


𝑦̂𝑖 = 24,4545 + 0,5091 ⋅ 𝑥𝑖
Fiecare punct de pe dreapta de regresie este o estimaţie a valorii medii a lui Y, corespunzător valorii alese
pentru X. Deci 𝑦̂𝑖 este o estimaţie pentru 𝐸(𝑌|𝑋𝑖 ).

2
Interpretarea parametrilor obţinuţi:
𝑏1 = 𝛽̂1 ≈ 0,5091 măsoară panta dreptei de regresie şi arată că, atunci când Venitul (X) creşte cu o
unitate, adica cu 1000 lei, Cheltuielile de consum (Y) cresc, în medie, cu 0,5091 mii lei.

𝑏0 = 𝛽̂0 ≈ 24,4545 arată nivelul cheltuielilor de consum, atunci când venitul este 0.
Interpretăm pe 𝑏0 ≈ 24,4545 ca fiind efectul mediu asupra lui Y, al tuturor factorilor care nu sunt luaţi în
considerare în modelul de regresie.

4. Estimarea parametrilor modelului de regresie liniară unifactorială utilizând EXCEL


Selectăm: Data, apoi Data Analysis şi apoi Regression din lista de instrumente de analiză afişate.
Introducem valorile pentru variabilele Y şi X.

Ex2. Cererea pentru un produs în funcţie de Preţ

Legea cererii postulează o relaţie inversă între cantitatea cerută dintr-un produs şi preţul său, toate celelalte
variabile care afectează cererea fiind considerate constante.
O editură doreşte să studieze legătura dintre numărul de albume vândute şi preţul unui anumit album (de
pictură). În acest scop, au fost înregistrate, în 10 oraşe, valorile următoarelor variabile:
Y – numărul de albume vândute;
X – preţul albumului (în euro).

X 1 2 3 4 5 6 7 8 9 10
Y 49 45 44 39 38 37 34 33 30 29

1. Să se reprezinte grafic datele de observaţie şi să se comenteze legătura dintre cele două variabile.

3
Din grafic se observă că între variabilele X şi Y există o legătură liniară, inversă.

2.
𝑟𝑥𝑦 = −0,9878 ⇒ există o legătură liniară, inversă şi foarte puternică între cele două variabile analizate.

3. Pe baza datelor de la nivelul eşantionului, să se determine ecuaţia de regresie liniară care modelează
legătura dintre cele două variabile. Să se estimeze parametrii modelului şi să se interpreteze rezultatele
obţinute.
Considerăm modelul:
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 , 𝑖 = 1,2, . . . , 𝑛.
Pentru a determina estimatorii 𝛽̂0 şi 𝛽̂1 ai parametrilor 𝛽0 şi 𝛽1, rezolvăm sistemul de ecuaţii normale ale
lui Gauss.
𝛽̂0 𝑛 + 𝛽̂1 ∑ 𝑥𝑖 = ∑ 𝑦𝑖 10𝛽̂0 + 55𝛽̂1 = 378
{ {
𝛽̂0 ∑ 𝑥𝑖 + 𝛽̂1 ∑ 𝑥𝑖 = ∑ 𝑥𝑖 𝑦𝑖
2
55𝛽̂0 + 385𝛽̂1 = 1901

Obţinem: 𝛽̂0 ≈ 49,6667 şi 𝛽̂1 ≈ −2,1575


Dreapta de regresie estimată este
𝑦̂𝑖 = 49,6667 − 2,1575 ⋅ 𝑥𝑖
Fiecare punct de pe dreapta de regresie este o estimaţie a valorii medii a lui Y, corespunzător valorii alese
pentru X. Deci 𝑦̂𝑖 este o estimaţie pentru 𝐸(𝑌|𝑋𝑖 ).

Interpretarea parametrilor obţinuţi:


𝛽̂1 ≈ −2,1575 măsoară panta dreptei de regresie şi arată că, atunci când Preţul (X) creşte cu un euro,
numărul de albume vândute (Y) scade, în medie, cu două unităţi (bucăţi).
Valoarea 𝛽̂0 ≈ 49,6667 arată numărul de albume vândute, atunci când preţul unui album este 0. În
general, parametrul de interceptare nu are semnificaţie economică. Interpretăm pe 𝛽̂0 ≈ 49,6667 ca fiind
efectul mediu asupra lui Y, al tuturor factorilor care nu sunt luaţi în considerare în modelul de regresie.

S-ar putea să vă placă și