Documente Academic
Documente Profesional
Documente Cultură
Pentru a evalua influenţa Venitului disponibil asupra Cheltuielilor de consum ale unei familii, au fost
înregistrate, pentru 10 familii, valorile următoarelor variabile: Venitul disponibil al familiei si Cheltuielile
de Consum ale familiei.
X 80 100 120 140 160 180 200 220 240 260
Y 70 65 90 95 110 115 120 140 155 150
Fiecare familie a fost selectată, la întâmplare, dintr-un grup de familii cu un venit net disponibil fixat.
Valorile celor două variabile sunt exprimate în mii lei, astfel încât prima familie câştigă 80 mii lei şi
consumă 70 mii lei anual. Variabilele sunt:
X – Venitul disponibil al familiei, exprimat în mii lei
(variabila independentă sau variabila explicativă sau variabila exogenă)
Y – Cheltuielile de Consum ale familiei, exprimate în mii lei
(variabila dependentă sau variabila explicată sau variabila endogenă)
1. Să se reprezinte grafic datele de observaţie şi să se comenteze legătura dintre cele două variabile.
2. Măsuraţi intensitatea legăturii dintre cele două variabile folosind coeficientul de corelaţie Pearson.
3. Pe baza datelor din eşantion, estimaţi coeficienţii modelului de regresie adecvat analizei dependenţei
dintre cele două variabile şi interpretaţi valorile obţinute.
4. Estimaţi coeficienţii modelului de regresie în Excel
Rezolvare:
1. Pentru a identifica existenţa unei relaţii de dependenţă între variabilele analizate, ca şi forma şi sensul
relaţiei de dependenţă, construim diagrama împrăştierii datelor. Pentru a crea o diagramă a datelor trebuie
să stabilim care variabilă ar trebui să apară pe axa orizontală. În analiza de regresie, variabila explicativă
apare totdeauna pe axa orizontală iar variabila explicată pe axa verticală.
Folosim Excel pentru a efectua calculele pentru estimarea unui model de regresie.
Valorile observate pentru variabilele X şi Y pot fi introduse în coloanele A şi B.
Reprezentăm grafic perechile de puncte observate (𝑥𝑖 , 𝑦𝑖 ).
În Excel, selectăm: Insert / Chart / XY(Scatter)…
1
Din grafic se observă că între variabilele X şi Y există o legătură liniară, directă.
2. Coeficientul de corelaţie de selecţie caracterizează direcţia şi intensitatea legăturii liniare dintre două
variabile. Semnul acestui coeficient indică direcţia legăturii iar valoarea sa indică intensitatea legăturii.
𝑆𝑥𝑦 ∑(𝑥𝑖 −𝑥̄ )(𝑦𝑖 −𝑦̄ ) 𝑛 ∑ 𝑥𝑖 𝑦𝑖 −∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑟𝑥𝑦 = 𝑆 𝑆 = 2 2
= ∈ [−1, +1]
𝑥 𝑦 √[∑(𝑥𝑖 −𝑥̄ ) ][∑(𝑦𝑖 −𝑦̄ ) ] √[𝑛 ∑ 𝑥𝑖2 −(∑ 𝑥𝑖 )2 ][𝑛 ∑ 𝑦𝑖2 −(∑ 𝑦𝑖 )2 ]
𝑟𝑥𝑦 = 0,9808 ⇒ există o legătură liniară, directă şi foarte puternică între cele două variabile analizate.
În Excel se utilizează funcţia CORREL pentru determinarea coeficientului de corelaţie Pearson.
3. Rezultă că putem considera că între cele două variabile există o relaţie de forma: 𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜀
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 ; 𝑖 = 1,2, . . . , 𝑛.
Notăm estimatorii parametrilor 𝛽0 şi 𝛽1 cu 𝑏0 şi 𝑏1 sau 𝛽̂0 şi 𝛽̂1
Pentru a determina estimatorii 𝑏0 şi 𝑏1 ai parametrilor 𝛽0 şi 𝛽1, rezolvăm sistemul de ecuaţii normale:
𝑏0 𝑛 + 𝑏1 ∑ 𝑥𝑖 = ∑ 𝑦𝑖 10𝑏0 + 1700𝑏1 = 1110
{ 2 {
𝑏0 ∑ 𝑥𝑖 + 𝑏1 ∑ 𝑥𝑖 = ∑ 𝑥𝑖 𝑦𝑖 1700𝑏 0 + 322000𝑏1 = 205500
Soluţiile sistemului se pot obţine folosind metoda determinanţilor:
𝛥𝑏0 ∑ 𝑦𝑖 ∑ 𝑥𝑖2 −∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖 (1110)(322000)−(1700)(205500)
𝑏0 = = ⇒ 𝑏0 = ≈ 24,4545
𝛥 𝑛 ∑ 𝑥𝑖2 −(∑ 𝑥𝑖 )2 (10)(322000)−(1700)2
𝛥𝑏1 𝑛 ∑ 𝑥𝑖 𝑦𝑖 −∑ 𝑥𝑖 ∑ 𝑦𝑖 (10)(205500)−(1700)(1110)
𝑏1 = = ⇒ 𝑏1 = ≈ 0,5091
𝛥 𝑛 ∑ 𝑥𝑖2 −(∑ 𝑥𝑖 )2 (10)(322000)−(1700)2
𝑛 ∑ 𝑥𝑖 ∑ 𝑦𝑖 ∑ 𝑥𝑖 𝑛 ∑ 𝑦𝑖
unde ∆= | |; ∆𝑏0 = | |; ∆𝑏1 = | |
∑ 𝑥𝑖 ∑ 𝑥𝑖2 ∑ 𝑥𝑖 𝑦𝑖 ∑ 𝑥𝑖2 ∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖
2
Interpretarea parametrilor obţinuţi:
𝑏1 = 𝛽̂1 ≈ 0,5091 măsoară panta dreptei de regresie şi arată că, atunci când Venitul (X) creşte cu o
unitate, adica cu 1000 lei, Cheltuielile de consum (Y) cresc, în medie, cu 0,5091 mii lei.
𝑏0 = 𝛽̂0 ≈ 24,4545 arată nivelul cheltuielilor de consum, atunci când venitul este 0.
Interpretăm pe 𝑏0 ≈ 24,4545 ca fiind efectul mediu asupra lui Y, al tuturor factorilor care nu sunt luaţi în
considerare în modelul de regresie.
Legea cererii postulează o relaţie inversă între cantitatea cerută dintr-un produs şi preţul său, toate celelalte
variabile care afectează cererea fiind considerate constante.
O editură doreşte să studieze legătura dintre numărul de albume vândute şi preţul unui anumit album (de
pictură). În acest scop, au fost înregistrate, în 10 oraşe, valorile următoarelor variabile:
Y – numărul de albume vândute;
X – preţul albumului (în euro).
X 1 2 3 4 5 6 7 8 9 10
Y 49 45 44 39 38 37 34 33 30 29
1. Să se reprezinte grafic datele de observaţie şi să se comenteze legătura dintre cele două variabile.
3
Din grafic se observă că între variabilele X şi Y există o legătură liniară, inversă.
2.
𝑟𝑥𝑦 = −0,9878 ⇒ există o legătură liniară, inversă şi foarte puternică între cele două variabile analizate.
3. Pe baza datelor de la nivelul eşantionului, să se determine ecuaţia de regresie liniară care modelează
legătura dintre cele două variabile. Să se estimeze parametrii modelului şi să se interpreteze rezultatele
obţinute.
Considerăm modelul:
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 , 𝑖 = 1,2, . . . , 𝑛.
Pentru a determina estimatorii 𝛽̂0 şi 𝛽̂1 ai parametrilor 𝛽0 şi 𝛽1, rezolvăm sistemul de ecuaţii normale ale
lui Gauss.
𝛽̂0 𝑛 + 𝛽̂1 ∑ 𝑥𝑖 = ∑ 𝑦𝑖 10𝛽̂0 + 55𝛽̂1 = 378
{ {
𝛽̂0 ∑ 𝑥𝑖 + 𝛽̂1 ∑ 𝑥𝑖 = ∑ 𝑥𝑖 𝑦𝑖
2
55𝛽̂0 + 385𝛽̂1 = 1901