Sunteți pe pagina 1din 4

CAP. 3.

REGRESIA LINIARA

1. Pentru un magazin de mobil s-au cules date privind numrul de spoturi publicitare difuzate i
numrul vizitatorilor (mii pers.) timp de 14 zile. Datele sunt prezentate n tabelul 4.1.
Tabelul 4.1
Ziua Nr. spoturi publicitare Nr.vizitatori(mii pers.)
0 1 2
1 7 42
2 5 32
3 1 10
4 8 40
5 10 61
6 2 8
7 6 35
8 7 34
9 9 45
10 3 11
11 12 64
12 8 37
13 4 30
14 11 55

a. Sa se reprezinte grafic datele si sa se caracterizeze pe baza lui legatura dintre variabile.


b. Sa se determine ecuaia de regresie liniara si sa se interpreteze valorile coeficientilor b0 si b1.
c. Sa se previzioneze numrul vizitatorilor n ipoteza c se vor difuza 15 spoturi pe zi.
d. S se msoare intensitatea legturii dintre cele dou variabile cu ajutorul unui indicator
adecvat. (coeficientul de corelatie liniara Pearson).

Rezolvare:
a) Notm cu X variabila factorial, independent nr.spoturi publicitare i cu Y variabila
dependent nr.vizitatori.
Pentru a identifica existena, forma i sensul legturii dintre variabilele analizate construim
corelograma (figura 4.1).

70

60

50
nr.vizitatori

40

30

20

10

0
0 2 4 6 8 10 12 14

nr.spoturi

Figura 4.1 Corelograma (diagrama de mprtiere)

Comentarii: exista legatura intre variabile, directa si liniara.

b) Ecuaia de regresie va avea forma:


y i b0 b1 xi
Pentru a determina estimatorii b0 i b1, rezolvm sistemul de ecuaii normale, folosind datele din
tabelul de lucru 4.2:
nb0 b1 xi y i

b0 xi b1 xi xi y i
2

n=14 (numrul observaiilor)


Tabelul 4.2
xi yi xi2 xiyi yi2 yi 2,2858 5,0753xi
0 1 2 3 4 5
7 42 49 294 1764 37,8
5 32 25 160 1024 27,7
1 10 1 10 100 7,4
8 40 64 320 1600 42,9
10 61 100 610 3721 53,0
2 8 4 16 64 12,4
6 35 36 210 1225 32,7
7 34 49 238 1156 37,8
9 45 81 405 2025 48,0
3 11 9 33 121 17,5
12 64 144 768 4096 63,2
8 37 64 296 1369 42,9
4 30 16 120 900 22,6
11 55 121 605 3025 58,1
xi yi xi2 xi yi yi2 yi =504
=93 =504 =763 =4085 =22190

14b0 93b1 504



93b0 763b1 4085
Serezolvasistemulsisegaseste:
b0 2,2858
b1 5,0753
(ATENTIE! Nu va pun sa calculati voi sumele, ci eventual le dau direct)
Ecuaia de regresie este:
yi 2,2858 5,0753xi
Interpretare b0:
Daca nu se difuzeaza nici un spot publicitar, (0 difuzari), atunci numarul mediu de vizitatori este de
2,2858 mii persoane. (ac. Interpretare se face doar daca 0 este o valoare posibila a variabilei X).
Interpretare b1:.
b1>0, rezulta o legatura directa intre cele doua variabile.
Daca numarul de spoturi publicitare difuzate creste cu 1, atunci numarul vizitatorilor va creste, in medie,
cu 5,0753 mii persoane.

c) Dac numrul spoturilor publicitare difuzate va fi de 15, atunci numrul previzionat al


vizitatorilor pe baza acestei ecuaii de regresie este:
y/ x 15 2,2858 5,0753 15 78 mii pers.
d) Pentru a msura intensitatea legturii dintre cele dou variabile se va calcula coeficientul
de corelaie liniar Pearson:

r

n xi yi xi yi

b

n x 2
i
xi
2

2
n yi yi
2



n yi
2

yi
2

10318 10318
0 ,9615

2033 14 22190 504 2 10731
Acest indicator ne arat o legtur direct i foarte puternic (r este pozitiv i apropiat de valoarea
unitar).

2. Un analist de marketing urmrete n 5 luni efectul reclamelor asupra veniturilor din vnzri. El
nregistreaz cheltuielile cu reclama (X) (mii RON) i veniturile din vnzri, Y (sute mii RON). n
urma prelucrrii rezultatelor, obine:
xi 15 ; yi 10 ; xi2 55 ; xi yi 37 . n ipoteza unei dependene liniare, s se
determine ecuaia de regresie.

Rezolvare:

Ecuaia de regresie este: y i b0 b1 xi

Pentru a determina estimatorii b0 i b1, rezolvm sistemul de ecuaii normale:

nb0 b1 xi y i

b0 xi b1 xi xi y i
2

n=5 (numrul observaiilor)


5b0 15b1 10

15b0 55b1 37
b0 0,1
b1 0,7
Deci ecuaia de regresie este: y 0 ,1 0 ,7 x .

3. Pentru opt judee ale Romniei, se cunosc: suprafaa cultivat n 1996 ( mii ha) i producia
agricol total n acelai an (mil. RON preuri curente):
Tabelul 4.14
Judeul Suprafaa cultivat n Producia agricol
1996 (mii ha) (mil. RON)
Alba 127 75,1
Arad 342 112,4
Bistria Nsud 98 64,4
Botoani 286 89,4
Braov 111 80,4
Buzu 252 84,3
Cara Severin 124 62
Clrai 404 96,5
S se studieze existena, direcia i intensitatea legturii dintre suprafaa cultivat i producia
agricol, cu ajutorul coeficienilor de corelaie a rangurilor ai lui Spearman i Kendall.

Rezolvare:
Coeficientul lui Spearman se determin cu relaia:
6 di2
rs 1

n n2 1
,

unde di reprezint diferena ntre rangurile celor dou variabile, aferente aceleiai uniti. Se
ordoneaz perechile de valori n ordinea cresctoare a valorilor xi, apoi se atribuie ranguri valorilor celor
dou variabile (tabelul 4.15.).
Tabelul 4.15
Jude Suprafaa Producia
(xi) (yi)
Rx Ry di d i2
Bistria Nsud 127 75,1 1 2 -1 1
Braov 342 112,4 2 4 -2 4
Cara Severin 98 64,4 3 1 2 4
Alba 286 89,4 4 3 1 1
Buzu 111 80,4 5 5 0 0
Botoani 252 84,3 6 6 0 0
Arad 124 62 7 8 -1 1
Clrai 404 96,5 8 7 1 1
Total 12
6 12
rs 1 0 ,86 , valoare ce indic o legtur direct, puternic, ntre cele dou variabile.
8 63
Coeficientul lui Kendall se calculeaz cu relaia:
2 pi qi
rk
n(n 1)
, unde pi reprezint suma rangurilor superioare (pi) i qi este suma

rangurilor inferioare (qi), corespunztoare fiecrui rang curent (tabelul 4.16).


2 20
rk 0,71 , valoare a crei interpretare este aceeai ca n cazul coeficientului lui
87
Spearman.

Tabelul 4.16
Jude Rx Ry pi qi
Bistria Nsud 1 2 6 1
Braov 2 4 4 2
Cara Severin 3 1 5 0
Alba 4 3 4 0
Buzu 5 5 3 0
Botoani 6 6 2 0
Arad 7 8 0 1
Clrai 8 7 0 0
Total - - 24 4

4. Datele sistematizate, obinute n urma unui studiu statistic privind vechimea n munc i timpul
zilnic nelucrat, efectuat pe 800 de salariai ai unei societi comerciale, sunt:
Tabelul 4.17
Timp nelucrat (u.m.)
Vechimea
sub 60 u.m. peste 60 u.m.
peste 10 ani 300 150
sub 10 ani 100 250
S se precizeze dac ntre cele dou variabile exist o legtur.

Rezolvare:
Se folosete coeficientul de asociere Yulle, calculat cu relaia:
n11 n22 n12 n21
QY , unde n11 = 300, n22 = 250, n21 = 100, n12 = 150.
n11 n22 n12 n21
300 250 100 150 60.000
QY 0,67 .
300 250 100 150 90.000
Rezult c ntre cele dou variabile exist o asociere pozitiva de intensitate medie.