Sunteți pe pagina 1din 6

Seminar 9

Aplicatia 1

Pentru un magazin de mobila se cunosc numarul de spoturi publicitare difuzate si numarul de vizitatori:

Numar de spoturi 7 5 1 8 10 2 6 7
publicitare
Numar vizitatori 42 32 10 40 61 8 35 34
(mii persoane)

Se cere:

1) sa se reprezinte grafic datele si sa se gaseasca functia de regresie potrivita

2) sa se determine parametrii functiei de regresie, sa se interpreteze si sa se calculeze valorile ajustate ale


numarului de vizitatori, in functie de numarul de spoturi publicitare

3) sa se estimeze, pe baza functiei de regresie, numarul de vizitatori daca s-ar difuza 12 spoturi publicitare

4) sa se masoare intensitatea legaturii dintre cele doua variabile, folosind un indicator adecvat. Sa se
interpreteze

5) in ce masura numarul de vizitatori depinde de numarul de spoturi publicitare difuzate

Rezolvare

1) Identificam:

Variabila factoriala, independenta X – numarul de spoturi publicitare

Variabila dependenta Y – numarul de vizitatori

Pentru a identifica existenta, forma si sensul legaturii dintre variabilele analizate construim corelograma:
Corelatia dintre numarul de vizitatori si numarul
spoturilor publicitare difuzate
70

60 y = 5.5354x + 0.9213
R² = 0.9384
50
vizitatori

40

30

20

10

0
0 2 4 6 8 10 12
spoturi

Se observa ca legatura dintre variabile este directa si liniara, iar ecuatia de regresie va avea forma:

𝑦̂𝑖 = 𝑎 + 𝑏𝑥𝑖

2) Pentru a determina estimatorii a si b, minimizam suma patratelor abaterilor valorilor ajustate de la


cele reale: 𝑚𝑖𝑛 ∑(𝑦𝑖 − 𝑦̂𝑖 )2 . Aceasta conditie se verifica atunci cand se anuleaza derivatele partiale in
raport cu cei doi parametrii.

𝑚𝑖𝑛 ∑(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )2

𝜕𝑓
=0 2 ∑(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )(−1) = 0 𝑛𝑎 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
{ 𝜕𝑎 →{ →{
𝜕𝑓
=0 2 ∑(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 ) (−𝑥𝑖 ) = 0 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖
𝜕𝑏
de unde:
∑ 𝑦𝑖 ∑ 𝑥𝑖
| |
∆𝑎 ∑ 𝑥𝑖 𝑦𝑖 ∑ 𝑥𝑖2 ∑ 𝑥𝑖2 ∑ 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖
𝑎= = =
∆ 𝑛 ∑ 𝑥𝑖 𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
| |
∑ 𝑥𝑖 ∑ 𝑥𝑖2

𝑛 ∑ 𝑦𝑖
| |
∆𝑏 ∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖 𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑏= = =
∆ 𝑛 ∑ 𝑥𝑖 𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
| 2 |
∑ 𝑥𝑖 ∑ 𝑥𝑖
Spoturi (xi) Vizitatori (yi) 𝑥𝑖2 𝑥𝑖 𝑦𝑖
7 42 49 294
5 32 25 160
1 10 1 10
8 40 64 320
10 61 100 610
2 8 4 16
6 35 36 210
7 34 49 238
46 262 328 1858

Astfel:

𝑛𝑎 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
8𝑎 + 46𝑏 = 262
{ →{
𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖 46𝑎 + 328𝑏 = 1858

De unde:
262 46
| | 328 ∗ 262 − 46 ∗ 1858 85936 − 85468 468
𝑎= 1858 328 = = = = 0.9213
8 46 8 ∗ 328 − (46)2 2624 − 2116 508
| |
46 328

8 262
| | 8 ∗ 1858 − 46 ∗ 262 14864 − 12052 2812
𝑏= 46 1858 = = = = 5.5354
8 46 8 ∗ 328 − (46)2 2624 − 2116 508
| |
46 328

Ecuatia de regresie este:


𝑦̂𝑖 = 𝑎 + 𝑏𝑥𝑖 = 0.9213 + 5.5354𝑥𝑖
Interpretare: La fiecare spot publicitar difuzat, numarul de vizitatori creste in medie cu 5.5354 mii pers.

Valorile ajustate 𝑦̂𝑖 se determina inlocuind Xi in functia de regresie.

Spoturi (xi) Vizitatori (yi) 𝑦̂𝑖


7 42 39.67
5 32 28.60
1 10 6.46
8 40 45.20
10 61 56.28
2 8 11.99
6 35 34.13
7 34 39.67
46 262 262.00
3) Daca numarul spoturilor publicitare ar fi 12 ( 𝑥𝑖 = 12), atunci numarul previzionat al vizitatorilor, pe
baza acestei ecuatii de regresie, ar fi:

𝑦̂𝑖 = 𝑎 + 𝑏𝑥𝑖 = 0.9213 + 5.5354𝑥𝑖 = 0.9213 + 5.5354 ∗ 12 = 67.35

Daca numarul spoturilor publicitare difuzate ar fi 12, atunci se poate estima ca numarul vizitatorilor ar fi
67.35 mii persoane.

4) Pentru a masura intensitatea legaturii dintre variabile se pot utiliza:

a) raportul de corelatie R

∑(𝑦̂𝑖 − 𝑦̅)2
𝑅=√
∑(𝑦𝑖 − 𝑦̅)2

∑ 𝑦𝑖 262
𝑦̅ = = = 32.75 mii pers/spot
𝑛 8

Spoturi (xi) Vizitatori (yi) 𝑦̂𝑖 (𝑦𝑖 − 𝑦̅)2 (𝑦̂𝑖 − 𝑦̅)2


7 42 39.67 85.56 47.87
5 32 28.60 0.56 17.24
1 10 6.46 517.56 691.34
8 40 45.20 52.56 155.11
10 61 56.28 798.06 553.44
2 8 11.99 612.56 430.89
6 35 34.13 5.06 1.91
7 34 39.67 1.56 47.87
46 262 262.00 2073.50 1945.68

Astfel:

∑(𝑦̂𝑖 − 𝑦̅)2 1945.68


𝑅=√ 2
=√ = √0.9384 = 0.9687
∑(𝑦𝑖 − 𝑦̅) 2073.50

Interpretare: Intre numarul de vizitatori si numarul de spoturi publicitare difuzate exista o legatura
liniara foarte puternica (R foarte aproape de 1) si directa (b>0).

sau

b) coeficiantul de corelatie liniara 𝑟𝑥𝑦

𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑟𝑥𝑦 =
√[𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 ] ∙ [𝑛 ∑ 𝑦 2 − (∑ 𝑦)2 ]

Avem nevoie si de patratele lui 𝑦𝑖


Spoturi (xi) Vizitatori (yi) 𝑥𝑖2 𝑥𝑖 𝑦𝑖 𝑦𝑖2
7 42 49 294 1764
5 32 25 160 1024
1 10 1 10 100
8 40 64 320 1600
10 61 100 610 3721
2 8 4 16 64
6 35 36 210 1225
7 34 49 238 1156
46 262 328 1858 10654

Astfel:
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦 8 ∗ 1858 − 46 ∗ 262
𝑟𝑥𝑦 = =
√[𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 ] ∙ [𝑛 ∑ 𝑦 2 − (∑ 𝑦)2 ] √(8 ∗ 328 − 462 )(8 ∗ 10654 − 2622 )
14864 − 12052 2812 2812
= = = = 0.9687
√(2624 − 2116)(85232 − 68644) √508 ∗ 16588 2902.88

Interpretare: Intre numarul de vizitatori si numarul de spoturi publicitare difuzate exista o legatura
liniara foarte puternica si directa (𝑟𝑥𝑦 foarte aproape de 1, pozitiv)

Observatie: in cazul legaturii liniare 𝑅 = 𝑟𝑥𝑦

5) Coeficientul de determinare 𝑅2

∑(𝑦̂𝑖 − 𝑦̅)2
𝑅2 = = 0.9384
∑(𝑦𝑖 − 𝑦̅)2

Interpretare: In medie, numarul de vizitatori este influentat in masura de 93.84% de numarul de spoturi
publicitare difuzate.

Aplicatia 2

Pentru sase suprafete agricole s-au inregistrat valorile variabilelor: cantitatea de ingrasaminte si productia
la hectar, intre care exista o legatura liniara. Se cunosc datele: ∑ 𝑥𝑖 = 53, ∑ 𝑦𝑖 = 148, ∑ 𝑥𝑖2 = 609,
∑ 𝑥𝑖 𝑦𝑖 = 833, 𝑖 = ̅̅̅̅
1,6. Sa se determine ecuatia de regresie liniara care modeleaza legatura dintre
variabile si sa se interpreteze coeficientul de regresie.

Rezolvare
Pentru a determina estimatorii a si b, minimizam suma patratelor abaterilor valorilor ajustate de la cele
reale: 𝑚𝑖𝑛 ∑(𝑦𝑖 − 𝑦̂𝑖 )2 . Aceasta conditie se verifica atunci cand se anuleaza derivatele partiale in raport
cu cei doi parametrii.

𝑚𝑖𝑛 ∑(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )2

𝜕𝑓
=0 2 ∑(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )(−1) = 0 𝑛𝑎 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
{ 𝜕𝑎 →{ →{
𝜕𝑓
=0 2 ∑(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 ) (−𝑥𝑖 ) = 0 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖
𝜕𝑏
de unde:
∑ 𝑦𝑖 ∑ 𝑥𝑖
| |
∆𝑎 ∑ 𝑥𝑖 𝑦𝑖 ∑ 𝑥𝑖2 ∑ 𝑥𝑖2 ∑ 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖
𝑎= = =
∆ 𝑛 ∑ 𝑥𝑖 𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
| |
∑ 𝑥𝑖 ∑ 𝑥𝑖2

𝑛 ∑ 𝑦𝑖
| |
∆𝑏 ∑ 𝑥𝑖 ∑ 𝑥𝑖 𝑦𝑖 𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑏= = =
∆ 𝑛 ∑ 𝑥𝑖 𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
| 2 |
∑ 𝑥𝑖 ∑ 𝑥𝑖

Astfel:

𝑛𝑎 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑦𝑖
6𝑎 + 53𝑏 = 148
{ →{
𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2 = ∑ 𝑥𝑖 𝑦𝑖 53𝑎 + 609𝑏 = 833

De unde:
148 53
| | 148 ∗ 609 − 53 ∗ 833 90132 − 44149 45983
𝑎 = 833 609 = = = = 54.42
6 53 6 ∗ 609 − (53)2 3654 − 2809 845
| |
53 609

6 148
| |
𝑏= 53 833 = 6 ∗ 833 − 53 ∗ 148 = 4998 − 7844 = −2846 = −3.37
6 53 6 ∗ 609 − (53)2 6 ∗ 609 − (53)2 845
| |
53 609

Ecuatia de regresie este:


𝑦̂𝑖 = 𝑎 + 𝑏𝑥𝑖 = 54.42 − 3.37𝑥𝑖
Interpretare: Pentru fiecare unitate suplimentara de ingrasamant, productia la hectar scade (!?) cu 3.37
unitati.