Documente Academic
Documente Profesional
Documente Cultură
În tabelul următor avem date referitoare la 15 agenţi de asigurări angajaţi ai unei companii
de asigurări de viaţă şi anume: timpul mediu, în minute, petrecut de un agent cu un potenţial client
şi numărul de poliţe încheiate într-o săptămână. Dacă xi (variabila cauza, independenta, exogena)
reprezintă timpul mediu, iar yi (variabila efect, dependenta, endogena) reprezintă numărul de
poliţe, avem datele sistematizate astfel:
xi yi
25 10
23 11
30 14
25 12
20 8
33 18
18 9
21 10
22 10
30 15
26 11
26 15
27 12
29 14
20 11
Se cere:
a) Sa se determine coeficientii modelului de regresie
b) să se determine erorile reziduale;
c) măsuraţi intensitatea legăturii dintre cele două variabile folosind un indicator adecvat;
d) efectuaţi o previzionare punctuală a numărului de poliţe încheiate de un agent care
petrece în medie 24 de minute cu un potenţial client.
Rezolvare:
a) Pentru a determina forma modelului de regresie se va construi corelograma:
Scara de reprezentare: 1 cm pe OY = 5 poliţe, 1 cm pe OX = 2 minute
Ecuatia de regresie : ŷ i = a 0 + a1 x i
n n
0
na + a 1 x i = yi
i =1 i =1
n n n
n = 15
a x + a x 2 = x y
0 i =1 i 1
i =1
i
i =1
i i
Pentru a rezolva sistemul vom folosi următorul tabel în care sunt prezentate valorile
intermediare:
xi yi x i2 x i yi y i2 (y i − y)2
25 10 625 250 100 4
23 11 529 253 121 1
30 14 900 420 196 4
25 12 625 300 144 0
20 8 400 160 64 16
33 18 1089 594 324 36
18 9 324 162 81 9
21 10 441 210 100 4
22 10 484 220 100 4
30 15 900 450 225 9
26 11 676 286 121 1
26 15 676 390 225 9
27 12 729 324 144 0
29 14 841 406 196 4
20 11 400 220 121 1
xi = yi = x i2 = x i yi = y i2 = 102
375 180 9639 4645 2262
c) Intensitatea legăturii dintre cele două variabile se face cu coeficientul de corelaţie liniară:
n n n
n xi yi − xi yi
ry / x = i =1 i =1 i =1
=
n 2 n n 2 n 2
2
n xi − xi n yi − yi
i =1 i =1 i =1 i =1
15 4645 − 375 180
= 0,88 0 → 1
15 9639 − 3752 15 2262 − 1802
Interpretare: Rezultă că între cele două variabile există o legătură directă foarte puternică.
Măsurarea intensităţii legăturii cu raportul de corelaţie R:
(ŷ i − y )
n 2
R = i =1 = 0,88
(y i − y )
n 2
i =1
Regression Statistics
Multiple R 0.883621
R Square 0.780786
Adjusted R Square 0.763923
Standard Error 1.311483
Observations 15.000000
ANOVA
df SS MS F Significance F
Regression 1.000000 79.640152 79.640152 46.302727 0.000013
Residual 13.000000 22.359848 1.719988
Total 14.000000 102.000000
RESIDUAL OUTPUT
SUMMARY OUTPUT
Regression Statistics
Tabel 1.
n n
Multiple R
( yˆi − y ) (y − yˆi )
2 2
i
Raportul de corelatie (R)
0.883621 Ry / x = i =1
n
= 1− i =1
n
(y − y) (y − y)
Apartine intervalului [0,1] 2 2
i i
Ne arata intensitatea i =1 i =1
R Square
Coeficientul (gradul) de
(ŷ i − y )
n 2
determinaţie 2y / x
0.780786 2e
Ne arata cat la suta din R2 = = 1− = i=1
(y i − y )
variatia lui Y se datoreaza 2y 2y n 2
lui X i =1
Adjusted R Square
Valoarea ajustată a 2u / n − k − 1
0.763923 2
coeficientului de R = 1−
determinaţie 2y / n − 1
Standard Error n
( )2 =
Regression n
(variaţia SSR= 2x = ŷ i − y 2x
1 (k) s 2x = = Testul F=46.302727 0.000013< 0.05
datorată i =1 k 2 2 (resping H0 – model
regresiei) 79.640152 79.640152 F= s / s
x u valid)
2u
n s 2u =
Residual
2
13 (n-k-1) SSE= u = (y i − ŷ i ) 2
n − k −1
(variaţia i =1 =
reziduală) = 22.359848 1.719988
( )2
n
2
SST= y = yi − y 2y
Total 14 (n-1) i=1 s 2y =
(variaţia = 102.000000 n −1
totală) SST=SSR + SSE
Tabel 3
Standard
Error
Coefficients
(Abaterea t Stat P-value Lower 95% Upper 95%
(Coeficienţi)
medie
pătratică)
Limita inf. a Limita sup. a
intervalului intervalului de
de încredere încredere
Intercept
0.412843
(termenul a0= -1.731061 s a0 =2.046120 t a0 = -0.846021 > 0,05
-6.151434 2.689313
liber)
Timpul
a1 = 0.549242>0 0.000013
mediu
directia legaturii s a1 =0.080716 t a1 = 6.804611 < 0,05
0.374866 0.723619
(variabila x)
▪ R2 = 0.780786 arată că 78% din variaţia numărului de poliţe încheiate este explicată de
timpul mediu petrecut de un agent cu un potenţial client.
▪ Abaterea medie pătratică a erorilor s u = 1.311483. În cazul în care acest indicator este
zero înseamnă că toate punctele sunt pe dreapta de regresie.
În acest tabel este calculat testul F pentru validarea modelului de regresie. Întrucât F =
46.302727, iar Significance F (pragul de semnificatie) este 0.000013 (valoare mai mica de 0.05)
atunci modelul de regresie construit este valid şi poate fi utilizat pentru analiza dependenţei dintre
cele două variabile.
▪ Intercept este termenul liber, deci coeficientul a0 este -1.731061. Termenul liber este
punctul în care variabila explicativă (factorială) este 0. Deci numărul de poliţe încheiate,
dacă timpul petrecut este 0 (NU are semnificatie economica)
▪ Coeficientul a1 este 0.549242>0(legatura directa), ceea ce însemnă că la creşterea timpului
petrecut cu un minut, numărul de poliţe încheiate va creşte cu 0,549242.