Sunteți pe pagina 1din 9

1.

În tabelul următor avem date referitoare la 15 agenţi de asigurări


angajaţi ai unei companii de asigurări de viaţă şi anume: timpul mediu, în
minute, petrecut de un agent cu un potenţial client şi numărul de poliţe încheiate
într-o săptămână. Dacă X reprezintă timpul mediu, iar Y reprezintă numărul de
poliţe, avem datele sistematizate astfel:

X Y
25 10
23 11
30 14
25 12
20 8
33 18
18 9
21 10
22 10
30 15
26 11
26 15
27 12
29 14
20 11

Se cere:
a) să se estimeze parametrii modelului liniar de regresie;
b) să se testeze semnificaţia parametrilor modelului pentru un prag de semnificaţie  =
5%;
c) să se determine erorile reziduale;
d) să se testeze validitatea modelului de regresie pentru un nivel de semnificaţie  =
5%;
e) măsuraţi intensitatea legăturii dintre cele două variabile folosind un indicator
adecvat şi testaţi semnificaţia acestuia pentru un nivel de încredere de 0,5%;
f) efectuaţi o previzionare punctuală şi pe interval de încredere a numărului de poliţe
încheiate de un agent care petrece în medie 24 de minute cu un potenţial client.
Rezolvare:

Pentru a determina forma modelului de regresie se va construi corelograma:

OY numar polite
16

14

12

10

OX
6
16 18 20 22 24 26 28 30 32
timpul mediu
34

1 cm OY = 5 poliţe
1 cm OX = 2 minute
a) ŷ i  a 0  a1 x i

Parametrii a şi b se determină cu ajutorul metodei celor mai mici pătrate:

 y i  ŷ i 2 min   y i  a 0  a1x i 2 min 


i i

 n n
na 0  a 1  x i   y i
 i 1 i 1
 n n n
n  15
a  x  a  x 2   x y
 0 i 1 i 1
i 1
i
i 1
i i

Pentru a rezolva sistemul vom folosi următorul tabel în care sunt prezentate valorile
intermediare:

xi yi x i2 x i yi y i2 y i  y2 x i  x 2
25 10 625 250 100 4 0
23 11 529 253 121 1 4
30 14 900 420 196 4 25
25 12 625 300 144 0 0
20 8 400 160 64 16 25
33 18 1089 594 324 36 64
18 9 324 162 81 9 49
21 10 441 210 100 4 16
22 10 484 220 100 4 9
30 15 900 450 225 9 25
26 11 676 286 121 1 1
26 15 676 390 225 9 1
27 12 729 324 144 0 4
29 14 841 406 196 4 16
20 11 400 220 121 1 25
 xi   yi   x i2   x i yi   y i2  102 264
375 180 9639 4645 2262

15a 0  a 1  375  180 a 0  1,73


  
a 0  375  a 1  9639  4645 a 1  0,5492

Deci:

ŷ i  1,73  0,5492 x i
b) Testarea semnificaţiei parametrilor modelului:
Ecuaţia de regresie la nivelul colectivităţii generale este:

y i   0  1 x i  u i

iar la nivelul eşantionului este:

y i  a 0  a1 x i  u i

Testarea semnificaţiei parametrului 1:


1) se stabileşte ipoteza nulă:
H0 : 1 = 0
2) se stabileşte ipoteza alternativă:
H1 : 1  0, adică 1 este semnificativ diferit de zero, adică 1 este semnificativ
statistic.
3) se calculează testul statistic:
deoarece n = 15  30 avem eşantion de volum redus şi pentru testare vom utiliza
testul t:
a  1 a1  0 a1 0,5492
t 1     6,8
s a1 s a1 s a1 0,08

s 2u 1,7199
s a2    0,0064
 x i  x 
i 2 264
i

 y i  ŷ i 2
22,35
s 2u  i   1,7199
n  k 1 15  2
k – reprezintă numărul variabilelor factoriale (în cazul modelului unifactorial k = 1).
15
 xi
375
x  i 1   25
15 15
Pentru un prag de semnificaţie de 5% valoarea tabelată a testului este:
t0,05/2; 13 = t0,025; 13 = 1,35
Testarea semnificaţiei parametrului 0:
1) se stabileşte ipoteza nulă: H0: 0 = 0;
2) se stabileşte ipoteza alternativă: H1: 0  0;
3) se calculează testul statistic:
a  1 a 0  0 a 0  1,73
t 0     0,84
s a0 s a0 s a 0 2,096

 
1 2 
  1,71 
x 1 25 
s a2  s 2u     4,186
0


i
2
n  x  x 

15 264
i

t calc  0,84  t  / 2;n 2  1,35  se acceptă ipoteza nulă, adică parametrul a0 nu


este semnificativ statistic.
c) Erorile reziduale sunt u i  y i  ŷ i şi sunt prezentate în tabelul de mai jos:

ui -14,99 -27,57 -0,91 18,38 16,58 7,37 5,03

-20,62 9,90 27,22 -19,95 -17,48 -5,09 5,42 16,70


d) Testarea validităţii modelului de regresie:
1) se stabileşte ipoteza nulă: H0: împrăştierea valorilor ŷ t datorate factorului nu diferă
semnificativ de împrăştierea aceloraşi valori datorate întâmplării, deci modelul nu este valid.
2) se stabileşte ipoteza alternativă: H1: modelul este valid;
3) se calculează testul F:

s 2 79,64
F x   46,3
s 2u 1,71

 ŷ i  y 
2
79,64
s 2x  i   79,64
k 1

 y i  ŷ i 2
22,35
s 2u  i   1,71
n  k 1 15  2
15
 yi
180
y  i 1   12
15 15
Fcalc  F;n k 1  F0,05;1,13  4,67

Deoarece Fcalc  Ftab  modelul este valid.


e) Intensitatea legăturii dintre cele două variabile se face cu coeficientul de corelaţie
liniară:
n x i yi   x i   yi
r 
n x 2
i 
  x i 2 n  y i2   y i 2 
15  4645  375  180
  0,88  1  0
15  9639  375 15  2262  180 
2 2

Rezultă că între cele două variabile există o legătură directă foarte puternică.
Testarea semnificaţiei coeficientului de corelaţie:
- se stabileşte ipoteza nulă: H0:  nu este semnificativ statistic;
- se stabileşte ipoteza alternativă: H1:  este semnificativ statistic;
- se calculează testul t:
r r n  2 0,88  13
t    6,75
sr 1 r 2
1  0,88 2

t calc  t ;n k 1  t 0,05; 13  2,16 

Coeficientul de corelaţie este semnificativ statistic.


Măsurarea intensităţii legăturii cu raportul de corelaţie R:

 ŷ i  y 
n 2

R  i 1  0,88
 y i  y 
n 2

i 1

Deoarece R = r = 0,88, apreciem că există o legătură liniară, puternică şi directă între


cele două variabile.
Testarea raportului de corelaţie se face cu testul F:

R2 n  k 1 0,78 13
F     46,09
1 R 2 k 1  0,78 1

Cum:
Fcalc  F0,05; 1; 13  4,67 

R este semnificativ statistic.


f)
ŷ n 1  1,73  0,5492 24  11,45 ~ 12 poliţe (aceasta este estimarea punctuală).

Pentru estimarea pe interval de încredere vom avea:

ŷ n 1  t  / 2;n k 1  s ŷn 1  y n 1  ŷ n 1  t  / 2;n k 1  s ŷn 1

12  t 0,025;13  1,35  y n 1  12  t 0,025;13  1,35

 
s 2ŷ
 1 x
 s 2u 1   n 1
x
2
  1 (24  25) 2 
  1,711     1,82 
n 1


 n  x x 2
i 
 
 15 264 
i

s ŷ  1,35
n 1

10,1775 y n 1  13,8225

Intervalul de încredere pentru numărul de poliţe încheiate este:

10  y n 1  14

S-ar putea să vă placă și