P. 1
Probleme Rezolvate REGRESIE

Probleme Rezolvate REGRESIE

|Views: 5|Likes:
Published by Violeta Frangu
Probleme Rezolvate REGRESIE
Probleme Rezolvate REGRESIE

More info:

Categories:Types, Brochures
Published by: Violeta Frangu on Jan 25, 2014
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

07/21/2015

pdf

text

original

1.

În tabelul următor avem date referitoare la 15 agenţi de asigurări angajaţi ai unei
companii de asigurări de viaţă şi anume: timpul mediu, în minute, petrecut de un agent cu
un potenţial client şi numărul de poliţe încheiate întro săptăm!nă. "acă # repre$intă
timpul mediu, iar % repre$intă numărul de poliţe, avem datele sistemati$ate astfel:
X Y
&5
&'
'(
&5
&(
''
1)
&1
&&
'(
&*
&*
&+
&,
&(
1(
11
1-
1&
)
1)
,
1(
1(
15
11
15
1&
1-
11
.e cere:
a/ să se estime$e parametrii modelului liniar de regresie0
b/ să se teste$e semnificaţia parametrilor modelului pentru un prag de semnificaţie
α 1 520
c/ să se determine erorile re$iduale0
d/ să se teste$e validitatea modelului de regresie pentru un nivel de semnificaţie α
1 520
e/ măsuraţi intensitatea legăturii dintre cele două variabile folosind un indicator
adecvat şi testaţi semnificaţia acestuia pentru un nivel de încredere de (,520
f/ efectuaţi o previ$ionare punctuală şi pe interval de încredere a numărului de
poliţe încheiate de un agent care petrece în medie &- de minute cu un potenţial
client.
3e$olvare:
4entru a determina forma modelului de regresie se va construi corelograma:
6
8
10
12
14
16
16 18 20 22 24 26 28 30 32 34
OY
timpul mediu
OX
numar polite
1 cm 5% 1 5 poliţe
1 cm 5# 1 & minute
a/
i 1 (
i
6 a a 78 + ·
4arametrii a şi b se determină cu ajutorul metodei celor mai mici pătrate:
( ) ( ) ⇔ − − ⇔ −
∑ ∑
min 6 a a 7 min 78 7
i
&
i 1 ( i
i
&
i i
¹
¹
¹
¹
¹
'
¹
· +
· +
∑ ∑ ∑
∑ ∑
· · ·
· ·
n
1 i
i i
n
1 i
&
i
1
n
1 i
i (
n
1 i
i
n
1 i
i 1 (
7 6 6 a 6 a
7 6 a na
15 n ·
4entru a re$olva sistemul vom folosi următorul tabel în care sunt pre$entate valorile
intermediare:
i
6
i
7
&
i
6
i i
7 6
&
i
7
( )
&
i
7 7 − ( )
&
i
6 6 −
&5
&'
'(
&5
&(
''
1)
&1
&&
'(
&*
&*
&+
&,
&(
1(
11
1-
1&
)
1)
,
1(
1(
15
11
15
1&
1-
11
*&5
5&,
,((
*&5
-((
1(),
'&-
--1
-)-
,((
*+*
*+*
+&,
)-1
-((
&5(
&5'
-&(
'((
1*(
5,-
1*&
&1(
&&(
-5(
&)*
',(
'&-
-(*
&&(
1((
1&1
1,*
1--
*-
'&-
)1
1((
1((
&&5
1&1
&&5
1--
1,*
1&1
-
1
-
(
1*
'*
,
-
-
,
1
,
(
-
1
(
-
&5
(
&5
*-
-,
1*
,
&5
1
1
-
1*
&5
'+5
6
i
·

1)(
7
i
·

,*',
6
&
i
·

-*-5
7 6
i i
·

&&*&
7
&
i
·

1(& &*-
¹
'
¹
· ⋅ + ⋅
· ⋅ +
-*-5 ,*', a '+5 a
1)( '+5 a a 15
1 (
1 (

¹
'
¹
·
− ·
5-,& , ( a
+' , 1 a
1
(
"eci:
i
i
6 5-,& , ( +' , 1 78 ⋅ + − ·
b/ 9estarea semnificaţiei parametrilor modelului:
:cuaţia de regresie la nivelul colectivităţii generale este:
i
i 1 (
i
u 6 7 + α + α ·
iar la nivelul eşantionului este:
i
i 1 (
i
u 6 a a 7 + + ·
9estarea semnificaţiei parametrului α
1
:
1/ se stabileşte ipote$a nulă:
;
(
: α
1
1 (
&/ se stabileşte ipote$a alternativă:
;
1
: α
1
≠ (, adică α
1
este semnificativ diferit de $ero, adică α
1
este
semnificativ statistic.
'/ se calculea$ă testul statistic:
deoarece n 1 15 < '( avem eşantion de volum redus şi pentru testare vom utili$a
testul t:
) , *
() , (
5-,& , (
s
a
s
( a
s
a
t
1 1 1
a
1
a
1
a
1 1
· · ·

·
α −
·
( )
((*- , (
&*-
+1,, , 1
6 6
s
s
i
&
i
&
u &
a
i
· ·

·

( )
+1,, , 1
& 15
'5 , &&
1 < n
78 7
s
i
&
i i
&
u
·

·
− −

·

< = repre$intă numărul variabilelor factoriale >în ca$ul modelului unifactorial <
1 1/.
&5
15
'+5
15
6
6
15
1 i
i
· · ·

·
4entru un prag de semnificaţie de 52 valoarea tabelată a testului este:
t
(,(5?&0 1'
1 t
(,(&50 1'
1 1,'5
9estarea semnificaţiei parametrului α
(
:
1/ se stabileşte ipote$a nulă: ;
(
: α
(
1 (0
&/ se stabileşte ipote$a alternativă: ;
1
: α
(
≠ (0
'/ se calculea$ă testul statistic:
)- , (
(,* , &
+' , 1
s
a
s
( a
s
a
t
( ( (
a
(
a
(
a
1 (
− ·

· ·

·
α −
·
( )
1)* , -
&*-
&5
15
1
+1 , 1
6 6
6
n
1
s s
i
&
i
&
&
u
&
a
(
·
1
]
1

¸

+ ·
1
1
1
1
]
1

¸


+ ·

'5 , 1 t )- , ( t
& n 0 & ? calc
− · − > − ·
− α ⇒ se acceptă ipote$a nulă, adică
parametrul a
(
nu este semnificativ statistic.
c/ :rorile re$iduale sunt
i i i
78 7 u − ·
şi sunt pre$entate în tabelul de mai jos:
ui 1-,,, &+,5+ (,,1 1),') 1*,5) +,'+ 5,('
&(,*& ,,,( &+,&& 1,,,5 1+,-) 5,(, 5,-& 1*,+(
d/ 9estarea validităţii modelului de regresie:
1/ se stabileşte ipote$a nulă: ;
(
: împrăştierea valorilor
t
78
datorate factorului nu
diferă semnificativ de împrăştierea aceloraşi valori datorate înt!mplării, deci modelul nu
este valid.
&/ se stabileşte ipote$a alternativă: ;
1
: modelul este valid0
'/ se calculea$ă testul @:
' , -*
+1 , 1
*- , +,
s
s
@
&
u
&
6
· · ·
( )
*- , +,
1
*- , +,
<
7 78
s
i
&
i
&
6
· ·

·

( )
+1 , 1
& 15
'5 , &&
1 < n
78 7
s
i
&
i i
&
u
·

·
− −

·

1&
15
1)(
15
7
7
15
1 i
i
· · ·

·
*+ , - @ @ @
1' , 1 0 (5 , ( 1 < n 0 calc
· · ·
− − α
"eoarece @
calc
> @
tab
⇒ modelul este valid.
e/ Antensitatea legăturii dintre cele două variabile se face cu coeficientul de
corelaţie liniară:
( ) [ ] ( ) [ ]
[ ][ ]
( 1 )) , (
1)( &&*& 15 '+5 ,*', 15
1)( '+5 -*-5 15
7 7 n 6 6 n
7 6 7 6 n
r
& &
&
i
&
i
&
i
&
i
i i i i
> → ·
− ⋅ − ⋅
⋅ − ⋅
·
·
− −
⋅ −
·
∑ ∑ ∑ ∑
∑ ∑ ∑
3e$ultă că între cele două variabile e6istă o legătură directă foarte puternică.
9estarea semnificaţiei coeficientului de corelaţie:
se stabileşte ipote$a nulă: ;
(
: ρ nu este semnificativ statistic0
se stabileşte ipote$a alternativă: ;
1
: ρ este semnificativ statistic0
se calculea$ă testul t:
+5 , *
)) , ( 1
1' )) , (
r 1
& n r
s
r
t
& &
r
·


·


· ·
1* , & t t t
1' 0 (5 , ( 1 < n 0 calc
· · >
− − α ⇒
Boeficientul de corelaţie este semnificativ statistic.
Căsurarea intensităţii legăturii cu raportul de corelaţie 3:
( )
( )
)) , (
7 7
7 78
3
n
1 i
&
i
n
1 i
&
i
·


·


·
·
"eoarece 3 1 r 1 (,)), apreciem că e6istă o legătură liniară, puternică şi directă
între cele două variabile.
9estarea raportului de corelaţie se face cu testul @:
(, , -*
1
1'
+) , ( 1
+) , (
<
1 < n
3 1
3
@
&
&
· ⋅

·
− −


·
Bum:
*+ , - @ @
1' 0 1 0 (5 , ( calc
· >

3 este semnificativ statistic.
f/
1& D -5 , 11 &- 5-,& , ( +' , 1 78
1 n
· ⋅ + − ·
+
poliţe >aceasta este estimarea
punctuală/.
4entru estimarea pe interval de încredere vom avea:
1 n 1 n
78 1 < n 0 & ? 1 n 1 n 78 1 < n 0 & ? 1 n
s t 78 7 s t 78
+ +
⋅ + ≤ ≤ ⋅ −
− − α + + − − α +
'5 , 1 t 1& 7 '5 , 1 t 1&
1' 0 (&5 , ( 1 n 1' 0 (&5 , (
⋅ + ≤ ≤ ⋅ −
+
( )
( )
)& , 1
&*-
/ &5 &- >
15
1
1 +1 , 1
6 6
6 6
n
1
1 s s
&
i
&
i
&
1 n &
u
&
78
1 n
·
1
1
]
1

¸


+ + ·
1
1
1
1
]
1

¸



+ + ·

+
+

'5 , 1 s
1 n
78
·
+
)&&5 , 1' 7 1++5 , 1(
1 n
≤ ≤
+
Antervalul de încredere pentru numărul de poliţe încheiate este:
1- 7 1(
1 n
≤ ≤
+
3e$olvarea problemei cu ajutorul programului informatic :#B:E:
.e selectea$ă din meniul principal opţiunea 9ools, apoi "ata Fnal7sis, apoi
3egression şi se deschide următoarea fereastră:
şi se obţin următoarele re$ultate:
.GCCF3% 5G94G9
Regression Statistics
Cultiple 3 (.))'*&1
3 .Huare (.+)(+)*
Fdjusted 3
.Huare
(.+*',&'
.tandard :rror 1.'11-)'
5bservations 15.((((((
FI5JF
df SS MS F Significance F
3egression 1.(((((( +,.*-(15& +,.*-(15
&
-*.'(&+&
+
(.((((1'
3esidual 1'.(((((( &&.'5,)-) 1.+1,,))
9otal 1-.(((((( 1(&.(((((
(
Coefficient
s
Standard
Error
t Stat P-value Lower
95%
Upper
95%
Antercept 1.+'1(*1 &.(-*1&((.)-*(&1 (.-1&)-'*.151-'- &.*),'1
'
# Jariable 1 (.5-,&-& (.()(+1* *.)(-*11 (.((((1' (.'+-)** (.+&'*1
,
3:.A"GFE 5G94G9
!servation Predicted
"
Residuals
1.(((((( 1&.(((((( &.((((((
&.(((((( 1(.,(1515 (.(,)-)5
'.(((((( 1-.+-*&1& (.+-*&1&
-.(((((( 1&.(((((( (.((((((
5.(((((( ,.&5'+)) 1.&5'+))
*.(((((( 1*.',',', 1.*(*(*1
+.(((((( ).155'(' (.)--*,+
).(((((( ,.)('('( (.1,*,+(
,.(((((( 1(.'5&&+' (.'5&&+'
1(.(((((( 1-.+-*&1& (.&5'+))
11.(((((( 1&.5-,&-& 1.5-,&-&
1&.(((((( 1&.5-,&-& &.-5(+5)
1'.(((((( 1'.(,)-)5 1.(,)-)5
1-.(((((( 1-.1,*,+( (.1,*,+(
15.(((((( ,.&5'+)) 1.+-*&1&
:6plicitarea datelor din tabelele de mai sus:
SUMMARY OUTPUT
Regression Statistics
Multiple R
3aportul de corelatie >3/
(.))'*&1
( )
( )
( )
( )




·
·
·
·


− ·


·
n
1 i
&
i
n
1 i
&
i i
n
1 i
&
i
n
1 i
&
i
7 7
78 7
1
7 7
7 78
6 , 37
R Square
Boeficientul >gradul / de
determinaţie
(.+)(+)*
( )
( )


·
·


·


− ·


·
n
1 i
&
i
n
1 i
&
i
&
7
&
e
&
7
&
6 ? 7
&
7 7
7 78
1 3
Adjusted R Square
Jaloarea ajustată a
coeficientului de
determinaţie
(.+*',&'
1 n ?
1 < n ?
1 3
&
7
&
u
&
− ∆
− − ∆
− ·
Standard Error
Fbaterea medie pătratică a
erorilor în eşantion
1.'11-)'
( )
& n
78 7
& n
s
n
1 i
&
i i
&
u
u


·


·

·
Observations
Iumărul observaţiilor >n/
15
9abel &.
ANOVA
Sursa
variaţiei
df
>grade de
libertate/
SS #varian$a%
#su&a p'tratelor%
MS (SS)df
#&edia p'tratelor%
>dispersia
corectată/
F Significance F
Regression
varia!ia
datorat"
regresiei#
1 ></
..31
( )

·
− · ∆
n
1 i
&
i
&
6
7 78
1
79.640152
<
s
&
6 &
6

·
1
79.640152
9estul
@146.302727
@1
&
*
s ?
&
u
s
0.000013K
(.(5
>resping ;( =
model valid/
Residual
varia!ia
re$idual"#
1' >n<1/
..:1
( )

·
− · ∆
n
1 i
&
i i
&
u
78 7 1
22.359848
1 < n
s
&
u &
u
− −

·
1
1.719988
Total
varia!ia
total"#
1- >n1/
..91
( )

·
− · ∆
n
1 i
&
i
&
7
7 7 1
102.000000
SST=SSR + SSE

1 n
s
&
7
&
7


·

9abel '

Coefficients
(Coeficienţi)
Standard
Error
(Abaterea
medie
patratică)
t Stat P-value Loer !"# $pper !"#
Limita inf%
a
intervalului
de &ncredere
Limita sup% a
intervalului
de &ncredere
%nter&ept
ter'enul
liber#
a+( 1.+'1(*1
(
a
s

1&.(-*1&(
(
a
t
1
(.)-*(&1
(.-1&)-'
L (,(5
*.151-'- &.*),'1'
Ti'pul
'ediu
a, ( (.5-,&-&
1
a
s

1(.()(+1*
1 a
t
1 *.)(-*11
(.((((1'
K (,(5
(.'+-)** (.+&'*1,
9abel -.
RES%)UA* OUTPUT
!servation
Predicted
i
-8
.u&'rul de poli$e
Residuals
i i
- - 8 −
1 '').5+,* 1-.,,)*
& '+1.&5-& &+.5+&&
' '+*.1+-) (.,1()
- ''&.)5&5 1).'),5
5 '11.)&)1 1*.5)),
* '1(.*,*& +.'+&)
+ '&5.,&'5 5.('55
) &)+.)*5, &(.*&,,
, '1(.,+*' ,.,(*+
1( ')&.'(+' &+.&&++
11 ''*.&1)) 1,.,5*)
1& '*,.&,') 1+.-)+)
1' '').+5(- 5.(,5-
1- '*+.&5&) 5.-&*&
15 '-*.(,1+ 1*.+(-'
Anterpretare re$ultate din tabelul SUMMARY OUTPUT :
 R( +,--./01 arată că între numărul de poliţe încheiate şi timpul mediu petrecut
cu un potenţial client e6istă o legătură puternică.
 R
0
(+,2-+2-/ arată că +)2 din variaţia numărului de poliţe încheiate este
e6plicată de timpul mediu petrecut de un agent cu un potenţial client.
 Abaterea 'edie patrati&a a erorilor u
s
( 1.'11-)'. În ca$ul în care acest
indicator este $ero înseamnă că toate punctele sunt pe dreapta de regresie.
Anterpretare re$ultate din tabelul ANOVA 3
În acest tabel este calculat testul @ pentru validarea modelului de regresie. Întruc!t
@1-*.'(&+&+, iar Significance F #pragul de se&nificatie% este (.((((1' >valoare mai
mica de (.(5/ atunci modelul de regresie construit este valid şi poate fi utili$at pentru
anali$a dependenţei dintre cele două variabile.
Anterpretarea re$ultatelor din tabelul -:
 %nter&ept este termenul liber, deci coeficientul a
+
este 1.+'1(*1. 9ermenul liber
este punctul în care variabila e6plicativă >factorială/ este (. "eci numărul de
poliţe încheiate, dacă timpul petrecut este (. "eoarece
(
a
t
1 (.)-*(&1iar pragul
de semnificaţie P-value este (.-1&)-'L(,(5 înseamnă că acest coeficient este
nesemnificativ. "e altfel faptul că limita inferioară a intervalului de încredere
>*.151-'- ≤ ≤
α
(
&.*),'1'/ pentru acest parametru este negativă, iar limita
superioară este po$itivă arată că parametrul din colectivitatea generală este
apro6imativ $ero.
 Boeficientul a
'
este (.5-,&-&, ceea ce însemnă că la creşterea timpului petrecut cu
un minut, numărul de poliţe încheiate va creşte cu (,5-,&-&. "eoarece
1 a
t
1
*.)(-*11 iar pragul de semnificaţie P-value este (.((((1'K(,(5 înseamnă că
acest coeficient este semnificativ. Antervalul de încredere pentru acest parametru
este (.'+-)** ≤ ≤
1
α (.+&'*1,.
&. În tabelul următor avem informaţii privind veniturile obţinute de &( de
gospodării selectate aleator şi ta6ele plătite de către aceste gospodării:
Venitul
'ii euro#
4
Ta4ele
euro#
5
Venitul
'ii euro#
4
Ta4ele
euro#
5
1+,5
'+,5
-+,5
&5,(
55,5
'5,(
15,5
1&,(
'&,(
-&,'
'5,(
*(,5
)),5
+(,5
1&5,(
*',(
'(,(
'(,(
*5,(
)(,(
&),(
&&,5
&5,(
&,,5
*5,(
51,(
',,'
'',(
-5,(
+5,(
+5,(
+(,(
*(,(
*5,(
15(,(
1((,(
+5,(
-(,(
+5,(
&((,(
.e cere:
a/ să se specifice modelul econometric ce descrie legătura dintre cele două
variabile0
b/ să se estime$e parametrii modelului0
c/ să se verifice ipote$ele metodei celor mai mici pătrate0
d/ să se verifice semnificaţia parametrilor modelului de regresie pentru α 1 (,10
e/ să se teste$e validitatea modelului de regresie0
f/ să se teste$e intensitatea legăturii dintre cele două variabile şi să se teste$e
semnificaţia indicatorilor utili$aţi0
g/ să se estime$e punctual şi pe interval de încredere nivelul ta6elor care trebuie
plătite dacă venitul este de -( mii euro pentru o probabilitate de ,52.
3e$olvare:
a/ .e va repre$enta grafic legătura dintre nivelul ta6elor şi venit pentru cele &( de
gospodării prin corelogramă sau diagrama norului de puncte:
0
20
40
60
80
100
120
140
160
180
200
220
0 10 20 30 40 50 60 70 80
OY
xi
OX
yi
1 cm 5# 1 1( mii euro 0 1 cm 5% 1 &( euro
"in grafic se poate observa că distribuţia punctelor >6
i
, 7
i
/ poate fi apro6imată cu o
dreaptă, deci modelul econometric care descrie legătura dintre cele două variabile este un
model liniar:
u 6 7
1 (
+ α + α ·
α(, α1 = parametrii modelului0
α
1
> ( >panta dreptei/ deoarece legătura dintre cele două variabile este directă.
b/ 4entru estimarea parametrilor modelului de regresie utili$ăm metoda celor mai
mici pătrate:
&( , 1 i u 6 a a 7
i 1 (
i
· + + ·
i 1 (
i
6 a a 78 + ·
( ) ( ) ⇔ − − ⇔ −
∑ ∑
min 6 a a 7 min 78 7
i
&
i 1 ( i
i
&
i i
¹
'
¹
· ⋅ + ⋅
· +
*))*- 5' , '1,,1 a 1 , +'' a
5 , 155+ a 1 , +'' a &(
1 (
1 (

¹
'
¹
·
− ·
&,,+ , & a
-&(1 , * a
1
(
"eci, modelul este:
i
i
6 &,,+ , & -&(1 , * 78 + − ·
&,,+ , &
5' , '1,,1 1 , +''
1 , +'' &(
*))*- 1 , +''
5 , 155+ &(
6 6
6 n
7 6 6
7 n
a
&
i
i
i
i i i
i
1
· · ·
∑ ∑

∑ ∑

-&(1 , * 6 a 7 a
1 (
− · ⋅ − ·
c/ Apote$ele metodei celor mai mici pătrate:
c
1
/ Jariabilele observate nu sunt afectate de erori de măsură.
Fceastă ipote$ă se poate verifica cu ajutorul următoarelor relaţii:
6 i 6
s ' 6 6 s ' 6 + < < −
7 i 7
s ' 7 7 s ' 7 + < < −
unde:
( )
,, , 15
&(
+- , 511,
n
6 6
s
n
1 i
&
i
6
· ·

·

·
( )
(+ , -(
&(
-- , '&11*
n
7 7
s
n
1 i
&
i
7
· ·

·

·
*55 , '*
&(
1 , +''
&(
6
n
6
6
&(
1 i
i
n
1 i
i
· · · ·
∑ ∑
· ·
)+5 , ++
&(
5 , 155+
&(
7
7
&(
1 i
i
· · ·

·
,, , 15 ' *55 , '* 6 ,, , 15 ' *55 , '*
i
⋅ + < < ⋅ −
*&5 , )- 6 '15 , 11
i
< < −
>adevărat/
(+ , -( ' )+5 , ++ 7 (+ , -( ' )+5 , ++
i
⋅ + < < ⋅ −
()5 , &(1 7 ''5 , -&
i
< < −
>adevărat/
Apote$a poate fi acceptată fără nici un dubiu.
c
&
/ Jariabila aleatoare >re$iduală/ u este medie nulă şi dispersia variabilei re$iduale
este constantă şi independentă de variabila factorială >ipote$a de homoscedasticitate/.
Apote$a de homoscedasticitate poate fi verificată cu metoda grafică >corelograma/.
.e repre$intă grafic pe a6a 5# valorile variabilei factoriale 6, iar pe a6a 5% se
repre$intă valorile variabilei re$iduale u.
Ja trebui să calculăm valorile variabilei re$iduale:
i i i
78 7 u − ·
3e$ultatele sunt pre$entate în tabelul de mai jos:
i
78
i
u
'',)&
+,,)&
1(&,)&
51,(+
1&1,&1
+-,(+
&,,&'
&1,1)
*+,1+
,(,)*
5+,,+
-5,'&
51,(+
*1,-&
1-',(*
11(,)*
)',,*
*,,-+
,+,(+
1**,(*
1,1)
1,,'&
1-,'&
1,,-'
',+,
11,(+
(,++
),)&
&,1+
1(,)*
1+,('
&-,*)
),,'
',5)
*,,-
1(,)*
),,*
&,,-+
&&,(+
'',,-
-30
-25
-20
-15
-10
-5
0
5
10
15
20
25
30
35
0 20 40 60 80
OY
xi
OX
ui
"eoarece graficul punctelor pre$intă o evoluţie oscilantă putem accepta ipote$a că
variabila factorială şi cea re$iduală sunt independente.
c
'
/ Jalorile variabilei re$iduale nu sunt autocorelate, adică sunt independente între
ele:
Jerificarea acestei ipote$e se poate face prin:
- metoda grafică >corelograma/0
- testul "urbinMarson.
4rin metoda grafică se construieşte corelograma trec!nduse pe a6a 5# valorile
variabilei re$ultative 7
i
, iar pe a6a 5% valorile variabilei re$iduale:
-30
-25
-20
-15
-10
-5
0
5
10
15
20
25
30
35
0 20 40 60 80 100 120 140 160 180
OY
yi
OX
ui
"istribuţia erorilor este oscilantă, adică nu avem alternativă sistematică sub formă
de dinţi de fierăstrău, deci putem accepta ipote$a că erorile sunt independente, adică nu
sunt autocorelate.
9estarea ipote$ei cu ajutorul testului "urbinMatson:
se stabileşte ipote$a nulă:
;
(
: variabila re$iduală nu este autocorelată.
se stabileşte ipote$a alternativă:
;
1
: variabila re$iduală este autocorelată.
se calculea$ă testul "urbinMatson:
( )
-) , 1
&* , 5(-(
)+ , +5()
u
u u
d
n
1 i
&
i
n
1 i
&
1 i i
calc
· ·

·


·
·

4entru a efectua calculul lui d vom pre$enta re$ultatele intermediare în următorul
tabel:
i
u
1 i
u

( )
&
1 i i
u u


&
i
u
1,1)
1,,'&
1-,'&
1,,-'
',+,
11,(+
(,++
),)&
&,1+
1(,)*
1+,('
&-,*)
),,'
',5)
*,,-
1(,)*
),,*
&,,-+
&&,(+
'',,-

1,1)
1,,'&
1-,'&
1,,-'
',+,
11,(+
(,++
),)&
&,1+
1(,)*
1+,('
&-,*)
),,'
',5)
*,,-
1(,)*
),,*
&,,-+
&&,(+

-&(,1,
&5,(-
11'),,(
&--,+1
&&(,)(
1-(,'(
*-,)*
1&(,+,
+5,-+
+++,++
5),-+
&-),1-
&),*'
11,&,
'1+,((
',*&
-&(,**
5-,)1
'1'+,-1
1,')
'+',&1
&(-,,-
'++,-'
1-,'-
1&&,5'
(,*(
++,)*
-,+1
11+,))
&),,,+
*(),,5
+,,+(
1&,)1
-),1*
11),(-
)(,&5
)*),-)
-)*,,'
115&,1(
+5(),)+ 5(-(,&*
se compară d
calc
cu cele două valori d
1
şi d
&
din tabelul testului "urbinMatson
pentru pragul de semnificaţie α 1 (,(5 pentru numărul variabilelor e6ogene < 1 1 şi
pentru n 1 &(:
d1 1 1,&( d& 1 1,-1
& calc &
d - d d − < <
5, , & -) , 1 -1 , 1 < <
⇒ erorile sunt independente.
9ot pentru testarea ipote$ei privind autocorelarea erorilor poate fi utili$at şi
coeficientul de autocorelaţie de ordinul A:
1- , (
&* , 5(-(
-1 , +(,
u
u u
r
n
1 i
&
i
n
1 i
1 i i
1
· ·

·


·
·

"eoarece r
1
este apropiat de ( putem aprecia că valorile variabilei re$iduale nu sunt
autocorelate, adică sunt independente.
c
-
/ Jalorile variabilei re$iduale sunt normal distribuite:
4entru a testa această ipote$ă se foloseşte metoda grafică >corelograma/. 4e a6a 5#
se repre$intă valorile ajustate
i
78
, iar pe a6a 5% se repre$intă valorile variabilei
re$iduale:
-30
-25
-20
-15
-10
-5
0
5
10
15
20
25
30
35
0 20 40 60 80 100 120 140 160 180
OY
OX
ui
.e observă că valorile re$iduale u
i
se înscriu în banda construită, deci putem
accepta ipote$a de normalitate a erorilor pentru un prag de semnificaţie de α 1 (,(5.
d/ 9estarea semnificaţiei parametrilor modelului
9estarea semnificaţiei parametrului α
(
:
se stabileşte ipote$a nulă:
;
(
: α
(
1 (
se stabileşte ipote$a alternativă:
;
1
: α
(
≠ (
se calculea$ă testul t:
15 , (
)& , -1
-&(1 , *
s
a
t
(
a
(
− ·

· ·
( )
*) , 1--,
+5 , 511,
5' , '1,,1
(1 , &)(
6 6
6
s s
i
&
i
i
&
i
&
u
&
a
(
· ⋅ ·

⋅ ·


( )
(1 , &)(
1)
&* , 5(-(
& n
78 7
s
i
&
i i
&
u
· ·


·

se compară t
calc
cu t
α?&0 n&
1 t
(,(50 15
1 &,1(1
"eoarece 1) 0 (5 , ( calc
t t <
⇒ este foarte probabil ca estimatorul a
(
să provină dintr
o colectivitate cu α
(
1 ( deci α
(
nu este diferit semnificativ de $ero.
9estarea semnificaţiei parametrului α
1
:
N t
(,(50 1)⋅su
t
(,(50 1)⋅su
i
78
se stabileşte ipote$a nulă: ;
(
: α
1
1 (
se stabileşte ipote$a alternativă: ;
1
: α
1
≠ (
se calculea$ă testul t:
,, , ,
&' , (
&,,+ , &
s
a
t
1
a
1
· · ·
( )
(5 , (
+5 , 511,
(1 , &)(
6 6
s
s
&(
1 i
&
i
&
u &
a
1
· ·

·

·
se compară t
calc
cu t
α?&0 n&
1 t
(,(50 1)
1 &,1(1
"eoarece 1) 0 (5 , ( calc
t t >
⇒ apreciem că parametrul α
1
este semnificativ statistic.
Antervalul de încredere pentru parametrul α
1
este:
1 1
a & n 0 & ? 1 1 a & n 0 & ? 1
s t a s t a ⋅ + ≤ α ≤ ⋅ −
− α − α
&' , ( 1(1 , & &,,+ , & &' , ( 1(1 , & &,,+ , &
1
⋅ + ≤ α ≤ ⋅ −
+)&,' , & )1*-+ , 1
1
≤ α ≤
e/ 9estarea validităţii modelului de regresie:
se stabileşte ipote$a nulă: ;
(
: modelul nu este valid.
se stabileşte ipote$a alternativă: ;
1
: modelul este valid0
se calculea$ă testul @:
*, , ,*
(1 , &)(
1) , &+(+*
s
s
@
&
u
&
6
· · ·
( )
1) , &+(+*
1
1) , &+(+*
<
7 78
s
&(
1 i
&
i
&
6
· ·

·

·
se compară @
calc
cu @
α0 <0 n<1
1 @
(,10 10 1)
1 ),&)
1) 0 1 0 1 , ( calc
@ *, , ,* @ > ·
⇒ se respinge ipote$a nulă şi se acceptă alternativa,
deci modelul este valid.

f/ Antensitatea legăturii dintre cele două variabile se aprecia$ă cu ajutorul:
coeficientului de corelaţie0
raportului de corelaţie.
Boeficientul de corelaţie:
,1) , (
7 7 n 6 6 n
7 6 7 6 n
r
&
i
i
i
&
i
&
i
i
i
&
i
i
i
i
i
i
i i
6 ? 7
·
1
1
]
1

¸

,
_

¸
¸

1
1
]
1

¸

,
_

¸
¸

⋅ −
·
∑ ∑ ∑ ∑
∑ ∑ ∑
"eoarece r
7?6
1 (,,1) → 1, apreciem că între cele două variabile e6istă o legătură
liniară, directă, foarte puternică.
9estarea semnificaţiei coeficientului de corelaţie pentru colectivitatea generală:
se stabileşte ipote$a nulă: ;
(
: ρ 1 ( >ρ nu este semnificativ statistic/0
se stabileşte ipote$a alternativă: ;
1
: ρ ≠ ( >ρ este semnificativ statistic/0
ρ coeficientul de corelaţie la nivelul colectivităţii generale
se calculea$ă testul t:
)& , ,
,1) , ( 1
1) ,1) , (
r 1
& n r
t
& &
calc
·


·


·
se compară
calc
t
cu
)+) , & t t
1) 0 1 , ( & n 0
· ·
− α
"eoarece 1) 0 1 , ( calc
t t >
⇒ respingem ipote$a nulă şi acceptăm alternativa, deci
coeficientul de corelaţie este semnificativ statistic.
3aportul de corelaţie 3:
( )
( )
,1) , (
-- , '&11*
&* , 5(-(
1
7 7
78 7
1 3
1 i
&
i
1 i
&
i i
· − ·


− ·


·
·
"eoarece 3 1 r
7?6
, apreciem că între cele două variabile e6istă, întradevăr,
o legătură liniară.
9estarea semnificaţiei raportului de corelaţie:
se stabileşte ipote$a nulă: ;
(
: 3 nu este semnificativ statistic0
se stabileşte ipote$a alternativă: ;
1
: 3 este semnificativ statistic0
se calculea$ă testul @:
5 , ,-
,1) , ( 1
,1) , (
1
1)
3 1
3
<
1 < n
@
&
&
&
&
calc
·

⋅ ·


− −
·
se compară
calc
@
cu
&) , ) @ @
1) 0 1 0 1 , ( 1 < n 0 < 0
· ·
− − α
"eoarece 1) 0 1 0 1 , ( calc
@ @ >
⇒ se respinge ipote$a nulă şi se acceptă alternativa,
deci raportul de corelaţie este semnificativ statistic.
g/
5*+, , )5 -( &,,+ , & -&(1 , * 78
1 n
· ⋅ + − ·
+
euro >estimarea punctuală/
4entru estimarea pe interval de încredere vom avea:
1 n 1 n
78 1 < n 0 & ? 1 n 1 n 78 1 < n 0 & ? 1 n
s t 78 7 s t 78
+ +
⋅ + ≤ ≤ ⋅ −
− − α + + − − α +
1* , 1+ t 5*+, , )5 7 1* , 1+ t 5*+, , )5
55& , & 1) 0 (&5 , ( 1 n 55& , & 1) 0 (&5 , (
⋅ + ≤ ≤ ⋅ −
· + ·
( )
( )
5, , &,-
+5 , 511,
/ *55 , '* -( >
&(
1
1 (1 , &)(
6 6
6 6
n
1
1 s s
&
n
1 i
&
i
&
1 n &
u
&
78
1 n
·
1
1
]
1

¸


+ + ·
1
1
1
1
1
]
1

¸



+ + ·

·
+
+

"eci, intervalul de încredere pentru ta6ele plătite pentru un venit de -( mii euro la
nivelul populaţiei este:
/ euro > '* , 1&, 7 / euro > ++ , -1
1 n
≤ ≤
+
3e$olvarea problemei cu ajutorul programului informatic :#B:E:
.e selectea$ă din meniul principal opţiunea 9ools, apoi "ata Fnal7sis, apoi
3egression şi se va deschide următoarea fereastră:
şi se obţin următoarele re$ultate
.GCCF3% 5G94G9
Regression Statistics
Cultiple 3
(.,1)1)-5
))
3 .Huare
(.)-'(*&,
'+
Fdjusted 3
.Huare
(.)'-'--&
1&
.tandard
:rror
1*.+''*'1
()
5bservations &(
FI5JF

df SS MS F
Significanc
e F
3egression 1&+(+*.1+)1-
&+(+*.1
) ,*.*,5**
1.155)):
()
3esidual 1)5(-(.&5,'*'
&)(.(1-
-
9otal 1, '&11*.-'+5

Coefficient
s
Standard
Error t Stat P-value
Lower
95%
Upper
95%
Antercept ,.'5''+-))) (.*)*- (.5(1&(, 1'.&'(5)
*.-&(1-&-
)
&*.(+()*,
1-
# Jariable 1
>Jenitul/
&.&,,*,(1
51(.&'')*5'&5
,.)''',
5 1.1*:()
1.)()'5*,
55 &.+,1(&'
3:.A"GFE 5G94G9
!servation
Predicted
" Residuals
1
''.)&--'5
1* 1.1+55*-)-
&
+,.)1)&')
1)

1,.'1)&')1)
'
1(&.)151'
,+

1-.'151',*,
-
51.(+&111
&,1,.-&+)))+1
5
1&1.&1&**
(,'.+)+'',1(+
*
+-.(*,(1&
) 11.(*,(1&)
+
&,.&&5(5-
)*(.++-,-51-1
)
&1.1+*1',
'').)&')*(**,
,
*+.1*,,-&
'5

&.1*,,-&'-)
1(
,(.)5*+5(
, 1(.)5*+5(,
11
5+.,+11)1
+-1+.(&))1)&*
1&
-5.'&&))5
,1&-.*++11-(,
1'
51.(+&111
&,).,&+)))+()
1-
*1.-&(+1*
,+'.5+,&)'(&,
15
1-'.(5,+1
+'*.,-(&)&*+-
1*
11(.)*-(5
5&

1(.)*-(55&1
1+
)'.,5+*)(
-5

).,5+*)(--,
1)
*,.-*,*'&
5 &,.-*,*'&5
1,
,+.(*5,1-
'1

&&.(*5,1-'1
&(
1**.(5**1
))''.,-'')11+
:6plicitarea datelor din tabelele de mai sus:
SUMMARY OUTPUT
Regression Statistics
Multiple R
3aportul de corelaţie
>3/
0.91818458
8
( )
( )
( )
( )




·
·
·
·


− ·


·
n
1 i
&
i
n
1 i
&
i i
n
1 i
&
i
n
1 i
&
i
7 7
78 7
1
7 7
7 78
6 , 37
R Square
Boeficientul >gradul / de
determinaţie
0.84306293
7
( )
( )


·
·


·


− ·


·
n
1 i
&
i
n
1 i
&
i
&
7
&
e
&
7
&
6 ? 7
&
7 7
7 78
1 3
Adjusted R Square
Jaloarea ajustată a
coeficientului de
determinaţie
0.83434421
2
1 n ?
1 < n ?
1 3
&
7
&
u
&
− ∆
− − ∆
− ·
Standard Error
Fbaterea medie
pătratică a erorilor în
eşantion
16.7336310
8
( )
& n
78 7
& n
s
n
1 i
&
i i
&
u
u


·


·

·
Observations
Iumărul observaţiilor
>n/
&(
9abel &.
ANOVA
Sursa
variaţiei
df
>grade de
libertate/
SS #varian$a%
#su&a p'tratelor%
MS (SS)df
#&edia p'tratelor%
>dispersia
corectată/
F
Significance
F
Regression
varia!ia
datorat"
regresiei#
1 ></
..31 ( ) ∑ − · ∆
·
n
i
i *
- -
1
&
&
8 1
27076.17814
/
s
*
*
&
&

·
1
27076.18
9estul
@196.69566
@1
&
*
s ?
&
u
s
1.15588E-
08K (.(5
>resping ;(
= model
valid/
Residual
varia!ia
re$idual"#
1) >n<1/
..:1 ( ) ∑ − · ∆
·
n
i
i i u
- -
1
& &
8
1 5040.259363
1
&
&
− −

·
/ n
s
u
u
1
280.0144
Total
varia!ia
total"#
1, >n1/
..91 ( ) ∑ − · ∆
·
n
1 i
&
i
&
7
7 7 1
32116.4375
SST=SSR + SSE
1
&
&


·
n
s
-
-

9abel '.
Coefficients
(Coeficienţi)
Standard Error
(Abaterea medie
patratică)
t Stat P-value Loer !"# $pper !"#
Limita inf% a
intervalului de
&ncredere
Limita sup%
a
intervalului
de &ncredere
%nter&ept
ter'enul
liber#
a+(
-6.42014248
(
a
s
1
9.353374888
(
a
t
1
-0.6864
0.501209L(,(5 -26.07086914 13.23058
Venitul
a, (
2.299690151
1
a
s
1
0.233865325
1 a
t
1
9.833395
1.16E-08K(,(5 1.808356955 2.791023
9abel -.
RES!"#$ O"%&"%
Observation
Predicted
i
-8
taxe plătite
Residuals
i i
- - 8 −
1 338.5796 -14.9986
2 371.2542 -27.5722
3 376.1748 -0.9108
4 332.8525 18.3895
5 311.8281 16.5889
6 310.6962 7.3728
7 325.9235 5.0355
8 287.8659 -20.6299
9 310.9763 9.9067
10 382.3073 27.2277
11 336.2188 -19.9568
12 369.2938 -17.4878
13 338.7504 -5.0954
14 367.2528 5.4262
15 346.0917 16.7043
Anterpretare re$ultate din tabelul SUMMARY OUTPUT :
 R( +,61-1-78-- arată că între impo$itele plătite şi venitul anual, e6istă o legătură
puternică.
 R
0
1(.)-'(*&,'+ arată că )-2 din variaţia impo$itelor este e6plicată de venit
 Abaterea 'edie patrati&a a erorilor u
s
( 1/,2../.1+-. În ca$ul în care acest
indicator este $ero înseamnă că toate punctele sunt pe dreapta de regresie.
Anterpretare re$ultate din tabelul ANOVA 3
În acest tabel este calculat testul @ pentru validarea modelului de regresie. Întruc!t
@1,*.*,5**, iar Significance F #pragul de se&nifica$ie% este 1.155)):() >valoare mai
mica de (.(5/ atunci modelul de regresie construit este valid şi poate fi utili$at pentru
anali$a dependenţei dintre cele două variabile.
Anterpretarea re$ultatelor din tabelul -:
 %nter&ept este termenul liber, deci coeficientul a
+
este *.-&(1-&-). 9ermenul
liber este punctul în care variabila e6plicativă >factorială/ este (. "eci impo$itele
care ar trebui plătite, dacă nu sar obţine nici un venit. "eoarece
(
a
t
1 (.*)*- iar
pragul de semnificaţie P-value este (.5(1&(,L(,(5 înseamnă că acest coeficient
este nesemnificativ. "e altfel faptul că limita inferioară a intervalului de încredere
>&*.(+()*,1- ≤ ≤
α
(
1'.&'(5)/ pentru acest parametru este negativă, iar limita
superioară este po$itivă arată că parametrul din colectivitatea generală este
apro6imativ $ero.
Boeficientul a
'
este &.&,,*,(151, ceea ce însemnă că la creşterea venitului cu o mie euro,
ta6ele vor creşte cu &,&,,*,(151 euro. "eoarece
1 a
t
1 ,.)''',5 iar pragul de
semnificaţie P-value este 1.1*:()K(,(5 înseamnă că acest coeficient este semnificativ.
Antervalul de încredere pentru acest parametru este 1.)()'5*,55 ≤ ≤
1
α &.+,1(&'

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->