Sunteți pe pagina 1din 22

Modelul liniar unifactorial în colectivitatea generală:

y i    X i   i , i = 1...n, unde:
 Y reprezintă variabila dependentă, endogenă, efect sau explicată;
 X este variabila independentă, exogenă, cauzală sau explicativă;
 parametrul  se numeşte termen liber (intercept) pentru colectiv
generală;
 parametrul  reprezintă panta dreptei de regresie (slope) p
colectivitatea generală;
 i se numeşte variabilă reziduală (residual) sau eroare;
 n reprezintă numărul de observaţii.

Ecuaţia de ajustare yˆ i  aˆ  bˆxi

 Yˆi valoarea estimată a lui Y pentru observaţia i;

 X i este valoarea lui X pentru observaţia i;

 estimatorul a se numeşte termen liber (intercept) pentru eşantionul extr


colectivitatea generală şi, din punct de vedere matematic, reprezintă pu
în care dreapta de regresie intersectează axa OY. Nu are semnif
economică;

 estimatorul b se numeşte coeficient de regresie şi, din punct de v


matematic, reprezintă panta dreptei de regresie (slope) arătând cu câte u
se modifică variabila Y, la o modificare cu o unitate a variabilei X;
 estimatorul b se numeşte coeficient de regresie şi, din punct de v
matematic, reprezintă panta dreptei de regresie (slope) arătând cu câte u
se modifică variabila Y, la o modificare cu o unitate a variabilei X;
tea generală: Estimarea parametrilor modelului liniar unifactorial de regresie:

 ˆ
n n

naˆ  b  xi   y i
:  i 1 i 1
 n n n
aˆ x  bˆ x 2  x y
   
u explicată;
i i i i
i 1 i 1 i 1
xplicativă;
) pentru colectivitatea
aˆ  y  b x



n y i
gresie (slope) pentru
 ˆ  xi x y
i i n   xi y i   xi   y i
b  
 n x i
n   x i2  ( xi ) 2
e; 
  xi x 2
i

Estimarea erorii (variabilei reziduale)

ei  ( yi  yˆ i )

entru eşantionul extras din


ematic, reprezintă punctul
OY. Nu are semnificaţie

şi, din punct de vedere


pe) arătând cu câte unităţi
a variabilei X;
şi, din punct de vedere
pe) arătând cu câte unităţi
a variabilei X;
orial de regresie: Analiza dispersională ANOVA și coeficient

 Aplicarea MCMMP pentru determinarea ecuaţi


calcularea a trei tipuri de dispersii:

1. Variaţia totală calculată ca suma pătratelor diferen


variabilei Y şi media variabilei Y (SST)
n
SST   Yi  Y 
2

i 1

2. Variaţia datorată regresiei (explicată de model) c


abaterilor dintre fiecare valoare a lui Y estimat pe baz
y i   xi   y i variabilei Y (SSR).
x 2
i
 ( xi ) 2
 
n 2
SSR   Yˆi  Y
i 1

3. Varianța reziduală (neexplicată de model) calcula


diferenţelor între fiecare valoare a lui Y şi lui Y estim
pătratelor erorilor) (SSE).

SSE   (Yi  Yˆi ) 2   ei2

 Coeficientul de determinare R2

2 SSR (Yˆi  Y ) 2
R  
SST (Yi  Y ) 2
NOVA și coeficientul de determinare R2

u determinarea ecuaţiei de ajustare se bazează pe  Ipoteze:


ispersii:
H0: β=0, variabila independentă nu
uma pătratelor diferenţelor dintre fiecare valoare a
Y (SST) dependente. R2 nu este semnificativ

H1: β≠0, variabila independentă ar


dependente. R2 este semnificativ din

explicată de model) calculată ca suma pătratelor  Testul calculat


lui Y estimat pe baza modelului şi media
(Yˆi  Y ) 2  (Yi  Yˆi )
2

Fcalculat  : 
k 1 nk

unde k reprezintă numărul de param


simple), iar n numărul de observaţii.

ată de model) calculată ca suma pătratelor  Regiunea de respingere


a lui Y şi lui Y estimat pe baza modelului (suma

Dacă Fcalculat  F ,k 1,n


ipoteza alternativă potrivit căreia R2
e R2

)2
)2
Testul F Testarea parametr

teze: Testarea parametrului  :

ila independentă nu are o influenţă semnificativă asupra variabilei 1. Ipoteze:


nu este semnificativ din punct de vedere statistic.
H0:   0 (nu este semnific

bila independentă are o influenţă semnificativă asupra variabilei


H1:   0 (este semnificati
este semnificativ din punct de vedere statistic.
2. Testul calculat:
tul calculat
a - 0 â - 0
Y ) 2  (Yi  Yˆi ) t calcultat  
2
SSR SSE MSR
:  :  a s aˆ
1 nk k  1 n  k MSE

tă numărul de parametrii ai modelului (2 în cazul regresiei liniare


3. Regiunea de respingere
mărul de observaţii.

giunea de respingere
Dacă
tcalc  t  / 2;n
ulat  F ,k 1,n  k se respinge ipoteza nulă şi se acceptă
alternativă potrivit căreia p
statistic.
2
vă potrivit căreia R este semnificativ din punct de vedere statistic.
Interval de încredere pentru

aˆ  t / 2,n  k  saˆ 
Testarea parametrilor unui model de regresie folosind testul t Testarea parametr
a parametrului  :
1. Ipoteze:
ze:
H0:   0 (nu este
 0 (nu este semnificativ din punct de vedere statistic)
H1:   0 (este se
 0 (este semnificativ din punct de vedere statistic)
2. Testul calculat:
ul calculat: b-0
t calcultat 
b
a - 0 â - 0 1 X2   (Y  Yˆ ) 2

t   2 
s â  s  


 n  (X  X )2 
seˆ  i

nk
i

a s aˆ  i 
3. Regiunea de resp

unea de respingere
Dacă
tcalc 
alternativă potrivit
tcalc  t  / 2;n -k se respinge ipoteza nulă, se acceptă ipoteza statistic.
ivă potrivit căreia parametrul alfa este semnificativ din punct de vedere
Interval de încrede
.

l de încredere pentru α: bˆ  t / 2,n  k 


 / 2,n  k  saˆ    aˆ  t / 2,n  k  saˆ
Testarea parametrului  :

1. Ipoteze:

H0:   0 (nu este semnificativ din punct de vedere statistic)

H1:   0 (este semnificativ din punct de vedere statistic)

2. Testul calculat:

b - 0 b̂ - 0 s b̂ 
s eˆ2
seˆ 
 (Y  Yˆ )
i i
2

t calcultat    ( X i  X )2 nk
b sbˆ

3. Regiunea de respingere:

Dacă
tcalc  t  / 2;n -k se respinge ipoteza nulă, se acceptă ipoteza
alternativă potrivit căreia parametrul alfa este semnificativ din punct de vedere
statistic.

Interval de încredere pentru β:

bˆ  t / 2,n  k  sbˆ    bˆ  t / 2,n  k  sbˆ


Intervalul de predicţie pentru variabila dependentă Y corespunzătoare unei
anumite valori a variabilei X

Yˆn1  t / 2,nk  se  hi

Yˆn1  t / 2,nk  se  hi  Yˆn*1  Yˆn1  t / 2,nk  s

Unde

1 ( X n1  X ) 2
hi  1  
n SSX
punzătoare unei

 t / 2,nk  se  hi
Înălțime Înălțime
Nr.crt. copil (yi) tată (xi) Notăm cu X variabila independentă (înălțimea tatălui)
1 164 170 Notăm cu Y variabila dependentă (înălțimea copilului)
2 167 180
3 168 170
4 182 185
5 173 174
6 159 170
7 162 170
8 157 174
9 166 180
10 175 186
11 163 170
12 159 167
13 170 170
14 165 180
15 171 175
16 165 169
17 162 170
18 169 184
19 173 190
20 180 182
entă (înălțimea tatălui)
ntă (înălțimea copilului)
Înălțime copil xi*yi xi^2 Yestimat=95,91+0,44*xi
Nr.crt. (yi) Înălțime tată (xi)
1 164 170 27880 28900 170.71
2 167 180 30060 32400 175.11
3 168 170 28560 28900 170.71
4 182 185 33670 34225 177.31
5 173 174 30102 30276 172.47
6 159 170 27030 28900 170.71
7 162 170 27540 28900 170.71
8 157 174 27318 30276 172.47
9 166 180 29880 32400 175.11
10 175 186 32550 34596 177.75
11 163 170 27710 28900 170.71
12 159 167 26553 27889 169.39
13 170 170 28900 28900 170.71
14 165 180 29700 32400 175.11
15 171 175 29925 30625 172.91
16 165 169 27885 28561 170.27
17 162 170 27540 28900 170.71
18 169 184 31096 33856 176.87
19 173 190 32870 36100 179.51
20 180 182 32760 33124 175.99
Total 3350 3516 589529 619028 3465.24

ymediu 167.50
xmediu 175.80 Estimarea punctuală a parametrilor
b^
a^
SSR 841.20
SSE 1181.08
SST 867.00
dfR k-1 k=nr de parametrii ai modelului
dfE n-k n=nr de perechiAnaliza ANOVA şi testul F
dfT n-1
MSR
MSE
Fcalculat Fcritic
Significance F(P-value)
R2
se e
sa
sb Testarea semnificatiei parametrilor
tcalculat(α) P(value)
tcalculat(β) P(value)
tcritic
Lower(95%) α Upper (95%) α
Intervale de incredere pentru parametri
Lower(95%) β Upper (95%) β

xprev 170
yprev Previziunea pe baza de interval de incredere
hi
Lower Upper
e=Yreal-Yestimat
e^2 (Yestimat-Ymediu)^2 (Yi-Ymediu)^2 (Xi-Xmediu)^2
(eroare estimata)

-6.71 45.02 10.30 12.25 33.64


-8.11 65.77 57.91 0.25 17.64
-2.71 7.34 10.30 0.25 33.64
4.69 22.00 96.24 210.25 84.64
0.53 0.28 24.70 30.25 3.24
-11.71 137.12 10.30 72.25 33.64
-8.71 75.86 10.30 30.25 33.64
-15.47 239.32 24.70 110.25 3.24
-9.11 82.99 57.91 2.25 17.64
-2.75 7.56 105.06 56.25 104.04
-7.71 59.44 10.30 20.25 33.64
-10.39 107.95 3.57 72.25 77.44
-0.71 0.50 10.30 6.25 33.64
-10.11 102.21 57.91 6.25 17.64
-1.91 3.65 29.27 12.25 0.64
-5.27 27.77 7.67 6.25 46.24
-8.71 75.86 10.30 30.25 33.64
-7.87 61.94 87.80 2.25 67.24
-6.51 42.38 144.24 30.25 201.64
4.01 16.08 72.08 156.25 38.44
-115.24 1181.08 841.20 867.00 915.20
SSE SSR SST SSX
sum of squares of ersum of squares of regressum of squares total
val de incredere
Notăm cu X variabila independentă (înălțimea tatălui)
Notăm cu Y variabila dependentă (înălțimea copilului)

Y=f(X)+e

Y=52,44+0,65*Xi a=52,44 termen liber (nu are semnificație economică)


b=0,65 coeficient de regresie (la creșterea cu 1 cm a înălțimii t
Yp (Xp=170)
yˆ i  aˆ  bˆxi
mnificație economică)
a creșterea cu 1 cm a înălțimii tatălui, înălțimea copilului crește cu 0,65 cm)

aˆ  y  b x



n y i

 ˆ  xi x y i i n   xi y i   xi   y i
b  
n   x i2  ( xi ) 2
 n x i

  xi x 2
i
Înălțime Înălțime xi*yi xi^2 yi^2 Testarea
Nr.crt. copil (yi) tată (xi)
1 164 170
2 167 180
3 168 170 cov( x, y )
4 182 185
r
Sx  Sy
5 173 174
6 159 170
7 162 170
8 157 174 1. Ipo
9 166 180
10 175 186 H0: ρ=0
11 163 170
12 159 167
H1: ρ≠0
13 170 170
14 165 180
15 171 175 2. Te
16 165 169
17 162 170
18
tcalc 
169 184
19 173 190
20 180 182
Total 3350 3516 3. Re
r
Dacă ca t
tcalculat
tcritic potrivit c
Testarea semnificaţiei coeficientului de corelaţie liniară utilizând testul t

r
cov( x, y )

 ( xi  x )( yi  y ) 
n x i y i   xi  y i
[ ( xi  x ) 2 ][  ( y i  y ) ] [n xi2  ( xi ) 2 ][ n y i2  ( y i ) 2 ]
2
Sx  Sy

1. Ipoteze:
H0: ρ=0 (nu este semnificativ din punct de vedere statistic)
H1: ρ≠0 (este semnificativ din punct de vedere statistic)

2. Testul calculat:
r 0 r n2
tcalc  
1 r2 1 r2
n2

3. Regiunea de respingere

Dacă calc t t
 / 2 , n  k se respinge ipoteza nulă, se acceptă ipoteza alternativă
potrivit căreia r este semnificativ din punct de vedere statistic.
tul t

alternativă

S-ar putea să vă placă și