Documente Academic
Documente Profesional
Documente Cultură
Obiective
Calcularea i interpretarea corelaiei simple dintre dou variabile Testarea coeficientului de corelaie Elaborarea i interpretarea modelului de regresie liniar unifactorial pentru un set de date Testarea ipotezelor modelului de regresie liniar Testarea validitii modelului de regresie
Obiective
(continuare)
Testarea parametrilor modelului, calcularea i interpretarea intervalelor de ncredere pentru parametrii modelului Elaborarea de prognoze pe baza modelului
x y y
x y y
x y
Coeficientul de corelaie
Coeficientul de corelaie la nivelul populaiei (rho) msoar intensitatea legturii liniare dintre dou variabile Coeficientul de corelaie la nivelul eantionului r este un estimator al lui i este utilizat pentru msurarea intensitii legturii liniare dintre dou variabile pe baza datelor din eantion
Aprecieri referitoare la i r
Nu au unitate de msur Valori ntre -1 i 1 Apropierea de -1, implic o legtur invers i puternic ntre cele dou variabile Apropierea de 1, implic o legtur direct i puternic ntre cele dou variabile Apropierea de 0, implic o legtur liniar foarte slab
r = -1
y
r = -0.6
y
r=0
r = +0.3
r = +1
( x x )( y y ) [ ( x x ) ][ ( y y ) ]
2 2
r
unde:
[n( x 2 ) ( x )2 ][n( y 2 ) ( y )2 ]
n xy x y
r = coeficientul de corelaie la nivelul eantionului n = volumul eantionului x = valoarea variabilei independente (cauz) y = valoarea variabilei dependente (efect)
Exemplu de calcul
nlimea Diametrul copacului trunchiului y 35 49 27 33 60 21 45 51 =321 x 8 9 7 6 13 7 11 12 =73 xy 280 441 189 198 780 147 495 612 y2 1225 2401 729 1089 3600 441 2025 2601 x2 64 81 49 36 169 49 121 144
Exemplu de calcul
nlimea copacului,
(continuare
y 70
60
n xy x y
50
40
30
0.886
r = 0.886 legtur direct, puternic ntre x i y
20
10
0 0 2 4 6 8 10 12 14
Diametrul trunchiului, x
Excel Output
Excel Correlation Output Tools / data analysis / correlation
Inaltimea Inaltimea Diametrul 1 0.886231 Diametrul 1
Testul statistic:
r 1 r n2
2
(cu n 2 grade de libertate)
Exemplu
Exist o legtur semnificativ ntre nlimea copacilor i diamterul trunchiurilor pentru un prag de semnificaie de 0.05?
H0: = 0 H1: 0
=0.05 , df = 8 - 2 = 6
d.f. = 8-2 = 6
/2=.025 /2=.025
Resping H0
-t/2 -2.4469
Nu resping H0
t/2 H0 2.4469
Resping
4.68
Regresia unifactorial
Regresia este utilizat pentru: Prognozarea valorii variabilei dependente pe baza a cel puin unei valori a variabilei independente Explicitarea impactului modificrii variabilei independente asupra variabilei dependente Variabila dependent: variabila care se dorete a fi analizat Variabila independent:Variabila utilizat pentru explicitarea variabilei dependente
Relaia dintre x i y este descris printr- o legtur liniar Modificrile lui y se presupune c sunt determinate doar de modificrile lui x
Nu exist legtur
y 0 1x
Componenta liniar Componenta rezidual
Homoscedasticitate:variaia erorilor et (i implicit a variabilei dependente yt) este constant pentru toate observaiile (= egala mprtiere a erorilor):
y 0 1x
i
Eroarea
Panta = 1
xi
i b0 b1x y
Erorile au media egal cu zero
(y (b
b1x))
b1
x y xy n 2 ( x ) 2 x n
b0 y b1 x
Un eantion de 10 case au fost selectate Variabila dependent(y) = preul casei n mii dolari Variabila independent(x) = suprafaa
324
319 255
2450
1425 1700
Excel Output
Regression Statistics Multiple R 0.76211
R Square
Adjusted R Square Standard Error Observations
0.58082
0.52842 41.33032 10
Ecuaia de regresie:
house price 98.24833 0.10977(squarefeet)
ANOVA df Regression Residual Total 1 8 9 SS 18934.9348 13665.5652 32600.5000 MS 18934.9348 1708.1957 F 11.0848 Significance F 0.01039
Reprezentarea grafic
Scatter plot i dreapta de regresie
450
400 350 300 250 200 150 100 50 0 0 500 1000 1500 2000 2500 3000 Square Feet
Panta = 0.10977
Interceptia = 98.248
Interpretarea Interceptiei, b0
house price 98.24833 0.10977(squarefeet)