Documente Academic
Documente Profesional
Documente Cultură
Uno de los supuestos básicos del modelo de regresión lineal clásico es el que los errores
tengan distribución normal con media cero y varianza σ 2 , esto es:
Y i=β 1 + β 2 X i +ui
Y i=Xβ +u
Donde:
ui N (0, σ 2) ; ∀ i
Con el cumplimiento del supuesto de normalidad se tiene la justificación teórica para la
utilización de pruebas estadísticas.
Dado que los estimadores de MCO son combinaciones lineales de Y i , entonces los
estimadores también seguirían esta distribución
( (
β1 N β1 , σ2
1 X́ 2
+
n Σ x2 ))
( ( ))
β2 N β2 ,
σ2
Σ x2
√
2
σ
2
Σx
Definimos un nivel de confianza de ( 1−α ) ×100 :
β^ 2−β 2
Pr −z
( 1−
α<
2
√ σ
Σx
2
2
<z
1−
α
2
)
=( 1−α )
donde : z
1−
α
2
es el percentil 1−
α
2
Área =
Área= Área=
Entonces:
( √ √ )
2 2
σ σ
Pr ^β 2−z α 2
< β2 < ^β 2 + z α =( 1−α )
1−
2 Σx 1−
2 Σx 2
√
2
^β ± Z σ Z 0.975=1.96
2 0.975 2
Σx
Pero σ 2 no es un valor conocido por lo que usaremos en reemplazo el valor estimado s
2
Comprobación:
2 ( n−2 ) s 2 2
x= 2
x ( n−2)
σ
[
p x2 α
2
, ( n−2)
≤ x 2 ≤ x 21−α
2
, ( n−2) ]= (1−α )
[ ( n−2 ) s 2
]
2
2 ( n−2 ) s
p ≤ σ ≤ =( 1−α )
x 2 1−α x2 α
, ( n−2 ) , ( n−2 )
2 2
Área =
Área= Área=
Comprobación:
√
2
σ
Σx
2
β^ 2− β2
= t (n−2 )
√ √
2
( n−2 ) s 2 s
σ
2
Σx 2
n−2
Entonces:
^β2 −β2
Pr −t
( 1−
α ( n−2 ) <
2
√ s2
Σx2
<t
1−
α
2
)
( n−2 ) = (1−α )
Operando:
( √ √ )
2 2
s s
Pr ^β 2−t α ( n−2 ) 2
< β 2< β^ 2 +t α ( n−2 ) 2
=( 1−α )
1−
2 Σx 1−
2 Σx
α
donde t (n−2) es el percentil 1−
1−
α
2
2
β 2 ∈ β^ 2 ±t
1−
α ( n−2 )
2
s2
Σx √2
β 1 ∈ β^ 1 ±t
1−
α ( n−2 ) s
2 √(
2 1 X́ 2
+
n Σ x2 )
Prueba de hipótesis
Es un procedimiento a través de pruebas de hipótesis. Involucran la recolección de una
muestra y el uso de resultados muestrales para proporcionar evidencias y emitir conclusiones.
Hipótesis alternativa H 0 : β2 ≠ a
Al ser β 2 una variable aleatoria prácticamente nunca será igual al valor, salvo cuestión de
azar.
Intervalo aleatorio
• Rechazo H 0
• No rechazo H 0
Estadístico t
T-student
cuando H 0 es
cierta
β 2=a
Región de rechazo Región de rechazo
•
Región de
Condición aceptación
de
rechazo de H0
|√ |
^
β 2−a
>t α ( n−2 )
^
Var ( β^2 ) 1− 2
• Condición de No rechazo de H0
|√ |
^
β 2−a
<t α ( n−2 )
^
Var ( β^2 ) 1− 2
Y i=β 1 + β 2 X i +ui
H 0 : β2=0
H 1: β2≠ 0
|√ |
^
β2
|t|= >t α ( n−2 )
^
Var ( ^
β 2) 1−
2
|√ |
^
β2
|t|= <t α ( n−2 )
^
Var ( ^
β 2) 1−
2
EL P-VALUE
Probabilidad o p>t
Indica el menor nivel de significancia con el cual podemos rechazar la H0
p−value=2 × 1−F
[ (| | )] β^
√Var
^ ( ^β )
, n−k
p−value=2 × F −
(| √V^
β^
ar ( ^β )
, n−k
| )
Donde:
F
(| √V^
β^
| )
ar ( ^β )
, n−k =Función de distribución acumulada de t-student
k =2 en el modelo bivariado
Función de densidad de la variable aleatoria -value
Área= Área=
EJERCICIO 1:
Σ x i y i=54.53 2
Σ x i =30.39
2
Σ y i =104.54
Cálculos previos:
X́ =
∑ X i = 44 =4.89 Ý = ∑ Y i = 76.3 =8.48
n 9 n 9
Yi
∑ (¿− β 2 X i) = Y i −2 β^ 2 ∑ Y i X i+ ^β22 ∑ X 2i
^ 2 2
30.39 n−2
S2=
∑ i =¿
e 2
n−2
^β −t
1
1−
α (n−2)
2 √(
S
−2.4609 ≤ β 1 ≤ 1.9209=¿ β 1 ∈ ⌈ , ⌉
2 1
+
X́ 2
n ∑ X 2i
≤ β 1 ≤ ^β 1+ t α
1−
2
) ( n−2)
√( S
2 1
+
X́ 2
n ∑ X 2i )
ii) Intervalo de confianza para β 2 :
√( √(
2 2
^β 2−t
1−
α
2
(n−2)
S
∑ X 2i ) ≤ β 2 ≤ ^β 2+ t
1−
α
2
( n−2 )
S
∑ X 2i )
1.3706 ≤ β 1 ≤ 2.2094=¿ β 2 ∈ ⌈ , ⌉
iii) Intervalo de confianza para σ 2
(n−2) S 2 2 ( n−2)S2
≤σ ≤
X2 α X2α
(n−2) (n−2)
1−
2 2
¿ X2 α
( n−2) = X 20.975 =16.01 (7 )
1−
2
¿ X2α ( n−2 ) =X 20.025 =1.69 ( 7)
2
2
¿>0.4180 ≤ σ ≤3.9598
|√ | |
^β
√ ∑ | |√ |
2 1.79 1.79
|t|= = = =|10.092|=10.092
var ( ^β2 ) S 2
0.956
X 2i 30.39
Decisión:
Como
|t|=10.092>2.3646=t α (n −2)
1−
2
¿> Se rechaza la hipotesis nula con5 de significancia
EJERCICIO 2:
i) Contraste de la hipótesis : β2
Hipótesis
H 0 : β2=0
H 1: β2≠ 0
Estadístico t:
|√ | |
^β
√ ∑ | |√ |
2 1. .0111 1.0111
|t|= = = =|14.509|=14.509
var ( ^β2 ) 2
S 0.5735
Xi
2 118.10
Decisión:
Como
|t|=14.509>2.228=t 0.95 (10 )
t α (n −2)
1−
2
Ejercicio 3:
La tabla muestra información relacionada con la producción y el costo total de
producción de un bien en el corto plazo
Producción 1 2 3 4 5 6 7 8 9 10
Costo Total 193 226 240 244 257 260 274 297 350 420
Se desea estimar la función de costos Costos i= ^β 1+ β^ 2 Produccióni+u i
^
β 1=166.4667
β 2=19.9333
Donde:
Numero de observaciones
n 10
Promedios (Medias):
X́ =
∑ X i Ý = ∑ Y i
n n
Media de x:
X́ 5.50
Media de y:
Ý 276.10
^β =Ý − β^ X́ ^β = ∑ xy
1 2 2 2
x
Función de Regresión muestral (FRM):
Y^ = β^ 1 + ^β 2 X
Residuos:
e=Y − Y^ = y− β^ 2 x
Estimador S 2 ( Estimacion de σ 2 ) :
S=2∑ e2
n−2
Varianza estimadas de β 1 y β2 :
X́ 2 S2
( 1
var ( ^β1 ) =S 2 +
n ∑ X 2i ) var ( ^β2 ) =
∑ X 2i
Suma de cuadrados totales (SCT):
Y −Ý
∑ (¿)2
SCT =∑ Y 2=¿
SCE= ^β 2 ∑ X
2
Suma de cuadrados de los Residuos (SCR):
y−¿
e =∑ (¿ ^β 2 x)
2 2
∑¿
SCR =¿
R cuadrado (Medida de bondad de ajuste)
2 SCR SCE
R =1− =
SCT SCT
2
0< R <1
Hipótesis Hipótesis
H 0 : β1=0 H 0 : β 1=0
H 1 : β 1 ≠ 0 H 1 : β1 ≠ 0
Valor absoluto
del estadístico t Estadístico t
|t|=8.7515|t|=6.5023
Decisión Decisión
2
Estandar S
S=2∑ e2
=775.3167
n−2
Varianza estimada
X́ 2 S2
^
var ( β1 ) =S
(
2 1
+
n ∑ X 2i ) var ( ^β2 ) =
∑ X 2i
var ( ^β1 ) =361.8144 var ( ^β2 ) =9.3978
SCE= ^β 2 ∑ X
2
SCE =32780.3667
Suma de cuadrados de residuos ( SCR )
SCR =6202.5333
SCR=∑ e
2
Σ X i Y i=1973.67 n=20
Σ X 2i =2165.18 ΣY 2i =1813.53
X́ =9.56 Ý =8.765
SOLUCION:
Y =Demanda de alimento
X =Ingreso disponible
Y i=β 1 + β 2 X i + μi
a)
∑ X i =9.56 →
X́ =
n
∑ X i=191.20
∑ Y i =8.765 →
Ý =
n
∑ Y i=175.3
x i=X i− X́
y i=Y i−Ý
X
(¿ ¿ i+ X́ )(Y i + Ý )
¿ ∑ Y i X i =∑ ¿
Xi Y i
(¿ + X i Ý +Y i X́ + X́ Ý )
1973.67=∑ ¿
X i +¿ X́ ∑ Y i + ∑ X́ Ý
∑ X i Y i+ Ý ∑ ¿
1973.67=∑ X i Y i + ∑ X́ Ý
n x X́ x Ý =1675.868
¿> ∑ X i Y i=297.802
X i− X́
∑ (¿)2
¿ ∑ X 2i =¿
X 2i −2 X i X́ i
(¿ + X́ 2)
¿∑¿
2 2
¿ ∑ X i −2 X́ ∑ X́ i+ ∑ X́
9.56
¿
¿
¿ 2165.18−2 ( 9.56 )( 191.2 ) +20 ¿
¿ 337.308
^β = ∑ Y i X i = 297.802 =0.883
2
X 2i 337.308
^β 1=Ý + ^β 2 X́ =8.765−( 0.883 ) ( 9.56 )=0.324 ,
Interpretacion :
β 1 ( Intercepto )
β 2 ( Pendiente )
Yi
∑ (¿− ^β2 X i ) =∑ (Y 2i −2 β^ 2 X− X 2 β^ 22 )
2
¿ SCR=¿
∑ Y 2i −2 ^β 2 ∑ X− β^ 22 ∑ X 2i
Yi
Y 2i
2
(¿−2Y i Ý + Ý )
(¿−Ý 2)=∑ ¿
¿ ∑ Y 2i =∑ ¿
2 2
¿ ∑ Y i −2 Ý ∑ Y i+ ∑ Ý
2
¿ 1813.53−2 ( 8.765 ) ( 175.3 ) +20 ( 8.765 )
¿ 277.0255
2
¿> SCR=277.0255−( 0.883 ) ( 337.308 )=14.0302
¿> SCT=∑ Y 2i
Estimar la varianza de μ
2 2
Var ( μ )=σ =S (muestral)
S 2=
∑ e 2i = SCR = 14.0302 =0.7795
n−2 n−2 18
^β 1−t
¿t
1−
1−
α
2
α (n−2)
(n−2)
√(
S2
1
+
X́ 2
n ∑ X 2i
=t 0.975 ( 18 )=2.101
)
≤ β 1 ≤ ^β 1+ t α
1−
2
( n−2)
√(
S2
1
+
X́ 2
n ∑ X 2i )
2
^β 2−t
1−
α
2 ∑
S2
X
0.7820 ≤ β 2 ≤0.9840
2
i √(
≤ β 2 ≤ ^β 2+ t α
(n−2)
1−
2
) ( n−2 )
√( S2
∑ X 2i )
2
Intervalos de confianza para σ
2 2
(n−2) S 2 ( n−2)S
2
≤σ ≤
X α X2α
(n−2) (n−2)
1−
2 2
¿ X2 α
( n−2) = X 20.975 =31.53
(18)
1−
2
¿ X2α ( n−2 ) =X 20.025 =8.23
( 18)
Contraste de la hipótesis: β2
Hipótesis
H 0 : β2=0
H 1: β2≠ 0
Estadístico t:
|√ | |
^β2
| |√ |
0.883 0.883
|t|= = = =|18.3681|=18.3681
var ( ^β2 )
√ S2
∑ X 2i
0.7795
337.308
Decisión:
Como
|t|=18.3681>2.101=t α (n−2)
1−
2
¿> Se rechaza la hipotesis nula con 95 de significancia
X 3 5 6 4 2 7 8 9 10
Y 2 4 6 3 4 8 10 14 12
SOLUCION:
a) Estimador S 2
S 2=
∑ e 2 =2.9619
n−2
Varianza estimada
Y −Ý
∑ (¿)2
SCT =∑ Y 2=¿
SCE= ^β 2 ∑ X 2
SCE =123.2667
Suma de cuadrados de los residuos ( SCR )
SCR =20.7333
R−cuadrado
R2=0.8560
t α =2.3646
1−
2
X α (n−2 )
=16.0128
1−
2
Xα (n−2) =1.6899
2
Intervalos de confianza β1
LI =−5.0318
LS=1.8318
Intervalos de confianza β2
LI =0.980
LS=1.9587
2
Intervalos de confianza σ
LI =1.2948
LS=12.2692
c) Prueba de Hipótesis
Hipótesis Hipótesis
H 0 : β1=0 H 0 : β 1=0
H 1 : β 1 ≠ 0 H 1 : β1 ≠ 0
Valor absoluto
del estadístico t Estadístico t
|t|=1.1025|t|=6.4512
Decisión Decisión