Sunteți pe pagina 1din 7

U7: Regresión Lineal

Con el grupo discutir el ejercicio 13.52 de la página 498. (Utilizar la herramienta de Excel y los
datos dados en el CD del libro)

Ejercicio 13.52

Se selecciona una muestra de 30 casas unifamiliares que se vendieron recientemente en una


pequeña ciudad. Desarrolle un modelo para pronosticar el precio de venta (miles de dólares)
utilizando el valor estimado (en miles de dólares) y el periodo (en meses desde la nueva
valoración). En esta ciudad se actualizó el valor de las casas en un año antes del estudio. Los
resultados se encuentran en el archivo House1

a. Determine la ecuación de regresión múltiple.

Para determinar la ecuación de regresión múltiple para estas variables utilizamos un


programa estadístico onnline (disponible en la direción que se muestra en la siguiente
imagen) donde designamos como variable independiente el precio de ventas mientas
como variables dependientes el valor estimado y el periodo:
 PV: Precio de venta
 V: Valor estimado
 P: Periodo

Encontramos que la ecuación de regresión múltiple es:

𝑃𝑉 = 1.7506𝑉 + 0.367952𝑃 − 44.9882

b. Interprete el significado de las pendientes en esta ecuación.

Por cada 1.000 dólares que el valor estimado aumenta, el precio de venta aumenta en
1.7506 miles de dólares, es decir en $1.750,6 dólares

Por cada mes que pasa desde la nueva valoración, el precio de venta aumenta en 0.367952
miles de dólares, es decir en $367,952 dólares.

c. Elabore un pronóstico del precio de venta de una casa valorada en 70.000 dólares que se
vendió en un periodo de 12 meses.

𝑃𝑉 = 1.7506𝑉 + 0.367952𝑃 − 44.9882


𝑃𝑉 = 1.7506(70) + 0.367952(12) − 44.9882 = 81.96922

La casa tendrá un precio de venta de $81.969,22 dólares.

d. Efectúe un análisis residual de sus resultados y determine la idoneidad del modelo.

Para este tipo análisis residual es importante la elaboración de una tabla de residuos:

La columna Actuals corresponde al precio de venta real, mientras que la columna


Interpolation Forecast corresponde al pronóstico o a la predicción mediante el modelo de
regresión lineal, es decir, tomando los valores estimados y los periodos y evaluandolos en
la ecuación del punto a, mientras que la columna Residuals Prediction Error corresponde
a la diferencia entre el pronóstico y el valor real
En este diagrama de dispersión notamos que la nube de puntos se esparce de forma casi
aleatoria, es decir no sigue algún patrón, lo cual nos indica que el modelo de lineal es
idóneo.

e. Determine si existe una relación significativa entre el precio de venta y las dos variables
independientes (valor actualizado y periodo), con un nivel de significancia de 0.05.

Ho: Las variables independientes no tienen una relación significativa con la variable
dependiente
Ha: Las variables independientes tienen una relación altamente significativa con la variable
dependiente
F( 2 , 27 )=223.458
Prob > F =0 < 0.05
Si existe suficiente evidencia para rechazar la hipotesis nula, es decir hay una relación
altamente significativa entre el precio de venta y las dos variables independientes (prueba
global).
f. Determine el valor p en el inciso e) e interprete su significado.

El valor p (p-value) es de aproximadamente 0, esto quiere decir que existe suficiente


evidencia para rechazar la hipótesis nula, (Ho: Las variables independientes no tienen una
relación significativa con la variable dependiente), por lo tanto asumimos que son
altamente significativas en el modelo (prueba global).

g. Interprete el significado del coeficiente de determinación

R-squared=0.9430
Este valor del coeficiente determinación indica que alrededor del 94% de los precios de
venta se explica a partir de los valores estimados y de los periodos, este es un valor
bastante altos cual nos habla sobre la alta confiabilidad que caracteriza este modelo.

h. Defina r^2 ajustada

Adj R-squared=0.9388
i. Con un nivel de significancia de 0.05, determine si cada uno de las variables
independientes hace una contribución significativa al modelo de regresión. Indique cuál es
el modelo de regresión más apropiado para este conjunto de datos.

Ho: La variable no es significativa en el modelo


Ha: La variable es altamente significativa en el modelo

Para las variables y la constante tenemos:

Valor estimado: Valor t = 20.41, Valor p = 0 < 0.05, es altamente significativa.


Periodo: Valor t = 2.87, Valor p = 0.008 < 0.05, es altamente significativa.
Constante: Valor t = -6.87, Valor p = 0 < 0.05, es altamente significativa.

j. Determine el valor p en el inciso f e interprete su significado

Valor estimado: Valor p = 0 < 0.05


Periodo: Valor p = 0.008 < 0.05
Constante: Valor p = 0 < 0.05

Debido a que cada uno de los valores vez es menor al 5%, entonces, existe suficiente
evidencia para demostrar que cada una de estas variables, y la constante, hacen un aporte
altamente significativo al modelo, esto quiere decir que estás tres, tienen una estrecha
relación con el precio de venta.
k. Elabore una estimación por intervalo de confianza del 95% para la pendiente poblacional
que existe entre el precio de venta y el valor estimado.

Con un 95% de confianza podemos asegurar que el verdadero valor de la pendiente


poblacional que existe entre el precio de venta y el valor estimado está entre 1.574644 y
1.926558.

S-ar putea să vă placă și