Sunteți pe pagina 1din 9

UNIVERSIDAD DE GUAYAQUIL

Facultad de Ingeniería Industrial


ANÁLISIS DE REGRESIÓN
MÚLTIPLE
INTRODUCCIÓN
Comienza con el estudio del coeficiente de correlación, el cual mide la
fuerza de una relación.
Un coeficiente cercano 1,00 indica una relación lineal muy fuerte, en
tanto que un valor cercano a cero significa que la relación es débil.
Se desarrolla un procedimiento para determinar una ecuación lineal que
nos permita expresar la relación entre las 2 variables la cual se la
denomina recta de regresión la cual se puede describir la relación entre
las variables así mismo describe el patrón general de una variable
dependiente (Y) de una variable independiente o variable de explicación
(X).

En la correlación y regresión lineal múltiple, se emplean variables


independientes adicionales (denotadas X1, X2, …, Xn) que ayudan a
explicar o predecir mejor a la variable dependiente (Y). Casi todas las
ideas estudiadas en la correlación y regresión lineal simple se amplían a
esta situación más general. Sin embargo, las variables independientes
adicionales permiten hacer algunas consideraciones nuevas. El análisis
de regresión múltiple sirve como técnica descriptiva o como técnica de
inferencia.
LA TABLA DE ANOVA
 Un análisis de varianza (ANOVA) prueba la hipótesis de que las
medias de dos o más poblaciones son iguales. Los ANOVA evalúan
la importancia de uno o más factores al comparar las medias de la
variable de respuesta en los diferentes niveles de los factores. La
hipótesis nula establece que todas las medias de la población
(medias de los niveles de los factores) son iguales mientras que la
hipótesis alternativa establece que al menos una es diferente.

 Para ejecutar un ANOVA, debe tener una variable de respuesta


continua y al menos un factor categórico con dos o más niveles.
Los análisis ANOVA requieren datos de poblaciones que sigan una
distribución aproximadamente normal con varianzas iguales entre
los niveles de factores. Sin embargo, los procedimientos de
ANOVA funcionan bastante bien incluso cuando se viola el
supuesto de normalidad, a menos que una o más de las
distribuciones sean muy asimétricas o si las varianzas son bastante
diferentes. Las transformaciones del conjunto de datos original
pueden corregir estas violaciones.
Fuente gl SS MS F

Regresión k SSR MSR SSRk MSRMSE

Residuo o error n (k 1) SSE MSE SSE[n (k 1)]

Total n 1 SS total

La columna con el encabezado “gl” se refiere a los grados de libertad asociados con cada
categoría.
El número total de grados de libertad es n 1.
El número de grados de libertad en la regresión es igual al número de variables
independientes existente en la ecuación de regresión múltiple.
Denominamos k a los grados de libertad de la regresión.
El número de grados de libertad asociados con el término error es igual al total de grados de
libertad menos los grados de libertad de la regresión. En una regresión múltiple, los grados de
libertad son n (k 1).
El término “SS”, localizado a la mitad de la tabla ANOVA, se refiere a la suma de los
cuadrados.
Observe que existe una suma de cuadrados en cada fuente de variación. La columna de la
suma de los cuadrados muestra la cantidad de variación atribuible a cada fuente. La variación
total de la variable independiente, Y, está resumido en SS total.
ERROR ESTÁNDAR DE
ESTIMACIÓN MÚLTIPLE
 El error estándar múltiple de la estimación es la medida de la
eficiencia de la ecuación de regresión.
Está medida en las mismas unidades que la variable dependiente.

Es difícil determinar cuál es un valor grande y cuál es uno pequeño


para el error estándar.

La fórmula es:

 donde n es el número de observaciones y k es el número de


variables independientes.
Y: es la observación actual.
Y´: es el valor estimado calculado mediante la ecuación
de regresión
n: es el número de observaciones de la muestra
k: es el número de variables independientes
COEFICIENTE DE TERMINACIÓN MÚLTIPLE

 Es el porcentaje de variación de la variable dependiente,


Y, explicada por el conjunto de variables independientes,
X1, X2, X3…Xk.
 Características:
 Se representa por una R mayúscula al cuadrado.
 Puede variar de 0 a 1.
 No puede adoptar valores negativos.
 Es fácil de interpretar.
COEFICIENTE AJUSTADO DE DETERMINACIÓN

S-ar putea să vă placă și