Sunteți pe pagina 1din 66

Análisis de Regresión Múltiple

 Elanálisis de regresión simple


es una regresión lineal
bivariada en el que una
variable dependiente de γ es
pronosticada por una variable
independiente, de χ.

1
Análisis de Regresión Múltiple

 Por ejemplo producción de petróleo


crudo por consumo de energía,
compensación a directores generales
por ventas trimestrales, etc.

 En muchos casos otras variables


independientes en conjunto con estas
variables pueden hacer que el modelo
de regresión sea un mejor ajuste al
pronosticar la variable dependiente.
2
Análisis de Regresión Múltiple

 Por ejemplo las ventas


podrían pronosticarse según
el tamaño de tienda y el
número de competidores,
además de la densidad de
población.

3
Análisis de Regresión Múltiple

 Un modelo para pronosticar


compensación a directores
generales podría crearse con el
uso de variables como las
utilidades de compañía por
acción, edad del director general
y tamaño de la compañía,
además de las ventas
trimestrales. 4
Análisis de Regresión Múltiple

 El análisis de regresión
múltiple es similar al análisis
de regresión simple pero más
complejo.

 La ecuación del modelo


probabilidad de regresión
simple es:
γ = β0 + β1 χ + Є
5
Análisis de Regresión Múltiple

 Donde:
γ = valor de la variable dependiente
β0 = ordenada γ poblacional
β1 = pendiente poblacional
Є = el error de pronóstico

6
Análisis de Regresión Múltiple
γ = β0 + β1χ1+ β2χ2+ β3χ3+…+ Є

 Donde
γ = valor de la variable dependiente
β0= constante de regresión
β1= coeficiente de regresión parcial para la
variable independiente 1
β2= coeficiente de regresión parcial para la
variable independiente 2

7
Análisis de Regresión Múltiple
β3= coeficiente de regresión
parcial para la variable
independiente 3

βk=coeficiente de regresión
parcial para la variable
independiente k

k = número de variables
8

independientes
Análisis de Regresión Múltiple

 Enel análisis de regresión múltiple,


la variable dependiente de γ, se
conoce como variable de
respuesta.

9
Análisis de Regresión Múltiple

 Elcoeficiente de regresión parcial


de una variable independiente βi,
representa el aumento que ocurrirá
en el valor de γ desde un aumento
de 1 unidad en esa variable
independiente, si todas las otras
variables se mantienen constante.
10
Modelo de regresión múltiple con
dos variables independientes (primer
orden)

 El modelo de regresión más


sencillo es el que se construye
con dos variables independientes,
donde la potencia más elevada
de cualquier variable es 1
(modelo de regresión de primer
orden).
γ = β0 + β1χ1+ β2χ2+Є
11
Modelo de regresión múltiple con
dos variables independientes
(primer orden)

 La constante y coeficiente se
estima con la información de la
muestra, lo que resulta en el
modelo siguiente:

ŷ = b0 + b1χ1+ b2χ2 12
Modelo de regresión múltiple con
dos variables independientes
(primer orden)

 Los modelos de regresión


simple proporcionan una recta
que se ajusta con los puntos de
los datos del plano xy.
 En el análisis de regresión
múltiple, el modelo resultante
produce una superficie de 13

respuesta.
Modelo de regresión múltiple con
dos variables independientes
(primer orden)
 En el modelo de regresión
múltiple con dos variables
independientes de primer
orden, la superficie de
respuesta es un plano de
respuesta, que se ajusta en
un espacio tridimensional (x1,
x2,y). 14
Determinación de la ecuación
de regresión múltiple

 Los modelos de regresión


múltiple con tres o más
variables independientes
comprenden más de tres
dimensiones y son difíciles de
describir geométricamente.
15
Determinación de la ecuación
de regresión múltiple
 La ecuación de regresión
simple para determinar la
pendiente de la muestra y la
ordenada resultan cuando se
utilizan los métodos de cálculo
para minimizar la suma de
cuadrados del error para el
modelo de regresión. 16
Determinación de la ecuación
de regresión múltiple

 El procedimiento para crear estas


ecuaciones sirve para resolver dos
ecuaciones simultáneas con dos
incógnitas, b0 y b1.

 Encontrar la pendiente de la muestra y


ordenada con estas ecuaciones requieren
los valores de Σχ, Σγ, Σχγ y Σχ2.

17
Determinación de la ecuación
de regresión múltiple

 El procedimiento para determinar


fórmulas y despejar coeficientes de
regresión múltiple es semejante.

 Las fórmulas se establecen para


satisfacer un objetivo para minimizar la
suma de cuadrados del error para el
modelo (análisis de mínimos cuadrados).
18
Determinación de la ecuación
de regresión múltiple

 Al aplicar métodos de cálculo el


resultado k+1 ecuaciones con k+1
incógnitas (b0 y k valores de bi)
para análisis de regresión
múltiples con k variables
independientes.

 Un modelo de regresión con seis


variables independientes genera
siete ecuaciones con siete
incógnitas (b0,b1, b2,b3 b4,b5,b6).
19
Determinación de la ecuación
de regresión múltiple

 Para modelos de regresión múltiples


con dos variables independientes, el
resultado serían tres ecuaciones
simultáneas con tres incógnitas
(b0,b1 y b2).

b0 n + b1Σχ1 + b2Σχ2 = Σγ
b0 Σχ1 + b1Σχ12 + b2Σχ1χ2 = Σχ1γ
b0 Σχ2 + b1Σχ1χ2 + b2Σχ2 = Σχ2γ
2 20
Determinación de la ecuación
de regresión múltiple

 Despejar los coeficientes de


regresión y constantes de
regresión en un modelo de
regresión múltiples con dos
variables independientes requiere:

Σχ1, Σχ2, Σγ, Σχ12, Σχ22, Σχ1χ2,


Σχ1γ y Σχ2γ.

Materia 21
Modelo de regresión
múltiple
 Serealizó un estudio de bienes
raíces en una pequeña ciudad
de Louisiana para determinar
cuáles variables, si las hay,
están relacionadas con el
precio de mercado de una
casa.
22
Modelo de regresión
múltiple
 Se exploraron diversas variables,
incluyendo el número de
recámaras, el número de baños,
la antigüedad de la casa, el
número de pies cuadrados de
especio de vivienda, el número
total de pies cuadrados de
especio y el número de cocheras.
23
Modelo de regresión
múltiple
 Suponga que el investigador desea
crear un modelo de regresión para
pronosticar el precio de mercado de
una casa para dos variables, “número
total de pies cuadrados de la casa” y
“la antigüedad de la casa”.

24
Nombre
Materia del 25
Profesor
Modelo de regresión
múltiple
ŷ = 57.4 + 0.0177x1 – 0.666x2

 La constante 57.4 es la
ordenada de γ y representa el
valor de ŷ si x1 (número de pies
cuadrados) y x2 (antigüedad)
son cero.
26
Modelo de regresión
múltiple
 En este ejemplo, una comprensión
práctica de la ordenada de γ no
tiene significado.

 Tiene poco sentido decir que una


casa que no tiene pies cuadrados
(x1= 0) y no tiene antigüedad (x2=
0) costaría $ 57 400. 27
Modelo de regresión
múltiple
 El coeficiente de x1 (número total
de pies cuadrados de la casa) es
0.0177, lo cual significa que el
incremento de 1 unidad en pies
cuadrados resultaría en un
aumento pronosticado de 0.0177.
($1 000) = 17.70 en el precio de la
casa, si su antigüedad se
mantuviera constante.
28
Modelo de regresión
múltiple
 Cuando se mantienen constantes
las otras variables, la suma de 1
pie cuadrado de espacio de la
casa tiene un aumento
pronosticado de $17.70 en el
precio de la casa.
29
Modelo de regresión
múltiple
 El coeficiente de x2 (antigüedad)
es -0.666, el signo negativo del
coeficiente indica una relación
inversa entre la antigüedad de la
casa y su precio.
 Es decir entre más antigua, menor
es el precio.
30
Modelo de regresión
múltiple
 En este caso si el número total de
pies cuadrado de la casa se
mantiene constante, un aumento de
1 unidad en la antigüedad (1 año)
resultará en –0.666. ($1 000) =
-$666, una reducción pronosticada
de $666 en el precio.
31
Modelo de regresión múltiple

 Este modelo de regresión se puede


usar para pronosticar el precio de una
casa en la pequeña ciudad de
Louisiana.
 Si la casa tiene 2 500 pies cuadrados
en total y tiene 12 años de antigüedad,
x1 = 2 500 y x2 = 12.
 El precio pronosticado de la casa es
$93 658.
32
Modelo de regresión múltiple

33
Modelo de regresión múltiple

• Salida MINITAB de regresión para el ejemplo de


bienes raíces.

34
Modelo de regresión múltiple

 Buena parte de la carga en el


mundo es transportada por
caminos y el volumen de carga
remitida por esta vía varía de un
país a otro, dependiendo del
tamaño del país, la cantidad de
comercio y la riqueza entre otros
factores.
35
Modelo de regresión múltiple

 Aquí se muestran siete de los


principales 10 países en los que la
carga se transporta por caminos,
junto con el número de millas que
recorren y el número de vehículos
comerciales (camiones y autobuses)
para cada país.
36
Modelo de regresión múltiple

 Con los siguientes datos realice un


modelo de regresión múltiple para
pronosticar el volumen de carga
transportada en caminos por la
longitud de caminos y el número de
vehículos comerciales.

37
Modelo de regresión múltiple

 Determine el volumen
pronosticado de carga si lo
longitud de los caminos es de
600 mil millas y el número de
vehículos comerciales es de
tres millones.

38
Modelo de regresión múltiple

39
Modelo de regresión múltiple

40
Modelo de regresión múltiple

41
Modelo de regresión múltiple

 El modelo indica que por cada


unidad (1 milla) de aumento en
longitud de caminos, el volumen
pronosticado de carga
transportada aumenta en 0.1081
millones de toneladas, o sea
101,800 toneladas, si el número
de vehículos comerciales se 42

mantiene constante.
Modelo de regresión múltiple

 Siel número de vehículos comerciales


aumenta 1 unidad, el volumen
pronosticado de carga transportada
aumenta en 0.0410 millones de
toneladas, o sea 41 mil toneladas, si la
longitud de caminos se mantiene
constante.
43
Modelo de regresión múltiple

 Si X1 (longitud de caminos) es de 600 mil y X2


(número de vehículos comerciales) es 3
millones, el modelo pronostica que el
volumen de carga transportada será de
157,655 millones de toneladas.

ŷ = -26,425.45 + 0.1018 (600,000) + 0.0410


(3,000,000)

ŷ = 157,655
44
Modelo de regresión múltiple

 ElServicio Interno de Reembolso


(SIR) está tratando de estimar la
cantidad mensual de impuestos no
pagados descubiertos por su
departamento de auditoria.

 Enel pasado, el SIR estimaba esta


cantidad sobre la base del número
esperado de horas de trabajo de
auditorias de campo. 45
Modelo de regresión múltiple

 En los últimos años, sin embargo,


las horas de trabajo de auditorias de
campo se han vuelto un factor de
predicción errático de los impuestos
reales no pagados.

46
47
Nombre
Materia del 48
Profesor
Modelo de regresión múltiple

• Cuando resolvemos estas tres ecuaciones de


manera simultánea, obtenemos:
a = -13.828
b1 = 0.564
b2 = 1.0099
49
Modelo de regresión múltiple

ŷ = -13.828 + 0.564 X1 + 1.0099 X2

 Supongamos que el SIR desea


aumentar la cantidad de sus
descubrimientos de impuestos no
pagados durante el siguiente mes.

50
Modelo de regresión múltiple

 Elnúmero de de horas de auditorias


de campo, entonces, permanecerá
en el nivel de octubre, alrededor de
4,300 horas.

51
Modelo de regresión múltiple

 Pero con el fin de aumentar su


hallazgo de impuestos no
pagados, el SIR espera
aumentar el número de horas
en computadoras a
aproximadamente 1,600.

 X1 = 43  4,300 HTAC
 X2 = 16  1,600 HTC
52
Modelo de regresión múltiple
 Sustituyendo estos valores obtenemos:
ŷ = 28.008 descubrimientos estimados en
$28,008,000.

 Se pueden crear modelos de regresión


múltiples para ajustarse a casi cualquier
conjunto de datos si el nivel de medida
es adecuado y existen suficientes puntos
de datos.

53
Modelo de regresión múltiple

 Una vez que un modelo se


construye es importante probar el
modelo para determinar si ajustan
bien los datos y si satisfacen las
suposiciones que sirven de base al
análisis de regresión.

54
Modelo de regresión múltiple
 La evaluación de lo adecuado del
modelo de regresión se puede hacer
en varias formas:
a) Estudiar las pruebas de
significancia de los coeficientes
de regresión,
b) Calcular los residuales,
c) Examinar el error estándar de la
estimación, y
d) Observar el coeficiente de
determinación.
55
Modelo de regresión múltiple

 Con regresión simple se usa una


prueba de t de la pendiente de la
recta de regresión para determinar
si la pendiente poblacional de la
recta de regresión es diferente de
cero.
56
Residuales, Error Estándar de
la Estimación y R2
RESIDUALES
 El residual o error del modelo de
regresión múltiple se despeja de la
misma forma que en la regresión
simple.
 Primero, un valor pronosticado, ŷ, se
determina al escribir el valor por cada
variable independiente para el conjunto
dado de observaciones en la ecuación
de regresión múltiple y despejar ŷ.
Nombre
Materia del 57
Profesor
Residuales, Error Estándar de
la Estimación y R2

 A continuación, el valor de γ – ŷ se
calcula para cada conjunto de
observaciones.

 Un examen de los residuales puede


explicar alguna información sobre el
ajuste del modelo de regresión de
bienes raíces.
Materia
Nombre
del 58
Profesor
Residuales, Error Estándar de
la Estimación y R2
 El investigador de negocios puede
observar los residuales y decidir si los
errores son suficientemente pequeños
para sostener la precisión del modelo.
 El precio de la casa en un unidades de
$ 1,000.
 Dos de los 23 residuales son más de
20.00, o sea más de $20 mil fuera de
su pronóstico.
 Por otra parte, dos residuales son
menores a 1, o $ 1,000 fuera de su
pronóstico.
Nombre
Materia del 59
Profesor
Residuales, Error Estándar de
la Estimación y R2
 Los residuales son más útiles para localizar
resultados aislados, los cuales son puntos de
datos que están separados o lejos de la corriente
principal de los otros datos.

 A veces son puntos de datos que se registraron o


midieron por equivocación.

 Debido a que todo punto de datos influye en el


modelo de regresión, los resultados aislados
pueden influir de manera importante en el modelo
basado en la distancia de los resultados aislados
desde otros puntos.
Nombre
Materia del 60
Profesor
Residuales, Error Estándar de
la Estimación y R2
 Al examinar los residuales de la tabla
para ver si hay resultados aislados, el
octavo residual de la lista es -27.699.
 Este error indica que el modelo de
regresión no tuvo casi éxito para
pronosticar precio de las casas con
esta particular como tuvo con las otras
(un error de más de $ 27 mil).
 Por cualquier razón, este punto de
datos está un poco separado de los
puntos de datos y puede ser
considerado como dato aislado.
Nombre
Materia del 61
Profesor
Nombre
Materia del 62
Profesor
Residuales, Error Estándar de
la Estimación y R2
SSE Y ERROR ESTÁNDAR DE LA ESTIMACIÓN

 Una de las propiedades de un modelo de


regresión es que los residuales suman cero.
 Esta propiedad impide la posibilidad de
calcular un residual promedio como una sola
medida de error.
 En un esfuerzo por calcular una estadística
individual que pueda representar el error en
un análisis de regresión.

Nombre
Materia del 63
Profesor
Residuales, Error Estándar de
la Estimación y R2
 SSE tiene uso limitado como medida de
error, pero es una herramienta empleada
para resolver otras medidas más útiles
como el error estándar de la estimación
Se, que es esencialmente la desviación
estándar de residuales (error) para el
modelo de regresión.
 El error estándar de la estimación, Se,
por lo general es la salida estándar desde
el análisis de regresión por paquete de
software.
Nombre
Materia del 64
Profesor
Residuales, Error Estándar de
la Estimación y R2
COEFICIENTE DE DETERMINACIÓN MÚLTIPLE
(R2)

 El coeficiente de determinación múltiple (R2)


es análogo de determinación (r2).
 R2 representa la proporción de variación de la
variable dependiente, γ, considerada por las
variables independientes en el modelo de
regresión.
 Una R2 de 0 indica que no hay relación entre
las variables pronosticadoras del modelo de γ.

Nombre
Materia del 65
Profesor
Residuales, Error Estándar de
la Estimación y R2
R2 AJUSTADO
 Cuando se sumen más variables
independientes a un modelo de regresión,
el valor de R2 no puede disminuir y casi
todos los casos aumentará.
 El valor de SSyy para un conjunto dado de
observaciones permanecerá igual cuando
se sumen variables independientes al
análisis de regresión, por que SSyy es la
suma de cuadrados para la variable
dependiente.
Nombre
Materia del 66
Profesor

S-ar putea să vă placă și