Sunteți pe pagina 1din 16

Estadística II

Unidad No. 2: Análisis de Regresión Lineal Simple


y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple.
Es posible utilizar más de una variable independiente para estimar la variable dependiente e
intentar, de esta manera, aumentar la precisión de la estimación. Este proceso se conoce como
Análisis de regresión Múltiple y Correlación.

La principal ventaja de la regresión múltiple es que nos permite utilizar más información
disponible para estimar la variable dependiente. En algunas ocasiones, la correlación entre dos
variables puede resultar insuficiente para determinar una ecuación de estimación confiable; sin
embargo, si
agregamos los datos de más variables independientes, podemos determinar una ecuación de
estimación que describa la relación con mayor precisión.

La regresión múltiple y el análisis de correlación implican un proceso de tres pasos como el que
usamos en la regresión simple:

1. Describimos la ecuación de regresión múltiple;


2. Examinamos el error estándar de regresión múltiple de la estimación, y
3. Utilizamos el análisis de correlación múltiple para determinar qué tan bien la ecuación de
regresión describe los datos observados.

Se puede observar cada una de las variables independientes y probar si contribuyen de manera
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple. Deducción de la Ecuación
mediante un ejemplo.
El Servicio Interno de Contribuciones (SRI) de Estados Unidos está tratando de estimar la
cantidad mensual de impuestos no pagados descubiertos por su departamento de auditorías. En
el pasado, el IRS estimaba esta cantidad con base en el número esperado de horas de trabajo
de auditorías de campo. En los últimos años, sin embargo, las horas de trabajo de auditorías de
campo se han convertido en un pronosticador errático de los impuestos no pagados reales.
Como resultado, la dependencia está buscando otro factor para mejorar la ecuación de
estimación.
El departamento de auditorías tiene un registro del número de horas que usa sus computadoras
para detectar impuestos no pagados. ¿Podríamos combinar esta información con los datos
referentes a las horas de trabajo de auditorías de campo y obtener una ecuación de estimación
más precisa para los impuestos no pagados descubiertos cada mes? En la tabla siguiente se
presentan esos datos para los últimos 10 meses.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple. Deducción de la Ecuación
mediante un ejemplo.

En la regresión simple:

En la regresión múltiple:
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple. Deducción de la Ecuación
mediante un ejemplo.
Podemos visualizar la ecuación de estimación simple como una recta en una gráfica; de manera
similar, podemos representar una ecuación de regresión múltiple de dos variables como un plano,
como el que ilustra la figura siguiente. Se trata de una forma o figura tridimensional, con profundidad,
largo y ancho. Para obtener una idea intuitiva de esta forma tridimensional, visualice la intersección
de los ejes Y, X1 y X2 como un rincón de una habitación.

a es la ordenada Y, b1 y b2 son las pendientes del plano


de regresión múltiple, es decir, son los coeficientes de
regresión estimados. La constante a es el valor de (en
este caso, la estimación de los impuestos no pagados) si
tanto X1 como X2 tienen valor cero. Los coeficientes b1 y
b2 describen cómo los cambios en X1 y X2 afectan el valor
de .
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple. Deducción de la Ecuación
mediante un ejemplo.
Nuestro problema consiste en decidir cuál
de los planos que podemos dibujar será
el que mejor se ajuste. Para hacer esto, de
nuevo utilizaremos el criterio de mínimos
cuadrados y localizaremos el plano que
minimice la suma de los cuadrados de los
errores, es decir, de las distancias de los
puntos alrededor del plano a los puntos
correspondientes sobre el plano.

Usemos nuestros datos y las


siguientes tres ecuaciones para determinar
los valores de las constantes numéricas a,
b1 y b2.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple. Deducción de la Ecuación
mediante un ejemplo.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple. Deducción de la Ecuación
mediante un ejemplo.
El departamento de auditorías puede utilizar esta ecuación mensualmente para estimar la cantidad
de impuestos no pagados que va a descubrir . Suponga que el SRI desea aumentar la cantidad de
detecciones de impuestos no pagados el siguiente mes. NOVIEMBRE, recordemos que:

Como los auditores capacitados son escasos, EL SRI no tiene la intención de contratar personal
adicional. El número de horas de trabajo en auditorías, entonces, permanecerá en el nivel de
OCTUBRE, alrededor de 4,300 horas. Pero con el fin de aumentar las detecciones de impuestos
no pagados, el SRI espera aumentar el número de horas en computadora a cerca de 1,600. Como
resultado:

Sustituyendo estos valores en la ecuación de regresión para el departamento de auditorías,


obtenemos: Por tanto, en el pronóstico para noviembre, el
departamento de auditorías espera encontrar una
evasión de impuestos cercana a 28 millones de
dólares, para esta combinación de factores.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple y el uso de la Computadora.
Supongamos que tenemos no una, ni dos variables independientes, sino un número k de ellas: X 1,
X2,..., Xk. Como antes, sea n el número de datos que se tienen. La ecuación de regresión que
intentamos estimar es:

Para demostrar cómo una computadora maneja el análisis de regresión múltiple, tomemos el
problema del Servicio Interno de Contribuciones (SRI) de la sección anterior. Suponga que el
departamento de auditorías agrega a su modelo la información correspondiente a las
recompensas para los informantes. La dependencia desea incluir esta tercera variable
independiente, X3,debido a que siente que existe cierta relación entre estas recompensas y el
descubrimiento de impuestos no pagados. La siguiente tabla muestra los datos:
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple y el uso de la Computadora.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple y el uso de la Computadora.
Supongamos ahora que, en noviembre, el SRI intenta dejar las horas de trabajo en auditorías de
campo y las horas en computadora en sus niveles de octubre (4,300 y 1,500), pero decide
aumentar las recompensas pagadas a los informantes a $75,000. ¿Cuánto de impuestos no
pagados esperan descubrir en noviembre? Sustituyendo estos valores en la ecuación de regresión
estimada, obtenemos:
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple.
El Error Estándar de la Estimación de la Regresión Múltiple: Una medida de dispersión.

En la regresión simple, la estimación es más precisa conforme el grado de dispersión alrededor de la


regresión es menor. Lo mismo es cierto para los puntos de la muestra que se encuentran alrededor
del plano de regresión múltiple. Para medir esta variación, debemos utilizar de nuevo la medida
conocida como error estándar de la estimación:

Con el ejemplo de las tres variables:


Se = 0.286 es decir, $286,000.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple.
El Coeficiente de Determinación Múltiple.
En la regresión múltiple se utiliza la misma fórmula que en el caso de la estimación simple:

Con el ejemplo de las tres variables:

r2 = 0.983. Esto nos dice que el modelo encontrado


explica el 98.3% de la variación total de impuestos no
pagados descubiertos.

r = 0.9914 Para la regresión de dos variables hecha antes, r2 es


sólo 0.729, así que el modelo de dos variables explica
Solamente el 99.14 % de el 72.9 % de los impuestos no pagados.
De los impuestos no
pagados, el tiempo de auditorías, El agregar las recompensas a los informantes explica
horas de computación y el pago a los 25.4% restante de la variación.
Informantes tienen relación.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Análisis de Correlación Múltiple y el uso de la Computadora.
En el problema de la evasión de impuestos, tenemos que para 4,300 horas de trabajo en auditorías
de campo, 1,500 horas en computadora y $75,000 de pago a informantes, es $27,905,000 como
estimación de impuestos no pagados descubiertos, y Se es $286,000.

Si deseamos construir un intervalo de confianza del 95% alrededor de esta estimación de


$27,905,000:
1–P=
1 – 0.95 = 0.05
para n – k – 1 = 10 – 3 – 1 = 6 grados de libertad

Buscamos en Tabla T student: Ttabla = 2.447

Con un nivel de confianza del 95%, el departamento de


auditorías puede sentirse seguro de que los
descubrimientos reales estarán en este intervalo, que
va de $27,205,200 a $28,604,800.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Clase No. 1 Análisis de Regresión Múltiple y
Correlación.
Ejemplo con computadora.
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Ejemplo con computadora. Resultados
Estadística II
Unidad No. 2: Análisis de Regresión Lineal Simple
y Múltiple .
Ejemplo con computadora. Resultados

Yˆ  34,8979  5,2617 X 1  8,018 X 2  6,808 X 3

S e  4,0688
R 2  0,9834 R  0,9834  0,9916

Yˆ  34,8979  5,2617 * 5,8  8,018 * 4,2  6,808 * 5,1


Yˆ  34,8979  30,51786  33,6756  34,7208
Yˆ  347239,74

S-ar putea să vă placă și