Sunteți pe pagina 1din 7

REGRESIN LINEAL MLTIPLE

Es un mtodo para analizar el efecto de dos o mas variables independientes


sobre una dependiente; asi mismo, es una extencin de la regresin lineal
solo que con un mayor nmero de variables independientes. Es decir sirve
para predecir el valor de una variable dependiente conociendo el valor y la
influencia de las variables independientes incluidas en el anlisis.
En la Regresin lineal simple slo se maneja una variable independiente, por
lo que slo cuenta con dos parmetros.
La Regresin lineal mltiple maneja varias variables independientes. Cuenta
con varios parmetros.

ventajas:
1. El coeficiente de regresin simple puede estar sesgado en alguna medida por el
efecto indirecto de un regresor omitido, siempre que ste se encuentre
correlacionado con las otras variables. Incorporar el regresor omitido ayuda a evitar
ese sesgo; o, dicho de otra manera, ayuda a la reduccin del error estocstico, que
consiste en la influencia que muchas variables omitidas tienen.
2. Otra ventaja que ofrece la regresin mltiple es la reduccin de la varianza
residual. La estimacin es tanto ms precisa cuanto menor es la varianza residual.

desventaja:
Es la primera tcnica que expresa, en trminos estadsticos, la complejidad de las
relaciones de varias variables. Las relaciones entre variables nunca son tan
sencillas. Nunca una sola variable produce sola otra variable. Por lo menos dos
variables concurren para producir otra. Dicho menos precisamente, una variable
nunca tiene una sola explicacin. La realidad es multivariable.

Modelo. Hipotesis del modelo


Disponemos de los siguientes elementos para el estudio estadstico:
Una variable respuesta (o dependiente), Y , que sera una variable numrica
(o cuantitativa): es la variable que se quiere analizar. Formalmente, sera una
variable aleatoria de tipo continuo.
Varias posibles variables explicativas (o independientes), X1, ..., Xk, que
sern variables numricas (o cuantitativas). Recurdese que los factores en
el modelo de diseo de experimentos eran siempre variables cualitativas.
Finalmente, necesitamos datos. Supondremos que disponemos de n
conjuntos de datos:
(yi, x1i, ..., xki) para i = 1, ..., n
Por supuesto, sigue siendo absolutamente necesario que los datos vayan
unidos
en el sentido de que (yi, x1i, ..., xki) representan los valores de Y , X1 ,..., Xk
en individuo o unidad muestral.
El modelo de regresin lineal mltiple es de la siguiente forma:
Yi = 0 + 1x1i + ... + jxji + ... + kxki + ui para i = 1, ..., n
Significado de los parmetros:
0= Valor medio de la variable respuesta cuando X1 = ... = Xk = 0.

Muy a menudo, el parmetro 0 no tiene una interpretacin intuitiva de


inters.
j= Mide la variacin media que experimenta la variable respuesta cuando
Xj aumenta una unidad (j = 1, ..., k).
La interpretacin intuitiva de j (j = 1, ..., k) siempre es muy interesante.
ui= Termino de error = Efecto adicional debido a otras variables que no se
incluyen en el modelo por no ser consideradas relevantes.
Para poder obtener y utilizar herramientas estadsticas que nos permitan
tomar decisiones objetivas y razonadas, necesitamos que el modelo se
ajuste a unas determinadas hiptesis.
Estas hiptesis iniciales del modelo son las siguientes:
Normalidad: Las observaciones Yi siguen una distribucin Normal,
Linealidad: Los valores medios de la variable respuesta dependen
linealmentede los valores de X1, ...Xk: E[Yi] = 0 + 1x1i + ... + jxji + ... +
kxki,
Homogeneidad o igualdad de varianzas (homocedasticidad): V (Yi) = 2,
Las observaciones son independientes.
Todas estas hipotesis se pueden expresar abreviadamente de la siguiente
forma:
Yi N(0 + 1x1i + ... + jxji + ... + kxki; 2) independientes.
Ausencia de multicolinealidad: No existen relaciones lineales entre las
variables explicativas X1, ..., Xk.
La ausencia de multicolinealidad constituye una hiptesis completamente
nueva
y su significado es el siguiente:
Por un lado, si alguna de las variables explicativas fuera combinacin lineal
de las otras, el modelo, obviamente, podra simplificarse. Pero eso no es lo
ms importante. La importancia practica de exigir ausencia de
multicolinealidad procede del hecho de que, si alguna de las variables
explicativas est fuertemente correlacionada con otras, se pueden producir
distorsiones en los resultados.
Es importante que estas hiptesis iniciales del modelo se cumplan
(aproximadamente) para que las conclusiones que obtengamos no sean una
barbaridad.
Llegados a este punto, se puede abordar la cuestion de si tenemos
suficientes datos (suficiente informacion muestral) para abordar el analisis
estadstico de este modelo. La regla basica para responder a esto es muy
facil de recordar (y de entender): en general, necesitaremos al menos
tantos datos como parametros queremos estimar en el modelo. En este
modelo, tenemos:
Nmero de datos= n

Nmero de parmetros= k+2


Por lo tanto, necesitamos, al menos, n = k + 2 conjuntos de datos.

ANALISIS DE REGRESIN LINEAL MLTIPLE


El Anlisis de Regresin Lineal Mltiple nos permite establecer la relacin
que se produce entre una variable dependiente Y y un conjunto de
variables independientes (X1, X2, ... XK). El anlisis de regresin lineal
mltiple, a diferencia del simple, se aproxima ms a situaciones de anlisis
real puesto que los fenmenos, hechos y procesos sociales, por definicin,
son complejos y, en consecuencia, deben ser explicados en la medida de lo
posible por la serie de variables que, directa e indirectamente, participan en
su concrecin.
Al aplicar el anlisis de regresin mltiple lo ms frecuente es que tanto la
variable dependiente como las independientes sean variables continuas
medidas en escala de intervalo o razn.
En la Regresin lineal mltiple el punto de partida es el mismo que en la
Regresin lineal simple. Se pretende modelizar la relacin entre unas
variables con la finalidad ltima de poder pronosticar una de ellas: la
variable dependiente, a partir del conocimientos de las otras: las variables
independientes. En la Regresin lineal mltiple se introducen nuevas
variables independientes con la finalidad de reducir la dispersin de la
prediccin, con la finalidad de disminuir el residuo.
No obstante, caben otras posibilidades:
1.

Tambin podremos aplicar este anlisis cuando relacionemos una


variable dependiente continua con un conjunto de variables
categricas.
2. Aplicaremos el anlisis de regresin lineal mltiple en el caso de que
relacionemos una variable dependiente nominal con un conjunto de
variables continuas.

Anotacin matemtica
regresin lineal mltiple:

del

modelo

ecuacin

de

Y=0+ 1 X1+ 2 X2

Al realizar una Regresin lineal mltiple


modalidades de estimacin del modelo:

hay,

tres

a. Forzando la entrada en el modelo de todas las variables elegidas.

b. Mediante un Stepwise hacia delante. La Regresin entonces se


denomina Fordward Stepwise Regression: En primer lugar crea un
modelo con una nica variable independiente. En realidad, pues, el primer
paso es crear una Regresin lineal simple. Pero lo hace eligiendo entre todas
las variables independientes la que consigue un mejor modelo, si es que lo
consigue.

En

este

primer

paso

debe

existir

entre

las

variables

independientes una variable que tenga una relacin significativa con la


variable dependiente. De lo contrario el procedimiento acabara aqu y no
tendramos modelo matemtico para relacionar esas variables.
En

el

segundo

paso

se

prueba

de

introducir,

entre

las

variables

independientes que quedan, cul es la que consigue un modelo mejor, si es


que alguna lo consigue. Se trata de establecer unos criterios de calidad
mnimos. Lo que se denomina un Criterio de entrada. Si no se alcanzan nos
quedamos con una Regresin lineal simple y se rechazan las otras variables.
Si hemos conseguido introducir en el modelo una segunda variable
independiente se valora, probando con todas las variables independientes
que quedan, la posibilidad de introducir una tercera. De nuevo se aplican
unos criterios de entrada que si no se alcanzan no se introduce ninguna
variable ms.
Y as se va haciendo hasta alcanzar el mejor modelo. Es importante tener en
cuenta que en cualquiera de estos pasos hay la posibilidad de extraer una
variable que anteriormente se haba introducido. Y cambiar as la
disposicin inicial. Por ejemplo, supongamos que en los pasos anteriores se
haban introducido las variables x3 y x5 y, al probar una nueva introduccin,
al ensayar con, por ejemplo, x7, el procedimiento observa que consigue
mejores resultados sacando del modelo la variable x 3 que haba sido la
primera que haba introducido, quedando, entonces, el modelo con x 5 y x7.
c. Mediante un Stepwise hacia atrs. La Regresin entonces se
denomina Backward Stepwise Regression: El Stepwise hacia atrs es lo
mismo pero ahora partiendo que hemos empezado forzando la entrada de
todas las variables dentro del modelo y, a continuacin, en el siguiente
paso, mirar de sacar una de las variables independientes: una variable que
al sacarla alteremos la calidad del modelo menos que un valor umbral
establecido, lo que se denomina, ahora, un Criterio de salida. Si es as, si
podemos extraer sin perjudicar por encima de ese valor preestablecido,
reducimos el modelo. Y as, paso a paso, pero en sentido contrario, vamos

creando el mejor modelo posible, la mejor ecuacin posible que relacione


una variable dependiente con varias variables independientes.
Los criterios de entrada y de salida, que en muchas ocasiones son el mismo
valor, generalmente vienen dados por el valor de un estadstico, por el valor
de la F de Fisher. Puede verse en el Herbario de tcnicas, en concreto, la
tcnica Contraste de hiptesis de la pendiente de Regresin que valores
de F pequeos implican buena relacin entre la variable dependiente y la
independiente. Y valores grandes implican mala relacin. Pues el criterio de
entrada ser que el valor de la F est por debajo de cierto valor y el de
salida que est por encima de tambin de cierto valor, que suele ser el
mismo. En otras ocasiones el criterio de entrada o de salida es un
determinado p-valor prefijado asociado al parmetro de la variable que se
decide si entra o no en el modelo.
Finalmente un criterio de calidad de una Regresin lineal mltiple, como
sucede tambin en la Regresin lineal simple, es el Coeficiente de
determinacin, la R2. Aunque el valor de este coeficiente es un nmero que
va del 0 al 1 es frecuente expresarlo en tanto por ciento. Es una forma de
expresar el grado de determinacin de la variable dependiente por parte de
las independientes.

EJERCICIO DE APLICACION DE REGRESION MULTIPLE:


Mediante el siguiente problema podremos ilustrar la aplicacin de Regresin
Multiple:
En la Facultad de Ingeniera de Sistemas y Computo de la Universidad "Inca
Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los
alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar
una muestra de 15 alumnos y ellos registran notas promedios en las
asignaturas
de Algoritmos, Base
de
Datos y Programacin como
se
muestran en el siguiente cuadro.
Alumno

PHP

13

13

13

15

16

15

12

13

13

10

13

11

11

12

14

13

15

14

15

15

15

Lo que buscamos es construir un modelo para determinar la dependencia


que exista de aprendizaje reflejada en las notas de la asignatura de PHP,
conociendo las notas de las asignaturas Algoritmos, Base de Datos y
Programacin.
Se presentara la siguiente ecuacin a resolver:

Utilizando las formulas de las ecuaciones normales a los datos obtendremos


los coeficientes de regresin o utilizando Regresin de Anlisis de datos, en
la Hoja de Calculo de Excel podemos calcular tambin los coeficientes de
regresin:

Por lo tanto podemos construir la ecuacin de regresin que buscamos:

El Error Estndar de Regresin Mltiple


Mediante esta medida de dispersin se hace ms preciso el grado de
dispersin alrededor del plano de regresin, se hace ms pequeo.
Para calcularla se utiliza la formula siguiente:

En los resultados de Excel se llama error tpico y para explicar la relacin


del aprendizaje de PHP que se viene desarrollando es de 0.861
El coeficiente de determinacin mltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las
variables mltiples, utilizando la si siguiente formula:

CONCLUSIONES
El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante
las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y
Programacin.

Bibliografa
http://www.monografias.com/trabajos30/regresion-multiple/regresionmultiple.shtml
http://rua.ua.es/dspace/bitstream/10045/8143/1/Regresion%20MUTIPLE.pdf
http://www.eumed.net/tesis-doctorales/2008/mrl/Analisis%20de
%20regresion%20multiple.htm
http://www.monografias.com/trabajos30/regresion-multiple/regresionmultiple.shtml

Libro de

ESTADSTICA PARA ADMINISTRACIN Y ECONOMA.

https://www.youtube.com/watch?
v=LSIKiIouQl8&index=23&list=PLZmWVIAvUcmG5kuAzwJyNr7I3Lmud7hf
T

S-ar putea să vă placă și