Sunteți pe pagina 1din 21

Universidad Nacional Experimental Politcnica.

Antonio Jos de Sucre


Vice-Rectorado Luis Caballero Mejas
Ncleo Guarenas.
Asignatura: Inferencia Estadistica II.

REGRESIN LINEAL

Profesor: Angel garcia

Alumnos: Carlos Daz Exp: 2011100124


Henry Daniel Daz Exp: 2011100118

Guarenas, abril del 2014

INTRODUCCIN
En la estadstica existe una relacin entre una variable denominada dependiente y
otras denominadas independientes por ejemplo las existentes entre la experiencia
profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de
personas, la produccin agraria y la cantidad de fertilizantes utilizados, etc., puede
darse el problema de que la dependiente asuma mltiples valores para una
combinacin de valores de las independientes.
La dependencia a la que hacemos referencia es relacional matemtica y no
necesariamente de causalidad. As, para un mismo nmero de unidades
producidas, pueden existir niveles de costo, que varan empresa a empresa.
Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresin
en los cuales se obtiene una nueva relacin pero de un tipo especial
denominado funcin, en la cual la variable independiente se asocia con un
indicador de tendencia central de la variable dependiente. Cabe recordar que en
trminos generales, una funcin es un tipo de relacin en la cual para
cada valor de la variable independiente le corresponde uno y slo un valor de la
variable dependiente.
En la regresin lineal mltiple vamos a utilizar ms de una variable
explicativa; esto nos va a ofrecer la ventaja de utilizar ms informacin en la
construccin del modelo y, consecuentemente, realizar estimaciones ms
precisas.
Al tener ms de una variable explicativa (no se debe de emplear el trmino
independiente) surgirn algunas diferencias con el modelo de regresin lineal
simple.
Una cuestin de gran inters ser responder a la siguiente pregunta: de un
vasto conjunto de variables explicativas: x1, x2, , xk, cules son las que ms
influyen en la variable dependiente Y.

REGRESIN LINEAL.

En Estadistica la regresion lineal o ajuste lineal es un metodo matematico que


modela la relacion entre una variable dependiente Y, las variables independientes
Xi y unb termino aleatorio .
Regresion lineal simple
Tiene como objeto estudiar cmo los cambios en una variable, no aleatoria,
afectan a una variable aleatoria, en el caso de existir una relacin funcional entre
ambas variables que puede ser establecida por una expresin lineal, es decir, su
representacin grfica es una lnea recta. Cuando la relacin lineal concierne
al valor medio o esperado de la variable aleatoria, estamos ante un modelo
de regresin lineal simple. La respuesta aleatoria al valor x de la variable
controlada se designa por Yx y, segn lo establecido, se tendr.

De manera equivalente, otra

formulacin del modelo de regresin lineal

simple sera: si xi es un valor de la variable predictora eYi la variable respuesta


que le corresponde, entonces.

Ei es el error o desviacin aleatoria de Yi.


Estimacin de los parmetros de la recta de regresin.
El primer problema a abordar es obtener los estimadores de los parmetros de la
recta de regresin, partiendo de una muestra de tamao n, es decir, n pares (x1,

Y1), (x2, Y2),..., (xn, Yn); que representan nuestra intencin de extraer para
cada xi un individuo de la poblacin o variable Yi .
Una vez realizada la muestra, se dispondr de n pares de valores o puntos del
plano (x1, y1), (x2, y2),..., (xn, yn). El mtodo de estimacin aplicable en regresin,
denominado de los mnimos cuadrados, permite esencialmente determinar la recta
que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Las estimaciones
de los parmetros de la recta de regresin obtenidas con este procedimiento son:

Por tanto la recta de regresin estimada ser:

Un ejemplo.
La recta de regresin representada corresponde a la estimacin obtenida a partir
de 20 pares de observaciones: x representa la temperatura fijada en un recinto
cerrado e Y el ritmo cardaco de un vertebrado.

ANLISIS ESTADSTICO: REGRESIN LINEAL SIMPLE


En el estudio de la relacin funcional entre dos variables poblacionales, una
variable X, llamada independiente, explicativa o de prediccin y una variable Y,
llamada dependiente o variable respuesta, presenta la siguiente notacin:
Y=a+bX+e
Donde:
a es el valor de la ordenada donde la lnea de regresin se intercepta con el eje Y.
b es el coeficiente de regresin poblacional (pendiente de la lnea recta)
e es el error
SUPOSICIONES DE LA REGRESIN LINEAL
1.

Los valores de la variable independiente X son fijos, medidos sin error.

2.

La variable Y es aleatoria

3.

Para cada valor de X, existe una distribucin normal de valores de Y


(subpoblaciones Y)

4.

Las variancias de las subpoblaciones Y son todas iguales.

5.

Todas las medias de las subpoblaciones de Y estn sobre la recta.

6.

Los valores de Y estn normalmente distribuidos y son estadsticamente


independientes.

ESTIMACIN DE LA ECUACIN DE REGRESIN MUESTRAL


Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,
encontrar los valores de a y b con los datos observados de la muestra.
El mtodo de estimacin es el de Mnimos Cuadrados, mediante el cual se
obtiene:

Luego, la ecuacin de regresin muestral estimada es

Que se interpreta como:


a es el estimador de a
Es el valor estimado de la variable Y cuando la variable X = 0
b es el estimador de b , es el coeficiente de regresin
Est expresado en las mismas unidades de Y por cada unidad de X. Indica el
nmero de unidades en que vara Y cuando se produce un cambio, en una unidad,
en X (pendiente de la recta de regresin).
Un valor negativo de b sera interpretado como la magnitud del decremento en Y
por cada unidad de aumento en X.
ANTECEDENTES DEL PROBLEMA
Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y,
kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente
se observ el peso de una persona seleccionada de entre el grupo con dicha
estatura, resultando:
X

152

155

50

61.5

Con estos datos vamos a plantear una ecuacin de regresin simple que nos
permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y
contrastaremos nuestra hiptesis con la prueba F.
DESARROLLO

Representacin matemtica y grfica de los datos:


Representacin Matemtica
Estatura
datos

152

155

152

155

157

152

157

165

162

10

178

11

183

12

178

Representacin Grfica

HIPTESIS
HO: No hay relacin entre el variable peso y la variable estatura.
HA: Hay relacin entre la variable peso y la variable estatura.
Tabla de anlisis de varianza
Fuente de
Variacin
Debido a
la regresin
error
total
Se obtiene un valor F = 73.08 > 4.96, con lo cual se rechaza la hip tesis nula y
aceptamos que la variable estatura est relacionada con la variable peso con un
95% de confianza.

De acuerdo al desarrollo matemtico hemos obtenido los siguientes


clculos:

Lo que nos permite obtener los coeficientes a y b.


Luego,
b = 1223 / 1409.667 = 0.8676
a = 65.25 (0.8676) (162.167) = -75.446

REGRESIN LINEAL MLTIPLE


La regresin lineal mltiple estima los coeficientes de la ecuacin lineal, con una o
ms variables independientes, que mejor prediga el valor de la variable
dependiente. Por ejemplo, se puede intentar predecir el total de facturacin
lograda por servicios prestados en una IPS cada mes (la variable dependiente) a
partir de variables independientes tales como: Tipo de servicio, edad, frecuencia
del servicio, tipo de usuario y los aos de antigedad en el sistema del usuario.
Clases de Regresin
La regresin puede ser Lineal y Curvilnea o no lineal, ambos tipos de regresin
pueden ser a su vez:
a.

Esta regresin se utiliza con mayor frecuencia en las ciencias econmicas,


y sus disciplinas tecnolgicas. Cualquier funcin no lineal, es lineal izada para
su estudio y efectos prcticos en las ciencias econmicas, modelos no lineales
y lineales multi ecuacionales.
Objetivo:
Se utiliza la regresin lineal simple para:
1.- Determinar la relacin de dependencia que tiene una variable respecto a
otra.
2.- Ajustar la distribucin de frecuencias de una lnea, es decir, determinar la
forma de la lnea de regresin.
3.-

Predecir

un

dato

desconocido

de

una

variable

partiendo

de

los datos conocidos de otra variable.


Por ejemplo: Podra ser una regresin de tipo lineal:
En una empresa de servicio de Internet busca relacionar las ganancias que
obtiene cada computadora con el numero de usuarios que ingresan a dicha
cabina diariamente. En la tabla representa Y (Ganancias S/.) e X (Numero de
usuarios)

100

98

116

96

Coeficiente de Regresin
Indica el nmero de unidades en que se modifica la variable dependiente "Y"
por efecto del cambio de la variable independiente "X" o viceversa en una
unidad de medida.
Clases de coeficiente de Regresin:
El coeficiente de regresin puede ser: Positivo, Negativo y Nulo.
Es positivo cuando las variaciones de la variable independiente X son
directamente proporcionales a las variaciones de la variable dependiente "Y"
Es negativo, cuando las variaciones de la variable independiente "X" son
inversamente proporcionales a las variaciones de las variables dependientes
"Y"
Es nulo o cero, cuando entre las variables dependientes "Y" e independientes
"X" no existen relacin alguna.

Procedimiento para hallar el Coeficiente de Regresin


Para determinar el valor del coeficiente de regresin de una manera fcil y
exacta es utilizando el mtodo de los Mnimos Cuadrados de dos maneras:
1.- Forma Directa
De la ecuacin de la recta:

Si

, se obtienen a partir de las ecuaciones normales:

Aplicando normales Y sobre X tenemos:

El Coeficiente de Regresin es

De la misma manera la recta de regresin de "X" sobre "Y" ser dada de la


siguiente manera:

Dnde:

se obtienen a partir de las ecuaciones normales:

Aplicando normales X sobre Y tenemos:

2.- Forma Indirecta del Mtodo de los Mnimos Cuadrados.


El fundamento de este mtodo es de las desviaciones de X respecto a su
media aritmtica. X

Ecuacin de y sobre x Ecuacin de y sobre x


Dnde:

X, y = desviaciones
X = media aritmtica
Y = media aritmtica
b.

Regresin

Simple:

Este

tipo

se

presenta

cuando

una

variable

independiente ejerce influencia sobre otra variable dependiente. Ejemplo: Y =


f(x)
c.

Regresin Mltiple: Este tipo se presenta cuando dos o ms variables


independientes influyen sobre una variable dependiente. Ejemplo: Y = f(x, w, z).

Por ejemplo: Podra ser una regresin de tipo mltiple:


Una Empresa de desarrollo de software establece

relacionar

sus Ventas en

funcin del nmero de pedidos de los tipos de software que desarrolla ( Sistemas,
Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el
presente ao.
En la Tabla representa Y (Ventas miles de S/.) e X (N pedidos de sistemas), W (N
de pedidos de Aplicaciones Educativas) y Z (N de pedidos de Automatizaciones
empresariales).
Y

440

455

50

40

105

140

75

68

Objetivo: Se presentara primero el anlisis de regresin mltiple al desarrollar y


explicar el uso de la ecuacin de regresin mltiple, as como el error estndar
mltiple de estimacin. Despus se medir la fuerza de la relacin entre las
variables independientes, utilizando los coeficientes mltiples de determinacin.
Anlisis de Regresin Mltiple
Dispone de una ecuacin con dos variables independientes adicionales:

Se puede ampliar para cualquier nmero "m" de variables independientes:

Para poder resolver y obtener

en una ecuacin de regresin mltiple

el clculo se presenta muy tediosa porque se tiene atender 3 ecuaciones que se


generan por el mtodo de mnimo de cuadrados:

Para poder resolver se puede utilizar programas informticos como AD+, SPSS y
Minitab y Excel.
El error estndar de la regresin mltiple
Es una medida de dispersin la estimacin se hace ms precisa conforme el grado
de dispersin alrededor del plano de regresin se hace ms pequeo.
Para medirla se utiliza la frmula:

Y: Valores observados en la muestra


: Valores estimados a partir a partir de la ecuacin de regresin
n : Nmero de datos

m : Nmero de variables independientes


El coeficiente de determinacin mltiple
Mide la tasa porcentual de los cambios de Y que pueden ser explicados por
,

simultneamente.

APLICACION DE REGRESION MULTIPLE


Mediante el siguiente problema podremos ilustrar la aplicacin de Regresin
Mltiple:
En la Facultad de Ingeniera de Sistemas y Computo de la Universidad "Inca
Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los
alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar
una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas
de Algoritmos, Base de Datos y Programacin como se muestran en el siguiente
cuadro.
Alumno

PHP

13

13

13

15

16

15

12

13

13

10

13

11

11

12

14

13

15

14

15

15

15

Lo que buscamos es construir un modelo para determinar la dependencia que


exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo
las notas de las asignaturas Algoritmos, Base de Datos y Programacin.
Se presentara la siguiente ecuacin a resolver:

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja
de Clculo de Excel podemos calcular tambin los coeficientes de regresin:

Por lo tanto podemos construir la ecuacin de regresin que buscamos:

El Error Estndar de Regresin Mltiple


Mediante esta medida de dispersin se hace ms preciso el grado de dispersin
alrededor del plano de regresin, se hace ms pequeo.
Para calcularla se utiliza la formula siguiente:

En los resultados de Excel se llama error tpico y para explicar la relacin del
aprendizaje de PHP que se viene desarrollando es de 0.861

El coeficiente de determinacin mltiple (r2)


Utilizaremos para determinar la tasa porcentual de Y para ser explicados las
variables mltiples, utilizando la si siguiente formula:

Regresin exponencial

Ser aquella en la que la funcin de ajuste ser una funcin exponencial del tipo
y = a.bx
La regresin exponencial aunque no es lineal es linealizable tomando logaritmos
ya que haciendo el cambio de variable
v = log y tendremos que la funcin anterior nos generara:

v = log y = log (a.bx) = log a + x log b


La solucin de nuestro problema vendra de resolver la regresin lineal entre v x,
y una vez obtenida supuesta sta:
v* = A + B x; obviamente la solucin final ser:
a = antilog A y b = antilog B.
Una regresin exponencial es el proceso de encontrar la ecuacin de la funcin
exponencial que se ajuste mejor a un conjunto de datos.

Ejemplo:
Considere el conjunto de datos. Determine la regresin exponencial para el
conjunto.
(0, 3), (1, 7), (2, 10), (3, 24), (4, 50), (5, 95)

Introduzca las coordenadas en x y las coordenadas en yen su calculadora y


realice una regresin exponencial. La ecuacin de la funcin que mejor se
aproxima al punto es

Realice la grfica. Obtenemos una grfica como esta.

CONCLUSIN
El anlisis de regresin lineal es una tcnica estadstica utilizada para estudiar la
relacin entre variables. Se adapta a una amplia variedad de situaciones. En la
investigacin social, el anlisis de regresin se utiliza para predecir un amplio
rango de fenmenos, desde medidas econmicas hasta diferentes aspectos del
comportamiento humano. En el contexto de la investigacin de mercados puede
utilizarse para determinar en cual de diferentes medios de comunicacin puede
resultar ms eficaz invertir; o para predecir el numero de ventas de un
determinado producto.
la regresin lineal es un procedimiento estadstico que busca establecer una
relacin

directa

inversa

entre

dos

mas

variables.

La regresin lineal presenta la ventaja de que puedes hacer una prediccin del
comportamiento de alguna variable en un determinado punto o momento.
El analisis de regresion lineal puede utilizarse para explorar y cuantificar la
relacion entre una variable llamada dependiente o criterio (Y) y una o mas
variables llamadas independientes o predictoras (X 1, X2,, Xk), as como para
desarrollar una ecuacin lineal con fines predictivos.

S-ar putea să vă placă și