Sunteți pe pagina 1din 5

Regresin lineal

En estadstica la regresin lineal o ajuste lineal es un modelo matemtico usado para aproximar la
relacin de dependencia entre una variable dependienteY, las variables independientes Xi y un
trmino aleatorio . Este modelo puede ser expresado como:
{\displaystyle Y_{t}=\beta _{0}+\beta _{1}X_{1}+\beta _{2}X_{2}+\cdots +\beta

_{p}X_{p}+\varepsilon }
donde:
{\displaystyle Y_{t}}: variable dependiente, explicada o regresando.
{\displaystyle X_{1},X_{2},\cdots ,X_{p}}: variables explicativas, independientes o regresores.
{\displaystyle \beta _{0},\beta _{1},\beta _{2},\cdots ,\beta _{p}}: parmetros, miden la influencia
que las variables explicativas tienen sobre el regrediendo.
donde {\displaystyle \beta _{0}} es la interseccin o trmino "constante", las {\displaystyle \beta
_{i}\ (i>0)} son los parmetros respectivos a cada variable independiente, y {\displaystyle p} es el
nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal
puede ser contrastada con la regresin no lineal.
Historia[editar]
La primera forma de regresin lineal documentada fue el mtodo de los mnimos cuadrados que
fue publicada por Legendre en 1805, Gauss public un trabajo en donde desarrollaba de manera
ms profunda el mtodo de los mnimos cuadrados,1 y en dnde se inclua una versin
del teorema de Gauss-Mrkov.
El trmino regresin se utiliz por primera vez en el estudio de variables antropomtricas: al
comparar la estatura de padres e hijos, donde result que los hijos cuyos padres tenan una
estatura muy superior al valor medio, tendan a igualarse a ste, mientras que aquellos cuyos
padres eran muy bajos tendan a reducir su diferencia respecto a la estatura media; es decir,
"regresaban" al promedio.2 La constatacin emprica de esta propiedad se vio reforzada ms tarde
con la justificacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de tcnicas de regresin, que emplean
modelos basados en cualquier clase de funcin matemtica. Los modelos lineales son una
explicacin simplificada de la realidad, mucho ms giles y con un soporte terico mucho ms
extenso por parte de la matemtica y la estadstica.

1.ejemplo
El coeficiente de correlacin provee una medida de como dos variables aleatorias
estn asociadas en una "muestra". Es tambin una medida de la intensidad de la
relacin lineal entre X e Y.
Regresin entre dos variables
Este tipo se presenta cuando dos o ms variables independientes influyen sobre
una variable dependiente. Ejemplo: Y = f(x, w, z).
Por ejemplo: Podra ser una regresin de tipo mltiple:
Una Empresa de desarrollo de software establece relacionar sus Ventas en
funcin del numero de pedidos de los tipos de software que desarrolla (Sistemas,
Educativos y Automatizaciones Empresariales), para atender 10 proyectos en el
presente ao.
En la Tabla representa Y (Ventas miles de S/.) e X (N pedidos de sistemas), W (N
de pedidos de Aplicaciones Educativas) y Z (N de pedidos de Automatizaciones
empresariales).
2. Ejemplos tericos
1. El profesor Isaac Asimov fue uno de los escritores ms prolficos de
todos los tiempos. Para cuando muri (1992) haba escrito casi 500 libros a lo
largo de una carrera de 40 aos. De hecho, a medida que avanzaba en su
profesin se volvi ms productivo en trminos de la cantidad de libros escritos en
un lapso dado. Estos datos son los tiempos que requera para escribir sus libros,
en incrementos de 100:
Nmero de libros 100 200 300 400 490
Tiempo (en meses) 237 350 419 465 507

a) Grafique la cantidad acumulada de libros en funcin del tiempo mediante un


diagrama de dispersin.
tiempo en meses
cantidad de libros
500400300200100
500
450
400
350
300
250
200
cantidad acumulada de libros
b) Describa la productividad del profesor Asimov con base al conjunto de
datos graficados en el inciso a). La relacin entre las dos variables parece ser
lineal?
Al parecer la relacin entre las dos variables si tiene signos de ser lineal, esto se
comprueba con tan solo mirar el diagrama de dispersin y darse cuenta de que los
puntos en el diagrama forman una lnea casi recta en aumento con relacin al
tiempo en meses y la cantidad de libros.

Regresin Cuadrtica
La regresin cuadrtica es el proceso por el cul encontramos los parmetros de una parbola que
mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo.
Bueno, pero por que habramos de querer ajustar nuestros datos precisamente a una parbola y
no a otra funcin? (ver escogiendo la funcin de ajuste).

Una funcin cuadrtica o de segundo grado se puede


representar de manera genrica como :

Entonces lo que nos interesa es encontrar los valores de a,


b y c que hacen que el valor de y calculado sea lo mas cercano
posible al medido.
Deduccin de las Ecuaciones:

De nuevo hacemos una definicin de la funcin de error, y encontramos los valores de los
parmetros que la minimizan, tomando derivadas parciales de la funcin por cada parmetro que
haya:

Ejemplo 1:
Considere el conjunto de datos. Determine la regresin cuadrtica
para el conjunto.
(-3, 7.5), (-2, 3), (-1, 0.5), (0, 1), (1, 3), (2, 6), (3, 14)
Introduzca las coordenadas en x y las coordenadas en y en su
calculadora y realice una regresin cuadrtica. La ecuacin de la
parbola que mejor se aproxima al punto es

Realice la grfica. Obtendr una grfica como esta.

Puede ver que el valor de R 2 para los datos es 0.9942.


REGRESIN EXPONENCIAL

Ser aquella en la que la funcin de ajuste ser una


funcin exponencial del tipo

y = a.bx

La regresin exponencial aunque no es lineal es


linealizable tomando logaritmos ya que haciendo el
cambio de variable
v = log y tendremos que la funcin anterior nos generara:

v = log y = log( a.bx) = log a + x log b

la solucin de nuestro problema vendra de resolver la regresin lineal


entre v x, y una vez obtenida supuesta sta:
v* = A + B x ; obviamente la solucin final ser:

a = antilog A y b = antilog B.

Ejemplo 1: Calculando SSE para una recta dada


Supngase que nos gustara calcular SSE para una recta especifica, como y=x+300 como mostrada
ms abajo:

Tenemos la siguiente tabla de valores:


Principio del formulario
y Observado y Pronosticado Error residual
x y
y =x+300 yy
160 126 140 -14
180 103 120 -17
200 82 100 -18

220 75

240 82

260 40

280 20
Final del formulario
Entonces, para la recta y=x+300
SSE = Suma de los valores de errores residuales
= - 14 - 17 - 18 - 5 + 22 + 0 + 0
= -32

P Muy bien. Ahora sabemos como se calcula el valor de SSE para una recta ya dada. Como
hallamos la recta de mejor ajuste; es decir, la recta para que SSE es lo menor?
R Presentaremos aqu la formula que la determina. Justificarla necesita clculo; puede consultar el
capitulo de funciones de varias variables en Clculo Aplicado para una explicacin detallada.
Recta de regresin (o mejor ajuste)
La recta que se ajusta mejor a los n puntos (x1 y1) (x2 y2) (xn yn) tiene la forma
y=mx+b
donde
Pendiente=m=n (x2) x 2n xy x y
Interseccin=b=n ym x
Aqu, significa "la suma de." As,
xy= suma del productos =x1y1+x2y2+ +xnyn x= suma del valores de x=x1+x2+ +xn
y= suma del valores de y=y1+y2+ +yn x2= suma del valores de x2=x21+x22+ +x2n
El uso de las formulas as bastante fcil, como se muestra el siguiente ejemplo.
Ejemplo 2: Calculando la recta de regresin a mano xx yy xyxy x2x2
Determine la recta de regresin asociada a los siguientes 1 1.5
datos:
Solucin Para aplicar las formulas, es mejor organizar los 2 1.6
datos en forma de tabla como sigue: (Cuando ha rellenado
los valores de xy y x2 correctamente, pulse "Sumas" para 3 2.1
obtener la suma de cada columna.) 4 3.0
Principio del formulario
Final del formulario x= 10 y= 8.2 xy= x2=
Sustituyendo los valores correctos de la tabla ms arriba en las formulas, obtenemos
Pendiente=m=n (x2) x 2n xy x y =4(30)1024(23)(10)(8 2)=0
5 Interseccin=b=n ym x =48 2(0 5)(10)=0 8
Por lo tanto, la recta de regresin es
y=0 5x+0 8
Antes de seguir... Aqu esta una traza de los pontos de dados y la
recta de regresin.

Observe que ni siquiera pasa la recta por uno de los puntos, pero es
la recta que se ajusta mejor a los puntos.