Sunteți pe pagina 1din 16

1

INSTITUTO TECNOLGICO SUPERIOR


DE LVARADO Campus Medelln

INGENIERA INDUSTRIAL

Materia:
ESTADSTICA INFERENCIAL 2

Semestre Grupo Sistema:


er.
4 Semestre NICO SEMIESCOLARIZADO

Tema:
REGRESIN LINEAL SIMPLE Y MLTIPLE

Producto Acadmico:
INVESTIGACIN

Presenta:
EDGAR PALAYOT LPEZ

Docente:
ING. XCHITL DEL CARMEN ROMERO HIPLITO

MEDELLN DE BRAVO, VER 27 de abril 2017


2

NDICE

INTRODUCCIN......3

1. REGRESIN LINEAL SIMPLE4

1.1 Modelo y Finalidad de la regresin lineal simple..4

1.2 Ecuacin Lineal Simple....5

1.2.1 Mtodo de mnimos cuadrados..6

1.3 Diagrama de dispersin.9

2. REGRESIN LINEAL MLTIPLE10

2.1 Modelo y aplicaciones de la regresin lineal mltiple10

2.1.1 Estimacin de los coeficientes por el mtodo de mnimos cuadrados.11

2.2 Regresin lineal matricial...12

2.2.1 Correlacin mltiple13

2.3 Error tpico de la estimacin14

CONCLUSIN15

BIBLIOGRAFA..16
3

INTRODUCCIN

En esta investigacin, se tocaran los temas de regresin lineal simple y mltiple, que son,

su formulacin y ms especficamente su funcionamiento. En forma ms especfica el anlisis

de correlacin y regresin comprende el anlisis de los datos muestrales para saber qu es y

cmo se relacionan entre si dos o ms variables en una poblacin. El anlisis de correlacin

produce un nmero que resume el grado de la fuerza de relacin entre dos variables; y el

anlisis de regresin da lugar a una ecuacin matemtica que describe dicha relacin. La

tcnica de regresin lineal simple est indicada cuando se pretende explicar una variable

respuesta cuantitativa en funcin de una variable explicativa cuantitativa tambin llamada

variable independiente, variable regresora o variable predictora.

Por ejemplo, se podra intentar explicar el peso en funcin de la altura. El modelo

intentara aproximar la variable respuesta mediante una funcin lineal de la variable

explicativa. A partir de la presente investigacin, se pretende mostrar la aplicacin prctica

de la regresin y correlacin lineal simple y mltiple en la industria. Ya que la aplicacin de

las tcnicas estadsticas contribuyen a la optimizacin de los procesos.


4

1. REGRESIN LINEAL SIMPLE

1.1. Modelo y finalidad de la regresin lineal simple

La finalidad de una ecuacin de regresin es estimar los valores de una variable con base

en los valores conocidos de la otra. Otra forma de emplear una ecuacin de regresin es para

explicar los valores de una variable en trminos de otra. El anlisis de regresin nicamente

indica qu relacin matemtica podra haber, de existir una.

Las suposiciones que se realizan al aplicar las tcnicas de regresin lineal son:

El modelo propuesto es lineal (es decir existe relacin entre la variable explicativa

y la variable explicada, y esta relacin es lineal).

Es decir se asume que:

Variable respuesta = o + variable explicativa. 1+

Siendo 0 el trmino independiente (constante) 1 el coeficiente de regresin de la variable

explicativa (pendiente) y es una variable aleatoria que se llama error residual.

La variable explicativa se ha medido sin error.

El valor esperado de e del modelo es cero.

La varianza de e (y por lo tanto de la variable respuesta) es constante.

Los son independientes entre s.

Si se desean realizar contrastes de hiptesis sobre los parmetros (coeficientes) o


sobre el modelo, tambin es necesario que la distribucin de sea normal.

Para estudiar la validez del modelo es necesario confirmar estas hiptesis mediante el

estudio de los residuos (valores observados - valores predichos): normalidad, tendencias, etc.
5

Cuando no se cumplen los criterios de aplicacin es necesario realizar transformaciones a las

variables, o bien para obtener una relacin lineal o bien para homogeneizar la varianza.

La regresin lineal simple comprende el intento de desarrollar una lnea recta o ecuacin

matemtica lineal que describa la relacin entre dos variables. La regresin puede ser

utilizada de diversas formas. Se emplean en situaciones en la que las dos variables miden

aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o por el

contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo

mismo. (Rojo, 2007, pgs. 4 - 5)

1.2. Ecuacin Lineal Simple

Dos caractersticas importantes de una ecuacin lineal:

La independencia de la recta

La localizacin de la recta en algn punto.

Una ecuacin lineal tiene la forma:

Donde:

Y se lee Y prima, es el valor pronosticado de la variable Y para un valor seleccionado de


X.

a es la ordenada de la interseccin con el eje Y, es decir, el valor estimado de Y cuando


X = 0. Dicho de otra forma, corresponde al valor estimado de Y, donde la recta de regresin
cruza el eje Y, cuando X = 0.
B es la pendiente de la recta, o el cambio promedio en Y por unidad de cambio
(incremento o decremento) en la variable independiente X.

x es cualquier valor seleccionado de la variable independiente.


6

Con esta expresin se hace referencia al proceso matemtico que sirve para ajustar una

lnea recta a travs de un conjunto de datos variables asentados en una grfica de dispersin.

Dicha lnea se conoce como lnea de regresin simple.

El primer paso es recoger datos experimentales correspondientes a n individuos con

informacin de dos variables cuantitativas: una de ellas se considera variable explicativa

(Variable x) y la otra se considera variable respuesta (Variable y). El modelo que se asume

es:

y = o + x 1 +

Los coeficientes o y 1 se estiman por b0 y por b1 a travs del mtodo de mnimos

cuadrados.

1.2.1. Mtodo de mnimos cuadrados

Es el procedimiento ms utilizado por adaptar una recta aun conjunto de punto se le que

conoce como mtodo de mnimos cuadrados. La recta resultante presenta 2 caracterstica

importantes:

Es nula la suma de desviaciones verticales en los puntos a partir de la recta

Es mnima la suma de los cuadrados de dichas desviaciones

Para un valor dado de X, por ejemplo, X1, habr una diferencia entre el valor Y1 y el

correspondiente valor de la curva C. Esta diferencia se denota por D1, que se conoce como

desviacin, error o residuo.


7

De todas las curvas de aproximacin a una serie de datos puntuales la curva que tiene la

propiedad de que: D21 + D22 + ... + D2N Se conoce como Mejor curva de ajuste

La suma de cuadrados de desviacin se le llama suma de cuadrados por falla (SCF). Esta

suma de cuadrados proporciona la medida de que tan bien se ajusta la lnea al conjunto

completo de puntos.

Si la SCF es cero, implica que los puntos caen exactamente sobre la lnea. Por el contrario

entre ms grande es SCF respecto de cero, menor es el ajuste. La recta que tenga una suma

de cuadrados menor para un conjunto de puntos, que cualquier otra lnea recta es la lnea

recta llamada lnea de regresin de los mnimos cuadrados.

Las ecuaciones normales son un conjunto de ecuaciones cuya solucin produce un valor

nico para la pendiente B y la ordenada a asociada con los datos variables. Obtenindose as:

El problema que se plantea es entonces el de cmo calcular las cantidades a y b a partir de

un conjunto de n observaciones:

(X1, Y1)
8

(X2, Y2)
.
(XN, YN)

De forma que se minimice el error. Las etapas en que se divide el proceso que se va a

desarrollar son de forma esquemtica, las que siguen:

1.- Dadas dos variables X, Y, sobre las que se define:

Se mide el error que se comete al aproximar Y mediante calculando la suma de las


diferencias entre los valores reales y los aproximados al cuadrado (para que sean positivas y
no se compensen los errores):

2. Una aproximacin = a + bx de Y, se define a partir de dos cantidades a y b. Se va a

calcular aquellas que minimizan la funcin

3. Posteriormente se encontraran las frmulas para el clculo directo de a y b que sirvan

para cualquier problema.

Ordenada al origen:
9

Pendiente a la recta:

1.3. Diagrama de dispersin

La correlacin, mtodo por el cual se relacionan dos variables se pude graficar con un

diagrama de dispersin de puntos, a la cual muchos autores le llaman nubes de puntos,

encuadrado dentro de un grfico de coordenadas X Y en la cual se pude trazar una recta y

cuyos puntos ms cercanos de una recta hablaran de una correlacin ms fuerte, a esta recta

se le denomina recta de regresin, que puede ser positiva o negativa, la primera contundencia

a aumentar y la segunda en descenso o decreciente.

Tambin se puede describir un diagrama de dispersin en coordenadas cartesianas valores,

en donde la nube de puntos representa los pares de valores.

Grficos de recta de regresin


10

(Gmez, 2012, pgs. 5 - 10)

2. REGRESIN LINEAL MLTIPLE

2.1. Modelo y aplicaciones de la regresin lineal mltiple

En la mayor parte de los problemas que se generan en la industria en que se aplica el

anlisis de regresin, se requiere ms de una variable independiente en el modelo de

regresin. La complejidad de la mayora de los mecanismos cientficos es tal que, con objeto

de estar en condiciones de pronosticar una respuesta, se necesita un modelo de regresin

mltiple.

La regresin mltiple comprende tres o ms variables. Existe solo una variable

dependiente, pero hay dos o ms de tipo independiente. En esta operacin se desarrolla una

ecuacin la cual se puede utilizar para predecir valore de y, respecto a valores dados de la
11

diferencia de variables independientes adicionales a travs de incrementar la capacidad

predicativa sobre la de la regresin lineal simple.

Aunque hay muchos problemas en los cuales una variable puede predecirse con bastante

exactitud en trminos de otra, parece razonable que las predicciones deban mejorar si

adicionalmente se considera informacin relevante.

2.1.1 Estimacin de los coeficientes por el mtodo de mnimos

cuadrados

En el caso de la regresin mltiple la ecuacin se ampla y puede tener ms variables

independientes adicionales. Esto puede ampliarse a cualquier nmero (k) de variables

independientes, siendo la ecuacin general de regresin mltiple:

Donde:

X1, XK son las variables independientes.

a es la interseccin con el eje Y. Es la ordenada del punto de interseccin con el eje Y.


B1 es la variacin neta en Y por cada unidad de variacin en X1 manteniendo X2 constante.
Se denomina coeficiente de regresin parcial, coeficiente de regresin neta, o simplemente
coeficiente de regresin.
BK es el cambio neto en Y para cada cambio unitario en Xk manteniendo X1 constante.
Tambin se le conoce como coeficiente de regresin parcial, coeficiente de regresin neta, o
simplemente coeficiente de regresin.
12

Se pueden aplicar tcnicas de mnimos cuadrados similares para estimar los coeficientes

cuando los modelos lineales involucran potencias y productos de las variables

independientes.

La solucin de este conjunto de ecuaciones de las estimaciones nicas produce los

coeficientes b0, b1, b2,...bK.

2.2 Regresin lineal matricial

Este modelo representa n ecuaciones que describen cmo se generan los valores de

respuesta. Con la notacin matricial, se pueden escribir las ecuaciones.

Dada la complejidad de las matrices, de acuerdo al nmero de variables independientes,

es conveniente resolverlas a travs de un software.


13

2.2.1 Correlacin mltiple

El grado de relacin existente entre tres o ms variables se llama correlacin mltiple. Los

principios fundamentales implicados en los problemas de correlacin mltiple son anlogos

a los de la correlacin simple tratada con anterioridad.

Como se observ en la parte de regresin lineal mltiple, existe una ecuacin de regresin

para estimar una variable dependiente, a partir de variables independientes.

Tambin, como observamos en la parte de regresin lineal mltiple, anlogamente a como

existen las rectas de regresin de mnimos cuadrados de aproximacin a una serie de N datos

puntuales (X, Y) en un diagrama de dispersin de dos dimensiones, existen los planos de

regresin de mnimos cuadrados que se ajustan a una serie de N datos puntuales (X1, X2,

X3) en un diagrama de dispersin de tres dimensiones.

La base del clculo de la correlacin mltiple se basa en la teora de la regresin mltiple,

ya sea por mnimos cuadrados o matricialmente, de acuerdo a nuestra parte de regresin lineal

mltiple.

PLANOS DE REGRESIN Y COEFICIENTES DE CORRELACIN:

Vamos a suponer una ecuacin de regresin para el caso de tres variables, como a

continuacin se indica: X1 = b1.23 + b12.3 X2 + b13.2 X3

Esta ecuacin se llama ecuacin de regresin lineal de X1 sobre X2 y X3; con b1.23,

b12.3, y b13.2 los coeficientes de regresin parcial de acuerdo a la teora de regresin

mltiple. Como observamos, tenemos una variable dependiente X1 y dos variables

independientes X2 y X3. Tomando como referencia esta ecuacin, si los coeficientes de


14

correlacin lineal entre las variables X1 y X2, X1 y X3, X2 y X3 se calculan como en la parte

de correlacin lineal simple y se denotan, respectivamente, por r12, r13, r23 (tambin

llamados coeficientes de correlacin de orden cero), el plano de regresin de mnimos

cuadrados tiene la ecuacin:

2.3 Error tpico de la estimacin

Tomando como base la teora de la regresin lineal simple como una generalizacin de

esta definimos al error de la siguiente manera:

Donde X1 est. Indica los valores de X1 estimados en la recta de regresin.

En trminos de los coeficientes de correlacin r12, r13, y r23, el error tpico de la

estimacin puede calculares por medio de:

(Ballo, 2013, pgs. 10 - 14)


15

CONCLUSIN

Con toda esta informacin, podemos concluir que, el anlisis de regresin y correlacin

lineal constituyen mtodos que se emplean para conocer las relaciones y significacin entre

series de datos. Lo anterior, es de suma importancia para la industria ya que es aqu en donde

se presentan variables de respuesta e independientes las cuales interactan para originar las

caractersticas de un proceso en particular y por ende; analizar, predecir valores de la variable

dependiente y examinar el grado de fuerza con que se relacionan dichas variables.

La regresin lineal simple y la regresin mltiple, analiza la relacin de dos o ms

variables continuas, cuando analiza dos variables a esta se l conoce como variable

bivariantes que pueden corresponder a variables cualitativas. La finalidad de una ecuacin

de regresin es la de estimar los valores de una variable con base en los valores conocidos de

la otra. Del mismo modo, una ecuacin de regresin explica los valores de una variable en

trminos de otra. Es decir, se puede intuir una relacin de causa y efecto entre dos o ms

variables. El anlisis de regresin nicamente indica qu relacin matemtica podra haber,

de existir una.
16

BIBLIOGRAFA

Ballo, A. (02 de Diciembre de 2013). https://www.uam.es. Obtenido de

https://www.uam.es/personal_pdi/ciencias/abaillo/AmbEst/Tema4.pdf

Gmez, J. V. (11 de Enero de 2012). ttps://docs.google.com/. Obtenido de

https://docs.google.com/viewer?a=v&pid=sites&srcid=ZGVmYXVsdGRvbWFp

bnxjYWx2YXJpb3NwZWNpYWwyMDEyfGd4OjQxZmUxNjE4ZTAxYzNmM

DE

Rojo, J. M. (22 de Febrero de 2007). http://humanidades.cchs.csic.es/. Obtenido

de

http://humanidades.cchs.csic.es/cchs/web_UAE/tutoriales/PDF/Regresion_lineal

_multiple_3.pdf

S-ar putea să vă placă și