Sunteți pe pagina 1din 14

Tema :

REGRESION LINEAL SIMPLE

OBJETIVO :
- Aprender como se puede aplicar el analisis de regresion para plantear
una ecueacion que relaciona dos variables.
Muchas veces las decisiones gerenciales se basan en la relacion entre dos o mas
variables.. Por ejemplo, despues de revisar la relacion entre los gastos de publicidad y
las ventas , un gerente de mercadotecnia podria tratar de predecir las ventas para
determinado nivel de gasto de publicidad. En otro caso , una empresa de electricidad
podria usar la relacion entre la temperatura maxima diaria y la demanda de
electricidad para predecir el consumo de energia en base a temperaturas maximas
pronosticadas ……podemos emplear un procedimiento estadistico llamado analisis de
regresion para plantear una ecuacion que muestre como dependen las variables entre
si.

El modelo de regresion Lineal Simple.

Describiremos el caso de Pizzerias Armand, cadena de restaurantes de comida italiana


que abarca 5 estados. Los lugares donde sus establecimientos han tenido mas exito
estan mas cercanos a establecimientos de educacion superior. Los administradores
creen que las ventas trimestrales en esps restaurantes (representadas por y) , se
relacionan en forma positiva con la poblacion estudiantil (representada por x) .

Aplicando el analisis de regresion podremos plantear una ecuacion que muestre como
se relaciona la variable dependiente y con la variable independiente x.
Modelo y ecuacion de regresion :

En el ejemplo de la pizzeria , cada restaurante esta asociado con una valor de x


(poblacion estudiantil) y un valor correspondiente de y. (Ventas).
La ecuacion que describe como se relaciona y con x y con un termino de error se
llama modelo de regresion.

En este modelo , y es una funcion lineal de x (la parte ) mas ε. Los


primeros se les llama parametros del modelo y ε es una variable aleatoria. Este
termino de error explica la variabilidad en y que no se puede explicar con la relacion
lineal entre y y x.

Ecuacion estimada de regresion


Si se conociaran los valores de los parametros βo y β1 , podriamos usar la ecuacion
arriba para calcular el valor medio de y para determinado valor de x.
desafortunadamente , los valores de estos parametros no se conocen en la practica, y
se deben estimar usando datos de la muestra. Se calculan estadisticos de la muestra
(denotados por bo y b1) como estimaciones de los parametros βo y β1.
Al sustituir estos valores obtenemos la ecuacion de regresion lineal simple.

Importante*
Lineas Posibles de regresion en la regresion lineal simple.
Metodos de los cuadrados minimos para calcular los parametros de la ecuacion de
regresion lineal.

Para ilustrar este metodo, supongamos que se reunieron datos de una muestra de 10
restaurantes :

a) Encotramos el diagrama de dispersion (graficarla), el cual nos permite ver


graficamente los datos y sacar conclusiones preliminares acerca de la posible
relacion entre las variables.
b) Empleamos el metodo de los cuadrados minimos para encontrar los parametros de
la ecuacion de regresion
Donde es el valor observado de la variable dependiente y es el valor estimado de
la variable dependiente
Despues de calculos difernciales , obtenemos las siguientes ecuaciones :
Calculos para la ecuacion estimada de regresion :
Tema :
Coeficiente de Correlacion

OBJETIVO :
- Entender el concepto del coeficiente de correlacion como medida
Descriptiva de la intensidad de la asociacion lineal entre dos variables x y y.
Entender el concepto de coeficiente de determinacion :

En el ejemplo de pizzeria, se dedujo la ecuacion de regresion


Para aproximar la relacion lineal entre el tamaño de la poblacion de estudiantes y la
ventas. Ahora la pregunta es : que tan bien se ajusta a los datos esta ecuacion de
regresion ?
Para responder esta pregunta debemos calcular el error que se comete al usar esta
ecuacion de regresion. A esta cantidad se le conococe con el nombre de suma de
cuadrados debido al error. Se represente por medio de SSE (Sum of squares due to errror)

SSE :

El valor de SSE es una medida del error que se comete al usar la ecuacion de regresion
para calcular los valores de la variable dependiente en la muestra.
Calculo de SSE para pizzeria Armands :

SSE : 1,530
Ahora supongamos que queremos determinar un estimado de las ventas sin conocer el
tamano de la poblacion de estudiantes. Sin conocer alguna de las variables
relacionadas usariamos la media de las muestras como estimado de las ventas en
cualquier restaurante.
En este ejemplo, este valor medio de las ventas es 1,300/10= 130.
En la siguiente tabla mostramos la suma de las desviaciones elevadas al cuadrado,
obtenida usando la media de la muestra. A la suma correspondiente de cuadrados, se
le llama suma total de cuadrados. STT (Sum of squares total)

STT :

SST = 15,730
En la siguiente figura se muestra la linea de regresion estimada y la que corresponde a
la media. Observe que los puntos se agrupan mas estrechamente alrededor de la linea
estimada de regresion que la linea y=130. por ejemplo para el decimo restaurante se ve
claro que el error es mucho mas grande cuando y = 130 se usa como estimado de y10
que cuando se usa la ecuacion de regresion. Podemos imaginar que SST es una
medida de lo bien que las observaciones se agrupan en torno a la recta y = x , y que
SSE mide lo bien que las observaciones se agrupan en torno a la ecuacion de regresion.
Para medir cuanto se desvian los valores de y medidos en la linea de regresion , de los
valores de la media , se calcula otra suma de cuadrados. A esta suma se le llama
suma de cuadrados debido a la regresion y se representa por SSR (Sum of squares due to
regression)

SSR = SST – SSE

En el ejemplo de la pizzeria, SSR = 14,200.

Calculando el coeficiente de determinacion :


Es la relacion entre SSR y SST . (Valores entre 0 y 1)

El coeficiente de determinacion para el caso de la pizzeria es de 14,200/15,730=0.9027

Coeficiente de correlacion
Es una medida descriptiva de la intensidad de la asociacion lineal entre dos variables, x
y y. Estos valores siempre estan en -1 y 1. un valor de +1 indican que las dos variables
tienen una relacion linal positiva perfecta. Esto es , todos los puntos de datos estan
sobre una linea recta con pendiente positiva. Un valor de -1 indica que x y y tinene una
relacion lineal negativa perfecta y que todos los puntos de datos estan sobre una recta
con pendiente negativa.
Los Valores de coeficiente de relacion cercanos a cero indican que x y y no tienen
relacion.

Coeficiente de correlacion rxy =(signo de b1)√coef. determinacion.


En el ejemplo de la pizzeria el coeficiente de correlacion es √0.9027 = +0.9501. hay una
FUERTE asociacion lineal positiva entre x y y.

Trabajo Pareja Clase 31-Agosto


Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Calcule la ec. De regresion de Y y su grafica , SSE , SST , SSR y coeficiente de correlacion

S-ar putea să vă placă și