Sunteți pe pagina 1din 46

Unidad I.

Regresin
lineal simple
H.A. para la toma de decisiones en MKT
Escuela de Economa y Negocios
Universidad Anhuac Cancn

Unidad I. Regresin lineal simple


Contenido:

1.1 Objetivo del anlisis de regresin


1.2 Anlisis de correlacin
1.3 Diagrama de dispersin
1.4 Estimacin por mnimos cuadrados ordinarios
1.5 Evaluacin del modelo
1.6 Bondad de ajuste
1.7 Significacin de la pendiente: Intervalo de
confianza, prueba de hiptesis
1.8 Interpretacin de los coeficientes
1.9 Estimaciones y pronsticos

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


ANTECEDENTES
Las ideas matemticas sobre estos temas y
su desarrollo surgieron de los trabajos de
los cientficos ingleses Francis Galton
(1822-1911) y Karl Pearson(1857-1936),
que las aportaron desde la Biologa y la
Fsica, asociadas a problemas relacionados
con la evolucin y la herencia.

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple

Ejemplo: Elabora el diagrama de


dispersin de los siguientes pares de
datos
donde
x
=
calif.
De
matemticas en 4. Sem y y = calif.
De Estadstica 5. Sem de un grupo
de 10 estudiantes de preparatoria.

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Alumno

Calif. En
Matemticas

Calif. En Estadstica

1
2
3
4
5
6
7
8
9
10

8
9
8
9
5
5
10
9
7
10

8
5
7
7
4
6
10
9
6
7

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Diagrama de dispersin
12
10
8
Estadstica

Vemos que a mayor


2
calificacin
en
0
Matemticas, mayor
4
5
calificacin se obtuvo
en
Estadstica,
aunque no tengan
una
perfecta
relacin.
Escuela de Economa y Negocios

8
7

9
7

10
7

Matemticas

Podramos
ajustar una recta
que
pase
lo11ms
9
10
cerca de todos
los
datos.
La
recta de mejor
ajuste.
Universidad Anhuac

Unidad I. Regresin lineal simple


La recta de mejor ajuste se le conoce
como recta de mnimos cuadrados y
se representar en la forma
= bx + a
donde se le conoce como valor
ajustado, ya que el valor real ser y.
Veamos esto grficamente.
Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Variable dependiente

yj

<

Error de
estimaci La recta de
n = yj - j mejor ajuste
es la que
minimice los
Error de errores de
estimaci estimacin.
n = i - yi

i
yi

<

xi

= bx +
a mnimos cuadrados
Recta de

xj

Variable independiente
Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Mediante mtodo de Clculo Diferencial se
tienen las siguientes frmulas:

XY n X Y

b
X n X
2

a Y bX

X = valores de la var. independiente


Y = valores de la var. Dependiente
X = Media de los valores de X
Y = Media de los valores de Y
n = nmero de puntos de datos (parejas)
Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Diagrama de dispersin
12
10
8
Estadstica

f(x) = 0.63x + 1.83

6
4
2
0
4

10

11

Matemticas

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


La recta de mnimos cuadrados
sirve para predecir, con cierta
aproximacin, los valores de la
variable dependiente (y) en funcin
de los de la variable independiente
(x).
Esto es, sirve para estimar
los
valores reales de y, no observados.
Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


La prediccin o estimacin de un
valor de y puede ser de dos tipos:
a) Interpolacin, si el valor de x se
encuentra entre los lmites de los
datos registrados.
b) Extrapolacin, si el valor de x se
ubica ms all de los datos
observados (por debajo o por
arriba).
Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple

En la ecuacin de la recta de regresin


= bx + a
b, es la pendiente y se le llama coeficiente de
regresin.
Si b > 0, entonces la relacin entre los datos es
directa.
Si b < 0, entonces la relacin entre las variables
es inversa.
El valor de b representa el cambio o incremento
que sufre Y por una unidad de cambio en X
(RAZN DE CAMBIO).
El valor a, se llama constante de regresin

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Cmo se verifica la recta de regresin?

Existen varios mtodos:


1) Revisar el ajuste de forma grfica
2) Analizando la suma de los errores
individuales con los datos
3) Calculando el error estndar de
la estimacin.

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Error estndar de la estimacin de RMC

Se representa como se
o Mide la variabilidad, o dispersin, de
los valores observados alrededor de
la RMC
o Se calcula con la siguiente frmula
o

se
Escuela de Economa y Negocios

(Y Y )

n2

Universidad Anhuac

Unidad I. Regresin lineal simple


Error estndar de la estimacin de RMC
o

Se tambin puede calcularse con la


siguiente frmula compacta:
2
Y
a Y b XY

se
n2

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Error estndar de la estimacin de RMC
o

Ejemplo 1:
Estima el error estndar de
estimacin para las calificaciones de
Matemticas vs. Estadstica y
compara las rectas generadas con
los intervalos de estimacin.

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Error estndar de la estimacin de RMC
El valor
Se = 1.452
indica que
existe un
error estndar
de 1.452
puntos sobre
las
calificaciones
pronosticadas
de Estadstica

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Error estndar de la estimacin de RMC
(Interpretacin)

= bx + a kSe
3S e
S
+a+
x
a+2 e
b
+
=
x

=b
a
Se
bx +
+
=
a

x+
=b
S
+a- e
x
b
a - 2S e
=
+
x
=b
a - 3S e
+
x
=b

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Error estndar de la estimacin de RMC
(Interpretacin)

Se nos da informacin sobre la porcin de datos que


queda comprendida alrededor de la recta de
regresin, es decir:

= bx + a Se abarca aprox. 68% de los datos

= bx + a 2Se abarca aprox. 95.5% de los


datos

= bx + a 3Se abarca aprox. 99.7% de los

datos
Escuela
de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Error estndar de la estimacin de RMC
(Interpretacin)
o

Ejemplo 2:
El director del Depto. De Salubridad de
Chapel Hill est interesado en la relacin
que existe entre la edad de un camin de
basura y los gastos anuales de reparacin
que debera esperar. Con el fin de
determinar dicha relacin, el director ha
acumulado informacin referente a cuatro
de los camiones que la ciudad posee
actualmente.

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Error estndar de la estimacin de RMC
(Interpretacin)

Ejemplo:
Nmero
del
camin

Edad del
camin
en aos (X)

101
102
103
104

5
3
3
1

Gastos de reparacin
durante el ltimo ao
en cientos de dlares
(Y)
7
7
6
4

Tabla 1. Gastos anuales de reparacin de


camiones.

Determina el error estndar de la


estimacin de la RMC

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Condiciones bsicas para la RMC
1)

2)

3)

4)

Para cada valor X existe un grupo de valores


Y, y estos valores Y se distribuyen en forma
normal.
Las medias de estas distribuciones normales
de valores Y se encuentran todas en la lnea
de regresin.
Las desviaciones estndares de dichas
distribuciones normales son iguales.
Los valores Y son estadsticamente
independientes. (En cada muestra
seleccionada)

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Condiciones bsicas para la RMC
Y

Es la misma d.e.
estimada por Sy-x

Una desviacin
estndar

RMC

X1

X2

Escuela de Economa y Negocios

X3

Las tres medias


quedan en la RMC
X
Universidad Anhuac

Unidad I. Regresin lineal simple


Intervalos de Confianza y de Prediccin
Si el tamao de la muestra es grande
Si la dispersin con relacin a la RMC tiene
una distribucin casi normal
Es til establecer intervalos de confianza
para disminuir el error de prediccin por la
variacin de los datos al alejarnos deY .

Hay dos tipos:


Intervalo de confianza (valor medio Y
para X)
Intervalo de prediccin (valores de Y
para
X) y Negocios
Escuela
de Economa
Universidad Anhuac

Unidad I. Regresin lineal simple


Intervalos de Confianza y de Prediccin
El intervalo de confianza para el valor medio de Y
para un valor dado de X se obtiene como:

1
Y 't ( S e )
n

X X

Y ' Valor pronosticado para


X XValor para X
X Media de los datos X
n Nmero de
observaciones
Se Error
estndar de
t estimacin
Valor de t-Student con
n-2 grados de libertad,
dos colas

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Intervalos de Confianza y de Prediccin

Ejemplo:
Nmero
del
camin

Edad del
camin
en aos (X)

101
102
103
104

5
3
3
1

Gastos de reparacin
durante el ltimo ao
en cientos de dlares
(Y)
7
7
6
4

Tabla 1. Gastos anuales de reparacin de


camiones.

Determina un intervalo de confianza al 95% para


todos los vehculos con una antigedad de 4
aos.

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Intervalos de Confianza y de Prediccin

Ejemplo:
Con la ecuacin de regresin, estimamos el valor Y, el
cual result de Y = 0.75(3) + 3.75 = 6.75
Con los n = 4 datos, los g.l. = 4-2 = 2, en la tabla al
95% para t es igual a 4.303
Y dado que el error de estimacin fue Se = 0.8660, se
obtiene el intervalo:

9.03
1 4 3
6.75 4.303(0.866)
6.75 2.28
2
4
4.47

12

44
4
2

Escuela de Economa y Negocios

Universidad Anhuac

Unidad I. Regresin lineal simple


Intervalos de Confianza y de Prediccin

Ejemplo:
De lo anterior, para todos los camiones con 4
aos de antigedad se espera que generen
un gasto de 6.75 cientos de dlares para su
mantenimiento, con una variacin de entre
4.47 hasta 9.03 cientos de dlares.
Y cul ser el intervalo de prediccin para un
camin que tiene exactamente 4 aos de
antigedad?

Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Intervalos de Confianza y de Prediccin


El intervalo de prediccin para un valor dado
de X se obtiene con la misma frmula, salvo
por un 1 que se agrega sumando dentro del
radical

1
Y 't ( S e ) 1
n

Escuela de Economa y Negocios

X X

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Intervalos de Confianza y de Prediccin

Ejemplo:
Aplicando tal variacin a los datos del ejemplo, se
obtiene

11.12
1 4 3
6.75 4.303(0.866) 1
6.75 4.37
2
4
2.38

12

44
4
2

Luego, para un camin en particular de 4 aos, el


costo de reparacin puede variar desde 2.38 hasta
11.12 cientos de dlares, un intervalo muy grande
porque es el estimado para un camin solamente, no
para
todos.
Escuela
de Economa
y Negocios
Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Intervalos de Confianza y de Prediccin


Diferencias:
Intervalo de confianza (valor medio Y
para X). Se refiere a todos los casos con un
valor dado de X y se obtiene con la 1 frmula.
Intervalo de prediccin (valores de Y
para X). Se enfoca a un valor particular dado
de X, por lo que el intervalo tendr una mayor
amplitud, al agregar el 1 en el radical.

Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
Es suficiente la RMC y el error para dar
mayor certidumbre en el anlisis de la
relacin entre datos para obtener nuevas
estimaciones ?

El anlisis de correlacin es la
herramienta estadstica que podemos
usar para describir el grado hasta el
cual una variable (X) est linealmente
relacionada con otra (Y).
Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
El anlisis de correlacin utiliza dos
medidas para describir la relacin entre las
variables:
El coeficiente de determinacin (r2),
principal valor para medir la extensin o
fuerza entre las variables X e Y.
El coeficiente de correlacin (r)*, nos
permite describir qu tan bien una variable
(Y) est explicada por otra (X).
*Desarrollado por Karl Pearson (1900)
Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
El coeficiente de determinacin
(r2),
mide la extensin o fuerza entre las variables
X e Y, analizando la variacin de los valores Y
alrededor de la lnea de regresin y con
relacin a su propia media. Se calcula como:

Y Y

1
Y Y

Escuela de Economa y Negocios

2
2

Es una medida del


grado de asociacin
lineal entre X y Y
r2= Var.Tot.-Var.No Exp.
Var. Tot.
Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
Tambin se calcula de forma prctica como:

r
2

a Y b XY nY

nY

Su interpretacin es:
r2 = 1, es una correlacin perfecta
r2 cercano a uno, Y est fuertemente
relacionado con X.
r2 = 0, NO existe correlacin
Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
Otra interpretacin de r2 es la proporcin o
porcentaje de desviacin explicada e
inexplicada de Y con relacin a X.
Por ejemplo: Si r2 = 0.576, significa que el
57.6% de la variacin en Y es explicada por la
variacin en X.
Veamos ms aplicaciones
Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
Ejercicio 1: Obtener el coeficiente de
determinacin de las calificaciones de Mate
(X) y Estadstica (Y). Describa sus resultados.
Ejercicio 2: Obtener el coeficiente de
determinacin del gasto en mantenimiento
de camiones (Y) y la antigedad del mismo
(X). Describa sus resultados.

Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
El coeficiente de correlacin (r) permite
analizar el tipo de relacin entre X e Y.
Correlacin
negativa
perfecta

Ninguna
correlacin

Correlacin
negativa
intensa

-1.00

Correlacin
positiva
perfecta

Correlacin Correlacin Correlacin Correlacin


negativa
negativa
positiva
positiva
moderada
dbil
moderada
dbil

-0.50
Correlacin negativa

Correlacin
positiva
intensa

0.50
Correlacin positiva

1.00

Fuente: Mason (2001). Estadstica para Admn. y Economa


Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
Ejercicio 3: Resuelve el problema planteado
al inicio del tema, sobre la inversin en
Investigacin y Desarrollo:
a) Elabora el diagrama de dispersin
b) Calcula la recta de regresin y estima
las ganancias al invertir 9 mdd.
c) Obtener el error de estimacin
d) Calcula un intervalo de confianza al
95%
e) Calcula
el
coeficiente
de
determinacin y de correlacin
Escuela de Economa y Negocios
Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
Finalmente, un anlisis prctico es la prueba
de significancia del coeficiente de
correlacin, apoyando suposiciones sobre
correlacin NO nula para TODA la poblacin, o
viceversa.
Se establecen las hiptesis nula y alternativa
H0: 0
Con n-2 g.l. para t-Student
r
n

2
H1: 0
con nivel de significancia
t
2
/2 (dos colas) (una
Y el estadstico
1 r cola)
de prueba es:
Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model

Anlisis de Correlacin
Ejemplo: Para las hiptesis nula y alternativa
H0: 0
H1: > 0
Considere una muestra al azar de 12 datos
con una correlacin de 0.32. Se puede
concluir que la correlacin en la poblacin es
mayor que cero? Aplica un nivel de
significancia de 0.05

Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model
Anlisis de Varianza para la Regresin Lineal

Una vez obtenido el Modelo de Regresin


Lineal, se puede someter a un Anlisis de
Varianza para determinar si el modelo es
significativo o no. Esto es, si influye la
variable X sobre la variable Y.
H0: E(Y/X = x) = a (no depende de X)
H1: E(Y/X = x) = a+bx (s depende de X)

Escuela de Economa y Negocios

Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model
Anlisis de Varianza para la Regresin Lineal

Estas hiptesis se probarn descomponiendo


la suma de cuadrados del total como se
indica
( y y ) ( y y ) ( y y )
i

Suma de
cuadrados
deResiduos
(SCR)

Suma de
cuadrados
Explicada
(SCE)

Suma de
cuadrados
Total (SCT)

( y y) ( y y ) ( y y)
2

g.l. = n-1
Escuela de Economa y Negocios

g.l. = n-2

g.l. = 1
Universidad Anhuac

Unidad II. Regresin lineal simple y


mltiple (CAPM) Capital Assets Price Model
Anlisis de Varianza para la Regresin Lineal

Luego, la tabla ANOVA queda expresada

Calculemos
conEXCEL!
Si Fprueba > Fcrtica, entonces H0 se rechaza y el
modelo S es significativo.
Escuela de Economa y Negocios

Universidad Anhuac

GRACIAS

S-ar putea să vă placă și