Documente Academic
Documente Profesional
Documente Cultură
FACULTAD DE CIENCIAS
NATURALES,MATEMATICAS Y ESTADISTICA
PROGRAMAS DE CIENCIAS ECONOMICAS
DOCENTE:
CARLOS VALDES JIMENEZ
Carlos.valdes@unibague.edu.co
WhatsApp: 3005558466 -3209333703
©Todos los derechos son reservados 2018
INTRODUCCIÓN
En esta sesión consideraremos la situación en la que nos interesa
establecer estadísticamente:
1.Si existe una relación entre dos variables
2.En caso afirmativo, calcular una ecuación que plasme dicha relación.
EJEMPLOS:
¿Existe una relación entre la atención dispersa y el desarrollo de
habilidades psicomotoras?
¿Existe una relación directa entre la edad y el coeficiente intelectual.?
¿Hay alguna relación entre la antigüedad en el trabajo de un empleado y
su desarrollo profesional.
Que tipo de relación se puede establecer entre el peso corporal y el
desarrollo físico.
REGRESION LINEAL SIMPLE
- Nuestro interés por saber si hay una relación entre las variables y en tal
caso determinar cómo es se debe a que existe una variable que nos
interesa medir, a la cual llamamos variable dependiente o variable
respuesta (la representamos como Y )
- Ocurre que Y es difícil o costosa de medir
- Existe otra variable que por sí misma no nos interesa, a la cual
llamamos variable independiente o variable explicativa (representamos
por X )
-Esta variable X es más fácil o menos costosa de medir que Y, además
de que, sospechamos, existe una relación funcional entre ambas
variables
A los modelos estadísticos que nos permiten predecir valores de una
variable, digamos Y, con base en otra, por ejemplo X, se les llama
métodos de regresión
ALGUNOS MODELOS DE REGRESION
REGRESION LINEAL SIMPLE
Eje Y
FUNCION LINEAL
y = a + bx
Ɵ
La pendiente es la
a
tangente del ángulo:
Ordenada al b = 𝜃 = 𝑡𝑎𝑛−1
𝑦
origen 𝑥
Eje X
REGRESIÓN LINEAL
Para poder escoger una recta, se impone una restricción:
-Escogeremos aquella recta que esté “lo más cerca posible” de todos los
puntos
-Matemáticamente, esto se expresa como la recta que minimice las
distancias de los puntos a la recta
- La forma más sencilla de relación entre dos variables es una línea
recta
- Cuando se supone que la relación entre las variables se puede expresar
como una recta, se dice que se tiene un modelo de regresión lineal
- Cuando se tiene solamente una variable explicativa, se dice que se
trata de un modelo de regresión simple
Por tanto, si se cuenta con solamente una variable explicativa y se
supone que la relación de esta con la variable respuesta está dada por
una línea recta, se dice que tenemos un modelo de regresión lineal
simple (RLS).
REGRESIÓN LINEAL SIMPLE
- Cuando la relación entre dos variables es una línea recta, basta con
dos valores para determinar cuál es dicha recta
-PENDIENTE: Es una medida de la inclinación de la recta.
Para nuestro caso lo determina el coeficiente 𝒃𝟏
Si 𝒃𝟏 < 0 la pendiente es:
Negativa, la recta está inclinada hacia abajo (viéndola de izquierda a
derecha)
Si 𝒃𝟏 = 0 la pendiente es:
Cero, la recta es horizontal
Si 𝒃𝟏 > 0 la pendiente es:
Positiva, la recta está inclinada hacia arriba (viéndola de izquierda a
derecha)
-LA ORDENADA AL ORIGEN: Es el valor que nos indica en qué
punto del eje Y pasa la recta es el coeficiente 𝒃𝟎
REGRESIÓN LINEAL SIMPLE
Recta con pendiente negativa
TIPOS DE Eje Y b1< 0
PENDIENTE
Eje X
Eje X Eje X
REGRESION LINEAL SIMPLE
A la relación funcional que se encuentra entre las variables, se le llama
modelo de regresión
Y 1 X 0
Los modelos de regresión tienen como fin determinar los valores de Y
(sin medirlos) a partir de valores de X (los cuales sí medimos)
Esto se hace con base en una muestra n.
Tomando una muestra n, para dos variables que tienen una relación.
𝒙𝒊 𝒚𝒊
𝒙𝟏 𝒚𝟏
𝒙𝟐 𝒚𝟐
𝒙𝟑 𝒚𝟑
𝒙𝟒 𝒚𝟒
𝒙𝒌 𝒚𝒌
𝑥𝑖 𝑦𝑖
REGRESION LINEAL SIMPLE
- Un primer problema que observamos es que habría varias formas de
hacer pasar una recta por entre los puntos
- ¿Cuál de todas ellas deberíamos elegir?
SOLUCION:
-Trazamos una recta que tome la mayoría de puntos.
-La distancia entre los puntos a la derecha y a la izquierda sea casi
igual.
El modelo de regresión general para esta recta es:
Y 1 X 0 ei
Observamos que le sumamos un error de aproximación que es el que
se comete al trazar la recta.
ei Y y
ˆ
REGRESION LINEAL SIMPLE
A estas distancias, se les denomina errores y se les calcula como
ei y y
ˆ
Estas distancias se toman al cuadrado, por lo que a la recta resultante se
le llama “de mínimos cuadrados”
Recordemos que tenemos solamente una muestra, por tanto, la
expresión que calculemos para la recta es una aproximación mediante
estimadores
Para ajustar un modelo de RLS se requiere que a partir de una muestra
de pares de observaciones del tipo (x , y), se calculen estimaciones para
los parámetros 0 y 1
El criterio que se usa para la estimación se llama de “mínimos
cuadrados” porque minimiza la suma de los cuadrados de los errores
n n
e y y
2
2
i i
ˆi
i 1 i 1
REGRESION LINEAL SIMPLE
NOTACIÓN
-En lo sucesivo, utilizaremos la letra griega para
representar los coeficientes del modelo de regresión
lineal
-0 para la ordenada al origen
-1 para la pendiente.
Podemos construir un modelo general para estimar los
valores de Y, si le damos valores a X, así:
Y 1 X 0
-Así que la gráfica queda como sigue:
REGRESION LINEAL SIMPLE
DIAGRAMA DE DISPERSION O NUBE DE PUNTOS
Eje Y Y 1 X 0
MODELO GENERAL
0
Eje X
AJUSTE DE UN MODELO DE RLS
Y 0 1 X
- Donde el término de error contiene todas las variaciones debidas
a todos los factores que influyen en Y ,nuestro modelo no los toma
en cuenta
-A fin de cuentas, lo expresamos como.
yˆi b1 xi b0
-Porque como tenemos solamente una muestra, tendremos
estimaciones de los parámetros b0 y b1
Para determinar los coeficientes b0 y b1 utilizaremos el método de
mínimos cuadrados.
CALCULO DE LA ORDENADA EN Y , bo , b1
Al usar el método de mínimos cuadrados deben resolverse las
ecuaciones simultaneas (1) y (2) para obtener los coeficientes de
regresión y b1 , b0
n n
y
i 1
i b1 xi nb0
i 1
1
n n n
x y
i 1
i i b1 x b0 xi 2
i 1
2
i
i 1
n n x y i i
SCXY x
i 1
i x yi y x
i 1
i yi i 1
n
i 1
2
n
i x
xi i 1
n n
SCX x x
2 2
i
i 1 i 1 n
Formula para el calculo de la ordenada en Yi , bo
b1 y b0 x
donde :
n n
x i y i
x i 1
y y i 1
n n
Ecuación del modelo de regresión lineal de la muestra
La ecuacion para estimar los valores de yi
yˆi b1 xi b0
donde :
yˆi valor pronosticado de yi para la observacion i
xˆi valor pronosticado de xi para la observacion i
ESTIMADORES DE MÍNIMOS CUADRADOS
Donde
2
n
1 n
S xx x xi
2
i
i 1 n i 1
2
n
1 n
S yy y yi
2
i
i 1 n i 1
n
1 n n
S xy xi yi xi yi
i 1 n i 1 i 1
REGRESION LINEAL SIMPLE
-Utilizando procedimientos de cálculo, se puede ver que las
expresiones para los estimadores de mínimos cuadrados para el
modelo de regresión lineal simple son:
b1
S xy b0 y b1 x
S xx
Tenemos 3 formas diferentes de construir nuestro modelo para
estimar los valores de “Y”
El modelo general para estimar los valores de “Y” es:
yˆi b1 xi b0
Y 1 X 0
b0
0
Eje X
REGRESIÓN LINEAL SIMPLE
EJEMPLO: Suponga que se quiere establecer una relación entre la cantidad de
artículos (X) que adquiere una persona en el SUPERMERCADO EL BARATILLO y el
tiempo que dura en la caja registradora (Y).Tomando una muestra de 15 personas que entran
un día cualquiera.
Σ
REGRESION LINEAL SIMPLE
PASO 1: Determinamos cual es la variable independiente y cual es la
variable dependiente.
Para nuestro caso X es el numero de artículos que toma del
SUPERMERCADO que vamos a considerar como variable
independiente.
Vamos a tomar como Y el tiempo que dura en pagar en la caja, la cual
de pende del numero de artículos, esta se considera como variable
dependiente.
PASO 2: Ubicamos los pares de puntos en el plano cartesiano, para
construir el diagrama de dispersión.
PASO 3: Trazamos una línea recta que tome la mayoría de puntos.
PASO 4: Con base en la grafica determinamos los coeficientes 𝛽0 , 𝛽1 .
Medimos con la escala del eje “Y” la distancia al punto de corte de la
recta.
REGRESION LINEAL SIMPLE
Determinando el coeficiente 𝛽0 = 2.Para determinar el valor del
coeficiente 𝛽1 es necesario, tomar dos pares de puntos A(X=7,Y=5) y
B(X= 9,Y=7) que se hallen sobre la recta. Hallamos la pendiente de la
𝑦2 −𝑦1 7−5
recta. 𝑚 = = = 1 donde 𝛽1 = 1, si queremos determinar el
𝑥2 −𝑥1 9−7
angulo θ = 𝑇𝑎𝑛−1 1 donde θ = 45° recordemos que la pendiente 𝑚 es
el grado de inclinación respecto al eje “X”
PASO 5: Tomando la ecuación general de la recta
𝑦2 − 𝑦1 = 𝑚 𝑥2 − 𝑥1 , si remplazamos 𝑚 = 1 y el punto A( 7 , 5 ) en
la ecuación Y−5= 𝑚 𝑋 − 7 ,despejando nos queda Y = X - 2.
Tomando el modelo general Y = 𝛽1 𝑋 + 𝛽0 si comparamos y
remplazamos los coeficientes 𝛽0 = 2 y 𝛽1 = 1, construimos el modelo
general de regresión lineal que es:
Y=𝑋−2
REGRESION LINEAL SIMPLE
DIAGRAMA DE DISPERSION O NUBE DE PUNTOS
MODELO GENERAL Y X 2
𝑦1 = 7
𝑥1 = 9
0 2
CANTIDAD DE ARTICULOS
REGRESION LINEAL SIMPLE
FORMA1: PARA CONSTRUIR UN MODELO PARA ESTIMAR “Y”:
vamos a construir un modelo para estimar los valores de “y”
ˆi b1 xi b0
y
Determinamos los coeficientes 𝑏0 , 𝑏1 ,utilizando la calculadora 𝑓𝑥 − 82𝑀𝑆que
consiste en hallar los valores de: 𝐴 = 𝑏0 y 𝐵 = 𝑏1 , primero borramos la
información con SHIFT MODE 3 = =
Luego pulsamos la función MODE , escogemos la función 3 REG luego
escogemos la función 1LIN lo que hemos hecho es dejar la calculadora en
la función regresión lineal.
Ingresamos los valores 3 , 2 y pulsamos M+ y aparece 1 que
significa que hemos ingresando el primer par de valores, luego continuamos
hasta ingresarlos todos. Si pulsamos SHIFT 1 tenemos las siguientes
opciones xi 2 xi n si pulsamos 2 y le damos = obtenemos el
1 2 3
1 2 3
si pulsamos 2 y le damos = obtenemos el valor de yi , Si
pulsamos SHIFT 2 tenemos las siguientes opciones
x S xn S xn 1
1 2 3
Si cogemos el cursor REPLAY y
yˆ 0.6404 x 1.2757
REGRESION LINEAL SIMPLE
Vamos ha estimar valores de “Y” en la calculadora. Para ello pulsamos 23
Luego pulsamos SHIFT 2 Si cogemos el cursor y
pulsamos por la derecha, hasta llegar a las opciones REPLAY
xˆ yˆ
,marcamos 2 obtenemos el valor estimado de
1 2 yˆ 16.00
Vamos ha estimar valores de “X” en la calculadora. Para ello pulsamos 18
Luego pulsamos SHIFT 2 Si cogemos el cursor y
pulsamos por la derecha, hasta llegar a las opciones REPLAY
xˆ yˆ
1 2 ,marcamos 1 obtenemos el valor estimado de xˆ 26.11
yˆi b1 xi b0
REGRESION LINEAL SIMPLE
Construimos un sistema de ecuaciones de dos por dos así:
n n
y
i 1
i b1 xi nb0
i 1
1
n n n
x y
i 1
i i b1 x b0 xi 2
i 1
2
i
i 1
Como ya tenemos:
σ 𝑥𝑖 =298 σ 𝑥𝑖 2 = 7772 σ 𝑦𝑖 = 210 σ 𝑥𝑖 𝑦𝑖 = 5358 𝑛 = 15
σ 𝑦𝑖 2 = 3714 𝑥ҧ = 19,86 𝑦ത = 14
S xy
b1 b0 y b1 x
S xx
REGRESION LINEAL SIMPLE
Utilizando procedimientos de cálculo, se puede ver que las expresiones
para los estimadores de mínimos cuadrados para el modelo de
regresión lineal simple son: 2
n
1 n
S xx xi xi
2
i 1 n i 1
Remplazando.
1
𝑆𝑥𝑥 = 7772 − 298 2 = 1851,73
15
Ahora determinamos. n
1 n n
S xy xi yi xi yi
i 1 n i 1 i 1
Remplazando.
1
𝑆𝑥𝑦 = 5358 − 298 210 = 1186
15
REGRESION LINEAL SIMPLE
Remplazando el valor de 𝑆𝑥𝑥 y 𝑆𝑥𝑦
1186
𝑏1 = = 0,6404 𝑏0 = 14 − 0,6404 19,8666 = 1,2757
1851,73
Vamos a construir el modelo de estimación. Remplazando el
valor de 𝑏1 = 0,6404 y 𝑏0 = 1,2757 , el modelo para estimar
nos queda así:
𝑦ෝ = 0,6404𝑥𝑖 + 1,2757
Vamos ha suponer que una persona toma 𝑥 = 10 artículos,
queremos estimar el tiempo que dura en la caja.
𝑦ෝ = 0,6404(10) +1,2757 = 5,12 minutos
Vamos ha suponer que una persona dura en la caja 𝑦 = 30
minutos, queremos estimar el numero de artículos que tomo.
30−1,2757
𝑥ො = = 44,85≈ 45 artículos
0,6404
REGRESIÓN LINEAL SIMPLE
FORMA 4: Utilizando Excel construimos la tabla
No. X Y 𝒙𝟐 𝒚𝟐 𝒙. 𝒚
1 3 2 9 4 6
2 5 3 25 9 15
3 7 5 49 25 35
4 9 7 81 49 63
5 11 10 121 100
𝑥. 𝑦
110
6 15 11 225 121 165
7 17 13 289 169 221
8 20 15 400 225 300
9 23 17 529 289 391
10 25 18 625 324 450
11 27 19 729 361 513
12 29 20 841 400 580
13 32 22 1024 484 704
14 35 23 1225 529 805
15
40 25 1600 625 1000
Σ 298 210 7772 3714 5358
REGRESIÓN LINEAL SIMPLE
Tomando la tabla y utilizando Excel determinamos:
σ 𝑥𝑖 2 = 7772, σ 𝑥𝑖 =298, 𝑛 = 15, σ 𝑦𝑖 2 = 3714, σ 𝑦𝑖 = 210, σ 𝑥𝑖 𝑦𝑖 = 5358
Σ𝑥 298
𝑥ҧ = = = 19,8666 o en forma directa 𝑥ҧ =19,866 𝑆𝑥𝑛 = 11,5007
𝑛 15
Σ𝑦 210
𝑦ത = = = 14 o en forma directa 𝑦ത = 14 𝑆𝑦𝑛 = 7,4354
𝑛 15
COEFICIENTES
𝑏0 1,27577765
𝑏1 0,640480991
𝑟 0,990660818
𝑦ො = 0,6404𝑥𝑖 + 1,275777
9.0
8.0
7.0
6.0 Y X 2
5.0
4.0
3.0
2.0
1.0 bo
5 10 15 20
-1.0
0 CANTIDAD DE ARTICULOS
-2.0
EJERCICIO APLICADO
El gerente de una cadena de supermercados desea determinar el efecto del espacio de
anaqueles en las ventas de comida para mascotas, se seleccionó una muestra aleatoria de 20
tiendas del mismo tamaño con los siguientes resultados.
n
SCE y yˆ
2
i 1
n 2
SCT y y
i 1
yˆi b1 xi b0
n 2
SCR yˆ y
i 1
y
Eje X
MEDIDAS DE VARIACION
MEDIA DE LA VARIABLE X MEDIA DE LA VARIABLE Y
σ𝑘1 𝑥𝑖 σ𝑘
1 𝑦𝑖
𝑥ҧ = 𝑦ത =
𝑛 𝑛
VARIANZA DE LA VARIABLE X VARIANZA DE LA VARIABLE Y
2 σ 𝑥𝑖2 −𝑛𝑥ҧ 2 σ 𝑦𝑖2 −𝑛𝑦ത 2
𝑆𝑋 = 𝑆𝑦2 =
𝑛 𝑛
𝑆𝑥 = 𝑆𝑥2 𝑆𝑦 = 𝑆𝑦2
LA COVARIANZA
σ 𝑥𝑖 .𝑦𝑖
𝐶𝑜𝑣 = − 𝑥ഥ. 𝑦ത
𝑛
MEDIDAS DE VARIACION
SUMA DE CUADRADOS TOTAL
Suma de cuadrados total = suma de la regresión + suma de cuadrados
del error
SCT = SCR + SCE
La suma de cuadrados total SCT es igual a la suma a la suma de
cuadrados de la diferencia entre el valor de yi y el promedio de y
2
n
2 yi
n n
SCT yi y yi
2 i 1
i 1 i 1 n
MEDIDAS DE VARIACION
La suma de cuadrados de la regresión SCR es iguala la suma a la suma
ˆ i y el
de cuadrados de la diferencia entre el valor pronosticado de y
promedio de y
SCR = variación explicada o suma de cuadrados de la regresión
2
n
2 yi
b0 yi b1 xi yi i 1
n n n
SCR yˆi y
i 1 i 1 i 1 n
yi
b0 yi b1 xi yi i 1
n n n
yˆ y
2
SCR n
r
2
i 1
n
i 1 i 1
2
yi y
SCT n
yi
2
i 1
n
i 1
i 1
yi
2
n
ERROR ESTANDAR DE LA ESTIMACION
Es el estadístico que mide la variabilidad de los valores de Y reales a
partir de los valores de y pronosticados, con las mismas características
de la desviación estándar.
La desviación estándar alrededor de la recta de regresión se llama
ERROR ESTANDAR DE LA ESTIMACION
n n n n
yi yˆ i b0 yi b1 xi yi
2 2
y
SCE
S yx i 1 i 1 i 1 i 1
yi
yi b1 xi yi i 1
n n
bo
SCR n
r r2 i 1 i 1
2
SCT n
i y
yi2 i 1
n
i 1 n
donde r tiene el signo de b1
CORRELACION MEDICION DE LA FUERZA DE
ASOCIACION
COEFICIENTE DE CORRELACION
En muchas aplicaciones solo nos interesa medir el grado de asociación
entre las variables, y no el uso de una variable para predecir otra. Si el
interés especifico la correlación , se puede calcular el coeficiente de
correlación r de manera directa con la siguiente ecuación.
n n
xi yi
i 1 i 1
n n
SCXY x x y y
i i X Y
i i
n
r i 1
i 1
n n 2 2
SCX SCY
x x . y y
n n
i i
2 2
i i x y
i 1 . i 1
n n
i 1 i 1
i 1
xi
2
n
i 1
yi
2
n
n n
x i y i
x i 1
y i 1
n n
TIPOS DE ASOCIACION ENTRE VARIABLES
CORRELACIÓN NEGATIVA CORRELACIÓN POSITIVA
-1 < r < 0 0<r<1