Sunteți pe pagina 1din 55

UNIVERSIDAD DE IBAGUE

FACULTAD DE CIENCIAS
NATURALES,MATEMATICAS Y ESTADISTICA
PROGRAMAS DE CIENCIAS ECONOMICAS

DOCENTE:
CARLOS VALDES JIMENEZ
Carlos.valdes@unibague.edu.co
WhatsApp: 3005558466 -3209333703
©Todos los derechos son reservados 2018
INTRODUCCIÓN
En esta sesión consideraremos la situación en la que nos interesa
establecer estadísticamente:
1.Si existe una relación entre dos variables
2.En caso afirmativo, calcular una ecuación que plasme dicha relación.
EJEMPLOS:
¿Existe una relación entre la atención dispersa y el desarrollo de
habilidades psicomotoras?
¿Existe una relación directa entre la edad y el coeficiente intelectual.?
¿Hay alguna relación entre la antigüedad en el trabajo de un empleado y
su desarrollo profesional.
Que tipo de relación se puede establecer entre el peso corporal y el
desarrollo físico.
REGRESION LINEAL SIMPLE
- Nuestro interés por saber si hay una relación entre las variables y en tal
caso determinar cómo es se debe a que existe una variable que nos
interesa medir, a la cual llamamos variable dependiente o variable
respuesta (la representamos como Y )
- Ocurre que Y es difícil o costosa de medir
- Existe otra variable que por sí misma no nos interesa, a la cual
llamamos variable independiente o variable explicativa (representamos
por X )
-Esta variable X es más fácil o menos costosa de medir que Y, además
de que, sospechamos, existe una relación funcional entre ambas
variables
A los modelos estadísticos que nos permiten predecir valores de una
variable, digamos Y, con base en otra, por ejemplo X, se les llama
métodos de regresión
ALGUNOS MODELOS DE REGRESION
REGRESION LINEAL SIMPLE
Eje Y

FUNCION LINEAL
y = a + bx

Ɵ
La pendiente es la
a
tangente del ángulo:
Ordenada al b = 𝜃 = 𝑡𝑎𝑛−1
𝑦
origen 𝑥

Eje X
REGRESIÓN LINEAL
Para poder escoger una recta, se impone una restricción:
-Escogeremos aquella recta que esté “lo más cerca posible” de todos los
puntos
-Matemáticamente, esto se expresa como la recta que minimice las
distancias de los puntos a la recta
- La forma más sencilla de relación entre dos variables es una línea
recta
- Cuando se supone que la relación entre las variables se puede expresar
como una recta, se dice que se tiene un modelo de regresión lineal
- Cuando se tiene solamente una variable explicativa, se dice que se
trata de un modelo de regresión simple
Por tanto, si se cuenta con solamente una variable explicativa y se
supone que la relación de esta con la variable respuesta está dada por
una línea recta, se dice que tenemos un modelo de regresión lineal
simple (RLS).
REGRESIÓN LINEAL SIMPLE
- Cuando la relación entre dos variables es una línea recta, basta con
dos valores para determinar cuál es dicha recta
-PENDIENTE: Es una medida de la inclinación de la recta.
Para nuestro caso lo determina el coeficiente 𝒃𝟏
Si 𝒃𝟏 < 0 la pendiente es:
Negativa, la recta está inclinada hacia abajo (viéndola de izquierda a
derecha)
Si 𝒃𝟏 = 0 la pendiente es:
Cero, la recta es horizontal
Si 𝒃𝟏 > 0 la pendiente es:
Positiva, la recta está inclinada hacia arriba (viéndola de izquierda a
derecha)
-LA ORDENADA AL ORIGEN: Es el valor que nos indica en qué
punto del eje Y pasa la recta es el coeficiente 𝒃𝟎
REGRESIÓN LINEAL SIMPLE
Recta con pendiente negativa
TIPOS DE Eje Y b1< 0

PENDIENTE

Eje X

Recta con pendiente cero Recta con pendiente positiva


Eje Y b1 = 0 Eje Y b1 > 0

Eje X Eje X
REGRESION LINEAL SIMPLE
A la relación funcional que se encuentra entre las variables, se le llama
modelo de regresión
Y  1 X   0
Los modelos de regresión tienen como fin determinar los valores de Y
(sin medirlos) a partir de valores de X (los cuales sí medimos)
Esto se hace con base en una muestra n.
Tomando una muestra n, para dos variables que tienen una relación.
𝒙𝒊 𝒚𝒊
𝒙𝟏 𝒚𝟏
𝒙𝟐 𝒚𝟐
𝒙𝟑 𝒚𝟑
𝒙𝟒 𝒚𝟒
𝒙𝒌 𝒚𝒌
෍ 𝑥𝑖 ෍ 𝑦𝑖
REGRESION LINEAL SIMPLE
- Un primer problema que observamos es que habría varias formas de
hacer pasar una recta por entre los puntos
- ¿Cuál de todas ellas deberíamos elegir?
SOLUCION:
-Trazamos una recta que tome la mayoría de puntos.
-La distancia entre los puntos a la derecha y a la izquierda sea casi
igual.
El modelo de regresión general para esta recta es:

Y  1 X  0  ei
Observamos que le sumamos un error de aproximación que es el que
se comete al trazar la recta.

ei  Y  y
ˆ
REGRESION LINEAL SIMPLE
A estas distancias, se les denomina errores y se les calcula como
ei  y  y
ˆ
Estas distancias se toman al cuadrado, por lo que a la recta resultante se
le llama “de mínimos cuadrados”
Recordemos que tenemos solamente una muestra, por tanto, la
expresión que calculemos para la recta es una aproximación mediante
estimadores
Para ajustar un modelo de RLS se requiere que a partir de una muestra
de pares de observaciones del tipo (x , y), se calculen estimaciones para
los parámetros 0 y 1
El criterio que se usa para la estimación se llama de “mínimos
cuadrados” porque minimiza la suma de los cuadrados de los errores
n n

e   y  y 
2
2
i i
ˆi
i 1 i 1
REGRESION LINEAL SIMPLE
NOTACIÓN
-En lo sucesivo, utilizaremos la letra griega  para
representar los coeficientes del modelo de regresión
lineal
-0 para la ordenada al origen
-1 para la pendiente.
Podemos construir un modelo general para estimar los
valores de Y, si le damos valores a X, así:
Y  1 X   0
-Así que la gráfica queda como sigue:
REGRESION LINEAL SIMPLE
DIAGRAMA DE DISPERSION O NUBE DE PUNTOS
Eje Y Y  1 X  0
MODELO GENERAL

0

Eje X
AJUSTE DE UN MODELO DE RLS

RELACIÓN ENTRE “X” y “Y”


Existe una relación entre X y Y que es lineal, más un
componente de aleatoriedad, al que llamamos error
Es decir, hay una relación entre las variables que se puede
expresar como Y = 0 + 1X + 

DISTRIBUCIÓN DE LOS ERRORES, 


Para cada valor de X, los errores se distribuyen N(0,σ2)
Los errores son independientes entre sí
Los errores son independientes del valor de X
SUPUESTOS BÁSICOS DEL MODELO DE
RLS
El que los errores  se distribuyan N(0,2) tiene como
consecuencia que la variable Y se distribuya N( 0 + 1X, 2)
Esto es importante, porque para que tenga sentido la aplicación
de un modelo de RLS, se requiere que la variable Y sea normal, o
al menos continua y simétrica
Si Y no es continua se requiere utilizar otros modelos de
regresión que no son lineales (por ejemplo, logística)
Se obtiene entonces una recta estimada
yˆi  b1 xi  b0
Se requiere verificar que los datos cumplan los supuestos del
modelo, examinando gráficas y realizando contrastes de
hipótesis
VERIFICACIÓN DE LA VALIDEZ DEL
MODELO
Los errores se distribuyen normal, con media cero, con la
misma varianza:
Normalidad: Gráfico de probabilidad normal, Histograma de
residuos
Media cero: Gráfico de residuos contra la variable
independiente o contra los valores predichos
Varianzas iguales: Ídem
Si ocurre una o más de las siguientes situaciones:
La relación entre las variables no es lineal
Los errores no se distribuyen normal
Los errores no tienen la misma varianza
AJUSTE DE UN MODELO DE RLS
- Si existen violaciones a dichos supuestos, debemos identificarlas
En caso de que sea posible, corrija las violaciones a los supuestos
haciendo transformaciones a los datos (esto no lo haremos en este
curso)
- Se requiere determinar si hay observaciones influyentes o
discrepantes, e identificarlas. En casos extremos, puede existir la
necesidad de eliminarlas del conjunto de datos
- Una vez concluido todo lo anterior, se puede hacer uso del modelo
para pronosticar valores de Y con base en valores de X
La relación entre “X” y “Y” existe y es lineal:
Gráfico de dispersión
Coeficiente de correlación lineal
Coeficiente de determinación
REGRESION LINEAL SIMPLE
EJEMPLO:
- Supongamos que podemos asumir que dicha relación es lineal
(mientras más cosas compre, más se tardará en cobrarle)
-Si la relación fuera perfectamente lineal, la expresión que relaciona a
X con Y sería

Sin embargo, no es realista pensar que la relación sea perfectamente


lineal
Existen otros factores que podrían influir en el tiempo que no estamos
tomando en cuenta:
- El tipo de artículos (no solamente la cantidad)
- Características de la persona que compra
- Características de la cajera que atiende
- La hora del día.
REGRESION LINEAL SIMPLE
- Por tanto, cada observación que hagamos del tiempo (Y), estará
determinada en parte por la cantidad de artículos (X), pero también
tendrá un componente de error
- La expresión que relaciona a Y con X es entonces

Y  0  1 X  
- Donde el término de error  contiene todas las variaciones debidas
a todos los factores que influyen en Y ,nuestro modelo no los toma
en cuenta
-A fin de cuentas, lo expresamos como.
yˆi  b1 xi  b0
-Porque como tenemos solamente una muestra, tendremos
estimaciones de los parámetros b0 y b1
Para determinar los coeficientes b0 y b1 utilizaremos el método de
mínimos cuadrados.
CALCULO DE LA ORDENADA EN Y , bo , b1
Al usar el método de mínimos cuadrados deben resolverse las
ecuaciones simultaneas (1) y (2) para obtener los coeficientes de
regresión y b1 , b0
n n

y
i 1
i  b1  xi  nb0
i 1
1
n n n

x y
i 1
i i  b1  x  b0  xi  2 
i 1
2
i
i 1

Formula para el el cálculo de la pendiente b0


SCXY
b0 
SCX
donde :
n n

n n x y i i
SCXY  x
i 1
i  x   yi  y   x
i 1
i yi  i 1

n
i 1

2
 n 
 i  x
  xi   i 1 
n n
SCX  x  x
2 2
i
i 1 i 1 n
Formula para el calculo de la ordenada en Yi , bo
b1  y  b0 x
donde :
n n

x i y i
x  i 1
y y  i 1

n n
Ecuación del modelo de regresión lineal de la muestra
La ecuacion para estimar los valores de yi
yˆi  b1 xi  b0
donde :
yˆi  valor pronosticado de yi para la observacion i
xˆi  valor pronosticado de xi para la observacion i
ESTIMADORES DE MÍNIMOS CUADRADOS
Donde

2
n
1 n

S xx   x    xi 
2
i
i 1 n  i 1 

2
n
1 n

S yy   y    yi 
2
i
i 1 n  i 1 

n
1  n  n 
S xy   xi yi    xi   yi 
i 1 n  i 1  i 1 
REGRESION LINEAL SIMPLE
-Utilizando procedimientos de cálculo, se puede ver que las
expresiones para los estimadores de mínimos cuadrados para el
modelo de regresión lineal simple son:

b1 
S xy b0  y  b1 x
S xx
Tenemos 3 formas diferentes de construir nuestro modelo para
estimar los valores de “Y”
El modelo general para estimar los valores de “Y” es:

Trazamos la recta para estimar los valores de “Y” tomando cual


quiera par 𝑥𝑘 , 𝑦𝑘 y 𝑥𝑚 , 𝑦𝑚
DIAGRAMA DE DISPERSION
Eje Y

yˆi  b1 xi  b0
Y  1 X  0

b0

0

Eje X
REGRESIÓN LINEAL SIMPLE
EJEMPLO: Suponga que se quiere establecer una relación entre la cantidad de
artículos (X) que adquiere una persona en el SUPERMERCADO EL BARATILLO y el
tiempo que dura en la caja registradora (Y).Tomando una muestra de 15 personas que entran
un día cualquiera.

Σ
REGRESION LINEAL SIMPLE
PASO 1: Determinamos cual es la variable independiente y cual es la
variable dependiente.
Para nuestro caso X es el numero de artículos que toma del
SUPERMERCADO que vamos a considerar como variable
independiente.
Vamos a tomar como Y el tiempo que dura en pagar en la caja, la cual
de pende del numero de artículos, esta se considera como variable
dependiente.
PASO 2: Ubicamos los pares de puntos en el plano cartesiano, para
construir el diagrama de dispersión.
PASO 3: Trazamos una línea recta que tome la mayoría de puntos.
PASO 4: Con base en la grafica determinamos los coeficientes 𝛽0 , 𝛽1 .
Medimos con la escala del eje “Y” la distancia al punto de corte de la
recta.
REGRESION LINEAL SIMPLE
Determinando el coeficiente 𝛽0 = 2.Para determinar el valor del
coeficiente 𝛽1 es necesario, tomar dos pares de puntos A(X=7,Y=5) y
B(X= 9,Y=7) que se hallen sobre la recta. Hallamos la pendiente de la
𝑦2 −𝑦1 7−5
recta. 𝑚 = = = 1 donde 𝛽1 = 1, si queremos determinar el
𝑥2 −𝑥1 9−7
angulo θ = 𝑇𝑎𝑛−1 1 donde θ = 45° recordemos que la pendiente 𝑚 es
el grado de inclinación respecto al eje “X”
PASO 5: Tomando la ecuación general de la recta
𝑦2 − 𝑦1 = 𝑚 𝑥2 − 𝑥1 , si remplazamos 𝑚 = 1 y el punto A( 7 , 5 ) en
la ecuación Y−5= 𝑚 𝑋 − 7 ,despejando nos queda Y = X - 2.
Tomando el modelo general Y = 𝛽1 𝑋 + 𝛽0 si comparamos y
remplazamos los coeficientes 𝛽0 = 2 y 𝛽1 = 1, construimos el modelo
general de regresión lineal que es:

Y=𝑋−2
REGRESION LINEAL SIMPLE
DIAGRAMA DE DISPERSION O NUBE DE PUNTOS

MODELO GENERAL Y  X  2

𝑦1 = 7

𝑥1 = 9
0  2
CANTIDAD DE ARTICULOS
REGRESION LINEAL SIMPLE
FORMA1: PARA CONSTRUIR UN MODELO PARA ESTIMAR “Y”:
vamos a construir un modelo para estimar los valores de “y”
ˆi  b1 xi  b0
y
Determinamos los coeficientes 𝑏0 , 𝑏1 ,utilizando la calculadora 𝑓𝑥 − 82𝑀𝑆que
consiste en hallar los valores de: 𝐴 = 𝑏0 y 𝐵 = 𝑏1 , primero borramos la
información con SHIFT MODE 3 = =
Luego pulsamos la función MODE , escogemos la función 3 REG luego
escogemos la función 1LIN lo que hemos hecho es dejar la calculadora en
la función regresión lineal.
Ingresamos los valores 3 , 2 y pulsamos M+ y aparece 1 que
significa que hemos ingresando el primer par de valores, luego continuamos
hasta ingresarlos todos. Si pulsamos SHIFT 1 tenemos las siguientes
opciones  xi 2  xi n si pulsamos 2 y le damos = obtenemos el
1 2 3

valor de  xi ,le damos AC para borrar el numero y volvemos hacer lo


mismo para obtener las otras opciones.
REGRESION LINEAL SIMPLE
Si pulsamos SHIFT 1 tenemos las siguientes opciones
 i
x 2
x i n
1 2 Si cogemos el cursor
3 REPLAY y
pulsamos por la derecha, tenemos las opciones
 i
y 2
 y x yi i i

1 2 3
si pulsamos 2 y le damos = obtenemos el valor de  yi , Si
pulsamos SHIFT 2 tenemos las siguientes opciones
x S xn S xn 1
1 2 3
Si cogemos el cursor REPLAY y

pulsamos por la derecha, tenemos las opciones


y S yn S yn 1
1 2 3
REGRESION LINEAL SIMPLE
Si cogemos el cursor y pulsamos por la derecha, tenemos
REPLAY
A B r
las opciones donde 𝐴 = 𝑏0 , 𝐵 = 𝑏1 y 𝑟 es el coeficiente de
1 2 3
correlación entre las dos variables.
En la calculadora obtenemos: σ 𝑥𝑖 2 = 7772 , σ 𝑥𝑖 = 298 , 𝑛 = 15,
σ 𝑦𝑖 2 = 3714, σ 𝑦𝑖 = 210 , σ 𝑥𝑖 𝑦𝑖 = 5358 , 𝑥ҧ = 19,86 , 𝑆𝑥𝑛 = 11,11
, 𝑆𝑥𝑛−1 = 11,50, 𝑦ത = 14, 𝑆𝑦𝑛 = 7.183 , 𝑆𝑦𝑛−1 = 7,4354, 𝐴 =
𝑏0 =1,2757, 𝐵 = 𝑏1 = 0,6404, 𝑟 = 0.9747, con esta información
vamos a construir un modelo para estimar los valores de “y”
remplazando obtenemos:
i yˆ  b x  b
1 i 0
El modelo para estimar en forma rápida

yˆ  0.6404 x  1.2757
REGRESION LINEAL SIMPLE
Vamos ha estimar valores de “Y” en la calculadora. Para ello pulsamos 23
Luego pulsamos SHIFT 2 Si cogemos el cursor y
pulsamos por la derecha, hasta llegar a las opciones REPLAY
xˆ yˆ
,marcamos 2 obtenemos el valor estimado de
1 2 yˆ  16.00
Vamos ha estimar valores de “X” en la calculadora. Para ello pulsamos 18
Luego pulsamos SHIFT 2 Si cogemos el cursor y
pulsamos por la derecha, hasta llegar a las opciones REPLAY
xˆ yˆ
1 2 ,marcamos 1 obtenemos el valor estimado de xˆ  26.11

FORMA 2 PARA CONSTRUIR UN MODELO PARA ESTIMAR “Y”:


vamos a construir un modelo para estimar los valores de “y”

yˆi  b1 xi  b0
REGRESION LINEAL SIMPLE
Construimos un sistema de ecuaciones de dos por dos así:
n n

y
i 1
i  b1  xi  nb0
i 1
1
n n n

x y
i 1
i i  b1  x  b0  xi  2 
i 1
2
i
i 1

Vamos ha determinar los coeficientes 𝑏0 , 𝑏1 ,utilizando el método de mínimos


cuadrados que consiste en construir un sistema de ecuaciones de dos por dos
tomando la siguiente información.
σ 𝑥𝑖 = 298 σ 𝑥𝑖 2 = 7772 σ 𝑦𝑖 = 210 σ 𝑦𝑖 2 = 3714 σ 𝑥𝑖 𝑦𝑖 =5358 𝑛 = 15
Remplazando nos queda
210 = 298𝑏1 + 15𝑏𝑜 298
5358 = 7772𝑏1 + 298𝑏𝑜 −15
Utilizando el método de eliminación para un sistema de dos por dos.
Si multiplicamos todos los términos de la ecuación 1 por 298 y todos
los términos de la ecuación 2 por −15 tenemos.
REGRESION LINEAL SIMPLE
62580 = 88804𝑏1 + 4470𝑏𝑜 1
−80370 = −116580𝑏1 − 4470𝑏𝑜 2

-17790 = -27776 𝑏1 despejando 𝑏1 nos queda.


−17790
𝑏1 = = 0,6404
−27776

Si remplazamos el valor de 𝑏1 = 0,6404 en la ecuación 1 tenemos


que: 62580 = 88804 0,6404 + 4470𝑏0
Despejando 62580-88804(0,6404) = 4470𝑏0 entonces:
62580−88804(0,6404)
𝑏0 = = 1,2773
4470
REGRESION LINEAL SIMPLE
Remplazando el valor de 𝑏1 = 0,6404 y 𝑏0 = 1,2773
El modelo para estimar nos queda así:
𝑦ෝ = 0,6404𝑥𝑖 + 1,2757
Vamos a trazar la recta del modelo para estimar 𝑦ො que en la
grafica esta de color rojo.
Le damos valores a 𝑥 = 5 entonces
𝑦ෝ = 0,6404(5) +1,2757 = 4,4777 minutos
Si 𝑥 = 7 entonces:
𝑦ෝ = 0,6404(7) +1,2757 =5,7585 minutos
Tenemos dos puntos ( 5 , 4,47 ) y ( 7 , 5,7585 ) para trazar
la recta.
REGRESION LINEAL SIMPLE
FORMA 3: PARA CONSTRUIR EL MODELO PARA ESTIMAR:

Como ya tenemos:
σ 𝑥𝑖 =298 σ 𝑥𝑖 2 = 7772 σ 𝑦𝑖 = 210 σ 𝑥𝑖 𝑦𝑖 = 5358 𝑛 = 15
σ 𝑦𝑖 2 = 3714 𝑥ҧ = 19,86 𝑦ത = 14

Determinamos los coeficientes 𝑏0 , 𝑏1 ,utilizando el método para los


estimadores de mínimos cuadrados que consiste en hallar los valores de:

S xy
b1  b0  y  b1 x
S xx
REGRESION LINEAL SIMPLE
Utilizando procedimientos de cálculo, se puede ver que las expresiones
para los estimadores de mínimos cuadrados para el modelo de
regresión lineal simple son: 2
n
1  n

S xx   xi    xi 
2

i 1 n  i 1 
Remplazando.
1
𝑆𝑥𝑥 = 7772 − 298 2 = 1851,73
15

Ahora determinamos. n
1  n  n 
S xy   xi yi    xi   yi 
i 1 n  i 1  i 1 
Remplazando.
1
𝑆𝑥𝑦 = 5358 − 298 210 = 1186
15
REGRESION LINEAL SIMPLE
Remplazando el valor de 𝑆𝑥𝑥 y 𝑆𝑥𝑦
1186
𝑏1 = = 0,6404 𝑏0 = 14 − 0,6404 19,8666 = 1,2757
1851,73
Vamos a construir el modelo de estimación. Remplazando el
valor de 𝑏1 = 0,6404 y 𝑏0 = 1,2757 , el modelo para estimar
nos queda así:
𝑦ෝ = 0,6404𝑥𝑖 + 1,2757
Vamos ha suponer que una persona toma 𝑥 = 10 artículos,
queremos estimar el tiempo que dura en la caja.
𝑦ෝ = 0,6404(10) +1,2757 = 5,12 minutos
Vamos ha suponer que una persona dura en la caja 𝑦 = 30
minutos, queremos estimar el numero de artículos que tomo.
30−1,2757
𝑥ො = = 44,85≈ 45 artículos
0,6404
REGRESIÓN LINEAL SIMPLE
FORMA 4: Utilizando Excel construimos la tabla
No. X Y 𝒙𝟐 𝒚𝟐 𝒙. 𝒚
1 3 2 9 4 6
2 5 3 25 9 15
3 7 5 49 25 35
4 9 7 81 49 63
5 11 10 121 100
𝑥. 𝑦
110
6 15 11 225 121 165
7 17 13 289 169 221
8 20 15 400 225 300
9 23 17 529 289 391
10 25 18 625 324 450
11 27 19 729 361 513
12 29 20 841 400 580
13 32 22 1024 484 704
14 35 23 1225 529 805
15
40 25 1600 625 1000
Σ 298 210 7772 3714 5358
REGRESIÓN LINEAL SIMPLE
Tomando la tabla y utilizando Excel determinamos:
σ 𝑥𝑖 2 = 7772, σ 𝑥𝑖 =298, 𝑛 = 15, σ 𝑦𝑖 2 = 3714, σ 𝑦𝑖 = 210, σ 𝑥𝑖 𝑦𝑖 = 5358
Σ𝑥 298
𝑥ҧ = = = 19,8666 o en forma directa 𝑥ҧ =19,866 𝑆𝑥𝑛 = 11,5007
𝑛 15
Σ𝑦 210
𝑦ത = = = 14 o en forma directa 𝑦ത = 14 𝑆𝑦𝑛 = 7,4354
𝑛 15

COEFICIENTES
𝑏0 1,27577765
𝑏1 0,640480991
𝑟 0,990660818

𝑏0 = 1,27577765, 𝑏1 = 0,640480, 𝑟 = 0,9906 con esta información


vamos a construir un modelo para estimar los valores de “y”
𝑦ො = 𝑏1 𝑥𝑖 + 𝑏0 remplazando obtenemos un modelo para estimar Y , que
es:
𝑦ො = 0,6404𝑥𝑖 + 1,275777
DIAGRAMA DE DISPERSION
TIEMPO PARA PAGAR

𝑦ො = 0,6404𝑥𝑖 + 1,275777

9.0
8.0
7.0
6.0 Y  X 2
5.0
4.0
3.0

2.0

1.0 bo

5 10 15 20
-1.0
0 CANTIDAD DE ARTICULOS
-2.0
EJERCICIO APLICADO
El gerente de una cadena de supermercados desea determinar el efecto del espacio de
anaqueles en las ventas de comida para mascotas, se seleccionó una muestra aleatoria de 20
tiendas del mismo tamaño con los siguientes resultados.

TIENDA ESPACIO EN VENTAS SEMANALES TIENDA ESPACIO EN VENTAS SEMANALES


ANAQUEL (PIES) (CIENTOS DE ANAQUEL(PIES) (CIENTOS DE
DÓLARES) DÓLARES)
1 5 1.6 11 20 2.9
2 5 2.2 12 20 3.1
3 5 1.4 13 25 3.2
4 10 1.9 14 25 3.4
5 10 2.4 15 25 3.6
6 10 2.6 16 30 3.8
7 15 2.3 17 30 4.1
8 15 2.7 18 30 4.3
9 15 2.8 19 35 4.5
10 20 2.6 20 35 4.9

a. Determine la variable independiente y la variable dependiente explique.


b. Grafique el diagrama de dispersión.
c. Trace una recta que tome la mayoría de puntos.
EJERCICIO APLICADO
d. Construya el modelo general.
e. Construya un modelo para estimar los valores de “Y” y de “X”.
Suponga una relación lineal y utilice los tres métodos para encontrar
los coeficientes de regresión b0 y b1
f. Interprete el significado del coeficiente b0 y b1
g. Pronostique las ventas semanales promedio (en cientos de dólares) de
comida para mascotas con 8 pies, 15pies, 27 pies de espacio en anaqueles.
h. Pronostique el espacio en anaqueles para 3.9, 4.5 ,5.3 ventas (en cientos de
dólares) de comida para mascotas.
i. ¿Qué espacio en repisas recomendaría que el gerente asignara a la comida
para mascotas? Explique.
j. Determine el promedio en espacio en anaqueles, la variación y el
coeficiente de variación.
k. Determine el promedio de ventas semanales para cada tienda, la variación
y el coeficiente de variación
MEDIDAS DE VARIACION
Eje Y
y

n
SCE    y  yˆ 
2

i 1

n 2

SCT    y  y 
i 1
yˆi  b1 xi  b0
n 2

SCR    yˆ  y 
i 1
y

Eje X
MEDIDAS DE VARIACION
MEDIA DE LA VARIABLE X MEDIA DE LA VARIABLE Y
σ𝑘1 𝑥𝑖 σ𝑘
1 𝑦𝑖
𝑥ҧ = 𝑦ത =
𝑛 𝑛
VARIANZA DE LA VARIABLE X VARIANZA DE LA VARIABLE Y
2 σ 𝑥𝑖2 −𝑛𝑥ҧ 2 σ 𝑦𝑖2 −𝑛𝑦ത 2
𝑆𝑋 = 𝑆𝑦2 =
𝑛 𝑛

DESVIACION ESTANDAR DE X DESVIACION ESTANDAR DE Y

𝑆𝑥 = 𝑆𝑥2 𝑆𝑦 = 𝑆𝑦2

LA COVARIANZA
σ 𝑥𝑖 .𝑦𝑖
𝐶𝑜𝑣 = − 𝑥ഥ. 𝑦ത
𝑛
MEDIDAS DE VARIACION
SUMA DE CUADRADOS TOTAL
Suma de cuadrados total = suma de la regresión + suma de cuadrados
del error
SCT = SCR + SCE
La suma de cuadrados total SCT es igual a la suma a la suma de
cuadrados de la diferencia entre el valor de yi y el promedio de y

SCT = variación total o suma de cuadrados total

2
 
n

2   yi 
 
n n
SCT    yi  y    yi 
2 i 1

i 1 i 1 n
MEDIDAS DE VARIACION
La suma de cuadrados de la regresión SCR es iguala la suma a la suma
ˆ i y el
de cuadrados de la diferencia entre el valor pronosticado de y
promedio de y
SCR = variación explicada o suma de cuadrados de la regresión
2
 n

2   yi 
 b0  yi  b1  xi yi   i 1 
n n n
SCR    yˆi  y 
i 1 i 1 i 1 n

La suma de cuadrados del error SCE es iguala la suma a la suma de


cuadrados de la diferencia entre el valor de y el promedio de
SCE = variación no explicada o suma de cuadrados del error
n 2 n n n
SCE    yi  yˆ    yi2  b0  yi  b1  xi yi
i 1 i 1 i 1 i 1
COEFICIENTE DE DETERMINACIÓN
ESTE COEFICIENTE DE DETERMINACIÓN mide la proporción
de la variación en Y que explica la variable independiente X en el
modelo de regresión

EL COEFICIENTE DE DETERMINACIÓN es igual a la suma de


cuadrados de regresión dividido entre la suma de cuadrados del total
2
  n

  yi 
b0  yi  b1  xi yi   i 1 
n n n

  yˆ  y 
2

SCR n
r 
2
 i 1
n
 i 1 i 1
2
 
  yi  y 
SCT n

  yi 
2

 i 1 
n
i 1

i 1
yi
2

n
ERROR ESTANDAR DE LA ESTIMACION
Es el estadístico que mide la variabilidad de los valores de Y reales a
partir de los valores de y pronosticados, con las mismas características
de la desviación estándar.
La desviación estándar alrededor de la recta de regresión se llama
ERROR ESTANDAR DE LA ESTIMACION
n n n n

  yi  yˆ   i  b0  yi  b1  xi yi
2 2
y
SCE
S yx   i 1  i 1 i 1 i 1

n2 n2 n2


yi  valor de y para una xi dada.
yˆ  valor pronosticado de y para una xi dada.
SCE  suma de cuadrados del error
n  tamaño de la muestra
CORRELACION MEDICION DE LA FUERZA DE ASOCIACION
COEFICIENTE DE CORRELACION
La decisión en el análisis de regresión se centra en la predicción de la variable dependiente Y
basada en la variable independiente X. por el contrario en el análisis de correlación la atención
se dedica a la medición del grado de asociación entre dos variables.
La fuerza de una relación entre dos variables con una población en general se mide con el
COEFICIENTE DE CORRELACION , cuyos valores varían de -1 para una correlación
negativa perfecta a +1 para una correlación positiva perfecta. Para situaciones que el interés
principal es el análisis de la regresión, el coeficiente de correlación de la muestra n se obtiene a
partir del coeficiente de determinación
2
  n

  yi 
yi  b1  xi yi   i 1 
n n
bo 
SCR n
r r2   i 1 i 1
2
SCT  n

 i  y
yi2   i 1 
n


i 1 n
donde r tiene el signo de b1
CORRELACION MEDICION DE LA FUERZA DE
ASOCIACION
COEFICIENTE DE CORRELACION
En muchas aplicaciones solo nos interesa medir el grado de asociación
entre las variables, y no el uso de una variable para predecir otra. Si el
interés especifico la correlación , se puede calcular el coeficiente de
correlación r de manera directa con la siguiente ecuación.

 n  n 
  xi   yi 
 i 1  i 1 
n n

SCXY   x  x  y  y 
i i  X Y
i i 
n
r  i 1
 i 1
n n 2 2
SCX SCY    
x  x  .  y  y 
n n

 i   i 
2 2
i i x y
 i 1  .  i 1 
n n
i 1 i 1

i 1
xi
2

n

i 1
yi
2

n
n n

x i y i
x i 1
y i 1

n n
TIPOS DE ASOCIACION ENTRE VARIABLES
CORRELACIÓN NEGATIVA CORRELACIÓN POSITIVA
-1 < r < 0 0<r<1

NO EXISTE CORRELACIÓN NO EXISTE CORRELACIÓN


r =0 r =0
EJERCICIO APLICADO
Suponga que el gerente de una cadena de servicios de entrega de paquetería desea
desarrollar un modelo para predecir las ventas semanales (en miles de dólares para las
tiendas individuales basado en el número de clientes que realizan compras. Se
seleccionó una muestra aleatoria entre todas las tiendas de la cadena con los siguientes
resultados:
Tienda Clientes Ventas ($000) Tienda Clientes Ventas ($000)
1 907 11.20 11 679 7.63
2 926 11,05 12 872 9,43
3 506 6,84 13 924 9,46
4 741 9,21 14 607 7,64
5 789 9,42 15 452 6,92
6 889 10,08 16 729 8,95
7 874 9,45 17 794 9,33
8 510 6,73 18 844 10,23
9 529 7,24 19 1.010 11,77
10 420 6,12 20 621 7,41
EJERCICIO APLICADO
a. Determine la variables independientes y dependientes
b. Grafique el diagrama de dispersión
c. Suponga una relación lineal y utilice el método de mínimos cuadrados para encontrar
los coeficientes de regresión 𝑏0 y 𝑏1
d. Construya un modelo para estimar clientes y ventas semanales.
e. Interprete el significado de la pendiente en este problema.
f. Pronostique las ventas semanales (en miles de dólares) para las tiendas que tienen
600, 900 y 1200 clientes.
g. Pronostique el número de clientes para ventas de 13.6, 14.8 y 25.9 en miles de
dólares.
h. Suponga que las ventas en la tienda 19 son 14.77. Resuelva los incisos a, b, c, y d
con este valor y compare los resultados.
i. ¿Qué otros factores además del número de clientes pueden afectar las ventas?
j. Calcule el coeficiente de determinación e intérprete su significado
k. Calcule el error estándar de la estimación e intérprete su significado
l. Determine el coeficiente de correlación e intérprete.
m. Pruebe el grado de asociación entre las variables.
n. Con base en los incisos (c) a (j), ¿existe alguna razón para dudar de la validez del
modelo?
REFERENCIAS BIBLIOGRAFICAS
PROBABILIDAD Y ESTADISTICA PARA INGENIERIA Y CIENCIA,
WALPOLE –MYERS-YE. editorial PRENTICE HALL, edición 8°, año 2007.
PROBABILIDAD Y ESTADISTICA PARA INGENIERIAS, CANAVOS. editorial
MAC GRAW HELL, edición 3° año 1997.
PROBABILIDAD Y ESTADISTICA PARA INGENIEROS,
DOUGLAS C MONTGOMERY. editorial JOHN WILEY & SONS, edición 3°,año
2002
ESTADISTICA MATEMATICA,WILLIAM MENDENHALL-RICHARD L
SCHEAFFER, editorial THOMSON. edición 6°, año 2002
ESTADISTICA PARA LA ADMINISTRACION,LINCOLN CHAO, editorial MAC
GRAW HELL, edición 4° ,año 1996.
ESTADISTICA Y MUESTREO, CIRO MARTINEZ BERCARDINO, editorial
ECO, EDICION 8°, AÑO 2009.
BERENSON –LEVINE –KREHIBIEL. ESTADÍSTICA PARA
ADMINISTRACIÓN. Editorial. PRENTICE HALL, edición 5°, año 2000

S-ar putea să vă placă și