Documente Academic
Documente Profesional
Documente Cultură
Estadística Administrativa II
2018-1
2
Regresión lineal simple
• Diagrama de dispersión
• Análisis de correlación
• Análisis de regresión
3
Diagrama de
dispersión
Técnica empírica para observar el comportamiento
relacionado de dos variables.
4
Diagrama de dispersión
Es la presentación gráfica que muestra la
relación de dos variables. Al estar
involucradas dos variables, una de ellas se
considera la independiente y la otra la
dependiente.
Y
X
5
Ejemplo . . .
La Empresa AUTOMAS da
mantenimiento preventivo a
vehículos turismo. Se tomó una
muestra para evaluar si el valor
del pago tiene alguna relación
con la antigüedad de los
clientes. Se tomó una muestra
de 9 clientes que visitaron
AUTOMAS la semana pasada y
a través de un diagrama de
dispersión evaluar su
comportamiento
6
. . .Ejemplo
𝑋 𝑌 7
Comando en Excel
8
Análisis de correlación
Es el estudio de la relación entre variables
numéricas. Es la presentación numérica del
diagrama de dispersión
9
𝑟 − 𝑃𝑒𝑎𝑟𝑠𝑜𝑛
𝑟
Coeficiente de
correlación
“Medida de la fuerza de la relación lineal entre
dos variables.” (Lind |Marchal |Wathen, 2008,
p.462).
10
Características
−1 , 1
11
Tendencia
12
Fortaleza de la relación entre
variables
13
Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
15
. . . Ejemplo
UNIDADES
AGENTE LLAMADAS VENDIDAS
Tomás García 20 30 1. Trazar el diagrama de
José Girón 40 60 dispersión
Gregorio Figueroa 30 60 2. Calcular el coeficiente
Carlos Ramírez 10 40 de correlación
Miguel Godoy 20 50 3. Interpretar el resultado
Marcos Reyes 20 30
16
. . . Ejemplo
• Diagrama de dispersión
UNIDADES
AGENTE LLAMADAS VENDIDAS
Tomás García 20 30
José Girón 40 60
Gregorio Figueroa 30 60
Carlos Ramírez 10 40
Miguel Godoy 20 50
Marcos Reyes 20 30
(20,30) está 2 veces
17
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
. . . Ejemplo 𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
140
𝑋ത𝑙𝑙𝑎𝑚𝑎𝑑𝑎𝑠 = = 23.0
6
270
𝑌ത𝑣𝑒𝑛𝑡𝑎𝑠 = = 45.0
6
18
𝑋ത = 23
. . . Ejemplo 𝑌ത = 45
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
• Coeficiente de correlación (r)
– Desviación estándar - variación
UNIDADES
AGENTE LLAMADAS 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
VENDIDAS
Tomás García 20 30 (20 - 23) = -3 (30 - 45) = -15
José Girón 40 60 (40 - 23) = 17 (60 - 45) = 15
Gregorio Figueroa 30 60 (30 - 23) = 7 (60 - 45) = 15
Carlos Ramírez 10 40 (10 - 23) = -13 (40 - 45) = -5
Miguel Godoy 20 50 (20 - 23) = -3 (50 - 45) = 5
Marcos Reyes 20 30 (20 - 23) = -3 (30 - 45) = -15
19
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
. . . Ejemplo 𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
𝑋𝑖 − 𝑋ത
𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑌𝑖 − 𝑌ത
(20 - 23) = -3 (30 - 45) = -15 45 9 225
(40 - 23) = 17 (60 - 45) = 15 255 289 225
(30 - 23) = 7 (60 - 45) = 15 105 49 225
(10 - 23) = -13 (40 - 45) = -5 65 169 25
(20 - 23) = -3 (50 - 45) = 5 -15 9 25
(20 - 23) = -3 (30 - 45) = -15 45 9 225
500 534 950
20
. . . Ejemplo 𝑋𝑖 − 𝑋ത = 534
𝑌𝑖 − 𝑌ത = 950
• Coeficiente de correlación (r)
– Desviación estándar
534
𝑠𝑋 = = 106.7 = 10.3
6−1
950
𝑠𝑌 = = 190.0 = 13.8
6−1
21
. . . Ejemplo σ 𝑋 − 𝑋ത 𝑌 − 𝑌ത =500
𝑠𝑋 = 10.3
𝑠𝑌 = 13.8
• Coeficiente de correlación (r) 𝑛=6
σ 𝑋 − 𝑋ത 𝑌 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
500
𝑟=
6 − 1 10.3 13.8
500
𝑟=
712.25
𝑟 = 0.702
22
. . . Ejemplo
• Coeficiente de correlación (r)
𝑟 = 0.702
Correlación negativa No hay relación Correlación positiva
Perfecta entre las variables Perfecta
Correlación negativa Correlación positiva
Moderada Moderada
0.702
𝑟
25
Ejemplo . . .
Calcular el coeficiente de determinación de
una muestra de dos variables, cuyos
coeficiente de correlación es 0.702
𝑟 = 0.702
𝑟 = 0.702
𝑟 = 0.4928
27
Estadístico de prueba
t-student
𝑟 𝑛−2
𝑡=
1−𝑟
𝑡 ≡ 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑡 − 𝑆𝑡𝑢𝑑𝑒𝑛𝑡
𝑟 ≡ 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛
𝑛 ≡ 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
28
Objetivo
• Concluir que el coeficiente de correlación
de la población es 0.
𝐻0 : 𝜌 = 0
𝐻𝑎 : 𝜌 ≠ 0
• Con n-2 grados de libertad
29
Ejemplo . . .
En la empresa Sara se venden unidades de aire
acondicionado; se ha observado que a mayor
cantidad de llamadas de los vendedores durante
el mes, mayor cantidad de compra de unidades de
aire acondicionado.
Se tomó una muestra de las ventas realizadas por
6 de los vendedores de planta y se quiere
comparar la cantidad de llamadas realizadas
durante el mes y las ventas facturadas.
El coeficiente de correlación obtenido fue de
0.702. Se va a probar si existe relación entre las
variables con un nivel de confianza del 95%. 30
UNIDADES
. . . Ejemplo LLAMADAS VENDIDAS
20 30
PASO 1: Hipótesis nula y alternativa 40 60
30 60
𝐻0 : 𝜌 = 0
10 40
𝐻𝑎 : 𝜌 ≠ 0
20 50
PASO 2: Nivel de significancia 20 30
𝛼 = 0.05 𝑟 = 0.702
PASO 3: Estadístico de prueba
𝑟 𝑛−2
𝑡=
1−𝑟 31
. . . Ejemplo
PASO 4: Regla de decisión
𝐻0 : 𝜌 = 0
2 𝑐𝑜𝑙𝑎𝑠
𝛼 = 0.05
𝑛=6
𝑔𝑙 = 6 − 2 = 4
𝑡 = 2.776
32
𝑡 = 2.776
. . . Ejemplo
PASO 5: Toma de decisión
𝑟 = 0.702
𝑛=6
𝑟 𝑛−2
𝑡=
1−𝑟
0.702 6 − 2
𝑡=
1 − 0.702
2.81 La hipótesis nula se rechaza
𝑡= La correlación de la población no es 0
0.71
Sí existe relación entre las variables
𝑡 = 3.96
33
Prácticas
Correlación
34
Cálculo de coeficiente
de correlación
Excel
35
Excel
36
12-feb
38
Desarrollo práctica # 1
2. Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Determinar las variables involucradas en el proceso
Número de Producción en
ensambladores una hora
(X) (unidades)(Y)
2 15
4 25
1 10
5 40
3 30
39
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las medias aritméticas (n=5)
Número de Producción en
ensambladores una hora 15
(X) (unidades)(Y) 𝑋ത = =3
5
2 15
4 25
120
1 10 𝑌ത = = 24
5 40 5
3 30
40
15 120
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones
Número de Producción en
ensambladores una hora 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
(X) (unidades)(Y)
2 15 (2 - 3) = -1 (15 - 24) = -9
4 25 (4 - 3) = 1 (25 - 24) = 1
1 10 (1 - 3) = -2 (10 - 24) = -14
5 40 (5 - 3) = 2 (40 - 24) = 16
3 30 (3 - 3) = 0 (30 - 24) = 6
41
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones cuadradas d2
Número de 𝑋𝑖 − 𝑋ത
Producción en
ensambladores 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത
una hora (Y)
(X)
2 15 -1 -9 9
4 25 1 1 1
1 10 -2 -14 28
5 40 2 16 32
3 30 0 6 - 42
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones cuadradas d2
Número de
Producción en
ensambladores 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋𝑖 − 𝑋ത
una hora (Y)
(X)
2 15 -1 -9 1
4 25 1 1 1
1 10 -2 -14 4
5 40 2 16 4
3 30 0 6 - 43
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones cuadradas d2
Número de
ensambladores
Producción en
𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത
una hora (Y)
(X)
2 15 -1 -9 81
4 25 1 1 1
1 10 -2 -14 196
5 40 2 16 256
3 30 0 6 36 44
Desarrollo práctica # 1
• Coeficiente de correlación
σ −𝑋ത 𝑌 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones cuadradas d2
Número de
Producción en 𝑋𝑖 − 𝑋ത
ensambladores 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
(X)
una hora (Y) 𝑌𝑖 − 𝑌ത
2 15 9 1 81
4 25 1 1 1
1 10 28 4 196
5 40 32 4 256
3 30 0 0 36
70 10 570 45
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las desviaciones estándar (s)
𝑋𝑖 − 3 𝑌𝑖 − 24 = 70
σ 𝑋𝑖 − 3 10
𝑠𝑋 = = = 1.6
𝑛−1 4
σ 𝑌𝑖 − 24 570
𝑠𝑋 = = = 11.9
𝑛−1 4
46
Desarrollo práctica # 1
• Coeficiente de correlación
𝑋𝑖 − 3 𝑌𝑖 − 24 = 70
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑠𝑋 = 1.6
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌 𝑠𝑋 = 11.9
70
𝑟= n=5
5 − 1 1.6 11.9
𝑟 = 0.9272
𝑟 = 0.9272
𝑟 = 0.8597
48
Desarrollo práctica # 1
4. Probar la importancia del coeficiente de
correlación. Nivel de confianza de 95%
Paso 1. Hipótesis nula y alternativa
𝐻0 : 𝜌 = 0
𝐻𝑎 : 𝜌 ≠ 0
Paso 2. Nivel de significancia
𝛼 = 0.05
Paso 3: Estadístico de prueba
𝑟 𝑛−2
𝑡=
1−𝑟 49
Desarrollo práctica # 1
Paso 4: Regla de decisión
𝐻0 : 𝜌 = 0
2 𝑐𝑜𝑙𝑎𝑠
𝛼 = 0.05
𝑛=5
𝑔𝑙 = 5 − 2 = 3
𝑡 = 3.182
50
𝑡 = 2.776
Desarrollo práctica # 1
PASO 5: Toma de decisión
𝑟 = 0.9272
𝑛=5
𝑟 𝑛−2
𝑡=
1−𝑟
0.9272 5 − 2
𝑡=
1 − 0.9272
3.6359 La hipótesis nula se rechaza
𝑡= La correlación de la población no es 0
0.3746
Sí existe relación entre las variables
𝑡 = 9.705
51
Un economista del Banco Central está preparando un
estudio sobre el comportamiento del consumidor. Recolectó
datos para determinar si existe una relación entre el ingreso
del consumidor y sus niveles de consumo. Los resultados
fueron los siguientes:
INGRESO CONSUMO 1. Trazar diagrama de dispersión
52
(000 Lps) (000 Lps) 2. Calcular coeficiente de correlación
24.3 16.0 3. Calcular coeficiente de
12.5 8.5 determinación
31.2 15.0 4. Probar la importancia del
28.0 17.0 coeficiente de correlación. Nivel de
35.1 24.2 confianza de 95%
10.5 11.2
23.2 15.0
10.0 7.1
8.5 3.5 corregido
15.9 11.5
Desarrollo práctica # 2
1. Diagrama de dispersión
53
Desarrollo práctica # 2
2. Coeficiente de correlación
INGRESO CONSUMO
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟= (X) (Y)
𝑛 − 1 𝑠𝑋 𝑠𝑌
24.3 16.0
12.5 8.5
31.2 15.0
• Determinar las variables 28.0 17.0
involucradas en el proceso 35.1 24.2
10.5 11.2
23.2 15.0
10.0 7.1
8.5 3.5
15.9 11.5 54
Desarrollo práctica # 2
• Coeficiente de correlación
• Calcular las medias aritméticas σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
INGRESO CONSUMO 𝑛 − 1 𝑠𝑋 𝑠𝑌
(X) (Y)
24.3 16.0
12.5 8.5
199.2
31.2 15.0 𝑋ത = = 19.9 = 20
28.0 17.0 10
35.1 24.2
10.5 11.2 129
23.2 15.0 𝑌ത = = 12.9 = 13
10.0 7.1
10
8.5 3.5
15.9 11.5 55
199.2 129.0
Desarrollo práctica # 2
𝑋ത = 20
• Coeficiente de correlación 𝑌ത = 13
- Calcular las variaciones
INGRESO CONSUMO
(X) (Y) 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
24.3 16.0 (24.3 - 20) = 4.3 (16.0 - 13) = 3.0
12.5 8.5 (12.5 - 20) = -7.5 (8.5 - 13) = -4.5
31.2 15.0 (31.2 - 20) = 11.2 (15.0 - 13) = 2.0
28.0 17.0 (28.0 - 20) = 8.0 (17.0 - 13) = 4.0
35.1 24.2 (31.5 - 20) = 15.1 (24.2 - 13) = 11.2
10.5 11.2 (10.5 - 20) = -9.5 (11.2 - 13) = -1.8
23.2 15.0 (23.2 - 20) = 3.2 (15.0 - 13) = 2.0
10.0 7.1 (10.0 - 20) = -10.0 (7.1 - 13) = -5.9
8.5 3.5 (8.5 - 20) = -11.5 (3.5 - 13) = -9.5
15.9 11.5 (15.9 - 20) = -4.1 (11.5 - 13) = -1.5
Desarrollo práctica # 2
• Coeficiente de correlación
- Calcular la variación cuadrada de X y Y.
INGRESO CONSUMO 𝑋𝑖 − 𝑋ത
(X) (Y) 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത
24.3 16.0 4.3 3.0 12.9
12.5 8.5 -7.5 -4.5 33.8
31.2 15.0 11.2 2.0 22.4
28.0 17.0 8.0 4.0 32.0
35.1 24.2 15.1 11.2 169.1
10.5 11.2 -9.5 -1.8 17.1
23.2 15.0 3.2 2.0 6.4
10.0 7.1 -10.0 -5.9 59.0
8.5 3.5 -11.5 -9.5 109.3
15.9 11.5 -4.1 -1.5 6.2
57
Desarrollo práctica # 2
• Coeficiente de correlación
- Calcular la variación cuadrada de X
INGRESO CONSUMO
(X) (Y) 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋𝑖 − 𝑋ത
24.3 16.0 4.3 18.5 18.5
12.5 8.5 -7.5 56.3 56.3
31.2 15.0 11.2 125.4 125.4
28.0 17.0 8.0 64.0 64.0
35.1 24.2 15.1 228.0 228.0
10.5 11.2 -9.5 90.3 90.3
23.2 15.0 3.2 10.2 10.2
10.0 7.1 -10.0 100.0 100.0
8.5 3.5 -11.5 132.3 132.3
15.9 11.5 -4.1 16.8 16.8
58
Desarrollo práctica # 2
• Coeficiente de correlación
- Calcular la variación cuadrada de Y
INGRESO CONSUMO
(X) (Y) 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത
24.3 16.0 4.3 18.5 9.0
12.5 8.5 -7.5 56.3 20.3
31.2 15.0 11.2 125.4 4.0
28.0 17.0 8.0 64.0 16.0
35.1 24.2 15.1 228.0 125.4
10.5 11.2 -9.5 90.3 3.2
23.2 15.0 3.2 10.2 4.0
10.0 7.1 -10.0 100.0 34.8
8.5 3.5 -11.5 132.3 90.3
15.9 11.5 -4.1 16.8 2.3
59
Desarrollo práctica # 2
• Coeficiente de correlación
- Resumen de variaciones cuadradas d2
INGRESO CONSUMO 𝑋𝑖 − 𝑋ത
ത 𝑋𝑖 − ത
𝑋 𝑌𝑖 − 𝑌ത
(X) (Y) 𝑌𝑖 − 𝑌
24.3 16.0 12.9 18.5 9.0
12.5 8.5 33.8 56.3 20.3
31.2 15.0 22.4 125.4 4.0
28.0 17.0 32.0 64.0 16.0
35.1 24.2 169.1 228.0 125.4
10.5 11.2 17.1 90.3 3.2
23.2 15.0 6.4 10.2 4.0
10.0 7.1 59.0 100.0 34.8
8.5 3.5 109.3 132.3 90.3
15.9 11.5 6.2 16.8 2.3
468.1 841.7 309.2 60
Desarrollo práctica # 2
• Coeficiente de correlación 𝑋ത = 20
𝑋𝑖 − 20 𝑌𝑖 − 13 = 468.1 𝑌ത = 13
𝑋𝑖 − 𝑋ത = 841.7
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത = 309.2
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las desviaciones estándar (s)
σ 𝑋𝑖 − 20 841.7
𝑠𝑋 = = = 9.7
𝑛−1 9
σ 𝑌𝑖 − 13 309.2
𝑠𝑌 = = = 5.9
𝑛−1 9
61
Desarrollo práctica # 2
• Coeficiente de correlación
𝑋𝑖 − 20 𝑌𝑖 − 13 = 468.1
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑠𝑋 = 9.7
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌 𝑠𝑌 = 5.9
468.1 n = 10
𝑟=
10 − 1 9.7 5.9
𝑟 = 0.9174
𝑟 = 0.9174
𝑟 = 0.8417
63
Desarrollo práctica # 2
4. Probar la importancia del coeficiente de
correlación. Nivel de confianza de 95%
Paso 1. Hipótesis nula y alternativa
𝐻0 : 𝜌 = 0
𝐻𝑎 : 𝜌 ≠ 0
Paso 2. Nivel de significancia
𝛼 = 0.05
Paso 3: Estadístico de prueba
𝑟 𝑛−2
𝑡=
1−𝑟 64
Desarrollo práctica # 2
Paso 4: Regla de decisión
𝐻0 : 𝜌 = 0
2 𝑐𝑜𝑙𝑎𝑠
𝛼 = 0.05
𝑛 = 10
𝑔𝑙 = 10 − 2 = 8
𝑡 = 2.306
65
Desarrollo práctica # 2
𝑡 = 2.306
Paso 5: Toma de decisión
𝑟 = 0.9174
𝑛 = 10
𝑟 𝑛−2
𝑡=
1−𝑟
0.9174 10 − 2
𝑡=
1 − 0.9174
7.33946 La hipótesis nula se rechaza
𝑡= La correlación de la población no es 0
0.39789
Sí existe relación entre las variables
𝑡 = 18.446
66
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los
Negocios y la Economía. México: McGrawHill