Sunteți pe pagina 1din 67

USAP

Estadística Administrativa II
2018-1

Actualizado: 13-febrero-2018 (12:27 p.m.) 1


Regresión lineal
simple
Conjunto de técnicas para hacer análisis
de la relación entre dos variables

2
Regresión lineal simple

• Diagrama de dispersión
• Análisis de correlación
• Análisis de regresión

3
Diagrama de
dispersión
Técnica empírica para observar el comportamiento
relacionado de dos variables.

4
Diagrama de dispersión
Es la presentación gráfica que muestra la
relación de dos variables. Al estar
involucradas dos variables, una de ellas se
considera la independiente y la otra la
dependiente.
Y

X
5
Ejemplo . . .
La Empresa AUTOMAS da
mantenimiento preventivo a
vehículos turismo. Se tomó una
muestra para evaluar si el valor
del pago tiene alguna relación
con la antigüedad de los
clientes. Se tomó una muestra
de 9 clientes que visitaron
AUTOMAS la semana pasada y
a través de un diagrama de
dispersión evaluar su
comportamiento
6
. . .Ejemplo

𝑋 𝑌 7
Comando en Excel

8
Análisis de correlación
Es el estudio de la relación entre variables
numéricas. Es la presentación numérica del
diagrama de dispersión

9
𝑟 − 𝑃𝑒𝑎𝑟𝑠𝑜𝑛
𝑟

Coeficiente de
correlación
“Medida de la fuerza de la relación lineal entre
dos variables.” (Lind |Marchal |Wathen, 2008,
p.462).
10
Características
−1 , 1

• 𝑟=1 Correlación perfecta positiva


• 𝑟 = −1 Correlación perfecta negativa
• 𝑟=0 No hay correlación
• 𝑟<0 Correlación negativa
• 𝑟>0 𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎

11
Tendencia

Correlación positiva Correlación negativa

12
Fortaleza de la relación entre
variables

13
Coeficiente de correlación

σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌

𝑋 : Cada observación de la variable independiente.


𝑌 : Cada observación de la variable dependiente
𝑋ത : Media aritmética muestral de variable independiente
𝑌ത : Media aritmética muestral de variable dependiente
𝑠𝑋 : Desviación estándar de variable independiente
𝑠𝑌 : Desviación estándar de variable dependiente
𝑛 : Tamaño de la muestra
14
Ejemplo . . .

En la empresa Sara se venden unidades de aire


acondicionado; se ha observado que a mayor
cantidad de llamadas de los vendedores durante
el mes, mayor cantidad de compra de unidades de
aire acondicionado.
Se tomó una muestra de las ventas realizadas por
6 de los vendedores de planta y se quiere
comparar la cantidad de llamadas realizadas
durante el mes y las ventas facturadas.

15
. . . Ejemplo

UNIDADES
AGENTE LLAMADAS VENDIDAS
Tomás García 20 30 1. Trazar el diagrama de
José Girón 40 60 dispersión
Gregorio Figueroa 30 60 2. Calcular el coeficiente
Carlos Ramírez 10 40 de correlación
Miguel Godoy 20 50 3. Interpretar el resultado
Marcos Reyes 20 30

16
. . . Ejemplo
• Diagrama de dispersión
UNIDADES
AGENTE LLAMADAS VENDIDAS
Tomás García 20 30
José Girón 40 60
Gregorio Figueroa 30 60
Carlos Ramírez 10 40
Miguel Godoy 20 50
Marcos Reyes 20 30
(20,30) está 2 veces

17
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
. . . Ejemplo 𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌

• Coeficiente de correlación (r)


– Media aritmética

140
𝑋ത𝑙𝑙𝑎𝑚𝑎𝑑𝑎𝑠 = = 23.0
6
270
𝑌ത𝑣𝑒𝑛𝑡𝑎𝑠 = = 45.0
6

18
𝑋ത = 23
. . . Ejemplo 𝑌ത = 45
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
• Coeficiente de correlación (r)
– Desviación estándar - variación

UNIDADES
AGENTE LLAMADAS 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
VENDIDAS
Tomás García 20 30 (20 - 23) = -3 (30 - 45) = -15
José Girón 40 60 (40 - 23) = 17 (60 - 45) = 15
Gregorio Figueroa 30 60 (30 - 23) = 7 (60 - 45) = 15
Carlos Ramírez 10 40 (10 - 23) = -13 (40 - 45) = -5
Miguel Godoy 20 50 (20 - 23) = -3 (50 - 45) = 5
Marcos Reyes 20 30 (20 - 23) = -3 (30 - 45) = -15

19
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
. . . Ejemplo 𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌

• Coeficiente de correlación (r)


– Desviación estándar – variación cuadrada

𝑋𝑖 − 𝑋ത
𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑌𝑖 − 𝑌ത
(20 - 23) = -3 (30 - 45) = -15 45 9 225
(40 - 23) = 17 (60 - 45) = 15 255 289 225
(30 - 23) = 7 (60 - 45) = 15 105 49 225
(10 - 23) = -13 (40 - 45) = -5 65 169 25
(20 - 23) = -3 (50 - 45) = 5 -15 9 25
(20 - 23) = -3 (30 - 45) = -15 45 9 225
500 534 950

20
. . . Ejemplo ෍ 𝑋𝑖 − 𝑋ത = 534

෍ 𝑌𝑖 − 𝑌ത = 950
• Coeficiente de correlación (r)
– Desviación estándar

534
𝑠𝑋 = = 106.7 = 10.3
6−1

950
𝑠𝑌 = = 190.0 = 13.8
6−1

21
. . . Ejemplo σ 𝑋 − 𝑋ത 𝑌 − 𝑌ത =500
𝑠𝑋 = 10.3
𝑠𝑌 = 13.8
• Coeficiente de correlación (r) 𝑛=6
σ 𝑋 − 𝑋ത 𝑌 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
500
𝑟=
6 − 1 10.3 13.8
500
𝑟=
712.25

𝑟 = 0.702
22
. . . Ejemplo
• Coeficiente de correlación (r)
𝑟 = 0.702
Correlación negativa No hay relación Correlación positiva
Perfecta entre las variables Perfecta
Correlación negativa Correlación positiva
Moderada Moderada

Correlación Correlación Correlación Correlación


negativa fuerte negativa Débil positiva Débil positiva Fuerte
-1 -0.5 0 0.5 1

0.702

La correlación entre ambas variables es positiva y fuerte.


El hacer llamadas telefónicas a los posibles clientes si nos
lleva a un incremento en las ventas. 23
Coeficiente de
determinación
“Proporción de la variación total en la variable
dependiente Y que se explica, o contabiliza, por
la variación en la variable independiente X.”
(Lind |Marchal |Wathen, 2008, p.465).
24
Coeficiente de determinación

• Resultado de elevar al cuadrado el


coeficiente de correlación.
• Resultado interpretado en base a 100%.

𝑟
25
Ejemplo . . .
Calcular el coeficiente de determinación de
una muestra de dos variables, cuyos
coeficiente de correlación es 0.702
𝑟 = 0.702

𝑟 = 0.702
𝑟 = 0.4928

Existe una correlación del 49% entre


ambas variables 26
𝑟, 𝑡
Prueba de la importancia
del coeficiente de
correlación
Se somete el coeficiente de correlación a
una prueba con el estadístico t

27
Estadístico de prueba
t-student

𝑟 𝑛−2
𝑡=
1−𝑟
𝑡 ≡ 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑡 − 𝑆𝑡𝑢𝑑𝑒𝑛𝑡
𝑟 ≡ 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛
𝑛 ≡ 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

28
Objetivo
• Concluir que el coeficiente de correlación
de la población es 0.
𝐻0 : 𝜌 = 0
𝐻𝑎 : 𝜌 ≠ 0
• Con n-2 grados de libertad

29
Ejemplo . . .
En la empresa Sara se venden unidades de aire
acondicionado; se ha observado que a mayor
cantidad de llamadas de los vendedores durante
el mes, mayor cantidad de compra de unidades de
aire acondicionado.
Se tomó una muestra de las ventas realizadas por
6 de los vendedores de planta y se quiere
comparar la cantidad de llamadas realizadas
durante el mes y las ventas facturadas.
El coeficiente de correlación obtenido fue de
0.702. Se va a probar si existe relación entre las
variables con un nivel de confianza del 95%. 30
UNIDADES
. . . Ejemplo LLAMADAS VENDIDAS
20 30
PASO 1: Hipótesis nula y alternativa 40 60
30 60
𝐻0 : 𝜌 = 0
10 40
𝐻𝑎 : 𝜌 ≠ 0
20 50
PASO 2: Nivel de significancia 20 30
𝛼 = 0.05 𝑟 = 0.702
PASO 3: Estadístico de prueba

𝑟 𝑛−2
𝑡=
1−𝑟 31
. . . Ejemplo
PASO 4: Regla de decisión
𝐻0 : 𝜌 = 0
2 𝑐𝑜𝑙𝑎𝑠
𝛼 = 0.05
𝑛=6
𝑔𝑙 = 6 − 2 = 4

𝑡 = 2.776
32
𝑡 = 2.776
. . . Ejemplo
PASO 5: Toma de decisión
𝑟 = 0.702
𝑛=6
𝑟 𝑛−2
𝑡=
1−𝑟
0.702 6 − 2
𝑡=
1 − 0.702
2.81 La hipótesis nula se rechaza
𝑡= La correlación de la población no es 0
0.71
Sí existe relación entre las variables
𝑡 = 3.96
33
Prácticas
Correlación

34
Cálculo de coeficiente
de correlación
Excel

35
Excel

36
12-feb

El departamento de producción de Celltronics International


desea explorar la relación entre el número de empleados que
trabajan en una línea de ensamble parcial y el número de
unidades producido. Como experimento, se asignó a dos
empleados al ensamble parcial. Su desempeño fue de 15
productos durante un periodo de una hora. Después, cuatro
37 empleados hicieron los ensambles y su número fue de 25
durante un periodo de una hora. El conjunto completo de
observaciones pareadas se muestra a continuación.
Producción
Número de
en una hora 1. Revisar diagrama de dispersión
ensambladores
(unidades) 2. Calcular coeficiente de correlación
2 15 3. Calcular coeficiente de determinación
4 25 4. Probar la importancia del coeficiente
1 10 de correlación. Nivel de confianza de
5 40
95%
3 30
Desarrollo práctica # 1
1. Diagrama de dispersión

38
Desarrollo práctica # 1
2. Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Determinar las variables involucradas en el proceso
Número de Producción en
ensambladores una hora
(X) (unidades)(Y)
2 15
4 25
1 10
5 40
3 30
39
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las medias aritméticas (n=5)
Número de Producción en
ensambladores una hora 15
(X) (unidades)(Y) 𝑋ത = =3
5
2 15
4 25
120
1 10 𝑌ത = = 24
5 40 5
3 30
40
15 120
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones
Número de Producción en
ensambladores una hora 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
(X) (unidades)(Y)
2 15 (2 - 3) = -1 (15 - 24) = -9
4 25 (4 - 3) = 1 (25 - 24) = 1
1 10 (1 - 3) = -2 (10 - 24) = -14
5 40 (5 - 3) = 2 (40 - 24) = 16
3 30 (3 - 3) = 0 (30 - 24) = 6
41
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones cuadradas d2
Número de 𝑋𝑖 − 𝑋ത
Producción en
ensambladores 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത
una hora (Y)
(X)

2 15 -1 -9 9
4 25 1 1 1
1 10 -2 -14 28
5 40 2 16 32
3 30 0 6 - 42
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones cuadradas d2
Número de
Producción en
ensambladores 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋𝑖 − 𝑋ത
una hora (Y)
(X)

2 15 -1 -9 1
4 25 1 1 1
1 10 -2 -14 4
5 40 2 16 4
3 30 0 6 - 43
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones cuadradas d2
Número de
ensambladores
Producción en
𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത
una hora (Y)
(X)

2 15 -1 -9 81
4 25 1 1 1
1 10 -2 -14 196
5 40 2 16 256
3 30 0 6 36 44
Desarrollo práctica # 1
• Coeficiente de correlación
σ −𝑋ത 𝑌 − 𝑌ത 𝑋ത = 3
𝑟= 𝑌ത = 24
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las variaciones cuadradas d2
Número de
Producción en 𝑋𝑖 − 𝑋ത
ensambladores 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
(X)
una hora (Y) 𝑌𝑖 − 𝑌ത
2 15 9 1 81
4 25 1 1 1
1 10 28 4 196
5 40 32 4 256
3 30 0 0 36
70 10 570 45
Desarrollo práctica # 1
• Coeficiente de correlación
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las desviaciones estándar (s)

෍ 𝑋𝑖 − 3 𝑌𝑖 − 24 = 70

σ 𝑋𝑖 − 3 10
𝑠𝑋 = = = 1.6
𝑛−1 4

σ 𝑌𝑖 − 24 570
𝑠𝑋 = = = 11.9
𝑛−1 4
46
Desarrollo práctica # 1
• Coeficiente de correlación
෍ 𝑋𝑖 − 3 𝑌𝑖 − 24 = 70
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑠𝑋 = 1.6
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌 𝑠𝑋 = 11.9
70
𝑟= n=5
5 − 1 1.6 11.9
𝑟 = 0.9272

Hay una correlación positiva


fuerte entre ambas variables 47
Desarrollo práctica # 1
3. Coeficiente de Determinación (r2)

𝑟 = 0.9272

𝑟 = 0.8597

Parece que existe una correlación del


86% entre ambas variables

48
Desarrollo práctica # 1
4. Probar la importancia del coeficiente de
correlación. Nivel de confianza de 95%
Paso 1. Hipótesis nula y alternativa
𝐻0 : 𝜌 = 0
𝐻𝑎 : 𝜌 ≠ 0
Paso 2. Nivel de significancia
𝛼 = 0.05
Paso 3: Estadístico de prueba
𝑟 𝑛−2
𝑡=
1−𝑟 49
Desarrollo práctica # 1
Paso 4: Regla de decisión
𝐻0 : 𝜌 = 0
2 𝑐𝑜𝑙𝑎𝑠
𝛼 = 0.05
𝑛=5
𝑔𝑙 = 5 − 2 = 3

𝑡 = 3.182
50
𝑡 = 2.776
Desarrollo práctica # 1
PASO 5: Toma de decisión
𝑟 = 0.9272
𝑛=5
𝑟 𝑛−2
𝑡=
1−𝑟
0.9272 5 − 2
𝑡=
1 − 0.9272
3.6359 La hipótesis nula se rechaza
𝑡= La correlación de la población no es 0
0.3746
Sí existe relación entre las variables
𝑡 = 9.705
51
Un economista del Banco Central está preparando un
estudio sobre el comportamiento del consumidor. Recolectó
datos para determinar si existe una relación entre el ingreso
del consumidor y sus niveles de consumo. Los resultados
fueron los siguientes:
INGRESO CONSUMO 1. Trazar diagrama de dispersión
52
(000 Lps) (000 Lps) 2. Calcular coeficiente de correlación
24.3 16.0 3. Calcular coeficiente de
12.5 8.5 determinación
31.2 15.0 4. Probar la importancia del
28.0 17.0 coeficiente de correlación. Nivel de
35.1 24.2 confianza de 95%
10.5 11.2
23.2 15.0
10.0 7.1
8.5 3.5 corregido
15.9 11.5
Desarrollo práctica # 2
1. Diagrama de dispersión

53
Desarrollo práctica # 2
2. Coeficiente de correlación
INGRESO CONSUMO
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟= (X) (Y)
𝑛 − 1 𝑠𝑋 𝑠𝑌
24.3 16.0
12.5 8.5
31.2 15.0
• Determinar las variables 28.0 17.0
involucradas en el proceso 35.1 24.2
10.5 11.2
23.2 15.0
10.0 7.1
8.5 3.5
15.9 11.5 54
Desarrollo práctica # 2
• Coeficiente de correlación
• Calcular las medias aritméticas σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑟=
INGRESO CONSUMO 𝑛 − 1 𝑠𝑋 𝑠𝑌
(X) (Y)
24.3 16.0
12.5 8.5
199.2
31.2 15.0 𝑋ത = = 19.9 = 20
28.0 17.0 10
35.1 24.2
10.5 11.2 129
23.2 15.0 𝑌ത = = 12.9 = 13
10.0 7.1
10
8.5 3.5
15.9 11.5 55
199.2 129.0
Desarrollo práctica # 2
𝑋ത = 20
• Coeficiente de correlación 𝑌ത = 13
- Calcular las variaciones
INGRESO CONSUMO
(X) (Y) 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
24.3 16.0 (24.3 - 20) = 4.3 (16.0 - 13) = 3.0
12.5 8.5 (12.5 - 20) = -7.5 (8.5 - 13) = -4.5
31.2 15.0 (31.2 - 20) = 11.2 (15.0 - 13) = 2.0
28.0 17.0 (28.0 - 20) = 8.0 (17.0 - 13) = 4.0
35.1 24.2 (31.5 - 20) = 15.1 (24.2 - 13) = 11.2
10.5 11.2 (10.5 - 20) = -9.5 (11.2 - 13) = -1.8
23.2 15.0 (23.2 - 20) = 3.2 (15.0 - 13) = 2.0
10.0 7.1 (10.0 - 20) = -10.0 (7.1 - 13) = -5.9
8.5 3.5 (8.5 - 20) = -11.5 (3.5 - 13) = -9.5
15.9 11.5 (15.9 - 20) = -4.1 (11.5 - 13) = -1.5
Desarrollo práctica # 2
• Coeficiente de correlación
- Calcular la variación cuadrada de X y Y.
INGRESO CONSUMO 𝑋𝑖 − 𝑋ത
(X) (Y) 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത
24.3 16.0 4.3 3.0 12.9
12.5 8.5 -7.5 -4.5 33.8
31.2 15.0 11.2 2.0 22.4
28.0 17.0 8.0 4.0 32.0
35.1 24.2 15.1 11.2 169.1
10.5 11.2 -9.5 -1.8 17.1
23.2 15.0 3.2 2.0 6.4
10.0 7.1 -10.0 -5.9 59.0
8.5 3.5 -11.5 -9.5 109.3
15.9 11.5 -4.1 -1.5 6.2
57
Desarrollo práctica # 2
• Coeficiente de correlación
- Calcular la variación cuadrada de X
INGRESO CONSUMO
(X) (Y) 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑋𝑖 − 𝑋ത
24.3 16.0 4.3 18.5 18.5
12.5 8.5 -7.5 56.3 56.3
31.2 15.0 11.2 125.4 125.4
28.0 17.0 8.0 64.0 64.0
35.1 24.2 15.1 228.0 228.0
10.5 11.2 -9.5 90.3 90.3
23.2 15.0 3.2 10.2 10.2
10.0 7.1 -10.0 100.0 100.0
8.5 3.5 -11.5 132.3 132.3
15.9 11.5 -4.1 16.8 16.8
58
Desarrollo práctica # 2
• Coeficiente de correlación
- Calcular la variación cuadrada de Y
INGRESO CONSUMO
(X) (Y) 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത
24.3 16.0 4.3 18.5 9.0
12.5 8.5 -7.5 56.3 20.3
31.2 15.0 11.2 125.4 4.0
28.0 17.0 8.0 64.0 16.0
35.1 24.2 15.1 228.0 125.4
10.5 11.2 -9.5 90.3 3.2
23.2 15.0 3.2 10.2 4.0
10.0 7.1 -10.0 100.0 34.8
8.5 3.5 -11.5 132.3 90.3
15.9 11.5 -4.1 16.8 2.3
59
Desarrollo práctica # 2
• Coeficiente de correlación
- Resumen de variaciones cuadradas d2
INGRESO CONSUMO 𝑋𝑖 − 𝑋ത
ത 𝑋𝑖 − ത
𝑋 𝑌𝑖 − 𝑌ത
(X) (Y) 𝑌𝑖 − 𝑌
24.3 16.0 12.9 18.5 9.0
12.5 8.5 33.8 56.3 20.3
31.2 15.0 22.4 125.4 4.0
28.0 17.0 32.0 64.0 16.0
35.1 24.2 169.1 228.0 125.4
10.5 11.2 17.1 90.3 3.2
23.2 15.0 6.4 10.2 4.0
10.0 7.1 59.0 100.0 34.8
8.5 3.5 109.3 132.3 90.3
15.9 11.5 6.2 16.8 2.3
468.1 841.7 309.2 60
Desarrollo práctica # 2
• Coeficiente de correlación 𝑋ത = 20
෍ 𝑋𝑖 − 20 𝑌𝑖 − 13 = 468.1 𝑌ത = 13
𝑋𝑖 − 𝑋ത = 841.7
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑌𝑖 − 𝑌ത = 309.2
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌
- Calcular las desviaciones estándar (s)

σ 𝑋𝑖 − 20 841.7
𝑠𝑋 = = = 9.7
𝑛−1 9

σ 𝑌𝑖 − 13 309.2
𝑠𝑌 = = = 5.9
𝑛−1 9
61
Desarrollo práctica # 2
• Coeficiente de correlación
෍ 𝑋𝑖 − 20 𝑌𝑖 − 13 = 468.1
σ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത 𝑠𝑋 = 9.7
𝑟=
𝑛 − 1 𝑠𝑋 𝑠𝑌 𝑠𝑌 = 5.9
468.1 n = 10
𝑟=
10 − 1 9.7 5.9
𝑟 = 0.9174

Hay una correlación positiva


fuerte entre ambas variables 62
Desarrollo práctica # 2
3. Coeficiente de Determinación (r2)

𝑟 = 0.9174

𝑟 = 0.8417

Parece que existe una correlación del


84% entre ambas variables

63
Desarrollo práctica # 2
4. Probar la importancia del coeficiente de
correlación. Nivel de confianza de 95%
Paso 1. Hipótesis nula y alternativa
𝐻0 : 𝜌 = 0
𝐻𝑎 : 𝜌 ≠ 0
Paso 2. Nivel de significancia
𝛼 = 0.05
Paso 3: Estadístico de prueba
𝑟 𝑛−2
𝑡=
1−𝑟 64
Desarrollo práctica # 2
Paso 4: Regla de decisión
𝐻0 : 𝜌 = 0
2 𝑐𝑜𝑙𝑎𝑠
𝛼 = 0.05
𝑛 = 10
𝑔𝑙 = 10 − 2 = 8

𝑡 = 2.306
65
Desarrollo práctica # 2
𝑡 = 2.306
Paso 5: Toma de decisión
𝑟 = 0.9174
𝑛 = 10
𝑟 𝑛−2
𝑡=
1−𝑟
0.9174 10 − 2
𝑡=
1 − 0.9174
7.33946 La hipótesis nula se rechaza
𝑡= La correlación de la población no es 0
0.39789
Sí existe relación entre las variables
𝑡 = 18.446
66
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los
Negocios y la Economía. México: McGrawHill

David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para 67


Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall

S-ar putea să vă placă și