Documente Academic
Documente Profesional
Documente Cultură
E-mail: cdelgado@cohervisa.com.ec
Móvil: 094343396
Centro/Apoyo: N.27 (Milagro)
Tutor: Econ.
Mes de Estudio: Primero
Materia: Estadística Aplicada a la Administración
Las relaciones entre las variables pueden ser positivas (directas), negativas
(indirectas) o pueden no existir, entonces son nulas.
Relaciones positivas son aquellas, donde las dos variables X y Y actúan en la misma
dirección, o sea si una crece, otra también crece; si una decrece, otra también
decrece: Ejemplo: A mayor peso de una persona(X)- mayor talla de la ropa que usa
(Y).
También podemos decir que las relaciones existentes entre las variables pueden ser:
lineales, curvilíneas o exponenciales (logarítmicas). Las más comunes son relaciones
lineales.
1
c. Numero de los atrasos de un empleado al trabajo y su calificación
del desempeño otorgada por su jefe inmediato.
Correlación negativa
EMPLEADO 1 2 3 4 5 6 7 8 9 10
CALIFICACIÓN 95 60 82 50 85 94 96 75 70 91
EXPERIENCIA (en años) 15 2 6 1 7 10 16 5
3 14
2
4 1 50 1 2500 50,00 62,0379 -12,0379 144,911036
5 7 85 49 7225 595,00 77,4831 7,5169 56,5037856
6 10 94 100 8836 940,00 85,2057 8,7943 77,3397125
100,650
7 16 96 256 9216 1536,00 9 -4,6509 21,6308708
8 5 75 25 5625 375,00 72,3347 2,6653 7,10382409
9 3 70 9 4900 210,00 67,1863 2,8137 7,91690769
10 14 91 196 8281 1274,00 95,5025 -4,5025 20,2725063
797,998
0,0012 416,699892
TOTAL 79 798 901 65932 7017 8
ΣXY=7017
ΣX=79
ΣY=798
ΣX2=901
n=10
b=nΣXY-ΣXΣYnΣX2-ΣX2
b=107017-7979810901-792=70170-630429010-6241=71282769=2,5742
a= ΣYn-bΣXn
a= 79810-2,57427910=79,8-20,3362=59,4638
MINITAB:
La ecuación de regresión es:
C1 = 59,5 + 2,57 C2
Coef.
3
Predictor Coef de EE T P
Constante 59,464 4,117 14,44 0,000
C2 2,5742 0,4337 5,94 0,000
El valor “b” significa que para cada año de experiencia adicional, la calificación
aumenta casi 2,6.
El valor de “a” de 59,4638 es el punto donde la ecuación cruza el eje Y o sea sino
tiene años de experiencia la calificación será 59,5
Y'=a+bX
Y'=59,4638+2,57428=80,0574
O sea la calificación sería aproximadamente 80
sy.x=ΣY-Y'2n-2
sy.x=416,699910-2=7.2172
sy.x=65932-59,4638798-2,5742701710-2=7.2174
4
f. Calcule un intervalo de predicción del 90% para el inciso e).
Intervalo de Predicción=Y'±tsy.x1+1n+X-X2ΣX2-ΣX2n
Y'=59,4638+2,57428=80,0574
Y'=80,0574
n=10
gl= n-2=10-2=8
Ver en apéndice F para gl=8 y 90%
t=1,860
X=8
X=7,9
ΣX2=901
ΣX=79
Intervalo de Predicción=80,0574±1,8607,21741+110+8-7,92901-79210
=80,0574±14,0798
coeficiente de correlación
r= nΣXY-ΣXΣYnΣX2-ΣX2nΣY2-ΣY2
n=10
X=8
ΣX2=901
ΣX=79
ΣY2=65932
ΣY=798
ΣXY=7017
r=107017-7979810901-7921065932-7982
r=0.9027
Es positivo de manera que se ve que hay una relación directa entre los años de
experiencia y la calificación. El valor 0.9027 está bastante cercano a uno por lo que
se concluye que la relación es fuerte.
Coeficiente de determinación=r2
r2= 0.90272=0.8149=81.49% ≈81.5%
5
por lo tanto el 81.5% de la variación en la calificación se explica
por la variación en los años de experiencia
Trabajador 1 2 3 4 5 6 7 8 9 10 11
12
Categoría del salario 11 10 8 5 9 9 7 3 11 8 7
2
Ausencias 18 17 29 36 11 26 28 35 14 20 32
39
6
Categorí
Trabajad Ausencia a del Y'
X² Y² XY Y-Y' (Y-Y')²
or s (X) salario (a+bX)
(Y)
Y'=a+bX
ΣXY=2030
ΣX=305
ΣY=90
ΣX2=8697
n=12
Y'=14.4263-0.2725X
a= ΣYn-bΣXn
b=nΣXY-ΣXΣYnΣX2-ΣX2
b=122030-30590128697-3052=24360-27450104364-93025=-309011339=-0.2725
7
a= 9012--0.272530512=7.5+6.9263=14.4263
Y'=14.4263-0.2725X
El valor “b” significa que para cada día de ausencia en los tres últimos años
adicional, la categoría del salario disminuye casi 0,3.
El valor de “a” 14.4263 es el punto donde la ecuación cruza el eje Y o sea sino tiene
ningún día de ausencia la categoría del salario será 14,4
Y=90
Y'=
n=12
sy.x=ΣY-Y'2n-2
sy.x=22,82846912-2=1.5108
sy.x=ΣY2-aΣY-bΣXYn-2
a=14.4263
b= -0.2725
ΣY2=768
ΣY=90
n=12
ΣXY=2030
sy.x=768-14.426390--0.2725203012-2=1.5102
8
La distancia promedio de los valores observados alrededor de la ecuación de regresión
es de 7,22. Es decir la dispersión de los valores observados es 7,22.
El error estándar de estimación, es bajo por lo tanto la dispersión de los puntos
alrededor de la línea de regresión es mínima.
Y'=a+bX
Y'=14.4263-0.272513=10.8838
O sea la categoría del salario de un trabajador con el 13% de ausentismo seria
aproximadamente 11.
Intervalo de Predicción=Y'±tsy.x1+1n+X-X2ΣX2-ΣX2n
Y'=14.4263-0.272513=10.8838
n=12
gl=12-2=10
t=2,228
X=13
X=25,4167
ΣX2=8697
ΣX=305
Intervalo de Prediccion=10.8838±2.228(1.5102)1+112+13-25.416728697-(305)212
=10.8838±2.2281.51021.1165
=10.8838±3.7557
El intervalo va desde 7,1281 hasta 14,6395 de categoría del salario. Se concluye que
la categoría se encontrara entre7,1281 hasta 14,6395 aproximadamente.
coeficiente de correlación
r= nΣXY-ΣXΣYnΣX2-ΣX2nΣY2-ΣY2
n=12
ΣX2=8697
9
ΣX=305
ΣY2=768
ΣY=90
ΣXY=2030
r=122030-30590128697-305212768-902
r= -0.8686
Es negativo de manera que se ve que hay una relación inversa entre los años de
experiencia y la calificación. El valor -0,8686 está bastante cercano a -1 por lo que
se concluye que la relación es negativa intensa.
Coeficiente de determinación=r2
r2=(-0.8686)2=0.7545=75.45% ≈75.5%
Si. En este análisis de regresión se desarrolla una ecuación de estimación, esto es,
una fórmula matemática que relaciona las variables conocidas con la variable
desconocida. Entonces ya podemos, aplicar el análisis de correlación para determinar
el grado de en el que están relacionadas las variables. El análisis de correlación,
entonces, nos dice qué tan bien están relacionadas las variables. La ecuación de
estimación realmente describe la relación.
10
ACTIVIDAD DE APRENDIZAJE 1.4
http://www.youtube.com/watch?v=ciQGl0ABpac&feature=related
http://www.youtube.com/user/felipe2000ipn#p/a/u/0/fmrPEJvfFS8
El señor Erazo, gerente de ventas de una compañía
(distribuidora de repuestos para automóviles), quiere
desarrollar un modelo para predecir las ventas anuales totales
para una región. Si las ventas regionales se pueden predecir,
entonces se podrán estimar las ventas totales de la compañía.
El número de distribuidores de la región que mantiene en
inventario y el número de automóviles registrados para cada
región, son las variables de predicción que el señor Erazo
quiere investigar.
REGIÓN 1 2 3 4 5 6 7 8 9 10
VENTAS (en miles de $) Y 52 26 20 16 30 46 35 24 33 25
NO. DE DISTRRIBUIDORES X1 40 28 25 18 30 35 33 18 33 24
NO. DE AUTOS (en cientos) X2 25 22 18 13 20 28 20 14 23 15
Ventas Nª de
(en miles de Distribuidores Nª de Autos (Y-
Region Y' Y-Y'
$) X2 Y')²
Y X1
31,080
46,425 5,575
1 52 40 25 6
24,900
30,99 -4,99
2 26 28 22 1
36,120
26,01 -6,01
3 20 25 18 1
0,0132
15,885 0,115
4 16 18 13 3
5 30 30 20 32,7 -2,7 7,29
20,611
41,46 4,54
6 46 35 28 6
7 35 33 20 36,3 -1,3 1,69
60,372
16,23 7,77
8 24 18
Gráfica de probabilidad normal 14 9
(la respuesta es Ventas) 18,792
37,335 -4,335
9 99
33 33 23 2
1,5006
95 23,775 1,225
10 90
25 24 15 3
202,37
80
307,11 -0,11
Total 307 284 198 1
Porcentaje
70
60
50
40
30
20
10
1
-10 -5 0 11 5 10
Residuo
a. Desarrolle una ecuación de estimación que permita
predecir ventas dadas en términos de las variables: número
de distribuidores y número de autos registrados.
La ecuación de regresión es
C1 = - 10,2 + 1,20 C2 + 0,345 C3
Coef.
Predictor Coef de EE T P
Constante -10,177 7,534 -1,35 0,219
C2 1,1987 0,5790 2,07 0,077
C3 0,3452 0,8553 0,40 0,699
Y'=a+b1X1+b2X2
ΣY=na+b1ΣX1+b2ΣX2
ΣX1Y=aΣX1+b1ΣX12+b2ΣX1X2
ΣX2Y=aΣX2+b1ΣX1X2+b2ΣX22
ΣY=307
n=10
ΣX1=284
ΣX2=198
ΣX1Y=9382
ΣX12=8536
ΣX1X2=5911
ΣX2Y=6498
ΣX22=4136
307=10a+284b1+198b2
9382=284a+8536b1+5911b2
6498=198a+5911b1+4136b2
12
a=- 10,2
b1=1,20
b2= 0,345
b2: Es el cambio neto en Y por cada cambio unitario en X2, manteniendo X1,
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión
sy.12=ΣY-Y'2n-k+1=202,3710-(2+1)=5,37680
Por la otra fórmula:
sy.12=SSEn-k+1=202,3710-2+1=5,37680 dolares
13
Es difícil determinar cuál es un valor grande y cuál es uno pequeño para el error
estándar.
La distancia promedio de los valores observados al rededor de la ecuación de
regresión es de 5,377 es decir la dispersión de los valores observados es de 5,377.
Gráficadedistribución
T. df=8
0,4
0,3
Densidad
0,2
0,1
0,0
-2,31 0 2,306
X
Análisis de varianza
Fuente GL SC MC F P
Regresión 2 939,73 469,87 16,25 0,002
Error residual 7 202,37 8,91
Total 9 1142,1
Fuente GL SC MC
F
Regresión k SSR MSR=SSR/k
MSR/MSE
14
Error residual n-(k+1) SSE MSE=SSE/n-k+1
Total n-1 SS total
R2=SSRSStotal=939,731142,1=0,823
t=rn-21-r2=
r=0,907
n=10
r2=0,823 =82,3%
t=0,90710-21-0,823=2,5650,421=6,097
Intervalo de Predicción=311,4±5.377(1,860)
Intervalo de Predicción=311,4±10.001
.
Con un nivel de confianza del 90% El gerente de ventas puede sentirse seguro de
que las ventas estarán en un intervalo que va desde 301,4 hasta 321,4 (miles de $)
con 38 distribuidores y 800 automóviles registrados.
15
Ventas Media de Ventas
Region (en miles de $)
(en miles de $) Y
Y-Y (Y-Y)ª
Y
r2=1142,1-202,371 1142,1=0,8228
Si. La regresión múltiple es solo una manera de usar varias variables independientes
para hacer un pronóstico mejor de la variable dependiente.
El análisis de regresión múltiple estudia la forma en que una variable dependiente Y,
se relaciona con dos o más variables independiente
Dicha medida nos la da el coeficiente de determinación R2, que verifica cuanto más
cercano a uno sea su valor, mayor es el grado de asociación lineal que existe entre la
variable dependiente y las independientes o predictoras.
ACTIVIDAD DE APRENDIZAJE 1.5
Se = 85.59
r2= 0.9579
b0 = 175.371
b1 = -0.028 sb1 = 0.315
b2 = 3.775 sb2 = 1.272
b3 = 1.990 sb3 = 4.51
b4 = 212.407 sb4 = 28.09
Y'=b0+b1X1+b2X2+b3X3+b4X4
b1: Es el cambio neto en Y por cada cambio unitario enX1, manteniendo X2, X3, X4,
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión.
b2: Es el cambio neto en Y por cada cambio unitario en X2, manteniendo X1, X3, X4
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión
b3: Es el cambio neto en Y por cada cambio unitario en X3, manteniendo X1, X2, X4
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión.
b4: Es el cambio neto en Y por cada cambio unitario en X4, manteniendo X1, X2, X3
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión.
tcrítico = 2,101
0,3
Densidad
0,2
t1=b1sb1
0,0
-2,10 0 2,10
H0 : b1 = 0 X
H1 : b1 ≠ 0
t1=-0,0280,315=-0,089
Para Entrada:
t2=b2sb2
19
H0 : b2 = 0
H1 : b2 ≠ 0
t2=0,37751,272=0,297
Ingreso anual:
t3=b3sb3
H0 : b3 = 0
H1 : b3 ≠ 0
t1=1,9904,51=0,441
t4=b4sb4
H0 : b4 = 0
H1 : b4 ≠ 0
t1=212,40728,09=7,562
SALARIO MENSUAL $ 250 400 800 1150 350 480 520 280 300 630
Salario
Antigüeda
Mensua Eda Gener Puest
Empleado d
l d o o
s (en años)
$ X2 X3 X4
X1
Y
1 250 1 25 0 0
2 400 3 30 0 1
3 800 5 36 1 1
4 1150 8 44 1 1
5 350 2 28 1 0
6 480 4 32 1 0
7 520 6 34 0 1
8 280 1 22 1 0
9 300 2 26 1 0
10 630 4 33 1 1
Coef.
Predictor Coef de EE T P
Constante -850,8 394,9 -2,15 0,084
Antigüedad(X₁) -15,05 51,01 -0,29 0,780
Edad (X2) 41,90 18,86 2,22 0,077
Genero (X3) 123,09 69,01 1,78 0,135
Puesto (X4) 72,08 91,14 0,79 0,465
21
a) Determine la ecuación de regresión usando el salario
mensual como variable dependiente, y las otras variables
como variables independientes.
Coeficientes
Intercepción -850,8247198
Antigüe (X₁) -15,04624089
Edad (X₂) 41,89642041
Género (X₃) 123,0905233
Puesto (X₄) 72,07757589
Y'=a+b1X1+b2X2+b3X3+b4X4
Y'=-850,823-15,046X1+41,896X2+123,091X3+72,078X4
b1: Es el cambio neto en Y por cada cambio unitario enX1, manteniendo X2, X3, X4,
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión.
b2: Es el cambio neto en Y por cada cambio unitario en X2, manteniendo X1, X3, X4
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión
b3: Es el cambio neto en Y por cada cambio unitario en X3, manteniendo X1, X2, X4
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión.
b4: Es el cambio neto en Y por cada cambio unitario en X4, manteniendo X1, X2, X3
constante. Se denomina coeficiente de regresión parcial, coeficiente de
regresión neta o bien coeficiente de regresión.
22
aumenta su salario. Así mismo, a medida que asciende de puesto administrativo
aumenta su salario.
NAÁLISIS DE VARIANZA
Valor
Grados de Suma de Promedio de los crítico
libertad cuadrados cuadrados F de F
Regresión 4 674565,79 168641,4479 23,1179 0,00201
Residuos 5 36474,21 7294,841693
Total 9 711040
H0 :b1=b2=b3=b4
H1 :No todas las b son 0
F= SSRKSSEn-(k-1)
SSR=674565,79
SSE=36474,21
k=4
F= 674565,79436474,2110-(4+1)=168641,457294,842=23,12
23
Primero determinaremos el valor crítico para t en el apéndice F para una prueba de
dos colas con 5 grados de libertad n-(k+1) y un nivel de significancia de 0,1 y
obtenemos t=2,015 se rechaza H0 si t es menor que -2,015 o es mayor que 2,015.
Coef.
Predictor Coef de EE T P
Constante -850,8 394,9 -2,15 0,084
Antigüedad(X₁) -15,05 51,01 -0,29 0,780
Edad (X2) 41,90 18,86 2,22 0,077
Genero (X3) 123,09 69,01 1,78 0,1355
Puesto (X4) 72,08 91,14 0,79 0,465
t=b1-0sb1=-15,04651,01=-0,295
t=2,015
La H0 no se rechaza y se concluye que X1 podría ser igual a cero, la antigüedad en
años de servicio no es un predictor significativo para el salario mensual, en
consecuencia se puede eliminar del análisis
Para la Edad:
H0 : X2 =0
H1 : X2 ≠0
b2=41,90
sb2=18,86
t=b1-0sb1=41,9018,86 =2,22
t=2,015
La H0 se rechaza y se concluye que X2 no es igual a cero, los coeficientes de
regresión para la variable edad no son cero y no se elimina del análisis.
Para el Género:
H0 :X3 =0
H1 : X3 ≠0
b3=123,09
sb3=69,01
24
La H0 no se rechaza y se concluye que X3 podría ser igual a cero, el género
(masculino o femenino) no es un predictor significativo para el salario mensual, en
consecuencia se puede eliminar del análisis.
Para el Puesto:
H0 :X4 =0
H1 : X4 ≠0
b4=72,08
sb4=91,14
t=b4-0sb4=72,08 91,14=0,791
t=2,015
Salario
Empleado
Mensual Edad Genero Puesto
$ X1 X2 X3
Y
1 250 25 0 0
2 400 30 0 1
3 800 36 1 1
4 1150 44 1 1
5 350 28 1 0
6 480 32 1 0
7 520 34 0 1
8 280 22 1 0
9 300 26 1 0
10 630 33 1 1
La ecuación de regresión es
C1 = - 748 + 36,8 X1 + 126 X2 + 69,6 X3
25
Coef.
Predictor Coef de EE T P
Constante -747,7 169,4 -4,41 0,004
X1 36,788 6,868 5,36 0,002
X2 126,49 62,65 2,02 0,090
X3 69,57 83,55 0,83 0,437
Para la Edad:
H0 : X1 =0
H1 : X1≠ 0
X1=36,788
sb1=6,868
t=b1-0sb1=36,788 6,868=5,356
t=2,015
La H0 se rechaza y se concluye que X1 no es igual a cero, los coeficientes de
regresión para la variable edad no son cero y no se elimina del análisis.
Para el Género:
H0 : X2 =0
H1 : X2 ≠0
b2=126,49
sb2=62,65
t=b2-0sb2=126,49 62,65=2,019
t=2,015
La H0 se rechaza y se acepta la hipótesis alternativa, se concluye que X2 no podría
ser igual a cero, el género (masculino o femenino) es un predictor significativo para
el salario mensual, en consecuencia no se puede eliminar del análisis.
Para el Puesto:
H0 :X3 =0
H1 : X3 ≠0
b3=69,57
sb3=83,55
t=b3-0sb3= 69,57 83,55=0,833
t=2,015
Coef.
Predictor Coef de EE T P
Constante -835,8 129,4 -6,46 0,000
edad 41,319 4,097 10,09 0,000
genero 101,30 53,64 1,89 0,101
Para la Edad:
H0 : X1 =0
H1 : X1≠ 0
X1=41,319
sb1=4,097
t=b1-0sb1=41,319 4,097=10,085
t=2,015
La H0 se rechaza y se concluye que X1 no es igual a cero, los coeficientes de
regresión para la variable edad no son cero y no se elimina del análisis.
Para el Género:
H0 : X2 =0
H1 : X2 ≠0
b2=101,30
sb2=53,64
t=b2-0sb2=101,3053,64=1,888
t=2,015
La H0 no se rechaza y no se acepta la hipótesis alternativa, se concluye que X2
podría ser igual a cero, el género (masculino o femenino) es un predictor no
significativo para el salario mensual, en consecuencia se debe eliminar esta variable.
27
e) Dé un intervalo de confianza de 90% para el salario si la
antigüedad del servicio en la compañía es de 7 años, la edad
del empleado es de 55 años, es un hombre, y desempeña el
cargo técnico.
Salario
Antigüedad
Emplead Mensual Edad Genero Puesto
(en años) Y' Y-Y' (Y-Y')²
o $ X2 X3 X4
X1
Y
Y'=-850,823-15,0467+41,89655+123,0911+72,0781=1543,304
sy.x123=ΣY-Y'2n-k-1
sy.x123=36474,25=85,41
Intervalo de Confianza=Y'±tsy.x123
Intervalo de Confianza=1543,304±2,015(85,41)
Intervalo de Confianza=1543,304±172,1
28
¿
T
i
e Con un nivel de confianza del 90% El gerente de Recursos Humanos puede
n sentirse seguro de que el salario mensual de un empleado con una antigüedad del
e servicio en la compañía es de 7 años, la edad del empleado es de 55 años, es un
hombre, y desempeña el cargo técnico, estará en un intervalo que va desde
q 1371,2 hasta 1715,4.
u
e f) Después de haber hecho la regresión, se descubrió que
en realidad se quería codificar al Hombre con 0 y a la
v Mujer con 1; y también se quería codificar con 0 a los
o Técnicos y con 1 a los administrativos.
l
v
e
Empleado
r Salario
Mensual Antiguedad Edad Género Puesto
s $ X1 X2 X3 X4
e Y
1 250 25 25 1 1
a 2 400 30 30 1 0
3 800 36 36 0 0
r 4 1150 44 44 0 0
e 5 350 28 28 0 1
a 6 480 32 32 0 1
7 520 34 34 1 0
l
8 280 22 22 0 1
i 9 26 0 1
300 26
z 10 630 33 33 0 0
a
r
l La ecuación de regresión es
a salario = - 656 - 15,0 antiguedad + 41,9 edad - 123 Genero - 72,1 Puesto
r
Coef.
e Predictor Coef de EE T P
g Constante -655,7 450,3 -1,46 0,205
r Antigüedad -15,05 51,01 -0,29 0,780
Edad 41,90 18,86 2,22 0,077
e
Genero -123,09 69,01 -1,78 0,135
s Puesto -72,08 91,14 -0,79 0,465
i
ó
S = 85,4098 R-cuad. = 94,9% R-cuad.(ajustado) = 90,8%
n
? Análisis de varianza
S
29
i
s
u
Fuente GL SC MC F P
Regresión 4 674566 168641 23,12 0,002
Error residual 5 36474 7295
Total 9 711040
Fuente GL SC sec.
antiguedad 1 585901
edad 1 65447
Genero 1 18655
Puesto 1 4563
salario = - 656 - 15,0 antigüedad + 41,9 edad - 123 Genero - 72,1 Puesto
30