Documente Academic
Documente Profesional
Documente Cultură
1
Currculum
ANTONIO E. CISNEROS CISNEROS
Estudios.
Definir.
Medir.
Analizar.
Mejorar.
Controlar.
4
Fase de Anlisis.
Qu se hace en esta fase?
Se prueban hiptesis sobre las variables que
afectan la salida del proceso. De esta manera
se identifican las causas raz (Xs).
* La prueba de hiptesis se lleva acabo en el
estado actual del proceso, es decir, sin
modificarlo.
5
Fase de Anlisis.
Objetivos:
1. Conocer y aplicar las herramientas
estadsticas mas utilizadas en el anlisis de
procesos de servicio o de manufactura.
2. Analizar la informacin de un proceso,
utilizando el paquete de cmputo estadstico
Minitab e interpretar los resultados
obtenidos con el mismo.
6
Metodologa de trabajo:
7
En Dios confo los
dems denme datos
8
Contenido temtico
9
Introduccin a las
Pruebas de Hiptesis
10
Pruebas de Hiptesis
11
Entendiendo el
Fases de Seis Sigma: proceso
(descubriendo
relaciones)
13
Anlisis: Encuentra las Xs rojas que mueven el
proceso.
Regin Persona Cmo se si estas Xs son
importantes/relevantes
a los CTQs?
Da de la semana
Costo
Tipo de formato
Temperatura
Desempeo
Presin
Nmero de parte Apariencia
15
Pruebas de Hiptesis
Para contestar la pregunta tiene relacin la X con la Y? (p.e. el costo de
ventas vara de regin a regin?), tenemos 2 opciones (solo una prevalecer):
Error tipo I
En realidad debemos...
a
Rechazar Ho
Error Tipo II
17
Pruebas de Hiptesis
Errores de decisin:
b (beta): Muy til para determinar que tan capaz es una prueba estadstica de
detectar una diferencia no aleatoria especial de un grupo de datos. Se relaciona
con que tan probable (factible) es negar una diferencia cuando en realidad
existe. El nmero (1-b) se conoce como la potencia de la prueba.
18
Pruebas de Hiptesis
Teora de decisin:
Si definimos un valor fijo de alfa, entonces la distribucin utilizada para el anlisis
tendr un valor de corte donde el rea (probabilidad) ms all de este punto es
igual a alfa, definiendo el rea de rechazo para Ho.
Corte
1-a
Regin de
aceptacin
de Ho Regin de rechazo para Ho
a
19
Pruebas de Hiptesis
Tres escenarios para Ha:
Za -Za
Regin de
rechazo de
Ho
Ha: m> 0 Ha: m < 0
Ha: m 0
Sin importar el escenario, si el
valor de la prueba es menor
-Za/2 Za/2 que a, rechazamos Ho.
Variables Atributos
Tienen una unidad fsica Es resultado de contar entidades
relacionada. discretas o caractersticas.
Los valores se miden en una Los valores se miden a travs de
escala continua. diferentes niveles (bajo-medio-alto;
pasa o no; entrega a tiempo o no;
cumple la especificacin; 1,2,3
rayones, etc.)
22
Tipo de datos
Por ejemplo:
X1 = Marca de auto
Una variable discreta X11 = Ford
con 3 niveles X12 = Toyota
X13 = VW
VARIABLE ATRIBUTO
24
Matriz de seleccin de herramientas
Factor (X) Necesitamos
VARIABLE ATTRIBUTE consideraciones
REGRESSION ANOVA, T-TEST,
adicionales en
Response (Y) VARIABLE ANALYSIS N ON
PARAMETRIC
ALTERNATIVES
este cuadrante...
LOGISTIC CHI SQUARE
ATTRIBUTE REGRESSION TEST, TEST FOR
PROPORTIONS
25
Matriz de seleccin de herramientas
Necesitamos
Factor (X) consideracione
VARI ABL E AT T RIB UTE
s adicionales
en este
Response (Y) V A R I AB L E
RE G R E S S IO N
AN A LY S IS
AN O V A, T-TES T,
NO N
P ARAM ET RI C
A L TE R N A T I V E S
cuadrante... Niveles dentro de la X
L O G IS T I C CH I SQ U A RE
AT T RIB UT E RE G R E S S IO N T E S T , TE S T FO R
P R O P O R TI O N S
1 Nivel 2 Niveles
Los datos son: Los datos en cada nivel son:
3 niveles
Los datos en cada nivel son:
Normales No normales
Target
Comparar el promedio contra un valor fijo (p.e. el
tiempo de ciclo es menor a 10 das?)
Herramienta: Prueba t de una muestra
Promedio
28
Herramientas para pruebas de hiptesis
Cliente OC con error OC sin error Buscar independencia entre variables (p.e. los errores
A 2 5
B 3 3 en los precios depende de los clientes?)
C 4 2 Herramienta: Prueba de Chi cuadrada
29
Herramientas para pruebas de hiptesis
20
15
10
tiempo de ciclo es influenciado por la velocidad?)
5
0
8 10 12 14 16 18
Herramienta: Regresin
X
Por qu?
30
Ejemplo 1
H0:
HA:
Tipo de datos
H0:
HA:
Tipo de datos
H0:
HA:
Tipo de datos
H0:
HA:
Tipo de datos
2.
3.
35
35
Que nos queda
Recuerda:
37
Apndice A: Error Estndar de la
media e intervalos de confianza
Todas las pruebas estadsticas dependen de los resultados obtenidos
de una muestra de una poblacin. Si muestreramos en forma
continua, el promedio de las muestras variara de una muestra a otra.
La desviacin estndar de la media muestral se conoce como el error
estndar.
Error
estndar
X
(SE)
38
Apndice A: Error Estndar de la
media e intervalos de confianza
Dependiendo del tamao de la muestra, es el tamao del error alrededor
de la media muestral:
N 4 6 8 10 15 20 25 30 60
S 1.07558276 0.90823734 0.84086047 0.79306224 0.86141349 0.79974404 0.76238764 0.77836987 0.87002243
SE 0.53779138 0.37078634 0.29728907 0.2507883 0.22241601 0.1788282 0.15247753 0.14211025 0.11231941
Media -0.5284525 -0.49827167 -0.58815125 -0.463164 -0.10126267 -0.003829 -0.0318636 0.02844533 0.15424533
0.6
0.5
0.4
SE
0.3
0.2
0.1
0
0 10 20 30 40 50 60 70
N
39
Apndice A: Error Estndar de la
media e intervalos de confianza
C.I . X ta SE
2
Intervalo de Nivel de
confianza para confianza
la media
(tambin puede
ser una
proporcin,
desviacin
estndar,
mediana, etc.) 41
Apndice A: Error Estndar de la
media e intervalos de confianza
0.5
0.4
0.3
0.2
Intervalos
0.1
0
-0.1 0 100 200 300 400 500 600
-0.2
-0.3
-0.4
-0.5
Tamao de muestra
42
Apndice A: Error Estndar de la
media e intervalos de confianza
Corte
Aqu es evidente
rechazar Ho.
Aqu el valor
de p es
marginal,
usando el
intervalo de
confianza
podemos ver
si el error es
grande, por lo
tanto concluir
que hay
problemas con
el tamao de
la muestra.43
Pruebas de Hiptesis
Para contestar la pregunta Tiene relacin la X con la Y? , p.e. El uso del
democar est relacionado con la venta de un modelo de automvil?. Tenemos 2
opciones (solo una ser correcta):
Recuerda:
46
Pruebas
de una Muestra para
comparacin de medias
47
Objetivo
48
El escenario...
Ho:
Ha:
49
Matriz de seleccin de herramientas
Factor (X)
VARIABLE ATRIBUTO
1 nivel
Datos son
Normales No Normales
51
Prueba Z
Valor
No te p(x > a) = 1 e-(1/2)[(x - m)/]2 dx Fijo
preocupes, 2
a
recuerda la Podemos afirmar
distribucin Z!!!
que existe diferencia
entre el promedio de
la poblacin y el valor
fijo?
Promedio
52
Prueba Z
Z=x-m Esta es
informacin de
la POBLACIN
Z=X- m
s/n
53
Prueba Z
Media muestral
s/n
Error estndar de la media
(igual que con grficas de
control).
54
-5.6 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
-5.5 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
-5.4 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
Prueba Z
-5.3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
-5.2 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
0.0
0.0
-5.1 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
-5.0 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
Para el ejemplo-4.9de tiempo
0.00000 de ciclo,
0.00000 0.00000el0.00000
ingeniero
0.00000(que result
0.00000 0.00000ser Black
0.00000 0.00000 0.0
Belt) obtuvo datos para probar
-4.8 0.00000 su suposicin.
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
C. Time
-4.7 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
Ho:-4.5m =
37.3 -4.6 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
22.5 30 (la
0.00000 media
0.00000 del proceso
0.00000 es igual
0.00000 0.00000 a 30
0.00000 segundos)
0.00000 0.00000 0.00000 0.0
30.3
29.5 Ha:-4.4m < 30 (la
0.00001 media
0.00001 es menor
0.00000 0.00000 a 30 segundos)
0.00000 0.00000 0.00000 0.00000 0.00000 0.0
26.7 -4.3 0.00001 0.00001 0.00001 0.00001 0.00001 0.00001 0.00001 0.00001 0.00001 0.0
30.5
26.3
-4.2 0.00001 0.00001 0.00001 0.00001 0.00001 0.00001 0.00001 0.00001 0.00001 0.0
29.9
29 Z=X- m
-4.1 0.00002 0.00002 0.00002 0.00002 0.00002 0.00002 0.00002 0.00002 0.00001
= 28.3 - 30 = -3.37
-4.0 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002
0.0
0.0
25.2
27.6 -3.9 0.00005 0.000052.8/30
s/n 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.0
28.4 -3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.0
23.6
-3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.0
-3.6 0.00016Buscando en la tabla0.00014
de Z: 0.00013 0.00013 0.00012 0.00012
27.8
25.5 0.00015 0.00015 0.00014 0.0
29
-3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.0
30.3
25.6
Z 0.00034
-3.4 0 0.01 0.00031
0.00032 0.02 0.00030
0.03 0.00029
0.04 0.00028
0.05 0.00027
0.06 0.00026
0.07 0.00025
0.08 0
0.0
28.8 -6.0 0.00048
-3.3 0.00000 0.00047
0.00000 0.00045
0.00000 0.00043
0.00000 0.00042
0.00000 0.00040
0.00000 0.00039
0.00000 0.00038
0.00000 0.00036
0.00000 0.0
29.6
25.8
-5.9 0.00069
-3.2 0.00000 0.00066
0.00000 0.00064
0.00000 0.00062
0.00000 0.00060
0.00000 0.00058
0.00000 0.00056
0.00000 0.00054
0.00000 0.00052
0.00000 0.0
29 -5.8 0.00097
-3.1 0.00000 0.00094
0.00000 0.00090
0.00000 0.00087
0.00000 0.00084
0.00000 0.00082
0.00000 0.00079
0.00000 0.00076
0.00000 0.00074
0.00000 0.0
29
25.6
Dado que el0.00000
-5.7 0.00000 valor 0.00000
de p es menor
0.00000 a 0.05,
0.00000 concluimos
0.00000 que0.00000
0.00000 0.00000 0.0
29.1 -5.6suficiente
hay 0.00000 0.00000 0.00000 0.00000
evidencia para 0.00000 0.00000
afirmar que la0.00000 0.00000en
reduccin 0.00000 0.0
27.2 -5.5 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
32
29.6
el tiempo
-5.4 de0.00000
0.00000 ciclo 0.00000
es real.0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
30.4 -5.3 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
55 0.0
27.3 -5.2 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.0
Prueba t
t=X- m
s/n
- Bueno, Cul es la
Distribucin
diferencia? t
Grados de
libertad (GL)
ta,n-1
Regin de
aceptacin
(1-a)
Regin de rechazo (a)
Valor de
corte
Mismos conceptos, diferentes frmulas!!!!
Nota: Los GL son los que afectan la dispersin de la distribucin. A mayor
muestra, ms grados de libertad y ms cercanos son nuestros datos a la
distribucin de la poblacin.
57
Prueba t
Tambin hay tablas para la distribucin t:
Value for t
dof 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00
1 1.0000 0.9682 0.9365 0.9052 0.8743 0.8440 0.8145 0.7857 0.7578 0.7308 0.7048 0.6799 0.6560 0.6331 0.6112 0.5903 0.5704 0.5515 0.5335 0.5163 0.5000
2 1.0000 0.9647 0.9295 0.8945 0.8600 0.8259 0.7925 0.7598 0.7278 0.6968 0.6667 0.6375 0.6094 0.5824 0.5564 0.5315 0.5076 0.4848 0.4631 0.4424 0.4226
3 1.0000 0.9633 0.9267 0.8903 0.8543 0.8187 0.7838 0.7495 0.7159 0.6832 0.6514 0.6206 0.5908 0.5620 0.5343 0.5077 0.4822 0.4578 0.4345 0.4122 0.3910
4 1.0000 0.9625 0.9252 0.8880 0.8512 0.8149 0.7791 0.7440 0.7096 0.6760 0.6433 0.6116 0.5808 0.5511 0.5225 0.4950 0.4685 0.4432 0.4190 0.3959 0.3739
5 1.0000 0.9621 0.9242 0.8866 0.8494 0.8125 0.7762 0.7406 0.7057 0.6715 0.6383 0.6060 0.5747 0.5444 0.5151 0.4870 0.4600 0.4341 0.4094 0.3857 0.3632
6 1.0000 0.9617 0.9236 0.8857 0.8481 0.8109 0.7743 0.7383 0.7030 0.6685 0.6349 0.6022 0.5705 0.5398 0.5101 0.4816 0.4542 0.4279 0.4028 0.3788 0.3559
7 1.0000 0.9615 0.9231 0.8850 0.8472 0.8098 0.7729 0.7366 0.7011 0.6663 0.6324 0.5994 0.5674 0.5364 0.5065 0.4777 0.4500 0.4234 0.3980 0.3738 0.3506
8 1.0000 0.9613 0.9228 0.8845 0.8465 0.8089 0.7718 0.7354 0.6996 0.6647 0.6305 0.5973 0.5651 0.5339 0.5038 0.4747 0.4468 0.4200 0.3944 0.3699 0.3466
9 1.0000 0.9612 0.9225 0.8841 0.8459 0.8082 0.7710 0.7344 0.6985 0.6634 0.6291 0.5957 0.5633 0.5319 0.5016 0.4724 0.4443 0.4174 0.3916 0.3669 0.3434
10 1.0000 0.9611 0.9223 0.8837 0.8455 0.8076 0.7703 0.7336 0.6976 0.6623 0.6279 0.5944 0.5619 0.5303 0.4999 0.4705 0.4423 0.4152 0.3893 0.3645 0.3409
11 1.0000 0.9610 0.9221 0.8835 0.8451 0.8072 0.7698 0.7329 0.6968 0.6614 0.6269 0.5933 0.5607 0.5290 0.4985 0.4690 0.4406 0.4134 0.3874 0.3625 0.3388
12 1.0000 0.9609 0.9220 0.8833 0.8448 0.8068 0.7693 0.7324 0.6962 0.6607 0.6261 0.5924 0.5597 0.5279 0.4973 0.4677 0.4393 0.4120 0.3858 0.3609 0.3370
13 1.0000 0.9609 0.9219 0.8831 0.8446 0.8065 0.7689 0.7319 0.6957 0.6601 0.6254 0.5916 0.5588 0.5270 0.4963 0.4666 0.4381 0.4107 0.3845 0.3594 0.3356
14 1.0000 0.9608 0.9218 0.8829 0.8444 0.8062 0.7686 0.7315 0.6952 0.6596 0.6248 0.5910 0.5581 0.5262 0.4954 0.4657 0.4371 0.4096 0.3833 0.3582 0.3343
15 1.0000 0.9608 0.9217 0.8828 0.8442 0.8060 0.7683 0.7312 0.6948 0.6591 0.6243 0.5904 0.5575 0.5255 0.4946 0.4649 0.4362 0.4087 0.3823 0.3572 0.3332
16 1.0000 0.9607 0.9216 0.8826 0.8440 0.8058 0.7680 0.7309 0.6944 0.6587 0.6239 0.5899 0.5569 0.5249 0.4940 0.4641 0.4354 0.4079 0.3815 0.3562 0.3322
17 1.0000 0.9607 0.9215 0.8825 0.8439 0.8056 0.7678 0.7306 0.6941 0.6584 0.6235 0.5895 0.5564 0.5244 0.4934 0.4635 0.4347 0.4071 0.3807 0.3554 0.3313
18 1.0000 0.9607 0.9214 0.8824 0.8437 0.8054 0.7676 0.7304 0.6939 0.6581 0.6231 0.5891 0.5560 0.5239 0.4929 0.4629 0.4341 0.4065 0.3800 0.3547 0.3306
19 1.0000 0.9606 0.9214 0.8823 0.8436 0.8053 0.7674 0.7302 0.6936 0.6578 0.6228 0.5887 0.5556 0.5235 0.4924 0.4624 0.4336 0.4059 0.3794 0.3540 0.3299
20 1.0000 0.9606 0.9213 0.8823 0.8435 0.8051 0.7673 0.7300 0.6934 0.6575 0.6225 0.5884 0.5552 0.5231 0.4920 0.4620 0.4331 0.4054 0.3788 0.3535 0.3293
21 1.0000 0.9606 0.9213 0.8822 0.8434 0.8050 0.7671 0.7298 0.6932 0.6573 0.6223 0.5881 0.5549 0.5227 0.4916 0.4616 0.4327 0.4049 0.3783 0.3529 0.3287
22 1.0000 0.9606 0.9213 0.8821 0.8433 0.8049 0.7670 0.7297 0.6930 0.6571 0.6220 0.5879 0.5546 0.5224 0.4913 0.4612 0.4323 0.4045 0.3779 0.3524 0.3282
23 1.0000 0.9606 0.9212 0.8821 0.8432 0.8048 0.7669 0.7295 0.6928 0.6569 0.6218 0.5876 0.5544 0.5221 0.4909 0.4609 0.4319 0.4041 0.3774 0.3520 0.3277
24 1.0000 0.9605 0.9212 0.8820 0.8432 0.8047 0.7668 0.7294 0.6927 0.6567 0.6216 0.5874 0.5541 0.5219 0.4907 0.4605 0.4316 0.4037 0.3771 0.3516 0.3273
25 1.0000 0.9605 0.9211 0.8820 0.8431 0.8046 0.7667 0.7293 0.6926 0.6566 0.6214 0.5872 0.5539 0.5216 0.4904 0.4603 0.4312 0.4034 0.3767 0.3512 0.3269
26 1.0000 0.9605 0.9211 0.8819 0.8430 0.8046 0.7666 0.7292 0.6924 0.6564 0.6213 0.5870 0.5537 0.5214 0.4901 0.4600 0.4310 0.4031 0.3764 0.3509 0.3265
27 1.0000 0.9605 0.9211 0.8819 0.8430 0.8045 0.7665 0.7291 0.6923 0.6563 0.6211 0.5868 0.5535 0.5212 0.4899 0.4597 0.4307 0.4028 0.3761 0.3505 0.3262
28 1.0000 0.9605 0.9211 0.8818 0.8429 0.8044 0.7664 0.7290 0.6922 0.6562 0.6210 0.5867 0.5533 0.5210 0.4897 0.4595 0.4304 0.4025 0.3758 0.3502 0.3259
29 1.0000 0.9605 0.9210 0.8818 0.8429 0.8043 0.7663 0.7289 0.6921 0.6561 0.6208 0.5865 0.5532 0.5208 0.4895 0.4593 0.4302 0.4023 0.3755 0.3500 0.3256
60
Prueba Z de nuevo...
Indica la columna con
los datos, el valor de la
desviacin estndar
POBLACIONAL y el
valor de referencia:
Selecciona Options:
61
Prueba Z de nuevo...
Test of mu = 30 vs mu < 30
The assumed sigma = 2.8
62
Prueba t de nuevo...
Usando Minitab: Stat>Basic Statistics>1-Sample t
63
Prueba t de nuevo...
Indica la columna con
los datos y el valor de
referencia:
Selecciona Options:
64
Prueba t de nuevo...
Test of mu = 30 vs mu < 30
65
Ejemplo
66
Que nos queda...
67
Pruebas de Varianzas y
Medias para mltiples
muestras
68
Objetivo
69
Forma, centro & dispersin
70
Matriz de seleccin de herramientas
Factor (X)
VARIABLE ATRIBUTO
3+ Niveles
2 niveles
Datos en los niveles son:
Datos en los niveles son:
Normales
Normales No Normales
12 = m1 m2
22 Podemos afirmar
diferencias entre el
proceso A y el
Homogeneidad de varianzas proceso B?
73
Suposicin de varianzas iguales
74
Suposicin de varianzas iguales
Bartlett Levene
75
Prueba de homogeneidad de varianzas
Actualmente tenemos a 2 proveedores entregando el mismo nmero
de parte, los precios son similares entre los dos proveedores.
Deseamos seleccionar solo uno en trminos de su confiabilidad
(consistencia) en entregas y quien entrega ms pronto. Qu
proveedor debemos seleccionar?
Tomorrowsure Inurdrims
Para la consistencia vamos a revisar si
30 27.8
30.5 25.5 uno tiene menos variacin que el otro, o si
29.3 38 esta es la misma:
30.9 40.8
30.4 17.3
29.7 36.5 Ho: 12 = 22
30.9 30
31.3 31.4
31.2 35.3 Ha: 12 22
31.2
32.4
29.7
76
Prueba de homogeneidad de varianzas
77
Prueba de homogeneidad de varianzas
Selecciona las
columnas que
deseas juntar.
Nombra las
columnas que van a
contener y=f(x)
78
Prueba de homogeneidad de varianzas
79
Prueba de homogeneidad de varianzas
Indica las
columnas que
contienen a la y,
as como a la x:
Selecciona O.K.
80
Prueba de homogeneidad de varianzas
Inurdrims
Tomorrowsure
0 5 10 15
Inurdrims
Tomorrowsure
20 30 40
Tiempo
Normales No Normales
Figrate la referencia!!!
( x1 x2 ) ( m1 m 2 )
t
SE ( x1 x2 )
s12 s22
Donde: SE ( x1 x2 )
n1 n2
2
s s
2 2
1 2
DoF 12 2 2
n n
Y los gl
son: s12 s22
n1 n2
n1 1 n2 1
84
Prueba t de 2 muestras
Para nuestro ejemplo, debemos probar las siguientes hiptesis:
85
Prueba t para 2 muestras
2
s 2
s 2
0.7584 52.71
2
1 2
DoF 12 2 2
n n 12 9
2 2
8.17 8
s1 s2
2 2
0.7584 52.71
n1 n2 12 9
n1 1 n2 1 11 8
86
Prueba t para 2 muestras
Stat>Basic
Statistics>2-Sample
t...
88
Prueba t para 2 muestras
Indica las columnas
con los datos y con
los niveles por
variable (tambin
puedes comparar los
dos niveles por
separado:
89
2 sample t-Test
90
Ejemplo
2000 2001
351.842 362.541 Ho: El promedio de costos es igual que el ao pasado
363.527 326.435 Ha: Los costos del ao pasado fueron mayores.
340.48 341.559
349.936 324.397
346.376 320.716
346.166 348.707
346.015
370.633 Ho: m1 = m2
Ha: m1 > m2
358.718
344.722
361.61
349.75
91
Ejemplo
2 levels
Data in each level is:
Normal
Variances are:
Non Normal
Variances are:
Primero debemos saber si las varianzas son iguales o no:
Equal Different Equal Different
t-Test with Mann-Whitney Mann-Whitney
t-Test with
equal t-Test with t-Test with
non-equal
variances equal equal
variances
1- way variances (in variances (in
ANOVA n>25) n>25)
1- way 1- way
ANOVA (if ANOVA (if
Note: Only if data is not paired. n>25) n>25)
92
Ejemplo
Test for Equal Variances for Costos
95% Confidence Intervals for Sigmas Factor Levels
2000
2001
10 20 30 40 50
2000
2001
93
Ejemplo
94
Ejemplo
Two-Sample T-Test and CI: 2000, 2001
95
Intenta este...
Ni-Cadmium Ni-metal
54.5 78.3 Un proveedor de bateras est probando una
67 79.8
41.7 81.3
nueva alternativa a su batera de Ni-Cd. La
64.5 69.4 nueva batera de Ni-metal se espera que dure
86.8 82.8 ms tiempo con la misma consistencia. 2
40.8 82.3
72.5 62.5 muestras de 25 bateras c/u fueron probadas.
76.9 77.5 Hay evidencia que de la batera de Ni-
81 85.3
83.3 85.3
Cadmium dura menos?
82 86.1
71.8 41.1
68.8 112.3 Ho:
71 103
67.8 95.4
56.7 91.1 Ha:
69.7 46.4
70.4 87.3
74.9 71.8
75.4 83.2
64.9 85
104.4 74.3
90.4 85.5
72.8 72.1
58.7 74.1
96
ANOVA
Una alternativa muy poderosa para la prueba t, es el Anlisis de
Varianza (ANOVA). Es tambin muy til para probar diferencias en
las medias cuando la X tienen mltiples niveles.
3+ Niveles
2 niveles
Datos en los niveles son:
Datos en los niveles son:
Normales
Normales No Normales
Tratamos de
ajustar este
modelo a
y m ai eij nuestros
datos...
Dentro
del
grupo
Entre grupos
Total
2
Entre
2
_ grupos 2
Dentro_ de _ grupos
Total n-1 ( x
i 1 j 1
ij xtotal ) 2
SSTotal SS EG
SS DG
Dentro de grupos* n-k
nk
l m
Total n-1 ( x
i 1 j 1
ij xtotal ) 2
Un valor til es el de epsilon cuadrada (e2) que nos dice que tanta variacin
(del total) se explica por la variacin entre grupos. Si e2 del error es mayor
que la de entre grupos, entonces probablemente otra fuente de variacin
cambi durante nuestro anlisis.
SS EG 2 SS DG
e EG ; e DG
Es mejor si se 2
expresa como
porcentaje!
SSTotal SSTotal
101
ANOVA
Ni-Cadmium Ni-metal
54.5 78.3 Un proveedor de bateras est probando una
67 79.8 nueva alternativa a su batera de Ni-Cd. La
41.7 81.3
64.5 69.4
nueva batera de Ni-metal se espera que dure
86.8 82.8 ms tiempo con la misma consistencia. 2
40.8 82.3
72.5 62.5
muestras de 25 bateras c/u fueron probadas.
76.9 77.5 Hay evidencia que de la batera de Ni-
81 85.3 Cadmium dura menos?
83.3 85.3
82 86.1
71.8 41.1
68.8 112.3 Ho: mNi-Cadmium = mNi-metal
71 103
67.8
56.7
95.4
91.1
Ha: mNi-Cadmium mNi-metal
69.7 46.4
70.4 87.3 Promedio Ni-Cadmio = 70.748
74.9 71.8
75.4 83.2 Promedio Ni-metal = 79.728
64.9 85 Promedio total = 75.238
104.4 74.3
90.4 85.5
72.8 72.1
58.7 74.1
102
ANOVA
Suma de Cuad.Medio
Fuente de Variacin GL Cuadrados F Valor de p
Total 49 11131.638
Stat>ANOVA>One-way
104
ANOVA
105
ANOVA
One-way ANOVA: Horas versus Batera
106
Intenta este...
107
Que nos queda
109
Apndice A: Prueba de Mann-Whitney
X discreta con 2 niveles:
110
Apndice A: Prueba de Mann-Whitney
La prueba U (como la mayora de las pruebas no paramtricas) usan la
suma de los rangos de las dos muestras.
El procedimiento es como sigue:
Ranquea todas las (n1 + n2) observaciones en orden
ascendente. Los empates reciben el promedio de sus
observaciones.
Calcula la suma de los rangos, denominados Ra y Rb
Calcula el estadstico U,
Ua = n1(n2) + .5(n1)(n1 + 1) - Ra
o
Ub = n1(n2) + .5(n2)(n2 + 1) - Rb
donde Ua + Ub = n1(n2).
111
Apndice A: Prueba de Mann-Whitney
Las hiptesis relacionan las medianas, no las medias:
x1 ~
Ho : ~ x2
x ~
Ha : ~ 1 x 2
El estadstico de prueba, U, es el menor de Ua y Ub. El valor de corte
de la distribucin U est dado por: Un1, n2, a y las reglas de decisin son
las mismas.
Lo sentimos, no tenemos tablas de la
distribucin U. Para analizar nos
limitaremos al uso de Minitab
(Stat>Nonparametrics>Mann-
Whitney).
112
Apndice B: Prueba de Kruskal-Wallis
113
Apndice B: Prueba de Kruskal-Wallis
Al computar el estadstico de KW, cada observacin se reemplaza por
el rango en una combinacin de todas las k muestras. En otras
palabras se crea una sola serie de valores. La mnima observacin se
reemplaza por el rango de 1, la siguiente ms pequea con el rango 2,
y la mxima observacin con el rango N, donde N es el total de
observaciones entre todas las muestras (N es la suma de ni).
114
Apndice B: Prueba de Kruskal-Wallis
Se puede mostrar que si las k muestras vienen de la misma poblacin,
cuando la hiptesis nula es verdadera, el estadstico H, usado para la
prueba se distribuye aproximadamente como una chi cuadrada con gl = k
- 1, partiendo de que las k muestras no son demasiado pequeas
(digamos, ni>4, para toda ki). H se define como:
12 k
Ri2
H
N ( N 1) i 1 ni
3( N 1)
donde
k = nmero de muestras (grupos)
ni = nmero de observaciones de la i-sima muestra del grupo
N = Nmero total de observaciones (suma de las ni)
Ri = suma de los rangos del grupo i
115
Prueba deChi2 & Prueba
de Proporciones
116
Objetivo
117
Matriz de seleccin de herramientas
Factor (X)
VARIABLE ATRIBUTO
Todo se trata
Ho: La variable A es independiente de la variable B de relaciones!!!
Ha: La variable A depende de la variable B
119
Prueba de Chi cuadrada
120
Prueba de Chi cuadrada
Ho:
Cmo escribiras las
hiptesis?
Ha:
121
Prueba de Chi cuadrada
Para el anlisis de los datos, necesitamos una tabla de contingencia
para sumarizar las frecuencias. Es un arreglo n X m mostrando las
combinaciones entre los niveles de 2 variables.
n1 n2 n3 n4 Total
Necesitamos el total
m1
(suma) por rengln y por
m2 columna y el gran total:
m3
Smi = Snj = Gran Total
Total
122
Prueba de Chi cuadrada
Para construir el estadstico de prueba, necesitamos sumar los
valores de Chi cuadrada por celda:
Ho:
Ha:
125
Como usando Excel.....
127
Usando Minitab.....
Selecciona O.K.
128
Usando Minitab.....
129
Ms ejemplos...
Queremos saber si hay diferencia significativa entre nuestros tres proveedores en
trminos de entregas a tiempo. Podemos afirmar que hay elementos para
determinar una diferencia?
Ho:
Ha:
131
Como usando Excel.....
133
Intenta este...
Edad de la Madre
Nacimiento < 25 25-35 > 35
Normal 22 23 9
Anormal 8 17 21
Ho:
Ha:
Za -Za
Regin de
rechazo de
Ho
Ha: P> 0 Ha: P< 0
Ha: P 0
Sin importar el escenario, si el
valor de p (p-value) es menor
-Za/2 Za/2 que a, rechazamos Ho.
Nota: La mayora de los software estadsticos
Regin de hacen anlisis para dos colas, si no entonces
rechazo de habr que multiplicar el valor de p por 2.
Ho
136
Prueba de Proporciones
Ataque n p
Grupo 1 239 11034 0.0217
Grupo 2 139 11037 0.0126
Es esta diferencia suficiente
para determinar que la
aspirina previene los ataques
al corazn? 138
3.6 0.999840854 0.99984
3.7 0.999892170 0.99989
Ejemplo 3.8 0.999927628 0.99993
3.9 0.999951884 0.99995
Ho: p1 = p2 (No hay diferencia entre las proporciones)
4.0 0.999968314 0.99996
Ha: p1 p2 (Existe diferencia entre las proporciones)
4.1 0.999979331 0.99998
4.2 0.999986646 0.99998
ppooled= x1 + x2 = 239 + 139 = 0.01713 4.3 0.999991454 0.99999
n1 + n2 11034+11037 4.4 0.999994583 0.99999
4.5 0.999996599 0.99999
se(p1-p2) = ppooled(1-ppooled)(1/n1 + 1/n2) = 0.017(0.98)(1/11034
4.6 0.999997885 0.99999
+ 1/11037)
4.7 0.999998698 0.99999
4.8 0.999999206 0.99999
se(p1-p2) = 0.00175 Buscando
4.9en0.999999520
las 0.99999
tablas Z:
5.0 0.999999713 0.99999
Z = p1 - p2 = 0.0217 - 0.0126 = 5.2 Z 0.999999830
0 0.01
5.1 0.99999
se(p1-p2) 0.00175 3.0
5.2 0.998650033
0.999999900 0.998693
0.99999
3.1 0.999032329 0.999064
5.3 0.999999942 0.99999
El valor de p deseado es: 2(1-0.99999)=0.00002 3.2 0.999312798 0.999336
5.4 0.999999967 0.99999
Rechazar Ho, concluimos que 3.3 existe
0.999516517 0.999533
suficiente
5.5 0.999999981 0.99999
3.4
evidencia para afirmar que la5.6 0.999663019
aspirina 0.999675
previene0.99999
0.999999989
los ataques al corazn! 3.5 0.999767327 0.999775
5.7 0.999840854
3.6 0.999999994 0.999846
0.99999
139
5.8 0.999999997 0.99999
Ejemplo
Usando Minitab:
Stat>Basic Statistics>2 proportions
140
Ejemplo
Proporcin
Gnero Contratado No contratado contratada
M 30 70 0.3
F 10 40 0.2
Ho:
Ha:
142
Ejemplo
Z 0 0.01 0.
Ho: p1 = p2 (No hay diferencia entre las proporciones)
0.0 0.50000 0.50399 0.5
Ha: p1 > p2 (Existe diferencia entre las proporciones)
0.1 0.53983 0.54380 0.5
0.2 0.57926 0.58317 0.5
ppooled= x1 + x2 = 30 + 10 = 0.26667 0.3 0.61791 0.62172 0.6
n1 + n2 100 + 50 0.4 0.65542 0.65910 0.6
0.5 0.69146 0.69497 0.6
se(p1-p2) = ppooled(1-ppooled)(1/n1 + 1/n2) = 0.267(0.73)(1/100
0.6 0.72575 +0.72907
1/50) 0.7
0.7 0.75804 0.76115 0.7
se(p1-p2) = 0.07659 0.8 0.78814 0.79103 0.7
0.9 0.81594 0.81859 0.8
Buscando en las
Z = p1 - p2 = 0.3 - 0.2 = 1.31 1.0Z:0.84134 0.84375 0.8
tablas
se(p1-p2) 0.07659 1.1 0.86433 0.86650 0.8
Z 0.88493
1.2 0 0.01 0.80
0.88686
0.0 0.90320
1.3 0.50000 0.90490
0.50399 0.9
0.
El valor de p es: 1-0.9049=0.0951
0.1 0.91924
1.4 0.53983 0.92073
0.54380 0.9
0.
No rechazar Ho, concluimos que no existe
1.5
0.2 0.93319
0.57926 0.93448
0.58317 0.9
0.
evidencia para afirmar que existen preferencias
1.6
0.3 0.94520
0.61791 0.94630
0.62172 0.9
0.
de gnero en las prcticas de contratacin. 143
1.7
0.4 0.95543
0.65542 0.95637
0.65910 0.9
0.
Intenta este....
Ho:
Ha:
145
Seleccin del Tamao de
muestra
146
Objetivo
147
Cmo seleccionar tamao de
muestra?
Debemos examinar el tipo de datos utilizado. Cada tipo de
dato tiene un mtodo diferente para definir tamaos de
muestra.
Datos continuos o variables
Datos discretos o atributos
Continuos Discretos
148
Terminologa
1. Hiptesis nula (Ho) - Afirmacin de no cambio o diferencia.
Afirmacin que se supone cierta
2. Error tipo I - Error incurrido al rechazar Ho cuando esta es cierta,
clamar una diferencia cuando no existe.
3. Riesgo alfa - Mxima probabilidad de incurrir en error tipo I. Esta
probabilidad es mayor a cero y usualmente se fija al 5%. Los
investigadores toman su decisin considerando el mayor riesgo
aceptable al rechazar. El riesgo de rechazar Ho cuando es cierta.
Distribucin Distribucin
real mejorada?
1a a
149
Terminologa
4. Hiptesis alternativa (Ha) - Afirmacin de cambio o diferencia. Este
enunciado es cierto si Ho se rechaza.
5. Error tipo II - El error de no rechazar Ho cuando esta es falsa, o
indicar que no hay diferencia cuando si la hay.
6. Riesgo Beta - La probabilidad de incurrir en el error tipo II, el riesgo
de aceptar Ho cuando es falsa.
Distribucin Distribucin
real mejorada?
1a b a 1b
150
Terminologa
7 Potencia (1b) - La habilidad de una prueba estadstica de detectar
una diferencia real. Comnmente usado para determinar tamaos
de muestra dependiendo de las diferencias que se desean percibir.
(delta-sigma: d/)
8. Estadstico de prueba - Valor estandarizado (z, t, F, etc.) que
representa la factibilidad de Ho y se distribuye de tal forma que se
puede determinar una probabilidad. Usualmente, dado que Ho es
ms factible, el valor absoluto del estadstico decrecer dado que la
probabilidad de ser parte de la distribucin es mayor.
a/2 1a a/2
Control
Distribution CL
Contrast
CL Distribution
b 1b
d
151
Terminologa
9. Delta (d) - La magnitud de la diferencia a ser detectada en el
universo, misma que es de inters o de utilidad prctica en el
mundo real. Se le conoce como delta o sensibilidad de la
prueba.
Muestra = f ( a, b, d, )
152
Sensibilidad de la prueba
Una vez definidos los valore de a y, es necesario determinar que tan
grande es la diferencia que se desea detectar para que exista una
diferencia prctica. Esta diferencia se conoce como delta sigma .
Por ejemplo, la diferencia entre dos medias expresada en
desviaciones estndar (valores de Z).
d/
Distribucin Distribucin
de control de contraste
a/2 a/2
CL
1a
CL
b 1b
d/
Delta (d) = Diferencia til en la prctica
Sigma ( ) = Desviacin estndar de referencia
153
Impacto de a y b en el tamao de la
muestra
Se QUEREMOS reducir error -- (a, b )
... aumenta el tamao de muestra n
Si QUEREMOS aumentar la sensibilidad -- ( reducir d / )
... aumenta el tamao de muestra n
0.5
0.6
0.4
0.5 0.3
0.4 0.2
Intervalos
0.1
SE
0.3
0
0.2 -0.1 0 100 200 300 400 500 600
0.1 -0.2
-0.3
0
-0.4
0 10 20 30 40 50 60 70 -0.5
N Tamao de muestra
154
Tamao de muestra
El criterio para determinar un adecuado tamao de muestra
es de naturaleza estadstica.
Otros criterios de naturaleza prctica incluyen elementos
tales como costo, tiempo y recursos disponibles.
Estos factores pueden tener un impacto prctico en la
seleccin de un tamao de muestra adecuado, as que esto
debe ser determinante despus de comparar el tamao
estadsticamente correcto. Solo entonces puedes evaluar
las prdidas.
Tamao
de = + +
muestra
155
Calculador de tamao de muestra
Tenemos una ayuda en Excel: sample_size_BSSA.xls para ayudarnos a
calcular tamaos de muestra estadsticamente vlidos.
156
Ejemplo
157
Ejemplo
Selecciona la hoja DPMO:
Vamos a comparar
una muestra del
proceso inicial contra
una muestra del
proceso mejorado,
as que
seleccionamos una
prueba de dos
muestras.
158
Ejemplo
DPMOs iniciales
vs. deseados DPMOs iniciales
(100000-11000) Esta es la muestra
necesaria para tener
validez estadstica.
159
Tamao de muestra - Datos continuos
Los tamaos de muestra para datos
continuos estn tabulados para facilitar (???)
la investigacin.
Con los valores de a, b, y d/, podemos usar
la tabla de la siguiente pgina para
determinar el tamao de muestra (n).
La columna izquierda tiene valores de d / .
La hilera superior tiene valores de a.
Bajo cada a hay 4 valores de b.
160
Tamao de muestra - Datos continuos
Sample Size
a = 20% a = 10% a =5% a = 1%
164
Tamao de muestra - Datos continuos
165
Intenta esto...
166
Intenta esto...
167
Que nos queda
168
Anlisis de Regresin
169
Objetivo
170
Matriz de seleccin de herramientas
Factor (X)
VARIABLE ATRIBUTO
172
Regresin
Y = F(x)
173
Regresin
80
75
Altura del hijo 70
65
60
60 65 70 75 80
Altura del padre
174
Regresin
Y=Millas por Y=Estatura de
galn 30 los hijos 80
(mpg) 2 6
0
1 0
4
0 0
0 .5 1 1.5 2 60 70 80
X=Peso del auto (tons) X=Estatura de los padres (pulgs)
Y=calif. Y=Precio de
(de 100%) 80 venta 35
6 (miles) 2
0
4 5
5
0
0 .5 1 1.5 2 1 6 14 22 30
X=Tiempo de estudio (hr) X=Edad del auto
Y=Precio de Y=Ventas $
casa ($) (millones) 30
2
0
1
0
15k 20k 35k 40k 0 .5 1 1.5 2
X=metros cuadrados X=Promocin $(Millones) 175
Regresin
Y = f(x)
80
Lineal,
75 cuadrtica,
cbica,
70
logartmica,
65 etc.
60
60 65 70 75 80
177
Regresin
Variable y ax b
dependiente (pronstico) Variable independiente
Estimado y b 0 b1 x
Variable de regresin
178
Regresin
Las frmulas para definir el modelo de regresin son(solo mostramos
en caso para una sola variable, conocido como regresin simple):
y b 0 b1 x
Qu tan
n bueno es
( x x )( y
i i y)
SS xy
BUENO al
ajustar los
b1 i 1
n
datos?
(x x) 2 SS xx
i
i 1
b 0 y b1 x
179
Regresin
y b 0 b1 x
Un modelo de regresin es bueno dependiendo de que tan bien describe la
variacin entre dos variables. El coeficiente de correlacin (R) indica que
tan pronunciada es la pendiente. El cuadrado de la correlacin indica que
tanta variacin (cambios en la Y) puede ser explicado por las variables de
regresin.
n
SS error i i
( y
y ) 2
R2 1 1 i 1
n
i
SS yy
( y y ) 2
i 1
180
Regresin
Un gerente de mercadeo que conduce un
estudio de mercado, desea predecir el
Experiencia Entrevistas nmero de entrevistas (cuestionarios) que
15 4 puede levantar dados los entrevistadores. El
41 9 piensa que el nmero de cuestionarios
58 12 depende de la experiencia del entrevistador
18 6 (en semanas). Toma una muestra de 10
37 8 entrevistadores para el anlisis. Tiene la
52 10
experiencia influencia real en el nmero de
28 6
24 5
cuestionarios aplicados?
45 10 Y = # entrevistas* Por qu??
33 7 X = Experiencia en semanas
Usando Minitab:
Stat>Regression>Regression
182
Regresin
Indica la Y
Indica la X
Selecciona Storage
183
Regresin
Selecciona O.K.
...y los valores dos veces
Selecciona que ajustados (fits)
guarde los
residuales...
184
Regresin
The regression equation is
Entrevistas = 1.62 + 0.173 Experiencia
Analysis of Variance
Source DF SS MS F P
Regression 1 54.596 54.596 124.65 0.000
Residual Error 8 3.504 0.438
Total 9 58.100
Analysis of Variance
Source DF SS MS F P
Regression 1 54.596 54.596 124.65 0.000
Residual Error 8 3.504 0.438
Total 9 58.100
Analysis of Variance
Source DF SS MS F P
Regression 1 54.596 54.596 124.65 0.000
Residual Error 8 3.504 0.438
Total 9 58.100
3. Revisa la cantidad de variacin descrita por el modelo (R-sq)
12
11
10
Entrevistas
20 30 40 50 60
Experiencia
8
modelo. Los residuales
dan informacin sobre la
7
validez del modelo, por
6
eso hay que analizarlos.
5 ei
4
20 30 40 50 60
Experiencia
190
Regresin
Los residuales son
el resultado de
substraer el valor
observado menos
el valor
Estos vienen
pronosticado (error
de utilizar el
del modelo)
modelo con
los valores
originales de
X.
.999
Stat>Basic .99
.95
Statistics>Normality
Probability
.80
Tests .50
.20
.05
.01
.001 Busca el valor
-0.5 0.0 0.5 1.0 de P
RESI1
Average: -0.0000000 Anderson-Darling Normality Test
StDev: 0.623954 A-Squared: 0.231
N: 10 P-Value: 0.734
Charts>Individuals 1
Individual Value
0 Mean=-3.4E-15
-1
LCL=-1.808
-2
0 1 2 3 4 5 6 7 8 9 10
Observation Number
Graphs>Plot
1
Los puntos deben
estar dispersos
RESI1
sin un patrn
0
especfico
-1
4 5 6 7 8 9 10 11 12
FITS1
194
Regresin
195
Regresin
Residual Model Diagnostics
Normal Plot of Residuals I Chart of Residuals
2
UCL=1.808
1
1
Residual
Residual
0 Mean=-3.4E-15
0
-1
LCL=-1.808
-1 -2
-1 0 1 0 1 2 3 4 5 6 7 8 9 10
Normal Score Observ ation Number
Residual
2
0
1
0 -1
-1.0 -0.5 0.0 0.5 1.0 1.5 4 5 6 7 8 9 10 11 12
Residual Fit
196
Ejemplo
Trabajando en un proyecto para reducir los costos
de mantenimiento, el ingeniero del rea desea
saber si la eficiencia de un motor depende de su
velocidad en rpms. Ajusta el modelo ms
apropiado y determina su validez.
197
Ejemplo
Regression Analysis: Y(%) versus X
Analysis of Variance
Source DF SS MS F P
Regression 1 0.299914 0.299914 269.100 0.000
Error 18 0.020061 0.001115
Total 19 0.319975
La velocidad es
significativa!
Residual
0.00 0.0 Mean=-4.8E-16
normales, O.K.
-0.05 -0.1
LCL=-0.1213
-2 -1 0 1 2 0 10 20
Normal Score Observ ation Number
4
Frequency
Residual
3
0.00
2
1
-0.05
0
-0.06 -0.04 -0.02 0.00 0.02 0.04 0.6 0.7 0.8 0.9 1.0
Residual Fit
Ahora qu????
Podemos apreciar un patrn entre los
residuales y los valores ajustados.
Esto nos indica que la relacin no es
lineal. Debemos ajustar otro modelo
tal como el cuadrtico, cbico, etc.
199
Ejemplo
Al ajustar modelos no lineales, debemos seleccionar otro tipo de modelos
tales como:
cuadrtico
y b 0 b1 x b 2 x 2
Debemos indicar a
o Minitab el modelo
necesitado.
cbico
y b 0 b1 x b 2 x 2 b 3 x3
200
Ejemplo
Analysis of Variance
Source DF SS MS F P
Regression 2 0.316569 0.158284 789.950 0.000
Error 17 0.003406 0.000200
Total 19 0.319975
Ambos componentes
Source DF Seq SS F P son necesarios en el
Linear 1 0.299914 269.100 0.000 modelo
Quadratic 1 0.016655 83.119 0.000
202
Ejemplo
estabilidad an 0.01
Residual
Residual
0.00
son buenas -0.01
0.00 Mean=-4.3E-16
-0.02
-0.05 LCL=-0.05038
-0.03
-2 -1 0 1 2 0 10 20
Normal Score Observ ation Number
4 0.01
Frequency
Residual
3 0.00
2 -0.01
1 -0.02
0 -0.03
-0.030
-0.024
-0.018
-0.012
-0.006
-0.000
0.006
0.012
0.018 0.55 0.65 0.75 0.85 0.95
Residual Fit
Gran mejora en la
independencia, el modelo
cuadrtico es adecuado.
203
Ejemplo
Regression Plot
Y(%) = 0.953603 + 0.0030173 X
- 0.0035365 X**2
S = 0.0141553 R-Sq = 98.9 % R-Sq(adj) = 98.8 %
0.95
0.85
Y(%)
0.75
0.65
0.55
0 5 10
204
Que nos queda...
205
Apndices
206
Apndice A: Intervalos de prediccin
Usar un modelo de regresin para pronosticar es vlido dentro del
rango de investigacin. Extrapolacin de los datos usando el modelo,
puede ser inapropiada debido al error del modelo de prediccin. El
error disminuye cuando aumenta el valor de R2, pero aumenta al
alejarnos de la regin de experimentacin.
y b 0 b1 x ta SE ( y )
2
donde:
1 ( x0 x ) 2
SE ( y ) s
n SS xx
207
Apndice A: Intervalos de prediccin
Selecciona Options:
Selecciona el despliegue
de intervalos de
prediccin
208
Apndice A: Intervalos de prediccin
Regression Plot
Y(%) = 0.953603 + 0.0030173 X
- 0.0035365 X**2
S = 0.0141553 R-Sq = 98.9 % R-Sq(adj) = 98.8 %
1.0
0.9
0.8
Y(%)
0.7
0.6 Regression
95% PI
0.5
0 5 10
209
Apndice B: Riesgos en la Regresin
0 .5 1 1.5 2 1 6 14 22 30
X=Peso de auto (tons) X=edad del auto (aos)
Tu ves Tu ves
Y=Millas por Y=Precio
galn 30 de venta 6
25 (miles) 4
(mpg)
20 2
211
Apndice C: Regresin Mltiple
La regresin mltiple es solo una extensin de los mtodos utilizados en
este mdulo. Solo se necesita considerar tantas columnas como
variables se tengan (mostramos los modelos para 2 variables, pero se
puede extender fcilmente a ms variables):
Modelo lineal
y b 0 b1 x1 b 2 x2
y b 0 b1 x1 b 2 x2 b 3 x1 x2
Modelo cuadrtico
y b 0 b1 x1 b 2 x2 b 3 x1 x2 b 4 x12 b5 x22
212
Apndice A: Intervalos de prediccin
Usar un modelo de regresin para pronosticar es vlido dentro del
rango de investigacin. Extrapolacin de los datos usando el modelo,
puede ser inapropiada debido al error del modelo de prediccin. El
error disminuye cuando aumenta el valor de R2, pero aumenta al
alejarnos de la regin de experimentacin.
y b 0 b1 x ta SE ( y )
2
donde:
1 ( x0 x ) 2
SE ( y ) s
n SS xx
213
Apndice A: Intervalos de prediccin
Selecciona Options:
Selecciona el despliegue
de intervalos de
prediccin
214
Apndice A: Intervalos de prediccin
Regression Plot
Y(%) = 0.953603 + 0.0030173 X
- 0.0035365 X**2
S = 0.0141553 R-Sq = 98.9 % R-Sq(adj) = 98.8 %
1.0
0.9
0.8
Y(%)
0.7
0.6 Regression
95% PI
0.5
0 5 10
215
Apndice B: Riesgos en la Regresin
0 .5 1 1.5 2 1 6 14 22 30
X=Peso de auto (tons) X=edad del auto (aos)
Tu ves Tu ves
Y=Millas por Y=Precio
galn 30 de venta 6
25 (miles) 4
(mpg)
20 2
217
Apndice C: Regresin Mltiple
La regresin mltiple es solo una extensin de los mtodos utilizados en
este mdulo. Solo se necesita considerar tantas columnas como
variables se tengan (mostramos los modelos para 2 variables, pero se
puede extender fcilmente a ms variables):
Modelo lineal
y b 0 b1 x1 b 2 x2
y b 0 b1 x1 b 2 x2 b 3 x1 x2
Modelo cuadrtico
y b 0 b1 x1 b 2 x2 b 3 x1 x2 b 4 x12 b5 x22
218
Regresin Logstica
Binaria
219
Objetivo
220
Matriz de seleccin de herramientas
Factor (X)
VARIABLE ATRIBUTO
222
Regresin Logstica
Modelo lineal
1
Modelo Logstico
224
Regresin Logstica
225
Regresin Logstica
Como la variable de respuesta binaria solo puede tener dos valores, el
modelo de prediccin debe de transformarse mediante una funcin de
enlace (link function)
227
Regresin Logstica
Usando Minitab:
Indica tu
columna con
las
respuestas
(expresadas
en 0 y 1)
231
Regresin Logstica
Busca significancia en la
influencia (relacin de cada
Logistic Regression Table variable)
Odds 95% CI
Predictor Coef SE Coef Z P Ratio Lower Upper
Constant -2.063 1.053 -1.96 0.050
Peso de 0.18110 0.07533 2.40 0.016 1.20 1.03 1.39
Log-Likelihood = -13.192
Test that all slopes are zero: G = 7.913, DF = 1, P-Value = 0.005
1
p(evento) Determina si el
1 e( 2.0630.1811x ) modelo es
significativo
232
Regresin Logstica
Goodness-of-Fit Tests
Method Chi-Square DF P
Pearson 15.509 20 0.747
Deviance 18.066 20 0.583
Hosmer-Lemeshow 8.239 8 0.410
233
Regresin Logstica
Ahora graficamos la
funcin de probabilidades.
234
Regresin Logstica
Para la Y, indica la
columna que Minitab
cre de
probabilidades de
evento (EPRO1), y la
X sigue siendo Peso
de la carga...
235
Regresin Logstica
0.5
0.4
0.3
0.2
0.1
0 5 10 15 20 25
Peso de la carga
236
Ahora t....
Un Black Belt estaba tratando de reducir el ruido de un motor. Uno de los
factores potenciales identificado en una sesin de tormenta de ideas de
ingeniera/manufactura fue la diferencia entre el dimetro exterior del estator y
el dimetro interior de la carcaza. El estator est diseado para que quede
ligeramente ms grande que la carcaza de tal manera que al ser prensado
dentro de la carcaza, esta se expande ligeramente y la interferencia ayuda a
mantener al estator apretado dentro de la carcaza. El dimetro exterior del
estator es 5.5 y el grosor es solo de 0.60 (ver diagrama) los datos de 35
motores estaban disponibles para un anlisis rpido.
Carcaza
Estator
Indican los datos que existe una Estator
relacin entre la interferencia estator- O.D.
interferencia.mtw
237
Uno ms....
Una comisin presidencial estaba interesada en saber si podran haber
predicho el desastre del Challenger con los datos disponibles al momento
del incidente en 1986. La comisin consigui datos de anillos daados de
la propulsin del cohete que haba antes del lanzamiento del Challenger.
Se muestran los datos obtenidos de previos vuelos espaciales, 1 es
daado y 0 es no daado. Se inspeccionaron 3 anillos por cada uno de
los 23 vuelos anteriores al Challenger
Estos datos son reales. Se pueden encontrar ms detalles en la publicacin de 1989 Anlisis de Riesgo de la nave
espacial: Prediccin de fallas previas al Challenger por Dalal, Fowlkes y Hoardley, Journal of the American Statistical
Association.
239
Antes Despus
Seccin de ejercicios
7 8
6 9
Ejercicio 1: 5 8
Una cadena de supermercados colect las opiniones 6 7
de los clientes respecto del servicio proporcionado por
7 7
las tiendas de la cadena antes y despus de que el
personal asistiera a tres sesiones semanales de 10 4 8
minutos de entrenamiento, mediante videocintas, que 7 8
tenan como meta mejorar las relaciones con los 6 9
clientes. Se obtuvieron dos muestras aleatorias
5 10
independientes de 19 clientes cada una, tomadas
antes y despus de las sesiones de entrenamiento, y 5 9
se pidi a cada persona que calificara el servicio de la 6 8
tienda en una escala de 1 (malo) a 10 (excelente). 5 8
Existe evidencia de que el curso de entrenamiento
4 7
tuvo efecto?
6 7
X= tipo de datos:
4 8
Y= tipo de datos: 5 6
Ho: 6 7
Ha: 6 7
P-value: 7 8
240
Conclusin:
Ejercicio 2:
Una compaa desea comparar las expectativas salariales x 100 mensuales
de su personal de ventas femenino y masculino, segn un nuevo plan de
compensaciones ventas+comisin. Se pidi a 13 vendedoras y 12
vendedores, muestreados al azar, predijeran sus ingresos mensuales bajo el
nuevo plan. Proporcionan los datos evidencia para afirmar que existen
diferencias significativas entre las expectativas de vendedoras y
vendedores?.
Vendedoras (1) 44 44 56 46 47 38 58 53 49 35 46 30 41
Vendedores (2) 35 47 55 29 40 39 32 41 42 57 51 39
X= tipo de datos:
Y= tipo de datos:
Ho:
Ha:
241
P-value: conclusin:
Empresa 1 Empresa 2
ms
X= apta que la 2?. tipo de datos: 258 228
264 230
Y= tipo de datos:
264 234
Ho: 260 220
243
Monto en
dlares de Das para
la OC (k$) pagar
Ejercicio 5: 6.23 15
Un contador est interesado en maximizar 1.92 25
los descuentos de los proveedores que se 0.75 7
obtienen al pagarles mas pronto. Uno de 8.08 14
los factores identificado como un factor 1.89 22
potencial era la cantidad de dlares en la 8.66 8
orden de compra. El equipo consigui 8.66 20
datos de los das que se tard en pagar al 0.37 6
proveedor y el monto en dlares de la 3.32 6
0.20 18
orden de compra.
7.94 8
Es el monto en dlares un factor
7.80 11
importante en la rapidez del pago?
7.47 16
7.70 24
6.63 5
Ho: P-value constante: 7.78 23
7.85 10
Ha: P-value X:
2.86 30
R2= Conclusiones: 8.74 6
2.42 12
244
Ejercicio 6:
El nmero de vendedores que emplea una concesionaria de autos vara de
cuatro (el valor ms bajo) a ocho (el valor ms alto). Depende el nmero de
nuevos autos vendidos del nmero de vendedores?. Para aclarar esta
cuestin, el gerente de ventas examin los registros de las ventas para los
ltimos cuatro meses y localiz un perodo de ocho semanas durante el cual
no se utilizaron programas de estmulos especiales. El nmero de autos
vendidos semanalmente y el nmero de vendedores se muestran en la
siguiente tabla.
Semana 1 2 3 4 5 6 7 8
N vendedores 5 6 5 4 7 6 5 8
N Autos vendidos 10 20 18 10 21 15 13 22
Calificacin como 39 43 21 64 57 47 28 75 34 52
aspirante X
Calificacin de xito 65 78 52 82 92 89 73 98 56 75
Y