Sunteți pe pagina 1din 14

Proyecto Final

Ana Leonor Toussaint

Diseo y Anlisis de
Experimentos

Dania Yareli Castillo Delgadillo


A00568330
Marcela Gaytn Gutirrez
A00568967
Karol Kryztel Du-Pont Falcn
A00569096
Alfonso Ignacio Martnez Huitrn
A00568233

Contenido
Presentacin del tema a investigar............................................................................. 2
Objetivos del tema a investigar.................................................................................. 2
Elementos necesarios para la investigacin...............................................................2
Desarrollo analtico e implementacin de la investigacin.........................................3
Correlacin de las variables..................................................................................... 3
Modelo inicial........................................................................................................... 3
Comprobacin de supuestos................................................................................. 4
Transformacin del modelo...................................................................................... 4
Comprobacin de supuestos................................................................................. 5
Significancia de las variables................................................................................... 6
Efecto de las variables............................................................................................. 7
Comparacin de medias.......................................................................................... 7
Grficas de interaccin............................................................................................ 8
Mximo ptimo general........................................................................................... 9
Conclusiones............................................................................................................... 9
Bibliografa................................................................................................................ 10

Presentacin del tema a investigar


En este proyecto se determin analizar un experimento, el cual fue realizado por los
alumnos de la clase de Diseo y anlisis de experimentos. En dicho experimento
se analiz la distancia que una flecha alcanzaba al ser lanzada por una ballesta
casera, del mismo modo se tuvieron algunas variantes tales como el ngulo de tiro,
el tamao de la ballesta, el tamao de la flecha y por ltimo el operador que
lanzaba los tiros, esto con la finalidad de poder determinar los factores influyentes
sobre la variable de respuesta (distancia recorrida por la flecha).
Para poder analizar los datos que el experimento arroj se utilizaron las
herramientas de Excel para poder acomodar y darle un mejor y efectivo uso a los
datos, as como el paquete estadstico StatGraphics. ste ltimo contribuy a
realizar el diseo de experimento, con el objetivo de ajustarlo a un modelo
matemtico, poder explicarlo y analizar los factores que influyeron en la variable Y,
adems para lograr una interpretacin adecuada de los supuestos matemticos
(normalidad, homocedasticidad e independencia), el valor P asociado de las
variables y del modelo y los errores. Del mismo modo se utilizaron las herramientas
grficas de mnimos cuadrados, comparaciones de medias, ANOVA desglosado y los
efectos de nivel.

Objetivos del tema a investigar


El objetivo del desarrollo de este proyecto consiste en llevar a cabo la realizacin de
un experimento e identificar el punto ptimo en el que una flecha recorre mayor
distancia al ser lanzada usando una ballesta, mediante la aplicacin de la
metodologa de Diseo de Experimentos.

Elementos necesarios para la investigacin


Para este experimento se tienen diferentes factores y variables:

Variable dependiente o de respuesta:


o Distancia que la flecha vuela
Variables independientes:
o Tamao de la ballesta: chico, mediano y grande. Estas medidas fueron
dadas por la maestra a cargo y se hicieron de materiales similares para
que esto no afectara el experimento.

Tamao de la flecha: chica, mediana y grande. (El tamao de las flechas


fue similar ms no exacto.)

o Operador: se utilizaron 3 operadores diferentes.


o ngulo de tiro: 30 y 45, para ello fueron utilizadas unas cuas.
Nmero de tiros y repeticiones hechas:
o 270 tiros en total los cuales estn repartidos de la siguiente manera:
Tamao de
ballesta
90: Grande
90: Mediana
90: Chica

Tamao de
flecha
30: Grande
30: Mediana
30: Chica

Nmero de
operador

ngulo de tiro

Bloques

10: operador 1
10: operador 2
10: operador 3

5: ngulo de
30
5: ngulo de
45

Se hicieron
cinco
repeticiones
por cada
combinacin

Desarrollo analtico e implementacin de la investigacin


Correlacin de las variables
Primeramente se obtuvo la correlacin que existe entre las variables explicativas y
la variable de respuesta. Al ser un diseo de experimentos en el cual se va a
explicar un fenmeno, las variables se introducen en el modelo de mayor a menor
correlacin. Se obtuvo el siguiente orden de correlacin respecto a la distancia.
1) Tamao de ballesta:
2)
3)
4)
5)

0.5281

ngulo:
0.2106
Tamao de flecha: 0.0717
Operador:
0.0342
Bloque:
0.0048

7)
6)

Corr
elaci
ones
9)

8)

Balle
sta
11)

10) ngu
lo
13)
12) Flech
a

15)
14) Oper
ador
17)
16) BLO
QUE

18)

D
is
ta
n
ci
a
0
.
5
2
8
1
0
.
2
1
0
6
0
.
0
7
1
7
0
.
0
3
4
2
0
.
0
0
4
8

Modelo inicial

Se realiz un Anlisis de Varianza mediante Modelos Lineales Generalizados, y una


por una se fueron eliminando las variables que no eran significativas para el modelo,
resultado el siguiente.

Modelos Lineales Generalizados


Nmero de variables dependientes: 1
Nmero de factores categricos: 5
A=Ballesta
B=ngulo
C=Flecha
D=Operador
E=BLOQUE
Anlisis de Varianza para Distancia
Fuente
Suma de Cuadrados
Modelo
876.898
Residuo
525.312
Total (Corr.)
1402.21

Gl
25
244
269

Cuadrado Medio
35.0759
2.15292

Razn-F
16.29

Valor-P
0.0000

Suma de Cuadrados Tipo I


Fuente
Ballesta
ngulo
Flecha
Operador
Ballesta*ngulo
Ballesta*Flecha
Ballesta*Operador
ngulo*Flecha
ngulo*Operador
Ballesta*ngulo*Operador
Residuo
Total (corregido)

Suma de Cuadrados
552.411
62.208
7.3376
11.1288
24.2
66.3809
52.3348
28.1729
15.6081
57.1165
525.312
1402.21

Gl
2
1
2
2
2
4
4
2
2
4
244
269

Cuadrado Medio
276.205
62.208
3.6688
5.5644
12.1
16.5952
13.0837
14.0864
7.80404
14.2791
2.15292

Razn-F
128.29
28.89
1.70
2.58
5.62
7.71
6.08
6.54
3.62
6.63

Valor-P
0.0000
0.0000
0.1841
0.0775
0.0041
0.0000
0.0001
0.0017
0.0281
0.0000

R-Cuadrada = 62.5369 porciento


R-Cuadrada (ajustada por g.l.) = 58.6984 porciento
Error estndar del est. = 1.46728

El valor de R2 indica que el modelo explica la variabilidad de la distancia con una


confianza de 62.53%.
Un valor de R2 ajustada menor indica que no es necesario incluir ms variables
explicativas al modelo.
El error estndar de 1.46 se encuentra dentro del 20% de los datos. Al ser bastante
grande no es aceptable en el modelo.
Grfico de Caja y Bigotes

Comprobacin de supuestos
1) Normalidad.
El
supuesto
de
normalidad no se cumple, ya que el
valor p asociado al estadstico de
Shapiro-Wilk es menor a 0.10.
Adems hay demasiados puntos
atpicos en el grfico de caja y brazos.
Pruebas de Normalidad
Prueba
Estadstico W de Shapiro-Wilk

Estadstico
0.974669

Valor-P
0.036985

-4.9

-2.9

-0.9
1.1
RES_Distancia

3.1

5.1

Grfica de Aberrantes con Lmites Sigma


Media de la muestra = -7.25556E-8, desviacin estd. = 1.39744

RES_Distancia

2) Independencia. El supuesto
de
independencia
si
se
cumple, ya que el valor p
asociado al estadstico de
Durbin-Watson es mayor a
0.10. El grfico de residuos vs
nmero de fila no muestra
una tendencia obvia, por lo
que se pudo comprobar de
manera grfica este supuesto.

3
2

0
-1

-2

-2

-4

-3
-4

-6
0

50

100

150
Nmero de fila

200

250

300

Estadstico Durbin-Watson = 1.9645 (P=0.3856)


Grfica de Residuos

Residuo Estudentizado

4.4

3) Homocedasticidad. El supuesto
de homocedasticidad no se
cumple, ya que existe conicidad
hacia el lado izquierdo en la grfica
de residuos vs predichos.

2.4

0.4

-1.6

-3.6
0

6
9
predicho Distancia

12

15

Transformacin del modelo


Al no satisfacer el Teorema Central del Lmite, dado que dos de los tres supuestos no
se cumplan, se ajust el modelo de diseo de experimentos. Despus de varias
transformaciones, se lleg a la conclusin que el mejor modelo, y que cumpla con
los tres supuestos del teorema central del lmite, era un ajuste logartmico. A
continuacin se muestra el modelo final y la comprobacin de los supuestos.

Modelos Lineales Generalizados


Nmero de variables dependientes: 1
Nmero de factores categricos: 5
A=Ballesta
B=ngulo
C=Flecha
D=Operador
E=BLOQUE
Anlisis de Varianza para log(Distancia)
Fuente
Suma de Cuadrados
Gl
Modelo
18.7605
25
Residuo
8.99452
244
Total (Corr.)
27.755
269
Suma de Cuadrados Tipo I
Fuente
Ballesta
ngulo

Cuadrado Medio
0.75042
0.0368628

Suma de Cuadrados
11.8937
1.41511

Gl
2
1

Razn-F
20.36

Cuadrado Medio
5.94683
1.41511

Valor-P
0.0000

Razn-F
161.32
38.39

Valor-P
0.0000
0.0000

Flecha
Operador
Ballesta*ngulo
Ballesta*Flecha
Ballesta*Operador
ngulo*Flecha
ngulo*Operador
Ballesta*ngulo*Operador
Residuo
Total (corregido)

0.361258
0.129836
0.830249
1.74906
0.818363
0.481269
0.238008
0.843686
8.99452
27.755

2
2
2
4
4
2
2
4
244
269

0.180629
0.0649182
0.415125
0.437266
0.204591
0.240635
0.119004
0.210921
0.0368628

4.90
1.76
11.26
11.86
5.55
6.53
3.23
5.72

0.0082
0.1740
0.0000
0.0000
0.0003
0.0017
0.0413
0.0002

R-Cuadrada = 67.5932 porciento


R-Cuadrada (ajustada por g.l.) = 64.2728 porciento
Error estndar del est. = 0.191997

En esta versin final del modelo de diseo de experimentos se encontr que no es


necesario incluir un bloque, por lo tanto no existe una variable no considerada o
efecto perturbador que afecte el promedio de la distancia.
El valor de R2 indica que el modelo explica la variabilidad de la distancia con una
confianza de 67.59%, siendo mayor que la del modelo inicial.
Un valor de R2 ajustada menor indica que no es necesario incluir ms variables
explicativas al modelo.
El error estndar de 0.19 se encuentra dentro del 3% de los datos, el cual al ser muy
chico, es bastante aceptable en el modelo.

Comprobacin de supuestos
1) Normalidad. El supuesto de normalidad se cumple ya que el valor p asociado
al estadstico de Shapilo-Wilk es de 0.10, adems cuenta con dos puntos
atpicos menos, y el grfico de caja y brazos muestra cierta distribucin
normal. Tambin el grfico de probabilidad normal muestra que los datos
centrales se ajustan a la recta.
Pruebas de Normalidad
Prueba
Estadstico
Grfico de Caja y Bigotes
Estadstico W de Shapiro-Wilk
0.977285

Valor-P
0.100111
Grfico de Probabilidad Normal para RES_LogDistancia

0.5

RES_LogDistancia

0.3
0.1
-0.1
-0.3
-0.5

-0.7

-0.5

-0.3

-0.1
0.1
RES_LogDistancia

0.3

0.5

-0.7
0.1

20

50

80

95

99

99.9

porcentaje

2) Independencia. El supuesto de independencia si se cumple, ya que el valor


p asociado del estadstico Durbin-Watson es mayor a 0.10. El grfico de
residuos vs nmero de fila no demuestra tendencia obvia, por lo que se puede

Estadstico Durbin-Watson = 1.9831 (P=0.4449)


Grfica de Residuos

Grfica de Aberrantes con Lmites Sigma


Media de la muestra = -4.00741E-9, desviacin estd. = 0.182858
0.8

4
3

RES_LogDistancia

comprobar grficamente que no hay


dependencia
entre
los
datos
obtenidos.

0.4

2
1

0
-1

3)-0.4

-2
-3

-4

Residuo Estudentizado

-0.8

3)

50

100

150
Nmero de fila

200

250

300

3) Homocedasticidad. La
transformacin realizada aplana el
-2
modelo del diseo de
-4
experimentos, por lo que se puede
1.1
1.4
1.7
2
2.3
2.6
predicho log(Distancia)
observar una mejor
homocedasticidad en la grfica de residuos vs predicho.
0

Ahora que se cumplen los 3 supuestos, se llevar a cabo la interpretacin de


grficos y comparacin de medias para encontrar la combinacin ptima que arroje
la mayor distancia.

Significancia de las variables


Diagrama de Pareto Estandarizada para log(Distancia)

En el grfico de Pareto se pueden


+
observar las variables e interacciones que A:Ballesta
D:ngulo
AD
tienen mayor significancia en el modelo,
AB
es decir que son los elementos que
B:Flecha
ACD
explican de mejor manera la variabilidad
AC
BD
de la distancia. El grfico muestra que la
CD
variable Tamao de Ballesta es la que C:Operador
0
3
6
9
12
15
tiene mayor influencia de manera
Efecto estandarizado
proporcional, es decir que mientras ms
grande sea la ballesta mayor ser la distancia. La variable que tiene menor
significancia en el modelo es Operador, por lo que se concluye que no importa la
persona que realice el lanzamiento, el resultado ser estadsticamente igual.
Las interacciones Ballesta * Operador, Flecha * ngulo, y Operador * ngulo se
muestran por debajo del error tipo I de 0.10, debido a que esta grfica fue obtenida
por un anlisis de diseo de experimentos en el paquete estadstico. En realidad los
grados de libertad estn modificando la tolerancia de la significancia, pero en el
ANOVA desglosado de modelos lineales generalizados se observa que stas si
afectan al experimento.

Efecto de las variables

Grfica de Efectos Principales para log(Distancia)

log(Distancia)

2.2
La grfica de la derecha muestra
el efecto que tiene cada variable
2.1
explicativa en la variabilidad de la
2
distancia. La variable Tamao de
Ballesta est correlacionada en
1.9
mayor medida, ya que sta es la
1.8
que tiene la pendiente ms
grande,
adems
de
estar
1.7
relacionada de manera positiva,
Ballesta
es decir que la distancia aumenta
mientras el tamao de la ballesta tambin aumente.

Flecha

Operador

ngulo

La segunda variable con mayor correlacin es ngulo, e igualmente est relacionada


de manera positiva, pero en menor medida. La siguiente variable con mayor
correlacin es el Tamao de Flecha, pero sta est relacionada inversamente, es
decir que la distancia se ve afectada de manera negativa mientras el tamao de la
flecha aumenta. En ltimo lugar se encuentra la variable Operador, y se puede
observar que la pendiente es muy chica, por lo tanto se concluye que el nmero de
operador no afecta en gran medida a la distancia.

Comparacin de medias
Ahora se van a contrastar las variables significativas para el modelo y encontrar la
mejor o mejores combinaciones para obtener la mayor distancia.
Medias y 95.0% Intervalos LSD
2.2
2.1
log(Distancia)

Comparaciones Mltiples para log(Distancia) por Ballesta


Mtodo: 95.0 porciento LSD
Ballesta Recuento Media MC Sigma MC Grupos
Homogneos
1
90
1.65049
0.0202382 X
X
3
90
2.09255
0.0202382
X
2
90
2.09881
0.0202382

2
1.9
1.8
1.7

Contraste
Sig. Diferencia
Lmites +/1-2
*
-0.448323
0.0563763
1-3
*
-0.442067
0.0563763
2-3
0.00625612
0.0563763
* denota una diferencia estadsticamente significativa.

1.6
1

Ballesta

El tipo de ballesta 2 y 3 presentan la media mayor para la distancia, y son


estadsticamente iguales entre ellos, pero estadsticamente diferentes a la ballesta
tipo 1.
Comparaciones Mltiples para log(Distancia) por ngulo

Medias y 95.0% Intervalos LSD

Mtodo: 95.0 porciento LSD


ngulo Recuento Media MC Sigma MC Grupos
Homogneos
30
135
1.87489
0.0165245 X
X
45
135
2.01968
0.0165245

2.05

log(Distancia)

Contraste
Sig. Diferencia
Lmites +/30 - 45
*
-0.144791
0.046031
* denota una diferencia estadsticamente significativa.

1.95
1.9
1.85
1.8
30

45
ngulo

El ngulo de 45 presenta la media mayor para la distancia. Es estadsticamente


diferente al ngulo de 30.

Medias y 95.0% Intervalos LSD


2.04
2
log(Distancia)

Comparaciones Mltiples para log(Distancia) por Flecha


Mtodo: 95.0 porciento LSD
Flecha Recuento Media MC Sigma MC Grupos
Homogneos
3
90
1.90911
0.0202382 X
2
90
1.93614
0.0202382 X
X
1
90
1.9966
0.0202382
Contraste
Sig. Diferencia
Lmites +/1-2
*
0.0604657
0.0563763
1-3
*
0.0874945
0.0563763
2-3
0.0270288
0.0563763
* denota una diferencia estadsticamente significativa.

1.96
1.92
1.88
1.84
1.8
1

Flecha

El tipo de flecha 1 presenta la mayor media para la distancia, y es estadsticamente


diferente a las flechas tipo 2 y 3, las cuales son estadsticamente iguales entre s.

Contraste
Sig. Diferencia
Lmites +/1-2
0.0354059
0.0563763
1-3
-0.0172793
0.0563763
2-3
-0.0526852
0.0563763
* denota una diferencia estadsticamente significativa.

Medias y 95.0% Intervalos LSD


2
1.96
log(Distancia)

Comparaciones Mltiples para log(Distancia) por Operador


Mtodo: 95.0 porciento LSD
Operador Recuento Media MC Sigma MC Grupos
Homogneo
s
2
90
1.91792
0.0202382 X
1
90
1.95333
0.0202382 X
3
90
1.97061
0.0202382 X

1.92
1.88
1.84
1.8
1

Operador

Los operadores 1, 2 y 3 presentan la media mayor para la distancia, y son


estadsticamente iguales.

Grficas de interaccin
Interacciones y 95.0% Intervalos LSD

Interacciones y 95.0% Intervalos LSD


2.4

ngulo
30
45

log(Distancia)

2.2
2
1.8

Flecha
1
2
3

2.2
log(Distancia)

2.4

2
1.8
1.6

1.6
1.4
1

1.4
1

Ballesta

Ballesta * Flecha. Mximos ptimos


viables: (2,1), (2,2), (2,3), (3,1), (3,2),
(3,3)

Ballesta

Ballesta * ngulo. Mximos ptimo


viables: (2,45)
Interacciones y 95.0% Intervalos LSD

Interacciones y 95.0% Intervalos LSD

2.3

Operador
1
2
3

2.1

2.2

1.9

1.7

Flecha
1
2
3

2.1
log(Distancia)

log(Distancia)

2
1.9
1.8

1.5
1

2
Ballesta

1.7
30

Ballesta * Operador. Mximos


ptimos viables: (2,1), (2,2), (2,3), (3,1),
(3,3)

ngulo * Flecha. Mximos ptimos


viables: (45,1), (45,2)
Grfica de Cubo para log(Distancia)
Flecha=2.0

Interacciones y 95.0% Intervalos LSD


2.2

Operador
1
2
3

2.1

1.81137
2.27814

45.0 1.91759

2.07162

ngulo

log(Distancia)

45
ngulo

1.9

1.6006
30.0 1.57544
1.0

1.8
30

45
ngulo

ngulo * Operador. Mximos ptimos


viables: (45,1), (45,3)

Ballesta

2.13358 3.0
2.18994
1.0
3.0

Operador

Ballesta * ngulo * Operador.


Mximos ptimos viables: (3,45,3)

Mximo ptimo general


Al observar y analizar las comparaciones de medias en las variables y las
interacciones significativas entre ellas se decidi que existen dos combinaciones
ptimas dadas por los siguientes juegos de niveles en cada factor.

Ballesta:
ngulo:
Flecha:
Operador:

Sin embargo, el paquete estadstico que se utiliz arroja una combinacin


diferente, debido a la interpretacin y anlisis de los grados de libertad.

3 (Grande)
45
1 (Chica)
3

Ballesta:
ngulo:
Flecha:
Operador:

Optimizar Respuesta

2 (Mediana)
45
1 (Chica)
3

Meta: maximizar log(Distancia)

Valor ptimo = 2.28097


F

a
B
A
p
ct
t
o
i
r
m
o
B

3
al
1.
3.
.
le
0
st
a
Fl

3
ec
1.
3.
.
h
0
a
O

3
p
1.
3.
.
er
0
a
d
or

4
n
3
4
5
g
.
ul
0
o

Conclusiones

Se realiz una transformacin logartmica en el modelo debido a que el


supuesto de homocedasticidad no se cumpla inicialmente al presentar
conicidad, por lo cual era necesario aplanar la grfica.

Al realizar el modelo, se identific al tamao de la ballesta como la variable


de mayor correlacin con la distancia recorrida por la flecha, lo cual se
identific visiblemente al realizar el experimento. Por otro lado, el equipo
pudo comprobar que la mayor distancia recorrida por una flecha con
movimiento parablico se logra con ngulo de salida de 45, como lo
establecen estudios cientficos. De la misma manera, la flecha chica recorri
mayor distancia al tener un peso ms ligero. Por ltimo, los operadores fueron
alumnos sin experiencia en lanzamiento de flechas usando una ballesta, por
lo que se puede concluir que todos se encontraban en las mismas
condiciones.

El equipo considera que es interesante formular teoras, realizar


experimentos, analizar datos y comprobarlos usando la metodologa de
Diseo de Experimentos, debido a que usando herramientas estadsticas es
muy sencillo, preciso y prctico. La realizacin de este proyecto fue de gran
agrado para el equipo debido a que con esto se pueden aplicar los
conocimientos vistos durante el curso.

Bibliografa

Statgraphics Centurion XV. Versin 2005.

S-ar putea să vă placă și