Sunteți pe pagina 1din 46

UNIDAD 1: FASE 2 - IDENTIFICAR Y APLICAR LOS DISEÑOS COMPLETAMENTE AL AZAR Y

BLOQUES COMPLETOS AL AZAR

EDWARD ENRIQUE NARANJO


CÓDIGO 73149507
TUTOR

DIEGO ALBERTO DEAZA

DISEÑO EXPERIMENTAL AVANZADO


GRUPO: 300001_2

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD


SEPTIEMBRE 19 DEL 2018
Diseño estadístico y el Análisis de experimentos

Ronald S. Fisher 1920 -1935


Estación experimental de agricultura

Los diseños cuadrados latinos


El métodos de análisis (El análisis de varianza) y
Sir Ronald A. Fisher in 1924.
(fuente: Fisher-Box, 1978,
escribió el primer libro sobre el tema (Fischer 1935).
Plate 4).

Sir Frank Yates


(1940s)

diseño de bloques y experimento factorial y sus


métodos de análisis.
Sir George Box
1940s y 1950s

Industria Química – (M.S.R)

Hay algunas diferencias cruciales entre la experimentación agrícola,


y la industrial (Box et al 1953)
La información en la industria esta disponible a tiempos mas cortos.
En la industria la experimentación ocurre en línea. (experimentos secuenciales
pequeños)
Agricultura compara variedades o fertilizantes / en los experimentos industriales el
foco está sobre el proceso modelando, optimización, y mejora de calidad.

Raj Chandra Bose et al .


1940s - 1950s

Teoría matemática de construcción de diseños experimentales basados en


análisis combinatorio
Jack Kiefer A. Bradford Hill
(1950s) 1950s

Psicología, Educación,
Teoría de diseños Asignaciones Mercadeo, y otras disciplinas
óptimos aleatorizadas también fueron testigo de
aplicaciones de experimentos
diseñados

Donald Campbell y Julian


Stanley
Cuasi-experimentos

Nuevas Ingeniero japonés Genichi


ideas Taguchi

Diseño robusto

GEOESTADISTICA
LOS CONCEPTOS Y TERMINOLOGÍA BÁSICA DE
EXPERIMENTACIÓN
Planeación incorrecta

Estrategia de factor por factor :

Es imposible saber si las variables interactúan entre si

Otro planteamiento:
Variar muchos factores a la vez
En el diseño y análisis de un experimento, es necesario
que quienes lo desarrollen :

•Entiendan claramente el problema objeto de estudio


•Conocimiento del material experimental a usar,
• Posibilidades existentes para coleccionar los datos
•Conocimiento estadístico necesario

Generalmente un grupo de investigación se conforma por :


Expertos tema Estadístico

Tukey afirma
“ Estadístico, es el experto que piensa con el
cerebro del otro”
Los pasos que se siguen en la experimentación
método experimental

El método científico

formulan hipótesis

experimentación
DEFINICIONES BASICAS
Cuantitativos:
Cuantitativos edad-altura - profundidad
Factor BLOQUE
Cualitativos Cualitativo:
estaciones (inv-prim-ver-otoño)

Efectos fijos
Niveles Efectos aleatorios
Efectos Mixtos

tratamiento
Tratamientos testigo

Unidad experimental (u.e) Homogénea Tratamientos no son


parte de la estructura
(unidades muestrales ) No homogénea
de la u.e.

Variable respuesta
EL DISEÑO DE EXPERIMENTOS
Consiste en determinar cuantos factores,
niveles y tratamientos se estudian y como
se asignaran los tratamientos a las
unidades experimentales.

 Diseño de los tratamientos

 Diseño de control del error

 Diseño de observaciones - Muestreo


OTRAS VARIABLES

Variable sustituta
Covariable

Material experimental

Variables Explicatorias

Observaciones para verificar la aplicación de los


tratamiento

Observaciones para determinar las condiciones


externas del experimentos

Error experimental
PRINCIPIOS DEL DISEÑO EXPERIMENTAL

Principio de aleatorización
Previene la existencia de Repetición del Homogeneidad
sesgos experimento estadística de las
Evita la dependencia entre Es la asignación del comparaciones –
observaciones mismo tratamiento a Control local
Confirma la validez de los mas de una u.e. Filosofía de diseños
procedimientos estadísticos independientes. clásicos - moderna
más comunes
PASOS NECESARIOS PARA PLANIFICAR, LLEVAR A
CABO Y ANALIZAR UN EXP. DISEÑADO

 DISEÑO DEL EXPERIMENTO


 1. Establecer los objetivos.
 2. Seleccionar los factores, niveles y tratamientos
 3. Definir la unidad experimental y todas las variables que
deban medirse. (Prueba Piloto)
 4. Determinar el número de replicas
 5. Aleatorizar las pruebas
 6. Realizar el experimento y tomar los datos
 ANALISIS DEL EXPERIMENTO
 7. Determinar como deben ser analizados los resultados
 8. Extraer conclusiones
 9. Verificar los resultados
EJERCICIO 3

Se desea estudiar el efecto de la carga animal sobre la producción


de materia seca en una pastura implantada. Para ello se divide un
lote en 28 potreros y se asignan aleatoriamente 7 potreros a cada
una de las 4 cargas animales en estudio (2 nov./ha., 4 nov./ha, 6
nov./ha. y 8 nov./ha.)
Los resultados fueron los siguientes expresados en toneladas de
materia seca por hectárea.

Carga 2 2.6 1.9 3.1 2.8 2.2 2.0 2.7


Carga 4 3.3 3.6 3.0 3.5 3.2 3.9 3.4
Carga 6 3.1 2.0 2.5 3.1 2.3 3.0 2.2
Carga 8 2.5 2.3 2.8 1.8 2.7 2.6 2.0
Una meta básica en cualquier experimento es
identificar los efectos de los factores tratamiento sobre la
variable de respuesta no confundida con cualquier factor
ruido.

El bloqueo se usa para evaluar la consistencia de la


efectividad de los tratamientos a través de unidades
experimentales teniendo características de amplio rango.

La aleatorización se usa para minimizar los efectos


tendenciosos de todos los otros factores de ruido.

La variación causada por los errores aleatorios y de


medida pueden ser minimizada a través de la repetición.
TRATAMIENTOS
1 2 3 ... t
Y11 Y21 Y31 Yt1
Y12 Y22 Y32 Yt2
. . . .
. . . .
. . . .
Y1n1 Y2n2 Y3n3 ... Ytnp

TOTALES Y1. Y2. Y3. Yt. Y. .


NUMERO n1 n2 n3 nt N
MEDIA Y1. Y2. Y3. Ya. Y..
DESV. ESTAND. S1 S2 S3 St
COEF. S1 S1 S1 S1
VARIACION * 100 * 100 *100 * 100
Y 1. Y 2. Y 3. Y a.

Cuando los ni son iguales, se dice que el diseño es


BALANCEADO, y cuando los ni son diferentes se dice
que el diseño es DESBALANCEADO.
MODELO DE ANÁLISIS DE VARIANZA
ASOCIADO AL D.C.A

El modelo podría ser expresado como

  
ij i ij

i = 1, 2, 3, . . . t j = 1,2, 3, . . r

Estimar la parámetro , 1, …. t


y las hipótesis experimentales tales como:
Ho: 1= 2...t
yij    Z i   ij

i  1,2,... j  1,2,...

El modelo en forma matricial se escribe:

Y  X  

rango=2

parámetro ,
6x3
1, y 2 no
puede ser
estimada por

ˆ  ( X T X ) 1 X T y
, i no son únicos y por consiguiente no pueden ser estimados
Para remediar la falta de unicidad de los parámetros en el
modelo sobreparametrizados

Redefina el modelo usando un número más pequeño de


parámetros nuevos que son únicos.

Utilice combinaciones lineales de los parámetros que


son únicos y puede ser sin ambigüedades estimado.
Reparametrización del modelo

REPARAMETRIZACION DEL MODELO

 ri Z i  0
SOLUCION
S.E.N. : XTX=XTY +  ri Z i  0 parámetros
Los supuestos del modelo son:

•Los errores se distribuyen normal con media 0 y varianza 2, ij N(0, 2)
•Los errores tienen varianza constante
•Los errores son independientes, COV (ij, i’j’)=0 ii’; jj’

En caso de no cumplirse la normalidad de los errores,


usted puede utilizar la prueba no parámetrica:
TEST DE LA MEDIANA
Las observaciones deben de estar medidas en la escala
ordinal.
También es posible utilizar la prueba de KRUSKALL
WALLIS
HIPOTESIS NULA DE INTERES EN EL MODELO

H0: 1 = 2 = 3 =... a =  (La media de los tratamientos son


iguales)
H1 : i  i ` (por lo menos dos de las medias son
diferentes)

Que en términos del modelo es equivalente a probar:


H0: Z1 = Z2 =...= Zt= Z
H1 : Zi Zi’

ANOVA
ANÁLISIS DE VARIANZA
PARA EL MODELO COMPLETAMENTE ALEATORIO
El método empleado para comparar las medias de los tratamientos se
denomina ANALISIS DE VARIANZA (ANOVA), mediante el cual se prueban
las hipótesis planteadas.

Inferencia

En el caso del D.C.A, la partición es :

SCT = SCTrat + SCE

Suma de cuadrados del total es igual a Suma de cuadrados


de los tratamientos más la suma de cuadrados de los
errores, la cual se conoce como la ecuación fundamental
del análisis de varianza.
Tabla . Análisis de varianza . Modelo Completamente Aleatorio.

FUENTE
Pr>F
DE g.l S.C C.M Fc
VARIACIÓN
CMTrat
Entre tratamientos t-1 2 2 SCTrat 
t y i. y.. 

CME
(Modelos)  t 1
i 1 ri n
Error (dentro de los n-t 2 SCE
Y
Y T Y   i.
tratamientos)
ri nt
Total n-1 t r
y..2
 y ij  n 2

i 1 j 1

Donde: t: Número de tratamientos


r : Número de replicas por tratamiento
n: Total de muestras =rt H0: Z1 = Z2 =...= Zt= Z
SCTrat =Suma de cuadrados de los tratamientos
H1 : Zi Zi’

Un p-valor es la probabilidad, calculada al asumir que Ho es cierta, de que


la estadística de prueba tome valore tan extremos o más extremos que los
calculados con la muestra actual.
CASO DE UN DISEÑO DESBALANCEADO : (diferentes tamaños de muestras)

Solo es necesario ajustar los cálculos para:

t
y 2 i. y..2
SCTRAT:  ri

n
si es balanceado.
i 1

t y1. 2 y 2. 2 yt.2 y..2 si el diseño es


SCTRAT:  ( r  r  ...  r )  n desbalanceado
i 1 1 2 t

2
Y
SCERROR : Y T Y   i. si es balanceado.
ri
t 2 2 2
y1. y 2. yt.
SCERROR: Y Y  (
T
  ...  ) si el diseño es
i 1 r1 r2 rt desbalanceado
DISEÑO DE EXPERIMENTOS
VALIDACION DE LOS SUPUESTOS DEL MODELO

  
ij i ij

Los errores se distribuyen normal con media 0 y varianza 2 :


ij N(0, 2)

Los errores tienen varianza constante

Los errores son independientes, COV (ij, i’j’) =0 ii’; jj’


ESTIMACIÓN DEL ERROR

DIFERENCIA ENTRE ERRORES () Y RESIDUALES (e)

Un residuo (eij), es un estimador del error experimental o aleatorio (i).


El error aleatorio esta dado por :

  y 
e  y  yˆ
e y y
Ho: i ~ normal Ha: i No ~ normal

Prueba de Shapiro Wilks (n< 30)


Kolmogorov – Smirnov (n >30)
Anderson – Darling (n>30)
SUPUESTO 2: LA VARIANZA DE LOS ERROR  SON IGUALES
(HOMOGENEIDAD DE VARIANZAS)

Los efectos de la desigualdad de las varianzas son:

 Estimadores insesgados y consistentes pero no de varianza mínima.


 Problemas de variabilidad en las predicciones

El F-test ANOVA es sólo ligeramente afectado por la desigualdad de la varianza si el modelo


contiene sólo los factores fijos y tiene tamaños iguales o casi iguales de muestras

DETECCIÓN
Pruebas formales Gráficos de residuales con
Ho: 2122=...=2 bandas crecientes, decrecientes o
Comparaciones múltiples: combinaciones de ambas.
Prueba de Levene's: datos continuos, no
necesariamente con distribución normal. Este método
considera las distancias de las observaciones de su
mediana de la muestra en lugar de su media de la
muestra, hace que la prueba sea más robusto para
muestras pequeñas
SUPUESTO 3: LOS ERROR  SON INDEPENDIENTES
M.M.C.O Se basa en que los errores son independientes uno del otro.

 Datos son tomados secuencia de tiempo: series de tiempo.


2
3
1 2

0 1
eij

eij
-1 0

10
-2 -1

-3 -2
t t

3 3
2
2
1
1
0

eij
eij

9
0
-1
1

-1 -2
-2 -3

-3 -4
t t

Durbin watson

El estadístico de Durbin -Watson está condicionado a la orden de las observaciones (filas)


las observaciones están en un orden significativo, como el tiempo.
DW:~2
TAMAÑO DE MUESTRA O NÚMERO DE REPLICAS PARA CADA
TRATAMIENTO

Este se realiza mediante un análisis de sensibilidad, para lo cual se debe


tener :
1. La diferencia mínima del cuadrado entre la media de los
efectos de los i-tratamientos y la media general.
La diferencia la podemos obtener de dos maneras :
 Especificada por el investigador
 Prueba Piloto: Consiste en realizar el experimento (mínimo 3
veces), con el fin de obtener la media y la varianza, con la
media se calcula la diferencia mínima :

a
 i
(    ) 2
 ( 1   ) 2
 (  2   ) 2
 ...  (  a   ) 2

i 1
2. Estimación de la varianza : Se puede obtener mediante :

•Investigaciones similares .
•Prueba pilote : De todas las varianzas de cada tratamiento,
debemos escoger la más grande, debido a que esta cubre las
demás.

3. Hallar la potencia de la prueba (probabilidad de rechazar


acertadamente la hipótesis nula). Esta se obtiene de la
siguiente manera:
3.1 Se calcula el factor de no 3.2 Con el factor de no centralidad,
centralidad (parámetro de calculamos el parámetro de no
excentricidad) de la distribución de la centralidad.
variable:

t
 (i   ) 2 ri 2K
K i 1 
2 2 t
3.3 Buscamos el valor  en la tabla de la F-no centrada. En
está ubicamos :
Nivel de significancia deseado ( = 0.005, 0.025, 0.05, 0.10)
Los grados de libertad del numerados : (t-1)
Los grados de libertad del denominador : t (ri-1)
El valor 

El valor obtenido, se le llama , que es la probabilidad de


cometer el error tipo II (probabilidad de rechazar Ho, cuando
Ho es verdadera)

3.4 El poder de la prueba es (1-).


D3 D5 D6 D10 D20
Ejercicio 9.3 1,27 1,30 1,25 0,99 0,64
1,32 1,29 1,25 0,99 0,66
1,25 1,26 1,24 0,96 0,64
1,30 1,29 1,26 0,99 0,67
1,24 1,27 1,24 1,02 0,67
1,29 1,27 1,25 1,01 0,67
1,28 1,31 1,25 1,00 0,67
1,25 1,25 1,22 1,00 0,68
1,29 1,30 1,24 0,97 0,64
1,26 1,32 1,26 0,99 0,62
MEDIA GLOBAL 1,09
MEDIA 1,28 1,29 1,25 0,99 0,66
VARIANZA 0,00070 0,00046 0,00012 0,00033 0,00035

Diferencia mínima :
(1)2(1.281.09)2 0,034
(2)2(1.291.09)2 0,038
(3)2(1.251.09)2 0,024
(4)2(0.991.09)2 0,010
(5)2(0.661.09)2 0,189
(  )2  0,295
2 = 0.0007 la mas grande de los tratamientos
t = 5 tratamientos
Poder de la prueba: -Parámetro de no centralidad.
-Factor de no centralidad :
t 2K 2K

2
 ( i   ) r 
K  i 1
0.295
 * r  209.66 * r t 5
2 2 2 * 0.0007

Con estas ecuaciones construimos la siguiente tabla:

V1=(t-1) 4 4
ri 8 10
V2=t(ri-1) 35 45
k 1677,3 2096,6
 25,9 29,0
 0,01 0.01
1 0.99 0.99

Ocho muestras en cada tratamiento nos da


un 99% de probabilidad de detectar
diferencias a un nivel de significancia del
0.05.
V1=(t-1) 4 4
ri 8 10
V2=t(ri-1) 35 45
k 1677,3 2096,6
 25,9 29,0
 0,01 0.01
1 0.99 0.99
Tamaño de la muestra en minitab
D.C.A - MINITAB
Comparaciones
múltiples

residuales
storage
Comparaciones múltiples

resultados
Validación de supuestos
Normalidad
HOMOGENEIDAD

S-ar putea să vă placă și