Sunteți pe pagina 1din 15

DISEO ESTADSTICO DE EXPERIMENTOS

Una prueba o serie de pruebas en las cuales se introducen cambios deliberados en las
variables de entrada que forman el proceso, de manera que sea posible observar e
identificar las causas de los cambios en la variable de salida.

REALIZAR UN EXPERIMENTO

Aplicar los distintos niveles, o combinaciones de niveles cuando hay presentes ms de


un factor, a distintas unidades experimentales y se observa el valor de la variable
respuesta.

Unidades experimentales: (personas, elementos fsicos,etc).

Factor: Variable controlable por el experimentador (Niveles del factor o


tratamientos).

Variable de inters: Variable Respuesta.

Error experimental o perturbacin: Variables no controlables por el


experimentador.

Tamao del experimento: nmero total de observaciones.

OBJETIVO
Estudiar el efecto que sobre la Variable Respuesta tiene un conjunto de otras variables
que reciben el nombre de Factores.

ETAPAS

1) Disear un experimento con una estructura lo ms adecuada posible a la


situacin que se desea estudiar y a los medios disponibles.
a) Planteamiento general del problema y de los objetivos que se persiguen.
b) Seleccin y definicin de la variable respuesta.
c) Eleccin de los factores y niveles que han de intervenir en el
experimento.
d) Determinacin del conjunto de unidades experimentales incluidas en el
estudio.
e) Determinacin de los procedimientos por los cuales los tratamientos se
asignan a las unidades experimentales.
2) Realizar la experimentacin de acuerdo con el plan previamente establecido en
el diseo.
3) Analizar estadsticamente los resultados obtenidos y comprobar si las hiptesis
establecidas y el modelo de diseo elegido se adecuan a la situacin estudiada.
4) Realizar las modificaciones oportunas para ampliar o modificar el diseo.
5) Obtener las conclusiones apropiadas.

PRINCIPIOS BSICOS DEL DISEO DE EXPERIMENTOS


Aleatorizacin: La asignacin de las unidades experimentales a los distintos
tratamientos y el orden en el que se realizan los ensayos se determinan al azar.
Replicacin.
Homogeneidad del material experimental.

DISEO COMPLETAMENTE ALEATORIZADO


Una compaa algodonera que emplea diversos fertilizantes desea comprobar si
stos tienen efectos diferentes sobre el rendimiento de la semilla de algodn.
Una profesora de estadstica que imparte en grupos experimentales de alumnos,
en los que explica la misma materia pero siguiendo distintos mtodos de
enseanza, desea comprobar si el mtodo de enseanza utilizado influye en las
calificaciones de los alumnos.
Una industria qumica, que obtiene un determinado producto, est interesada en
comprobar si los cambios de temperatura influyen en la cantidad de producto
obtenido.

INTERS: Un solo factor con varios niveles o tratamientos


TCNICA ESTADSTICA: Anlisis de la Varianza de un factor o una va
OBJETIVO: Comparar ente s varios grupos o tratamientos
MTODO: Descomposicin de la variabilidad total de un experimento en
componentes independientes

OTROS FACTORES QUE INFLUYEN


Pequeas variaciones en la cantidad de riego, en la pureza de los insecticidas
suministrados, etc.
El nivel cultural del alumno, el grado de atencin y de inters del alumno, etc.
La pureza de la materia prima, la habilidad de los operarios, etc.
Tericamente es posible dividir esta variabilidad en dos partes, la originada por el factor
de inters y la producida por los restantes factores que entran en juego, conocidos o no,
controlables o no, que recibe el nombre de perturbacin o error experimental.

MODELO ESTADSTICO

yij = + i + uij i = 1, , I; j = 1, ni
yij : Variable aleatoria que representa la observacin j-sima del i-simo
tratamiento (nivel i-simo del factor).
: Efecto constante, comn a todos los niveles. Media global.
i : Efecto del tratamiento i-simo. Es la parte de yij debida a la accin delnivel
i-simo, que ser comn a todos los elementos sometidos a ese nivel del factor.
uij : Variables aleatorias que engloban un conjunto de factores, cada uno de los
cuales influye en la respuesta slo en pequea magnitud pero que de forma
conjunta debe tenerse en cuenta. Deben verificar las siguientes condiciones:
La media sea cero: E[uij] = 0 i, j .
La varianza sea constante: Var [uij] = 2 i, j
Independientes entre s: E [uij urk] = 0 i r j k.
Distribucin sea normal.

OBJETIVO
Estimar lo efectos de los tratamientos y contrastar las hiptesis.
1) Todos los tratamientos producen el mismo efecto.
H0 : i = 0 , i
2) Frente a la alternativa: Al menos dos difieren significativamente entre s:
H1 : i 0 por lo menos para algn i o equivalentemente

1) Todos los tratamientos tienen la misma media:


H0 : 1 = = I =
2) H1 : i j por lo menos para algn par (i, j)

SITUACIONES (EFECTOS)

Modelo de efectos fijos: i ni i = 0


Modelo de efectos aleatorios

SITUACIONES (TAMAO MUESTRALES)

Modelo equilibrado o balanceado: Todas las muestras del mismo tamao


(ni = n)
Modelo no-equilibrado o no-balanceado: Los tamaos, ni, de las muestras son
distintos.
Tabla Anova
1) SCT : Suma de cuadrados total
2) SCTr: Suma de cuadrados entre tratamientos
3) SCR: Suma de cuadrados dentro de los tratamientos o residual.
1) CMT : Cuadrado medio total: CMT =SCT /(N 1)
2) CMTr : Cuadrado medio entre tratamientos: CMTr =SCTr/(I1)
3) CMR : Cuadrado medio residual: CMR = SCR/(N I)

COEFICIENTE DE DETERMINACIN

R2 : Proporcin de la variabilidad total presente en los datos que es explicada por el


modelo de anlisis de la varianza.

EJEMPLOS

1. Una compaa textil utiliza diversos telares para la produccin de telas. Aunque
se desea que los telares sean homogneos con el objeto de producir tela de
resistencia uniforme, se supone que puede existir una variacin significativa en
la resistencia de la tela debida a la utilizacin de distintos telares. A su
disposicin tiene 5 tipos de telares con los que realiza determinaciones de la
resistencia de la tela. Este experimento se realiza en orden aleatorio y los
resultados se muestran en la tabla siguiente.

En este experimento, se han considerado 5 tipos de telares y se han realizado 6,


5, 5, 4 y 6 determinaciones de la resistencia de tela manufacturada con cada uno,
respectivamente.

La variable de inters o variable respuesta es la resistencia de la tela.


El factor: Los telares
Niveles del factor: 5
Modelo unifactorial de efectos fijos, no-equilibrado
2. En una determinada fbrica de galletas se desea saber si las harinas de sus cuatro
proveedores producen la misma viscosidad en la masa. Para ello, produce
durante un da 16 masas, 4 de cada tipo de harina, y mide su viscosidad. Los
resultados obtenidos son:

Variable respuesta: viscosidad


Factor: Proveedor
Tratamientos: 4
Modelo unifactorial de efectos fijos equilibrado

3. Una fbrica de textiles dispone de un gran nmero de telares. En principio, se


supone que cada uno de ellos debe producir la misma cantidad de tela por
unidad de tiempo. Para investigar esta suposicin se seleccionan al azar cinco
telares, y se mide la cantidad de tela producida en cinco ocasiones diferentes. Se
obtienen los datos de la tabla adjunta. Del estudio se concluye que todos los
telares tienen el mismo rendimiento?

Variable respuesta: cantidad de tela


Factor: Telares
Tratamientos: 5
Modelo unifactorial de efectos aleatorios equilibrado
DIAGNOSIS Y VALIDACIN DEL MODELO
Hiptesis bsicas del modelo estn o no en contradiccin con los datos observados.

HIPTESIS DE MODELO

La media sea cero: E [uij] = 0 i, j .


La varianza sea constante: Var [uij] = 2 ; i, j
Independientes entre s: E [uij urk] = 0 ; i r j k.
Distribucin sea normal.

VERIFICACION

ESTIMADORES DE LAS PERTURBACIONES: RESIDUOS

1. Independencia de los residuos


Grfico de los residuos en funcin del tiempo

2. Normalidad de los residuos


Histograma: Apariencia de una distribucin Normal centrada en cero
Grfico probabilstico normal (Q-Q-Plot)

3. Homocedasticidad (Varianza constante)


Residuos frente a los valores ajustados
Residuos frente a ciertas variables de inters
Ambas grficas tambin se utilizan para comprobar la hiptesis de
independencia
Contrastes: Barlett, Cochran, Hartley y Levene

COMPARACIONES MLTIPLES

Tcnicas cuyo objeto es identificar:


Qu tratamientos son diferentes (estadsticamente) y en cunto oscila el valor de esas
diferencias. (MODELO DE EFECTOS FIJOS)

OBJETIVO FUNDAMENTAL
Comparar entre s medias de tratamientos o grupos de ellas.

PROCEDIMIENTOS ANALTICOS

COMPARAR POR PAREJAS LOS EFECTOS DE I TRATAMIENTOS


Mtodo LSD
Mtodo de Bonferroni
Mtodo de Tukey o mtodo HSD
Mtodo de rango mltiple de Duncan
Test de Newman-Keuls
Mtodo Scheff
Mtodo de Dunnett

DISEOS EN BLOQUES COMPLETOS ALEATORIZADOS


HOMOGENEIDAD ENTRE LAS UNIDADES EXPERIMENTALES: En la
industria algodonera: las parcelas de terreno son de la misma calidad e igual
superficie.
El error experimental reflejar esta variabilidad entre las parcelas de terreno.
El error experimental sea lo ms pequeo posible. Se debe sustraer del error
experimental la variabilidad producida por las parcelas de terreno. Para ello, el
experimentador puede:
a. Considerar parcelas de terreno muy homogneas.
b. O bien, formar bloques de terreno de manera que el terreno de cada
bloque sea lo ms homogneo posible y los bloques entre s sean
heterogneos.

RECORDEMOS
o En el diseo completamente aleatorizado asignbamos los tratamientos al
azar a las parcelas sin restriccin alguna.
o En el diseo en bloques aleatorizados primero agrupamos las parcelas en
bloques y a continuacin asignamos los tratamientos a las parcelas en cada
bloque.

SOPUNGAMOS
o Se realiza una observacin por tratamiento en cada bloque: N = IJ
observaciones.
o La asignacin de los tratamientos a las unidades experimentales en cada
bloque se determina aleatoriamente.
o Los tratamientos y los bloques son factores de efectos fijos.
o No hay interaccin entre los tratamientos y los bloques: (El efecto de un
factor no depende del nivel del otro factor): Efectos de los factores son
aditivos.
MODELO ESTADISTICO

yij = + i + j + uij i = 1, 2, , I ; j = 1, 2, , J

yij : La variable aleatoria que representa la observacin (i)-sima del bloque (j)-
simo.
es un efecto constante. Media global.
i : El efecto producido por el nivel i-simo del factor principal. i = 0.
j : El efecto producido por el nivel j-simo del factor secundario o factor de
bloque. Se supone que .
uij : Variables aleatorias independientes con distribucin N (0, ).

DOS FACTORES

1) Factor tratamiento factor principal


2) Factor bloque factor secundario

Inters fundamentalmente est centrado en el primero y el factor bloque se introduce en


el modelo para eliminar su influencia en la variable respuesta.

OBJETIVO
Estimar los efectos de los tratamientos y de los bloques y contrastar la
hiptesis:
H0 : i = 0 i vs H1 : i 6= 0 por lo menos para algn i
H0 : j = 0 j vs H1 : j 6= 0 por lo menos para algn j

TABLA ANOVA

Tabla ANOVA. Modelo de Bloques Aleatorizados


1) SCT : Suma total de cuadrados.
2) SCT r: Suma de cuadrados entre tratamientos.
3) SCBl: Suma de cuadrados entre bloques
4) SCR: Suma de cuadrados del error o residual.
1) CMT : Cuadrado medio total : CMT = SCT /(N 1)
2) CMTr : Cuadrado medio entre tratamientos: CMT r =SCT r/(I 1)
3) CMBl : Cuadrado medio entre bloques: CMBl =SCBl/(J 1)
4) CMR : Cuadrado medio residual: CMR =SCR/(I 1)(J 1)

ANLISIS ESTADSTICO

Contraste de inters: H0 1 = = I = 0

F = CMT r
CMR F(I1),(I1)(J1)

Rechazar H0 a nivel si F (exp) > F;I1,(I1)(J1)

Tambin es interesante contrastar: H0 1 = = J = 0

F = CMBl
CMR F(J1),(I1)(J1)

Rechazar H0 a nivel si F(exp) > F;J1,(I1)(J1)

EJEMPLO
Una industria desea comprobar el efecto que tienen cinco productos qumicos
sobre la resistencia de un tipo particular de fibra. Como tambin puede influir
la mquina empleada en la fabricacin, decide utilizar un diseo en bloques
aleatorizados, considerando las distintas mquinas como bloques. La industria
dispone de 4 mquinas a las que asigna los 5 productos qumicos en orden
aleatorio.

Los resultados obtenidos se muestran en la tabla adjunta.

Variable respuesta: Resistencia de la fibra


Factor principal: Producto qumico. (Niveles: 5)
Factor secundario o factor bloque: Mquinas. (Niveles: 4)
Diseo en bloques completos al azar
PRUEBA DE UNIDAD DE VARIANZA

PRUEBA DE COMPARACIONES MLTIPLES

Intervalos de comparaciones mltiples para muestras k > 2

Sea Supongamos que k > 2 son muestras


independientes, donde cada muestra es independiente y est distribuida idnticamente
con la media y varianza . Y, supongamos que las muestras
provienen de poblaciones que tienen una curtosis comn.

Y sea sea un estimador de curtosis agrupada para el par de muestras ( i, j)


determinado como:

Sea sea el superior un punto del rango de las variables k que son independientes y
distribuidas idnticamente en una distribucin aleatoria normal estndar. Es
decir, satisface lo siguiente:

donde Z1, ..., Zk son variables aleatorias normales estndar independientes y distribuidas
idnticamente. Barnard (1978) proporciona un algoritmo numrico simple basado en
una cuadratura gaussiana de 16 puntos para calcular la funcin de distribucin del rango
normal.

El procedimiento de comparaciones mltiples rechaza la hiptesis nula de igualdad de


varianzas (tambin denominada homogeneidad de varianzas) si, y nicamente si, al
menos un par de los intervalos siguientes no se sobrepone:

donde

Donde ri = (ni - 3) / ni.


Nos referimos a los intervalos arriba mencionados como intervalos de comparaciones
mltiples o Intervalos de CM. Los intervalos de CM de cada muestra no se deben
interpretar como intervalos de confianza para las desviaciones estndar de las
poblaciones parentales. Hochberg et al. (1982) hacen referencia a intervalos similares
para comparar medias como "intervalos de incertidumbre". Los intervalos de CM dados
aqu solo son tiles para comparar las desviaciones estndar o varianzas de los diseos
de mltiples muestras. Cuando la prueba general de comparaciones mltiples es
significativa, las desviaciones estndar que corresponden a los intervalos que no se
solapan son estadsticamente diferentes. (Para la derivacin detallada de estos
intervalos, vaya al artculo tcnico sobre Mtodos de comparaciones mltiples.)

Intervalos de comparaciones mltiples para muestras k = 2

Donde hay nicamente dos muestras, los intervalos de comparaciones mltiples son
determinados por:

Donde z / 2 es el punto percentil / 2 superior de la distribucin normal estndar, ci =


ni / ni - z / 2, y Vi es determinado por la siguiente frmula:

Valor p para la prueba

Si hay 2 muestras en el diseo, entonces Minitab calcula el valor p para la prueba de


comparaciones mltiples utilizando el mtodo de Bonett para una prueba de 2 varianzas
y una relacin hipottica, Po , de 1.

Si hay muestras k > 2 en el diseo, entonces sea Pi j siendo el valor p de la prueba para
cualquier par (i, j) de muestras. El valor p del procedimiento de comparaciones
mltiples como una prueba general de igualdad de varianzas es determinado por lo
siguiente:

Para obtener ms informacin, incluyendo las simulaciones y los algoritmos detallados


para calcular Pi j, consulte el Mtodo de Bonett, que es un artculo tcnico que tiene
simulaciones y otras informaciones sobre el Mtodo de Bonett.

Notacin
Trmino Descripcin

ni el nmero de observaciones en la muestra i.

Y il la Isima observacin en la muestra i.

mi La media recortada de la muestra i con proporciones de recorte de


.

k El nmero de muestras.

Si la desviacin estndar de la muestra i.

El nivel de significancia para la prueba = 1 - (el nivel de confianza / 100).

Ci

Z / 2 el punto percentil / 2 superior de la distribucin normal estndar

ri

Estadstico de prueba de Levene

Minitab muestra un estadstico de prueba y un valor p para la prueba de Levene. La


hiptesis nula es que las varianzas son iguales y la hiptesis alternativa es que las
varianzas no son iguales. Utilice la prueba de Levene cuando los datos provengan de
distribuciones continuas, pero no necesariamente distribuciones normales.

El mtodo de clculo de la prueba de Levene es una modificacin del procedimiento de


Levene (Levene, 1960) desarrollado por Brown y Forsythe (1974). Este mtodo
considera las distancias de las observaciones con respecto a la mediana de la muestra en
lugar de la media de la muestra. Al usar la mediana de la muestra en vez de la media de
la muestra, esto hace que la prueba sea ms slida para las muestras ms pequeas y
hace el procedimiento asintticamente libre de distribucin. Si el valor p es menor que
el nivel , se rechaza la hiptesis nula de que las varianzas son iguales.

Frmula
H. Levene (1960). Contributions to Probability and Statistics. Stanford
University Press, CA.
M. B. Brown y A. B. Forsythe (1974). "Robust Tests for the Equality of
Variance," Journal of the American Statistical Association, 69, 364367.

Notacin

Trmino Descripcin

Vij

i 1, ..., k

j 1, ..., ni

mediana

Estadstico de prueba de Bartlett

Minitab muestra un estadstico de prueba y un valor p para la prueba de Bartlett.


Cuando nicamente hay dos niveles, Minitab realiza una prueba F en lugar de la prueba
de Bartlett. Para estas pruebas, la hiptesis nula es que las varianzas son iguales y la
hiptesis alternativa es que las varianzas no son iguales. Utilice la prueba de Bartlett
cuando los datos provengan de distribuciones normales; la prueba de Bartlett no es
slida cuando los datos se apartan de la normalidad.

El estadstico de prueba de Bartlett calcula el promedio aritmtico ponderado y el


promedio geomtrico ponderado de cada varianza de muestra basada en los grados de
libertad. Mientras mayor sea la diferencia en los promedios, es ms probable que las
varianzas de las muestras no sean iguales. B sigue una distribucin 2 con k 1 grados
de libertad. Si el valor p es menor que el nivel , se rechaza la hiptesis nula de que las
varianzas son iguales.

Frmula
Notacin

Trmino Descripcin

si 2

k nmero de muestras

vi ni - 1

ni nmero de observaciones al i simo nivel del factor

Estadstico de prueba F

Cuando nicamente hay dos niveles, Minitab realiza una prueba F en lugar de la prueba
de Bartlett. La hiptesis nula es que las varianzas son iguales y la hiptesis alternativa
es que las varianzas no son iguales. Utilice el estadstico F cuando los datos provengan
de distribuciones normales.

Si el valor p es menor que el nivel , se rechaza la hiptesis nula de que las varianzas
son iguales.

Frmula

Notacin

Trmino Description

S12 varianza de la muestra 1

S22 varianza de la muestra 2


n1 - 1 grados de libertad para el numerador

n2 - 1 grados de libertad para el denominador

Desviacin estndar (Desv.Est.)

Notacin

Trmino Description

yij observaciones al i simo nivel del factor

media de observaciones al i simo nivel factor del factor

ni nmero de observaciones al i simo nivel del factor

Intervalos de confianza de Bonferroni

Minitab calcula los intervalos de confianza para las desviaciones estndar utilizando el
mtodo de Bonferroni. Un intervalo de confianza es un rango de valores que
probablemente incluya algunos parmetros de poblacin, en este caso, contiene la
desviacin estndar.

Los intervalos de confianza estndar se calculan utilizando un nivel de confianza 1 /


2. El mtodo de Bonferroni utiliza el nivel de confianza 1 / 2p para cada intervalo de
confianza individual, donde p es el nmero de factor y las combinaciones de nivel. El
mtodo garantiza que el conjunto de intervalos de confianza tengan un nivel de
confianza de al menos 1 . El mtodo de Bonferroni proporciona intervalos de
confianza (ms amplios) ms conservadores, lo que reduce la probabilidad de error de
tipo 1.

S-ar putea să vă placă și