Sunteți pe pagina 1din 57

.1 Objetivos de la Inferencia Estadstica.

El objetivo de la Estadstica es medir y modelar la variabilidad del proceso mediante un modelo probabilstico. Para modelar la variabilidad de una variable aleatoria si slo se dispone del conocimiento de una muestra de la misma se sigue el siguiente modo de actuacin: 1. Planteamiento del problema. 2. Seleccin de la muestra (Muestreo estadstico), en algunos estudios la muestra se obtiene por simulacin (Simulacin Estadstica) 3. Estudio descriptivo de la muestra, analtico y grfico (Estadstica Descriptiva). 4. En base al conocimiento de los modelos probabilsticos ms utilizados y teniendo en cuenta el planteamiento del problema y el estudio descriptivo previo, elegir un modelo de probabilidad (Teora de la Probabilidad). 5. Estimar los parmetros del modelo supuesto a partir de las observaciones muestrales utilizando los mtodos de Inferencia Estadstica: estimacin puntual, estimacin por intervalos de confianza y contrastes de hiptesis paramtricos. 6. Chequear que el modelo de probabilidad ajustado a los datos es adecuado y que se verifican las hiptesis supuestas en el estudio, por ejemplo, que las observaciones muestrales son independientes, que no existen observaciones errneas,...,etc. Para ello se utilizan los mtodos de Inferencia no Paramtrica. 7. Si se acepta que el modelo ajustado es adecuado se puede utilizar para obtener resultados y conclusiones sobre la variable en estudio. En caso contrario, se debe reformular el modelo de probabilidad y repetir el proceso desde el paso 4. Si se obtiene ms informacin se puede mejorar el conocimiento de la variabilidad de la variable de inters. Puede hacerse por los siguientes medios: Mejorar la estimacin de los parmetros del modelo, utilizando mtodos estadsticos ms eficaces. Aumentando el tamao muestral. Reducir la variabilidad controlando la variabilidad sistemtica que puede ser debida a factores que influyen en la variable en estudio o controlando otras variables relacionadas con la variable de inters y que explican en mayor o menor medida su comportamiento. Para ello es necesario disponer de informacin adicional a la de la propia variable de inters, y tener datos de los factores y/o variables explicativas que influyen en ella. Este texto se estudian los modelos estadsticos que estudian una variable utilizando su relacin con otras variables y/o factores. En particular se

estudiarn los dos modelos estadsticos ms importantes y utilizados en la prctica, El Diseo de Experimentos, que estudia la variabilidad de la variable de inters controlando los factores que pueden influir en la misma. Los Modelos de Regresin, que estudian la variabilidad de la variable de inters teniendo en cuenta la relacin funcional de la misma con otras variables explicativas.

1.2 Inferencia Estadstica. Conceptos bsicos.


Puede definirse la InferenciaEstadstica como

El conjunto de mtodos estadsticos que permiten deducir(inferir)como se distribuye la poblacin en estudio o las relacionesestocsticasentre varias variables de inters a partir de la informacin queproporciona una muestra.

Para que un mtodo de inferencia estadstica proporcione buenos resultados debede: Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente validada. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao suficiente. Conceptos bsicos que seutilizarn en este texto son los siguientes: Poblacin: es un conjuntohomogneo de individuos sobre los que se estudia una o varias caractersticas que son, de alguna forma, observables. Muestra: es un subconjunto de lapoblacin. El nmero de elementos de la muestra se denomina tamao muestral. Muestreo aleatorio simple: es aquelen el que todos los individuos de la poblacin tienen la misma probabilidad de ser elegidos. Muestra aleatoria simple, de unavariable aleatoria X, condistribucin F, de tamao n, es un conjunto de n variables aleatorias X1,X2,...,Xn,independientes e igualmente distribudas (i.i.d.) con distribucin F. Espacio muestral: es el conjunto demuestras posibles que pueden obtenerse al seleccionar una muestra aleatoria, de tamao n, de una cierta poblacin. Parmetro: es cualquiercaracterstica medible de la funcin dedistribucin de la variable en estudio (media, varianza,..). Estadstico: es unafuncin de la muestra T . Por tanto, es una variable aleatoria que tiene una funcin de distribucin que se denomina

distribucin en el muestreo de T. Los estadsticosindependientes del parmetro a estimar se denominan estimadores. Propiedades de los estimadores. Sea n= n un estimador del parmetro . Propiedades del estimador son las siguientes 1. Estimador centrado o insesgado,tiene sesgo cero,

2. Estimador asintticamente centrado o insesgado,verifica

3. Error Cuadrtico Medio de

,es

4. Estimador consistente en mediacuadrtica, verifica

por tanto

5. La precisin o eficacia del estimador

es

Si el estimador es insesgado

6. Estimador de la media poblacional,se utiliza la media muestraldefinida por 1. (1.1)

2. Si X sigue una distribucinN

, se verifica que

(1.2)

3. Estimador de la varianzapoblacional, se utiliza la cuasivarianza muestral definida por 4. (1.3)

5. Si X sigue una distribucinN

, se verifica que

(1.4)

6. Dado que normalmente la varianza poblacional se desconoce y es necesario estimarla, es de inters el siguiente resultado

(1.5)

7.

1.3 Contraste o test de hiptesis. Definiciones.


1.3.1 Definiciones bsicas.

Uncontraste o test de hiptesis es una tcnicade Inferencia Estadstica que permite comprobar si lainformacin que proporciona una muestra observada concuerda(o no) con la hiptesis estadstica formulada sobreel modelo de probabilidad en estudio y, por tanto, se puedeaceptar (o no) la hiptesis formulada. Una hiptesis estadstica es cualquier conjeturasobre una o varias caractersticas de inters de unmodelo de probabilidad. Unahiptesis estadstica puede ser:
Paramtrica: es unaafirmacin sobre los valores de los parmetrospoblacionales desconocidos. Las hiptesis paramtricas se clasifican en Simple: si la hiptesisasigna valores nicos a los parmetros ( ,...). =1'5, = 10,
X

Compuesta: si la hiptesisasigna un rango de valores a los parmetros poblacionales desconocidos ( > 1'5,5 < < 10, X< Y ,...). No Paramtrica: es unaafirmacin sobre alguna caractersticaestadstica de la poblacin en estudio. Por ejemplo, las observaciones son independientes, la distribucin de la variable en estudio es normal, la distribucin es simtrica,...

La hiptesis que se contrasta se denominahiptesis nula y, normalmente,se denota por H0.Si se rechaza la hiptesis nula es porque se asumecomo correcta una hiptesis complementaria que se denominahiptesis alternativa y sedenota por H1.
1.3.2 Pasos a seguir en la realizacin de un contraste de hiptesis.

Al realizar cualquier contrastede hiptesis estadstico se deben seguir lassiguientes etapas:


1. Plantear el contraste de hiptesis, definiendo la hiptesis nula (H0, hiptesis que se desea contrastar), y la hiptesis alternativa (H1, cualquier forma de negacinde la hiptesis nula ). 2. Definir una medida de discrepancia entre la informacin que proporciona la muestra ( ) y la hiptesis H0. Esta medida de discrepancia

1.

(1.6)

2. se denomina estadstico del contraste yser cualquier funcin de los datos muestrales y de la informacin de la hiptesis nula

. La medida de discrepancia debe seguir una distribucin conocida cuando H0 sea cierta, de forma que se pueda distinguir entre: una discrepancia grande, la que tiene una probabilidad muy pequea de ocurrir cuando H0 es cierto. una discrepancia pequea, la que tiene una probabilidad grande de ocurrir cuando H0 es cierta. 3. Decidir que valores de d se consideran muy grandes, cuandoH0 es cierto, para que sean atribuibles al azar. sto es, decidir que discrepancias se consideran inadmisibles cuando H0 es correcto, lo que equivale aindicar el valor del nivel designificacin,que se denota por . 4. Tomar la muestra ( ), calcular el valor delestadistico asociado a la muestra (valorcrtico del contraste) yanalizar: Si es pequeo (pertenece a la regin de aceptacin), entonces se acepta la hiptesis H0. Si es grande (pertenece a la regin de rechazo), entonces serechaza la hiptesis H0. 1.3.3 Tipos de Error en un contraste de hiptesis.

Al realizar un contraste se puedecometer uno de los dos errores siguientes:


Error tipo I, se rechaza lahiptesis nula H0 cuando es cierta. Error tipo II, se acepta lahiptesis nula H0 cuando es falsa.

Situacin real:

H0es cierta H0 es falsa

ACEPTAR CORRECTO ERROR II H0 Decisin: RECHAZAR H0 ERROR I CORRECTO

Tabla 1.1: Situaciones posibles en un contraste dehiptesis.

Debe tenerse en cuenta que slo se puede cometer uno de los dos tipos de error y, en lamayora de las situaciones, se desea controlar controlar laprobabilidad de cometer un error de tipo I.

Se denomina nivelde significacinde un contraste a la probabilidad de cometer un error tipoI, se denota por y, portanto,
(1.7) Fijar el nivel de significacin equivale a decidir de antemanola probabilidad mxima que se est dispuesto aasumir de rechazar la hiptesis nula cuando es cierta. Elnivel de significacin lo elige el experimentador y tienepor ello la ventaja de tomarlo tan pequeo como desee(normalmente se toma = 0'05, 0'01 o 0'001).

La seleccin de un nivel de significacin conduce a dividir en dosregiones el conjunto de posibles valores del estadstico decontraste:
La regin de Rechazo, conprobabilidad , bajo H0.

La regin de Aceptacin, con probabilidad 1 - ,bajo H0.

0,4

f. densidad de D

0,3 0,2 0,1 0 -4

D/H_0

D/H_1

E_ii E_i -2 0 1.65 2 4 6

R. Aceptacin

R.Rechazo
= 0'05,P =0'36,

Figura 1.1. Tipos de errores. Contrasteunilateral, P

Si el estadstico de contraste toma unvalor perteneciente a la regin de aceptacin,entonces no existen evidencias suficientes para rechazar lahiptesis nula con un nivel de significacin y el contraste se dice que estadsticamente no essignificativo. Si, por el contrario, el estadsticocae en la regin de rechazo entonces se asume que los datosno son compatibles con la hiptesisnula y se rechaza a un nivel de significacin . En este supuesto se dice que elcontraste es estadsticamente significativo. Por tanto, resolver un contrasteestadstico es calcular la regin deaceptacin y la regin de rechazo y actuarsegn la siguiente regla dedecisin: Se obtiene la muestra contraste . = y se calculael estadstico del

(1.8)

Segn la forma de la regin de rechazo, un contraste de hiptesis, paramtrico o no, sedenomina Contraste unilateral o contraste de unacola es el contraste de hiptesis cuya regin de rechazo est formada por una cola de la distribucin del estadstico de contraste,

bajo H0. Contraste bilateral o contraste de doscolas es el contraste de hiptesis cuya regin de rechazo est formada por las dos colas de la distribucin del estadstico de contraste, bajo H0.

Figura 1.2. Contraste bilateral. H0 :

= 0,H1 :

0.

Figura 1.3. Contraste unilateral H0 :

> 0,H1 :

< 0.

Ejemplo 1.1. Test de hiptesis estadstica.

La distribucin del tamao en Kb de los ficheros que resultan al digitalizar imgenes con un determinado programa puede suponerse normal. El programa ha sido mejorado en su ltima versin (versin B) hasta el punto de que quienes lo comercializan garantizan una disminucin en el tamao medio de los ficheros resultantes superior a 6 Kb con respecto a la versin anterior (versin A). La nueva versin B se envi a probar a un centro de investigacin privado que utiliza la versin A. Las ltimas 550 imgenes recibidas se digitalizaron con la nueva versin B, obtenindose que los tamaos de los ficheros resultantes presentaron una media xB= 63'9 y una cuasivarianza B2= 105'063. Cuando se comprob que las 550 imgenes anteriores a stas, digitalizadas con la versin antigua A, haban proporcionado las siguientes medidas xA= 70'8 y A2= 96'04, el centro no consider realista la diferencia anunciada por el proveedor y devolvieron el producto. Los proveedores enviaron entonces un representante comercial y ste convenci a los responsables del centro para la realizacin de una nueva prueba. Las 25 imgenes que haba en ese momento en el laboratorio se digitalizaron con las dos versiones del programa A y B. Finalmente se calcularon las diferencias en Kb de los ficheros obtenidos con cada versin resultando
5'210 10'785 9'607 12'442 11'248 -2'368 9'762 9'776

8'683 10'783 5'371 9'917 8'151

10'830 12'836 11'487 12'964 7'343 5'722 0'615 12'406 4'693 4'048 6'151 8'480

Estos resultados hicieron cambiar de idea a los responsables del centro y adquirieron la nueva versin B. Analizar ambas experiencias. Cmo es posible que con tan slo 25 datos se haya cambiado de opinin si la experiencia primera se realiz en base a un tamao de muestra 22 veces superior?

Solucin: Se siguen los siguientes pasos

Paso 1: Especificar las hiptesis nula (H0) y alternativa (H1).

Sea A la esperanza de la distribucin de los tamaos de los ficheros una vez digitalizadas las imgenes con la versin A del programa y B la correspondiente a la versin B actualizada. Se desea investigar si es razonable asumir la afirmacin del proveedor. El contraste a realizar es

(1.9)

Se supone que se verifican las siguientes hiptesis: Las observaciones siguen una distribucin normal. Las observaciones son independientes. Las dos muestras tienen igual varianza.

Se contrasta la tercera hiptesis de igualdad de las varianzas de las dos muestras.

(1.10)

Fijado

= 0'05, se calcula el estadstico del contraste

Este valor 2 no pertenece a la regin de rechazo especificada para el contraste de varianzas de dos muestras independientes que viene dado por

Por tanto se acepta la hiptesis de igualdad de las varianzas de las dos muestras.

5 4

F_549,549

3 2 1 0'025 0 0,6 Rechazo 0,8 0,7 1 1,2 1,3 1'09 1,1 1'17 R. Rechazo R. 0'83 0,9 R. Aceptacin
Figura 1.4. Contraste de igualdad de varianzas.

0'95 0'025

Paso 2: Se elige un estadstico de contraste apropiado: d1= d1(H0, problema una buena eleccin es la siguiente.

). En este

(1.11)

Si H0 es cierto, entonces (1.12)


2 2 A = 2

es un estimador del parmetro

, que viene dado por

(1.13)

Paso 3: Se fija el nivel de significacin , esto es, la probabilidad de error de tipo I. En este ejemplo se utiliza = 0'05.

Paso 4: Se calculan las regiones de rechazo y de aceptacin del contraste, teniendo en cuenta si el contraste es unilateral o bilateral.

En el ejemplo el contraste es unilateral y teniendo en cuenta regin de rechazo para = 0'05 es

la

(1.14)

0,4 0,3

t_1098

0,2 0,1 0 -4 -3

0'95 0'05

-2 -1 0 R. Aceptacin 1'48

1 1'64

3 4 R. Rechazo

Figura 1.5. Contraste de igualdad de medias. Primer estudio.

Paso 5: Se obtiene la muestra y utilizando el estadstico de contraste d1 dado en se obtiene el valor crtico = (X1, ,Xn).

En el ejemplo en estudio, en primer lugar se calcula la estimacin de la varianza

Ahora el valor crtico del contraste C1 es

El nivel crtico asociado del contraste es 0'0683 (ver siguiente seccin).

Paso 6: Se concluye si el test es estadsticamente significativo o no al nivel de significacin segn que el valor crtico pertenezca a la regin de rechazo o a la regin de aceptacin, respectivamente.

Como 1 = 1'488 no pertenece a la regin de rechazo dada en se acepta la hiptesis nula. Por consiguiente los datos muestrales no avalan que el tamao medio de los ficheros disminuye en ms de 6 Kb como afirman los vendedores del nuevo programa. Tal y como se resolvi el problema hay un parmetro que no se controla, elerror de tipo II, ya que se desconoce la probabilidad de aceptar la hiptesisnula cuando es falsa. Si,simultneamente, se desea controlar la probabilidad deerror de tipo I y la probabilidad de error de tipo II ( ( 1)) se debe especificar eltamao muestral que se est dispuesto a asumir.sto es, si se quiere controlar el porcentaje de veces quese detecta la hiptesis alternativa (que se denota = 1)cuando es cierta, que en trminos de probabilidad sedenota por

es necesario calcular el tamao muestral n adecuado para garantizar que ambasprobabilidades de error sean las fijadas.

Obviamente existe una relacin entre lostres parmetros (n, conocidos dos de ellos se puedeobtener el tercero:
n, tamao muestral, , probabilidad de error de tipo I, ( ), probabilidad de error de tipoII.

( )),

En este ejemplo puede suponerse que existe independenciaentre las observaciones muestrales y que no hay relacin entre los dos gruposde 550 imgenes digitalizadas por cada una de las dos versiones del programa.Por tanto se trata de dos muestras independientes. En la segunda experiencia que se propone los datos se hantomado apareados ya que se han ejecutado lasdos versiones del programa sobre las mismas imgenes, primero la versin A ydespus la B. Por tanto hay independencia entre las observaciones de cadamuestra pero no entre las observaciones de una muestra respecto a la otra. Pararesolver el problema en este segundo contexto y evitar el problema dedependencia, se trabaja con la variable diferencia del tamao del fichero aldigitalizar la imagen con la versin A del programa y el tamao del fichero alutilizar la versin B .Se calculan las 25 diferencias entre los tamaos de los ficherosresultantes y se obtiene una muestra nica. De la que se obtiene

El contraste es ahora

(1.15)

El estadstico del contraste es (1.16)

Bajo las hiptesis supuestas se verifica que la distribucin de d3,cuando H0es cierta, es una distribucin t

(1.17) Para = 0'05se obtiene la siguiente regin de rechazo

Utilizando

se obtiene el siguiente valor crtico

Este valor

pertenece a la regin de rechazo y serechaza H0.

Obsrvese que tambin se rechazara H0con = 0'01(de hecho el nivel crtico es 0'003).La decisin de rechazo parece clara y con garantas, en contradiccin con ladecisin de la primera experiencia.

0,4

Figura 1.6. Contraste sobre la media. Datos apareados.


Por qu esta diferencia en la respuesta?

Viene motivada por la alta variabilidad de las variables delprimer experimento XAy XB.Con el muestreo apareado la variabilidad ha disminuido considerablemente, lavarianza de la variable diferencia Z esconsiderablemente inferior a la varianza de XAy XB.La disminucin tan fuerte en la variabilidad est motivada en la existencia deuna alta correlacin positiva entre las variables XAy XB,ya que las imgenes que al digitalizarlas con una versin generanficheros grandes (pequeos) tambin producirn ficheros grandes (pequeos)al ser digitalizadas con la otra versin.

1.3.4 Nivel crtico y regin crtica.

Si el contraste dehiptesis se va estudiar con una nica muestra y node forma repetida y sistemtica, se puede utilizar unafilosofa alternativa y ms informativa que se basaen los conceptos de nivel crtico y regincrtica.

Se denomina nivel crtico o p-valor a laprobabilidad p de obtener una discrepancia con H0 mayor o igual que el valorcrtico cuando H0 es correcto.

(1.9)

La regin crtica es el conjunto devalores para los cuales d esmayor o igual que el valor crtico d . Por tanto,

Comentarios:

1. El nivel crtico slo puede calcularse una vez tomada la muestra, obtenindose niveles crticos distintos para cada muestra. 2. El nivel crtico p puede interpretarse como un nivelmnimo de significacin en el sentido de que niveles de significacin iguales o superiores al p -valor llevarn a rechazar la hiptesis nula. Por tanto, cuanto menor sea el p -valor mayor es el gradode incompatibilidad de la muestra con H0, lo que lleva a rechazar H0. 3. El clculo del nivel crtico no proporciona de modo sistemtico una decisin entre H0 y H1. 4. En las Figuras 1.7 (y 1.8) pueden verse representados el nivel crtico y la regin crtica en un contraste unilateral (y bilateral) acerca de la media, bajo la hiptesis de normalidad.

Figura 1.7. Nivel crtico. Contraste unilateralsobre la media con

= 0'84.

0,4

Figura 1.8. Nivel crtico. Contraste bilateralsobre la media con

= 0'84.

1.3.5 Potencia de un contraste.

Para medir la bondad de uncontraste de hiptesis se utiliza el concepto de potenciadel contraste. Considrese que se est estudiando uncontraste de hiptesis acerca del parmetro , siendo la hiptesis nula frente a la hiptesis alternativa Se denomina potencia al nivel del estadstico de contrasted a la funcin queasigna a cada valor del parmetro la probabilidad de rechazar H0 cuando es correcto.

Esto es,

donde

(1.10)

Comentarios: 1. Al grafo de la potencia se lo denomina curva de potencia. En algunos textosse trabaja con la funcin curva caracterstica de operacin definida por

1. (1.11)

2. Si denotamos por

a la probabilidad de error de tipo I,se verifica que

Cuanto ms lejana se encuentra la alternativa H1 de H0 menor es la probabilidad de incurrir en un error tipo II ( ) y, porconsiguiente, la potencia tomar valores ms prximos a 1. 3. Si la potencia en la hiptesis alternativa es siempre muy prxima a 1 entonces se dice que el estadstico de contraste es muy potentepara contrastar H0 ya que en ese caso las muestras sern, con alta probabilidad, incompatibles con H0 cuando H1 sea cierta. Por tanto puede interpretarse la potencia de un contraste como su sensibilidad o capacidad para detectar una hiptesis alternativa. 1. Fijado un nivel de significacin , un contraste d1 se dice ms potente que otro d2 para contrastar la hiptesis nula H0 si
1. (1.12)

2. En la Figura 1.9. se representa la funcin de potencia del contraste H0 : = 0 frente a la alternativa H1 : 0 (contraste bilateral), bajo lahiptesis de normalidad, con =0'10 y tamao muestral n =100. En la Figura 1.10. se representa la funcin de potencia del contraste H0 : < 0 frente a la alternativa H1 : >0 (contrasteunilateral), bajo la hiptesis de normalidad, con =0'10 y tamao muestral n =100.

Figura 1.9. Funcin de Potencia. Contrastebilateral acerca de la media.

Figura 1.10. Funcin de Potencia. Contrasteunilateral acerca de la media. 1.3.6 Algunos contrastes paramtricos importantes.

Se exponen en esta seccinalgunos de los estadsticos de contraste msimportantes para contrastar hiptesis nulas del tipo H0 : = 0,siendo

unparmetro desconocido y de cuyo valor depende ladistribucin de una variable de inters X. Contrastes sobre la media. A partirde una muestra extrada 2 de una poblacin X normal con media y varianza desconocidas, se desea contrastar la hiptesis nula El estadstico de contraste es

(1.13)

donde

es ladesviacin tpica muestral corregida

. Si H0 es cierto

Contrastes sobre la varianza. Sea lamuestra aleatoria simple extrada de una poblacin X normal con varianza contrastar El estadstico de contraste es

, se desea

(1.14)

Si H0 es cierto

Contrastes sobre la igualdad de varianzas.Sean dos muestras aleatorias simples e obtenidas de dos poblaciones X e Y,con distribuciones respectivas N Se desea contrastar yN .

El estadstico de contraste es

(1.15)

Si H0 es cierto

Contrastes sobre la diferencia de medias,muestras independientes e igualdadde varianzas. Sean dos muestrasaleatorias simples obtenidas de dos poblaciones X e Y, con distribuciones N yN contrastar .Por tanto se supone que
2 X

= 2. Se desea

El estadstico de contraste es

(1.16)

siendo

(1.17)

un estimador insesgado eficiente de la varianza que se calcula a partir de la informacin que proporcionan ambas muestras.

Si H0 es cierto se verifica que

Contrastes sobre la diferencia de medias,muestras independientes y varianzasdesiguales. Sean dos muestrasaleatorias simples obtenidas de dos poblaciones X e Y, con distribucionesrespectivas N Se desea contrastar yN ,y se supone que
2 X Y 2

e .

El estadstico de contraste que se utiliza es

(1.18)

Si H0 es cierto se verifica que

siendo g =n + m- 2 + , con un trmino de correccin(ver Cao y otros (2001)). Contrastes sobre la diferencia de medias,muestreo apareado. En este caso las dos muestras aleatorias simples tienen igual tamao muestral e y son obtenidas al realizar dos observacionesXi eY i sobre el mismo individuo, el i-simo. Por la naturaleza delmuestreo apareado las dos muestras son dependientes. Para eliminar este problema se estudia la variable diferencia Z =Y - X, por tanto, a partir de las dosmuestras iniciales se calcula la muestra de diferencias , Zi =Xi -Yi .Para contrastar la hiptesis

Se utiliza el siguiente estadstico de contraste

(1.19)

Si H0 es cierto

Captulo 2 Principios bsicos del diseo de experimentos.

2.1 Introduccin. 2.2 Tipos de variabilidad. 2.3 Planificacin de un experimento. 2.4 Resumen de los principales conceptos. 2.5 Principios bsicos del diseo de experimentos. 2.6 Algunos diseos experimentales clsicos 2.6.1 Diseo completamente aleatorizados. 2.6.2 Diseo en bloques o con un factorbloque. 2.6.3 Diseos con dos o ms factoresbloque. 2.6.4 Diseos con dos o ms factores. 2.6.5 Diseos factoriales a dos niveles.

2.1 Introduccin.
Los modelos de Diseo de experimentos son modelosestadsticos clsicos cuyo objetivo es averiguar si unos determinados factoresinfluyen en la variable de inters y, si existe influencia de algn factor,cuantificarla. Ejemplos donde habra que utilizar estos modelos son lossiguientes: En el rendimiento de un determinado tipo de mquinas (unidades producidas por da) se desea estudiar la influencia del trabajador que la maneja y la marca de la mquina. Se quiere estudiar la influencia del tipo de pila elctrica y de la marca en la duracin de las pilas. Una compaa telefnica est interesada en conocer la influencia de varios factores en la variable de inters la duracin de una llamada telefnica. Los

factores que se consideran son los siguientes: hora a la que se produce la llamada; da de la semana en que se realiza la llamada; zona de la ciudad desde la que se hace la llamada; sexo del que realiza la llamada; tipo de telfono (pblico o privado) desde el que se realiza la llamada. Una compaa de software est interesada en estudiar la variable porcentaje que se comprime un fichero al utilizar un programa que comprime ficheros teniendo en cuenta el tipo de programa utilizado y el tipo de fichero que se comprime. Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para ello, se desean controlar diferentes factores: profesor que imparte la asignatura; mtodo de enseanza; sexo del alumno. La metodologa del diseo de experimentos se basa en laexperimentacin. Es conocido que si se repite un experimento, en condicionesindistinguibles, los resultados presentan variabilidadque puede ser grande o pequea. Si la experimentacin se realiza en unlaboratorio donde la mayora de las causas de variabilidad estn muycontroladas, el error experimental ser pequeo y habr poca variacin enlos resultados del experimento. Pero si se experimenta en procesos industriales,administrativos, ... la variabilidad es grande en la mayora de loscasos. El objetivo del diseo de experimentos es estudiar siutilizar un determinado tratamiento produce una mejora en el proceso o no. Paraello se debe experimentar utilizando el tratamiento y no utilizndolo. Si lavariabilidad experimental es grande, slo se detectar la influencia del usodel tratamiento cuando ste produzca grandes cambios en relacin con el errorde observacin. La metodologa del Diseo de Experimentos estudia cmo variar las condiciones habituales de realizacin de un proceso emprico para aumentar la probabilidad de detectar cambios significativos en la respuesta, de esta forma se obtiene un mayor conocimiento del comportamiento del proceso de inters. Para que la metodologa de diseo de experimentos sea eficazes fundamental que el experimento est bien diseado. Un experimento se realiza por alguno de los siguientesmotivos: * Determinar lasprincipales causas de variacin en la respuesta. * Encontrar lascondiciones experimentales con las que se consigue un valor extremo en lavariable de inters o respuesta. * Comparar las respuestasen diferentes niveles de observacin de variables controladas.

* Obtener un modelo estadstico-matemticoque permita hacer predicciones de respuestas futuras. La utilizacin de los modelos de diseo de experimentos sebasa en la experimentacin y en el anlisis de los resultados que se obtienenen un experimento bien planificado. En muy pocas ocasiones es posible utilizarestos mtodos a partir de datos disponibles o datos histricos, aunque tambinse puede aprender de los estudios realizados a partir de datos recogidos porobservacin, de forma aleatoria y no planificada. En el anlisis estadsticode datos histricos se pueden cometer diferentes errores, los mscomunes son los siguientes: Inconsistencia de los datos. Los procesos cambian con el tiempo, se producen cambios en el personal (cambios de personas, mejoras del personal por procesos de aprendizaje, motivacin, ...), cambios en las mquinas (reposiciones, reparaciones, envejecimiento, ...). Estos cambios tienen influencia en los datos recogidos, lo que hace que los datos histricos sean poco fiables, sobre todo si se han recogido en un amplio espacio de tiempo. Variables con fuerte correlacin. Puede ocurrir que en el proceso existan dos o ms variables altamente correlacionadas que pueden llevar a situaciones confusas. Por ejemplo, en el proceso hay dos variables X1 y X2 fuertemente correlacionadas que influyen en la respuesta, pero si en los datos que se tiene aumenta al mismo tiempo el valor de las dos variables no es posible distinguir si la influencia es debida a una u otra o a ambas variables (confusin de los efectos). Otra situacin problemtica se presenta si solo se dispone de datos de una variable (por ejemplo de X1 y no de X2), lo que puede llevar a pensar que la variable influyente es la X1 cuando, en realidad, la variable influyente es la X2 (variable oculta). El rango de las variables controladas es limitado. Si el rango de una de las variables importantes e influyentes en el proceso es pequeo, no se puede saber su influencia fuera de ese rango y puede quedar oculta su relacin con la variable de inters o lo cambios que se producen en la relacin fuera del rango observado. Esto suele ocurrir cuando se utilizan los datos recogidos al trabajar el proceso en condiciones normales y no se experimenta (cambiando las condiciones de funcionamiento) para observar el comportamiento del proceso en situaciones nuevas.

2.2 Tipos de variabilidad.

Uno de los principales objetivos de los modelos estadsticosy, en particular, de los modelos de diseo de experimentos, es controlar lavariabilidad de un proceso estocstico que puede tener diferente origen. Dehecho, los resultados de cualquier experimento estn sometidos a tres tipos devariabilidad cuyas caractersticas son las siguientes: Variabilidad sistemtica y planificada. Esta variabilidad viene originada por la posible dispersin de los resultados debida a diferencias sistemticas entre las distintas condiciones experimentales impuestas en el diseo por expreso deseo del experimentador. Es el tipo de variabilidad que se intenta identificar con el diseo estadstico. Cuando este tipo de variabilidad est presente y tiene un tamao importante, se espera que las respuestas tiendan a agruparse formando grupos (clusters). Es deseable que exista esta variabilidad y que sea identificada y cuantificada por el modelo. Variabilidad tpica de la naturaleza del problema y del experimento. Es la variabilidad debida al ruido aleatorio. Este trmino incluye, entre otros, a la componente de variabilidad no planificada denominada error de medida. Es una variabilidad impredecible e inevitable. Esta variablidad es la causante de que si en un laboratorio se toman medidas repetidas de un mismo objeto ocurra que, en muchos casos, la segunda medida no sea igual a la primera y, ms an, no se puede predecir sin error el valor de la tercera. Sin embargo, bajo el aparente caos, existe un patrn regular de comportamiento en esas medidas: todas ellas tendern a fluctuar en torno a un valor central y siguiendo un modelo de probabilidad que ser importante estimar. Esta variabilidad es inevitable pero, si el experimento ha sido bien planificado, es posible estimar (medir) su valor, lo que es de gran importancia para obtener conclusiones y poder hacer predicciones. Es una variabilidad que va a estar siempre presente pero que es tolerable. Variabilidad sistemtica y no planificada.

Esta variabilidad produce una variacin sistemtica en los resultados y es debida a causas desconocidas y no planificadas. En otras palabras, los resultados estn siendo sesgados sistemticamente por causas desconocidas. La presencia de esta variabilidad supone la principal causa de conclusiones errneas y estudios incorrectos al ajustar un modelo estadstico. Como se estudiar posteriormente, existen dos estrategias bsicas para tratar de evitar la presencia de este tipo de varibilidad: la aleatorizacin y la tcnica de bloques. Este tipo de variabilidad debe de intentar evitarse y su presencia lleva a conclusiones errneas.

2.3 Planificacin de un experimento.


La experimentacin forma parte natural de la mayora delas investigaciones cientficas e industriales, en muchas de las cuales, losresultados del proceso de inters se ven afectados por la presencia dedistintos factores, cuya influencia puede estar oculta por la variabilidad delos resultados muestrales. Es fundamental conocer los factores que influyenrealmente y estimar esta influencia. Para conseguir sto es necesarioexperimentar, variar las condiciones que afectan a las unidades experimentales yobservar la variable respuesta. Del anlisis y estudio de la informacinrecogida se obtienen las conclusiones. La forma tradicional que se utilizaba en la experimentacin,para el estudio de estos problemas, se basaba en estudiar los factores uno auno, sto es, variar los niveles de un factor permaneciendo fijos los dems.Esta metodologa presenta grandes inconvenientes: * Es necesario un gran nmerode pruebas. * Las conclusionesobtenidas en el estudio de cada factor tiene un campo de validez muyrestringido. * No es posible estudiarla existencia de interaccin entre los factores. * Es inviable, en muchoscasos, por problemas de tiempo o costo. Las tcnicas de diseo deexperimentos se basan en estudiar simultaneamente los efectos de todoslos factores de inters, son ms eficaces y proporcionan mejores resultadoscon un menor coste. A continuacin se enumeran las etapas que deben seguirse parauna correcta planificacin de un diseo experimental, etapas que deben serejecutadas de

forma secuencial. Tambin se introducen algunos conceptos bsicosen el estudio de los modelos de diseo de experimentos. Las etapas a seguir en el desarrollo de un problema de diseode experimentos son las siguientes: 1. Definir los objetivos del experimento. 2. Identificar todas las posibles fuentes de variacin, incluyendo: factores tratamiento y sus niveles, unidades experimentales, factores nuisance (molestos): factores bloque, factores ruido y covariables. 3. Elegir una regla de asignacin de las unidades experimentales a las condiciones de estudio (tratamientos). 4. Especificar las medidas con que se trabajar (la respuesta), el procedimiento experimental y anticiparse a las posibles dificultades. 5. Ejecutar un experimento piloto. 6. Especificar el modelo. 7. Esquematizar los pasos del anlisis. 8. Determinar el tamao muestral. 9. Revisar las decisiones anteriores. Modificarlas si se considera necesario. Los pasos del listado anterior no son independientes y en undeterminado momento puede ser necesario volver atrs y modificar decisionestomadas en algn paso previo. A continuacin se hace una breve descripcin de lasdecisiones que hay que tomar en cada uno de los pasos enumerados. Slo despusde haber tomado estas decisiones se proceder a realizar el experimento. 1.- Definir los objetivos delexperimento. Se debe hacer una lista completa de las preguntas concretas alas que debe dar respuesta el experimento. Es importante indicar solamentecuestiones fundamentales ya que tratar de abordar problemas colaterales puedencomplicar innecesariamente el experimento. Una vez elaborada la lista de objetivos, puede ser tilesquematizar el tipo de conclusiones que se espera obtener en el posterior anlisisde datos. Normalmente la lista de objetivos es refinada a medida que sevan ejecutando las etapas del diseo de experimentos.

2.- Identificar todas lasposibles fuentes de variacin. Una fuente de variacin escualquier cosa que pueda generar variabilidad en la respuesta. Esrecomendable hacer una lista de todas las posibles fuentes de variacin delproblema, distinguiendo aquellas que, a priori, generarn una mayorvariabilidad. Se distinguen dos tipos: - Factores tratamiento: sonaquellas fuentes cuyo efecto sobre la respuesta es de particular inters parael experimentador. - Factores nuisance: sonaquellas fuentes que no son de inters directo pero que se contemplan en eldiseo para reducir la variabilidad no planificada. A continuacin se precisan ms estos importantes conceptos. (i) Factores y sus niveles. Se denomina factor tratamiento a cualquier variable de inters para el experimentador cuyo posibleefecto sobre la respuesta se quiere estudiar. Los niveles de un factortratamiento son los tipos o grados especficos del factor que se tendrn encuenta en la realizacin del experimento. Los factores tratamiento pueden ser cualitativoso cuantitativos. Ejemplos de factores cualitativosy sus niveles respectivos son los siguientes: proveedor (diferentes proveedores de una materia prima), tipo de mquina (diferentes tipos o marcas de mquinas), trabajador (los trabajadores encargados de hacer unatarea), tipo de procesador (los procesadores de los que se quierecomparar su velocidad de ejecucin), un aditivo qumico (diferentes tipos de aditivos qumicos), el sexo (hombre y mujer), un mtodo de enseanza (un nmero determinado de mtodosde enseanza cuyos resultados se quieren comparar). Ejemplos de factores cuantitativosson los siguientes:

tamao de memoria (diferentes tamaos de memoria deordenadores), droga (distintas cantidades de la droga), la temperatura (conjuntos de temperaturas seleccionadas enunos rangos de inters). Debe tenerse en cuenta que en el tratamiento matemtico delos modelos de diseo de experimento los factores cuantitativos son tratadoscomo cualitativos y sus niveles son elegidos equiespaciados o se codifican. Porlo general, un factor no suele tener ms de cuatro niveles. Cuando en un experimento se trabaja con ms de un factor, se denomina: Tratamiento a cada una delas combinaciones de niveles de los distintos factores. Observacin es una medidaen las condiciones determinadas por uno de los tratamientos. Experimento factorial esel diseo de experimentos en que existen observaciones de todos los posiblestratamientos. (ii) Unidades experimentales. Son el material dondeevaluar la variable respuesta y al que se le aplican los distintos niveles delos factores tratamiento. Ejemplos de unidades experimentales son: en informtica, ordenadores, pginas web, buscadores deinternet, en agricultura, parcelas de tierra, en medicina, individuos humanos u animales, en industria, lotes de material, trabajadores, mquinas. Cuando un experimento se ejecuta sobre un perodo de tiempode modo que las observaciones se recogen secuencialmente en instantes de tiempodeterminados, entonces los propios instantes de tiempo pueden considerarseunidades experimentales. Es muy importante que las unidades experimentales seanrepresentativas de la poblacin sobre la que se han fijado los objetivos delestudio. Por ejemplo, si se utilizan los estudiantes universitarios de un pascomo unidades experimentales,

las conclusiones del experimento no sonextrapolables a toda la poblacin adulta del pas. (iii) Factores nuisance:bloques, factores ruido y covariables. En cualquier experimento, adems de los factores tratamientocuyo efecto sobre la respuesta se quiere evaluar, tambin influyen otrosfactores, de escaso inters en el estudio, pero cuya influencia sobre larespuesta puede aumentar significativamente la variabilidad no planificada. Conel fin de controlar esta influencia pueden incluirse en el diseo nuevosfactores que, atendiendo a su naturaleza, pueden ser de diversos tipos. Factor bloque. En algunoscasos el factor nuisance puede ser fijado en distintos niveles, de modo que esposible controlar su efecto a esos niveles. Entonces la forma de actuar esmantener constante el nivel del factor para un grupo de unidades experimentales,se cambia a otro nivel para otro grupo y as sucesivamente. Estos factores sedenominan factores de bloqueo(factores-bloque) y las unidades experimentales evaluadas en un mismonivel del bloqueo se dice que pertenecen al mismo bloque.Incluso cuando el factor nuisance no es medible, a veces es posible agrupar lasunidades experimentales en bloques de unidades similares: parcelas de tierracontiguas o perodos de tiempo prximos probablemente conduzcan a unidadesexperimentales ms parecidas que parcelas o perodos distantes. Desde un punto de vista matemtico el tratamiento que se hacede los factores-bloque es el mismo que el de los factores-tratamiento en los queno hay interaccin, pero su concepto dentro del modelo de diseo deexperimentos es diferente. Un factor-tratamiento es un factor en el que se estinteresado en conocer su influencia en la variable respuesta y un factor-bloquees un factor en el que no se est interesado en conocer su influencia pero seincorpora al diseo del experimento para disminuir la variabilidad residuas delmodelo. Covariable. Si el factornuisance es una propiedad cuantitativa de las unidades experimentales que puedeser medida antes de realizar el experimento (el tamao de un fichero informtico,la presin sangunea de un paciente en un experimento mdico o la acidez deuna parcela de tierra en un experimento agrcola). El factor se denomina covariabley juega un papel importante en el anlisis estadstico. Ruido. Si elexperimentador est interesado en la variabilidad de la respuesta cuando semodifican las condiciones experimentales, entonces los factores nuisance sonincluidos deliberadamente en el experimento y no se aisla su efecto por medio debloques. Se habla entonces de factores ruido. En resumen, las posibles fuentes de variacin de unexperimento son:

Fuente Debida a las condiciones de inters (Factores tratamiento) Debida al resto de condiciones controladas (Factores nuisance) Debida a condiciones no controladas (error de medida, material experimental, ...)

Tipo Planificada y sistemtica Planificada y sistemtica No planificada, perosistemtica?

3.- Elegir una regla deasignacin de las unidades experimentales a las condiciones deestudio (tratamientos). La regla de asignacin odiseo experimental especifica que unidades experimentales se observarnbajo cada tratamiento. Hay diferentes posibilidades: diseo factorial o no, anidamiento, asignacin al azar en determinados nivelesde observacin, el orden de asignacin, etc. En la prctica, existen una serie de diseos estndar quese utilizan en la mayora de los casos.

4.- Especificar las medidas quese realizarn (la respuesta), el procedimiento experimentaly anticiparse a las posibles dificultades. Variable respuesta o variable deinters. Los datos que se recogen en un experimento son medidas de unavariable denominada variable respuesta o variable de inters. Es importante precisar de antemano cul es la variablerespuesta y en qu unidades se mide. Naturalmente, la respuesta estcondicionada por los objetivos del experimento. Por ejemplo, si se deseadetectar una diferencia de 0'05gramos en la respuesta de dos tratamientos no es apropiado tomar medidascon una precisin prxima al gramo.

A menudo aparecen dificultades imprevistas en la toma dedatos. Es conveniente anticiparse a estos imprevistos pensando detenidamente enlos problemas que se pueden presentar o ejecutando un pequeo experimentopiloto (etapa 5). Enumerar estos problemas permite en ocasiones descubrir nuevasfuentes de variacin o simplificar el procedimiento experimental antes decomenzar. Tambin se debe especificar con claridad la forma en que serealizarn las mediciones: instrumentos de medida, tiempo en el que se harnlas mediciones, etc.

5.- Ejecutar un experimentopiloto. Un experimento piloto es un experimento que utiliza un nmeropequeo de observaciones. El objetivo de su ejecucin es ayudar a completar ychequear la lista de acciones a realizar. Las ventajas que proporciona larealizacin de un pequeo experimento piloto son las siguientes: permite practicar la tcnica experimental elegida eidentificar problemas no esperados en el proceso de recogida de datos, si el expeerimento piloto tiene un tamao suficientementegrande puede ayudar a seleccionar un modelo adecuado al experimento principal, los errores experimentales observados en el experimentopiloto pueden ayudar a calcular el nmero de observaciones que se precisan enel experimento principal.

6.- Especificar el modelo. El modelo matemtico especificado debe indicar la relacinque se supone que existe entre la variable respuesta y las principales fuentesde variacin identificadas en el paso 2. Es fundamental que el modelo elegidose ajuste a la realidad con la mayor precisin posible. El modelo ms habitual es el modelo lineal:

En este modelo la respuesta viene dada por una combinacinlineal de trminos que representan las principales fuentes de variacinplanificada ms un trmino residual debido a las fuentes de variacin noplanificada. Los modelos que se estudian en este texto se ajustan a esta formageneral. El experimento piloto puede ayudar a comprobar si el modelo se ajustarazonablemente bien a la realidad. Los modelos de diseo de experimentos, segn sean losfactores includos en el mismo, se pueden clasificar en: modelo de efectosfijos, modelo de efectos aleatorios y modelos mixtos. A continuacin seprecisan estas definiciones. Factor de efectos fijos esun factor en el que los niveles han sido seleccionados por el experimentador. Esapropiado cuando el inters se centra en comparar el efecto sobre la respuestade esos niveles especficos. Ejemplo: un empresario est interesado en comparar elrendimiento de tres mquinas del mismo tipo que tiene en su empresa. Factor de efectos aleatorios esun factor del que slo se incluyen en el experimento una muestra aleatoriasimple de todos los posibles niveles del mismo. Evidentemente se utilizan estosfactores cuando tienen un nmero muy grande de niveles y no es razonable oposible trabajar con todos ellos. En este caso se est interesado en examinarla variabilidad de la respuesta debida a la poblacin entera de niveles delfactor. Ejemplo: una cadena de hipermercados que tiene en plantilla300 trabajadores de caja est interesada en estudiar la influencia del factortrabajador en la variable tiempo en el cobro a un cliente. Modelo de efectos fijos esun modelo en el que todos los factores son factores de efectos fijos. Modelo de efectos aleatorios esun modelo en el que todos los factores son factores de efectos aleatorios. Modelo mixto es un modeloen el que hay factores de efectos fijos y factores de efectos aleatorios.

7.- Esquematizar los pasos delanlisis estadstico. El anlisis estadstico a realizar depende de: los objetivos indicados en el paso 1,

el diseo seleccionado en el paso 3, el modelo asociado que se especific en elpaso 5. Se deben esquematizar los pasos del anlisis a realizar quedeben incluir: estimaciones que hay que calcular, contrastes a realizar, intervalos de confianza que se calcularn diagnosis y crtica del grado de ajuste delmodelo a la realidad.

8.- Determinar el tamaomuestral. Calcular el nmero de observaciones que se deben tomar paraalcanzar los objetivos del experimento. Existen, dependiendo del modelo, algunas frmulas paradeterminar este tamao. Todas ellas sin embargo requieren el conocimiento deltamao de la variabilidad no planificada (no sistemtica y sistemtica, si esel caso) y estimarlo a priori no es fcil, siendo aconsejable sobreestimarla.Normalmente se estima a partir del experimento piloto y en base a experienciasprevias en trabajos con diseos experimentales semejantes.

9.- Revisar las decisionesanteriores. Modificar si es necesario. De todas las etapas enumeradas, el proceso de recogida dedatos suele ser la tarea que mayor tiempo consume, pero es importante realizaruna planificacin previa, detallando los pasos anteriores, lo que garantizarque los datos sean utilizados de la forma ms eficiente posible. Es fundamental tener en cuenta que Ningn mtodo de anlisis estadstico, por sofisticado que sea, permite extraer conclusiones correctas en un diseo de experimentos mal planificado. Recprocamente, debe quedar claro que el anlisis estadsticoes una etapa ms que est completamente integrado en el proceso de planificacin.

El anlisis estadstico no es un segundo paso independiente de la tarea de planificacin. Es necesario comprender la totalidad de objetivos propuestos antes de comenzar con el anlisis. Si no se hace as, tratar que el experimento responda a otras cuestiones a posteriori puede ser (lo ser casi siempre) imposible. Pero no slo los objetivos estn presentes al inicio del anlisissino tambin la tcnica experimental empleada. Una regla de oro en laexperimentacin y que debe utilizarse es la siguiente: No invertir nunca todo el presupuesto en un primer conjunto de experimentos y utilizar en su diseo toda la informacin previa disponible. Finalmente indicar que todas las personas que trabajan en elexperimento se deben implicar en el mismo, esto es: Toda persona implicada en la ejecucin del experimento y en la recoleccin de los datos debe ser informada con precisin de la estrategia experimental diseada.

.4 Resumen de los pricipales conceptos.


En esta seccin se hace un resumen de la terminologa comnutilizada en la teora de los modelos de diseo de experimentos: Unidad experimental: son los objetos, individuos, intervalos de espacio o tiempo sobre los que se experimenta. Variable de inters o respuesta: es la variable que se desea estudiar y controlar su variabilidad. Factor: son las variables independientes que pueden influir en la variabilidad de la variable de inters. Factor tratamiento: es un factor del que interesa conocer su influencia en la respuesta. Factor bloque: es un factor en el que no se est interesado en conocer su influencia en la respuesta pero se supone que sta existe y se quiere controlar para disminuir la variabilidad residual. Niveles: cada uno de los resultados de un factor. Segn sean elegidos por el experimentador o elegidos al azar de una amplia poblacin se denominan factores de efectos fijos o factores de efectos aleatorios. Tratamiento: es una combinacin especfica de los niveles de los factores en estudio. Son, por tanto, las condiciones experimentales que se desean comparar en el experimento. En un diseo con un nico factor son los distintos niveles del factor y en un diseo con varios factores son las distintas combinaciones de niveles de los factores. Observacin experimental: es cada medicin de la variable respuesta. Tamao del Experimento: es el nmero total de observaciones recogidas en el

diseo. Interaccin de factores: existe interaccin entre dos factores FI y FJ si el efecto de algn nivel de FI cambia al cambiar de nivel en FJ. Esta definicin puede hacerse de forma simtrica y se puede generalizar a interacciones de orden tres o superior. Ortogonalidad de factores: dos factores FI y FJ con I y J niveles, respectivamente, son ortogonales si en cada nivel i de FI el nmero de observaciones de los J niveles de FJ estn en las mismas proporciones. Esta propiedad permite separar los efectos simples de los factores en estudio. Diseo equilibrado o balanceado: es el diseo en el que todos los tratamientos son asignados a un nmero igual de unidades experimentales.

2.5 Principios bsicos en el diseo de experimentos.


Al planificar un experimento hay tres tres principios bsicosque se deben tener siempre en cuenta: El principio dealeatorizacin. El bloqueo. La factorizacin del diseo. Los dos primeros (aleatorizar y bloquear) son estrategiaseficientes para asignar los tratamientos a las unidades experimentales sinpreocuparse de qu tratamientos considerar. Por el contrario, la factorizacindel diseo define una estrategia eficiente para elegir los tratamientos sinconsiderar en absoluto como asignarlos despus a las unidades experimentales. Aleatorizar Aleatorizar todos los factores no controlados por el experimentador en el diseo experimental y que puden influir en los resultados sern asignados al azar a las unidades experimentales. Ventajas de aleatorizar los factores no controlados: Transforma lavariabilidad sistemtica no planificada en variabilidad no planificada o ruidoaleatorio. Dicho de otra forma, aleatorizar previene contra la introduccin desesgos en el experimento. Evita la dependenciaentre observaciones al aleatorizar los instantes de recogida muestral. Valida muchos de losprocedimientos estadsticos ms comunes.

Bloquear Se deben dividir o particionar las unidades experimentales en grupos llamados bloques de modo que las observaciones realizadas en cada bloque se realicen bajo condiciones experimentales lo ms parecidas posibles. A diferencia de lo que ocurre con los factores tratamiento, el experimentador no est interesado en investigar las posibles diferencias de la respuesta entre los niveles de los factores bloque. Bloquear es una buena estrategia siempre y cuando sea posibledividir las unidades experimentales en grupos de unidades similares. La ventaja de bloquear un factor que se supone que tienen unaclara influencia en la respuesta pero en el que no se est interesado, es lasiguiente: Convierte lavariabilidad sistemtica no planificada en variabilidad sistemticaplanificada. Con el siguiente ejemplo se trata de indicar la diferenciaentre las estrategias de aleatorizar y de bloquear en un experimento. Ejemplo 2.1. Se desea investigar las posibles diferencias en la produccinde dos mquinas, cada una de las cuales debe ser manejada por un operario. En el planteamiento de este problema la variable respuesta esla produccin de una mquina (en un da),el factor-tratamiento en el que se est interesado es el tipode mquina que tiene dos niveles y un factor nuisance es el operarioque maneja la mquina. En el diseo del experimento para realizar elestudio se pueden utilizar dos estrategias para controlar el factor operarioque maneja la mquina. Aleatorizar: seseleccionan al azar dos grupos de operarios y se asigna al azar cada grupode operarios a cada una de las dos mquinas. Finalmente se evala la produccinde las mismas. Bloquear: se introduce elfactor-bloque operario. Se eligeun nico grupo de operarios y todos ellos utilizan las dos mquinas. Qu consideraciones se deben tener en cuenta al utilizarestas dos estrategias? Qu estrategia es mejor? La factorizacin del diseo.

Un diseo factorial es una estrategia experimental que consiste en cruzar los niveles de todos los factores tratamiento en todas las combinaciones posibles. Ventajas de utilizar los diseos factoriales: Permiten detectar la existencia de efectos interaccin entre los diferentes factores tratamiento. Es una estrategia ms eficiente que la estrategia clsica de examinar la influencia de un factor manteniendo constantes el resto de los factores.

2.6 Algunos diseos experimentales clsicos.


Un diseo experimental es una regla quedetermina la asignacin de las unidades experimentales a los tratamientos.Aunque los experimentos difieren unos de otros en muchos aspectos, existen diseosestndar que se utilizan con mucha frecuencia. Algunos de los ms utilizadosson los siguientes:
2.6.1 Diseo completamente aleatorizado.

El experimentador asigna las unidades experimentales a lostratamientos al azar. La nica restriccin es el nmero de observaciones quese toman en cada tratamiento. De hecho si nies el nmero de observaciones en el isimotratamiento, i =1,...,I, entonces, los valores n1,n2,...,nIdeterminan por completo las propiedades estadsticas del diseo. Naturalmente,este tipo de diseo se utiliza en experimentos que no incluyen factores bloque. El modelo matemtico de este diseo tiene la forma:

2.6.2 Diseo en bloques o con un factor bloque.

En este diseo el experimentador agrupa las unidadesexperimentales en bloques, a continuacin determina la distribucin de lostratamientos en cada bloque y, por ltimo, asigna al azar las unidadesexperimentales a los tratamientos dentro de cada bloque. En el anlisis estadstico de un diseo en bloques, stosse tratan como los niveles de un nico factor de bloqueo, aunque en realidadpuedan venir definidos por la combinacin de niveles de ms de un factornuisance. El modelo matemtico de este diseo es:

El diseo en bloques ms simple es el denominado diseoen bloques completos, en el que cada tratamiento se observa el mismo nmerode veces en cada bloque. El diseo en bloques completos con una nica observacinpor cada tratamiento se denomina diseo en bloquescompletamente aleatorizado o, simplemente, diseoen bloques aleatorizado. Cuando el tamao del bloque es inferior al nmero detratamientos no es posible observar la totalidad de tratamientos en cada bloquey se habla entonces de diseo en bloques incompletos.
2.6.3 Diseos con dos o ms factores bloque.

En ocasiones hay dos (o ms) fuentes de variacin losuficientemente importantes como para ser designadas factores de bloqueo. En talcaso, ambos factores bloque pueden ser cruzados oanidados. Los factores bloque estn cruzadoscuando existen unidades experimentales en todas las combinacionesposibles de los niveles de los factores bloques. Diseo con factores bloquecruzados. Tambin denominado diseofilacolumna, se caracteriza porqueexisten unidades experimentales en todas las celdas(intersecciones de fila y columna). El modelo matemtico de este diseo es:

Los factores bloque estn anidadossi cada nivel particular de uno de los factores bloque ocurre en un niconivel del otro factor bloque. Diseo con factores bloqueanidados o jerarquizados. Dos factores bloque se dicen anidados cuandoobservaciones pertenecientes a dos niveles distintos de un factor bloque estnautomticamente en dos niveles distintos del segundo factor bloque.

En la siguientetabla puede observarse la diferencia entre ambos tipos de bloqueo.

Bloques Cruzados Bloque 1 1 1 Bloqu e2 2 3


* *

Bloques Anidados Bloque 1

2
* *

3
* *

1 1 2 3 Bloqu e2 4 5 6 7 8 9
* *

* *

* * * * *

Tabla 2.1: Plan esquemtico de experimentos con dosfactores bloque

2.6.4 Diseoscon dos o ms factores.

En algunas ocasiones se est interesado en estudiar lainfluencia de dos (o ms) factores tratamiento, para ello se hace un diseo defilas por columnas. En este modelo es importante estudiar la posible interaccinentre los dos factores. Si en cada casilla se tiene una nica observacin noes posible estudiar la interaccin entre los dos factores, para hacerlo hay quereplicar el modelo, esto es, obtener k observacionesen cada casilla, donde k es el nmero de rplicas. El modelo matemtico de este diseo es:

Generalizar los diseos completos a ms de dos factores esrelativamente sencillo desde un punto de vista matemtico, pero en su aspectoprctico tiene el inconveniente de que al aumentar el nmero de factoresaumenta muy rpidamente el nmero de observaciones necesario para estimar elmodelo. En la prctica es muy raro utilizar diseos completos con ms defactores. Un camino alternativo es utilizar fraccionesfactoriales que son diseos en los que se supone que muchas de lasinteracciones son nulas, esto permite estudiar el efecto de un nmero elevadode factores con un nmero relativamente pequeo de pruebas. Por ejemplo, eldiseo en cuadrado latino, en el que sesupone que todas las interacciones son nulas, permite estudiar tres factores de kniveles con solo k2observaciones. Si se utilizase el diseo equilibrado completo se necesitan k3observaciones.
2.6.5 Diseosfactoriales a dos niveles.

En el estudio sobre la mejora de procesos industriales(control de calidad) es usual trabajar en problemas en los que hay muchosfactores que pueden influir en la variable de inters. La utilizacin deexperimentos completos en estos problemas tiene el gran inconveniente denecesitar un nmero elevado de observaciones, adems puede ser una estrategiaineficaz porque, por lo general, muchos de los factores en estudio no soninfluyentes y mucha informacin recogida no es relevante. En este caso unaestrategia mejor es utilizar una tcnica secuencial donde se comienza portrabajar con unos pocos factores y segn los resultados que se obtienen seeligen los factores a estudiar en la segunda etapa. Los diseos factoriales 2kson diseos en los que se trabaja con k factores,todos ellos con dos niveles (se suelen denotar + y-). Estos diseos son adecuados para tratarel tipo de problemas descritos porque permiten trabajar con un nmero elevadode factores y son vlidos para estrategias secuenciales. Si k es grande, el nmerode observaciones que necesita un diseo factorial 2kes muy grande (n =2k). Por este motivo, las fraccionesfactoriales 2k-p sonmuy utilizadas, stas son diseos con k factoresa dos niveles, que mantienen la propiedad de ortogonalidad de los factores ydonde se suponen nulas las interacciones de orden alto (se confunden con losefectos simples) por lo que para su estudio solo se necesitan 2k-p observaciones(cuanto mayor sea p menor nmero deobservaciones se necesita pero mayor confusin de efectos se supone). En los ltimos aos Taguchi ha propuesto la utilizacin defracciones factoriales con factores a tres niveles en problemas de control decalidad industrial.

Captulo 3 Diseos con una fuente de variacin. 3.1 Introduccin. 3.2 Modelo matemtico del diseocompletamente aleatorizado. 3.3 Estimacin de losparmetros. 3.3.1 Estimadores pormxima-verosimilitud. 3.3.2 Estimadores pormnimo-cuadrticos. 3.3.3 Estimacin puntual dela varianza. 3.4 Anlisis de lavarianza de una va. 3.4.1 Idea general. 3.4.2 Descomposicin de lavariabilidad. 3.5 Inferencia de losparmetros del modelo. 3.5.1 Intervalos de confianza de losparmetros. 3.5.2 Concepto de contraste. 3.5.3 Contrastes mltiples. 3.6 Anlisis de un caso de diseo con un factor fijo 3.7 Efectos aleatorios. 3.7.1 El modelo matemticode un factor aleatorio. 3.7.2 Contraste de varianza nula de los efectos tratamiento. 3.7.3 Anlisis de un caso de diseo con un factor aleatorio.

.1 Introduccin.
Como ya se indic en el captulo previo el diseo deexperimentos estudia la forma de realizar comparaciones lo ms homogneasposibles que permitan detectar cambios en el proceso de inters e identificarlos factores influyentes. En este contexto el problema ms sencillo que se puedepresentar es el de detectar la influencia de un factor que tiene dos niveles enuna variable de inters (diseo de experimentos con un factor a dos niveles).Este problema es exactamente el mismo que el problema de compararlas medias de dos poblaciones. Problemaque bajo la hiptesis de normalidad de las poblaciones se resuelve por elcontraste de la t. La generalizacin deeste problema es contrastar la igualdad de las medias de los I niveles de un factor, esto es, estudiar la influencia de un factorcon I niveles en la variable de inters. Para resolver este problema se utiliza la tcnica del AnlisisDE la VArianza: ADEVA (en ingls,ANalysis Of VAriance: ANOVA) introducida porR. A. Fisher en los aos treinta. El anlisis de la varianza es la herramientafundamental para el estudio de una variable de inters a partir deobservaciones que dependen de varios factores.

El ANOVA es la herramienta bsica para el anlisis de los modelosestadsticosde Diseo de Experimentos yRegresin Lineal,porquepermite descomponer la variablidad de unexperimento en componentesindependientes que pueden asignarse a diferentescausas.

En este captulo se estudia el diseo de experimentos mssimple: el diseo completamente aleatorizado.Este modelo de diseo tiene un nico factor con I niveles y las unidades experimentales se asignan al azar a lostratamientos. En este modelo los tratamientos son los niveles del factor y no seincluyen factores bloque. Un procedimiento sencillo para aleatorizar un diseocompletamente aleatorizado es el siguiente: se denota ni: el nmero de observaciones que recibirn el i-simotratamiento, I: el nmerototal de tratamientos, n=
I i = 1 ni:

el nmero total de observaciones.

Se codifican los tratamientos de 1a I y se etiquetan las unidadesexperimentales de 1 a n.Se siguen los siguientes pasos: Paso 1: Crear una columna con n1 unos, n2 doses,...., nIIes; los valores de esta columna representan a los tratamientos. Paso 2: Crear una segunda columna con n nmeros aleatorios (uniformes en [0,1]) con dgitos suficientes para evitar empates. Paso 3: Reordenar simultnemente ambas columnas de modo que los nmeros aleatorios se ordenen en forma ascendente. De esta forma se consigue que las etiquetas de los tratamientos estn en orden aleatorio. Paso 4: Asignar la unidad experimental t al tratamiento cuya etiqueta est en la fila t.

.2 Modelo matemtico del diseo completamentealeatorizado.


Se denota

Yit : la variable aleatoria querepresenta el valor de la respuesta en la tsima observacin del i-simo tratamiento. Enadelante se utilizar la notacin Y it para referise a la variable e yit para referirse a unaobservacin concreta. i:la respuesta real del i-simo tratamiento. Esdecir, a la respuesta que se obtendra siempre con el i-simo tratamiento si seejecutase el experimento en, exactamente, las mismas condiciones. it : la variable aleatoria querepresenta la distancia de la t-sima observacindel i-simo tratamiento a su valor real. Por tanto it agrupa la contribucin delas fuentes de variacin menores y no planificadas. Esta variable se denomina error o errorexperimental. Para cada t= 1,...,ni, i= 1,...,I, el modelo matemtico deldiseo es:

(3.1) Si en este modelo se denota

seobtiene la siguiente forma alternativa del modelo

(3.2) es una constanteque representa la respuesta media de la variable Y, y i representa la variacin (positiva o negativa) dela media del nivel i respecto a la media de la respuesta: i = i- .Los parmetros ise llaman efectos. Examinar las diferencias entre niveles equivale a examinar las diferenciasentre los parmetros ien el modelo (1.1) o entre los parmetros ien el modelo (1.2):

Si se utiliza el segundo modelo, se exige lacondicin:

(3.3)

Si hay el mismo nmero de datos en cada nivel condicin es

, esta

(3.4) El modelo (3.1) es un modelo lineal. En su estudio se suponen lassiguientes hiptesis: 1. La varianza es de la respuesta es constante (homocedasticidad),

equivalentemente, V ar

, j = 1,...,ni, i = 1,...,I.

2. La distribucin de la respuesta es normal,

equivalentemente,

ij

~N

, j = 1,...,ni, i = 1,...,I.

3. Las observaciones Yij son independientes. Bajo las hiptesis de normalidad, esto equivale a que Cov(Yij,Ykh) = 0, si i k o j h. En funcin de los errores esta hiptesis es los que bajo normalidad, equivale a que Cov En resumen,
ij

son independientes, = 0, si i k o j h.

El siguiente ejemplo ayuda a entender el modelo de diseo deexperimentos completamente aleatorizado. Ejemplo 3.1. Una empresa desea estudiar la productividad media por horaen el montaje de un mecanismo electrnico en las tres fbricas que tiene: FA,FB y FC. Para ello se ha tomado una muestra de la productividad por hora en cadafbrica. La recogida de datos se ha aleatorizado y nada presupone que existanfactores con

influencia en los resultados obtenidos. (Este ejemplo se desarrolla en la seccin 3.6.) Planteamiento del problema. Se est interesado en saber si en la variable de inters influye el factoren estudio. Esto es, se quiere contrastar si la media de la productividad de montaje es la misma en las tres fbricas. Variable de inters: productividad media por hora en el montaje de un mecanismo electrnico. Factor: fbrica en la que se realiza el montaje. El factor en estudio tiene tres niveles:FA, FB, FC. Hiptesis del estudio: Las tres muestras son muestras aleatorias simples de las correspondientes poblaciones. La productividad de las tres fbricas siguen una distribucin normal. La productividad de las tres fbricas tienen la misma varianza.

3.3 Estimacin de los parmetros.


En el modelo matemtico(3.1) hay I + 1parmetros a estimar:

Anlogamente, en el modelo (3.2) hay I + 1parmetros a estimar:

el parmetro

se deduce de la condicin (3.3).

Los parmetros del modelo se estiman porel mtodo de mxima-verosimilitud que bajo lahiptesis de normalidad es equivalente a obtenerlos por elmtodo de mnimos cuadrados.
3.3.1 Estimadores por mxima-verosimilitud.

De la hiptesis denormalidad se sigue que

i,j

La funcin deverosimilitud es

Tomandologaritmos neperianos se obtiene la funcin soporte

para obtener elmximo de la funcin L 2 y se iguala a cero, de dondese obtienen proporciona lossiguientes estimadores:

se deriva la misma respecto a i y ecuaciones, cuya resolucin

(3.5)

(3.6)

donde si2es la varianza de los resultados del nivel i,

En la prctica el estimador

2 MV

no se sueleutilizar porque es sesgado

3.3.2 Estimadores por mnimo-cuadrticos.

Un mtodo alternativo deestimacin de los parmetros es el mtodo de estimacin mnimo cuadrtica, que consiste enseleccionar como estimadores los valores de los parmetrosque minimizan la suma de los cuadrados de los errores. Esto es, setrata de seleccionar valores 1,..., I queminimicen la siguiente funcin de I variables:

por tanto se quiere calcular

,...,

tales que

El problema de minimizacin anteriorconduce a un sistema de Iecuaciones (denominadas ecuaciones normales) cuyassoluciones nicas son para cada i= + i,

(3.7)

Por tanto, los estimadores que se utilizarn son los siguientes (3.8)

Si se utiliza el modelo (3.2), los estimadoresson

(3.9)

(3.10) La bondad de los estimadores mnimo-cuadrticos la establece un resultadoclave en los problemas de modelizacin lineal estadstica, el Teoremade Gauss-Markov, segn el cual,

Para todo modelo lineal con errores normales, independientes y varianza comn 2 , los estimadores mnimo-cuadrticos son nicos, insesgados y de varianza mnima. En base a las hiptesis del modelo es fcil deducir que la distribucin de los estimadoresdados (3.8) es lasiguiente

(3.11)

3.3.3 Estimacin puntual de la varianza.

En cualquier modeloestadstico, se denomina residuo a la diferencia entre unvalor observado y el valor previsto por el modelo. Esto es,

(3.12)

En el modelo actual, para todo j =1,...,ni e i = 1,...,Ise tiene: (3.13) con los estimadoresmnimo-cuadrticos dados (3.8).

En el modelo de diseo de experimentos completamentealeatorizado hay n = I i = 1 niresiduos eij.Existen las siguientes I relacionesentre ellos

Por ello se dice que los residuos del modelo tienen n- I gradosde libertad. A partir de los residuos se obtiene la suma de residuos al cuadrado, sumade cuadrados residual ovariabilidad no explicada(scR), dada por

(3.14)

El valor concreto scR es una realizacinparticular de la variable aleatoria SCR (el resultado que se obtiene apartir de la muestra seleccionada)

El valor concreto scR esuna realizacin particular de la variable aleatoria SCR.Esta variable es,

Un sencillo clculo algebraico permite obtener la relacin:

con

la varianza muestral corregida del i-simotratamiento,

Como i2 es un estimador insesgado dela varianza del error esperado de SCR es:

, el valor

Por tanto, un estimador insesgadode

es:

(3.15)

que se denomina, indistintamente, varianza residual o error cuadrtico medio o varianza dentro de los tratamientos.

De las hiptesis delmodelo se deduce que

(3.16)

Intervalos de confianza para los parmetros delmodelo. A partir de la distribucin dada en (3.16) se puede calcular unintervalo de confianza al (1 - )para la varianza 2del modelo. Este intervalo viene dado por:

(3.17)

donde n-I2 es un nmero que verifica que P = ,siendo una variable aleatoria con distribucin chi-cuadrado con n- I gradosde libertad.

El intervalo dado en (3.17) no es simtrico. En algunos casos tambin se utiliza el siguienteintervalo de confianza

Los intervalos de confianza de ise obtienen a partir de la distribucin dada en (3.11). Dado que se desconoce el parmetro 2,de (3.11) y (3.16) se deduce que

(3.18)

Que permite calcular el siguiente intervalo de confianza simtrico de

al (1 -

) (3.19)

donde tn-I es un nmero que verifica que P aleatoria con distribucin t conn - Igrados de libertad.

= ,siendo una variable

S-ar putea să vă placă și