Sunteți pe pagina 1din 14

Universidad Autnoma de Nuevo Len Facultad de Ciencias Qumicas Ingeniero Industrial Administrador

Estadstica aplicada
Ing. Santiago Pruneda Snchez

Resumen 11 Grupo 4

Equipo 1
Frida Alans Alvarado Milly Betancourt de la Garza Alonzo Cant Rodrguez Adriana Garca Daz Julio Lara Cardona

Junio de 2012

Diseo y anlisis de experimentos de un solo factor: Anlisis de varianza La estrategia de la experimentacin Los experimentos son parte natural de la ingeniera y de los procesos de toma de decisiones cientficos. Muchos experimentos de un solo factor requieren la consideracin de ms de dos niveles para este. Existen formas en las que se puede emplear el anlisis de varianza para comparar las medias cuando existen ms de dos niveles para un solo factor. Se estudia la aleatorizacin de las corridas experimentales y el papel tan importantes que tiene este concepto en toda la estrategia de experimentacin, como analizar y disear experimentos con varios factores. Las tcnicas de diseo experimental son tiles para la mejora del rendimiento de los procesos de manufactura, variables controladas tales como temperatura, presin y tasa de abastecimiento. Mediante el empleo de experimentos diseados se puede determinar las variables que dentro del proceso tienen mayor influencia sobre el rendimiento de este. Los resultados pueden conducir a Mejorar el rendimiento del proceso Reducir la variabilidad del proceso y acercarlos a los requerimientos nominales Disminucin del tiempo de diseo y desarrollo Disminucin del costo de la operacin

Los mtodos de diseo de experimentos tambin son tiles en ingeniera de diseo, donde se desarrollan nuevos productos y se mejoran los existentes. Algunas aplicaciones representativas de los experimentos diseados de manera estadstica incluyen Evaluacin y comparacin de configuraciones de diseo bsicas Evaluacin de materiales diferentes Seleccin de parmetros de diseo de modo que el producto funcione bien bajo una gama amplia de condiciones de campo (o para que el diseo sea robusto) Determinacin de los parmetros de diseo importantes del producto que tienen impacto sobre el funcionamiento de este.

El empleo del diseo experimental en el proceso de diseo de ingeniera puede resultar en que los productos son ms fciles de fabricar, productos que tienen un mejor rendimiento y la fiabilidad de campo mejor que su competidores, y los productos que pueden ser diseados, desarrollados y producidos en menos tiempo. Los experimentos diseados se emplean generalmente de forma secuencial. Es decir, el primer experimento con un sistema complejo (quizs un proceso de fabricacin) que tiene muchas variables controlables es a menudo un experimento de diagnostico diseado para determinar qu variables son ms importantes. Experimentos posteriores se utilizan para refinar esta informacin y determinar qu ajustes a estas variables crticas son necesarios para mejorar el proceso. Finalmente, el objetivo del experimentador es la optimizacin, es decir, para determinar qu niveles deben tener las

variables criticas para obtener el mejor desempeo del proceso. Cada experimento consiste en una secuencia de actividades: Conjetura, la hiptesis original que motiva el experimento. Experimento-la prueba realizada para investigar la conjetura. Anlisis: el anlisis estadstico de los datos del experimento. Conclusin: lo que se ha aprendido acerca de la conjetura original de la prueba. A menudo el experimento dar lugar a una conjetura revisada y un nuevo experimento, y as sucesivamente.

Todos los experimentos son experimentos diseados, por desgracia, algunos de ellos estn mal diseados, y como resultado, los recursos valiosos son utilizados de manera ineficaz. Los experimentos diseados estadsticamente permiten la eficiencia y la economa en el proceso experimental, y el uso de mtodos estadsticos en el anlisis de los resultados de brinda objetividad cientfica al obtener conclusiones. Los niveles del factor se denominan como tratamientos, y cada tratamiento seis observaciones o repeticiones. Es importante analizar grficamente los datos de un experimento diseado. Los diagramas de caja indican la variabilidad de las observaciones dentro de un tratamiento (nivel de factor) y la variabilidad entre tratamientos. Anlisis de varianza A veces cada nivel del factor se conoce como tratamiento, un trmino muy general que se remonta a las primeras aplicaciones de la metodologa del diseo experimental en las concias agrcolas. La respuesta para cada uno de los a tratamientos, es una variable aleatoria, se considera el caso en el que existe un nmero igual de observaciones, n, en cada tratamiento.

Modelo estadstico lineal Yij variable aleatoria que denota la (ij)-sima observacin, es un parmetro comn a todos los tratamientos denominados media global, i, es un parmetro asociado con el i-simo tratamiento denominado efecto del i-simo tratamiento, y i es un componente de error aleatorio, el modelo tambin puede escribirse como

Donde i = +i es la medida del i-simo tratamiento. En esta forma del modelo, se observa que cada tratamiento define una poblacin que tiene una medida i, consistente de la medida global

ms un efecto i, que se debe al tratamiento. Aqu se supondr que los errores ij estn distribuidos de manera normal e independiente, con media cero y varianza . Por consiguiente cada tratamiento puede considerarse como una poblacin normal con media i y varianza . La ecuacin es el modelo fundamental para un experimento de un solo factor. Adems, puesto que es necesario que las observaciones se toman en orden aleatorio y que el ambiente (a menudo conocido como unidades experimentales) en el que los tratamientos se utilizan lo ms uniforme posible, este diseo experimental se llama un diseo completamente aleatorizado. Los niveles de factor a en el experimento podra haber sido elegido en dos formas diferentes. En primer lugar, el experimentador podra haber elegido especficamente los a tratamientos. En esta situacin, se desea probar hiptesis acerca de los medios de tratamiento, y las conclusiones no se pueden extender a tratamientos similares que no fueron considerados. Adems, se podra estimar los efectos de los tratamientos. Esto se conoce como los efectos fijos del modelo. Alternativamente, los a tratamientos podra ser una muestra aleatoria de una poblacin ms grande de los tratamientos. En esta situacin, nos gustara ser capaz de extender las conclusiones (que se basan en la muestra de tratamientos) a todos los tratamientos en la poblacin, sean o no fueron considerados explcitamente en el experimento. Aqu los efectos del tratamiento i son variables aleatorias, y conocimiento sobre aquellos investigados tiene relativamente poca importancia. En su lugar, probar las hiptesis sobre la variabilidad de los i y se trata de estimar esta variabilidad. Esto se conoce como modelo de los efectos aleatorios, o los componentes de la varianza. En el modelo de efectos fijos, los efectos de los tratamientos i se define generalmente como desviaciones de la media global de modo que

Sean yi representan el total de las observaciones bajo el i-simo tratamiento y i el promedio de las observaciones bajo el i-simo tratamiento. Del mismo modo, sea y el gran total de todas las observaciones y i representan la media total de todas las observaciones. Expresado matemticamente,

Donde N=an es el nmero total de observaciones. Por lo tanto, el "punto" notacin de subndice implica la sumatoria de los subndices que lo reemplace.

Estamos interesados en probar la igualdad de las medias de los a tratamientos, nos encontramos con que esto es equivalente a probar las hiptesis.

Por lo tanto, si la hiptesis nula es cierta, cada observacin se compone de la media global ms una realizacin de la componente de error aleatorio ij. Esto equivale a decir que todos las N observaciones se han tomado de una distribucin normal con media y la varianza . Por lo tanto, si la hiptesis nula es verdadera, el cambio de los niveles del factor no tiene efecto sobre la respuesta promedio.

El anlisis de varianza divide la variabilidad total de los datos contenidos en muestra en dos componentes. As la prueba de la hiptesis se basa en una comparacin de dos estimaciones independientes de la varianza de la poblacin. La variabilidad total en los datos se describe por la suma total de cuadrados

Valor esperado

Error cuadrtico medio

Si la hiptesis nula es verdadera el cociente

Las formulas para el clculo de las sumas de cuadrados para el anlisis de varianza con muestras del mismo tamao en cada tratamiento son

La suma de cuadrados del error se obtiene por sustraccin y es

Los clculos para este procedimiento de prueba se resumen en forma tubular conocida como tabla de anlisis de varianza. En algunos experimentos unifactoriales, el nmero de observaciones tomadas para cada tratamiento puede ser diferente. En este caso se dice que el diseo no est balanceado. Aun con esto puede emplearse el anlisis de varianza descrito anteriormente, pero es necesario hacer modificaciones a las formulas para suma de cuadrados Las formulas para el clculo de las sumas de cuadrados para el anlisis de varianza con diferentes amaos de muestra n en el tratamiento son

La seleccin de un diseo balanceado tiene dos ventajas importantes. En primer lugar, el anlisis de varianza es relativamente insensible a las pequeas desviaciones de la hiptesis de igualdad de varianzas si el tamao de las muestras son iguales. Este no es el caso de los tamaos de muestra distintos. En segundo lugar, la potencia de la prueba se maximiza si las muestras son de igual tamao. Anlisis residual y verificacin del modelo El anlisis de varianza del modelo supone que las observaciones estn distribuidas de manera normal e independiente, con la misma varianza para cada tratamiento o nivel del factor. Estas suposiciones deben verificarse mediante el examen de los residuos. Un residuo es la diferencia entre una observacin Yij y su valor estimado o ajustado a partir del modelo estadstico bajo estudio, denotado como ij. Para el diseo complementario aleatorizado ij= y cada residuo es eij=Yij- . Esto es, la diferencia entre una observacin y la correspondiente media observada para el tratamiento. La suposicin de normalidad puede verificarse mediante la construccin de una grafica de probabilidad normal de los residuos. Para verificar la suposicin de varianzas iguales para cada nivel del tratamiento, se hace una grafica de los residuos contra los niveles del factor, y se compara la dispersin de los residuos. Tambin es til hacer una grafica de los residuos contra (lo que algunas veces se conoce como valor ajustado); la variabilidad de los residuos no debe depender de ninguna manera del valor de . La aparicin de un patrn en estas graficas,

usualmente sugiere la necesidad de una transformacin, esto es, el anlisis de los datos pero con una mtrica diferente. La suposicin de independencia puede verificarse al hacer una grafica de los residuos contra el tiempo u orden de la corrida en que se realizo el experimento. Un patrn en esta grafica, tal como secuencia de residuos positivos y negativos, pueden indicar que las observaciones no son independientes. Esto sugiere que el tiempo u orden de la corrida es importante, o que existen importantes variables que cambian con el paso del tiempo y que no han sido incluidas en el diseo experimental. Pruebas sobre las medidas de cada tratamiento El anlisis de la varianza indica que la hiptesis nula debe rechazarse. Esto, claro est, implica diferencias entre las medias de los tratamientos, pero no se dice exactamente qu medias son diferentes. Es obvio que en una situacin de este tipo se garantiza la comparacin adicional de las medias de los tratamientos. Los procedimientos para comparar las medias de cada tratamiento en el anlisis de varianza usualmente se conocen como mtodos de comparacin mltiple. Es fcil comparar de manera grafica las medidas de los tratamientos, despus del anlisis de varianza. Supnganse que el factor tiene a niveles y que 1, 2,, son los promedios observados para los niveles de dicho factor. El promedio de cada tratamiento tiene una desviacin estndar , donde es la desviacin estndar de una observacin. Si las medias de todos los tratamientos son iguales, las medias observadas pueden comportarse como si fueran un conjunto de observaciones tomadas al azar de una distribucin normal con media y desviacin estndar Si las medias de todos los tratamientos son iguales, debe existir un punto en esta distribucin que haga obvio el hecho de que los valores fueron tomados de la misma distribucin. Si este no es el caso, entonces los valores de que no parezcan haber sido tomados de esta distribucin estn asociados con tratamientos que producen respuestas promedio diferentes. El nico problema en la lgica es que es desconocida. Sin embargo, puede utilizarse del anlisis de varianza para estimar . Esto implica que debe emplearse una distribucin t en lugar de la normal para hacer la grafica, pero dado que t tiene una apariencia muy similar a la normal, usualmente se obtienen buenos resultados al bosquejar una curva normal. Contrastes ortogonales Es una combinacin lineal de tratamientos llamados contrastes. La suma de los cuadrados de cualquier contraste es

Y tiene un solo grado de libertad. Si el diseo no es balanceado, entonces la comparacin de las medias de los tratamientos requiere que y la ecuacin se convierte en

El contraste se prueba mediante la comparacin de la suma de los cuadrados de este con el error cuadrtico medio. El estadstico resultante tiene una distribucin F, con 1 y N-a grados de libertad. Dos contrastes con coeficientes {ci} y {di} son octagonales si

Y para un diseo no balanceado, si Para a tratamientos, un conjunto de a-1 contrastes ortogonales es la participacin de la suma de los cuadrados debidos a los tratamientos en a-1 sumas de cuadrados independientes con un grado de libertad. Por tanto, las pruebas efectuadas sobre contrastes ortogonales son independientes. Existen muchas maneras de seleccionar los coeficientes de los contrastes ortogonales para un conjunto de tratamientos. Lo usual es que algo en el contexto del experimento es lo que sugiere qu comparaciones son de inters. Los coeficientes de contraste deben escogerse antes de realizar el experimento, porque si estas comparaciones se seleccionan despus de examinar los datos, la mayor parte de los experimentadores puedan construir pruebas que comparen las diferencias grandes observadas en las medias. Estas diferencias grandes pueden deberse a la presencia de efectos reales o algn error aleatorio si los experimentadores siempre escogen las diferencias ms grandes para comparacin, entonces ellos inflan el error de tipo I de la prueba, ya que es probable que en un porcentaje inusualmente grande de las comparaciones seleccionadas, las diferencias observadas se deban a un error

Prueba de rangos mltiples de Duncan. Existen varios procedimientos de prueba para evitar la tasa de errores experimental por pasos. Newman-keuls, Tukey y la prueba de rangos mltiples de Duncan. Para poder aplicar la prueba de Duncan para muestras del mismo tamao, las medias de los a tratamientos se acomodan en orden ascendente y se determina el error estndar de cada media como:

De la tabla de rangos se obtienen los valores p, el paso siguiente es convertir esta serie de rangos en a-1 rangos menos significativos. Despus se prueban los rangos comenzando la ms grande contra la ms pequea, lo que ser como el rango menos significativo, despus la media ms grande contra la segunda ms pequea y as hasta que todas las medias menores se hayan comparado contra la mayor. La prueba de Duncan tiene una tasa de error experimental por pasos mayor que a y por eso es que es la prueba ms poderosa. El modelo de efectos aleatorios Si el experimento selecciona a lazar sus valores se dice que los factores son aleatorios. Dado a que los factores se eligieron de manera aleatoria, las conclusiones sern validas para toda la poblacin de niveles de factor. El modelo estadstico es:

Donde los efectos del tratamiento y los errores son variables aleatorias independientes. La varianza para la respuesta es:

Las varianzas se conocen como componentes de varianza y el modelo de ecuaciones recibe el nombre de modelo de componentes de la varianza o modelo de efectos aleatorios. Para el modelo de efecto aleatorio, no tiene sentido la prueba de hiptesis ya que los resultados son ceros. Resulta ms conveniente aplicarlo directamente a la varianza. Si la varianza es igual a 0 entonces los tratamientos son idnticos, pero si la varianza es mayor a 0 existe variabilidad entre los tratamientos. Esto es. Hiptesis nula: varianza igual a 0 Hiptesis alterna: varianza mayor a 0 Para observar las medias de estos tratamientos debemos desarrollarlas al cuadrado considerando el valor cuadrado como el valor de las medias de los tratamientos.

Tambin deseamos estimar los componentes de la varianza del modelo. El procedimiento que se emplea para estimar las varianzas recibe el nombre de mtodo de anlisis de la varianza. Cuando se igualan las medias de cuadrados esperados y observados en el modelo de efectos aleatorios con clasificacin simple se tiene que:

Diseo aleatorizado por bloques completos Diseo y anlisis estadstico El bloque es el factor indispensable es decir la unidad experimental utilizada. El diseo aleatorizado de bloques es una extensin de la prueba de t pareada para situaciones donde el factor de inters tiene ms de 2 niveles.

El procedimiento general para el diseo experimental con bloques completos consiste en seleccionar b bloques y realizar una rplica completa del experimento en cada uno de ellos. En los modelos de bloques se utiliza un modelo estadstico lineal para las observaciones que es:

Para probar la hiptesis de que los efectos de todos los tratamientos son cero es equivalente a probar la hiptesis de que las medias de los tratamientos son iguales. La cual se define como:

Y puesto que en la sumatoria igualada a cero se tiene que la media del i-simo tratamientos es definida por: i=+ La demostracin de esta identidad se obtiene al desarrollar el miembro izquierdo de la ecuacin de la siguiente manera.

La identidad de la suma de cuadrados puede escribirse de manera simblica como:

Por otra parte los grados de libertad que corresponden a la suma de cuadrados es: Ab-1= (a-1)+ (b-1)+ (a-1) (b-1) Para el diseo aleatorizado por bloques, las medias de cuadrados son:

Puede demostrarse que los valores esperados de esta media de cuadrados son:

Se calcula el coeficiente para probar que la hiptesis es 0:

Pruebas sobre las medias de cada tratamiento. Cuando el anlisis de varianza indica que existe una diferencia entre las medias de los tratamientos, tal vez sea necesario efectuar algunas pruebas adicionales para aislar las diferencias especificas. Para calcular el error estndar de la media de un tratamiento es: Syi=MSe/b Anlisis residuales y verificacin del modelo En cualquier experimento diseado siempre es importante examinar los residuos y verificar si se violan las suposiciones bsicas que puedan invalidar los resultados. Como es usual los residuos del diseo aleatorizado por bloques completos son precisamente la diferencia entre los valores observados y los estimados por ejemplo: ij=Yij-ij Y los valores ajustados son: ij=i.+.j-.. El valor ajustado representa la estimacin de la respuesta promedio cuando el i-simo tratamiento se corre en el j-simo bloque. Diseo aleatorizado por bloques completos con factores aleatorios. Si los tratamientos o bloques son efectos aleatorios, entonces es posible formular la prueba F del anlisis de varianza como:

Si los tratamientos son aleatorios, entonces los efectos de estos se consideran como variables aleatorias distribuidas de manera normal e independiente, y la hiptesis nula se trata como =0. Ho: varianza =0 Ha: varianza mayor a 0 Cuando los bloques y los tratamientos son aleatorios, entonces los efectos del bloque se suponen tambin como valores aleatorios con distribucin normal e independiente. La media y los errores de este tipo son:

Las estimaciones intestadas de los componentes de las varianzas son:

Determinacin del tamao de la muestra en experimentos con un solo factor. En cualquier diseo experimental es importante la seleccin del tamao de la muestra o del numero de replicas a utilizar. Por lo tanto si el experimento conoce la magnitud de la diferencia entre las medias, puede emplear las curvas caractersticas de operacin para determinar el nmero de replicas necesarias para lograr la sensibilidad adecuada. Casos de efectos fijos. Primero se considera la determinacin del tamao de la muestra en un modelo de efectos fijos para el caso en que el tamao de la muestra de cada tratamiento es igual. La potencia (1-B) de las pruebas es:

Para evaluar el planteamiento de probabilidad, es necesario conocer la distribucin que tiene el estadstico de prueba F si la hiptesis nula es falsa. Para evaluar la B definida por la ecuacin, se utilizan caractersticas de operacin dadas en el diagrama con parmetros .

El parmetro est relacionado con el parmetro de no centralidad . Casos de efectos aleatorios. La potencia de la prueba para el modelo de efecto aleatorio es:

Puede demostrarse que la hiptesis alternativa es verdadera (la varianza es mayor a 0) la potencia puede calcularse utilizando la F central, con a-1 y a(n-1) grados de libertad.

La ecuacin es:

S-ar putea să vă placă și