Documente Academic
Documente Profesional
Documente Cultură
Para la Investigación
Experimental
Elías A. Torres Armas Lic. Ms. C.
i
Métodos Estadísticos para la
Investigación Experimental
Elías Alberto Torres Armas, Lic. Ms. C.
Es propiedad del Autor, prohibida la producción total o parcial de esta obra, por
cualquier medio o método, sin autorización del autor.
Dirección postal: Grau 721
Chachapoyas, Amazonas, Perú
e-mail: allpachaki@hotmail.com
Diagramación
Elías A. Torres Armas
Impreso:
Compugraf S.R.L.
RUC. 20479787779
SEVILLANO GAYOSO JOSE LUIS
e-mail: sevillano16@hotmail.com
Jr. Ayacucho N° 1041
Amazonas / Chachapoyas / Chachapoyas
Perú – 2013.
Métodos Estadísticos para la Investigación
Contenido
Páginas
Carátula interior i
Depósito Legal de la Biblioteca Nacional ii
Presentación iii
Tablas Estadísticas iv
Índice vi
Tabla de números aleatorios
1
Tabla Binomial simple
2 -11
Tabla Binomial acumulada
12-21
Tabla Poisson simple
22-26
Tabla Poisson acumulada
27-30
Tabla Normal estandarizada
31-37
Tabla F 10%
38-39
Tabla F 5%
40-41
Tabla F 2.5%
42-43
Tabla F 1%
44-45
Tabla F 0.1%
46-47
Tabla F
48-65
Tabla t-Student
66
Tabla Chi cuadrado
67-68
Tabla Chi cuadrado cola derecha
69-70
Tabla Duncan
71-72
Tabla Tukey
73-74
Tabla Newman Keuls
75-76
Tabla Dunnett
77-80
Prefacio
En verdad, el propósito de este texto es el de ayudar al lector a entender los conceptos, ideas y
funciones de los métodos estadísticos aplicados a problemas de la ingeniería y de la ciencia en
general. Este texto deberá ser también útil para aquellos estudiosos quienes deseen hacer
aplicaciones de métodos estadísticos a problemas de la ingeniería en términos generales, así como
también a la investigación experimental.
Este texto estará diseñado para estudiantes de ingeniería y de la ciencia en general. Es decir, para
aquellos investigadores quienes deseen encontrar, prácticamente, todos los conceptos de la
probabilidad y de la estadística, que les pueda ayudar en el desarrollo de su profesión de
ingeniería, en la investigación o en cualquier otra área de la ciencia en general.
El texto tiene un enfoque de carácter científico, tecnológico centrado en métodos estadísticos
como herramientas útiles para la investigación experimental con repercusión en el desarrollo
económico, cultural y social de la región y del país.
CAPITOLO I
1. Introducción
En la vida diaria cada persona hace alguna observación de acontecimientos ordinarios, como
predicción del tiempo, precios de un producto, costo de vida etc. y compara sus observaciones
actuales con su valor promedio y concluye si su observación actual es habitual (no diferencia
significativa) o no habitual (diferencia significativa); utiliza la estadística con la que valúa
mentalmente su investigación; sin embargo la investigación formal es de importancia
infinitamente mayor y debe conducirse con mayor cuidado; pues, la investigación científica es un
estudio escudriñante o examen, análisis o experimentación crítica y exhaustiva cuya finalidad es el
descubrimiento de nuevos hechos y su correcta interpretación; revisión de conclusiones
aceptadas, teorías o leyes, a la luz de hechos descubiertos recientemente o la aplicación práctica
de tales conclusiones nuevas o revisadas; por consiguientes, la investigación científica es la
búsqueda continuada del conocimiento y entendimiento, compuesta de dos elementos: observación,
por la cual se obtiene el conocimiento de ciertos hechos a través de percepciones sensitivas; el
razonamiento, mediante el cual se determina el significado de esos hechos, su interrelación y su
relación con el acervo existente de conocimientos, en el grado que el presente estado del
conocimiento y la habilidad del investigador lo permiten. Además, la investigación implica que el
investigador esté interesado en generalidades, más que en resultados particulares, que esté
interesado en la reproducción de resultados y en su aplicación a situaciones más complicadas y
generales (Ostle, 1986, pp. 17, 18)
El método científico. Existen más definiciones de método científico que investigadores. Pero
para fines de este texto se usará la siguiente: El método científico es una estrategia para lograr el
ideal de la ciencia que es lograr una interrelación sistemática de hechos, mediante
experimentación, observación, argumentación lógica de los postulados aceptados y una
combinación de los mismos en proporciones variables (Ostle, 1986, pp. 18).
Experimento. Es una prueba o serie de pruebas en las que se hacen cambios deliberados en las
variables de entrada de un proceso o sistema para observar o identificar las razones de los
cambios que pudieran observarse en la respuesta de salida (Montgomery, 2004, pp.1). ¿Qué tipo
de estudio es la investigación experimental? En Sampieri y otros (1998) encontramos 4 tipos de
estudios: Exploratorios, descriptivos, correlacionales, explicativos. Los estudios explicativos
analizan relaciones entre una o más variables independientes, una o más variables dependientes y
los efectos causales de las primeras sobre las segundas. Las investigaciones experimentales se
pueden considerar del tipo explicativo.
Tipos de experimento.
Experimento cualitativo. Es aquel para el cual, las mediciones de las variables respuesta se hacen
en escala nominal u ordinal. Se usa las estadística no paramétrica.
Experimento cuantitativo. Es aquel en que las mediciones se hacen en una escala de razón e
intervalo. Se usa la estadística paramétrica.
Experimentos mixtos. Si algunas variables son cuantitativas y otras cualitativas.
7
Elías Alberto Torres Armas, Lic. Ms. C.
Clases de diseño experimental: Se clasifica según el objetivo del diseño, “estudiar uno o más
factores (variables independientes).
o Parcelas apareadas
o Parcelas no apareadas o grupos sorteados o grupos sorteados (2 tratamientos)
o Diseño completamente al azar (DCA)
o Diseño en bloque completamente al azar (DBCA)
o Diseño cuadrado latino (DCL)
o Diseño cuadrado grecolatino
o Diseño cuadrado modificado
o Etc.
8
Métodos Estadísticos para la Investigación experimental
Cuasi-experimentos, Implican grupos intactos. No cumple con el principio básico del diseño:
No Aleatorización
Pre-experimentos (Tienen grado de control mínimo). Poco o nulo control local. No cumple
con dos principios básicos del diseño: No aleatorización. Medición en dos grupos no
equivalentes, Medición única en un solo grupo
Experimentos puros (verdaderos). Cumple con los tres principios básicos del diseño:
Repetición, Aleatorización, Control Local. Manipulación intencional de las variables
independientes. Medición del efecto en la variable(s) dependientes(s). Control y validez. Dos o
más grupos
Según Hinkelman K. & Kempthorne O. (1994) los pasos lógicos de la experimentación científica
se muestran en el siguiente esquema:
PROBLEMA
FORMULACIÓN DE PREGUNTAS E HIPÓTESIS
ANÁLISIS ESTADISTICO
INTERPRETACIÓN DE RESULTADOS
9
Elías Alberto Torres Armas, Lic. Ms. C.
A. Problema o experimento
a. Exposición del problema
b. Elección de la variable respuesta
c. Selección de factor(es).
d. Elección de niveles: Cuantitativos o cualitativos; fijos o aleatorios.
e. Combinación de niveles (tratamientos)
B. Diseño
a. Tamaño de la muestra: cantidad, variación, diferencia o precisión, riesgo.
b. Aleatorización. Método de aleatorización
c. Modelo matemático
C. Análisis
a. Recolección y procesamiento de datos
b. Cálculos de pruebas estadísticas
c. Interpretación de resultados
d. Conclusiones
En general se usa: Planteamiento del problema, Marco teórico, Metodología, Análisis de datos,
Conclusiones, Recomendaciones.
o Tipo de sustrato
o Tamaños de poda
o Sistema de riego
o Tipos de poda
o Densidad de siembra
o Tipos de herbicidas
o Temperatura
o Tiempo
o Alimentación
o Presentación de un producto
o Sistemas de enseñanza
o Formas de elaborar un producto
o Terapia de una enfermedad.
10
Métodos Estadísticos para la Investigación experimental
Unidad experimental (u.e.). Llamado también “Parcela experimental” en donde se aplican los
tratamientos, en el cual se observan, se miden y se evalúan las variables respuesta (características)
que se investiga. El conjunto de unidades experimentales viene a ser el material experimental,
ejemplo: Una maceta, una planta, un animal, una persona, un árbol, una parcela, un conjunto de
semillas, etc.
AREA DE BORDES
PARCELA UTIL
Dato estadístico. Es el registro numérico, en un momento dado, de cada una de las unidades
experimentales ante la aplicación de los (tratamientos) niveles del factor en estudio. Ejemplo:
Factor: Dosis de nitrógeno. Niveles de factor (tratamentos): N1, N2, N3, … , Nk. Variable
respuesta: Rendimiento en Kg de una variedad de papa. Unidad experimental: Una parcela de 20
m2. Dato estadístico: 18 kg/parcela
11
Elías Alberto Torres Armas, Lic. Ms. C.
o El fenómeno de que se trate, de ser posible, debe aislarse para estudiarse mejor
o El experimento debe repetirse en las mismas circunstancias para probar y medir el error
experimental
o Las condiciones del experimento deben alterarse para investigar de qué grado modifican al
fenómeno.
o El experimento debe durar el tiempo suficiente para que se produzca el fenómeno deseado.
o El error experimental es la variación existente (involuntaria y/o extraña) entre los resultados
de las observaciones, realizados por dos o más unidades experimentales que recibieron el
mismo tratamiento y que por efectos aleatorios (factores no controlables) reportan ciertas
diferencias.
o Es el fracaso de llegar a resultados idénticos con dos o más unidades experimentales tratados
por igual.
a. La variabilidad propia del material experimental al cual se aplican los tratamientos. Ejemplo:
En una población de plantas de papaya, existen diferencias genéticas entre los individuos de
dicha población: Diferencias en tipo de fruto, tamaño de planta, color de fruto, etc.
b. Falta de uniformidad en la conducción física del experimento. Es decir, la deficiencia en poder
uniformizar la técnica experimental. Ejemplo: Heterogeneidad del suelo, error en la medición,
pérdida de la biomasa en la cosecha, etc.
c. Efecto combinado de factores extraños (estos efectos no pudieron ser controladas por el
investigador durante la conducción de experimento).
d. Error de medición y/u observación
12
Métodos Estadísticos para la Investigación experimental
d
Donde:
r: Número de repeticiones
t1: Valor crítico de t-student para grados de libertad γ2 y nivel de significación α1= α
13
Elías Alberto Torres Armas, Lic. Ms. C.
t2: Valor crítico de t-student para grados de libertad γ2 y nivel de significación α2=2(1-P).
2
kS
r 2 2 1
d
Donde:
k: Valor crítico que se puede encontrar en la tabla III-1 del libro de Federer, W. (1955).
“Experimental designs”, New York, The Macmillan Co.
S 2q 2
r F( 2 , 1 )(1 P )
d2
Donde:
q: Valor crítico del rango estudentizado para el nivel α1= α, grados de libertad γ2 y para p
tratamientos.
F: Valor crítico de la distribución F para el nivel de significación α 2=1-P y grados de
libertad γ2 y γ1.
Las tres fórmulas indicadas requieren de un proceso iterativo debido a que los valores de t, k
y F dependen del valor de los grados de libertad γ2 que a su vez dependen del número de
repeticiones r del nuevo experimento. Pues, tenemos que dar un valor supuesto para obtener
el primer estimado, con el cual nuevamente obtenemos otro, y así sucesivamente hasta hallar
el menor valor conveniente de r (Lizarzaburu, 1984).
d
2
10
r 2
t 2 ,0.05 t 2 , 0.20 2
5.5
1 0.05
2 2(1 P) 2(1 0.90) 1(0.10) 0.20
Damos un valor de r supuesto para obtener el primer estimado:
Sea r=6 γ2=(t-1)(r-1)=(5-1)(r-1)
γ2=(t-1)(r-1)=(5-1)(6-1)=20
14
Métodos Estadísticos para la Investigación experimental
Ahora:
2
10
r 2
t 2 ,0.05 t 2 , 0.20
2
5.5
2
10
r 2 t20,0.05 t20,0.20 2
5 .5
t20, 0.05 2.089 tabla t student dos colas
t20, 0.20 1.325 tabla t student dos colas
2
10
r 2 2.089 1.3252 7.69250975
5 .5
r 8
2
10
r 2
t 2 , 0.05 t 2 , 0.20
2
5. 5
2
10
r 2 t 24, 0.05 t 24, 0.20 2
5. 5
t 24, 0.05 2.064 tabla t student dos colas
t 24, 0.20 1.318 tabla t student dos colas
2
10
r 2 2.064 1.3182 7.5622638
5. 5
r 8
Tabla 1.3. Número óptimo de repeticiones
Tratamientos r inicial supuesto glerror t0.05 t0.20 ro
5 2 4 2.776 1.533 12.28
5 3 8 2.306 1.397 9.07
5 4 12 2.179 1.356 8.26
5 5 16 2.12 1.337 7.90
5 6 20 2.086 1.325 7.69
5 7 24 2.064 1.318 7.56
Según Tukey
S 2q 2
r F( 2 , 1 )(1 P )
d2
q: Valor crítico del rango estudentizado para el nivel α1= α, grados de libertad γ2 y para p
tratamientos.
F: Valor crítico de la distribución F para el nivel de significación α 2=1-P y grados de
libertad γ2 y γ1.
Sea r=6 γ2=(t-1)(r-1)=(5-1)(r-1)
γ2=(t-1)(r-1)=(5-1)(6-1)=20
q=4.23 α1= α=0.05 γ2=20 γ1=50
15
Elías Alberto Torres Armas, Lic. Ms. C.
d=5.5 S= 10 P=0.90
F( 2 , 1 )(1 P ) F( 20,50)0.10 1.57
S 2q 2
r F( 2 , 1 )(1 P )
d2
10(4.23) 2
r 1.57 9.28656298 9
5.52
b. Aleatorización.-
c. Control local
Es una representación matemática de las relaciones existentes entre los diversos factores o
componentes considerados en un diseño experimental. Cada fenómeno natural tiene un modelo.
Los modelos más perfeccionados dependen de afirmaciones matemáticas y que estos nos
16
Métodos Estadísticos para la Investigación experimental
permiten explicar un fenómeno. Por ejemplo: Modelo lineal aditivo para un diseño completo al
azar (DCA), es:
Yij i ij
Aditivo: Porque los efectos o componentes que están incluidos en el modelo son aditivos (se
suman), para dar lugar al hecho observado a su valor.
Lineal: Porque sus componentes del modelo están elevados a la potencia uno.
Dependiendo de la forma en que son elegidos los niveles de los factores en estudio, los modelos
son de tres tipos:
Modelo I (Efectos fijos). Se presenta cuando los niveles son fijados por el experimentador.
Ejemplo. Se desea estudiar el efecto de dietas con diferente nivel energético en la ganancia de
peso en terneros de ganado vacuno, este factor es fijo. Las conclusiones del experimento son
solamente válidas para los niveles evaluados.
Modelo II (Efectos aleatorios). Se presenta cuando los niveles son escogidos aleatoriamente
desde una población. Las conclusiones del experimento serán válidas para la población de niveles
del factor. Ejemplo. Si además en el ejemplo anterior, de estudiar el efecto de las dietas, se desea
evaluar el efecto de la condición genética del padrillo en la ganancia de peso de los terneros, este
último es factor aleatorio.
Modelo III (Efectos mixtos). Se presenta cuando se tiene una combinación de los dos modelos
anteriores, es decir; cuando se tiene algunos factores con efectos fijos y algunos con efectos
aleatorios.
Es una técnica estadística que permite descomponer la variabilidad total de los resultados de un
experimento en sus distintas fuentes (tratamientos, interacciones entre factores, covariables, error
experimental), con la finalidad de compararlas e identificar su importancia relativa en la
explicación de la variabilidad total. Se entiende como análisis de varianza a las descomposición
de la variabilidad total que se en los datos en cada una de sus fuentes controladas y no
controladas. El análisis de varianza (ANVA) es una técnica que se puede utilizar para decidir si las
medidas de dos o mas poblaciones (tratamientos) son iguales o no.
- Estimar las diferencias entres los tratamientos que son de interés, de manera que el valor
estimado este lo más cercano posible al valor real.
- Obtener información acerca de la exactitud de los estimadores, lo cual se logra al determinar el
correspondiente error estándar.
- Proveer información necesaria y suficiente para efectuar pruebas de de comparación entre
promedios de tratamientos tal la prueba t-student, etc.
- Estimar los componentes de varianza.
17
Elías Alberto Torres Armas, Lic. Ms. C.
2. Investigación experimental
3. Según Sampieri y otros (1998). La investigación experimental es de 4 tipos ¿Cuáles son?
4. ¿Cuáles son los tipos de experimento?.
5. ¿Cuáles son las características del diseño experimental?.
6. Mencione las clases de diseño experimental según el objetivo del diseño, “estudiar uno o más
factores (variables independientes).
7. Eligiendo una situación práctica de interés en el campo de su especialidad, describa un
problema cuya solución deba ser determinada experimentalmente e indique: Factor(es),
nivel(es) de factor, variable respuesta, unidad experimental.
8. Mencione dos reglas para planear un experimento
9. En qué consiste el error experimental
10. Cuáles son las recomendaciones para realizar control del error experimental
11. ¿Qué se entiende por modelo estadístico?.
12. Dependiendo de la forma en que son elegidos los niveles de los factores en estudio, los
modelos son de tres tipos ¿cuáles son? Indique solamente cuáles son
13. Mencione al menos dos propósitos del análisis de varianza (ANVA)
14. Mediante un ejemplo describa y conceptualice los términos siguientes: Factor, niveles del
factor, tratamiento, testigo (si lo hubiera), unidad experimental, variable respuesta, diseño
experimental y conceptualice cada uno de los principios básicos del diseño experimental.
18
Métodos Estadísticos para la Investigación experimental
1. Utilizar 4 autos y en cada auto colocar las 4 cubiertas con el mismo tratamiento. Es decir, un
tratamiento por auto.
2. Utilizar 4 autos y en cada uno de ellos asignar a la cubierta delantera derecha el tratamiento 1,
a la delantera izquierda el tratamiento 2, a la trasera derecha el tratamiento 3 y a la trasera
izquierda el tratamiento 4.
3. Utilizar 4 autos y en cada uno asignar aleatoriamente un tratamiento a una cubierta.
4. Utilizar 4 autos y en cada uno asignar un tratamiento a una cubierta de modo que todos los
tratamientos estén una vez en cada posición (usando los 4 autos) y los 4 tratamientos estén
presentes en cada auto.
Ejercicio 3. Los tres principios básicos del diseño de experimentos son: replicación,
aleatorización y control de los efectos de variables externas. Considere cada uno de los siguientes
escenarios. ¿Se adhiere cada uno de ellos a todos los principios? En caso de respuesta afirmativa,
describa de qué manera. En caso de respuesta negativa indique cómo cambiaría el diseño para
incorporar el o los principios faltantes.
1. Un químico desea comparar un nuevo método de ensayo más simple con un método estándar.
Prepara una cierta solución y la divide en 40 tubos de ensayo. Aleatoriamente selecciona 20
tubos y le pide a su ayudante técnico que los analice usando el método estándar. Ella por su
parte analiza los restantes 20 usando el método nuevo. Al final los dos grupos de resultados de
estos ensayos serán comparados.
2. Un grupo de estudiantes universitarios cree que un cierto té de hierbas posee un remarcable
poder para levantar el ánimo. Para probar lo que creían realizaron visitas semanales a un hogar
de ancianos, visitando a los residentes y sirviéndoles de este té. El personal del hogar reportó
que luego de varios meses muchos de los residentes estaban más alegres y saludables.
Ejercicio 4. El tamaño final del fruto es un factor determinante de la calidad de los duraznos.
Algunas de las nuevas variedades de duraznero se caracterizan por su abundante fructificación lo
que origina una gran cantidad de frutos de pequeño tamaño con escasa calidad comercial. Una
práctica que puede mejorar el tamaño del fruto es el raleo (eliminación de frutos) químico o
manual. Con el objetivo de evaluar el impacto del raleo sobre el tamaño final de los frutos (peso
medio de fruto en gramos), se realizó el siguiente ensayo: Material experimental: plantas
homogéneas en desarrollo y estado sanitario. Repeticiones: 5 por tratamiento, cada repetición era
una planta y se muestrearon 100 frutos por planta. Tratamientos: un testigo sin ralear
(Tratamiento 1); raleo manual (Tratamiento 2); y raleo químico (Tratamiento 3). Los datos del
experimento se resumen en el siguiente tabla:
Tabla 1.4. Los calibres promedio por planta (mm) en cosecha
Repeticiones
Tratamiento 1 2 3 4 5
1 52.3 53.8 57.3 60.2 61.3
2 70.2 71.8 68.7 67.5 66.2
3 57.8 67.2 63.5 58.4 68.8
Indique: (a) Objetivo del estudio, b) Factor en estudio, (c) Unidad experimental , (d) Variable de
respuesta, e) Escriba el modelo estadístico adecuado para este estudio y explique sus componentes.
19
CAPITOLO II
Sean X1 ,X2, X3, …Xn una muestra aleatoria, seleccionada de una población N(µ 1, σ21) y Sean Y1 ,Y2,
Y3, …Yn una muestra aleatoria, seleccionada de una población N(µ 2, σ22). Supongamos que las
poblaciones son independientes y con medias maestrales: X y Y .
Sean X1 ,X2, X3, …Xn una muestra aleatoria, seleccionada de una población N(µ1, σ21) y Sean Y1 ,Y2,
Y3, ………Yn una muestra aleatoria, seleccionada de una población N(µ2, σ22 ) donde µ1, µ2 , σ21 y
σ22 , son desconocidas. Supongamos que las poblaciones son independientes.
X1 X 2 n1 n2
tc t( v ) g .l . v 2 2
2
S12 S22 S12 S 22
n1 n2 n1 n2
n1 1 n2 1
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
t c > t α(v) t c < - t α(v) |t c | > t α/2(v)
Sean X1 , …Xn una m.a. seleccionada de una población N(µ1 , σ²1) y Y1,…,Yn una muestra
aleatoria tomada de una población N(µ2 , σ²2), de modo que las observaciones están pareadas,
esto es, la muestra está formada por los pares (X1 , Y1) , (X2 , Y2), ………………,(Xn , Yn).
Di D ²
n n
Di D2
D i 1
, S
2 i 1
Asi, D N ( D , )
n 1
D
n n
21
Elías Alberto Torres Armas, Lic. Ms. C.
Tabla 2.5. Comparación de medias de dos poblaciones normales dependientes, muestra pequeña
(n<30)
Pasos Unilateral derecha Unilateral izquierda Bilateral
Hipótesis: Ho: D 0 Ho: D 0 Ho: D 0
Ha: D 0 Ha: D 0 Ha: D 0
Nivel de Significancia α = 0.01 o 0.05. Asocia a tα de la distribución t-student
Estadística de prueba D
tc
SD / n
Decisión Re chazar H 0 Re chazar H 0 Re chazar H 0
Si t c t n1, Si tc tn1, Si t c t
n 1,
2
Tabla 2.6. Comparación de medias de dos poblaciones normales dependientes, muestra grande
(n ≥ 30)
Pasos Unilateral derecha Unilateral izquierda Bilateral
Hipótesis: Ho: D 0 Ho: D 0 Ho: D 0
Ha: D 0 Ha: D 0 Ha: D 0
APLICACIONES
HOMBRES 7 6 8 7 5 6 4 9 9 8
MUJERES 6 5 6 5 4 4 4 6 4 8
a) Se trata de comparar las medias de hombres y de mujeres (6.9 y 5.2, respectivamente) con una
prueba t para muestras independientes (contraste bilateral o de dos colas): el SPSS nos da
t(18)0.05=2.53, p=0.021, luego la respuesta es sí.
b) Igual que en a) sólo cambia aquí que el hecho de que el contraste es ahora unilateral (una cola).
En este caso sólo hay que dividir la p que nos da el programa por 2. Luego quedaría así:
t(18)0.05=2.53, p=0.0105, siendo la respuesta también que sí.
Ejemplo 2. (Quevedo H, 2006. pp.303). En un estudio de la aplicación del pH (potencial
hidrógeno que tiene una escala de 0 a 14, donde 7 es neutral y abajo de 7 es ácido y arriba de 7 es
22
Métodos Estadísticos para la Investigación experimental
Ejemplo 3. (Di Rienzo, 2008. Pp183). Los siguientes resultados se obtuvieron al analizar los
registros de las precipitaciones ocurridas en dos zonas: A y B. Para conocer la precipitación
promedio de cada zona se construyeron los correspondientes intervalos de confianza al 95%.
23
Elías Alberto Torres Armas, Lic. Ms. C.
resultados de los dos equipos de control. Asúmase que el muestreo de selección fue
completamente al azar, sin emparejamiento y asumir que las poblaciones son normales.
Antes de comenzar, tenemos que hacer una decisión sobre cual prueba de t es la más apropiada.
Pudiéramos usar la versión de t para observación pares donde hay un aparejamiento deliberado.
Tal vez pudiéramos usar la función de t que asume que las varianzas de las poblaciones son
iguales y con muestras del mismo tamaño. La tercera opción, sería usar la versión de t para
varianzas desiguales. Sin embargo, si asumimos que se usó el método de selección completamente
aleatorio, sin emparejamiento, y si analizamos a simple vista los datos de la tabla de arriba,
podemos ver que hay mucha variación en las observaciones (se debe hacer una prueba de
hipótesis con el objeto de ver si las varianzas son iguales), lo que nos inclinaría a usar la tercera
opción.
24
Métodos Estadísticos para la Investigación experimental
tc=3.544 t(4)0.05dos colas=2.77Rechazamos Ho Si |tc| > t α/2(v) tc>t(4)0.05dos colas por tanto se
rechaza Ho.
Conclusión: con el equipo adicional, hubo diferencia en las reducciones de contaminantes.
25
CAPÍTULO III
- Es el diseño más simple y aplicable solo cuando las unidades experimentales son
homogéneas.
- Los tiramientos son asignados completamente al azar ( sin restricción en el azar) en las
unidades experimentales o viceversa.
- Los tratamientos pueden tener igual o diferente número de unidades experimentales.
- El número de tratamientos está en función del número de unidades experimentales que se
disponen, es conveniente tener menor número de tratamientos y más unidades
experimentales.
Ventajas
Desventajas
Usos
1. Diseño completamente al azar con una observación por unidad experimental para
cada tratamiento
Métodos Estadísticos para la Investigación experimental
Yij i ij
Análisis de varianza
Hipótesis:
H 0 : i 0 H 0 : i 0
ó
H a : i 0 H a : i 0 ( No todos son iguales )
Tabla 3.1 Cuadro de análisis de varianza para el diseño completo al azar con diferente
número de repeticiones por tratamiento
Fuente de Suma de Grados de Cuadrados Fc
Variación Cuadrados Libertad Medios
Tratamiento SC tratamiento t-1 CM tratamiento CM tratamiento/CME
Error SC error t CME
(ni 1)
i 1
Total SC total t
n
i 1
i 1
27
Elías Alberto Torres Armas, Lic. Ms. C.
r
i 1
i
t r
Y..2
Suma de cuadrados para el total SCtotal Y 2
ij t
i 1 j 1
r
i 1
i
Y 2
i.
Y..2
Suma de cuadrados para tratamientos SCtratamiento i 1
t
r
ri
i
i 1
Ejemplo:
28
Métodos Estadísticos para la Investigación experimental
% Conservante
Repetición 0.01 0.02 0.03 0.04
1 20 17 32 28
2 22 19 30 25
3 26 20 28 23
4 25 - - 26
5 21 - - -
6 23 - - -
Total 137 56 90 102 385
ri 6 3 3 4 16
Yij i ij
Análisis de varianza
H 0 : i 0
H a : i 0 ( No todos son iguales )
Cálculos:
( 385 ) 2
SC total = 202 + 222 + ... 262 - 262.93
16
137 2 562 902 1022 ( 385 ) 2
SC trat = + + + - 210.44
6 3 3 4 16
SC error = SC total - SC trat = 52.49
29
Elías Alberto Torres Armas, Lic. Ms. C.
Observe que Fc>Ft tanto para 5% (F0.05=3.49) como para 1% (F0.01=5.95), lo que
significa que al menos uno de los tratamientos es (*) significativo y/o (**) altamente
significativo
Yij i ij
30
Métodos Estadísticos para la Investigación experimental
2. Linealidad: Las relaciones entre los efectos del modelo son lineales
3. Normalidad: Los errores del modelo deben tener una distribución normal con
media µi y varianza σ2
4. Independencia: Los resultados obtenidos en el experimento son independientes
entre si
5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la
aplicación de los diferentes tratamientos tienen varianzas iguales (σ 2)
Análisis de varianza
Hipótesis:
H 0 : i 0 H 0 : i 0
ó
H a : i 0 H a : i 0 ( No todos son iguales )
Tabla 3.5. Cuadro de análisis de varianza para el diseño completo al azar con igual
número de repeticiones por tratamiento
Fuente de Suma de Grados de Cuadrados Fc
Variación Cuadrados Libertad Medios
Tratamiento SC tratamiento t-1 CM tratamiento CM tratamiento/CME
Error SC error t(r-1) CME
Total SC total rt-1
Y 2
i.
Y..2
Suma de cuadrados para tratamientos SCtratamiento i 1
r tr
Suma de cuadrados para el error SCerror SCtotal SCtratamiento
31
Elías Alberto Torres Armas, Lic. Ms. C.
Ejemplo:
Incremen to en peso de ganado porcino
20
15
10
1 2 3 4
Gráfico
Die ta alim enticia 3.1. Incremento
de concentr adodea peso
diferdeentes
ganado porcino
dos isa de maíz am ar illo duro
diferentes dietas alimenticias de maíz amarillo duro
32
Métodos Estadísticos para la Investigación experimental
Del gráfico interactivo: diagrama de cajas y bigotes, por simple inspección se puede
mencionar que no hay diferencia entre los niveles del factor, es decir entre los distintos
porcentajes de concentrado de maíz amarillo duro, aun cuando en las dietas B y C se
observen ganancias más altas. La dieta C se encuentra concentrado respecto a la media,
pero tiene valores anómalos, mediciones que afectan a la misma, así como la dieta D.
Obsérvese que en el diseño está presente cada uno de los siguientes elementos:
Yij i ij
Para i = 1, 2, 3,..., 4 tratamientos t=4, j = 1,2,3,..... 5 observaciones o repeticiones
r=5
Análisis de Varianza
Hipótesis: H0: t1 = t2 = t3 = t4
Ha: t1 t2 t3 t4 (Al menos una de las dietas es diferente)
ó
H 0 : i 0
H a : i 0 ( No todos son iguales )
33
Elías Alberto Torres Armas, Lic. Ms. C.
t r
Y..2 210..2
SCtotal Y 1 6 17 ... 3
2
ij
2 2 2 2
665
i 1 j 1 tr 4(5)
Y 2
i.
Y..2 432 532 712 432 2102
SCtratamiento i 1
560.40
r tr 5 4(5)
Observe que Fc<Ft tanto para 5% (F0.05 =3.24) como para 1%, (F0.01 =5.29) lo que
significa que no existe al menos uno de los tratamientos es significativo y/o altamente
significativo, por tanto, se acepta H0, es decir no hay diferencia entre los incrementos
promedio de peso del ganado porcino por efecto de las distintas dietas alimenticias de
maíz amarillo duro
34
Métodos Estadísticos para la Investigación experimental
Decisión
Aceptamos Ho porque Fc<Ft tanto para 5% (F0.05 =3.24) como para 1%, (F0.01 =5.29) ó
(p-valor=0,4202>0,05 y p-valor= 0,4202>0,01).
Conclusión
No existe evidencia suficiente para afirmar de que por lo menos uma de lãs dietas
alimentícias sea diferente de las demás.
Estadísticos descriptivos
Aun cuando la prueba F del análisis de varianza sea o no significativa, las Pruebas post
hoc (posterior al análisis de varianza), Duncan o Tukey se podrán aplicar para las
comparaciones múltiples de promedios de los tratamientos. Estas pruebas se evaluaran
más adelante.
2. Diseño completamente al azar con más de una observación por unidad experimental
2.1. Diseño completo al azar con sub-muestra con igual número de repeticiones e
igual número de unidades en la muestra
Cuando se tiene en cada unidad experimental varias observaciones. Un DCA con sub-
muestreo e igual número de subunidades por unidad experimental (u.e), puede ser usado
cuando se demandan unidades experimentales muy grandes debido a ello es posible dividirlas
en subunidades y ser estudiadas a partir de muestras pequeñas. También puede ser usado
cuando se presentan experimentos donde es muy tedioso tomar toda la unidad experimental,
siendo por esto, necesario sacar subunidades de cada unidad. Se debe tener claro que en éste
tipo de diseños existen dos tipos de análisis: Uno referente a las unidades y el otro referente
35
Elías Alberto Torres Armas, Lic. Ms. C.
Yijk i ij ijk
i 1,2,3,..., t j 1,2,3,..., r k 1,2,3,..., s
Yijk : Observación de la variable respuesta asociado a la k-ésimo sub-unidad experimental, j-
esimo unidad experimental del i-ésimo tratamiento
i : Efecto del i-ésimo tratamiento
ij : Efecto de error experimental. Asociado a las unidades experimentales, j-ésimo unidad
experimental del i-ésimo tratamiento
ijk : Efecto del k-ésimo sub-unidad experimental j-esimo unidad experimental del i-ésimo
tratamiento.
Hipótesis
Ho: t1 = t2 = t3 =... = tt
Ha: t1 t2 t3 ... tt para i = 1, 2,3,................, t tratamientos
Nivel de significación:
Decisión.
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar.
Conclusión.
36
Métodos Estadísticos para la Investigación experimental
Y 2
i ..
Y...2
Suma de cuadrados de tratamientos Tyy i
rs rst
Y 2
ij . Y 2
i ..
Suma de cuadrados del error experimental E yy i j
i
s rs
Y 2
ij .
Suma de cuadrados de sub-muestreo S yy Y 2
ijk
i j
i j k s
Y...2
Suma de cuadrados del total Wyy Yijk2
i j k rst
Ejemplo:
El cuadro siguiente muestra el análisis químico de tres variedades de pastos, donde se evaluó
el contenido de Mg en ppm, se tomó lecturas en duplicado para cada unidad experimental.
Realizar el análisis de varianza y ver si existe diferencia estadística entre las concentraciones
de Mg de los pastos en estudio.
37
Elías Alberto Torres Armas, Lic. Ms. C.
i j k s 2
Suma de cuadrados del total
Y2 126.302
Wyy Yijk2 ... 3.32 5.02 8.02 7.02 74.38
i j k rst 4(2)(3)
Decisión.
Conclusión.
2.2. Diseño completo al azar con sub-muestra con diferente número de repeticiones
e igual número de unidades en la muestra
Yijk i ij ijk
Donde : i 1,2,3,..., t j 1,2,3,..., ni k 1,2,3,..., nij
38
Métodos Estadísticos para la Investigación experimental
Tabla 3.9. Esquema para el registro de datos de un experimento con Diseño completo al
azar con sub-muestra con diferente número de repeticiones e igual número de unidades
en la muestra
TRATAMIENTO
Observación T1 Ti Tt
Y111 Yi11 Y1t1
Y112 Yi12 Y1t2
1 Y11. Yi1. Y1t.
Y121 Yi21 Y1t1
Y122 Yi22 Y1t2
2 Y12. Yi2. Y1t.
Y131 Yi31 Y1t1
Y132 Yi32 Y1t2
3 Y13. Yi3. Y1t.
. . .
. . Y ijk .
. . . .
.
Y1j. Yij. .
. . .
. . .
. . .
R . . .
TOTAL Y1.. Yi.. . Y…
Número de repeticiones n1.. ni.. . n
Número de unidades de sub-muestra n12. nij. .
Tabla 3.10. Esquema para el registro de datos de un experimento con Diseño completo al azar
con sub-muestra con diferente número de repeticiones e igual número de unidades en la
muestra
Tratamiento Repeticiones Observaciones de la Yij. nij. Yi.. ni.. Y
(i) (j) muestra (k) i ..
1 1 …
2 …
3 …
4 …
2 1 …
2 …
3 …
3 1 …
2 …
. . …
. . …
. . …
Y…= Y
...
39
Elías Alberto Torres Armas, Lic. Ms. C.
: Es una constante
ij :
Están normalmente distribuidas con media cero y desviación estándar
ijk :
Están normalmente distribuidas con media cero y desviación estándar
Hipótesis
H o : i 0 (i 1,..., t ) T1 = T2 = T3 =... = Tt
H a : i 0 T1 T2 T3 ... Tt para i=1, 2, 3, ..., t tratamientos
Nivel de significación.
Error Eyy
(n
i 1
i 1)
E E/S
t ni
(n ij 1)
Error de sub-muestreo Syy i 1 j 1 S
Total Wyy n-1 W
Decisión.
F(gl tratamient o , glerror )
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > de lo contrario
aceptar
Conclusión.
nij . ni..
Y 2
ij .
Suma de cuadrados de sub-muestreo S yy Yijk2
i j
i j k nij .
40
Métodos Estadísticos para la Investigación experimental
Y...2
Suma de cuadrados del total Wyy Yijk2
i j k n
t
n ni..
i 1
Ejemplo:
Yijk i ij ijk
Donde :
i 3 tratamient os j 4, 3, 2 (ni ) repeticion es por tratamient o
k 2 unidades de la muestra
Ho: i 0 (i 1,..., t ) T1 = T 2 = T3
Ha: i 0 T1 T2 T3 para i=1, 2, 3 tratamientos t=3
Nivel de significación: 0,05
t
(n
i 1
i 1) =(4-1)+(3-1)+(2-1)=6 n1=4, n2=3, n3=2
t ni
(n
i 1 j 1
ij 1) = (2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+ (2-1)=9
S yy Yijk2 i j
(3,3) 2 (3,5) 2 (3,5) 2 (3,6) 2 (4,1) 2 ... (8,0) 2 484,41
i j k ni j .
485,70 484,41 1,59
Decisión.
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar. Rechazar H0 porque Fc=429,38> F(2;6)0,05 = 5,14
Conclusión.
42
Métodos Estadísticos para la Investigación experimental
Por lo menos existe una diferencia significativa entre dos promedios atribuibles al efecto del
tratamiento después de separar el efecto de la sub-muestra.
2.3. Diseño completo al azar con sub-muestra con diferente número de repeticiones y
diferente número de unidades en la muestra
Hipótesis
H o : i 0 (i 1,..., t ) T1 = T2 = T3 =... = Tt
H a : i 0 T1 T2 T3 ... Tt para i=1, 2, 3, ..., t tratamientos
Nivel de significación.
Error Eyy
(n
i 1
i 1)
E E/S
t ni
(n ij 1)
Error de sub-muestreo Syy i 1 j 1 S
Total Wyy n-1 W
Decisión.
F(gl tratamient o , glerror )
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > de lo contrario
aceptar
Conclusión.
43
Elías Alberto Torres Armas, Lic. Ms. C.
nij . ni..
Y 2
ij .
Suma de cuadrados de sub-muestreo S yy Yijk2
i j
i j k nij .
Y...2
Suma de cuadrados del total Wyy Yijk2
i j k n
t
n ni..
i 1
Ejemplo:
Tabla 3.14. Cantidad de azúcar no convertida en el substrato que sigue a una fermentación de 24
horas debida a dos diferentes microorganismos
Tratamiento Repeticiones Observaciones de la Yij. nij. Yi.. ni.. Y
i ..
(i) (j) muestra (k)
1 1 5,6 5,7 11,3 2
2 5,0 5,0 5,1 15,1 3
3 5,4 5,4 5,4 5,5 5,4 27,1 5
4 5,3 5,5 10,8 2 64,3 4
2 1 7,6 7,6 7,8 23,0 3
2 7,4 7,0 7,2 21,6 3
3 7,5 7,6 7,5 7,4 30,0 4 74,6 3
Y…=138,9 Y ...
Yijk i ij ijk
44
Métodos Estadísticos para la Investigación experimental
Hipótesis
Ho: i 0 (i 1,..., t ) T1 = T 2
Ha: i 0 T1 T2 para i=1, 2 tratamientos t=2
t
t=2r=7 m=22 (n
i 1
i 1) =(4-1)+(3-1)=5 n1=4, n2=3
t ni
(n
i 1 j 1
ij 1) = (2-1)+(3-1)+(5-1)+(2-1)+(3-1)+(3-1)+(4-1)=15
t
nij=2 para todo i,j n ni.. =4+3=18 n1..=4 n2..=3
i 1
Y 2
i ..
Y...2 (64,3) 2 (74,6) 2 (138,9) 2
Tyy i
ni
901,0568 876,9641 24,0927
n 12 10 22
n
j 1
i ..
Y 2
ij . Y 2
i ..
(11,3) 2 (15,1) 2 (27,1) 2 (10,8) 2 (23,0) 2 (21,6) 2 (30,0) 2
E yy i j
i
ni
901,0568
ni j . 2 3 5 2 3 3 4
n
j 1
i ..
Y...2
Wyy Yijk2 (5,6) 2 (5,7) 2 (5,0) 2 (5,0) 2 (5,1) 2 ... (7,4) 2 876,9641
i j k n
902,07 876,9641 25,0059
45
Elías Alberto Torres Armas, Lic. Ms. C.
Decisión.
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar. Rechazar H0 porque Fc=142,22>F(1;5)0,05 =6.61
Conclusión.
Por lo menos existe una diferencia significativa entre dos promedios atribuibles al efecto del
microorganismo.
Describir el modelo lineal aditivo del diseño en términos del enunciado.. Indique los
principios básicos del modelo. Realice el Análisis de Variancia y de sus conclusiones
a un nivel de significación del 5%
2.4.2. Con la finalidad de estudiar el efecto de 5 raciones para cerdos, se llevó a cabo un
experimento conducido en D.C.A. Los resultados del incremento de peso (en Kg.)
al final del experimento se presentan a continuación:
Observaciones. RACIONES (i)
(j) R1 R2 R3
1 4.228 4.529 4.994
2 4.330 4.956 4.373
3 3.791 4.160 5.642
4 4.008 4.650 5.124
5 3.910 3.891 4.562
46
Métodos Estadísticos para la Investigación experimental
A B C D E
60 ºC 65 º C 70 º C 75 ºC 78 ºC
TOTAL 9,243 9,177 9,190 9,076 7,880
PROMEDIO 1,027 1,020 1,021 1,008 0,876
REPETICION 9 9 9 9 9
ANVA
F.V GL SC CM FC
Tratamientos 4 0,150 0,037 0,00371
Error 40 403,580 10,090
Total 44 403,730
47
Elías Alberto Torres Armas, Lic. Ms. C.
DIETA
Observaciones
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
64
Total 244 330 340 366 1280
Promedio 61 66 68 61 64
Repeticiones 4 5 5 6 20
DIETA
Observaciones
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
Total 244 265 272 239 1020
Promedio 61 66.25 68 59.75 63.75
Desviación estándar 1.8257 3.5940 2.1602 2.6300
Repeticiones 4 4 4 4 16
48
Métodos Estadísticos para la Investigación experimental
Tabla 3.16. Peso final de los cerdos a tres tratamientos con diferentes niveles de energía
Tratamiento (i) Repetición (j) Muestras (k) Yij. nij. Yi.. ni..
A 1 70 90 160 2 600 8
2 60 90 90 240 3
3 50 60 90 200 3
B 4 100 120 220 2 430 5
5 80 70 60 210 3
C 6 50 40 50 140 3 240 5
7 50 50 100 2
49
CAPITULO IV
El rechazo de la hipótesis nula (H0) en la tabla del análisis de varianza (ANVA) del diseño, nos
indica que existe diferencia significativa (o altamente significativa) entre los tratamientos en
estudio, sin embargo no nos informa en qué tratamiento se da la mayor diferencia y en última
instancia cuál es el tratamiento óptimo en función de la naturaleza del problema (máx. ó min.).
En muchos experimentos entonces, en el planteamiento existirá específicamente el interés en
determinar los mejores tratamientos o en el tratamiento óptimo. Para solucionar el problema se
utiliza los métodos de comparaciones múltiples, entre los cuales tenemos: Prueba t-Student,
Prueba de la diferencia límite significativa, Prueba Duncan, Prueba Tukey, Prueba SHEFFE,
Prueba Dunnet, Entre otras como las de contrastes ortogonales, Bonferroni, Neuman Keuls, etc.
Estas pruebas se realizan posterior al análisis de varianza (ANVA).
1. Prueba t-student
Se usa para comparar dos medias poblacionales, para su análisis se debe tener en cuenta las
siguientes restricciones:
a. Las comparaciones a estudiar deberán ser seleccionadas antes de cualquier análisis de datos.
b. La prueba F del ANVA debe ser SIGNIFICATIVA
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj H0: µi=µj H0: µi=µj
H0: µi≠µj H0: µi>µj H0: µi<µj
2. Nivel se significación: α
3. Estadística de prueba
( xi x j ) ( i j )
tc t ( g lerro r )
s xi x j
Donde :
1 1
s xi x j CME ( ) si ri r j
ri rj
2CME
s xi x j si ri r j
r
DLS ( s xi x j )(t ( g lerro r ) )
4. Región crítica
5. Decisión: Rechazar H0 si tc cae en región de rechazo ó
Rechazar Ho si:
xi x j DLS, Dos colas
xi x j DLS, Una cola derecha
xi x j DLS, Una cola izquierda
6. Conclusión.
Métodos Estadísticos para la Investigación experimental
EJERCICIO: Se desea antes de realizar el experimento, planear la comparación entre las dietas
alimenticias 3 y 5 para aumento de peso en pollos a los 28 días de edad; se piensa que la dieta 5
genera mayores pesos que la dieta 3: Los datos son los siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.265 1.273 1.308
Repetición 4 4 4 4 4
CUADRO N° 2: ANVA para el aumento de peso del pollo a los 28 dias de edad
F.de V GL SC CM Fc Ftab Sig
Tratamientos 4 0.01 0.0025 11.74 4.77 **
Error 15 0.0032 0.000213
Total 19 0.0132
51
Elías Alberto Torres Armas, Lic. Ms. C.
3. Prueba Duncan
Se llama también t-Student modificada, se realiza posterior al ANVA; se usa para efectuar
comparaciones múltiples entre dos medias de tratamientos del experimento. Con t tratamientos
se realiza t(t-1)/2 comparaciones posibles de promedios de tratamientos. La prueba de igualdad
de tratamientos (F en el ANVA) puede ser o no significativa. Cuando el número de repeticiones
es igual en los tratamientos, los cálculos son más precisos que cuando se tiene diferente número
de repeticiones por tratamiento. Tiene el inconveniente cuando se tiene un alto número de
tratamientos el nivel de significación α remodifica en función a ellos.
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj
H0: µi≠µj
2. Nivel se significación: α
3. Estadística de prueba
Ordenar los promedios de tratamientos de menor a mayor o viceversa
Del ANVA tomamos CME y us grados de libertad aun cuando la H0 haya sido
aceptada, y calculamos:
CME 1 1
s xi x j ( ) si ri r j
2 ri rj
CME
s xi x j si ri r j
r
De la tabla Duncan obtenemos los AESD (amplitud estudentizado significativa de
Duncan), rangos para α dado para 5% y 1% con grados de libertad del error y para
2,3,4,…,t tratamientos (t-1) rangos
Calculamos ahora: ALS D AES D (s xi x j )
4. Decisión:
xi x j
Si | |≤ALSD, entonces aceptar H0
x x
Si | i j |≥ALSD, entonces rechazar H0
5. Comparaciones y significación
Comparaciones x x p ALSD Decisión Sig
H0 d=| i j |
6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.
Tratamientos A B C D
Promedios 71.5 85 76 62
r=6 t=4 CME=103.075 g.lERROR=6.4-4=20
Realizar la prueba Duncan para todas las comparaciones posibles.
52
Métodos Estadísticos para la Investigación experimental
1. Hipótesis
H0: µi=µj
H0: µi≠µj
2. Nivel se significación: α=1%, ó 5%
3. Estadística de prueba
Ordenar los promedios de tratamientos de menor a mayor o viceversa
Tratamientos B C A D
Promedios 85 76 71.5 62
Del ANVA tomamos CME y sus grados de libertad aun cuando la H0 haya sido
aceptada.
CME=103.075 g.lERROR=6.4-4=20
Calculamos:
CME 1 1
s xi x j ( ) si ri r j
2 ri r j
CME 103.075
s xi x j si ri r j s xi x j 4.14
r 6
De la tabla Duncan obtenemos los AESD (amplitud estudentizado significativa de
Duncan), rangos para α dado para 5% y 1% con grados de libertad del error y para
2,3,4,…,t tratamientos (t-1) rangos
t 2 3 4
AESD 2.95 3.10 3.18
Calculamos ahora: ALS D AES D (s xi x j ) AES D (4.14)
t 2 3 4
AESD 2.95 3.10 3.18
ALSD 12.227 12.849 13.180
x x xi x j
4. Decisión: Si | i j |≤ALSD, entonces aceptar H0. Si | |≥ALSD, entonces
rechazar H0
5. Comparaciones y significación
Comparaciones x x P ALSD Decisión Sig
H0 d=| i j |
ns
µB=µC 85 – 76 =9 2 12.227 Acepta
µB=µA 85 - 71.5 =13.5 3 12.849 Rechaza *
µB=µD 85 – 62 =23 4 13.180 Rechaza *
µC=µA 76 - 71.5 =4.5 2 12.227 Acepta o
µC=µD 76 – 62 =14 3 12.849 Rechaza *
µA=µD 71.5 – 62 =9.5 2 12.227 Acepta O
6. Representación de los resultados: (grupos homogéneos)
Por segmentos de recta
Tratamientos B C A D
53
Elías Alberto Torres Armas, Lic. Ms. C.
4. Prueba de Tukey
Es menos rigurosa que al prueba Duncan por tal motivo el nivel de significación debe ser más
amplio y las comparaciones que realmente son significativas, ésta prueba las podría declarar no
significativas. El nivel de significación α se mantiene constante. F calculado en el ANVA puede
ser significativa o no. Es más precisa cuando los tratamientos tienen igual número de
repeticiones. No es necesario ordenar los promedios de tratamientos, sin embargo ello es muy
usual en la práctica. Utiliza un solo valor tabular para calcular la ALST (amplitud limite
significativa de Tukey)
PROCEDIMIENTO:
Información básica: Promedios de los tratamientos y el cuadro ANVA del diseño.
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj i j
H0: µi≠µj
2. Nivel se significación: α
3. Estadística de prueba
Ordenar los promedios de tratamientos de menor a mayor o viceversa
Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
aceptada. Calculamos:
CME 1 1
s xi x j ( ) si ri r j
2 ri rj
CME
s xi x j si ri r j
r
De la tabla Tukey obtenemos los AEST (amplitud estudentizado significativa de
Tukey) y tambén se obtiene de la tabla de Student_Neuman-Keul, para un nivel de
significación α dado para 5% y 1%, con grados de libertad del error y para un solo
valor de p (p: número de tratamientos propuestos en el experimento)
Calculamos ahora: ALST AES T (s xi x j ) . Cuando se tiene diferente número de
repeticiones por tratamiento se genera varios valores ALS T.
54
Métodos Estadísticos para la Investigación experimental
x x x x
4. Decisión: Si | i j |≤ALST, entonces aceptar H0. Si | i j |≥ALST, entonces rechazar
H0
5. Comparaciones y significación
Comparaciones xi x j ALST Decisión Sig
H0 d=| |
6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.
EJERCICIO: Se desea saber que tratamiento permite una mayor ganancia en el peso en pollos a
los 28 días de edad, mediante la prueba Tukey para comparaciones múltiples; se tiene los datos
son los siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.273 1.308 1.265
Repetición 4 4 4 4 4
CUADRO N° 2: ANVA para el aumento de peso del pollo a los 28 dias de edad
F.de V GL SC CM Fc Ftab Sig
Tratamientos 4 0.01 0.0025 11.74 4.77 **
Error 15 0.0032 0.000213
Total 19 0.0132
SOLUCIÓN:
1. Hipótesis
H0: µi=µj i j
H0: µi≠µj
2. Nivel se significación: α=5%
3. Estadística de prueba
Ordenar los promedios de tratamientos de menor a mayor o viceversa
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T5 T3 T4
Promedio 1.241 1.258 1.265 1.273 1.308
Repetición 4 4 4 4 4
Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
aceptada. Calculamos:
CME 1 1
s xi x j ( ) si ri r j
2 ri r j
CME 0.000213
s xi x j si ri r j s xi x j 0.0073
r 4
De la tabla Tukey obtenemos los AEST (amplitud estudentizado significativa de
Tukey) y tambén se obtiene de la tabla de Student_Neuman-Keul, para un nivel de
55
Elías Alberto Torres Armas, Lic. Ms. C.
significación α dado para 5% y 1%, con grados de libertad del error y para un solo
valor de p (p: número de tratamientos propuestos en el experimento)
α =5%, grados de libertad del error = 15 p=5 tratamientos
AEST=4.37
Calculamos ahora: ALST AES T (s xi x j ) (0.0073)(4.37) 0.0319
Cuando se tiene diferente número de repeticiones por tratamiento se genera varios
valores ALST.
x x x x
4. Decisión: Si | i j |≤ALST, entonces aceptar H0. Si | i j |≥ALST, entonces rechazar
H0
5. Comparaciones y significación
Comparaciones x x ALST Decisión Sig
H0 d=| i j |
µ1=µ2 0.017 < 0.0319 Acepta o
µ1=µ5 0.024 < 0.0319 Acepta o
µ1=µ3 0.032 > 0.0319 Rechaza *
µ1=µ4 0.067 > 0.0319 Rechaza *
µ2=µ5 0.007 < 0.0319 Acepta o
µ2=µ3 0.015 < 0.0319 Acepta o
µ2=µ4 0.05 > 0.0319 Rechaza *
µ5=µ3 0.008 < 0.0319 Acepta o
µ5=µ4 0.043 > 0.0319 Rechaza *
µ3=µ4 0.035 > 0.0319 Rechaza *
6. Representación de los resultados: (grupos homogéneos)
Por segmentos de recta
Tratamientos T1 T2 T5 T3 T4
Literal
Tratamientos grupos homogéneos.
T1 a
T2 ab
T5 abc
T3 bc
T4
Cuadro de doble entrada
T1 T2 T5 T3 T4
T1 0.017 0.024 0.032* 0.067 *
T2 0.007 0.015 0.050 *
T5 0.008 0.043 *
T3 0.035 *
T4
Tratamientos grupos homogéneos.
T1 X
T2 XX
T5 XXX
T3 XX
T4
56
Métodos Estadísticos para la Investigación experimental
7. Conclusión: En base a los resultados experimentales podemos decir que existen tres grupos
con resultados de diferencia de tratamientos similares (homogéneos). El grupo de los de
menor valor (el primero) de éste quien posee el menor rendimiento (más bajo) es el
tratamiento T1. El segundo grupo de mayor valor, de estos, el que posee rendimientos
medios superiores es el tratamiento T4. Por tanto se recomienda el tratamiento T4, puesto
que da un mayor incremento en el peso a los 28 días de edad en la alimentación de los pollos
para carne.
5. Prueba de Dunnett
Se usa cuando existe tratamiento testigo y se desea comparar éste testigo con los demás
tratamientos. La prueba F del ANVA debe ser significativa. Las comparaciones son planeadas
antes de realizar el experimento.
PROCEDIMIENTO:
1. Hipótesis
H0: µk=µj k j
H0: µk≠µj k: es la ubicación del tratamiento testigo
2. Nivel se significación: α
3. Estadística de prueba
Del ANVA tomamos CME y sus grados de libertad aun cuando la H0 haya sido
aceptada.
Calculamos:
1 1
s xk x j CME ( ) si rk rj
rk rj
2CME
s xk x j si rk rj
r
De la tabla Dunnett obtenemos los t(DN), para un nivel de significación α dado para
5% y 1%, con grados de libertad del error y para un valor de p=t-1 (p: número de
tratamientos propuestos en el experimento sin incluir el tstigo o control)
Calculamos ahora: ALS( DN ) (T( DN ) )(sxk x j )
4. Decisión: Si | x k x j |≤ALS(DN), entonces aceptar H0, Si | x k x j |≥ALS(DN), entonces rechazar
H0
5. Comparaciones y significación
Comparaciones d=| x k x j | ALS(DN) Decisión Sig
H0
6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.
57
Elías Alberto Torres Armas, Lic. Ms. C.
EJERCICIO: Se desea saber que tratamiento permite una mayor ganancia en el peso en pollos a
los 28 días de edad, mediante la prueba Dunnett para comparaciones múltiples usando el
tratamiento 1 como testigo; se tiene los datos siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.273 1.308 1.265
Repetición 4 4 4 4 4
SOLUCIÓN:
1. Hipótesis
H0: µk=µj k j
H0: µk≠µj k: es la ubicación del tratamiento testigo
2. Nivel se significación: α=5%
3. Estadística de prueba
Ordenar los promedios de tratamientos de menor a mayor o viceversa
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T5 T3 T4
Promedio 1.241 1.258 1.265 1.273 1.308
Repetición 4 4 4 4 4
Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
aceptada.
Calculamos:
1 1 1 1
s xk x j CME ( ) si rk r j s xk x j 0.000213( ) 0.0103
rk r j 4 4
2CME
s xk x j si rk r j
r
De la tabla Dunnett obtenemos los t (DN), para un nivel de significación α dado para
5% y 1%, con grados de libertad del error y para un valor de p=t-1 (p: número de
tratamientos propuestos en el experimento sin incluir el testigo o control)
p=t-1=4 grados de libertad del error = 15 α =5% t(DN)=2.73
Calculamos ahora: ALS ( DN ) (T( DN ) )(s xk x j ) 2.73(0.0103) 0.028119
4. Decisión:
Si | x x |≤ALS(DN), entonces aceptar H0. Si | x x |≥ALS(DN), entonces rechazar H0
k j k j
5. Comparaciones y significación
Comparaciones d=| x x |
k j
ALST Decisión Sig
H0
µ1=µ2 1.258 – 1.241=0.017 < 0.0319 Acepta o
µ1=µ5 1.265 – 1.241=0.024 < 0.0319 Acepta o
µ1=µ3 1.273 – 1.241=0.032 > 0.0319 Rechaza *
µ1=µ4 1.308 – 1.241=0.067 > 0.0319 Rechaza *
58
Métodos Estadísticos para la Investigación experimental
Literal
Se llevó acabo un experimento para evaluar el efecto de 4 dietas alimenticias de concentrado con
diferentes dosis de maíz amarillo duro, en el incremento en peso de ganado porcino, utilizándose
para ello 20 camadas de cerdos de la misma raza, de la misma parición y del mismo día de
nacidos, obteniéndose los siguientes resultados:
B2 A1 C20 C15 D7 C9 B16 A11 B12 D3
D10 B19 A6 C14 D18 B4 A17 D5 A8 C13
A. 20%m.a.d. B. 30%m.a.d. C. 40%m.a.d. D. 50%m.a.d.
Realice el análisis estadístico pertinente y anuncie sus conclusiones para el investigador
59
Elías Alberto Torres Armas, Lic. Ms. C.
15
10
1 2 3 4
Die ta alim enticia de concentr ado a difer entes dos is de maíz am ar illo duro
Por simple inspección se puede mencionar que no hay diferencia entre los niveles del factor, es
decir entre los distintos porcentajes de concentrado de maíz amarillo duro, aun cuando en las
dietas B y C se observen ganancias más altas. La dieta C se encuentra concentrado respecto a la
media, pero tiene valores anómalos, mediciones que afectan a la misma, así como la dieta D.
Yij i ij
Para i = 1,2,3,..... 4 tratamientos t=4
j = 1,2,3,..... 5 observaciones o repeticiones r=5
Donde:
Yij : Es incremento en peso de ganado porcino en el i-ésisma dieta alimenticia y j-
ésima repetición.
µ : Efecto de la media general
τi : Efecto de la i-ésima dieta alimenticia
εij : Error experimental (efecto verdadero) que pertenece a la i-ésisma dieta
alimenticia y j-ésima repetición.
Supuestos básicos modelo estadístico: El modelo estadístico debe cumplir con los siguientes
supuestos:
1. Aditividad: Los efectos del modelo son aditivos
2. Linealidad: Las relaciones entre los efectos del modelo son lineales
3. Normalidad: Los errores del modelo deben tener una distribución normal con media Cero y
varianza σ2 .
4. Independencia: Los resultados obtenidos en el experimento son independientes entre si.
5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la aplicación de los
diferentes tratamientos tienen varianzas iguales (σ2)
60
Métodos Estadísticos para la Investigación experimental
Estadísticos descriptivos
Variable dependiente: Incremento en peso de ganado porcino
Dieta alimenticia de concentrado a diferentes dosis de maíz amarillo duro Media Desv. típ. N
A:20%m.a.d. 8.60 5.941 5
B:30%m.a.d. 10.60 7.403 5
C:40%m.a.d. 14.20 3.962 5
D:50%m.a.d. 8.60 5.857 5
Total 10.50 5.916 20
Análisis de Varianza
MODELO I.- EFECTOS FIJOS
No existe evidencia suficiente para afirmar de que por lo menos uma de lãs dietas alimentícias sea
diferente de las demás.
Pruebas post hoc. Usando Duncan o Tukey, que son dos pruebas en las que la prueba F puede
ser o no significativa.
(I) Dieta alimenticia (J) Dieta alimenticia Interv alo de conf ianza al
de concentrado a de concentrado a Dif erencia 95%.
diferentes dosis de diferentes dosis de entre Límite
maíz amarillo duro maíz amarillo duro medias (I-J) Error típ. Significación Límite inf erior superior
DHS de Tukey A:20%m.a.d. B:30%m.a.d. -2.00 3.743 .949 -12.71 8.71
C:40%m.a.d. -5.60 3.743 .462 -16.31 5.11
D:50%m.a.d. .00 3.743 1.000 -10.71 10.71
B:30%m.a.d. A:20%m.a.d. 2.00 3.743 .949 -8.71 12.71
C:40%m.a.d. -3.60 3.743 .772 -14.31 7.11
D:50%m.a.d. 2.00 3.743 .949 -8.71 12.71
C:40%m.a.d. A:20%m.a.d. 5.60 3.743 .462 -5.11 16.31
B:30%m.a.d. 3.60 3.743 .772 -7.11 14.31
D:50%m.a.d. 5.60 3.743 .462 -5.11 16.31
D:50%m.a.d. A:20%m.a.d. .00 3.743 1.000 -10.71 10.71
B:30%m.a.d. -2.00 3.743 .949 -12.71 8.71
C:40%m.a.d. -5.60 3.743 .462 -16.31 5.11
Basado en las medias observ adas.
61
Elías Alberto Torres Armas, Lic. Ms. C.
Subconjuntos homogéneos
Incremento en peso de ganado porcino
Observese además que los niveles del factor son de naturaleza cuantitativa, es de interés,
conocer la naturaleza de la curva de respuesta al factor en estudio, esto implica realizar un análisis
de regresión, que puede ser lineal, cuadrática, y cúbica. Si los niveles del factor son t=4,
obtenemos t-1=3 componentes: la lineal, cuadrática, cúbica.
No hay evidencia suficiente para rechazar la hipótesis de que el modelo sea lineal, cuadrático o
cúbico.
62
Métodos Estadísticos para la Investigación experimental
Homogeneidad de varianzas
Una salida de statgraphics plus for v.5.1 muestra los siguientes contrastes
Contraste de Varianza
Contraste C de Cochran: 0.391149 P-valor = 0.681973
Contraste de Bartlett: 1.09633 P-valor = 0.721391
Contraste de Hartley: 3.49045
Test de Levene: 0.639354 P-valor = 0.600638
El estadístico mostrado en esta tabla, comprueba la hipótesis nula de que la desviación típica de
INCREPESO dentro de cada uno de los 4 niveles de Dieta, es la misma. De particular interés
están los tres p-valores. Dado que el menor de los p-valores es superior o igual a 0.05, no hay
diferencia estadísticamente significativa entre las desviaciones típicas para un nivel de confianza
del 95.0%.
10
5
Valor Normal esperado
-5
-10
-10 -5 0 5 10
Valor observado
Según el grafico Q-Q plot Normal, los puntos de las observaciones estan alineados respecto a la
recta, lo que significa que existe normalidad de los errores.
Gráfico Q-Q Normal sin tendencia de Residuo para INCREPESO
1
Desviación de Normal
-1
-10 -5 0 5 10
Valor observado
63
Elías Alberto Torres Armas, Lic. Ms. C.
Pruebas de normalidad
Kolmogorov-Smirnov(a) Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Residuo para
INCREPESO .098 20 .200(*) .959 20 .516
CONCLUSION FINAL
Se ha realizado los calculos y analisis de los resultados, se encontró que no hay evasión de
supuestos del diseño DCA, pero en el ANVA encontramos que la razón F es menor que 1 (.995).
La salida del Statgraphics Plus nos presenta la siguiente conclusión: grupos. El F-ratio, que en
este caso es igual a 0.995479, es el cociente de la estimación entre grupos y la estimación dentro
de los grupos. Puesto que el p-valor del test F es superior o igual a 0.05, no hay diferencia
estadísticamente significativa entre las INCREPESO medias de un nivel de Dieta a otro para un
95.0%. Siembargo, estaríamos en el caso presentado por Ostlle: La razon F resulta ser un
número menor que 1. (Ostle, 1986, pp335, 336) “…es posible (y completamente probable) que el
valor calculado de F resultara menor que la unidad. ¿Cuál debería ser nuestra conclusión ante tal
situación?. Podemos, por supuesto, simplemente decir que F no era significante y de esta manera
la hipótesis no puede ser rechazada. Sin embargo, no es prudente una excusa tan simple del
problema, ya que podría causar que ignorásemos una advertencia tan valiosa. Supongamos, como
puede suceder, que F, con v1 y v2 grados de libertad, en tan pequeña que F’=1/F, con v2 y v1
grados de libertad, es significante. ¿Cuál sería nuestra conclusión en este caso? Parece que debería
rechazarse algo; ¿pero qué? En esta situación, parece razonable rechazar el modelo
estadístico postulado (el modelo utilizado no es el más idóneo). Si el modelo estadístico es
rechazado debido a un valor significante F’, entonces, ¿cuáles son los pasos que deberán tomarse?
Algunos de ellos son:
1. El procedimiento experimental deberá ser revisado para ver si se satisfacen las diferentes
suposiciones. Por ejemplo, si no se empleó la aleatorización debida, la validez de la
suposición de independencia es dudosa.
2. Si se dispone de suficientes observaciones, la suposición de normalidad podría revisarse
mediante la representación gráfica de los datos, bien sea en una hoja grafica regular o en
una hoja de papel normal.
3. La suposición de varianzas homogéneas deberá ser revisada, pero esto requerirá un gran
número de observaciones dentro de subclases.
4. El fenómeno básico deberá reestudiarse para ver si el modelo lineal supuesto es una
buena aproximación a la verdad de los hechos. Si, como resultado, el modelo supuesto es
rechazado deberá buscarse un nuevo modelo que describa mejor los datos observados y
el fenómeno bajo investigación.
1. Se quiere estudiar la influencia de cuatro tipos de riego en la producción de maíz. Para ello, se
seleccionan parcelas del mismo tamaño y con la misma calidad de terreno, y se prueban los
cuatro tipos de riego, en 6, 8, 9 y 7 parcelas respectivamente. Los datos de producción que se
obtienen son los siguientes:
64
Métodos Estadísticos para la Investigación experimental
a. Realice el ANVA
b. Analizar las diferencias entre pares de medias de tratamientos, usando el método de Duncan
con α=0.01.
c. Describir el modelo lineal aditivo del diseño en términos del enunciado
d. Indique los principios básicos del modelo
2 1 2 5 2 1
3 1 1 0 0
1 0 5 1 1
3 1 2 2 1 3
1 0 4 3 3
1 1 3 3 3
4 2 2 3 0 0
3 0 3 0 1
0 1 4 2 1
TOTAL
a. Escriba el modelo lineal aditivo. Plantear las hipótesis del modelo
b. Realice el análisis de varianza correspondiente e intérprete sus resultados.
DESCRIBA LOS TÉRMINOS SIGUIENTES:
c. Factor
d. Niveles del factor
e. Tratamiento
f. Testigo (si lo hubiera)
g. Unidad experimental
h. Variable respuesta
i. Diseño experimental
j. Y conceptualice cada uno de los principios básicos del diseño experimental
k. Modelo estadístico
l. Y conceptualice cada uno de los supuestos básicos del modelo experimental
65
Elías Alberto Torres Armas, Lic. Ms. C.
5. Los datos que se presentan a continuación corresponden al análisis del tiempo de coagulación
(en segundos) de sangre extraída a 20 animales, asignados aleatoriamente a 4 dietas
diferentes, resultado de un experimento llevado en un diseño completamente al azar.
Source DF SS MS F P
Diets (trats) 3 200.52 66.84 8.10 0.002
Error 16 132.03 8.25
Total 19 332.55
Level N Mean
1 5 61.000
2 5 66.000
3 5 68.400
4 5 61.167
a) Al 1% de significación cuál es la conclusión del ANVA
b) Utilizando t-student al 5% probar que el tratamiento 3 es mayor que el 2.
c) Realice la prueba Tukey de comparación múltiple de promedios de los tratamientos
66
Métodos Estadísticos para la Investigación experimental
ANVA
F.V GL SC CM FC FT
Tratamientos 4 0,150 0,037 0,00371 2,021
Error 40 403,580 10,090
Total 44 403,730
a. Al 1% de significación cuál es la conclusión del ANVA
b. Utilizando t-student al 5% probar que el tratamiento A es mayor que el C.
c. Realice la prueba Duncan de comparación múltiple de promedios de los tratamientos
67
Elías Alberto Torres Armas, Lic. Ms. C.
8. Con el objeto de investigar el efecto de la harina del fríjol “canario” en el sabor de las galletas,
se formularon las siguientes recetas A: Galletas, con 0% de harina de fríjol canario
(TESTIGO), B: Galletas, con 5% de harina de fríjol canario, C: Galletas, con 10% de harina
de fríjol canario, Galletas, con 15% de harina de fríjol canario. Intervinieron 18 panelistas
semi-entrenados, que recibieron una muestra testigo y tres muestras debidamente
codificadas; los panelistas evaluaron las muestras en relación al testigo, según la escala de
comparación múltiple de 9 puntos, donde extremadamente mejor que el testigo (9 puntos),
mucho mejor que el testigo (8 puntos), moderadamente mejor que el testigo (7 puntos),
ligeramente mejor que el testigo (6 puntos), igual que el testigo (5 puntos), ligeramente peor
que el testigo (4 puntos), moderadamente peor que el estigo (3 puntos), mucho peor que el
testigo (2 puntos), extremadamente peor que el testigo (1 puntos). Se indica que los
resultados obtenidos de la evaluación organoléptica, fueron previamente sorteados la
ubicación de las posiciones de las muestras que fueron servidos, los cuales fueron
procesados estadísticamente con el propósito de saber, si la harina de fríjol canario altera el
sabor de las galletas a un nivel del 5% de significación. Con la información del enunciado
anterior, determinar:
9. Sea un experimento con tres tratamientos T 1, T2, y T3, cuyos resultados experimentales se
indican a continuación:
T1 4 6 5 4 9 8 5
T2 10 9 7 10 8
T3 33 5 8 4 5 6 3
Determinar la variabilidad de cada tratamiento
¿Cuáles son los supuestos básicos del modelo lineal aditivo para el DCA que se deben
cumplir para el análisis de varianza? Realizar el ANVA y una prueba de comparaciones
múltiple de tratamientos apropiada
10. Se desea investigar si 4 máquinas alimentadoras (A, B, C, D) en cierta planta están llenando
envases a diferentes niveles de lo normalmente establecido. Las condiciones en las cuales se
lleva a cabo es estudio hacen que se utilice el Diseño completamente al Azar (DCA) para el
análisis de resultados. Por cada repetición se tomaron muestras aleatorias de 10 envases cada
una de la producción de cada máquina y al examinarse se obtuvieron los siguientes datos
estadísticos que expresan el número de envases por muestra, con llenado no conveniente o
fuera de lo normal.
Tratamientos Repeticiones Total
A 4 3 4 5
B 3 4 3 5 4
C 2 2 2
D 6 5 4 5 4 6
Identifique: La variable de respuesta, enuncie el modelo lineal aditivo, y efectúe el ANVA al
α=0.05
68
Métodos Estadísticos para la Investigación experimental
1. La variable respuesta
2. Factor(es) y niveles de factor(es)
3. Nombre del diseño utilizado
4. Presente el modelo lineal aditivo y su interpretación de sus componentes en términos del
enunciado.
5. Proponga la Hipótesis de interés y cuadro simbólico ANVA
6. Efectúe el análisis de varianza
7. Mediante la prueba DLS compare T1 y T3
8. Realice la prueba de Tukey.
9. ¿Se justifica el uso de DCA? Explique brevemente.
10. ¿Es conveniente realizar la prueba Dunnett? ¿Por qué?
13. Con la finalidad de estudiar el efecto de 5 raciones para cerdos, se llevó a cabo un
experimento conducido en D.C.A.. Los resultados del incremento de peso (en Kg.) al final
del experimento se presentan a continuación:
69
Elías Alberto Torres Armas, Lic. Ms. C.
Y
i 1 j 1
2
ij 554.42461
14. Un ingeniero está investigando el efecto que tienen cuatro métodos de ensamblaje (A, B, C y
D) sobre el tiempo de ensamblaje de un componente para computadoras. Se selecciona a
cuatro operadores para realizar este estudio con similares habilidades. Los resultados en
minutos se muestran a continuación:
METODO
REP. A B C D
1 5 6 9 7
2 4 7 8 6
3 6 6 10 5
4 4 5 11 8
Si. 0.9574 0.8165 1.2910 1.2910
Yi . 19 24 38 26
a. Presente el modelo aditivo lineal y describa cada uno de sus componentes en términos del
experimento.
b. ¿Se cumple el supuesto de homogeneidad de variancias?. Usar = 0.01.
c. Presente el cuadro ANVA y pruebe la hipótesis respectiva. Usar = 0.05.
d. Descomponga Y34 en sus efectos estimados e intérprete los resultados.
70
Métodos Estadísticos para la Investigación experimental
71
CAPÍTULO V
1. INTRODUCCIÓN
2. CARACTERISTICAS
- Las unidades experimentales se distribuyen en grupos o en bloques bajo el criterio de
homogeneidad dentro de grupos y heterogeneidad entre grupos.
- En cada bloque el número de unidades experimentales es igual al numero de
tratamientos (bloques completos).
- Los tratamientos son asignados aleatoriamente en las unidades experimentales dentro
de cada bloque.
- Los números de bloques, puede ser igual o diferente al numero de tratamientos.
3. VENTAJAS
- En general es más preciso que el diseño completamente al azar
- Es simple y fácil de planificar.
- Las unidades experimentales perdidas no causan mucha dificultad.
- Es flexible con relación al número de tratamientos y repeticiones.
4. DESVENTAJAS
- No es apropiado para un número elevado de tratamientos, debido a que aumenta el
tamaño del bloque y como consecuencia aumenta la variabilidad dentro de cada
bloque y por ende el error experimental.
- Si en la fuente de variabilidad para los bloques no existe diferencias estadísticas, no
hay ganancia en precisión con respecto al diseño completo randomizado, y por el
contrario puede haber perdida por la disminución de los grados de libertad del error.
5. USOS
- Son utilizados en experimentos de campo, laboratorio, etc.
- Se utilizan en cultivos anuales y perennes.
Yij t i j ij
Para i = 1,2,3,..... t tratamientos j= 1,2,3,..... r bloques
Donde:
Para
i = 1,2,3,..... t tratamientos
J = 1,2,3,..... r bloques
CALCULO DE LAS SUMAS DE CUADRADOS
OBTENCIÓN DEL FACTOR DE CORRECCIÓN
(Total ) 2 Y2
C ..
( Número de respuestas( N de panelistas )).( N de tratamient os) B.T
B: Número de bloques
T: Número de tratamientos
SUMA DE CUADRADOS PARA EL TOTAL
t r
S .C.total Yij2 C
i 1 j 1
SUMA DE CUADRADOS PARA TRATAMIENTOS
t
Y 2
i.
SCtratamiento i 1
C
B
SUMA DE CUADRADOS PARA BLOQUES
r
Y
j 1
2
.j
SC Panel SCbloques C
T
SUMA DE CUADRADOS PARA EL ERROR
SCerror SCTotal SCtratamiento SCbloque
8. ESQUEMA DEL ANÁLISIS DE VARIANCIA
FV GL SC CM FC
Tratamiento (B-1) SC tratam. CM tratam. CM tratm.
CM error
Bloques (T-1) SC bloques CM bloq. CM bloq.
CM error
Error Experim (B-1) (T-1) SCerror CMerror
TOTAL BT-1 SCtotal
3. PRUEBAS DE HIPOTESIS
a. Plantear la hipótesis para tratamientos
Ho : T1 = T2 = T3 = ...... = Tt
Ha : T1 T2 T3 ...... Tt para i = 1,2,3, ................ , t tratamientos
EJERCICIO. UN DBCA.
73
Elías Alberto Torres Armas, Lic. Ms. C.
144
74
Métodos Estadísticos para la Investigación experimental
ANVA
Determinación de S y
i y j
CM error 0.48716
Sy = 0.1645127
i y j
r 18
AES (T) Tabla : 4.36067
ALS (T) = 0.1645127 x 4.36067 = 0.717386
Ordenamiento de los promedios de tratamientos:
Tratamiento T4 T8 T1 T7 T2 T6 T3 T5
75
Elías Alberto Torres Armas, Lic. Ms. C.
Regla de decisión:
Si Y i Y j ALS (T ) se acepta Ho
Y i Y j ALS (T ) se rechaza HO
Número de comparaciones posibles: 8(8-1)/2=28
Comparación y significación
Comparación d ALS (T) Acepta/rechaza Signif = 0.05
I – II 0.8333 > 0.717386 u4 u8 *
I – III 1.0000 > 0.717386 u4 u1 *
I – IV 1.4444 > 0.717386 u4 u7 *
I–V 1.5555 > 0.717386 u4 u2 *
I – VI 1.8333 > 0.717386 u4 u6 *
I – VII 2.2778 > 0.717386 u4 u3 *
I – VIII 2.2778 > 0.717386 u4 u5 *
II – III 0.1667 < 0.717386 u8 = u7 n.s
II – IV 0.6111 < 0.717386 u8 u2 n.s
II –V 0.7222 > 0.717386 u8 u6 *
II – VI 1.0000 > 0.717386 u8 u3 *
II – VII 1.4445 > 0.717386 u8 u5 *
II – VIII 1.4445 > 0.717386 u1 = u7 *
III – IV 0.4444 < 0.717386 u1 = u2 n.s
III –V 0.5555 < 0.717386 u1 u6 n.s
III – VI 0.8333 > 0.717386 u1 u3 *
III – VII 1.2775 > 0.717386 u1 u5 *
III –VIII 1.2778 > 0.717386 u7 = u2 *
IV – V 0.1111 < 0.717386 u7 = u6 n.s
IV – VI 0.3889 < 0.717386 u7 u3 n.s
IV – VII 0.8334 > 0.717386 u7 u5 *
IV – VIII 0.8334 > 0.717386 u2 = u6 *
V –VI 0.2778 < 0.717386 u2 = u6 n.s
V-VII 0.7223 > 0.717386 u2 u3 *
V-VIII 0.7223 > 0.717386 u2 u5 *
V –VII 0.4445 < 0.717386 u6 = u3 n.s
VI-VIII 0.4445 < 0.717386 u6 = u5 n.s
VI –VIII 0 < 0.717386 u3 = u5 n.s
Tratamiento T4 T8 T1 T7 T2 T6 T3 T5
76
Métodos Estadísticos para la Investigación experimental
b) Literalmente.
Tratamiento T4 T8 T1 T7 T2 T6 T3 T5
A A A
B B B
C C C
D D
E E E
F F
c) Utilizando un cuadro de doble entrada:
T4 T8 T1 T7 T2 T6 T3 T5
T4 - 0.8333 * 1.000 * 1.444 * 1.556 * 1.833 * 2.278 * 2.278 *
T8 - 0.167 0.611 0.722 * 1.000 * 1.4445 * 1.4445 *
T1 - 0.444 0.556 0.833 * 1.278 * 1.2778 *
T7 - 0.111 0.389 0.833 * 0.833 *
T2 - 0.278 0.722 * 0.722 *
T6 - 0.445 0.445
T3 - 0
T5 -
Conclusiones.
Podemos afirmar a un nivel de 5% de probabilidad, que el encurtido T 3 y T5, son mejores que
los otros tratamientos, alcanzando el calificativo por los panelistas de gusten moderadamente.
1) Se quiere saber el grado de aceptación entre los panelistas del producto en evaluación
(yogurt ) los cuales dan la siguiente puntuación.
Bloque T1 T2 T3 TOTAL
1 8 8 9 25
2 10 9 8 27
3 7 10 6 23
4 8 9 8 25
5 9 8 9 26
6 9 7 7 23
7 8 8 6 22
8 7 7 8 22
9 8 10 9 27
10 9 9 9 27
TOTAL 83 85 79 247
Hipótesis:
Ho : T1= T2 = T3 = T4
Ha : T1 T2 T3 T4
77
Elías Alberto Torres Armas, Lic. Ms. C.
α= 5% C = ( 247 )2 = 2033.63
30
Cálculos:
SC Bloque = total -C
= 43.37
Grados
Fuente de Suma de de Promedio de
variacion cuadrados libertad los cuadrados F Significancia
Bloque 12.70 9 1.41 0.88 ns
Tratamiento 1.87 2 0.935 0.58 0 ns
Error 28.80 18 1.6
Total 43.37 29
Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en la
tabla por lo tanto esta en el rango de significan cía.
Conclusión: No existe diferencia significativa entre los bloques ni tratamientos. Realice la
prueba Duncan de comparaciones múltiples
78
Métodos Estadísticos para la Investigación experimental
9 B 4 A 6 C 4 14
10 C 5 A 7 B 4 16
TOTAL 51 51 53 155
Hipótesis: Ho : T1= T2 = T3 = T4
Ha : T1 T2 T3 T4
Nivel de significación Factor de corrección
α= 5% C = ( 155 )2 = 800.83
30
Ordenando datos :
Sabor del helado
Panelista A B C TOTAL
1 5 4 6 15
2 5 7 6 18
3 5 6 4 15
4 4 4 7 15
5 4 7 6 17
6 5 5 5 15
7 6 4 5 15
8 4 4 7 15
9 6 4 4 14
10 7 4 5 16
TOTAL 51 49 55 155
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los
variaciones cuadrados libertad cuadrados F Significancia
Panelista 4.17 9 0.463 0.25 o
Posición 0.27 2 0.135 0.072 o
Tratamiento 1.87 2 0.935 0.501 o
Error 29.86 16 1.866
Total 36.17 29
Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en
la tabla por lo tanto esta en el rango de significan cía.
79
Elías Alberto Torres Armas, Lic. Ms. C.
3 X 5 3 4 12
4 4 3 4 5 16
TOTAL 10 14 13 16 53
Hipótesis: Ho : T1= T2 = T3 = T4
Ha : T1 T2 T3 T4
Nivel de significación ŷ = T ( Y n) + B ( Y.n ) - Y
α= 5% ( T-1 ) ( B – 1)
= 4 ( 12 ) + 4 (10 ) – 53 = 3.89
3x 3
Factor de corrección:
C = ( 56.89 )2 = 202.28
16
BLOQUES
Tratamientos A B C D TOTAL
1 2 3 4 5 14
2 4 3 2 2 11
3 3.89 5 3 4 15.89
4 4 3 4 5 16
TOTAL 13.89 14 13 16 56.89
ANÁLISIS DE VARIANZA
Origen de las Grados de Promedio de los
variaciones Suma de cuadrados libertad cuadrados F Significancia
Bloque 1.20 3 0.4 0.303 O
Tratamiento 4.093 3 1.364 1.03 O
Error 10.5591 8 1.32
Total 15.8521 14
Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en
la tabla por lo tanto esta en el rango de significan cía.
Doce personas excedidas en pesos, participan en un estudio para comparar, tres regimenes
para reducir el peso, para lo cual utilizamos un producto con bajas calorías. Los sujetos se
distribuyeron en cuatro grupos de acuerdo a su peso inicial y cada uno de los tres sujetos de
cada grupo fue asignado aleatoriamente a uno de los tres regimenes reductores. Al final del
experimento se registraron las perdidas de peso en kilogramos.
80
Métodos Estadísticos para la Investigación experimental
Yi 59 51 50
Promedio Yi 14.75 2.75 12.5 Y.. = 160
A. HIPOTESIS
H0 : T1 =T2 = T3 = T4 = T5
Ha : T1 = T2 = T3 = T4 = T5
ANVA
FV GL SC CM Fc Ft Significancia
Bloques (peso 3 44.667 14.889 23.3065 9.73 **
inicial)
Tratamiento 2 12.167 6.0835 9.5228 10.92 Ns
(regimenes)
Error 6 3.833 0.6388
Total 11 60.667
C. CONCLUSION
En conclusión no hay evidencia estadística suficiente como para rechazar la hipótesis.
No existen diferencias significativas entre los efectos de los regimenes aplicados para
reducir de peso.
D. PRUEBA DE COMPARACIONES.
PRUEBA DE TUKEY
CME =0.6388
r = 4 AES(t)= 6.33
CME
ALST AEST
r
81
Elías Alberto Torres Armas, Lic. Ms. C.
ALS(T) = 2.5296
3. Comparación de los promedios y significación
Diferencias ALS(D) Conclusiones
14.75 – 12.75 = 2 2.5296 Se acepta la Hp
14.75 – 12.50 = 2.25 2.5296 Se acepta la Hp
12.75 – 12.50 = 0.25 2.5296 Se acepta la Hp
4. CONCLUSIÓN
En conclusión no existen diferencias significativas entre ninguno de los efectos de los
regímenes aplicados para reducir el peso.
Para esto intervienen 18 panelistas entrenado que recibieron una muestra testigo de (40 0Brix )
y 3 muestras debidamente codificadas en relación al testigo, los panelistas evaluaron las
muestras según la escala de comparación múltiple de 9 puntos, donde: Escala:
82
Métodos Estadísticos para la Investigación experimental
Total 69 86 74 86 315
Se desea saber qué cantidad de grados Brix da un mejor sabor a la fruta confitada de mango a
un nivel de 5% de probabilidad. Para calcular el análisis de varianza, confeccionar el siguiente
cuadro auxiliar ordenados en función a los tratamientos.
3152
SC TOTAL 62 ... 42 1511 1378.125 132.875
18 4
97 2 ... 652 3152
SC TRATAMIENT O 1407.94 1378.125 29.815
18 18 4
692 ... 862 3152
SC POSICION 12.375
18 18 4
222 ... 222 3152
SC PANELISTA 1426 1378.125 47.875
4 18 4
B. HIPOTESIS
H0 = TA = TB = TC = TD
Ha = TA ≠ TB ≠ TC ≠ TD
CUADRO N° 3. ANVA
FV GL SC CM Fc Significancia
Tratamiento 3 29.815 9.9383 11.142 * *
Panelistas 17 47.875 2.816
Posición 5 12.375 4.125
Error 48 42.81 0.892
83
Elías Alberto Torres Armas, Lic. Ms. C.
Total 71 132.875
*: Existe diferencia significativa con una seguridad del 95% de probabilidad.
* *: Existe diferencia altamente significativa con una seguridad del 99% de
probabilidad.
D. CONCLUSION
Se observa que los tratamientos resultan altamente significativos que conlleva a una
comparación de promedios, como el testigo ha sido comprobado en tres minutos entonces la
prueba apropiada es la Dunnet. Complete el cálculo de la suma de cuadrados y realice la
prueba de comparación múltiple Dunnett.
84
Métodos Estadísticos para la Investigación experimental
CAPÍTULO VI
4. INTRODUCCIÓN
Es el diseño estadístico cuya aplicación cada día es mas frecuente, ya que los
investigadores, conociendo la sencillez en el planteamiento y análisis, hacen
conclusiones muy adecuadas.
5. CARACTERÍSTICAS
6. VENTAJAS.-
7. DESVENTAJAS.-
85
Elías Alberto Torres Armas, Lic. Ms. C.
- Número limitado de tratamientos, porque t=r=c. Rara vez se utiliza com más de 10
tratamientos.
- El diseño es rígido en el número de repeticiones y en agrupar los tratamientos en
filas y en columnas en tal forma que ningún tratamiento se repita en fila ni en
columna.
8. USOS
9. RESTRICCIONES
DCL 4x4
A B C D
B C D A
C D A B
D A B C
DCL 5x5
A B C D E
B C D E A
C D E A B
D E A B C
E A B C D
86
Métodos Estadísticos para la Investigación experimental
D C A B 2
A D B C 3
B A C D 4
3º Permutación de filas (sortear las filas)
B A C D 4
Filas
C B D A 1
A D B C 3
D C A B 2
87
Elías Alberto Torres Armas, Lic. Ms. C.
Se podrá disponer de este último para llevar a cabo el experimento. Con cuadrados
latinos de mayor número de tratamientos se procede en forma similar.
11. ANALISIS
Donde:
88
Métodos Estadísticos para la Investigación experimental
ANALISIS DE VARIANZA
89
Elías Alberto Torres Armas, Lic. Ms. C.
Y 2
(i )
Y..2
SCtratamiento i 1
2
t t
SUMA DE CUADRADOS PARA FILAS
t
Y 2
j.
Y..2
SC filas i 1
t t2
SUMA DE CUADRADOS PARA COLUMNAS
t
Y 2
.k
Y..2
SC columnas i 1
2
t t
SUMA DE CUADRADOS PARA EL ERROR
S.C.error SCtotal SCtratamiento SC filas SCcolumnas
También
t t t
t r Y 2
(i ) Y 2
j. Y 2
.k
Y..2
S .C.total Y 2
ij
i 1
i 1
i 1
2
i 1 j 1 t t t t
SOLUCION:
90
Métodos Estadísticos para la Investigación experimental
H0 : i 0 i
H a : i 0 para almenos a lg ún i
H 0 : i 0 i
H a : i 0 para almenos a lg ún i
t r
Y..2 1260 2
SCtotal Yij2 600 2 ... 800 2 10315300 10064756,25
i 1 j 1 t 16
SCtotal 250543.75
SUMA DE CUADRADOS PARA TRATAMIENTOS
t
Y 2
Y..2 27802 30302 33302 35502 12602
(i )
SCtratamiento i 1
t t2 4 16
SCtratamiento 10150175 10064756.25 85418.75
Y 2
Y..2 2870 2 3270 2 2770 2 3780 2 1260 2
j.
SC filas i 1
t t2 4 16
SC filas 10222775 10064756.25 158018.75
Y 2
Y..2 3210 2 3220 2 3190 2 3070 2 1260 2
.k
SC columnas 2
i 1
t t 4 16
SC columnas 10068375 10064756.25 3618.75
SCerror=250543.75-3618.75-158018.75-85418.75=3487.5
F de V SC gl CM Fc
Lactaciones 3618.75 3 1206.25 2.07526882
Razas 158018.75 3 52672.9167 90.6200717
Tratamientos 85418.75 3 28472.9167 48.9856631
Error 3487.5 6 581.25
Total 250543.75 15 16702.9167
91
Elías Alberto Torres Armas, Lic. Ms. C.
Decisión:
Conclusión
92
Métodos Estadísticos para la Investigación experimental
CAPÍTULO VII
1. Diagrama de dispersión: gráfica que describe la relación entre las dos variables de interés.
Variable dependiente: la variable que se pronostica o estima. Variable independiente: la
variable que proporciona la base para la estimación. Es la variable predictora.
2. Modelo de regresión lineal simple. Propósito: determinar la ecuación de regresión; se usa
para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X).
El modelo es: Yi 0 1 X i i
3. Estimación de los parámetros del modelo de regresión. Procedimiento: seleccionar una
muestra de la población y enumerar los datos por pares para cada observación; dibujar un
diagrama de dispersión para visualizar la relación; determinar los estimadores de los
parámetros 0 , y 1 del modelo de regresión. La ecuación de regresión estimada es:
Yˆ b0 b1 x , Donde:
Yˆ Es el valor promedio pronosticado de Y para cualquier valor de X.
b0: Es el estimador de 0 , es la intercepción en Y, o el valor estimado de Y cuando X = 0
b1: Es el estimador de 1 , es la pendiente de la recta, o cambio promedio en Yˆ por cada
cambio de una unidad en X
Para el cálculo de a y b, se usa el método de mínimos cuadrados ordinarios:
x y
xy n SP. XY Suma de productos XY y b x
b1 , b0
( x) 2 1
SC. X suma de cuadrados de X n n
x 2
n
93
Elías Alberto Torres Armas, Lic. Ms. C.
( y ) 2
SCT y2 n
SCR 1 ( xy
x y ) ó SCR ( x 2 2
( x) 2
1
n n
SCE SCT SCR
S y. x
(Y Yˆ ) 2
y 2
b0 y b1 xy
ó S y. x
SCE
CME
n2 n2 n2
CME CME
Var (b1 ) s b1
SCX SCX
( x 2 )CME ( x 2 )CME
Var (b0 ) s b1
nSCX nSCX
94
Métodos Estadísticos para la Investigación experimental
Hipótesis H 0 : 1 0
H 1 : 1 0
PARA 1 Nivel de significac ión :
b1
Estadistic a de prueba : t c t n 2;
s b1
Decisón : Re chazar H 0 si t c t n 2; prueba bilateral
si t c t n 2; prueba unilateral izquierda
si t c t n 2; prueba unilateral derecha
Análisis de correlación: se usa un grupo de técnicas estadísticas para medir la fuerza de la
relación (correlación) entre dos variables. Coeficiente de correlación, r: El coeficiente de
correlación (r) es una medida de la intensidad de la relación entre dos variables. Requiere datos
con escala de intervalo o de razón (variables). Puede tomar valores entre -1.00 y 1.00. Valores de
-1.00 o 1.00 indican correlación fuerte y perfecta. Valores cercanos a 0.0 indican correlación
débil. Valores negativos indican una relación inversa y valores positivos indican una relación
directa. Fórmula para r
x y
xy n SCR SCE
r ó r 1
( x) 2 ( y ) 2 SCT SCT
( x 2
)( y
2
)
n n
Correlación negativa perfecta
95
Elías Alberto Torres Armas, Lic. Ms. C.
Hipótesis H0 : 0
H1 : 0
Nivel de significac ión :
r n2
Estadistic a de prueba : t c t n 2;
1 r2
Decisón : Re chazar H 0 si t c t n 2; prueba bilateral
si t c t n 2; prueba unilateral izquierda
si t c t n 2; prueba unilateral derecha
5. Predicción. El intervalo de confianza (de predicción) de 100(1-α)% para la media de Y dado
un valor de X está definido por:
1 ( X X )2 1 ( X X )2
yˆ t CME ( Y ˆ
y t CME (
n 2;1 n SCX n 2;1 n SCX
2 2
El intervalo de predicción (de predicción) de 100(1-α)% para un valor individual de Y dado
un valor de X se define por:
1 ( X X )2 1 ( X X )2
yˆ t CME (1 Y yˆ t CME (1
n 2;1 n SCX n 2;1 n SCX
2 2
Ejemplo. Se efectuó un experimento para evaluar el efecto el zinc en el peso de las cacatúas.
En el experimento, a 7 grupos de cacatúas adultas se les dio diferentes dosis de zinc y sus
pérdidas de peso tras la primera semana fueron registradas. Los datos de los pesos medios
por grupo al final de la semana están expresados como porcentajes sobre los pesos iniciales.
X(Ingesta Y(Peso
X2 Y2 XY
de zinc) medio %)
1 0 100 0 10000 0
2 2 92 4 8464 184
3 4 95 16 9025 380
4 8 90 64 8100 720
5 12 98 144 9604 1176
6 16 85 256 7225 1360
7 30 67 900 4489 2010
SUMA 72 627 1384 56907 5830
X Y 72 627
XY n
5830
7
1 , 1 -0.96225577
X 2 72
2
X n 2 1384
7
0
Y X 627 0.96225577 72 , 0 99.4689165
n
1 n 7 7
Ecuación: Y 0 1 X Y 99.4689165 - 0.96225577 X
X Y 72 627
CORRELACIÓN: XY n
5830
7
X2 X
2
Y 2 Y
2
1384
72 2
56907
627 2
n
n
7 7
96
Métodos Estadísticos para la Investigación experimental
0.89382905
Coeficiente de determinación: 2 - 0.893829052 2 0.79893037
Nota : El 80% de “Y” depende de “X”
ANÁLISIS DE VARIANZA:
Hipótesis
Y 2
627 2
SCTOTAL Y 2
56907 745.714286
n 7
X 2
-0.962255771384 72
2
SC REGRESIÓN 1 X
2
595.7737884
n 7
SC ERROR SCTOTAL SC REGRESION 745.714286 - 595.7737884 149.9404973
Cuadro ANVA:
F.V. S.C. G.L. C.M. F.C. Sig.
Regresión 595.7737884 1 595.7737884 19.8670072 **
Error 149.9404973 5 29.98809947
TOTAL 745.7142857 6
Decisión: Ft = F (1,5)0.05 = 3.84. Fc > Ft entonces se rechaza H0.
Conclusión: Existe suficiente evidencia estadística de que existe regresión lineal entre x e
y.
97
Elías Alberto Torres Armas, Lic. Ms. C.
CAPÍTULO VIII
1.1. INTRODUCCIÓN:
REGRESIÓN: Consiste en determinar una relación funcional entre las variables con el fin de
que se pueda predecir el valor de una variable (dependiente) en base a otra(s) variables
(independientes).
Los modelos para un análisis de regresión múltiple son similares a los de regresión lineal simple,
excepto que contienen más términos y pueden servir para proponer relaciones más complejas que
una línea recta en lugar de usar un modelo de línea recta E(y) =β0 + β1 X , para modelar el
componente determinístico podríamos emplear el modelo cuadrático E(y) =β0 + β1X + β2X2
También conocido como modelo de segundo orden se representa gráficamente como una
parábola en contraste con los modelos de línea recta o modelos de primer orden.
Si por añadidura pensamos incluir en el modelo otra variable una gráfica de E(y) como función
de X1, X2 describe una superficie de respuesta en el plano (X 1,X2) y el modelo de primer orden
es: E(y) =β0 + β1 X1 + β1X2 (describe una superficie plana) sin embargo en la mayor parte de
las aplicaciones de la vida real esperaríamos una curvatura en la superficie de respuesta y
utilizaríamos un modelo de tercer orden: E(y) 0 1 X1 2 X 2 3 X1 X 2 4 X12 5 X 23
para modelar la relación.
98
Métodos Estadísticos para la Investigación experimental
Estos modelos e denominan modelos lineales generales porque E(y) es función lineal de los
PARÁMETROS desconocidos
β0, β1, β2...
1 X
El modelo E ( y ) 0 no es un modelo lineal porque E(y) no es función lineal de los
parámetros β0 + β1
E(y) 0 1 X 1 2 X 2 3 X 3 4 X 4 5 X 5 6 X 6
Las variables ficticias introducen al parámetro β apropiado ( de que puede ser positivo o
negativo) dependiendo del día de la semana. Así: En domingo X1= 1, X2 = X3, ...., = X6 = 0 y el
valor medio de Y es:
99
Elías Alberto Torres Armas, Lic. Ms. C.
Y = E(y) + ε
Componente
aleatorio
Componente
Determinístico
El componente aleatorio ε debe obedecer los supuestos del modelo de regresión lineal:
Tenga distribución normal con media 0 y varianza σ2. Esto implica que la media de Y
equivale al componente deterministico
E(y) 0 1 X 1 ... k X k
Para todos los valores de las variables independientes X1, X2, X3,..., Xk la varianza de ε es
constante.
Las relaciones entre la variable Y con las variables X1, X2, X3, ..., Xk, donde cada observación (Xi1
Xi2 Xi3 ... Xik , Y) satisface el modelo lineal general de regresión siguiente:
Yi 0 1 X i1 2 X i 2 3 X i3 ... k X ik i
100
Métodos Estadísticos para la Investigación experimental
X1, X2, X3, ..., Xk: variables independientes. Podrían en realidad representar los
cuadrados cubos productos cruzados u otras funciones
(sen, log. Etc.) de las variables de predicción. Lo esencial es
que se pueden medir sin error cuando se observe un valor
de Y y que no intervengan parámetros desconocidos.
βj: Parámetros de la regresión . constantes desconocidas.
Expresan el incremento en la variable respuesta Y que se
corresponde a una unidad de incremento en Xj cuando
otras variables Xi i j se mantienen constantes.
εi: Vector aleatorio de errores supuestos.
Los coeficientes βj : 0,k son estimados por el método de mínimos cuadrados, así:
El modelo:
Yi 0 1 X i1 2 X i 2 3 X i3 ... k X ik i
Despejando εi y elevando al cuadrado ambos miembros:
(εi)2= (Yi ( 0 1 X i1 2 X i 2 3 X i 3 ... k X ik ))
2
Derivando parcialmente con respecto a β j e igualando a cero buscamos minimizar la suma de los
cuadrados del error aleatorio:
n n
i
2
(Yi Yˆi ) 2 SSE
i 1 i 1
Obteniéndose un sistema de ecuaciones lineales simultaneas llamadas ecuaciones normales de
mínimos cuadrados del modelo:
SSE
0
0
SSE
0
1
SSE
0
2
.
.
.
SSE
0
k
Examinemos la primera ecuación:
101
Elías Alberto Torres Armas, Lic. Ms. C.
SSE n
2 (Yi ( 0 1 X i1 2 X i 2 3 X i 3 ... k X ik ))(1)
0 i 1
Como puede verse, escribir k+1 ecuaciones lineales de mínimos cuadrados ya cuesta trabajo,
resolverlos simultáneamente a mano es todavía más difícil. Una forma fácil de expresar las
ecuaciones y resolverlos es mediante el álgebra de Matrices y obtener fórmulas para las
estimaciones de los coeficientes de regresión lineal de mínimos cuadrados, SSE, estadísticas de prueba, intervalos de
confianza y de predicción.
102
Métodos Estadísticos para la Investigación experimental
Datos Y X1 X2 X3... Xk ε
1 Y1 X11 X12 X13...X1K ε1
2 Y2 X21 X22 X23...X2K ε2
3 Y3 X31 X32 X33...X3K ε3
. . . . . ....
. . . . . ....
. . . . . ....
n Yn Xn1 Xn2 Xn3… Xnk εk
En notación matricial:
En forma desarrollada puede verse así:
103
Elías Alberto Torres Armas, Lic. Ms. C.
OBSERVACIONES:
La primera columna de X es una columna de unos, es decir estamos insertando un valor
de X, específicamente X0 como coeficiente de βo donde X0 es una variable que siempre
toma valores iguales a 1.
Hay una columna en la matriz X para cada parámetro β
Un punto de datos en particular se identifica mediante filas específicas de las matrices Y y
X. Ejemplo: el Valor de Y para el punto de datos 3, osea y 3 está en la tercera fila de la
matriz Y y sus valores correspondientes de X1 X2 X3 … Xk aparecen en la tercera fila de
la matriz X.
Con ésta notación el modelo lineal general se pude expresar en la forma de matriz como:
Y = Xβ + ε
La matriz β contiene a los parámetros βo, β1, β2, β3,…,βp de modo que resolver el sistema
nos dará como resultado, las estimaciones de mínimos cuadrados de cada uno de ellos,
denotados por:
ˆ ( ˆ 0 ˆ1 ˆ 2 ˆ 3 ˆ ) ' y el modelo de estimación es
y Xˆ , donde y Yˆ
Ahora bien:
* El modelo: y Xˆ
Despejando ε
y Xˆ
104
Métodos Estadísticos para la Investigación experimental
Se obtiene:
Derivando con respecto a ̂ para minimizar ' que es la suma de cuadrados del
error:
'
2 X ' y 2 X ' Xˆ
ˆ
Igualando a cero:
Por tanto:
= (X’X)-1X’y
105
Elías Alberto Torres Armas, Lic. Ms. C.
SE ESCRIBE:
El producto resulta:
(X’X)-1 = (1/|X’X|)adjunta(X’X)
1 1 1 1 Y1 Yi1
X Y
X11 X 21 X 31 X n1 Y2 i1 1
X12 X 22 X32 X n2 Y3 X i 2Y2
X ' Y X13 X 23 X33 X n3 . X i 3Y3
.
. .
Y
X1k X 2k X3k X nk pxn n nx1 X ikYn px1
106
Métodos Estadísticos para la Investigación experimental
0
1
ˆ ( X ' X ) X ' Y 2
1
K
Yˆ Xˆ
Var-cov( ̂ )= 2 ( X ' X ) 1
Demostración:
Observe que:
ˆ ( X ' X ) 1 X ' Y donde Y X
ˆ ( X ' X ) 1 X ' ( X )
ˆ ( X ' X ) 1 X ' X ( X ' X ) 1 X '
ˆ ( X ' X ) 1 X '
ˆ ( X ' X ) 1 X '
107
Elías Alberto Torres Armas, Lic. Ms. C.
Los elementos que están fuera de la diagonal proporcionan valores necesarios para calcular las
covarianzas de los parámetros, digamos
̂ j , ̂ i Donde i j
cov( ˆ i ˆ j )= cij 2 c ji
2
108
Métodos Estadísticos para la Investigación experimental
Hipótesis
H0: β1= β2= β3=…=βK=0
H1: Por lo menos uno de los parámetros es distinto de cero
ANÁLISIS DE VARIANZA
Fuente de Suma de G. L. Cuadrados FC
Variación cuadrados medios
REGRESIÓN SCR K CMR CMR/CME
ERROR SCE n-p CME
TOTAL SCT n-1
El rechazo de H0 implica que al menos una de las variables de regresión tienen una contribución
significativa en el modelo.
109
Elías Alberto Torres Armas, Lic. Ms. C.
ˆ j
TO
ˆ 2 c jj
DECISIÓN:
Rechazar H0 si |To|> tn-p para un % de significación
CONCLUSIÓN
Si no se rechaza la hipótesis H0 indica que el regresor Xj puede eliminarse del modelo
SSR SSE
R2 1 , 0 R2 1
SCT SCT
R2 grande no necesariamente implica que el modelo de regresión sea bueno, pues la adición de
una variable al modelo siempre aumenta R2 sin importar si la variable es o no estadísticamente
significativa.
R 2 R Es el coeficiente de correlación múltiple entre Y y el conjunto de variables de
regresión X1 X2 X3 … Xk
R es una mediad de asociación lineal que existe entre Y y X1 X2 X3 … Xk. Cuando k=1
tenemos el coeficiente de correlación simple entre Y y X
110
Métodos Estadísticos para la Investigación experimental
venta desempeño
conocimientos experiencia
vendedor semanal laboral
Y X1 X2 X3
1 5 4 2 3
2 12 7 5 4
3 4 3 1 6
4 8 6 4 4
5 11 10 6 7
111
Elías Alberto Torres Armas, Lic. Ms. C.
112
Métodos Estadísticos para la Investigación experimental
a) Qué sueldos estimaría usted para un profesor con 5 años de experiencia una
calificación del director de 72
b) Realice una prueba de hipótesis global para determinar alguno de los coeficientes de
regresión netos son diferentes de cero. Margen de error de 5%.
c) Realice una prueba de hipótesis para los coeficientes individuales de regresión
¿Considera usted eliminar cualquiera de las variables independientes usar un nivel de
significancia de 1% y 5%.
d) Determine los residuos.
e) Probar si la variable años de experiencia debe estar en el modelo de regresión usar los
coeficientes de correlación parcial, con un error del 5%.
f) Encontrar los intervalos de confianza para 1 y 2, con 1% de error.
113
Elías Alberto Torres Armas, Lic. Ms. C.
CAPÍTULO IX
ANALISIS DE COVARIANZA
En cada caso, se entiende que la variable X tiene un efecto en la variable Y, sin embargo
esta dependencia deberá ser probada estadísticamente mediante el ANALISIS DE
REGRESION.
114
Métodos Estadísticos para la Investigación experimental
En algunos casos puede existir más de una variable externa caso multivariante, ejemplo
X1, X2, X3. Este caso puede resolverse matricialmente y con ayuda del computador
porque los procesos manuales son tediosos.
CARACTERISTICAS
a) Técnica estadística que asocia el análisis de varianza y el análisis de regresión con el objeto
de controlar, en forma indirecta el error experimental al tomar en cuenta la presencia de
una variable concomitante (X) o acompañante a la variable principal (Y) acerca de la cual
se debe obtener conclusiones. Debe recordarse que una posibilidad de controlar el error
experimental en forma directa es mediante formación de grupos homogéneos o bloques.
Mediante la regresión se evalúa la influencia o no, de X en Y , la hipótesis es:
H 0 : 0 : No hay influencia de X en Y
H a : 0 : Si hay influencia de X en Y
Mediante el análisis de varianza se evalúa el efecto de los tratamientos:
H0 : 0 ó H 0 : 2 0 , según sea el modelo I o modelo II en los
experimentos simples.
MODELO ESTADISTICO
115
Elías Alberto Torres Armas, Lic. Ms. C.
ANÁLISIS DE VARIANZA
Se utiliza los criterios respectivos de cada diseño. Esto es, se utiliza las reglas prácticas para la
obtención de las sumas de cuadrados. Teniendo en cuenta a las variables X e Y, analizaremos al
DCA pudiendo extender este criterio al DBCA y DCL.
Ejemplo: (Extraido del trabajo “La nutrición minerales camote” realizado por Flor Milla A.
(1990) INIAA). Se desarrollo un DCA con desigual numero de repeticiones, su objetivo fue:
Comparar los rendimientos en parcela Kg/Parcela de las variedades Jonathan, Tiza y Urquirano
de camote. Se sospechó de la influencia de la profundidad de siembra en los rendimientos finales
la que de consideró como una covariable, por tanto se realizó un análisis de covarianza y el
modelo estadístico es el siguiente:
116
Métodos Estadísticos para la Investigación experimental
Y X T
35 21 1
39 26 1
36 22 1
45 28 1
43 29 1
44 34 2
38 26 2
39 29 2
27 18 2
24 23 3
32 29 3
40 30 3
21 16 3
28 29 3
19 14 3
Analizar/Modelo lineal general/univariante/ ingrese Y a variable dependiente, T a
factores fijos, X a covariable/modelopersonalizadopase factores y covariables a
modelo-efctos principalescontinuar/opciones-pase el factor a mostrar las medias
para-estadisticos descriptivos- estimaciones de los parámetros-comparar efectos
principales (selecciones DMS , bonferroni o sidack)-continuar/aceptar
Factores inter-sujetos
Etiqueta del valor N
Variedades de cammote 1 Variedad de camote Jonathan 5
2 Variedad de camote Tiza 4
3 Variedad de camote Urquiaro 6
117
Elías Alberto Torres Armas, Lic. Ms. C.
HIPÓTESIS
a) Para la regresión
H0: β = 0
Ha: β = 0
b) Para tratamientos
H0: τi = 0 para i=1,2,....,t
Ha: τi ≠ 0
Las evidencias muestrales indican que existe relación lineal entre profundidad de siembra y
rendimiento, se justifica entonces el ANCOVA.
Dado que p=0.000 es menor que 1% se afirma que las variedades en estudio son
significativamente diferentes en cuanto al rendimiento promedio (después de ajustar los datos
con la variable concomitante profundidad de siembra).
Para efectuar comparaciones de promedios éstos deben ajustarse o corregirse del efecto de la
variable concomitante
118
Métodos Estadísticos para la Investigación experimental
n
[T=1] 10.546 1.716 6.147 .000 6.770 14.322
[T=2] 6.377 1.864 3.420 .006 2.273 10.480
[T=3] 0(a) . . . . .
X 1.012 .135 7.520 .000 .716 1.309
a Al parámetro se le ha asignado el valor cero porque es redundante.
Variedades de camote
Estimaciones
Variable dependiente: Rendimiento en Kg/parcela
Intervalo de confianza
al 95%.
Variedades de camote Límite Límite
Media Error típ. inferior superior
Variedad de camote Jonathan 39.330(a) 1.256 36.565 42.095
Variedad de camote Tiza 35.161(a) 1.425 32.025 38.297
Variedad de camote Urquiaro 28.784(a) 1.162 26.226 31.343
a Las covariables que aparecen en el modelo se evalúan en los siguiente valores:
Profundidad de siembra en centímetros = 24.93.
119
Elías Alberto Torres Armas, Lic. Ms. C.
Grupos homogéneos
Conclusión: Existe un grupo homogéneo formado por la variedad Jonathan y Tiza que no
tienen diferencia significativa en el rendimiento medio, sin embargo la variedad Tiza tiene
rendimiento medio significativamente diferente a la variedad Urquiano que es de mínimo
rendimiento. La decisión será tomada entre tiza y Jonathan.
CAPÍTULO X
Los factoriales son combinaciones de factores (nitrógeno, fosforo, variedades, sustancias, niveles
de concentrado, etc.) para formar tratamientos, los cuales se aplican en los diseños
experimentales (DCA, DBCA, DCL). La información obtenida de estos experimentos es amplia,
ya que permiten comparar los niveles de cada factor entre si y evaluar las interacciones que
resulten como combinaciones de los factores, así como la comparación de niveles de un factor
bajo un nivel de otro factor.
En un experimento con factoriales, si todos los niveles de un factor se combinan con todos los
niveles de otro factor, entonces se dice que estos factores están cruzados. Si los niveles de un
factor se combinan con ciertos niveles de otro factor se dice que estos factores están anidados.
Ejemplo. Los niveles de un factor A a1, a2, y a3 se combinan con los niveles de un factor B b1,
b2 de la siguiente forma:
a1 a2 a3
b1 b2 b1 b2 b1 b2
Tratamientos: a1b1, a1b2, a2b1, a2b2, a3b1, a3b2
Los factores A y B están cruzados.
Ejemplo. Los niveles de un factor A: a1, a2, y a3 se combinan con los niveles de un factor B b 1,
b2, b3, b4, b5, b6 de la siguiente forma:
120
Métodos Estadísticos para la Investigación experimental
a1 a2 a3
b1 b2 b3 b4 b5 b6
Tratamientos: a1b1, a2b3, a2b4, a3b5, a3b6
El factor B esta anidado en A. Se representa como: B(A)
CONCEPTOS GENERALES
EFECTO PRINCIPAL.- Es el efecto promedio del factor sobre los otros niveles del mismo
factor independiente de los otros factores. Ejemplo: Efecto de nitrógeno en las unidades
experimentales al aplicar un abono formado por nitrógeno, fosforo y potasio.
EFECTO INTERACCION.- Es el efecto adicional debido a la influencia combinada de dos o
más factores. Ejemplo. Efecto conjunto Nitrógeno-Fosforo en la unidad experimental.
EFECTO SIMPLE.- Es el efecto de los niveles del factor en un nivel de otro factor. Ejemplo.
Efecto del nitrógeno bajo la presencia de 0.5 % de fosforo. Es un efecto derivado del efecto de la
interacción.
EFECTO SIMPLE.- Es el efecto de los niveles del factor a una combinación de los otros
factores, por ejemplo, el efecto del nitrógeno en las unidades experimentales, bajo la presencia de
0.5% de fosforo y 1% de Potasio.
TIPOS DE FACTORES
121
Elías Alberto Torres Armas, Lic. Ms. C.
b2: 0.1 µM
b3: 1.0 µM
b4:10.0 µM
Al combinar ambos factores A y B se tiene 3x4 = 12 tratamientos para ser evaluados.
Los factores se identifican con letras mayúsculas y los niveles con letras minúsculas, por ejemplo:
FORMACION DE FACTORIALES
Desventajas:
1. El número de unidades experimentales utilizadas es mayor que en experimentos simples y es
más difícil contar con un número suficiente de unidades que requiere el experimento.
2. El análisis se complica, a medida que el numero de factores y niveles aumenta.
122
Métodos Estadísticos para la Investigación experimental
3. Algunas combinaciones pueda que no sean de importancia, pero deben incluirse para
completar el factorial, esto obliga a usar mas unidades experimentales.
Factor A, con 3 niveles, factor B con 2 niveles. El numero de tratamientos son 3x2 = 6, con
grados de libertad igual a (6-1)= 5.
De lo efectos principales:
A con (2-1) = 1 gl.
B (3-1) = 2 gl.
C (2-1) = 1 gl.
De los efectos de la interaccion:
AB (2-1)(3-1) = 2 gl.
AC (2-1)(2-1) = 1 gl.
BC (3-1)(2-1) = 2 gl.
De los efectos de Doble interaccion:
ABC (2-1)(3-1)(2-1) = 2 gl.
La suma de grados de libertad son: 1+2+1+2+1+2+2 = 11; que son los correspondientes grados
de libertad de tratamientos.
Los cuadrados medios de estas fuentes se obtienen dividiendo la suma de cuadrados entre los
grados de libertad, y para la prueba de F, se divide cada CM con el CM del error, solo cuando se
tiene factores aleatorios o anidados, es necesario hallar los esperados cuadrados medios.
INTERACCION DE FACTORES
123
Elías Alberto Torres Armas, Lic. Ms. C.
La interacción de los factores juega un papel importante en el análisis, de ahí que las pruebas de
F, se realizan en el siguiente orden: primero la interacción de orden superior, luego la de menor
orden y por último los factores principales.
Si la interacción de mayor orden resulta significativa, termina las prueba del cuadro del ANVA y
se procede a los análisis de los efectos simples-simples, esto significa comparar los niveles de un
factor en la combinación de los otros factores.
Ejemplo.- ABC : ns
Continúan el análisis del ANVA.
AB : ns
AC : ns
BC : ns
Continúan el análisis del cuadro de ANVA, para los efectos principales de A, B y C.
Ejemplo.- ABC : ns
Continua el analisis del ANVA.
AB : *
AC : ns
BC : ns
Se prueban los efectos simples en cada factor (A y B), es decir comparar los niveles de A
bajo la presencia de cada nivel de B y comparar los niveles de B bajo la presencia de cada
nivel de A.
Luego continuar con el análisis en cuadro de ANVA solo para los efectos principales de
C.
Ejemplo.- ABC : ns
Continua el análisis del ANVA.
AB : *
AC : *
BC : ns
Se prueban los efectos simples en cada factor (A y B), en los factores (A y C) se
compararan los niveles de A bajo la presencia de cada uno de los niveles de C y en C se
comparan sus niveles bajo la presencia de cada uno de los niveles de A.
Ejemplo.- ABC : ns
Continua el análisis del ANVA.
AB : *
AC : *
124
Métodos Estadísticos para la Investigación experimental
BC : *
Se prueban los efectos simples en cada factor (A y B), en (A y C) y en (B y C).
El análisis de los efectos simples-simples y efectos simples pueden realizarse mediante la prueba
de F (las sumas de cuadrados) o una prueba comparativa de promedios (DLS, TUKEY).
Solo para los casos de factores fijos es válido el análisis de efectos simples-simples, simples o
promedios.
Ejemplo 6. A es fijo y B al azar, AB resulta (*), no procede los análisis de efectos simples.
Ejemplo 7. A es fijo y B es fijo, AB resulta (*), procede los análisis de efectos simples.
GRAFICO DE LA INTERACCION
En los siguientes gráficos se muestran los casos posibles de interacción en dos factores: A con 3
niveles y B con 2 niveles. En el eje X se registra los niveles de A y en el eje Y los promedios de la
interacción de A y B. Los puntos son unidos con una línea, para cada nivel de B.
EFECTOS SIMPLES
El análisis de los efectos simples se realiza cuando existe una interacción de dos factores por
ejemplo A y B. Los efectos simples se calculan a partir del cuadro de promedios de la
combinación de factores.
Los experimentos factoriales en si no constituyen un diseño experimental sino mas bien ellos
deben ser llevados a cualquiera de los diseños clásicos tales como DCA, DBCA, DCL etc. Por
diseño factorial se entiende aquel en el que se investigan todas las posibles combinaciones de los
niveles de los factores en cada ensayo completo o replica del experimento; es decir cuando los
factores están cruzados, cada combinación requiere al menos 1 repetición cada combinación.
Cada combinación se considera un tratamiento.
Debe usarse cuando existe homogeneidad en las unidades experimentales. El interés es comparar
el efecto de los tratamientos o el efecto de los niveles en cada uno de los factores y de la
interacción.
Esquema de campo
125
Elías Alberto Torres Armas, Lic. Ms. C.
a1 b1
A a2 B
a3 b2
niveles de A: 3
niveles de B: 2
t=3*2=6 tratam
si r=3
entonces:
n=t*r=18 unidades experimentales
Entonces:
Las combinaciones
a1 a2 a3
b1 b2 b1 b2 b1 b2
Los tratamientos
T1 T2 T3 T4 T5 T6
a1b1 a1b2 a2b1 a2b2 a3b1 a3b2
T4 T2 T1 T4 T2 T3
T1 T2 T6 T3 T6 T5
T5 T3 T1 T4 T5 T6
126
Métodos Estadísticos para la Investigación experimental
jB
i 1 2 … b Yi..
Y111 Y121
Y112
1
A …
Y11r
Y211
Y212
… Yijk
2 Y21r
…
Y.j. Y…
MODELO
A partir del modelo para el DCA con t tratamientos con dos factores
Ylk t l lk
Donde : l 1,2,3,..., t
k 1,2,..., r
Ai i
Bj j
ABij ij i j
ijk Yijk ij
PROCEDIMIENTO DE PRUEBA
i) Hipótesis
127
Elías Alberto Torres Armas, Lic. Ms. C.
H 0 : ij 0
H a : ij 0
H0: Todos los niveles del factor A tienen el mismo efecto
Ha: Al menos uno de los niveles del factor A tiene efecto diferente
H 0 : Ai 0
H a : Ai 0
H0: Todos los niveles del factor B tienen el mismo efecto
Ha: Al menos uno de los niveles del factor B tiene efecto diferente
H0 : Bj 0
Ha :Bj 0
H0: No existe interacción entre los factores
Ha: Si existe interacción entre los factores
H 0 : ABij 0 ij
H a : Al menos una ABij 0
ii) Nivel de significación: α
iii) Función de prueba: Fl=F del ANVA
iv) Valor tabular Ftab=Tabla F
v) Decisión: Rechazar H0 si F>Ftab
Para determinar el cociente o razón F para un factor se debe apreciar la distribución de los
cuadrados medios esperados. Tanto el numerador como el denominador del cociente deben tener
las mismas componentes (con igual ponderación) a excepción del numerador, donde debe
aparecer una componente más, que corresponde al factor que se va a probar.
F de V Gl SC CM F
Tratam ab-1 Tyy T T/E
A a-1 Ayy A A/E
B b-1 Byy B B/E
AB (a-1)(b-1) AByy AB AB/E
Error ab(r-1) Eyy E
Total abr-1 Wyy W
La sumas de cuadrados
Tyy
Y 2
ij ..
Y...2
Ayy
Y 2
i ..
Y...2
B yy
Y 2
. j ..
Y...2
r abr br abr ar abr
128
Métodos Estadísticos para la Investigación experimental
AB yy
Y 2
ij .
Y 2
i ..
Y 2
. j ..
Y...2
r br ar abr
E yy Yijk2
Y 2
ij .
r
2
Y
W yy Yijk2 ...
abr
La sumas de cuadrados:
Tyy
Y 2
ijk .
Y....2
Ayy
Y 2
i ...
Y....2
r abcr bcr abcr
Byy
Y Y
2
. j ..
2
....
C yy
Y Y....2 2
..k .
AB yy
Yij.. Yi... Y. j.. Y....
2 2 2 2
AC yy
Yi.k . Yi... Y..k . Y....2
2 2 2
BC yy
Y. jk . Y. j.. Y..k . Y....2
2 2 2
ABC yy
Yijk . Yi.k . Y. 2jk . Yij2.. Yi...2 Y. 2j .. Y..2k .
2
2
Y2
....
r br ar cr bcr acr abr abcr
E yy Yijkl 2
Yijk . 2
r
2
Y
W yy Yijkl 2
...
abcr
129
Elías Alberto Torres Armas, Lic. Ms. C.
Ejemplo I: Un ingeniero diseña uma bateria para su uso en un dispositivo que será sometido a
ciertas variaciones de temperatura. El único parâmetro de diseño que El puede seleccionar em
este punto ES El material de La cubierta de La bateria. El hace um ensayo de laboratório con 2
factores: tipo de material y temperatura(ºF), evaluando El resultado con La duración efectiva em
horas. Los datos ordenados se muestran a continuación:
3A3B
n=36 t=9 r=4
a1 a2 a3
b1 b2 b3 b1 b2 b3 b1 b2 b3
repeticiones a1b1 a1b2 a1b3 a2b1 a2b2 a2b3 a3b1 a3b2 a3b3
1 130 34 20 150 136 25 138 174 96
2 155 40 70 188 122 70 110 120 104
3 74 80 82 159 106 58 168 150 82
4 180 75 58 126 115 45 160 139 60
130
Métodos Estadísticos para la Investigación experimental
131
Elías Alberto Torres Armas, Lic. Ms. C.
Ahora reúna los ambos resultados, y se tendrá el cuadro ANVA resultante, así:
F(8,27)F(8,25)=2.34 al 5%
F(2,27)F(2,25)=3.39 al 5%
F(4,27)F(4,25)=2.76 al 5% Lo correcto será hacer una interpolación.
Otra forma para interpretar: Significación= p-Valor=pSi p es menor que α=5% (0.05) ó
[α=1% (0.01)] el efecto será significativo
Conclusión:
Respecto a tratamientos, existe al menos uno altamente significativo
Existe efecto altamente significativo del tipo de material sobre la duración de la batería.
Existe efecto altamente significativo de la temperatura sobre la duración de la batería.
132
Métodos Estadísticos para la Investigación experimental
133
Elías Alberto Torres Armas, Lic. Ms. C.
134
Métodos Estadísticos para la Investigación experimental
En un factorial en DBCA todos los tratamientos o combinación de niveles deben aparecer una
sola vez en cada bloque. El esquema de campo para un experimento 3A2B en 4 bloques:
El cuadro ANVA
F de V Gl SC CM F
Tratamientos ab-1 Tyy T T/E
A a-1 Ayy A A/E
B b-1 Byy B B/E
AB (a-1)(b-1) AByy AB AB/E
Bloques r-1 Ryy R R/E
Error (ab-1)(r-1) Eyy E
Total abr-1 Wyy W
La sumas de cuadrados
Tyy
Y 2
ij .. Y2
... Ayy
Y Y2
2
...
i ..
B yy
Y 2
. j.
Y...2
r abr br abr ar abr
135
Elías Alberto Torres Armas, Lic. Ms. C.
AB yy
Y 2
ij .
Y 2
i ..
Y 2
. j.
Y...2
r br ar abr
R yy
Y 2
..k
Y 2
...
ab abr
E yy Y 2
Y 2
ij .
Y 2
..k
Y...2
ijk
r ab abr
2
Y
W yy Yijk2 ...
abr
a1 a2 a3
Bloques Y..k
b1 b2 b1 b2 b1 b2
I 41 35 30 31 45 51 233 j 1 2
II 40 41 39 34 53 58 265 Y.j. 565 541
III 48 38 38 33 54 60 271
IV 60 50 52 45 65 65 337
Yij. 189 164 159 143 217 234
1106
Yi. 353 302 451
La sumas de cuadrados
Tyy
Y 2
ij ..
Y...2
r abr
Ayy
Y
Y...2
2
i ..
br abr
B yy
Y
Y...2
2
. j.
ar abr
AB yy
Y 2
ij .
Y 2
i ..
Y 2
. j.
Y...2
r br ar abr
Ryy
Y
Y...2
2
..k
ab abr
E yy Y 2
Y 2
ij .
Y
2
..kY...2
ijk
r ab abr
Y...2
Wyy Y 2
ijk
abr
136
Métodos Estadísticos para la Investigación experimental
En SPSS haga lo siguiente: Primero construyamos en cuadro de análisis de varianza con fuentes
de variación: Bloques/tratamientos/error/total:
137
Elías Alberto Torres Armas, Lic. Ms. C.
Total corregida 2631.833 23
Ahora reúna los ambos resultados, y se tendrá el cuadro ANVA resultante, así:
Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
BLOQ 952.5 3 317.5 47.86 0.0000001
TRATS 1579.833333 5 315.9666667 47.63 0.0000000
A 1433.583333 2 716.7916667 108.06 0.0000000
B 24 1 24 3.62 0.0765341
A*B 122.25 2 61.125 9.21 0.0024530**
Error 99.5 15 6.633333333
Total corregida 2631.833333 23
Como la interacción a salido altamente significativa, nos interesa ver los efectos simples de la
interacción
B dentro de a1
Datos/seleccionar casos/ si satisface la condición/si…/A=1 a la caja en blanco-
continuar/Aceptar.
Ahora:
Análisis/Comparar medias/anova de un factor/ Y a dependientes B a factor/Aceptar
ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
78.125 1 78.125 1.231 .310
grupos
Intra-
380.750 6 63.458
grupos
Total 458.875 7
B dentro de a2
ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
32.000 1 32.000 .522 .497
grupos
Intra-
367.500 6 61.250
grupos
138
Métodos Estadísticos para la Investigación experimental
Total 399.500 7
B dentro de a3
Datos/seleccionar casos/ si satisface la condicion/si…/A=3 a la caja en blanco-
continuar/Aceptar.
Ahora:
Analisis/Comparar medias/anova de un factor/ Y a dependientes B a factor/Aceptar
ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
36.125 1 36.125 .714 .431
grupos
Intra-
303.750 6 50.625
grupos
Total 339.875 7
Ahora:
139
Elías Alberto Torres Armas, Lic. Ms. C.
Analisis/Comparar medias/anova de un factor/ Y a dependientes A pasa a factor/Aceptar
ANOVA
Y
Suma de Media
B cuadrados Gl cuadrática F Sig.
1 Inter-
420.667 2 210.333 2.680 .122
grupos
Intra-
706.250 9 78.472
grupos
Total 1126.917 11
2 Inter-
1135.167 2 567.583 14.774 .001
grupos
Intra-
345.750 9 38.417
grupos
Total 1480.917 11
Nótese que las F de los anovas últimos no son válidos para el análisis, pues hay que corregirlos
dividiendo los correspondientes cuadrados medios entre el CM del error=6.633333333 del anova
previo a estos cálculos.
140
Métodos Estadísticos para la Investigación experimental
CAPÍTULO XI
EXPERIMENTOS FACTORIALES 2k
Se refiere al estudio de k factores cada uno con dos niveles. Es un caso particular de los
experimentos factoriales; se puede realizar, además del método conocido, con otros métodos. Es
frecuentemente usado para estudios de sondeo.
Ejm.
A B t= 4 a0b0 a0b1 a1b0 a1b1 2A2B
22
a0 b0 = 4 (1) b a ab
a1 b1
A B C t= 8 a0 a1
23
a0 b 0 c0 = 8 b0 b1 b0 b1
a1 b 1 c1 c0 c1 c0 c1 c0 c1 c0 c1
a0
b0
c0 a0b0c1 a0b1c0 a0b1c1 a1b0c0 a1b0c1 a1b1c0 a1b1c1
1 C B BC A AC AB ABC
A B C D t= 16
24
a0 b 0 c0 d0 = 16
a1 b 1 c1 d1
141
Elías Alberto Torres Armas, Lic. Ms. C.
Y A B tratam
1 1 1 1
5 1 1 1
9 1 1 1
2 1 2 2
3 1 2 2
4 1 2 2
7 2 1 3
11 2 1 3
15 2 1 3
10 2 2 4
10 2 2 4
10 2 2 4
Luego ejecute el programa, así:
Primero resuelva el ANVA para los efectos de A, B y AB
142
Métodos Estadísticos para la Investigación experimental
Nota: La descomposición de la suma de cuadrados puede hacerse con otros métodos: Signos y
Yates.
Efectos Yi..
Tratam A B AB
a0b0 1 - - + 15
a1b0 a + - - 33
a0b1 b - + - 9
a1b1 ab + + + 30
Cj= 39 -9 3 87 r= 3
Efecto= 6.5 -1.5 0.5 k= 2
SC= 126.75 6.75 0.75 r*2^k-1= 6
r*2^k= 12
( )
∑ {
( )
+: Si el tratamiento incluye nivel alto del factor
-: Si el tratamiento incluye nivel bajo del factor
̂
A: Efecto de A=6,50
B: Efecto de B=-1,50
AB: Efecto de AB=0,50
Media
Si X es cuantitativa:
( ) ( )
{ ; {
( ) ( )
Usando statgrafics
Avanzado/diseño experimental/crear diseño/en pantalla/
Número de variables respuesta (1)
Número de factores experimentales (2)
Aceptar
factor: A Bajo(-1) Alto(+1)
B Bajo(-1) Alto(+1)
Aceptar
Variable respuesta: Nombre Y
143
Elías Alberto Torres Armas, Lic. Ms. C.
Aceptar
Vea las opciones y seleccione FACTORIAL 2^2/Aceptar
En la nueva pantalla: Puntos centrales (0)
Replica (2) (Nota: estas replicas se refiere a las replicas
adicionales a 1, pues por defecto considera 1, es decir cada tratamiento tiene 3 repeticiones
entonces sobra 2.
Desactivar ALEATORIO
ACEPTAR
Entrar al diseño creado, por la barra de herramientas/VENTANA/SIN NOMBRE/ Ingrese
los datos ahora.
F de V Gl SC CM F
Tratam 7 Tyy T T/E
A 1 Ayy A A/E
B 1 Byy B B/E
C 1 Cyy C C/E
AB 1 AByy AB AB/E
AC 1 ACyy AC AC/E
BC 1 BCyy BC BC/E
ABC 1 ABCyy ABC ABC/E
Error t(r-1) Eyy E
Total tr-1 Wyy W
El análisis puede realizarse con el método ordinario (muy laborioso) o con el método de los
signos.
EJEMPLO II. (DISEÑO FACTORIAL 23). Se desea analizar el efecto sobre el funcionamiento
de una bicicleta, al variar la altura del sillón (alto +, bajo -), la presión de los neumáticos (alta +,
baja -) y utilizar o no el dinamo (si +, no -). La variable respuesta que se mide es la diferencia
entre el pulso sanguíneo antes y después de realizar una determinada prueba.
C
A B No(-) Si(+) Total
Bajo(-) 56 58 68 67 249 498
Bajo(-)
Alta(+) 54 60 72 66 501 252
Bajo(-) 59 57 69 64 249 480
Alto(+)
Alta(+) 57 56 69 46 477 228
Total 457 521 978 b0=498 b1=480
144
Métodos Estadísticos para la Investigación experimental
Modelo de regresión:
̂
̂
( )
( )
( )
PARA EL EJEMPLO ANTERIOR
2k=23=8 k=3 r=2
145
Elías Alberto Torres Armas, Lic. Ms. C.
Tratam Yi… 1 2 3 ef SC
1 114 230 457 978 r= 2
a 116 227 521 -24 -3.00 36 k= 3
b 114 268 1 -18 -2.25 20.25 r*2^(k-1)= 8
c 113 253 -25 -24 -3.00 36 r*2^k= 16
ab 135 2 -3 64 8.00 256
ac 133 -1 -15 -26 -3.25 42.25
bc 138 -2 -3 12 1.50 9
abc 115 -23 -21 -18 -2.25 20.25
c. EXPERIMENTO 2k NO REPLICADO
EJEMPLO
Un producto químico se fabrica en un vaso fresurizado. Se lleva a cabo un experimento factorial
en la planta piloto, para estudiar los factores que se piensa, influyen en el índice de filtración de
este producto. Los cuatro factores son la temperatura (A), presión (B), concentración de
formaldehido (C) y la velocidad de agitación (D). Cada factor está presente con dos niveles. La
matriz del diseño y los datos de la respuesta obtenidos en una sola replica del experimento 24 se
muestran a continuación:
Trat A B C D Yi
1 - - - - 45
a + - - - 71
b - + - - 48
ab + + - - 65
c - - + - 68
ac + - + - 60
bc - + + - 80
abc + + + - 65
d - - - + 43
ad + - - + 100
bd - + - + 45
abd + + - + 104
cd - - + + 75
acd + - + + 86
bcd - + + + 70
abcd + + + + 96
146
Métodos Estadísticos para la Investigación experimental
b - + - - - + + - - + + + - + - 48
ab + + - - + - - - - + - - + + + 65
c - - + - + - + - + - + - + + - 68
ac + - + - - + - - + - - + - + + 60
bc - + + - - - + + - - - + + - + 80
abc + + + - + + - + - - + - - - - 65
d - - - + + + - + - - - + + + - 43
ad + - - + - - + + - - + - - + + 100
bd - + - + - + - - + - + - + - + 45
abd + + - + + - + - + - - + - - - 104
cd - - + + + - - - - + + + - - + 75
acd + - + + - + + - - + - - + - - 86
bcd - + + + - - - + + + - - - + - 70
abcd + + + + + + + + + + + + + + + 96
Cj= 173 25 79 117 1 -145 133 19 -3 -9 15 33 -13 -21 11 1121
Ef= 21,625 3,125 9,875 14,625 0,125 -18,125 16,625 2,375 -0,375 -1,125 1,875 4,125 -1,625 -2,625 1,375
SC= 1870,5625 39,0625 390,0625 855,5625 0,0625 1314,0625 1105,5625 22,5625 0,5625 5,0625 14,0625 68,0625 10,5625 27,5625 7,5625
SC= 1870,5625 39,0625 390,0625 855,5625 0,0625 1314,0625 1105,5625 22,5625 0,5625 5,0625 14,0625 68,0625 10,5625 27,5625 7,5625
Para conformar el error experimental se puede mancomunar algunas interacciones. Las de mayor
orden (3 y 4 factores) y aquellas que tienen poco valor, también existe el CRITERIO DE
DANIEL.
METODO DE DANIEL
Daniel propone graficar las interacciones de los efectos (de menor a mayor) frente a una
probabilidad pi, donde:
( )
HACER EL GRAFICO, que permitirá mancomunar algunas interacciones para conformar
el error experimental
147
Elías Alberto Torres Armas, Lic. Ms. C.
El ANOVA puede considerar solamente a las interacciones AC y AD y las otras interacciones
conformaran el error experimental:
F de V SC g.l CM F p-VALOR
trat 15
A 1870,5625 1 1870,5625 107,87 0,0000
B 39,0625 1 39,0625 2,25 0,1676
C 390,0625 1 390,0625 22,49 0,0011
D 855,5625 1 855,5625 49,34 0,0001
AC 1314,0625 1 1314,0625 75,78 0,0000
AD 1105,5625 1 1105,5625 63,76 0,0000
Error 156,0625 9 17,34027778
Total 5730,9375 15
s2(+)=313,27
( )
S2(-)=238,21 luego: ( ) ESTE VALOR ESTA DENTRO DE
LOS INTERVALOS, POR TANTO LA DISPERSION ESTA BAJO CONTROL.
148
Métodos Estadísticos para la Investigación experimental
F de V SC g.l
trat 15
A 1870,5625 1
B 39,0625 1
C 390,0625 1
D 855,5625 1
AB 0,0625 1
AC 1314,0625 1
AD 1105,5625 1
BC 22,5625 1
BD 0,5625 1
CD 5,0625 1
ABC 14,0625 1
ABD 68,0625 1
ACD 10,5625 1
BCD 27,5625 1
ABCD 7,5625 1
Error ¿?
Total 5730,9375 15
Se pueden conformar las interacciones despreciables y los de mayor orden para conformar el
error experimental. La tabla puede quedar así:
F de V SC g.l CM F p-VALOR
trat 15
A 1870,5625 1 1870,5625 107,87 0,0000
B 39,0625 1 39,0625 2,25 0,1676
C 390,0625 1 390,0625 22,49 0,0011
D 855,5625 1 855,5625 49,34 0,0001
AC 1314,0625 1 1314,0625 75,78 0,0000
AD 1105,5625 1 1105,5625 63,76 0,0000
Error 156,0625 9 17,34027778
Total 5730,9375 15
Cuando se usan diseños factoriales 2k (dos niveles) se debe suponer la linealidad en los efectos. Si
esto se cumple el sistema 2k funcionará bastante bien. Sin embargo si existe sospecha de no
linealidad existe un método para replicar ciertos puntos en un diseño factorial 2 k lo cual protegerá
contra la curvatura además de permitir obtener estimaciones de error independientes. Dicho
método consiste en agregar puntos centrales al diseño 2k, para lo cual se hacen replicas (n 0) en los
puntos Xi=0 (i=1,2,3,..,k). Se supone que los k factores son cuantitativos.
149
Elías Alberto Torres Armas, Lic. Ms. C.
El análisis de varianza para un diseño 2k (23) con n0 puntos centrales es:
F de V g.l. SC CM F(I)
A 1 Ayy A A/E
B 1 Byy B B/E
C 1 Cyy C C/E
AB 1 AByy AB AB/E
AC 1 ACyy AC AC/E
BC 1 BCyy BC BC/E
ABC 1 ABCyy ABC ABC/E
Curvatura 1 CUyy CU CU/E
Error nc-1 Eyy E
k
Total 2 +nc-1 Wyy
8+nc-1
∑( ̅)
(̅ ̅)
̅ (
̅ (
Si CU/E resulta no significativa, entonces, no hay evidencia de curvatura en la respuesta en la
región explorada.
150
Métodos Estadísticos para la Investigación experimental
Efectos
Trat A B C AB AC BC ABC Y
1 - - - + + + - 18 324
a + - - - - + + 23 529
b - + - - + - + 21 441
ab + + - + - - - 27 729
c - - + + - - + 21 441
ac + - + - + - - 25 625
bc - + + - - + - 24 576
abc + + + + + + + 33 1089
Cj= 24 18 14 6 2 4 4 192 4754
Ef= 6,0 4,5 3,5 1,5 0,5 1,0 1,0 146
SC= 72,0 40,5 24,5 4,5 0,5 2,0 2,0
( )
CUyy= 3,07692308
CUADRO ANOVA
F de V SC g.l. CM F
A 72 1 72 32.0000
B 40.5 1 40.5 18.0000
C 24.5 1 24.5 10.8889
AB 4.5 1 4.5 2.0000
AC 0.5 1 0.5 0.2222
BC 2 1 2 0.8889
ABC 2 1 2 0.8889
Curvatura 3.077 1 3.077 1.3676
Error 9 4 2.25
Total 158.077 12
También se conoce como fracción ½ porque solamente se usa la mitad de las corridas del
diseño completo (2k-1=2k/2).
151
Elías Alberto Torres Armas, Lic. Ms. C.
En un diseño factorial 24 con ½ repetición solo se deben usar 24-1=8 corridas, es decir 8
combinaciones de tratamientos y no las 16.
Para identificar las corridas o tratamientos a usar:
Construir una tabla de signos 2k=24 con los efectos principales y con la interacción que
se va confundir (la de mayor orden ABCD).
En la columna de la interacción confundida elegir los tratamientos que tienen el mismo
signo (positivo o negativo).
Combinación A B C D ABCD
tratamiento
(1) - - - - +
a + - - - -
b - + - - -
ab + + - - +
c - - + - -
ac + - + - +
bc - + + - +
abc + + + - -
d - - - + -
ad + - - + +
bd - + - + +
abd + + - + -
cd - - + + +
acd + - + + -
bcd - + + + -
abcd + + + + +
(C j ) 2
SC
2 k 1
En la tabla de tratamientos y efectos, solo se consideran los tratamientos elegidos (-) y los efectos
de un diseño 24 sin considerar el efecto ABCD por estar confundida.
152
Métodos Estadísticos para la Investigación experimental
La suma de cuadrados son iguales, de: A=BCD, B=ACD, …, AB=CD; estos son los llamados
pares aliados. En el ANVA de cada para aliado solo se elige a uno de ellos.
Los pares aliados se obtienen así:
AxABCD=A2BCD=BCD aliado de A
BxABCD=AB2CD=ACD aliado de B
ABxABCD=A2B2CD=CD aliado de AB
Estos son diseños en los que ningún efecto principal es aliado de otro principal pero si lo son de
interacciones de dos factores; así mismo las interacciones de dos factores son aliados entre sí. (
23III1 con I ABC ).
DISEÑOS DE RESOLUSIÓN IV
Estos son diseños en los que ningún efecto principal es aliado de otro principal, ni de alguna
interacción de dos factores. Las interacciones de dos factores son aliados entre sí. (
24IV1 con I ABCD )
DISEÑOS DE RESOLUSIÓN V
Estos son diseños en los que ningún efecto principal es aliado de otro principal, ni de alguna
interacción de dos factores. Las interacciones de dos factores son aliados de las interacciones de
tres factores. ( 2V51 con I ABCDE )
Un diseño es de resolución R si ningún efecto de p factores es aliado de otro efecto que tenga
menor de R-p factores. Se usa el numeral romano para indicar su resolución.
153
Elías Alberto Torres Armas, Lic. Ms. C.
EJEMPLO. Se desea iniciar una investigación experimental con 5 factores cada uno a dos niveles.
Sólo se dispone de una capacidad para 25-1=16 ensayos. Se puede construir el diseño de máxima
resolución y realizar el análisis con los datos registrados.
*: Tratamientos a usar:
A: Temperatura : -, +
B: Presión : -, +
C: Velocidad : -, +
D: pH : -, +
E: Humedad : -, +
Y: Dureza
E=ABCD generador
I=ABCDE relación definición
Aliados: EfectosxI ( 2V51 )
A=BCDE AB=CDE BD=ACE
B=ACDE AC=BDE BE=ACD
C=ABDE AD=BCE CD=ABE
D=ABCE AE=BCD CE=ABD
E=ABCD BC=ADE DE=ABC
Para obtener los contrastes, efectos y suma de cuadrados por el método de los signos
t 16
C j CijYi
i 1
154
Métodos Estadísticos para la Investigación experimental
En el análisis de varianza se puede optar por mancomunar los efectos de las interacciones a
excepción de AB que parece ser de importancia.
Combinación A B C D E AB AC AD AE BC BD BE CD CE DE Yi.
tratamiento
E - - - - + + + + - + + - + - - 8
A + - - - - - - - - + + + + + + 9
B - + - - - - + + + - - - + + + 34
Abe + + - - + + - - + - - + + - - 52
C - - + - - + - + + - + + - - + 16
Ace + - + - + - + - + - + - - + - 22
Bce - + + - + - - + - + - + - + - 45
Abc + + + - - + + - - + - - - - + 60
D - - - + - + + - + + - + - + - 6
Ade + - - + + - - + + + - - - - + 10
Bde - + - + + - + - - - + + - - + 30
Abd + + - + - + - + - - + - - + - 50
Cde - - + + + + - - - - - - + + + 15
Acd + - + + - - + + - - - + + - - 21
Bcd - + + + - - - - + + + - + - - 44
Abcde + + + + + + + + + + + + + + + 63
Cj 89 271 87 -7 5 55 3 9 9 5 -1 -1 7 3 -11 485
Cj
ef k 2
11.125
33.875
10.875
-0.875
-0.125
-0.125
-1.375
0.625
6.875
0.375
1.125
1.125
0.625
0.875
0.375
2
4590.0625
495.0625
473.0625
189.0625
(C j ) 2
3.0625
1.5625
0.5625
5.0625
5.0625
1.5625
0.0625
0.0625
3.0625
0.5625
7.5625
SC
2 k 1
El análisis de varianza
F de V gl SC CM F
A 1 495.0625 495.0625 189.10
B 1 4590.063 4590.0625 1753.23
C 1 473.0625 473.0625 180.69
D 1 3.0625 3.0625 1.17
E 1 1.5625 1.5625 0.60
AB 1 189.0625 189.0625 72.21
AC 1 0.5625
AD 1 5.0625
AE 1 5.0625
BC 1 1.5625
BD 1 0.0625
BE 1 0.0625
CD 1 3.0625
CE 1 0.5625
DE 1 7.5625
Error 9 23.5625 2.6181
Total 15 5775.4375
155
Elías Alberto Torres Armas, Lic. Ms. C.
Se conoce como fracción ¼ porque solamente puede usarse la cuarta parte de las corridas de
un diseño completo. En este diseño solo se dispone 2k-2 unidades experimentales. Para
construir este diseño primero se escriben las combinaciones para el diseño 2 k-2 y después se
agregan dos factores como generadores, cada uno como el producto de los signos de
interacciones del diseño 2k-2 elegidas adecuadamente, los mismos que generan dos relaciones
de definición I1, I2, de tal manera que la relación generalizada I3= I1xI2 sea de orden adecuado
(mod2). En este caso cada efecto tiene tres aliados, multiplicando cada efecto por I1, I2 y I3.
I1=ABCE I2=BCDF
I3=ABCExBCDF=AB2C2DEF=ADEF
A=BCE=DEF=ABCDF AD=EF=ABCF=BCDF
B=ACE=CDF=ABDEF AE=BC=DF=ABCDEF
C=ABE=BDF=ACDEF AF=DE=ABCD=BCDF
D=AEF=BCF=ABCDE BD=CF=ABDF=ACDE
E=ABC=ADF=BCDEF BF=CD=ABDE=ACEF
F=ADE=BCD=ABCEF ABD=CDE=ACF=BEF
AB=CE=ACDF=BDEF ACD=BDE=ABF=CEF
AC=BE=ABDF=CDEF
Existen tablas con generadores para obtener diseños de máxima resolución. Este diseño 2 6IV2
(Resolución IV). Resol: Longitud palabra más corta de I i.
156
Métodos Estadísticos para la Investigación experimental
35.625
11.875
-0.875
-1.625
-5.375
-1.875
-0.125
-0.125
-4.875
1.375
0.375
0.375
0.625
0.125
2
5076.5625
770.0625
564.0625
115.5625
(C j ) 2
10.5625
14.0625
95.0625
3.0625
7.5625
0.5625
0.5625
0.5625
0.0625
0.0625
SC
2 k 2 0.0625
El análisis de varianza
F de V gl SC CM F
A 1 770.0625 770.0625 25.99
B 1 5076.563 5076.563 171.36
C 1 3.0625 3.0625 0.10
D 1 7.5625 7.5625 0.26
E 1 0.5625 0.5625 0.02
F 1 0.5625 0.5625 0.02
AB 1 564.0625 564.0625 19.04
Error 8 237 29.625
157
Elías Alberto Torres Armas, Lic. Ms. C.
Total 15 6659.438
PROYECCION DEL FACTORIAL FRACCIONARIO
Cuando en experimentos 2k se desea usar bloques, entonces cada uno de los bloques debe tener
2k unidades experimentales, para que en dichos bloques puedan correrse todos los tratamientos;
sin embargo en experimentos 2k el número de factores crece rápidamente (23, 24, 25,…) por lo
que hacer una réplica completa en cada bloque resulta poco viable. Si cada bloque dispone de 2 k-1,
2k-2, 2k-3, unidades experimentales, se puede hacer uso de la técnica de la confusión (confundido).
La técnica de la confusión es aquella es aquella que nos permite acomodar un experimento
factorial completo en bloques incompletos, donde el tamaño de cada uno de estos bloques es de
2k-1, 2k-2, …, unidades experimentales; es decir el tamaño de cada bloque incompleto es la mitad, o
la cuarta parte, … , del bloque completo.
Al usar la técnica de la confusión se pierde la información de una o de más interacciones, las que
deben ser elegidas adecuadamente por el investigador; estas, generalmente son las que parecen
tener poco valor o poco interés.
Vamos a desarrollar la construcción y análisis del diseño factorial 2k en 2p bloques incompletos
cada réplica con p<k.
Si p=1 2k en 2 bloques incompletos cada replicación
Si p=2 2k en 4 bloques incompletos cada replicación
Si p=3 2k en 8 bloques incompletos cada replicación
El tamaño de cada bloque
p=1 2k-1 u.e, p=2 2k-2 u.e, p=3 2k-3 u.e
158
Métodos Estadísticos para la Investigación experimental
159
Elías Alberto Torres Armas, Lic. Ms. C.
SOLUCIÓN
a. El diseño
i. Tabla de signos
Trat A B C AB AC BC ABC
(1) - - - -
a + - - +
b - + - +
ab + + - -
c - - + +
ac + - + -
bc - + + -
abc + + + +
Dos bloques:
Bloques incompletes
160
Métodos Estadísticos para la Investigación experimental
b c abc a ac (1) ab bc
40 35 60 60 195 58 39 45 70 212
bc ab (1) ac a abc c b
64 60 38 70 232 45 69 45 47 206
a c b abc ac bc (1) ab
39 43 48 71 201 60 60 30 65 215
161
Elías Alberto Torres Armas, Lic. Ms. C.
107=39+38+30
Se está estudiando el efecto que tienen 4 factores Temperatura (A), fusión (B), concentración de
los reactivos (C) y rapidez de mezclado (D) sobre la tasa de filtración de un producto en una
planta piloto. Suponga que no se pueden efectuar las 24 combinaciones de tratamientos en un
mismo día. Diariamente el experimentador puede ensayar 8 combinaciones por lo que un diseño
24 confundido en 2 bloques resulta apropiado. Es lógico confundir la interacción de mayor
orden ABCD.
SOLUCIÓN
a. Construcción del diseño
i. Usando tabla de signos
Combinación A B C D ABCD
tratamiento
(1) - - - - +
a + - - - -
b - + - - -
ab + + - - +
c - - + - -
ac + - + - +
bc - + + - +
abc + + + - -
d - - - + -
ad + - - + +
bd - + - + +
abd + + - + -
cd - - + + +
acd + - + + -
bcd - + + + -
abcd + + + + +
162
Métodos Estadísticos para la Investigación experimental
I (1) ab ac bc ad bd cd abcd
45 65 60 80 100 45 75 96 566
1121
II a b c d abc bcd acd abd
71 48 68 43 65 70 86 104 555
Para facilitar los cálculos puede usarse el algoritmo de YATES. El experimentador piensa que la
interacción de 3 factores son despreciables, las que al mancomunarse conforman el error
experimental.
Combinación Rpta 1 2 3 4 (C j ) 2 (C j ) 2 (C j ) 2
(C j )
tratamiento
Cj ef , r 1 SC
r 2 k 1 r 2k 1* 2 4 16
(1) 45 116 229 502 1121
a 71 113 273 619 173 21.625 1870.5625
b 48 128 294 20 25 3.125 39.0625
ab 65 145 327 153 1 0.125 0.0625
c 68 143 43 14 79 9.875 390.0625
ac 60 149 -23 11 -145 -18.125 1314.0625
bc 80 161 116 -16 19 2.375 22.5625
abc 65 166 37 17 15 1.875 14.0625
d 43 26 -3 44 117 14.625 855.5625
ad 100 17 17 35 133 16.625 1105.5625
bd 45 -8 6 -66 -3 -0.375 0.5625
abd 104 -15 5 -79 33 4.125 68.0625
cd 75 57 -9 20 -9 -1.125 5.0625
acd 86 59 -7 -1 -13 -1.625 10.5625
bcd 70 11 2 2 -21 -2.625 27.5625
abcd 96 26 15 13 11 1.375 7.5625
163
Elías Alberto Torres Armas, Lic. Ms. C.
164
Métodos Estadísticos para la Investigación experimental
En este diseño 2k, cada bloque debe tener 2k-3 unidades experimentales. Deben seleccionarse
p=3 efectos independientes que serán confundidos. Por independiente se entiende que
ningún efecto elegido es igual a la interacción generalizada de los otros. Los bloques se
165
Elías Alberto Torres Armas, Lic. Ms. C.
pueden generar usando los contrastes de definición L 1, L2, L3, los otros 4 efectos serán
confundidos con los bloques, siendo estos las interacciones generalizadas de los 3 efectos
independientes elegidos originalmente. Los efectos que serán confundidos deben elegirse
cuidadosamente para no sacrificar alguna información importante. El análisis estadístico de
estos diseños es directo, las sumas de cuadrados de todos los efectos se calculan como si no
existieran los bloques. La suma de cuadrados de bloques puede determinarse sumando las
sumas de cuadrados de los efectos que se confunden con los bloques. (Ver tabla 7.8 de
Montgomery).
El uso de diseños de superficie de respuesta es una alternativa más adecuada que utiliza técnicas
matemáticas y estadísticas para establecer la relación entre los factores y la variable dependiente,
siendo el objetivo principal optimizar la respuesta. Se desarrolla en las siguientes etapas:
Diseño y recopilación de datos experimentales
Aplicación de las técnicas de región múltiple para elegir la mejor para elegir la mejor ecuación
que representa a los datos
Determinar los valores de los factores o variables de control que producirán una respuesta
óptima
Describir gráficamente cómo es la superficie de respuesta en las inmediaciones de la respuesta
óptima.
k k k k
Yˆ b0 b j X j b jj X 2j bij X i X j
j 1 j 1 i 1 j 1
Los coeficientes del modelo matemático de segundo orden pueden estimarse por mínimos
cuadrados, de manera matricial:
b ( X ' X ) 1 X 'Y
X 1, X 1 , X 2 , X 12 , X 22 , X 1 X 2
Donde:
b: Vector de coeficientes,
X: matriz del diseño,
166
Métodos Estadísticos para la Investigación experimental
Se hace a través del análisis de varianza. Por ejemplo para un diseño de dos factores
F de V SC gl CM F
A F1(yy) 1 F1 F1/E
B F2(yy) 1 F2 F2/E
AA F11(yy) 1 F11 F11/E
BB F22(yy) 1 F22 F22/E
AB F12(yy) 1 F12 F12/E
Error experimental Eyy n-6 E
Falta de ajuste Qyy n-nc-5 Q Q/P
Puro error Pyy nc-L P
Total Wyy n-1
A partir del modelo de regresión, los valores óptimos de los factores se obtienen por métodos
analíticos de optimización. En los modelos matemáticos de segundo orden se construye el
sistema de ecuaciones:
Y Y Y
0 0 ... 0
X 1 X 2 X k
Se resuelve el sistema y se obtienen los valores óptimos.
iv. REPRESENTACIÓN GRÁFICA
La representación gráfica hace considerando a dos factores manteniendo fijos los otros. Es
fundamental analizar si el modelo de segundo orden estimado tiene un máximo o un mínimo,
o no tiene un valor extremo. Para el caso de varios factores se evalúa la matriz HESSIANA H:
167
Elías Alberto Torres Armas, Lic. Ms. C.
2Y 2Y 2Y
X 2
1 X 1 X 2 X 1 X k
2Y 2Y 2Y
H X 1 X 2 X 22 X 2 X k
2
Y 2Y
X X
1 k X k2
Para la existencia de un máximo el determinante de Hj debe tener signos alternados.
Los diseños experimentales más usados para describir adecuadamente los modelos de segundo
orden para diseños de superficie de respuesta son:
DISEÑOS ROTABLES
DISEÑOS COMPUESTOS CENTRALES
EXPERIMENTOS CON MEZCLAS
DISEÑOS DE BOX – BEHNKEN
a. DISEÑOS ROTABLES
Un diseño experimental es rotable cuando se tiene igual facultad de predicción en todas las
direcciones a partir de un punto experimental centrado (X0) y donde los otros puntos
experimentales están a una distancia constante del punto central. Esto significa que la varianza
depende solamente de la distancia del punto (X 1, X2,…, Xk) al punto central del diseño
(X0). En un diseño rotable los contornos de la varianza son círculos concéntricos alrededor del
punto central. Así por ejemplo son diseños rotables para k=2:
2 0.5000 0.8660
3 -0.5000 0.8660 1
x
4 -1.0000 0.0000 P0(0,0) P1(1,0)
5 -0.5000 -0.8660 P4(-
0.5 X1
6 0.5000 -0.8660 1,0)
7 0 0
8 0 0
9 0 0
1 1 P P6
X1 , X2 , valores codificado s; Z i : valores
5 originales
1 1
168
Métodos Estadísticos para la Investigación experimental
Z max Z min
1 si Z i Min Zi
2 Z i Z1
A X1 Xi
1 si Z i Max Z max Z min Z max Z min
2 2
Z Z min
1 si Z i Min Z i max
2 Zi Z 2
B X2 Xi
1 si Z i Max Z max Z min Z max Z min
2 2
a.2. DISEÑO OCTOGONAL
Este diseño es más confiable, debido a que utiliza un mayor número de pruebas
experimentales. Este diseño consta de 8 vértices correspondientes a un octágono regular, más
los puntos centrales para estimar la varianza del error experimental. Ejemplo: Realizar el
análisis del siguiente experimento:
Variables originales
Variables Niveles
Inferior Superior
Z1=%Cal 23.9 85.9
Z2=Temperatura 663 83.7
Z1:%Cal
169
Elías Alberto Torres Armas, Lic. Ms. C.
Z2: Temperatura
Z Z min 837 663
Z i max Z1
Xi 2 0.707 2 Z 2 812
Z max Z min 837 663
2 2
k k k k
El modelo matemático de segundo orden Yˆ b0 b j X j b jj X 2j bij X i X j
j 1 j 1 i 1 j 1
F de V SC gl CM F p-valor
A 81.6436 1 81.6436 4.27 0.0937
B 17.9973 1 17.9973 0.94 0.3767
AA 47.3389 1 47.3389 2.47 0.1765
BB 0.1197 1 0.1197 0.01 0.9400
AB 25 1 25.0000 1.31 0.3048
Error experimental 95.6628 5 19.1326
Falta de ajuste 42.9961 3 14.3320 10.75 0.0863
Puro error 2.6667 2 1.3334
Total 220.727 10
170
Métodos Estadísticos para la Investigación experimental
171
Elías Alberto Torres Armas, Lic. Ms. C.
X1 X2 Z1 Z2 Y
-1 -1 80 170 76.5
-1 1 80 180 77.0
1 -1 90 170 78.0
1 1 90 180 79.5
0 0 85 175 79.5
0 0 85 175 80.3
0 0 85 175 80.0
0 0 85 175 79.7
0 0 85 175 79.8
1.414 0 92.07 175 78.4
-1.414 0 77.93 175 75.6
0 1.414 85 182.07 78.5
0 -1.414 85 167.93 77.0
Z 85
Z i Z1 para X 1 1.414 se tiene : 1.414 i
5
Z1 92.07
Xi ,
Z max Z min Z 175
para X 1.414 se tiene : 1.414 i Z 2 167.93
2 2
5
Y
0 0.995 2.752 X 1 0.250 X 2 0
X 1
Y
0 0.515 2.002 X 2 0.250 X 1 0
X 2
2.752 X 1 0.250 X 2 0.995 X 1 0.3896 Z1 86.94
Yˆmáx 80.23
2.002 X 2 0.250 X 1 0.515 X 2 0.3051 Z 2 176.76
F de V SC gl CM F p-valor
A 7.9198 1 7.9198 111.93 0.00001
B 2.1232 1 2.1232 30.01 0.00093
AA 13.1761 1 13.1761 186.22 0.00000
BB 6.9739 1 6.9739 98.56 0.00002
AB 0.25 1 0.25 3.53 0.10221
Error experimental 0.4953 7 0.07076
Falta de ajuste 0.2833 3 0.0944 1.78 0.28969
Puro error 0.212 4 0.053
172
Métodos Estadísticos para la Investigación experimental
Total 12
EJERCICIO: Presentar un diseño compuesto central para 3 factores y n c=6 puntos centrales.
La región de exploración es: Z1(13, 17), Z2(80, 100) y Z3(300, 400). Z1:Velocidad, Z2: Tiempo y
Z3:Temperatura.
Si X1, X2, … , Xp denota las proporciones de una mezcla, éstas deben satisfacen ciertas
restricciones:
En experimentos con mezclas, los modelos que permiten pronosticar el valor de la variable
dependiente en función de sus componentes pueden expresarse de una manera especial:
Modelo lineal:
p
Y i X i
i 1
Modelo cuadrático
p
Y i X i ij X i X j
i 1 i j
Modelo cúbico
p
Y i X i ij X i X j ij X i X j ( X i X j ) ijk X i X j X k
i 1 i j i j i j
173
Elías Alberto Torres Armas, Lic. Ms. C.
p
Y i X i ij X i X j ijk Xi X j Xk
i 1 i j i j k
Se puede agregar:
Puntos duplicados
Puntos de argumento (% para las p componentes)
1. EJEMPLO:
Pto Proporción Y
X1 X2 X3
1 1 0 0 11.7
2 0.5 0.5 0 15.3
3 0 1 0 9.4
4 0 0.5 0.5 10.5
5 0 0 1 16.4
6 0.5 0 0.5 16.9
El modelo matemático:
Valores óptimos
A=29.38%
B=0.0%
C=70.62%
Yˆ 17.38
174
Métodos Estadísticos para la Investigación experimental
2. EJEMPLO:
X1 : 0.3 X 1 0.4
X2 : 0.1 X 2 0.2
X3 : 0.5 X 3 0.6
Es otra alternativa para la estimación de superficies de respuesta. Estos diseños tienen ventajas
sobre los diseños compuestos centrales:
Existen solamente 3 niveles en cada factor (-1, 0, 1), mientras que en el diseño compuesto
central deben controlarse 5 niveles (-α, 1, 0, 1, α)
Para construir diseños de 3-5 factores, se forman todos los posibles pares factoriales 22,
manteniendo en cero o su nivel medio en cero o su nivel medio al factor no considerado,
añadiendo los puntos centrales; en los diseños de 6-9 factores se consideran factoriales 23,
completando con ceros los factores no considerados, agregando puntos centrales.
Corrida X1 X2 X3 Z1 Z2 Z3 Y1 Y2
1 -1 -1 0 80 7 310 13 87.6
2 1 -1 0 90 7 310 14 91.6
3 -1 1 0 80 7.4 310 7.3 71
4 1 1 0 90 7.4 310 6 69.8
5 -1 0 -1 80 7.2 300 12 83.1
6 1 0 -1 90 7.2 300 9.8 76
7 -1 0 1 80 7.2 320 7.5 72.4
8 1 0 1 90 7.2 320 5.7 68.5
9 0 -1 -1 85 7 300 11 82.2
10 0 1 -1 85 7.4 300 9.8 76.5
11 0 -1 1 85 7 320 13 90
175
Elías Alberto Torres Armas, Lic. Ms. C.
Donde:
Variables Niveles
Inferior Superior
Z1 80 (-1) 90 (1)
Z2 7.0 (-1) 7.4 (1)
Z3 300 (-1) 320 (1)
176
Métodos Estadísticos para la Investigación experimental
39 1 0 -1 0 0 1 1 22
40 1 0 1 0 0 1 1 25
41 1 -1 0 -1 0 0 -1 24
42 1 1 0 -1 0 0 -1 27
43 1 -1 0 1 0 0 -1 25
44 1 1 0 1 0 0 -1 35
45 1 -1 0 -1 0 0 1 21
46 1 1 0 -1 0 0 1 25
47 1 -1 0 1 0 0 1 20
48 1 1 0 1 0 0 1 25
49 1 0 0 0 0 0 0 18
50 1 0 0 0 0 0 0 19
51 1 0 0 0 0 0 0 20
52 1 0 0 0 0 0 0 20
53 1 0 0 0 0 0 0 18
54 1 0 0 0 0 0 0 15
El análisis se realiza de manera similar a los desarrollados anteriormente. Suponga que se realiza una
investigación con F=6 factores con la aplicación de Box-Behnken con 6 puntos centrales. Los
resultados se presentan en la última columna, junto al diseño. Realizar el análisis.
REFERENCIAS BIBLIOGRÁFICAS
BOX, HUNTER, HUNTER (1995). Estadística para Investigadores. Editorial Reverté S.A.
de Barcelona España.
LEE WAYNE (1975) Experimental Desing and Analysis W.H. Freedman and Company.
San Francisco USA.
OSTLE BERNARD (1973) Estadística Aplicada. Editorial Limusa Willey S.A. de México.
Tercera Reimpresión.
177
Elías Alberto Torres Armas, Lic. Ms. C.
178
Métodos Estadísticos para la Investigación experimental
179