Sunteți pe pagina 1din 28

UNIVERSIDAD PRIVADA DE

TACNA
Diseños experimentales
II unidad
Tema: Comparación de medias
Semestre 2019-I
COMPARACIÓN DE MEDIAS
• En la unidad anterior vimos pruebas de hipótesis para comparar la media
de una población con un valor fijo de la media poblacional
• Sin embargo, en esta unidad la mayoría de las aplicaciones, interesa
comparar dos poblaciones, es decir el caso más simple. Por ejemplo, para
evaluar el efecto de un tratamiento, se suele comparar un grupo de
individuos al que se aplica el tratamiento con otro grupo al que se le aplica
otro tratamiento. En otros casos se comparan individuos expuestos a un
factor de riesgo con otros que no lo están; o individuos sanos contra
enfermos, etc.
• Emplearemos el análisis de procedimientos que permiten realizar
comparaciones estadísticas calculadas a partir de dos muestras de datos
numéricos con el propósito de hacer inferencias con respecto a las posibles
diferencias en los parámetros de las dos poblaciones respectivas.
Diferencia entre muestras independientes y
dependientes
• Dos muestras son independientes o dependientes entre sí, en función
de si las observaciones de las muestras se han obtenido de los
mismos individuos u objetos o no. Si ambas muestras se obtienen de
distintos individuos, máquinas, empresas, objetos, etc...no hay nada
en común en dichas muestras lo que hace que ambas sean
“independientes”.
• Sin embargo, si las observaciones o valores de ambas muestras se
obtienen de los mismos individuos, empresas, agentes, etc., diremos
que hay algo en común en dichas muestras por lo que serán muestras
“dependientes” o “no independientes”
ejemplos
• Supongamos que queremos comparar los beneficios empresariales
del sector de la agroindustria entre el año 2010 y el año 2012. Para
ello podemos tomar una muestra aleatoria formada por 50 empresas
agroindustriales de todo el país y medimos sus beneficios en el año
2010.
• A continuación, para poder comparar los beneficios del sector con el
año 2012, se toma otra muestra aleatoria distinta con otras 30
empresas constructoras y analizamos sus beneficios en el año
2012.
• En este caso se trata de muestras “independientes” puesto que las
observaciones de ambas muestras se toman de distintos individuos,
en este caso distintas rubros de empresas.
• Sin embargo, si en el año 2012 observamos los beneficios de las
mismas 50 empresas agroindustriales de la muestra del año 2010,
estaríamos por tanto ante muestras “dependientes” , o pareadas.
• Supongamos ahora que, al iniciar el semestre, seleccionamos
al azar 30 alumnos matriculados en Diseños y les pasamos un
test de conocimientos previos. Al final del semestre,
seleccionamos otros 30 alumnos al azar y les pasamos un test
de conocimientos adquiridos durante el curso. En tal caso,
consideraríamos ambas muestras como independientes. Por el
contrario, si el test de conocimientos adquiridos se realizase a
los mismos 30 alumnos que hicieron el test inicial, entonces
hablaríamos de muestras dependientes.
PRUEBAS DE VARIANZAS CONJUNTAS PARA
MUESTRAS INDEPENDIENTES
• Población 1→ 𝑛1 , media, varianza
• Población 2→ 𝑛2 , media, varianza
• La estadística ( 𝑋ത1 − 𝑋ത2 ), es la variable que sigue una distribución normal ,
por ello se emplea la siguiente expresión:

(𝑋ത1 −𝑋ത2 )−(𝜇1 −𝜇2 )


•𝑍=
𝜎2 2
1 +𝜎2
𝑛1 𝑛2

• La suposición fundamental es la independencia de las muestras y


varianzas poblacionales iguales. Siendo así, se emplea la distribución t para
determinar si existen diferencias entre las medias poblacionales.
• Procedimiento
• Hip nula: 𝜇1 = 𝜇2
• Hip alter:𝜇1 ≠ 𝜇2
• El estadístico de prueba es:

(𝑋ത1 −𝑋ത2 )−(𝜇1 −𝜇2 )


•𝑇= 1 1
donde: 𝑆𝑐2 : 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑎
𝑆𝑐2 (𝑛 +𝑛 )
1 2

• Regla de decisión si T > 𝑡𝑛1+𝑛2−2 𝑜 𝑇 < −𝑡𝑛1+𝑛2−2 , Rechazar la


hipótesis nula.
20 22 25 30 21 20 16 17 22 19 21 25 23 27 17

ejemplo1 30 30 29 27 25 26 24 23 28 26 25 24 23 22 26
28 29 22 34 32

• Suponer que un Ing es contratado para realizar consultoría en una


institución del estado, en materia ambiental. Desea comparar
resultados sensoriales de dos marcas de un producto lácteo de
naturaleza orgánica. Para este propósito selecciona 15 envases de la
marca gloria y 20 envases de la marca local. Los resultados se
observan en la siguiente tabla.
• Realizar una comparación de ambas marcas y describir sus
conclusiones. Qué producto presenta mejores resultados sensoriales?
ejemplo

-Se realizó un estudio para determinar la resistencia a la


ruptura de dos tipos de acero. Para una muestra aleatoria
formada por 20 especímenes de acero laminado en frío la
resistencia promedio muestral fue de 28.9 ksi.
• Al estudiar una segunda muestra aleatoria de 25
especímenes de acero galvanizado de dos lados se
obtuvo una resistencia promedio muestral 𝑑𝑒 𝑌ത =
32 ksi. Se supone que las distribuciones de la
resistencia a la ruptura de los dos tipos de acero son
normales con 𝜎1 = 4.0 y 𝜎2 = 5
• ¿Indican los datos que las medias de resistencia a la
ruptura son diferentes para los dos tipos de acero?
Ejemplo 2
• Se realizó un experimento para determinar el grado de contaminación
que presentan dos zonas en la región, dedicados a la producción de
productos orgánicos. De la zona A se tomó una muestra aleatoria de
20 frascos de agua de los ríos, proporcionando una media de 25% de
contaminación. Al recorrer la zona B, se tomó una muestra de 25
frascos de agua proporcionando un promedio de 28%. Para el estudio
se supone que los datos provienen de una distribución normal con
desviación de 2.3 y 2.8 para la zona A y B respectivamente.
• ¿Indican los datos que las medias del grado de contaminación son
diferentes para las dos zonas?
Para varianzas diferentes

(𝑋ത1 −𝑋ത2 )−(𝜇1 −𝜇2 )


•𝑇=
𝜎2 𝜎2
1+ 2
𝑛1 𝑛2

• Desarrollar el mismo ejemplo,


Comparación de medias relacionadas
• Nos permite contrastar hipótesis sobre igualdad de medias para muestras
relacionadas.
• Se considera una población de diferencias con media 𝜇𝐷 , resultado
de restar las puntuaciones de un mismo grupo en dos variables
diferentes o en la misma variable en dos momentos diferentes.
• De la población de diferencias se extrae una muestra aleatoria de tamaño
𝑛 y se utiliza la media de ésta para contrastar la hipótesis de que la media
de la población de diferencias es cero.
• Es necesario que la población de diferencias se distribuya normalmente.
• En este caso para realizar la prueba empleamos un procedimiento nuevo,
introduciendo una nueva variable, D, que se entiende como la diferencia
entre pares de valores coincidentes.
• Procedimiento
1° Se calcula la media de la variable D, diferencias
σ𝐷

𝐷=
𝑛
2° Se calcula la varianza de la diferencia de medias, mediante:
σ 𝐷2
2
𝜎𝐷 = −𝐷ഥ2 =
𝑛
3° Calculamos el error estándar de D mediante:
2
𝜎𝐷 𝜎𝐷
𝐸𝐸 = = =𝑆
𝑛−1 𝑛−1 𝐷
4° El estadístico de prueba T es:

𝐷
𝑇𝑐 =
𝑆𝐷
La estadística t sigue una distribución t con 𝜐 grados de libertad que resulta de la
expresión: n-1.
Ejemplo: Se ha estudiado el aumento de peso (en gramos) de 20
conejos jóvenes, cuyo registro se presenta a continuación
• Indiv: .
• 𝑀1 : 30 35 32 40 31 30 36 37 38 41 45 47 46 40 39 38 46 48 47 49
• ----------------------------------------------------------------------------------------------------
• 𝑀2 : 50 62 65 55 45 40 46 40 50 55 60 72 70 69 64 58 74 81 79 85

• 𝑀1 : peso inicial
• 𝑀2 : peso final
Ejemplo: Se ha estudiado el aumento de peso en monos
adultos de una reserva nacional (Kg), frente a la adopción de
una nueva dieta.
Realizar una prueba de comparación de medias relacionadas y
Responder: ¿La nueva dieta ha contribuido significativamente
en el aumento de peso de los monos?

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

20 24 18 24 32 15 20 19 18 14 18 17 26 10 19 18 16 18 17 19

50 25 28 25 29 40 25 30 29 25 20 27 35 15 28 24 20 25 26 25
Ejemplo

• NOVOMAT, S.A. es una empresa dedicada a la fabricación de piezas en


materiales compuestos a base de fibra de vidrio, kevlar y fibra de
carbono. Sus clientes son empresas de alta tecnología que precisan
incorporar a sus diseños componentes con un elevado límite elástico y
bajo peso. Las exigencias de estos clientes son cada vez mayores y las
especificaciones de compra cada vez más complejas.
• Para mejorar el proceso, NOVOMAT está evaluando dos alternativas, la
“A”, que es la actualmente implantada y la ”B” que incorpora
modificaciones sustanciales al proceso. Los ingenieros de proceso
basándose en datos anteriores saben que:
• La distribución de la característica de calidad en las piezas es
sensiblemente normal.
• La desviación típica del proceso es sensiblemente constante.
• Para comparar las dos alternativas se fabrican dos muestras de 10
unidades. Una vez ensayadas en el laboratorio, se obtienen los
siguientes valores:
• Valores de ensayo de las muestras de las alternativas A y B.

• A : 10.57 12.08 8.84 10.44 10.36 10.17 9.94 10.26 10.77 10.01
• B : 11.19 11.07 10.10 11.01 11.84 10.43 9.89 11.10 11.24 10.64
• Probar ambas alternativas y manifestar sus conclusiones
Ejemplo
• A las personas que sufren de tensión alta, se les recomienda
seguir una dieta libre de sal. Queremos realizar un estudio para
comprobar si esta dieta es efectivamente ventajosa. Para el
estudio se empleó una muestra de 10 personas y se tomó la
tensión antes de empezar la dieta. Dos semanas después se
tomó la segunda muestra. Los resultados obtenidos fueron:
• Antes 93 106 87 92 102 95 88 110 100 110
• Después 92 102 89 92 101 96 88 105 97 100
• Denotamos 𝜇𝐴 y 𝜇𝐵 a las medias poblacionales de tensión
antes y después de empezar la dieta, respectivamente. De este
modo, el contraste de hipótesis que debemos plantear es:
• 𝐻0 : 𝜇𝑎 = 𝜇𝑏
• 𝐻1 : 𝜇𝑎 > 𝜇𝑏
• 𝛼 = 0.01
𝐷ഥ
•𝑇=
𝑆𝐷
Ejemplo
• Antes de lanzar una promoción muy agresiva de un cierto producto
dirigida a los hipermercados de grandes superficies, la directora de
marketing de la empresa quiere saber si “merece la pena” (si se
traduce en un incremento en las ventas del producto en este tipo de
establecimientos). Para ello se seleccionan al azar 15 hipermercados
de Madrid para llevar a cabo la promoción y recoger datos de ventas
(en miles de $ mensual)antes y después de la promoción. Los datos a
continuación: Realizar la comparación de las ventas y manifestar si es
significativo el aumento
X 152 145 186 193 157 169 158 179 187 180 190 170 160 176 160
Y 159 149 193 198 176 172 160 187 190 190 196 179 170 179 180
2.2 ANALISIS DE VARIANZA
• Es una técnica que comprende una serie de modelos estadísticos y sus
procedimientos asociados, en el cual la varianza está particionada en ciertos
componentes debido a diferentes variables predictivas.
• Así mismo, un análisis de varianza (ANOVA)realiza la prueba de hipótesis
asumiendo que las medias de dos o más poblaciones son iguales. Esta técnica
evalúa la relevancia de uno o más factores de un experimento al comparar las
medias de la variable de salida en sus diferentes niveles. En la hipótesis nula se
plantea que todas las medias de la población (medias de los niveles de los
factores) son iguales mientras que la hipótesis alternativa establece que al menos
una es diferente.
Supuestos del ANVA
• Las muestras sobre las que se aplican los tratamientos son independientes y
aleatorias
• Las poblaciones de donde se extraen las muestras deben tener varianzas iguales.
• Las poblaciones deben ser normales.
• El ANVA, es una técnica que se emplea para comparar varios grupos
de muestras en una variable cuantitativa. En consecuencia, se trata
de generalizar la prueba t para muestras independiente o pareadas a
diseños con más de dos muestras.
• En esta técnica a las variables categóricas se les denomina factor de
entrada o variables causales. Mientras que a las cantidades que se
registran como resultados son las variables cuantitativas o factores de
salida o respuesta a la causa.
• Análisis de una factor: corresponde al análisis más sencillo, ya que
consiste en comparar la variación total de un conjunto de muestras y
plantear la siguiente ecuación:
• 𝑆𝐶𝑇 = 𝑆𝐶𝑒𝑛𝑡𝑟𝑒 + 𝑆𝐶𝑖𝑛𝑡𝑟𝑎
• Tal como observamos en la ecuación anterior, el ANOVA se basa en la
descomposición de la variación total de los datos con respecto a la
media global (SCT), que bajo el supuesto de que 𝐻0 es cierta es una
estimación de 𝜎 2 obtenida a partir de toda la información muestral,
en dos partes:
• Variación entre las muestras o Inter-grupos, cuantifica la dispersión
de los valores de cada muestra con respecto a sus correspondientes
medias.
• Variación dentro de muestras, o Intra-grupos, cuantifica la dispersión
de las medias de las muestras con respecto a la media global.
Tabla del ANOVA

Fuentes de Grados de libertad Suma de cuadrados Cuadrado medio Fc


variabilidad

Entre grupos K-1 SCEG SCEG/k-1=CMEG CMEG/CMIG


Intra grupos N-k SCIG SCIG/N-k=CMIG

TOTAL N-1
Formulas

(σ 𝑥)2
• 1. 𝑇𝐶 =
𝑁

• 2. 𝑆𝐶𝑇 = σ 𝑥 2 − 𝑇𝐶

σ 𝑥 2 𝑖.
• 3. 𝑆𝐶𝐸𝐺 = − 𝑇𝐶
𝑟

• 4. 𝑆𝐶𝐼𝐺 = 𝑆𝐶𝑇 − 𝑆𝐶𝐸𝐺


Ejemplo
• Ejemplo
• Un investigador desea comparar el efecto de cuatro alimentos
proporcionados a ratones de experimentación, para lo cual se
seleccionan 40 ratones y se les asigna cuatro alimentos diferentes a
10 ratones para tomar el peso a cada uno de ellos un tiempo
después, los datos son los siguientes:
• Realizar el anova
• Existen deferencias estadísticas significativas entre los grupo
Ejemplo

Alimento 1 Alimento 2 Alimento 3 Alimento 4


10 6 10 12
12 9 12 14
9 7 11 16
8 5 9 13
7 8 11 11
9 6 10 10
12 8 9 9
10 7 14 8
11 8 15 13
12 6 14 14
Solución
• 1. Se calcula un valor denominado Término de corrección: TC
• 2. Se calcula la suma de cuadrado global.
• 3. Se calcula la suma de cuadrados entre grupos o muestras
• 4. Se calcula la suma de cuadrados dentro de grupos.
• Hipótesis:
• 𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
• 𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 ≠ 𝜇4

S-ar putea să vă placă și