Documente Academic
Documente Profesional
Documente Cultură
TACNA
Diseños experimentales
II unidad
Tema: Comparación de medias
Semestre 2019-I
COMPARACIÓN DE MEDIAS
• En la unidad anterior vimos pruebas de hipótesis para comparar la media
de una población con un valor fijo de la media poblacional
• Sin embargo, en esta unidad la mayoría de las aplicaciones, interesa
comparar dos poblaciones, es decir el caso más simple. Por ejemplo, para
evaluar el efecto de un tratamiento, se suele comparar un grupo de
individuos al que se aplica el tratamiento con otro grupo al que se le aplica
otro tratamiento. En otros casos se comparan individuos expuestos a un
factor de riesgo con otros que no lo están; o individuos sanos contra
enfermos, etc.
• Emplearemos el análisis de procedimientos que permiten realizar
comparaciones estadísticas calculadas a partir de dos muestras de datos
numéricos con el propósito de hacer inferencias con respecto a las posibles
diferencias en los parámetros de las dos poblaciones respectivas.
Diferencia entre muestras independientes y
dependientes
• Dos muestras son independientes o dependientes entre sí, en función
de si las observaciones de las muestras se han obtenido de los
mismos individuos u objetos o no. Si ambas muestras se obtienen de
distintos individuos, máquinas, empresas, objetos, etc...no hay nada
en común en dichas muestras lo que hace que ambas sean
“independientes”.
• Sin embargo, si las observaciones o valores de ambas muestras se
obtienen de los mismos individuos, empresas, agentes, etc., diremos
que hay algo en común en dichas muestras por lo que serán muestras
“dependientes” o “no independientes”
ejemplos
• Supongamos que queremos comparar los beneficios empresariales
del sector de la agroindustria entre el año 2010 y el año 2012. Para
ello podemos tomar una muestra aleatoria formada por 50 empresas
agroindustriales de todo el país y medimos sus beneficios en el año
2010.
• A continuación, para poder comparar los beneficios del sector con el
año 2012, se toma otra muestra aleatoria distinta con otras 30
empresas constructoras y analizamos sus beneficios en el año
2012.
• En este caso se trata de muestras “independientes” puesto que las
observaciones de ambas muestras se toman de distintos individuos,
en este caso distintas rubros de empresas.
• Sin embargo, si en el año 2012 observamos los beneficios de las
mismas 50 empresas agroindustriales de la muestra del año 2010,
estaríamos por tanto ante muestras “dependientes” , o pareadas.
• Supongamos ahora que, al iniciar el semestre, seleccionamos
al azar 30 alumnos matriculados en Diseños y les pasamos un
test de conocimientos previos. Al final del semestre,
seleccionamos otros 30 alumnos al azar y les pasamos un test
de conocimientos adquiridos durante el curso. En tal caso,
consideraríamos ambas muestras como independientes. Por el
contrario, si el test de conocimientos adquiridos se realizase a
los mismos 30 alumnos que hicieron el test inicial, entonces
hablaríamos de muestras dependientes.
PRUEBAS DE VARIANZAS CONJUNTAS PARA
MUESTRAS INDEPENDIENTES
• Población 1→ 𝑛1 , media, varianza
• Población 2→ 𝑛2 , media, varianza
• La estadística ( 𝑋ത1 − 𝑋ത2 ), es la variable que sigue una distribución normal ,
por ello se emplea la siguiente expresión:
ejemplo1 30 30 29 27 25 26 24 23 28 26 25 24 23 22 26
28 29 22 34 32
• 𝑀1 : peso inicial
• 𝑀2 : peso final
Ejemplo: Se ha estudiado el aumento de peso en monos
adultos de una reserva nacional (Kg), frente a la adopción de
una nueva dieta.
Realizar una prueba de comparación de medias relacionadas y
Responder: ¿La nueva dieta ha contribuido significativamente
en el aumento de peso de los monos?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
20 24 18 24 32 15 20 19 18 14 18 17 26 10 19 18 16 18 17 19
50 25 28 25 29 40 25 30 29 25 20 27 35 15 28 24 20 25 26 25
Ejemplo
• A : 10.57 12.08 8.84 10.44 10.36 10.17 9.94 10.26 10.77 10.01
• B : 11.19 11.07 10.10 11.01 11.84 10.43 9.89 11.10 11.24 10.64
• Probar ambas alternativas y manifestar sus conclusiones
Ejemplo
• A las personas que sufren de tensión alta, se les recomienda
seguir una dieta libre de sal. Queremos realizar un estudio para
comprobar si esta dieta es efectivamente ventajosa. Para el
estudio se empleó una muestra de 10 personas y se tomó la
tensión antes de empezar la dieta. Dos semanas después se
tomó la segunda muestra. Los resultados obtenidos fueron:
• Antes 93 106 87 92 102 95 88 110 100 110
• Después 92 102 89 92 101 96 88 105 97 100
• Denotamos 𝜇𝐴 y 𝜇𝐵 a las medias poblacionales de tensión
antes y después de empezar la dieta, respectivamente. De este
modo, el contraste de hipótesis que debemos plantear es:
• 𝐻0 : 𝜇𝑎 = 𝜇𝑏
• 𝐻1 : 𝜇𝑎 > 𝜇𝑏
• 𝛼 = 0.01
𝐷ഥ
•𝑇=
𝑆𝐷
Ejemplo
• Antes de lanzar una promoción muy agresiva de un cierto producto
dirigida a los hipermercados de grandes superficies, la directora de
marketing de la empresa quiere saber si “merece la pena” (si se
traduce en un incremento en las ventas del producto en este tipo de
establecimientos). Para ello se seleccionan al azar 15 hipermercados
de Madrid para llevar a cabo la promoción y recoger datos de ventas
(en miles de $ mensual)antes y después de la promoción. Los datos a
continuación: Realizar la comparación de las ventas y manifestar si es
significativo el aumento
X 152 145 186 193 157 169 158 179 187 180 190 170 160 176 160
Y 159 149 193 198 176 172 160 187 190 190 196 179 170 179 180
2.2 ANALISIS DE VARIANZA
• Es una técnica que comprende una serie de modelos estadísticos y sus
procedimientos asociados, en el cual la varianza está particionada en ciertos
componentes debido a diferentes variables predictivas.
• Así mismo, un análisis de varianza (ANOVA)realiza la prueba de hipótesis
asumiendo que las medias de dos o más poblaciones son iguales. Esta técnica
evalúa la relevancia de uno o más factores de un experimento al comparar las
medias de la variable de salida en sus diferentes niveles. En la hipótesis nula se
plantea que todas las medias de la población (medias de los niveles de los
factores) son iguales mientras que la hipótesis alternativa establece que al menos
una es diferente.
Supuestos del ANVA
• Las muestras sobre las que se aplican los tratamientos son independientes y
aleatorias
• Las poblaciones de donde se extraen las muestras deben tener varianzas iguales.
• Las poblaciones deben ser normales.
• El ANVA, es una técnica que se emplea para comparar varios grupos
de muestras en una variable cuantitativa. En consecuencia, se trata
de generalizar la prueba t para muestras independiente o pareadas a
diseños con más de dos muestras.
• En esta técnica a las variables categóricas se les denomina factor de
entrada o variables causales. Mientras que a las cantidades que se
registran como resultados son las variables cuantitativas o factores de
salida o respuesta a la causa.
• Análisis de una factor: corresponde al análisis más sencillo, ya que
consiste en comparar la variación total de un conjunto de muestras y
plantear la siguiente ecuación:
• 𝑆𝐶𝑇 = 𝑆𝐶𝑒𝑛𝑡𝑟𝑒 + 𝑆𝐶𝑖𝑛𝑡𝑟𝑎
• Tal como observamos en la ecuación anterior, el ANOVA se basa en la
descomposición de la variación total de los datos con respecto a la
media global (SCT), que bajo el supuesto de que 𝐻0 es cierta es una
estimación de 𝜎 2 obtenida a partir de toda la información muestral,
en dos partes:
• Variación entre las muestras o Inter-grupos, cuantifica la dispersión
de los valores de cada muestra con respecto a sus correspondientes
medias.
• Variación dentro de muestras, o Intra-grupos, cuantifica la dispersión
de las medias de las muestras con respecto a la media global.
Tabla del ANOVA
TOTAL N-1
Formulas
(σ 𝑥)2
• 1. 𝑇𝐶 =
𝑁
• 2. 𝑆𝐶𝑇 = σ 𝑥 2 − 𝑇𝐶
σ 𝑥 2 𝑖.
• 3. 𝑆𝐶𝐸𝐺 = − 𝑇𝐶
𝑟