Sunteți pe pagina 1din 55

6

PRUEBA DE HIPTESIS
6.1 INTRODUCCIN
Los mtodos estudiados en el captulo anterior usan la informacin proporcionada por los estadsticos muestrales para estimar con cierta probabilidad el valor de un parmetro poblacional. En ste captulo se introducir la prueba de hiptesis que es un enfoque diferente. En ste caso, se supone a priori el valor del parmetro y sobre la base de la informacin obtenida en una muestra se somete a prueba la suposicin, para luego tomar con cierta probabilidad, la decisin de rechazar o no rechazar la hiptesis. En ste punto es importante sealar que la expresin no rechazar pudiera ser sustituida por aceptar, sin embargo antes de hacerlo es necesario atender cuidadosamente algunas explicaciones que se darn ms adelante. La prueba de hiptesis tambin conocida como docimasia o contrastacin de hiptesis es uno de los mtodos estadsticos ms usados en las ciencias naturales por ser un procedimiento que le proporciona al investigador un criterio objetivo para tomar decisiones con base a un nmero limitado de observaciones. Frecuentemente el bilogo tiene que decidir: a) al comparar magnitudes de propiedades fsicas, qumicas o biolgicas en dos o ms condiciones o categoras, como es el caso de confrontar el valor medio de la presin arterial en personas pertenecientes a dos grupos etarios; b) al valorar los efectos de diferentes niveles de algn factor ambiental como la temperatura, la humedad, el contenido de oxgeno sobre algn proceso, caracterstica o propiedad de un organismo; y c) al relacionar dos o ms variables, como la intensidad lumnica y la tasa fotosinttica. En ste captulo y en los siguientes se trataran varios procedimientos para probar hiptesis que dan respuesta a este tipo de problemas o a otros similares.

6.2 LA PRUEBA DE HIPTESIS: UN PROCEDIMIENTO DE DECISIN


Antes de estudiar las distintas etapas y casos de las que consta el procedimiento para la prueba de hiptesis, consideraremos un ejemplo que servir para mostrar los fundamentos del proceso de docimasia y la toma de decisiones. Ejemplo 6.1. Con el propsito de determinar el efecto de una nueva dieta sobre el desarrollo de ratones de laboratorio un investigador necesita formar varios grupos de ratones recin nacidos todos con un mismo peso. De manera que conforma varios lotes de 36 ratones con un peso aproximado a los 30 g. Para verificar si los grupos son homogneos en cuanto al peso, vuelve a pesar cuidadosamente los 36 ratones de cada grupo y le calcula el valor promedio y la desviacin estndar. El investigador sabe que al ser el peso una variable aleatoria y por estar trabajando con una muestra es difcil que cada grupo tenga un peso promedio exactamente igual a 30 g, aunque si bastante aproximado a ste valor. Sin embargo el investigador se

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

109

encuentra ante una disyuntiva: a) si el valor promedio de peso para cada grupo se considera como una simple desviacin fortuita de los 30 g dada la variabilidad caracterstica de las muestras aleatorias, no hay necesidad de reorganizar el grupo, y b) si el valor medido esta verdaderamente desviado del valor esperado de 30 g es necesario reorganizar el grupo sustituyendo los ratones causantes de la desviacin. A fin de tener un criterio objetivo que le ayude a tomar la mejor decisin, el investigador establece como premisa que el peso promedio de la poblacin de donde provienen los pesos de los ratones es de 30 g. Si es cierto que = 30 es de esperar que el valor promedio del grupo o muestra x sea muy cercano a dicho valor y su probabilidad de ocurrencia sea alta. Si esto sucede se acepta la hiptesis y se considera que la desviacin del peso promedio de la muestra con respecto a la media esperada, x - , es producto de la naturaleza aleatoria de la variable peso, siendo innecesario reorganizar el grupo de ratones. Pero an siendo cierto que = 30, es posible que los 36 ratones tengan un peso promedio alejado del peso esperado de 30 g, lo cual es improbable, En ste caso, el investigador puede aceptar que = 30 y considerar que ocurri un hecho poco probable o alternativamente decidir que en lugar de haber sucedido algo poco probable considerar que el valor de la media poblacional es menor a 30 ( < 30). Ilustremos la situacin anterior en forma real y supongamos que el investigador encontr que uno de los grupos dio como resultado un promedio de 29.3 g con una desviacin de 2 g. De acuerdo a lo dicho anteriormente, para poder tomar la decisin de reorganizar o no el grupo de ratones, se debe proceder a determinar si 29.3 ocurre con una probabilidad alta o baja teniendo como hiptesis que = 30. Como el peso promedio observado es menor a 30 se debe proceder a hallar la P( X 30 ). Para tal fin tenemos que saber como es la distribucin de la media muestral. Aunque desconocemos la distribucin de la variable peso promedio, como el tamao de la muestra es grande (n = 36) se puede afirmar, de acuerdo al Teorema del Lmite Central, que dicha variable se distribuye normalmente con media igual a 30 y desviacin igual a S x = 2 36 = 0.33 . Por lo tanto la probabilidad buscada ser: 29.3 30 P ( X 29.3) = P ( Z z ) = P ( Z = P ( Z 2.1) = 0.0179 2 36 Esta probabilidad tan baja (Figura 6.1), tiene dos explicaciones: a) La hiptesis de que = 30 es cierta y ocurri un hecho casi imposible como el de obtener un peso promedio igual a 29.3 el cul esta muy alejada del valor esperado de 30 g, y b) la hiptesis anterior no es cierta y el valor esperado es mucho menor a 30. La explicacin b resulta obviamente ms razonable.

Figura 6.1.

Pero veamos que habra ocurrido si el valor de la media muestral hubiese sido ms prximo a 30, por ejemplo 29.9. En ste caso la probabilidad de que ocurra un valor igual o menor a 29.9 sera:

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

110

P ( X 29.9) = P ( Z

29.9 30 = P ( Z 0.3) = 0.382 2 36

Esta es una probabilidad de ocurrencia alta (Figura 6.2), siempre y cuando = 30. Por lo tanto resulta razonable aceptar la presuncin de que el peso promedio del grupo todava es igual a 30 g. Pero si la media muestral hubiese dado un valor ni tan prximo ni tan alejado de 30 la decisin no sera tan clara. Por ejemplo si el valor de la media muestral hubiese sido 29.5 Cul sera la decisin?. P ( X 29.6) = P ( Z

Figura 6.2

29.6 30 = P ( Z 1.2) = 0.1151 2 36

En este caso la probabilidad no es tan baja (Figura 6.3) para rechazar de inmediato que = 30 y tampoco es tan alta para aceptar sin mayores consideraciones que = 30. Esta situacin de incertidumbre siempre estar presente para cualquier valor con probabilidades moderadas de ocurrencia.

Figura 6.3

La mejor manera de resolver el problema es estableciendo previamente un criterio o valor lmite para aceptar o rechazar la hiptesis y as poder tomar una decisin inmediata. Este valor lmite debe excluir los valores que ocurren con menor probabilidad. Por lo general se excluyen aquellos valores cuya probabilidad de ocurrencia es igual o menor a 0.05. Tambin se pueden utilizar otros criterios como aquellos que establecen una probabilidad de ocurrencia igual o menor a 0.01 0.001. Ms adelante sern discutidas las razones que fundamentan la escogencia de un valor lmite de probabilidad como criterio para rechazar o no una hiptesis. Por ahora es necesario concentrarse en comprender el proceso de encontrar este valor crtico. Una vez que se elige el valor de probabilidad que sirve de criterio para tomar una decisin, se pueden conocer cules valores de la variable cumplen con sta decisin. Si decidimos que el valor de probabilidad crtico es 0.05, todos los valores que rechazan la hiptesis establecida son aquellos cuya P(X x ) = 0.05. A partir de sta expresin se puede encontrar cul es valor de X a partir del cual la probabilidad de ocurrencia es menor a 0.05. Sabemos que P(X x ) = 0.05 es equivalente a P(Z z) = 0.05, siendo z igual a z= x x Sx n

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

111

El valor de Z a la izquierda del cul se encuentra el 0.05% del rea de la distribucin de probabilidades de la media muestral es -1.64, por lo tanto, si se despeja x de la expresin anterior se tiene que, x = x + z (0.05) S x n = 30 + (1.64)(2 / 36) = 30 0.5412 = 29, 46

Este valor es ahora nuestro lmite para tomar la decisin de aceptar o rechazar la presuncin de que = 30. Si la media del grupo de ratones es menor a 29.46 se rechaza la premisa y si es mayor se acepta (Figura 6.4). Ahora sabemos que 0.54 es la mxima desviacin que se puede aceptar para concluir que la diferencia entre la media observada y la esperada es Figura 6.4 simplemente aleatoria. Volviendo al caso de los ratones, el investigador ahora conociendo el peso promedio de cada grupo puede tomar rpidamente una decisin para mantener o reorganizar el grupo, simplemente comparando la media obtenida con el valor crtico de 29.46 g.

6.3 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS


En el procedimiento usado para resolver el problema del Ejemplo 6.1 se pueden identificar varias etapas fundamentales, las cuales se pueden reordenar e identificar en la forma siguiente: 1. Formulacin de hiptesis 2. Especificacin de un valor de probabilidad crtico o nivel de significacin. 3. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. 4. Establecimiento de una zona de rechazo para Ho. 5. Cmputos necesarios. 6. Decisin. En lo que sigue nos permitiremos dos concesiones: supondremos que todas las variables usadas siguen una distribucin normal y la mayora de las veces usaremos la media poblacional como ejemplo del parmetro a docimar. Formulacin de hiptesis. Por lo general toda investigacin en el campo de las ciencias naturales se inicia a partir de una hiptesis la cual es una explicacin tentativa que se da a un hecho observado. La misma puede surgir a partir de una teora general que explica cierta realidad a la cual pertenece el fenmeno observado, o por la experiencia propia o de otros investigadores, o por simple intuicin. Ahora bien, en la formulacin de cualquier hiptesis est implcita una hiptesis alternativa. Por ejemplo, se puede plantear como hiptesis de investigacin que el ejercicio constante disminuye el nivel de colesterol en el plasma sanguneo, pero asociada a esta hiptesis existe otra premisa alterna que se opone, en ste caso la alternativa sera que el ejercicio constante no disminuye el nivel de colesterol en el

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

112

plasma sanguneo. Estas hiptesis de investigacin para poderse someter a prueba deben concretarse en trminos cuantitativos, transformndose en hiptesis estadsticas. Para el ejemplo anterior, se puede proponer como hiptesis estadstica que bajo cierto programa de ejercicio la tasa promedio de disminucin de la concentracin del colesterol ser mayor a 30 unidades. Consecuentemente existe una hiptesis estadstica alternativa que en este caso plantea que con el ejercicio la tasa promedio de disminucin del colesterol ser igual a 30 unidades. De manera que las hiptesis de investigacin se derivan de las teoras que se estn probando y las hiptesis estadsticas hacen factible su contrastacin. En forma general las hiptesis estadsticas son afirmaciones que involucran una propiedad de la distribucin probabilstica de la variable aleatoria que se est estudiando, propiedades como son la media (), la varianza (2), un valor de proporcin () o la forma de la distribucin. De modo que el primer paso en un proceso de decisin es formular las hiptesis estadstica, las cuales reciben el nombre de hiptesis nula (H0) e hiptesis alternativa (H1). La hiptesis nula se dice que es una hiptesis simple, porque es una afirmacin de igualdad con un valor especifico, mientras que las hiptesis alternativa se dicen que es compuesta porque puede asumir diferentes valores. Si se representa un parmetro poblacional por letra griega y con o un valor cualquiera del parmetro, la forma genrica de la hiptesis nula sera una igualdad entre el parmetro y un valor especfico del mismo, H0 : = Por su parte la hiptesis alternativa se puede representar con una de las tres posibilidades siguientes: > H1: < La expresin > se interpreta como que el parmetro puede asumir cualquier valor mayor a y se dice que la prueba de hiptesis es de una cola a la derecha. Por su parte < indica que el parmetro puede ser cualquier valor menor a y la prueba de hiptesis se llama de una cola a la izquierda. Finalmente representa la posibilidad que el parmetro asuma cualquier valor diferente (mayor o menor) al valor y la prueba de hiptesis se denomina de dos colas. Ms adelante, cuando se trate lo referente al establecimiento de la zona de decisin, se aclarar la razn de esta nomenclatura. Para el caso del ejemplo del programa de ejercicios y la disminucin del nivel de colesterol en la sangre, las hiptesis se pueden plantear de la manera siguiente: Hiptesis nula Hiptesis alternativa : H0 : = 30 H1: > 30

La hiptesis nula establece que un parmetro como la tasa media de disminucin de la concentracin de colesterol es igual al valor de 30, mientras que la hiptesis alternativa predice que su valor ser mayor a 30. Aqu podemos darnos cuenta que la proposicin que el investigador quiere probar, como es que la disminucin promedio de colesterol ser mayor a 30 unidades, est recogida por la hiptesis alternativa, mientras que la hiptesis nula asume la proposicin que se quiere negar. La utilidad de plantear las hiptesis de sta manera se explica porque el rechazo de H0 es un veredicto mucho ms robusto que su no rechazo, puesto que es necesario acumular evidencia

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

113

cientfica muy fuerte para poder rechazar una hiptesis nula. Por lo tanto la consecuencia de rechazar una hiptesis nula es un gran apoyo a la hiptesis alternativa. Ilustremos esta situacin con la analoga siguiente: en los procesos judiciales donde hay alguien acusado de un delito, hay dos hiptesis: inocente (H0) y culpable (H1). El fiscal pblico tiene inters en probar que el acusado es culpable. Para poder llegar a una decisin de culpable es necesario presentar suficientes evidencias que garanticen que la decisin es correcta. De no tenerse evidencias fuertes la hiptesis nula de inocencia no puede ser rechazada, pero esto no significa que se comprob la inocencia del acusado, sino que no se logr acumular suficientes elementos para rechazar H0. De hecho es posible que con nuevas investigaciones se determine la culpabilidad del acusado. Por el contrario habindose obtenido fuertes evidencias de culpabilidad, se acepta la hiptesis alternativa, decisin que es mucho ms difcil revertir. En otras palabras la probabilidad de cometer un error es mucho menor al rechazar H0 que al no rechazarla. En la prctica jurdica, si la evidencia es dbil es preferible equivocarse declarando inocente a alguien culpable que condenando a un inocente. Un razonamiento similar a ste es el que usan los investigadores cuando plantean como hiptesis alternativa el evento que se quiere probar. Si los datos usados para probar las hiptesis proporcionan suficiente evidencia para rechazar la hiptesis nula, como consecuencia inmediata la hiptesis alternativa recibe un respaldo muy fuerte. Pero si el investigador hubiese planteado el mismo evento como hiptesis nula, su no rechazo no demuestra que el evento de inters sea verdad, sino que los datos no proporcionaron evidencia para rechazarla, dejando abierta la posibilidad de poder ser refutada con otro conjunto de datos o que otra hiptesis sea la verdadera. Por esta razn, es que la sustitucin del trmino no rechazar H0 por el trmino aceptar H0, no es muy conveniente y de hacerlo se debe estar consciente que la aceptacin de H0 es slo temporal. Veamos un ejemplo biolgico: durante mucho tiempo los taxnomos, al describir los mamferos le asignaban como una caracterstica nica el hecho de ser vivparos, es decir que los individuos se desarrollaban en el vientre de la madre y cuando nacan ya haban completado en gran parte su desarrollo, lo cual los diferenciaba de los animales ovparos y ovovivparos cuyo desarrollo se completa dentro de un huevo. Esta era una hiptesis que haba recibido mucho respaldo, puesto que cada vez que apareca una nueva especie de mamfero reciba apoyo la hiptesis. Pero esto fue as hasta finales del siglo XVIII cuando fueron descubiertos los ornitorrincos, mamferos que viven en Oceana que junto con los equidna, descubiertos posteriormente, son los nicos mamferos ovparos porque sus cras se desarrollan dentro de huevos fuera del cuerpo de la madre. Es decir que la hiptesis de la viviparidad que pareca un hecho fuertemente comprobado se vino abajo cuando apareci la primera evidencia contradictoria. En otras palabras la hiptesis alternativa implcita que era que no todos los mamferos eran vivparos, qued definitivamente comprobada al negarse la hiptesis nula. Esto demuestra lo conveniente de probar un hecho no por el aporte directo de evidencias sino por el rechazo de un hecho opuesto. Volviendo al ejemplo del colesterol, si se refuta H0: = 30, es porque los datos obtenidos en la muestra fueron concluyentes, por lo cual la hiptesis alternativa H1: > 30 recibe un apoyo muy fuerte. Por el contrario si no se rechaza H0 las implicaciones de este hecho no son concluyentes. El no rechazo no significa que necesariamente = 30, porque se hubiese llegado a la misma conclusin con cualquier otro valor de menor a 30, lo cual deja muchas dudas con relacin al verdadero valor de . Tambin el no rechazo de H0 solo indica que la proposicin es aceptada temporalmente dado que puede ser revertida con un nuevo conjunto de datos. El ejemplo que sigue puede aclarar la temporalidad de una aceptacin de H0.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

114

Suponga que alguien afirma que todos los granos de frijol que hay en un saco son de color verde. Para probarlo toma un puado de granos y observa su color. Si todos los frijoles del puado son verdes, no significa que prob su premisa, solamente le dio apoyo. Puede repetir el ensayo muchas veces con el mismo resultado, pero mientras existan granos de frijol en el saco su hiptesis no esta probada, porque si en alguno de los ensayos encuentra un solo grano de otro color, la hiptesis nula queda definitivamente negada y por el contrario la hiptesis alternativa implcita de que no todos los granos de frijol del saco son verdes queda plenamente confirmada. Como vimos existen tres formas distintas de planteamiento para la hiptesis alternativa. La seleccin de una de ellas depende de la naturaleza del problema que se quiere docimar. Algunos ejemplos pueden ayudar a entender la lgica para seleccionar una hiptesis alternativa. Ejemplo 6.2. Un bilogo sospecha que debido a la escasez de alimento que hay en un ro, la talla promedio de las truchas adultas que viven en el mismo no alcanza el tamao mnimo de pesca permitido que es de 25 cm. Si se comprueba la sospecha del investigador se prohibir la pesca de truchas en ese ro, de lo contrario no se tomar ninguna medida. Puesto que el planteamiento que quiere probar el bilogo es que la talla promedio de las truchas es menor al valor mnimo permitido, las hiptesis a probar deben ser las siguientes: H0 : = 25 H1: < 25 Ejemplo 6.3. Se quiere saber si una nueva droga es eficaz como tratamiento del SIDA. Para lo cual a un grupo de paciente se le aplica un tratamiento con la droga. La eficacia de la droga implica que la mayora de los pacientes, es decir que ms de la mitad de los pacientes a los cuales se les aplic el tratamiento con la droga, respondieron positivamente a la enfermedad. Si se considera que es la proporcin de la poblacin de pacientes para los cuales la droga es eficaz, las hiptesis que se deben someter a prueba sern las siguientes: H0 : = 0.5 H1: > 0.5 Ejemplo 6.4. Un especialista en nutricin sospecha que el contenido de protena total en la sangre de pacientes que estn sometidos a cierto rgimen de alimentacin no es el mismo que el registrado en otro grupo de pacientes sometidos a otro tratamiento, para el cual se sabe que el contenido de protena total tiene un valor promedio igual a 7.0 unidades. El especialista sospecha que el contenido de protena total no es el mismo en los dos grupos de pacientes, lo cual implica que el valor de esta variable para el grupo problema puede ser mayor, menor o igual al grupo de referencia, por lo tanto las hiptesis a probar deben ser las siguientes: H1: 7.0 H0 : = 7.0

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

115

La formulacin de hiptesis no siempre es una tarea fcil debido a que no todas las situaciones son tan obvias como las planteadas en los ejemplos anteriores. Como no existen normas ni procedimientos que se puedan aplicar para plantear correctamente las hiptesis estadsticas, el investigador debe apelar a la experiencia y a su conocimiento del sistema bajo estudio. Muchas veces, se plantean las hiptesis con base a los resultados obtenidos en una muestra. Pero esto no es correcto, porque de hacerlo, se estara usando la informacin que proporciona la muestra con el doble propsito de formular y docimar las hiptesis. Esta manera de proceder puede llevar a cometer errores graves. Ilustremos esta situacin con el caso del Ejemplo 6.4. Como vimos se plante una hiptesis alternativa de diferencia, lo cual conduce a una prueba de hiptesis de dos colas. Supngase que la hiptesis nula ( = 7.0) es cierta. Si la formulacin de hiptesis se hubiese hecho despus de obtener los datos de una muestra, en lugar de plantearse una hiptesis alternativa de dos colas, necesariamente se hubiese tenido que plantear una hiptesis de una sola cola, hacia la derecha o la izquierda, porque difcilmente una muestra hubiese dado un valor promedio igual a 7.0. Las consecuencias de este proceder es que aumenta la posibilidad de rechazar la hiptesis nula cuando de hecho es verdadera. Esto quedar ms claro cuando se traten los problemas que se derivan de la toma de decisiones estadsticas. Especificacin del nivel de significacin. Cualquier decisin dentro del proceso de prueba de hiptesis lleva asociado cierto riesgo de fallar. Es decir que siempre existe la posibilidad de tomar una decisin equivocada, slo que en este tipo de prueba se tiene la ventaja de conocer de antemano la probabilidad de equivocarse. En la Tabla 6.1 se muestran las posibles consecuencias de tomar una decisin con relacin a la hiptesis nula. Tabla 6.1. Situaciones derivadas de una decisin estadstica CONDICIN REAL H0 cierta H0 falsa DECISIN Rechazar Ho No Rechazar Ho Error (Tipo I) Acierto Acierto Error (Tipo II)

El razonamiento bsico del proceso de prueba de hiptesis supone que si el planteamiento de la hiptesis nula es cierto, por ejemplo que H0 = , la mayora de las muestras proporcionaran valores del muy prximos a estadstico muestral , y por lo tanto caern dentro de la zona de aceptacin (Figura 6.5).

Figura 6.5

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

116

Pero tambin una minora de observaciones puede no caer en la zona de aceptacin a pesar que H0 sea cierta, provocando que se tome una decisin errada, aunque se tiene a favor que se conoce la magnitud de ese error. Por ejemplo cuando se define una zona de aceptacin donde se espera caigan el 95% de las observaciones si H0 es cierta, tambin se est determinando que en un 5% de los casos se puede cometer una equivocacin al rechazar H0 cuando de hecho es cierta. Es decir que la probabilidad de cometer una falla es igual a 0.05. Este tipo de error se llama Error Tipo I (Tabla 6.1) y su probabilidad se identifica con la letra (Figura 6.6a). Tambin se puede cometer un error si se acepta H0 cuando de hecho es falsa. Esto sucede cuando una observacin cae dentro de la zona de aceptacin de H0, siendo otra hiptesis H1 la verdadera (Figura 6.6b). En queda este caso la observacin muestral dentro de la zona de aceptacin de H0, pero siendo verdadera H1. Este tipo de error se conoce como Error Tipo II (Tabla 6.1) y su probabilidad se identifica con la letra (Figura 6.6b)

a)

b)

Figura 6.6

En trminos de probabilidad los dos tipos de errores se expresan de la forma siguiente: Zona rechazo / H0 cierta} = P{Error Tipo I} = P{ Zona aceptacin / H1 cierta} = P{Error Tipo II} = P{ Como se puede notar tanto como son probabilidades condicionadas. Los valores de ambos errores no pueden calcularse en un sentido absoluto. Para calcular es necesario asumir que H0 es cierta y para calcular se asume que H1 es cierta. En cualquier prueba de hiptesis lo ms conveniente ser que ambos tipos de errores sean lo ms pequeo posible, pero esto no es fcil de lograr, porque al intentar disminuir uno el otro aumenta proporcionalmente (Figura 6.7).

Figura 6.7

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

117

Afortunadamente al incrementar el tamao n de la muestra es posible disminuir la probabilidad de cometer el Error Tipo II, manteniendo constante la probabilidad de cometer el Error Tipo I. En la Figura 6.8 se muestra como al aumentar el tamao de la muestra se reduce la varianza de las distribuciones e igualmente el valor de , mientras que el valor de se mantiene en 0.05.

Figura 6.8 De acuerdo a lo visto hasta ahora, sera lgico concluir que es necesario conocer la magnitud con la cual ambos errores operan en una prueba de hiptesis. Lamentablemente, esto slo es posible para el Error Tipo I. Debido a la naturaleza del procedimiento, al formular una hiptesis nula no slo se supone el valor de un parmetro, sino que se presume la ubicacin de la distribucin de probabilidades del estadstico de prueba. La consecuencia de esto es que puede fijarse un valor de y establecerse la respectiva regin de rechazo de H0. Esto no es posible para el caso del Error Tipo II. Aun cuando se rehace H0 se desconoce el valor de la hiptesis alternativa y por lo tanto la ubicacin de la distribucin probabilstica del estadstico de prueba, no pudindose fijar el valor de . Por tales razones en toda prueba de hiptesis una vez que se han formulado la hiptesis se fija el valor de con el cual se cuantifica el riesgo que se esta dispuesto a correr al rechazar una hiptesis nula cierta. El valor de se conoce como nivel de significacin, trmino con el cual se quiere destacar que cualquier estadstico cuya probabilidad de ocurrencia sea igual o menor al valor de , mantiene una diferencia tan grande con el valor del parmetro supuesto que se puede concluir que no pertenece a la distribucin con la cual se est trabajando y por lo tanto asegurar que H0 es falsa y otra hiptesis es la verdadera. Comnmente los niveles de significacin usados son 0.05, 0.01 y 0.001. El grado de importancia de la significacin se califica de distintas formas dependiendo de donde se ubique el valor de probabilidad del estadstico. ) > 0.01 se dice que la prueba de hiptesis es significativa (*). Si 0.05 > P( ) > 0.001 se dice que la prueba de hiptesis es muy significativa (**). Si 0.01 > P( ) se dice que la prueba de hiptesis es altamente significativa (***). Si 0.001 > P(

El nmero de asteriscos es una forma de indicar en un texto o en una tabla de resultados el grado de significacin de los estadsticos de prueba. Tomemos como ejemplo los resultados que se presenta en la tabla siguiente:

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

118

Tabla 6.2. Densidad promedio de cuatro gneros de Ephemeroptera (Insecta) en dos ros de montaa. Gnero Baetis Thraulodes Leptohyphes Baetodes Ro A 64.6 22.7 40.7 256.8 Ro B *** 107.1 ** 38.5 * 57.9 ns 259.4

* = diferencias significativas (P < 0.05). ** = diferencias muy significativas (P < 0.01). *** = diferencias altamente significativas (P < 0.001). ns = diferencias no significativas (P > 0.05).

Tambin dentro de los textos cientficos se suele presentar el resultado de una prueba estadstica indicando el nivel de significacin o el rango de probabilidad dentro del cual se ubica el estadstico de prueba, Ejemplo: ... la densidad de insectos no mostr relacin con los valores acumulados de precipitacin (rs = 0.14; p < 0.05).... Seleccin del estadstico de prueba. Para poder someter a prueba las hiptesis formuladas, es necesario usar alguna propiedad o estadstico de las muestras que est relacionado con el parmetro objeto de la inferencia. Estas propiedades muestrales reciben el nombre genrico de estadsticos de prueba. En la Tabla 6.3 se muestran algunos parmetros y sus estadsticos de prueba correspondiente. Tabla 6.3. Parmetros y estadsticos de prueba ms comunes Parmetro Media () Diferencia de Medias (2-1) Varianza (2) Proporcin () Coeficiente de correlacin () Estadstico de prueba x x 2 x1 s2 p r

Sin embargo, por razones prcticas, muchas veces los estadsticos de prueba no se usan en su forma original sino con otras formas equivalentes o derivadas (Tabla 6.4)

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

119

Tabla 6.4. Estadsticos de prueba para algunos parmetros poblacionales. Parmetro Media () Estadstico de prueba x Estadsticos de prueba derivados z = ( x ) ( z = ( x ) (s t = ( x ) (s Z = ( x 2 x1 ) ( 2 1 ) Diferencia de medias (2 1) Z = ( x 2 x1 ) ( 2 1 ) T = ( x 2 x1 ) ( 2 1 ) n) n) n)
2 2 2 + 1 n 2 n1 2 s2 s2 + 1 n 2 n1 2 s2 s2 + 1 n 2 n1

x 2 x1

Varianza Razn de varianzas

2 2 1
2 2

2 2 = (n 1) s 2 0

2 2 ) ( s 2 2 ) F = (s 2 2 1 1

La utilidad de estos y otros estadsticos de prueba se ver cuando se traten particularmente las pruebas de hiptesis para algunos parmetros. Establecer una zona de aceptacin para H0. Una vez conocido el estadstico de prueba a utilizar, as como su distribucin, es necesario definir en la distribucin del estadstico muestral una zona de aceptacin y una zona de rechazo de la hiptesis nula. La zona de aceptacin de H0 est formada por todos los valores del estadstico de prueba con una probabilidad de ocurrencia mayor al establecido en el nivel de significacin.. Por el contrario la zona de rechazo est formada por todos los valores del estadstico de prueba cuya probabilidad de ocurrencia es igual o menor al valor establecido en el nivel de significacin. La zona de rechazo a diferencia de la zona de aceptacin y dependiendo de la hiptesis alternativa planteada puede estar orientada en diferentes direcciones a lo largo del eje de valores de la variable aleatoria. Zona de rechazo a la derecha: esta formada por todos los valores del estadstico de prueba ubicados a la derecha del parmetro cuya probabilidad de ocurrencia es menor a la del nivel de significacin. Esta zona se especifica cuando H1: > 0 y la docimasia se llama prueba de una cola a la derecha (Figura 6.9A)

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

120

Zona de rechazo a la izquierda: esta formada por todos los valores del estadstico de prueba ubicados a la izquierda del parmetro cuya probabilidad de ocurrencia es menor a la del nivel de significacin. Esta zona se especifica cuando H1: < 0 y la docimasia se llama prueba de una cola a la izquierda (Figura 6.9B) Zona de rechazo doble: La zona de rechazo puede ser dividida en dos partes iguales ubicadas a cada lado del parmetro. La zona de la derecha y de la izquierda estn formadas por todos cuya probabilidad de ocurrencia es menor a la mitad de los valores del estadstico de prueba la probabilidad del nivel de significacin . Esta zona se especifica cuando H1: 0 y la docimasia se llama prueba de dos colas (Figura 6.9C).

Figura 6.9: Posible ubicacin de la zona de rechazo de H0. A) A la derecha; B) A la izquierda, y C) Ambos lados. = parmetro; o =valor del parmetro y k = valor crtico. ), que como se ve en la Para concretar una decisin, es necesario encontrar un valor crtico ( k Figura 6.9 es el valor del estadstico de prueba que separa la regin de aceptacin de la regin de rechazo. Esto explica la importancia de conocer la distribucin del estadstico de prueba. Este valor crtico por lo general se expresa en trminos de los estadsticos de prueba derivados debido a la facilidad de encontrar el valor requerido usando las tablas de probabilidad acumulada de las distribuciones de probabilidad que estos estadsticos siguen. Como se observa en la Figura 6.9 y la Tabla 6.5 la cuanta del valor crtico depende, adems de la distribucin de probabilidad, del valor de . Tabla 6.5: Algunos valores crticos de Z y T usados en las pruebas de hiptesis = 0.100 = 0.050 = 0.025 = 0.010 z (0.90) = 1.29 z (0.95) = 1.65 z (0.975) = 1.96 z (0.99) = 2.33 t(0.90; 10) = 1.372 t(0.95; 10) = 1.812 t(0.975; 10) = 2.228 t(0.99; 10) = 2.764

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

121

El valor crtico del estadstico de prueba marca el punto de separacin de las zonas de aceptacin y de rechazo de la hiptesis nula. En la Tabla 6.6 se muestra algunos de estos valores cuando se somete a prueba la hiptesis nula = 0. Se seleccion como estadstico de prueba a Z y el nivel de confianza especificado fue = 0.05.

Tabla 6.6 Cmputos necesarios. Con los datos proporcionados por una muestra de tamao n se calcula el estadstico de prueba. La mayora de las veces no se usa el estadstico de prueba directamente sino alguna de sus formas equivalentes (Tabla 6.4), algunas de las cuales requieren para su uso que tambin se calcule la desviacin estndar (s). La otra cantidad que hay que cuantificar es el valor crtico el cual depende del nivel de significacin especificado y de la distribucin probabilstica que siga el estadstico de prueba. Decisin. En la ltima etapa en el procedimiento de prueba de hiptesis se debe tomar la decisin de rechazar o no la hiptesis nula. Si el estadstico de prueba cae dentro de la regin de rechazo, se considera que la diferencia entre el parmetro que se est docimando y el estadstico de prueba es significativa y que la misma no puede atribuirse nicamente a las variaciones aleatorias de las muestras, por lo tanto se rechaza la hiptesis nula y se declara como falsa. Si por el contrario el estadstico de prueba se ubica en la zona de aceptacin se considera que la diferencia entre el parmetro que se est docimando y el estadstico de prueba es no significativa y que dicha diferencia es simplemente aleatoria, en consecuencia se puede aceptar la hiptesis nula planteada. Aqu es necesario recordar que la decisin de aceptar H0 es una forma corta de decir que no existe suficiente evidencia para rechazarla y que en modo alguno se est concluyendo que la hiptesis nula es verdadera. Slo se est aceptando temporalmente, hasta que se pruebe lo contrario. Un aspecto importante, para la toma de una decisin esta relacionada con la escogencia del nivel de significacin. Como hemos visto, los valores de son fijados previamente al clculo del estadstico de prueba y usualmente los valores escogidos son 0.05 y 0.01. De modo que el rechazo o la aceptacin de H0 dependen de que el estadstico de prueba se ubique o no dentro

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

122

de la regin de rechazo previamente definida. Sin embargo, un investigador puede tomar una decisin diferente. Por ejemplo, si la probabilidad de ocurrencia de un estadstico de prueba es ) = 0.0614, se debe aceptar H0 con un muy cercana a la regin de rechazo, digamos que la P( = 0.05 si se acta estrictamente. Pero el investigador puede decidir rechazar H0 puesto que la probabilidad de cometer un error tipo I no aumento mucho, siempre y cuando quede explicito en el informe de investigacin el valor del nivel de significacin usado. Actualmente, esta forma de proceder es muy usada debido a la facilidad que ofrecen los paquetes estadsticos y otros programas de aplicacin de calcular los valores de P para cualquier estadstico de prueba. Por esta razn es comn ver dentro de un texto cientfico afirmaciones parecidas a las siguientes: se encontr que el nivel promedio de calcio en los huesos del grupo de personas enfermas con osteoporosis fue significativamente menor al del grupo de personas sanas (P < 0.08). En los inicios de ste captulo se dijo que la resolucin de todo problema cientfico se iniciaba con la formulacin de las hiptesis de investigacin, que luego eran transformadas en hiptesis estadsticas, que como hemos visto son las premisas sometidas al proceso de docimasia. De modo que para cerrar el ciclo del proceso, es necesario que las conclusiones estadsticas se transformen en conclusiones de investigacin. Si regresamos al ejemplo del programa de ejercicios y la disminucin del nivel de colesterol en la sangre las hiptesis de investigacin que se formularon fueron las siguientes: H0: El ejercicio constante no disminuye el nivel de colesterol en el plasma sanguneo. H1: El ejercicio constante disminuye el nivel de colesterol en el plasma sanguneo. Las hiptesis estadsticas fueron las siguientes: H0: = 30 (La tasa media de disminucin de la concentracin de colesterol es igual a 30 unidades). H1: > 30 (La tasa media de disminucin de la concentracin de colesterol es mayor a 30 unidades). Si despus de efectuar todo el proceso de prueba de hiptesis se tomo la decisin de rechazar H0: = 30, la conclusin del investigador en relacin con el problema de investigacin planteado es que los datos de la muestra proporcionaron evidencia concluyente para apoyar la suposicin que el ejercicio fsico disminuye el nivel de colesterol en la sangre. La diferencia entre ambas es que la conclusin estadstica esta particularizada a un aspecto de la situacin, en esta caso al valor de 30, mientras que la conclusin de investigacin es generalizada a una parte o todos los valores de la variable estudiada. Finalmente es importante enfatizar que las decisiones de un investigador no tienen que ser siempre consecuentes con las decisiones estadsticas. Los mtodos estadsticos slo proporcionan elementos de juicios objetivos y poderosos, que deben ser tomados en cuenta por el investigador al momento de decidir, pero no son los nicos, hay otros elementos de juicio de naturaleza no estadstica que el cientfico puede considerar para tomar una decisin. En otras palabras decidir entre dos o ms alternativas siempre queda a juicio del investigador.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

123

6.4 PRUEBA DE HIPTESIS PARA UNA MEDIA POBLACIONAL.


En la investigacin biolgica es frecuente que se quiera conocer si la media poblacional de una variable aumento, disminuy o no cambi con relacin a una situacin anterior. Se puede querer saber si el contenido de protenas totales en la sangre de los animales de una poblacin silvestre aument al finalizar un perodo en el cual la oferta de alimentos fue abundante; o si el tratamiento con una solucin clorada disminuy el nmero promedio de bacterias en el agua usada para el consumo humano en cierta regin; o verificar si la aplicacin de una droga altera el valor promedio de la presin arterial de los conejos usados en pruebas de laboratorio. La respuesta a cada una de estas situaciones se puede lograr poniendo a prueba la hiptesis nula de que la media poblacional es igual a un valor determinado, = o. Sin embargo el proceso de docimasia de hiptesis para una media poblacional, al igual que en el caso de la estimacin de , depende de varios aspectos: i) de la distribucin probabilstica que siga la variable estudiada; ii) del conocimiento de la varianza poblacional, y iii) del tamao de la muestra. A continuacin estudiaremos mediante ejemplos las distintas situaciones o casos que se pueden presentar en la prueba de hiptesis sobre una media poblacional. 6.4.1. Prueba de hiptesis acerca de la media poblacional cuando la muestra proviene de una poblacin distribuida normalmente y con varianza conocida. Ejemplo 6.5. Un mdico traumatlogo afirma que el contenido de calcio en los huesos de mujeres que padecen osteoporosis despus de aplicrsele cierto tratamiento es mayor al valor promedio observado para la poblacin femenina que padece est enfermedad, el cual se sabe es igual a 270 mg/g con una desviacin de 120 mg/g. Para probar su premisa el investigador determin el contenido de calcio en los huesos de 36 individuos que fueron sometidos al tratamiento y pudo determinar que dicha muestra arroja un valor promedio de calcio igual a 310 mg/g. La concentracin de calcio es una variable que se distribuye normalmente. Las hiptesis de investigacin son las siguientes: Ho : El tratamiento para la osteoporosis no tiene ningn efecto H1 : El tratamiento para la osteoporosis aumenta los niveles de calcio en los huesos. Prueba de las hiptesis estadsticas a. Formulacin de hiptesis Ho : = 270 H1 : > 270 b. Especificacin de un valor de probabilidad crtico o nivel de significacin. Ante la ausencia de una especificacin particular, se puede escoger como nivel de significacin un valor de = 0.05

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

124

c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la variable se distribuye normalmente con varianza conocida lo ms conveniente es usar como estadstico de prueba la media muestral en su forma derivada Z. Z = ( x ) ( d. Establecer una zona de aceptacin para Ho. Como H1: > o se trata de una prueba de una cola hacia la derecha, siendo la zona de aceptacin la siguiente: ZA = {Z / Z < z (1)} e. Cmputos necesarios. e.1) Estadstico de prueba: Z = ( x ) ( n ) = (310 270) (120 36) = 40 20 = 2 n)

e.2) Zona de aceptacin: Z = {Z / Z < z(0.95)} = {Z / Z < 1.65} f. Decisin. Como z = 2 > z(0.95) = 1.65 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho.

La informacin obtenida de la muestra permite afirmar que se tiene un 95% de confianza que el tratamiento aplicado a los pacientes enfermos de osteoporosis aumenta el nivel de calcio en los tejidos seos. 6.4.1. Prueba de hiptesis acerca de la media poblacional cuando la muestra proviene de una poblacin distribuida normalmente, con varianza desconocida y tamao de muestra grande (n > 30). Ejemplo 6.6. Un entomlogo sospecha que en cierta zona endmica para el dengue el valor de la tasa neta reproductiva (Ro) de una poblacin del mosquito Aedes aegypti vector de dicha

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

125

enfermedad, ha cambiado en relacin con el valor determinado hace 5 aos el cual era igual a 205 individuos. Con tal propsito determin el valor de Ro a 40 hembras criadas en el laboratorio y pertenecientes a una cepa desarrollada a partir de mosquitos capturados en la zona estudiada. Los resultados fueron los siguientes: N 1 2 3 4 5 6 7 8 9 10 Ro 228 173 182 197 205 260 233 289 158 199 N 11 12 13 14 15 16 17 18 19 20 Ro 201 212 162 282 216 181 249 174 196 220 N 21 22 23 24 25 26 27 28 29 30 Ro 141 169 163 159 192 231 257 174 206 149 N 31 32 33 34 35 36 37 38 39 40 Ro 144 226 228 192 205 237 223 226 182 195

El investigador sabe que la variable se distribuye normalmente y quiere someter a prueba su hiptesis no queriendo equivocarse en ms del 5% de las veces. Las hiptesis de investigacin son las siguientes: Ho : La tasa neta de reproduccin no ha cambiado H1 : La tasa neta de reproduccin de modific despus de cinco aos. Prueba de las hiptesis estadsticas a. Formulacin de hiptesis Ho : = 205 H1 : 205 (Analice porque la hiptesis alternativa es de diferencia) b. Especificacin de un valor de probabilidad crtico o nivel de significacin. El nivel de significacin especificado es = 0.05 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la variable se distribuye normalmente con varianza desconocida y el tamao de la muestra grande lo ms conveniente es usar como estadstico de prueba la media muestral en su forma derivada Z. El valor de la desviacin de la muestra se usa para estimar el valor de . Z = ( x ) (s n)

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

126

d. Establecer una zona de aceptacin para Ho. Como H1: o se trata de una prueba de dos colas, siendo la zona de aceptacin la siguiente: ZR = {Z / -z(1/2) < Z < z (1/2)} e. Cmputos necesarios. e.1) Media: 202.9 e.2) Desviacin estndar: s = 36.17 e.3) Estadstico de prueba: Z = ( x ) (s e.4) Zona de aceptacin: ZA = {Z / -z(1/2) < Z < z (1/2)} = {Z / -z (0.975) < Z < z (0.975)} = {Z / -1.96 < Z < + 1.96} f. Decisin. Como z = -0.35, el valor del estadstico de prueba se encuentra dentro de la zona de aceptacin de Ho. Por lo tanto se concluye que los datos no proporcionan suficiente evidencia para rechazar Ho n ) = (203 205) (36.17 40) = 2 5.719 = 0.35

La sospecha del investigador que la tasa de reproduccin de la poblacin de mosquito se haba modificado fue rechazada con un 95% de confianza a la luz de la informacin proporcionada por la muestra. 6.4.2. Prueba de hiptesis acerca de la media poblacional cuando la muestra proviene de una poblacin distribuida normalmente, con varianza desconocida y tamao de muestra pequeo (n < 30). Ejemplo 6.7. Un ecofisilogo vegetal desea verificar si el contenido de nitrgeno en las hojas jvenes de la especie Rhizophora mangle, es menor en las plantas que viven en una zona ambientalmente protegida con relacin al de plantas que viven en una zona que est siendo

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

127

afectada por la contaminacin con fertilizantes y cuyo valor promedio se cuantific en 14.6 mg/g de nitrgeno. El anlisis de 25 hojas jvenes provenientes de la zona protegida produjo los resultados siguientes: N 1 2 3 4 5 N2 10,5 15.0 12,4 6,8 7,9 N 6 7 8 9 10 N2 13,1 11,6 8,2 9,5 11,7 N 11 12 13 14 15 N2 14,2 13,8 15,1 6,9 8,9 N 16 17 18 19 20 N2 9,5 11,1 10,3 10,2 9,9 N 21 22 23 24 25 N2 8,9 10,8 9,8 7,8 8,1

Si la concentracin de nitrgeno se distribuye normalmente, apoya la evidencia proporcionada por la muestra la presuncin que las plantas de la zona protegida contienen menos nitrgeno?. El error tipo I no debe ser mayor al 1%. Las hiptesis de investigacin son las siguientes: Ho : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle en ambas regiones es la misma H1 : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle es menor en la regin protegida. Prueba de las hiptesis estadsticas a. Formulacin de hiptesis Ho : = 14.6 H1 : < 14.6 b. Especificacin de un valor de probabilidad crtico o nivel de significacin. El nivel de significacin especificado es = 0.01 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la variable se distribuye normalmente con varianza desconocida y el tamao de la muestra es pequeo lo ms conveniente es usar como estadstico de prueba la media muestral en su forma derivada T. El valor de la desviacin de la muestra se usa para estimar el valor de . T = ( x ) (s d. Establecer una zona de aceptacin para Ho. Como H1: < o se trata de una prueba de una cola hacia la izquierda, siendo la zona de aceptacin la siguiente: n)

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

128

ZA = {T / T > -t(1; n-1) } e. Cmputos necesarios. e.1) Media: x = 10.48 e.2) Desviacin estndar: s = 2.41 e.3) Estadstico de prueba: T = ( x ) (s e.4) Zona de aceptacin: ZA = {T / T > -t(1; n-1) } = {T / T > -t(0.99; 24)} = {T / T > -2.492} f. Decisin. Como t = - 8.55 < -t(0.99; 24) = -2.492 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho n ) = (10.48 14.6) (2.41 25) = 4.12 0.482 = 8.55

De acuerdo a la informacin obtenida de la muestra se puede afirmar con un 99% de confianza que la concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle en ambas regiones es la misma. 6.4.3. Prueba de hiptesis acerca de la media poblacional cuando la muestra proviene de una poblacin con distribucin no normal y tamao de muestra grande (n 30). Cuando la muestra proviene de una poblacin con distribucin no normal pero el tamao de la muestra es grande se puede aplicar el Teorema del Lmite Central y considerar que la media muestral se distribuye normalmente. Si la desviacin poblacional es conocida se usa Z = ( x ) n como estadstico de prueba. En caso de no conocerse la desviacin

poblacional se utiliza la desviacin de la muestra y Z = ( x ) s prueba usado.

n ser el estadstico de

Ejemplo 6.8. En cierto nervio del cuerpo humano, los impulsos elctricos viajan a una velocidad promedio de 4.3 m/seg con una desviacin igual a 1.2 m/seg. Un fisilogo observ

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

129

que la velocidad promedio de conduccin del impulso elctrico en 45 individuos con una distrofia fue de 3.7 m/seg. Basado en estos resultados el investigador presume que con relacin a los individuos sanos en los individuos con distrofia el impulso elctrico viaja a menor velocidad en el nervio estudiado. Soportan sta hiptesis los resultados obtenidos?. Las hiptesis de investigacin son: Ho : En los individuos con distrofia la velocidad de transmisin del impulso nervioso es igual a la observada en individuos normales. H1 : En los individuos con distrofia la velocidad de transmisin del impulso nervioso es menor a la observada en individuos normales. Prueba de las hiptesis estadsticas. a. Formulacin de hiptesis Ho : = 4.3 H1 : < 4.3 b. Especificacin de un valor de probabilidad crtico o nivel de significacin. Como no se especific el nivel de significacin se puede selecciona = 0.05 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Aunque no se conoce la distribucin de la variable, como el tamao de la muestra es grande se aplica el Teorema del Lmite Central. Por lo tanto se puede considerar que la media muestral se distribuye normalmente y lo ms conveniente es usar Z como estadstico de prueba. Z = ( x ) ( n ) d. Establecer una zona de aceptacin para Ho. Como H1: < o se trata de una prueba de una cola hacia la izquierda, siendo la zona de rechazo la siguiente: ZA = {Z / Z > -z(1) } e. Cmputos necesarios. e.1) Estadstico de prueba: Z = ( x ) ( n ) = (3.7 4.3) (1.2 45) = 0.6 0.18 = 3.33

e.2) Zona de aceptacin: ZA = {Z / Z > -z(1) } = {Z / Z > -z(0.95)} = {Z / Z > -1.65}

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

130

f. Decisin. Como z = -3.33 < -z(0.95) = -1.65, el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho

Los datos soportan la suposicin del investigador que en los individuos con distrofia la velocidad de transmisin del impulso nervioso es menor a la observada en individuos normales. Cul debe ser el menor valor de x que permite rechazar Ho? Ejemplo 6.9. Una compaa productora de leche pasteurizada tiene como norma no aceptar leche cruda con un contenido de grasa superior a los 34 g/100g. Una muestra de 36 litros de leche obtenidos de otras tantas vacas pertenecientes a una misma finca, dio un valor medio del contenido de grasa en la leche de 35.2 g/100g con una desviacin de 4.1 g/100g. Puede ser aceptada la leche por la pasteurizadora? La compaa admite un nivel de error del 1%. Las hiptesis de investigacin son: Ho : El contenido promedio de grasa en la leche es igual al valor mximo permitido para su procesamiento. H1 : El contenido promedio de grasa en la leche es superior al valor mximo permitido para su procesamiento Prueba de las hiptesis estadsticas. a. Formulacin de hiptesis Ho : = 34 H1 : > 34 b. Especificacin de un valor de probabilidad crtico o nivel de significacin. El nivel de significacin especificado es = 0.01 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

131

Aunque no se conoce la distribucin de la variable, como el tamao de la muestra es grande se aplica el Teorema del Lmite Central. Por lo tanto se puede considerar que la media muestral se distribuye normalmente y lo ms conveniente es usar Z como estadstico de prueba y a la desviacin muestral (s) como estimador de . Z = ( x ) (s d. Establecer una zona de aceptacin para Ho. Como H1: > o se trata de una prueba de una cola hacia la derecha, siendo la zona de aceptacin la siguiente: ZA = {Z / Z < z(1) } e. Cmputos necesarios. e.1) Estadstico de prueba: Z = ( x ) ( s n ) = (35.2 34) (4.1 36) = 1.2 0.68 = 1.75 n)

e.2) Zona de aceptacin: ZA = {Z / Z < z(1) } = {Z / Z < z(0.99)} = {Z / Z < 2.33} f. Decisin. Como z = 1.75 < z(0.99) = 2.33 el valor del estadstico de prueba se encuentra dentro de la zona de aceptacin de Ho. Por lo tanto se concluye que los datos no proporcionan suficiente evidencia para rechazar Ho

Se puede concluir que el contenido promedio de grasa en la leche de la finca tiene un valor igual al valor mximo permitido para su procesamiento.

6.5 PRUEBA DE HIPTESIS PARA DOS MEDIAS POBLACIONALES.


Posiblemente la situacin ms frecuente en la investigacin en el campo de las ciencias naturales sea la de decidir entre dos alternativas. Por lo general cuando se requiere escoger entre dos mtodos, determinar si un tratamiento fue ms efectivo que otro o decidir si existen diferencias para una misma variable entre dos grupos de individuos, se recurre a una prueba de hiptesis para dos medias poblacionales. Esta prueba consiste bsicamente en determinar si dos muestras estiman la misma media poblacional, ya sea porque se supone que las muestras

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

132

provienen de una misma poblacin o de poblaciones diferentes con la misma media. El procedimiento de docimasia a seguir depende del conocimiento que se tenga de varios aspectos como son: la distribucin de probabilidades de la variable estudiada, las varianzas poblacionales y el tamao de las muestras. Las diferentes situaciones y procedimientos se mostraran a travs de algunos ejemplos. 6.5.1. Prueba de hiptesis para dos medias poblacionales cuando las muestras provienen de poblaciones distribuidas normalmente y con varianzas conocidas. Ejemplo 6.10. De acuerdo a los estudios efectuados sobre el contenido de estroncio en los seres humanos se sabe que sta variable se distribuye normalmente con varianza 2 = 144. Los mismos estudios indican que el contenido de este elemento en los huesos disminuye con la edad de las personas. En una investigacin relacionada con ste problema, un qumico determin mediante la espectrofotometra de absorcin atmica, el contenido de estroncio en muestras de huesos fracturados de pacientes femeninos pertenecientes a dos grupos etreos diferentes. Los resultados fueron los siguientes: Niveles de estroncio g/g 35-44 aos 45-54 aos 40,45 48,21 55,15 23,37 67,59 25,42 80,58 41,94 78,09 40,65 68,09 44,75 72,06 51,69 Esto resultados apoyan la hiptesis de la disminucin de los niveles de estroncio en el tejido seo al incrementar la edad de las personas? Use = 0.03. Las hiptesis de investigacin son: Ho : El contenido de estroncio en los huesos no se modifica con la edad de las personas. H1 : El contenido de estroncio en los huesos disminuye con la edad de las personas. Prueba de las hiptesis estadsticas. a. Formulacin de hiptesis: si se considera que la poblacin de edades entre 35 y 44 aos tiene una media 1 y que la poblacin con edades entre 45 y 54 aos tiene una media 2, las hiptesis estadsticas a probar son las siguientes: H0 : 1 = 2 1 - 2 = 0 H1 : 1 > 2 1 - 2 > 0

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

133

b. Especificacin de un valor de probabilidad crtico o nivel de significacin. El nivel de significacin especificado es = 0.03 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que la variable concentracin de estroncio se distribuye normalmente con varianza conocida y como se trata de una prueba de hiptesis sobre la diferencia de dos medias poblacionales se puede usar el estadstico de prueba Z. Z = ( x1 x 2 ) ( 1 2 ) d. Establecer una zona de aceptacin para Ho. Como H1: 1 > 2 se trata de una prueba de una cola hacia la derecha, siendo la zona de aceptacin la siguiente: ZA = {Z / Z < z(1)} e. Cmputos necesarios. e.1) Media de las muestras: e.2) Estadstico de prueba: Z = ( x 2 x1 ) ( 2 1 )
2 2 2 + 1 = ( 66.0 39.43) 0 n 2 n1 2 12 2 + n1 n 2

x 1 = 66.0 ; x 2 = 39.43

144 144 + = 26.57 6.41 = 4.14 7 7

e.3) Zona de aceptacin: ZA = {Z / Z < z(1) } = {Z / Z < z(0.97)} = {Z / Z < 1.88} f. Decisin. Como z = 4.14 >> z(0.97) = 1.88 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

134

Se puede concluir con un 97% de confianza que la evidencia aportada por la muestra apoya la hiptesis de la disminucin del nivel de estroncio en los huesos de las personas con la edad. 6.5.2. Prueba de hiptesis para dos medias poblacionales cuando las muestras provienen de poblaciones distribuidas normalmente, con varianzas desconocidas y tamao de muestras grandes (n1 y n2 30). Ejemplo 6.11. En el Departamento de Toxicologa del Ministerio de Salud se necesita saber si el contenido de nicotina en dos marcas de cigarrillos importados es la misma. Con el propsito de resolver la situacin se le determina el contenido de nicotina a un lote de cigarrillos de cada marca, encontrndose los resultados siguientes: Contenido de nicotina (mg) Marca Kill me softly Marca Little life 49 36 24.0 25.2 2.30 2.90

n Media Desviacin estndar

Si se sabe que la cantidad de nicotina se distribuye normalmente, determine con un nivel de confianza del 10% si las dos marcas tienen la misma cantidad de nicotina. Las hiptesis de investigacin son: Ho : La cantidad de nicotina en los cigarrillos de las dos marcas es la misma. H1 : La cantidad de nicotina en los cigarrillos de las dos marcas es diferente. Prueba de las hiptesis estadsticas. a. Formulacin de hiptesis: si se considera a 1 y 2 como el valor promedio del contenido de nicotina en los cigarrillos Kill me softly y Little life respectivamente, las hiptesis estadsticas a probar son las siguientes: H0 : 1 = 2 1 - 2 = 0

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

135

H1 : 1 2 1 - 2 0 b. Especificacin de un valor de probabilidad crtico o nivel de significacin. El nivel de significacin especificado es = 0.10 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que el parmetro involucrado en la docimasia es la diferencia de medias poblacionales 1 2, y como la variable se distribuye normalmente con varianza desconocida y tamao de la muestra grande lo ms conveniente es usar como estadstico de prueba la diferencia de medias muestrales en su forma derivada Z. El valor de la 2 2 2 2 varianzas s1 y s 2 de las muestras se usa para estimar el valor de 1 y 2 . Z = ( x 2 x1 ) ( 2 1 ) d. Establecer una zona de aceptacin para Ho. Como H1: 1 2 se trata de una prueba de dos colas, siendo la zona de aceptacin la siguiente: ZA = {Z / -z(1/2) < Z < z(1/2) } e. Cmputos necesarios. e.2) Varianzas: s1 = (2.3) = 5.29 ; s 2 = (2.9) = 8.41 e.2) Estadstico de prueba: Z = ( x 2 x1 ) ( 2 1 ) e.3) Zona de aceptacin: ZA = {Z / -z(1/2) < Z < z(1/2)} = {Z / -z(0.95) < Z < z(0.95)} = {Z / -1.65 < Z < 1.65} f. Decisin. Como z = -2.06 < z(0.95) = -1.65 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho
2 s2 s2 + 1 = ( 24.0 25.2 ) 0 n 2 n1 2 2 2 s1 s2 + 2 n1 n 2

5.29 8.41 + = 1.2 0.58 = 2.06 49 36

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

136

Se puede concluir que la evidencia aportada por la muestra apoya como hiptesis que el contenido de nicotina en las dos marcas es diferente. 6.5.3. Prueba de hiptesis para dos medias poblacionales cuando las muestras provienen de poblaciones distribuidas normalmente, con varianzas desconocidas y tamao de muestras pequeas (n1 y n2 < 30). Cuando se presenta una situacin de ste tipo, es necesario considerar adicionalmente si las dos varianzas poblacionales, aunque desconocidas, son iguales o diferentes. Si se supone que las varianzas son iguales se debe utilizar como estadstico de prueba a: T=

( x 2 x1 ) ( 2 1 )
s2 p n2 + s2 p n1

; donde s 2 p =

2 ( n 1) s 12 + ( n 1) s 2

n1 + n 2 2

Si se presume que las varianzas son diferentes, y si la prueba de hiptesis para la diferencia de medias es de dos colas, se debe usar como estadstico de prueba a: T=

( x 2 x1 ) ( 2 1 )
2 s2 s2 + 1 n 2 n1

y se usa t* como valor crtico para la zona de rechazo.


2 s1 t (1- n = 1 2 s2 + t (1- 2;n 1 1) n2 2 s2 s1 2 + n n 1 2 2;n 2 1)

t (*1 2 )

Ejemplo 6.12. En un estudio sobre la condicin ecolgica de los ros altiandinos, se determin la temperatura del agua en ros de pramo (> 2800 m.s.n.m.) y de selva nublada (1800 < m.s.n.m. < 2800), obtenindose los resultados siguientes:

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

137

Temperatura del agua (C) Ros s 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 x Pramo 10,5 15,0 14,5 8,5 7,5 13,5 15,0 11,5 17,0 13,0 13,5 14,5 13,5 15,0 10,5 10,0 12,69 2,66 Selva 19,5 17,0 13,5 9,0 12,0 16,5 16,5 18,0 18,0 18,0 12,0 16,0 12,0 14,5 16,5 17,0 15,38 2,9

Conociendo que la temperatura del agua es una variable que se distribuye normalmente, se quiere saber si los ros de selva son ms calientes. Las hiptesis de investigacin son: Ho : La temperatura del agua en los ros es la misma en las dos unidades ecolgicas H1 : La temperatura del agua es mayor en los ros de la zona de selva. Prueba de las hiptesis estadsticas. a. Formulacin de hiptesis: si se considera a 1 y 2 como el valor promedio de la temperatura del agua en los ros de pramo y de selva nublada respectivamente, las hiptesis estadsticas a probar son las siguientes: H0 : 1 = 2 1 - 2 = 0 H1 : 2 > 1 2 - 1 > 0

b. Especificacin de un valor de probabilidad crtico o nivel de significacin. Como no se especific ninguno, por defecto se puede definir = 0.05 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que el parmetro involucrado en la docimasia es la diferencia de medias poblacionales 2 1, y como la variable se distribuye normalmente con varianzas desconocidas y el tamao de la muestra es pequeo, para poder seleccionar el estadstico de prueba a usar, se debe en primer lugar determinar si las varianzas poblacionales se pueden considerar iguales o diferentes. Para esto se puede hacer uso de las reglas prcticas para la comparacin de varianzas (Captulo 5: seccin 5.3.2). Como = 0.05 y RV =
2 s2 (2.9) 2 = = 1.19 es menor a 2.5 se acepta que las dos 2 s1 (2.66) 2 varianzas son iguales. Por lo tanto se debe usar como estadstico de prueba a:

T=

( x 2 x1 ) ( 2 1 )
s2 p n2 + s2 p n1

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

138

d. Establecer una zona de aceptacin para Ho. Como H1: 2 > 1 se trata de una prueba de una cola hacia la derecha, siendo la zona de aceptacin la siguiente: ZA = {T / T < t(1 ;n1 + n2-2) } e. Cmputos necesarios. e.2) Varianzas ponderada s 2 p. s2 p =

( n1 1) s 12 + ( n 2 1)
n1 + n 2 2

2 s2

(16 1)( 2.66 ) 2 + (16 1)( 2.9 ) 2


16 + 16 2

= 7.74

e.2) Estadstico de prueba: T=

( x 2 x1 ) ( 2 1 ) (15.38 12.69 ) 0
s2 p n2 + s2 p n1 = 7.74 7.74 + 16 16

2.69 = 2.73 0.9836

e.3) Zona de aceptacin: ZA = {T / T < t(1 ;n1 + n2-2) } = {T / T < t(0.95 ; 30)} = {T / T < 1.697} f. Decisin. Como T = 2.73 > t(0.95 ; 30) = 1.697 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho.

Se puede concluir que se tiene un 95% de confianza que la temperatura del agua es mayor en los ros de selva nublada que en los ros de pramo. Ejemplo 6.1.3. Un investigador que trabaja sobre la interaccin insecto/planta piensa que las plantas cianognicas, es decir las que producen HCN, tienden a ser rechazadas por los insectos herbvoros no especializados. Para poner a prueba sta hiptesis se efectu un

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

139

experimento en el cual se le ofreci a las larvas de un insecto generalista hojas de una planta cianognica como la parchita (Passiflora capsularis) y hojas de una planta no cianognica como la espinaca (Spinacia olercea). Como una medida de la aceptacin o rechazo del alimento ofrecido se determin el peso de tejido foliar consumido por las larvas de la polilla Spodoptera frugiperda. Los resultados fueron los siguientes: Especie Vegetal Passiflora capsularis Spinacia olercea n 5 5 Peso consumido (mg/larva) s x 74.70 20.13 124.44 8.28

Sabiendo que la variable peso de hoja consumida se distribuye normalmente se quiere determinar si la sospecha del investigador es cierta para un = 0.01 Las hiptesis de investigacin son: Ho : La presencia de sustancias cianognicas no interfiere el consumo de tejido vegetal por los insectos herbvoros no especialistas. H1 : La presencia de sustancias cianognicas disminuye el consumo de tejido vegetal por parte de los insectos herbvoros no especialistas. Prueba de las hiptesis estadsticas. g. Formulacin de hiptesis: si se considera a 1 y 2 como el peso promedio de hojas de parchita y espinaca que respectivamente consumen las larvas del insecto, las hiptesis estadsticas a probar son las siguientes: H0 : 1 = 2 1 - 2 = 0 H1 : 1 < 2 1 - 2 < 0 h. Especificacin de un valor de probabilidad crtico o nivel de significacin. Nivel de significacin especificado = 0.01 i. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que el parmetro involucrado en la docimasia es la diferencia de medias poblacionales 1 2, como la variable se distribuye normalmente con varianzas desconocidas y el tamao de la muestra es pequeo, para poder seleccionar el estadstico de prueba a usar, se debe en primer lugar determinar si las varianzas poblacionales se pueden considerar iguales o diferentes. Para esto se puede hacer uso de las reglas prcticas para la comparacin de varianzas (Captulo 5: seccin 5.3.2).

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

140

2 s1 (20.13) 2 = = 5.9 es mayor a 3.5 se acepta que las dos varianzas 2 s2 (8.28) 2 son diferentes. Por lo tanto se debe usar como estadstico de prueba a:

Como = 0.01 y RV =

T=

( x 2 x1 ) ( 2 1 )
2 s2 s2 + 1 n 2 n1

j. Establecer una zona de aceptacin para Ho. Como H1: 1 < 2 se trata de una prueba de una cola hacia la izquierda. Adems por ser 2 2 * 1 2 se debe usar t (1 ) como valor crtico de la zona de aceptacin. ZA = {T / T > - t (1 ) } = {T / T > - t (0.99 ) } k. Cmputos necesarios. e.1) Estadstico de prueba: T=
* *

( x1 x 2 ) ( 1 2 ) = ( 74.70 124.44 ) 0 2 s1 s2 ( 20.13) 2 + ( 8.28) 2 + 2


n1 n2 5 5

49.74 = 5.11 9.73

e.2) Zona de aceptacin:


2 2 s1 s2 t ( 0.99;4 ) + t ( 0.99;4 ) n1 n2 2 s2 s1 2 + n1 n 2

t (*0.99 ) =

(20.13) 2 (8.28) 2 (3.747) + (3.747) 355.05 5 5 = = = 3.75 94.76 (20.13) 2 (8.28) 2 + 5 5

ZA = {T / T > - t * ( 0.99 ) } = {T / T > -3.75} l. Decisin. * Como T = -5.11 < t (0.99) = -3.75 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se afirma que los datos proporcionan suficiente evidencia para rechazar Ho.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

141

Se puede concluir que se tiene un 99% de confianza que las larvas de Spodoptera frugiperda tienden a rechazar los tejidos de plantas cianognicas. 6.5.4. Prueba de hiptesis para dos medias poblacionales cuando las muestras provienen de poblaciones con distribucin no normal y tamao de muestras grandes (n1 y n2 30). Cuando las muestras provienen de dos poblaciones con distribucin no normal pero el tamao de las muestras es grande se puede aplicar el Teorema del Lmite Central y considerar que la diferencia de medias muestrales, x 2 x 1 , se distribuye normalmente. Si las varianzas poblacionales se conocen el estadstico de prueba a usar es: Z = ( x 2 x1 ) ( 2 1 )
2 2 2 + 1 n 2 n1

En caso de no conocerse las varianzas poblacionales, estas se sustituyen por las varianzas de las muestras y el estadstico de prueba a usar es: Z = ( x 2 x1 ) ( 2 1 )
2 s2 s2 + 1 n 2 n1

Ejemplo 6.14. Se sabe que el contenido de calcio en los huesos de los animales de cierta 2 especie se distribuye normalmente con una varianza 1 = 57.6 para las hembras y una varianza 2 = 51.2 para los machos. Con el propsito de determinar si existen diferencias en el contenido de calcio entre machos y hembras se le determin a 31 hembras y 33 machos el contenido de calcio en el tejido seo encontrndose que para la muestra de hembras el valor promedio fue de 400.45 g/g y para la muestra de machos fue de 395.24 g/g. Cul debe ser la respuesta?. Use a = 0.05. Las hiptesis de investigacin son: Ho : El contenido de calcio en los huesos de los animales de los dos sexos es el mismo. H1 : El contenido de calcio en los huesos de los animales de ambos sexos es diferente.
2

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

142

Prueba de las hiptesis estadsticas. a. Formulacin de hiptesis: si se considera que la concentracin de calcio en las hembras tiene una media 1 y en los machos una media 2, las hiptesis estadsticas a probar son las siguientes: H0 : 1 = 2 1 - 2 = 0 H1 : 1 2 1 - 2 0 b. Especificacin de un valor de probabilidad crtico o nivel de significacin. El nivel de significacin especificado es = 0.05 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Aunque no se conoce la distribucin de la variable, como el tamao de la muestra es grande se aplica el Teorema del Lmite Central. Por lo tanto se puede considerar que la diferencia de medias muestrales se distribuye normalmente y lo ms conveniente es usar Z como estadstico de prueba. Z = ( x 2 x1 ) ( 2 1 ) d. Establecer una zona de aceptacin para Ho. Como H1: 1 2 se trata de una prueba de dos colas, siendo la zona de aceptacin la siguiente: ZA = {Z / -z(1/2) < Z < z(1/2)} e. Cmputos necesarios. e.1) Estadstico de prueba: Z = ( x1 x 2 ) ( 1 2 ) e.2) Zona de aceptacin: ZA = {Z / -z(1/2) < Z < z(1/2)} = {Z / -z(0.975) < Z < z(0.975)} = {Z / -1.96 < Z < 1.96} f. Decisin. Como z = 2.83 > z(0.975) = 1.96 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho
2 12 2 + = ( 400.45 395.24 ) 0 n1 n 2 2 2 2 + 1 n 2 n1

57.6 51.2 + = 5.21 1.84 = 2.83 31 33

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

143

Se puede afirmar con un 95% de confianza que el nivel de calcio en los huesos de los animales de los dos sexos es diferente. Ejemplo 6.15. En una investigacin sobre el papel que juega el marsupial Marmosa robinsoni sobre la dispersin de semillas de dos especies de cactus, se piensa que este animal prefiere las semillas de uno de los dos tipos de cactus que hay en la zona de estudio. Para averiguar si esto es cierto, se determin bajo condiciones de laboratorio la cantidad (grs) de pulpa del fruto de las dos especies de cactus que fue consumida por el marsupial. Los resultados encontrados fueron los siguientes: Especie de cactus Stenocereus griseus Subpilocereus repandus n 32 38 x 19.99 21.20 s 2.37 1.47

Si se acepta un 1% como mxima probabilidad de equivocarse cul de las dos especies es preferida por la marmosa? Las hiptesis de investigacin son: Ho : La marmosa no tiene preferencia por ninguno de los dos tipos de frutos H1 : La marmosa prefiere uno de los dos tipos de frutos Prueba de las hiptesis estadsticas. a. Formulacin de hiptesis: si se considera que la cantidad de pulpa consumida de la especie Stenocereus griseus tiene una media 1 y que la cantidad de pulpa consumida de la especie Subpilocereus repandus tiene una media 2, las hiptesis estadsticas a probar son las siguientes: H0 : 1 = 2 1 - 2 = 0 H1 : 1 2 1 - 2 0 b. Especificacin de un valor de probabilidad crtico o nivel de significacin: = 0.01

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

144

c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Aunque no se conoce la distribucin de la variable, como el tamao de la muestra es grande se aplica el Teorema del Lmite Central. Por lo tanto se puede considerar que la diferencia de medias muestrales se distribuye normalmente. Se puede usar Z como estadstico de prueba y estimar las varianzas poblacionales a partir de las desviaciones de las muestras. 2 s1 s2 Z = ( x 2 x1 ) ( 2 1 ) + 2 n1 n 2 d. Establecer una zona de aceptacin para Ho. Como H1: 1 2 se trata de una prueba de dos colas, siendo la zona de aceptacin la siguiente: ZA = {Z / -z(1/2) < Z < z(1/2)} e. Cmputos necesarios. e.1) Estadstico de prueba: Z= ( x 2 x1) ( 2 1 )
2 s1 s2 + 2 n1 n 2

(19.99 21.20) 0 1.21 = = 2.51 (2.37) 2 (1.47) 2 0.482 + 32 38

e.2) Zona de aceptacin: ZA = {Z / -z(1/2) < Z < z(1/2)} = {Z / -z(0.995) < Z < z(0.995)} = {Z / -2.58 < Z < 2.58} f. Decisin. Como -z(0.995) = -1.96 < z = -2.51 < z(0.995) = 1.96 el valor del estadstico de prueba se encuentra dentro de la zona de aceptacin de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para aceptar Ho

Se puede afirmar con un 99% de confianza que la marmosa no tiene preferencia por ninguno de los dos frutos.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

145

6.5.5. Prueba de hiptesis para dos medias poblacionales usando observaciones apareadas. La efectividad con la cual las pruebas de hiptesis pueden detectar diferencias entre dos medias poblacionales, depende de que las dos muestras sean independientes, es decir que los valores obtenidos en cada una unidad de muestra no afecten los valores de la otra muestra. Adems, la variacin dentro de las muestras no debe ser tan grande que impida detectar las eventuales diferencias entre las medias. Si se pone atencin a las ecuaciones de los estadsticos de prueba usados para comparar dos medias poblacionales, es fcil deducir la importancia de la variacin dentro de las muestras. Cualquier aumento de la variacin dentro de las muestras disminuye el valor del estadstico de prueba, anulando cualquier pequea diferencia que pudiera existir entre las medias muestrales, diferencia que eventualmente podra permitir rechazar H0. Por ejemplo, cuando se obtienen dos muestras pequeas de poblaciones normales con las mismas varianzas, el valor del estadstico, ( x x 2 ) ( 1 2 ) T= 1 s2 s2 p p + n1 n 2 disminuir a medida que incrementa el valor de s p , aumentando su probabilidad de caer en la zona de aceptacin de H0 y por lo tanto de rechazar la hiptesis alternativa de diferencia entre las medias. La variabilidad dentro de cada muestra esta compuesta por la variacin aleatoria debido a los mtodos de medicin, el ambiente y las diferencias naturales entre los individuos. Igualmente la variabilidad entre las muestras tiene estos mismos componente de variacin ms la variacin aadida o controlada por el investigador. Pero en muchas ocasiones estn presentes factores extraos al experimento que aumentan la variabilidad dentro y entre las muestras que ocultan cualquier pequea diferencia entre las medias muestrales que pudiera haber conducido a rechazar la hiptesis nula. El ejemplo siguiente puede ilustrar la influencia de estos factores extraos en ocultar diferencias existentes entre dos medias poblacionales o por el contrario mostrar diferencias donde no existen. Para comprobar cual de dos fertilizantes es mejor, se siembran dos parcelas con maz. Al suelo de una parcela se le aade el fertilizante A y al de la otra parcela el fertilizante B (Figura 6.10 ). Una prueba de hiptesis puede determinar que la produccin de las dos parcelas es diferente y concluirse que uno de los fertilizantes es mejor, sin embargo la diferencia puede Figura 6.10 deberse a la accin de los factores ambientales que no son controlados. Otro resultado posible es que se acepte la hiptesis nula de no diferencia entre los fertilizantes, cuando realmente hay diferencia y la misma qued encubierta por la variabilidad originada por los factores extraos. Una manera de superar estas dificultades es apareando las
2

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

146

observaciones de las muestras. Esto significa que las unidades muestrales donde se quiere medir el efecto de las variables controladas por el investigador sean lo ms parecida posibles. En el ejemplo de los fertilizantes, tendran que ubicarse los cultivos en parcelas muy parecidas en cuanto a las condiciones ambientales. Otras maneras de aparear es usando un mismo individuo y medir la respuesta antes y despus de aplicrsele un tratamiento. Si no es posible usar el mismo sujeto se buscan pares de individuos muy parecidos en cuanto a edad, sexo, peso, raza, estatura, etc. Tambin se puede dividir un mismo material en dos partes y efectuar las experiencias que interesan, como probar la eficiencia de dos mtodos de medicin. Una vez que se tienen las muestras emparejadas, en lugar de trabajar individualmente con cada una, es mejor usar la diferencia entre las respuestas, di = xi1 xi2. Los diferentes valores de di se diferencias entre s principalmente por los efectos del factor controlado por el investigador, puesto que la sustraccin del valor de una observacin al valor de la otra observacin, elimina la mayor parte de la variacin debido a los factores extraos. Si las muestras provienen de poblaciones distribuidas normalmente la media, D , de las diferencias di = xi1 xi2, es una variable aleatoria que se distribuye normalmente alrededor de una media d con una desviacin s d = s d n

Bajo esta nueva situacin, la hiptesis nula a contrastar sera d = 0, lo que equivale a contrastar la hiptesis nula 1 2 = 0. Por lo tanto, cuando las observaciones son pareadas; H0 : d = 0 y H1 : d 0 son las hiptesis a plantear. El estadstico de prueba a usar es: T = (d d ) ( s d n ) y la zona de rechazo sera ZR = {T / -t(1/2; n-1) > T > t(1/2; n-1)} Ejemplo 6.16. - La -dimetil digoxina es una droga que afecta el ritmo cardaco. En un estudio efectuado para determinar los efectos agudos de esta droga se le determin la frecuencia cardiaca a 10 acures (Cavia porcellus) antes y despus de la administracin de la droga. En la tabla siguiente se muestran los resultados. Acure N
1 2 3 4 5 6 7 8 9 10

Frecuencia inicial (lat/min)


260 390 350 400 380 240 360 270 410 270

Frecuencia final (lat/min)


230 350 290 420 330 190 370 240 350 260

di
30 40 60 -20 50 50 -10 30 60 10

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

147

Sabiendo que la frecuencia cardaca de los acures se distribuye normalmente, determine con un nivel de significacin igual 0.05 si la droga altera dicha variable. Prueba de las hiptesis estadsticas g. Formulacin de hiptesis Ho : d = 0 H1 : d 0 h. Especificacin de un valor de probabilidad crtico o nivel de significacin. El nivel de significacin especificado es = 0.05 i. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que se trata de la comparacin de muestras apareadas el estadstico de prueba es: T = (d d ) ( s d j. Establecer una zona de aceptacin para Ho. ZA = {T / -t(1/2; n-1) < T < t(1/2; n-1)} k. Cmputos necesarios. e.1) Media: d = 30 e.2) Desviacin estndar: sd = 28.28 e.3) Estadstico de prueba: T = (d d ) ( s d e.4) Zona de rechazo: ZA = {T / -t(1/2; n-1) < T < t(1/2; n-1)} = {T / -t(0.975; 9) < T < t(0.975; 9)} = {T / -2.26 <T < 2.26} l. Decisin. Como t = 3.35 > t(0.975; 8) = 2.26 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho n ) = (30 0) (28.28 10) = 30 8.94 = 3.35 n)

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

148

De acuerdo a la informacin obtenida de la muestra se puede afirmar con un 95% de confianza que la droga altera la frecuencia cardiaca de los acures. Utilice estos mismos datos y haga una prueba de hiptesis para dos medias considerando las muestras en forma independiente (sin aparear) y compare los resultados. Observe los cambios que se producen en la desviacin de los estadsticos de prueba usados en los dos procedimientos.

6.6 PRUEBA DE HIPTESIS PARA DOS VARIANZAS POBLACIONALES.


En la Seccin 6.5.3 vimos que para efectuar algunas comparaciones de medias poblacionales se debe averiguar si las muestras proceden de poblaciones con la misma varianza. Sin embargo este conocimiento es importante para otro tipo de situacin. Por ejemplo, al comparar la precisin de dos mtodos, o al confrontar la variabilidad caractersticas presentes en dos individuos, dos taxa, dos poblaciones, dos procesos, etc. De modo que es muy valioso disponer de un mtodo estadstico que con mayor formalidad que las reglas prcticas dadas en la seccin 5.3.2, precise si dos varianzas son o no homogneas. Una forma de hacerlo es comparar mediante una prueba de hiptesis las varianzas poblacionales. Para esto es necesario, adems de plantear las hiptesis, disponer de un estadstico de prueba y del modelo de distribucin de probabilidad que este estadstico sigue. Afortunadamente, ambas cosas se conocen. Veamos entonces el procedimiento de contrastacin de hiptesis para las varianzas de dos poblaciones. Esta docimasia tiene como condicin que las muestras sean independientes y las dos poblaciones estn distribuidas normalmente. Hiptesis El planteamiento de las hiptesis sobre las varianzas es algo particular por el hecho de que las varianzas no son aditivas y el planteamiento de igualdad entre varianzas de la hiptesis nula 2 2 = 0 , sino como no se puede hacer como una ecuacin de diferencia igualada a cero ( 2 ) 1
2 = 2 o igualando a uno la razn entre las dos varianzas de igualdad entre las varianzas ( 2 1 )

( 22

12 = 1) . En trminos generales el planteamiento de las hiptesis sera el siguiente:

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

149

Hiptesis nula:

2 = 2 H0 : 2 1

2 2 =1 2 1

Hiptesis alternativas:
2 2 2 2 1 2 2 1 1 2 2 2 H1: 2 > 1 2 12 > 1 2 < 2 2 2 < 1 2 2 1 1 2 s 2 . Es Como estadstico de pruebas se usa la razn de las varianzas muestrales, Fo = s 2 1 conveniente por razones prcticas que veremos ms adelante, que las hiptesis se planteen de forma que la varianza mayor siempre este en el numerador. Si las muestras provienen de dos poblaciones con la misma varianza o de una misma poblacin, la distribucin de probabilidades de la razn de varianzas sigue el modelo probabilstico conocido como distribucin F de Snedecor, cuya funcin de probabilidad es la siguiente:

h( f ) =

[ ( 1 + 2 ) 2] ( 1 / 2 ) 1 2 f ( 1 2) ( 2 2)

( 1 2)

- 1 [1 + ( ) f ] 1 2

(1 2)( 1 + 2 )

f >0

donde: 1 y 2 = grados de libertad; = funcin gama. Los valores de 1 y 2 son estimados a partir del tamao de las muestras menos uno: 1 = (n1 1) y 2 = (n2 1) En realidad la distribucin de F es una familia de distribuciones, existiendo una distinta para cada combinacin de 1 y 2 . La mayora de las distribuciones son asimtricas positivas con una giba, como se ve en la Figura 6.11.

Figura 6.11. Distribuciones de F con diferentes valores para 1 y 2 . Dada la utilidad de la distribucin de F para muchos procedimientos estadsticos, se han elaborado tablas de la funcin acumulada ( ( f ) ) para diferentes valores de 1 y 2 (Tabla 6.7).

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

150

Tabla 6.7. Percentiles de la distribucin de F.

La tabla tiene dos entradas: los grados de libertad del numerador (1) que identifican las columnas y los grados de libertad del denominador (2) que identifican las filas. Cada fila est subdividida en hileras que corresponden a seis diferentes niveles de significacin (1-). Los valores que se encuentran en la interseccin de una hilera con una columna corresponden a un percentil, es decir a un valor de f a la izquierda del cual se encuentra una porporcin 1- del rea. Por ejemplo si se tiene que 1 = 12 y 2 = 13, entonces un 0.95 del rea bajo la curva de F se encuentra a la izquierda del percentil f = 2.6 (Tabla 6.7 y Figura 6.12). Figura 6.12 Suponiendo que la razn de varianzas de dos muestras es menor al valor lmite 2.6, eso significa que su probabilidad de ocurrencia es mayor a 0.05. En ste caso se considera que las diferencias entre las dos varianzas muestrales son aleatorias. Pero si la razn de varianza es mayor a 2.6, es porque su probabilidad de ocurrencia es menor a 0.05, de lo que se deduce que las diferencias entre las dos varianzas muestrales no son simplemente fortutas y por tanto las varianzas son diferentes. En trminos generales se puede decir que cuando se trata de una

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

151

prueba con una cola a la derecha el valor f(1- ; 1/2) define el lmite entre las zonas de 2 = 2 ). aceptacin y rechazo de la hiptesis nula (H0 : 2 1 Cuando la prueba de hiptesis es de dos colas, debido a la asimetra de la distribucin de F, la zona de rechazo de H0 es diferente para ambos lados de la distribucin. El valor f(1- /2; 1/2) sera el lmite de la derecha y el valor f(/2; 1/2) el lmite de la izquierda (Figura 6.13). Aqu surge un pequeo inconveniente, porque las tablas de la funcin acumulada slo Figura 6.13 presentan valores de f para la cola derecha. Esta situacin se puede solventar de dos maneras. La forma ms fcil es plantear las hiptesis de modo que la varianza muestral mayor siempre quede en el numerador. La otra solucin es calcular el valor crtico de la cola izquierda mediante la expresin siguiente: 1 f ( 2 ; 1 2 ) = f (1- 2) ; 2 1 ) Por ejemplo, si f ( 0.975 ; 8 12) = 3.5 es el lmite crtico para la cola de la derecha, en las tablas no se encuentra el valor de f ( 0.025 ; 8/12) que sera el lmite crtico de la cola de la izquierda, pero se puede calcular usando la relacin anterior. En primer lugar se encuentra el valor de f ( 0.975 ; 12 8) = 4.2 (observe que los grados de libertad se intercambiaron), luego se obtiene el inverso de 4.2, siendo entonces f ( 0.025 ; 8/12) = 0.238. Este mismo procedimiento se debe usar para calcular el valor crtico de la zona de rechazo cuando la prueba de hiptesis es de una cola a la izquierda. Ejemplo 6.17. En un estudio taxonmico sobre una especie de insecto se quiere usar una caracterstica morfolgica del cuerpo para estimar el tamao de los adultos. Se escoger como carcterstica aquella que tenga la menor variabilidad. Con ste propsito se midieron en 10 individuos la longitud del ala anterior y la longitud total del cuerpo. Con base a los resultados que se presentan a continuacin y sabiendo que las dos variables se distribuyen normalmente, escoja la que mejor estima el tamao de los insectos?
N de Individuo Alas anteriores (mm) Tamao del cuerpo (mm) 1 17,1 17,6 2 17 16,5 3 17,1 15,5 4 16,3 16,9 5 16,9 17,1 6 15,9 15,2 7 16,2 16,7 8 17,2 17,7 9 17,1 16,9 10 16,8 15,1

Prueba de las hiptesis estadsticas a. Formulacin de hiptesis Hiptesis nula: Hiptesis alternativas:
2 2 =1 H0 : 2 1 2 H1 : 2 12 1

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

152

b. Especificacin de un valor de probabilidad crtico o nivel de significacin: = 0.05 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que se trata de la comparacin de dos varianzas el estadstico de prueba es: s2 Fo = 2 2 s1 d. Establecer una zona de aceptacin para Ho. ZA = {F / f ( e. Cmputos necesarios. e.1) Varianzas muestrales: s1 = 0.2093 ; s 2 = 0.8907 e.2) Grados de libertad: 2 = n2 1 = 10-1 = 9 ; 1 = n1 1 = 10-1 = 9 e.3) Estadstico de prueba: Fo = e.4) Zona de rechazo: ZA = {F / f (
2 ; n 2 -1 n 1 -1) < 2 s2 0.8907 = = 4.26 2 s 1 0.2093 2 2 2 ; n 2 -1 n 1 -1) <

F < f (1-

2 ; n 2 -1 n 1 -1) }

F < f (1-

2 ; n 2 -1 n 1 -1) } = {F/f (0.025; 9/9)

< F<f (0.975;9/9) }

f (0.025;9 / 9) =

1 f (0.975;9 / 9)

1 = 0.248 4.03

ZA = {F/ 0.248< F< 4.03} f. Decisin. Como Fo = 4.26 > f(0.975; 9/9) = 4.03 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho. Entonces, de acuerdo a la informacin obtenida de la muestra se puede afirmar con un 95% de confianza que las varianzas de las dos variables morfomtricas son diferentes, siendo la longitud de las alas una variable ms homognea.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

153

Ejemplo 6.18. Un eclogo afirma que la temperatura del agua en los ros de pramo es ms homognea que la temperatura del agua en los ros de selva nublada, para lo cual determin la temperatura mxima diaria en ros de ambas zonas.Apoyan los resultados la hiptesis del investigador?. Se sabe que la temperatura tiene una distribucin normal y se dispone de la informacin siguiente: N ros Media Desviacin Pramo 17.0 11.9 1.39 Selva nublada 26.0 16.5 2.28

a. Formulacin de hiptesis: Si se considera que 1 y 2 son las varianzas de la temperatura del agua en los ros de pramo y selva nublada respectivamente, y adems que la temperatura del agua en los ros de pramo es menos variable, entonces las hiptesis a plantear son las siguientes: Hiptesis nula: Hiptesis alternativa:
2 2 =1 H0 : 2 1 2 2 >1 H1 : 2 1

b. Especificacin de un valor de probabilidad crtico o nivel de significacin: = 0.05 c. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis. Puesto que se trata de la comparacin de dos varianzas el estadstico de prueba es: s2 Fo = 2 2 s1 d. Establecer una zona de aceptacin para Ho. ZA = {F / F < f (1- ; n 2 -1 n1 -1) } e. Cmputos necesarios. e.1) Varianzas muestrales: s1 = (s1 ) = 1.392 = 1.93 ; s 2 = (s 2 ) = 2.282 = 5.2 e.2) Grados de libertad: 2 = n2 1 = 17-1 = 16 ; 1 = n1 1 = 26-1 = 25 e.3) Estadstico de prueba: Fo =
2 s2 5.2 = = 2.69 2 s 1 1.93 2 2 2 2

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

154

e.4) Zona de rechazo: ZA = {F/F < f (1- ; n 2 -1 n 1 -1 ) } = {F / F < f (0.95;25/16) } = {F / F < 2.23} f. Decisin. Como Fo = 2.69 > f(0.95; 25/16) = 2.23 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho. Entonces, de acuerdo a la informacin obtenida de la muestra se puede afirmar con un 95% de confianza que las varianzas de la temeperatura del agua en en los ros de selva nublada es mayor que la de los ros de pramo.

6.7 EJERCICIOS
6.7.1) Compruebe la hiptesis nula Ho: = 22 frente a la alternativa H1: + 22 con un nivel de significacin = 5% en base a la siguiente informacin suministrada por una muestra: media = 23.5; desviacin = 1,2 y n = 230. La distancia recorrida por dos sustancias orgnicas en 13 corridas cromatogrficas fueron las siguientes: Corrida n 1 2 3 4 5 6 7 8 9 10 11 12 13 Distancia recorrida (cm) Distancia recorrida (cm) Sustancia 1 Sustancia 2 5.8 4.0 6.6 6.1 7.3 4.5 6.3 4.9 5.9 5.2 6.5 5.1 6.0 5.2 6.9 5.2 5.6 5.4 5.7 5.6 6.2 3.8 5.6 4.3 6.2 5.7

6.7.2)

Usando un nivel de confianza de 95% para todos los casos.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

155

6.7.2.1) Se podra afirmar que la distancia recorrida por la primera sustancia es mayor a 5,85 cm? 6.7.2.2) Se podra afirmar que la distancia promedio recorrida por la segunda sustancia es igual a 5.3 cm? 6.7.3) Un investigador cree que la concentracin de glucsidos en las larvas de una especie de Mariposa es de 0.15 unidades. Para poner a prueba tal hiptesis, examin 75 larvas del insecto y encontr los siguientes valores: media = 0.2 unidades y varianza = 0.012. Use un = 0.05. El Profesor de Mtodos Estadsticos supone que el CI de los alumnos del curso actual es superior al promedio de los cursos anteriores que ha sido igual a 100 con una desviacin igual a 10. Para poner a prueba tal suposicin le midi el CI a los 25 alumnos del curso presente y encontr que el CI fue de 104. Tiene razn el profesor?. Use un = 0.04 Despus de haberse realizado una campaa publicitaria sobre los efectos dainos del cigarrillo sobre la salud de las personas, el Ministerio de Sanidad, quiere comprobar si la misma tuvo efecto y si como consecuencia de la misma disminuy el consumo medio de cigarrillos por adulto, valor que al inicio de la campaa era de 10 cigarrillos/dia con una desviacin de 1.5 cigarrillos/dia. Para tal fin eligieron aleatoriamente 144 individuos y encontraon que la media muestral fue de 8.5 cigarrillos/dia. tuvo la campaa algun efecto benfico a un nivel de significacin de 0.01. Veinticinco estudiantes varones universitarios, observados en forma aleatoria, presentan un peso promedio de 74 kg. con una desviacin de 5 kg. Son estas observaciones consistentes con el supuesto de que el peso medio de todos los estudiantes de la Universidad para el momento de la medicin era de de 71 kg. Un mdico dice haber elaborado una crema para la comezn, y que la misma es efectiva en mas del 70%. El Dpto. de Control de Medicamentos del MSAS, piensa lo contrario y decide probar tal afirmacin con una probabilidad no mayor al 0.01 de tomar una decisin equivocada. El efecto de la crema se evaluo en 200 pacientes, de los cuales 125 dijeron haber experimentado un alivio inmediato. Quin tiene la razn?. La produccin media de una variedad de hongos bajo cierto rgimen de cuidado ha sido de 31 Kg. en un perodo estndar. Se introdujo un nuevo sistema, que aunque mas costoso, si la produccin es mayor a 45 kg. dara bastantes beneficios. Para decidir si se adopta el nuevo sistema, el Productor siembra 40 parcelas, que atendidas con el nuevo sistema dan una produccin media de 48 kg. y una desviacin de 4,5 kg.. El productor acepta como mximo un 10% de error. Que decisin debe tomar el Productor?

6.7.4)

6.7.5)

6.7.6)

6.7.7)

6.7.8)

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

156

6.7.9)

En el caso del problema 6.7.2 sobre cromatografa Se podra afirmar que la distancia promedio recorrida por cada sustancia es distinta?

6.7.10) El coeficiente de inteligencia de 16 estudiantes del curso de estadstica de 1990 di una media de 112 con una desviacin tpica de 8, mientras que el C.I. de 14 estudiantes del curso de 1992 dio una media de 107 con una desviacin tpica de 10 Hay diferencias significativas entre los dos grupos al nivel de 0,01 y 0,05. 6.7.11) Para averiguar si un nuevo fertilizante para la produccin de trigo es mas efectivo que el antiguo, se dividi un terreno en 100 parcelas de iguales dimensiones. Se aplic el nuevo fertilizante en 50 parcelas y el antiguo en las otras 50 parcelas. El promedio de trigo cosechado en cada parcela con el nuevo fertilizante fue de 25,5 kg. con una varianza de 22. En las parcelas donde se utiliz el viejo fertilizante el promedio de produccin fue de 24,6 kg. con una varianza de 19. Es el nuevo fertilizante mas eficiente que el antiguo?. 6.7.12) Se desea comparar la duracin de una enfermedad segn que el enfermo presente o no un acceso de fiebre al principio de la enfermedad. La duracin observada de la enfermedad ha sido por trmino medio de 11 dias para 5 enfermos no fbriles y de 17 dias para enfermos febriles. La estimacin comn de la varianza de la duracin de la enfermedad es S = 20 Que conclusin se puede sacar? = 0,01. 6.7.13) Un qumico metalrgico ha hecho cuatro determinaciones del punto de fusin del manganeso: 1269 C, 1271 C, 1263 C y 1265 C. Si la variable Punto de fusin (C) se distribuye normalmente, estan esos datos de acuerdo con el valor publicado de 1260 C, aceptndose un error de 5%.? 6.7.14) Una muestra de 10 mediciones del dimetro de la cpsula ceflica de un insecto da una media de 4,08 mm y una desviacin de 0,05 mm. Es esta informacin consistente con el hecho de que la poblacin tiene una media = 4 mm, dado = 0,05?. 6.7.15) El Club Atltico Ese Gordito asegura en su publicidad que las personas que sigan por dos das una dieta y su programa de ejercicios perdern peso en forma significativa. A fin de comprobar la veracidad de sta publicidad, la Oficina del Instituto Nacional de Capacitacin al Usuario (INDECU), seleccion aleatoriamente 33 personas inscritas en el programa y determin que las mismas perdieron en dos das un promedio de 0,37 kg con una desviacin de 0.98 kg. Compruebe con un nivel de significacin del 95% si la aseveracin de la propaganda es correcta. 6.7.16) El contenido mximo de estao que se considera incuo en los tejidos de cierto vegetal comestible es de 50 g/g . La valoracin de 8 porciones del mismo vegetal cultivado cerca de un yacimiento de estao proporcion un valor medio igual a 55.89 g/g con una desviacin de 8.8 g/g Estar contaminado el vegetal?. Suponga que la concentracin de estao se distribuye normalmente. La probabilidad de cometer el error tipo I no debe ser mayo a 0.01.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

157

6.7.17) El requerimiento humano de sal es de 220 mg/da. Si una muestra de 38 raciones iguales de un cereal para el desayuno tiene un contenido promedio de Na Cl de 196 mg con una desviacin de 24.5 mg, se podra afirmar que una racin de este cereal satisface el requerimiento diario de cloruro de sodio? Se sabe que la concentracin de esta sustancia en el cereal se distribuye normalmente. Use = 0 0.05 6.7.18) Un investigador sospecha que el contenido de albmina en la sangre de ciertos animales es mayor al valor promedio de 40 g/l que se seala en la literatura. Con el fin de confirmar su sospecha examin el contenido de albmina en la sangre de 32 animales y encontr que su valor promedio fue de 42.8 g/l con una desviacin de 10 g/l. Cul es la conclusin del investigador?. 6.7.19) Una surtidora automticas es utilizada para llenar envases con 16 ml de un medicamento. El volumen servido se puede considerar como una variable aleatoria que se distribuye normalmente. El Departamento de Control de Medicamentos del Ministerio de Sanidad sospecha que el volumen de llenado es menor que lo estipulado. Para comprobar sto a 10 frascos seleccionados aleatoriamente se les mide el volumen envasado, encontrandose los resultados siguientes: 16; 15.6; 15.97; 16.04; 16.05; 15.98; 15.96; 16.02; 16.05; 16.02 6.7.19.1) Es correcta la apreciacin del Departamento de Control? 6.7.19.2) A que se debe la variacin en las medidas? 6.7.20) A fin de determinar la eficiencia de un nuevo mtodo para medir mercurio, se hicieron varias mediciones de la cantidad de este elemento en una solucin patrn que contiene un 40% de mercurio. El resultado de 9 mediciones produjo un valor promedio de 37.8% y una desviacin de 1.9%. Suponindo que la variable se distribuye normalmente se puede afirmar que el mtodo est fallando?. Use = 0.01. 6.7.21) Una muestra de 16 hojas de una determinada variedad de tomate present los siguientes valores de longitud:
X(cm) = 3.00, 5.20, 8.00, 2.30, 4.50, 3.25, 2.80, 3.22, 9.24, 2.75, 1.08, 4.83, 2.49, 9.00, 5.00, 2.10.

6.7.22) Sera la media poblacional mayor o menor a 6 cm? La probabilidad de cometer el error tipo I no debe ser mayor a 1%. Supoga que la variable longitud se distribuye normalmente. 6.7.23) Un entomlogo esta probando el efecto de un nuevo insecticida sobre las larvas (gusanos) de una especie de mariposa. Para efectuar el experimento necesita un grupo de larvas cuyo tamao promedio debe ser al menos de 5.0 cm. Si el tamao promedio es significativamente menor a 5 cm el investigador elimina el grupo de larvas y busca otro. A fin de concretar el primer ensayo el investigador seleccion aleatoriamente 16 individuos y midi su longitud obteniendo un valor promedio de 4.90 cm y una

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

158

desviacin de 0.02 cm. Cual debe ser la decisin del entomlogo?. La variable talla se distribuye normalmente. La probabilidad mxima de cometer error es igual a 0.01. 6.7.24) Un pas con una carencia crtica de alimentos recibe como ayuda internacional un cargamento de varias toneladas de yuca, la cual se contamin en el viaje con una toxina que afecta el sistema nervioso. Estudios de la Organizacin Mundial de la Salud han demostrado que alimentos que contengan concentraciones iguales o menores a 40 ppm de la toxina pueden ser ingeridos sin mayor riesgo. Las autoridades sanitarias del pas en cuestin determinan la presencia de la toxina en 100 muestras tomadas al azar del cargamento (el costo y el tiempo requerido del anlisis no permite hacer ms determinaciones) y obtienen una concentracin promedio de la toxina de 37.8 ppm. con una desviacin tpica de 10 ppm.. A Ud. se le consulta para decidir si el cargamento debe utilizarse o destruirse. En base a la informacin suministrada y teniendo en cuenta que lo siguiente: 6.7.24.1) Cual nivel de significacin escogera para probar la hiptesis? Por qu? Recuerde que estan en juego la salud y/o vida de miles de personas. 6.7.24.2) Haga los clculos correspondientes y formule su decisin estadstica? 6.7.24.3) Que recomendara hacer con el cargamento de yuca?. Tenga presente que su decisin puede implicar a) impedir que miles de personas mueran de inanicin o b) envenenarlas con la toxina. 6.7.25) En un estudio sobre el ciclo de vida de un insecto, se desea determinar si existen diferencias en cuanto a la duracin entre las fases de huevo y de larva. A una muestra de 12 huevos y a otra muestra de 12 larvas se les determina el tiempo de duracin, los cuales resultan ser los siguientes: Huevos (horas) 31 34 29 26 32 35 38 34 30 29 32 31 Larvas (horas) 26 24 28 29 30 29 32 26 31 29 32 28

Suponga que la variable tiempo de duracin se distribuye normalmente. La probabilidad de cometer el error tipo I no debe ser mayor 0,05%.

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

159

6.7.26) El oxgeno consumido (ml) durante la incubacin de dos suspensiones de clulas, una en un buffer y la otra no, fue el siguiente: Suspensin con Suspensin sin buffer buffer 13.0 6.7 13.2 7.2 15.0 9.1 13.2 8.3 14.2 7.6 14.8 9.2 14.1 7.8 12.2 8.7 12.1 6.9 13.4 6.8 13.8 7.7 13.1 7.2 13.5 8.5 14.7 7.5 15.1 7.8 12.9 7.5 15.0 13.9 Existen diferencias en el consumo de oxgeno entre los dos grupos de clulas?. El error tipo I debe ser igual o menor a 0,01%. 6.7.27) Dos mtodos de recuperacin de nitrgeno se utilizaron para analizar 36 porciones de un material orgnico. Los resultados fueron los siguientes: Media Desviacin Mtodo A Mtodo B 75.8% 76.0% 3.10% 2.50%

Es el mtodo B mejor que el A? 6.7.28) Se examin el oxigeno (ppm) disuelto en el agua de un ro a dos altitudes diferentes, en 25 ocasiones. Los resultados fueron los siguientes: Media Desviacin 1000 m.s.n.m. 6.5 1.11 2.700 m.s.n.m. 8.4 1.65

Existen diferencias en el contenido de oxgeno con la altitud?

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

160

6.7.29) Se sabe que la maquinaria para llenar un medicamento en polvo lo vierte en frascos de un detrminado tamao con una desviacin estndar de 0.6 g. A fin de mantener ajustada la maquina, diariamente se verifican los pesos netos de las cajas. Dos muestras tomadas en dos das presentan la informacin siguiente: Media n Muestra 1 Muestra 2 18.7 g 21.9 g 30 35

6.7.29.1) Est la maquinaria ajustada para servir 20 g, en el primer da? 6.7.29.2) Est ajustada la mquina para servir 20 g, en el segundo da? 6.7.29.3) Se verific algn cambio en el ajuste de la mquina entre los dos das?. 6.7.30) Los datos que siguen corresponden al nmero de individuos / litro de dos especies de invertebrados que se hallaron en una laguna en seis profundidades diferentes. Nmero de individuos / litro Especie A Especie B 35 37 32 27 29 30 28 31 32 30 28 27

Profundidad (m) 1 2 3 4 5 6

Utilizando = 0.05 y suponiendo que el nmero de individuos se distribuye normalmente, responda: 6.7.30.1) Se podra afirmar que la abundancia de la especie A es mayor que 27 indiv./L, si se sabe que A = 6 ? 6.7.30.2) Se podra afirmar que la abundancia de la especie B es igual a 28 indiv/L? 6.7.30.3) Se podra afirmar que la abundancia promedio de las dos especies es distinta? 6.7.31) Un qumico esta tratando de determinar si dos materiales orgnicos de distinta procedencia tiene el mismo contenido de fsforo. Para tal fn seleccion dos muestras de 25 porciones del mismo peso de cada material y utilizando la msma metodologa midi el contenido de fsforo en ambas muestras, encontrando que en el material A el contenido medio del elemento fue de 37.75 g con una desviacin de 4.71 g y en el material B el contenido medio fue de 35.00 g con una desviacin del 3.89 g. Suponiendo que el contenido de fsforo es una variable que se distribuye normalmente Cul debe ser la conclusin del investigador?

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

161

6.7.32) Se est investigando el efecto de la concentracin inicial de un fertilizante sobre el tamao de las plantas de un determinado cultivo. Para tal fn se fertilizaron dos parcelas de terreno con dos concentraciones del producto (800 y 200 mg/l). Despues de seis semanas, se midi la altura en cinco plantas elegidas aleatoriamente dentro de cada parcela encontrndose los valores siguientes: Altura de las plantas (cm) Planta N 800 mg/l 200 mg/l 1 58.2 52.9 2 57.2 49.9 3 58.4 50.0 4 55.8 51.7 5 54.5 56.3 Tiene la concentracin inicial del fertilizante algn efecto sobre el tamao promedio de las plantas?. La variable altura se distribuye normalmente, siendo iguales las varianzas poblacionales? 6.7.33) Se quiere determinar si dos mtodos para detectar Ca en tejidos vegetales tienen la misma eficiencia. Para tal fin se eligieron 10 tomates de la misma variedad. Cada tomate se dividi en dos partes iguales. A una de las partes se le determin el Ca por uno de los mtodos y a la otra parte se le determin el Ca por el otro mtodo. Se puede admitir que los mtodos son igualmente eficientes? si los resultados fueron los siguientes: Use = 0.001 Mtodo A 31.90 31.88 32.14 32.85 31.82 32.11 31.63 31.79 31.05 31.86 Mtodo B 31.51 31.30 31.50 31.81 31.66 31.65 31.57 31.42 31.76 31.71

6.7.34) A Ud. como profesional al Servicio del Ministerio del Ambiente le corresponde investigar la denuncia de un grupo de cultivadores de ajo en la poblacin de Mucuchis que afirman que los efluvios de una planta industrial instalada en los alrededores de los plantos y que son vertidos en un canal de aguas servidas, estan disminuyendo el tamao de los ajos que cultivan. Como primer paso Ud. hace analizar muestras de las aguas residuales de la planta y en repetidos intentos no logra detectar ninguna sustancia que se pueda suponer afecte a los ajos. Como segundo paso decide verificar si hay evidencias de que los ajos sembrados en las riberas del canal son de menosr peso que los de otras zonas de los cultivos. Para ello toma una muestra de 51 cabezas de ajos de plantas situadas en la ribera del canal de desage y otra muestra de

Samuel Segnini

Fundamentos de Bioestadstica

Captulo 6

162

igual tamao y tomada con un procedimiento anlogo de una zona de los cultivos fuera de la influencia del canal y procedi a pesar las cabezas. Los resultados del pesaje fueron los siguientes: para las plantas fuera de la influencia del canal el promedio de la muestra fue de 29.9 g con una desviacin de 2.44 g; para las plantas en la zona de influencia la muestra proporcion una media de 28.7 g con una desviacin de 2.89 g. Se podra afirmar, que existen diferencias en el peso promedio de los ajos cultivados en ambas zonas?. Para responder la pregunta anterior use el nivel de significacin que le parezca ms adecuado y explique las razones de esta seleccin.

Adulto de la Familia Perlidae (Insecta: Plecoptera)

S-ar putea să vă placă și