Sunteți pe pagina 1din 25

Ctedra I Estadstica II

Autor I Hebe Goldenhersch



81
CONTRASTE, PRUEBA, TEST O DOCIMASTA DE HIPTESIS
I



Objetivos

Comprender los fundamentos tericos y la lgica subyacente de la
metodologa de pruebas de hiptesis estadsticas.
Aplicar los procedimientos de pruebas de hiptesis estadsticas para dife-
rentes parmetros poblacionales.
Conocer acerca de los errores que se pueden cometer en el proceso de
decisin basado en muestras.
Aplicar conceptos y procedimientos de la metodologa en la resolucin de
problemas.
Introducir los conceptos del diseo experimental mediante el desarrollo del
modelo de diseo completamente aleatorizado de un factor.
Comprender la metodologa de anlisis de la varianza como procedimiento
que posibilita la comparacin de promedios de dos o ms poblaciones.
Identificar las distintas fuentes de variacin de un conjunto de datos.
Conocer los procedimientos de comparaciones mltiples para identificar las
poblaciones con promedios diferentes.


Contenidos


1. Introduccin.
2. Procedimiento para la prueba de hiptesis; pruebas de una y dos colas.
3. Errores tipo I y tipo II.
4. Pruebas de hiptesis para la media, proporcin, varianza, diferencia de
medias, diferencia de proporciones, cociente de varianzas.
4.1. Pruebas de hiptesis referida al parmetro media poblacional.
4.1.1. Varianza poblacional conocida, poblaciones normales o
muestra mayores que 30 (cualquier distribucin poblacional).
4.1.2. Varianza poblacional desconocida, poblaciones normales y no
normales.
4.2. Pruebas de hiptesis referida al parmetro proporcin poblacional
(muestras grandes- np y nq > 5).
4.3. Pruebas de hiptesis referida al parmetro varianza poblacional
2
.
4.4. Pruebas estadsticas para comparacin de parmetros de dos
poblaciones.
4.4.1. Muestras independientes: comparacin de medias y varianzas.
4.4.2. Comparacin de medias: muestras dependientes.
4.4.3. Comparacin de dos proporciones, muestras independientes.
5. Vinculacin entre pruebas de hiptesis e intervalos de confianza.
6. Funcin de potencia. Curva O. C.
7. Determinacin del tamao muestral cuando se fijan y .
8. Pruebas de hiptesis para las medias de K poblaciones.
8.1. Introduccin.
8.2. Anlisis de la varianza de un factor.
9. Tabla de Anlisis de varianza. Variacin entre y dentro de grupos.
Comparaciones mltiples.
9.1. Variacin entre y dentro de grupos.
9.2. Tabla de ANAVA.
9.3. Modelo estadstico y supuestos del ANAVA.
9.4. Supuestos del modelo.
9.4.1. Supuesto de normalidad de errores.
9.4.2. Supuesto de independencia de errores.
9.4.3. Independencia entre residuos y variable de respuesta.
9.4.4. Supuesto de varianza constante para todos los grupos.
9.5. Comparaciones mltiples.

82































































Ctedra I Estadstica II
Autor I Hebe Goldenhersch

83
1. Introduccin


Tal como lo planteamos en el captulo anterior, abordamos ahora el segundo de los
tipos de procedimiento, de la Inferencia Estadstica: la prueba de hiptesis
estadstica. En ingls se denomina test y en su traduccin al espaol se han
utilizado varios vocablos, que a los efectos estadsticos consideramos equivalentes:
prueba de hiptesis, contraste de hiptesis o docimasia de hiptesis (este ltimo suena
algo extrao porque es un trmino muy especfico utilizado en geologa para pruebas
que se realizan con ciertos minerales); a veces tambin se utiliza en castellano la
palabra test. En este captulo nos referiremos a la cuestin de la prueba de hiptesis
utilizando indistintamente cualquiera de esas formas.

Una vez realizada esta aclaracin, comenzaremos a considerar situaciones donde se
aplica esta metodologa.

En muchas oportunidades, durante el proceso de investigacin cientfica se generan
propuestas denominadas hiptesis de trabajo.


Por ejemplo, un educador puede sospechar que la poltica econmica aplicada en
los ltimos 10 aos ha aumentado la desercin de los alumnos que concurran al
nivel medio de enseanza y vinculado a esta hiptesis de trabajo, teniendo en
cuenta otros aspectos de la realidad social puede plantear la siguiente deduccin:

La desercin debe haber sido mayor entre los alumnos que concurren a
las escuelas pblicas.

El solo enunciado de esta deduccin no agrega mucho al conocimiento. Ser
necesario efectuar un enunciado conjetural capaz de ser confrontado con datos
observados de la realidad, es decir, formular lo que denominaremos una
hiptesis estadstica.

Una hiptesis estadstica es un enunciado provisional con respecto a una
situacin del mundo real, generalmente expresada a travs de relaciones
particulares de ciertas variables en estudio.

Podemos decir tambin que las hiptesis estadsticas son aqullas que pueden
contrastarse con datos observados de la realidad.


En el ejemplo, se puede establecer la siguiente hiptesis estadstica: en la
Provincia de Crdoba, en los ltimos aos, la proporcin de alumnos que ha
desertado en las escuelas pblicas es mayor que la proporcin de alumnos que ha
desertado en las escuelas privadas.

La esencia de la comprobacin de una hiptesis estriba en verificar la relacin
expresada por ella a travs de la experimentacin u observacin de hechos de la
vida real. Cul seria el camino a seguir para verificar la hiptesis planteada?

Se debera contar con un listado de todas las escuelas pblicas y privadas de nivel
medio de la provincia de Crdoba; de cada listado seleccionar una muestra
aleatoria de escuelas e ir a las escuelas seleccionadas para tomar datos referidos a
la desercin de alumnos en los ltimos 10 aos. Una vez que se cuenta con los
datos, se debe aplicar alguna metodologa estadstica conveniente para verificar si
la tasa de desercin escolar ha sido diferente o similar en los tipos de escuelas
establecidos, o sea, contrastar la hiptesis estadstica planteada.

Si la realidad no se ajusta a la hiptesis planteada, se deber repensar el
problema y tal vez modificar la hiptesis inicial y comenzar un nuevo ciclo en la
investigacin. Por medio de este procedimiento, se habr producido un avance
cientfico a travs del razonamiento estadstico.

Otro ejemplo simple nos llevar a clarificar la idea de efectuar una prueba de
hiptesis.

84

Supongamos que establecemos la siguiente hiptesis y su correspondiente deduc-
cin con respecto a un aula de la Facultad que est con las puertas cerradas con
llave (por ahora no se trata de una hiptesis formulada estadsticamente).

A: la habitacin esta vaca (hiptesis)
B: como la puerta no se puede abrir, si se mira por el ojo de la cerradura no se
ver a nadie (deduccin).

Si procedemos a mirar por el ojo de la cerradura y vemos un alumno sentado en
un banco, podemos estar seguros al decir que la hiptesis A es falsa.

Deduccin no se cumple Hiptesis falsa

Si en cambio, miramos por el ojo de la cerradura y no vemos a nadie en el aula,
no podremos decir que la hiptesis es verdadera, porque no vimos sino una parte
del aula; pero como no hemos visto a nadie, no estamos en condiciones de
rechazar la hiptesis; entonces diramos:

Deduccin se cumple No podemos rechazar la hiptesis

El hecho de mirar por el ojo de la cerradura equivale a tomar una muestra
(observar slo una parte del aula). Podemos asimilar esta situacin con la
inferencia estadstica por cuanto debemos tomar una decisin en base a una
informacin limitada (la muestra) respecto de la totalidad del aula (la poblacin).

Generalmente, en una investigacin, se trabaja con muestras obtenidas a partir de una
cierta poblacin: en el ejemplo de las escuelas, se ha tomado slo una muestra
aleatoria de las mismas. Por ello se debe tener mucho cuidado al establecer
conclusiones a partir de muestras. Si la evidencia de la muestra lleva a la decisin de
rechazar la hiptesis planteada estaremos mucho ms seguros de nuestra
determinacin que cuando no existan evidencias para su rechazo.

Pasaremos ahora a comentar el razonamiento que se sigue al efectuar una prueba de
hiptesis. Este razonamiento es muy similar al que se utiliza en una corte de justicia
cuando se debe tomar la decisin de declarar culpable o no culpable a una persona
acusada de haber cometido un delito.

Los actores de un juicio pueden resumirse en un acusado, un fiscal y un juez que es
quien debe tomar la decisin de declarar o no culpable al acusado.

El acusado ser considerado inocente hasta tanto las pruebas presentadas por el fiscal
demuestren lo contrario.

Haciendo una analoga con el procedimiento de prueba de hiptesis, la hiptesis que
considera que el acusado es inocente, se suele denominar hiptesis nula en el lenguaje
del test de hiptesis.

Una hiptesis nula es un supuesto acerca de uno o ms parmetros u otras
caractersticas de la poblacin, que puede ser rechazado o no en base a la
evidencia muestral.

La hiptesis nula se suele simbolizar con H
0
.


En general, como explicramos ms arriba, la hiptesis nula no se acepta sino que
se rechaza o no se rechaza. Su rechazo implica la aceptacin de la alternativa (en
el caso del juicio, el rechazo de la inocencia implica aceptacin de la culpabilidad, en el
caso del aula vaca, el rechazo implica que en el aula hay alguien). Es por ello que
suele colocarse como hiptesis nula, la situacin que el investigador piensa ser
rechazada.

Para explicarnos mejor: si un acusado es sometido a un juicio, es porque se sospecha
de su culpabilidad, el fiscal sospecha que es culpable, por eso lo somete a juicio;
aunque no puede ser condenado hasta no probar su culpabilidad. El rechazo de la
hiptesis nula implica la aceptacin de la culpabilidad, su no rechazo implica que no se
pudo probar esa culpabilidad.



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

85

Si se hace una prueba estadstica para determinar quin tiene razn en el caso del
aula vaca, es porque se sospecha que hay alguien; no sera razonable mirar
porque s por el ojo de la cerradura en todas las aulas para ver si hay alguien;
cuando este procedimiento se lleva a cabo, es porque se sospecha en ese caso
particular que hay alguna persona, y el procedimiento estadstico la confirma
(rechazando la hiptesis nula) o no la confirma (no rechazndola).

Una hiptesis se denomina nula en el sentido que se supone que no existe una
diferencia importante entre el verdadero valor del parmetro de la poblacin y el valor
del parmetro especificado en la hiptesis nula (supuesto de inocencia, igualdad de
tasas de desercin entre escuelas pblicas y privadas). La hiptesis nula suele
expresarse con la igualdad del parmetro a cierto valor de referencia. Cuando se
tienen dos o ms poblaciones, suele establecer la igualdad de los parmetros que se
quieren comparar.


En el estudio acerca de la desercin escolar la hiptesis nula establecida sera que
no existen diferencias en las proporciones de alumnos que desertaron en las
escuelas pblicas y privadas, en smbolos:

H
0
) P
1
= P
2


donde P
1
= proporcin de alumnos que desertaron en la poblacin de escuelas
publicas y P
2
= proporcin de alumnos que desertaron en la poblacin de escuelas
privadas.

Si la hiptesis nula es falsa, deber existir otra hiptesis que sea verdadera. Esta
hiptesis recibe el nombre de hiptesis alternativa.

La hiptesis alternativa se simboliza como H
1
.


En el ejemplo:

H
1
) P
1
> P
2

Veamos otro ejemplo.

El Instituto Pasteur de Pars y el Laboratorio Merieux bajo la rectora de la Agencia
Nacional de Investigacin contra el SIDA han elaborado una vacuna contra tal
enfermedad. En una primera etapa esta vacuna se prob en chimpancs y, como
los resultados fueron buenos, se decidi probar la misma en seres humanos. Se
seleccionaron 50 voluntarios de entre 18 y 55 aos de ambos sexos. Los
voluntarios deban ser todos no infectados con el virus del SIDA y con un alto
riesgo de contraer la enfermedad (prcticamente se sabe que todos van a
enfermarse a causa de su situacin de alto riesgo).

Previamente a esta experiencia, el grupo francs ensay la inmunidad lograda en
chimpancs inoculados con la vacuna, obteniendo una respuesta favorable en un
75% de los casos. Por este motivo se decidi que la vacuna podr ser considerada
efectiva en seres humanos cuando ella prevenga de la enfermedad a ms del 80%
de los pacientes tratados.

Como dijimos que la hiptesis nula asume el rol del acusado y que este es
inocente (no efectiva) hasta que se demuestre su culpabilidad (es efectiva), la
hiptesis nula deber expresar:

H
0
) P 0.80

donde P es el parmetro proporcin poblacional, es decir, el parmetro del cual
hacemos un juicio provisorio. (La vacuna no es efectiva en ms del 80% de los
casos).

86

Los 50 voluntarios de la muestra sern inoculados con la vacuna y se les efectuar
el seguimiento durante un ao luego del cual se obtendrn las primeras
conclusiones.

La muestra de personas a las que se les dio la vacuna ser la evidencia de que el
equipo de investigacin llevar ante la Agencia Nacional de Investigacin contra el
SIDA.

Tambin dijimos que en el procedimiento de prueba de una hiptesis nula debe
existir lo que se denomina una hiptesis alternativa.

La hiptesis alternativa ser:

H
1
) P > 0.80

(La vacuna es efectiva en ms del 80% de los casos).

Hasta aqu hemos resuelto el primer paso a seguir en el planteamiento de hiptesis, o
sea, el establecimiento de la hiptesis nula y de la hiptesis alternativa.

Recordemos que en general, la hiptesis alternativa es la que expresa lo que el
investigador est sospechando ocurrir (el acusado ser declarado culpable, la
habitacin no est vaca, le proporcin de desercin en las escuelas pblicas es mayor
que en las privadas, la vacuna es efectiva en ms del 80% de los casos).

Para poder tomar una decisin con respecto a rechazar o no la hiptesis nula
planteada, hay que establecer ciertas reglas de decisin.


Ahora bien, si en la muestra considerada, el 15% de las personas no contrae la
enfermedad, es muy probable que la vacuna sea declarada como no efectiva (la
proporcin de efectividad es mucho menor al 80%). Por el contrario, si el 95% de
las personas no contrae la enfermedad, con seguridad ella ser considerada
efectiva.

Pero, qu decisin se tomar si, por ejemplo, el porcentaje de personas que no
se enferman oscila entre el 70 y el 85%?

Evidentemente, debera establecerse un criterio estadstico que especificar de manera
objetiva, a partir de qu valor de p (proporcin muestral), se tomar la decisin de
rechazar o no la hiptesis nula. Este criterio, conocido como medida de discrepancia
o criterio de test, se calcula sobre la base de la informacin aportada por la muestra.

Como consecuencia de este criterio de test adoptado se podr establecer un valor
crtico que determinar una regin de rechazo y una regin de no rechazo de la
hiptesis nula. Este criterio tendr que ver con un estimador del parmetro objeto del
test, y con un estadstico cuya distribucin de probabilidad sea conocido en caso de
cumplimiento de la hiptesis nula. En general, los estimadores son los mismos que se
usaron en el Captulo I para construir los intervalos de confianza y los estadsticos
sern muy parecidos a los utilizados en esa oportunidad; slo que en lugar de contener
un parmetro desconocido, contendrn el valor que asume el parmetro si se cumple
la hiptesis nula.


En el ejemplo de la vacuna, el estimador para efectuar el test ser la proporcin
muestral p de personas que quedaron inmunizadas por su accin (recordando que
p , con tamaos de muestra adecuados, tiene distribucin normal) y las reglas de
decisin determinarn en cul de las dos regiones se posiciona el valor muestral,
con el auxilio del estadstico adecuado.



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

87




Tipos de hiptesis

A lo largo de la materia estableceremos bsicamente cuatro tipos de hiptesis:

a) Hiptesis que especifiquen un valor o un intervalo de valores para algn parmetro
de una distribucin poblacional.
b) Hiptesis que comparen valores de parmetros de dos o ms distribuciones
poblacionales.
c) Hiptesis que determinen la forma de la distribucin de la variable en una
poblacin.
d) Hiptesis que se refieran a relaciones existentes entre variables (por ejemplo si
son o no independientes, si existe entre ellas una relacin funcional, etc.).

En este captulo estudiaremos las hiptesis de los tipos indicados en los apartados a) y
b); las indicadas en los apartados c) y d) se estudian en otros captulos; se trata en
general de pruebas llamadas no paramtricas o de regresin, que implican mtodos
diferentes a los estudiados en este captulo.




A continuacin veremos un procedimiento estandarizado para realizar pruebas de
hiptesis estadsticas. Este procedimiento para llevar a cabo una prueba de hiptesis
es el resultado de los trabajos de R. A. Fisher, J. Neyman y E. S. Pearson entre los
aos 1920 y 1933.

En la mayora de los casos, los pasos siguientes resultan adecuados:

a) Se define la hiptesis nula a probar y la correspondiente hiptesis alternativa.
b) Se define una medida de discrepancia (tambin denominada criterio de test) entre
los datos aportados por la o las muestras obtenidas y la hiptesis nula. Esta
medida se expresa como funcin del parmetro especificado en H
0
y su correspon-
diente estimador en la muestra. De acuerdo a la terminologa que definimos en el
Captulo I, esta funcin es un estadstico (funcin de un parmetro y de su
estimador, slo que en los estadsticos para realizar estimacin por intervalos el
parmetro era desconocido y en el caso que estudiamos ahora se trata del valor
del parmetro cuando se cumple la hiptesis nula). La medida de discrepancia
debe seguir una distribucin de probabilidad conocida cuando se cumple la
hiptesis nula. Esta discrepancia ser grande cuando tiene asociada una probabi-

88
lidad muy pequea de ocurrir si la hiptesis nula es cierta y ser pequea cuando
la probabilidad de ocurrir en caso que la hiptesis nula sea cierta es elevada. Es
decir, el criterio de test permitir discernir cuando la diferencia entre el estimador
y el parmetro establecido en la hiptesis nula es demasiado grande para
atribuirse meramente al azar.
c) Se toma la muestra, se calcula el estimador correspondiente y la medida de
discrepancia elegida. Si esta es pequea, no se rechaza la hiptesis nula
(recordemos que la hiptesis nula no se acepta sino que se rechaza o no se
rechaza) y si es grande, se rechazar la hiptesis nula.

Resumiendo, para decidir con respecto a la veracidad o no de la hiptesis nula
se debe elegir una medida de discrepancia y una regla para juzgar cundo la
discrepancia es suficientemente grande como para rechazarla.


Pruebas de una y dos colas

La formulacin de las hiptesis puede ser de dos tipos segn cmo se exprese la
alternativa:

a) Se desconoce la direccin en que se sospecha la falsedad de la hiptesis nula y se
especifica la hiptesis alternativa como P
1
P
2
Se dice entonces que la prueba de
hiptesis es bilateral.
b) Se conoce de antemano que la hiptesis nula, si se rechaza, tiene una direccin
determinada y, en ese caso se plantea que P
1
> P
2
o que P
1
< P
2
. La prueba es
entonces unilateral (derecha en el primer caso, izquierda en el segundo).

Es decir:

a) Si las hiptesis planteadas son H
0
: =
0
H
1

0
donde simboliza cualquier
parmetro de la poblacin se trata de una prueba de hiptesis bilateral. La
hiptesis nula ser rechazada cuando se obtengan tanto valores muy grandes
como muy pequeos del estadstico obtenido en la muestra. El investigador desea
rechazar la hiptesis nula cuando la evidencia indique diferencias con el valor de la
hiptesis nula en cualquier sentido.
b) Si las hiptesis planteadas son H
0
:
0
H
1
: > , se est en presencia de una
prueba de hiptesis unilateral derecha. La hiptesis nula ser rechazada para
valores grandes del estadstico obtenido en la muestra. Este planteo se realiza
cuando el investigador desea rechazar la hiptesis slo cuando la evidencia indica
que el valor del parmetro es mayor que el establecido por la hiptesis nula. Si, en
cambio las hiptesis planteadas son H
0
:
0
H
1
: <
0
se trata de una prueba
de hiptesis unilateral izquierda. La hiptesis nula ser rechazada para valores
chicos del estadstico obtenido en la muestra. Es el caso opuesto al anterior, el
investigador desea rechazar la hiptesis nula solamente si la evidencia le indica
que el valor del parmetro es inferior al planteado en la hiptesis nula
1/
.


3. Errores tipo I y tipo II



Al llegar a este punto, siguiendo con el ejemplo de la vacuna planteado ms
arriba, debemos recordar que se est decidiendo con respecto al parmetro
proporcin poblacional P a partir de la informacin brindada por una muestra. En
realidad, estamos mirando por el ojo de la cerradura y, en consecuencia, el
investigador podr acertar o cometer un error. En realidad, los errores que pueden


1/
En algunos textos se encuentra en la hiptesis nula slo el signo igual, en lugar de mayor o
igual o menor o igual. El razonamiento es exactamente el mismo y los resultados no difieren.
Preferimos poner el mayor o igual o menor o igual para que entre la hiptesis nula y la
alternativa se contemplen todos los valores posibles del parmetro.



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

89

cometerse son de dos tipos: podra rechazar la hiptesis nula diciendo que la
vacuna es efectiva cuando en realidad no lo es (es fcil imaginarse la peligrosidad
de esta aseveracin en cuanto a la salud de los pacientes que creen estar
inmunizados y no toman las precauciones necesarias para no contraer la
enfermedad); o bien podra no rechazar la hiptesis nula cuando en realidad es
falsa (estara diciendo que la vacuna no es efectiva cuando en realidad lo es. La
ciencia mdica perdera la posibilidad de erradicar el SIDA cuando tena todo a su
alcance para hacerlo).

Estos dos tipos de errores se conocen como: Error de tipo I y error de tipo II, y es
necesario que el investigador plantee la prueba de hiptesis previendo que las
probabilidades de cometer cualquiera de estos errores sean lo ms bajas posibles.

El error de tipo I es aquel que se comete al rechazar una hiptesis nula
cuando ella es verdadera.

La probabilidad de cometer un error de tipo I se simboliza con la letra griega ; se
conoce tambin como nivel de significacin de un test.

= P (rechazar H
0
/ H
0
es verdadera)

El error de tipo II es aquel que se comete al no rechazar una hiptesis nula
cuando en realidad es falsa.

La probabilidad de cometer un error de tipo II se simboliza con la letra griega .

= P (no rechazar H
0
/ H
0
es falsa)

El siguiente cuadro resume todas las acciones que se pueden llevar a cabo en un
procedimiento de prueba de hiptesis, y cules sern sus consecuencias segn la
hiptesis nula sea verdadera o falsa:

Decisin Hiptesis nula verdadera Hiptesis nula falsa
Rechazar H
0
Error tipo I
P(E
I
) =
Decisin correcta
P(DC)= 1 -
No rechazar H
0
Decisin correcta
P(DC)= 1 -
Error tipo II
P(E
II
) =


En lo que sigue, aprenderemos a calcular las probabilidades especificadas en esta
tabla, referidas tanto a las decisiones correctas como a los dos tipos de errores. Se
desarrollan los procedimientos para efectuar pruebas de hiptesis en diversos casos
particulares, referidos a parmetros o comparacin de parmetros.




4.1. Prueba de hiptesis referida al parmetro media poblacional

Nos ocuparemos en este punto de la prueba de hiptesis referida al parmetro media
poblacional . El procedimiento a seguir es bsicamente el mismo para todos los
dems parmetros estudiados hasta ahora (principalmente varianza poblacional
2
y
proporcin poblacional P). Las diferencias slo se refieren a la eleccin del estadstico
de prueba bajo diferentes condiciones tales como distribucin de la poblacin,
conocimiento de varianzas, tamaos de muestra, etc. Tal como mencionramos ms
arriba, los estadsticos son muy parecidos a los utilizados en el Captulo I para
estimacin por intervalos de los parmetros.


90
4.1.1. Varianza poblacional conocida, poblaciones normales o muestra mayo-
res que 30 (cualquier distribucin poblacional)


Introduciremos el tema por medio de un ejemplo.

De acuerdo con ciertos informes de un organismo encargado del estudio del medio
ambiente, la lluvia cida, causada por la reaccin de ciertos contaminantes del aire
con el agua de lluvia, disminuye la acidez del aire, afectando las tierras de cultivo
y causando corrosin en los metales expuestos.

La lluvia pura que cae a travs del aire limpio registra un valor de pH (el pH es
una medida de la acidez) de 5.7.

La sospecha que la instalacin masiva de fbricas en un parque industrial cercano
a un radio urbano puede estar contaminando el ambiente, llev a este organismo
a iniciar una investigacin sobre la contaminacin ambiental.

Los investigadores formularon la hiptesis que el ambiente estaba contaminado
por el aumento de la actividad fabril en la zona. En otras palabras, pensaban que
el pH de la lluvia que cae en la zona era inferior a 5.7.

Se establecieron las siguientes hiptesis:

H
0
) 5.7 H
1
) < 5.7

siendo el promedio de pH de la lluvia cada en la totalidad de las precipitaciones
que se dan en el lugar. (Hacemos la aclaracin de que a menor pH, mayor acidez).

Ya dijimos que en el procedimiento de pruebas de hiptesis, es lgico pensar que
la evidencia para rechazar o no la hiptesis nula ser proporcionada por una
muestra aleatoria extrada de la poblacin de inters.

Como estamos tratando de probar una hiptesis referida al parmetro media
poblacional, utilizaremos como estimador para tomar la decisin a su contrapartida
en la muestra, la media muestral x .

Ya hemos visto que la media muestral es un estimador insesgado, de mnima
varianza y que tiende a distribuirse normalmente a medida que se incrementa el
tamao de la muestra.

Grficamente, se tiene:












0
= 5.7 x


Como la muestra es mayor que 30 y la varianza poblacional se supone conocida, la
distribucin de la media muestral es normal.

En este caso particular, como se trata con test de hiptesis unilateral izquierdo tal
como est expresada la hiptesis alternativa, la hiptesis nula se rechazar
cuando el estimador puntual x tome valores ms pequeos que 5.7. Cuanto ms
alejado est de ese valor, con mayor razn vamos a rechazar H
0
.



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

91


La regin de rechazo de la hiptesis nula estar a la izquierda de la distribucin
tal como se observa en la siguiente figura:

Existir un valor de x , que denominaremos valor crtico y simbolizaremos con * x
que separar la regin de rechazo de H
0
de la regin de no rechazo.

La probabilidad de rechazar la hiptesis nula cuando es verdadera ser el rea
sombreada a la izquierda de * x bajo la curva normal. Esta es la probabilidad de
cometer el error de tipo I que hemos llamado .


A continuacin calculamos el valor crtico que separar las zonas de rechazo y no
rechazo de la hiptesis nula.

Como estas zonas son reas de la distribucin normal, debemos estandarizar el
valor crtico * x que establece el lmite entre las dos zonas, de acuerdo con la
probabilidad de cometer el error de tipo I que se ha fijado.

En el caso como el del ejemplo, que se trata de un test unilateral izquierdo, con
las siguientes hiptesis:

H
0
)
0
H
1
) <
0


la regin de rechazo de la hiptesis nula estar a la izquierda de la distribucin.

Estandarizando el punto crtico, bajo el supuesto que la hiptesis nula es
verdadera, se tiene:

0
*
*
x
z
n

=

De esta expresin se puede despejar el valor del estimador * x que separar
las zonas de aceptacin y rechazo de la hiptesis nula:

0
* *. x z
n

= +

Conocido el valor critico, se pueden establecer las siguientes reglas de decisin:

0
0
*
*
Si x x
Si x x

>
se rechaza H
no se rechaza H



92
Cuando se elige una determinada prueba para una hiptesis estadstica, las reglas de
decisin deben ser formuladas de manera tal que indiquen claramente cundo los
datos experimentales son consistentes con la hiptesis nula y cundo no lo son.

En este caso particular, donde se est hablando de probar hiptesis con respecto al
parmetro media poblacional , las reglas de decisin deben sealar un rango de
valores para x (media muestral) para los cuales la decisin sea rechazar H
0
.

La hiptesis alternativa determina la localizacin de la regin de rechazo de H
0
y el
nivel de significacin el tamao de dicha regin.


En nuestro ejemplo, para poder calcular el valor crtico, el organismo a cargo de
la investigacin decide tomar una muestra de n = 40 precipitaciones. En cada una
mide el pH y obtiene un promedio x = 3.7. Supongamos, a efectos del desarrollo
de este ejemplo, que se conoce la desviacin estndar poblacional y que sta es
igual a 0.5.

Si el investigador decide aceptar equivocarse en no ms del 5% de las veces al
tomar una decisin de rechazar la hiptesis nula cuando es cierta, = 0.05.

Para determinar el valor crtico que separa las zonas de rechazo y no rechazo de
H
0
se debe encontrar el valor de z que acumula el 0.05 de probabilidad. Si vamos
a la tabla de probabilidades normales, encontraremos que ese valor de z es
1.645.

Entonces:
0.5
* 1.645. 5.7 0.13 5.7 5.57
40
x = + = + =

Conocido este valor crtico, se pueden establecer las siguientes reglas de decisin:

0
0
x 5.57 H
x > 5.57 H
Si
Si
se rechaza
no se rechaza


Como el valor de la media muestral x = 3.7 cae en la zona de rechazo de H
0
, el
organismo encargado de la investigacin decidir rechazar la hiptesis nula a favor
de la hiptesis alternativa. Se concluye que el ambiente presenta un contaminante
producido por la lluvia cida.

Existe otra manera de determinar las zonas de rechazo y de no rechazo de la
hiptesis nula, consistente en comparar directamente los valores estandarizados
con el z crtico. Por ejemplo, se tiene el valor de z* = -1.645 como z crtico. Si
llamamos z observado al valor de x estandarizado, las reglas de decisin sern:

Si z z* se rechaza H
0

Si z > z* no se rechaza H
0

El valor de z observado es:
0
3.7 5.7
25
0.5
40
x
z
n


= = =

Como -25 < -1.645, la decisin en este caso es obviamente la misma que result
con el mtodo planteado anteriormente: rechazar H
0
.



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

93
Antes de continuar con los diversos casos de pruebas de hiptesis, comenta-
mos un elemento que se utiliza cuando los problemas se resuelven utilizando
un paquete estadstico (con la computadora) y resulta muy til para tomar las
decisiones en las pruebas de hiptesis, nos referimos al uso del nivel crtico,
valor p o valor de significacin.

A partir de las posibilidades que brinda la utilizacin de los paquetes estadsticos, suele
utilizarse el llamado nivel crtico p, que proporciona una informacin interesante
acerca de la verdadera probabilidad de cometer el error de tipo I cuando se realiza una
prueba de hiptesis. Su clculo exacto es complicado y a veces imposible de realizar
a mano, ya que no se dispone en general de las tablas necesarias, pero los
programas de los paquetes estadsticos tienen incluidas las posibilidades de calcular
las integrales de las funciones en todos los casos, y por ello proporcionan este valor
exacto. De qu se trata? El valor p se define como la probabilidad de obtener una
discrepancia mayor o igual que la observada en la muestra cuando se cumple H
0
.

Esta medida de discrepancia, en general puede definirse como:

i
d

=

Es decir, se trata del clculo del valor observado del estadstico para una muestra en
particular, y tiene una distribucin de probabilidad conocida
2/
.

La medida de discrepancia depende de la direccin de la hiptesis alternativa. Si la
prueba de hiptesis es bilateral, no se considera el signo de la desviacin que se
produce entre el estimador y el parmetro especificado en la hiptesis nula.

Si la prueba es unilateral se debe tener en cuenta si la direccin de la hiptesis nula es
hacia la izquierda o hacia la derecha de la distribucin de probabilidad utilizada.

Si denominamos

d al valor observado de la discrepancia, se tiene:



0

( / ) p P d d H =

Es decir, p es la probabilidad de obtener una discrepancia igual o mayor a la observada
en la muestra. Se trata de la probabilidad de las colas (si la prueba es bilateral); o
la cola (si es unilateral) que ocurran valores iguales o superiores al observado.

Este valor de p debe compararse con el que el investigador est dispuesto a
aceptar. Si p es menor que , entonces debemos rechazar la H
0
., de lo contrario no
podemos rechazarla. Dicho de otro modo, cuanto menor sea p, menor es la
probabilidad de aparicin de una discrepancia como la observada y menor ser la
credibilidad de H
0
.


En el ejemplo que estamos desarrollando, como se trata de un estadstico con
distribucin normal, sera posible calcular el valor exacto de p (valor de signifi-
cacin). Este es:

P(z < -25) = 1 F(25) = 1 1= 0


2/
Si la distribucin del estadstico es normal, es posible calcular las probabilidades de cualquier
discrepancia observada, pero si tiene otra distribucin, no existen tablas completas para
hacerlo. Se sugiere que usted revise las tablas de la t, la F o
2
y advertir que no puede
calcular las probabilidades para cualquier valor, sino slo para los que estn tabulados.

94

Ello significa que hay una probabilidad prcticamente nula de obtener una
discrepancia como la observada (o mayor), si la
0
H fuera verdadera, esto es si el
nivel de pH fuera 5,7.

Al llegar a la conclusin que el pH no es 5.7, el investigador puede efectuar una
estimacin por intervalos para averiguar cul es el verdadero pH en la poblacin
total de precipitaciones.

Si se construye este intervalo, se tiene:

0.5 0.5
(3.7 1.96 3.7 1.96 ) 0.95
40 40
P + =

Realizando los clculos, encontramos que el valor promedio del pH en la poblacin
es un valor comprendido entre 3.55 y 3.85 con un 95% de confianza.

El valor del pH estimado es muy inferior al planteado en la hiptesis nula por lo
que puede concluirse que la contaminacin por lluvia cida es muy importante.


Si hubiramos tenido en test unilateral derecho, las hiptesis planteadas habran
sido:

H
0
)
0
H
1
) >
0


En esta situacin, la regin de rechazo de la hiptesis nula estar a la derecha de
la distribucin.

Tambin se puede plantear una hiptesis bilateral de la siguiente manera:

H
0
) =
0
H
1
)
0


En este caso se tienen dos zonas de rechazo de la hiptesis nula, una a la
izquierda y otra a la derecha de la distribucin, cada una con una probabilidad
/2.

Las reglas de decisin para una prueba bilateral seran:

1 2 0
1 2 0
x x * o x x * H
x * x < x * H
Si
Si

<
se rechaza
no se rechaza


El tamao de cada cola de la distribucin (zonas de rechazo de la hiptesis nula),
es igual a la mitad del nivel de significacin .


4.1.2. Varianza poblacional desconocida, poblaciones normales y no normales

Cuando la varianza poblacional es desconocida, como se explic en el Captulo I, el
estadstico con distribucin normal no puede usarse. Ese caso es el ms frecuente en
las aplicaciones prcticas, ya que resulta casi imposible suponer que se conoce la
varianza poblacional cuando se desconoce la media.

Si la poblacin es normal, el estadstico adecuado para probar hiptesis acerca de la
media poblacional es:

0
1 n
X
S n
t

(1)



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

95
Si la poblacin no es normal, ese estadstico no podra ser utilizado, ya que la t
requiere que la poblacin sea normal. Pero, empricamente puede comprobarse que
para muestras de tamao 100 o mayor, si la poblacin no es normal, la aproximacin
del estadstico a la normal es buena.

Resumiendo: si la varianza poblacional es desconocida, y

la poblacin es normal, se utiliza el estadstico t para cualquier tamao de
muestra (por la aproximacin de la t a la normal, cuando los grados de libertad
son mayores a 40 puede recurrirse a aproximaciones, interpolaciones, o a la tabla
de la normal),
la poblacin no es normal, puede usarse el estadstico (1) con distribucin
normal slo si n > 100. De lo contrario hay que recurrir a pruebas no
paramtricas, que se presentan en otro captulo de esta materia.

Actualmente, en la mayora de las situaciones que el investigador debe enfrentar,
resuelve los problemas de pruebas de hiptesis con el auxilio de programas especficos
de computacin. Para que Uds. se habiten a la lectura de los resultados que
proporcionan estos programas, desarrollamos un problema donde se efecta el test de
hiptesis para la media utilizando un programa de computacin pertinente.

Veamos ahora algunos casos en que se supone poblacin normal; no importa
cul sea el tamao muestral, se utiliza la distribucin t (estadstico 1).


Los siguientes datos se refieren a salarios de 36 empleados de una fbrica
seleccionados aleatoriamente del archivo de empleados:

Empleado Salario Empleado Salario Empleado Salario
1 735 13 694 25 594
2 550 14 482 26 839
3 590 15 456 27 604
4 892 16 419 28 454
5 398 17 671 29 441
6 493 18 983 30 513
7 458 19 659 31 801
8 684 20 534 32 895
9 781 21 419 33 945
10 644 22 532 34 617
11 526 23 507 35 539
12 578 24 592 36 407

De acuerdo con informaciones del INDEC (Instituto Nacional de Estadstica y
Censos), el salario promedio en la ciudad de Crdoba es de 490$. Se puede
pensar que esta hiptesis es consistente con el salario recibido por los empleados
de esta fbrica?

Las hiptesis planteadas son:

H
0
) = 490 H
1
) 490

En la siguiente salida de computacin se observa una estadstica descriptiva de la
variable en estudio donde se presenta el tamao de la muestra n, la media
muestral, la desviacin estndar muestral y el error estndar de la media ( / ). s n
Estadsticos para una muestra
36 609,0556 160,73384 26,78897 Salario
n Media
Desviacin
estandar
Error estandar
de la media





96

En la siguiente salida, el valor de prueba es el valor establecido para el parmetro
salario promedio poblacional en la hiptesis nula, o sea
0
. Tambin se da el valor
de t observado calculado como
0
609.06 490
4.444
26.79 /
x
t
s n

= = = .

A continuacin se da el valor de significacin exacto p = 0,044. Este valor es
inferior al 0,05. Como se puede observar, la probabilidad de obtener un promedio
en la muestra de $ 609 tiene una muy baja probabilidad de ocurrir si en realidad la
hiptesis nula es verdadera. Por lo tanto, se decide rechazar la hiptesis nula. Los
empleados de esta fbrica ganan en promedio ms que la media establecida para
toda la provincia de Crdoba.




A continuacin se ve un grfico de probabilidad normal, (ya estudiado en
Estadstica I), por medio del cual se puede visualizar si la distribucin de la
variable salarios es normal. Existen algunos valores atpicos de salarios bajos pero
podemos ver que la distribucin es bastante normal. Si la distribucin es normal,
entonces podemos utilizar el estadstico (1) con cualquier tamao muestral

Grafico de normalidad de la
variable salario
Valor observado
1000 800 600 400 200
V
a
l
o
r

N
o
r
m
a
l

e
s
p
e
r
a
d
o
1000
900
800
700
600
500
400
300
200



Esta visualizacin de la distribucin de frecuencias, para saber si la poblacin es
o no es normal se completa con un test de hiptesis denominado de normalidad y
que se debe a Kolmogorov y Smirnov. Este test pertenece a los denominados tests
no paramtricos que se estudiarn en el Captulo VI.

Prueba para una muestra
4.444 35 ,044 Salario
t gl Sig. (bilateral)
Valor de prueba = 490



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

97

Las hiptesis que se plantean en esta prueba son:

H
0
) La distribucin de los salarios es normal.

H
1
) La distribucin de los salarios no es normal.

Los resultados de la aplicacin de este test son los siguientes:
Prueba de Kolmogorov-Smirnov para una muestra
36
609,0556
160,73384
,124
,124
-,095
,742
,641
n
Media
Desviacin tpica
Parmetros normales
a,b
Absoluta
Positiva
Negativa
Diferencias ms extremas
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
Salario
La distribucin de contraste es la Normal.
a.
Se han calculado a partir de los datos.
b.


La medida de discrepancia en este test es de 0.742 con un valor de significa-
cin p = 0.641. Como este valor p es muy elevado, (mayor que cualquier que
tengamos en mente, existe una alta probabilidad que esta medida de discre-
pancia ocurra cuando se cumple la hiptesis nula; por lo cual no la rechaza, con-
cluyendo que la distribucin de los salarios en la poblacin puede considerarse
normal.

Para determinar el verdadero valor del salario promedio de empleados de esta
fbrica se estim el mismo por medio de un intervalo de confianza: (utilizamos el
valor z en lugar de t porque los grados de libertad son mayores que 30; hay poca
diferencia entre uno y otro, y adems no se encuentran tabulados todos los
valores de t para ms de 30 grados de libertad; tambin podra utilizarse algn t
cercano a 35 grados de libertad).

[ ]
609.06 1.96 26.79
609.06 52.5
556.56 ; 661.52
x



El verdadero valor del salario promedio de los empleados de esta fbrica es un
valor comprendido en el intervalo establecido, con una confianza del 95%.


Veamos ahora otros ejemplos, tambin usando el estadstico (1)


Supongamos que el Departamento de Control de Calidad de una fbrica de
televisores asegura que, de acuerdo al plan implementado, los televisores no
deben fallar hasta los tres aos de uso.

El Departamento de Comercializacin, con el objetivo de corroborar esta afirma-
cin, lleva a cabo una encuesta dirigida a compradores del producto con ms de 3
aos de antigedad. Una de las preguntas estaba referida a cundo requiri por
primera vez asistencia tcnica por falla del aparato.

98

Las respuestas obtenidas (tiempo desde que compr el aparato hasta que registr
la primera asistencia tcnica en aos), en una muestra de 20 compradores, fueron
las siguientes:

2.5 3.1 2.8 3.5 4.8 3.9 2.6 4.0 3.8 3.2
3.8 2.3 3.1 4.1 3.8 3.0 3.4 4.1 2.6 3.0

En base a esta evidencia proporcionada por la muestra, el Departamento de
Comercializacin desea saber si es lcito seguir publicitando que los aparatos no
registran fallas hasta despus de 3 aos de ser utilizados.

Las hiptesis planteadas fueron:

H
0
) 3 aos

H
1
) > 3 aos

El estimador adecuado para efectuar el correspondiente test de hiptesis es
tambin la media de la muestra que en este caso es:

3.37 x aos =

La varianza del tiempo transcurrido hasta la primera asistencia tcnica fue
s
2
= 0.4327 y la correspondiente desviacin estndar muestral es de 0.66 aos.

Como ocurre generalmente en la prctica, es imposible calcular la varianza del
tiempo transcurrido entre la compra del televisor y su primer pedido de asistencia
en la poblacin de televisores vendidos por la empresa. Por este motivo, la nica
medida de variabilidad es la correspondiente a la muestra de 20 televisores.

Tambin en este caso nos encontramos con el problema que, en lugar de aparecer
la desviacin estndar poblacional , nos encontramos con su estimador muestral
insesgado s. Como ya hemos visto, este estadstico se distribuye como una t de
Student con n 1 grados de libertad.

En nuestro ejemplo, la hiptesis alternativa establecida determina una prueba
unilateral derecha por lo cual la zona de rechazo de la hiptesis nula estar en la
cola derecha de la distribucin t de Student.

Grficamente, tendremos:


El paso siguiente consiste en determinar un nivel de significacin que podra
ser 0.05.





Ctedra I Estadstica II
Autor I Hebe Goldenhersch

99

Estableciendo el criterio de test como:

0
1
( * )
n
x
t t
s
n

=


De aqu se puede despejar el valor de * x que es:

0
*
s
x t
n
= +


La regla de decisin ser, entonces:

Si el promedio de tiempo transcurrido desde la compra del televisor hasta que se
produce su primera asistencia tcnica, calculado en la muestra de 20 televisores
es mayor a * x , se rechazar la hiptesis nula; en caso contrario se concluir que
no existe una evidencia muestral contundente para rechazarla.

En el ejemplo, se tiene una variable t con 19 grados de libertad cuyo valor que es
el que acumula el 0.95 de probabilidad, es t
19;0.95
= 1.729.

Calculamos, entonces, el valor crtico:

0.66
3 1.729 3 0.26 3.26
20
* x = + = + =

La media en la muestra de televisores fue de 3.37 aos. Como este valor es
superior a 3.26, se rechaza la hiptesis nula.

El valor de la media muestral cae en la zona de rechazo de la hiptesis nula por lo
cual llegamos a la conclusin de que el tiempo promedio hasta que solicita
asistencia tcnica por primera vez, es superior a 3 aos. Por ello, el Departamento
de Comercializacin podr seguir publicitando la duracin de los productos de la
fbrica.

Cuando se rechaza la hiptesis nula, se puede estar interesado en estimar el
verdadero valor del parmetro poblacional, en este caso = tiempo promedio
hasta que se solicita asistencia tcnica por primera vez.

Para ello se efecta una estimacin por intervalos que, en este caso, ser:

0.95
s s
P x t x t
n n


+ =




0 . 6 6 0 . 6 6
3 . 3 7 2 . 0 9 3 3 . 3 7 2 . 0 9 3 0 . 9 5
4 . 4 7 4 . 4 7
P

+ =




El valor de t es ahora el que acumula el 0.975 de probabilidad.

Efectuando convenientemente los clculos, se tiene:

P(3.37 0.31 3.37 + 0.31) = 0.95

3.06 3.68

De acuerdo a la informacin proporcionada por la muestra, el tiempo promedio
hasta que se requiere asistencia tcnica es un valor comprendido en este intervalo
y esto se dice con un 95% de confianza.

100

A continuacin damos un ejemplo que ha sido resuelto por medio del programa de
computacin (SPSS).

Los siguientes datos se refieren a la antigedad (en aos), los salarios mensuales
percibidos y el sexo de empleados de una empresa:

Antigedad Salario Sexo
40.00 585.00 1.00
35.00 2066.00 1.00
20.00 838.00 1.00
30.00 502.00 2.00
31.00 269.00 2.00
41.00 537.00 2.00
22.00 1279.00 1.00
10.00 470.00 1.00
14.00 475.00 1.00
20.00 568.00 2.00
39.00 549.00 2.00
14.00 541.00 2.00
20.00 739.00 1.00
33.00 1007.00 1.00
39.00 857.00 2.00

Sexo: 1.- Varn 2.- Mujer

Estadistica descriptiva calculada en la muestra
15 23.600000 8.575713215 2.2142396 Antiguedad
n Media Desviacin tp.
Error tp.
de la media


En esta tabla aparece la media muestral ( x ), la desviacin estndar muestral (s)
y el error estndar muestral ( / ) s n .

Las hiptesis planteadas para el parmetro promedio de antigedad son las
siguientes:

H
0
) = 25 H
1
) 25

El resultado de la prueba se presenta en la siguiente tabla:

Prueba para una muestra
,803 14 ,435 Antiguedad
t gl Sig. (bilateral)
Valor de prueba = 25


El valor de p es 0.435. Si lo comparamos con = 0.05, estamos en la situacin de
que p > 0.05, por lo cual se toma la decisin de no rechazar la hiptesis nula.
La antigedad promedio de todos los empleados de esa empresa es de 25 aos.




Ctedra I Estadstica II
Autor I Hebe Goldenhersch

101

Plot normal de la variable antiguedad
Valor observado
50 40 30 20 10 0
V
a
l
o
r

N
o
r
m
a
l

e
s
p
e
r
a
d
o
40
30
20
10
0


Prueba de Kolmogorov-Smirnov para una muestra
15
23.60000000
8.575713215
.174
.174
-.106
.674
.754
n
Media
Desviacin tpica
Parmetros normales
Absoluta
Positiva
Negativa
Diferencias ms extremas
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
ANTIGUED


Analizando el normal plot, se observa que los valores del grficos oscilan bastante
cerca de la lnea trazada por lo cual se puede pensar que la variable antigedad se
distribuye normalmente. Esta situacin es luego corroborada por el test de
normalidad de Kolmogorov para una muestra (p = 0.745), tambin mayor que
0.05.

15 N =
A
n
t
i
g
u
e
d
a
d
50
40
30
20
10
0



En el correspondiente box plot no se observa la presencia de valores atpicos.



102

A continuacin realizamos una prueba de hiptesis para el parmetro salario
promedio. Las hiptesis planteadas son:

H
0
) = 500 H
1
) 500

Estadsticos para una muestra
15 752,1333 441,88571 114,09440 Salario
N Media Desviacin tp.
Error tp.
de la media




En este caso, se observa un valor de p = 0.04 que si lo comparamos con = 0.05,
al ser este menor, se toma la decisin de rechazar la hiptesis nula. El salario
promedio de los empleados de la empresa no es 500$. En este caso se debe
calcular una estimacin por intervalos para ver por dnde anda el valor del salario
promedio en la poblacin.

Normal plot para la variable salario
Valor observado
3000 2000 1000 0 -1000
V
a
l
o
r

N
o
r
m
a
l

e
s
p
e
r
a
d
o
1600
1400
1200
1000
800
600
400
200
0
-200



En el normal plot pareciera que la distribucin se alejan de la normal pero si se
observa la prueba de Kolmogorov que se presenta a continuacin, aparece un
p = 0.318 > 0.05, por lo cual no se rechaza la normalidad de la variable en
estudio.




Prueba para una muestra
2,210 14 ,044 Salario
t gl Sig. (bilateral)
Valor de prueba = 500



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

103

Prueba de Kolmogorov-Smirnov para una muestra
15
752,1333
441,88571
,247
,247
-,195
,958
,318
n
Media
Desviacin tpica
Parmetros normales
Absoluta
Positiva
Negativa
Diferencias ms extremas
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
VAR00002


Existe un valor atpico para la variable salario: una persona que gana 2066$.

A continuacin se presentan algunas actividades para que practiquen los
conceptos aprendidos.



Actividad 1:
El gerente de un Banco local ha informado al Directorio que las ltimas
medidas econmicas implementadas, que restringen el retiro de fondos de los
bancos, ha generado un movimiento mayor en los cajeros automticos. Hasta
ahora sus clientes utilizaban los mismos a un promedio de 6 operaciones
mensuales. Seleccionando a 130 clientes de su base de datos se encontr:

Estadstica descriptiva

N 130
x 8.68
Varianza 4.12
Error estndar de la media 0.18
Valor mnimo 4
Valor mximo 14
Mediana 9
Suma 1129

a) Es razonable lo informado por el gerente? Trabaje con = 0,01.
b) Cul es la verdadera cantidad promedio de extracciones mensuales que
ahora realizan sus clientes? Trabaje con (1-) = 0,99.

Actividad 2:
La Facultad de Ciencias Econmicas viene afirmando que la duracin de la
carrera de Contador Pblico es de 8.5 aos con una desviacin estndar de 2.6
aos. Luego de haber implementado distintas medidas a fin de mejorar este
valor, decide evaluarlas. Para ello selecciona aleatoriamente 40 legajos de
egresados en la ltima colacin encontrando los siguientes datos:




Actividades de Aprendizaje

104
Duracin
Media 7,007
Error tpico 0,242
Mediana 6,940
Desviacin estndar 1,534
Varianza de la muestra 2,352
Curtosis -0,622
Coeficiente de asimetra 0,391
Rango 5,990
Mnimo 4,480
Mximo 10,470
Suma 280,260
N 40,000

Puede la Facultad decir que las medidas implementadas han sido efectivas a
un nivel de 10%?

Actividad 3:
Los mosaicos producidos por una fbrica de la ciudad de Crdoba poseen una
resistencia media a la ruptura de 80 Kg. con una desviacin estndar de 15
Kg. El gerente de produccin propone un nuevo mtodo para fabricar los
mosaicos, sosteniendo que el mismo aumenta la resistencia a la ruptura.

Para evaluar esta afirmacin se someten a prueba de resistencia mosaicos
fabricados con el nuevo mtodo, con el siguiente resultado:

Estadstica descriptiva

Resumen Resistencia
N 32
Media 107,22
Var(n-1) 223,66
E.E. 2,64
Mn. 68,12
Mx. 131,30
Mediana 107,51

a) Es correcta la afirmacin del gerente a un nivel del 1%?

Actividad 4:
El Balance General de una S.A., que posee 200 deudores, arroja para el rubro
Otros Crditos un total de $ 3.500.000. El directorio contrata un auditor externo
ya que considera que el saldo promedio de dicha cuenta no es el que refleja la
contabilidad. Se envan circulares a 49 deudores elegidos aleatoria- mente, los
cuales confirmaron adeudar un total de $ 870.000. Se conoce que la varianza
poblacional es 300.000 pesos
2
. A un nivel del 5%, es confiable la cifra que
muestra el balance?

Actividad 5:
Un envasador de gaseosas dice que la cantidad promedio de bebida en sus
botellas de 1 litro es de 1.08. La Oficina de Defensa al Consumidor ha recibido
numerosos reclamos de clientes que afirman que el contenido es menor que 1
litro. Para poder responder a estas quejas, la Oficina Estatal decide llevar a
cabo una prueba de hiptesis. Explique el significado del error tipo I, eligiendo
una de las siguientes alternativas:
1. Concluir que = 1 litro cuando realmente 1
2. Concluir que < 1 litro cuando en realidad 1
3. Concluir que = 1 litro cuando realmente < 1
4. Concluir que < 1 litro cuando en realidad < 1



Ctedra I Estadstica II
Autor I Hebe Goldenhersch

105

S-ar putea să vă placă și