Sunteți pe pagina 1din 8

La metodologa de las pruebas de hiptesis est estrechamente relacionada con la

de intervalos de confianza y aunque efectivamente se puede verificar una


hiptesis estadstica usando intervalos de confianza, en problemas donde surge la
necesidad de tomar decisiones, es ms natural utilizar la metodologa de pruebas
de hiptesis. En este documento te presento algunas pruebas estadsticas que
pudieran servir para que te des una idea de lo que ser el ejercicio de tu
desempeo como Ingeniero en Gestin Empresarial.
El problema principal a resolver en una prueba de hiptesis es el siguiente: Si se
afirma que el parmetro x tiene cierto valor, cmo decidir que efectivamente el
valor dado es el valor real del parmetro? Para intentar dar respuesta a l, se
presentar una situacin en la cual se realiza un juicio contra un acusado, esto
porque existe gran similitud en cmo se plantea un juicio y el procedimiento de
pruebas de hiptesis1. En los juicios se parte de un principio: la inocencia del
acusado y se procede de manera que el fiscal intenta demostrar la culpabilidad del
acusado. De manera similar, en las investigaciones donde se utilizan pruebas de
hiptesis, se parte de un supuesto bsico: A travs de la hiptesis nula el
investigador trata de recoger informacin con base en una muestra aleatoria, para
poder decidir si rechaza o no la hiptesis nula. En caso de rechazarla se acoge a
otra hiptesis conocida como hiptesis alternativa, ya que ambas son mutuamente
excluyentes.
Ideas de apoyo a la metodologa
Se presenta a continuacin un juicio contra un estudiante, que falta a la clase de
estadstica y se dedica a jugar volados con sus compaeros. El juez est
representado por el profesor y el fiscal y abogado defensor por dos compaeros
de clase del acusado.

El fiscal acusa al estudiante de que roba dinero a sus compaeros


jugando volados con una moneda que est cargada, es decir usa una
moneda para la cual la probabilidad de obtener cara no es igual a la de
obtener sello.

El acusado se declara inocente.

El abogado defensor argumenta que se acusa al estudiante sin tener


prueba; y que hasta que no se demuestre lo contrario, se debe suponer
que la moneda no est cargada y por consiguiente la probabilidad de

1 Presentacin de esta idea fue tomada del libro Matemticas, Azar, Sociedad.
Conceptos bsicos de estadstica. Patricia Ins Perry, Vilma Mara Meza, Felipe
Fernndez y Pedro Gmez. De la editorial Iberoamerica,

obtener cara o sello es igual a , es decir, 0.5. La defensa est


usando el principio de inocencia.

El fiscal seala que va ha demostrar que la moneda est cargada,


utilizando probabilidades y estadstica. Propone que se lance 100 veces
la moneda al aire y contar el nmero de veces que se obtiene cara. El
fiscal est tratando de conseguir pruebas para demostrar la culpabilidad
del acusado.

El abogado defensor protesta, argumentando que por puro azar, podra


ocurrir que todas las veces se obtuviera cara. Como podrs imaginar,
aqu se presenta la posibilidad de tener cuatro conclusiones, en donde
se pueden cometer dos errores graves: Declarar inocente a un culpable,
siendo culpable; declarar culpable a un inocente, siendo inocente y otras
dos opciones correctas: Declara culpable a un culpable siendo culpable
y declara inocente a un inocente en realidad siendo inocente.

El fiscal debate el argumento con el hecho de que la probabilidad de que


eso ocurra si la moneda no est cargada es de elevado a 100 y que
por lo tanto es muy remoto que eso ocurra. Entonces, si se supone la
inocencia del acusado, es decir, si se cree la hiptesis de que en su
moneda, las probabilidades de cara y sello son iguales a y se
realiza el experimento de lanzar cien veces la moneda, la ocurrencia de
una proporcin exagerada de sellos contra caras o viceversa da lugar
a pensar que la moneda est cargada.

La defensa seala que tal hecho no permite demostrar


contundentemente la culpabilidad del acusado ya que en caso de
ocurrencia de una proporcin exagerada de sellos contra caras o
viceversa, por las razones siguientes:

No se ha dicho a partir de qu punto la mayor ocurrencia de caras o sellos se


considera exagerada, pero se puede considerar lo siguiente:
1. Si se asume que la moneda no est cargada, y que al lanzar la moneda
cien veces, siempre se obtiene cara, hecho aunque poco probable, si
puede ocurrir por un alocado azar.
2. El juez considera que dada la validez de los argumento vertidos tanto
por la defensa como por la fiscala se hace necesario establecer antes
del lanzamiento de la moneda un criterio para considerar como muy
exagerado el desequilibrio entre la proporcin de caras y sellos. Para
ello se toma se acuerdan tambin los siguientes puntos:

La defensa seala que si se presenta ese desequilibrio existe el


riego de declarar culpable al acusado siendo inocente.

La fiscala expone que tambin existe la posibilidad de que el


acusado sea culpable y que por puro azar se declare inocente.

El juez determina que a pesar de utilizar la probabilidad y la


estadstica no se puede estar completamente seguros de la
decisin, ya que se pueden cometer los siguientes dos tipos de
errores: Declarar culpable al acusado, siendo realmente inocente
y no declararlo culpable, siendo culpable, como dijimos lneas
arriba.

En todo caso vamos a continuar el juicio determinado un criterio para establecer


a partir de qu punto la moneda del acusado puede considerarse cargada. Es
decir determinar el nmero mnimo y el mximo de caras que pueden ocurrir, a
partir de los cuales se considerar que la moneda est cargada. Reflexionemos en
el mismo sentido de lneas arriba y argumentemos lo conducente en las siguientes
preguntas:
a) Consideran ustedes que si de los cien lanzamientos se obtiene 53 caras,
esto representa suficiente evidencia para concluir que la moneda est
cargada?
b) Y , si se obtienen 55?, o 45?, o 43?, u 80?. Es necesario que
justifiquemos las respuestas.
Antes debemos considerar los siguientes dos criterios para juzgar la legalidad de
la moneda:
Criterio 1: Si salen menos de 40 caras, o, si salen ms de 60 caras, entonces la
moneda est cargada,
Criterio 2: Si salen menos de 35 caras, o si salen ms de 65 caras, entonces la
moneda est cargada.
Cul es la diferencia entre los dos criterios? Con cul de los dos criterios
preferira el acusado que se le juzgue? Argumentemos la respuesta.
Considere los siguientes dos criterios para juzgar la legalidad de la moneda:
Criterio 3: Si salen menos de 35 caras, o si salen ms de 65 caras, entonces la
moneda est cargada.
Criterio 4: Si salen ms de 64 caras, entonces la moneda est cargada.

Cul es la diferencia entre los dos criterios? Si la acusacin est realizada sobre
el hecho de que la moneda est cargada, cul de los dos criterios es ms
adecuado para decidir el juicio? Argumente su respuesta.
De qu estilo debe ser la acusacin para que el criterio 4 resulte adecuado?
Evidentemente desde el punto de vista terico de la probabilidad, si la moneda se
lanza 100 veces al aire se espera obtener 50 caras y 50 sellos. Sin embargo en la
prctica si se obtuvieran 53 caras y 47 sellos, este hecho no dara pie a considerar
que la moneda est cargada y podramos aceptar la diferencia como razonable
entre lo terico y lo experimental, como una consecuencia del azar en el
experimento.
Obviamente por el mismo motivo si al lanzar 100 veces la moneda al aire se
obtienen 47 caras y 53 sellos no se pensara que la moneda est cargada.
Entonces en qu casos tiene sentido sospechar sobre la legalidad de la
moneda? De manera muy ambigua la respuesta sera en aquellos casos en que
el nmero de caras y de sellos sea muy diferente a 50.
Dado que el supuesto es que la moneda puede estar cargada y no que la moneda
puede estar cargada a favor de un determinado resultado, esto se debe reflejar en
el criterio que se va a utilizar. As pues el criterio debe ser planteado de que se
rechazar el supuesto de que la Moneda es legal si se presenta cualquiera de las
dos siguientes situaciones: si se obtienen menos de a caras o si se obtienen ms
de b caras.

Zona de rechazo del


Supuesto de inocencia

Zona de rechazo del


Supuesto de inocencia

50

Evidentemente que los valores de a y b no son nicos, su valor depende de que


tan rgido se quiere que sea el criterio. Entre ms cerca estn a y b al 50, ms
estricto es el criterio con el que se juzga el resultado y hay ms probabilidad de
rechazar de que la moneda no est cargada; por lo tanto hay ms probabilidad de
acoger la hiptesis de que la moneda s est cargada, cuando en realidad podra
ser una moneda legal. Recprocamente, entre ms alejados estn a y b de 50, el
criterio con el que se juzga el resultado de los 100 lanzamientos es ms amplio,
puesto que incluye resultados diferentes de 50, que pueden suceder al azar y no

necesariamente porque la moneda est cargada. La idea es que a y b estn


separados lo necesario para incluir entre ellos una buena proporcin del total de
los resultados posibles y no incluir una baja proporcin de resultados que pueden
ser atpicos.
El esquema siguiente intenta ayudar a aclarar lo anteriormente expresado.
5% del total de las
observaciones

5% del total de las


observaciones

90% del total de las observaciones

50

2.5% del total de las


observaciones

2.5% del total de las


95% del total de las observaciones observaciones
a

50

Para precisar el criterio vamos a suponer que el experimento de lanzar 100 veces
al aire una moneda legal y registrar el nmero de caras obtenidas. Este
experimento se repite una gran cantidad de veces y que la repeticin del
experimento produce una distribucin con las siguientes caractersticas.

La variable, el nmero de caras, toma valores desde 0 hasta 100,

La media de la distribucin es de 50 caras,

La desviacin estndar es de 5 caras,

La distribucin sigue un modelo normal.

Si consideramos que en dos desviaciones estndar alrededor se encuentran


aproximadamente el 95.44% del total de las observaciones, el criterio podra ser el
siguiente: Si se obtienen menos de 40 caras ms de 60 caras en cien
lanzamientos consecutivos de la moneda, se considera que la moneda es ilegal y
por lo tanto deber declarase culpable al acusado.
a) Argumente cmo fueron calculados los valores del criterio.

Zona de resultados cercanos


Resultados de las proporciones ms probables de ocurrir al lanzar una moneda legal

La representacin grfica con el cual se va a juzgar la legalidad de la moneda del


acusado se presenta a continuacin.

Zona de resultados lejanos

Resultados muy poco probables de una moneda legal

Resultados Muy pocos probables de un

Para la toma de decisin del veredicto se lanza la moneda al aire 100 veces y se
observan 66 caras, por lo tanto se determina la culpabilidad del acusado.
b) Son las pruebas contra el acusado contundentes? Argumente su respuesta.
c) Qu errores podra cometer el jurado al tomar una decisin sobre la
acusacin? Considere ambos casos: cuando es declarado culpable y, cuando se
declara que no se encontr evidencia de que es culpable.
d) Explique por qu la probabilidad de obtener 40 menos caras, , 60 ms
caras, suponiendo que la moneda es legal, al lanzar una moneda al aire es de
0.05.
e) Si la norma elegida hubiera sido: Si salen menos de 35 caras , si salen ms de
65 caras, entonces la moneda est cargada, cul hubiera sido el veredicto? qu
probabilidad hay en ese caso de declarar culpable al acusado?
f) Sabiendo que se obtuvieron 62 caras en los cien lanzamientos de la moneda,
construya un intervalo de confianza del 95% que permita decidir acerca de la
culpabilidad de acusado.

g) Suponga que la sospecha hubiera sido: la moneda est cargada a favor de


cara. En este caso, no tendra sentido que el criterio contemplara la posibilidad de
condenar al acusado si hubiera menos de a caras. Suponga entonces que el
criterio fuera: si salen ms de b caras, donde 50 < b < 100, entonces, la moneda
es ilegal. Se quiere que este criterio excluya slo un 5% del total de los resultados
posibles, cul debe ser el valor de b? Argumente su respuesta.

Formalizacin de los conceptos


En el juicio anterior se ha sealado de manera intuitiva los conceptos de hiptesis
nula, hiptesis alternativa y criterios de decisin. A continuacin se formalizan
dichos conceptos y se sealarn los posible errores que se pueden cometer en la
toma de una decisin.
Las hiptesis: En el juicio se present una sospecha acerca de la cual se desea
realizar un investigacin, la cual en Estadstica se conoce como hiptesis de
investigacin. Un principio para juzgar al acusado, en el que se supone que ste
es inocente hasta que se demuestre lo contrario. En Estadstica este supuesto se
conoce como Hiptesis Nula, donde la palabra nula viene de nulidad. Como
siempre existe la posibilidad de tener que rechazar la hiptesis nula, (sta siempre
se enfrenta a la hiptesis conocida como hiptesis alternativa).
Criterio y decisin acerca de la hiptesis nula. As como en el juicio se debe
tomar una decisin sobre declarar culpable o inocente a un acusado, en
Estadstica, si se rechaza una hiptesis nula es porque se encuentran resultados
significativos diferentes a lo que debera ocurrir si la hiptesis nula fuera cierta; el
no rechazo de la hiptesis nula quiere decir que los resultados no fueron
significativamente diferentes de los que se esperaba, bajo la suposicin de que la
hiptesis nula era cierta.
En todo caso, siempre se debe de establecer previamente un criterio para decidir
acerca de la hiptesis nula, por lo cual se requiere determinar la regin de
rechazo de la hiptesis nula.
Consecuencias de una decisin. As como en un juicio existen cuatro
situaciones posibles originadas por la decisin de un jurado que son: declarar
culpable a un culpable, declarar inocente a un inocente, declara culpable a un
inocente y declarar inocente a un culpable. Siendo las dos ultimas decisiones
errneas. Tambin en Estadstica, al rechazar o no una hiptesis nula hay cuatro
situaciones posibles con respecto a la correcta o incorrecta toma de una decisin.

Ahora y despus de lo antes expuesto, complete el cuadro que se presenta a


continuacin, indicando en cada caso si la decisin es correcta o si se comete un
error
Situacin real

De
cis
in

La hiptesis nula es
cierta.

La hiptesis nula no
es cierta

Rechazamos la
Hiptesis nula
No rechazamos la
Hiptesis nula

Al tomar una decisin acerca de una hiptesis nula es posible cometer el error de
rechazarla siendo cierta o aceptarla, siendo falsa. Vean la similitud del juicio
anterior. En el primer caso el investigador puede controlar la probabilidad de
cometer el error, pues es l quien fija el lmite a partir del cual se rechaza la
hiptesis nula. En el segundo caso la situacin es ms complicada pues el
investigador no tiene bajo control ese error, por eso cuando las pruebas no
muestran suficiente evidencia que permita rechazar la hiptesis nula, la conclusin
no es que debe aceptarla, la conclusin es mucho ms dbil; es simplemente no
rechazarla.

S-ar putea să vă placă și