Sunteți pe pagina 1din 5

PRUEBAS DE HIPÓTESIS

Guillermo Correa L.

Puesto que en la práctica los parámetros poblacionales siempre son desconocidos, es necesario
plantear y responder preguntas que permitan al investigador tener la mejor aproximación posible
a los mismos. En adición a la estimación puntual o por intervalos, el investigador puede plantear
juegos de hipótesis que consideren dos regiones mutuamente excluyentes y complementarias
para el parámetro de interés. Así, por ejemplo, si se está adelantando un estudio, uno de cuyos
objetivos sea evaluar el rendimiento de un proceso químico. El investigador podría definir las dos
regiones siguientes: rendimiento ≥ 50 g; rendimiento < 50 g. El límite de tales regiones se definirá
acorde con los objetivos del estudio.

Las herramientas de la estimación (estimación puntual, intervalos de confianza) brindan


información en estudios de diagnóstico en los que se sabe muy poco sobre los parámetros
estudiados. Son preguntas de tipo general: ¿en qué sector es más probable que esté el
parámetro? ¿Con base en la información muestral, cuál sería la mejor apuesta que podría hacerse
sobre el valor del parámetro poblacional?

Las hipótesis estadísticas permiten responder preguntas dirigidas, las cuales surgen usualmente en
estudios de tipo confirmatorio, en los cuales se tiene un mayor conocimiento del fenómeno
estudiado. Este mayor conocimiento permite plantear hipótesis específicas sobre el parámetro
(Por ejemplo: el rendimiento de reacción es 40 g). La información muestral puede respaldar
algunas de las hipótesis y constituir un argumento en contra de otras.

En la práctica investigativa, son mucho más utilizadas las herramientas asociadas con las pruebas
de hipótesis que las que tienen que ver con estimación. No obstante, el uso de una u otra
herramienta dependerá de los objetivos específicos de la investigación. Y en no pocas ocasiones
estos dos enfoques de la inferencia estadística resultan complementarios.

Hipótesis Estadística. Una hipótesis estadística consta de un par de afirmaciones mutuamente


excluyentes y complementarias acerca de la distribución probabilística de una o más variables
aleatorias o acerca de algún parámetro de una función de probabilidad dada.

Las pruebas de hipótesis clásicas (o fisherianas, en contraste con las bayesianas) se basan en la
modelación probabilística de las variables de campo mediante distribuciones probabilísticas
determinadas (casi siempre la normal). Las pruebas pueden enfocarse en evaluar lo adecuado o
inadecuado de modelar una variable de campo mediante una distribución probabilística dada
(Pruebas de bondad de ajuste. Normalmente se realizan como preliminares de las pruebas de
interés central), o pueden enfocarse en algún parámetro específico de la distribución
probabilística utilizada como modelo. En cualquiera de los dos casos, se habla de pruebas
paramétricas.
En contraste con las pruebas anteriores (las más populares), existe otro grupo de pruebas que no
parten de la modelación de las variables de campo mediante una distribución probabilística
específica. En consecuencia, las hipótesis no se realizan sobre parámetros específicos de las
distribuciones modelo. Este grupo de técnicas se denominan no paramétricas.

Las pruebas no paramétricas tienen la ventaja sobre las paramétricas de ser más flexibles,
pudiendo aplicarse a variables medidas en escalas más débiles (variables ordinales). No obstante,
cuando la muestra está constituida por variables medidas en una escala fuerte (numérica), las
pruebas paramétricas son más potentes.

Este curso está centrado en la Estadística Paramétrica.

Prueba de Hipótesis. Método que permite dictaminar sobre la plausibilidad de una u otra opción
en una hipótesis estadística, usando la información muestral como guía.

El seguimiento del método en cuestión no garantiza la certeza del dictamen. Para ello sería
necesario examinar la totalidad de la población... pero en tal caso, no habría lugar a inferencia
estadística alguna (¿Es evidente por qué? Revisa la definición de inferencia estadística).

Ejemplo: En el interior de una bolsa hay 5 fichas totalmente indistinguibles al tacto. Lo único que
las diferencia es un número marcado en cada una de ellas.
Una gitana afirma que su capacidad para adivinar el número de la ficha es superior al de una
persona común.

Para probar la afirmación de la gitana, se realiza un experimento: se le permite extraer una ficha,
anunciando previamente el resultado.

Para los fines que nos interesan el espacio muestral del experimento puede dividirse en dos
regiones: acierta; no acierta. Definido de esta manera, el experimento planteado es de tipo
Bernoulli, donde:

Éxito: Acierta
Fracaso: No acierta

X ∼ Bernoulli ( p )

Para contrastar la afirmación de la gitana, es necesario establecer un referente. ¿Cuál es la


probabilidad de que una persona cualquiera adivine el número de una ficha?

1
Aplicando definición clásica de probabilidad, se tiene que: p = = 0.2 .
5

La afirmación de la gitana puede expresarse en términos probabilísticos como que su p>0.2.

El correspondiente juego de hipótesis está compuesto por las dos hipótesis siguientes:

H0: p≤0.2 (No tiene una capacidad superior a la normal)


Ha: p>0.2 (Tiene una capacidad extraordinaria)

La hipótesis nula es la que incluye la igualdad. Esta hipótesis siempre hace referencia a la nulidad
de efectos (no tiene capacidad superior a la normal, no difiere del referente, etc.). La hipótesis
alternativa es la que el investigador usualmente desea probar. Consiste en la negación y
complemento de la hipótesis nula.
Una regla de decisión intuitiva para dictaminar sobre el resultado del experimento podría ser
respaldar la hipótesis alternativa si la gitana adivina; respaldar la hipótesis nula en caso contrario.

Nótese que aunque esta pueda ser la mejor regla de decisión basada en los resultados del
experimento planteado, existe la posibilidad de errar, cualquiera que sea el resultado.

Esta es una característica fundamental de la inferencia estadística: “Siempre hay probabilidad de


errar al hacer una afirmación estadística”.

Podría parecer, entonces, que la estadística no resulta de ninguna utilidad y que da igual hacer una
afirmación estadística que una afirmación profana sin el seguimiento de ningún protocolo. Esto,
sin embargo, no es así: Al hacer una afirmación estadística, si bien existe una probabilidad de
error, esta es cuantificable, y siempre se establecen reglas que permitan minimizar tal
probabilidad.

En el ejemplo planteado podría obtenerse la probabilidad de errar al tomar una decisión basada
en la regla propuesta (¡Obténgala!).

Cuando la información muestral registrada para contrastar el juego de hipótesis no apoya la


hipótesis nula, esta hipótesis se rechaza; en caso contrario, la hipótesis nula no se rechaza.

En muchos textos, al no rechazo de la hipótesis nula se le llama aceptación. Este término ha sido
muy criticado, puesto que es imposible aceptar cualquier postulado por el solo hecho de no existir
argumentos suficientes en su contra.

Considérese el siguiente juego de hipótesis.

H0: Los extraterrestres no existen.


H a: Los extraterrestres sí existen.

La información muestral que daría elementos para apoyar una u otra hipótesis sería la exploración
de los cielos, en busca de señales que respalden la hipótesis alternativa.

Si se encontrara una señal incontrovertible de la existencia de vida extraterrestre, ello permitiría


rechazar la hipótesis nula (rechazar la hipótesis de no existencia) y apoyar la hipótesis alternativa
(la hipótesis de existencia). Si, por el contrario, no se hallara ninguna señal tras muchos años de
paciente observación, ello no constituiría una prueba de la no existencia de vida extraterrestre. Es
en tal sentido que se dice que la ausencia de argumentos para rechazar la hipótesis nula no
constituye un elemento válido para su aceptación. Todo lo que podría decirse es que no se cuenta
con elementos suficientes para rechazar la hipótesis nula. El no rechazo de la hipótesis nula no
tiene carácter de prueba; siempre se trata de una hipótesis temporal que se mantendrá hasta que
surjan elementos que permitan rechazarla.
Situación poblacional, verdadera, pero desconocida

H0 Verdadera (H0) H0 Falsa (Ha)


Error Tipo I Decisión correcta
Decisión basada Rechaza H0 Potencia de la prueba
en la información Máxima probabilidad: α 1-β
muestral Decisión correcta Error Tipo II
No Rechaza H0
1-α β

Error tipo I: Es el error que se comete al rechazar una hipótesis nula que es cierta.

Error tipo II: Es el error que se comete al no rechazar una hipótesis nula que es falsa.

Nivel de Significancia: Es la máxima probabilidad de cometer un error tipo I, esto es, errar al
rechazar una hipótesis nula que es cierta. Esta probabilidad es fijada por el investigador
(obviamente, debe ser baja). Se denota por α.

Pmáx ( Error tipo I ) = Pmáx ( R.H 0 cuando H 0 es verdadera ) = Pmáx ( R.H 0 | H 0 ) = α

P( Error tipo II ) = P( No R.H 0 cuando H 0 es falsa ) = P( No R.H 0 | H a ) = β

P( R.H 0 cuando H 0 es falsa ) = P( R.H 0 | H a ) = 1 − β

A la probabilidad (1-β) se le llama Potencia de la Prueba. Esta probabilidad indica la capacidad que
tiene una prueba para detectar una hipótesis nula falsa y rechazarla. 1-β no es constante para
cualquier situación, sino que es una función del verdadero valor del parámetro en cuestión.

Las probabilidades α y β son interdependientes. Si se es muy exigente en el control de α, se infla β


y viceversa. La única forma de disminuir simultáneamente ambas probabilidades es
incrementando el tamaño de la muestra.

S-ar putea să vă placă și