Sunteți pe pagina 1din 5

Ciencia & Tecnologa para la Salud Visual y Ocular Vol. 8, No.

2 / julio - diciembre de 2010

Prueba de hiptesis frente a intervalos de


confianza
Carlos Escalante Angulo*

Resumen

Los valores P, generalmente, 0,05 0,01, que en la muestra la ventaja de los intervalos al comparar la
prueba de hiptesis estadstica se usan para diferen- prueba de hiptesis con la estimacin de intervalos
ciar resultados estadsticamente significativos de los de confianza para inferir la diferencia entre dos pro-
no significativos, se considera de poco valor infor- porciones muestrales.
mativo y prctico cuando el investigador biomdico
y epidemilogo estn interesados en conocer la mag- Palabras clave: valores p, prueba de hiptesis esta-
nitud de un resultado de un estudio. Este artculo dstica, intervalos de confianza, muestra, poblacin.


*
Antroplogo de la Universidad Nacional. Magster en Sociologa. Profesor emrito de la Universidad Nacional y la Universidad de La Salle. Correo
electrnico: caescalante@unisalle.edu.co.
Fecha de recepcin: 10 de enero del 2010
Fecha de aprobacin: 8 de abril del 2010

153
Ciencia & Tecnologa para la Salud Visual y Ocular Vol. 8, No. 1 / enero - junio de 2010

Hypothesis testing versus confidence intervals

Abstract

The p values, generally 0.05 or 0.01, that in the sta- advantage of the intervals to compare the hypothesis
tistical hypothesis test are used to distinguish the test with the interview confidence for inferring the
significant and non-significant statistical results, it difference between two sample proportions.
is considered of few information and few practical
value, when the biomedical researcher and epide- Keywords: p-values, statistical hypothesis testing,
miologist are interesting in knowing the magnitude confidence intervals, sample population.
of a result of study. This communication shows the

154 / Carlos Escalante Angulo


Ciencia & Tecnologa para la Salud Visual y Ocular Vol. 8, No. 1 / enero - junio de 2010

Introduccin Crticas al uso de p

En dcadas pasadas se ha incurrido en conceder ex- Desde hace varias dcadas, las crticas autorizadas
cesiva importancia a las pruebas de hiptesis y a los al uso inapropiado de las pruebas de hiptesis para
valores p asociados a ellas, para determinar si los re- valorar la importancia de los resultados en investi-
sultados de un estudio resultan ser o no ser signifi- gaciones epidemiolgicas y biomdicas han sido re-
cativos. Esto ocurre cuando los investigadores estn currentes. Como marco justificativo de este ensayo
interesados, sobre todo, en la magnitud de las dife- expositivo, he escogido dos de esas crticas, que ex-
rencias, en los grupos comparados en los estudios pongo a continuacin.
analticos, sean stos ensayos clnicos u observacio-
nales. Este excesivo nfasis en el uso de p relega a un Cita 1:
segundo plano las pruebas de estimacin de interva- Adis, p menor del 0,05, equivoco y traicionero compa-
los de confianza a las que se les han venido recono- ero de viaje. Tus efectos colaterales y toxicidad intrace-
ciendo mayor valor informativo y utilidad prctica rebral son demasiado grandes para compensar cualquier
en los estudios clnicos y epidemiolgicos. beneficio que pudieras aportar (Feinstein, 1985).

Es conveniente recordar que el valor p se relaciona Cita 2:


con las pruebas de hiptesis y representa la probabi- Las tpicas aseveraciones p<0,05, P>0,05, o P=NS dan

lidad de que, en una investigacin, un resultado se poca informacin sobre los resultados de un estudio y se
basan en el consenso arbitrario de utilizar el nivel de sig-
deba al azar, cuando en realidad no hay relacin en
nificacin estadstico de 5% para definir los posibles re-
la poblacin entre las variables implicadas por ejem-
sultados: significativo o no significativo. Esto no sirve para
plo, una diferencia de proporciones entre dos gru- nada y, adems, favorece la vagancia intelectual. Incluso
pos. En el proceso inferencial se considera que si el cuando se indica el valor p en concreto, no se proporciona
valor p es menor que alfa el nivel seleccionado por el informacin alguna sobre las diferencias en los grupos es-
investigador, generalmente 0,05 o 0,01 se rechazar tudiados (Gardner Martin., Altman, 1996)1.

la hiptesis nula.
Prueba de hiptesis: z
En esta breve nota expondremos crticas autorizadas
al uso inapropiado de las pruebas de hiptesis y, a 1. Hiptesis nula (Ho). No hay diferencias en mejo-
continuacin, mostraremos en una tabla resultados ra entre los tratamientos A y B. Hiptesis alterna
de un supuesto estudio y lo analizaremos utilizan- (H1): el tratamiento A es ms efectivo.
do sendas pruebas de hiptesis e intervalos de con- 2. Prueba estadstica. Prueba Z para la diferencia
fianza, para mostrar diferencias y virtudes de ambos entre dos proporciones, divida sta por el error
procedimientos estadsticos. La tabla es la siguiente: estndar de la diferencia.

Ejemplo: Resultado: dos muestras independientes

Tratamiento
Respuesta
A B
Con mejora 80 40
Sin mejora 20 60
1
Agradezco al Dr. Juan Manuel Lozano, del Departamento de
Total 100 100 Epidemiologia de la Universidad Javeriana, la gentileza de haberme
proporcionado copia de este articulo.

Prueba de hiptesis versus intervalos de confianza / 155


Ciencia & Tecnologa para la Salud Visual y Ocular Vol. 8, No. 1 / enero - junio de 2010

3. Regla de decisin. Sea alfa 0,05, para que el resul- determinado. Los niveles de confianza (0,90, 0,95,
tado concuerde con 0,95 en que se basa el inter- 0,99) estn definidos por los correspondientes valo-
valo de confianza. res Z (1,64, 1,96, 2,58) que, respectivamente, acom-
4. Valor crtico, 1,96 para la prueba de una cola. Se paan el error estndar de la distribucin muestral
rechaza Ho si el valor observado de Z es mayor de una estadstica. No es ocioso recordar una vez
que 1,96. ms que el error estndar es una medida de la varia-
bilidad del factor estudiado en una distribucin de
Resultado: muestreo, pues se supone de manera implcita que
una sola muestra no sirve para determinar con exac-
titud el valor poblacional. Por lo general, se lo utiliza
en el clculo de los intervalos de confianza.

Decisin estadstica: 6,6 > 1,96, se rechaza Ho. Ahora calcularemos el intervalo de confianza, con
una probabilidad de los 95% para la diferencia de
Puesto que en la tabla no existe el valor p ms cerca- proporciones arriba sealadas, con la siguiente esta-
no a 6,6, se recomienda reportar p < 0,001. Con este dstica de prueba.
nivel de significacin se rechaza Ho y es todo lo que
se suele decir: la diferencia entre las proporciones
es estadsticamente significativa, cuando el objetivo
central de la investigacin es demostrar la magnitud
Expresado en palabras, representa el estimador el
de la diferencia en trminos de mejora entre los dos
nivel de confianza multiplicado por el error estndar
tratamientos. Para observarla hay que recurrir a la
de la diferencia:
estadstica descriptiva, 0,80 - 0,40.

Intervalo de confianza

El lector ya se habr dado cuenta de que la amplitud


Como sabemos, la estimacin es un procedimien-
del intervalo y la precisin de la estimacin depende
to inferencial por medio del cual se llega a inferir
del tamao muestral. Si ste fuera de 200 para cada
los valores poblacionales por medio de los valores
tratamiento, los lmites del intervalo servan 39,25
muestrales. La estimacin se apoya en la suposicin
40,75, menor amplitud, mayor precisin.
de que el investigador tiene inters en los parme-
tros de varias poblaciones, tales como medias, pro-
Una vez ms, la estimacin del parmetro a partir
porciones o diferencia entre medias y proporciones.
de los valores muestrales utiliza el error estndar, de
En los estudios analticos en salud se utiliza la esti-
modo que en muestras repetidas, el 95% de los inter-
macin por intervalos, que consiste en dos valores
valos incluira la diferencia verdadera en la pobla-
numricos que definen un intervalo, el cual contiene
cin. En este ejemplo estara entre 0,26-0,53.
el parmetro bajo estudio con un nivel de confianza

156 / Carlos Escalante Angulo


Ciencia & Tecnologa para la Salud Visual y Ocular Vol. 8, No. 1 / enero - junio de 2010

Referencias
Lpez, L., J.M. & Dennis V., R.J. (2001). Medidas de
Anderson, R.P. (1998). La estadstica razonada: reglas frecuencia, de asociacin y de impacto. En A.
y principios (Cap. 3, 78-79). Barcelona: Paids. Ruiz Morales, C. Gmez Restrepo & D. Londoo
Trujillo (Edits. acadmicos). Investigacin clnica:
Dawson, B. & Trapp, R.O. (2005). Bioestadstica
epidemiologa clnica aplicada (93-109). Bogot:
Mdica (Cap. 6). Bogot: el Manual Moderno.
Centro Editorial Javeriano.
Gardner, M.J. & Althman, D.G. (1986). Confidence
Prieto, V., L. & Herrn, I. (2005). Qu significa
Intervals Rather than P Values; Estimation Rather
Estadsticamente significativo? Madrid: Edicin
than Hypothesis Testing. British Medical Journal,
Daz Santos.
292, 746-750.

Prueba de hiptesis versus intervalos de confianza / 157

S-ar putea să vă placă și