Sunteți pe pagina 1din 49

DESGLOSES

COMENTADOS
que además de decirnos cuántos tienen un resultado positivo, nos dicen
los que estaban verdaderamente enfermos:

Enfermos Sanos
+ 16 6
- 2 88

VPP; verdaderos enfermos (a) / total de positivos (a + b): 16 / 22: 0,727


(respuesta 1, correcta)

P235 MIR 2014-2015

MIR La sensibilidad es la probabilidad de, estando enfermo, tener un resulta-


do positivo en el test; en este caso, 63% (respuesta 5, correcta). Su com-
plementario serán aquellos enfermos que reciben un resultado negativo
en el test; es decir, TFN 37% (respuesta 1, falsa). De igual manera, la TFP
es el complementario a la E; es decir, 5% (respuesta 2, falsa). Si no nos
dan la prevalencia de la enfermedad, no podremos calcular con los datos
aportados los valores predictivos (respuesta 4, falsa). El área bajo la curva

Estadística será de 1 o del 100%, para un test con una S y una E del 100%, algo que
no existe en la práctica clínica, no existe una prueba perfecta.

y epidemiología P189 MIR 2013-2014

Cuando realizamos la validación de un test diagnóstico, al cambiar el va-


lor a partir del cual consideramos “enfermo” a un paciente, cambiamos los

T01 Estudio de un test. Parámetros de uso valores de sensibilidad y especifidad del mismo. En este caso, un valor de
IFG bajo representa una mayor insuficiencia renal; por tanto, si disminui-
mos el valor de corte de 60 a 15, disminuiremos los verdaderos positivos,
P131 MIR 2014-2015 pero también los falsos positivos, es decir, estaremos haciendo el test más
específico. Recuerda que un test específico tiene pocos falsos positivos,
La probabilidad preprueba es la prevalencia, es decir, mide el porcen- y si disminuimos esa cantidad de FP, nuestro test será más especifico. De la mis-
taje global de enfermos en la población o muestra a estudio. Por tanto, ma manera, al “ser más estrictos” para diagnosticar de insuficiencia renal cam-
el parámetro que de forma más exacta y segura permitirá determinar la biando el punto de corte de 60 a 15, aumentaremos los verdaderos negativos
probabilidad preprueba en este caso es la frecuencia de hepatitis A en y también los falsos negativos, lo que convierte el test en uno menos sensible.
el entorno.

P191 MIR 2013-2014


P194 MIR 2014-2015
Un test específico se usa para confirmar enfermedad, ya que tiene pocos
Las pruebas de cribado o screening se realizarán sobre sujetos asintomá- falsos positivos. Si tenemos un tratamiento que causa efectos secunda-
ticos o de manera precoz, por ello se denominan también pruebas de rios importantes y tiene un coste elevado, hay que estar lo más seguro
despistaje o detección precoz. Se puede realizar sobre una enfermedad posible de que el paciente está realmente enfermo. Por eso, entre las
(simple) o varias a la vez (múltiple) y sobre la población general (no selec- opciones, elegiré el test más especifico (prueba A, 60%; prueba B, 99%).
tivo) o subgrupos de alto riesgo (selectivo); por tanto, respuesta 2.

P176 MIR 2012-2013


P195 MIR 2014-2015
El coeficiente Kappa o kappa-cohen mide el nivel de concordancia no aleato-
Pregunta difícil de validación de un test diagnóstico en el que tenemos ria entre varios observadores o entre diferentes observaciones de una misma
que diferenciar que el test a evaluar es la punción con ecografía. No pre- variable cualitativa. Si la prevalencia de una enfermedad es muy alta o muy
guntan por la probabilidad de estar enfermo con un test+; valor predic- baja, la probabilidad de que sean clasificados por los observadores como
tivo positivo. Dan los datos para construir una tabla de contingencia, ya enfermos o sanos respectivamente debido al azar es alta, y como este coefi-
DESGLOSES
COMENTADOS MIR
ciente “elimina” el azar, el coeficiente kappa será bajo en ambos casos. Por un tienen que ver con los valores predictivos y la 5 es la respuesta falsa de
motivo similar se descarta la 4.ª respuesta. La 5.ª opción, parece lógico que si regalo (S y E se relacionan, pero una no predice la otra ni viceversa).
los observadores tienen 5 categorías dónde puedan clasificar su observación,
diferirán en más casos que si sólo la pueden clasificar en 2 categorías.
P191 MIR 2011-2012

P195 MIR 2012-2013 Los valores predictivos son parámetros de validez externa que se mo-
difican por tanto, en función de la prevalencia. En aquellas situaciones
La prevalencia es una medida de frecuencia de la enfermedad, por lo tan- en las que la prevalencia de la enfermedad sea elevada se mejorará el
to si la enfermedad es más frecuente en hombres la prevalencia será más valor predictivo positivo, disminuyendo el valor predictivo negativo. Por
elevada en la población masculina. La sensibilidad y la especificidad de el contrario, en aquellas situaciones de baja prevalencia será más bajo
una prueba son características propias del test y no se ven influenciadas también el VPP y más alto sin embargo el VPN.
por los parámetros de frecuencia. Distinto es lo que ocurre con el VPP y
el VPN que dependen de la prevalencia. Si la prevalencia aumenta, el VPP
aumenta y el VPN disminuye y viceversa. En este caso como la enferme- P192 MIR 2011-2012
dad es menos frecuente en mujeres, en estas la prevalencia es menor y
por lo tanto el VPN de la prueba será mayor. Para contestar a esta pregunta lo mejor es dibujar la tabla 2x2 que te per-
mite situar cada número en su sitio, aunque lo primero es recordar cada
uno de los parámetros que evalúan el rendimiento de una prueba diag-
P196 MIR 2012-2013 nóstica: la sensibilidad nos indica el total de personas enfermas, cuántas
son detectadas como tales por la prueba; la especificidad indica el total
La razón de verosimulitud positiva (o razón de probabilidad positiva) se de personas sanas, cuántas con clasificadas como tales por la prueba; el
calcula dividiendo la probabilidad de un resultado positivo en los pacien- valor predictivo positivo nos dice el total de personas con un resultado
tes enfermos entre la probabilidad de un resultado positivo en los no en- positivo, cuántas tienen de verdad la enfermedad; y el valor predictivo
fermos. Es decir, cuantas veces es más probable encontrar un resultado negativo nos indica el total de personas con un resultado negativo, cuán-
positivo en enfermos que en sanos (respuesta correcta 2). tas están de verdad sanas.

En esta pregunta se nos indica que 8 de cada 10 individuos con una en-
P197 MIR 2012-2013 fermedad crónica presentan una prueba alterada, es decir, nos dicen la
sensibilidad de la prueba (8/10). También nos dicen que 8 de cada 10
Para una prueba de cribado nos interesa sobrediagnosticar, es decir, que no se sanos presentan valores normales en la prueba, lo que hace referencia a
nos escape nadie que tenga la enfermedad. Para ello es necesario una prueba la especificidad (8/10). Además, nos indican cuántas de las personas a las
muy sensible, que todo individuo que tenga la enfermedad nos dé positivo que les aplicamos la prueba sabemos que están enfermas: 20 de los 100
en el test. Pero esto tiene el problema de aumentar los falsos positivos, por individuos. Después de toda esta información, se nos pide que indique-
ello en un segundo tiempo (una vez la prueba de cribado haya dado positiva) mos el valor predictivo positivo.
sería necesario una segunda prueba más específica. Por ejemplo en el criba-
do de cáncer de mama la primera prueba es una mamografía (muy sensible) El valor predictivo positivo se calcula como el total de personas enfermas
y la segunda PAAF, BAG o Biopsia (muy específicas). Para aceptar una prueba con un resultado positivo sobre el total de personas con un resultado po-
como de screening tiene que ir focalizada a detectar una enfermedad pre- sitivo. Como la sensibilidad es 0,8 (8/10) el total de personas enfermas con
valente en la población y que su diagnóstico precoz signifique una ventaja un resultado positivo (verdaderos positivos) será 0,8 multiplicado por 20
en cuanto a posibles tratamientos y supervivencia respeto a un diagnóstico (el 80% de 20), es decir, 16 personas. Ahora nos faltan el resto de resultados
tardío. De nada sirve diagnosticar precozmente si luego no podremos tratar. positivos que serán aquellas personas que están sanas, pero que fueron
Las respuestas 1, 3, 4 y 5 son por tanto correctas y la falsa es la 2. clasificadas como enfermas (falsos positivos). En este caso será 0,2 (1-espe-
cificidad que es 8/10=0,8) multiplicado por 80 personas (100 menos las 20
enfermas), es decir, 16 personas. Si ahora aplicamos la fórmula obtenemos
P198 MIR 2012-2013 (16/[16+16])x100=50%) (verdaderos positivos/[verdaderos postivos + fal-
sos positivos]), por lo que la respuesta correcta es la 2.
La sensibilidad es la probabilidad de clasificar correctamente a un sujeto
enfermo, es decir, la probabilidad de que para un sujeto enfermo se obten- P192 (MIR 11-12)
ga en la prueba un resultado positivo (S= verdaderos positivos/verdaderos Enfermos Sanos
positivos+falsos negativos o todos los verdaderos enfermos). Por ello, si Reultado Alterado 16 16 • 32 • VPP = 16/32
de la
la sensibilidad es del 95%, la única respuesta correcta es la 1, hay un 5% prueba Normal 4 64 • 68 • VPN = 64/68
de falsos negativos, es decir hay un 5% de los enfermos que estará mal
20 20 100
clasificado, un 5% que dará negativo a la prueba pero que realmente será
enfermo). Los falsos positivos (respuesta 2) los encontraríamos calculando Sensibilidad = Especificidad =
16/20 64/80
1-ESPECIFICIDAD ¡no se relacionan con la sensibilidad! Las respuestas 3 y 4

ESTA DÍSTICA Y EPIDEMIOLOGÍA 198


Estadística y epidemiología
P193 MIR 2011-2012 Esto es así porque si hay más casos de esa enfermedad en Inglaterra, la
probabilidad de estar enfermo cuando el test es positivo lógicamente será
La sensibilidad y la especificad de una prueba diagnóstica nos permiten mayor que cuando hay pocos casos. Por ello, la respuesta correcta es la 1.
calcular el total de personas enfermas en las que la prueba es positiva (ver-
daderos positivos; sensibilidad), el total de personas enfermas en las que
la prueba es negativa (falsos negativos; 1-sensibilidad), el total de perso- P189 MIR 2010-2011
nas sanas en las que la prueba es negativa (verdaderos negativos; espe-
cificidad) y el total de personas sanas en las que el resultado es positivo Una pregunta de dificultad moderada, sobre un tema reiterado en el exa-
(falsos positivos; 1-especificidad). La sensibilidad y la especificidad no son men MIR: los parámetros de estudio de un test diagnóstico.
parámetros independientes, sino que cuando uno aumenta, el otro dismi-
nuye. Si, por ejemplo, la especificidad aumenta (como la especificad habla La clave para resolver este tipo de preguntas es identificar el parámetro al
de los sanos, si ésta aumenta, los clasificará mejor por lo que disminuirán que se hace referencia; en este caso la probabilidad de NO padecer la en-
los falsos positivos y aumentarán los verdaderos negativos) la sensibilidad fermedad si la prueba ha sido positiva, que se corresponde con la inversa
disminuye (como la sensibilidad habla de los enfermos, si ésta disminuye, del valor predictivo positivo (1 - VPP). El VPP se define como la proporción
disminuirán los verdaderos positivos y aumentarán los falsos negativos). de verdaderos positivos entre aquellos que han sido identificados como
positivos en una prueba de test, sin embargo en este caso nos preguntan
En esta pregunta se nos pregunta qué pasaría si en lugar de considerar lo opuesto: del total de resultados positivos (VP + FP), ¿qué proporción de
cifras superiores a 20 mmHg para el diagnóstico de glaucoma conside- estos individuos NO van a padecer la enfermedad (FP)?
rásemos cifras de 24 mmHg. El hecho de aumentar el punto de corte a
partir del cual diagnosticas a la persona de glaucoma tiene como resul- FP
= 1 – VPP = 1 – 0,662 = 0,338 = 33,8%
tado que aumentas la especificidad y disminuyes la sensibilidad, es decir, VP + FP
clasificas a una mayor de sanos como sanos (verdaderos negativos) ya
que aquellas personas sanas con cifras entre 20 y 24 mmHg pasan de
ser enfermas (falsos positivos) a ser sanas (verdaderos negativos) y, por La respuesta correcta es la 2. Es importante no confundir este concepto
el contrario, diagnosticas a una menor parte de las personas enfermas con la tasa de falsos positivos (TFP), que sería la probabilidad de obtener
como enfermas (verdaderos positivos) ya que todas aquellas personas un resultado alterado en un individuo que no padece la enfermedad.
que antes tenían diagnóstico de glaucoma y que estaban con cifras entre
20 y 24 mmHg pasan a ser clasificadas como sanas (falsos negativos). Al
revisar las posibles respuestas, la única correcta es la 1, es decir, aumenta P190 MIR 2010-2011
el número de verdaderos negativos ya que aumenta la especificidad y
disminuye la sensibilidad. Los conceptos de sensibilidad y especificidad de un test diagnóstico se
han preguntado en el examen MIR en repetidas ocasiones. Para respon-
der a esta pregunta debemos conocer la definición de sensibilidad, que
P194 MIR 2011-2012 es la probabilidad de que un individuo enfermo (hipertenso), tenga un
resultado positivo en la prueba y, por tanto, sea correctamente identi-
La sensibilidad de una prueba diagnóstica nos proporciona información ficado por el test, tal y como se expone en el enunciado. La respuesta
sobre su capacidad para clasificar de forma correcta a las personas que es- correcta sería la 3, la sensibilidad.
tán enfermas. Es decir, la sensibilidad, nos indica del total de personas que
están enfermas, cuántas son clasificadas como enfermas (personas con re- Las respuestas 1 y 5 se excluyen porque hacen referencia a personas no
sultado positivo de la prueba). Por el contrario, la especificidad nos habla enfermas. La respuesta 4 se refiere a pacientes enfermos que han sido in-
de la capacidad de la prueba para clasificar de forma correcta a las perso- correctamente identificados, por lo que tampoco se ajusta al enunciado
nas sanas, es decir, la especificidad nos indica del total de personas sanas, de la pregunta.
cuántas son clasificadas como sanas (resultado de la prueba negativo).
Pueden surgirnos dudas entre las respuestas 2 y 3. La respuesta 2 se ex-
En esta pregunta la respuesta correcta es la 4, ya que se trata de la defini- cluye porque el VPP se refiere a la proporción de pacientes con un resul-
ción de lo que es la sensibilidad: del total de personas enfermas cuántas tado positivo que son realmente hipertensos.
han sido clasificadas como tales expresado como una proporción.

P192 MIR 2010-2011


P175 MIR 2010-2011
Una pregunta muy difícil que fallaron muchos alumnos, ya que era la pri-
Pregunta típica, sobre un tema preguntado reiteradamente. El concepto mera vez que se preguntaba en el examen MIR el coeficiente de correla-
preguntado es acerca de lo que hace variar los valores predictivos. El VPP ción intraclase.
aumenta con el aumento de la prevalencia, y el VPN disminuye. Y esto es
lo que plantea el enunciado. Si la prevalencia de cáncer de cérvix en In- Nos piden la técnica estadística que analice la concordancia entre dos
glaterra es tres veces superior a la de España, el VPP también será mayor. mediciones del FEV1, es decir, la concordancia para una variable cuan-

199
DESGLOSES
COMENTADOS MIR
titativa. En estos casos, se recurre al coeficiente de correlación intracla- prueba sea útil. Si aumenta la especificidad, se incrementa el número de
se (respuesta 2, correcta). No hay que confundirlo con el coeficiente κ falsos negativos, ya que algunos de estos resultados negativos corres-
(respuesta 3, incorrecta), que se usa para analizar la concordancia de ponderán a enfermos. Pongamos un ejemplo extremo: una prueba que
una variable cualitativa dicotómica (por ejemplo, serviría para estimar siempre diese negativo. Obviamente, esta prueba no serviría para nada,
la concordancia entre dos radiólogos que evalúan una muestra de ma- pero su especificidad sería del 100%, porque todos los sanos tendrían
mografías clasificando el resultado como “normal” o “patológico”, como un resultado negativo en ella. Pero los enfermos también darían nega-
apareció en la pregunta 85 de la convocatoria 1997-1998). tivo (todos ellos serían falsos negativos). Por tanto, lo ideal es encontrar,
en cada prueba diagnóstica, un punto de equilibrio entre sensibilidad y
especificidad.
P195 MIR 2009-2010
No te confundas con la opción 5. El valor predictivo negativo es la pro-
Una de las preguntas más básicas de este examen, al menos en el blo- porción de pacientes sanos entre los que han obtenido un resultado ne-
que de Epidemiología y Estadística. Los valores predictivos positivo y gativo en la prueba.
negativo dependen de la prevalencia. Cuanto más prevalente sea una
enfermedad, más alto será el valor predictivo positivo, porque al ha-
ber más enfermos en esa población, es más probable que la prueba P215 MIR 2008-2009
“acierte” al dar un positivo, es decir, que corresponda a un enfermo. El
aumento de la prevalencia hace que disminuya el valor predictivo ne- Una pregunta muy difícil en apariencia, pero que en realidad puede
gativo, por la misma razón. Al haber menos sanos en ese colectivo, es deducirse. Lo primero que hay que tener claro es el concepto de po-
menos probable que un negativo en la prueba corresponda a un sano tencia o poder estadístico. Representa la capacidad del estudio para
en la realidad. detectar diferencias cuando realmente existen. En segundo lugar, de-
bemos plantearnos qué es la sensibilidad. Llamamos sensibilidad a la
Pongamos un ejemplo, para así entender hasta qué punto la prevalen- capacidad de un test para clasificar a un enfermo como positivo. En
cia puede influir sobre estos valores. Imaginemos una población donde otras palabras, la capacidad de una prueba diagnóstica para detectar
TODOS están enfermos. ¿Cuál será el valor predictivo positivo? Eviden- una enfermedad. En ambos casos estamos hablando de la probabili-
temente, del 100%, porque todos los positivos que la prueba encuentre dad de detectar algo: una diferencia real (potencia) o una enfermedad
van a coincidir, obligatoriamente, con un enfermo. ¿Cuál sería el valor (sensibilidad). Por tanto, la respuesta correcta es la 3. No te confundas
predictivo negativo? Pues el 0%... Si todos están enfermos, todos los ne- con la opción 1, como les ocurrió a algunos opositores en esta con-
gativos que nos dé la prueba serán falsos negativos, porque ninguno co- vocatoria. El valor predictivo positivo hace referencia a la proporción
rresponderá a un sano. de enfermos entre los que han sido clasificados como positivos. No se
encuentra en esta idea el grado de similitud comentado para potencia
Con este ejemplo, un tanto burdo e irreal (pero ilustrativo), queda clara la y sensibilidad.
falsedad de la respuesta 5.

P217 MIR 2007-2008


P196 MIR 2009-2010
Los conceptos de sensibilidad y especificidad de un test diagnóstico han
Una pregunta muy fácil, sobre todo teniendo en cuenta que, años atrás, sido preguntados en el MIR con mucha frecuencia. Asegúrate de domi-
había aparecido otra prácticamente idéntica. Hay que tener muy claras narlos.
las siguientes definiciones.
• Sensibilidad: proporción de positivos entre los enfermos. En este Si cambiásemos el umbral para considerar positiva una prueba de esfuer-
caso, 90% (0,9). zo, situándolo en 2 mm, en vez de los 0,5 mm actuales, la sensibilidad de
• Especificidad: proporción de negativos entre los sanos. Aquí, 87%. la prueba sería menor, ya que habría enfermos que serían clasificados
• Valor predictivo positivo: proporción de enfermos entre los positivos. como negativos, al no alcanzar el ST un descenso tan marcado. Por el
En este problema sería del 79%. contrario, la especificidad aumentaría, puesto que la mayor parte de los
• Valor predictivo negativo: del total de pacientes con resultado sanos serían clasificados como negativos (sería difícil que el ST de un pa-
negativo, qué porcentaje está, en realidad, sano. En nuestro caso, ciente sano alcanzase descensos de esta magnitud).
96%.

P195 MIR 2006-2007


P211 MIR 2008-2009
Esta pregunta es anulable, puesto que ninguna de las opciones satis-
Pregunta sobre uno de los conceptos más importantes de la asignatura. face la respuesta correcta. Construyendo la tabla de contingencia re-
La especificidad de una prueba es la proporción de negativos dentro del sulta que la sensibilidad de la prueba es 204/208, opción que no existe
grupo de sanos (respuesta 2, correcta). Recuerda que, por sí solas, una entre las cinco ofrecidas como se puede comprobar en la tabla que apa-
elevada especificidad (o sensibilidad, en su caso), no garantizan que una rece en la página siguiente.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 200


Estadística y epidemiología
P195 (MIR 06-07) aumentar el VPP, y que cuando el test sea positivo haya más probabili-
Enfermos Sanos dades de que sea un verdadero positivo, es decir, un verdadero enfermo
Positivo 204 5 (opciones 1 y 4, falsas). Por el contrario, cuando la prevalencia de una en-
fermedad es baja, el VPP es bajo (VP / VP+FP) y el denominador aumenta
Negativo 4 103
respecto al numerador, es decir, aumentan los falsos positivos. Así, un
resultado positivo en el test lo más probable es que sea un falso positivo
P195 (MIR 06-07) Resultado de la prueba diagnóstica
que evaluamos y que realmente el sujeto no padezca la enfermedad (opción 2, correcta;
3 y 5 falsas).

P135 MIR 2003-2004

Esta es una pregunta sencilla que versa sobre un tema muy reiterado en
el MIR, el estudio de un test diagnóstico, en la que ni siquiera tenemos
que construir la tabla de contingencia porque ya nos la dan construida.

La eficacia de una prueba diagnóstica depende de su capacidad para de-


tectar correctamente la presencia o ausencia de la enfermedad que se
estudia, lo que se expresa matemáticamente en cuatro índices: sensibili-
P196 MIR 2006-2007 dad, especificidad, valor predictivo positivo y valor predictivo negativo.

Cuando se realiza una prueba de screening, es preferible una prueba Estos índices se obtienen a partir del análisis de una serie de pacientes
sensible a una específica. Esta prueba tiene la virtud de dar positivo en a los que se les realiza una prueba diagnóstica (prueba problema), com-
la mayoría de los enfermos, que es lo que pretendemos detectar. Tiene parándose los resultados con los de una prueba de superior rendimiento
también un inconveniente, que será la presencia de algunos falsos po- diagnóstico (prueba de referencia).
sitivos, dado que algunos sanos serán clasificados erróneamente. Más
adelante, se realizaría una prueba más específica, para identificar los pa- El valor predictivo positivo es la proporción de verdaderos positivos en-
cientes realmente enfermos y descartar los falsos positivos. tre aquellos que han sido identificados como positivos con el test. En
este caso será 80 de 180, un 44% aproximadamente.
Un claro ejemplo de esto es el ELISA para la detección de VIH. Esta prueba
es muy sensible, pero poco específica. Su falta de especificidad la com- El valor predictivo negativo es la proporción de verdaderos negativos
plementaríamos después con una prueba como el Western-Blot, que entre aquellos que han sido identificados como negativos con el test. En
confirmará o descartará la infección de forma definitiva. este caso será 800 de 820, un 98% aproximadamente.

P202 MIR 2006-2007 P144 MIR 2003-2004

El concepto de valor predictivo positivo (VPP) ha sido preguntado de for- El cálculo de valores de un test es imprescindible en el planteamiento del
ma casi constante a lo largo de los últimos años, directa o indirectamen- MIR. La sensibilidad se refiere a la capacidad de detectar positivos en el
te. Es una pregunta que debería acertarse sin complicaciones. grupo de enfermos. En esta pregunta, el total de enfermos (con úlcera)
son 300 y de éstos, 130 son detectados como tal por la prueba (VP), así
El VPP hace referencia a la probabilidad que tiene un paciente de pade- que la S es igual a 130/300 = 43%.
cer la enfermedad, una vez que ha dado positivo en el test (respuesta 4,
correcta). No lo confundas con la sensibilidad, que es a lo que hacen re-
ferencia en la respuesta 3 y en la 5. P148 MIR 2003-2004

Ésta es una pregunta sencilla donde se barajan conceptos relacionados


P215 MIR 2005-2006 con medicina preventiva. La opción 1 es correcta porque, al actuar sobre
los factores de riesgo, evitamos la aparición de casos nuevos de enfer-
Una pregunta de dificultad baja. El valor predictivo positivo es un con- medad, lo que determina una disminución de la incidencia. La opción
cepto muy preguntado en el MIR que has de dominar. El valor predictivo 2 es también correcta, puesto que al detectar los casos de enfermedad
positivo de una prueba diagnóstica (VPP) aumenta cuando aumenta la precozmente y tratarlos conseguimos una disminución de prevalencia
prevalencia de la enfermedad, por lo que sí depende de ella. Por eso, de enfermedad, aunque al inicio se pueda producir un falso aumento
cuando queremos hacer un screening en la población, seleccionamos de prevalencia al diagnosticar más enfermos. La opción 3 es falsa y hace
a los pacientes con factores de riesgo para padecer la enfermedad (en referencia a un concepto de epidemiología: los valores predictivos de-
quienes suponemos que la prevalencia de enfermedad será alta) y así penden de la prevalencia, de forma que al aumentar la prevalencia de la

201
DESGLOSES
COMENTADOS MIR
enfermedad aumenta el VPP (es decir, cuanto más habitual es la enfer- P203 MIR 2006-2007
medad más probable es que un resultado positivo en el test corresponda
realmente a un enfermo). La prevalencia es un concepto absolutamente básico. Esta pregunta
es una de las más sencillas del examen. La prevalencia representa el
número de casos en una población, incluyéndose todos los enfermos,

T02 Conceptos y uso de la epidemiología sean recientes o antiguos (respuesta 4, correcta). No la confundas con
la incidencia, que representa el riesgo de enfermar en un periodo de
tiempo determinado, y hace referencia a los casos nuevos durante ese
P224 MIR 2007-2008 periodo.

De los criterios de causalidad, no existe ninguno que por sí solo sea a la P203 (MIR 06-07) Medidas de frecuencia de la enfermedad
vez necesario y suficiente. De hecho, todos ellos pueden no cumplirse,
salvo uno, que es la relación temporal (la causa debe preceder al efecto,
respuesta 3, correcta). El resto de ellos pueden no aparecer. También has
de recordar que la asociación estadística no es un criterio de causalidad,
detalle preguntado en varias ocasiones. Los criterios de causalidad son:
• Fuerza de asociación.
• Efecto dosis-respuesta.
• Secuencia temporal.
• Coherencia externa (consistencia de los resultados).
• Ausencia de distorsiones metodológicas en el estudio, debidas a sesgos.
• Ausencia de explicaciones alternativas.
• Plausibilidad biológica.
• Efecto de la cesación o reversibilidad.
T04 Medidas de asociación
• Demostración experimental.
P189 MIR 2014-2015

T03 Medidas de frecuencia de la enfermedad En esta pregunta tenemos que calcular el OR entre una enfermedad y un
factor. Para ello, nos dan los datos de enfermos en cada grupo, con y sin
factor X:
P209 MIR 2013-2014 • 20 expuestos en 120 enfermos.
• 20 expuestos en 420 sanos.
El estudio de cohortes es un estudio analítico, observacional y prospecti-
vo. A partir de individuos sanos nos permite, a diferencia de los estudios El OR (OR = ad/bc) se calcula con la tabla:
casos y controles, el cálculo de medidas de frecuencia como la incidencia
acumulada (riesgo individual de enfermar) y la densidad de incidencia. Enfermos Sanos
Esta última es una tasa, y, por tanto, incorpora en el denominador el
Expuestos a b
tiempo. Para su cálculo se realiza el cociente de casos nuevos entre el su-
No expuestos c d
matorio de los periodos individuales en riesgo (opción 4, correcta). Nos
expresa la velocidad con la que aparece un fenómeno en una población.
Si sustituimos los valores:

P194 MIR 2009-2010


Enfermos Sanos
Expuestos 20 20
Una pregunta difícil. Hasta este momento, el concepto de incidencia ha-
No expuestos 100 400
bía aparecido en numerosas ocasiones, pero no el de densidad de inci-
dencia. La densidad de incidencia se define como el número de casos
nuevos de enfermedad que se producen en un periodo de tiempo, igual OR = 20 x 400/20 x 100 = 4
que sucede con la incidencia acumulada. No obstante, a diferencia de
ésta, la densidad de incidencia considera cuánto tiempo ha estado ex-
puesto cada sujeto al factor de estudio (en este caso, al ibuprofeno). P193 MIR 2013-2014

La densidad de incidencia es una tasa que expresa la velocidad con la Cuando queremos realizar una inferencia, es decir, generalizar los resulta-
que se desarrolla una enfermedad en una población y, para ser válida, to- dos a la población, necesitamos construir un intervalo de confianza entre
dos los sujetos deberían haber sido seguidos durante un tiempo suficien- dos valores donde se encontrará el verdadero valor poblacional. En este
te para desarrollarla. También se conoce como “fuerza de morbilidad”. caso, el RR es 0,69 (factor protector), pero el IC va desde 0,31 (factor pro-

ESTA DÍSTICA Y EPIDEMIOLOGÍA 202


Estadística y epidemiología
tector) hasta 1,17 (factor de riesgo). Con este intervalo, no podemos con- cero e infinito (opción 5, falsa). Se calcula dividiendo la incidencia de la
cluir desde el punto de vista estadístico si el factor de estudio es un factor enfermedad en los expuestos entre la incidencia de la enfermedad en los
protector, factor de riesgo o no tiene efecto (opción 4). Recuerda que si no expuestos (opción 1, falsa). Al dividir incidencia en expuestos entre
un IC de un RR contiene el 1, ese IC no es significativo, ya que el RR = 1 incidencia en no expuestos obtenemos un resultado que no tiene unida-
significa que no tiene efecto. des (opción 2, correcta).

La odds ratio es la medida básica de los estudios casos-controles. Su sig-


P195 MIR 2013-2014 nificado es idéntico al del riesgo relativo, aunque no puede calcularse
como él, puesto que en los estudios casos-controles no puede calcularse
Los autores han realizado un estudio observacional retrospectivo donde la incidencia de la enfermedad.
comparan personas sanas y enfermos para ver la relación del cáncer de
P198 (MIR 05-06) Cálculo de las medidas de asociación
pulmón y un factor de exposición como el sílice. Es un estudio de casos y
en cada estudio
controles (opción 5). Obtienen como resultados una OR = 1,67 (OR > factor
de riesgo), y aportan un IC (1,27-2,21), con todos los valores mayores de 1.
Es decir, que la exposición al sílice es factor de riesgo para el cáncer de
pulmón (opciones 1 y 4, falsas).

P181 MIR 2012-2013

RR con el nuevo tratamiento: 25/500 (0.05), RR con el tratamiento habi-


tual: 50/500 (0.1), 0.05/0.1 = 0.5.

P182 MIR 2011-2012 P136 MIR 2003-2004

El intervalo de confianza del RR (1,77-3,22) no incluye el valor 1, lo cual Si se tiene claro el concepto de fuerza de asociación, uno de los más
indica significación. Como el RR es mayor que 1 indica que estamos destacados del bloque de Epidemiología, no se encontrarán dificultades
ante un factor de riesgo. Por tanto, asumimos que es significativo que para contestar esta pregunta.
aumenta el riesgo de muerte súbita en los pacientes que toman anti-
psicóticos. Los parámetros de fuerza de asociación miden la diferencia de ocurren-
cia de enfermedad entre dos grupos: personas expuestas (a un factor de
riesgo o fármaco) y personas no expuestas.
P203 MIR 2007-2008
El riesgo relativo es la medida de asociación en los estudios de cohortes
Esta pregunta puede intimidar, a primera vista, puesto que está llena de y en los demás estudios prospectivos, como los ensayos clínicos. Puede
letras y números. Sin embargo, es bastante más sencilla de lo que parece. variar entre cero e infinito y responde a la pregunta: ¿cuánto más común
Ante los datos que nos ofrecen podemos concluir: es la enfermedad entre los expuestos a un factor respecto a los no ex-
• La respuesta 1 queda excluida, ya que el intervalo de confianza de B puestos?
incluye el 1. Esto quiere decir que no se ha alcanzado la significación
estadística, con lo que cabe la posibilidad de que sea tanto factor de En la pregunta que nos ocupa, el RR es de tres, así que diremos que la
riesgo como factor protector para el padecimiento de IAM. incidencia de hemorragia intracraneal entre los pacientes tratados con
• Las opciones 3 y 4 (fármacos A y D) quedan descartadas, dado que a el factor de estudio (anticoagulantes orales) es tres veces superior a la de
juzgar por las medidas de asociación (OR, en ambos casos), se com- los no tratados (en este caso tratados con antiagregantes).
portarían como factores de riesgo para IAM.
• Por consiguiente, nos queda la opción 2 (fármaco C). Si la analizamos,
veremos que el intervalo de confianza no incluye la unidad (es decir, P149 MIR 2003-2004
existe significación) y se comporta como factor protector frente al
infarto agudo de miocardio (RR = 0,7). Este tipo de preguntas acerca de la interpretación es cada vez más
normal en el examen. La mayoría de veces son sencillas si dominas los
conceptos relacionados con el contraste de hipótesis y el intervalo de
P198 MIR 2005-2006 confianza.

Pregunta fácil acerca del riesgo relativo. El riesgo relativo es una medida Nos describen un estudio en el que los pacientes hipertensos son
de asociación utilizada en los estudios de cohortes. Mide la fuerza de la clasificados en función del tipo de tratamiento antihipertensivo que
asociación entre el factor de riesgo y la enfermedad. Puede variar entre estuvieran recibiendo. Posteriormente son seguidos en el tiempo,

203
DESGLOSES
COMENTADOS MIR
estudiando la aparición de infarto agudo de miocardio. Se trata por P179 MIR 2010-2011
tanto de un estudio de cohortes (no confundir con el ensayo clínico
porque aquí el tratamiento no es asignado por el investigador, ya lo Una pregunta muy sencilla sobre un concepto ya preguntado antes en el
estaban tomando). La opción correcta es la 2: como el intervalo de con- examen MIR. Cuando nos preguntan cuántos pacientes deberíamos tratar
fianza no incluye el 1 (valor nulo), sabemos que el resultado es estadís- para evitar un evento, en este caso un infarto de miocardio, debemos utilizar
ticamente significativo. la fórmula del NNT (número necesario de pacientes a tratar). Esta fórmula
sería: NNT = 100/(I1-I2), donde I1 es la incidencia de IAM con el fármaco an-
El riesgo relativo y su intervalo de confianza nos informan de cuántas tiguo, mientras que I2 representa la incidencia de IAM con el fármaco nuevo.
veces más riesgo tienen los expuestos, pero no de incidencias (recuerda Sustituyendo, NNT = 100/2,5 = 40 pacientes (respuesta 4, correcta).
que en estos estudios se pueden calcular incidencias A distintas de los
casos y controles).
P188 MIR 2010-2011

T05 Medidas de impacto o del efecto Una pregunta sencilla en la que, para resolverla, sólo nos exigen mante-
ner un mínimo de atención. Con el tratamiento habitual, se producían
50 infartos por cada 500 pacientes, es decir, un 10%. En cambio, con el
P181 MIR 2014-2015 nuevo tratamiento solamente se producen 25 sobre 500, un 5%. ¿Cuál es
la diferencia entre los dos? ¿Cuánto se reduce, con la nueva alternativa,
Pregunta directa sobre el cálculo de medidas de asociación y de efecto. el riesgo de infarto?
Se pide calcular el riesgo relativo (RR) y el riesgo atribuible (RAE). Para
ello, es necesario conocer la incidencia en expuestos (Ie) y en no expues- 10% - 5% = 5%
tos (Io):
• Ie = 30 casos en 1.000 mujeres fumadoras = 30/1000 = 3/100 = 3% Así de simple (respuesta 5, correcta). El único problema que puedes ha-
• Io = 20 casos en 2.000 mujeres fumadoras = 20/2.000 = 2/200 = 1/100 = 1% ber tenido es restar, directamente, 50 – 25 = 25. Observa que las posibles
opciones aparecen expresadas en porcentaje. Haciendo correctamente
Ahora, sólo queda sustituir en la fórmula del RR y del RAE: la conversión, el problema no encierra ninguna dificultad.
• RR = Ie/Io = 3/1 = 3%
• RAE = Ie/Io = 3 - 1 = 2% = 20 por 1.000.
P208 MIR 2008-2009

P198 MIR 2014-2015 Una pregunta de dificultad media sobre la interpretación de los datos de
ensayos clínicos. Analicemos opción por opción:
El NNH es el equivalente al NNT, sin embargo, en lugar de tratar con un • Es cierto que el metoprolol reduce la mortalidad en un 50%, es decir,
efecto beneficioso de un fármaco para evitar un fenómeno adverso (RR a la mitad (con placebo, 40%; con este fármaco, 20%). Respuesta 1,
menor de 1), nos encontramos un aumento de un fenómeno adverso correcta.
(RR mayor de 1). Serán por tanto preguntas que hablen de efectos se- • En términos de riesgo relativo, la respuesta 3 tiene razón; sólo tene-
cundarios. Su significado sería cuántas personas hay que tratar con el mos que dividir incidencias o riesgos.
fármaco para obtener un evento, que en lugar de ser evitar un ictus por • La respuesta 4 es evidente. Los pacientes de alto riesgo se benefician
ejemplo (NNT), será tener una hemorragia (NNH). más, porque estaríamos salvando 20 vidas por cada 100 pacientes
tratados (ya no muere el 40%, sino únicamente el 20%). Sin embar-
go, en los de bajo riesgo salvamos solamente 5 vidas por cada 100
P205 MIR 2013-2014 tratamientos.
• La respuesta 5 es consecuencia natural de lo que dice la 4. Si los recur-
Debemos conocer el cálculo de las medidas de efecto o impacto. La re- sos son limitados (es decir, no puedo tratar a todos), es preferible tratar
ducción riesgo absoluto o RRA nos indica la proporción de pacientes no al grupo que más se beneficie, que en este caso son los de alto riesgo.
expuestos al factor protector (RR menor de 1) en los que se evitaría el
fenómeno adverso si se expusieran al mismo, y su cálculo se realiza me- La opción falsa es la 2. El riesgo relativo desciende por igual en ambos
diante la resta de la incidencia en no expuestos a la incidencia en expues- grupos (20/40=0,5; 5/10=0,5). Lo que sí cambia de un grupo a otro es lo
tos (respuesta 5, correcta). Nos comunica, pues, la incidencia de eventos que dice la respuesta 4: el beneficio absoluto, entendido como número
adversos que ha evitado el factor, normalmente un medicamento a es- de vidas salvadas por cada 100 pacientes tratados.
tudio.

P211 MIR 2007-2008


P182 MIR 2012-2013
El NNT, número necesario de pacientes a tratar, es una de las posibles
NNT = 1/ RRA = 1/ 0,1-0,05 = 1/0,05 = 20 formas de medir el efecto del tratamiento en los ensayos clínicos. Re-

ESTA DÍSTICA Y EPIDEMIOLOGÍA 204


Estadística y epidemiología
presenta el número de pacientes que han de ser tratados para evitar un correctamente esta pregunta es necesario saber interpretar los resulta-
suceso indeseable adicional. Por ejemplo, si en un estudio se compara un dos que nos están dando.
antiagregante con el placebo en la prevención del infarto agudo de mio-
cardio, y el NNT fuese de diez, significaría que prevendríamos un infarto La reducción del riesgo relativo (RRR) es la diferencia entre el porcentaje
cada diez pacientes tratados con el antiagregante. de eventos en el grupo control y el porcentaje de eventos en el grupo
experimental, dividido por el porcentaje de eventos en el grupo control.
Su significado depende, como el riesgo relativo, del valor que tome:
P214 MIR 2006-2007 • RRR > 0% : factor de protección
• RRR = 0% : indiferente. La incidencia es igual en expuestos que en no
Pregunta que se intuye, incluso sin el Manual. El NNT es el número de expuestos.
pacientes que se han de tratar para prevenir un suceso indeseable adi- • RRR < 0% (negativo) : factor de riesgo.
cional. Se obtiene como el inverso de la RAR multiplicado por 100. La
RAR se calcula con la diferencia entre el porcentaje de eventos en el Al inferir los datos del ensayo clínico a la población, obtenemos un inter-
grupo control y el porcentaje de eventos en el grupo experimental. Por valo de confianza que indica los límites de los valores dentro de los cua-
esto, el fármaco de elección sería el A, puesto que necesitamos tratar a les el parámetro poblacional tiene la probabilidad de estar. Si nos dan un
un número menor de pacientes para evitar una incidencia indeseable intervalo de confianza del 95% y suponiendo que nuestra variable (RRR)
adicional. sigue una distribución normal, podemos concluir que en el 95% de las
ocasiones la RRR en la población estará entre RRR ± 1,96 eem.

P201 MIR 2005-2006 Por otro lado, los valores se distribuyen en torno a la media según la cur-
va de gauss, de forma que la mayoría de éstos se encuentran en torno a
Pregunta fácil por haber sido repetida últimamente de manera casi idén- la media y son cada vez más infrecuentes conforme nos alejamos de ésta.
tica. Nos preguntan directamente el cálculo del NNT, uno de los índices En este caso, por consiguiente, si la media de la RRR en la población es
utilizados en el análisis de los resultados de un ensayo clínico. Simplemen- –29%, serán más usuales los valores en torno a ésta que los valores próxi-
te nos tenemos que limitar a aplicar la fórmula. Esta pregunta ha caído mos a –100% o a +43%, que son los límites del intervalo de confianza.
todos los años en las últimas tres o cuatro convocatorias. El NNT (número
de pacientes a tratar para evitar un evento) se deriva de la REDUCCIÓN Has de saber también que cuando el intervalo de confianza del RRR in-
ABSOLUTA DEL RIESGO. La reducción absoluta del riesgo es la diferencia cluye el 0, el resultado no es concluyente, ya que como hemos dicho an-
de incidencias del evento entre el grupo sometido al tratamiento experi- teriormente el 0 indica la indiferencia, es decir, que en nuestro caso la
mental y el grupo control. En nuestra pregunta, la mortalidad en el grupo incidencia de accidentes cerebrovasculares en pacientes con ácido ace-
placebo es del 10% y en el grupo experimental del 5%. En atención a ello, tilsalicílico es igual a la de los pacientes en el grupo control.
la RAR es del 5%. Esto quiere decir que, gracias al tratamiento, evitamos
cinco muertes por cada 100 pacientes tratados. Por tanto, deberemos tra- Con todo esto, podemos entender la opción 3, que es la interpretación
tar a 20 pacientes con el nuevo fármaco para evitar una muerte (opción 2, correcta de los resultados.
correcta).

Además de con el NNT, la magnitud del efecto del tratamiento en los P127 MIR 2003-2004
ensayos clínicos se puede expresar mediante:
• El riesgo relativo: cociente entre el riesgo de sufrir un determinado Esta pregunta es difícil, porque hace necesario interrelacionar dos con-
evento en el grupo expuesto a un determinado tratamiento y el ries- ceptos. Para poder contestar, necesitamos manejar dos conceptos. El pri-
go de sufrir el mismo evento en el grupo control. mero, es el del riesgo atribuible (Ie-Io) y el segundo es el del NNT (100/
• La reducción absoluta del riesgo (RAR): diferencia entre el porcentaje RA). El enunciado aporta dos variables: la primera es Io que es igual al
de eventos en el grupo control y el porcentaje de eventos en el grupo 6%, y la segunda es el NNT, que es igual a 20. Si el NNT es 20, el RA será
experimental. igual a 100/20, es decir, cinco. Por lo que, si la (incidencia en no expuestos
• La reducción relativa del riesgo (RRR): diferencia entre el porcentaje (Io)) es 6%, para conseguir un riesgo atribuible (RA) de 5, la incidencia en
de eventos en el grupo control y el porcentaje de eventos en el gru- expuestos (Ie) debe ser del 1%.
po experimental, dividido por el porcentaje de eventos en el grupo
control.
P152 MIR 2003-2004

P259 MIR 2005-2006 Esta pregunta se contesta realizando una tabla de contingencia y apli-
cando fórmulas. Es de dificultad baja. Hemos de realizar una tabla de
Pregunta difícil; es lógico que te haya planteado cierta dificultad. En esta contingencia de 2 x 2 y extraer los datos de incidencia en los expuestos
pregunta nos plantean un ensayo clínico en el que se compara la efica- (50/1000) y la incidencia en no expuestos (10/2000). Así, aplicando la fór-
cia de la terapia antiagregante con ácido salicílico en la prevención de mula del riesgo relativo y la del riesgo atribuible, se obtiene un riesgo
accidentes cerebrovasculares frente a un grupo control. Para contestar relativo de 10 y un riesgo atribuible de 0,045.

205
DESGLOSES
COMENTADOS MIR
HDA P198 MIR 2013-2014
Sí No Total
Consumo Sí 50 950 1000 Los autores han realizado un estudio analítico, observacional y retros-
de AINE pectivo, comparando un grupo con enfermedad y otro sano para estu-
No 10 1990 2000
diar la exposición del factor de estudio, es decir, se trata de un estudio de
Total 60 2940 300
casos y controles.
50 / 1000
RR = = 10 En un registro poblacional se reportan todos los casos diagnosticados de
10 / 2000
una enfermedad en un área de población expuesta al riesgo. Un estudio
de casos controles anidado, o de grupo de riesgo, es un estudio de ca-
RA= Ie – Io = 50/1000 – 10/2000 = 0,05 – 0,005= 0,045 sos controles donde se identifican los sujetos a partir de una cohorte, en
este caso, el registro poblacional de cáncer. Los casos son aquellos que
tienen ya la enfermedad dentro de mi cohorte, y que un sujeto sea ele-

T06 Tipos de estudios epidemiológicos gido como control depende de que éste se encuentre en riesgo, es decir,
tiene que ser miembro de la cohorte en el momento en que se selecciona
o identifica el caso. Los casos y el conjunto de individuos en riesgo que
P182 MIR 2014-2015 no desarrollaron el evento constituyen el grupo de riesgo. En un primer
tiempo se define la cohorte o población en estudio; se realiza el segui-
Pregunta sencilla sobre los estudios observacionales. Los autores realizan miento de la misma con el fin de detectar los eventos que ocurren (casos
un estudio en el que dividen los grupos de estudios en función del factor nuevos de cáncer) a lo largo del tiempo y, cada vez que se selecciona o se
de riesgo (niños con exposición a humo y niños sin exposición a humo) y identifica un caso, se seleccionan uno o varios controles de la población
estudian la aparición, al año, de posibles efectos, por lo que es un estudio que en ese momento particular se encontraba en riesgo de desarrollar el
de cohortes (respuesta 1, correcta). Hay que recordar que los estudios de evento en estudio (pacientes sin cáncer).
cohortes son observacionales longitudinales (respuesta 4, falsa), y útiles
para estudiar factores de exposición raros (respuesta 5, falsa). La metodo- En esta variante del estudio de casos y controles podría ocurrir que un
logía cualitativa es aquélla de tipo observacional pero que, a diferencia de sujeto fuera seleccionado como control y, posteriormente, desarrollar
la cuantitativa, admite la subjetividad de los investigadores (respuesta 3, la enfermedad y ser considerado como caso. Esto no es un sesgo, ya
falsa). Se usa, sobre todo, en estudios sociales, como por ejemplo la eva- que en los estudios de cohorte, al igual que en esta situación, un mismo
luación de un programa de formación. sujeto puede contribuir tanto al numerador como al denominador. El
diseño de casos y controles anidado, o de grupo de riesgo, se usa en
cohortes dinámicas en las que la determinación de la exposición y sus
P183 MIR 2014-2015 cambios en el tiempo, en todos los miembros de la cohorte, resultaría
muy cara.
Pregunta polémica sobre estudios observacionales donde se analiza
la relación entre HDA y consumo de AINE. No se concreta con exac-
titud si los individuos del grupo control han tenido o no HDA. Si, su- P208 MIR 2013-2014
poniendo una errata cuando dice “pero por razones que no tuvieran
nada que ver con el uso de AINE”, cambiásemos uso de AINE por HDA, Para estudiar los efectos de una intervención necesitaremos un estudio
sería un estudio observacional retrospectivo, como dice la respues- analítico (opciones 1 y 3, incorrectas). Dentro de los estudios analíticos
ta 2: casos y controles. Ante este tipo de preguntas, que pueden ser necesitaremos un estudio experimental, ya que la intervención va a ser
anulables, si se intuye lo que se ha querido preguntar como es el caso, aplicada sobre el paciente por nosotros, y no podremos limitarnos a ob-
o hay 4 claramente falsas, debe marcarse la respuesta que parece co- servarla en el seguimiento de una cohorte ya sea de manera prospectiva
rrecta. o retrospectiva (opciones 2 y 5, incorrectas). El estudio analítico experi-
mental de mayor valor estadístico es el ensayo clínico, donde realizamos
una aleatorización de la intervención y disponemos de un grupo control
P197 MIR 2014-2015 (opción 4, correcta).

En este estudio partimos de un grupo homogéneo respecto a un factor, su-


jetos vacunados, no disponemos de dos grupos comparables con iguales P178 MIR 2012-2013
factores pronósticos, por lo que no podremos realizar un estudio analítico
(respuestas 1, 4 y 5, falsas). Además, tenemos información sobre estos su- No es un ensayo clínico ya que el investigador no decide sobre ninguna
jetos antes y después de la vacuna, por lo que podremos expresar median- variable, no es un estudio de cohortes ya que no hay un grupo expuesto
te un estudio descriptivo un dato general sobre este grupo; por ejemplo, y otro no a ningún factor de riesgo, no es un casos y controles ya que no
prevalencia de algún dato patológico en los que se vacunan o incidencia hay enfermos y sanos, son todos enfermos, no es una serie de casos ya
en un periodo determinado de un evento recogido en un informe de alta que son muchos pacientes, la selección es aleatoria y se mide además la
hospitalaria, como el IAM (respuesta 2). calidad de vida, es un estudio transversal.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 206


Estadística y epidemiología
P179 MIR 2012-2013 si estaban expuestos al factor de riesgo. Por tanto, es un estudio observa-
cional que va desde la enfermedad (accidente de tráfico), hacia los facto-
No es un estudio transversal porque hay un seguimiento de los pacien- res de riesgo (alcohol). Es un estudio de casos y controles.
tes, no es un casos y controles ya que al inicio están todos sanos y se
siguen hasta que aparece la enfermedad, no es un cuasiexperimental
porque hay un grupo control y los grupos son comparables en todo ex- P183 MIR 2011-2012
cepto en la exposición, no es un ensayo clínico ya que el investigador
no decide la exposición, es un cohortes con un grupo expuesto (SAT) y Estamos ante una población que presenta una enfermedad rara, con una
otro no (vecinos sanos) que se sigue hasta la aparición del evento (neu- baja prevalencia y con un tiempo de incubación largo. La mejor manera
ropatía). de estudiar la relación causa-consecuencia en este caso será un estudio
de casos y controles. Seleccionando como casos, a los pacientes con leu-
cemia y, como controles, a pacientes con similares características que no
P183 MIR 2012-2013 tengan enfermedad y, en los dos, estudiamos la existencia de exposición
a radiaciones.
Cuando se miden ciudades, países… porque no hay datos a nivel indivi-
dual y los datos son de poblaciones se trata de estudios ecológicos.
P184 MIR 2011-2012

P184 MIR 2012-2013 Dadas las características de la patología que nos presentan, no podemos
plantear la realización de un estudio prospectivo: en ningún caso podría-
Se trata de un “casos y controles” dentro de un estudio de cohortes. mos asignar, al azar o no, a mujeres embarazadas a determinadas exposi-
ciones para luego detectar la incidencia de espina bífida. Además, se trata
de una enfermedad poco frecuente, con una prevalencia estimada, según
P186 MIR 2012-2013 el enunciado, de uno de cada 1.000 nacidos vivos. Las dos características
nos hacen inclinarnos hacia un estudio de casos y controles (opciones
En el cohortes todos son sanos al inicio del estudio (opción 1, falsa) solo 3 y 4). En la opción 4, no se plantea un diseño real de casos y controles
difieren en la exposición, se mira si la incidencia de la enfermedad es di- puesto que en realidad de clasifica a los sujetos de estudio en función de
ferente en expuestos y no expuestos (opción 2, falsa) se mide incidencia la exposición. Por todo ello, la opción 3 resulta la más adecuada.
no prevalencia ya que hay un seguimiento (opción 3, falsa) la exposición
la decide el sujeto no el azar (opción 4, falsa) y pueden ser retrospectivos
si utilizamos cohortes históricas (opción 5, cierta). P232 MIR 2011-2012

Esta pregunta exige conocimientos de epidemiología y neurología para


P178 MIR 2011-2012 su resolución. El mejor diseño para evaluar la eficacia de un tratamiento
es el ensayo clínico controlado aleatorizado. Los controles históricos no
Pregunta sencilla y directa sobre los tipos de estudios epidemiológicos. son útiles porque en su caso la asignación del tratamiento no es aleato-
Los estudios experimentales son aquellos en los que el investigador ria, y son susceptibles de sesgo por cambios en el cuidado de los pacien-
introduce el factor de estudio. Dentro de éstos los podemos dividir en tes, por lo que el riesgo de sesgo es mayor. Para enfermedades crónicas,
experimentales puros si existe aleatorización (como el ensayo clínico lo ideal son periodos de seguimiento largos (2 años mejor que 6 meses).
aleatorizado) o cuasiexperimentales si no la hay. Por otra parte, el control debería hacerse con el tratamiento indicado
para la patología. Es verdad que los fármacos anticolinesterásicos han
demostrado mejoría cognitiva en pacientes con Alzheimer leve-modera-
P179 MIR 2011-2012 da, pero no está claro que retrasen la progresión de la enfermedad.

La clave de esta pregunta está en ver qué busca el estudio: incidencia.


Necesitamos un estudio que observe casos nuevos de enfermedad (Gui- P173 MIR 2010-2011
llain-Barré) a partir de sujetos expuestos o no expuestos al factor de ries-
go (vacuna). El único estudio longitudinal prospectivo de los propuestos Los tipos de estudios epidemiológicos son un tema estrella en el examen
es el estudio de cohortes. MIR. En esta pregunta, nos piden que, a partir de un estudio que nos
describen, señalemos de qué tipo de diseño se trata.

P180 MIR 2011-2012 Los estudios ecológicos son estudios en los que la unidad de análisis son
grupos de individuos, no individuos. Por ejemplo, clases de una escuela,
La selección de pacientes se basa en la aparición de un fenómeno: ac- regiones o, como en el caso de la pregunta, de ciudades europeas. Son
cidente; se seleccionan los controles de características similares excep- útiles cuando no se pueden hacer mediciones individuales: ruido, ventas
tuando que no tuvieron el accidente y en los dos casos nos preguntamos de cigarrillos o, como aquí, niveles medios de contaminación.

207
DESGLOSES
COMENTADOS MIR
En el estudio que nos describen, sólo disponemos de datos poblaciona- - 2.º Ensayo clínico controlado no aleatorizado con controles histó-
les, no individuales, acerca de la tasa de incidencia de un tipo de alergia ricos.
en el último año y los niveles medios de contaminación en 250 ciudades - 3.º Estudio de cohortes prospectivos.
europeas (opción 5 correcta). Los estudios ecológicos permiten describir - 4.º Estudio de cohortes retrospectivos.
diferencias en poblaciones que habrán de ser estudiadas posteriormente
con más detalle. Su problema es que las medidas usadas son aproxima- • Mala:
das de exposición y de enfermedad, lo que limita el valor de los hallazgos. - 1.º Estudio de casos y controles.
- 2.º Serie de casos clínicos, estudios ecológicos y estudios transver-
sales.
P177 MIR 2010-2011 - 3.º Comités de expertos.

Una pregunta muy sencilla que puede resolverse por descarte de opciones: Según esta clasificación, podemos ver que la respuesta 1 es la correcta,
• El diseño es prospectivo, lo que descarta el estudio de casos y con- descartándose el resto por aportar un menor nivel de evidencia científica.
troles (retrospectivo) y el transversal (donde no existe seguimiento)
(respuestas 1 y 3, descartadas).
• En una serie de casos, no se parte de una población inicialmente P191 MIR 2010-2011
sana, lo que descarta la respuesta 4.
• Evidentemente, no podemos constituir dos grupos para asignar el Los tipos de estudios epidemiológicos son un tema muy importante para
uso de teléfono móvil a uno de ellos, privando al otro de hacerlo, el examen MIR. En esta pregunta nos piden el estudio más adecuado
para establecer después una comparación. Se descarta, por tanto, el para enfermedades cuyo periodo de latencia es muy largo. Para este tipo
ensayo clínico. Precisamente, en un estudio de cohortes, es el propio de enfermedades los estudios prospectivos requerirían un periodo de se-
sujeto el que decide exponerse o no al factor de estudio, mientras guimiento muy largo, hasta la aparición de casos de enfermedad, lo que
que en el ensayo clínico lo asigna el investigador (respuesta 5, des- encarecería el estudio y retrasaría mucho la obtención de resultados; por
cartada). ello, no son apropiados en estos casos. Así descartamos las respuestas 2
y 4 por tratarse de estudios prospectivos.
P177 (MIR 10-11) Estudio de cohortes
Las respuestas 1 y 5 también se excluyen fácilmente porque se tratan de
estudios descriptivos, cuya utilidad para establecer asociaciones causa-
les es muy limitada, y en cualquier caso dicha asociación debe ser verifi-
cada por estudios analíticos.

Los estudios de casos y controles (respuesta 3) son estudios analíticos,


longitudinales y retrospectivos, en los que a partir de un grupo de indivi-
duos enfermos (casos) y de otros comparables a ellos en todo, pero que
no tienen enfermedad (controles) se estudia la exposición, en ambos, a
distintos factores de riesgo. Son estudios de corta duración y bajo coste
y, por tanto, útiles para el estudio de multicausalidad de la enfermedad,
La respuesta correcta es la 2. No olvides que, al partir de una pobla- y los más apropiados para el estudio de enfermedades con largo periodo
ción inicialmente sana, todos los casos que van apareciendo son ca- de inducción, siendo la solución a la pregunta.
sos nuevos. Por ello, en los estudios de cohortes podemos calcular
P191 (MIR 10-11) Diferencias entre los estudios de cohortes
incidencias.
y los de casos-controles
CARACTERÍSTICAS COHORTES CASOS-CONTROLES

P181 MIR 2010-2011 Población en riesgo Definida Indefinida


Cálculo de la incidencia Sí No
Una pregunta muy fácil y muy repetida en el examen MIR. Según la gra- N.º de efectos medibles Varios Uno
dación de la calidad de la evidencia científica, se diferencian los siguien- N.º de exposiciones posibles
Una Varias
tes niveles: a estudiar
• Buena: Enfermedades raras Poco útil Muy útil
- 1.º Metanálisis de ensayos clínicos controlados y aleatorizados. Exposiciones raras Muy útil Poco útil
- 2.º Ensayo clínico controlado y aleatorizado de muestra grande. Sesgos posibles Pocos Muchos
- 3.º Ensayo clínico controlado y aleatorizado de muestra pequeña. N.º de sujetos en estudio Muchos Pocos
Coste Elevado Bajo
• Regular:
Duración Larga Corta
- 1.º Ensayo clínico controlado no aleatorizado con controles con-
Evidencia causal Regular Mala
currentes.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 208


Estadística y epidemiología
P196 MIR 2010-2011 Aunque existen múltiples tipos de diseño epidemiológico, algunos apor-
tan mayor evidencia científica que otros. Este nivel de evidencia viene
En esta pregunta, debemos distinguir con claridad las dos fases de las definido por las siguientes características:
que se compone el estudio, y entonces resulta sencillo: • Los diseños prospectivos aportan mayor evidencia que los retrospec-
• En una primera fase, parten de una sola cohorte: 25.000 trabajado- tivos.
res, a los que siguen durante 8 años. De estos 25.000, enferman 250, • La existencia de aleatorización también supone un incremento del
mientras que el resto permanece sano. nivel de evidencia.
• En un segundo tiempo, pretendemos saber si esta enfermedad se • Existencia de un grupo control concurrente.
asocia o no a una determinada alteración genética, pero no podemos • El enmascaramiento de pacientes e investigadores participantes.
estudiar a los 25.000. ¿Qué podemos hacer entonces? Podríamos rea- • La inclusión de un número suficiente de pacientes como para de-
lizar este test a los 250 trabajadores que han enfermado, y realizarlo tectar diferencias entre los diferentes grupos de estudio, en caso de
también a otros 250 que hayan permanecido sanos, comparando la haberlas.
frecuencia de esta mutación en ambos grupos. Realmente, lo que esta-
ríamos haciendo en este caso es un estudio de casos y controles, que De los distintos diseños existentes, el que mayor evidencia aporta es el
proceden de un estudio prospectivo previo, o lo que es lo mismo, casos ensayo clínico aleatorio. Observa que, en la respuesta 2, no dicen exac-
y controles anidado (respuesta 3, correcta). tamente eso, pero debes saber que, al hablar de asignación “al azar” y de
un diseño “prospectivo”, es lo que te estarían describiendo. Por eso es la
opción correcta.
P180 MIR 2009-2010
Recuerda que, por encima del ensayo clínico, existe algo que ofrece
Una pregunta de dificultad media sobre los tipos de diseño epidemioló- mayor evidencia, y sería la combinación de varios ensayos de caracte-
gicos. De las opciones que nos ofrecen existen varias que podemos des- rísticas similares: el metaanálisis de ensayos clínicos controlados y alea-
cartar con mucha facilidad. torizados.
• Dado que existe un seguimiento, se trata de un estudio de carácter
prospectivo. Esto descarta las respuestas 1 y 3.
• El investigador se limita a observar. En ningún momento aleatoriza P182 MIR 2009-2010
ni asigna él mismo ningún factor de estudio, por lo que no puede
tratarse de un ensayo clínico. Opción 4, descartada. Los estudios de prevalencia, transversales o de corte, permiten descri-
bir las características de una población en un momento determinado.
Tampoco se trata de un estudio ecológico. En este tipo de diseños, la A partir de ellos obtendremos datos sobre cuántos individuos de una co-
unidad de estudio es la población, ya que nos falta información sobre los munidad padecen una determinada patología (por ejemplo, HTA) entre
individuos concretos. No puede tratarse de un estudio ecológico, ya que el total de individuos de esa comunidad, es decir, datos de prevalencia.
conocemos exactamente cuántos y quiénes son los sujetos participan-
tes, al tenerlos identificados desde el comienzo del mismo. Son útiles para estudiar enfermedades crónicas y frecuentes (alta preva-
lencia, larga duración y baja mortalidad), y también son buenos para la
Otra observación con respecto a los estudios ecológicos. La esencia de planificación sanitaria, porque dan una idea de lo frecuente que es y los
los mismos está en utilizar la población como unidad de estudio, tal recursos consumidos por el sistema sanitario en una determinada pato-
como hemos dicho. Muchos de vosotros, nada más oír “estudio eco- logía. Sin embargo, al no hacer un seguimiento temporal y al estudiar la
lógico”, automáticamente hace una asociación mental con “medidas enfermedad y el supuesto factor de riesgo simultáneamente, no puede
preventivas”, y esto es ABSOLUTAMENTE INCORRECTO. Para evaluar ac- saber si éste lo es o no en realidad, precisándose estudios analíticos pos-
tividades de prevención, se dispone de diseños específicos, tales como teriores que lo confirmen.
los ensayos de campo o los estudios de intervención comunitaria. No
entendemos el motivo de este error tan común, pero sabemos que
existe por la experiencia de los años. Esperamos que, después de leer P183 MIR 2009-2010
este comentario, ninguno de vosotros lo vuelva a cometer. Opción 4,
incorrecta. Una pregunta muy clásica en el examen MIR. Debes aprender a distinguir
muy bien los estudios de cohortes de los de casos y controles. Es frecuen-
La respuesta correcta es la 2. Se trata de un estudio observacional y pros- te que intenten que los confundas. Si quieres distinguirlos con facilidad,
pectivo, por lo que estaríamos ante un estudio de cohortes. la pregunta fundamental es la siguiente: ¿partimos de dos grupos con
ausencia de enfermedad, o contamos con un grupo de individuos en-
fermos y otro de sanos? En el primer caso, estaremos ante un estudio de
P181 MIR 2009-2010 cohortes; en el segundo, ante un estudio de casos y controles.

Una pregunta que ya había aparecido en el MIR antes de esta convocato- En este enunciado nos dicen que tenemos un grupo de niños que ya han
ria. Lo único que cambia es la forma de preguntarse, pero en esencia es presentado síndrome de Reye, con lo que la respuesta está clara. Estamos
siempre la misma. ante un estudio de casos y controles. Por otra parte, el diseño del estudio

209
DESGLOSES
COMENTADOS MIR
es retrospectivo (preguntamos si la madre tomó ácido acetilsalicílico). La • Otra posible desventaja es que, si se hace con respecto a demasiadas
respuesta correcta sería, por tanto, la opción 3. variables (sobreapareamiento), puede dificultar en extremo la obten-
ción de la muestra necesaria.

P185 MIR 2009-2010 Respecto al resto de las opciones, la 2 y la 3 son falsas, ya que el aparea-
miento no implica utilizar un diseño cruzado, ni tampoco que un sujeto
Esta pregunta hace alusión a conceptos muy preguntados en el examen actúe como su propio control (lo que, en esencia, sería un diseño cruza-
MIR, que por lo tanto hay que dominar. En un estudio de cohortes se do). Por otra parte, la respuesta 4 es claramente falsa, puesto que esta-
plantean hipótesis, es decir, es analítico. La respuesta incorrecta, por lo mos hablando de estudios de casos y controles, y en ellos no habría un
tanto, sería la 2. Al no asignarse de forma controlada, los posibles facto- seguimiento prospectivo.
res de estudio son observacionales (un ensayo clínico, donde es el inves-
tigador el que lo asigna, sería experimental). La única opción válida es la 1. Aunque habitualmente se utiliza un control
por caso, existen estudios donde se realiza una aleatorización distinta
El estudio de cohortes es longitudinal porque existe un seguimiento a lo (1:2, 1:3) usando más de un control por caso. Si no se supiese esto, la
largo del tiempo. Es en los transversales donde no hay seguimiento en el pregunta podía resolverse fácilmente por exclusión.
tiempo (estudios de prevalencia, por ejemplo).

Los estudios de cohortes son prospectivos, salvo en casos muy concretos P205 MIR 2008-2009
(cohortes histórico, que sería retrospectivo, una excepción, por lo que la
opción 1 puede considerarse cierta). Una pregunta difícil, donde la forma más sencilla de resolverla es descar-
tando opciones:
• La respuesta 1 es incorrecta. No puede plantearse este estudio en
P186 MIR 2009-2010 forma de ensayo clínico, por razones éticas. Está claramente demos-
trado que la triple terapia disminuye la transmisión vertical del VIH,
El posible problema que nos están describiendo en el enunciado, y que por lo que no sería aceptable realizar este diseño, ya que implicaría
pretendemos evitar, es el llamado sesgo de memoria, típico de los estu- transmitir el VIH al grupo no tratado, cuando esto podría evitarse.
dios de casos y controles. En ellos, los casos (pacientes con la enferme- • La respuesta 2 no puede ser válida. Una variable de estudio es la
dad) recuerdan más fácilmente posibles exposiciones que los controles, presencia de retraso psicomotor, y la otra es la infección por VIH,
ya que éstos no han sufrido ninguna consecuencia, por lo que estarían cuando lo que nos interesa es la exposición o no exposición a anti-
menos motivados para recordarlas. rretrovirales.
• La opción 3 es falsa, porque se limita a estudiar lo que sucede en
Una forma muy inteligente de protegerse frente a este error sistemático niños con VIH, cuando el enunciado nos pide independencia de este
es lo que dice la respuesta 3. En lugar de confiar en lo que dice el paciente factor (es decir, que estudiemos los infectados y los no infectados).
(que puede no recordarlo, sobre todo si es un control), buscar este dato en • La respuesta 5 no tiene sentido. Si se diseña un estudio de casos y
un registro totalmente objetivo: una base de datos sobre las prescripciones controles, los casos deberían ser los que tienen retraso psicomotor;
médicas que se realizaron durante el embarazo de las participantes en el los controles, los que no lo tienen. Después, se investigaría su exposi-
estudio. De este modo, estaríamos protegidos frente al sesgo de memoria. ción o no a estos fármacos.

La respuesta correcta es la 4, aunque su redacción resulta bastante con-


P196 MIR 2008-2009 fusa. Lo que está proponiendo, con otras palabras, es seleccionar dos
grupos: niños cuya madre tomó antirretrovirales y niños cuya madre no
El apareamiento es el proceso mediante el cual se selecciona a los contro- lo hizo, comparando después la aparición de casos de retraso psicomotor
les, considerando que éstos tengan características similares a los casos, (incidencia de retraso psicomotor). En esencia, un planteamiento similar
con respecto a una o más posibles variables. Éstas pueden ser el sexo, a lo que decía la opción 1, pero éticamente factible (en forma de estudio
edad y condición socioeconómica, entre otras muchas posibles. Este pro- de cohortes, un diseño observacional). Puede plantear dudas cuando ha-
cedimiento de reclutamiento de los controles tiene como ventajas au- bla de niños “no infectados” por el VIH, porque esto no asegura la premisa
mentar la eficiencia estadística, y disminuir el sesgo asociado a factores de independencia de infección que mencionan en el enunciado. Sin em-
de confusión conocidos. No obstante, en ningún caso podríamos afirmar bargo, de las cuatro respuestas, es la más aceptable. Habría que conside-
que esto “garantiza” la eliminación de factores de confusión. Por ello, la rarla, si no totalmente correcta, al menos sí como “la más correcta”, y por
respuesta 5 es incorrecta. tanto la solución a la pregunta.

El uso de esta técnica plantea otros inconvenientes:


• Si apareamos casos y controles respecto a cualquier variable, como P207 MIR 2008-2009
el sexo, ya no podríamos analizar el posible efecto de riesgo de esta
variable, ya que por definición se distribuiría igual en los casos y en Los estudios descriptivos son los que, como su nombre indica, describen
los controles. las características y la frecuencia de un problema de salud (respuesta 5,

ESTA DÍSTICA Y EPIDEMIOLOGÍA 210


Estadística y epidemiología
correcta). En cambio, los analíticos tratan de establecer una relación de gunta 209, MIR 08-09 y, si también la fallas, lee el comentario que dedica-
causalidad entre un potencial factor de riesgo y una enfermedad. mos a esta pregunta, porque explica las dos.

Los estudios transversales tienen carácter descriptivo, pero también pue- En los estudios de cohortes, el investigador identifica dos grupos de su-
den tener un carácter analítico, ya que pueden utilizar una medida de jetos, uno expuesto al factor en estudio (fármaco, factor de riesgo) y otro
asociación (razón de prevalencia), de interpretación análoga al riesgo re- no expuesto. Después, los sigue a lo largo del tiempo para ver la inciden-
lativo y a la odds ratio. Por tanto, las respuestas 2 y 3 son correctas. cia de enfermedad. No son útiles para enfermedades raras o poco fre-
cuentes, porque aunque siguiéramos la cohorte durante mucho tiempo
Tal como dice la respuesta 4, la medición de la exposición y enfermedad podrían no aparecer, o no alcanzarse un número de enfermos adecuado
se realiza a la vez, lo que resulta bastante lógico, ya que se limitan a estu- en ninguno de los dos grupos. Tampoco son útiles para enfermedades
diar un momento puntual del tiempo (nunca puede existir seguimiento con periodo de inducción largo, porque el estudio se prolongaría mucho
en un estudio transversal, por concepto). y su organización sería cara y complicada. Sin embargo, sí que lo son para
exposiciones raras, por las razones que exponemos en el comentario de
La respuesta falsa es la 1. Podrías llegar a esta conclusión de dos maneras: la pregunta 209.
• Por conocimientos teóricos, a partir de lo expuesto hasta ahora.
• Por sentido común. El enunciado te dice que hay una opción falsa, que
tienes que encontrar, por lo que también habrá cuatro correctas. Las P219 MIR 2008-2009
respuestas 2 y 3 dicen que, aparte de describir, pueden tener propósitos
analíticos (o, en otras palabras, investigar asociaciones). Por tanto, dicen Debes aprender a distinguir muy bien los estudios de cohortes de los de
lo mismo, y como no puede haber dos falsas a la vez, 2 y 3 son obligada- casos y controles. Es muy frecuente que intenten que los confundas. Es
mente ciertas. Teniendo en cuenta que se oponen a la 1 (dice que sólo la tercera pregunta sobre el mismo tema, en la misma convocatoria (ver
pueden estimar prevalencia), ésta debe ser necesariamente falsa. también preguntas 209 y 216, MIR 08-09).

Para diferenciarlos, es fundamental fijarte en el diseño del estudio (retros-


P209 MIR 2008-2009 pectivo en casos y controles, prospectivo en el de cohortes). Otra diferen-
cia importante es que, en el de casos y controles, partimos de enfermos y
Todo un clásico en el examen MIR. Debes aprender a distinguir muy bien sanos, y se investiga la exposición previa a ciertos factores. En cambio, en
los estudios de cohortes de los de casos y controles. Es frecuente que uno de casos y controles partiríamos de un grupo de personas expuestas
intenten que los confundas. y otro de no expuestas, todos sanos al principio del estudio. Luego, con el
paso del tiempo, comparamos cuántos enferman en cada grupo.
Para distinguir estos dos tipos de estudio, la pregunta fundamental es
la siguiente. ¿Partimos de dos grupos con ausencia de enfermedad, o con- Este enunciado nos dice que los pacientes con infección neumocócica
tamos con un grupo de individuos enfermos y otro de sanos? En el primer fueron comparados con pacientes sanos (controles), comparándose los
caso, estaremos ante un estudio de cohortes; en el segundo, ante un es- antecedentes de asma. Se trataría, por tanto, de un estudio de casos y
tudio de casos y controles. controles. La medida de asociación sería la odds ratio, mientras que en los
de cohortes se emplea el riesgo relativo.
Sólo con esta reflexión, te darías cuenta de que la respuesta falsa es
la 1. Los estudios que parten de la exposición, analizando la posterior
aparición de enfermedad, son los de cohortes. En cambio, los de casos P198 MIR 2007-2008
y controles parten de individuos enfermos y sanos, y les preguntan por
antecedentes de exposición. Pese a que parece una pregunta complicada, en realidad es bastante fácil
si tienes claros los conceptos fundamentales de los niveles de evidencia
De esta manera, si deseamos medir los efectos de exposiciones raras, como científica.
dice la primera opción, lo que habría que hacer es identificar a un grupo
de personas expuestas, y comparar lo que sucede respecto a un grupo no Los distintos tipos de estudio están más protegidos de sesgos y, en con-
expuesto. Por ejemplo, si queremos comprobar las consecuencias de la ex- secuencia, ofrecen mayor rigor científico, cuando cumplen las siguientes
posición al asbesto (una exposición rara), al principio del estudio estarían características:
sanos todos los participantes. Y, según pasase el tiempo, observaríamos • Sentido prospectivo del estudio.
una mayor incidencia de mesotelioma, cáncer broncogénico y fibrosis pul- • Asignación aleatoria de los distintos grupos.
monar en los expuestos, entre otras posibles consecuencias. • Existencia de un grupo control concurrente.
• Uso de enmascaramiento, tanto de pacientes como de investigadores.
• Inclusión de un número suficiente de pacientes como para detectar
P216 MIR 2008-2009 las diferencias, en caso de existir.

A veces, en una misma convocatoria, un mismo concepto puede resolver De los diseños que nos ofrecen, deberíamos elegir uno que sea pros-
dos preguntas (a veces, incluso más). Te invitamos a enfrentarte a la pre- pectivo, experimental y aleatorio, siendo el ensayo clínico el que cumple

211
DESGLOSES
COMENTADOS MIR
estos requisitos y el que mayor grado de evidencia científica ofrece (res- en lo referente a su exposición a un AINE, comparando con la propor-
puesta 1, correcta). ción de exposición en personas que no han padecido infarto (controles).
Recuerda que, en este tipo de estudios, la medida de asociación es la
odds ratio (OR), mientras que en los de cohortes se emplea el riesgo re-
P199 MIR 2007-2008 lativo (RR).

Los estudios de cohortes son un tema muy habitual en el MIR. La mayoría


de las preguntas intentan que los confundas con los de casos y controles. P202 MIR 2007-2008
Veamos opción por opción:
• Respuesta 1: la medida de asociación que se utiliza es el riesgo relati- En el examen MIR es fundamental que sepas distinguir entre los varios
vo (RR). La odds ratio (OR) se emplea en los de casos y controles. tipos de estudio, así como sus ventajas y desventajas.
• Respuesta 2: los estudios de prevalencia se llaman también estudios
de corte, y no de cohortes. Los estudios de casos y controles parten de un grupo de individuos
• Respuesta 3: es la respuesta correcta. Un estudio de cohortes consiste enfermos (casos) y uno de sanos, comparables en todo salvo en el pa-
en comparar dos grupos, uno expuesto y otro no expuesto a deter- decimiento de la enfermedad. Constituidos los grupos, se estudia la ex-
minado factor, siguiéndoles después en el tiempo y comparando las posición de ambos a distintos factores. Por tanto, puede decirse que van
incidencias. del efecto (enfermedad) a la causa, es decir, son retrospectivos y longi-
• Respuesta 4: el estudio de cohortes implica un seguimiento en el tudinales.
tiempo, es decir, no se estudia una muestra en un momento puntual,
como se haría en uno de prevalencia. Ventajas:
• Respuesta 5: cuando se plantea un estudio de cohortes, cuyo desarro- • Son de corta duración y no precisan un gran tamaño muestral, así
llo puede implicar un seguimiento prolongado, es lógico que se pro- que son más baratos que otros diseños (respuesta 5, correcta).
duzcan pérdidas. Por esto, antes de comenzar el estudio, se hace una • Son ideales para el estudio de enfermedades raras (respuesta 1, co-
previsión, para tener un tamaño de muestra adecuado a pesar de estas rrecta), o cuando el período de inducción es muy prolongado (res-
pérdidas. puesta 2, correcta).
• Son muy útiles para el estudio de la multicausalidad de la enferme-
dad (respuesta 4, correcta).
P200 MIR 2007-2008 • Es el mejor tipo de estudio para formular nuevas hipótesis etiológicas.
P200 (MIR 07-08) Diferencias entre los estudios de cohortes
y los de casos y controles Sin embargo, tienen un grave inconveniente: la posibilidad de que se
produzcan sesgos es muy alta. Por eso, es difícil constituir un grupo ade-
cuado de comparación (respuesta 3, falsa). Por la misma razón, la evi-
dencia científica que pueden aportar estos estudios es menor que los de
cohortes y mucho menor que los ensayos clínicos.

P199 MIR 2006-2007

Los estudios de cohortes y los casos y controles han sido muy pregunta-
dos. Esta pregunta es bastante representativa de las preguntas de esta-
dística y epidemiología de los últimos años.

Estos estudios son de tipo analítico, no observacional, así que la opción


2 es falsa. Los estudios de cohortes no son aconsejables para investigar
enfermedades poco habituales, sino los de casos y controles (respues-
ta 3, falsa). Los pacientes que tienen la enfermedad son los casos, no
los controles (opción 4 incorrecta). Por último, cabe mencionar que los
estudios de cohortes acostumbran a ser prospectivos, pero existe otro
Pregunta muy típica del MIR. Has de aprender a distinguir muy bien los planteamiento, que es el de cohortes retrospectivo (respuesta 5, falsa).
estudios de cohortes de los de casos y controles. Es normal que inten- En cambio, la respuesta 1 nos da idea de una de las fuentes más comunes
ten que los confundas. Para diferenciarlos, la pregunta fundamental es para conseguir enfermos en este tipo de estudios.
la siguiente: ¿partimos de dos grupos con ausencia de enfermedad, o
contamos con un grupo de individuos enfermos y otro de sanos? En el Esta pregunta, en cualquier caso, es anulable por lo dudoso de la res-
primer caso, estaremos ante un estudio de cohortes; en el segundo, ante puesta 5, ya que aunque haya un subtipo de estudio de cohortes retros-
un estudio de casos y controles. En esta pregunta, la respuesta correcta pectivos, no es la norma. Así fue interpretado por el Tribunal, que la anuló
es la 5, donde los pacientes con enfermedad (casos) fueron investigados al considerar que hacía dos posibles respuestas válidas.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 212


Estadística y epidemiología
P206 MIR 2006-2007 que partes de una población seleccionada. Tampoco tienes información
sobre la prevalencia, dado que el número de enfermos sólo depende de
Es una pregunta muy típica del MIR. Han preguntado varias veces ya los que tú elijas. Debido a esto, la fuerza de asociación no se puede calcu-
acerca de los estudios epidemiológicos y sus características. Recuerda lar directamente, como en el estudio de cohortes, sino de forma indirecta
que en los estudios de casos y controles se parte de un grupo de indivi- mediante la odds ratio.
duos enfermos (casos) y otro grupo comparable al primero en todo sin
la enfermedad (controles) –no es al azar–, estudiando la exposición de
ambos a distintos factores de riesgo. Por eso, es un estudio retrospectivo P195 MIR 2005-2006
que permite ver el riesgo para una enfermedad de diversos factores etio-
lógicos, corto y barato, ideal para el estudio de enfermedades raras, pero Pregunta fácil acerca de los estudios epidemiológicos. Los tipos de es-
en gran medida sujeto a sesgos. tudios epidemiológicos constituyen uno de los temas más pregunta-
dos en epidemiología. La opción 1 dice que pueden ser retrospectivos.
Los ensayos clínicos son estudios que por definición son prospectivos
P207 MIR 2006-2007 y experimentales. En cambio, los estudios de cohortes pueden ser re-
trospectivos: son los llamados estudios de cohortes históricas. En ellos,
Es una pregunta muy típica del MIR. Nuevamente nos preguntan acerca el investigador identifica, mediante registros, una cohorte expuesta en
de las ventajas y desventajas de un tipo de estudio epidemiológico. Los el pasado a un factor de riesgo, y otra cohorte no expuesta. Mediante
estudios de cohortes parten de un grupo de individuos expuestos al fac- dichos registros (por ejemplo, historias clínicas) sigue la evolución de
tor de riesgo (cohorte expuesta) y de otros comparables en todo pero ambas cohortes comparando los resultados. La opción 1 es, por tanto,
que no estén expuestos al factor de riesgo (cohorte no expuesta) y se falsa.
estudia la incidencia de enfermedad en ambas cohortes. Por esto, son es-
tudios longitudinales, de seguimiento, prospectivos generalmente (ex- Tanto en los estudios de cohortes como en el ensayo clínico hay un grupo
cepto cohortes históricas), que muchas veces requieren un gran periodo de expuestos (a un factor de riesgo y a un tratamiento, respectivamente) y
de seguimiento. Son muy útiles porque permiten evaluar la relación en- un grupo de no expuestos (opción 2, correcta). La diferencia entre ambos
tre la exposición en estudio y muchas enfermedades (multiefectividad radica en que en el ensayo clínico existe asignación controlada del factor
de un factor de riesgo), pero son caros, no siendo útiles para el estudio de estudio; mientras que en el estudio de cohortes dicha asignación no
de enfermedades raras o con largo periodo de incubación. Si bien son existe, el factor de riesgo ya está presente en la cohorte expuesta sin que el
estudios con posibilidad de sesgos baja, recuerda que el ensayo clínico investigador se lo haya asignado. Por consiguiente, la opción 3 es incorrec-
le supera en cuanto a calidad de evidencia científica, teniendo mayor va- ta. La opción 4 también es incorrecta, ya que los estudios transversales son
lidez interna. principalmente descriptivos y estudian la relación entre una enfermedad y
algunas variables en un momento concreto del tiempo, buscando encon-
trar una posible relación entre un FR y una enfermedad que posteriormen-
P208 MIR 2006-2007 te tendrá que ser verificada por estudios analíticos. Los ensayos clínicos
y los estudios de cohortes son estudios analíticos: analizan una hipótesis
Pregunta de mediana dificultad. Los estudios ecológicos pueden ser trans- intentado establecer una relación de causalidad entre factor de riesgo y
versales o longitudinales. Son estudios en los que la unidad de análisis son enfermedad.
grupos de individuos, no individuos (por ejemplo, clases de una escuela,
ciudades, regiones…). Son útiles cuando no se pueden hacer mediciones P195 (MIR 05-06) Estudio de casos y controles
de exposiciones individuales (contaminación del aire, ruidos…). Permiten
describir diferencias en poblaciones que han de ser estudiadas con más
detalle posteriormente. En atención a lo cual, los datos son promedios de
poblaciones, se usan medidas aproximadas de exposición (impuestos por
alcohol, ventas de cigarrillos… que es a lo que se refiere con datos secun-
darios) y de enfermedad (mortalidad en vez de incidencia…), y esto limita
el valor de los hallazgos.

P195 (MIR 05-06) Estudio de cohortes


P218 MIR 2006-2007

Es una pregunta muy típica del MIR. Han preguntado varias veces ya
acerca de los estudios epidemiológicos y sus características. Recuerda
que en los estudios de casos y controles se parte de un grupo de indivi-
duos enfermos (casos) y otros comparables a ellos en todo sin la enfer-
medad (controles) –no es al azar– estudiando la exposición en ambos de
distintos factores de riesgo. En los estudios de casos y controles no pue-
des obtener información sobre la incidencia de la enfermedad, puesto

213
DESGLOSES
COMENTADOS MIR
P196 MIR 2005-2006 sana, el enfermo está más motivado para saber qué ha tomado en el pasado
que la persona sana. Cogiendo controles también enfermos, aunque sea por
Los estudios ecológicos han sido objeto de pregunta en el MIR precedente causas no relacionadas con el factor de estudio, conseguimos que todos los
y este año han vuelto a ser preguntados. En los estudios ecológicos de ten- pacientes en estudio estén igual de motivados en recordar antecedentes.
dencias temporales, la unidad de análisis son grupos de individuos, no indi-
viduos. En este estudio que nos describen precisamente sólo disponemos
de datos poblacionales, no individuales, acerca de la mortalidad por asma y P200 MIR 2005-2006
del consumo de cierto medicamento (opción 4 correcta). Permiten describir
diferencias en poblaciones que habrán de ser estudiadas con más detalle Se trata de una pregunta sencilla y clásica. Casi todos los años caen pre-
posteriormente. Su problema es que las medidas usadas son aproximadas guntas de este tipo. Nos dan información sobre el diseño de un estudio
de exposición y de enfermedad, lo que limita el valor de los hallazgos. epidemiológico y nos piden que identifiquemos a cuál corresponde. El
investigador pretende estudiar la relación entre distintos factores de ries-
go y la aparición de enfermedad; por tanto, se trata de un estudio ana-
P197 MIR 2005-2006 lítico. Esto nos permite descartar estudios descriptivos (opciones 3 y 4).
Vemos que el investigador desempeña un papel pasivo, puesto que no
Se trata de una pregunta muy repetida en el MIR y asequible, acerca de los ha decidido a qué factores de riesgo se van a exponer los participantes
tipos de estudios epidemiológicos. Hemos de saber reconocer de dónde ni el nivel de exposición. Tan sólo se limita a observar lo que ocurre a lo
parte el que ha diseñado el estudio y a dónde quiere llegar. Se recogen pa- largo del tiempo. Es, en consecuencia, un estudio de tipo observacional
cientes con hiperprolactinemia, es decir, enfermos (casos) y se aparean con (opción 2, incorrecta). Una vez llegados a este punto, sólo nos queda fi-
pacientes de su misma edad y sexo con EPOC, enfermedad cardiovascular jarnos en el criterio utilizado para la selección de los sujetos. En relación
y fracturas traumáticas (controles). En ambos grupos se investiga si han con esto, vemos que se han seleccionado en función del factor de riesgo,
consumido un neuroléptico, es decir, partimos de la enfermedad (hiper- estando todos sanos al inicio del estudio. En el seguimiento se pretende
prolactinemia) y buscamos el factor de riesgo en el pasado (neuroléptico). estudiar la aparición de enfermedad. La pregunta nos está describiendo
claramente un diseño de cohortes (opción 5 correcta).
Fíjate bien en cómo han elegido a los controles, se han apareado por edad y
sexo, y el hecho de que se hayan elegido pacientes con otras enfermedades
que la hiperprolactinemia (EPOC, enfermedad cardiovascular y fracturas) es P193 MIR 2004-2005
para evitar un sesgo frecuente de los estudios de casos y controles como
es el sesgo de memoria. Si se pregunta por antecedentes farmacológicos En esta pregunta nos plantean un estudio de carácter retrospectivo, don-
a un paciente con hiperprolactinemia y se toma como control una persona de vamos del efecto (enfermedad) a la causa. Como ves, partimos de un

P200 (MIR 05-06) Tipos de estudios epidemiológicos

ESTA DÍSTICA Y EPIDEMIOLOGÍA 214


Estadística y epidemiología
grupo de enfermos, que son los casos, y otro de controles, que serán su- P206 MIR 2004-2005
jetos de características semejantes, salvo por la enfermedad, de la que
están libres. Partiendo de su estatus de sano o enfermo, se investiga la Los estudios de casos y controles presentan el problema de ofrecer
presencia de posibles causas a las que se hayan expuesto en el pasado un grado bastante bajo de evidencia científica. Esto se debe a que, en
(en este caso, benzodiacepinas). comparación con otros estudios, son más vulnerables a sesgos. Algunos
sesgos típicos de los casos y controles son la falacia de Neyman y, muy
Este diseño corresponde a un estudio de casos y controles. No lo confun- especialmente, el sesgo de memoria. Este último consiste en que los ca-
das con la opción 2, el estudio de cohortes, donde partimos de sujetos sos, al padecer la enfermedad, están más motivados para recordar posi-
expuestos y no expuestos, evaluando con el paso del tiempo cuántos bles antecedentes que los controles.
desarrollan la enfermedad en cada grupo.

P129 MIR 2003-2004


P194 MIR 2004-2005
Pregunta fácil, podríamos decir que es casi un clásico del MIR. En todo
Los estudios ecológicos tienen como unidad de análisis los grupos de estudio de casos y controles, la principal fuente de sesgo se sitúa en el
individuos, no los individuos en sí. Son útiles cuando no se pueden ha- momento de recogida de información. Si la información recogida en el
cer mediciones individuales. En este caso, sería el diseño más adecuado, grupo de los casos y en el de los controles no es idéntica, la posibilidad
puesto que estamos estudiando mediciones colectivas (accidentes por de cometer sesgos de clasificación es muy alta, lo cual puede llegar a
país, renta per cápita…). invalidar un estudio. De modo que es fundamental la realización de una
anamnesis farmacológica idéntica en ambos grupos.
Estos estudios tienen la desventaja de que manejan valores promedio de
poblaciones, por lo que son menos exactos que los que miden de forma
individual. P131 MIR 2003-2004

Se trata de una pregunta ambigua, que según se interprete tiene dos op-
P195 MIR 2004-2005 ciones correctas posibles. En el enunciado te dice que se selecciona una
muestra de pacientes con bronquitis crónica y los asigna a tratamiento o
Los estudios de cohortes son longitudinales y prospectivos. Se basan en no tratamiento. Se trata por tanto de un estudio prospectivo en el que se
la comparación de dos grupos, uno de ellos expuesto a un factor de ries- estudian individuos (descartadas opciones 2 y 3).
go y el otro no. Se les sigue en el tiempo y se compara la diferencia que
existe respecto al desarrollo de enfermedad, es decir, se comparan las La respuesta correcta está entre las opciones 1 (estudio de cohortes) y la
incidencias. Esto es lo que hacen en el estudio que nos describen: selec- 4 (ensayo clínico), y elegir entre una y otra depende fundamentalmente
cionan personas basándose en su exposición a factores de riesgo, y los de si ha habido aleatorización o no en la asignación de tratamiento.
reevalúan cada dos años (prospectivo), comparando cuántos desarrollan
la enfermedad (incidencia). El truco de esta pregunta está en el enunciado, donde nos indican que
estamos hablando de pacientes “en la práctica (clínica) habitual”. Es decir,
Ten cuidado: no se trata de un ensayo clínico, dado que no es el investi- los corticoides por vía inhalatoria se han pautado o no, en función de las
gador el que decide qué sujetos se exponen y cuáles no, sino los propios indicaciones de cada paciente, no al azar. Esto descarta el ensayo clínico
participantes. Es decir, el estudio de cohortes es observacional. Si fuera y nos deja al estudio de cohortes (respuesta 1) como opción correcta.
el investigador el que asignase quién se expone y quién no, sería expe-
rimental.
P132 MIR 2003-2004

P200 MIR 2004-2005 Pregunta difícil sobre diseños epidemiológicos. Un ensayo clínico se ca-
racteriza porque el investigador introduce el factor de estudio y lo asigna
Los estudios experimentales son aquellos en los que el investigador asig- a uno y otro grupo de pacientes. Aparentemente, esta pregunta corres-
na el factor de estudio (por ejemplo, qué fármaco o vacuna, cuánta dosis, pondería a un ensayo clínico, sin embargo, el investigador no introduce el
cuánto tiempo…). Por el contrario, en un estudio observacional se limi- factor de estudio, sino que identifica un grupo de pacientes ya tratados.
taría a estudiar lo que sucede en un grupo de individuos que se exponen Es decir, hay un grupo expuesto y uno no expuesto, por lo que en realidad
por sí mismos. se trata de un estudio prospectivo no experimental (estudio de cohortes).

El ensayo clínico es experimental porque el investigador es quien deter-


mina lo que se administra, a qué dosis y a quiénes. En cambio, un estudio P137 MIR 2003-2004
de cohortes sería observacional. Por ejemplo: seguir durante tres años a
un grupo de fumadores y otro de no fumadores, y comparar la mortalidad Es una pregunta sobre un tema básico en epidemiología, los tipos de
cardiovascular (el ser fumador o no fumador no lo decide el investigador). estudios epidemiológicos, y la formulación de la misma es muy sencilla.

215
DESGLOSES
COMENTADOS MIR
El estudio en el que, partiendo de un grupo de individuos enfermos (ca- nada realmente representa al conjunto de la población, aumentando la
sos) y de otros comparables a ellos en todo, pero que no tienen la enfer- validez externa.
medad (controles), se determina la exposición, en el pasado, a distintos
factores de riesgo, se llama estudio de casos y controles.
P194 MIR 2013-2014
Se trata, pues, de un estudio observacional (no hay asignación del factor
de estudio por el investigador) y longitudinal (buscamos el posible factor Un sesgo de memoria (opción 2) se observa de manera frecuente en los
de riesgo en el pasado). estudios retrospectivos, donde se pregunta por el antecedente de ex-
posición a un factor de estudio en un periodo de la vida, existiendo la
Las ventajas del estudio de casos y controles son: posibilidad de olvido de esa exposición. El hecho de haber padecido la
• Es de corta duración. enfermedad, en este caso una malformación neonatal, hace que el sujeto
• Es bueno para el estudio de enfermedades raras. esté más predispuesto a recordar esa exposición, mientras que el grupo
• Es útil para el estudio de enfermedades de largo periodo de inducción. control no tanto.
• El coste es bajo.
• Es bueno para el estudio de la multicausalidad de la enfermedad (los
posibles factores de riesgo de una determinada enfermedad). P196 MIR 2013-2014
• Es el mejor para formular nuevas hipótesis etiológicas.
Un sesgo o factor de confusión es un factor de riesgo que se relaciona
Tiene la desventaja de que es más vulnerable a sesgos (de ahí que su con el factor de estudio y, a su vez, con la enfermedad. En este caso, una
nivel de evidencia científica sea bajo en comparación con otros, como los posible asociación de tabaco y cáncer de páncreas, así como de consumo
de cohortes o los ensayos clínicos). de tabaco y de alcohol, puede ser causa de un sesgo de confusión si no
te tiene en cuenta. Para controlar los factores de confusión podemos rea-
lizar técnicas de apareamiento, aleatorización, restricción, análisis multi-
P141 MIR 2003-2004 variante y estratificación.

Pregunta difícil sobre el diseño de ensayos clínicos. El principal inconve-


niente de los ensayos clínicos en los que se utiliza placebo es el ÉTICO. P177 MIR 2011-2012
En consecuencia, los pacientes que consienten participar en el estudio,
han de saber que pueden ser tratados con un fármaco ineficaz. Una vez Los factores de confusión son un tipo de error sistemático o sesgo que
hecha la asignación del fármaco o placebo, el paciente no debe conocer se asocian tanto al factor de exposición como al efecto. A diferencia de
(técnicas de enmascaramiento) qué está recibiendo para evitar la pérdi- otros sesgos, no hace falta conocerlo de antemano, el factor de confu-
da del efecto placebo. sión de puede corregir a posteriori si lo detectamos durante la fase de
análisis de nuestro estudio, mediante técnicas como el análisis multiva-
riante o estratificado.

T07 Validez y fiabilidad


de los estudios epidemiológicos Recuerda que hay cinco maneras de minimizar su efecto que se resumen
en la palabra MAREA (Multivariante, Aleatorización, Restricción, Estratifi-
cación y Apareamiento).
P190 MIR 2013-2014

La validez interna está relacionada con la metodología del estudio y el P181 MIR 2011-2012
control de los errores en el diseño de éste. Por otro lado, la validez ex-
terna está relacionada con la generalización de los hallazgos más allá de La validez interna estudia el grado en el que los resultados de un estu-
los sujetos del estudio, del contexto de investigación y del momento del dio representan correctamente a la muestra que se estudia. Por tanto,
experimento. Unos criterios de inclusión y exclusión estrictos hacen que la ausencia de sesgos. Hablamos de validez interna cuando tenemos
aumente la validez interna de mi estudio, siendo un estudio explicativo controlados de manera razonable los sesgos que es lo que dice la op-
(opción 1). El problema que tiene realizar esto es que resulta difícil extra- ción 2.
polar los resultados a la población general, es decir, tener validez exter-
na. Los estudios con criterios de inclusión laxos, estudios pragmáticos,
aumentan la validez externa (opción 2). La utilización de técnicas de en- P174 MIR 2010-2011
mascaramiento, control con grupos o introducción de nuevas variantes
del mismo fenómeno permiten confirmar la consistencia del fenómeno Pregunta fácil que se contesta sin problemas conociendo los Desgloses.
estudiado (validez interna, opciones 3 y 4). De la misma manera, la asig- Hay fundamentalmente dos tipos de error: los errores aleatorios, que
nación aleatoria de los grupos de tratamiento controla la posibilidad de son debidos al azar y se corrigen aumentando el tamaño muestral, y los
error y aumenta la validez interna (opción 5). No debes confundirlo con errores sistemáticos o sesgos, que no se deben al azar y, por tanto, no se
la selección aleatoria de la muestra, que intenta que la muestra seleccio- corrigen aumentando el tamaño muestral.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 216


Estadística y epidemiología
Debemos conocer los tres tipos más importantes de sesgos: mascaramiento. Confusión (factor de confusión o confounding) (respues-
• Sesgos de selección: se controlan mediante aleatorización. ta 5, incorrecta) es otro tipo de error sistemático en el que una variable
• Sesgos de información: se controlan mediante técnicas de enmasca- ajena al estudio modifica los resultados que se obtienen. Todo factor de
ramiento (respuesta 2, falsa). confusión debe cumplir tres condiciones: ser un factor de riesgo para la
• Factor de confusión, todo factor de confusión debe cumplir tres con- enfermedad, estar asociado con la exposición y no ser un paso interme-
diciones: dio entre la exposición y la enfermedad. Para prevenirlo tenemos distin-
- Ser un factor de riesgo para la enfermedad. tas técnicas según nos encontremos en la fase de diseño o en la fase de
- Estar asociado con la exposición. análisis estadístico. Este concepto se ha preguntado reiteradamente en
- No ser un paso intermedio entre la exposición y la enfermedad el examen MIR.
(respuesta 1, falsa).

Se puede controlar en la fase de diseño mediante aleatorización, apa- P234 MIR 2010-2011
reamiento o emparejamiento (respuesta 3, correcta) y restricción. Y en
la fase de análisis estadístico, mediante análisis estratificado y multi- Pregunta fácil del tema más recurrente del examen. Para el control de los
variante. De esto se deduce que las respuestas 4 y 5 son claramente errores sistemáticos o sesgos, se dispone de una serie de técnicas como
falsas. la aleatorización o el enmascaramiento. En concreto para evitar la false-
dad sobre la valoración subjetiva de los efectos del fármaco problema
P174 (MIR 10-11) Tipos de error enmascaramos la información al paciente, lo que sería simple ciego, o al
paciente y al médico lo que sería doble ciego. No hay que confundir con
AFECTA
SOLUCIÓN los errores aleatorios que se controlarían aumentando el tamaño mues-
CARACTERÍSTICAS A LA VALIDEZ
O CONTROL
INTERNA tral.

· Simétrico
· Incorregible
Error
· Impredecible NO ↑ tamaño muestral P198 MIR 2008-2009
aleatorio
· Estimable por
estadística Tal como se explica en la respuesta 1, si la mortalidad es mayor por otras
· Sesgo de selección: razones distintas al factor de estudio, esto reduce las posibilidades de
Aleatorización sufrir el evento de interés (arritmias y muertes por causas cardíacas). Por
· Asimétrico · Sesgo de clasificación:
este motivo, un menor número de eventos en el grupo experimental po-
· Corregible Enmascaramiento
Sesgo dría no deberse a la eficacia del tratamiento, ya que existe una mayor
· Predecible · Factor de confusión:
o error SÍ
sistemático · Prevención Aleatorización probabilidad de fallecer por otras causas, disminuyendo en apariencia el
y control Apareamiento número de muertes por causas cardíacas. Por otra parte, en la convoca-
por epidemiología Restricción
Estratificación toria del MIR 02-03, apareció una pregunta prácticamente idéntica (pre-
Análisis multivariante gunta 43), con una respuesta correcta que apoya el argumento citado, y
que coincide textualmente con la respuesta 1.

Una vez más, aprovechamos la oportunidad para demostrarte la gran


P184 MIR 2010-2011 importancia de analizar preguntas antiguas, que sirven de “inspiración”
para las nuevas.
Pregunta fácil sobre un tema que ya ha aparecido en el examen MIR. La
respuesta correcta es la 2, ya que se dice que un estudio tiene validez
externa cuando los resultados del estudio (en este caso, pacientes dia- P203 MIR 2008-2009
béticos provenientes de una unidad de diabetes hospitalaria) son apli-
cables a otros individuos distintos a los del estudio (en este caso, otros El sesgo de memoria, también conocido como sesgo amnésico, es típico
diabéticos, procedentes de la consulta de un médico de atención prima- de los estudios de casos y controles. En este tipo de estudios, los casos,
ria). Por otra parte, la validez interna (respuesta 1, incorrecta) es el grado al saber que padecen la enfermedad, están más motivados para recordar
de validez del resultado para los pacientes del estudio. La precisión o posibles exposiciones a factores de riesgo que los que no la padecen.
fiabilidad (respuesta 3, incorrecta) es el grado de reproductibilidad de un Este tipo de sesgo se engloba en los de información o clasificación, y
estudio, es decir, el grado de similitud que presentarían los resultados si dentro de ellos, serían de clasificación incorrecta diferencial (respuesta 2,
se repitiese el estudio en condiciones similares. La validez es el grado de correcta).
ausencia de error sistemático, mientras que la precisión es el grado de
ausencia de error aleatorio. Recuerda que, en este tipo de sesgos, la medición incorrecta afecta sola-
mente a uno de los grupos de estudio (de ahí el nombre de “diferencial”,
El sesgo de clasificación, de información o de medida (respuesta 4, in- ya que les afecta de forma diferente). Si ambos grupos se afectasen de la
correcta) se produce cuando hay un error sistemático en la medición de misma forma, que no es el caso, se trataría de una clasificación incorrecta
alguna variable clave del estudio. Se controla mediante técnicas de en- no diferencial.

217
DESGLOSES
COMENTADOS MIR
P201 MIR 2007-2008 • Análisis por protocolo, donde se incluye sólo a aquellos pacientes que
han cumplido los requisitos de protocolo y/o han finalizado el estudio.
Los tipos de error son un motivo de pregunta muy reiterado en el exa- • Análisis por intención de tratar, donde se incluye a todos los pacien-
men MIR. Presta especial atención a este tema, si has fallado esta pre- tes, aunque no hayan finalizado el estudio o hayan cambiado de
gunta. En este caso, deberías haber identificado de qué tipo de error nos grupo. El análisis por intención de tratar pretende controlar las pér-
están hablando: el sesgo de información. didas que se puedan ocasionar a lo largo del estudio para mantener
la aleatoriedad. Ten en cuenta que el problema que se plantea con la
El sesgo de información se manifiesta cuando existe un error sistemático aleatorización está en la resistencia de los sujetos a ser manejados de
en la medición de alguna variable clave del estudio. La clasificación in- una forma tan impersonal. No es raro que no acepten participar en el
correcta puede afectar, de igual manera, a todos los grupos del estudio estudio y soliciten que les sean administrados los tratamientos más
o no. La forma de protegernos frente a este tipo de error son las técni- modernos o aquellos en los que el médico tenga mayor confianza.
cas de enmascaramiento (recuerda que éstas no sirven para prevenir los
factores de confusión, detalle que ya han preguntado en el MIR). Dentro
de los sesgos de información o clasificación, cabe distinguir dos grandes P208 MIR 2004-2005
grupos:
• Clasificación incorrecta diferencial: la probabilidad de clasificación Un factor de confusión es una variable ajena al estudio que nos modifi-
errónea de la exposición (en estudios de casos y controles) afecta de ca los resultados obtenidos. En este caso, estábamos estudiando alcohol
manera desigual a sanos y enfermos. También puede verse en estu- y cáncer de esófago. Más tarde, el investigador se ha dado cuenta de
dios de cohortes, cuando la clasificación de un individuo como enfer- que los pacientes que toman alcohol también fuman más, puesto que
mo o no enfermo se hace de manera distinta, según se esté expuesto el tabaco y el alcohol son hábitos que se asocian, etc. ¿Quién produce el
o no al factor de estudio. En este tipo de sesgo, puede darse tanto cáncer de esófago en realidad, el alcohol o el tabaco? Esto es lo que se
una subestimación como una sobreestimación del efecto del factor conoce como factor de confusión. Ha de cumplir tres condiciones:
de exposición en la enfermedad. Pertenecen a este grupo el sesgo • Ser un factor de riesgo para la enfermedad (el tabaco lo es, ya sabes
de memoria y el de Hawthorne (ver Manual CTO de Epidemiología y que se asocia al cáncer de esófago).
Estadística). • Estar relacionado con la exposición que estamos estudiando (tabaco
• Clasificación incorrecta no diferencial: la probabilidad de clasifica- y alcohol se asocian).
ción errónea ocurre en todos los grupos de forma similar. La conse- • No ser un paso intermedio entre la exposición y la enfermedad (ob-
cuencia sería una infraestimación del factor de exposición estudiado viamente, entre el alcohol y el cáncer de esófago no está, como paso
en la enfermedad. intermedio, el fumar).

En esta pregunta, al afectarse por igual la clasificación de expuestos y no


expuestos, se trataría de una clasificación incorrecta no diferencial, así que P147 MIR 2003-2004
la respuesta correcta es la 2 (infraestimación de la fuerza de asociación).
Se trata de una pregunta sencilla y múltiples veces preguntada en el exa-
men MIR. El sesgo por factor de confusión es, sin duda, el más relevante
P210 MIR 2005-2006 de cara al examen. Este sesgo se origina cuando una variable extraña es
capaz de modificar los resultados. Recuerda que el factor de confusión ha
Pregunta fácil por tratarse de un concepto repetido. Los errores sistemá- de cumplir tres requisitos: asociación a enfermedad, a exposición y no ser
ticos o sesgos son errores ocurridos cuando hay un fallo en el diseño o en paso intermedio. En esta pregunta nos presentan un estudio acerca de la
la ejecución del estudio, que hace que los resultados de la muestra sean relación entre cáncer y alcohol, donde encontramos una tercera variable,
distintos de la población de la que proceden. el tabaco, que se asocia a ambos.

El sesgo de selección se genera cuando se asignan sujetos al grupo con-


trol que difieren significativamente, en alguna característica clave, del
grupo problema. Este tipo de sesgos se pueden controlar mediante un
T08 Ensayo clínico
proceso de aleatorización en la constitución de los distintos grupos de
estudio (opciones 1 y 3, verdaderas). P178 MIR 2014-2015

La opción 2 es falsa, puesto que cuando utilizamos un control histórico En esta pregunta, se pide elegir un diseño de EC para estudiar la eficacia
(grupo de similares características, pero de una época anterior), lógica- de un citostático, y también la eficacia de un citostático con un anticuer-
mente los cuidados recibidos no van a ser iguales, al comparar grupos po asociado. Tanto en el diseño cruzado como en el paralelo, sólo podría-
de épocas distintas. En consecuencia, para evitar este sesgo hemos de mos comparar dos ramas, el efecto del fármaco respecto al control o el
comparar grupos concurrentes. efecto del fármaco + anticuerpo respecto al control, pero no el efecto de
cada uno por separado y entre ellos (respuestas 1 y 2, falsas). El único di-
A la hora de realizar el análisis de los resultados en un ensayo clínico (EC), seño que permite tener varias ramas y comparar entre ellas es el factorial
podemos realizar dos tipos de análisis: (respuesta 3, correcta).

ESTA DÍSTICA Y EPIDEMIOLOGÍA 218


Estadística y epidemiología
P179 MIR 2014-2015 P196 MIR 2014-2015

Los ensayos clínicos en fase I buscan estudiar datos relacionados con la El estudio que nos describen es un estudio experimental, ya que es el
farmacocinética y la farmacodinámica del fármaco (respuesta 1, falsa), investigador el que aplica el factor a estudio (tratamiento) (respuestas
por lo que suelen realizarse en voluntarios sanos (respuesta 2, falsa), aun- 1 y 5, falsas). Además, es un estudio experimental puro, ya que forma
que en determinadas circunstancias se realizan en pacientes (respuesta 3, los grupos con una aleatorización individual. Se trata, por tanto, de un
falsa). Como lo que se quiere es estudiar cómo se comporta el fármaco ensayo clínico aleatorizado, que siempre es prospectivo. Los estudios
en el cuerpo humano, no se necesita comparar entre grupos, sólo medir postautorización (poscomercialización de un fármaco) pueden ser expe-
cantidad de fármaco en sangre. Por eso, no se suelen hacer grupos con- rimentales u observacionales, siendo mucho más frecuentes estos últi-
trol ni con enmascaramiento (respuesta 5, falsa) y no son aleatorizados mos (respuestas 2 y 3, falsas).
(respuesta 4, correcta).

P199 MIR 2014-2015


P180 MIR 2014-2015
Se trata de un metaanálisis en el que han realizado un análisis de la hete-
Los ensayos clínicos se pueden clasificar, en función de sus criterios de rogeneidad, dónde han demostrado una ausencia de la misma, es decir,
inclusión y exclusión, en explicativos y pragmáticos. Los explicativos los 15 estudios que la integran llegan a conclusiones similares. En este
tienen unos criterios de inclusión estrictos, de manera que la muestra caso, el aumento del riesgo de IAM con Tromboclean, RR de 1,35 (IC; 1,15-
es muy homogénea (respuesta 2, falsa) para poder diferenciar con la 1,50), es decir el intervalo se mantiene por encima de 1, aumento del
mayor exactitud posible los efectos debidos al fármaco y no a otros riesgo de infarto significativo.
factores (respuestas 3 y 4, falsas), pero esto hace que sea más difícil
realizar inferencias a la población de sus resultados. Por otro lado, los
pragmáticos son aquéllos que tienen criterios de inclusión más laxos, P200 MIR 2014-2015
más parecidos a la población general, ya que pretenden extrapolar los
resultados a toda la población que forman los pacientes que atende- Pregunta sobre el metaanálisis, que es una revisión sistemática a partir
remos en la práctica clínica habitual (respuesta 1, correcta), por lo que de estudios publicados sobre un mismo tema. Una vez recopilados se-
generalmente requieren un mayor tamaño muestral para su realización gún los criterios establecidos a priori, haremos un análisis de la heteroge-
(respuesta 5, falsa). neidad para decidir qué modelo estadístico aplicar. Si son homogéneos,
podremos utilizar el modelo de efectos fijos; si no, utilizaremos los de
efectos aleatorios, que nos darán intervalos más amplios (respuestas 2,
P190 MIR 2014-2015 4 y 5, verdaderas). Antes de exponer las conclusiones, descartaremos la
presencia de un sesgo de publicación; aquellos estudios pequeños con
Un estudio de no inferioridad tiene como objetivo establecer un equi- resultados desfavorables tienen el riesgo de no publicarse, sin embargo
valente terapéutico frente al fármaco de referencia, en este caso el FDC- son de interés para conocer el efecto real que estudiamos (respuesta 1,
ELIPTUS. Para ello, no tendrá que demostrar una eficacia clínica exacta al verdadera). Para ello, podemos utilizar el análisis de sensibilidad o el grá-
100%, sino que se establece un valor, llamado valor delta, por debajo del fico de embudo. Debido a la ambigüedad de la respuesta 3, esta pregun-
cual no podrá considerarse equivalente al fármaco experimental. En este ta fue anulada.
caso, el valor delta es -50 y el intervalo de confianza al 95% lo incluye (-59,
+67). Esto se traduce en que con un 95% de probabilidades (lo estableci-
do para aceptar las diferencias), no podemos asegurar que el efecto del P208 MIR 2014-2015
nuevo fármaco esté entre -59 y -50, valores entre los cuales el estudio no
es concluyente (respuesta 3). La equivalencia farmacocinética (opción 4) la definiremos diciendo que
ambos fármacos tendrán una equivalencia a nivel de eficacia, seguridad
y también en el plano farmacológico, que es lo que nos refieren en el
P193 MIR 2014-2015 enunciado.

En un ensayo clínico, la realización de análisis intermedios, al igual que


la realización de comparaciones múltiples, aumenta la probabilidad de P203 MIR 2013-2014
error tipo I (respuesta 5 falsa). Pueden estar justificados por razones
éticas, para evitar que un grupo deje de beneficiarse de los efectos del La segunda fase del desarrollo de un medicamento tiene como objeti-
fármaco nuevo o por posibles efectos secundarios (respuestas 1, 2 y 3, vo principal la posología (opción 3), mediante el estudio de la relación
falsas). Al interrumpir el ensayo antes de tiempo, podemos sobrees- dosis-respuesta, para establecer las que serán las dosis según el efecto
timar o infraestimar la fuerza de asociación, ya que no hemos tenido deseado (opción 1), en función de variables como peso o función renal.
en cuenta variables como el abandono del estudio de los sujetos, ni Se suelen realizar en un grupo pequeño de pacientes, normalmente alre-
el efecto del fármaco mantenido en el tiempo que habíamos planifi- dedor de 100 (opción 2), y si es posible con grupos de control. Requieren,
cado. como en cualquier ensayo, la firma de un consentimiento informado y, al

219
DESGLOSES
COMENTADOS MIR
ser una muestra no muy grande, no tienen una gran duración (opciones P188 MIR 2012-2013
4 y 5). En ocasiones aportan datos preliminares sobre la eficacia (fase IIb).
El “análisis por intención de tratar” es el que incluye a todos los pacientes
que han sido seleccionados y en el grupo en que fueron asignados aun-
P204 MIR 2013-2014 que no hayan finalizado el estudio o hayan cambiado de grupo (respues-
ta 4, correcta). Cuando el análisis de los resultados incluye sólo a los que
Los ensayos clínicos de eficacia corresponden a estudios de desarro- han cumplido los requisitos del protocolo y/o han finalizado el estudio se
llo de medicamentos en fase III. Se realizan sobre pacientes con unas conoce como “análisis por protocolo”.
ciertas características clínicas que hemos definido en la fase de planifi-
cación (criterios de inclusión y exclusión), y en función de ello nuestros
resultados se aplicarán a pacientes con esas características (opción 1). P189 MIR 2012-2013
Se realizarán con un grupo control, el cual recibirá el tratamiento están-
dar si éste existe, o el placebo si no (opción 2). La eficacia se medirá en Un ensayo clínico es un estudio prospectivo y experimental en que la
función de la patología estudiada; en el caso de la depresión, la mejoría muestra se divide aleatoriamente en dos grupos (respuesta 5, correcta)
en escalas clínicas (opción 3), y según el fármaco se realiza un segui- que difieren en la intervención terapéutica que van a recibir. El grupo
miento de varias semanas para asegurar la consistencia de los resul- control puede recibir placebo pero siempre que exista un tratamiento
tados (opción 5). En los estudios de no inferioridad se deberá alcanzar eficaz, debe administrarse este (respuesta 2, correcta). Inicialmente los
un valor de respuesta clínica (valor delta) para considerar los fármacos criterios de inclusión al estudio son más estrictos y se lleva a cabo en
equivalentes terapéuticos. La variabilidad de la respuesta influirá en adultos, en fases posteriores los criterios son más laxos y se incluyen
el tamaño muestral y, por tanto, en la significación estadística, pero si muchos más pacientes y posteriormente, si procede, en ancianos y ni-
el estudio está bien diseñado y ejecutado, las diferencias observadas ños (respuesta 4, correcta). Para evitar sesgos en la intervención es im-
serán válidas. portante utilizar técnicas de enmascaramiento (simple, doble o triple
ciego) (respuesta 3, falsa). Hay diferentes tipos de ensayos clínicos, uno
de ellos es el diseño cruzado en que un mismo paciente va a recibir
P206 MIR 2013-2014 los dos tratamientos incluyendo un periodo de blanqueo entre ellos.
Estos diseños pueden emplearse cuando se trata de una enfermedad
El metaanálisis tiene dos objetivos: realizar una revisión sistemática de crónica (respuesta 1, correcta) puesto que de ser aguda se resolvería
los estudios sobre un tema, y, además, realizar una combinación esta- o mejoraría mucho con el primer tratamiento y no se podría valorar el
dística de los resultados de los mismos. La primera implica la tarea de segundo.
seleccionar los resultados de todos los estudios que cumplen los criterios
que nos hemos propuesto, independientemente de su resultado, para no
llevar a cabo un sesgo de publicación (opciones 2 y 3, incorrectas). La se- P190 MIR 2012-2013
gunda parte incluye combinar de una manera cuantitativa los resultados
heterogéneos a partir de la aplicación de pruebas estadísticas (opción Un ensayo clínico es por definición un estudio experimental (respuesta 2,
1, correcta). En ocasiones nos ayudamos de una representación gráfica incorrecta). En la fase II el principal objetivo es evaluar la relación dosis/
que manifieste la variabilidad entre estudios, conocida como “diagrama respuesta (respuestas 3, 4 y 5, incorrectas) y esta se lleva a cabo en gru-
de bosques”. Al ser una combinación de estudios, su potencia estadística pos de 100-200 pacientes.
nunca superará la de los estudios en los que se basa, e incluirá sus errores
metodológicos (opciones 4 y 5, incorrectas).
P191 MIR 2012-2013

P180 MIR 2012-2013 En un ensayo clínico se distinguen 4 fases (I, II, III, IV) cada una de ellas
con unas características. En la fase I es la primera vez que el fármaco se
El ensayo clínico aleatorizado es el que da más evidencia y tiene menos prueba en humanos y generalmente son voluntarios sanos (n = 20-80),
sesgos. en la fase II ya se administra en pacientes pero a un grupo reducido.
Cuando en el estudio se incluye un número de pacientes mayor y se pre-
tende alcanzar el registro del medicamento entonces se trata de un en-
P187 MIR 2012-2013 sayo clínico fase III (respuesta 4). La fase IV tiene lugar una vez el fármaco
ya ha sido comercializado.
Un ensayo clínico es enmascarado cuando se emplean técnicas de ciego
(simple, doble o triple) para evitar sesgos. De lo contrario se dice que es
abierto (respuesta 1 y 3, incorrectas). Cuando sólo es el paciente el que P194 MIR 2012-2013
desconoce el grupo al que está asignado es simple ciego (respuesta 4,
incorrecta), si es el paciente, personal sanitario y evaluador doble ciego El metaanálisis es un análisis estadístico que combina los resultados de
(respuesta 5, correcta) y si además también lo desconoce el analista triple varios ensayos clínicos independientes que el analista considera que se
ciego (respuesta 2, incorrecta). pueden combinar (respuesta 3 y 5, incorrectas). Los principales proble-

ESTA DÍSTICA Y EPIDEMIOLOGÍA 220


Estadística y epidemiología
mas metodológicos son el sesgo de publicación y la heterogeneidad sayo clínico, y del seguro o indemnización para cubrir las responsabilida-
de los ensayos clínicos incluidos. Para el primero de ellos hay dos ma- des a que haya lugar.
neras de evaluarlo: el análisis de sensibilidad y el Funnel Plot (diagrama
de embudo) (respuestas 1 y 4, incorrectas). Cuando se trata de estudios Entre otras funciones, también conocerá y evaluará el alcance de las
heterogéneos se utiliza un modelo de efectos aleatorios (al azar) con la compensaciones que se ofrecerán a los investigadores y a los sujetos de
desventaja que conceden un peso excesivo a los estudios de pequeño la investigación por su participación y realizará el seguimiento del ensa-
tamaño muestral (respuesta 2, correcta). yo clínico desde su inicio hasta la recepción del informe final.

P185 MIR 2011-2012 P188 MIR 2011-2012

De todos los diseños planteados, el ensayo clínico (opciones 1 y 5) cons- Las técnicas de ciego o enmascaramiento sirven para evitar algunos ti-
tituye aquél que arroja una mejor evidencia científica. En la opción 1 se pos de sesgos en los ensayos clínicos. Cuando se realiza “simple ciego”,
plantea un ensayo no cegado controlado con placebo y no se hace re- es el paciente el que no conoce la medida terapéutica que va a recibir.
ferencia a la aleatorización mientras que en la opción 5 se describe un Cuando se habla de “doble ciego”, no lo conoce tampoco el médico que
buen ensayo clínico aleatorizado, enmascarado y comparado con el tra- administra el tratamiento. En aquellos casos en los que no se realizan las
tamiento existente para la indicación a testar. técnicas de ciego, se dice que el ensayo clínico es abierto.

P186 MIR 2011-2012 P189 MIR 2011-2012

La aleatorización estratificada (opción 2) clasifica los sujetos de estudio En enfermedades infecciosas en las que la eficacia del fármaco se mide
en diferentes estratos o categorías según determinados criterios pronós- por la curación o no (erradicación o no de la infección), sólo se pueden
ticos conocidos antes de la asignación aleatoria, criterios que se consi- realizar ensayos clínicos paralelos. No podríamos administrar un segun-
deran generalmente variables de interés en el diseño que se plantea. do fármaco como ocurre en el ensayo clínico cruzado, cuando ya hemos
Los pacientes de cada categoría son asignados de forma independiente curado la infección con el primer fármaco. Nos quedaríamos entonces
a cada brazo del estudio mediante un procedimiento de aleatorización con las opciones 2 y 3. Entre ambas, la aleatorización y el enmascara-
propio, consiguiendo de esta manera que los grupos contengan apro- miento hacen que el ensayo clínico sea mejor al minimizar la probabili-
ximadamente el mismo número de sujetos en cada gradiente definido. dad de sesgos y aumentar en consecuencia la validez interna.

P187 MIR 2011-2012 P190 MIR 2011-2012

Antes de la ejecución de un ensayo clínico en cualquier centro de nues- En estudios que comparan dos fármacos conocidamente efectivos para una
tro país, es necesaria la emisión de un informe favorable desde el Comité patología, el enmascarmiento puede ser mantenido mediante el uso de dos
Ético de Investigaciones Clínicas (CEIC). El Comité Ético de Investigación placebos, método conocido como doble simulación. En esta situación el pa-
Clínica ponderará los aspectos metodológicos, éticos y legales del pro- ciente recibe “dos pastillas”. Un grupo recibe el fármaco activo 1 y el placebo
tocolo propuesto, así como el balance de riesgos y beneficios. Para ello, del fármaco 2. El otro grupo recibe el fármaco activo 2 y el placebo del 1.
evaluará la idoneidad del protocolo en relación con los objetivos del es-
tudio, su eficiencia científica (la posibilidad de alcanzar conclusiones vá-
lidas, con la menor exposición posible de sujetos) y la justificación de los P200 MIR 2011-2012
riesgos y molestias previsibles, ponderadas en función de los beneficios
esperados para los sujetos y para la sociedad. Según la regulación de la Unión Europea, dos fármacos son bioequiva-
lentes si su biodisponibilidad tras la administración de la misma dosis
Evaluará también la idoneidad del equipo investigador para el ensayo molar es tan parecida que su eficacia y seguridad, son prácticamente
propuesto, teniendo en cuenta su experiencia y capacidad investigadora idénticas. A estos efectos, se considera que la biodisponibilidad queda
para llevar adelante el estudio, en función de sus obligaciones asistencia- demostrada cuando los intervalos de confianza del 90% del área bajo la
les y de los compromisos previamente adquiridos con otros protocolos curva (AUC0-t) y la concentración máxima (Cmax) de los dos preparados
de investigación. están comprendidos dentro del intervalo 80-125%.

Es fundamental la valoración de la información escrita sobre las caracte-


rísticas del ensayo que se dará a los posibles sujetos de la investigación, P172 MIR 2010-2011
o en su defecto, a su representante legal, la forma en que dicha informa-
ción será proporcionada y el tipo de consentimiento que va a obtenerse. Esta es una pregunta complicada sobre un tema que va cobrando cada año
Comprobará la previsión de compensación y tratamiento que se ofrecerá más importancia, como es el metanálisis. Para contestarla sería interesante
a los sujetos participantes en caso de lesión o muerte, atribuibles al en- conocer el concepto de homogeneidad. Con este término nos referimos a

221
DESGLOSES
COMENTADOS MIR
que el resultado obtenido en distintos estudios siempre es el mismo, por tenidamente nos daremos cuenta de que es relativamente fácil dar con
ejemplo, si estamos comparando dos fármacos para evaluar su eficacia la respuesta falsa.
frente a una patología, todos los estudios nos marcan que el fármaco A es
mejor que el B, sean cuales sean las diferencias obtenidas en los resultados Las respuestas 1 y 2 dicen prácticamente lo mismo, que ninguno de los
particulares de cada estudio. En este caso nos encontraríamos ante unos dos tratamientos es superior al otro (realmente deberían haber puesto
resultados homogéneos, si no fuese así, serían heterogéneos, obteniendo que eran no-inferiores, pero bueno…). La respuesta 3 es correcta, ya
mayor precisión en los primeros. Cuando hay homogeneidad se puede em- que, al incluir el IC el uno, ese 1,18 que supera a la unidad se compor-
plear un modelo de efectos fijos, mientras que si no la hay, deberíamos usar ta como un factor de riesgo, aunque este tipo de estudio no busque
uno de efectos aleatorios. Sólo con esto podríamos llegar a la conclusión de confirmar ni descartar este hecho. La respuesta 4 es también correcta,
que las respuestas 1 y 4 son falsas y que la correcta es la respuesta 3. puesto que se cumple la condición que especifican al principio de la
pregunta “el fármaco experimental será no-inferior al fármaco control
Respecto a la 2, el sesgo de publicación se refiere a que sólo llegan a ser si el límite superior del IC del RR para la variable principal (infarto de
publicados aquellos estudios en los que los resultados son concluyentes miocardio) no supera el 1,20” y, efectivamente, no lo supera ya que es
y beneficiosos para el investigador, mientras que la 5 es completamente de 1,18.
falsa ya que el metanálisis busca justo lo contrario, una mayor precisión
al juntar todos los estudios, trabajando con una muestra más grande. Lo más “fácil” de esta pregunta era darse cuenta de que la respuesta 5
es claramente falsa, para demostrar la equivalencia de dos tratamientos,
es necesario utilizar un estudio de bioequivalencia, que no tiene nada
P182 MIR 2010-2011 que ver con el tipo de estudio del que nos están hablando en el enuncia-
do de la pregunta.
Pregunta fácil sobre un tema fundamental: el ensayo clínico. La respuesta 2
es la correcta, ya que la aleatorización consiste en asignar por azar, sin que
influya ningún factor, los pacientes de la muestra a los dos grupos de inter- P197 MIR 2010-2011
vención. De este modo, si el tamaño muestral es suficientemente grande,
se consigue una distribución homogénea de las variables predictoras en Las fases del ensayo clínico se preguntan con frecuencia en el exame MIR.
ambos grupos, permitiendo su comparación. El doble ciego y el triple cie- No puedes permitirte fallar una pregunta como esta.
go (respuestas 1 y 5, incorrectas) hacen referencia a dos tipos de enmasca- • Fase I. Se realiza normalmente en pacientes sanos. Es un estudio de
ramiento mediante los que se pretende evitar el sesgo de cointervención, toxicidad, es decir, se estudia la tolerabilidad del fármaco en estudio
es decir, que tanto investigadores como otros proveedores de cuidados (respuesta 1, correcta).
traten de forma diferente a los dos grupos de intervención. El análisis por • Fase II. Se introducen pacientes enfermos, estudiándose la relación
intención de tratar (respuesta 4, incorrecta) hace referencia a una forma de dosis-respuesta, para delimitar el intervalo de dosis terapéutica más
análisis de resultados, no a la comparabilidad de los grupos de estudio. El adecuado.
tamaño muestral (respuesta 3, incorrecta) indica el número aproximado • Fase III. Es el modelo típico de ensayo clínico, donde se compara con
de sujetos para detectar una diferencia determinada, si existe, con unos otra alternativa, si existe, o con placebo.
márgenes de error previamente definidos, teniendo que ser suficiente • Fase IV. Estudios poscomercialización (farmacovigilancia).
para obtener un IC del 95% de la eficacia, cuyos límites sean clínicamente
relevantes, por lo que no influye en la comparabilidad de los grupos.
P184 MIR 2009-2010

P186 MIR 2010-2011 Los estudios analíticos son aquellos que intentan establecer una relación
de causalidad entre un factor de riesgo y una enfermedad. A su vez, se
Pregunta de extrema dificultad sobre un tema no preguntado hasta aho- pueden clasificar en experimentales y observacionales.
ra en el examen MIR. No os preocupéis si la habéis fallado.
En los estudios experimentales es el investigador el que asigna el factor
CONSORT es el acrónimo de CONsolidated Standards Of Reporting Trials de estudio (qué fármaco, vacuna, campaña de educación... cuánto tiem-
(estándares consolidados de comunicación de ensayos). El objetivo de po, cuándo, cuánta dosis recibirán los individuos...) mientras que en los
CONSORT ha sido elaborar recomendaciones para que la publicación de observacionales, el investigador se limita a observar qué es lo que suce-
ensayos clínicos sea más completa y comprensiva. Estas recomendacio- de en un grupo de individuos, sin manipular el estudio.
nes se traducen en una lista de comprobación o de verificación (check-
list) y un diagrama de flujo (flow-diagram) (respuesta 1, correcta). Si lees con atención el enunciado de esta pregunta, lo que realmente
te están pidiendo es que señales, entre las cinco opciones, cuál corres-
ponde a un diseño experimental. La respuesta correcta sería el ensayo
P193 MIR 2010-2011 clínico, donde es el investigador quien decide todas estas cuestiones. El
resto de las opciones hacen referencia a diversos tipos de estudios obser-
Una pregunta aparentemente difícil porque trata acerca de un estudio vacionales, donde el investigador se limita a estudiar lo que sucede, pero
que no es muy preguntado en el examen MIR, pero si la analizamos de- no interviene en la asignación del factor de estudio.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 222


Estadística y epidemiología
P187 MIR 2009-2010 pudieran influir en el estudio. Al repartirse de forma equitativa entre los
diferentes grupos de comparación, la única diferencia existente entre
Vamos a resumir los aspectos más importantes sobre las fases de los en- ellos sería la intervención que estamos estudiando (por ejemplo, qué fár-
sayos clínicos: maco toman). Respuesta 5, correcta.
• Fase I: primera vez que se usa en humanos, que son voluntarios sa-
nos. No hay grupo control. Sirve para evaluar la toxicidad. El resto de las opciones son completamente falsas. Marcarlas como co-
• Fase II: intenta conocer la relación dosis-respuesta. Se administra en rrectas implicaría un grave error de concepto.
pacientes. No es necesario establecer comparación con otro fármaco. • Respuesta 1: un ensayo controlado con placebo no es necesaria-
• Fase III: sirve para evaluar la eficacia, en comparación con placebo u mente mejor ni peor que si se controla con un fármaco activo. Las
otros fármacos (si existen). También da información sobre los efectos diferencias entre ellos son fundamentalmente éticas. No sería ético
adversos habituales. comparar con placebo cuando se conoce un fármaco eficaz, puesto
• Fase IV: farmacovigilancia (post-comercialización). Detecta efectos que implicaría el sufrimiento innecesario (o la muerte) de pacientes
adversos infrecuentes o de aparición tardía. También da información incluidos en el grupo placebo.
sobre interacciones con otros fármacos. • Respuesta 2: siempre que sea posible debemos evitar el uso de contro-
les históricos, como ya se ha preguntado en el MIR con anterioridad.
Esta pregunta da un paso más. Dentro de la fase II debemos ser capaces • Respuesta 3: se habla de estudio abierto cuando no se utiliza enmas-
de distinguir entre las dos subfases existentes: IIa y IIb. caramiento (simple ciego, doble ciego, triple ciego…).
• IIa. En ella se realizan los primeros ensayos en pacientes. Suele tratar- • Respuesta 4: si el paciente sabe qué fármaco toma, este conocimien-
se de estudios piloto, no controlados, en poblaciones de pacientes to puede influir en los resultados del estudio (por ejemplo, si toma
muy seleccionados. el fármaco antiguo y lo sabe, tenderá a decirnos que es poco eficaz,
• IIb. En esta fase se trata de ensayos controlados, como sucede en esta porque sabe que estamos investigando una alternativa nueva, que
pregunta, donde un grupo está tomando placebo (respuesta 3, co- tal vez sea mejor). La forma de evitar estos problemas es recurrir a
rrecta). Son más rigurosos y suelen ser enmascarados. Los ensayos en técnicas de enmascaramiento, de forma que el paciente no conoce lo
fase IIb son mucho más parecidos a los de fase III que los de la fase IIa. que está tomando. En otras palabras, el enmascaramiento sirve para
evitar los sesgos de información. No tiene nada que ver con lo que se
explica en la respuesta 4.
P188 MIR 2009-2010

La mayoría de los ensayos clínicos tratan de evaluar la posible superio- P191 MIR 2009-2010
ridad de una actuación con respecto a otra. Son los llamados ensayos
clínicos de superioridad. Sin embargo, en otras ocasiones, el investiga- Una pregunta bastante sencilla. Basta el sentido común para descartar la
dor da por hecho que un nuevo tratamiento no es inferior a otro clásico mayor parte de las opciones:
en cuanto a su eficacia o efectividad, pero puede tener otras ventajas • El consentimiento informado, en un estudio de este tipo (ensayo clí-
(menor toxicidad, posología más cómoda, etc.), por lo que puede ser nico), debe recogerse por escrito en todos los casos, lo que hace falsa
preferible utilizarlo. En estos casos se plantean estudios de equivalencia la opción 3.
absoluta o, al menos, de no-inferioridad. • En todo ensayo clínico es necesario seguir las normas de buena prác-
tica clínica. En la respuesta 5 sugieren que éstas no son necesarias en
Para establecer la no-inferioridad de un fármaco debemos poner unos lími- un estudio de bioequivalencia, lo que obviamente sería falso.
tes, dentro de los cuales una diferencia sería considerada como demasiado • Un ensayo clínico, sea cual sea el número de pacientes, debe some-
pequeña o irrelevante. Estos límites deben estar claramente delimitados des- terse a consideraciones éticas (respuesta 2, falsa).
de la fase de diseño, es decir, antes de comenzar el estudio. Esto es, ni más ni
menos, lo que se describe en el enunciado de esta pregunta. Se establece un Llegar hasta aquí es relativamente fácil. Lo único que debemos saber para
límite clínicamente relevante de hasta un 3% y, comparando ambos trata- responder esta pregunta es lo siguiente. ¿Quién tiene que autorizarlo, la
mientos, la diferencia que se objetiva es de un 1%. Por lo tanto, al estar dentro Agencia Española de Medicamentos o el Comité Ético del hospital…?
de este límite (límite delta), la conclusión del estudio sería la respuesta 4: el
fármaco experimental es no-inferior con respecto al fármaco control. La respuesta correcta es la 4. Aunque un ensayo clínico se realice en un
solo centro, el informe favorable del Comité Ético de ese hospital no es
suficiente.
P189 MIR 2009-2010

Una pregunta de dificultad media-baja. Aunque tuvieses dudas con las P192 MIR 2009-2010
cuatro primeras opciones, lo que se explica en la respuesta 5 es la defini-
ción perfecta del objetivo de la asignación aleatoria. Una pregunta de dificultad media sobre los ensayos clínicos. La respues-
ta falsa es la 2. Para darte cuenta deberías haber reparado en la palabra
La asignación aleatoria, propia de los estudios experimentales, tiene la “efectividad”. Recuerda que “eficacia” y “efectividad” no son lo mismo, en
ventaja de que permite distribuir por igual las diferentes variables que absoluto…

223
DESGLOSES
COMENTADOS MIR
• La eficacia hace referencia a lo que sucede en condiciones ideales o • Fase II: estudia fundamentalmente la relación dosis-respuesta, es
experimentales. decir, trata de delimitar el intervalo óptimo de dosis. Puede ofrecer
• El término efectividad está en relación con lo que ocurre en la prác- cierta información preliminar sobre la eficacia del fármaco, pero éste
tica. no es su verdadero propósito.
• Fase III: evaluación, como tal, de la eficacia del fármaco. Suele com-
En un ensayo clínico, lo que mejor se evalúa es la eficacia del tratamien- parar con otro fármaco de eficacia ya demostrada, o frente a pla-
to, ya que están realizados bajo unas condiciones más o menos estric- cebo.
tas (respuesta 2, falsa). En algunos casos puede evaluarse la efectividad • Fase IV: estudios post-comercialización.
(ensayos clínicos pragmáticos), pero esto no es lo habitual. En cualquier
caso, no deberías haber confiado en una respuesta tan restrictiva. La pa- Las opciones 1 y 2 (validez externa, pacientes similares a la práctica ha-
labra “específicamente” es prácticamente lo mismo que decir “sólo”, “de bitual) harían referencia a un ensayo en fase III de tipo pragmático, o in-
forma exclusiva”, etcétera. cluso en fase IV, pero nunca en fase I, donde lo habitual es emplearlo en
sujetos sanos. Respecto a la opción 4, la realidad es justamente la con-
El resto de las respuestas son claras y correctas. traria: los que más se prolongan son los de fases posteriores. Por último,
la respuesta 5 miente al decir que no existen límites en el número de
pacientes. De hecho, en las primeras fases, el tamaño muestral suele ser
P193 MIR 2009-2010 menor que más adelante.

Una pregunta de elevada dificultad. Hasta la fecha, nunca se había plan-


teado ninguna cuestión sobre los ensayos clínicos sobre un solo pacien- P197 MIR 2008-2009
te. El ensayo clínico de un solo paciente (ensayo clínico n=1) consiste en
modificar de manera sistematizada el tratamiento de una enfermedad, Pregunta importante sobre un tema muy de moda en el MIR: los niveles
en un solo enfermo, durante una serie de periodos predeterminados. Por de calidad de la evidencia científica. Es importante que conozcas bien
ello, la respuesta 2 es un requisito para que pueda ser aplicado, que este- este tema, porque se ha preguntado con mayor insistencia durante las
mos hablando de una enfermedad crónica. últimas convocatorias.

El objetivo de este estudio es confirmar o rechazar la efectividad del tra- El metaanálisis de ensayos clínicos aleatorizados y controlados es el estu-
tamiento en este paciente en particular. Resulta obvio que, si se realiza dio más riguroso y de mayor evidencia científica. Como dice la respuesta
sobre un solo paciente, no se le podrá exigir a este tipo de diseño que 4, presenta de forma estructurada los resultados de los distintos estudios
sea generalizable al resto de la población (respuesta 1, correcta). Existen que incluye. Al combinar estadísticamente los datos de varios estudios,
diversas variantes que incluirán propiedades como la aleatorización o el la evidencia que aporta es mayor que la de éstos por separado. El metaa-
doble enmascaramiento, como ocurre en el resto de los ensayos clínicos. nálisis de ensayos clínicos aleatorizados y controlados es el estudio más
riguroso y de mayor evidencia científica. Después, vendrían los ensayos
En el ensayo clínico convencional la unidad de estudio es el individuo, que clínicos.
puede haber sido asignado a un grupo u otro, de forma aleatoria. Sin em-
bargo, en el ensayo n=1 lo que se aleatoriza son periodos de seguimiento,
comparándose por pares. En cada periodo recibe un tratamiento (o place- P200 MIR 2008-2009
bo, en su caso), comparándose sus efectos sobre este único paciente.
El ensayo clínico es uno de los temas más preguntados en el examen MIR.
El objetivo de este tipo de diseño es diferente al del ensayo clínico habi- Tal como decimos en la pregunta 195 de esta misma convocatoria, este
tual. Se trata de saber si una intervención es más efectiva que otra, en ese tipo de estudios pasan por diferentes fases:
enfermo en particular (respuesta 3). Por supuesto, antes de realizar este • Fase I: se trata de un estudio de toxicidad, habitualmente en volun-
tipo de ensayo clínico tiene que haber un mutuo acuerdo entre médico y tarios sanos.
paciente. Para valorar los resultados, ambos tendrán que conocer cuáles • Fase II: estudia fundamentalmente la relación dosis-respuesta, es
son los criterios de evaluación (respuesta 4). Además, habrá una serie de decir, trata de delimitar el intervalo óptimo de dosis. Puede ofrecer
criterios para detenerlo en cualquier momento, que podrán ser supervi- cierta información preliminar sobre la eficacia del fármaco, pero éste
sados por una tercera persona (respuesta 5). no es su verdadero propósito.
• Fase III: evaluación, como tal, de la eficacia del fármaco. Suele com-
parar con otro fármaco de eficacia ya demostrada, o frente a placebo.
P195 MIR 2008-2009 • Fase IV: estudios post-comercialización.

Antes de comercializar un fármaco, un ensayo clínico pasa por unas fases Las propiedades farmacocinéticas (opción 1) se estudiarían en la primera
bien diferenciadas: fase. La eficacia, en fase III (respuesta 2). El perfil de seguridad, en fase
• Fase I: se trata de un estudio de toxicidad, habitualmente en volun- I (opción 4). La determinación de la dosis, en fase II (respuesta 4). Sin
tarios sanos, donde se estudian los parámetros mencionados en la embargo, el patrón de prescripción habitual no es materia del ensayo
opción 3. clínico, sino más bien de estudios de farmacoepidemiología, que podrían

ESTA DÍSTICA Y EPIDEMIOLOGÍA 224


Estadística y epidemiología
ser puramente descriptivos, sin necesidad de realizar comparación de • Ensayos clínicos pragmáticos. En ellos, los criterios de inclusión son
ningún tipo (lo que sí es inherente al ensayo clínico). muy laxos. De este modo, los participantes se acercan lo más posible
a la población general (mayor validez externa).
• Ensayos clínicos explicativos. Los criterios de inclusión son muy es-
P201 MIR 2008-2009 trictos. Por tanto, los participantes pueden no ser representativos de
la población general (pérdida de validez externa).
Una pregunta muy fácil y muchas veces repetida en el examen MIR. Los
estudios que ofrecen mayor evidencia científica son los experimentales, no Teniendo en cuenta que la efectividad es un concepto que hace referen-
los observacionales (como los de cohortes, casos y controles…), por lo que cia a los resultados obtenidos en condiciones reales, esto es precisamen-
habría que descartar, de entrada,las respuestas 1 y 2. Por otra parte,el uso te lo que se evalúa en un ensayo pragmático (respuesta 1, correcta). Por
de controles históricos puede introducir sesgos, ya que los pacientes del el contrario, dado lo restrictivo de los criterios de inclusión, los ensayos
pasado pueden diferir significativamente de los del presente, en más facto- explicativos se aproximan más a la medición de la eficacia (resultados en
res de los que podemos controlar. Es decir, podrían ser distintos no sólo en condiciones ideales o experimentales).
el fármaco en estudio, sino también en otros aspectos (ser tratados por di-
ferentes médicos o personal de enfermería, que las condiciones higiénicas
no fuesen las mismas en ambos periodos, etc.). Sólo quedaría duda entre P218 MIR 2008-2009
las opciones 3 y 4, que se resuelve fácilmente, puesto que un estudio pros-
pectivo ofrece siempre mayor evidencia científica que uno retrospectivo. El diseño cruzado consiste en que un mismo paciente va a recibir dos tra-
tamientos, que van a ser comparados entre sí. Lógicamente, los recibe en
dos momentos distintos, primero uno y después el otro. Cada paciente
P210 MIR 2008-2009 sirve de control a sí mismo, lo cual reduce la variabilidad intragrupal. Esto
consigue un control perfecto de los factores pronósticos como el sexo, la
Una pregunta de elevada dificultad. En los ensayos clínicos, lo habitual es edad, etc. Por otra parte, la necesidad de pacientes es menor (requieren
evaluar si un tratamiento es mejor que otra alternativa terapéutica, o que un tamaño muestral más pequeño que los ensayos clínicos de grupos pa-
el placebo en su caso. Esto es lo que se pretende en los ensayos clínicos ralelos). Por supuesto, como en otros tipos de ensayo clínico, es posible el
de “superioridad”. Sin embargo, existe otro tipo de diseño, donde se pre- uso de placebo y requiere el consentimiento informado de los pacientes
tende demostrar que un nuevo tratamiento tiene efectos “similares” o “no que participan en él.
inferiores” al tratamiento que ya existía. En este caso, estaríamos ante un
ensayo de “no inferioridad”. Uno de los problemas de este tipo de diseño es el efecto carry-over o
de arrastre (el efecto de uno puede influir sobre la toma del otro). Para
El límite de no-inferioridad (delta) habría que determinarlo para un ensa- evitarlo, debe haber un periodo de lavado entre la administración de los
yo de no-inferioridad. Se dice que un tratamiento es equivalente a otro si dos tratamientos, de modo que el primer fármaco haya sido totalmente
la diferencia de sus efectos es irrelevante. Esta irrelevancia se define por aclarado del organismo antes de administrar el segundo.
unos límites previamente determinados (delta1 y delta 2). Si está dentro
de los mismos, la diferencia no es relevante; cuando los excede, sí lo sería.
Sin embargo, este parámetro no se utiliza en un ensayo clínico de supe- P220 MIR 2008-2009
rioridad. Por ello, la respuesta 2 sería incorrecta.
Una pregunta de dificultad media sobre la validez de un ensayo clínico.
Esta pregunta, a pesar de lo dicho, fue anulada después del periodo de Para empezar, debes tener claro el concepto de validez, que es la ausen-
reclamaciones. Un motivo posible sería lo que dice la respuesta 4. Es cier- cia de sesgos o errores sistemáticos. Veamos las diferentes opciones:
to que, en un ensayo con diseño de superioridad, pueden encontrarse • Respuesta 1. La asignación aleatoria del tratamiento confiere una
diferencias estadísticamente significativas, pero sin relevancia clínica (tal mayor validez, puesto que protege de los sesgos de selección y de
como lo explica la opción 5). En este caso, la interpretación sería similar a la los factores de confusión.
de un ensayo de no-inferioridad. No obstante, se considera que, cuando se • Respuesta 2. El enmascaramiento es una técnica para evitar sesgos
trata de estudiar equivalencias, el nivel de evidencia científica que ofrece de información o de clasificación.
un ensayo de no-inferioridad supera a la de uno de superioridad, aunque • Respuesta 3. Asegurarse de la similitud inicial entre los dos grupos de
cumpliese las citadas características. Por ello, la opción 4 podría entender- comparación (técnicas de apareamiento, restricción), protege frente
se como una respuesta dudosa (conceptualmente, serían similares, pero al sesgo de selección y frente a los factores de confusión.
no en cuanto al nivel de evidencia). En cualquier caso, si hubiese que de- • Respuesta 5. El análisis estadístico por intención de tratar, en general,
cantarse por una opción como “más falsa”, sería claramente la 2. se considera más adecuado que el análisis por protocolo, porque re-
fleja mejor lo que sucede en la práctica clínica.

P212 MIR 2008-2009 Sin embargo, la opción 4 tiene poca o ninguna importancia. La inclusión
del mismo número de sujetos en todos los centros participantes, si son
En función de los criterios de inclusión, podemos dividir los ensayos clí- iguales en cuanto al resto de sus características, no debería cuestionar la
nicos en dos grandes grupos: validez del estudio.

225
DESGLOSES
COMENTADOS MIR
P204 MIR 2007-2008 se desprende un mayor nivel de evidencia científica es el ensayo
clínico.
El proceso de aleatorización se fundamenta en asignar por azar los pa- • Respuesta 5: el ensayo cruzado se basa en que un mismo paciente
cientes de la muestra a los dos grupos de intervención. De esta forma, va a recibir dos tratamientos, que van a ser comparados entre sí.
si el tamaño muestral es lo suficientemente grande, se consigue una Lógicamente, los recibe en dos momentos distintos, primero uno y
distribución homogénea de las variables predictoras en ambos grupos. después el otro. Cada paciente sirve de control a sí mismo, lo cual
Existen diversas formas de realizarla (simple, por bloques, estratifica- reduce la variabilidad intragrupal. Esto consigue un control perfecto
da…). La aleatorización sirve para protegernos de dos tipos de errores de los factores pronósticos como el sexo, la raza, etc. Asimismo, tiene
sistemáticos, que son el sesgo de selección y el factor de confusión. Tie- la ventaja de precisar un menor tamaño muestral, al compararse cada
nes que tener muy claro que, a pesar de su nombre, NO nos protegerá paciente consigo mismo. Sin embargo, esto implica un inconvenien-
frente al error aleatorio (esto se consigue incrementando el tamaño te: las pérdidas también influirán más que en un ensayo clínico con
muestral). diseño paralelo.

Aunque el objetivo es garantizar la homogeneidad de las variables predic- La respuesta incorrecta es la 3. Los análisis intermedios se realizan du-
toras antes de realizar la comparación, no nos asegura totalmente que es- rante las fases III y IV del estudio. Están justificados para evitar que los
temos exentos de los errores de los que intenta protegernos (respuesta 4, pacientes del grupo control no se beneficien del tratamiento, en caso
falsa). de que sea eficaz. No obstante, realizar muchos análisis intermedios au-
menta la probabilidad de cometer un error tipo I, de modo que ha de
estar previsto en el protocolo del estudio y debe haber una penalización
P205 MIR 2007-2008 estadística porque al realizarse múltiples comparaciones aumenta el
riesgo de que, en alguna de ellas, se detecten diferencias que realmen-
Una pregunta que podrías haber acertado por sentido común. Eviden- te no existen. Esta penalización estadística puede consistir, por ejemplo,
temente, lo que se pretende en cualquier ensayo clínico es encontrar en exigir un nivel de p más pequeño para considerar el resultado como
diferencias que, aplicadas a la clínica, aporten algún beneficio a los pa- significativo.
cientes. Si empleamos escalas que miden la calidad de vida, es evidente
que la relevancia clínica será mayor que si midiésemos, por ejemplo, un
parámetro analítico que nada tiene que ver con el bienestar del paciente. P207 MIR 2007-2008
No obstante, tendríamos un inconveniente, que es la subjetividad y la
dificultad de medición de este parámetro. ¿Qué tal se encuentra usted? En función de los criterios de inclusión, podemos dividir los EC en dos
Señale del 1 al 10 lo bien que se encuentra. Siempre será más fácil medir, grandes grupos:
por ejemplo, la calcemia o el hematocrito (respuesta 3, correcta). • EC pragmáticos: se acercan lo más posible a la población general (res-
puesta 4, correcta). Los criterios de inclusión son muy laxos (práctica-
mente los únicos son los diagnósticos).
P206 MIR 2007-2008 • EC explicativos: los criterios de inclusión son muy estrictos, así pues la
población no es exactamente igual a la población general.
Durante los últimos años, el tema del ensayo clínico se ha convertido en
uno de los más preguntados del examen MIR, por lo que has de dominar- Cuando los criterios de inclusión son muy estrictos, el EC presenta una
lo. Analicemos opción por opción: muestra más homogénea y se necesita menor tamaño muestral para de-
• Respuesta 1: el análisis por protocolo sólo incluye a los pacientes que tectar las diferencias. Además, hay mayor validez interna. Sin embargo,
han cumplido los requisitos del protocolo y han finalizado el estudio. existe una clara limitación a la hora de generalizar los resultados y de
Esto puede suponer un sesgo al no analizar las pérdidas, ya que sería reclutar a los pacientes. Se utilizan, sobre todo, en las fases II y III.
posible que éstas se deban a la falta de eficacia del fármaco o a la
aparición de efectos indeseables. Al no terminar el estudio, nada de En cambio, cuando no son estrictos, el reclutamiento será más sencillo,
esto podría reflejarse en los resultados del estudio. se podrá generalizar los resultados con mayor facilidad y tendrán mayor
• Respuesta 2: los estudios con controles históricos sobrevaloran la validez externa. No obstante, la muestra será más heterogénea, se nece-
eficacia del fármaco que estamos estudiando. Imagínate un estu- sitará un mayor tamaño muestral y los resultados serán confusos si sólo
dio sobre el tratamiento de la neumonía bacteriana. Comparamos es eficaz en subgrupos de pacientes. Se utilizan en las fases III y IV.
un nuevo antibiótico con la penicilina (un grupo de pacientes que
fueron tratados con ella hace cincuenta años). Se observan diferen-
cias estadísticamente significativas a favor del nuevo fármaco. ¿Estas P208 MIR 2007-2008
diferencias se justifican totalmente por el fármaco en sí? ¿No cabría
la posibilidad de que la mejora de las condiciones higiénicas, la ali- Las comparaciones con controles históricos no siempre son acertadas.
mentación u otros factores, estuvieran influyendo positivamente en Cuando éstas se realizan, nos encontramos con un problema: no sólo
la supervivencia de nuestros pacientes? serán distintos los tratamientos que estemos comparando, pudiendo ha-
• Respuesta 4: es la respuesta que tendrías que tener más clara de las ber cambiado más cosas. Imagínate que estuviésemos comparando dos
que aparecen en esta pregunta. Efectivamente, el diseño del que fibrinolíticos, tomando como controles los pacientes infartados en cierto

ESTA DÍSTICA Y EPIDEMIOLOGÍA 226


Estadística y epidemiología
hospital hace diez años. Los resultados deberían interpretarse con re- • La heterogenicidad entre los ensayos incluidos, en términos de ca-
servas, puesto que en diez años pueden haber cambiado muchas cosas: racterísticas clínicas y sociodemográficas de las poblaciones en cada
criterios utilizados en ese hospital para avisar al cardiólogo, los médicos ensayo, los métodos de evaluación clínica aplicados, la dosis, forma
que trabajan en el servicio de urgencias, los cardiólogos, las enfermeras farmacéutica o pauta de dosificación del fármaco evaluado, etc.
de la planta, el acceso al hospital (que condicionaría el tiempo de evolu- • El posible sesgo de publicación, derivado de que no todos los ensa-
ción hasta aplicar el fármaco), etc. yos clínicos realmente realizados han sido publicados, por resultados
negativos o no esperados.
De las opciones que nos ofrecen, el mejor para comparar con controles
históricos sería el cáncer de páncreas diseminado. La supervivencia de Sobre el metaanálisis, has de recordar que se considera el estudio más
este tumor a los cinco años es inferior al 1% en estos momentos, así que riguroso y el que aporta una mayor evidencia causal.
es de esperar que hace unos años fuese muy similar. Dado que se trata de
una enfermedad gravísima y que la situación no ha mejorado a lo largo P214 (MIR 07-08) Gradación de la evidencia científica
del tiempo, sería poco probable que la comparación se viese influida por Niveles de evidencia
factores como los descritos. Grado I Evidencia obtenida a partir de al menos un ensayo clínico aleatorizado
y controlado bien diseñado
Grado II -1 Evidencia obtenida a partir de ensayos clínicos no aleatorizados y bien
P212 MIR 2007-2008 diseñados
Grado II -2 Evidencia obtenida a partir de estudios de cohortes (2a: prospectivo
Vamos a resumir los aspectos más significativos sobre las fases de los y 2b: retrospectivo)

ensayos clínicos: Grado II -3 Evidencia obtenida a partir de múltiples series comparadas en el tiempo,
con o sin grupo control. Incluye resultados “dramáticos” producidos por
• Fase I: primera vez que se usa en humanos, que son voluntarios sa-
experimentos no controlados (p. ej., penicilina en los años cuarenta)
nos. No hay grupo control. Sirve para evaluar la toxicidad (no la efica-
Grado III Opiniones basadas en experiencias clínicas, estudios descriptivos
cia, como dice la opción 2, de modo que es falsa).
o informes de comités de ética
• Fase II: intenta conocer la relación dosis-respuesta. Se administra
en pacientes. No es necesario establecer comparación con otro fár-
maco.
• Fase III: sirve para evaluar la eficacia, en comparación con placebo u P216 MIR 2007-2008
otros fármacos (si existen). También da información sobre los efectos
adversos habituales. Se entiende por validez interna el grado de validez del resultado para los
• Fase IV: farmacovigilancia (poscomercialización). Detecta efectos ad- pacientes del estudio. Por tanto, puede decirse que existe validez interna
versos infrecuentes o de aparición tardía. También da información so- cuando el resultado del estudio es aplicable a los individuos que forman
bre interacciones con otros fármacos y para evaluar posibles nuevas parte del mismo. Por el contrario, la validez externa es la capacidad de
indicaciones. generalizar los resultados obtenidos a otros individuos distintos a los del
estudio.

P214 MIR 2007-2008 El ensayo clínico se caracteriza por ofrecer un alto nivel de evidencia
científica, puesto que se ve menos afectado por sesgos que otro tipo de
El primer metaanálisis fue realizado por Karl Pearson a principios del diseños (casos y controles, cohortes, etc.). Sin embargo, para ofrecer este
siglo XX, en un intento de solucionar el problema del reducido poder grado de evidencia, es usual que estos estudios sean muy exactos y res-
estadístico de los estudios con tamaños muestrales pequeños. De esta trictivos en cuanto a sus criterios de inclusión, a las condiciones de ad-
forma, analizando los resultados de un grupo de estudio, de característi- ministración del fármaco o factor en estudio, etc. Por esto, lo habitual es
cas parecidas, se puede alcanzar una valoración más exacta de los efec- que exista un alto grado de validez interna y de rigor científico, luego la
tos. No obstante, aunque lo que hizo Pearson encaja conceptualmente validez externa, a veces, no es tan alta como sería deseable (respuesta 3,
en el concepto de metaanálisis, este término en realidad nace en 1976, correcta).
aplicado a las ciencias sociales y en psicología. Es en los años 80 cuando
comienza a utilizarse en la ciencia médica. Recuerda que, dentro de los ensayos clínicos, existe una variedad que se
ajusta más a la práctica clínica, ya que sus criterios de inclusión son más
Un metaanálisis es un estudio basado en la integración estructurada y laxos (ensayos pragmáticos), que sería la excepción a este respecto.
sistemática de la información obtenida en diversos estudios clínicos, so-
bre un problema de salud determinado. Consiste en identificar y revisar
los estudios controlados sobre un determinado problema, con el fin de P198 MIR 2006-2007
dar una estimación cuantitativa sintética de todos los estudios disponi-
bles. Dado que incluye un número mayor de observaciones, un metaa- Pregunta de dificultad media sobre los tipos de diseño. Este tipo de pre-
nálisis tiene un poder estadístico superior al de los ensayos clínicos que guntas son habituales en el examen. En ese tipo de diseño se evalúan
incluye. Los dos principales problemas metodológicos de los metaanáli- simultáneamente dos tratamientos distintos en una misma muestra de
sis de ensayos clínicos son: sujetos. Estos sujetos son asignados de forma aleatoria a uno de los cua-

227
DESGLOSES
COMENTADOS MIR
tro grupos posibles: A, B, A+B y placebo. Con este tipo de diseño se pue- ciente reciba los dos tratamientos objeto de comparaciones en dos mo-
de evaluar la interacción entre los dos tratamientos, pese a que cuando mentos distintos, de modo que cada paciente sirve de control a sí mismo,
se diseña se asume que los dos tratamientos no interactúan entre sí. lo cual, al reducir la variabilidad, permite llevar a cabo el estudio con un
tamaño muestral menor al de diseño clásico. Uno de los problemas es el
efecto carry over o de arrastre (el efecto de uno puede influir sobre la toma
P200 MIR 2006-2007 del otro), así pues ha de haber un periodo de lavado entre la administra-
ción de los dos fármacos, de manera que el primer fármaco haya sido to-
El diseño cruzado o intrapaciente se basa en que un mismo paciente va a talmente aclarado del organismo antes de la administración del segundo.
recibir dos tratamientos, que van a ser comparados entre sí. Lógicamen- Piensa que una infección aguda en la que vas a probar un tratamiento
te, los recibe en dos momentos distintos, primero uno y después el otro. antibiótico cuando hayas introducido el primer antibiótico y lo cures, ya
Cada paciente sirve de control a sí mismo, lo cual reduce la variabilidad no puedes usar el segundo antibiótico, puesto que ya está curado.
intragrupal. Esto consigue un control perfecto de los factores pronósti-
cos como el sexo, la raza, etc. Uno de los problemas es el efecto carry over P212 (MIR 06-07) Ensayo clínico cruzado
o de arrastre (el efecto de uno puede influir sobre la toma del otro), así
que ha de haber un periodo de lavado entre la administración de los dos
fármacos, de modo que el primer fármaco haya sido totalmente aclarado
del organismo antes de proporcionar el segundo.

Dicho esto, sobre la pregunta que nos ocupa, no es el diseño ideal para
medidas preventivas (opciones 1, 3, 4). La opción 5, el antibiótico, tam-
poco es adecuada, porque el primer antibiótico que administres puede
curar la otitis e impedir evaluar el efecto del segundo. Sin embargo, los
analgésicos para el síndrome premenstrual son meramente sintomáticos
y sin efecto residual entre uno y otro, de modo que pueden ser evaluados
mediante este diseño sin problemas (respuesta 2, correcta).

P205 MIR 2006-2007


P216 MIR 2006-2007
Para contestar esta pregunta has de tener en cuenta que nos piden el di-
seño más adecuado, lo cual no quiere decir que algunas de las opciones Pregunta fácil que ya ha sido preguntada en otras ocasiones. Existen cua-
no sean válidas. La aleatorización consiste en asignar por azar, para que tro fases en el desarrollo de un medicamento. La fase I es la primera vez
no influya ningún factor y nos evite sesgos. El enmascaramiento (doble que un fármaco se da a humanos. Acostumbran a ser voluntarios sanos
ciego) también persigue evitar sesgos. En un ensayo en fase III el fármaco sin grupo control, aunque también se usan en pacientes enfermos de
se compara con el tratamiento de referencia (AAS en este caso) o con enfermedades graves, por razones humanitarias, en los que no hay una
placebo en el caso de que no haya tratamiento eficaz (aquí sí lo hay, por terapia alternativa que dé resultado (uso compasivo de medicamentos
lo que no sería ético compararlo con placebo). en cáncer de mama... dándose fármacos que aún están en proceso de
investigación). El principal objetivo del ensayo en fase I es evaluar la toxi-
cidad y conocer la dosis única aceptable no tóxica. El ensayo en fase II tie-
P210 MIR 2006-2007 ne como objetivo principal aportar información sobre la dosis/respuesta,
dando información preliminar sobre la eficacia. No tienen que ser com-
Pregunta muy típica que ya ha caído años anteriores. La aleatorización parativos, y se realiza en pacientes. El ensayo en fase III es el prototipo de
reside en asignar por azar, sin que influya ningún factor, los pacientes de ensayo clínico, que suele ser comparativo entre la terapia de referencia
la muestra a los dos grupos de intervención de modo que, si el tamaño o con el placebo. Sirve para evaluar la eficacia de un nuevo fármaco y
muestral es suficientemente grande, se consiga una distribución homo- la existencia de efectos adversos habituales. Es la parte más rigurosa. El
génea de las variables predictoras en ambos grupos. La aleatorización ensayo en fase IV es lo mismo que la farmacovigilancia y consiste en el
ideal es la de tipo estratificado: los pacientes son divididos en grupos o seguimiento postcomercialización de un número elevado de pacientes
estratos homogéneos respecto a alguna variable de interés pronóstico y, con el fin de detectar efectos adversos poco frecuentes o de aparición
posteriormente, son asignados aleatoriamente a uno de los dos grupos tardía, evaluar nuevas indicaciones de fármacos o posibles interacciones
de intervención. con fármacos del mercado.

P212 MIR 2006-2007 P219 MIR 2006-2007

Pregunta algo lógica que ya ha aparecido otra vez en el MIR. El ensayo Pregunta fácil preguntada varias veces en el MIR. En función de los cri-
clínico con diseño cruzado o intrapaciente consiste en que un mismo pa- terios de inclusión podemos dividir los ensayos clínicos en dos grandes

ESTA DÍSTICA Y EPIDEMIOLOGÍA 228


Estadística y epidemiología
grupos: pragmáticos y explicativos. Los ensayos clínicos pragmáticos se El enmascaramiento es una técnica para controlar los sesgos en la medi-
acercan lo más posible a la población general, siendo los criterios de in- ción de la variable resultado. Si utilizamos este procedimiento, decimos
clusión muy laxos (prácticamente los únicos son los diagnósticos). Tienen que el ensayo clínico es ciego (simple, doble o triple). Sin embargo, no
mayor reclutamiento, son más generalizables, con mayor validez externa; todos los ensayos clínicos son ciegos. Según nuestro enunciado, no po-
sin embargo, la muestra es más heterogénea, se necesita mayor tama- demos asumir que el nuestro lo sea (opción 2, incorrecta).
ño muestral y los resultados son confusos si sólo es eficaz en subgrupos
de pacientes. Se utilizan en las fases III y IV del ensayo clínico. El análisis Con respecto a las opciones 4 y 5, que también son incorrectas, hemos de
de los resultados es por intención de tratar, que incluye a todos los pa- decir que no existe un mínimo de duración o de tamaño muestral. Estos
cientes que han sido seleccionados y en el grupo que fueron asignados, aspectos están condicionados por el objetivo del estudio y la variable
pese a que no hayan finalizado el estudio o hayan cambiado de grupo. utilizada. Por eso, se hace la predeterminación del tamaño muestral.
Por otro lado, los ensayos explicativos tienen los criterios de inclusión
muy estrictos, con lo que la población no es exactamente igual a la po-
blación general. Son más homogéneos, se necesita menor tamaño para P202 MIR 2005-2006
detectar diferencias, tienen mayor validez interna; no obstante, existe
una limitación a la hora de generalizar sus resultados y de reclutar a pa- Pregunta de dificultad media acerca del uso de placebo. Es la segunda
cientes. Se utilizan, sobre todo, en las fases II y III. El análisis es por pro- vez que preguntan sobre este aspecto. Hemos de tener en cuenta que
tocolo, que incluye sólo a pacientes que han cumplido los requisitos del los grupos control de un ensayo clínico pueden ser de muy distinto tipo.
protocolo y/o han finalizado el estudio. Entre ellos, se encuentra el placebo, que es el único que permite valorar
la eficacia absoluta del tratamiento. El resto de controles (históricos, otro
fármaco o una intervención no farmacológica como el tratamiento qui-
P259 MIR 2006-2007 rúrgico o la educación sanitaria) sólo nos pueden informar de la eficacia
relativa, esto es, en comparación con otra medida.
El uso del placebo tiene muchas implicaciones éticas, así que siempre
se ha de considerar en qué pacientes se utiliza. Debes analizar las distin- El uso de placebo plantea problemas de índole ética, ya que no es lícito
tas opciones y adivinarlo por sentido común: podemos usar el placebo negar un tratamiento de eficacia demostrada. Lo más importante, en re-
cuando no hay riesgo para el sujeto, cuando no esté el médico diciendo lación con este aspecto, queda recogido en las opciones 2, 3 y 4, que son
a qué persona le da el placebo y a quién no (el doble ciego también ciertas. Es primordial tener en cuenta que es más fácil encontrar diferen-
aporta el que el paciente no sepa con qué está siendo tratado, si bien cias si comparamos con placebo que si comparamos con otro fármaco. La
esto influye con respecto a los sesgos más que a las consideraciones respuesta incorrecta es la 5, y esto es precisamente lo que preguntaron
éticas), cuando el tratamiento usado sea muy tóxico o su eficacia sea du- en el MIR. En el documento del consentimiento informado queda recogi-
dosa, y cuando haya un tratamiento de rescate. Pero, en ningún caso, lo da la información relevante acerca del diseño y objetivo del estudio en el
podremos utilizar cuando exista tratamiento eficaz en una enfermedad que se le propone participar. En caso de que sea un estudio controlado
muy grave. con placebo, el paciente ha de conocer que, entre las alternativas de tra-
tamiento que podría llegar a recibir tras la aleatorización, está el placebo
(sustancia inactiva). Esto no afecta al enmascaramiento, porque es una
P199 MIR 2005-2006 información proporcionada antes de la asignación y de que el individuo
dé su consentimiento.
Pregunta muy fácil repetida año tras año. Los estudios epidemiológicos
se pueden dividir en dos grupos:
• Estudios descriptivos: describen las características y la frecuencia de P204 MIR 2005-2006
un problema de salud.
• Estudios analíticos: intentan establecer una relación de causalidad Pregunta difícil acerca del ensayo clínico. De nuevo nos preguntan acerca
entre el factor de riesgo y la enfermedad. Los estudios analíticos se de distintas variantes de diseño del ensayo clínico. La palabra clave para
clasifican en estudios experimentales y observacionales. contestar correctamente esta pregunta está en el enunciado. Necesitan
un diseño en el que los tratamientos se puedan comparar administrados
En los estudios experimentales es el investigador el que asigna el factor solos y en combinación. Mediante el diseño factorial podemos evaluar,
de estudio, mientras que, en los observacionales, el investigador se limita simultáneamente, los dos tratamientos, el eprosartán y la vitamina E, en
a observar qué es lo que sucede en un grupo de individuos, sin manipu- una misma muestra de sujetos, en este caso los pacientes de alto riesgo.
lar el estudio. Dentro de los observacionales, los dos más representativos Se asigna aleatoriamente a los sujetos a uno de los tres grupos posibles:
son el estudio de cohortes y casos y controles, mientras que el estudio recibir eprosartán, recibir vitamina E, recibir eprosartán + vitamina E.
experimental por excelencia es el ensayo clínico (opción 1, correcta). Re-
cuerda las características propias de un diseño experimental: Con este diseño se puede evaluar la interacción entre los dos tratamien-
• Introducción del factor de estudio, por parte del investigador (el in- tos, si bien hay que asumir que los dos tratamientos no interaccionan
vestigador es activo). entre sí. En consecuencia, la opción correcta es la 4, puesto que es la
• Asignación aleatoria de los participantes a los distintos grupos de única que nos habla del diseño factorial, aunque la descripción de éste
estudio. no es la más adecuada.

229
DESGLOSES
COMENTADOS MIR
En los diseños clásicos o en paralelo, el grupo control recibe el tratamien- • Análisis por protocolo, donde se incluyen sólo a aquellos pacientes
to a la vez que el grupo experimental con el fin de controlar el efecto de que han cumplido los requisitos de protocolo y/o han finalizado el
los factores pronósticos que pudieran cambiar a lo largo del tiempo. No estudio.
permite, por tanto, combinar dos tratamientos en un grupo como en el • Análisis por intención de tratar, donde se incluye a todos los pacien-
diseño factorial (opción 1, incorrecta). tes, aunque no hayan finalizado el estudio o hayan cambiado de gru-
po. Por tanto, la opción correcta es la 1.
P204 (MIR 05-06) Ensayo clínico: diseño factorial
Al analizar los resultados al final de un ensayo clínico es preferible
hacer un análisis por intención de tratar que un análisis por protocolo.
Esto es debido a que el análisis por intención de tratar incluye a todos
los pacientes que fueron seleccionados (por tanto aleatorizados), y en
el grupo en el que fueron asignados. De este modo, se evita la pérdida
de información que supone obviar el abandono del tratamiento por
En los diseños cruzados o intrapaciente, un mismo paciente va a recibir algún factor relevante (por ejemplo, por efectos secundarios), con lo
los dos tratamientos objeto de comparación en dos momentos distintos, que se pueden generalizar mejor los resultados al ser más parecidos
de modo que cada paciente sirve de control a sí mismo, lo cual reduce a la práctica diaria. En el análisis por protocolo se incluye sólo a los
la variabilidad intragrupal y consigue un control perfecto de los factores pacientes que han cumplido los requisitos del estudio y lo han fina-
pronósticos de carácter perenne, como el sexo, la raza, etc. Una vez más lizado.
este diseño no nos permite ver el efecto de los dos tratamientos en com-
binación (opción 2, incorrecta). En el siguiente ejemplo vamos a ver por qué es más adecuado hacer el
análisis por intención de tratar.

P205 MIR 2005-2006 P206 (MIR 05-06) Análisis por protocolo vs. por intención de tratar

Pregunta fácil acerca del ensayo clínico. Los ensayos clínicos tienen cua-
tro fases y han sido objeto de pregunta en las últimas convocatorias MIR.
Las cuatro fases son:
• Fase I: es la primera vez que un fármaco se da a humanos. General-
mente se realiza con voluntarios sanos (n = 20-80) y sin grupo control.
El principal objetivo es evaluar la toxicidad y conocer la dosis única
aceptable no tóxica. En esta fase evaluaremos la farmacocinética,
farmacodinámica, bioequivalencia y biodisponibilidad. Por tanto, la
dosis más eficaz no se evalúa en esta fase sino en la fase II (opción 4,
correcta).
• Fase II: el principal objetivo es aportar información sobre la relación
dosis/respuesta, proporcionando una información preliminar sobre
la eficacia. Se hace en pacientes (n = 100-200). No necesariamente
tienen que ser comparativos. En el análisis por intención de tratar se tienen en cuenta los 400 pacien-
• Fase III: es el prototipo del ensayo clínico. Suele ser comparativo con tes que iniciaron el estudio, 200 en el grupo A y 200 en el grupo B. En
la terapéutica de referencia o con un placebo. Es la investigación clí- cambio, en el análisis por protocolo sólo se incluyen los pacientes que no
nica más extensa y rigurosa sobre un tratamiento médico. Sirve para abandonaron el estudio, 160 en el grupo A y 190 en el grupo B. Observa
establecer la eficacia de un nuevo fármaco y la existencia de efectos cómo los resultados del mismo ensayo clínico son diversos y que en el
adversos frecuentes. análisis por protocolo se encuentran diferencias mucho mayores entre
• Fase IV: también se denomina farmacovigilancia y consiste en el se- los dos tratamientos.
guimiento postcomercialización de un número muy elevado de pa-
cientes con el fin de detectar efectos adversos poco habituales o de
aparición tardía. La fase IV también sirve para evaluar interacciones P207 MIR 2005-2006
entre medicamentos y sugerir nuevas indicaciones de fármacos ya
aceptados para otro fin. Pregunta difícil, ya que requiere tiempo para su análisis. En esta pre-
gunta nos hablan de dos conceptos: porcentaje de reducción absoluta
de riesgo y el nivel de significación estadística. El nivel de significación
P206 MIR 2005-2006 estadística hace referencia a la probabilidad de equivocarnos, fija la
probabilidad máxima de que los resultados diferentes observados en-
Pregunta de dificultad media acerca del análisis por intención de tratar. tre los dos grupos puedan ser debidos simplemente al azar, que suele
A la hora de realizar el análisis de los resultados en un ensayo clínico (EC), ser por convenio del 5%. En esta pregunta, en las tres comparaciones,
podemos llevar a cabo dos tipos: A versus placebo, B versus placebo y C versus placebo, la p es menor

ESTA DÍSTICA Y EPIDEMIOLOGÍA 230


Estadística y epidemiología
de 0,05, es decir, que en todas las comparaciones el resultado es esta- P214 MIR 2005-2006
dísticamente significativo. La reducción adherente de riesgo (es decir,
reducción absoluta de riesgo) es una medida que implica la magnitud Pregunta directa y muy fácil. No debes fallarla.
del efecto. Como las tres corporaciones son significativas, el medica-
P214 (MIR 05-06) Formato oficial para la notificación
mento que muestra un efecto de mayor magnitud será aquel en el que
espontánea de RAM
el porcentaje de resolución absoluta sea mayor. Por consiguiente, el
medicamento B es el que muestra una mayor magnitud frente a place-
bo (opción 3, correcta).

P209 MIR 2005-2006

Se trata de una pregunta complicada, puesto que no se responde con


conocimientos de estadística, sino con conocimientos de urología, pese
a que se encuentre en el bloque de estadística y epidemiología.

La fosfatasa ácida prostática (FAP) se emplea en clínica desde hace dé-


cadas, es un marcador específico de tumor de próstata, y su elevación
suele indicar extensión extraprostática. En este estudio se comparan dos
tratamientos y se observa cómo, con un tratamiento nuevo, se consigue
una reducción significativa en la fosfatasa ácida para la HBP. Sin embargo,
aunque la reducción es significativa, la variable principal no es relevante,
dado que la fosfatasa ácida se usa para el carcinoma prostático y no para
la hiperplasia prostática benigna. Por tanto, no se puede recomendar el
cambio de tratamiento.

P211 MIR 2005-2006

Pregunta fácil. Has de dominar los tipos de ensayos clínicos para el MIR.
En el ensayo clínico de diseño secuencial no conocemos a priori el tama-
ño muestral, sino que se van incluyendo pares de pacientes aleatoriza-
dos a los dos tratamientos (uno al tratamiento en estudio y otro al grupo
control). Se analizan los resultados, después de introducir a cada pareja,
y cuando la diferencia entre los dos tratamientos favorece a uno de ellos
(exceso de preferencias), es el momento en que el ensayo clínico se de-
tiene. Se pueden seguir incluyendo pacientes hasta que exista evidencia
de eficacia, efectos secundarios o cuando la probabilidad de obtener una
diferencia relevante es muy baja.
Una vez que se encuentra un fármaco en el mercado (tras pasar la fase III),
Ventajas del diseño secuencial: pueden aparecer efectos adversos que han de ser detectados en la fase IV o
• No hay un tamaño muestral predeterminado. de farmacovigilancia. La Notificación Espontánea de Reacciones Adversas
• Se incluyen pacientes en función de los resultados. a Medicamentos (RAM) es la principal fuente de información del Sistema
• Éticamente correcto. Español de Farmacovigilancia, y supone la recogida y notificación (en las
• Adaptables a cualquier tipo de variable. tarjetas amarillas, que son formularios destinados a ello) de las RAM que
• Posibilidad de realizar múltiples análisis intermedios. aparecen durante la práctica clínica. En general, se acepta cualquier reac-
• Ahorro de pacientes de hasta un 40%. ción adversa, aunque las de mayor interés son las RAM graves, inesperadas
o raras y aquéllas de fármacos de comercialización reciente (menos de tres
Inconvenientes del diseño secuencial: años). El programa de Notificación Espontánea está dirigido especialmen-
• Variable principal única. te a médicos, aunque también incluye a otros profesionales sanitarios.
• Necesidad de conocer los resultados de la intervención poco des-
pués de la inclusión del paciente.
• Riesgo de cometer errores tipo I. P216 MIR 2005-2006
• Métodos estadísticos de diseño y análisis complejos.
• Difícil planificación de recursos. Pregunta de dificultad media. El tema del ensayo clínico es uno de los
• Un 10% necesita más pacientes que el diseño con tamaño fijo. más rentables de cara al examen MIR; estúdialo bien. Lo primordial a

231
DESGLOSES
COMENTADOS MIR
la hora de interpretar un ensayo clínico es valorar la posible existencia P197 MIR 2004-2005
de errores en las distintas fases del estudio, puesto que cualquier fallo
no controlado en el diseño (opción 3) o en la ejecución podría invalidar El muestreo aleatorio estratificado asegura que, en nuestra muestra, la
los resultados finales, no importando entonces si las diferencias alcan- proporción de una o varias variables sea la misma que en la población
zan o no la significación estadística (opción 2, correcta). Las pérdidas total (respuesta 3, correcta).
de sujetos y los motivos de las mismas pueden invalidar los resultados
finales del estudio si éstas no se tienen en cuenta. Las pérdidas que Imagina un estudio sobre el cáncer de pulmón. En la población podría ha-
ocurren antes de la aleatorización pueden afectar a la capacidad de ber variables que pudiesen influir mucho en el resultado, por ejemplo, ser
generalización de los resultados (a la validez externa), mientras que fumador o no serlo. Lo que haríamos sería obtener una muestra en la que el
las pérdidas postaleatorización pueden afectar a la validez interna (op- porcentaje de fumadores y no fumadores fuese el mismo que en la pobla-
ción 1). ción general. De esta forma, si en la población fuma un 30%, en mi muestra
habría que conseguir un 30% de fumadores. Naturalmente, esto puede ha-
Las características de los pacientes incluidos podrían condicionar la cerse respecto a muchas más variables, según las necesidades del estudio.
aparición de sesgos, factores de confusión, determinada respuesta al
tratamiento… En fin, es conveniente valorarlas y tenerlas en cuenta
antes de interpretar los resultados de un estudio (opción 4). La va- P198 MIR 2004-2005
riable de medida utilizada debe ser una característica observable y
mensurable, que se evaluará durante un tiempo determinado en los Una pregunta fundamental. En alguna otra ocasión, han hecho preguntas
sujetos del estudio. Debemos asegurarnos que la variable y su medi- sobre el análisis de los resultados. Es comprensible que intenten confun-
ción han sido correctas previamente a interpretar los resultados del dirnos entre el análisis por protocolo y el análisis por intención de tratar.
estudio (opción 5).
El análisis por intención de tratar incluye a TODOS los pacientes que han
sido seleccionados. Se les analiza en el grupo al que fueron asignados
P196 MIR 2004-2005 inicialmente, pese a que no terminaran el estudio o cambiasen de grupo.
En cambio, el análisis por protocolo sólo incluye a los que han cumplido
Pregunta de cierta dificultad, pero muy instructiva, dado que hace refe- los requisitos del protocolo y han finalizado el estudio. Esto tiene un pro-
rencia a varias ideas primordiales. Revísala con atención si la has fallado. blema fundamental; vamos a verlo en un ejemplo práctico.
1. Por supuesto, si estamos hablando de controles históricos, puede que
cierta información se haya perdido en el tiempo (o no fuera recogida) Imagina que estamos comparando la eficacia de dos fármacos, A y B. Su-
porque evidentemente pertenecen al pasado. pongamos que los enfermos del grupo B llegan todos al final del estudio,
2. Muy lógico… ¿Cuándo habrá más diabéticos, con los criterios actuales pero los del grupo A abandonan a la mitad, y el resultado no encontrara
(Glu >126) o con los antiguos (Glu >140)? Lógicamente, al exigir un diferencias estadísticamente significativas. Este estudio podría estar ses-
nivel de glucemia más bajo como criterio diagnóstico, el número de gado. ¿Por qué abandona la gente el fármaco A? Podría ser, por ejemplo,
personas consideradas diabéticas aumenta. Por esto, puede variar la porque el fármaco A no esté siendo eficaz. Este tipo de análisis no lo de-
prevalencia si modificamos la definición de diabético o de otras enfer- tectaría, puesto que sólo analiza los que han llegado al final del estudio
medades. (los que les iba bien, por eso no vemos diferencias respecto a B). Éste es
3. Cuidado, es al contrario, la tendencia es más a HIPERVALORAR. Vamos el problema del análisis por protocolo: al no considerar las pérdidas, el
a poner un ejemplo muy extremista, pero muy gráfico: imagina que resultado puede estar sesgado si se dan situaciones como ésta.
comparamos la eficacia de un antibiótico nuevo con la penicilina.
Comparamos nuestro grupo de pacientes con otro grupo, tratado con
penicilina en 1940. Resultado del estudio: diferencias significativas a P199 MIR 2004-2005
favor del nuevo fármaco. Pues bien, la eficacia del nuevo fármaco tal
vez sea superior a la penicilina, pero… ¿No habrá contribuido que el Los análisis intermedios se realizan durante las fases III y IV del estudio.
desarrollo sanitario en el año 2007 es bastante superior al de 1940? Tal Están justificados, dado que, si detectan una diferencia entre los trata-
vez sea la limpieza del hospital, los cuidados de enfermería, la mejor mientos que se comparan, evitan que haya pacientes que no se benefi-
alimentación, la mejora del nivel de vida, la II Guerra Mundial… Quién cien del tratamiento (se pararía el ensayo y se trata a todos con el fármaco
sabe. Cuando usas controles históricos, hay muchos factores que pue- bueno). Sin embargo, no se debe hacer un número muy elevado. A ma-
den cambiar, no sólo el fármaco. yor número de análisis intermedios, mayor posibilidad de que, en alguno
4. Has de conocer muy bien qué influye en el cálculo del tamaño mues- de ellos, se detecte una diferencia que realmente no existe (error tipo I).
tral. Para el número de sujetos necesario, da igual que sean controles
históricos o actuales. Sí influyen parámetros como alfa, mínima dife-
rencia que se desea detectar, etc. P201 MIR 2004-2005
5. Es lo que explicábamos en la respuesta 3. ¿Por qué nuestro fár-
maco es mejor que el de hace 70 años? ¿Por el fármaco o porque, Este mismo concepto ha aparecido en el MIR 2006-2007. Como sabes, el
además, tomamos otras medidas concomitantes que entonces no diseño que más evidencia científica ofrece es el ensayo clínico aleatorio.
existían? El análisis secuencial lo usamos para ahorrar pacientes, especialmente

ESTA DÍSTICA Y EPIDEMIOLOGÍA 232


Estadística y epidemiología
en aquellos casos que la intervención sea costosa. A cambio, son más Una variable intermedia es aquella que está presente en una cadena
difíciles de analizar, por lo que en el caso de una neumonía puede no causal, entre una variable independiente y una dependiente (variable in-
compensar, al ser un tratamiento relativamente barato y sencillo (opción dependiente  intermedia  dependiente). Puede verse influida por la
1 falsa). Dado que se trata de una enfermedad para la que ya dispone- variable independiente y, a su vez, influye sobre la dependiente, asocián-
mos de un tratamiento eficaz, la comparación con placebo no sería ética dose a la vez a ambas. El uso de variables intermedias implica que estén
(opción 2 falsa). Lo que les falla a las opciones 4 y 5 es el tipo de ensayo previamente validadas. Cuando no están previstas en el estudio, pueden
que plantean. Cuando se trata de antibióticos, carece de sentido utilizar suponer graves errores metodológicos y producir sesgos diversos (com-
un ensayo cruzado. No olvides que en este tipo de ensayos se emplea pri- portándose, por ejemplo, a modo de factor de confusión).
mero un fármaco, se deja un periodo de lavado y después se introduce el
segundo fármaco, en el mismo paciente. El problema de estos ensayos es
el potencial efecto residual de los fármacos (si el primer antibiótico cura P205 MIR 2004-2005
la infección, difícilmente podrás probar la eficacia del segundo).
El diseño cruzado se está empezando a preguntar bastante durante los
últimos años (dos preguntas en el MIR 2006-2007). Vamos a explicar lo
P202 MIR 2004-2005 más destacado sobre este tipo de diseño.
• El diseño cruzado también recibe el nombre de INTRAPACIENTE. En él,
El concepto de relevancia clínica ha aparecido en el MIR dos veces duran- el mismo paciente recibe dos tratamientos en dos momentos distin-
te los últimos tres años, así que debes entenderlo bien. Un ensayo clínico tos, de forma que sirve de control respecto a sí mismo (comparamos
puede ser metodológicamente perfecto, pero si sus resultados carecen el efecto de los dos fármacos). Por ello, al haber distintas medicio-
de aplicación práctica, carecería de relevancia clínica, como es este caso. nes en el mismo individuo, se trata de datos apareados (respuesta 4,
Los antiepilépticos, en el mundo real, se utilizan a dosis variables de un cierta). Lógicamente, como cada paciente es control de sí mismo, ha-
paciente a otro. Por esto, la comparación que nos plantean es absurda. Es rán falta menos pacientes (respuesta 1, cierta). Como consecuencia
indiferente que el fármaco nuevo (a dosis variables) supere a una dosis de esto, las pérdidas influyen más en el estudio, porque perder un
fija de fenitoína; no se utiliza así. Pese a que, por lo demás, el método fue- solo paciente sería como perder dos (respuesta 3, cierta).
se perfecto, le falta relevancia clínica, ya que la forma habitual de utilizar • Uno de los problemas que plantea este tipo de diseño es el efecto
la fenitoína es distinta a la del estudio. Para solucionar este problema, residual o de arrastre de los fármacos. Aparte, en ciertos casos no se
deberían haber comparado el nuevo fármaco (dosis variables) con la fe- puede emplear este tipo de diseño. Por ejemplo, ante una infección
nitoína, a dosis también variables. aguda no habría lugar a comparar dos antibióticos mediante un dise-
ño cruzado, de modo que el primero que administras podría curar la
infección, impidiendo evaluar el segundo. Esto es lo que quiere decir
P203 MIR 2004-2005 la respuesta 5, si bien no está expresada de forma muy inteligible.

Las preguntas de estadística y epidemiología se repiten mucho en el MIR, Ten cuidado con la respuesta 2. Lo que es menor es la variabilidad IN-
pero ésta supera a la media en dificultad. La forma más sencilla de afron- TRAINDIVIDUAL. La variabilidad INTERindividual (la que existe entre los
tarla es por descarte de opciones: distintos individuos que forman parte del estudio) no tiene por qué ser
• No encontrar diferencias entre el fármaco estudiado y el control pue- distinta que en otros tipos de diseño (respuesta 2, falsa).
de deberse a varias razones: que realmente no existan tales diferen-
cias o, también, que aun existiendo no seamos capaces de detectar-
las (por ejemplo, debido a un tamaño muestral escaso). Por esto, no P207 MIR 2004-2005
podemos asumir equivalencia (respuesta 1, falsa).
• La opción 2 es claramente falsa. Por supuesto, hacer ensayos INÚTI- Esta pregunta ha aparecido prácticamente idéntica en el MIR 2006-2007.
LES para la ciencia es absurdo, porque desperdicia un esfuerzo huma- También en el 2007-2008 se maneja este concepto, por lo que podemos
no y económico que podría dedicarse a cualquier otro fin. decir que está MUY de moda. Desde el punto de vista metodológico, el me-
• El error alfa es la probabilidad de encontrar diferencias cuando en jor diseño es el ensayo clínico aleatorio, dado que es el que más evidencia
realidad no existen. Lo que describe la opción 3 es el error beta. científica ofrece. La duda está entre las opciones 2 y 4. No obstante, recuerda
• Respuesta 4: los posibles abandonos deberían tenerse en cuenta en que no sólo se tiene en cuenta el grado de evidencia, sino también aspectos
ambos grupos para el cálculo del tamaño muestral. De esta forma, éticos. Y no es ético tratar a un paciente con placebo, cuando sabemos que
evitamos la pérdida de poder estadístico, adelantándonos a las posi- existe un fármaco eficaz, especialmente si se trata de una enfermedad po-
bles pérdidas (éste es el procedimiento habitual). Otra opción podría tencialmente grave, como la colitis ulcerosa. Por ello, habría que elegir la 4.
ser sustituir las pérdidas; sin embargo, cambiar más pacientes en un
grupo que en otro podría generar un sesgo. Al principio del estudio,
los dos grupos tal vez eran comparables… No obstante, si luego cam- P209 MIR 2004-2005
biamos más pacientes en uno que en otro, posiblemente ya no lo
sean (el grupo ya no es el que inicialmente habíamos previsto para El sistema de farmacovigilancia ha sido preguntado ya en alguna oca-
la comparación). Por tanto, en caso de recurrirse a un método como sión. Concretamente, esta pregunta es relativamente fácil, puesto que
éste, las sustituciones deberían ser similares entre los dos grupos. puede resolverse por exclusión.

233
DESGLOSES
COMENTADOS MIR
• Respuesta 2: una notificación adversa grave no es motivo para la re- El programa de Notificación Espontánea está dirigido especialmente a
tirada del fármaco, ya que un solo caso no implica que la relación médicos, si bien incluye a otros profesionales sanitarios.
esté demostrada. Podría haber sido producida por una circunstancia
ajena al fármaco, siendo casual la relación con éste.
• Respuesta 3: que se haya recibido más de un caso tampoco impli- P134 MIR 2003-2004
ca causalidad. Ante la presencia de estos casos, queda demostrar la
asociación, para lo que habrá que recurrir a las técnicas estadísticas Se trata de una pregunta de un tema reiterado en el MIR, el ensayo clí-
oportunas. Tal vez estas reacciones no sean por el medicamento, sino nico, si bien se refiere a una aspecto muy concreto del mismo, la com-
por la propia enfermedad para la que se utiliza, o simplemente cir- paración intrapaciente en los ensayos clínicos cruzados, que no es nada
cunstanciales. fácil.
• Respuesta 4: no sabemos si la hepatitis apareció al azar o si fue una
reacción adversa rara. Si aparece un solo caso después de dos años El ensayo clínico cruzado o intrapaciente consiste en que un mismo pa-
de uso, probablemente sea al azar, pero no podemos estar seguros ciente va a recibir los dos tratamientos objeto de comparación en dos
(siempre puede haber una primera vez, esto no lo sabemos). momentos distintos, de modo que cada paciente sirve de control a sí
• Respuesta 5: esta opción dice lo mismo que la 4, así que no pueden mismo, lo cual reduce la variabilidad intragrupal y consigue un control
ser correctas a la vez. Observa que niega de forma categórica la posi- perfecto de los factores pronósticos de carácter perenne, como el sexo,
ble asociación, lo cual no es correcto. la raza, etc.

La única solución razonable es la 1. Ante un solo caso grave, lo lógico es Uno de los problemas es el efecto carry over o de arrastre (el efecto de
considerar cuánta gente se ha expuesto al fármaco y estar alerta ante uno puede influir sobre la toma del otro), por lo que ha de haber un pe-
una posible asociación. riodo de lavado entre la administración de los dos fármacos, de modo
que el primer fármaco haya sido totalmente aclarado del organismo an-
tes de administrar el segundo.
P216 MIR 2004-2005
Si este efecto arrastre o residual es distinto con los dos tratamientos, la
Pregunta básica sobre el ensayo clínico. Es uno de los temas más de situación basal tras el periodo de lavado no es igual en los dos grupos,
moda en el MIR durante los últimos años, así que no lo descuides. La pri- así pues para el análisis no se va a poder comparar cada paciente con-
mera administración del fármaco en humanos se realiza en los ensayos sigo mismo, ya que habría diferencias según el orden en que hubiesen
en fase I (respuesta 3, incorrecta). Más adelante, a partir de la fase II, se recibido los tratamientos. Como consecuencia, es posible que el tamaño
administran en enfermos. En algún caso, se hacen excepciones y se dan muestral sea insuficiente a la hora de realizar el análisis estadístico.
en enfermos en fase I, cuando se trata de fármacos extremadamente tó-
xicos y no haya ningún tipo de alternativa terapéutica (por ejemplo, en-
fermos neoplásicos muy avanzados). Recuerda también que el objetivo P138 MIR 2003-2004
de los estudios en fase II es determinar la relación dosis/respuesta, para
pasar luego a fase III, donde serán comparados con placebo o con otras Es una pregunta reiterada y fácil, que no se puede fallar. Por definición,
alternativas terapéuticas si existen. un ensayo clínico cruzado es aquel en el que todos los pacientes reciben
ambas opciones terapéuticas en estudio. En un EC cruzado, los pacientes
son divididos en dos grupos que recibirán de forma sucesiva (periodos 1
P133 MIR 2003-2004 y 2), aunque en orden inverso, ambos tratamientos. Entre ambos perio-
dos de tratamiento debe existir un periodo de lavado de una duración
Pregunta diferente y, por tanto, difícil. La farmacovigilancia es la recogida suficiente para asegurar el aclaramiento de ambos fármacos.
de datos sobre seguridad de fármacos una vez que se autoriza su comer-
cialización. Su objetivo es detectar reacciones adversas poco frecuentes
que no han sido identificadas durante el desarrollo del ensayo, dado que P139 MIR 2003-2004
éste se ha realizado en una población limitada (generalmente n < 2000).
El Sistema Español de Farmacovigilancia, recibe información de diferen- Pregunta difícil sobre el análisis estadístico de un ensayo clínico. Una
tes fuentes, entre ellas, y principalmente, la notificación espontánea de nueva estrategia terapéutica ha de demostrar, con vistas a su comerciali-
reacciones adversas. zación, que es superior, o al menos no inferior, a los tratamientos ya dis-
ponibles. Como ya sabes, para el análisis estadístico de un ensayo clínico
La notificación espontánea de reacciones adversas supone la recogida se puede elegir la población por intención de tratar (todos los pacientes
y notificación mediante las tarjetas amarillas de las reacciones adversas seleccionados y analizados en el grupo en el que fueron asignados), o
que aparecen durante la práctica clínica. bien la población por protocolo (sólo aquellos pacientes que han cum-
plido los requisitos del protocolo y/o finalizado el estudio).
En general, se acepta cualquier reacción adversa. Sin embargo, las de
mayor interés son las reacciones adversas graves, inesperadas o raras, y La población PP es la población ideal que cumple el tratamiento y no
aquellas de fármacos de comercialización reciente (menos de tres años). tiene problemas de falta de eficacia y/o de seguridad y, por consiguien-

ESTA DÍSTICA Y EPIDEMIOLOGÍA 234


Estadística y epidemiología
te, finaliza el estudio. Ésta es la población que debe utilizarse para el cia, debería combinar estos dos factores. A la hora de tomar decisiones
análisis de no-inferioridad: basta que demostremos que no es inferior, clínicas, hay que considerar además las preferencias de los enfermos (es
aunque sea en las mejores condiciones posibles. Sin embargo, para el aná- decir, este concepto no está reñido con la autonomía del pacientes).
lisis de superioridad hemos de ponernos en la peor situación, es decir,
elegir a toda la población del estudio, en la que están incluidos tanto los
que tienen problemas de eficacia como de seguridad, porque ésta se P197 MIR 2006-2007
aproxima a la población que vamos a encontrar en la práctica clínica y,
en estas condiciones, hay que demostrar la supuesta superioridad. Pregunta conceptual sobre los metaanálisis, concepto recientemente in-
troducido en el examen MIR. Un metaanálisis es un estudio basado en
la integración estructurada y sistemática de la información obtenida en
P151 MIR 2003-2004 diferentes ensayos clínicos, sobre un problema de salud determinado.
Se fundamenta en identificar y revisar los estudios controlados sobre un
Pregunta difícil, pero asequible si dominamos las distintas fases de un determinado problema, con el fin de dar una estimación cuantitativa sin-
estudio. No olvides que para el MIR es imprescindible dominar el EC. tética de todos los estudios disponibles. Dado que incluye un número
Existen diversos tipos de estudios de utilización de medicamentos: des- mayor de observaciones, un metaanálisis tiene un poder estadístico su-
criptivos y analíticos. Sus objetivos varían, y van desde describir las in- perior al de los ensayos clínicos que incluye.
dicaciones en las que se emplean los fármacos, identificar los fármacos
para una indicación determinada, hasta estudios de dosis y duración de
tratamientos, de cumplimiento e incluso modificar problemas relaciona-
dos con los mismos. En ningún caso va a hacerse un estudio de eficacia
T10 Estadística. Generalidades
frente a placebo. No sería un estudio de utilización de fármacos comer-
cializados, sino un ensayo clínico. P184 MIR 2014-2015

Pregunta directa sobre los tipos de variables. Existen dos grandes grupos
P257 MIR 2003-2004 de variables, cualitativas o categóricas y cuantitativas o numéricas. Éstas,
a su vez, se dividen en varios grupos:
Esta pregunta es fácil. Se contesta con la definición. Según los criterios de • Cualitativas: nominales dicotómicas (dos opciones), nominales no di-
inclusión, los ensayos clínicos se dividen en dos tipos: cotómicas (tres o más opciones) y ordinales (escalas).
• EC pragmáticos, en los que los criterios de inclusión son laxos y, por • Cuantitativas: discretas (sin decimales) y continuas (con decimales).
tanto, la muestra seleccionada se va a parecer mucho a la población
de la que se ha extraído. Será una muestra heterogénea. Nos hablan de una variable que sólo tiene dos opciones, presencia o au-
• EC explicativos, en los que los criterios de inclusión son estrictos y, sencia de bacteriuria, por lo que es una variable dicotómica (respuesta co-
por tanto, los pacientes incluidos no se parecerán tanto a los de la rrecta 3: categórica).
población de referencia. Será una muestra homogénea.

Esta división sólo se refiere a los criterios de inclusión, no a las interven- P199 MIR 2008-2009
ciones ni al análisis de resultados ni al enmascaramiento (respuestas 1, 3
y 5, incorrectas). La respuesta 2 se refiere a un EC explicativo. Por consi- Una buena oportunidad para comprender el concepto de muestreo no pro-
guiente, la respuesta correcta es la 4. babilístico, y algunas de sus variantes. Se habla de muestreo no probabilísti-
co cuando la selección de los elementos de la muestra no se hace al azar. Por
el contrario, son probabilísticos aquellos en los que la probabilidad de apa-

T09 Niveles de calidad de la evidencia científica recer en la muestra es conocida (o puede calcularse) para cualquier elemen-
to de la población. Científicamente, los probabilísticos son de mayor valor.

P131 MIR 2009-2010 Dentro de los muestreos no probabilísticos, destaca el de casos consecu-
tivos, que es considerado como el mejor dentro de este grupo. Consiste
La medicina basada en la evidencia no sólo consiste en aplicar ensayos en ir eligiendo a los pacientes que cumplen determinados criterios de
clínicos a la práctica diaria (respuesta 1, falsa), ni limitar todas las decisio- inclusión, hasta alcanzar el número necesario, o dentro de un intervalo
nes a los resultados de determinados trabajos considerados de calidad de tiempo prefijado. En el ejemplo que nos plantea esta pregunta, habría
(opción 2, falsa). Tampoco significa caer en extremismos como los que que estudiar a todos los pacientes que se diagnostican de HTA hasta lle-
aparecen en la respuesta 4. gar a un número (100 casos, por ejemplo) o durante un tiempo preesta-
blecido (6 meses, 10 meses…).
Lo que realmente significa esta denominación es saber combinar la mejor
evidencia clínica existente (por ejemplo, resultados de ensayos clínicos y Otro tipo de estudio no probabilístico es el muestreo de conveniencia,
metaanálisis) con la experiencia clínica adquirida por el profesional médi- que es el que define la opción 1: elegir “a dedo” los casos que suponemos
co a lo largo de su ejercicio. Idealmente, la Medicina Basada en la Eviden- más apropiados para participar en el estudio en cuestión.

235
DESGLOSES
COMENTADOS MIR
P202 MIR 2008-2009 aquellas en las que entre dos valores cualesquiera siempre se puede in-
tercalar otro.
Una pregunta sencilla, casi regalada, probablemente la más fácil de este
bloque en la convocatoria 2008-09. La presencia o ausencia de hemo-
rragia digestiva, obviamente, no puede ser cuantificada, ya que sencilla-
mente existe o no existe. Por tanto, la variable de estudio es cualitativa.
T11 Estadística descriptiva
Además, se diría que es binaria o dicotómica, porque solamente admite
dos alternativas: el paciente sangra o no sangra. P192 MIR 2013-2014

Si hubiésemos clasificado el sangrado en una escala de gravedad (por ejem- Para poder comparar la distribución de una variable en dos muestras nece-
plo: leve, moderado y grave), estaríamos ante una variable cualitativa ordinal. sitamos conocer la dispersión de esta variable, es decir, no sólo su medida
de tendencia central (media) sino también cómo se alejan de ese punto
central; en otras palabras, su medida de dispersión (desviación típica).
P194 MIR 2006-2007 Recuerda que la dispersión de una muestra se mide con el coeficiente de
variación de Pearson, que relaciona media y desviación típica (opción 3).
Pregunta bastante difícil sobre los tipos de muestreo. No te preocupes si
la has fallado. El muestreo probabilístico es el único científicamente váli-
do, por lo que se emplea al diseñar la mayoría de los trabajos científicos. P177 MIR 2012-2013
Implica selección ALEATORIA de los casos. En este muestreo, la probabi-
lidad de aparición de cualquier elemento en una muestra es conocida, o El coeficiente de Fisher mide (según sea positivo o negativo) si hay mas
puede calcularse. En cambio, en un muestreo no probabilístico, la selec- valores a la derecha o a la izquierda de la media, los cuartiles son los
ción de los elementos de la muestra no se hace al azar. valores que dividen la media en 4 partes (25, 50, 75 y 100) la varianza
mide la dispersión de los valores respecto a la media, la curtosis mide
Por ejemplo, si de una población de 100.000 personas elijo al azar 300 el apuntamiento (si es el apuntamiento es muy grande indica que hay
para mi estudio, sería un muestreo aleatorio simple, y es probabilístico, muchos valores alrededor de la media y también valores muy alejados,
porque conozco de antemano la probabilidad de seleccionar cada caso colas muy grandes) y la amplitud mide del valor más bajo al más alto de
(300/100.000). Sin embargo, en un muestreo de casos consecutivos, esta la muestra.
probabilidad no es conocida.

En el muestreo de casos consecutivos, se elige a cada paciente que P194 MIR 2010-2011
cumpla con los criterios de selección dentro de un intervalo de tiempo
prefijado. Se continúan incluyendo hasta alcanzar el tamaño muestral Pregunta sencilla, que se contesta directamente con los Desgloses, sobre
necesario (fechas indicadas con anterioridad). Es decir, se van seleccio- un concepto sencillo y repetido en el examen MIR en muchas ocasiones.
nando todos los casos que cumplen ciertos criterios durante un tiempo, La mediana es una medida de localización o tendencia central. Es el valor
pero NO se hace de forma aleatoria. Simplemente se introducen casos numérico que divide en dos partes iguales a todo un conjunto de datos
hasta llegar al número necesario. Al no haber aleatorización alguna, no numéricos. De esta forma, el 50% estará por encima de la mediana y el
entra en el concepto de muestreo probabilístico. 50% por debajo. En la pregunta, la mediana es 6; por tanto, la respuesta
correcta es la 5. La mitad de los pacientes sobreviven más de 6 años, y la
otra mitad menos.
P146 MIR 2003-2004
Conviene recordar que, en una distribución simétrica, la mediana coinci-
Se trata de una pregunta del tema de generalidades. No son muy comu- de con la media aritmética, no así en distribuciones asimétricas, en cuyo
nes, pero es fundamental dominar conceptos para responder preguntas caso la mediana es mejor que la media como medida de centralización,
de interpretación de resultados o de diseño de estudios. ya que no se ve tan influida por valores extremos.

Recuerda que existen dos tipos de variables: cualitativas y cuantitativa


(se expresan siempre mediante valor numérico). En las escalas de medi- P178 MIR 2009-2010
ción de las variables cualitativas se establecen categorías que, en ocasio-
nes, están jerarquizadas y ordenadas. Hablamos, entonces, de variables Una pregunta extraordinariamente fácil. Fallarla sería perder un punto
ordinales, como la descrita en esta pregunta. Si bien, las categorías del muy valioso. Para sintetizar los datos de una muestra precisamos al me-
enunciado están descritas por número, no es una variable cuantitativa, nos dos parámetros.
puesto que carecen de significado matemático: los pacientes clasificados • Medida de centralización: indican alrededor de qué valores tienden a
en la categoría 4 no tienen el doble de dolor que los de la categoría 2. agruparse las observaciones de la muestra. Las más utilizadas son la
media aritmética y la mediana.
Las opciones 2 y 3 representan dos subtipos de variables cuantitativas. • Medida de dispersión o de variabilidad: completan la información so-
Las discretas siempre adoptan números enteros y las continuas son bre la distribución de la variable. En otras palabras, nos indican si los

ESTA DÍSTICA Y EPIDEMIOLOGÍA 236


Estadística y epidemiología
valores de la variable están muy dispersos o si se concentran alrede- te, la mitad, un 2’5% estará por encima de 226 mg/dl y un 2’5% estará por
dor de la medida de centralización. debajo 206 mg/dl.

En este caso está claro que la mediana es una medida de tendencia cen-
tral, no de dispersión, por lo que la única respuesta posible es la 5.
T14 Estimación de parámetros.
Estadística inferencial
P256 MIR 2004-2005
P172 MIR 2011-2012
La mediana es el valor numérico que divide en dos partes iguales a todo
un conjunto de datos numéricos. De esta forma, el 50% estará por enci- El error estándar de la media es la desviación típica de todas las medias
ma de la mediana y el 50% por debajo. En el ejemplo que nos ponen, si obtenidas a partir de las infinitas muestras que componen la población.
la mediana es siete, la interpretación correcta es la 2: la mitad sobreviven Nos permite predecir con una probabilidad determinada (estimar), la
más y la otra mitad, menos. probabilidad de acierto-error en nuestra afirmación. Por ejemplo, en una
muestra de diabéticos la glucemia media es 160. Si queremos saber cuál
Recuerda que, en una distribución simétrica, media y mediana coinciden, es, sin embargo, la media poblacional (estimar la media poblacional a
pero no en las asimétricas. Cuando los datos se disponen de forma asi- partir de nuestros datos muestrales, no sólo en nuestra muestra), necesi-
métrica, la mediana es mejor que la media como medida de centraliza- taremos el error estándar. Recordemos que la fórmula del error estándar
ción, ya que no se ve tan influida por los valores extremos. de la media es:

eem = Desviación típica/raíz cuadrada del tamaño muestral

T13 Principales leyes de distribución


de variables aleatorias
P175 MIR 2011-2012

P185 MIR 2014-2015 En este estudio se ha comprobado que en la muestra, el fármaco actúa
como factor protector ya que el RR es < 1 (0,39). Sin embargo, si quere-
Pregunta sobre estadística inferencial sencilla, pero cuya dificul- mos saber cómo se comportaría el fármaco no en nuestra muestra, sino
tad radica en el cálculo mental que tenemos que realizar. Piden que en la población, tendremos que calcular un intervalo de confianza (ha-
calculemos el IC al 95% sabiendo que la media (x) es 0,8 mg/dl; la bitualmente del 95%). La asociación entre el fármaco y la superviven-
desviación típica (s), 0,62 mg/dl; y el tamaño muestral (n), 85. Para cal- cia será significativa si la estimación no incluye el 1. Como sabemos, un
cular el IC al 95%, construiremos un IC así: x +/- 2eem, sabiendo que RR de 1 significaría en este estudio que el fármaco nuevo no modifica la
eem = S/√(n-1). supervivencia con respecto al previo. La precisión del intervalo de con-
fianza viene determinada por la anchura del mismo. Cuanto más ancho,
Sólo queda sustituir: menor precisión. Si el intervalo es poco preciso es muy probable que in-
• eem = 0,62/√84 = 0,62/9,16 = 0,067. cluya, entre otros valores, el 1, como ocurre en este estudio.
• x +/- 2eem = 0,8 +/- 2 x 0,067 = 0,13 (respuesta 2).

Si nos encontramos con preguntas de este tipo, tenemos que “redondear” P176 MIR 2010-2011
los números para no perder tiempo, ya que en el examen no se puede usar
calculadora y es raro que conozcas la raíz cuadrada de 84 de memoria Pero Una pregunta sencilla, donde nos piden que señalemos la respuesta falsa.
¿y la raíz de 81? 9 x 9 = 81. Pues haz la de 81. Tampoco es fácil calcular Para ello es fundamental conocer el concepto de odds ratio e intervalo de con-
0,62 entre 9, pero 6 entre 9 es lo mismo que 2 entre 3, y eso sí que sabes fianza, auténticos clásicos del examen MIR, y que se repiten todos los años.
calcularlo 2/3 = 0,6. Sólo quedaría añadir un decimal: 0,6/9 = 0,06. Así, re-
dondeando quedaría: En la pregunta nos cuentan que una revista lleva a cabo un estudio sobre
• eem = 0,6/√81 = 0,6/9 = 0,2/3 = 0,06. factores pronósticos en la lumbalgia, donde determinan la medida de fuer-
• x +/- 2eem = 0,8 +/- 2 x 0,06 = 0,8 +/- 0,12 (respuesta 2). za de asociación del estudio, en este caso mediante la odds ratio. El signi-
ficado de una OR de 2, en este caso, es lo que dice la respuesta 4. El riesgo
de fracaso terapéutico es el doble, cuando la duración del tratamiento es
P175 MIR 2012-2013 mayor de un año, con respecto a los casos en los que sea menor.

Debemos asumir que los niveles de colesterol siguen una distribución El intervalo de confianza es el resultado de aplicar la estadística inferen-
normal. Según esta ley de distribución de variables, los valores entre cial, es decir, a partir de los valores de una muestra calculamos los valores
+/- 1 DE o desviación típica respecto la media (en este caso entre 211 y en la población, y para ello necesitamos determinar un intervalo de con-
221 mg/dl) comprenden 68% de la población. Los valores entre +/-2 DE fianza en el que encontraremos el verdadero valor de la OR con una de-
(en este caso entre 206 y 226 mg/dl) comprenden el 95%, del 5% restan- terminada probabilidad, en este caso del 95% (respuestas 1 y 2, ciertas).

237
DESGLOSES
COMENTADOS MIR
Lo que dice la respuesta 5 es totalmente cierto, cuando hablamos de me- es más del doble que el inferior. Es casi como decir que un antibiótico
didas de asociación (OR, RR) el intervalo de confianza no puede incluir cura entre el 2% y el 97% de los casos afectados por determinada bac-
el valor 1 porque indicaría el efecto neutro del factor de estudio y, por teria. Debería ser interpretado con reservas, porque la precisión que nos
tanto, se hablaría de un resultado no significativo. ofrece es bajísima. Los dos fármacos podrían ser similares en cuanto a
su efecto (RR cerca de uno), pero también existe un riesgo importante
La falsa, por tanto, es la respuesta 3, pues el intervalo de confianza, de que no lo sean (por la amplitud del intervalo). Por eso, la respuesta
para ser aceptado, no tiene que estar centrado forzosamente en el correcta es la 5.
valor de la OR. Lo importante es que no incluya el valor 1, porque en
tal caso no podríamos saber si el factor de estudio es protector o de
riesgo.
T15 Contraste de hipótesis

P204 MIR 2006-2007 P186 MIR 2014-2015

La interpretación de estudios es bastante habitual en el examen MIR. Pregunta sobre el test estadístico que tenemos que utilizar para relacio-
El estudio que nos describen ofrece un intervalo de confianza al 95%. nar la calidad del sueño y la tendencia a la depresión. En el enunciado se
La interpretación de este dato no corresponde con la opción 3. No po- aclara que a cada paciente se le asigna una puntuación numérica, por lo
demos AFIRMAR que el 95% de los adultos estará entre 192 y 208. Lo que tendremos que buscar un test estadístico para utilizar cuando tene-
que podemos decir es que, con una probabilidad del 95%, la media de mos dos variables cuantitativas (respuesta 5, correcta).
esta población estará entre 192 y 208, lo que es muy distinto. Es lo que
aparece en las opciones 1 y 2, que es la forma correcta de interpretar el
estudio. P033 MIR 2013-2014

La opción 5 puede ofrecer cierta dificultad, porque no es evidente. Si El método de Kaplan-Meier es una de las formas más empleadas para
tienes en cuenta la fórmula para calcular el error estándar de la media, realizar un análisis de supervivencia. Se representa como la caída del
puedes dar con ella: evento que se mide a lo largo del tiempo. Es decir, que si lo que me-
dimos es la supervivencia, veremos cómo la gráfica, según mueren los
eem = σ/√n-1 pacientes, se aproxima al eje de abscisas. En el eje de ordenadas se
representa el porcentaje libre de evento (en esta pregunta la varia-
Teniendo en cuenta que el eem = 4 y n = 100, la desviación típica ronda ble progresión libre de enfermedad) y el eje de abscisas el tiempo. En
los 40 (respuesta 5, cierta). nuestra gráfica hay dos grupos de tratamiento, A (BSC) y B (BSC + P).
Comprobamos cómo en ambos casos las gráficas se reducen a lo largo
del tiempo. Si observamos en el eje de ordenadas el 50% (mediana
P209 MIR 2006-2007 de progresión), veremos cómo el tiempo para el grupo A es de unas
7 semanas y media, mientras que para el grupo B es de unas 8 sema-
Pregunta muy típica del MIR, en la que nos preguntan acerca del signifi- nas y media, es decir, que para la mediana libre de evento, el tiempo
cado del intervalo de confianza. No olvides que en la hipótesis nula par- entre ambos tratamientos difiere como dice la opción 1, en menos de
timos de que ambos tratamientos son iguales. En este caso, y dado que 2 semanas. El Logrank test es el método favorito para comparar la so-
estamos construyendo un intervalo con la reducción absoluta del riesgo, brevida de grupos, que incluye todo el periodo de seguimiento y no la
que es la diferencia entre el porcentaje de eventos en el grupo control y sobrevida en un punto arbitrario de las curvas (como dice la opción 4).
el porcentaje de eventos en el grupo experimental, un intervalo no signi- El logrank test es un test de significación estadística y no ofrece ningu-
ficativo sería el que incluyese el valor 0. Al hallar el intervalo vemos que na información sobre la magnitud de las diferencias entre los grupos.
no está incluido ese valor y, por ello, es significativo. Para ello se utiliza el hazard ratio que daría una estimación de la aso-
ciación aproximada al significado del riesgo relativo de los estudios
prospectivos.
P204 MIR 2004-2005

Es lógico que el representante intente vender su producto, pero hemos P034 MIR 2013-2014
de ser críticos. Que un estudio nos lo ofrezca un representante no quiere
decir que sea malo. Hemos de valorar si es o no útil y por qué. En las tablas de K-M, en ordenadas no se representan sujetos, sino por-
centajes libres del evento de estudio (opción 1). El mejor estimador del
Aquí nos hablan de un estudio que intenta demostrar la igualdad entre efecto de la diferencia entre 2 KM es el promedio de tiempo hasta la pro-
dos fármacos. De hecho, aparentemente lo consigue, ya que el riesgo gresión, que como se ha discutido en la pregunta 33, en nuestra gráfica
relativo en cuanto a la tasa de curaciones (0,97) es prácticamente igual no supera las dos semanas. Si hay o no diferencias estadísticas entre las
a 1, por lo que en principio serían iguales o casi. Sin embargo, fíjate en gráficas viene determinado por el test de Logrank (p < 0,0001 en nuestro
la amplitud del intervalo: 0,60-1,30. Es tan amplio que el valor superior estudio), si bien la cuantificación “clínica” de dicho efecto la ofrece la ha-

ESTA DÍSTICA Y EPIDEMIOLOGÍA 238


Estadística y epidemiología
zard ratio (cuánto menos riesgo de progresión de la enfermedad tiene un P174 (MIR 11-12) Ejemplo de Kaplan-Meier
grupo de tratamiento respecto al otro).

P197 MIR 2013-2014

Al comparar dos fármacos, tramadol y experimental, en un ensayo clíni-


co, obtenemos una diferencia entre ambos con una p=0,03, es decir, di-
ferencias estadísticamente significativas (opción 2). Un valor de p < 0,05
me indica que las diferencias encontradas son estadísticamente signi-
ficativas, pero si la diferencia es clínicamente relevante (opción 1), no
depende de los valores de p, sino de las diferencias obtenidas en el es-
tudio, en este caso, de 4 puntos sobre 100 en la escala visual analógica
(de 27 a 31).

P174 MIR 2012-2013


P176 MIR 2011-2012
La pregunta no tiene más comentario que la propia respuesta, la res-
puesta 1 es la definición exacta del valor “p”: La probabilidad de observar Un estudio de regresión es una técnica estadística que nos permite pre-
los resultados del estudio, u otros más alejados de la hipótesis nula, si la decir una variable en función de otra, en este caso la probabilidad de
hipótesis nula fuera cierta. El valor de p se obtiene con las pruebas de sufrir cirrosis en función de cinco parámetros. Existen varias opciones
significación estadística, y se considera estadísticamente significativo si para estimar un modelo de regresión, de entre los que destacan por su
es inferior a 0,05, si es superior, los resultados pueden ser debidos al azar facilidad de aplicación e interpretación, el modelo de regresión lineal y
con una probabilidad demasiado alta según el nivel de exigencia científi- el modelo de regresión logística. Teniendo en cuenta el tipo de variable
co. Muy importante en el MIR todo lo relacionado al valor “p”. que deseemos predecir, aplicaremos un modelo de regresión u otro.

Cuando la variable dependiente es una variable continua, el modelo de


P173 MIR 2011-2012 regresión más frecuentemente utilizado es la regresión lineal, mientras
que cuando la variable de interés es dicotómica (en este caso cirrosis si/
En el contraste de hipótesis se pueden cometer dos tipos diferentes de no) se utiliza la regresión logística.
errores. Por una parte el error tipo I o alfa, que consiste en que realmente
no hay diferencias, por ejemplo, entre dos fármacos y yo erróneamente
afirmo que sí que las hay. Es decir, que es cierta H0 o punto de partida de P178 MIR 2010-2011
nuestro contraste de hipótesis y yo erróneamente digo que lo correcto es
que haya diferencias (acepto erróneamente H1). Por otra parte, tenemos Una pregunta muy sencilla, que se pregunta en el examen MIR prácticamen-
el error tipo II o beta, que consiste en que sí hay diferencias en realidad y te todos los años. El concepto de error tipo I consiste en detectar una diferen-
yo no logro detectarlas, por lo que H1 es correcta pero yo erróneamente cia entre los dos tratamientos cuando realmente no existe. En otras palabras,
admito H0. podría considerarse un “falso positivo”. Es lo que ha sucedido en el caso que
nos exponen: aparentemente el nuevo fármaco es mejor, cuando realmente
no existen tales diferencias con respecto al placebo (respuesta 1, correcta).
P174 MIR 2011-2012
P178 (MIR 10-11) Contraste de hipótesis
Las curvas de Kaplan-Meier son curvas en las que se representa cómo apa- REALIDAD
rece una variable que estamos midiendo a lo largo del tiempo. Son un
EXISTE NO EXISTE
análisis estadístico del análisis de supervivencia porque permiten contro- DIFERENCIA DIFERENCIA
lar el sesgo que supone el factor tiempo. Por ejemplo, tenemos la quimio-
H0 falsa H0 cierta
terapia A para el cáncer de colon y la quimioterapia B. Con la A sobrevive
el 80% y con la B sobrevive el 70%. Si comparamos directamente los por- HAY 1-β
DIFERENCIAS Poder estadístico Error tipo I
centajes no estamos teniendo en cuenta cuánto viven los pacientes en SIGNIFICATIVAS o potencia del o error α
cada grupo. Con los datos que tenemos hasta ahora pensamos que A es test
Resultados Rechazo H0
mejor. Pero, ¿qué pensamos si nos dicen que con A sobrevive el 80% los
del test NO HAY
primeros 6 meses y con B el 70% pero los primeros 5 años? Está claro que
DIFERENCIAS Error tipo II
ahora ya nos cuestionamos cuál es el mejor tratamiento. La gráfica, a con- SIGNIFICATIVAS 1-α
o error β
tinuación muestra otro ejemplo de Kaplan-Meier en el que se observan
No rechazo H0
las diferentes supervivencias a lo largo del tiempo para los fármacos 1 y 2.

239
DESGLOSES
COMENTADOS MIR
No te confundas con el error tipo II, porque es todo lo contrario. El error va, que en este caso tendría razón. Por consiguiente, estaríamos afirmando
tipo II, o error β, es un “falso negativo”. Es decir, consiste en no detectar que existe una diferencia, cuando la realidad es ésa. La pregunta, por tan-
una diferencia, a pesar de que existe en realidad (respuesta 4, incorrecta). to, queda resuelta; estaríamos hablando de la potencia o poder estadístico
de un test. Recuerda que la potencia de un test se define como la capaci-
dad del test para detectar diferencias, cuando éstas existen. Expresado de
P176 MIR 2009-2010 otra manera: la probabilidad del test de aceptar la hipótesis alternativa
cuando es cierta (o, lo que es lo mismo, rechazar la nula cuando es falsa).
Una pregunta absolutamente básica, prácticamente regalada, ya que la
interpretación de la “p” (error alfa) aparece en el MIR todos los años, sin
excepción. Imagina un contraste de hipótesis que compare dos antibió- P194 MIR 2008-2009
ticos A y B. Al final del estudio, este estudio encuentra diferencias a favor
del tratamiento A. ¿Quiere esto decir que, necesariamente el tratamiento En general, los test paramétricos son preferibles a los no paramétricos,
A es mejor que el B? ¿Estas diferencias son reales o, simplemente, el ha- por su mayor potencia. Sin embargo, tienen unas condiciones de apli-
llazgo ha sido producto del azar? Para responder a esta pregunta habría cación. Si no se cumplen, deberíamos elegir uno no paramétrico. Estas
que comprobar el valor de “p”. Lo que “p” significa es la probabilidad de condiciones son las siguientes:
que las diferencias encontradas puedan justificarse por efecto del azar. • Distribución normal de la variable estudiada.
• Tamaño muestral suficiente (n > 30).
Cuando el valor de “p” es inferior a 0,05, se dice que la diferencia es esta- • No pueden manejar variables ordinales.
dísticamente significativa. En otras palabras, esta diferencia sería difícil-
mente atribuible al efecto del azar. Por ello, ante una distribución distinta a la normal, una variable ordinal
o una muestra insuficiente, debemos elegir un test no paramétrico. La
Cuando detectamos diferencias que, en realidad, son inexistentes, de- respuesta correcta, por tanto, es la 5.
cimos que se ha cometido un error de tipo I. El error tipo I consiste en
rechazar H0 siendo cierta (respuesta 3).
P204 MIR 2008-2009
En otras palabras, implica aceptar diferencias que en realidad no existen,
dando como significativo algo que no lo es. Recuerda que el valor de “p” Pregunta absolutamente típica, sobre una idea que se había pregunta-
coincide con la probabilidad de cometer el error tipo I. do muchas veces en convocatorias previas. Inexcusable acertarla, si se
pretende hacer un buen examen. De hecho, en esta convocatoria, la pre-
gunta fue acertada por el 98% de nuestros alumnos. No obstante, a pesar
P177 MIR 2009-2010 de tratarse de una pregunta repetida (y esto es más que fácil), del resto
de los opositores sólo la acertó un 54%. Por consiguiente, insistimos una
Pregunta muy sencilla sobre los test de contraste de hipótesis. La mecá- vez más en la importancia de ejercitarse con preguntas de convocatorias
nica es siempre la misma: identificar las variables de estudio y, después, previas (y asegurarse de entenderlas).
elegir el test más adecuado.
• Variable 1: presencia de antecedentes de rubéola materna (SÍ/NO), es El error tipo I o alfa es el que se comete cuando, no habiendo diferencias
decir, cualitativa dicotómica. entre dos tratamientos, llegamos a la conclusión de que sí las hay. Es de-
• Variable 2: padecimiento de cataratas congénitas (SÍ/NO), cualitativa cir, consiste en detectar diferencias que no existen en la realidad. Esto,
dicotómica. en otras palabras, implicaría rechazar la hipótesis nula cuando es cierta.

Cuando se estudia la asociación de dos variables cualitativas, el test de Por otra parte, el error tipo II consiste en que, cuando hay diferencias en
elección sería el de la chi-cuadrado (respuesta 3, correcta). realidad, no llegamos a detectarlas.

Recuerda que ambos errores pueden disminuirse si se aumenta el tama-


P179 MIR 2009-2010 ño muestral del estudio.

Esta pregunta sólo encierra una dificultad, que es conocer el significado


de hipótesis nula. La hipótesis nula es la que sostiene que no existen dife- P193 MIR 2007-2008
rencias reales entre las diferentes alternativas que estamos comparando.
En otras palabras, es la hipótesis de la “no diferencia” o de la “diferencia Pregunta sencilla sobre los tests de contraste de hipótesis, tema muy
nula”. La hipótesis contraria es la llamada hipótesis alternativa, que sos- preguntado en el MIR. En este tipo de preguntas, siempre has de seguir
tiene que sí existen diferencias que no se podrían justificar por el azar. la misma mecánica: identificar las dos variables y después elegir bien el
test. Para esta pregunta sería:
Si leemos bien el enunciado, nos dicen que estamos rechazando la hipó- • Variable 1: momento de medición (antes/después)  Cualitativa
tesis nula cuando es falsa. En otras palabras, estamos negándola cuando dicotómica.
está equivocada. Por lo tanto, estaríamos aceptando la hipótesis alternati- • Variable 2: bilirrubina sérica (numérica)  Cuantitativa.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 240


Estadística y epidemiología
P193 (MIR 07-08) Pruebas de asociación estadística

La medición antes-después en el mismo grupo de pacientes nos obliga dando como significativo algo que no lo es. Recuerda que el valor de p
a elegir un test específico para datos apareados. Si, además, tenemos en coincide con la probabilidad de cometer el error tipo I.
cuenta la naturaleza de las variables, habría que elegir la t de Student
para datos apareados (respuesta 1, correcta). El error tipo II consiste en no detectar diferencias cuando realmente sí exis-
ten. Es como un falso negativo: damos por no significativo algo que sí lo es.
Puedes revisar cuándo se usa cada test en la tabla de la parte superior. La probabilidad de cometerlo se llama beta (la del error tipo I es alfa, o p).
Dicho de otro modo, es la probabilidad de rechazar la hipótesis alternativa
siendo cierta.
P195 MIR 2007-2008

Los conceptos de error tipo I y II están entre los más preguntados en el P196 MIR 2007-2008
bloque de Estadística y Epidemiología. No puedes permitirte fallar pre-
guntas como ésta. Una pregunta bastante difícil, dado que las técnicas de análisis de super-
vivencia nunca habían sido preguntadas en el MIR, hasta esta convocato-
P195 (MIR 07-08) Contraste de hipótesis ria. El término supervivencia puede resultar engañoso en esta pregunta,
pues su significado en estadística no coincide con el que empleamos
coloquialmente. En estadística, se refiere al hecho de que un paciente
sigue en la situación inicial (es decir, sin que se haya producido el evento
a estudio). Este evento, habitualmente es la muerte, de ahí que se hable
de técnicas de análisis de supervivencia. Sin embargo, en nuestro caso
no estamos estudiando el tiempo transcurrido hasta un fallecimiento,
sino hasta la desaparición de los síntomas. Independientemente de cuál
sea el suceso, el manejo estadístico en ambos casos es similar; en ambos
casos se trata del tiempo transcurrido hasta que ocurre determinado su-
ceso.

El error tipo I estriba en rechazar H0 siendo cierta (respuesta 1, correcta). Dado que el tiempo es una variable continua, en principio podría estu-
En otras palabras, implica aceptar diferencias que en realidad no existen, diarse mediante las técnicas de análisis de la varianza o los modelos de

241
DESGLOSES
COMENTADOS MIR
regresión. No obstante, existen dos dificultades importantes para este P220 MIR 2006-2007
planteamiento. En primer lugar, en la mayor parte de los estudios cita-
dos, la variable tiempo no tiene una distribución normal. Al contrario, Pregunta muy fácil acerca del uso de los distintos test estadísticos. Tene-
acostumbra a tener una distribución asimétrica. Por otra parte, existe una mos como variables, por un lado, tres alternativas de tratamiento como
segunda dificultad que justifica un planteamiento específico para estas variable 1 (cualitativa no dicotómica) y, por otro lado, el gradiente de pre-
variables, y es que para observarlas se tiene que prolongar el estudio sión venosa transhepática (cuantitativa continua), siendo de distribución
durante un periodo de tiempo suficientemente largo. Al prolongarlo, es normal. Por eso, hay que usar el análisis de varianza. Tanto la prueba de
muy frecuente que se produzcan pérdidas, que imposibilitan la obser- Wilcoxon como la U de Mann-Whitney son tests no paramétricos equi-
vación del evento. Por ello, en el enunciado de la pregunta insisten en valentes a la t Student (aquí la distribución es normal). La t de Student se
que no han desaparecido los síntomas en algunos pacientes al final del usaría si sólo comparásemos dos tratamientos, ya que se usa si la variable
estudio (es decir, no se ha producido el evento). 1 es cualitativa dicotómica y la variable 2 es cuantitativa continua. El test
exacto de Fisher es una variante del chi-cuadrado, que se usa cuando el
tamaño muestral es pequeño (n < 5).
P197 MIR 2007-2008

Una pregunta muy fácil sobre la elección del test más adecuado para un P193 MIR 2005-2006
contraste de hipótesis. La mecánica es siempre la misma, comenzando
por identificar las variables en estudio. Pregunta de dificultad media, dado que por primera vez preguntan por
• Variable 1: muestra de procedencia (placebo/nuevo fármaco) Cua- un test no paramétrico. Las pruebas de asociación estadística se pre-
litativa dicotómica. guntan mucho en el examen MIR. Siempre han preguntado por pruebas
• Variable 2: presión arterial media (numérica)  Cuantitativa. paramétricas, pero fíjate en que en la pregunta de este año especifican
al final que la distribución NO tiene una distribución normal. Hemos de
Teniendo en cuenta las dos variables y su naturaleza, el que corresponde pensar, por tanto, en usar un test NO paramétrico. Los tests NO paramé-
sería el test de la t de Student para datos independientes, puesto que es- tricos son pruebas que NO dependen de la distribución y que NO necesi-
tamos hablando de dos grupos distintos. Recuerda que, si estuviésemos tan la normalidad de la población.
comparando tres o más muestras, deberíamos haber empleado el ANOVA.
Una vez visto que necesitamos una prueba NO paramétrica, tenemos que
ver qué tipo de variables nos ofrecen para decantarnos por un test. En
P209 MIR 2007-2008 este ensayo clínico la variable 1 es cualitativa (tres tratamientos: placebo,
tratamiento establecido, tratamiento nuevo) y la variable 2 es cuantita-
Ante el resultado de un contraste de hipótesis, hemos de plantearnos si tiva (glucemia). En consecuencia, el test a utilizar es el de Kruskal-Wallis.
las diferencias observadas son atribuibles al azar, o si, por el contrario, po-
demos asumir que las diferencias son reales (aceptamos H1). Cuando la
probabilidad de que el azar explique un resultado es pequeña, entonces P194 MIR 2005-2006
se dice que se ha alcanzado significación estadística. Esta probabilidad
viene dada por p. Lo habitual es considerar un resultado como signifi- Pregunta muy fácil y básica de estadística. El objeto de la estadística es
cativo cuando p < 0,05. En este caso, dado que p = 0,034, esto significa determinar cuál es la probabilidad de que los resultados obtenidos en un
que el azar justificaría las diferencias encontradas con una probabilidad estudio se puedan explicar por el azar. Esta probabilidad se corresponde
del 3,4%. con el grado de significación.

Para abordar este problema se consideran dos hipótesis:


P210 MIR 2007-2008 • Hipótesis nula (H0): NO existen diferencias entre las dos interven-
ciones.
En el ensayo que nos describen, la comparación principal no ha encon- • Hipótesis alternativa (H1): SÍ existen diferencias entre las dos inter-
trado diferencias estadísticamente significativas. Sin embargo, se han venciones.
analizado diez variables secundarias, alcanzándose la significación en
una de ellas. Este dato ha de ser interpretado con gran cautela. Cada vez Previamente al ensayo de una hipótesis, se fija la probabilidad máxima
que se realiza una comparación, existe una probabilidad de cometer un de que los resultados distintos observados entre las dos intervenciones
error tipo I, es decir, un falso positivo en la comparación (detectar una puedan ser debidos al azar (hipótesis nula cierta: NO hay diferencias),
diferencia que no existe realmente). Si analizamos muchas variables, la que suele ser por convenio del 5%. A continuación, se calcula cuál es
probabilidad de que una de ellas cometa este tipo de error aumenta pa- la probabilidad de que las diferencias que nosotros hemos observado
ralelamente al número de comparaciones realizadas. Por ello, dado que puedan ser explicadas por azar. Esta probabilidad es el valor de la p o
en este caso se han realizado multitud de comparaciones, no sería sen- grado de significación estadística. En este caso la p es mayor de 0,05, lo
sato concluir que las diferencias encontradas son reales. Lo que debería- cual significa que no existe suficiente evidencia para decir que ambas
mos hacer es plantear un nuevo ensayo clínico, haciendo servir el motivo intervenciones son diferentes, ya que existe una probabilidad mayor de
de esa comparación como variable principal. la exigida (0,05) de que las diferencias puedan deberse al azar.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 242


Estadística y epidemiología
P208 MIR 2005-2006 mente relevante (eso nos lo dice el sentido común, ¿es relevante en la
práctica clínica una diferencia de 0,5 mmHg? No parece muy importante,
Se trata de una pregunta de dificultad media sobre uno de los temas ¿no?) (opción 2 falsa).
estrella en el MIR: el contraste de hipótesis. Todo opositor MIR ha de
dominar este concepto, puesto que la mayoría de estas preguntas se Por otra parte, vemos que la opción 3 también es falsa, puesto que si yo
contestan simplemente comprendiendo el significado del grado de sig- acepto que el nuevo tratamiento es mejor, la probabilidad de equivocarme
nificación estadística. En este caso, queremos comparar dos protocolos es menor de 1/1000 si realmente no existieran diferencias entre los dos
de actuación en nuestro centro hospitalario para ver cuál es mejor. El tratamientos (es decir, si la hipótesis nula fuera cierta). La opción 5 también
contraste de hipótesis nos permite observar si las diferencias observadas es errónea, dado que el intervalo de confianza estimado sí nos informa
entre los dos protocolos son reales, o se deben simplemente a diferen- de la magnitud del efecto y nos dice que la TAD puede bajar de 0,2 a 0,7
cias que el azar puede establecer (variaciones aleatorias del muestreo), mmHg más con el nuevo tratamiento que con el tratamiento control, con
sin que existan diferencias reales entre ambos protocolos. una confianza del 95%. Fíjate en que la opción 4 interpreta el intervalo de
confianza al 95% y nos dice que el nuevo tratamiento sí ofrece una mayor
Para abordar este problema se consideran dos hipótesis: reducción de la TAD que el tratamiento control. Esta reducción irá de 0,2 a
• Hipótesis nula (H0): NO existen diferencias entre los dos protocolos. 0,7 mmHg y asumimos que nos equivocaremos el 5% de las veces que ha-
• Hipótesis alternativa (H1): SÍ existen diferencias entre los dos proto- gamos esta afirmación (por tratarse de un intervalo de confianza del 95%).
colos.

Previamente al ensayo de una hipótesis, se fija la probabilidad máxima P210 MIR 2004-2005
de que los resultados diferentes observados entre los dos protocolos
puedan ser debidos al azar (hipótesis nula cierta: NO hay diferencias), Pregunta sencilla sobre los tests de contraste de hipótesis. En este tipo de
que suele ser por convenio del 5%. A continuación, se calcula cuál es preguntas, siempre has de seguir la misma mecánica: identificar las dos
la probabilidad de que las diferencias que nosotros hemos observado variables, y después elegir bien el test. Para esta pregunta, sería:
puedan ser explicadas por azar. Esta probabilidad es el valor de la p o • Variable 1: Tensión arterial  Cuantitativa.
grado de significación estadística. En este caso la p es mayor de 0,05, lo • Variable 2: Colesterol Cuantitativa.
cual significa que no existe suficiente evidencia para decir que ambos
tratamientos son diferentes, ya que existe una probabilidad mayor de la Teniendo en cuenta las dos variables y su naturaleza, el que corresponde
exigida (0,05) de que las diferencias puedan deberse al azar. sería el test de la correlación de Pearson. Si tienes alguna duda, puedes
consultar la tabla del comentario de la pregunta 193, MIR 07-08.
La opción 1 es incorrecta, puesto que el análisis de subgrupos puede oca-
sionar problemas, especialmente cuando no se tiene previsto desde el
principio. Produce comparaciones múltiples, y al aumentar el número de P212 MIR 2004-2005
comparaciones, aumenta el número de resultados falsamente positivos.
El valor de p se conoce como nivel de significación estadística. Represen-
El hecho de que el resultado no sea estadísticamente significativo se ta la probabilidad de llegar a estos resultados por efecto del azar. Esto
puede deber a un tamaño de la muestra insuficiente. El cálculo del ta- quiere decir que, si en realidad no hubiesen diferencias entre los trata-
maño muestral se realiza antes de comenzar el estudio, así que lo que se mientos, la probabilidad de llegar a este resultado equivaldrían al valor
puede hacer en este caso es lo que expone la opción 3: este estudio nos de p (en este problema, menos del 4,5%). Cuando p es menor de 0,05, se
puede servir para realizar uno nuevo en el que se pueda predeterminar dice que existe significación estadística, es decir, el resultado sería difícil
mejor el tamaño muestral. de justificar por el azar (menos del 5% de probabilidad).

P212 MIR 2005-2006 P213 MIR 2004-2005

Es una pregunta larga y complicada de entender; has de leerla despacio Pertenecer a uno de los tres tratamientos es una variable cualitativa (tra-
para no perderte. No olvides dominar la interpretación de la p y de los tamiento 1, 2 o 3). La otra variable, el nivel de glucosa, es cuantitativa
intervalos de confianza en un contraste de hipótesis para el examen MIR. continua. Dado que nos dicen que la distribución es normal, en principio
Es uno de los temas más preguntados en los últimos años. no parece necesario recurrir a ningún test no paramétrico. Por tanto, la
respuesta correcta es el análisis de la varianza (respuesta 3). Si nos hubie-
Recuerda que el valor de la p en un contraste de hipótesis NUNCA de- sen hablado de dos tratamientos, la correcta sería la t de Student.
muestra nada, sólo da la probabilidad de que los resultados hallados
sean debidos al azar si la hipótesis nula fuera cierta (en nuestro caso, la
hipótesis nula es que no existen diferencias entre los dos tratamientos), P145 MIR 2003-2004
es decir, la probabilidad de cometer un error tipo I (opción 1 falsa). El
valor de la p nos habla de una diferencia estadísticamente significativa Los tests estadísticos paramétricos han de conocerse obligatoriamen-
entre los dos tratamientos, pero no siempre esta diferencia será clínica- te en la preparación del examen. En esta pregunta las dos variables a

243
DESGLOSES
COMENTADOS MIR
contrastar son, por una parte, la media de colesterol (mg/dl) (VARIABLE desea estimar. Para ello nos basamos en estudios previos. Necesitaremos
CUANTITATIVA CONTINUA) y la otra variable es la presencia o no de ACV saber la precisión que deseamos (1 unidad de IMC), el nivel de confianza
(VARIABLE CUALITATIVA DICOTÓMICA). En consecuencia, el test que hay (5% habitualmente) y, según sea una proporción o una media, como en
que aplicar es la prueba t de Student para datos independientes. nuestro caso, la proporción esperada o la varianza (opción 2).

P153 MIR 2003-2004 P190 MIR 2009-2010

Esta pregunta intenta saber si se domina conceptualmente el contraste de Los factores que influyen en el tamaño muestral han sido preguntados
hipótesis. El contraste de hipótesis intenta solventar una duda: las diferen- en el MIR de forma incesante. Esta pregunta no es muy distinta de otras
cias encontradas entre los dos grupos a comparar son o no atribuibles al que ya han aparecido, por lo que debe considerarse fácil:
azar. Es decir, si a la intervención realizada se le puede atribuir efecto clínico • Opción 1. Para detectar pequeñas diferencias (en este caso, de mor-
o no. Sin embargo, lo que hemos de tener claro es que el contraste de hi- talidad), haría falta un tamaño muestral muy grande. Por el contrario,
pótesis no confirma una opción, sino que establece probabilidades de que cuando se trata de estudiar diferencias grandes, la muestra no preci-
ocurra. El contraste de hipótesis no aumenta el valor predictivo, sino que sa ser tan numerosa.
lo cuantifica. Si bien la cuantificación de los errores I y II es un instrumento • Opción 2. Cuanto más variable sea el parámetro que nos interesa
fundamental en el proceso de contraste, no es su objetivo fundamental. medir, mayor será el número de pacientes necesario para ese estu-
dio.
• Opción 3. Si estamos usando dosis muy similares, es de suponer que

T16 Análisis de correlación y de regresión las diferencias serán también pequeñas. Sucede lo mismo que en la
respuesta 1: detectar diferencias pequeñas precisa muestras grandes.
• Opción 5. Cuando mayor sea la potencia del estudio (menor error
P207 MIR 2013-2014 beta), más sujetos serán necesarios.

El análisis de correlación nos sirve para estudiar la relación entre dos va- La respuesta correcta es la 4. Nos están diciendo que vamos a asumir un
riables cuantitativas. El coeficiente de correlación lineal de Pearson mide error alfa menos exigente de lo habitual (0,1 en vez de 0,05). Por lo tanto,
la intensidad con la que se relacionan esas variables, ya sea positiva (al el tamaño muestral necesario será menor que si quisiéramos un error alfa
aumentar una aumenta la otra) o negativa (al aumentar una disminuye la más pequeño.
otra). Sus valores van de -1, que indica una perfecta asociación negativa,
a +1, que indica una perfecta correlación positiva. El punto 0, justo en
medio, indica que no hay correlación lineal. P215 MIR 2006-2007

Pregunta fácil acerca del cálculo del tamaño muestral. Entre los factores
P194 MIR 2007-2008 que influyen en este cálculo, siendo un estudio descriptivo en el que va-
mos a estimar un determinado parámetro, se encuentra la variabilidad
Una pregunta sencilla sobre la regresión lineal. El análisis de regresión es de dicho parámetro (previamente conocida o aproximada según datos
útil para determinar una posible forma de relación entre dos variables, preexistentes o estudios pilotos), de la precisión con que deseemos ob-
que podrá predecirse en mayor o menor medida mediante una ecuación. tener esa estimación (amplitud del intervalo de confianza, a mayor preci-
En este caso, se está empleando la regresión lineal, que nos dará una sión mayor tamaño muestral), nivel de confianza y proporción esperada
ecuación como la siguiente: de la variable en la población. El error beta sólo influiría como factor si
nos encontrásemos ante un test de contraste de hipótesis, puesto que
Y = a + bX recuerda que es el inverso de la potencia, que es lo que nos permite de-
tectar las diferencias si existen.
El coeficiente a representa el punto en el que la línea corta el eje vertical
(valor de Y para X = 0). El coeficiente b (0,08 en nuestro caso) es la pen-
diente de la recta que muestra la cantidad que cambia Y (PCR) por una P203 MIR 2005-2006
unidad de cambio de X (número de articulaciones afectas).
Pregunta fácil acerca de un tema de moda en las últimas convocatorias.
La predeterminación del tamaño muestral se ha preguntado en las tres

T17 Tamaño muestral últimas convocatorias. Para contestar esta pregunta, lo primero que
tenemos que analizar es el tipo de estudio o diseño que nos plantean.
Como se trata de un ensayo clínico, sabemos que comportará una com-
P200 MIR 2013-2014 paración de los grupos de tratamiento. Así sabemos que tenemos que
tener en cuenta:
En el cálculo del tamaño muestral en la estimación de parámetros, el ta- • Objetivo del estudio y la variable principal.
maño de la muestra dependerá de la variabilidad del parámetro que se • Magnitud del efecto que queremos detectar.

ESTA DÍSTICA Y EPIDEMIOLOGÍA 244


Estadística y epidemiología
• Variabilidad de la variable principal. Por otra parte, no necesitamos para nada el error beta (respuesta 1, falsa).
• Errores tipo I y II. El error beta es la probabilidad de no detectar diferencias cuando exis-
• Poder o potencia estadística. ten. Aquí no hay ninguna diferencia que detectar, puesto que se trata de
• Proporción de pacientes en ambos grupos. un estudio de PREVALENCIA. Tampoco precisamos estimar el error alfa
• Pérdidas esperadas. (respuesta 4, falsa), porque ya nos lo dan calculado: si el intervalo de con-
• Tipo de contraste. fianza es del 95%, el error alfa es del 5%.

Con esto, fácilmente podemos deducir que la respuesta a la pregunta


es la opción 1, dado que no está en nuestra lista. Este aspecto hace refe- Otros temas
rencia a las dificultades que podemos encontrar en el reclutamiento. Si
nuestro hospital atiende muchas neumonías, dicho reclutamiento será
más fácil. Por último, un breve comentario con relación a la magnitud P123 MIR 2010-2011
del efecto. En condiciones ideales, lo mejor sería ser capaces con nues-
tro diseño de detectar cualquier diferencia que pudiera haber entre los Pregunta fácil sobre aspectos tradicionalmente no muy preguntados en
tratamientos, por pequeña que ésta fuera. En la práctica, hay que llegar el examen MIR, pero que en las últimas convocatorias parecen estar co-
a un equilibrio entre esto (serían necesarios grandes tamaños muestra- brando importancia.
les, incrementando los costes) y las diferencias que son clínicamente
relevantes y, en consecuencia, pueden modificar nuestra actitud. Por Como se explica en la respuesta 1 (respuesta correcta), el concepto de
eso, la magnitud del efecto que queremos detectar se hace correspon- consentimiento informado engloba todo el proceso de información al
der con la diferencia que consideramos relevante desde el punto de paciente, que se realiza generalmente de forma oral durante toda la ac-
vista clínico. tividad asistencial y que, sólo en algunas ocasiones, se lleva a cabo de
forma escrita (prueba invasiva, riesgos sobreañadidos…). Por tanto, la
respuesta 3 es falsa (no es sólo un documento). Las respuestas 2 y 4, aún
P211 MIR 2004-2005 sin tener idea sobre el tema, tendrían que sonar a falsas, por lo restrictivo
de su afirmación (sólo y en ningún caso, respectivamente). El consenti-
El tabaquismo es una cualidad, así pues no se estimará en forma de me- miento informado por representación también sería necesario en aque-
dia (respuesta 5, falsa) sino como porcentaje o proporción: % de fumado- llos pacientes sin capacidad para emitir un juicio racional, bien porque la
res y % de no fumadores (respuesta 2, correcta). Por supuesto, tampoco hayan perdido (demencia) o porque nunca la llegaron a adquirir (retraso
necesitamos la desviación estándar del tabaquismo, porque ese paráme- mental). La respuesta 5 podría plantear más problemas si no se conoce
tro se calcula para variables cuantitativas, y aquí estudiamos una cuali- el tema, pero hay que recordar que el principio bioético que sustenta el
dad (fumar/no fumar). consentimiento informado es el de autonomía.

245

S-ar putea să vă placă și