Documente Academic
Documente Profesional
Documente Cultură
COMENTADOS
que además de decirnos cuántos tienen un resultado positivo, nos dicen
los que estaban verdaderamente enfermos:
Enfermos Sanos
+ 16 6
- 2 88
Estadística será de 1 o del 100%, para un test con una S y una E del 100%, algo que
no existe en la práctica clínica, no existe una prueba perfecta.
T01 Estudio de un test. Parámetros de uso valores de sensibilidad y especifidad del mismo. En este caso, un valor de
IFG bajo representa una mayor insuficiencia renal; por tanto, si disminui-
mos el valor de corte de 60 a 15, disminuiremos los verdaderos positivos,
P131 MIR 2014-2015 pero también los falsos positivos, es decir, estaremos haciendo el test más
específico. Recuerda que un test específico tiene pocos falsos positivos,
La probabilidad preprueba es la prevalencia, es decir, mide el porcen- y si disminuimos esa cantidad de FP, nuestro test será más especifico. De la mis-
taje global de enfermos en la población o muestra a estudio. Por tanto, ma manera, al “ser más estrictos” para diagnosticar de insuficiencia renal cam-
el parámetro que de forma más exacta y segura permitirá determinar la biando el punto de corte de 60 a 15, aumentaremos los verdaderos negativos
probabilidad preprueba en este caso es la frecuencia de hepatitis A en y también los falsos negativos, lo que convierte el test en uno menos sensible.
el entorno.
P195 MIR 2012-2013 Los valores predictivos son parámetros de validez externa que se mo-
difican por tanto, en función de la prevalencia. En aquellas situaciones
La prevalencia es una medida de frecuencia de la enfermedad, por lo tan- en las que la prevalencia de la enfermedad sea elevada se mejorará el
to si la enfermedad es más frecuente en hombres la prevalencia será más valor predictivo positivo, disminuyendo el valor predictivo negativo. Por
elevada en la población masculina. La sensibilidad y la especificidad de el contrario, en aquellas situaciones de baja prevalencia será más bajo
una prueba son características propias del test y no se ven influenciadas también el VPP y más alto sin embargo el VPN.
por los parámetros de frecuencia. Distinto es lo que ocurre con el VPP y
el VPN que dependen de la prevalencia. Si la prevalencia aumenta, el VPP
aumenta y el VPN disminuye y viceversa. En este caso como la enferme- P192 MIR 2011-2012
dad es menos frecuente en mujeres, en estas la prevalencia es menor y
por lo tanto el VPN de la prueba será mayor. Para contestar a esta pregunta lo mejor es dibujar la tabla 2x2 que te per-
mite situar cada número en su sitio, aunque lo primero es recordar cada
uno de los parámetros que evalúan el rendimiento de una prueba diag-
P196 MIR 2012-2013 nóstica: la sensibilidad nos indica el total de personas enfermas, cuántas
son detectadas como tales por la prueba; la especificidad indica el total
La razón de verosimulitud positiva (o razón de probabilidad positiva) se de personas sanas, cuántas con clasificadas como tales por la prueba; el
calcula dividiendo la probabilidad de un resultado positivo en los pacien- valor predictivo positivo nos dice el total de personas con un resultado
tes enfermos entre la probabilidad de un resultado positivo en los no en- positivo, cuántas tienen de verdad la enfermedad; y el valor predictivo
fermos. Es decir, cuantas veces es más probable encontrar un resultado negativo nos indica el total de personas con un resultado negativo, cuán-
positivo en enfermos que en sanos (respuesta correcta 2). tas están de verdad sanas.
En esta pregunta se nos indica que 8 de cada 10 individuos con una en-
P197 MIR 2012-2013 fermedad crónica presentan una prueba alterada, es decir, nos dicen la
sensibilidad de la prueba (8/10). También nos dicen que 8 de cada 10
Para una prueba de cribado nos interesa sobrediagnosticar, es decir, que no se sanos presentan valores normales en la prueba, lo que hace referencia a
nos escape nadie que tenga la enfermedad. Para ello es necesario una prueba la especificidad (8/10). Además, nos indican cuántas de las personas a las
muy sensible, que todo individuo que tenga la enfermedad nos dé positivo que les aplicamos la prueba sabemos que están enfermas: 20 de los 100
en el test. Pero esto tiene el problema de aumentar los falsos positivos, por individuos. Después de toda esta información, se nos pide que indique-
ello en un segundo tiempo (una vez la prueba de cribado haya dado positiva) mos el valor predictivo positivo.
sería necesario una segunda prueba más específica. Por ejemplo en el criba-
do de cáncer de mama la primera prueba es una mamografía (muy sensible) El valor predictivo positivo se calcula como el total de personas enfermas
y la segunda PAAF, BAG o Biopsia (muy específicas). Para aceptar una prueba con un resultado positivo sobre el total de personas con un resultado po-
como de screening tiene que ir focalizada a detectar una enfermedad pre- sitivo. Como la sensibilidad es 0,8 (8/10) el total de personas enfermas con
valente en la población y que su diagnóstico precoz signifique una ventaja un resultado positivo (verdaderos positivos) será 0,8 multiplicado por 20
en cuanto a posibles tratamientos y supervivencia respeto a un diagnóstico (el 80% de 20), es decir, 16 personas. Ahora nos faltan el resto de resultados
tardío. De nada sirve diagnosticar precozmente si luego no podremos tratar. positivos que serán aquellas personas que están sanas, pero que fueron
Las respuestas 1, 3, 4 y 5 son por tanto correctas y la falsa es la 2. clasificadas como enfermas (falsos positivos). En este caso será 0,2 (1-espe-
cificidad que es 8/10=0,8) multiplicado por 80 personas (100 menos las 20
enfermas), es decir, 16 personas. Si ahora aplicamos la fórmula obtenemos
P198 MIR 2012-2013 (16/[16+16])x100=50%) (verdaderos positivos/[verdaderos postivos + fal-
sos positivos]), por lo que la respuesta correcta es la 2.
La sensibilidad es la probabilidad de clasificar correctamente a un sujeto
enfermo, es decir, la probabilidad de que para un sujeto enfermo se obten- P192 (MIR 11-12)
ga en la prueba un resultado positivo (S= verdaderos positivos/verdaderos Enfermos Sanos
positivos+falsos negativos o todos los verdaderos enfermos). Por ello, si Reultado Alterado 16 16 • 32 • VPP = 16/32
de la
la sensibilidad es del 95%, la única respuesta correcta es la 1, hay un 5% prueba Normal 4 64 • 68 • VPN = 64/68
de falsos negativos, es decir hay un 5% de los enfermos que estará mal
20 20 100
clasificado, un 5% que dará negativo a la prueba pero que realmente será
enfermo). Los falsos positivos (respuesta 2) los encontraríamos calculando Sensibilidad = Especificidad =
16/20 64/80
1-ESPECIFICIDAD ¡no se relacionan con la sensibilidad! Las respuestas 3 y 4
199
DESGLOSES
COMENTADOS MIR
titativa. En estos casos, se recurre al coeficiente de correlación intracla- prueba sea útil. Si aumenta la especificidad, se incrementa el número de
se (respuesta 2, correcta). No hay que confundirlo con el coeficiente κ falsos negativos, ya que algunos de estos resultados negativos corres-
(respuesta 3, incorrecta), que se usa para analizar la concordancia de ponderán a enfermos. Pongamos un ejemplo extremo: una prueba que
una variable cualitativa dicotómica (por ejemplo, serviría para estimar siempre diese negativo. Obviamente, esta prueba no serviría para nada,
la concordancia entre dos radiólogos que evalúan una muestra de ma- pero su especificidad sería del 100%, porque todos los sanos tendrían
mografías clasificando el resultado como “normal” o “patológico”, como un resultado negativo en ella. Pero los enfermos también darían nega-
apareció en la pregunta 85 de la convocatoria 1997-1998). tivo (todos ellos serían falsos negativos). Por tanto, lo ideal es encontrar,
en cada prueba diagnóstica, un punto de equilibrio entre sensibilidad y
especificidad.
P195 MIR 2009-2010
No te confundas con la opción 5. El valor predictivo negativo es la pro-
Una de las preguntas más básicas de este examen, al menos en el blo- porción de pacientes sanos entre los que han obtenido un resultado ne-
que de Epidemiología y Estadística. Los valores predictivos positivo y gativo en la prueba.
negativo dependen de la prevalencia. Cuanto más prevalente sea una
enfermedad, más alto será el valor predictivo positivo, porque al ha-
ber más enfermos en esa población, es más probable que la prueba P215 MIR 2008-2009
“acierte” al dar un positivo, es decir, que corresponda a un enfermo. El
aumento de la prevalencia hace que disminuya el valor predictivo ne- Una pregunta muy difícil en apariencia, pero que en realidad puede
gativo, por la misma razón. Al haber menos sanos en ese colectivo, es deducirse. Lo primero que hay que tener claro es el concepto de po-
menos probable que un negativo en la prueba corresponda a un sano tencia o poder estadístico. Representa la capacidad del estudio para
en la realidad. detectar diferencias cuando realmente existen. En segundo lugar, de-
bemos plantearnos qué es la sensibilidad. Llamamos sensibilidad a la
Pongamos un ejemplo, para así entender hasta qué punto la prevalen- capacidad de un test para clasificar a un enfermo como positivo. En
cia puede influir sobre estos valores. Imaginemos una población donde otras palabras, la capacidad de una prueba diagnóstica para detectar
TODOS están enfermos. ¿Cuál será el valor predictivo positivo? Eviden- una enfermedad. En ambos casos estamos hablando de la probabili-
temente, del 100%, porque todos los positivos que la prueba encuentre dad de detectar algo: una diferencia real (potencia) o una enfermedad
van a coincidir, obligatoriamente, con un enfermo. ¿Cuál sería el valor (sensibilidad). Por tanto, la respuesta correcta es la 3. No te confundas
predictivo negativo? Pues el 0%... Si todos están enfermos, todos los ne- con la opción 1, como les ocurrió a algunos opositores en esta con-
gativos que nos dé la prueba serán falsos negativos, porque ninguno co- vocatoria. El valor predictivo positivo hace referencia a la proporción
rresponderá a un sano. de enfermos entre los que han sido clasificados como positivos. No se
encuentra en esta idea el grado de similitud comentado para potencia
Con este ejemplo, un tanto burdo e irreal (pero ilustrativo), queda clara la y sensibilidad.
falsedad de la respuesta 5.
Esta es una pregunta sencilla que versa sobre un tema muy reiterado en
el MIR, el estudio de un test diagnóstico, en la que ni siquiera tenemos
que construir la tabla de contingencia porque ya nos la dan construida.
Cuando se realiza una prueba de screening, es preferible una prueba Estos índices se obtienen a partir del análisis de una serie de pacientes
sensible a una específica. Esta prueba tiene la virtud de dar positivo en a los que se les realiza una prueba diagnóstica (prueba problema), com-
la mayoría de los enfermos, que es lo que pretendemos detectar. Tiene parándose los resultados con los de una prueba de superior rendimiento
también un inconveniente, que será la presencia de algunos falsos po- diagnóstico (prueba de referencia).
sitivos, dado que algunos sanos serán clasificados erróneamente. Más
adelante, se realizaría una prueba más específica, para identificar los pa- El valor predictivo positivo es la proporción de verdaderos positivos en-
cientes realmente enfermos y descartar los falsos positivos. tre aquellos que han sido identificados como positivos con el test. En
este caso será 80 de 180, un 44% aproximadamente.
Un claro ejemplo de esto es el ELISA para la detección de VIH. Esta prueba
es muy sensible, pero poco específica. Su falta de especificidad la com- El valor predictivo negativo es la proporción de verdaderos negativos
plementaríamos después con una prueba como el Western-Blot, que entre aquellos que han sido identificados como negativos con el test. En
confirmará o descartará la infección de forma definitiva. este caso será 800 de 820, un 98% aproximadamente.
El concepto de valor predictivo positivo (VPP) ha sido preguntado de for- El cálculo de valores de un test es imprescindible en el planteamiento del
ma casi constante a lo largo de los últimos años, directa o indirectamen- MIR. La sensibilidad se refiere a la capacidad de detectar positivos en el
te. Es una pregunta que debería acertarse sin complicaciones. grupo de enfermos. En esta pregunta, el total de enfermos (con úlcera)
son 300 y de éstos, 130 son detectados como tal por la prueba (VP), así
El VPP hace referencia a la probabilidad que tiene un paciente de pade- que la S es igual a 130/300 = 43%.
cer la enfermedad, una vez que ha dado positivo en el test (respuesta 4,
correcta). No lo confundas con la sensibilidad, que es a lo que hacen re-
ferencia en la respuesta 3 y en la 5. P148 MIR 2003-2004
201
DESGLOSES
COMENTADOS MIR
enfermedad aumenta el VPP (es decir, cuanto más habitual es la enfer- P203 MIR 2006-2007
medad más probable es que un resultado positivo en el test corresponda
realmente a un enfermo). La prevalencia es un concepto absolutamente básico. Esta pregunta
es una de las más sencillas del examen. La prevalencia representa el
número de casos en una población, incluyéndose todos los enfermos,
T02 Conceptos y uso de la epidemiología sean recientes o antiguos (respuesta 4, correcta). No la confundas con
la incidencia, que representa el riesgo de enfermar en un periodo de
tiempo determinado, y hace referencia a los casos nuevos durante ese
P224 MIR 2007-2008 periodo.
De los criterios de causalidad, no existe ninguno que por sí solo sea a la P203 (MIR 06-07) Medidas de frecuencia de la enfermedad
vez necesario y suficiente. De hecho, todos ellos pueden no cumplirse,
salvo uno, que es la relación temporal (la causa debe preceder al efecto,
respuesta 3, correcta). El resto de ellos pueden no aparecer. También has
de recordar que la asociación estadística no es un criterio de causalidad,
detalle preguntado en varias ocasiones. Los criterios de causalidad son:
• Fuerza de asociación.
• Efecto dosis-respuesta.
• Secuencia temporal.
• Coherencia externa (consistencia de los resultados).
• Ausencia de distorsiones metodológicas en el estudio, debidas a sesgos.
• Ausencia de explicaciones alternativas.
• Plausibilidad biológica.
• Efecto de la cesación o reversibilidad.
T04 Medidas de asociación
• Demostración experimental.
P189 MIR 2014-2015
T03 Medidas de frecuencia de la enfermedad En esta pregunta tenemos que calcular el OR entre una enfermedad y un
factor. Para ello, nos dan los datos de enfermos en cada grupo, con y sin
factor X:
P209 MIR 2013-2014 • 20 expuestos en 120 enfermos.
• 20 expuestos en 420 sanos.
El estudio de cohortes es un estudio analítico, observacional y prospecti-
vo. A partir de individuos sanos nos permite, a diferencia de los estudios El OR (OR = ad/bc) se calcula con la tabla:
casos y controles, el cálculo de medidas de frecuencia como la incidencia
acumulada (riesgo individual de enfermar) y la densidad de incidencia. Enfermos Sanos
Esta última es una tasa, y, por tanto, incorpora en el denominador el
Expuestos a b
tiempo. Para su cálculo se realiza el cociente de casos nuevos entre el su-
No expuestos c d
matorio de los periodos individuales en riesgo (opción 4, correcta). Nos
expresa la velocidad con la que aparece un fenómeno en una población.
Si sustituimos los valores:
La densidad de incidencia es una tasa que expresa la velocidad con la Cuando queremos realizar una inferencia, es decir, generalizar los resulta-
que se desarrolla una enfermedad en una población y, para ser válida, to- dos a la población, necesitamos construir un intervalo de confianza entre
dos los sujetos deberían haber sido seguidos durante un tiempo suficien- dos valores donde se encontrará el verdadero valor poblacional. En este
te para desarrollarla. También se conoce como “fuerza de morbilidad”. caso, el RR es 0,69 (factor protector), pero el IC va desde 0,31 (factor pro-
El intervalo de confianza del RR (1,77-3,22) no incluye el valor 1, lo cual Si se tiene claro el concepto de fuerza de asociación, uno de los más
indica significación. Como el RR es mayor que 1 indica que estamos destacados del bloque de Epidemiología, no se encontrarán dificultades
ante un factor de riesgo. Por tanto, asumimos que es significativo que para contestar esta pregunta.
aumenta el riesgo de muerte súbita en los pacientes que toman anti-
psicóticos. Los parámetros de fuerza de asociación miden la diferencia de ocurren-
cia de enfermedad entre dos grupos: personas expuestas (a un factor de
riesgo o fármaco) y personas no expuestas.
P203 MIR 2007-2008
El riesgo relativo es la medida de asociación en los estudios de cohortes
Esta pregunta puede intimidar, a primera vista, puesto que está llena de y en los demás estudios prospectivos, como los ensayos clínicos. Puede
letras y números. Sin embargo, es bastante más sencilla de lo que parece. variar entre cero e infinito y responde a la pregunta: ¿cuánto más común
Ante los datos que nos ofrecen podemos concluir: es la enfermedad entre los expuestos a un factor respecto a los no ex-
• La respuesta 1 queda excluida, ya que el intervalo de confianza de B puestos?
incluye el 1. Esto quiere decir que no se ha alcanzado la significación
estadística, con lo que cabe la posibilidad de que sea tanto factor de En la pregunta que nos ocupa, el RR es de tres, así que diremos que la
riesgo como factor protector para el padecimiento de IAM. incidencia de hemorragia intracraneal entre los pacientes tratados con
• Las opciones 3 y 4 (fármacos A y D) quedan descartadas, dado que a el factor de estudio (anticoagulantes orales) es tres veces superior a la de
juzgar por las medidas de asociación (OR, en ambos casos), se com- los no tratados (en este caso tratados con antiagregantes).
portarían como factores de riesgo para IAM.
• Por consiguiente, nos queda la opción 2 (fármaco C). Si la analizamos,
veremos que el intervalo de confianza no incluye la unidad (es decir, P149 MIR 2003-2004
existe significación) y se comporta como factor protector frente al
infarto agudo de miocardio (RR = 0,7). Este tipo de preguntas acerca de la interpretación es cada vez más
normal en el examen. La mayoría de veces son sencillas si dominas los
conceptos relacionados con el contraste de hipótesis y el intervalo de
P198 MIR 2005-2006 confianza.
Pregunta fácil acerca del riesgo relativo. El riesgo relativo es una medida Nos describen un estudio en el que los pacientes hipertensos son
de asociación utilizada en los estudios de cohortes. Mide la fuerza de la clasificados en función del tipo de tratamiento antihipertensivo que
asociación entre el factor de riesgo y la enfermedad. Puede variar entre estuvieran recibiendo. Posteriormente son seguidos en el tiempo,
203
DESGLOSES
COMENTADOS MIR
estudiando la aparición de infarto agudo de miocardio. Se trata por P179 MIR 2010-2011
tanto de un estudio de cohortes (no confundir con el ensayo clínico
porque aquí el tratamiento no es asignado por el investigador, ya lo Una pregunta muy sencilla sobre un concepto ya preguntado antes en el
estaban tomando). La opción correcta es la 2: como el intervalo de con- examen MIR. Cuando nos preguntan cuántos pacientes deberíamos tratar
fianza no incluye el 1 (valor nulo), sabemos que el resultado es estadís- para evitar un evento, en este caso un infarto de miocardio, debemos utilizar
ticamente significativo. la fórmula del NNT (número necesario de pacientes a tratar). Esta fórmula
sería: NNT = 100/(I1-I2), donde I1 es la incidencia de IAM con el fármaco an-
El riesgo relativo y su intervalo de confianza nos informan de cuántas tiguo, mientras que I2 representa la incidencia de IAM con el fármaco nuevo.
veces más riesgo tienen los expuestos, pero no de incidencias (recuerda Sustituyendo, NNT = 100/2,5 = 40 pacientes (respuesta 4, correcta).
que en estos estudios se pueden calcular incidencias A distintas de los
casos y controles).
P188 MIR 2010-2011
T05 Medidas de impacto o del efecto Una pregunta sencilla en la que, para resolverla, sólo nos exigen mante-
ner un mínimo de atención. Con el tratamiento habitual, se producían
50 infartos por cada 500 pacientes, es decir, un 10%. En cambio, con el
P181 MIR 2014-2015 nuevo tratamiento solamente se producen 25 sobre 500, un 5%. ¿Cuál es
la diferencia entre los dos? ¿Cuánto se reduce, con la nueva alternativa,
Pregunta directa sobre el cálculo de medidas de asociación y de efecto. el riesgo de infarto?
Se pide calcular el riesgo relativo (RR) y el riesgo atribuible (RAE). Para
ello, es necesario conocer la incidencia en expuestos (Ie) y en no expues- 10% - 5% = 5%
tos (Io):
• Ie = 30 casos en 1.000 mujeres fumadoras = 30/1000 = 3/100 = 3% Así de simple (respuesta 5, correcta). El único problema que puedes ha-
• Io = 20 casos en 2.000 mujeres fumadoras = 20/2.000 = 2/200 = 1/100 = 1% ber tenido es restar, directamente, 50 – 25 = 25. Observa que las posibles
opciones aparecen expresadas en porcentaje. Haciendo correctamente
Ahora, sólo queda sustituir en la fórmula del RR y del RAE: la conversión, el problema no encierra ninguna dificultad.
• RR = Ie/Io = 3/1 = 3%
• RAE = Ie/Io = 3 - 1 = 2% = 20 por 1.000.
P208 MIR 2008-2009
P198 MIR 2014-2015 Una pregunta de dificultad media sobre la interpretación de los datos de
ensayos clínicos. Analicemos opción por opción:
El NNH es el equivalente al NNT, sin embargo, en lugar de tratar con un • Es cierto que el metoprolol reduce la mortalidad en un 50%, es decir,
efecto beneficioso de un fármaco para evitar un fenómeno adverso (RR a la mitad (con placebo, 40%; con este fármaco, 20%). Respuesta 1,
menor de 1), nos encontramos un aumento de un fenómeno adverso correcta.
(RR mayor de 1). Serán por tanto preguntas que hablen de efectos se- • En términos de riesgo relativo, la respuesta 3 tiene razón; sólo tene-
cundarios. Su significado sería cuántas personas hay que tratar con el mos que dividir incidencias o riesgos.
fármaco para obtener un evento, que en lugar de ser evitar un ictus por • La respuesta 4 es evidente. Los pacientes de alto riesgo se benefician
ejemplo (NNT), será tener una hemorragia (NNH). más, porque estaríamos salvando 20 vidas por cada 100 pacientes
tratados (ya no muere el 40%, sino únicamente el 20%). Sin embar-
go, en los de bajo riesgo salvamos solamente 5 vidas por cada 100
P205 MIR 2013-2014 tratamientos.
• La respuesta 5 es consecuencia natural de lo que dice la 4. Si los recur-
Debemos conocer el cálculo de las medidas de efecto o impacto. La re- sos son limitados (es decir, no puedo tratar a todos), es preferible tratar
ducción riesgo absoluto o RRA nos indica la proporción de pacientes no al grupo que más se beneficie, que en este caso son los de alto riesgo.
expuestos al factor protector (RR menor de 1) en los que se evitaría el
fenómeno adverso si se expusieran al mismo, y su cálculo se realiza me- La opción falsa es la 2. El riesgo relativo desciende por igual en ambos
diante la resta de la incidencia en no expuestos a la incidencia en expues- grupos (20/40=0,5; 5/10=0,5). Lo que sí cambia de un grupo a otro es lo
tos (respuesta 5, correcta). Nos comunica, pues, la incidencia de eventos que dice la respuesta 4: el beneficio absoluto, entendido como número
adversos que ha evitado el factor, normalmente un medicamento a es- de vidas salvadas por cada 100 pacientes tratados.
tudio.
P201 MIR 2005-2006 Por otro lado, los valores se distribuyen en torno a la media según la cur-
va de gauss, de forma que la mayoría de éstos se encuentran en torno a
Pregunta fácil por haber sido repetida últimamente de manera casi idén- la media y son cada vez más infrecuentes conforme nos alejamos de ésta.
tica. Nos preguntan directamente el cálculo del NNT, uno de los índices En este caso, por consiguiente, si la media de la RRR en la población es
utilizados en el análisis de los resultados de un ensayo clínico. Simplemen- –29%, serán más usuales los valores en torno a ésta que los valores próxi-
te nos tenemos que limitar a aplicar la fórmula. Esta pregunta ha caído mos a –100% o a +43%, que son los límites del intervalo de confianza.
todos los años en las últimas tres o cuatro convocatorias. El NNT (número
de pacientes a tratar para evitar un evento) se deriva de la REDUCCIÓN Has de saber también que cuando el intervalo de confianza del RRR in-
ABSOLUTA DEL RIESGO. La reducción absoluta del riesgo es la diferencia cluye el 0, el resultado no es concluyente, ya que como hemos dicho an-
de incidencias del evento entre el grupo sometido al tratamiento experi- teriormente el 0 indica la indiferencia, es decir, que en nuestro caso la
mental y el grupo control. En nuestra pregunta, la mortalidad en el grupo incidencia de accidentes cerebrovasculares en pacientes con ácido ace-
placebo es del 10% y en el grupo experimental del 5%. En atención a ello, tilsalicílico es igual a la de los pacientes en el grupo control.
la RAR es del 5%. Esto quiere decir que, gracias al tratamiento, evitamos
cinco muertes por cada 100 pacientes tratados. Por tanto, deberemos tra- Con todo esto, podemos entender la opción 3, que es la interpretación
tar a 20 pacientes con el nuevo fármaco para evitar una muerte (opción 2, correcta de los resultados.
correcta).
Además de con el NNT, la magnitud del efecto del tratamiento en los P127 MIR 2003-2004
ensayos clínicos se puede expresar mediante:
• El riesgo relativo: cociente entre el riesgo de sufrir un determinado Esta pregunta es difícil, porque hace necesario interrelacionar dos con-
evento en el grupo expuesto a un determinado tratamiento y el ries- ceptos. Para poder contestar, necesitamos manejar dos conceptos. El pri-
go de sufrir el mismo evento en el grupo control. mero, es el del riesgo atribuible (Ie-Io) y el segundo es el del NNT (100/
• La reducción absoluta del riesgo (RAR): diferencia entre el porcentaje RA). El enunciado aporta dos variables: la primera es Io que es igual al
de eventos en el grupo control y el porcentaje de eventos en el grupo 6%, y la segunda es el NNT, que es igual a 20. Si el NNT es 20, el RA será
experimental. igual a 100/20, es decir, cinco. Por lo que, si la (incidencia en no expuestos
• La reducción relativa del riesgo (RRR): diferencia entre el porcentaje (Io)) es 6%, para conseguir un riesgo atribuible (RA) de 5, la incidencia en
de eventos en el grupo control y el porcentaje de eventos en el gru- expuestos (Ie) debe ser del 1%.
po experimental, dividido por el porcentaje de eventos en el grupo
control.
P152 MIR 2003-2004
P259 MIR 2005-2006 Esta pregunta se contesta realizando una tabla de contingencia y apli-
cando fórmulas. Es de dificultad baja. Hemos de realizar una tabla de
Pregunta difícil; es lógico que te haya planteado cierta dificultad. En esta contingencia de 2 x 2 y extraer los datos de incidencia en los expuestos
pregunta nos plantean un ensayo clínico en el que se compara la efica- (50/1000) y la incidencia en no expuestos (10/2000). Así, aplicando la fór-
cia de la terapia antiagregante con ácido salicílico en la prevención de mula del riesgo relativo y la del riesgo atribuible, se obtiene un riesgo
accidentes cerebrovasculares frente a un grupo control. Para contestar relativo de 10 y un riesgo atribuible de 0,045.
205
DESGLOSES
COMENTADOS MIR
HDA P198 MIR 2013-2014
Sí No Total
Consumo Sí 50 950 1000 Los autores han realizado un estudio analítico, observacional y retros-
de AINE pectivo, comparando un grupo con enfermedad y otro sano para estu-
No 10 1990 2000
diar la exposición del factor de estudio, es decir, se trata de un estudio de
Total 60 2940 300
casos y controles.
50 / 1000
RR = = 10 En un registro poblacional se reportan todos los casos diagnosticados de
10 / 2000
una enfermedad en un área de población expuesta al riesgo. Un estudio
de casos controles anidado, o de grupo de riesgo, es un estudio de ca-
RA= Ie – Io = 50/1000 – 10/2000 = 0,05 – 0,005= 0,045 sos controles donde se identifican los sujetos a partir de una cohorte, en
este caso, el registro poblacional de cáncer. Los casos son aquellos que
tienen ya la enfermedad dentro de mi cohorte, y que un sujeto sea ele-
T06 Tipos de estudios epidemiológicos gido como control depende de que éste se encuentre en riesgo, es decir,
tiene que ser miembro de la cohorte en el momento en que se selecciona
o identifica el caso. Los casos y el conjunto de individuos en riesgo que
P182 MIR 2014-2015 no desarrollaron el evento constituyen el grupo de riesgo. En un primer
tiempo se define la cohorte o población en estudio; se realiza el segui-
Pregunta sencilla sobre los estudios observacionales. Los autores realizan miento de la misma con el fin de detectar los eventos que ocurren (casos
un estudio en el que dividen los grupos de estudios en función del factor nuevos de cáncer) a lo largo del tiempo y, cada vez que se selecciona o se
de riesgo (niños con exposición a humo y niños sin exposición a humo) y identifica un caso, se seleccionan uno o varios controles de la población
estudian la aparición, al año, de posibles efectos, por lo que es un estudio que en ese momento particular se encontraba en riesgo de desarrollar el
de cohortes (respuesta 1, correcta). Hay que recordar que los estudios de evento en estudio (pacientes sin cáncer).
cohortes son observacionales longitudinales (respuesta 4, falsa), y útiles
para estudiar factores de exposición raros (respuesta 5, falsa). La metodo- En esta variante del estudio de casos y controles podría ocurrir que un
logía cualitativa es aquélla de tipo observacional pero que, a diferencia de sujeto fuera seleccionado como control y, posteriormente, desarrollar
la cuantitativa, admite la subjetividad de los investigadores (respuesta 3, la enfermedad y ser considerado como caso. Esto no es un sesgo, ya
falsa). Se usa, sobre todo, en estudios sociales, como por ejemplo la eva- que en los estudios de cohorte, al igual que en esta situación, un mismo
luación de un programa de formación. sujeto puede contribuir tanto al numerador como al denominador. El
diseño de casos y controles anidado, o de grupo de riesgo, se usa en
cohortes dinámicas en las que la determinación de la exposición y sus
P183 MIR 2014-2015 cambios en el tiempo, en todos los miembros de la cohorte, resultaría
muy cara.
Pregunta polémica sobre estudios observacionales donde se analiza
la relación entre HDA y consumo de AINE. No se concreta con exac-
titud si los individuos del grupo control han tenido o no HDA. Si, su- P208 MIR 2013-2014
poniendo una errata cuando dice “pero por razones que no tuvieran
nada que ver con el uso de AINE”, cambiásemos uso de AINE por HDA, Para estudiar los efectos de una intervención necesitaremos un estudio
sería un estudio observacional retrospectivo, como dice la respues- analítico (opciones 1 y 3, incorrectas). Dentro de los estudios analíticos
ta 2: casos y controles. Ante este tipo de preguntas, que pueden ser necesitaremos un estudio experimental, ya que la intervención va a ser
anulables, si se intuye lo que se ha querido preguntar como es el caso, aplicada sobre el paciente por nosotros, y no podremos limitarnos a ob-
o hay 4 claramente falsas, debe marcarse la respuesta que parece co- servarla en el seguimiento de una cohorte ya sea de manera prospectiva
rrecta. o retrospectiva (opciones 2 y 5, incorrectas). El estudio analítico experi-
mental de mayor valor estadístico es el ensayo clínico, donde realizamos
una aleatorización de la intervención y disponemos de un grupo control
P197 MIR 2014-2015 (opción 4, correcta).
P184 MIR 2012-2013 Dadas las características de la patología que nos presentan, no podemos
plantear la realización de un estudio prospectivo: en ningún caso podría-
Se trata de un “casos y controles” dentro de un estudio de cohortes. mos asignar, al azar o no, a mujeres embarazadas a determinadas exposi-
ciones para luego detectar la incidencia de espina bífida. Además, se trata
de una enfermedad poco frecuente, con una prevalencia estimada, según
P186 MIR 2012-2013 el enunciado, de uno de cada 1.000 nacidos vivos. Las dos características
nos hacen inclinarnos hacia un estudio de casos y controles (opciones
En el cohortes todos son sanos al inicio del estudio (opción 1, falsa) solo 3 y 4). En la opción 4, no se plantea un diseño real de casos y controles
difieren en la exposición, se mira si la incidencia de la enfermedad es di- puesto que en realidad de clasifica a los sujetos de estudio en función de
ferente en expuestos y no expuestos (opción 2, falsa) se mide incidencia la exposición. Por todo ello, la opción 3 resulta la más adecuada.
no prevalencia ya que hay un seguimiento (opción 3, falsa) la exposición
la decide el sujeto no el azar (opción 4, falsa) y pueden ser retrospectivos
si utilizamos cohortes históricas (opción 5, cierta). P232 MIR 2011-2012
P180 MIR 2011-2012 Los estudios ecológicos son estudios en los que la unidad de análisis son
grupos de individuos, no individuos. Por ejemplo, clases de una escuela,
La selección de pacientes se basa en la aparición de un fenómeno: ac- regiones o, como en el caso de la pregunta, de ciudades europeas. Son
cidente; se seleccionan los controles de características similares excep- útiles cuando no se pueden hacer mediciones individuales: ruido, ventas
tuando que no tuvieron el accidente y en los dos casos nos preguntamos de cigarrillos o, como aquí, niveles medios de contaminación.
207
DESGLOSES
COMENTADOS MIR
En el estudio que nos describen, sólo disponemos de datos poblaciona- - 2.º Ensayo clínico controlado no aleatorizado con controles histó-
les, no individuales, acerca de la tasa de incidencia de un tipo de alergia ricos.
en el último año y los niveles medios de contaminación en 250 ciudades - 3.º Estudio de cohortes prospectivos.
europeas (opción 5 correcta). Los estudios ecológicos permiten describir - 4.º Estudio de cohortes retrospectivos.
diferencias en poblaciones que habrán de ser estudiadas posteriormente
con más detalle. Su problema es que las medidas usadas son aproxima- • Mala:
das de exposición y de enfermedad, lo que limita el valor de los hallazgos. - 1.º Estudio de casos y controles.
- 2.º Serie de casos clínicos, estudios ecológicos y estudios transver-
sales.
P177 MIR 2010-2011 - 3.º Comités de expertos.
Una pregunta muy sencilla que puede resolverse por descarte de opciones: Según esta clasificación, podemos ver que la respuesta 1 es la correcta,
• El diseño es prospectivo, lo que descarta el estudio de casos y con- descartándose el resto por aportar un menor nivel de evidencia científica.
troles (retrospectivo) y el transversal (donde no existe seguimiento)
(respuestas 1 y 3, descartadas).
• En una serie de casos, no se parte de una población inicialmente P191 MIR 2010-2011
sana, lo que descarta la respuesta 4.
• Evidentemente, no podemos constituir dos grupos para asignar el Los tipos de estudios epidemiológicos son un tema muy importante para
uso de teléfono móvil a uno de ellos, privando al otro de hacerlo, el examen MIR. En esta pregunta nos piden el estudio más adecuado
para establecer después una comparación. Se descarta, por tanto, el para enfermedades cuyo periodo de latencia es muy largo. Para este tipo
ensayo clínico. Precisamente, en un estudio de cohortes, es el propio de enfermedades los estudios prospectivos requerirían un periodo de se-
sujeto el que decide exponerse o no al factor de estudio, mientras guimiento muy largo, hasta la aparición de casos de enfermedad, lo que
que en el ensayo clínico lo asigna el investigador (respuesta 5, des- encarecería el estudio y retrasaría mucho la obtención de resultados; por
cartada). ello, no son apropiados en estos casos. Así descartamos las respuestas 2
y 4 por tratarse de estudios prospectivos.
P177 (MIR 10-11) Estudio de cohortes
Las respuestas 1 y 5 también se excluyen fácilmente porque se tratan de
estudios descriptivos, cuya utilidad para establecer asociaciones causa-
les es muy limitada, y en cualquier caso dicha asociación debe ser verifi-
cada por estudios analíticos.
Una pregunta que ya había aparecido en el MIR antes de esta convocato- En este enunciado nos dicen que tenemos un grupo de niños que ya han
ria. Lo único que cambia es la forma de preguntarse, pero en esencia es presentado síndrome de Reye, con lo que la respuesta está clara. Estamos
siempre la misma. ante un estudio de casos y controles. Por otra parte, el diseño del estudio
209
DESGLOSES
COMENTADOS MIR
es retrospectivo (preguntamos si la madre tomó ácido acetilsalicílico). La • Otra posible desventaja es que, si se hace con respecto a demasiadas
respuesta correcta sería, por tanto, la opción 3. variables (sobreapareamiento), puede dificultar en extremo la obten-
ción de la muestra necesaria.
P185 MIR 2009-2010 Respecto al resto de las opciones, la 2 y la 3 son falsas, ya que el aparea-
miento no implica utilizar un diseño cruzado, ni tampoco que un sujeto
Esta pregunta hace alusión a conceptos muy preguntados en el examen actúe como su propio control (lo que, en esencia, sería un diseño cruza-
MIR, que por lo tanto hay que dominar. En un estudio de cohortes se do). Por otra parte, la respuesta 4 es claramente falsa, puesto que esta-
plantean hipótesis, es decir, es analítico. La respuesta incorrecta, por lo mos hablando de estudios de casos y controles, y en ellos no habría un
tanto, sería la 2. Al no asignarse de forma controlada, los posibles facto- seguimiento prospectivo.
res de estudio son observacionales (un ensayo clínico, donde es el inves-
tigador el que lo asigna, sería experimental). La única opción válida es la 1. Aunque habitualmente se utiliza un control
por caso, existen estudios donde se realiza una aleatorización distinta
El estudio de cohortes es longitudinal porque existe un seguimiento a lo (1:2, 1:3) usando más de un control por caso. Si no se supiese esto, la
largo del tiempo. Es en los transversales donde no hay seguimiento en el pregunta podía resolverse fácilmente por exclusión.
tiempo (estudios de prevalencia, por ejemplo).
Los estudios de cohortes son prospectivos, salvo en casos muy concretos P205 MIR 2008-2009
(cohortes histórico, que sería retrospectivo, una excepción, por lo que la
opción 1 puede considerarse cierta). Una pregunta difícil, donde la forma más sencilla de resolverla es descar-
tando opciones:
• La respuesta 1 es incorrecta. No puede plantearse este estudio en
P186 MIR 2009-2010 forma de ensayo clínico, por razones éticas. Está claramente demos-
trado que la triple terapia disminuye la transmisión vertical del VIH,
El posible problema que nos están describiendo en el enunciado, y que por lo que no sería aceptable realizar este diseño, ya que implicaría
pretendemos evitar, es el llamado sesgo de memoria, típico de los estu- transmitir el VIH al grupo no tratado, cuando esto podría evitarse.
dios de casos y controles. En ellos, los casos (pacientes con la enferme- • La respuesta 2 no puede ser válida. Una variable de estudio es la
dad) recuerdan más fácilmente posibles exposiciones que los controles, presencia de retraso psicomotor, y la otra es la infección por VIH,
ya que éstos no han sufrido ninguna consecuencia, por lo que estarían cuando lo que nos interesa es la exposición o no exposición a anti-
menos motivados para recordarlas. rretrovirales.
• La opción 3 es falsa, porque se limita a estudiar lo que sucede en
Una forma muy inteligente de protegerse frente a este error sistemático niños con VIH, cuando el enunciado nos pide independencia de este
es lo que dice la respuesta 3. En lugar de confiar en lo que dice el paciente factor (es decir, que estudiemos los infectados y los no infectados).
(que puede no recordarlo, sobre todo si es un control), buscar este dato en • La respuesta 5 no tiene sentido. Si se diseña un estudio de casos y
un registro totalmente objetivo: una base de datos sobre las prescripciones controles, los casos deberían ser los que tienen retraso psicomotor;
médicas que se realizaron durante el embarazo de las participantes en el los controles, los que no lo tienen. Después, se investigaría su exposi-
estudio. De este modo, estaríamos protegidos frente al sesgo de memoria. ción o no a estos fármacos.
Los estudios transversales tienen carácter descriptivo, pero también pue- En los estudios de cohortes, el investigador identifica dos grupos de su-
den tener un carácter analítico, ya que pueden utilizar una medida de jetos, uno expuesto al factor en estudio (fármaco, factor de riesgo) y otro
asociación (razón de prevalencia), de interpretación análoga al riesgo re- no expuesto. Después, los sigue a lo largo del tiempo para ver la inciden-
lativo y a la odds ratio. Por tanto, las respuestas 2 y 3 son correctas. cia de enfermedad. No son útiles para enfermedades raras o poco fre-
cuentes, porque aunque siguiéramos la cohorte durante mucho tiempo
Tal como dice la respuesta 4, la medición de la exposición y enfermedad podrían no aparecer, o no alcanzarse un número de enfermos adecuado
se realiza a la vez, lo que resulta bastante lógico, ya que se limitan a estu- en ninguno de los dos grupos. Tampoco son útiles para enfermedades
diar un momento puntual del tiempo (nunca puede existir seguimiento con periodo de inducción largo, porque el estudio se prolongaría mucho
en un estudio transversal, por concepto). y su organización sería cara y complicada. Sin embargo, sí que lo son para
exposiciones raras, por las razones que exponemos en el comentario de
La respuesta falsa es la 1. Podrías llegar a esta conclusión de dos maneras: la pregunta 209.
• Por conocimientos teóricos, a partir de lo expuesto hasta ahora.
• Por sentido común. El enunciado te dice que hay una opción falsa, que
tienes que encontrar, por lo que también habrá cuatro correctas. Las P219 MIR 2008-2009
respuestas 2 y 3 dicen que, aparte de describir, pueden tener propósitos
analíticos (o, en otras palabras, investigar asociaciones). Por tanto, dicen Debes aprender a distinguir muy bien los estudios de cohortes de los de
lo mismo, y como no puede haber dos falsas a la vez, 2 y 3 son obligada- casos y controles. Es muy frecuente que intenten que los confundas. Es
mente ciertas. Teniendo en cuenta que se oponen a la 1 (dice que sólo la tercera pregunta sobre el mismo tema, en la misma convocatoria (ver
pueden estimar prevalencia), ésta debe ser necesariamente falsa. también preguntas 209 y 216, MIR 08-09).
A veces, en una misma convocatoria, un mismo concepto puede resolver De los diseños que nos ofrecen, deberíamos elegir uno que sea pros-
dos preguntas (a veces, incluso más). Te invitamos a enfrentarte a la pre- pectivo, experimental y aleatorio, siendo el ensayo clínico el que cumple
211
DESGLOSES
COMENTADOS MIR
estos requisitos y el que mayor grado de evidencia científica ofrece (res- en lo referente a su exposición a un AINE, comparando con la propor-
puesta 1, correcta). ción de exposición en personas que no han padecido infarto (controles).
Recuerda que, en este tipo de estudios, la medida de asociación es la
odds ratio (OR), mientras que en los de cohortes se emplea el riesgo re-
P199 MIR 2007-2008 lativo (RR).
Los estudios de cohortes y los casos y controles han sido muy pregunta-
dos. Esta pregunta es bastante representativa de las preguntas de esta-
dística y epidemiología de los últimos años.
Es una pregunta muy típica del MIR. Han preguntado varias veces ya
acerca de los estudios epidemiológicos y sus características. Recuerda
que en los estudios de casos y controles se parte de un grupo de indivi-
duos enfermos (casos) y otros comparables a ellos en todo sin la enfer-
medad (controles) –no es al azar– estudiando la exposición en ambos de
distintos factores de riesgo. En los estudios de casos y controles no pue-
des obtener información sobre la incidencia de la enfermedad, puesto
213
DESGLOSES
COMENTADOS MIR
P196 MIR 2005-2006 sana, el enfermo está más motivado para saber qué ha tomado en el pasado
que la persona sana. Cogiendo controles también enfermos, aunque sea por
Los estudios ecológicos han sido objeto de pregunta en el MIR precedente causas no relacionadas con el factor de estudio, conseguimos que todos los
y este año han vuelto a ser preguntados. En los estudios ecológicos de ten- pacientes en estudio estén igual de motivados en recordar antecedentes.
dencias temporales, la unidad de análisis son grupos de individuos, no indi-
viduos. En este estudio que nos describen precisamente sólo disponemos
de datos poblacionales, no individuales, acerca de la mortalidad por asma y P200 MIR 2005-2006
del consumo de cierto medicamento (opción 4 correcta). Permiten describir
diferencias en poblaciones que habrán de ser estudiadas con más detalle Se trata de una pregunta sencilla y clásica. Casi todos los años caen pre-
posteriormente. Su problema es que las medidas usadas son aproximadas guntas de este tipo. Nos dan información sobre el diseño de un estudio
de exposición y de enfermedad, lo que limita el valor de los hallazgos. epidemiológico y nos piden que identifiquemos a cuál corresponde. El
investigador pretende estudiar la relación entre distintos factores de ries-
go y la aparición de enfermedad; por tanto, se trata de un estudio ana-
P197 MIR 2005-2006 lítico. Esto nos permite descartar estudios descriptivos (opciones 3 y 4).
Vemos que el investigador desempeña un papel pasivo, puesto que no
Se trata de una pregunta muy repetida en el MIR y asequible, acerca de los ha decidido a qué factores de riesgo se van a exponer los participantes
tipos de estudios epidemiológicos. Hemos de saber reconocer de dónde ni el nivel de exposición. Tan sólo se limita a observar lo que ocurre a lo
parte el que ha diseñado el estudio y a dónde quiere llegar. Se recogen pa- largo del tiempo. Es, en consecuencia, un estudio de tipo observacional
cientes con hiperprolactinemia, es decir, enfermos (casos) y se aparean con (opción 2, incorrecta). Una vez llegados a este punto, sólo nos queda fi-
pacientes de su misma edad y sexo con EPOC, enfermedad cardiovascular jarnos en el criterio utilizado para la selección de los sujetos. En relación
y fracturas traumáticas (controles). En ambos grupos se investiga si han con esto, vemos que se han seleccionado en función del factor de riesgo,
consumido un neuroléptico, es decir, partimos de la enfermedad (hiper- estando todos sanos al inicio del estudio. En el seguimiento se pretende
prolactinemia) y buscamos el factor de riesgo en el pasado (neuroléptico). estudiar la aparición de enfermedad. La pregunta nos está describiendo
claramente un diseño de cohortes (opción 5 correcta).
Fíjate bien en cómo han elegido a los controles, se han apareado por edad y
sexo, y el hecho de que se hayan elegido pacientes con otras enfermedades
que la hiperprolactinemia (EPOC, enfermedad cardiovascular y fracturas) es P193 MIR 2004-2005
para evitar un sesgo frecuente de los estudios de casos y controles como
es el sesgo de memoria. Si se pregunta por antecedentes farmacológicos En esta pregunta nos plantean un estudio de carácter retrospectivo, don-
a un paciente con hiperprolactinemia y se toma como control una persona de vamos del efecto (enfermedad) a la causa. Como ves, partimos de un
Se trata de una pregunta ambigua, que según se interprete tiene dos op-
P195 MIR 2004-2005 ciones correctas posibles. En el enunciado te dice que se selecciona una
muestra de pacientes con bronquitis crónica y los asigna a tratamiento o
Los estudios de cohortes son longitudinales y prospectivos. Se basan en no tratamiento. Se trata por tanto de un estudio prospectivo en el que se
la comparación de dos grupos, uno de ellos expuesto a un factor de ries- estudian individuos (descartadas opciones 2 y 3).
go y el otro no. Se les sigue en el tiempo y se compara la diferencia que
existe respecto al desarrollo de enfermedad, es decir, se comparan las La respuesta correcta está entre las opciones 1 (estudio de cohortes) y la
incidencias. Esto es lo que hacen en el estudio que nos describen: selec- 4 (ensayo clínico), y elegir entre una y otra depende fundamentalmente
cionan personas basándose en su exposición a factores de riesgo, y los de si ha habido aleatorización o no en la asignación de tratamiento.
reevalúan cada dos años (prospectivo), comparando cuántos desarrollan
la enfermedad (incidencia). El truco de esta pregunta está en el enunciado, donde nos indican que
estamos hablando de pacientes “en la práctica (clínica) habitual”. Es decir,
Ten cuidado: no se trata de un ensayo clínico, dado que no es el investi- los corticoides por vía inhalatoria se han pautado o no, en función de las
gador el que decide qué sujetos se exponen y cuáles no, sino los propios indicaciones de cada paciente, no al azar. Esto descarta el ensayo clínico
participantes. Es decir, el estudio de cohortes es observacional. Si fuera y nos deja al estudio de cohortes (respuesta 1) como opción correcta.
el investigador el que asignase quién se expone y quién no, sería expe-
rimental.
P132 MIR 2003-2004
P200 MIR 2004-2005 Pregunta difícil sobre diseños epidemiológicos. Un ensayo clínico se ca-
racteriza porque el investigador introduce el factor de estudio y lo asigna
Los estudios experimentales son aquellos en los que el investigador asig- a uno y otro grupo de pacientes. Aparentemente, esta pregunta corres-
na el factor de estudio (por ejemplo, qué fármaco o vacuna, cuánta dosis, pondería a un ensayo clínico, sin embargo, el investigador no introduce el
cuánto tiempo…). Por el contrario, en un estudio observacional se limi- factor de estudio, sino que identifica un grupo de pacientes ya tratados.
taría a estudiar lo que sucede en un grupo de individuos que se exponen Es decir, hay un grupo expuesto y uno no expuesto, por lo que en realidad
por sí mismos. se trata de un estudio prospectivo no experimental (estudio de cohortes).
215
DESGLOSES
COMENTADOS MIR
El estudio en el que, partiendo de un grupo de individuos enfermos (ca- nada realmente representa al conjunto de la población, aumentando la
sos) y de otros comparables a ellos en todo, pero que no tienen la enfer- validez externa.
medad (controles), se determina la exposición, en el pasado, a distintos
factores de riesgo, se llama estudio de casos y controles.
P194 MIR 2013-2014
Se trata, pues, de un estudio observacional (no hay asignación del factor
de estudio por el investigador) y longitudinal (buscamos el posible factor Un sesgo de memoria (opción 2) se observa de manera frecuente en los
de riesgo en el pasado). estudios retrospectivos, donde se pregunta por el antecedente de ex-
posición a un factor de estudio en un periodo de la vida, existiendo la
Las ventajas del estudio de casos y controles son: posibilidad de olvido de esa exposición. El hecho de haber padecido la
• Es de corta duración. enfermedad, en este caso una malformación neonatal, hace que el sujeto
• Es bueno para el estudio de enfermedades raras. esté más predispuesto a recordar esa exposición, mientras que el grupo
• Es útil para el estudio de enfermedades de largo periodo de inducción. control no tanto.
• El coste es bajo.
• Es bueno para el estudio de la multicausalidad de la enfermedad (los
posibles factores de riesgo de una determinada enfermedad). P196 MIR 2013-2014
• Es el mejor para formular nuevas hipótesis etiológicas.
Un sesgo o factor de confusión es un factor de riesgo que se relaciona
Tiene la desventaja de que es más vulnerable a sesgos (de ahí que su con el factor de estudio y, a su vez, con la enfermedad. En este caso, una
nivel de evidencia científica sea bajo en comparación con otros, como los posible asociación de tabaco y cáncer de páncreas, así como de consumo
de cohortes o los ensayos clínicos). de tabaco y de alcohol, puede ser causa de un sesgo de confusión si no
te tiene en cuenta. Para controlar los factores de confusión podemos rea-
lizar técnicas de apareamiento, aleatorización, restricción, análisis multi-
P141 MIR 2003-2004 variante y estratificación.
La validez interna está relacionada con la metodología del estudio y el P181 MIR 2011-2012
control de los errores en el diseño de éste. Por otro lado, la validez ex-
terna está relacionada con la generalización de los hallazgos más allá de La validez interna estudia el grado en el que los resultados de un estu-
los sujetos del estudio, del contexto de investigación y del momento del dio representan correctamente a la muestra que se estudia. Por tanto,
experimento. Unos criterios de inclusión y exclusión estrictos hacen que la ausencia de sesgos. Hablamos de validez interna cuando tenemos
aumente la validez interna de mi estudio, siendo un estudio explicativo controlados de manera razonable los sesgos que es lo que dice la op-
(opción 1). El problema que tiene realizar esto es que resulta difícil extra- ción 2.
polar los resultados a la población general, es decir, tener validez exter-
na. Los estudios con criterios de inclusión laxos, estudios pragmáticos,
aumentan la validez externa (opción 2). La utilización de técnicas de en- P174 MIR 2010-2011
mascaramiento, control con grupos o introducción de nuevas variantes
del mismo fenómeno permiten confirmar la consistencia del fenómeno Pregunta fácil que se contesta sin problemas conociendo los Desgloses.
estudiado (validez interna, opciones 3 y 4). De la misma manera, la asig- Hay fundamentalmente dos tipos de error: los errores aleatorios, que
nación aleatoria de los grupos de tratamiento controla la posibilidad de son debidos al azar y se corrigen aumentando el tamaño muestral, y los
error y aumenta la validez interna (opción 5). No debes confundirlo con errores sistemáticos o sesgos, que no se deben al azar y, por tanto, no se
la selección aleatoria de la muestra, que intenta que la muestra seleccio- corrigen aumentando el tamaño muestral.
Se puede controlar en la fase de diseño mediante aleatorización, apa- P234 MIR 2010-2011
reamiento o emparejamiento (respuesta 3, correcta) y restricción. Y en
la fase de análisis estadístico, mediante análisis estratificado y multi- Pregunta fácil del tema más recurrente del examen. Para el control de los
variante. De esto se deduce que las respuestas 4 y 5 son claramente errores sistemáticos o sesgos, se dispone de una serie de técnicas como
falsas. la aleatorización o el enmascaramiento. En concreto para evitar la false-
dad sobre la valoración subjetiva de los efectos del fármaco problema
P174 (MIR 10-11) Tipos de error enmascaramos la información al paciente, lo que sería simple ciego, o al
paciente y al médico lo que sería doble ciego. No hay que confundir con
AFECTA
SOLUCIÓN los errores aleatorios que se controlarían aumentando el tamaño mues-
CARACTERÍSTICAS A LA VALIDEZ
O CONTROL
INTERNA tral.
· Simétrico
· Incorregible
Error
· Impredecible NO ↑ tamaño muestral P198 MIR 2008-2009
aleatorio
· Estimable por
estadística Tal como se explica en la respuesta 1, si la mortalidad es mayor por otras
· Sesgo de selección: razones distintas al factor de estudio, esto reduce las posibilidades de
Aleatorización sufrir el evento de interés (arritmias y muertes por causas cardíacas). Por
· Asimétrico · Sesgo de clasificación:
este motivo, un menor número de eventos en el grupo experimental po-
· Corregible Enmascaramiento
Sesgo dría no deberse a la eficacia del tratamiento, ya que existe una mayor
· Predecible · Factor de confusión:
o error SÍ
sistemático · Prevención Aleatorización probabilidad de fallecer por otras causas, disminuyendo en apariencia el
y control Apareamiento número de muertes por causas cardíacas. Por otra parte, en la convoca-
por epidemiología Restricción
Estratificación toria del MIR 02-03, apareció una pregunta prácticamente idéntica (pre-
Análisis multivariante gunta 43), con una respuesta correcta que apoya el argumento citado, y
que coincide textualmente con la respuesta 1.
217
DESGLOSES
COMENTADOS MIR
P201 MIR 2007-2008 • Análisis por protocolo, donde se incluye sólo a aquellos pacientes que
han cumplido los requisitos de protocolo y/o han finalizado el estudio.
Los tipos de error son un motivo de pregunta muy reiterado en el exa- • Análisis por intención de tratar, donde se incluye a todos los pacien-
men MIR. Presta especial atención a este tema, si has fallado esta pre- tes, aunque no hayan finalizado el estudio o hayan cambiado de
gunta. En este caso, deberías haber identificado de qué tipo de error nos grupo. El análisis por intención de tratar pretende controlar las pér-
están hablando: el sesgo de información. didas que se puedan ocasionar a lo largo del estudio para mantener
la aleatoriedad. Ten en cuenta que el problema que se plantea con la
El sesgo de información se manifiesta cuando existe un error sistemático aleatorización está en la resistencia de los sujetos a ser manejados de
en la medición de alguna variable clave del estudio. La clasificación in- una forma tan impersonal. No es raro que no acepten participar en el
correcta puede afectar, de igual manera, a todos los grupos del estudio estudio y soliciten que les sean administrados los tratamientos más
o no. La forma de protegernos frente a este tipo de error son las técni- modernos o aquellos en los que el médico tenga mayor confianza.
cas de enmascaramiento (recuerda que éstas no sirven para prevenir los
factores de confusión, detalle que ya han preguntado en el MIR). Dentro
de los sesgos de información o clasificación, cabe distinguir dos grandes P208 MIR 2004-2005
grupos:
• Clasificación incorrecta diferencial: la probabilidad de clasificación Un factor de confusión es una variable ajena al estudio que nos modifi-
errónea de la exposición (en estudios de casos y controles) afecta de ca los resultados obtenidos. En este caso, estábamos estudiando alcohol
manera desigual a sanos y enfermos. También puede verse en estu- y cáncer de esófago. Más tarde, el investigador se ha dado cuenta de
dios de cohortes, cuando la clasificación de un individuo como enfer- que los pacientes que toman alcohol también fuman más, puesto que
mo o no enfermo se hace de manera distinta, según se esté expuesto el tabaco y el alcohol son hábitos que se asocian, etc. ¿Quién produce el
o no al factor de estudio. En este tipo de sesgo, puede darse tanto cáncer de esófago en realidad, el alcohol o el tabaco? Esto es lo que se
una subestimación como una sobreestimación del efecto del factor conoce como factor de confusión. Ha de cumplir tres condiciones:
de exposición en la enfermedad. Pertenecen a este grupo el sesgo • Ser un factor de riesgo para la enfermedad (el tabaco lo es, ya sabes
de memoria y el de Hawthorne (ver Manual CTO de Epidemiología y que se asocia al cáncer de esófago).
Estadística). • Estar relacionado con la exposición que estamos estudiando (tabaco
• Clasificación incorrecta no diferencial: la probabilidad de clasifica- y alcohol se asocian).
ción errónea ocurre en todos los grupos de forma similar. La conse- • No ser un paso intermedio entre la exposición y la enfermedad (ob-
cuencia sería una infraestimación del factor de exposición estudiado viamente, entre el alcohol y el cáncer de esófago no está, como paso
en la enfermedad. intermedio, el fumar).
La opción 2 es falsa, puesto que cuando utilizamos un control histórico En esta pregunta, se pide elegir un diseño de EC para estudiar la eficacia
(grupo de similares características, pero de una época anterior), lógica- de un citostático, y también la eficacia de un citostático con un anticuer-
mente los cuidados recibidos no van a ser iguales, al comparar grupos po asociado. Tanto en el diseño cruzado como en el paralelo, sólo podría-
de épocas distintas. En consecuencia, para evitar este sesgo hemos de mos comparar dos ramas, el efecto del fármaco respecto al control o el
comparar grupos concurrentes. efecto del fármaco + anticuerpo respecto al control, pero no el efecto de
cada uno por separado y entre ellos (respuestas 1 y 2, falsas). El único di-
A la hora de realizar el análisis de los resultados en un ensayo clínico (EC), seño que permite tener varias ramas y comparar entre ellas es el factorial
podemos realizar dos tipos de análisis: (respuesta 3, correcta).
Los ensayos clínicos en fase I buscan estudiar datos relacionados con la El estudio que nos describen es un estudio experimental, ya que es el
farmacocinética y la farmacodinámica del fármaco (respuesta 1, falsa), investigador el que aplica el factor a estudio (tratamiento) (respuestas
por lo que suelen realizarse en voluntarios sanos (respuesta 2, falsa), aun- 1 y 5, falsas). Además, es un estudio experimental puro, ya que forma
que en determinadas circunstancias se realizan en pacientes (respuesta 3, los grupos con una aleatorización individual. Se trata, por tanto, de un
falsa). Como lo que se quiere es estudiar cómo se comporta el fármaco ensayo clínico aleatorizado, que siempre es prospectivo. Los estudios
en el cuerpo humano, no se necesita comparar entre grupos, sólo medir postautorización (poscomercialización de un fármaco) pueden ser expe-
cantidad de fármaco en sangre. Por eso, no se suelen hacer grupos con- rimentales u observacionales, siendo mucho más frecuentes estos últi-
trol ni con enmascaramiento (respuesta 5, falsa) y no son aleatorizados mos (respuestas 2 y 3, falsas).
(respuesta 4, correcta).
219
DESGLOSES
COMENTADOS MIR
ser una muestra no muy grande, no tienen una gran duración (opciones P188 MIR 2012-2013
4 y 5). En ocasiones aportan datos preliminares sobre la eficacia (fase IIb).
El “análisis por intención de tratar” es el que incluye a todos los pacientes
que han sido seleccionados y en el grupo en que fueron asignados aun-
P204 MIR 2013-2014 que no hayan finalizado el estudio o hayan cambiado de grupo (respues-
ta 4, correcta). Cuando el análisis de los resultados incluye sólo a los que
Los ensayos clínicos de eficacia corresponden a estudios de desarro- han cumplido los requisitos del protocolo y/o han finalizado el estudio se
llo de medicamentos en fase III. Se realizan sobre pacientes con unas conoce como “análisis por protocolo”.
ciertas características clínicas que hemos definido en la fase de planifi-
cación (criterios de inclusión y exclusión), y en función de ello nuestros
resultados se aplicarán a pacientes con esas características (opción 1). P189 MIR 2012-2013
Se realizarán con un grupo control, el cual recibirá el tratamiento están-
dar si éste existe, o el placebo si no (opción 2). La eficacia se medirá en Un ensayo clínico es un estudio prospectivo y experimental en que la
función de la patología estudiada; en el caso de la depresión, la mejoría muestra se divide aleatoriamente en dos grupos (respuesta 5, correcta)
en escalas clínicas (opción 3), y según el fármaco se realiza un segui- que difieren en la intervención terapéutica que van a recibir. El grupo
miento de varias semanas para asegurar la consistencia de los resul- control puede recibir placebo pero siempre que exista un tratamiento
tados (opción 5). En los estudios de no inferioridad se deberá alcanzar eficaz, debe administrarse este (respuesta 2, correcta). Inicialmente los
un valor de respuesta clínica (valor delta) para considerar los fármacos criterios de inclusión al estudio son más estrictos y se lleva a cabo en
equivalentes terapéuticos. La variabilidad de la respuesta influirá en adultos, en fases posteriores los criterios son más laxos y se incluyen
el tamaño muestral y, por tanto, en la significación estadística, pero si muchos más pacientes y posteriormente, si procede, en ancianos y ni-
el estudio está bien diseñado y ejecutado, las diferencias observadas ños (respuesta 4, correcta). Para evitar sesgos en la intervención es im-
serán válidas. portante utilizar técnicas de enmascaramiento (simple, doble o triple
ciego) (respuesta 3, falsa). Hay diferentes tipos de ensayos clínicos, uno
de ellos es el diseño cruzado en que un mismo paciente va a recibir
P206 MIR 2013-2014 los dos tratamientos incluyendo un periodo de blanqueo entre ellos.
Estos diseños pueden emplearse cuando se trata de una enfermedad
El metaanálisis tiene dos objetivos: realizar una revisión sistemática de crónica (respuesta 1, correcta) puesto que de ser aguda se resolvería
los estudios sobre un tema, y, además, realizar una combinación esta- o mejoraría mucho con el primer tratamiento y no se podría valorar el
dística de los resultados de los mismos. La primera implica la tarea de segundo.
seleccionar los resultados de todos los estudios que cumplen los criterios
que nos hemos propuesto, independientemente de su resultado, para no
llevar a cabo un sesgo de publicación (opciones 2 y 3, incorrectas). La se- P190 MIR 2012-2013
gunda parte incluye combinar de una manera cuantitativa los resultados
heterogéneos a partir de la aplicación de pruebas estadísticas (opción Un ensayo clínico es por definición un estudio experimental (respuesta 2,
1, correcta). En ocasiones nos ayudamos de una representación gráfica incorrecta). En la fase II el principal objetivo es evaluar la relación dosis/
que manifieste la variabilidad entre estudios, conocida como “diagrama respuesta (respuestas 3, 4 y 5, incorrectas) y esta se lleva a cabo en gru-
de bosques”. Al ser una combinación de estudios, su potencia estadística pos de 100-200 pacientes.
nunca superará la de los estudios en los que se basa, e incluirá sus errores
metodológicos (opciones 4 y 5, incorrectas).
P191 MIR 2012-2013
P180 MIR 2012-2013 En un ensayo clínico se distinguen 4 fases (I, II, III, IV) cada una de ellas
con unas características. En la fase I es la primera vez que el fármaco se
El ensayo clínico aleatorizado es el que da más evidencia y tiene menos prueba en humanos y generalmente son voluntarios sanos (n = 20-80),
sesgos. en la fase II ya se administra en pacientes pero a un grupo reducido.
Cuando en el estudio se incluye un número de pacientes mayor y se pre-
tende alcanzar el registro del medicamento entonces se trata de un en-
P187 MIR 2012-2013 sayo clínico fase III (respuesta 4). La fase IV tiene lugar una vez el fármaco
ya ha sido comercializado.
Un ensayo clínico es enmascarado cuando se emplean técnicas de ciego
(simple, doble o triple) para evitar sesgos. De lo contrario se dice que es
abierto (respuesta 1 y 3, incorrectas). Cuando sólo es el paciente el que P194 MIR 2012-2013
desconoce el grupo al que está asignado es simple ciego (respuesta 4,
incorrecta), si es el paciente, personal sanitario y evaluador doble ciego El metaanálisis es un análisis estadístico que combina los resultados de
(respuesta 5, correcta) y si además también lo desconoce el analista triple varios ensayos clínicos independientes que el analista considera que se
ciego (respuesta 2, incorrecta). pueden combinar (respuesta 3 y 5, incorrectas). Los principales proble-
De todos los diseños planteados, el ensayo clínico (opciones 1 y 5) cons- Las técnicas de ciego o enmascaramiento sirven para evitar algunos ti-
tituye aquél que arroja una mejor evidencia científica. En la opción 1 se pos de sesgos en los ensayos clínicos. Cuando se realiza “simple ciego”,
plantea un ensayo no cegado controlado con placebo y no se hace re- es el paciente el que no conoce la medida terapéutica que va a recibir.
ferencia a la aleatorización mientras que en la opción 5 se describe un Cuando se habla de “doble ciego”, no lo conoce tampoco el médico que
buen ensayo clínico aleatorizado, enmascarado y comparado con el tra- administra el tratamiento. En aquellos casos en los que no se realizan las
tamiento existente para la indicación a testar. técnicas de ciego, se dice que el ensayo clínico es abierto.
La aleatorización estratificada (opción 2) clasifica los sujetos de estudio En enfermedades infecciosas en las que la eficacia del fármaco se mide
en diferentes estratos o categorías según determinados criterios pronós- por la curación o no (erradicación o no de la infección), sólo se pueden
ticos conocidos antes de la asignación aleatoria, criterios que se consi- realizar ensayos clínicos paralelos. No podríamos administrar un segun-
deran generalmente variables de interés en el diseño que se plantea. do fármaco como ocurre en el ensayo clínico cruzado, cuando ya hemos
Los pacientes de cada categoría son asignados de forma independiente curado la infección con el primer fármaco. Nos quedaríamos entonces
a cada brazo del estudio mediante un procedimiento de aleatorización con las opciones 2 y 3. Entre ambas, la aleatorización y el enmascara-
propio, consiguiendo de esta manera que los grupos contengan apro- miento hacen que el ensayo clínico sea mejor al minimizar la probabili-
ximadamente el mismo número de sujetos en cada gradiente definido. dad de sesgos y aumentar en consecuencia la validez interna.
Antes de la ejecución de un ensayo clínico en cualquier centro de nues- En estudios que comparan dos fármacos conocidamente efectivos para una
tro país, es necesaria la emisión de un informe favorable desde el Comité patología, el enmascarmiento puede ser mantenido mediante el uso de dos
Ético de Investigaciones Clínicas (CEIC). El Comité Ético de Investigación placebos, método conocido como doble simulación. En esta situación el pa-
Clínica ponderará los aspectos metodológicos, éticos y legales del pro- ciente recibe “dos pastillas”. Un grupo recibe el fármaco activo 1 y el placebo
tocolo propuesto, así como el balance de riesgos y beneficios. Para ello, del fármaco 2. El otro grupo recibe el fármaco activo 2 y el placebo del 1.
evaluará la idoneidad del protocolo en relación con los objetivos del es-
tudio, su eficiencia científica (la posibilidad de alcanzar conclusiones vá-
lidas, con la menor exposición posible de sujetos) y la justificación de los P200 MIR 2011-2012
riesgos y molestias previsibles, ponderadas en función de los beneficios
esperados para los sujetos y para la sociedad. Según la regulación de la Unión Europea, dos fármacos son bioequiva-
lentes si su biodisponibilidad tras la administración de la misma dosis
Evaluará también la idoneidad del equipo investigador para el ensayo molar es tan parecida que su eficacia y seguridad, son prácticamente
propuesto, teniendo en cuenta su experiencia y capacidad investigadora idénticas. A estos efectos, se considera que la biodisponibilidad queda
para llevar adelante el estudio, en función de sus obligaciones asistencia- demostrada cuando los intervalos de confianza del 90% del área bajo la
les y de los compromisos previamente adquiridos con otros protocolos curva (AUC0-t) y la concentración máxima (Cmax) de los dos preparados
de investigación. están comprendidos dentro del intervalo 80-125%.
221
DESGLOSES
COMENTADOS MIR
que el resultado obtenido en distintos estudios siempre es el mismo, por tenidamente nos daremos cuenta de que es relativamente fácil dar con
ejemplo, si estamos comparando dos fármacos para evaluar su eficacia la respuesta falsa.
frente a una patología, todos los estudios nos marcan que el fármaco A es
mejor que el B, sean cuales sean las diferencias obtenidas en los resultados Las respuestas 1 y 2 dicen prácticamente lo mismo, que ninguno de los
particulares de cada estudio. En este caso nos encontraríamos ante unos dos tratamientos es superior al otro (realmente deberían haber puesto
resultados homogéneos, si no fuese así, serían heterogéneos, obteniendo que eran no-inferiores, pero bueno…). La respuesta 3 es correcta, ya
mayor precisión en los primeros. Cuando hay homogeneidad se puede em- que, al incluir el IC el uno, ese 1,18 que supera a la unidad se compor-
plear un modelo de efectos fijos, mientras que si no la hay, deberíamos usar ta como un factor de riesgo, aunque este tipo de estudio no busque
uno de efectos aleatorios. Sólo con esto podríamos llegar a la conclusión de confirmar ni descartar este hecho. La respuesta 4 es también correcta,
que las respuestas 1 y 4 son falsas y que la correcta es la respuesta 3. puesto que se cumple la condición que especifican al principio de la
pregunta “el fármaco experimental será no-inferior al fármaco control
Respecto a la 2, el sesgo de publicación se refiere a que sólo llegan a ser si el límite superior del IC del RR para la variable principal (infarto de
publicados aquellos estudios en los que los resultados son concluyentes miocardio) no supera el 1,20” y, efectivamente, no lo supera ya que es
y beneficiosos para el investigador, mientras que la 5 es completamente de 1,18.
falsa ya que el metanálisis busca justo lo contrario, una mayor precisión
al juntar todos los estudios, trabajando con una muestra más grande. Lo más “fácil” de esta pregunta era darse cuenta de que la respuesta 5
es claramente falsa, para demostrar la equivalencia de dos tratamientos,
es necesario utilizar un estudio de bioequivalencia, que no tiene nada
P182 MIR 2010-2011 que ver con el tipo de estudio del que nos están hablando en el enuncia-
do de la pregunta.
Pregunta fácil sobre un tema fundamental: el ensayo clínico. La respuesta 2
es la correcta, ya que la aleatorización consiste en asignar por azar, sin que
influya ningún factor, los pacientes de la muestra a los dos grupos de inter- P197 MIR 2010-2011
vención. De este modo, si el tamaño muestral es suficientemente grande,
se consigue una distribución homogénea de las variables predictoras en Las fases del ensayo clínico se preguntan con frecuencia en el exame MIR.
ambos grupos, permitiendo su comparación. El doble ciego y el triple cie- No puedes permitirte fallar una pregunta como esta.
go (respuestas 1 y 5, incorrectas) hacen referencia a dos tipos de enmasca- • Fase I. Se realiza normalmente en pacientes sanos. Es un estudio de
ramiento mediante los que se pretende evitar el sesgo de cointervención, toxicidad, es decir, se estudia la tolerabilidad del fármaco en estudio
es decir, que tanto investigadores como otros proveedores de cuidados (respuesta 1, correcta).
traten de forma diferente a los dos grupos de intervención. El análisis por • Fase II. Se introducen pacientes enfermos, estudiándose la relación
intención de tratar (respuesta 4, incorrecta) hace referencia a una forma de dosis-respuesta, para delimitar el intervalo de dosis terapéutica más
análisis de resultados, no a la comparabilidad de los grupos de estudio. El adecuado.
tamaño muestral (respuesta 3, incorrecta) indica el número aproximado • Fase III. Es el modelo típico de ensayo clínico, donde se compara con
de sujetos para detectar una diferencia determinada, si existe, con unos otra alternativa, si existe, o con placebo.
márgenes de error previamente definidos, teniendo que ser suficiente • Fase IV. Estudios poscomercialización (farmacovigilancia).
para obtener un IC del 95% de la eficacia, cuyos límites sean clínicamente
relevantes, por lo que no influye en la comparabilidad de los grupos.
P184 MIR 2009-2010
P186 MIR 2010-2011 Los estudios analíticos son aquellos que intentan establecer una relación
de causalidad entre un factor de riesgo y una enfermedad. A su vez, se
Pregunta de extrema dificultad sobre un tema no preguntado hasta aho- pueden clasificar en experimentales y observacionales.
ra en el examen MIR. No os preocupéis si la habéis fallado.
En los estudios experimentales es el investigador el que asigna el factor
CONSORT es el acrónimo de CONsolidated Standards Of Reporting Trials de estudio (qué fármaco, vacuna, campaña de educación... cuánto tiem-
(estándares consolidados de comunicación de ensayos). El objetivo de po, cuándo, cuánta dosis recibirán los individuos...) mientras que en los
CONSORT ha sido elaborar recomendaciones para que la publicación de observacionales, el investigador se limita a observar qué es lo que suce-
ensayos clínicos sea más completa y comprensiva. Estas recomendacio- de en un grupo de individuos, sin manipular el estudio.
nes se traducen en una lista de comprobación o de verificación (check-
list) y un diagrama de flujo (flow-diagram) (respuesta 1, correcta). Si lees con atención el enunciado de esta pregunta, lo que realmente
te están pidiendo es que señales, entre las cinco opciones, cuál corres-
ponde a un diseño experimental. La respuesta correcta sería el ensayo
P193 MIR 2010-2011 clínico, donde es el investigador quien decide todas estas cuestiones. El
resto de las opciones hacen referencia a diversos tipos de estudios obser-
Una pregunta aparentemente difícil porque trata acerca de un estudio vacionales, donde el investigador se limita a estudiar lo que sucede, pero
que no es muy preguntado en el examen MIR, pero si la analizamos de- no interviene en la asignación del factor de estudio.
La mayoría de los ensayos clínicos tratan de evaluar la posible superio- P191 MIR 2009-2010
ridad de una actuación con respecto a otra. Son los llamados ensayos
clínicos de superioridad. Sin embargo, en otras ocasiones, el investiga- Una pregunta bastante sencilla. Basta el sentido común para descartar la
dor da por hecho que un nuevo tratamiento no es inferior a otro clásico mayor parte de las opciones:
en cuanto a su eficacia o efectividad, pero puede tener otras ventajas • El consentimiento informado, en un estudio de este tipo (ensayo clí-
(menor toxicidad, posología más cómoda, etc.), por lo que puede ser nico), debe recogerse por escrito en todos los casos, lo que hace falsa
preferible utilizarlo. En estos casos se plantean estudios de equivalencia la opción 3.
absoluta o, al menos, de no-inferioridad. • En todo ensayo clínico es necesario seguir las normas de buena prác-
tica clínica. En la respuesta 5 sugieren que éstas no son necesarias en
Para establecer la no-inferioridad de un fármaco debemos poner unos lími- un estudio de bioequivalencia, lo que obviamente sería falso.
tes, dentro de los cuales una diferencia sería considerada como demasiado • Un ensayo clínico, sea cual sea el número de pacientes, debe some-
pequeña o irrelevante. Estos límites deben estar claramente delimitados des- terse a consideraciones éticas (respuesta 2, falsa).
de la fase de diseño, es decir, antes de comenzar el estudio. Esto es, ni más ni
menos, lo que se describe en el enunciado de esta pregunta. Se establece un Llegar hasta aquí es relativamente fácil. Lo único que debemos saber para
límite clínicamente relevante de hasta un 3% y, comparando ambos trata- responder esta pregunta es lo siguiente. ¿Quién tiene que autorizarlo, la
mientos, la diferencia que se objetiva es de un 1%. Por lo tanto, al estar dentro Agencia Española de Medicamentos o el Comité Ético del hospital…?
de este límite (límite delta), la conclusión del estudio sería la respuesta 4: el
fármaco experimental es no-inferior con respecto al fármaco control. La respuesta correcta es la 4. Aunque un ensayo clínico se realice en un
solo centro, el informe favorable del Comité Ético de ese hospital no es
suficiente.
P189 MIR 2009-2010
Una pregunta de dificultad media-baja. Aunque tuvieses dudas con las P192 MIR 2009-2010
cuatro primeras opciones, lo que se explica en la respuesta 5 es la defini-
ción perfecta del objetivo de la asignación aleatoria. Una pregunta de dificultad media sobre los ensayos clínicos. La respues-
ta falsa es la 2. Para darte cuenta deberías haber reparado en la palabra
La asignación aleatoria, propia de los estudios experimentales, tiene la “efectividad”. Recuerda que “eficacia” y “efectividad” no son lo mismo, en
ventaja de que permite distribuir por igual las diferentes variables que absoluto…
223
DESGLOSES
COMENTADOS MIR
• La eficacia hace referencia a lo que sucede en condiciones ideales o • Fase II: estudia fundamentalmente la relación dosis-respuesta, es
experimentales. decir, trata de delimitar el intervalo óptimo de dosis. Puede ofrecer
• El término efectividad está en relación con lo que ocurre en la prác- cierta información preliminar sobre la eficacia del fármaco, pero éste
tica. no es su verdadero propósito.
• Fase III: evaluación, como tal, de la eficacia del fármaco. Suele com-
En un ensayo clínico, lo que mejor se evalúa es la eficacia del tratamien- parar con otro fármaco de eficacia ya demostrada, o frente a pla-
to, ya que están realizados bajo unas condiciones más o menos estric- cebo.
tas (respuesta 2, falsa). En algunos casos puede evaluarse la efectividad • Fase IV: estudios post-comercialización.
(ensayos clínicos pragmáticos), pero esto no es lo habitual. En cualquier
caso, no deberías haber confiado en una respuesta tan restrictiva. La pa- Las opciones 1 y 2 (validez externa, pacientes similares a la práctica ha-
labra “específicamente” es prácticamente lo mismo que decir “sólo”, “de bitual) harían referencia a un ensayo en fase III de tipo pragmático, o in-
forma exclusiva”, etcétera. cluso en fase IV, pero nunca en fase I, donde lo habitual es emplearlo en
sujetos sanos. Respecto a la opción 4, la realidad es justamente la con-
El resto de las respuestas son claras y correctas. traria: los que más se prolongan son los de fases posteriores. Por último,
la respuesta 5 miente al decir que no existen límites en el número de
pacientes. De hecho, en las primeras fases, el tamaño muestral suele ser
P193 MIR 2009-2010 menor que más adelante.
El objetivo de este estudio es confirmar o rechazar la efectividad del tra- El metaanálisis de ensayos clínicos aleatorizados y controlados es el estu-
tamiento en este paciente en particular. Resulta obvio que, si se realiza dio más riguroso y de mayor evidencia científica. Como dice la respuesta
sobre un solo paciente, no se le podrá exigir a este tipo de diseño que 4, presenta de forma estructurada los resultados de los distintos estudios
sea generalizable al resto de la población (respuesta 1, correcta). Existen que incluye. Al combinar estadísticamente los datos de varios estudios,
diversas variantes que incluirán propiedades como la aleatorización o el la evidencia que aporta es mayor que la de éstos por separado. El metaa-
doble enmascaramiento, como ocurre en el resto de los ensayos clínicos. nálisis de ensayos clínicos aleatorizados y controlados es el estudio más
riguroso y de mayor evidencia científica. Después, vendrían los ensayos
En el ensayo clínico convencional la unidad de estudio es el individuo, que clínicos.
puede haber sido asignado a un grupo u otro, de forma aleatoria. Sin em-
bargo, en el ensayo n=1 lo que se aleatoriza son periodos de seguimiento,
comparándose por pares. En cada periodo recibe un tratamiento (o place- P200 MIR 2008-2009
bo, en su caso), comparándose sus efectos sobre este único paciente.
El ensayo clínico es uno de los temas más preguntados en el examen MIR.
El objetivo de este tipo de diseño es diferente al del ensayo clínico habi- Tal como decimos en la pregunta 195 de esta misma convocatoria, este
tual. Se trata de saber si una intervención es más efectiva que otra, en ese tipo de estudios pasan por diferentes fases:
enfermo en particular (respuesta 3). Por supuesto, antes de realizar este • Fase I: se trata de un estudio de toxicidad, habitualmente en volun-
tipo de ensayo clínico tiene que haber un mutuo acuerdo entre médico y tarios sanos.
paciente. Para valorar los resultados, ambos tendrán que conocer cuáles • Fase II: estudia fundamentalmente la relación dosis-respuesta, es
son los criterios de evaluación (respuesta 4). Además, habrá una serie de decir, trata de delimitar el intervalo óptimo de dosis. Puede ofrecer
criterios para detenerlo en cualquier momento, que podrán ser supervi- cierta información preliminar sobre la eficacia del fármaco, pero éste
sados por una tercera persona (respuesta 5). no es su verdadero propósito.
• Fase III: evaluación, como tal, de la eficacia del fármaco. Suele com-
parar con otro fármaco de eficacia ya demostrada, o frente a placebo.
P195 MIR 2008-2009 • Fase IV: estudios post-comercialización.
Antes de comercializar un fármaco, un ensayo clínico pasa por unas fases Las propiedades farmacocinéticas (opción 1) se estudiarían en la primera
bien diferenciadas: fase. La eficacia, en fase III (respuesta 2). El perfil de seguridad, en fase
• Fase I: se trata de un estudio de toxicidad, habitualmente en volun- I (opción 4). La determinación de la dosis, en fase II (respuesta 4). Sin
tarios sanos, donde se estudian los parámetros mencionados en la embargo, el patrón de prescripción habitual no es materia del ensayo
opción 3. clínico, sino más bien de estudios de farmacoepidemiología, que podrían
P212 MIR 2008-2009 Sin embargo, la opción 4 tiene poca o ninguna importancia. La inclusión
del mismo número de sujetos en todos los centros participantes, si son
En función de los criterios de inclusión, podemos dividir los ensayos clí- iguales en cuanto al resto de sus características, no debería cuestionar la
nicos en dos grandes grupos: validez del estudio.
225
DESGLOSES
COMENTADOS MIR
P204 MIR 2007-2008 se desprende un mayor nivel de evidencia científica es el ensayo
clínico.
El proceso de aleatorización se fundamenta en asignar por azar los pa- • Respuesta 5: el ensayo cruzado se basa en que un mismo paciente
cientes de la muestra a los dos grupos de intervención. De esta forma, va a recibir dos tratamientos, que van a ser comparados entre sí.
si el tamaño muestral es lo suficientemente grande, se consigue una Lógicamente, los recibe en dos momentos distintos, primero uno y
distribución homogénea de las variables predictoras en ambos grupos. después el otro. Cada paciente sirve de control a sí mismo, lo cual
Existen diversas formas de realizarla (simple, por bloques, estratifica- reduce la variabilidad intragrupal. Esto consigue un control perfecto
da…). La aleatorización sirve para protegernos de dos tipos de errores de los factores pronósticos como el sexo, la raza, etc. Asimismo, tiene
sistemáticos, que son el sesgo de selección y el factor de confusión. Tie- la ventaja de precisar un menor tamaño muestral, al compararse cada
nes que tener muy claro que, a pesar de su nombre, NO nos protegerá paciente consigo mismo. Sin embargo, esto implica un inconvenien-
frente al error aleatorio (esto se consigue incrementando el tamaño te: las pérdidas también influirán más que en un ensayo clínico con
muestral). diseño paralelo.
Aunque el objetivo es garantizar la homogeneidad de las variables predic- La respuesta incorrecta es la 3. Los análisis intermedios se realizan du-
toras antes de realizar la comparación, no nos asegura totalmente que es- rante las fases III y IV del estudio. Están justificados para evitar que los
temos exentos de los errores de los que intenta protegernos (respuesta 4, pacientes del grupo control no se beneficien del tratamiento, en caso
falsa). de que sea eficaz. No obstante, realizar muchos análisis intermedios au-
menta la probabilidad de cometer un error tipo I, de modo que ha de
estar previsto en el protocolo del estudio y debe haber una penalización
P205 MIR 2007-2008 estadística porque al realizarse múltiples comparaciones aumenta el
riesgo de que, en alguna de ellas, se detecten diferencias que realmen-
Una pregunta que podrías haber acertado por sentido común. Eviden- te no existen. Esta penalización estadística puede consistir, por ejemplo,
temente, lo que se pretende en cualquier ensayo clínico es encontrar en exigir un nivel de p más pequeño para considerar el resultado como
diferencias que, aplicadas a la clínica, aporten algún beneficio a los pa- significativo.
cientes. Si empleamos escalas que miden la calidad de vida, es evidente
que la relevancia clínica será mayor que si midiésemos, por ejemplo, un
parámetro analítico que nada tiene que ver con el bienestar del paciente. P207 MIR 2007-2008
No obstante, tendríamos un inconveniente, que es la subjetividad y la
dificultad de medición de este parámetro. ¿Qué tal se encuentra usted? En función de los criterios de inclusión, podemos dividir los EC en dos
Señale del 1 al 10 lo bien que se encuentra. Siempre será más fácil medir, grandes grupos:
por ejemplo, la calcemia o el hematocrito (respuesta 3, correcta). • EC pragmáticos: se acercan lo más posible a la población general (res-
puesta 4, correcta). Los criterios de inclusión son muy laxos (práctica-
mente los únicos son los diagnósticos).
P206 MIR 2007-2008 • EC explicativos: los criterios de inclusión son muy estrictos, así pues la
población no es exactamente igual a la población general.
Durante los últimos años, el tema del ensayo clínico se ha convertido en
uno de los más preguntados del examen MIR, por lo que has de dominar- Cuando los criterios de inclusión son muy estrictos, el EC presenta una
lo. Analicemos opción por opción: muestra más homogénea y se necesita menor tamaño muestral para de-
• Respuesta 1: el análisis por protocolo sólo incluye a los pacientes que tectar las diferencias. Además, hay mayor validez interna. Sin embargo,
han cumplido los requisitos del protocolo y han finalizado el estudio. existe una clara limitación a la hora de generalizar los resultados y de
Esto puede suponer un sesgo al no analizar las pérdidas, ya que sería reclutar a los pacientes. Se utilizan, sobre todo, en las fases II y III.
posible que éstas se deban a la falta de eficacia del fármaco o a la
aparición de efectos indeseables. Al no terminar el estudio, nada de En cambio, cuando no son estrictos, el reclutamiento será más sencillo,
esto podría reflejarse en los resultados del estudio. se podrá generalizar los resultados con mayor facilidad y tendrán mayor
• Respuesta 2: los estudios con controles históricos sobrevaloran la validez externa. No obstante, la muestra será más heterogénea, se nece-
eficacia del fármaco que estamos estudiando. Imagínate un estu- sitará un mayor tamaño muestral y los resultados serán confusos si sólo
dio sobre el tratamiento de la neumonía bacteriana. Comparamos es eficaz en subgrupos de pacientes. Se utilizan en las fases III y IV.
un nuevo antibiótico con la penicilina (un grupo de pacientes que
fueron tratados con ella hace cincuenta años). Se observan diferen-
cias estadísticamente significativas a favor del nuevo fármaco. ¿Estas P208 MIR 2007-2008
diferencias se justifican totalmente por el fármaco en sí? ¿No cabría
la posibilidad de que la mejora de las condiciones higiénicas, la ali- Las comparaciones con controles históricos no siempre son acertadas.
mentación u otros factores, estuvieran influyendo positivamente en Cuando éstas se realizan, nos encontramos con un problema: no sólo
la supervivencia de nuestros pacientes? serán distintos los tratamientos que estemos comparando, pudiendo ha-
• Respuesta 4: es la respuesta que tendrías que tener más clara de las ber cambiado más cosas. Imagínate que estuviésemos comparando dos
que aparecen en esta pregunta. Efectivamente, el diseño del que fibrinolíticos, tomando como controles los pacientes infartados en cierto
ensayos clínicos: Grado II -3 Evidencia obtenida a partir de múltiples series comparadas en el tiempo,
con o sin grupo control. Incluye resultados “dramáticos” producidos por
• Fase I: primera vez que se usa en humanos, que son voluntarios sa-
experimentos no controlados (p. ej., penicilina en los años cuarenta)
nos. No hay grupo control. Sirve para evaluar la toxicidad (no la efica-
Grado III Opiniones basadas en experiencias clínicas, estudios descriptivos
cia, como dice la opción 2, de modo que es falsa).
o informes de comités de ética
• Fase II: intenta conocer la relación dosis-respuesta. Se administra
en pacientes. No es necesario establecer comparación con otro fár-
maco.
• Fase III: sirve para evaluar la eficacia, en comparación con placebo u P216 MIR 2007-2008
otros fármacos (si existen). También da información sobre los efectos
adversos habituales. Se entiende por validez interna el grado de validez del resultado para los
• Fase IV: farmacovigilancia (poscomercialización). Detecta efectos ad- pacientes del estudio. Por tanto, puede decirse que existe validez interna
versos infrecuentes o de aparición tardía. También da información so- cuando el resultado del estudio es aplicable a los individuos que forman
bre interacciones con otros fármacos y para evaluar posibles nuevas parte del mismo. Por el contrario, la validez externa es la capacidad de
indicaciones. generalizar los resultados obtenidos a otros individuos distintos a los del
estudio.
P214 MIR 2007-2008 El ensayo clínico se caracteriza por ofrecer un alto nivel de evidencia
científica, puesto que se ve menos afectado por sesgos que otro tipo de
El primer metaanálisis fue realizado por Karl Pearson a principios del diseños (casos y controles, cohortes, etc.). Sin embargo, para ofrecer este
siglo XX, en un intento de solucionar el problema del reducido poder grado de evidencia, es usual que estos estudios sean muy exactos y res-
estadístico de los estudios con tamaños muestrales pequeños. De esta trictivos en cuanto a sus criterios de inclusión, a las condiciones de ad-
forma, analizando los resultados de un grupo de estudio, de característi- ministración del fármaco o factor en estudio, etc. Por esto, lo habitual es
cas parecidas, se puede alcanzar una valoración más exacta de los efec- que exista un alto grado de validez interna y de rigor científico, luego la
tos. No obstante, aunque lo que hizo Pearson encaja conceptualmente validez externa, a veces, no es tan alta como sería deseable (respuesta 3,
en el concepto de metaanálisis, este término en realidad nace en 1976, correcta).
aplicado a las ciencias sociales y en psicología. Es en los años 80 cuando
comienza a utilizarse en la ciencia médica. Recuerda que, dentro de los ensayos clínicos, existe una variedad que se
ajusta más a la práctica clínica, ya que sus criterios de inclusión son más
Un metaanálisis es un estudio basado en la integración estructurada y laxos (ensayos pragmáticos), que sería la excepción a este respecto.
sistemática de la información obtenida en diversos estudios clínicos, so-
bre un problema de salud determinado. Consiste en identificar y revisar
los estudios controlados sobre un determinado problema, con el fin de P198 MIR 2006-2007
dar una estimación cuantitativa sintética de todos los estudios disponi-
bles. Dado que incluye un número mayor de observaciones, un metaa- Pregunta de dificultad media sobre los tipos de diseño. Este tipo de pre-
nálisis tiene un poder estadístico superior al de los ensayos clínicos que guntas son habituales en el examen. En ese tipo de diseño se evalúan
incluye. Los dos principales problemas metodológicos de los metaanáli- simultáneamente dos tratamientos distintos en una misma muestra de
sis de ensayos clínicos son: sujetos. Estos sujetos son asignados de forma aleatoria a uno de los cua-
227
DESGLOSES
COMENTADOS MIR
tro grupos posibles: A, B, A+B y placebo. Con este tipo de diseño se pue- ciente reciba los dos tratamientos objeto de comparaciones en dos mo-
de evaluar la interacción entre los dos tratamientos, pese a que cuando mentos distintos, de modo que cada paciente sirve de control a sí mismo,
se diseña se asume que los dos tratamientos no interactúan entre sí. lo cual, al reducir la variabilidad, permite llevar a cabo el estudio con un
tamaño muestral menor al de diseño clásico. Uno de los problemas es el
efecto carry over o de arrastre (el efecto de uno puede influir sobre la toma
P200 MIR 2006-2007 del otro), así pues ha de haber un periodo de lavado entre la administra-
ción de los dos fármacos, de manera que el primer fármaco haya sido to-
El diseño cruzado o intrapaciente se basa en que un mismo paciente va a talmente aclarado del organismo antes de la administración del segundo.
recibir dos tratamientos, que van a ser comparados entre sí. Lógicamen- Piensa que una infección aguda en la que vas a probar un tratamiento
te, los recibe en dos momentos distintos, primero uno y después el otro. antibiótico cuando hayas introducido el primer antibiótico y lo cures, ya
Cada paciente sirve de control a sí mismo, lo cual reduce la variabilidad no puedes usar el segundo antibiótico, puesto que ya está curado.
intragrupal. Esto consigue un control perfecto de los factores pronósti-
cos como el sexo, la raza, etc. Uno de los problemas es el efecto carry over P212 (MIR 06-07) Ensayo clínico cruzado
o de arrastre (el efecto de uno puede influir sobre la toma del otro), así
que ha de haber un periodo de lavado entre la administración de los dos
fármacos, de modo que el primer fármaco haya sido totalmente aclarado
del organismo antes de proporcionar el segundo.
Dicho esto, sobre la pregunta que nos ocupa, no es el diseño ideal para
medidas preventivas (opciones 1, 3, 4). La opción 5, el antibiótico, tam-
poco es adecuada, porque el primer antibiótico que administres puede
curar la otitis e impedir evaluar el efecto del segundo. Sin embargo, los
analgésicos para el síndrome premenstrual son meramente sintomáticos
y sin efecto residual entre uno y otro, de modo que pueden ser evaluados
mediante este diseño sin problemas (respuesta 2, correcta).
Pregunta algo lógica que ya ha aparecido otra vez en el MIR. El ensayo Pregunta fácil preguntada varias veces en el MIR. En función de los cri-
clínico con diseño cruzado o intrapaciente consiste en que un mismo pa- terios de inclusión podemos dividir los ensayos clínicos en dos grandes
229
DESGLOSES
COMENTADOS MIR
En los diseños clásicos o en paralelo, el grupo control recibe el tratamien- • Análisis por protocolo, donde se incluyen sólo a aquellos pacientes
to a la vez que el grupo experimental con el fin de controlar el efecto de que han cumplido los requisitos de protocolo y/o han finalizado el
los factores pronósticos que pudieran cambiar a lo largo del tiempo. No estudio.
permite, por tanto, combinar dos tratamientos en un grupo como en el • Análisis por intención de tratar, donde se incluye a todos los pacien-
diseño factorial (opción 1, incorrecta). tes, aunque no hayan finalizado el estudio o hayan cambiado de gru-
po. Por tanto, la opción correcta es la 1.
P204 (MIR 05-06) Ensayo clínico: diseño factorial
Al analizar los resultados al final de un ensayo clínico es preferible
hacer un análisis por intención de tratar que un análisis por protocolo.
Esto es debido a que el análisis por intención de tratar incluye a todos
los pacientes que fueron seleccionados (por tanto aleatorizados), y en
el grupo en el que fueron asignados. De este modo, se evita la pérdida
de información que supone obviar el abandono del tratamiento por
En los diseños cruzados o intrapaciente, un mismo paciente va a recibir algún factor relevante (por ejemplo, por efectos secundarios), con lo
los dos tratamientos objeto de comparación en dos momentos distintos, que se pueden generalizar mejor los resultados al ser más parecidos
de modo que cada paciente sirve de control a sí mismo, lo cual reduce a la práctica diaria. En el análisis por protocolo se incluye sólo a los
la variabilidad intragrupal y consigue un control perfecto de los factores pacientes que han cumplido los requisitos del estudio y lo han fina-
pronósticos de carácter perenne, como el sexo, la raza, etc. Una vez más lizado.
este diseño no nos permite ver el efecto de los dos tratamientos en com-
binación (opción 2, incorrecta). En el siguiente ejemplo vamos a ver por qué es más adecuado hacer el
análisis por intención de tratar.
P205 MIR 2005-2006 P206 (MIR 05-06) Análisis por protocolo vs. por intención de tratar
Pregunta fácil acerca del ensayo clínico. Los ensayos clínicos tienen cua-
tro fases y han sido objeto de pregunta en las últimas convocatorias MIR.
Las cuatro fases son:
• Fase I: es la primera vez que un fármaco se da a humanos. General-
mente se realiza con voluntarios sanos (n = 20-80) y sin grupo control.
El principal objetivo es evaluar la toxicidad y conocer la dosis única
aceptable no tóxica. En esta fase evaluaremos la farmacocinética,
farmacodinámica, bioequivalencia y biodisponibilidad. Por tanto, la
dosis más eficaz no se evalúa en esta fase sino en la fase II (opción 4,
correcta).
• Fase II: el principal objetivo es aportar información sobre la relación
dosis/respuesta, proporcionando una información preliminar sobre
la eficacia. Se hace en pacientes (n = 100-200). No necesariamente
tienen que ser comparativos. En el análisis por intención de tratar se tienen en cuenta los 400 pacien-
• Fase III: es el prototipo del ensayo clínico. Suele ser comparativo con tes que iniciaron el estudio, 200 en el grupo A y 200 en el grupo B. En
la terapéutica de referencia o con un placebo. Es la investigación clí- cambio, en el análisis por protocolo sólo se incluyen los pacientes que no
nica más extensa y rigurosa sobre un tratamiento médico. Sirve para abandonaron el estudio, 160 en el grupo A y 190 en el grupo B. Observa
establecer la eficacia de un nuevo fármaco y la existencia de efectos cómo los resultados del mismo ensayo clínico son diversos y que en el
adversos frecuentes. análisis por protocolo se encuentran diferencias mucho mayores entre
• Fase IV: también se denomina farmacovigilancia y consiste en el se- los dos tratamientos.
guimiento postcomercialización de un número muy elevado de pa-
cientes con el fin de detectar efectos adversos poco habituales o de
aparición tardía. La fase IV también sirve para evaluar interacciones P207 MIR 2005-2006
entre medicamentos y sugerir nuevas indicaciones de fármacos ya
aceptados para otro fin. Pregunta difícil, ya que requiere tiempo para su análisis. En esta pre-
gunta nos hablan de dos conceptos: porcentaje de reducción absoluta
de riesgo y el nivel de significación estadística. El nivel de significación
P206 MIR 2005-2006 estadística hace referencia a la probabilidad de equivocarnos, fija la
probabilidad máxima de que los resultados diferentes observados en-
Pregunta de dificultad media acerca del análisis por intención de tratar. tre los dos grupos puedan ser debidos simplemente al azar, que suele
A la hora de realizar el análisis de los resultados en un ensayo clínico (EC), ser por convenio del 5%. En esta pregunta, en las tres comparaciones,
podemos llevar a cabo dos tipos: A versus placebo, B versus placebo y C versus placebo, la p es menor
Pregunta fácil. Has de dominar los tipos de ensayos clínicos para el MIR.
En el ensayo clínico de diseño secuencial no conocemos a priori el tama-
ño muestral, sino que se van incluyendo pares de pacientes aleatoriza-
dos a los dos tratamientos (uno al tratamiento en estudio y otro al grupo
control). Se analizan los resultados, después de introducir a cada pareja,
y cuando la diferencia entre los dos tratamientos favorece a uno de ellos
(exceso de preferencias), es el momento en que el ensayo clínico se de-
tiene. Se pueden seguir incluyendo pacientes hasta que exista evidencia
de eficacia, efectos secundarios o cuando la probabilidad de obtener una
diferencia relevante es muy baja.
Una vez que se encuentra un fármaco en el mercado (tras pasar la fase III),
Ventajas del diseño secuencial: pueden aparecer efectos adversos que han de ser detectados en la fase IV o
• No hay un tamaño muestral predeterminado. de farmacovigilancia. La Notificación Espontánea de Reacciones Adversas
• Se incluyen pacientes en función de los resultados. a Medicamentos (RAM) es la principal fuente de información del Sistema
• Éticamente correcto. Español de Farmacovigilancia, y supone la recogida y notificación (en las
• Adaptables a cualquier tipo de variable. tarjetas amarillas, que son formularios destinados a ello) de las RAM que
• Posibilidad de realizar múltiples análisis intermedios. aparecen durante la práctica clínica. En general, se acepta cualquier reac-
• Ahorro de pacientes de hasta un 40%. ción adversa, aunque las de mayor interés son las RAM graves, inesperadas
o raras y aquéllas de fármacos de comercialización reciente (menos de tres
Inconvenientes del diseño secuencial: años). El programa de Notificación Espontánea está dirigido especialmen-
• Variable principal única. te a médicos, aunque también incluye a otros profesionales sanitarios.
• Necesidad de conocer los resultados de la intervención poco des-
pués de la inclusión del paciente.
• Riesgo de cometer errores tipo I. P216 MIR 2005-2006
• Métodos estadísticos de diseño y análisis complejos.
• Difícil planificación de recursos. Pregunta de dificultad media. El tema del ensayo clínico es uno de los
• Un 10% necesita más pacientes que el diseño con tamaño fijo. más rentables de cara al examen MIR; estúdialo bien. Lo primordial a
231
DESGLOSES
COMENTADOS MIR
la hora de interpretar un ensayo clínico es valorar la posible existencia P197 MIR 2004-2005
de errores en las distintas fases del estudio, puesto que cualquier fallo
no controlado en el diseño (opción 3) o en la ejecución podría invalidar El muestreo aleatorio estratificado asegura que, en nuestra muestra, la
los resultados finales, no importando entonces si las diferencias alcan- proporción de una o varias variables sea la misma que en la población
zan o no la significación estadística (opción 2, correcta). Las pérdidas total (respuesta 3, correcta).
de sujetos y los motivos de las mismas pueden invalidar los resultados
finales del estudio si éstas no se tienen en cuenta. Las pérdidas que Imagina un estudio sobre el cáncer de pulmón. En la población podría ha-
ocurren antes de la aleatorización pueden afectar a la capacidad de ber variables que pudiesen influir mucho en el resultado, por ejemplo, ser
generalización de los resultados (a la validez externa), mientras que fumador o no serlo. Lo que haríamos sería obtener una muestra en la que el
las pérdidas postaleatorización pueden afectar a la validez interna (op- porcentaje de fumadores y no fumadores fuese el mismo que en la pobla-
ción 1). ción general. De esta forma, si en la población fuma un 30%, en mi muestra
habría que conseguir un 30% de fumadores. Naturalmente, esto puede ha-
Las características de los pacientes incluidos podrían condicionar la cerse respecto a muchas más variables, según las necesidades del estudio.
aparición de sesgos, factores de confusión, determinada respuesta al
tratamiento… En fin, es conveniente valorarlas y tenerlas en cuenta
antes de interpretar los resultados de un estudio (opción 4). La va- P198 MIR 2004-2005
riable de medida utilizada debe ser una característica observable y
mensurable, que se evaluará durante un tiempo determinado en los Una pregunta fundamental. En alguna otra ocasión, han hecho preguntas
sujetos del estudio. Debemos asegurarnos que la variable y su medi- sobre el análisis de los resultados. Es comprensible que intenten confun-
ción han sido correctas previamente a interpretar los resultados del dirnos entre el análisis por protocolo y el análisis por intención de tratar.
estudio (opción 5).
El análisis por intención de tratar incluye a TODOS los pacientes que han
sido seleccionados. Se les analiza en el grupo al que fueron asignados
P196 MIR 2004-2005 inicialmente, pese a que no terminaran el estudio o cambiasen de grupo.
En cambio, el análisis por protocolo sólo incluye a los que han cumplido
Pregunta de cierta dificultad, pero muy instructiva, dado que hace refe- los requisitos del protocolo y han finalizado el estudio. Esto tiene un pro-
rencia a varias ideas primordiales. Revísala con atención si la has fallado. blema fundamental; vamos a verlo en un ejemplo práctico.
1. Por supuesto, si estamos hablando de controles históricos, puede que
cierta información se haya perdido en el tiempo (o no fuera recogida) Imagina que estamos comparando la eficacia de dos fármacos, A y B. Su-
porque evidentemente pertenecen al pasado. pongamos que los enfermos del grupo B llegan todos al final del estudio,
2. Muy lógico… ¿Cuándo habrá más diabéticos, con los criterios actuales pero los del grupo A abandonan a la mitad, y el resultado no encontrara
(Glu >126) o con los antiguos (Glu >140)? Lógicamente, al exigir un diferencias estadísticamente significativas. Este estudio podría estar ses-
nivel de glucemia más bajo como criterio diagnóstico, el número de gado. ¿Por qué abandona la gente el fármaco A? Podría ser, por ejemplo,
personas consideradas diabéticas aumenta. Por esto, puede variar la porque el fármaco A no esté siendo eficaz. Este tipo de análisis no lo de-
prevalencia si modificamos la definición de diabético o de otras enfer- tectaría, puesto que sólo analiza los que han llegado al final del estudio
medades. (los que les iba bien, por eso no vemos diferencias respecto a B). Éste es
3. Cuidado, es al contrario, la tendencia es más a HIPERVALORAR. Vamos el problema del análisis por protocolo: al no considerar las pérdidas, el
a poner un ejemplo muy extremista, pero muy gráfico: imagina que resultado puede estar sesgado si se dan situaciones como ésta.
comparamos la eficacia de un antibiótico nuevo con la penicilina.
Comparamos nuestro grupo de pacientes con otro grupo, tratado con
penicilina en 1940. Resultado del estudio: diferencias significativas a P199 MIR 2004-2005
favor del nuevo fármaco. Pues bien, la eficacia del nuevo fármaco tal
vez sea superior a la penicilina, pero… ¿No habrá contribuido que el Los análisis intermedios se realizan durante las fases III y IV del estudio.
desarrollo sanitario en el año 2007 es bastante superior al de 1940? Tal Están justificados, dado que, si detectan una diferencia entre los trata-
vez sea la limpieza del hospital, los cuidados de enfermería, la mejor mientos que se comparan, evitan que haya pacientes que no se benefi-
alimentación, la mejora del nivel de vida, la II Guerra Mundial… Quién cien del tratamiento (se pararía el ensayo y se trata a todos con el fármaco
sabe. Cuando usas controles históricos, hay muchos factores que pue- bueno). Sin embargo, no se debe hacer un número muy elevado. A ma-
den cambiar, no sólo el fármaco. yor número de análisis intermedios, mayor posibilidad de que, en alguno
4. Has de conocer muy bien qué influye en el cálculo del tamaño mues- de ellos, se detecte una diferencia que realmente no existe (error tipo I).
tral. Para el número de sujetos necesario, da igual que sean controles
históricos o actuales. Sí influyen parámetros como alfa, mínima dife-
rencia que se desea detectar, etc. P201 MIR 2004-2005
5. Es lo que explicábamos en la respuesta 3. ¿Por qué nuestro fár-
maco es mejor que el de hace 70 años? ¿Por el fármaco o porque, Este mismo concepto ha aparecido en el MIR 2006-2007. Como sabes, el
además, tomamos otras medidas concomitantes que entonces no diseño que más evidencia científica ofrece es el ensayo clínico aleatorio.
existían? El análisis secuencial lo usamos para ahorrar pacientes, especialmente
Las preguntas de estadística y epidemiología se repiten mucho en el MIR, Ten cuidado con la respuesta 2. Lo que es menor es la variabilidad IN-
pero ésta supera a la media en dificultad. La forma más sencilla de afron- TRAINDIVIDUAL. La variabilidad INTERindividual (la que existe entre los
tarla es por descarte de opciones: distintos individuos que forman parte del estudio) no tiene por qué ser
• No encontrar diferencias entre el fármaco estudiado y el control pue- distinta que en otros tipos de diseño (respuesta 2, falsa).
de deberse a varias razones: que realmente no existan tales diferen-
cias o, también, que aun existiendo no seamos capaces de detectar-
las (por ejemplo, debido a un tamaño muestral escaso). Por esto, no P207 MIR 2004-2005
podemos asumir equivalencia (respuesta 1, falsa).
• La opción 2 es claramente falsa. Por supuesto, hacer ensayos INÚTI- Esta pregunta ha aparecido prácticamente idéntica en el MIR 2006-2007.
LES para la ciencia es absurdo, porque desperdicia un esfuerzo huma- También en el 2007-2008 se maneja este concepto, por lo que podemos
no y económico que podría dedicarse a cualquier otro fin. decir que está MUY de moda. Desde el punto de vista metodológico, el me-
• El error alfa es la probabilidad de encontrar diferencias cuando en jor diseño es el ensayo clínico aleatorio, dado que es el que más evidencia
realidad no existen. Lo que describe la opción 3 es el error beta. científica ofrece. La duda está entre las opciones 2 y 4. No obstante, recuerda
• Respuesta 4: los posibles abandonos deberían tenerse en cuenta en que no sólo se tiene en cuenta el grado de evidencia, sino también aspectos
ambos grupos para el cálculo del tamaño muestral. De esta forma, éticos. Y no es ético tratar a un paciente con placebo, cuando sabemos que
evitamos la pérdida de poder estadístico, adelantándonos a las posi- existe un fármaco eficaz, especialmente si se trata de una enfermedad po-
bles pérdidas (éste es el procedimiento habitual). Otra opción podría tencialmente grave, como la colitis ulcerosa. Por ello, habría que elegir la 4.
ser sustituir las pérdidas; sin embargo, cambiar más pacientes en un
grupo que en otro podría generar un sesgo. Al principio del estudio,
los dos grupos tal vez eran comparables… No obstante, si luego cam- P209 MIR 2004-2005
biamos más pacientes en uno que en otro, posiblemente ya no lo
sean (el grupo ya no es el que inicialmente habíamos previsto para El sistema de farmacovigilancia ha sido preguntado ya en alguna oca-
la comparación). Por tanto, en caso de recurrirse a un método como sión. Concretamente, esta pregunta es relativamente fácil, puesto que
éste, las sustituciones deberían ser similares entre los dos grupos. puede resolverse por exclusión.
233
DESGLOSES
COMENTADOS MIR
• Respuesta 2: una notificación adversa grave no es motivo para la re- El programa de Notificación Espontánea está dirigido especialmente a
tirada del fármaco, ya que un solo caso no implica que la relación médicos, si bien incluye a otros profesionales sanitarios.
esté demostrada. Podría haber sido producida por una circunstancia
ajena al fármaco, siendo casual la relación con éste.
• Respuesta 3: que se haya recibido más de un caso tampoco impli- P134 MIR 2003-2004
ca causalidad. Ante la presencia de estos casos, queda demostrar la
asociación, para lo que habrá que recurrir a las técnicas estadísticas Se trata de una pregunta de un tema reiterado en el MIR, el ensayo clí-
oportunas. Tal vez estas reacciones no sean por el medicamento, sino nico, si bien se refiere a una aspecto muy concreto del mismo, la com-
por la propia enfermedad para la que se utiliza, o simplemente cir- paración intrapaciente en los ensayos clínicos cruzados, que no es nada
cunstanciales. fácil.
• Respuesta 4: no sabemos si la hepatitis apareció al azar o si fue una
reacción adversa rara. Si aparece un solo caso después de dos años El ensayo clínico cruzado o intrapaciente consiste en que un mismo pa-
de uso, probablemente sea al azar, pero no podemos estar seguros ciente va a recibir los dos tratamientos objeto de comparación en dos
(siempre puede haber una primera vez, esto no lo sabemos). momentos distintos, de modo que cada paciente sirve de control a sí
• Respuesta 5: esta opción dice lo mismo que la 4, así que no pueden mismo, lo cual reduce la variabilidad intragrupal y consigue un control
ser correctas a la vez. Observa que niega de forma categórica la posi- perfecto de los factores pronósticos de carácter perenne, como el sexo,
ble asociación, lo cual no es correcto. la raza, etc.
La única solución razonable es la 1. Ante un solo caso grave, lo lógico es Uno de los problemas es el efecto carry over o de arrastre (el efecto de
considerar cuánta gente se ha expuesto al fármaco y estar alerta ante uno puede influir sobre la toma del otro), por lo que ha de haber un pe-
una posible asociación. riodo de lavado entre la administración de los dos fármacos, de modo
que el primer fármaco haya sido totalmente aclarado del organismo an-
tes de administrar el segundo.
P216 MIR 2004-2005
Si este efecto arrastre o residual es distinto con los dos tratamientos, la
Pregunta básica sobre el ensayo clínico. Es uno de los temas más de situación basal tras el periodo de lavado no es igual en los dos grupos,
moda en el MIR durante los últimos años, así que no lo descuides. La pri- así pues para el análisis no se va a poder comparar cada paciente con-
mera administración del fármaco en humanos se realiza en los ensayos sigo mismo, ya que habría diferencias según el orden en que hubiesen
en fase I (respuesta 3, incorrecta). Más adelante, a partir de la fase II, se recibido los tratamientos. Como consecuencia, es posible que el tamaño
administran en enfermos. En algún caso, se hacen excepciones y se dan muestral sea insuficiente a la hora de realizar el análisis estadístico.
en enfermos en fase I, cuando se trata de fármacos extremadamente tó-
xicos y no haya ningún tipo de alternativa terapéutica (por ejemplo, en-
fermos neoplásicos muy avanzados). Recuerda también que el objetivo P138 MIR 2003-2004
de los estudios en fase II es determinar la relación dosis/respuesta, para
pasar luego a fase III, donde serán comparados con placebo o con otras Es una pregunta reiterada y fácil, que no se puede fallar. Por definición,
alternativas terapéuticas si existen. un ensayo clínico cruzado es aquel en el que todos los pacientes reciben
ambas opciones terapéuticas en estudio. En un EC cruzado, los pacientes
son divididos en dos grupos que recibirán de forma sucesiva (periodos 1
P133 MIR 2003-2004 y 2), aunque en orden inverso, ambos tratamientos. Entre ambos perio-
dos de tratamiento debe existir un periodo de lavado de una duración
Pregunta diferente y, por tanto, difícil. La farmacovigilancia es la recogida suficiente para asegurar el aclaramiento de ambos fármacos.
de datos sobre seguridad de fármacos una vez que se autoriza su comer-
cialización. Su objetivo es detectar reacciones adversas poco frecuentes
que no han sido identificadas durante el desarrollo del ensayo, dado que P139 MIR 2003-2004
éste se ha realizado en una población limitada (generalmente n < 2000).
El Sistema Español de Farmacovigilancia, recibe información de diferen- Pregunta difícil sobre el análisis estadístico de un ensayo clínico. Una
tes fuentes, entre ellas, y principalmente, la notificación espontánea de nueva estrategia terapéutica ha de demostrar, con vistas a su comerciali-
reacciones adversas. zación, que es superior, o al menos no inferior, a los tratamientos ya dis-
ponibles. Como ya sabes, para el análisis estadístico de un ensayo clínico
La notificación espontánea de reacciones adversas supone la recogida se puede elegir la población por intención de tratar (todos los pacientes
y notificación mediante las tarjetas amarillas de las reacciones adversas seleccionados y analizados en el grupo en el que fueron asignados), o
que aparecen durante la práctica clínica. bien la población por protocolo (sólo aquellos pacientes que han cum-
plido los requisitos del protocolo y/o finalizado el estudio).
En general, se acepta cualquier reacción adversa. Sin embargo, las de
mayor interés son las reacciones adversas graves, inesperadas o raras, y La población PP es la población ideal que cumple el tratamiento y no
aquellas de fármacos de comercialización reciente (menos de tres años). tiene problemas de falta de eficacia y/o de seguridad y, por consiguien-
Pregunta directa sobre los tipos de variables. Existen dos grandes grupos
P257 MIR 2003-2004 de variables, cualitativas o categóricas y cuantitativas o numéricas. Éstas,
a su vez, se dividen en varios grupos:
Esta pregunta es fácil. Se contesta con la definición. Según los criterios de • Cualitativas: nominales dicotómicas (dos opciones), nominales no di-
inclusión, los ensayos clínicos se dividen en dos tipos: cotómicas (tres o más opciones) y ordinales (escalas).
• EC pragmáticos, en los que los criterios de inclusión son laxos y, por • Cuantitativas: discretas (sin decimales) y continuas (con decimales).
tanto, la muestra seleccionada se va a parecer mucho a la población
de la que se ha extraído. Será una muestra heterogénea. Nos hablan de una variable que sólo tiene dos opciones, presencia o au-
• EC explicativos, en los que los criterios de inclusión son estrictos y, sencia de bacteriuria, por lo que es una variable dicotómica (respuesta co-
por tanto, los pacientes incluidos no se parecerán tanto a los de la rrecta 3: categórica).
población de referencia. Será una muestra homogénea.
Esta división sólo se refiere a los criterios de inclusión, no a las interven- P199 MIR 2008-2009
ciones ni al análisis de resultados ni al enmascaramiento (respuestas 1, 3
y 5, incorrectas). La respuesta 2 se refiere a un EC explicativo. Por consi- Una buena oportunidad para comprender el concepto de muestreo no pro-
guiente, la respuesta correcta es la 4. babilístico, y algunas de sus variantes. Se habla de muestreo no probabilísti-
co cuando la selección de los elementos de la muestra no se hace al azar. Por
el contrario, son probabilísticos aquellos en los que la probabilidad de apa-
T09 Niveles de calidad de la evidencia científica recer en la muestra es conocida (o puede calcularse) para cualquier elemen-
to de la población. Científicamente, los probabilísticos son de mayor valor.
P131 MIR 2009-2010 Dentro de los muestreos no probabilísticos, destaca el de casos consecu-
tivos, que es considerado como el mejor dentro de este grupo. Consiste
La medicina basada en la evidencia no sólo consiste en aplicar ensayos en ir eligiendo a los pacientes que cumplen determinados criterios de
clínicos a la práctica diaria (respuesta 1, falsa), ni limitar todas las decisio- inclusión, hasta alcanzar el número necesario, o dentro de un intervalo
nes a los resultados de determinados trabajos considerados de calidad de tiempo prefijado. En el ejemplo que nos plantea esta pregunta, habría
(opción 2, falsa). Tampoco significa caer en extremismos como los que que estudiar a todos los pacientes que se diagnostican de HTA hasta lle-
aparecen en la respuesta 4. gar a un número (100 casos, por ejemplo) o durante un tiempo preesta-
blecido (6 meses, 10 meses…).
Lo que realmente significa esta denominación es saber combinar la mejor
evidencia clínica existente (por ejemplo, resultados de ensayos clínicos y Otro tipo de estudio no probabilístico es el muestreo de conveniencia,
metaanálisis) con la experiencia clínica adquirida por el profesional médi- que es el que define la opción 1: elegir “a dedo” los casos que suponemos
co a lo largo de su ejercicio. Idealmente, la Medicina Basada en la Eviden- más apropiados para participar en el estudio en cuestión.
235
DESGLOSES
COMENTADOS MIR
P202 MIR 2008-2009 aquellas en las que entre dos valores cualesquiera siempre se puede in-
tercalar otro.
Una pregunta sencilla, casi regalada, probablemente la más fácil de este
bloque en la convocatoria 2008-09. La presencia o ausencia de hemo-
rragia digestiva, obviamente, no puede ser cuantificada, ya que sencilla-
mente existe o no existe. Por tanto, la variable de estudio es cualitativa.
T11 Estadística descriptiva
Además, se diría que es binaria o dicotómica, porque solamente admite
dos alternativas: el paciente sangra o no sangra. P192 MIR 2013-2014
Si hubiésemos clasificado el sangrado en una escala de gravedad (por ejem- Para poder comparar la distribución de una variable en dos muestras nece-
plo: leve, moderado y grave), estaríamos ante una variable cualitativa ordinal. sitamos conocer la dispersión de esta variable, es decir, no sólo su medida
de tendencia central (media) sino también cómo se alejan de ese punto
central; en otras palabras, su medida de dispersión (desviación típica).
P194 MIR 2006-2007 Recuerda que la dispersión de una muestra se mide con el coeficiente de
variación de Pearson, que relaciona media y desviación típica (opción 3).
Pregunta bastante difícil sobre los tipos de muestreo. No te preocupes si
la has fallado. El muestreo probabilístico es el único científicamente váli-
do, por lo que se emplea al diseñar la mayoría de los trabajos científicos. P177 MIR 2012-2013
Implica selección ALEATORIA de los casos. En este muestreo, la probabi-
lidad de aparición de cualquier elemento en una muestra es conocida, o El coeficiente de Fisher mide (según sea positivo o negativo) si hay mas
puede calcularse. En cambio, en un muestreo no probabilístico, la selec- valores a la derecha o a la izquierda de la media, los cuartiles son los
ción de los elementos de la muestra no se hace al azar. valores que dividen la media en 4 partes (25, 50, 75 y 100) la varianza
mide la dispersión de los valores respecto a la media, la curtosis mide
Por ejemplo, si de una población de 100.000 personas elijo al azar 300 el apuntamiento (si es el apuntamiento es muy grande indica que hay
para mi estudio, sería un muestreo aleatorio simple, y es probabilístico, muchos valores alrededor de la media y también valores muy alejados,
porque conozco de antemano la probabilidad de seleccionar cada caso colas muy grandes) y la amplitud mide del valor más bajo al más alto de
(300/100.000). Sin embargo, en un muestreo de casos consecutivos, esta la muestra.
probabilidad no es conocida.
En el muestreo de casos consecutivos, se elige a cada paciente que P194 MIR 2010-2011
cumpla con los criterios de selección dentro de un intervalo de tiempo
prefijado. Se continúan incluyendo hasta alcanzar el tamaño muestral Pregunta sencilla, que se contesta directamente con los Desgloses, sobre
necesario (fechas indicadas con anterioridad). Es decir, se van seleccio- un concepto sencillo y repetido en el examen MIR en muchas ocasiones.
nando todos los casos que cumplen ciertos criterios durante un tiempo, La mediana es una medida de localización o tendencia central. Es el valor
pero NO se hace de forma aleatoria. Simplemente se introducen casos numérico que divide en dos partes iguales a todo un conjunto de datos
hasta llegar al número necesario. Al no haber aleatorización alguna, no numéricos. De esta forma, el 50% estará por encima de la mediana y el
entra en el concepto de muestreo probabilístico. 50% por debajo. En la pregunta, la mediana es 6; por tanto, la respuesta
correcta es la 5. La mitad de los pacientes sobreviven más de 6 años, y la
otra mitad menos.
P146 MIR 2003-2004
Conviene recordar que, en una distribución simétrica, la mediana coinci-
Se trata de una pregunta del tema de generalidades. No son muy comu- de con la media aritmética, no así en distribuciones asimétricas, en cuyo
nes, pero es fundamental dominar conceptos para responder preguntas caso la mediana es mejor que la media como medida de centralización,
de interpretación de resultados o de diseño de estudios. ya que no se ve tan influida por valores extremos.
En este caso está claro que la mediana es una medida de tendencia cen-
tral, no de dispersión, por lo que la única respuesta posible es la 5.
T14 Estimación de parámetros.
Estadística inferencial
P256 MIR 2004-2005
P172 MIR 2011-2012
La mediana es el valor numérico que divide en dos partes iguales a todo
un conjunto de datos numéricos. De esta forma, el 50% estará por enci- El error estándar de la media es la desviación típica de todas las medias
ma de la mediana y el 50% por debajo. En el ejemplo que nos ponen, si obtenidas a partir de las infinitas muestras que componen la población.
la mediana es siete, la interpretación correcta es la 2: la mitad sobreviven Nos permite predecir con una probabilidad determinada (estimar), la
más y la otra mitad, menos. probabilidad de acierto-error en nuestra afirmación. Por ejemplo, en una
muestra de diabéticos la glucemia media es 160. Si queremos saber cuál
Recuerda que, en una distribución simétrica, media y mediana coinciden, es, sin embargo, la media poblacional (estimar la media poblacional a
pero no en las asimétricas. Cuando los datos se disponen de forma asi- partir de nuestros datos muestrales, no sólo en nuestra muestra), necesi-
métrica, la mediana es mejor que la media como medida de centraliza- taremos el error estándar. Recordemos que la fórmula del error estándar
ción, ya que no se ve tan influida por los valores extremos. de la media es:
P185 MIR 2014-2015 En este estudio se ha comprobado que en la muestra, el fármaco actúa
como factor protector ya que el RR es < 1 (0,39). Sin embargo, si quere-
Pregunta sobre estadística inferencial sencilla, pero cuya dificul- mos saber cómo se comportaría el fármaco no en nuestra muestra, sino
tad radica en el cálculo mental que tenemos que realizar. Piden que en la población, tendremos que calcular un intervalo de confianza (ha-
calculemos el IC al 95% sabiendo que la media (x) es 0,8 mg/dl; la bitualmente del 95%). La asociación entre el fármaco y la superviven-
desviación típica (s), 0,62 mg/dl; y el tamaño muestral (n), 85. Para cal- cia será significativa si la estimación no incluye el 1. Como sabemos, un
cular el IC al 95%, construiremos un IC así: x +/- 2eem, sabiendo que RR de 1 significaría en este estudio que el fármaco nuevo no modifica la
eem = S/√(n-1). supervivencia con respecto al previo. La precisión del intervalo de con-
fianza viene determinada por la anchura del mismo. Cuanto más ancho,
Sólo queda sustituir: menor precisión. Si el intervalo es poco preciso es muy probable que in-
• eem = 0,62/√84 = 0,62/9,16 = 0,067. cluya, entre otros valores, el 1, como ocurre en este estudio.
• x +/- 2eem = 0,8 +/- 2 x 0,067 = 0,13 (respuesta 2).
Si nos encontramos con preguntas de este tipo, tenemos que “redondear” P176 MIR 2010-2011
los números para no perder tiempo, ya que en el examen no se puede usar
calculadora y es raro que conozcas la raíz cuadrada de 84 de memoria Pero Una pregunta sencilla, donde nos piden que señalemos la respuesta falsa.
¿y la raíz de 81? 9 x 9 = 81. Pues haz la de 81. Tampoco es fácil calcular Para ello es fundamental conocer el concepto de odds ratio e intervalo de con-
0,62 entre 9, pero 6 entre 9 es lo mismo que 2 entre 3, y eso sí que sabes fianza, auténticos clásicos del examen MIR, y que se repiten todos los años.
calcularlo 2/3 = 0,6. Sólo quedaría añadir un decimal: 0,6/9 = 0,06. Así, re-
dondeando quedaría: En la pregunta nos cuentan que una revista lleva a cabo un estudio sobre
• eem = 0,6/√81 = 0,6/9 = 0,2/3 = 0,06. factores pronósticos en la lumbalgia, donde determinan la medida de fuer-
• x +/- 2eem = 0,8 +/- 2 x 0,06 = 0,8 +/- 0,12 (respuesta 2). za de asociación del estudio, en este caso mediante la odds ratio. El signi-
ficado de una OR de 2, en este caso, es lo que dice la respuesta 4. El riesgo
de fracaso terapéutico es el doble, cuando la duración del tratamiento es
P175 MIR 2012-2013 mayor de un año, con respecto a los casos en los que sea menor.
Debemos asumir que los niveles de colesterol siguen una distribución El intervalo de confianza es el resultado de aplicar la estadística inferen-
normal. Según esta ley de distribución de variables, los valores entre cial, es decir, a partir de los valores de una muestra calculamos los valores
+/- 1 DE o desviación típica respecto la media (en este caso entre 211 y en la población, y para ello necesitamos determinar un intervalo de con-
221 mg/dl) comprenden 68% de la población. Los valores entre +/-2 DE fianza en el que encontraremos el verdadero valor de la OR con una de-
(en este caso entre 206 y 226 mg/dl) comprenden el 95%, del 5% restan- terminada probabilidad, en este caso del 95% (respuestas 1 y 2, ciertas).
237
DESGLOSES
COMENTADOS MIR
Lo que dice la respuesta 5 es totalmente cierto, cuando hablamos de me- es más del doble que el inferior. Es casi como decir que un antibiótico
didas de asociación (OR, RR) el intervalo de confianza no puede incluir cura entre el 2% y el 97% de los casos afectados por determinada bac-
el valor 1 porque indicaría el efecto neutro del factor de estudio y, por teria. Debería ser interpretado con reservas, porque la precisión que nos
tanto, se hablaría de un resultado no significativo. ofrece es bajísima. Los dos fármacos podrían ser similares en cuanto a
su efecto (RR cerca de uno), pero también existe un riesgo importante
La falsa, por tanto, es la respuesta 3, pues el intervalo de confianza, de que no lo sean (por la amplitud del intervalo). Por eso, la respuesta
para ser aceptado, no tiene que estar centrado forzosamente en el correcta es la 5.
valor de la OR. Lo importante es que no incluya el valor 1, porque en
tal caso no podríamos saber si el factor de estudio es protector o de
riesgo.
T15 Contraste de hipótesis
La interpretación de estudios es bastante habitual en el examen MIR. Pregunta sobre el test estadístico que tenemos que utilizar para relacio-
El estudio que nos describen ofrece un intervalo de confianza al 95%. nar la calidad del sueño y la tendencia a la depresión. En el enunciado se
La interpretación de este dato no corresponde con la opción 3. No po- aclara que a cada paciente se le asigna una puntuación numérica, por lo
demos AFIRMAR que el 95% de los adultos estará entre 192 y 208. Lo que tendremos que buscar un test estadístico para utilizar cuando tene-
que podemos decir es que, con una probabilidad del 95%, la media de mos dos variables cuantitativas (respuesta 5, correcta).
esta población estará entre 192 y 208, lo que es muy distinto. Es lo que
aparece en las opciones 1 y 2, que es la forma correcta de interpretar el
estudio. P033 MIR 2013-2014
La opción 5 puede ofrecer cierta dificultad, porque no es evidente. Si El método de Kaplan-Meier es una de las formas más empleadas para
tienes en cuenta la fórmula para calcular el error estándar de la media, realizar un análisis de supervivencia. Se representa como la caída del
puedes dar con ella: evento que se mide a lo largo del tiempo. Es decir, que si lo que me-
dimos es la supervivencia, veremos cómo la gráfica, según mueren los
eem = σ/√n-1 pacientes, se aproxima al eje de abscisas. En el eje de ordenadas se
representa el porcentaje libre de evento (en esta pregunta la varia-
Teniendo en cuenta que el eem = 4 y n = 100, la desviación típica ronda ble progresión libre de enfermedad) y el eje de abscisas el tiempo. En
los 40 (respuesta 5, cierta). nuestra gráfica hay dos grupos de tratamiento, A (BSC) y B (BSC + P).
Comprobamos cómo en ambos casos las gráficas se reducen a lo largo
del tiempo. Si observamos en el eje de ordenadas el 50% (mediana
P209 MIR 2006-2007 de progresión), veremos cómo el tiempo para el grupo A es de unas
7 semanas y media, mientras que para el grupo B es de unas 8 sema-
Pregunta muy típica del MIR, en la que nos preguntan acerca del signifi- nas y media, es decir, que para la mediana libre de evento, el tiempo
cado del intervalo de confianza. No olvides que en la hipótesis nula par- entre ambos tratamientos difiere como dice la opción 1, en menos de
timos de que ambos tratamientos son iguales. En este caso, y dado que 2 semanas. El Logrank test es el método favorito para comparar la so-
estamos construyendo un intervalo con la reducción absoluta del riesgo, brevida de grupos, que incluye todo el periodo de seguimiento y no la
que es la diferencia entre el porcentaje de eventos en el grupo control y sobrevida en un punto arbitrario de las curvas (como dice la opción 4).
el porcentaje de eventos en el grupo experimental, un intervalo no signi- El logrank test es un test de significación estadística y no ofrece ningu-
ficativo sería el que incluyese el valor 0. Al hallar el intervalo vemos que na información sobre la magnitud de las diferencias entre los grupos.
no está incluido ese valor y, por ello, es significativo. Para ello se utiliza el hazard ratio que daría una estimación de la aso-
ciación aproximada al significado del riesgo relativo de los estudios
prospectivos.
P204 MIR 2004-2005
Es lógico que el representante intente vender su producto, pero hemos P034 MIR 2013-2014
de ser críticos. Que un estudio nos lo ofrezca un representante no quiere
decir que sea malo. Hemos de valorar si es o no útil y por qué. En las tablas de K-M, en ordenadas no se representan sujetos, sino por-
centajes libres del evento de estudio (opción 1). El mejor estimador del
Aquí nos hablan de un estudio que intenta demostrar la igualdad entre efecto de la diferencia entre 2 KM es el promedio de tiempo hasta la pro-
dos fármacos. De hecho, aparentemente lo consigue, ya que el riesgo gresión, que como se ha discutido en la pregunta 33, en nuestra gráfica
relativo en cuanto a la tasa de curaciones (0,97) es prácticamente igual no supera las dos semanas. Si hay o no diferencias estadísticas entre las
a 1, por lo que en principio serían iguales o casi. Sin embargo, fíjate en gráficas viene determinado por el test de Logrank (p < 0,0001 en nuestro
la amplitud del intervalo: 0,60-1,30. Es tan amplio que el valor superior estudio), si bien la cuantificación “clínica” de dicho efecto la ofrece la ha-
239
DESGLOSES
COMENTADOS MIR
No te confundas con el error tipo II, porque es todo lo contrario. El error va, que en este caso tendría razón. Por consiguiente, estaríamos afirmando
tipo II, o error β, es un “falso negativo”. Es decir, consiste en no detectar que existe una diferencia, cuando la realidad es ésa. La pregunta, por tan-
una diferencia, a pesar de que existe en realidad (respuesta 4, incorrecta). to, queda resuelta; estaríamos hablando de la potencia o poder estadístico
de un test. Recuerda que la potencia de un test se define como la capaci-
dad del test para detectar diferencias, cuando éstas existen. Expresado de
P176 MIR 2009-2010 otra manera: la probabilidad del test de aceptar la hipótesis alternativa
cuando es cierta (o, lo que es lo mismo, rechazar la nula cuando es falsa).
Una pregunta absolutamente básica, prácticamente regalada, ya que la
interpretación de la “p” (error alfa) aparece en el MIR todos los años, sin
excepción. Imagina un contraste de hipótesis que compare dos antibió- P194 MIR 2008-2009
ticos A y B. Al final del estudio, este estudio encuentra diferencias a favor
del tratamiento A. ¿Quiere esto decir que, necesariamente el tratamiento En general, los test paramétricos son preferibles a los no paramétricos,
A es mejor que el B? ¿Estas diferencias son reales o, simplemente, el ha- por su mayor potencia. Sin embargo, tienen unas condiciones de apli-
llazgo ha sido producto del azar? Para responder a esta pregunta habría cación. Si no se cumplen, deberíamos elegir uno no paramétrico. Estas
que comprobar el valor de “p”. Lo que “p” significa es la probabilidad de condiciones son las siguientes:
que las diferencias encontradas puedan justificarse por efecto del azar. • Distribución normal de la variable estudiada.
• Tamaño muestral suficiente (n > 30).
Cuando el valor de “p” es inferior a 0,05, se dice que la diferencia es esta- • No pueden manejar variables ordinales.
dísticamente significativa. En otras palabras, esta diferencia sería difícil-
mente atribuible al efecto del azar. Por ello, ante una distribución distinta a la normal, una variable ordinal
o una muestra insuficiente, debemos elegir un test no paramétrico. La
Cuando detectamos diferencias que, en realidad, son inexistentes, de- respuesta correcta, por tanto, es la 5.
cimos que se ha cometido un error de tipo I. El error tipo I consiste en
rechazar H0 siendo cierta (respuesta 3).
P204 MIR 2008-2009
En otras palabras, implica aceptar diferencias que en realidad no existen,
dando como significativo algo que no lo es. Recuerda que el valor de “p” Pregunta absolutamente típica, sobre una idea que se había pregunta-
coincide con la probabilidad de cometer el error tipo I. do muchas veces en convocatorias previas. Inexcusable acertarla, si se
pretende hacer un buen examen. De hecho, en esta convocatoria, la pre-
gunta fue acertada por el 98% de nuestros alumnos. No obstante, a pesar
P177 MIR 2009-2010 de tratarse de una pregunta repetida (y esto es más que fácil), del resto
de los opositores sólo la acertó un 54%. Por consiguiente, insistimos una
Pregunta muy sencilla sobre los test de contraste de hipótesis. La mecá- vez más en la importancia de ejercitarse con preguntas de convocatorias
nica es siempre la misma: identificar las variables de estudio y, después, previas (y asegurarse de entenderlas).
elegir el test más adecuado.
• Variable 1: presencia de antecedentes de rubéola materna (SÍ/NO), es El error tipo I o alfa es el que se comete cuando, no habiendo diferencias
decir, cualitativa dicotómica. entre dos tratamientos, llegamos a la conclusión de que sí las hay. Es de-
• Variable 2: padecimiento de cataratas congénitas (SÍ/NO), cualitativa cir, consiste en detectar diferencias que no existen en la realidad. Esto,
dicotómica. en otras palabras, implicaría rechazar la hipótesis nula cuando es cierta.
Cuando se estudia la asociación de dos variables cualitativas, el test de Por otra parte, el error tipo II consiste en que, cuando hay diferencias en
elección sería el de la chi-cuadrado (respuesta 3, correcta). realidad, no llegamos a detectarlas.
La medición antes-después en el mismo grupo de pacientes nos obliga dando como significativo algo que no lo es. Recuerda que el valor de p
a elegir un test específico para datos apareados. Si, además, tenemos en coincide con la probabilidad de cometer el error tipo I.
cuenta la naturaleza de las variables, habría que elegir la t de Student
para datos apareados (respuesta 1, correcta). El error tipo II consiste en no detectar diferencias cuando realmente sí exis-
ten. Es como un falso negativo: damos por no significativo algo que sí lo es.
Puedes revisar cuándo se usa cada test en la tabla de la parte superior. La probabilidad de cometerlo se llama beta (la del error tipo I es alfa, o p).
Dicho de otro modo, es la probabilidad de rechazar la hipótesis alternativa
siendo cierta.
P195 MIR 2007-2008
Los conceptos de error tipo I y II están entre los más preguntados en el P196 MIR 2007-2008
bloque de Estadística y Epidemiología. No puedes permitirte fallar pre-
guntas como ésta. Una pregunta bastante difícil, dado que las técnicas de análisis de super-
vivencia nunca habían sido preguntadas en el MIR, hasta esta convocato-
P195 (MIR 07-08) Contraste de hipótesis ria. El término supervivencia puede resultar engañoso en esta pregunta,
pues su significado en estadística no coincide con el que empleamos
coloquialmente. En estadística, se refiere al hecho de que un paciente
sigue en la situación inicial (es decir, sin que se haya producido el evento
a estudio). Este evento, habitualmente es la muerte, de ahí que se hable
de técnicas de análisis de supervivencia. Sin embargo, en nuestro caso
no estamos estudiando el tiempo transcurrido hasta un fallecimiento,
sino hasta la desaparición de los síntomas. Independientemente de cuál
sea el suceso, el manejo estadístico en ambos casos es similar; en ambos
casos se trata del tiempo transcurrido hasta que ocurre determinado su-
ceso.
El error tipo I estriba en rechazar H0 siendo cierta (respuesta 1, correcta). Dado que el tiempo es una variable continua, en principio podría estu-
En otras palabras, implica aceptar diferencias que en realidad no existen, diarse mediante las técnicas de análisis de la varianza o los modelos de
241
DESGLOSES
COMENTADOS MIR
regresión. No obstante, existen dos dificultades importantes para este P220 MIR 2006-2007
planteamiento. En primer lugar, en la mayor parte de los estudios cita-
dos, la variable tiempo no tiene una distribución normal. Al contrario, Pregunta muy fácil acerca del uso de los distintos test estadísticos. Tene-
acostumbra a tener una distribución asimétrica. Por otra parte, existe una mos como variables, por un lado, tres alternativas de tratamiento como
segunda dificultad que justifica un planteamiento específico para estas variable 1 (cualitativa no dicotómica) y, por otro lado, el gradiente de pre-
variables, y es que para observarlas se tiene que prolongar el estudio sión venosa transhepática (cuantitativa continua), siendo de distribución
durante un periodo de tiempo suficientemente largo. Al prolongarlo, es normal. Por eso, hay que usar el análisis de varianza. Tanto la prueba de
muy frecuente que se produzcan pérdidas, que imposibilitan la obser- Wilcoxon como la U de Mann-Whitney son tests no paramétricos equi-
vación del evento. Por ello, en el enunciado de la pregunta insisten en valentes a la t Student (aquí la distribución es normal). La t de Student se
que no han desaparecido los síntomas en algunos pacientes al final del usaría si sólo comparásemos dos tratamientos, ya que se usa si la variable
estudio (es decir, no se ha producido el evento). 1 es cualitativa dicotómica y la variable 2 es cuantitativa continua. El test
exacto de Fisher es una variante del chi-cuadrado, que se usa cuando el
tamaño muestral es pequeño (n < 5).
P197 MIR 2007-2008
Una pregunta muy fácil sobre la elección del test más adecuado para un P193 MIR 2005-2006
contraste de hipótesis. La mecánica es siempre la misma, comenzando
por identificar las variables en estudio. Pregunta de dificultad media, dado que por primera vez preguntan por
• Variable 1: muestra de procedencia (placebo/nuevo fármaco) Cua- un test no paramétrico. Las pruebas de asociación estadística se pre-
litativa dicotómica. guntan mucho en el examen MIR. Siempre han preguntado por pruebas
• Variable 2: presión arterial media (numérica) Cuantitativa. paramétricas, pero fíjate en que en la pregunta de este año especifican
al final que la distribución NO tiene una distribución normal. Hemos de
Teniendo en cuenta las dos variables y su naturaleza, el que corresponde pensar, por tanto, en usar un test NO paramétrico. Los tests NO paramé-
sería el test de la t de Student para datos independientes, puesto que es- tricos son pruebas que NO dependen de la distribución y que NO necesi-
tamos hablando de dos grupos distintos. Recuerda que, si estuviésemos tan la normalidad de la población.
comparando tres o más muestras, deberíamos haber empleado el ANOVA.
Una vez visto que necesitamos una prueba NO paramétrica, tenemos que
ver qué tipo de variables nos ofrecen para decantarnos por un test. En
P209 MIR 2007-2008 este ensayo clínico la variable 1 es cualitativa (tres tratamientos: placebo,
tratamiento establecido, tratamiento nuevo) y la variable 2 es cuantita-
Ante el resultado de un contraste de hipótesis, hemos de plantearnos si tiva (glucemia). En consecuencia, el test a utilizar es el de Kruskal-Wallis.
las diferencias observadas son atribuibles al azar, o si, por el contrario, po-
demos asumir que las diferencias son reales (aceptamos H1). Cuando la
probabilidad de que el azar explique un resultado es pequeña, entonces P194 MIR 2005-2006
se dice que se ha alcanzado significación estadística. Esta probabilidad
viene dada por p. Lo habitual es considerar un resultado como signifi- Pregunta muy fácil y básica de estadística. El objeto de la estadística es
cativo cuando p < 0,05. En este caso, dado que p = 0,034, esto significa determinar cuál es la probabilidad de que los resultados obtenidos en un
que el azar justificaría las diferencias encontradas con una probabilidad estudio se puedan explicar por el azar. Esta probabilidad se corresponde
del 3,4%. con el grado de significación.
Previamente al ensayo de una hipótesis, se fija la probabilidad máxima P210 MIR 2004-2005
de que los resultados diferentes observados entre los dos protocolos
puedan ser debidos al azar (hipótesis nula cierta: NO hay diferencias), Pregunta sencilla sobre los tests de contraste de hipótesis. En este tipo de
que suele ser por convenio del 5%. A continuación, se calcula cuál es preguntas, siempre has de seguir la misma mecánica: identificar las dos
la probabilidad de que las diferencias que nosotros hemos observado variables, y después elegir bien el test. Para esta pregunta, sería:
puedan ser explicadas por azar. Esta probabilidad es el valor de la p o • Variable 1: Tensión arterial Cuantitativa.
grado de significación estadística. En este caso la p es mayor de 0,05, lo • Variable 2: Colesterol Cuantitativa.
cual significa que no existe suficiente evidencia para decir que ambos
tratamientos son diferentes, ya que existe una probabilidad mayor de la Teniendo en cuenta las dos variables y su naturaleza, el que corresponde
exigida (0,05) de que las diferencias puedan deberse al azar. sería el test de la correlación de Pearson. Si tienes alguna duda, puedes
consultar la tabla del comentario de la pregunta 193, MIR 07-08.
La opción 1 es incorrecta, puesto que el análisis de subgrupos puede oca-
sionar problemas, especialmente cuando no se tiene previsto desde el
principio. Produce comparaciones múltiples, y al aumentar el número de P212 MIR 2004-2005
comparaciones, aumenta el número de resultados falsamente positivos.
El valor de p se conoce como nivel de significación estadística. Represen-
El hecho de que el resultado no sea estadísticamente significativo se ta la probabilidad de llegar a estos resultados por efecto del azar. Esto
puede deber a un tamaño de la muestra insuficiente. El cálculo del ta- quiere decir que, si en realidad no hubiesen diferencias entre los trata-
maño muestral se realiza antes de comenzar el estudio, así que lo que se mientos, la probabilidad de llegar a este resultado equivaldrían al valor
puede hacer en este caso es lo que expone la opción 3: este estudio nos de p (en este problema, menos del 4,5%). Cuando p es menor de 0,05, se
puede servir para realizar uno nuevo en el que se pueda predeterminar dice que existe significación estadística, es decir, el resultado sería difícil
mejor el tamaño muestral. de justificar por el azar (menos del 5% de probabilidad).
Es una pregunta larga y complicada de entender; has de leerla despacio Pertenecer a uno de los tres tratamientos es una variable cualitativa (tra-
para no perderte. No olvides dominar la interpretación de la p y de los tamiento 1, 2 o 3). La otra variable, el nivel de glucosa, es cuantitativa
intervalos de confianza en un contraste de hipótesis para el examen MIR. continua. Dado que nos dicen que la distribución es normal, en principio
Es uno de los temas más preguntados en los últimos años. no parece necesario recurrir a ningún test no paramétrico. Por tanto, la
respuesta correcta es el análisis de la varianza (respuesta 3). Si nos hubie-
Recuerda que el valor de la p en un contraste de hipótesis NUNCA de- sen hablado de dos tratamientos, la correcta sería la t de Student.
muestra nada, sólo da la probabilidad de que los resultados hallados
sean debidos al azar si la hipótesis nula fuera cierta (en nuestro caso, la
hipótesis nula es que no existen diferencias entre los dos tratamientos), P145 MIR 2003-2004
es decir, la probabilidad de cometer un error tipo I (opción 1 falsa). El
valor de la p nos habla de una diferencia estadísticamente significativa Los tests estadísticos paramétricos han de conocerse obligatoriamen-
entre los dos tratamientos, pero no siempre esta diferencia será clínica- te en la preparación del examen. En esta pregunta las dos variables a
243
DESGLOSES
COMENTADOS MIR
contrastar son, por una parte, la media de colesterol (mg/dl) (VARIABLE desea estimar. Para ello nos basamos en estudios previos. Necesitaremos
CUANTITATIVA CONTINUA) y la otra variable es la presencia o no de ACV saber la precisión que deseamos (1 unidad de IMC), el nivel de confianza
(VARIABLE CUALITATIVA DICOTÓMICA). En consecuencia, el test que hay (5% habitualmente) y, según sea una proporción o una media, como en
que aplicar es la prueba t de Student para datos independientes. nuestro caso, la proporción esperada o la varianza (opción 2).
Esta pregunta intenta saber si se domina conceptualmente el contraste de Los factores que influyen en el tamaño muestral han sido preguntados
hipótesis. El contraste de hipótesis intenta solventar una duda: las diferen- en el MIR de forma incesante. Esta pregunta no es muy distinta de otras
cias encontradas entre los dos grupos a comparar son o no atribuibles al que ya han aparecido, por lo que debe considerarse fácil:
azar. Es decir, si a la intervención realizada se le puede atribuir efecto clínico • Opción 1. Para detectar pequeñas diferencias (en este caso, de mor-
o no. Sin embargo, lo que hemos de tener claro es que el contraste de hi- talidad), haría falta un tamaño muestral muy grande. Por el contrario,
pótesis no confirma una opción, sino que establece probabilidades de que cuando se trata de estudiar diferencias grandes, la muestra no preci-
ocurra. El contraste de hipótesis no aumenta el valor predictivo, sino que sa ser tan numerosa.
lo cuantifica. Si bien la cuantificación de los errores I y II es un instrumento • Opción 2. Cuanto más variable sea el parámetro que nos interesa
fundamental en el proceso de contraste, no es su objetivo fundamental. medir, mayor será el número de pacientes necesario para ese estu-
dio.
• Opción 3. Si estamos usando dosis muy similares, es de suponer que
T16 Análisis de correlación y de regresión las diferencias serán también pequeñas. Sucede lo mismo que en la
respuesta 1: detectar diferencias pequeñas precisa muestras grandes.
• Opción 5. Cuando mayor sea la potencia del estudio (menor error
P207 MIR 2013-2014 beta), más sujetos serán necesarios.
El análisis de correlación nos sirve para estudiar la relación entre dos va- La respuesta correcta es la 4. Nos están diciendo que vamos a asumir un
riables cuantitativas. El coeficiente de correlación lineal de Pearson mide error alfa menos exigente de lo habitual (0,1 en vez de 0,05). Por lo tanto,
la intensidad con la que se relacionan esas variables, ya sea positiva (al el tamaño muestral necesario será menor que si quisiéramos un error alfa
aumentar una aumenta la otra) o negativa (al aumentar una disminuye la más pequeño.
otra). Sus valores van de -1, que indica una perfecta asociación negativa,
a +1, que indica una perfecta correlación positiva. El punto 0, justo en
medio, indica que no hay correlación lineal. P215 MIR 2006-2007
Pregunta fácil acerca del cálculo del tamaño muestral. Entre los factores
P194 MIR 2007-2008 que influyen en este cálculo, siendo un estudio descriptivo en el que va-
mos a estimar un determinado parámetro, se encuentra la variabilidad
Una pregunta sencilla sobre la regresión lineal. El análisis de regresión es de dicho parámetro (previamente conocida o aproximada según datos
útil para determinar una posible forma de relación entre dos variables, preexistentes o estudios pilotos), de la precisión con que deseemos ob-
que podrá predecirse en mayor o menor medida mediante una ecuación. tener esa estimación (amplitud del intervalo de confianza, a mayor preci-
En este caso, se está empleando la regresión lineal, que nos dará una sión mayor tamaño muestral), nivel de confianza y proporción esperada
ecuación como la siguiente: de la variable en la población. El error beta sólo influiría como factor si
nos encontrásemos ante un test de contraste de hipótesis, puesto que
Y = a + bX recuerda que es el inverso de la potencia, que es lo que nos permite de-
tectar las diferencias si existen.
El coeficiente a representa el punto en el que la línea corta el eje vertical
(valor de Y para X = 0). El coeficiente b (0,08 en nuestro caso) es la pen-
diente de la recta que muestra la cantidad que cambia Y (PCR) por una P203 MIR 2005-2006
unidad de cambio de X (número de articulaciones afectas).
Pregunta fácil acerca de un tema de moda en las últimas convocatorias.
La predeterminación del tamaño muestral se ha preguntado en las tres
T17 Tamaño muestral últimas convocatorias. Para contestar esta pregunta, lo primero que
tenemos que analizar es el tipo de estudio o diseño que nos plantean.
Como se trata de un ensayo clínico, sabemos que comportará una com-
P200 MIR 2013-2014 paración de los grupos de tratamiento. Así sabemos que tenemos que
tener en cuenta:
En el cálculo del tamaño muestral en la estimación de parámetros, el ta- • Objetivo del estudio y la variable principal.
maño de la muestra dependerá de la variabilidad del parámetro que se • Magnitud del efecto que queremos detectar.
245