Sunteți pe pagina 1din 47

METAANLISIS

Notas
ndice
1. INTRODUCCIN .............................................................................................................2
2. TIPOS DE REVISIONES BIBLIOGRFICAS CUANTITATIVAS .....................................3
2.1. Conteo de votos (vote-counting) ................................................................................................................ 3
2.2. Mtodos de probabilidad combinada ......................................................................................................... 3
2.3. Mtodo del mnimo valor de p .................................................................................................................... 4
2.4. Test de probabilidad combinada (2) ........................................................................................................... 4
2.5. Transformacin z (3)................................................................................................................................... 4
2.6. Transformacin z ponderada (4) ................................................................................................................ 4
2.7. Metaanlisis moderno (5) ........................................................................................................................... 5
2.8. Claroscuros (6) ........................................................................................................................................... 5

3. QU ES EL METAANLISIS?.......................................................................................5
3.1. Objetivos..................................................................................................................................................... 6
3.2. Justificacin ................................................................................................................................................ 6

4. ETAPAS DE UN METAANLISIS ...................................................................................7


5. LIMITACIONES DE LA TCNICA METAANALTICA ....................................................16
5.1. Limitaciones metodolgicas del metaanlisis .......................................................................................... 17
5.2. Sesgo de publicacin ............................................................................................................................... 17

6. METAANLISIS CUALITATIVO ....................................................................................18


7. METAANLISIS CUANTITATIVO .................................................................................18
7.1. Modelos de riesgo .................................................................................................................................... 18

8. MTODOS ESTADSTICOS PARA COMBINAR ESTUDIOS .......................................18


8.1. Modelo de efectos fijos............................................................................................................................. 19
8.2. Modelo de efectos aleatorios.................................................................................................................... 20
8.3. Heterogeneidad ........................................................................................................................................ 21
8.4. Meta-regresin.......................................................................................................................................... 22
8.5. Anlisis de subgrupos y de sensibilidad................................................................................................... 22
8.6. Presentacin de resultados ...................................................................................................................... 23
8.7. Mtodo de Mantel-Haenszel-Peto para obtener un estimador combinado del efecto de un grupo de
ensayos clnicos incluidos en un metaanlisis ................................................................................................ 24
8.8. Odds ratio ajustada de Mantel-Haenszel ................................................................................................. 25

9. CLCULO DEL TAMAO DEL EFECTO ......................................................................27


9.1. Definicin .................................................................................................................................................. 27
9.2. Fuente de datos........................................................................................................................................ 27
9.3. Tamaos de efecto basados medias y desviaciones tpicas ................................................................... 27
9.4. d de Hegde (45)........................................................................................................................................ 27
9.5. d de Cohen (46)........................................................................................................................................ 28
9.6. Response ratio, R (47) ............................................................................................................................. 28
9.7. Tablas de contingencia 2 x 2.................................................................................................................... 28
9.8. Risk difference, RD (48) ........................................................................................................................... 29
9.9. Odds ratio OR (49) ................................................................................................................................... 29
9.10. Correlaciones.......................................................................................................................................... 29
9.11. Transformacin z de Fisher (2) .............................................................................................................. 29
9.12. Recomendaciones para presentacin de datos ..................................................................................... 30

10. COMBINACIN DE RESULTADOS ............................................................................30


10.1. Tamao del efecto acumulado ............................................................................................................... 30
10.2. Significacin del efecto acumulado ........................................................................................................ 31
10.3. Heterogeneidad total (50)....................................................................................................................... 31
10.4. Fuentes de heterogeneidad.................................................................................................................... 31
10.5. Predictores categricos .......................................................................................................................... 31

10.6. Heterogeneidad dentro y entre grupo (50) ............................................................................................. 32


10.7. Predictores continuos (51)...................................................................................................................... 33
10.8. Efectos fijos y aleatorios (52) ................................................................................................................. 34
10.9. Modelo lineal general ............................................................................................................................. 35

11. EVALUACIN DEL SESGO DE PUBLICACIN .........................................................36


11.1. Mtodos grficos .................................................................................................................................... 36
11.2. Mtodos estadsticos.............................................................................................................................. 37

12. CUALIFICACIN DE EVIDENCIA Y GRADO DE RECOMENDACIN ......................38


13. METAANLISIS DE PACIENTES INDIVIDUALES......................................................39
14. METAANLISIS BAYESIANO .....................................................................................39
15. COMENTARIOS SOBRE EL METAANLISIS ............................................................39
16. VALIDEZ DEL METAANLISIS: COMPARACIN CON EL ENSAYO CLNICO ........40
17. CONCLUSIONES ........................................................................................................40
18. GLOSARIO ..................................................................................................................41
19. BIBLIOGRAFA............................................................................................................43
20. BIBLIOGRAFA ADICIONAL........................................................................................45

1. Introduccin
A mediados del siglo XIX Bichat y Magendi preconizaban un cambio sustancial en la manera de establecer
las bases clnicas del diagnstico precoz, el pronstico y el tratamiento de las enfermedades que podemos
considerar como la base de lo que hoy conocemos como medicina basada en la evidencia (MBE) que surgi
formalmente hace 20 aos en el seno de la gestin sanitaria como mtodo para facilitar la toma de
decisiones y consecuentemente racionalizar la prctica clnica.
El rpido avance de las tcnicas diagnsticas y teraputicas producido en los ltimos aos dificulta
alcanzar una experiencia personal vlida y segura como "patrn" en la toma de decisiones clnicas. De ah
la necesidad de disponer de mtodos que faciliten la puesta en prctica con cotidianidad de la MBE. Un
mtodo bsico es el metaanlisis que, a travs de mtodos estadsticos, sintetizando los resultados de
estudios independientes puede proporcionar estimaciones de los efectos de la atencin sanitaria ms
precisas y conclusiones ms contundentes que las derivadas de los estudios individuales incluidos en una
revisin tradicional de la literatura mdica.
El trmino metaanlisis fue empleado por primera vez por G.V. Glass en 1976, para referirse al anlisis
estadstico del conjunto de resultados obtenidos en diferentes ensayos clnicos sobre una misma cuestin,
con la finalidad de evaluarlos de manera conjunta. Fue inicialmente aplicado en ciencias sociales y
psicologa. A partir de la dcada de los ochenta se comenz a aplicar de manera creciente en medicina, y
en la actualidad son muy frecuentes los artculos que describen resultados de metaanlisis en publicaciones
mdicas.
En medicina el metaanlisis se aplica sobre todo en las siguientes situaciones:

para comprobar la consistencia de los ensayos en los que se ha evaluado una intervencin determinada
y generar un estimador del efecto, que en principio debe tener mayor poder estadstico que el obtenido
en cada ensayo por separado;

para comprobar la consistencia de los resultados de diferentes ensayos clnicos sobre una misma
intervencin en una misma patologa;

para identificar con mayor precisin los subgrupos de pacientes con posibilidades de responder de
manera diferente del promedio a una determinada intervencin;

para calcular cuntos pacientes sera necesario incluir en futuros ensayos clnicos sobre un problema
determinado; y

para cuantificar la incidencia de efectos no deseados, que, por ser baja, requiere un nmero elevado de
pacientes.
La idea de agregar los datos de diferentes ensayos para examinar este tipo de problemas es sugerente, y
ha permitido grandes avances en el conocimiento de la historia natural de numerosas patologas y de sus
posibles tratamientos. La Colaboracin Cochrane (vase Colaboracin Cochrane en el Glosario) desarrolla
2

una labor de recopilacin y anlisis de ensayos clnicos tan imprescindible como ejemplar, y en su web se
puede encontrar amplia informacin sobre sus mtodos de trabajo y una extraordinaria base de datos, en
forma de metaanlisis, sobre numerosos aspectos de la teraputica farmacolgica y de otras intervenciones
preventivas y educativas en salud.

ao
desarrollo

autor

evento

1932

Fisher

Descripcin del mtodo analtico para combinar valores de la p

1937

Cochan

1959
1972
1976
1977

Mantel y Haenszel
Peto y Peto
Glass
Peto y cols.

Descripcin del mtodo analtico para combinar valores de la z


equilibrados
Descripcin del mtodo analtico para obtener valores de la odds ratio
Modificacin del mtodo de Cochran para obtener una prueba log-rank
Uso del trmino metaanlisis
Descripcin del mtodo para combinar datos de diferentes ensayos
clnicos. Uso del trmino pooling

utilizacin
1974

Stjernsward

Uso del mtodo de Mantel-Haenszel para combinar distintos ensayos


clnicos
1983
Tran
Uso de la prueba log-rank de Cochran-Peto para combinar distintos
ensayos clnicos
1985
Yusuf
Uso del trmino overview
1985
Sacks y cols.
Uso de la prueba log-rank de Cochran-Peto para combinar distintos
ensayos clnicos
Tabla 1. Cronologa del desarrollo del concepto y utilizacin de los metaanlisis en la literatura mdica.
Modificado de (1).

2. Tipos de revisiones bibliogrficas cuantitativas


El objetivo central de una revisin sistemtica es valorar el grado de evidencia que hoy existe para
responder a una pregunta de investigacin sobre un tema (etiologa, diagnstico, tratamiento, etc.). El
metaanlisis se centra en la estimacin cuantitativa de los parmetros que se utilizan para valorar dicha
evidencia.

2.1. Conteo de votos (vote-counting)


1. Se observan los resultados estadsticos de un conjunto de trabajos.
2. Los resultados se asignan a tres categoras: significativos en la direccin esperada, significativos en la
direccin no esperada, y no significativos.
3. Se determina la proporcin de resultados de cada categora.
4. La hiptesis es evaluada sobre la base de esa proporcin.
5. Si slo hay dos categoras se puede emplear una prueba de signos (distribucin binomial)
Ventaja:
simplicidad
Inconvenientes: conservadores;
poca potencia estadstica;
no ofrece informacin sobre la magnitud del efecto.

2.2. Mtodos de probabilidad combinada


1. Estos mtodos combinan resultados estadsticos de un conjunto de estudios basados en valores
exactos de probabilidad.
2. Por este motivo, tienen en cuenta los tamaos de muestra de los diferentes trabajos

3. Hay al menos 18 mtodos que usan diferentes distribuciones estadsticas (uniforme, normal, t de
Student,

2 , logstica).

2.3. Mtodo del mnimo valor de p


Hay efecto significativo si al menos un estudio tiene un nivel de significacin menor que el nivel crtico

= 1 (1 *)

* = 0, 05
2.4. Test de probabilidad combinada (2)
1. Sean n estudios con valores de significacin individuales p i ;

2. Se genera un estadstico que se ajusta a una


frmula:

con 2 n grados de libertad, usando la siguiente

F2 = 2 log ( p i )
i =1

3.

2
F

es comprobada frente a la distribucin de

cuadrado para ver si hay un efecto significativo de

los datos.
Inconveniente: es muy sensible a valores de p i bajos (asimetra).

2.5. Transformacin z (3)


1. Sean k estudios, cada uno con un valor z i de puntuacin z para los valores individuales de
significacin1;
2. Se genera un estadstico que se ajusta a una normal, usando la siguiente frmula:
k

zs =

zi
k

i =1

3. La significacin del valor de z s es comprobada frente a una distribucin normal.

2.6. Transformacin z ponderada (4)


1. Es un mtodo que generaliza el anterior para dar diferente peso w i a cada estudio dependiendo de su
potencia;
2. Se genera de nuevo un estadstico que se ajusta a una normal, usando la siguiente frmula:

zw =

zi

i =1

i =1

2
i

3. Las ponderaciones w i se calculan como el recproco del error estndar cuadrtico del tamao del
efecto;
4. As, se tiene en cuenta los grados de libertad especficos de cada estudio.

La puntuacin z se halla a partir de una distribucin normal con media x = 0 y desviacin tpica s = 1 y
corresponde a los valores correspondientes a una probabilidad dada].

Usar z s o z w es un poco cuestin de gusto, ya que los valores de la p estn ya ponderados por el
tamao muestral. Si la hiptesis nula es globalmente cierta, entonces todos los valores de la p
deberan estar uniformemente distribuidos entre 0 y 1 independientemente del tamao muestral.

2.7. Metaanlisis moderno (5)


1. Combina las medidas de los efectos de estudios individuales dentro de una estima de efecto general, y
usa esta estima para determinar la significacin;
2. Un resultado significativo implica que hay soporte estadstico para la hiptesis que es testada;
3. Esta determinacin se hace calculando un tamao de efecto general y determinando si este efecto es
mayor que el esperado por azar;
4. La realizacin de un metaanlisis implica dos fases:
(a) Hay que calcular el tamao del efecto y su varianza para cada estudio;
(b) Hay que combinar esos efectos en un modelo sinttico estadstico.
5. Opcionalmente, se puede comprobar la heterogeneidad entre estudios, para ver si provienen de ms de
una poblacin estadstica.

2.8. Claroscuros (6)


Ventajas:

Inconvenientes:

impone una disciplina til en el proceso de sintetizar informacin cientfica;


representa una forma ms sofisticada de revisar los descubrimientos cientficos que los
mtodos anteriores;
es capaz de encontrar relaciones que permanecen oscuras;
representa una forma organizada de manipular informacin proveniente de un gran
nmero de estudios independientes.
su dificultad debido a lo complicado de la base conceptual y la metodologa estadstica
empleada;
la mezcla de estudios de diferente naturaleza;
la mezcla de estudios de diferente calidad metodolgica.

3. Qu es el metaanlisis?
El metaanlisis es la sntesis formal, cualitativa y cuantitativa, de diferentes investigaciones clnicas
controladas aleatorizadas, como por ejemplo los ensayos clnicos, que poseen en comn una misma
intervencin y un mismo punto final de resultado y que se agrupan con la intencin de sintetizar la evidencia
cientfica con respecto a la direccin del efecto producido por la intervencin en anlisis. Expresado de otra
manera, el metaanlisis es una estrategia de revisin sistemtica que pretender responder a diversas
cuestiones y que es especialmente til cuando los resultados de varios estudios son discordantes con
respecto a la magnitud de la direccin de un efecto, cuando los tamaos muestrales de los estudios
individuales es demasiado pequeo para detectar dicho efecto como significativo, o cuando un ensayo
clnico de gran tamao es demasiado costoso en trminos econmicos o de tiempo. El metaanlisis es un
procedimiento de investigacin que mejora la calidad de las revisiones bibliogrficas, dado que provee los
elementos para realizarlas metdicamente y arrojar resultados claramente interpretables.
El metaanlisis es una aproximacin ms estructurada a la revisin de la literatura de lo que lo son las
revisiones tradicionales y en esta medida pueden ser de ms ayuda para establecer principios cientficos.
Los resultados del metaanlisis permiten planificar futuros ensayos clnicos sobre temas similares, ya que
proporcionan la evidencia de los efectos que se pueden esperar de una intervencin, permitiendo por ello
mejores clculos del tamao muestral. Aportan tambin elementos de juicio para generar nuevas hiptesis o
decidir si hacen falta nuevos ensayos clnicos sobre el tema.
Los metaanlisis pueden ser utilizados en la aprobacin del uso de intervenciones por parte de organismos
reguladores y en la docencia, ya que posee capacidad de mostrar sintticamente la evidencia cientfica
disponible.
Otros trminos que se han utilizado para los metaanlisis incluyen, overview, summary studies, evaluation
research y quantitative synthesis. En general, parece que debera reducirse el uso de estos trminos, dada
la confusin que pueden generar.

El metaanlisis es un procedimiento estadstico que integra los resultados de diversos estudios


independientes que se consideran combinables. Un metaanlisis bien realizado permite una evaluacin ms
objetiva de la evidencia que la que se obtiene con una revisin narrativa tradicional, proporciona una
estimacin ms precisa del efecto del tratamiento y puede explicar la heterogeneidad entre los resultados
de los estudios individuales. Por otra parte, un metaanlisis mal realizado puede estar sesgado debido a la
exclusin de estudios relevantes o a la inclusin de estudios inadecuados. En general, los anlisis errneos
pueden evitarse si se siguen una serie de principios bsicos.
Metaanlisis sensu lato
Mtodo cuantitativo de sintetizar, resumir o revisar sistemticamente una serie de resultados de estudios
empricos
Los estudios deben:

Ser empricos, no tericos;

Producir resultados cuantitativos, en vez de cualitativos;

Examinar las mismas cuestiones tericas;

Ser susceptibles de ser configurados en formas estadsticas comparables (por ejemplo,


correlaciones, proporciones, tamaos de efectos, etc.
Los metaanlisis podran intentar resolver cuestiones analizadas mediante estudios observacionales,
aunque ms clsicamente se utilizan para la valoracin de estudios experimentales.

3.1. Objetivos
Cualquier problema clnico es susceptible de ser analizado mediante el metaanlisis. Los objetivos, en
cualquier caso, deben estar planteados con mucha claridad. Es obligatorio establecer en la fase del diseo
un protocolo de trabajo que formalice el desarrollo del estudio. En la tabla 2 se detallan los objetivos
generales y especficos del metaanlisis.
1. Comprobar la hiptesis relacionada con el efecto (en particular, su direccin) de la intervencin
bajo anlisis;
2. Aumentar la precisin de los estimadores del efecto (en particular, su magnitud) de la
intervencin bajo anlisis, intervalos de confianza ms reducidos;
3. Evaluar la consistencia entre los ensayos clnicos de similares intervenciones inherentes al tema
y generar un estimador del efecto ms eficiente;
4. Evaluar la consistencia entre ensayos clnicos de diferentes intervenciones realizadas con el
mismo fin y generar un estimador del efecto de esos cuidados;
5. Identificar con mayor precisin subgrupos de pacientes que tendran mayor probabilidad de verse
afectados por la intervencin, ya sea en sentido favorable o desfavorable;
6. Calcular los requerimientos, en cuanto a tamao muestral, de los futuros ensayos clnicos a
realizar en el mismo campo.
Tabla 2. Objetivos generales y especficos del metaanlisis.

3.2. Justificacin
Aunque es poco probable que dos ensayos clnicos tengan la misma magnitud, si es frecuente que el efecto
de la intervencin lleve, por azar, la misma direccin. Por ello, es til resumir en un anlisis conjunto las
evidencias presentadas por estudios independientes, para reducir la probabilidad de que el azar conduzca a
conclusiones errneas. Esto ocurre porque los efectos de las intervenciones suelen ser solo moderados,
con lo que la probabilidad de apreciarlos equivocadamente es grande (las intervenciones que se prueban
actualmente no tienen efectos superiores al 1530 % de reduccin de dao o aumento del beneficio). Estas
pequeas modificaciones obligan a ser muy cautos en la interpretacin de los resultados, dado que con
estas cifras todos los factores capaces de originar sesgos en la estimacin de los efectos pueden ser causa
de importantes errores en las apreciaciones, ya que con efectos de escasa magnitud, stos pueden pasar
fcilmente inadvertidos o ser engaosamente magnificados.
Los errores que se pueden cometer en metaanlisis son iguales que en cualquier otro tipo de estudio
epidemiolgico: aleatorios y sistemticos. El sesgo del azar se produce cuando no se incluyen suficientes
pacientes en el estudio.

Dado que se trata de estudios retrospectivos, existe la posibilidad de cometer todos los sesgos inherentes a
este tipo de diseo, ya que cuando conocemos los resultados es fcil cometer sesgos. Tambin hay
grandes posibilidades de cometer sesgo de seleccin, tanto por el hecho de que no hayamos hecho una
revisin exhaustiva como por la tendencia que existe a publicarse solamente aquellos resultados que
coinciden con la tendencia ms vigente (son responsables tanto los autores que no envan sus resultados
como los editores que no los consideran para su inclusin en las revistas mdicas).
Cuando las publicaciones son escasas, pueden incluirse en el metaanlisis poblaciones e intervenciones
muy diferentes, siendo el estudio criticable; sin embargo, debe considerarse que lo que interesa conocer es
la direccin de los efectos ms que su magnitud y esta direccin se alterar poco porque se aplique la
intervencin a diferentes poblaciones o las condiciones sean distintas en los estudios. Lo que pretende el
metaanlisis es evaluar tendencias en el conjunto de los estudios, que por separado podran no apreciarse.

4. Etapas de un metaanlisis
Los metaanlisis deben considerarse como verdaderos proyectos de investigacin en los que las unidades
de observacin son los estudios originales y que requieren una adecuada planificacin, una considerable
dedicacin de recursos (especialmente humanos) y la elaboracin de un protocolo en el que se detalle cada
una de las etapas del proceso que se describen a continuacin (vase figura 1).
(a) Establecimiento del problema y la hiptesis que se desea valorar. La formulacin del problema es
crucial en estudios clnicos y observacionales, definiendo de forma clara y precisa tanto la respuesta
como los posibles factores de confusin. Las mejores preguntas son aquellas que se refieren a algn
tema para el cual existe incertidumbre colectiva, y cuya respuesta puede cambiar conductas futuras.
Para formular correctamente una pregunta destinada a una revisin sistemtica deben incluirse en la
misma cuatro componentes: el tipo de sujeto o situacin sanitaria o administrativa a estudiar, el tipo de
estudio (teraputico, diagnstico, de riesgo, de pronstico o preventivo), el tipo de control utilizado para
la comparacin y el resultado o efecto a considerar.
El investigador debe extraer de los trabajos datos consistentes y elegir las tcnicas estadsticas ms
adecuadas para su anlisis. De este modo, el protocolo de un metaanlisis debe incluir una breve
resea de los antecedentes del problema que se pretende abordar con la investigacin, plantear
claramente el problema cientfico, que a menudo se expresa en forma de preguntas e hiptesis,
formular los objetivos y delimitar todas aquellas especificaciones sobre la recogida de la informacin y
de datos, as como su anlisis. Una correcta definicin y delimitacin de cada uno de estos aspectos
facilitar enormemente las siguientes etapas del proceso.

Figura 1. Esquema general de las etapas de un metaanlisis.


7

(b) Cuantificacin de los efectos. Antes de realizar el metaanlisis, el investigador ha de establecer las
medidas que se van a utilizar para describir y representar los efectos, y as poderlos agregar.
Obviamente, estas medidas van a depender tanto del tipo de respuesta (binaria o continua) como del
diseo del estudio (experimental u observacional) utilizados en los estudios primarios.
Respuesta binaria. Este tipo de respuesta solamente presenta dos categoras de resultado (muerte o
supervivencia, enfermos o sanos, etc.). En estudios con este tipo de respuesta, las medidas de efecto
ms comnmente utilizadas son la tasa de riesgos (o riesgo relativo), la razn de ventajas (odds ratio), o
la diferencia de riesgos.
Respuesta continua. En la literatura mdica existen multitud de estudios en los cuales la variable
respuesta est medida en escala continua (tensin sistlica, nivel de colesterol, etc.). Si las respuestas
de todos los estudios estn medidas en la misma escala, entonces la medida del efecto (o tamao del
efecto, effect size) ser simplemente la diferencia entre las medias de los grupos. Si no fuese as, es
decir, si los estudios miden la respuesta en diferente escala, habr que considerar en su lugar una
diferencia estandarizada de medias.
(c) Bsqueda de la informacin. En general, de cada uno de los estudios que pueden intervenir en el
metaanlisis, interesa extraer informacin referente a los siguientes aspectos:

Las caractersticas de los estudios: tales como tipo de diseo, caractersticas de la muestra de
estudio (edad, gnero, factores pronsticos, etc.), tipo de intervencin (principio activo, pauta,
dosis, etc.), medidas del resultado consideradas, tiempo de seguimiento y otras caractersticas
que permitan valorar el grado de homogeneidad o heterogeneidad de los estudios que han de
combinarse.

La calidad metodolgica de los estudios: existen distintos instrumentos que permiten valorar
cualitativamente o cuantitativamente la posible existencia de sesgos y, por lo tanto, la llamada
validez interna de los estudios originales.

Los resultados de los estudios: medidas del efecto observadas (odds ratio, riesgo relativo,
diferencia de riesgos, diferencia de medias, etc.) con sus indicadores de variabilidad (intervalos
de confianza) y nivel de significacin estadstica.
(d) Localizacin de los estudios de investigacin. La validez de un metaanlisis depende, en buena medida,
de lo exhaustivo con que se identifique y localice los trabajos originales.
Fuentes de informacin. Para la realizacin de bsquedas bibliogrficas puede partirse de fuentes
informales, fuentes primarias y fuentes secundarias.

Las fuentes informales estn constituidas por archivos personales, libros, artculos de revisin,
contactos con expertos, trabajos en congresos, etc.;

Las fuentes primarias son las revistas conocidas relacionadas con el tema y la realizacin de
revisiones ascendentes (a partir de las citas bibliogrficas de los artculos que ya se tienen y,
as, sucesivamente);

Las fuentes secundarias las constituyen las bases de datos automatizadas, que son
fundamentales para la realizacin de cualquier bsqueda bibliogrfica, pero, a pesar de su gran
importancia no son perfectas porque slo incluyen revistas dejando a un lado todo lo que se
denomina "literatura gris" (tesis doctorales, comunicaciones a congresos, informes hechos para
administraciones pblicas, trabajos no publicados, etc.).
Bases de datos bibliogrficas. Hay mucha literatura especializada en bases de datos bibliogrficas y
cmo acceder a ellas. Dickersin (7) elabor un algoritmo para encontrar todos los artculos que se
publican de ensayos clnicos, aunque por este mtodo se obtienen muchos falsos positivos, lo que
obliga a la revisin posterior de todo lo encontrado como nica manera de excluir lo que no interesa.
Las bases automatizadas ms importantes son MEDLINE, EMBASE, SCISEARCH o Science citation
index (base de citaciones tiles para aquellas no incluidas en MEDLINE) y las bases COCHRANE 5,
surgidas a partir de la Colaboracin Cochrane, formada por grupos de expertos que revisan temas
concretos y lo envan al Centro de Baltimore, que mantiene un registro internacional de ensayos
clnicos.
La recuperacin de la bibliografa es una tarea larga y laboriosa. Requiere la recopilacin de todos los
trabajos localizados, lo cual puede ser ms o menos complejo ya que los artculos pueden ser lenta
pero eficazmente recuperados en bibliotecas nacionales, extranjeras o a travs de peticiones al autor,
pero la literatura gris suele ser ms difcil de conseguir.

(e) Criterios de inclusin/exclusin de los estudios. No todos los trabajos recuperados podrn incluirse en el
metaanlisis. Habr que establecer, pues, los requisitos que se van a exigir a un estudio para consentir
su inclusin.
Como en cualquier estudio estadstico, el diseo muestral es un determinante de la utilidad y validez
cientfica de los resultados. En un metaanlisis, las unidades muestrales son los resultados de estudios
publicados o no publicados. Los criterios de inclusin y exclusin dan una definicin de caso para los
resultados que se van a utilizar en la sntesis.
En este paso de realizacin de un metaanlisis es donde puede incurrirse en el segundo de los sesgos
importantes, el sesgo de seleccin. Para disminuir el riesgo de cometerlo se ha de procurar que la
revisin de los estudios la realicen varios evaluadores de forma ciega o enmascarada (sin conocer la
revista, ao de publicacin, los autores, las instituciones, etc.) elaborando una lista de criterios de
inclusin e exclusin, que sern siempre analizables objetivamente, y de carcter metodolgico y no de
resultados, de modo que su fiabilidad y precisin sean mximas.
(f) Evaluacin de la calidad de los estudios incluidos. Es importante porque la validez de los resultados del
metaanlisis es consecuencia de la calidad de los trabajos originales incluidos.
Hay muchas escalas para medir la calidad de estudios, que van asignando distintas puntuaciones a
cada uno de ellos. Este proceso puede complicarse todo cuanto se quiera pero ay algunos aspectos
bsicos que hay que controlar a partir de la informacin metodolgica obtenida: el diseo del estudio, la
posibilidad de combinar los distintos trabajos, el control de sesgos (mediante determinacin del tamao
muestral mnimo, la duracin de seguimiento ms breve admitida, que la asignacin sea realmente
aleatoria o que se efecte realmente doble ciego cuando sea necesario, etc.), y que el anlisis
estadstico de cada estudio se haya realizado correctamente.
Existen distintos instrumentos que permiten, a travs de asignacin de puntuaciones, valorar cualitativa
y cuantitativamente la validez interna de los distintos estudios originales. La utilizacin ms usual de las
puntuaciones de calidad es la de asignar un mayor peso a unos estudios que a otros a la hora de
combinarlos. Otro uso interesante de estas medidas sera el de realizar agrupaciones de estudios segn
su calidad, y as determinar si el grado de sta se relaciona con las estimaciones de los efectos. Esta
utilizacin es, sin embargo, un tema controvertido, pudindose encontrar ejemplos en la literatura en los
cuales no se contempla dicha relacin. De todas formas, algn aspecto particular de calidad (como por
ejemplo, la adherencia al esquema de aleatorizacin en ensayos clnicos controlados), s se ha
mostrado asociado al tamao del efecto.
(g) Anlisis de la heterogeneidad. Existen varios mtodos estadsticos y grficos para evaluar el grado de
heterogeneidad que permiten valorar hasta qu punto los resultados que provienen de diferentes
estudios pueden ser resumidos en una nica medida.
En general, todas las pruebas estadsticas diseadas para comprobar la existencia de heterogeneidad
se basan en la hiptesis de que la variabilidad entre estudios es nula. Una de las pruebas ms
convenientes para valorarla es la prueba Q propuesta por DerSimonian y Laird (8), preferida por
cuestiones de validez y sencillez informtica. A pesar de sus ventajas, esta prueba estadstica presenta
baja potencia, debido principalmente a que el nmero de estudios primarios que se suelen considerar
(por ejemplo, el tamao muestral efectivo) es en general pequeo (no sobrepasa en general el valor de
30 estudios). De ello se deduce que la falta de heterogeneidad estadstica no se puede considerar como
evidencia de homogeneidad, ya que pudieran no detectarse diferencias estadsticamente significativas
incluso en metaanlisis con niveles moderados de heterogeneidad.
Debido a la poca potencia de las pruebas estadsticas existentes, stas pueden complementarse con
alguna representacin grfica que permita la inspeccin visual de la magnitud de la variabilidad entre
estudios. Las representaciones ms utilizadas son el grfico de Galbraith (9), recomendado por ser
aplicable a cualquier tipo de estudio (observacional y experimental) y el grfico de LAbb (10), ms
restrictivo, aplicable nicamente a metaanlisis de ensayos clnicos.
El grfico de Galbraith representa la precisin de cada estudio (el inverso del error estndar) frente al
efecto estandarizado; asimismo, representa la lnea de regresin ajustada a estos puntos y una banda
de confianza. Los estudios que caen fuera de esta banda son los que ms contribuyen a la
heterogeneidad. Por otra parte, la posicin de los estudios en el eje de abscisas permite identificar
visualmente aquellos que tienen un mayor peso en el metaanlisis. Este grfico tambin se puede
utilizar para detectar fuentes de heterogeneidad al etiquetar los estudios por diferentes variables, tales
como el ao de publicacin.
El grfico de LAbb representa la tasa de eventos del grupo tratamiento frente a la tasa del grupo
control, por tanto, este grfico slo se presenta cuando la variable respuesta es binaria.

Para poder explicar la heterogeneidad se necesita experiencia en clnica y epidemiologa as como


experiencia en investigacin. En caso de que exista heterogeneidad entre los estudios (estadstica y/o
clnica), se pueden adoptar varias actitudes. Metodolgicamente, la menos arriesgada sera no proceder
a un resumen de los estudios primarios. Otra actitud consistira en presentar una medida resumen, a
pesar de la heterogeneidad. Si se toma esta decisin, es necesario advertir claramente sus limitaciones
analticas y de interpretacin, y acompaar dicha medida con una estimacin de la variabilidad entre
estudios, el coeficiente de variacin entre estudios, o un coeficiente de correlacin intraclase. Epidat 3.1
presenta las siguientes medidas de variabilidad: varianza entre estudios, varianza intra-estudios,
coeficiente de variacin entre estudios (varianza entre estudios dividida por la medida de efecto global o
ponderada), y coeficiente RI que representa la proporcin de varianza total debida a la varianza entre
estudios y, por tanto, toma valores entre 0 y 1.
Por ltimo, en caso de que se sospeche que existen motivos que puedan explicar la heterogeneidad de
los resultados entre los estudios, la opcin ms recomendable es realizar un anlisis de subgrupos que
slo combine los estudios que cumplen determinada condicin o caracterstica, de modo que stos sean
ms homogneos.
Ejemplo. Para ilustrar la interpretacin de los grficos de Galbraith y LAbb se va a considerar como
ejemplo una revisin sistemtica de ensayos clnicos aleatorizados (ECA) sobre los efectos del consejo
mdico para abandonar el tabaquismo (11) (Tabla 3)

estudio
1 Porter
2 Rusell
3 Wilson
4 Stewart
5 Rusell
6 Jamrozik
7 McDowell
8 Page
9 Janz
10 Slama
11 Wetter
12 Demers
13 Wilson
14 Haug
15 Higashi
16 Slama

ref.

ao de
publicacin

grupo de intervencin
dejaron
no dejaron
de fumar
de fumar

grupo control
dejaron no dejaron
de fumar de fumar

(12)
1972
5
96
4
(13)
1979
34
997
8
(14)
1982
21
85
11
(15)
1982
11
493
4
(16)
1983
43
718
35
(17)
1984
77
435
58
(18)
1985
12
73
11
(19)
1986
8
106
5
(20)
1987
28
116
12
(21)
1990
1
103
1
(22)
1990
34
203
20
(23)
1990
15
277
5
(24)
1990
43
534
17
(25)
1994
20
134
7
(26)
1995
53
415
35
(27)
1995
42
2157
5
Tabla 3. Metaanlisis de diecisis ensayos clnicos aleatorizados que analizan
los efectos del consejo mdico para dejar de fumar (11).

86
1099
94
183
624
491
67
63
94
105
214
287
515
102
451
924

Esta revisin incluye 16 ensayos clnicos aleatorizados publicados entre 1972 y 1995, que investigan los
efectos del consejo mdico para dejar de fumar. En todos los estudios los pacientes fueron asignados
aleatoriamente al grupo intervencin, en el que se realiz consejo mdico, o al grupo control. La variable
respuesta es el abandono del tabaco, y la medida de efecto el riesgo relativo. En la figura 2 se muestran
los datos obtenidos con Epidat 3.12.

Epidat es un programa de libre distribucin. Para ms informacin, vase: http://dxsp.sergas.es/default.asp


10

Figura 2.
La prueba de DerSimonian y Laird indica, con un nivel de confianza del 95 %, que no hay evidencia
estadstica de heterogeneidad

( p = 0,1280 ) .

Sin embargo, el grfico de Galbraith pone de

manifiesto que los estudios no son homogneos. Asimismo, el grfico de LAbb confirma esta
hiptesis de heterogeneidad, con una nube de puntos que no se alinean en torno a una recta. Estos
resultados contradictorios no hacen ms que confirmar la poca potencia de la prueba para detectar
heterogeneidad. Por esta razn, se ha recomendado reducir el nivel de confianza, al 90 % o incluso
al 80 %, a fin de aumentar la potencia.
La inspeccin visual del grfico de Galbraith conduce a las siguientes conclusiones:

Hay evidencia de heterogeneidad entre los estudios, con una clara influencia del estudio 2Rusell (16), que es el que ms contribuye a la heterogeneidad, por caer fuera de las bandas de
confianza del grfico. Este estudio, el segundo en tamao, es el que proporciona la mayor
estimacin del efecto. La repeticin del anlisis sin este estudio produce un resultado de la
prueba de heterogeneidad no significativo ( Q = 13,91; g . de l. = 14; p = 0, 4563) .

Se pueden identificar dos grupos de estudios diferentes entre s pero que internamente
muestran mayor grado de homogeneidad. En el grfico, los dos grupos quedan separados por
la recta horizontal en y = 1 . Un primer grupo est constituido por los estudios 1 Porter (12), 4
Stewart (15), 5 Rusell (16), 7 McDowell (18), 8 Page (19) y 10 Slama (21) efecto estandarizado
en torno a cero, aunque la precisin vara de unos a otros. El estudio Rusell (16) es el ms
preciso y, por tanto, el de mayor peso en el metaanlisis. En el grfico de LAbb estos estudios
corresponden a los puntos que se sitan sobre la diagonal del cuadrado, pues un efecto
prximo a cero se traduce en tasas similares en los grupos tratamiento y control. Los restantes
estudios constituyen un segundo grupo con efecto estandarizado variable, pero muy por encima
del estimado en los del primer grupo.
Todas estas evidencias de heterogeneidad deben tenerse en cuenta en la combinacin de resultados.
(h) Combinacin de resultados
Existen diversas tcnicas estadsticas para la combinacin y presentacin de resultados en un
metaanlisis. La eleccin del mtodo depende fundamentalmente del tipo de medida de resultado/efecto
utilizada y de la valoracin del grado de heterogeneidad de los resultados de los estudios.

11

Estimacin del efecto combinado. Modelo de efectos fijos. Modelo de efectos aleatorios. Para la
obtencin de la medida resumen, los resultados de los estudios individuales son ponderados,
generalmente por la inversa de su varianza o por el tamao muestral, aunque tambin pueden aplicarse
otros criterios adicionales como la calidad del estudio. Epidat 3.1 pondera los estudios por la inversa de
la varianza.
La heterogeneidad entre los estudios puede tenerse en cuenta en el anlisis al utilizar los modelos de
efectos aleatorios (random-effects model), o no ser incluida, si se utiliza un modelo de efectos fijos
(fixed-effects model).
El modelo de efectos fijos asume que existe un nico efecto en la poblacin y no tiene en cuenta la
variabilidad de los resultados entre los distintos estudios. As, el tamao del estudio y su propia varianza
(variabilidad intra-estudio) son los nicos determinantes de su peso en el metaanlisis. El modelo de
efectos aleatorios, por el contrario, tiene en cuenta la posible heterogeneidad al considerar que los
efectos de la exposicin/intervencin en la poblacin son diversos y que los estudios incluidos en la
revisin son slo una muestra aleatoria de todos los posibles efectos. As, la ponderacin de los
estudios bajo este tipo de modelos considera no slo su propia varianza (variabilidad intra-estudio), sino
tambin la que pueda existir entre los estudios (variabilidad entre-estudios).
Al comparar ambos modelos, en general se puede decir que:

Los modelos de efectos aleatorios deben utilizarse siempre que se determine, tras un anlisis
de heterogeneidad, que los estudios no son homogneos y no puedan identificarse claramente
las causas, lo que suele ser habitual, especialmente en estudios epidemiolgicos.

Los resultados bajo la suposicin de un modelo de efectos aleatorios tienden a ser ms


conservadores que los obtenidos asumiendo el modelo de efectos fijos, lo que da lugar a
intervalos de confianza mayores para el efecto combinado.

Una limitacin de los modelos de efectos aleatorios es que se asume que los estudios incluidos
son representativos de una poblacin hipottica de estudios, y que la heterogeneidad entre los
ensayos puede ser representada por una sola varianza. Otra desventaja es que conceden un
peso excesivo a los estudios con pequeo tamao muestral.
Representacin grfica de los resultados. La representacin grfica de los resultados de un
metaanlisis contribuye a una fcil y rpida interpretacin. Para ello se construye una grfica en la que
en el eje de abscisas (eje X ) se representa la medida de efecto considerada (odds ratio, riesgo
relativo, etc.) y a lo largo del eje de coordenadas (eje Y ) se sitan los diferentes estudios,
generalmente ordenados por el ao de publicacin o cualquier otro criterio de ordenacin. Para cada
estudio y para la estimacin global del efecto, se representa su estimacin puntual y tambin el intervalo
de confianza que le corresponde (asumiendo un modelo de efectos fijos y/o efectos aleatorios).
Ejemplo. El anlisis de heterogeneidad en el ejemplo anterior indica que es aconsejable utilizar el
modelo de efectos aleatorios para obtener la estimacin global del efecto. El resultado permite concluir
que la intervencin mdica es significativamente beneficiosa para que los pacientes dejen de fumar.
(Resultados con Epidat 3.1.)

12

Figura 3.
(i) Identificacin del sesgo de publicacin. Todo metaanlisis debera valorar la posibilidad de la existencia
de un sesgo de publicacin que pudiese comprometer sus resultados y conclusiones. Se han propuesto
varios mtodos para la exploracin de la posibilidad y la cuanta del sesgo de publicacin. El ms simple
consiste en realizar un anlisis de sensibilidad, y calcular entonces el nmero de estudios negativos
realizados y no publicados que debera haber para modificar el sentido de una eventual conclusin
positiva obtenida con un metaanlisis. Si este nmero es muy elevado, se considera que la probabilidad
de que el sesgo de publicacin haya modificado sustancialmente los resultados es baja, y se acepta la
existencia de las diferencias sugeridas por el metaanlisis.
Tambin se puede examinar la posibilidad de sesgo de publicacin con el mtodo conocido como el
grfico en embudo (funnel plot). Se parte del supuesto de que los estudios que tendran mayor
probabilidad de no ser publicados seran los que no muestran diferencias (estudios "negativos"), sobre
todo si eran de pequeo tamao. Inversamente, si hubiera sesgo de publicacin, entre los estudios
pequeos (en los que hay mayor probabilidad de que se alteren los resultados por azar) se tendera a
publicar los que mostraran diferencias. En principio, en una comparacin entre dos opciones
teraputicas, los diferentes ensayos clnicos realizados sobre una misma cuestin deberan producir
estimadores de diferencias (en forma de razn de ventajas o de riesgo relativo) para cada ensayo que
se agrupasen alrededor de un estimador central, y mostraran tanta mayor dispersin alrededor de este
valor cuanto ms pequeo fuera su tamao, de modo que si se representara una grfica que en el eje
de ordenadas se registre el nmero de pacientes en cada ensayo y en el de abscisas la magnitud del
riesgo relativo, la nube de puntos se distribuira en forma de embudo invertido. Si hubiera sesgo de
publicacin en el sentido descrito anteriormente (de los ensayos pequeos, se tendera a haber
publicado los que hubieran mostrado diferencias favorables al tratamiento evaluado), la nube de puntos
resultara "deformada" y el embudo perdera su simetra, porque los estudios de pequeo tamao
tenderan a disponerse hacia la parte derecha respecto al estimador central.
Entre las limitaciones de estos grficos se destaca el hecho de tratarse de una tcnica visual, y por
tanto subjetiva, y de difcil interpretacin en el caso de que existan pocos estudios, lo que suele ser una
circunstancia habitual. Es aconsejable, entonces, complementar siempre el estudio de sesgo con
pruebas estadsticas ms objetivas, como las prueba de Begg (28) o de Egger (29) que contrastan la
hiptesis nula de ausencia de sesgo de publicacin.
Ejemplo. Considrese ahora como ejemplo un metaanlisis de estudios epidemiolgicos. Se trata de
diez estudios que evalan el efecto del consumo de anticonceptivos orales como factor de riesgo frente
al cncer invasivo de cuello uterino. Los datos se presentan en la tabla 4.

13

estudio

ref.

ao de
publicacin

odds
ratio

intervalo de confianza (95 %)


lmite inferior
lmite superior

1 Brinton
(30)
1986
1268
1,49
1,10
2,10
2 Celentano
(31)
1987
306
0,69
0,25
1,89
3 Ebeling
(32)
1987
404
1,51
0,78
2,92
4 OMS
(33)
1993
4612
1,31
1,19
1,45
5 Parazzini
(34)
1990
556
1,85
1,00
3,14
6 Beral
(35)
1988
432222
1,80
1,00
3,30
7 Brinton
(36)
1990
2072
1,21
0,90
1,60
8 Kjaer
(37)
1993
1190
1,30
0,50
3,30
9 Daling
(38)
1996
687
1,00
0,60
1,60
10 Eluf Neto
(39)
1994
415
1,65
0,80
3,37
Tabla 4. Metaanlisis de diez estudios sobre el efecto del consumo de anticonceptivos orales
como factor de riesgo frente al cncer invasivo de cuello uterino.
Todos son estudios de casos y controles, salvo el de Beral (35), que es de cohortes. La prueba de
Dersimonian y Laird indica que no hay evidencia estadstica de heterogeneidad

( Q = 6, 4201; g. de l. = 9;

p = 0, 6972 ) , lo que se puede confirmar con el grfico de Galbraith (Figura

4). Este grfico permite identificar un estudio, el OMS, que destaca claramente por su mayor precisin
frente a los dems y, por tanto, por su mayor peso en el metaanlisis. La estimacin global de la odds
ratio (odds ratio = 1,32 e intervalo de confianza al 95 %: [1,22;1,44]) indica un efecto significativo del
consumo de anticonceptivos orales como factor de riesgo en el cncer invasivo de crvix.

Figura 4. Grfico de Galbraith con Epidat 3.1.


Respecto al sesgo de publicacin, la prueba de Begg no arroja un resultado significativo, pero el autor
aconseja precaucin al interpretar esta prueba, ya que tiene muy poca potencia cuando el nmero de
estudios es pequeo, como ocurre en este caso. El equivalente grfico a la prueba de Begg, o funnel
plot, representa la magnitud del efecto (en este caso, el logaritmo neperiano de la odds ratio) frente a
una medida del tamao como es el error estndar. Con los datos del ejemplo se obtiene una nube de
puntos que se distribuyen simtricamente en torno a la estimacin global del efecto, lo que es indicativo
de ausencia de sesgo.
La prueba de Egger, ms especfica que la de Begg, permite detectar asimetra en el grfico de
embudo, sugestiva de la presencia de sesgo de publicacin. El mtodo consiste en ajustar una recta de
regresin a los puntos con abscisa igual a la precisin, que es el inverso del error estndar (variable
independiente), y ordenada igual al efecto estandarizado (variable dependiente). La regresin se
pondera por el inverso de la varianza. Si no hay sesgo de publicacin, la ordenada en el origen ser
igual a cero; cuanto ms alejada de cero, ms pronunciada es la asimetra, y mayor la evidencia de
sesgo. La prueba de Egger est basada en la prueba de significacin para el trmino independiente de
14

la recta ajustada. Con los datos del ejemplo, la prueba de Egger confirma la hiptesis de ausencia de
sesgo (Resultados obtenidos con Epidat 3.1):

Figura 5.

Figura 6.
(j) Anlisis de sensibilidad. El anlisis de sensibilidad pretende estudiar la influencia de cada uno de los
estudios en la estimacin global del efecto y, por lo tanto, la robustez o estabilidad de la medida final
obtenida.
Este anlisis consiste en la repeticin del metaanlisis tantas veces como estudios seleccionados, de
forma que cada vez se omite un estudio combinndose todos los restantes. Si los resultados de los
distintos metaanlisis son similares, esto es, el efecto tiene una misma direccin, magnitud y
significacin estadstica, se puede concluir que los resultados son robustos. En caso contrario no se
tendra un estimador robusto, lo cual exigira cierta precaucin en la interpretacin de los resultados o
podra ser motivo para generar nuevas hiptesis. El anlisis de sensibilidad tambin puede utilizarse
para estudiar la influencia en los resultados del metaanlisis de ciertos aspectos relacionados con la
validez de los estudios, como por ejemplo la exclusin de: (a) estudios que no superan un determinado
umbral de calidad; (b) trabajos no publicados; o bien (c) estudios en los que hay incertidumbre sobre el
cumplimiento de los criterios de seleccin.
Ejemplo. El anlisis de sensibilidad realizado con los estudios del ejemplo anterior pone de manifiesto la
robustez del metaanlisis. Cuando se elimina cualquiera de los estudios incluidos no cambia la direccin
ni la significacin del efecto global. Sin embargo, s conviene destacar la influencia del estudio OMS, ya
detectada con el grfico de Galbraith, que por ser mucho ms preciso que los dems, al ser eliminado
produce una prdida de precisin en la estimacin global. (Resultados del anlisis de sensibilidad con
Epidat 3.1):

15

Figura 7.
(k) Publicacin. Se sugiere publicar primero y presentar personalmente despus, para que quede protegida
la autora intelectual del metaanlisis. Se debe intentar la publicacin en revistas mdicas de amplia
difusin y con comit de revisores. El ttulo del artculo debe contener la palabra metaanlisis, para
agilizar las bsquedas bibliogrficas futuras, e indicar la intervencin evaluada y su intencin.
El resumen contendr, en unas 200 palabras, el objetivo del metaanlisis, mtodo de bsqueda,
cantidad de ensayos clnicos identificados, incluidos y excluidos, con las razones de estas decisiones.
Mtodos de anlisis empleados y conclusiones alcanzadas.
El cuerpo del artculo tendr las siguientes secciones: Introduccin, con razones para requerir la sntesis
de la evidencia y el disenso existente. Material y mtodos, tipificando los criterios de elegibilidad de los
ensayos clnicos. Mtodos de bsqueda empleados. Listado de los ensayos clnicos encontrados,
aclarando incluidos y excluidos. Razones para su seleccin. Caractersticas de diseo y operativas de
los ensayos clnicos aclarando, criterios de elegibilidad de los participantes, caractersticas
demogrficas de los mismos, tamao muestral alcanzado, caractersticas de las intervenciones,
cumplimiento del protocolo, datos faltantes, control del sesgo de seleccin, evaluacin del punto final
(uso de enmascaramiento), acciones para certificar los datos presentes o lograr los faltantes en las
publicaciones y por ltimo mtodos de anlisis empleados. Anlisis de resultados y discusin, con la
evaluacin cualitativa y cuantitativa de los ensayos clnicos incluidos. Por ltimo, conclusin, sobre la
seguridad y eficacia de la intervencin analizada, sobre las limitaciones y problemas de las conclusiones
referidas y recomendaciones para el futuro de las investigaciones al respecto.

5. Limitaciones de la tcnica metaanaltica


Problemas con los que en la actualidad se enfrenta la tcnica del metaanlisis.
16

1. Calidad de los distintos ensayos clnicos.


2. Heterogeneidad de los ensayos clnicos combinados.
3. Mltiples comparaciones (error alta).
4. Sesgo de publicacin.
Dada su relativa juventud, la tcnica tiene todava bastantes detractores. Como se ha indicado es difcil
establecer conclusiones positivas de un metaanlisis cuando los ensayos clnicos individuales no han sido
capaces de hacerlo. Aunque es una tentacin sustituir los ensayos clnicos por evaluaciones metaanalticas
de ensayos clnicos y bases informatizadas de datos, en funcin de su bajo coste relativo, no parece una
actitud cientficamente consistente. Est claro que no se pueden obtener buenos resultados de metaanlisis
a partir de ensayos clnicos mal realizados. La existencia de heterogeneidad entre los ensayos clnicos
supone un reto a la propia validez del mtodo. No obstante, la propia heterogeneidad puede ser indicativa
de la diferencia de comportamiento de la intervencin en diferentes grupos. Por ltimo, debe considerarse la
tendencia a no publicar los ensayos clnicos con resultados negativos, por lo que en el metaanlisis quedan
sobre representados aquellos con resultados favorables (esto es importante en el caso de que el resultado
sea escasamente positivo). Por otra parte, si se calcula el nmero de ensayos clnicos que debera haber
con resultado negativo para contrarrestar nuestro metaanlisis con resultado positivo, y resulta muy grande,
se puede aceptar la eficacia del tratamiento valorada por el metaanlisis en cuestin.

5.1. Limitaciones metodolgicas del metaanlisis


Los tcnicas metaanalticas presentan ciertas limitaciones propias de su metodologa. Estas limitaciones
deben conocerse y tenerse en cuenta a la hora de interpretar sus resultados. En primer lugar, el
metaanlisis puede originar resultados distorsionados debido a posibles sesgos de seleccin y de
publicacin de los estudios. Por otro lado, la validez de los resultados y las conclusiones del metaanlisis
dependen de la calidad de los estudios individuales de modo que la combinacin de estudios sesgados
puede potenciar an ms el sesgo. Por ltimo, la interpretacin del metaanlisis en caso de heterogeneidad
o variabilidad entre los estudios es difcil y controvertida. La obligacin de quienes utilizan el metaanlisis es
conocer estas limitaciones, as como explicitarlas y discutirlas en cada caso concreto. Antes de comentar las
etapas en el proceso de un metaanlisis, se describen brevemente algunos de sus principales problemas
metodolgicos.
Heterogeneidad entre estudios
Una primera crtica metodolgica al metaanlisis consiste en intentar una combinacin estadstica de
resultados que provienen de estudios que exhiben una gran variabilidad (heterogeneidad) entre ellos. Esta
no es una dificultad exclusiva del metaanlisis, ya que es compartida por toda investigacin clnica
(especialmente los estudios multicntricos), donde la amplia variedad de caractersticas inherentes a los
sujetos de estudio hace necesario disear un protocolo uniforme, realizar un riguroso proceso de seleccin
de los sujetos de estudio y posteriormente efectuar un anlisis cuidadoso de la influencia sobre los
resultados de los casos extremos. Esto se hace particularmente difcil al integrar evidencia derivada de
numerosos estudios que fueron a su vez realizados en distintos contextos, con diseos variados, incluyendo
sujetos diferentes en cuanto a caractersticas sociodemogrficas o de gravedad de la enfermedad,
comparando con diferentes grupos testigo. Tambin se puede observar heterogeneidad midiendo resultados
o efectos distintos; esto es, cuando los estimadores de efecto de los diferentes estudios individuales van en
direcciones opuestas, o que un estudio no encuentre un efecto y otros encuentren un efecto de magnitud
muy importante.

5.2. Sesgo de publicacin


El sesgo de publicacin, es decir, la publicacin selectiva de estudios sobre la base de sus hallazgos,
representa un riesgo para la validez de cualquier metaanlisis.
Es bien sabido que muchos trabajos de investigacin terminados no llegan a publicarse. Esto es ms
frecuente cuando el resultado del ensayo es "negativo", es decir, cuando no se demuestran diferencias
significativas entre los grupos comparados o bien cuando es desfavorable a un nuevo frmaco. En estos
casos, el investigador y el patrocinador del ensayo (generalmente una compaa farmacutica) suelen tener
menos inters en preparar un artculo para publicar. Por otra parte, los directores de revistas mdicas tienen
ms tendencia a rechazar su publicacin, porque los resultados "negativos" no suelen ser noticia. Tambin
se ha comprobado que los estudios en los que no se hallan diferencias significativas tardan ms tiempo en
ser publicados Por estos motivos, los metaanlisis que slo incluyen los trabajos publicados sobre la
cuestin objeto de estudio tienden a dar un resultado sesgado. Tambin puede ocurrir que un mismo
estudio haya sido publicado ms de una vez, en formas aparentemente diferentes; la publicacin duplicada
17

tambin puede introducir un sesgo, que favorece la tendencia de los resultados de los estudios que han sido
objeto de publicacin duplicada. Adems, se ha comprobado que en una proporcin importante de
metaanlisis se ignoran los trabajos publicados en idiomas distintos del ingls, y se ha visto que la
proporcin de estudios "negativos" es mayor en otras lenguas. Dada su naturaleza, es muy difcil impedir el
sesgo de publicacin, o por lo menos hacerse una idea de su magnitud.

6. Metaanlisis cualitativo
Valoracin de la validez de los estudios primarios: mtodo seguido para la extraccin de la informacin
relevante y pertinente de cada investigacin. El aspecto central en el metaanlisis cualitativo es la
valoracin de la calidad de una investigacin. La valoracin de la calidad es importante ya que los estudios
de alta calidad reducen sesgos y tienen mayor precisin para estimar el efecto que calculan. Se ha de
realizar una comparacin vertical de todos los estudios realizados.

7. Metaanlisis cuantitativo
El metaanlisis cuantitativo valora:
1. Los mtodos estadsticos empleados para la combinacin de resultados:

Cohortes Riesgo Relativo , Casos - controles odds ratio


2. Metodologa empleada para tratar el problema de la heterogeneidad:
No se pueden comparar riesgo relativo con odds ratio. La heterogeneidad mide las diferencias entre los
distintos tipos de diseos. Ejemplo: la poblacin general no es igual a la poblacin hospitalaria.
3. Anlisis de sensibilidad:

Comprobar que el modelo es continuo, hay distintos niveles exposicin y distintos niveles de riesgo;

Comparar estudios con resultado de riesgo muy alto o muy bajo.


4. Valoracin estadstica del sesgo de publicacin:
Slo se publican estudios en los que los factores de riesgo estudiados si son factores de riesgo o de
proteccin significativos.

7.1. Modelos de riesgo

Modelo de efectos fijos: cuando se asume que el efecto producido por la exposicin es constante de
estudio en estudio. Es el ms usual cuando se estudia toda la poblacin de artculos;

Modelo de efectos aleatorios: se asume una distribucin al azar a lo largo de distintos estudios. Cuando
slo se estudia un estrato de la poblacin de artculos.

Modelos de riesgo: parten del modelo de regresin lineal:

y = a+b x
donde: y

b
a

es la exposicin;
es un coeficiente;
es el efecto aditivo sobre el riesgo.

La exposicin a un riesgo x se multiplica por el coeficiente b .

exposicin

Cuando a = 0 , y = b x ; por tanto b =

Cuando b = 1 , y = a + x ; por tanto a = y x ; relacin entre los riesgos.

Cuando a = y b = ; relacin de riesgos entre todos los trabajos publicados.

: relacin

riesgo

8. Mtodos estadsticos para combinar estudios


Aunque existen diferentes propuestas estadsticas para combinar estudios, hay tres fundamentales, que se
conocen con el nombre modelo de efectos fijos, modelo de efectos aleatorios y por ltimo el modelo
bayesiano.
18

En el modelo de efectos fijos los estudios se combinan considerando que no existe heterogeneidad entre
ellos, y que por lo tanto todos ellos constituyen estimaciones de un efecto real, cuya magnitud se desea
conocer. As pues, la inferencia realizada est condicionada a los estudios que se han efectuado.
En el modelo de efectos aleatorios la inferencia se basa en suponer que los estudios incluidos en el anlisis
constituyen una muestra aleatoria del universo de estudios posibles, y sus resultados son ms
conservadores al tener en cuenta una fuente extra de variacin, ya que ahora se incluyen dos posibles
fuentes de variacin: la existente dentro de los estudios y la variacin entre los estudios.
La utilizacin de modelos bayesianos constituye, como ya se coment en el correspondiente tema, una
alternativa interesante a la estadstica inferencial clsica, pero por su complejidad no los comentaremos en
este artculo sobre metaanlisis.
Dado que una gran mayora de metaanlisis se efecta sobre resultados dicotmicos (fallece, fracasa el
tratamiento, efecto secundario, etc.) se centrar la exposicin en este tipo de variable, aunque la lgica
subyacente es similar para otro tipo de datos.
Si tenemos estudios que comparan dos grupos, por ejemplo un tratamiento nuevo con un grupo control, y
en los que el resultado es binario, por ejemplo efectivo no/s, podemos construir una tabla 2 x 2 para
presentar los datos de cada estudio y en ella calcular alguna de las medidas habituales (odds ratio, riesgo
relativo, diferencia de riesgo). Es importante tener en cuenta que no es correcto juntar sin ms todas esas
tablas para crear una tabla global y calcular en ella el dato medido, por ejemplo odds ratio. Esta situacin
errnea que se conoce con el nombre de paradoja de Simpson ya fue comentada anteriormente.

8.1. Modelo de efectos fijos


El mtodo ms general para combinar estudios segn un modelo de efectos fijos se conoce como mtodo
ponderado por la inversa de la varianza (inverse variance wighted method), descrito en 1930 por Birge y
tambin por Cochran. En l cada estudio interviene en la estimacin global de forma ponderada, con un
peso proporcional a su precisin, que en este caso se mide como la inversa de la varianza, ya que la
varianza es una medida de dispersin y por lo tanto su inversa una medida de precisin. Supngase que se
tiene k estudios, i = 1, 2, , k , en los que se calcula una medida del efecto que se denominar Ti . En el
modelo de efectos fijos se considera que existe un efecto global fijo que se estimar como:
k

T =

w T
i =1
k

w
i =1

donde w i

s i2

son las ponderaciones habituales: w i = 1

s i2

es la varianza de la medida en el estudio i , cuya frmula concreta depende del tipo de

medida utilizado (odds ratio, riesgo relativo, media, etc.).


Una estimacin de la varianza de T se calcula mediante la siguiente frmula:

var (T ) =

1
k

w
i =1

Y si se admite que T sigue una distribucin normal se puede calcular un intervalo de confianza del 95 %

( )

para ese efecto global sumando y restando al efecto global la raz cuadrada de var T

multiplicada por

1,96.
Para intervenir en el metaanlisis algunas medidas es preciso transformarlas, fundamentalmente tomando
logaritmos, antes de que puedan ser combinadas, con el fin de que su distribucin se aproxime a la normal.
Es lo que ocurre con la odds ratio y el riesgo relativo, con los que se trabajar siempre usando sus
logaritmos.

19

8.2. Modelo de efectos aleatorios


En el modelo de efectos aleatorios se supone que los estudios incluidos en el anlisis constituyen una
muestra aleatoria del universo de estudios posibles, y ahora el efecto Ti en uno de los estudios se
considera que tiene dos componentes:

Ti = i + e i
donde e i

es el error con el que Ti estima el verdadero efecto

i .

Ahora la varianza viene dada por la expresin:

var (Ti ) = 2 + i

donde

es la varianza debida al error de muestreo en el estudio i ;

corresponde a la varianza entre estudios.

Existen diferentes mtodos matemticos para estimar los parmetros de este modelo. Se presentar aqu
unas frmulas sencillas para estimar un modelo de efectos aleatorios cuando se pondera con la inversa de
la varianza. Para estimar la varianza debida a la variacin entre estudios, se definen las siguientes
expresiones:
k

w
i =1

w =

s w2 =

1 k 2
2
wi k w
k 1 i =1

s w2
U = ( k 1) w

k
w

A partir de ellas se calcula la varianza debida a la variacin entre estudios como:

2 =
donde Q

Q ( k 1)
U

cuando Q > k 1

es el resultado de la prueba de heterogeneidad que se describe ms adelante.

Si Q k 1 entonces la variacin entre estudios se considera 0 y el modelo coincide con el de efectos fijos
descrito anteriormente.
Seguidamente se calcularn unas ponderaciones ajustadas para cada estudio:

w i* =

1
1
+ 2
wi

y la estimacin del efecto global y su varianza viene dada por:


k

T =

w
i =1
k

*
i

w
i =1

var (T ) =

Ti
*
i

1
k

w
i =1

20

*
i

Hay que destacar que no es correcto pensar que la utilizacin del modelo de efectos aleatorios elimina el
efecto de la heterogeneidad en los estudios y se debe tener claro que si la heterogeneidad es acusada el
objetivo primordial del metaanlisis debe centrarse precisamente en el estudio de esa variabilidad.

8.3. Heterogeneidad
Puede ocurrir que la variabilidad entre estudios sea superior a la que es de esperar por puro azar, y por ello
interesa contrastar la hiptesis de homogeneidad. Existe una prueba sencilla y utilizada habitualmente que
fue originalmente desarrollada por Cochran en 1954, sin embargo hay que llamar la atencin sobre la baja
potencia de sta para detectar diferencias, agravado por el hecho de que el nmero de estudios que se
combinan suele ser pequeo, por lo que no se debe contentar con aplicar la prueba y darla por buena si el
resultado ha sido no significativo. Siempre se debe intentar verificar la homogeneidad de los resultados
tambin por otros cauces, como puede ser un anlisis por subgrupos, que se describe ms adelante.
En esta prueba se trata en esencia de calcular una suma ponderada de las desviaciones del efecto
determinado en cada estudio con respecto a la media global:

Q =

w (T T )
i =1

En la hiptesis de homogeneidad Q se distribuye aproximadamente como una

2 con k 1

grados de

libertad, siendo k el nmero de estudios.


Debe insistirse en que aunque esta prueba no resulte significativa suele ser insuficiente para concluir que no
existe heterogeneidad entre los estudios y conviene explorar esa posibilidad con otras alternativas,
fundamentalmente de tipo grfico. As resulta interesante representar los resultados estandarizados:

zi =

Ti T

es (Ti )

ya que bajo la hiptesis de homogeneidad, es decir de existencia slo de diferencias aleatorias entre los
estudios, stos valores estandarizados debieran seguir una distribucin normal N ( 0,1) .

Otro enfoque para determinar la presencia de heterogeneidad entre estudios es tratar de localizar la posible
causa de sta. Una pregunta que resulta natural en este contexto es si existe relacin entre la tasa de
respuesta y el riesgo base. Una buena herramienta grfica para verificarlo la constituye el grfico de l'Abb,
en el que, para cada estudio, se representa en el eje de ordenadas el resultado en el grupo de tratamiento
frente al resultado en el grupo de control en el eje de abscisas, y una lnea a 45 que divida el grfico en
dos secciones: a un lado de esta lnea quedarn los estudios en los que fue favorable el grupo de
tratamiento y al otro lado los estudios en los que fue favorable al grupo de control. Se suele representar los
puntos de tamao variable con un rea inversamente proporcional a la varianza de la estimacin del efecto
en cada estudio (directamente proporcional a la precisin de la estimacin), de tal manera que cuanto ms
grande es un punto mayor precisin tiene el estudio que representa. La presencia de puntos dispersos en el
grfico de l'Abb indica heterogeneidad, mientras que si se agrupan en una zona estrecha es seal de
resultados ms homogneos.

Figura 8.

21

La presencia de patrones en este grfico puede orientar sobre lo que est ocurriendo. Si la eficacia depende
del riesgo base, podra ocurrir que para riesgos base bajos los puntos estn muy prximos a la lnea
divisoria o incluso del lado de la no eficacia, y a medida que nos vamos moviendo hacia riesgos base
mayores los puntos se vayan alejando de esa lnea hacia valores de mayor eficacia como se ve en la figura
anterior.
Se puede llevar ms lejos la idea de que alguna caracterstica subyacente en los estudios puede estar
afectando a la heterogeneidad de los resultados, no slo el riesgo base, sino cualquiera otra caracterstica.
Una herramienta estadstica que se emplea para analizar esa posibilidad es la meta-regresin.

8.4. Meta-regresin
El trmino meta-regresin describe el anlisis en el que las caractersticas de los estudios o de los sujetos
incluidos en cada estudio se usan como variables explicativas en un modelo de regresin multivariante, en
el que la variable dependiente es el efecto medido o alguna medida de la desviacin del efecto de cada
estudio respecto del efecto global.
Aqu la unidad de observacin es cada estudio o cada subgrupo de estudios, y a la hora de estimar los
coeficientes de la ecuacin de regresin se emplean mtodos que ponderan la intervencin de cada estudio
en esa estimacin, de acuerdo a su precisin (proporcional al tamao del estudio, inversamente
proporcional a la variabilidad del estudio).
Puesto que la muestra es pequea (nmero de estudios), el nmero de variables independientes que
intervienen en la ecuacin de regresin debe ser pequeo. Al igual que en el anlisis de regresin
tradicional se usa la regla orientativa de 5 10 casos por cada variable, y dado que el nmero de estudios
en un metaanlisis suele ser pequeo no se debe utilizar muchas variables en la ecuacin de regresin.
En la figura 9 puede verse una grfica tpica de meta regresin de un ejemplo ya clsico, en la que se
presenta el logartmo de la odds ratio (eficacia de la vacuna BCG contra la tuberculosis) frente a la latitud
del pas en el que se efectu el estudio. El rea de los puntos es inversamente proporcional a la varianza
del ln odds ratio. Tambin se puede ver representada la ecuacin de meta-regresin, que a diferencia de
una ecuacin de regresin normal en la que todos los puntos intervienen por igual, aqu atraen la recta
hacia s en razn directa a su masa. En este caso se puede ver que probablemente el riesgo de ineficacia
de la vacuna tiende a aumentar cuando se acerca al ecuador.

Figura 9.

8.5. Anlisis de subgrupos y de sensibilidad


Otra posible alternativa para explorar la heterogeneidad consiste en efectuar un anlisis de subgrupos. La
idea del anlisis de subgrupos o estratificacin consiste en efectuar el metaanlisis en diferentes grupos de
estudios, reunidos segn caractersticas de los mismos (estudios publicados frente a no publicados,
estudios de gran tamao frente a pequeo tamao, estudios segn nivel de calidad, segn fecha de
publicacin, etc.) o segn las caractersticas de los pacientes incluidos y comprobar cmo vara el resultado
al estimarlo de nuevo en cada ocasin.
De nuevo creemos conveniente destacar que aunque pudiera parecer que la principal motivacin para
efectuar un metaanlisis es la de combinar estudios con el fin de resolver un asunto para el que se han
obtenido resultados discrepantes, nada ms lejos de la realidad. La situacin ideal para la aplicacin del
metaanlisis en cuanto a la determinacin de un efecto medio global, se da cuando los estudios que se
22

combinan son ensayos clnicos aleatorizados y sus resultados son homogneos, aunque el tamao de
muestra original era insuficiente para obtener resultados concluyentes. En el resto de los casos, estudios
discrepantes, la investigacin de la presencia y causas de la heterogeneidad de los resultados puede pasar
a convertirse en el principal objetivo del metaanlisis y desplazar al otro objetivo de obtener un valor global
medio.
Cuando las discrepancias entre los estudios son moderadas no ser adecuado utilizar un modelo de efectos
fijos y ser preciso acudir al modelo de efectos aleatorios o incluso a un modelado ms complejo, y en
cualquier caso los resultados tendrn que ser interpretados con cautela.
El primer paso de un anlisis de subgrupos, que tambin se conoce como anlisis de sensibilidad, consiste
en repetir los clculos extrayendo uno de los estudios cada vez. Podemos representar grficamente el
resultado del anlisis repetido excluyendo un estudio, frente al efecto global calculado con todos los
estudios y su intervalo de confianza. Esto permite visualizar como afecta cada estudio al resultado global.

Figura 10.

8.6. Presentacin de resultados


Si cualquier trabajo de investigacin debe presentarse de una forma clara y bien organizada mucho ms los
resultados de un metaanlisis que pretenden ser el resultado numrico de una revisin sistemtica y por lo
tanto deben tener una presentacin muy cuidada, que facilite su lectura e interpretacin. Un grupo de
trabajo ha definido un esquema y un diagrama de flujo denominado Quality of reporting of meta-analysis
(QUORUM) para guiar en la elaboracin del metaanlisis.
En cuanto a los datos numricos es habitual presentarlos en tablas con una fila para cada estudio, as como
un grfico en el que se visualiza el efecto obtenido en cada estudio, con su intervalo de confianza del 95 %,
as como el valor global obtenido al combinar los estudios y su correspondiente intervalo de confianza.
En el caso de medidas de tipo cociente como son la odds ratio y el riesgo relativo se representarn en
escala logartmica.
El problema de este tipo de grfico, que en ingls se conoce como Forest plot, radica en que los estudios
con peor precisin, los que tienen menor peso en el clculo del efecto global son los que presentan un
mayor impacto visual, ya que su intervalo de confianza es el ms amplio. Para remediar esto de alguna
forma, se acude a representar el valor de su efecto medio con un smbolo cuya rea sea proporcional a la
precisin, de tal manera que los smbolos ms grandes y por tanto ms llamativos, corresponden a los
estudios ms precisos y con mayor peso en la estimacin del efecto global.

23

Figura 11.

estudio odds ratio


1
2
3
4
5
6
7
8
Global

intervalo de confianza de la odds ratio 95 %


lmite inferior
lmitesuperior

0,96
0,96
0,70
0,40
1,00
0,70
0,82
0,69
0,73

0,25
0,21
0,26
0,10
0,06
0,21
0,25
0,17
0,45

3,73
4,29
1,92
1,60
16,65
2,28
2,69
2,85
1,16

varianza
0,478
0,585
0,265
0,506
2,059
0,365
0,369
0,524

Tabla 5.
Para finalizar despus de reconocer que una buena revisin sistemtica es una excelente herramienta para
valorar los conocimientos y conclusiones sobre un asunto, es una valiossima herramienta para ayudar a
tomar decisiones y para definir nuevas lneas de trabajo, y que adems est sirviendo para que mejore la
calidad y homogeneidad en la presentacin de los datos en los estudios bsicos, pero no est de ms
recordar el proverbio popular de que mil conejos blancos no hacen un caballo blanco, ni siquiera en un
metaanlisis!

8.7. Mtodo de Mantel-Haenszel-Peto para obtener un estimador combinado del efecto de


un grupo de ensayos clnicos incluidos en un metaanlisis
Test de homogeneidad/heterogeneidad de Woolf

Hiptesis nula : odds ratio1 = odds ratio 2 = = odds ratio k = odds ratio ajustado
donde: k

es el nmero de estratos.

tratamiento experimental
presente
ausente
efecto

presente

ai

bi

m1i

ausente

ci

di

m 2i

totales

n1i

n 2i

Ni

24

Para cada estrato i se calcula la odds ratioi , que es la odds ratioespecfica por estrato.
Para el estrato i :

ai d i

odds ratio i =

bi c i

ai d i
ln ( odds ratio i ) = ln
bi c i

La varianza especfica por estrato s i es:

s i2 =

1
1
1
1
+
+
+
a i bi c i d i

y
k

ln ( odds ratioPOND ) =

i =1

2
i

ln ( odds ratio i )
k

s
i =1

2
i

El ln ( odds ratioPOND ) es el logaritmo neperiano del promedio ponderado de la odds ratio, igual que el
logaritmo neperiano de la odds ratio, ajustado de Mantel-Haenszel.
Finalmente, el test de Homogeneidad de Woolf se distribuye como una con k 1 grados de libertad (si
el valor del estadstico es pequeo, no se puede rechazar la hiptesis nula y se ha de aceptar que los
estratos son homogneos):
2

2
Woolf
=

( ln ( odds ratio ) ln ( odds ratio


i

i =1

POND

))

2
i

Si se acepta la hiptesis nula de homogeneidad, tiene sentido calcular una medida de magnitud, resumen
del efecto del tratamiento utilizado, a lo largo de los diferentes estratos, que sera la odds ratio ajustado de
Mantel-Haenszel.

8.8. Odds ratio ajustada de Mantel-Haenszel


Es el mtodo ms utilizado para valorar la asociacin global en un anlisis estratificado. El clculo de la
odds ratio de Mantel-Haenszel como medida de magnitud de asociacin a lo largo de los diferentes estratos
se basa en la siguiente frmula:

ai d i
a1 d 1 a 2 d 2
a dk
+
++ k

Ni
N1
N2
Nk
i =1
=
=
k b c
b1 c1 b 2 c 2
bk c k
i
i
+
+
+

N1
N2
Nk
N i
i =1
k

odds ratio M H

La divisin por N i sirve para ponderar por los tamaos de los diferentes estratos (tamaos de los distintos
estudios). Mediante la frmula de Woolf se pueden obtener resultados similares.
El estadstico de Mantel-Haenszel es una generalizacin directa del anlisis sencillo de la . Esta prueba
puede aplicarse tanto a datos independientes como apareados. Se basa en una distribucin
hipergeomtrica para estudios de seguimiento acumulados, de casos y controles (densidad y acumulados) y
de corte transversal. Para estudios de cohortes con densidad de incidencia se utiliza una distribucin
binomial. La hiptesis nula es, como habitualmente, que la odds ratio sea 1.
2

25

El diseo general (para variables dicotmicas, exposicin y enfermedad) es una prueba para grandes
muestras que utiliza el estadstico

con un grado de libertad cuya estructura bsica es:

M2 H =

(a E )
var ( E )

donde a

es el nmero de casos expuestos;

Ea

es el nmero de casos esperados bajo el supuesto de la hiptesis nula de no asociacin; y

var ( E a ) es la varianza del total de casos expuesto tambin bajo la hiptesis nula.
La forma especfica de estos dos ltimos valores depende del diseo del estudio.
En tabla anterior, la casilla principal es la superior izquierda, a, ya que los marginales vienen dados por los
datos del estudio y conociendo una casilla, se derivan las tres restantes. Asumiendo que los valores en
cada estrato son independientes, los valores esperados para todos los estratos y sus varianzas se calculan
con las siguientes frmulas:

Ea

M2 H

M2 H

ai =

n1i m1i

i =1

Ni

i =1

var ( E a ) =
en consecuencia, la

n1i n 2 i m1i m 2 i

(N
i =1

1) N i2

ponderada por los estratos es la siguiente:


k n m
k
1i
1i
a i

N
i
i
=
=
1
1
i

= k
n1i n 2 i m1i m 2 i

(N
i =1

k a i d i bi c i

Ni
i =1
= k
n1i n 2 i m1i

(N

1) N i2

i =1

m 2i

1) N i2

que puede ser comparado con los valores de una tabla con un grado de libertad. Debe tenerse en
cuenta que aunque los estratos tengan pocos casos en las celdas, lo que interesa son los totales
marginales para considerar la utilizacin de esta prueba estadstica.
La precisin del estimador odds ratioM H puede calcularse por varios mtodos. El mtodo de Miettinen (40)
es sucio y rpido. Calcula un estimador aproximado del error estndar mediante el test based, basado en
2

la prueba

2:
intervalo de confianza = odds ratio

donde:

M H =

1 z 1
2


M H

M H

M2 H

Los mtodos exactos de Flanders (41) y de Robins (42) son ms seguros y complejos. El mtodo de

Flanders calcula el error estndar del ln odds ratio M H :

es ln ( odds ratio M H ) =

k
bi c i

i =1 N i

p
bi c i

N i2
i =1

cuyo intervalo de confianza al 95 % es:

ai d i + 1

+ ( bi c i )

odds ratio M H

ln ( odds ratio M H ) 1,96 es ln ( odds ratio M H )


26

9. Clculo del tamao del efecto


9.1. Definicin
1. Tamao del efecto es un concepto crucial en el metaanlisis moderno
2. Tamao del efecto se puede definir como cualquier medida estadstica que evidencia el grado con el
que un evento dado esta presente en una muestra (43). El tipo de medida se llama efecto, y su
magnitud es el tamao del efecto.
3. Diferentes medidas de tamaos de efecto se calculan a partir de diferentes tipos de datos originales

9.2. Fuente de datos


1. Diferentes medidas de tamaos de efecto se calculan a partir de diferentes tipos de datos originales
2. En general, los datos originales caen en una de las tres siguientes categoras:

Medias, tamaos de muestras y desviaciones estndares de los grupos control y experimental;

Tablas de contingencia 2 x 2 que representan las cuatro posibles soluciones categricas


experimentales;

Coeficientes de correlacin.

9.3. Tamaos de efecto basados medias y desviaciones tpicas


Tamao de efecto de Glass (44)
1. Sean x C y x E la media de un efecto de distribucin continua en el grupo control y el grupo
experimental;
2. Sean s C y s E las desviaciones tpicas de cada grupo y n E y n C los respectivos tamaos de muestra;
3. El tamao del efecto y su varianza se calculan como:

var ( )
Inconveniente:

x E xC
sC
nC + n E
nC n E

2
+
2 ( n C 1)

Slo la varianza del grupo control se usa para estandarizar la diferencia entre medias.

9.4. d de Hegde (45)


1. Sean x C y x E la media de un efecto de distribucin continua en el grupo control y el grupo
experimental;
2. Sean s C y s E as desviaciones tpicas de cada grupo y n E y n C los tamaos de muestra;
3. El tamao del efecto y su varianza se calculan como:

donde: S =

(n

var ( d )

1) s C2 + ( n E 1) s E2
nC + n E 2

27

x E xC
s
nC + n E
nC n E

J
+

g2
2 ( nC + n E 2)

J = 1

3
4 ( nC + n E 2) 1

9.5. d de Cohen (46)


1. Sean x C y x E la media de un efecto de distribucin continua en el grupo control y el grupo
experimental.
2. Sean s C y s E as desviaciones tpicas de cada grupo y n E y n C los tamaos de muestra;
3. El tamao del efecto y su varianza se calculan como:

d
var ( d )

donde:

(n

=
=

x E xC

nC + n E
nC n E

nC + n E
d2
+
2 ( nC + n E 2) nC + n E 2

1) s C2 + ( n E 1) s E2
nC + n E

Ventaja:
no se afecta por varianzas muestrales distintas.
Inconveniente: sesgada por tamaos muestrales pequeos.

9.6. Response ratio, R (47)


1. Sean x C y x E la media de un efecto de distribucin continua en el grupo control y el grupo
experimental.
2. Sean s C y s E as desviaciones tpicas de cada grupo y n E y n C los tamaos de muestra;
3. El tamao del efecto y su varianza se calculan como:

ln ( R )
var ( ln ( R ) )

xE
= ln
xC

s E2
s C2
=
+
n E x E2 n C x C2

9.7. Tablas de contingencia 2 x 2


1. La variable respuesta es dicotmica y tiene distribucin binomial, por lo que puede ser representada en
la siguiente tabla:

control

respuesta

experimental
a

total
a+b

no respuesta

c+d

total

nE = a + c

nC = b + d

N = a +b+c+ d

2. Se calcula la tasa de respuesta de ambos grupos, PE y PC , como

28

A
b
y
, respectivamente:
nE
nC

PE =

a
nE

PC =

b
nC

9.8. Risk difference, RD (48)


1. El tamao del efecto y su varianza se calculan como:

= PE PC

RD

var ( RD ) =

PE (1 PE )
nE

PC (1 PC )
nC

2. No diferencia entre grupos genera RR = 1 , y vara entre 0 e infinito ( ln( RR ) = 0 ) .

9.9. Odds ratio OR (49)


1. Odds de un evento es la probabilidad de que ocurra el evento dividido por la probabilidad de que no
ocurra.
2. El tamao del efecto y su varianza se calculan como:

odds ratio
var ( RD ) =

PE (1 PE )

PC (1 PC )

PE (1 PC )

PC (1 PE )

ad
bc

1 1 1 1
+ + +
a b c d

9.10. Correlaciones
1. A veces los datos originales estn en diferentes fuentes ( F , t ,

2 , ...);

2. Es til transformar todo estos estadsticos en correlaciones de Pearson y calcular el tamao del efecto a
partir de ellas;
3. Estas transformaciones se pueden hacer con una meta-calculadora. Las transformaciones ms
frecuentes son:

r =
r =

z
N

12
N

r =

t2
t 2 + gl

r =

F
F + gl

z : datos en forma de probabilidades.


9.11. Transformacin z de Fisher (2)
1. Con las correlaciones, podemos calcular el tamao del efecto mediante la frmula:

29

1 1+ r
ln

2 1 r
1
=
n 3
=

z
var ( z )
donde n
2.

es el tamao muestral.

z oscila entre y + , con z = 0 indicando ausencia de efecto.

Ventaja:
Inconvenientes:

puede incluir estudios tomados de forma diferente, por lo que puede aumentar la
cantidad de estudios metaanalizados.
est sesgado ligeramente cuando el tamao muestral es bajo;
hay que tener cuidado con no incluir estudios demasiado heterogneos

9.12. Recomendaciones para presentacin de datos


1. Presentar todos los valores de probabilidad exactos;
2. Cuando sea posible, presentar medias, desviaciones estndares y tamao muestral de cada grupo
experimental usado en el diseo y del grupo control.
3. Ejemplo de requisitos impuestos por el J. Evol. Biol:
Please make sure any in-line statistics conform to the Instructions for authors: "In-line
statistical results should be presented as test-statistics: degrees of freedom as subscript(s)
p -value., e.g.
to test-statistics (e.g. F1,12 = or t 8 = ), followed by

(F

1,12

= 4.9, p < 0.05 ) . Statistical results in tables should be comprehensive,

allowing future meta-analyses. Depending on the details of the analyses, results


reported may include parameter estimates, test-statistics, degrees of freedom, significance
levels and err/residual model information (e.g. error MS's and df's in ANOVA or regression
models). Since exact p -values can be useful for meta-analyses, we recommend that
these

are

quoted

even

when

non-significant,

e.g.

t 23 = 0.25, p = 0.34 ,

or

F2,32 = 1.12, p = 0.55 . However, non significant tests (i.e. p > 0.05 ) should always be
interpreted as such.
(see Instructions for Authors, JEB inside back cover, or
http://www.blackwellpublishing.com/journals/jeb/submiss.htm)

10. Combinacin de resultados


10.1. Tamao del efecto acumulado
1. Tamao del efecto acumulado es un estimador que sintetiza el efecto global de los tratamientos que
estamos metaanalizando.
2. Se calcula segn la siguiente frmula:
n

w
i =1
n

w
i =1

var ( E )

1
n

w
i =1

30

Ei

1
.
s i2

donde w i

es la inversa de la varianza del estudio

Ventaja:

es una media ponderada. De esta forma, se tiene en cuenta la diferencia en tamao


muestral y potencia de cada estudio individual.

10.2. Significacin del efecto acumulado


1. Se pueda calcular el intervalo de confianza del efecto acumulado usando la frmula:

E t 2 n 1 s E
donde

es el valor crtico a partir de un distribucin t de Student para el nivel

2. Una vez establecido el intervalo de confianza, se puede evaluar estadsticamente el efecto global del
conjunto de estudios. Se admite un efecto acumulado significativo cuando el intervalo de confianza no
incluye el valor cero.

10.3. Heterogeneidad total (50)


1. La heterogeneidad total QT indica si los tamaos de efecto son homogneos:
n

QT =

w
i =1

E
2
i

w
i =1

E i2
=

w
i =1

(E
i =1

2. Para ver si QT es significativa, se contrasta frente a una

E)

con n 1 grados de libertad. [La hiptesis

nula es que todos los tamaos de efecto son iguales. Una QT significativa indica que la varianza entre
tamaos de efecto es mayor que la esperada por azar].
3.

QT es un suma de cuadrados ponderada, por lo que es comparable a la suma de cuadrados total de un


ANOVA.

10.4. Fuentes de heterogeneidad


1. Cuando QT es significativo, se puede pensar que es debido a que existe una estructura subyacente en
los datos.
2. La estructura puede aparecer porque existan variables que afecten a los resultados. Estas variables
pueden ser categricas o continuas.
3. Se puede incorporar estas variables dentro de nuestros modelos metaanalticos como predictores.
Dependiendo de la naturaleza de estos predictores, tendremos un tipo u otro de modelo metaanaltico.

10.5. Predictores categricos


1. Los predictores son categricos cuando los estudios se pueden segregar en ms de un grupo.
2. En este caso, se calcula el tamao de efecto acumulado para cada grupo, E i y su varianza segn la
frmula:
k

Ej

w
i =1

Ei j

w
i =1

31

ij

ij

var ( E j ) =

w
i =1

donde k j

ij

es el nmero de estudios en el grupo j ;

wi j

son las ponderaciones; y

Ei j

son los tamaos de efecto del estudio i en el grupo j .

3. El intervalo de confianza se calcula como:

E j t 2 k j 1 s E j
3. Se admite que E j es significativo cuando el intervalo de confianza no incluye el valor cero.

10.6. Heterogeneidad dentro y entre grupo (50)


1. Se puede ver si dentro de cada grupo existe heterogeneidad significativa a su vez. La heterogeneidad
dentro de grupo Q wi se calcula como:

Q wi =
2. Se contrasta frente a una

w (E
ij

i =1

Ej)

ij

con k j 1 grados de libertad.

3. Se puede adems comprobar si la los grupos difieren entre ellos en tamao de efectos. Para ello, se
descompone la heterogeneidad total QT en heterogeneidad o variacin en tamaos del efecto debida al
modelo Q M y heterogeneidad debida al error Q E :

QT = Q M + Q E
4. Para datos categricos Q M describe la diferencia entre grupos en los tamaos de efectos acumulados
y se calcula como:

QM =
donde: m

kj

w ( E
i = 1 j =1

ij

E)

es el nmero de grupos;
es el numero de estudios en el grupo j ;

w i j es el peso del estudio i i en el grupo j ;


Ej

es el tamao de efecto acumulado para el grupo j ;

E es el tamao de efecto acumulado global.


5. La heterogeneidad del error residual se calcula como
QE =
donde: E i j

Q
i =1

mi

w ( E
i =1 j =1

ij

ij

Ej)

es el nmero de grupos;

6. Tanto Q M como Q E pueden ser contrastadas frente a una

con m 1 grados de libertad. para

Q M y n m grados de libertad para Q E .


7. Un Q M significativo significa que hay diferencia en el tamao del efecto para los grupos, mientras que
un Q E significativo implica que an hay heterogeneidad no explicada por el modelo.
32

10.7. Predictores continuos (51)


1. A veces el tamao de los efectos de estudios individuales puede explicarse por una variable
independiente. En este caso se utiliza un modelo metaanaltico continuo.
2. Se requieren tres variables de cada estudio: el tamao del efecto E i , la ponderacin w i y el valor de la
variable independiente X i .
3. La relacin entre E i y X i se determina mediante una regresin ponderada:

E i = b 0 + b1 X i +
j

donde b 0 =

wi E i b1 wi E i
i =1

i =1

es la interceptacin de la ordenada; y

w
i =1

i
j

w
i =1

b1 =

X i Ei

wi X i
i =1

w
i =1

Ei

w
i =1

w
X

i
i
j
i =1
2

wi X i

j
i =1
wi

es la pendiente

i =1

4. Sin embargo, sus errores estndares no pueden calcularse mediante el procedimiento de mnimos
cuadrados, sino como:

s b0 =

1
j

wi wi X i

i =1
i =1

w
i =1

s b1 =

Xi

1
j

w
i =1

wi X i
i =1

2
i

w
i =1

5. Dividiendo la pendiente y la ordenada en el origen por sus errores estndares, se halla la puntuacin z .
Este valor se compara al de una distribucin normal para ver si son significativas [si la variable
independiente explica significativamente la variacin en tamaos de efectos].
6.

Q M y Q E se calculan como:
QM =

b12
s 2b1

Q E = QT Q M

33

7.

Q M se comprueba con una 2 con un grado de libertad y su nivel de significacin ser idntico al
nivel de significacin de b1 .

8. Un Q M significativo significa que X i explica una porcin significativa de la variacin en tamaos del
efecto.
9.

Q E se contrasta frente a una 2 con n 2 grados de libertad, y si sale significativo implica que hay
an heterogeneidad no explicada por el modelo.

10.8. Efectos fijos y aleatorios (52)


1. Todos los modelos vistos hasta ahora son modelos de efectos fijos, es decir, modelos que asumen que
hay un tamao de efecto real compartido por todos los estudios o por cada grupo de estudios;
2. Los modelos de efectos fijos calculan los estadsticos basados en el presupuesto de que la nica
variacin en tamao del efecto al error del muestreo;
3. Sin embargo, existe un segundo tipo de modelos denominados modelos de efectos aleatorios que
asumen que existe adems un componente de variacin aleatorio en los tamaos de efectos entre
estudios;
4. En los modelos con efectos aleatorios, este componente aleatorio de variacin se calcula y se introduce
en los estadsticos;
5. Un modelo de efectos aleatorios se construye en tres fases

Se asume un modelo de efectos fijos para determinar el valor de los estadsticos;

Se calcula una varianza entre estudios

pooled .

Este estadstico se usa para recalcular la

ponderacin de cada estudio en modelos aleatorios w i ( rand ) .

Finalmente las nuevas ponderaciones se incluyen en un modelo de efectos aleatorios en las


mismas ecuaciones descritas antes para calcular los estadsticos metaanalticos.
6. En todos los casos, el peso en un modelo de efectos aleatorios se calcula como:

w i ( rand ) =

2
v i + pooled

7. La varianza entre estudios se calcula usando la siguiente frmula cuando no hay estructura:
2
=
pooled

QT ( n 1)
j

w
i =1

w
i =1
j

2
i

w
i =1

8. El numerador es la varianza no explicadas en tamaos de efecto menos el nmero de grados de


libertad. El denominador es una funcin sumatoria de las ponderaciones.
9. Cuando hay estructura subyacente en los datos, y los predictores son categricos, la varianza se
calcula como:
2
pooled
=

QE (n m)

m j
wi

j =1 i =1

i =1

wi j

i =1

2
ij

10. El numerador es de nuevo la varianza no explicada en tamaos de efecto menos el nmero de grados
de libertad. El denominador es una funcin sumatoria de las ponderaciones.
11. Este modelo se denomina a veces modelo de efectos mixtos porque incluye variacin aleatoria entre
estudios dentro de un grupo y diferencias fija entre grupos.
34

12. Cuando hay estructura subyacente en los datos, y los predictores son continuos, la varianza se calcula
como:

Q E ( n 2)

2
=
pooled

w
i =1

wi X i2 2 X i wi X i ii + X i2 wi
i =1

i =1

w w X
i

i =1

i =1

2
ii

w i X i2
i =1

i =1
2

13. El numerador es de nuevo la varianza no explicadas en tamaos de efecto menos el nmero de grados
de libertad. El denominador es una funcin sumatoria de las ponderaciones.

10.9. Modelo lineal general


La complejidad de los modelos metaanalticos puede incrementarse introduciendo ms variables tanto de
naturaleza continua como categrica. Estos modelos pueden ser resueltos mediante modelos lineales
generales ponderados. El modelo lineal general utiliza lgebra matricial para determinar la relacin entre un
conjunto de variables dependientes e independientes.
Sea E el vector de dimensiones 1 n de variables dependientes o tamaos de efecto:

E1

E
E = 2


E n
y sea X la matriz de dimensiones p n de variables dependientes

1 X 11
1 X
12
X =

1 X 1n

X p1
X p 2

X p n

X 21
X 22
X 2n

donde la primera columna es la nica columna incluida para un metaanlisis no estructurado, y las dems
columnas son aadidas cuando existe estructura.
Segn el modelo lineal general, la relacin entre variables dependientes e independientes se determina de
acuerdo con la ecuacin:

E = X +
donde

es un vector de coeficientes (0 a p ); y
es el error del modelo.

En el metaanlisis, los tamao de efecto varan en precisin alrededor del tamao de efecto acumulado
verdadero, por lo que se necesita una estimacin ponderada de :

= ( X W X ) X W E
1

donde W

es una matriz diagonal con los pesos de los estudios individuales

1. Resolviendo el modelo lineal general:

E i = 0 + 1 X 1i + 2 X 2 i + + p X pi
2. La varianza de los coeficientes se hallan como:

= ( X W X )

35

3. Usando el modelo lineal general se pueden tambin hallar la heterogeneidad explicada por el modelo
QM, la heterogeneidad residual QE y por ende la heterogeneidad total QT (frmulas no mostradas):

11. Evaluacin del sesgo de publicacin


Un problema que puede aparecer al realizar metaanlisis es la presencia de sesgo en las publicaciones: la
publicacin selectiva de artculos mostrando cierto tipo de resultados sobre otros (53). Esto ocurre por:
(a)
la tendencia de las revistas de rechazar resultados no significativos;
(b)
la tendencia de los propios autores de no enviar resultados nos significativos.
Este comportamiento conlleva un dficit de resultados nulos (file-drawer problem), y una sobreestimacin de
resultados significativos (inferencia anticonservadora).
La presencia de sesgo de publicacin se evala mediante mtodos grficos o estadsticos.

11.1. Mtodos grficos


Histogramas ponderados (51)
Una forma simple de evaluacin es a travs de histogramas ponderados, en los cuales la altura de las
barras de cada clase se construye mediante los pesos combinados de los estudios en lugar de las
frecuencias. Los mtodos metaanalticos asumen normalidad. As, un histograma ayudar a identificar la
existencia de datos extremos (outliers). Los histogramas bimodales o multimodales indican modelos
estructurados segn variables categricas. Si hay sesgo de publicacin, con ausencia de estudios con nulo
o poco efecto, el histograma mostrar huecos

Figura 12.
Diagrama de embudo
Otra forma simple de evaluacin son los diagramas de embudo (funnel plot), un grfico que representa los
tamaos de los efectos frente al tamao muestral. En ausencia de sesgo debe cumplirse:

Estudios con tamao muestral bajo deben tener error de muestreo alto, y por lo tanto la variacin
alrededor del tamao de efecto debe disminuir cuando aumento el tamao muestral;

El tamao de efecto acumulado debe ser independiente del tamao muestral;

Para un tamao muestral dado, los estudios deben estar distribuidos segn una normal de media el
tamao de error acumulado.
Si estas tres condiciones se cumplen, se obtendr un grfico en forma de embudo (figura 13):
Grfico de cuantiles normales (54)
El grfico de cuantiles normales (54) es un tipo especial del grfico cuantil-cuantil, donde se representan los
cuantiles de nuestra distribucin (el tamao de efecto estandarizado) con una distribucin normal. Si son
iguales, los puntos deben caer en la recta y = x . Este mtodo tiene la ventaja de que es ms fcil de
interpretar, y adems comprueba el supuesto de normalidad bsico a todo estudio metaanaltico.

36

La pendiente de la regresin lineal indica la desviacin tpica de los datos (debera ser igual a 1) y la
interseccin con el eje Y indica la media. La presencia de sesgo de publicacin produce huecos extraos o
extrema no linealidad.
2.22

Tamao de efecto

0.50
-1.23
-2.95
-4.67
2.00

Tamao muestral
6.50

11.00

15.50

20.00

Figura 13

5.53
3.29

1.05
-1.18
-3.42 -2.27

-1.13

0.00

1.1
3

2.27

Normal Quantile

Figura 14

11.2. Mtodos estadsticos


Prueba de correlacin de rangos
En la prueba de correlacin de rangos (55) se correlaciona el tamao de efecto estandarizado, E * con el
tamao muestral n . Es un anlogo estadstico del grfico del embudo.

E* =

E)
v*i

1

j =1 v i

donde v i = v i
*

(E

Como pruebas de correlacin se utiliza una correlacin de rango simple, la de Kendall o la de


Spearman. Si la correlacin es significativa se deduce que hay sesgo de publicacin. Este mtodo aumenta
su potencia para detectar sesgo a medida que aumenta el nmero de estudios incluidos en el metaanlisis.

37

Fail-safe number
Este mtodo calcula el nmero adicional de estudios con tamao de efecto cero que se tiene que aadir
para cambiar los resultados de significativo a no significativo. Existen varios procedimientos para calcularlo.
El ms clsico es el propuesto por Rosenthal (56):
2

NR
donde: n

z( pi )
i =1
n
=
2
z

es el nmero de estudios;

z(p )
1

son las puntuaciones z de los valores individuales significativos;

es la puntuacin z de una cola asociada al nivel de significacin deseado.

Orwin propone un mtodo alternativo:

NO =
donde: n

n ( E0 Em )
Em En

es el nmero de estudios;

E0

es el tamao del efecto medio de los estudios originales;

Em

es el tamao de efecto mnimo deseado, por lo general 0,2; y

En

es el tamao de efecto medio de los estudios adicionales.

Weigthed fail-safe number


Los mtodos anteriores presentan el problema de que no ponderan el tamao muestral de cada estudio
particular. Rosenberg (57) ha propuesto un mtodo promediado calculando el nmero de estudios con
resultado nulo necesarios para reducir el nivel de significacin.

N =

n W
n

w
i =1

donde: n

wi =

es el nmero de estudios;

1
vi

Ei
i =1
W = 2
t (v)

12

w
i =1

El safe number en todo caso debe ser inferior a un valor umbral 2 N + 10 , siendo N el nmero de
estudios.

12. Cualificacin de evidencia y grado de recomendacin


Toda revisin debera concluir con una recomendacin segn el nivel de evidencia existente (grado de
fortaleza metodolgica).

38

recomendacin
1

grado A

metaanlisis
ensayos clnicos aleatorizados con errores y bajos

grado B

3
4

grado C
grado C

grado C

ensayos clnicos aleatorizados con errores y altos


estudios concurrentes de cohorte
estudios de cohortes histricas
estudios de casos y controles
series de casos
Tabla 5 Niveles de evidencia

13. Metaanlisis de pacientes individuales

Reanalizar los datos de pacientes individuales;

Menos sesgos;

Ms fcil de aprovechar los datos;

Ms difciles de realizar.

14. Metaanlisis bayesiano


Algunos estadsticos piensan que otros enfoques estadsticos son ms adecuados que los modelos
expuestos anteriormente. Una aproximacin utiliza el teorema de Bayes, as denominado en honor de
Thomas Bayes, clrigo ingls del siglo XVIII. Los estadsticos bayesianos expresan su creencia acerca del
tamao de un efecto mediante una distribucin de probabilidades previa al conocimiento de los datos, y
actualizan esa creencia calculando una distribucin de probabilidades posterior, que tiene en cuenta los
datos observados. Los modelos bayesianos pueden utilizarse tanto bajo las asunciones de efectos fijos
como las de efectos aleatorios. El intervalo de confianza (o ms correctamente, segn la terminologa
bayesiana, el intervalo de credibilidad del 95 %, que cubre el 95 % de la distribucin de probabilidades
posterior) a menudo ser ms amplio que el que se deriva de los modelos convencionales, debido a que se
introduce otro componente de variabilidad, la distribucin previa. Los enfoques bayesianos son
controvertidos porque la distribucin previa a menudo est basada en opiniones y juicios subjetivos.

15. Comentarios sobre el metaanlisis


El metaanlisis resulta un procedimiento de investigacin que incrementa la calidad de las revisiones
bibliogrficas, dado que provee los elementos para realizarlas metdicamente y arrojar resultados
claramente interpretables.
Los resultados del metaanlisis son tiles a la hora de planificar futuras investigaciones clnicas controladas
aleatorizadas sobre temas similares, ya que proveen la evidencia de los efectos que es dable esperar,
permitiendo por ello mejores clculos del tamao muestral. Tambin aportan los elementos de juicio
necesarios para generar nuevas hiptesis o papara decidir si es necesario practicar nuevas investigaciones
clnicas controladas aleatorizadas sobre la misma cuestin.
Si ninguna de las mejores investigaciones clnicas controladas aleatorizadas incluidas mostrara un efecto
relevante de la intervencin y el metaanlisis s, recomendar su aplicacin slo sobre la base del resultado
de ste puede resultar temerario. Si esta es la situacin, la conclusin es que se requieren ms
investigaciones clnicas controladas aleatorizadas bien diseadas y conducidas que disipen la duda.
Los metaanlisis son aplicables para la aprobacin del uso de intervenciones por parte de organismos
reguladores y en la docencia, ya que poseen la capacidad de mostrar sintticamente la evidencia cientfica
disponible.
Finalmente, el metaanlisis es un procedimiento de investigacin que demanda una utilizacin consciente,
ya que de lo contrario se desacreditar, privando a la Epidemiologa Clnica de un instrumento til.

39

16. Validez del metaanlisis: comparacin con el ensayo clnico


Diversos trabajos han explorado la validez de los resultados de los metaanlisis de ensayos clnicos,
comparndolos con los resultados de grandes ensayos clnicos sobre la misma cuestin.
En un estudio se revisaron 30 metaanlisis de ensayos clnicos de pequeo tamao sobre intervenciones en
perinatologa, y sus resultados fueron comparados con los de un ensayo nico con una muestra grande ( de
ms de 1000 pacientes) sobre la misma cuestin. En un 80 % de los casos la direccin de los resultados
coincidi, pero la concordancia sobre la significacin estadstica de uno y otro fue menor.
En otra revisin de 79 metaanlisis de intervenciones en perinatologa realizados por la Colaboracin
Cochrane, se encontr una coincidencia de 80 % a 90 % en la direccin de los resultados. Se hall el doble
de desacuerdos si se aplicaban modelos de anlisis estadsticos de efectos fijos. De 15 desacuerdos
identificados con el modelo de efectos aleatorios, cinco podan atribuirse a diferencias a diferencias en el
pronstico del grupo control, cuatro a diferencias de protocolo, y uno a un posible sesgo de publicacin; dos
de los otros cinco desacuerdos eran clnicamente irrelevantes. Los autores concluyeron que generalmente
los resultados de estudios pequeos son compatibles con los de los estudios grandes, pero en ocasiones
ocurren discrepancias, incluso si se consideran las diferencias de diseo entre ensayos grandes y
pequeos; no obstante, es raro encontrar diferencias clnicamente importantes sin explicacin.
Una comparacin de 12 ensayos clnicos de gran tamao con 19 metaanlisis previos sobre problemas de
diversas especialidades mdicas lleg a conclusiones ms pesimistas: a pesar de que s encontr
congruencia en la direccin del efecto en un 80 % de los casos, los resultados del metaanlisis hubieran
conducido a la adopcin de un tratamiento inefectivo en un 32 % de los casos y a rechazar un tratamiento
efectivo en un 33 %.
Cuando existen, las discrepancias entre resultados de metaanlisis de ensayos pequeos y los de los
grandes ensayos clnicos sobre la misma cuestin suelen explicarse por la heterogeneidad de las
poblaciones comparadas. As por ejemplo, un metaanlisis concluy que los suplementos de calcio durante
la gestacin son muy efectivos para prevenir la preeclampsia, pero un gran ensayo clnico posterior no
confirm estos resultados. Se pudo comprobar que haba una importante heterogeneidad entre los
pacientes incluidos en los ensayos; cuando estos fueron diferenciados entre los que incluyeron a pacientes
de alto riesgo y los que los incluyeron de bajo riesgo, se observ que los suplementos de calcio tienen un
importante efecto beneficioso en las de riesgo elevado, pero en las de bajo riesgo, similares a las incluidas
en el citado ensayo, el calcio no mostraba efecto protector. As, se concluy que los resultados del
metaanlisis eran compatibles con los del ensayo clnico, y que la aparente discrepancia se deba a la
heterogeneidad de los ensayos clnicos incluidos en el metaanlisis.
Un metaanlisis es riguroso si cumple una serie de condiciones: en primer lugar, es conveniente que
participe un clnico, para no perder de vista la significacin de lo que se examina. En segundo lugar, es
preciso asegurar la calidad del anlisis, con la participacin de un bioestadstica. Es preciso definir
cuidadosamente las preguntas, asegurar que no se deja de incluir ningn ensayo (evitar sobre todo los
sesgos de publicacin), aplicar criterios de inclusin estrictos y cuidadosamente definidos ( de modo que
finalmente puede que se llegue a incluir slo un 10 % de las publicaciones identificadas), expresar los
resultados de los diferentes estudios en una escala comn, evaluar la calidad de cada uno de los ensayos
incluidos y examinar detalladamente cada uno de los estudios por separado. En trminos generales, la
mayor parte de las revisiones no ponen en duda la validez de los ensayos clnicos incluidos, y atribuyen las
discrepancias a fallos o errores metodolgicos en la realizacin del metaanlisis. En cualquier caso, lo ms
importante de los resultados de un metaanlisis no debe ser la magnitud del estimador obtenido, sino la
direccin del efecto, la comparabilidad de los estudios incluidos y las posibles razones que expliquen las
diferencias de resultados entre ellos.
En general, los metaanlisis cuidadosamente realizados pueden ofrecer un adelanto de la tendencia del
efecto que ser observada en ensayos clnicos con una muestra grande de pacientes. Sin embargo, cuando
se usa slo un a de estas dos herramientas metodolgicas, cabe preguntarse cunta incertidumbre debe
aadir el lector a la que ya indican los intervalos de confianza.

17. Conclusiones
El metaanlisis debe ser visto como la estructuracin del proceso a travs del cual se realiza una revisin
de la investigacin existente. La exhaustividad de la revisin y el grado de "combinabilidad", que deben ser
considerados en cualquier revisin, se abordan de forma explcita. Fue razonable combinar los ensayos
individuales que componen un metaanlisis? Es el resultado robusto en relacin con los cambios en las
asunciones? La conclusin alcanzada, tiene sentido desde el punto de vista clnico y fisiopatolgico?

40

Finalmente, ha contribuido el anlisis al proceso de toma de decisiones lgicas en el manejo de los


pacientes?

18. Glosario
anlisis de sensibilidad (sensitivity analysis): existen diferentes tipos. En la valoracin de la
heterogeneidad, el anlisis de sensibilidad trata de la inclusin/exclusin de estudios especficos. En el uso
de tcnicas estadsticas de combinacin, consiste en la repeticin del anlisis de combinacin mediante
varios mtodos, para valorar si se alcanzan los mismos resultados y si stos se alteran por la calidad de los
estudios individuales y el sesgo de publicacin.
calidad de un estudio (study quality): valoracin global de un estudio segn un protocolo probado y
validado. Dado que las diferentes escalas de calidad dan resultados divergentes, deben interpretarse con
precaucin los anlisis basados en una puntuacin global de la calidad. Resulta ms fcil en los ensayos
clnicos que en los estudios de observacin. Los evaluadores deberan utilizar procedimientos que los
mantuvieran enmascarados con respecto a la informacin que puede influir en la evaluacin.
Colaboracin Cochrane (Cochrane Collaboration): organizacin internacional llamada as en honor a
Archibald Cochrane y cuyo objetivo es ayudar a los profesionales a adoptar decisiones bien informadas
sobre la asistencia sanitaria por medio de la preparacin, diseminacin y actualizacin continua de
revisiones sistemticas de ensayos clnicos sobre los efectos de las intervenciones sanitarias. Estas
revisiones se publican en la Cochrane Database of Systematic Reviews, disponible en CDROM. Se pueden
encontrar ms detalles en la siguiente direccin de Internet: www.cochrane.org.
combinacin (pooling): estimacin de una magnitud de efecto resumen (o combinada) tras la agregacin
de las magnitudes de efecto de los estudios individuales.
estadstico Q (Q statistic): prueba de la ji al cuadrado para valorar la heterogeneidad de los estudios
incluidos en un metaanlisis, en la que la magnitud del efecto de cada estudio individual se compara con el
estimador combinado. Por su validez, potencia estadstica y facilidad de clculo, esta prueba de
heterogeneidad es la mejor eleccin.
Glass, Gene V.: psiclogo de la educacin que acu el trmino metaanlisis en 1976.
grficos en rbol de Navidad (Christmas tree plots): grfico que se utiliza para detectar
el sesgo de publicacin, en el que en el eje de ordenadas se representa el tamao del estudio (o el error
estndar del parmetro que se pondera en sentido decreciente) y en el de abscisas el parmetro que mide
la magnitud del efecto. Se traza un eje vertical que pasa por el valor ponderado global. La asimetra con
relacin al eje (sobre todo en la parte baja del rbol) indica sesgo de publicacin.
grficos en embudo (funnel plots): conjunto de mtodos grficos para representar la existencia de un
posible sesgo de publicacin. Muestra la relacin entre la magnitud del efecto (eje de ordenadas) y el
tamao del estudio (eje de abscisas), que se puede medir de distintas maneras (error estndar de la
magnitud del efecto, su inverso, el tamao de la muestra o el nmero de efectos observados). Se dibuja una
lnea horizontal que pasa por el valor ponderado global. Si no hay sesgo de publicacin aparece la forma de
un embudo tpico (simetra con relacin a la lnea dibujada).
heterogeneidad (heterogeneity): significa que hay variabilidad estadstica entre los estudios que se
combinan. Puede proceder de muchas fuentes (ms numerosas en los estudios de observacin que en los
diseos experimentales): caractersticas de la poblacin del estudio (por ejemplo, el riesgo subyacente del
efecto o subgrupos diferentes de alto o bajo riesgo), variaciones en el diseo del estudio (tipo de diseo,
mtodos de seleccin, fuentes de informacin, manera de reunir la informacin), diferentes mtodos
estadsticos y distintos esquemas de ajuste de los factores de confusin. Dado que las pruebas estadsticas
de heterogeneidad tienen poca potencia estadstica, se recomienda utilizar como punto de corte una p < 0,1
(no 0,05). Si hay heterogeneidad, el estimador ponderado no tiene sentido, ya que ello significa que hay
ms de una magnitud de efecto verdadera en los estudios que se combinan.
homogeneidad (homogeneity): lo opuesto a heterogeneidad.
inverso de la varianza (inverse of variance): el tipo ms comn de ponderacin utilizado para combinar
diferentes estudios individuales en un estimador ponderado. Se puede aplicar a muchas medidas de
magnitud del efecto.
magnitud del efecto (effect size): estimador estandarizado no escalar de la relacin entre
una exposicin y un efecto. En sentido general, este trmino se aplica a cualquier medida de la diferencia
en el resultado entre los grupos de estudio; de tal manera que el riesgo relativo (relative risk), la razn de
odds (odds ratio) y la diferencia de riesgos (risk difference) son magnitudes de efecto. Cuando la
magnitud del efecto se aplica a mediciones de variables continuas (como la media), su estimador comn
41

ms usado es la diferencia media estandarizada, que se calcula como la diferencia de medias dividida por la
desviacin estndar. Esto es sobre todo til cuando no hay una medida comn a todos los estudios.
metaanlisis (meta-analysis, overview): el prefijo meta (del griego ) significa despus de. Se puede
definir como la sistemtica identificacin, valoracin, sntesis y, si es pertinente, la agregacin estadstica de
todos los estudios sobre el mismo tema, siguiendo un mtodo explcito y predeterminado.
metaanlisis acumulado (cumulative metaanalysis): tipo de metaanlisis en el que los estudios se
combinan secuencialmente mediante la adicin cada vez de un estudio nuevo segn una variable ordinal.
Por ejemplo, si la variable ordinal es el ao de publicacin, los estudios se ordenarn por ella, y a
continuacin se realizar un anlisis combinado cada vez que aparezca un estudio. Muestra la evolucin del
estimador ponderado segn la variable ordinal. Otras variables frecuentemente usadas en el metaanlisis
acumulado son la calidad del estudio, la frecuencia del efecto en el grupo de referencia, el tamao de la
diferencia entre los grupos y otras variables (por ejemplo, el tiempo medio transcurrido hasta el tratamiento).
Mide la contribucin de un nuevo estudio a lo ya existente y tambin se puede utilizar como procedimiento
para explicar la heterogeneidad.
metaanlisis cualitativo (qualitative metaanalysis) : parte del metaanlisis que se refiere a la valoracin de
los mtodos utilizados en cada estudio individual. En la actualidad se considera prcticamente sinnimo del
concepto de revisin sistemtica.
metarregresin (meta-regression): coleccin de mtodos estadsticos (regresin lineal ponderada o no,
regresin logstica) para valorar la heterogeneidad, en los que la magnitud del efecto se enfrenta a una o
ms covariables. Es un procedimiento que se puede utilizar cuando el nmero de estudios no es muy
abundante (< 20).
mtodo de De Simonian-Laird (DerSimonian- Lairds method): fue descrito por vez primera por Cochrane
en 1954. Fue el primer modelo de efectos aleatorios y se aplic a un modelo aditivo (diferencia de riesgos),
ponderado por el inverso de la varianza.
mtodo de Egger (Eggers method): procedimiento para detectar un sesgo de publicacin. Consiste en una
regresin lineal simple de la magnitud del efecto dividida por su error estndar sobre el inverso del error
estndar, en la que se prueba si la ordenada en el origen es estadsticamente significativa con p < 0,1.
mtodo de Macaskill, Walter e Irwig (Macaskill et als method (58)): es mejor que el mtodo de Egger para
detectar un sesgo de publicacin. Se realiza una regresin lineal simple entre la magnitud del efecto y el
tamao del estudio (el clsico funnel plot). Se recomienda ponderar la regresin por el inverso de la
varianza del efecto global observado en cada estudio individual. Se investiga si la pendiente de la recta de
regresin es distinta de cero o no. En el caso de estudios experimentales o de cohortes, el efecto es la
enfermedad (curacin, etc.); en estos casos se suman los efectos observados en los grupos que se
comparan y el resultado se divide por el tamao total del estudio (incidencia acumulada o tasa total).
mtodo de Mantel-Haenszel (Mantel-Haenszels method): mtodo estadstico de combinacin de riesgos
relativos y razn de odds de estudios individuales, que se describi para combinar estratos de un mismo
estudio. Hay que conocer la distribucin cruda de los datos, por lo que suele ser apropiado para los estudios
experimentales aleatorizados, pero si los autores de los estudios originales proporcionan la informacin
necesaria, puede aplicarse a cualquier tipo de estudio.
mtodo de Peto (Petos method): mtodo estadstico para combinar estudios individuales, derivado del
mtodo de Mantel-Haenszel, en el que los efectos observados en el grupo ndice se comparan con los
esperados, ponderando por la varianza. Debera usarse slo cuando el tamao de muestra de las ramas de
un estudio es similar y cuando la magnitud de efecto es prxima al valor nulo; en otras situaciones da un
resultado sesgado (que es lo ms habitual).
modelo de efectos aleatorios (random effects model): mtodo de combinacin de magnitudes de efecto
individuales en el que la heterogeneidad se incorpora al estimador
resumen mediante la inclusin de un componente de la variabilidad entre los estudios. Supone que la
muestra de estudios incluidos en el anlisis se extrae de una poblacin de estudios. Este modelo no supone
homogeneidad en las magnitudes de efecto de los estudios que se combinan; esto es, cada muestra de
estudio tiene una verdadera magnitud de efecto. No hay acuerdo sobre si este modelo es ms apropiado
que el de efectos fijos para combinar estudios. Se recomienda cuando el nmero de estudios es pequeo,
siempre y cuando no haya sesgo de publicacin, ya que es un mtodo que da ms importancia a los
estudios pequeos.
modelo de efectos fijos (fixed effects model): cualquier modelo estadstico en el que se asume
homogeneidad del efecto en los diferentes estudios que se combinan, esto es, en el que la verdadera
magnitud del efecto tiene un valor comn y real para todos los estudios. En el estimador ponderado slo se
considera la varianza de cada estudio individual.
42

peso (weighting): la influencia dada a cada estudio individual en el anlisis combinado. Hay diferentes tipos
de ponderaciones: inverso de la varianza, por la distribucin de los datos (Mantel-Haenszel), por la varianza
de los casos esperados en la referencia (Peto), etctera.
problema de la extraccin de archivos (file drawer problem): trmino acuado por Rosenthal para
referirse al nmero de estudios con resultados no significativos estadsticamente (p > 0,05) que no se han
publicado.
revisin sistemtica (systematic review): sntesis de los resultados de varios estudios primarios mediante
tcnicas que limitan los sesgos y el error aleatorio. Estas tcnicas incluyen la bsqueda de todos los
estudios potencialmente relevantes y el uso de criterios explcitos y fiables en la seleccin de las
investigaciones. La revisin sistemtica cualitativa resume las investigaciones primarias u originales sin
combinacin estadstica (metaanlisis cualitativo). La revisin sistemtica cuantitativa es sinnimo de
metaanlisis.
sesgo de bsqueda (bias, search): error sistemtico introducido cuando la bsqueda se centra en una sola
base de datos (normalmente Medline). Las revistas escritas en ingls estn ms representadas en Medline;
adems, las revistas de un pas (y de pases vecinos o de similar idioma o cultura) donde se confecciona la
base de datos tambin estn proporcionalmente ms representadas. Es recomendable consultar ms de
una base de datos, junto con una bsqueda manual de las referencias localizadas en cada estudio.
sesgo de idioma (bias, language): error sistemtico introducido cuando la bsqueda de estudios
potenciales de un metaanlisis se centra en un solo idioma, en general el ingls. Es posible que los
resultados significativos alcanzados en pases de habla no inglesa se publiquen ms frecuentemente en
ingls que en su idioma nativo, por la mayor difusin alcanzada.
sesgo de publicacin (bias, publication): sesgo introducido cuando los estudios publicados no representan
adecuadamente todos los estudios realizados sobre un tema especfico. Puede deberse a muchos hechos,
aunque el mejor conocido es la tendencia a publicar resultados estadsticamente significativos (p < 0,05) o
clnicamente relevantes (magnitud del efecto alta, aunque no significativa). Otras variables que influyen en
el sesgo de publicacin son el tamao de muestra (mayor sesgo en estudios pequeos), tipo de diseo
(menor en los ensayos clnicos aleatorizados), financiacin, conflicto de intereses, prejuicio frente a una
asociacin y el patrocinio.

19. Bibliografa
1.
Dickersin K, Higgins K, Meinert CL. Identification of meta-analyses. The need for standard
terminology. Control Clin Trials. 1990;11(1):52-66.
2.
Fisher RA. Statistical methods for research workers. 4 ed. Londres: Oliver and Boyd; 1932.
3.
Stouffer SA, Suchman EA, DeVinney LC, Star SA, Williams RM. The American soldier: Adjustment
during army life. Princeton: Princeton University Press; 1949.
4.
Mosteller F, Bush RR. Selected quantitative techniques. In: Lindsey G, editor. Handbook of social
psychology. Vol 1. Theory and method. Cambridge: Addison-Wesley; 1954. p. 289-334.
5.
Smith ML, Glass GV. Meta-analysis of psychotherapy outcome studies. American Psychologist
1977;32:752760.
6.
Lipsey MW, Wilson DB. Practical meta-analysis. Londres: Sage Publications; 2001.
7.
Dickersin K, Scherer R, Lefebvre C. Identifying relevant studies for systematic reviews. Bmj.
1994;309(6964):1286-91.
8.
DerSimonian R, Laird N. Meta-analysis in clinical trials. Control Clin Trials. 1986;7(3):177-88.
9.
Galbraith RF. A note on graphical presentation of estimated odds ratios from several clinical trials.
Stat Med. 1988;7(8):889-94.
10.
L'Abbe KA, Detsky AS, O'Rourke K. Meta-analysis in clinical research. Ann Intern Med.
1987;107(2):224-33.
11.
Silagy C, Ketteridge S. Physician advice for smoking cessation. In: Lancaster T, Silagy C, Fullerton
D, editors. Tobacco addiction module. The Cochrane Database of Systematic Reviews. N 4. (1 Septiembre
1997). Oxford: The Cochrane Collaboration. Disponible en Cochrane Library.; 1997.
12.
Porter AM, McCullough DM. Counselling against cigarette smoking. A controlled study from a
general practice. Practitioner. 1972;209(253):686-9.
13.
Russell MA, Wilson C, Taylor C, Baker CD. Effect of general practitioners' advice against smoking.
Br
Med
J.
1979;2(6184):231-5.

43

14.
Wilson D, Wood G, Johnston N, Sicurella J. Randomized clinical trial of supportive follow-up for
cigarette smokers in a family practice. Can Med Assoc J. 1982;126(2):127-9.
15.
Stewart PJ, Rosser WW. The impact of routine advice on smoking cessation from family physicians.
Can Med Assoc J. 1982;126(9):1051-4.
16.
Russell MA, Merriman R, Stapleton J, Taylor W. Effect of nicotine chewing gum as an adjunct to
general practitioner's advice against smoking. Br Med J (Clin Res Ed). 1983;287(6407):1782-5.
17.
Jamrozik K, Vessey M, Fowler G, Wald N, Parker G, Van Vunakis H. Controlled trial of three different
antismoking interventions in general practice. Br Med J (Clin Res Ed). 1984;288(6429):1499-503.
18.
McDowell I, Mothersill KJ, Rosser W, Hartman R. A randomized trial of three approaches to
smoking cessation. Can Fam Phys 1985;31:351-355.
19.
Page AR, Walters DJ, Schlegel RP, Best JA. Smoking cessation in family practice: the effects of
advice and nicotine chewing gum prescription. Addict Behav. 1986;11(4):443-6.
20.
Janz NK, Becker MH, Kirscht JP, Eraker SA, Billi JE, Woolliscroft JO. Evaluation of a minimalcontact smoking cessation intervention in an outpatient setting. Am J Public Health. 1987;77(7):805-9.
21.
Slama K, Redman S, Perkins J, Reid AL, Sanson-Fisher RW. The effectiveness of two smoking
cessation programmes for use in general practice: a randomised clinical trial. Bmj. 1990;300(6741):1707-9.
22.
Wetter DW, Remington PL, Pezzino G. The smoking continuum in Wisconsin, 1990. Wis Med J.
1992;91(4):183, 185-6.
23.
Demers RY, Neale AV, Adams R, Trembath C, Herman SC. The impact of physicians' brief smoking
cessation counseling: a MIRNET study. J Fam Pract. 1990;31(6):625-9.
24.
Wilson PA. Effectiveness of anti-smoking advice from doctors who smoke. J R Coll Gen Pract.
1989;39(326):388.
25.
Haug K, Fugelli P, Aaro LE, Foss OP. Is smoking intervention in general practice more successful
among pregnant than non-pregnant women? Fam Pract. 1994;11(2):111-6.
26.
Higashi A, Ozasa K, Watanabe Y, Hayashi K, Aoike A, Kawai K, et al. [Efficacy of smoking cessation
instruction for general smokers at an annual physical examination]. Nippon Koshu Eisei Zasshi.
1995;42(5):313-21.
27.
Slama K, Karsenty S, Hirsch A. Effectiveness of minimal intervention by general practitioners with
their smoking patients: a randomised controlled trial in France. Tobacco Control 1995;4:162-169.
28.
Begg CB, Mazumdar M. Operating characteristics of a rank correlation test for publication bias.
Biometrics. 1994;50(4):1088-101.
29.
Egger M, Davey Smith G, Schneider M, Minder C. Bias in meta-analysis detected by a simple,
graphical test. Bmj. 1997;315(7109):629-34.
30.
Brinton LA, Huggins GR, Lehman HF, Mallin K, Savitz DA, Trapido E, et al. Long-term use of oral
contraceptives and risk of invasive cervical cancer. Int J Cancer. 1986;38(3):339-44.
31.
Celentano DD, Klassen AC, Weisman CS, Rosenshein NB. The role of contraceptive use in cervical
cancer: the Maryland Cervical Cancer Case-Control Study. Am J Epidemiol. 1987;126(4):592-604.
32.
Ebeling K, Nischan P, Schindler C. Use of oral contraceptives and risk of invasive cervical cancer in
previously screened women. Int J Cancer. 1987;39(4):427-30.
33.
Invasive squamous-cell cervical carcinoma and combined oral contraceptives: results from a
multinational study. WHO Collaborative Study of Neoplasia and Steroid Contraceptives. Int J Cancer.
1993;55(2):228-36.
34.
Parazzini F, la Vecchia C, Negri E, Maggi R. Oral contraceptive use and invasive cervical cancer. Int
J Epidemiol. 1990;19(2):259-63.
35.
Beral V, Hannaford P, Kay C. Oral contraceptive use and malignancies of the genital tract. Results
from the Royal College of General Practitioners' Oral Contraception Study. Lancet. 1988;2(8624):1331-5.
36.
Brinton LA, Reeves WC, Brenes MM, Herrero R, de Britton RC, Gaitan E, et al. Oral contraceptive
use and risk of invasive cervical cancer. Int J Epidemiol. 1990;19(1):4-11.
37.
Kjaer SK, Engholm G, Dahl C, Bock JE, Lynge E, Jensen OM. Case-control study of risk factors for
cervical squamous-cell neoplasia in Denmark. III. Role of oral contraceptive use. Cancer Causes Control.
1993;4(6):513-9.

44

38.
Daling JR, Madeleine MM, McKnight B, Carter JJ, Wipf GC, Ashley R, et al. The relationship of
human papillomavirus-related cervical tumors to cigarette smoking, oral contraceptive use, and prior herpes
simplex
virus
type
2
infection.
Cancer
Epidemiol
Biomarkers
Prev.
1996;5(7):541-8.

39.
Eluf-Neto J, Booth M, Munoz N, Bosch FX, Meijer CJ, Walboomers JM. Human papillomavirus and
invasive cervical cancer in Brazil. Br J Cancer. 1994;69(1):114-9.
40.
Schiaffino A, Rodrguez M, Pasarn MI, Regidor E, Borrell C, Fernndez E. Odds ratio o razn de
proporciones?: Su utilizacin en estudios transversales. Gac Sanit. [online] [citado 2007-11-20]
2003;17(1):51.
41.
Flanders WD. A new variance estimator for the Mantel-Haenszel odds ratio. Biometrics 1985;41:637642.
42.
Robins J, Breslow N, Greenland S. Estimators of the Mantel-Haenszel variance consistent in both
sparse data and large-strata limiting models. Biometrics. 1986;42(2):311-23.
43.
Cohen J. Statistical power analysis for the behavioral sciences. 2 ed. Nueva York: Academic Press.;
1988.
44.
Glass GV. Primary, Secondary, and Meta-Analysis of Research. Educational Researcher
1976;5(10):3-8.
45.
Hedge LV. Distribution theory for Glass's estimator of effect size and related estimator. J Ed Stat
1981;6:107-128.
46.
Cohen J. Statistical power analysis for the behavioural sciences. Nueva York: Academic Press;
1969.
47.
Hedges LV, Gurevitch J, Curtis PS. The meta-analysis of response ratios in experimental ecology.
Ecology 1999;80:1150-1156.
48.
Normand SL. Meta-analysis: formulating, evaluating, combining, and reporting. Stat Med.
1999;18(3):321-59.
49.
Sokal RR, Rohlf FJ. Biometry. 3 ed. San Francisco: Freeman; 1995.
50.
Hedges LV, Olkin I. Statistical methods for meta-analysis. Nueva York: Academic Press; 1985.
51.
Greenland S. Quantitative methods in the review of epidemiologic literature. Epidemiologic Reviews
1987;9:1-30.
52.
Gurevitch J, Hedges LV. Statistical isues in ecological meta-analysis. Ecology 1999;80(1142-1149).
53.
Begg CB, Berlin JA. Publication bias: a problem in interpreting medical data. J Roy Stat Soc, Ser A
1988;151:419-463.
54.
Wang MC, Bushman BJ. Using the normal quantile plot to explore meta-analytic data sets.
Psychological Methods 1998;3:46-54.
55.
Begg CB. Publication bias. In: Cooper H, Hedge LV, editors. The Handbook of research synthesis.
Nueva York: Russell Sage Fundation; 1994. p. 399-409.
56.
Rosenthal R. The "file drawer problem" and tolerance for null results. Psychological Bulletin
1979;86:638-641.
57.
Rosenberg MS. The file-drawer problem revisited: a general weighted method for calculating fail-safe
numbers in meta-analysis. Evolution 2005;59(464-468).
58.
Macaskill P, Walter SD, Irwig L. A comparison of methods to detect publication bias in meta-analysis.
Stat Med. 2001;20(4):641-54.

20. Bibliografa adicional


1. Abraira V. Revisiones sistemticas y metaanlisis. Semergen 2003; 29(4): 183-5.
2. Bero L, Rennie D. The Cochrane Collaboration. JAMA 1995; 274: 1935-8.
3. Berkey CS, Hoaglin DC, Mosteller F, Colditz GA. A random-effects regression model for meta-analysis.
Stat Med 1995; 14: 395-411.
4. Boissel J-P, Blanchard J, Panak E, Peyrieux JC, Sacks S. Considerations for the meta-analysis of
randomised clinical trials. Summary of a panel discussion. Contr Clin Trials 1989; 10: 254-81.

45

5. Brockwell SE, Gordon IR. A comparison of statistical methods for meta-analysis. Stat Med 2001; 20: 82540.
6. Ceballos C., Crdoba E ,Valdizn JR, Garca Campayo J, Artal A, Giraldo P. Medicina nuclear basada en
la
evidencia:
20
aos
de
metaanlisis.
Alasbimn
Journal
2000;
2(7).
http://www.alasbimnjournal.cl/revistas/7/ceballostotal.html
7. Colditz GA, Burdick E, Mosteller F. Heterogeneity in meta-analysis of data from epidemiologic studies: a
comentary. Am J Epidemiol 1995; 142: 371-82.
8. Cook DJ, Mulrow CD, Haynes RB. Systematic reviews: synthesis of best evidence for clinical decisions.
Ann Intern Med 1997; 126: 376-80.
9. Delgado-Rodrguez M. Glossary on meta-analysis. J Epidemiol Commun Health 2001; 55: 534-6.
10. Egger M, Zellweger-Zhner, Schneider M, Junker C, Lengeler C, Antes G. Language bias in randomised
controlled trials published in English and German. Lancet 1997; 350: 326-9.
11. Escrig-Sos J, Molina Martnez J Interpretacin de los resultados de un ensayo clnico o metaanlisis en
angiologa y ciruga vascular: odds ratios, riesgo relativo, intervalos de confianza y credibilidad. Angiologa
2007; 59; 3-11.
12. Felson DT. Bias in meta-analytic research. J Clin Epidemiol 1992; 45: 885-92.
13. Fleiss JL. The statistical basis of meta-analysis. Stat Methods Med Res 1993; 2: 121-45.
14. Gibaldi M. Meta-analysis. A review of its place in therapeutic decision-making. Drugs 1993; 46: 805-18
15. Greenland S, Salvan A. Bias in the one-step method for pooling study results. Stat Med 1990; 9: 247-52.
16. Greenland S. Meta-analysis. En: Rothman KJ, Greenland S, eds.: Modern epidemiology, 2. ed. Boston:
Lippincott-Raven; 1998, 643-73.
17. Guallar E, Banegas JR, Martn-Moreno JM, del Ro A. Metaanlisis: su importancia en la toma de
decisiones clnicas en cardiologa. Rev Esp Cardiol 1994; 47: 509-17
18. Hardy RJ, Thompson SG. A likelihood approach to meta-analysis with random effects. Stat Med
1996;15:619-29
19. Katerndahl DA, Lawler W R. Variability in meta-analytic results concerning the value of cholesterol
reduction in coronary heart disease. A meta-analysis. Am J Epidemiol 1999; 149: 429-41.
20. Jenicek M. Mta-analyse in medecine. Qubec: Edisem 1987.
Jenicek M. Mta-analyse en mdecine. valuation et synthse de linformation clinique et pidmiologique.
St. Hyacinthe, y Paris: EDISEM y Maloine d., 1987.
21. Jenicek M. Meta-analysis in medicine: where we are and where we want to go. J Clin Epidemiol 1989;
42: 35-44.
22. Jni P, Witschi A, Bloch R, Egger M. The hazards of scoring the quality of clinical trials for meta-analysis.
JAMA 1999; 282: 1054-60.
23. Leandro G. Meta-analysis. Meta-analysis in medical research : the handbook for the understanding and
practice of meta-analysis. Malden, Mass: BMJ books: Blackwell, 2005.
24. Lau J, Schmid CH, Chalmers TC. Cumulative meta-analysis of clinical trials builds evidence for
exemplary medical care. J Clin Epidemiol 1995; 48: 45-57.
25. Marn-Martnez, F., Snchez-Meca, J., & Huedo-Medina, T. (2004). El coste de la dicotomizacin en
meta-anlisis [The cost of dichotomizing in meta-analysis]. Metodologa de las Ciencias del
Comportamiento, Volumen Especial, 367-375.
26. Molinero LM. Metaanlisis: claves para interpretar una herramienta de investigacin controvertida.
Hipertensin 2001; 18: 232-40.
27. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF. Improving the quality of reports of metaanalysis of randomised controlled trials: the QUOROM statement. Lancet 1999; 354: 1896-900.
28. Prtega Daz S, Pita Fernndez S. Revisiones sistemticas y metaanlisis. Cad Aten Primaria 2005; 12:
109-12.
29. Petitti DB. Meta-analysis, decision analysis and cost-effectiveness analysis. Methods for quantitative
synthesis in medicine. New York: Oxford University Press, 1994.
30. Ruano-Ravina A, Figueiras A, Barros-Dios JM. El metaanlisis a debate. Med Clin (Barc) 2002; 119:
439.
31. Snchez-Meca J, Marin-Martnez F y Huedo-Medina T. Modelo de efectos fijos y modelo de efectos
aleatorios. En Matas JLR, Tobias A, Seoane T, eds.: Revisiones sistemticas en ciencias de la vida.
Toledo: FISCAN, 2006; 189-204
46

32. Snchez-Meca J, Marn-Martnez F. Testing significance of a common risk difference in meta-analysis.


Com Stats Data Anal 2000; 33: 299-313.
33. Snchez-Meca J, Marn-Martnez F. Meta-analysis of 2x2 tables: Estimating a common risk difference.
Ed Psychol Measurement 2001; 61: 249-76
34. Sutton AJ, Abrams KR, Jones DR, Sheldon TA, Song F. Methods for meta-analysis in medical research.
New York: Wiley, 2000.
35. Takkouche B, Cadarso-Surez C, Spiegelman D. Evaluation of old and new tests of heterogeneity in
epidemiologic meta-analysis. Am J Epidemiol 1999; 150: 206-15.
36.Tang JL, Liu JL. Misleading funnel plot for detection of bias in meta-analysis. J Clin Epidemiol 2000; 53:
477-84.
37. Teagarden JR. Meta-analysis: whither narrative review? Pharmacotherapy 1989; 9: 274-81.
38 Thompson SG, Sharp SJ. Explaining heterogeneity in meta-analysis: a comparison of methods. Stat Med
1999; 18: 2693-708.
39. Thornton A, Lee P. Publication bias in meta-analysis: its causes and consequences. J Clin Epidemiol
2000; 53: 207-16.
40. www.icf.uab.es/llibre/pdf/cap-6.pdf
41. www.prematuros.cl/webmarzo06/metaanalisis/metaanalisis_revisionsistematica.htm
42. http://www.seh-lelha.org/pdf/metaanalisis.pdf
43. http://mural.uv.es/safu/preventiva/Tema%2018.htm
44. www.iambe.org.ar
45. http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/11-Ayuda%20Meta-an%E1lisis.pdf

47