Sunteți pe pagina 1din 396

CONTENIDOS

Nota del traductor xi


Prefacio xiii
Agradecimientos xvii

1. LA APARICION DE LA EPIDEMIOLOGIA 3
2. INFERENCIA CAUSAL EN EPIDEM IOLOGIA 11
Filosofia de la Inferencia Científica 12
Un modelo general de causa J5
Inferencia causal en Epidemiología 22

3.' MEDIDAS DE FRECUENCIA DE UNA ENFERMEDAD 29


Incidencia 30
Incidencia acumulada 36
Prevalencia 39

4~ MEDIDAS DEL EFECTO 43


Efecto absoluto 43
Efecto relativo 45
Proporción atribuible 47

5. _ ESTANDARIZACION DE TASAS 49
El principio de estandarización 49
Estandarización «indirecta» Versus «directa» 53

6.' TIPOS DE ESTUDIO EPIDEMIOLOGICO 59


Estudios experimentales 60
Estudios no-experimentales 64

7. " OBJETIVOS DEL DISEÑO DE ESTUDIOS EPIDEMIO-


LOGICOS........... .... ................... ....... .. 89
Precisión (carencia de error aleatorio) 90
Validez (carencia de error sistemático) 96

8. ESTRATEGIAS EN EL DISEÑO DE ESTUDIOS EPIDE-


MIOLOGICOS ......................... ....... .. .... 115
Mejora de la precisión 115
Mejora de fa validez 118
VII
r VIII

9.
INDICE GENERAL

EL PAPEL DE LA ESTADISTICA EN ANALISIS EPI-


DEMIOLOGICOS .. ... ...... ...... ............ . 133
13. APAREA
Principios
Determinación de la variabilidad aleatoria 133
Delerminación y control del efecto de confusión 144 SOBREAI
APAREA]
10. FUNDAMENTOS DEL ANALISIS DE DATOS EPIDE- DAD DE
MIOLOGICOS ........... .... ........ . .............. 149 Análisis dt.
Edición de los datos 150
Reducción de los datos 153 ESTIMAC
Estimación del efecto (y comprobación de la hipótesis) 156 (RAZON
CASO-CC
11. ANA LISIS DE DATOS CRUDOS 173
Comprobación de hipótesis con datos crudos 173
Estimación de efectos con datos crudos 185 COMPRC
DATOS e
12. ANALISIS ESTRATIFICADO ... . 199
Evaluación y control de la confusión 201 ESTIMAC
. VENTAJP
ESTIMACION PUNTUAL DE UN EFECTO UNIFOR- DOS ....
ME .................................... . . . .......... 204 Estudios d
Poo/ing con varianzas inversas (pooling directo) 205 Eva/uación
Pooling utilizando el método de la máxima probabilidad 213 dos 3
Poo/ing con estimadores de Mantel-Haenszel 219 Eva/uación
tro/ 3
COMPROBACION DE LA HIPOTESIS ESTADISTICA Análisis m
PARA DATOS ESTRATIFICADOS................ . 220
Comprobación de hipótesis con dalos estratificados persona- 14. ANALISI~
tiempo 222 Modelos 11'
Comprobación de hipótesis con datos estratificados de «Inci- Diseño de ,
dencia acumulada, de prevalencia o de caso-control (Tablas Mode/os rr,
de2 x 2) 228 Ventajas y
Uso de UI
INTERVALOS DE CONFIAZA PARA ESTIMADOS sión 3
CONJUNTADOS DEL EFECTO . . ................ . 232
Intervalos de confianza para datos estratificados persona 15. INTERAC
tiempo 233 Definición
Intervalos de confianza para datos de incidencia acumulada Medición a
estratificados 239
Intervalos de confianza de la razón de ventaja con datos 16. ANA LISIS
estratificados de caso-control (o de prevalencia) 242 PLES ...
Evaluación y descripción de la modificación del efecto 246 Estimación
Comprobac
EVALUACION DE LA MODIFICACION DEL EFECTO 247 cia 38.
Análisis mIo
DESCRIPCION DE LA MODIFICACION DEL EFECTO 25>1
Estimados del efecto estandarizados 253 IN DICE ..
Funciones del efecto 260
INDICE GENERAL

13. APAREAMIENTO 265


Principios de apareamiento 265

SOBREAPAREAMIENTO ............................ 276


APAREAMIENTO SOBRE INDICADORES DE CALI-
DAD DE INFORMACION ... ..... ..... ....... ..... .. 278
Análisis de casowconlrol apareados 279

EST!MACION PUNTUAL DEL RIESGO RELATIVO


(RAZON DE VENTAJA) A PARTIR DE DATOS DE
CASO-CONTROL APAREADOS .. ....... . ..... ....... 280

COMPROBACION DE HIPOTESIS ESTADISTICA CON


DATOS CASO-CONTROL APAREADOS .............. 289

EST!MACION DEL INTERVALO DE LA RAZON DE


VENTAJA CON DATOS CASO-CONTROL APAREA-
DOS ............ ..... .. ... ..... .... ........... . ..... 295
Estudios de seguimiento apareados 306
Evaluación de la modificación del efecto con datos aparea-
dos 310 -
Evaluación del efecto de aparear con datos de caso-con-
tra! 312
Análisis multivariado de datos apareados 313

14. ANALISIS MULTIVARIADO 317


Modelos matemáticos básicos 319
Diseño de modelos rnultivariados para realizar inferencia 332
Modelos multivariados en análisis ecológicos 338
Ventajas y limitaciones de los modelos multivariados 340
Uso de una puntuación resumen para el efecto de confu w
sión 312

15. INTERACCIONES ENTRE CAUSAS 347


Definición de interacción 349
Medición de la interacción 358

16. ANALISIS CON NIVELES DE EXPOSICION MULT!-


PLES ....... ... ......... . ................. . ......... 365
Estimación de efectos para niveles de exposición múltiple 370
Comprobación de hipótesis estadística para detectar tenden-
cia 386
Análisis multivariado para detectar tendencia 388

INDICE ...... ..... ........................... ..... .. 391


1. LA APARICION
DE LA EPIDEMIOLOGIA

En comparación con otras ciencias, la epidemiologia se halla aún en


estado embrionario. Aunque antes del siglo xx se llevaron a cabo algu-
nos estudios epidemiológicos excelentes, tan sólo en las dos últimas
décadas ha empezado a tomar forma un cuerpo de principios epidemio-
] lógicos sistematizado con los que diseñar y juzgar tales estudios. Estos
principios han evolucionado en paralelo con una explosión de actividad
epidemiológica que cubre una amplia gama de problemas de salud.
Después de la Segunda Guerra Mundial, los Estados Unidos inicia-
ron muchos estudios a gran escala en el área que nos ocupa. Un cierto
número de éstos han tenido profundas influencias posteriores sobre la
salud de los ciudadanos de hoy día. Por ejemplo, los ensayos comunita-
-j rios de intervención sobre fluoración de las aguas, empezados en los años
cuarenta, han llevado a una amplia prevención primaria de las caries den-
tales (Ast, 1965). El estudio cardiológico de Framinghan, iniciado en 1949
para estudiar los factores de riesgo de la enfermedad cardiovascular, es el
más notable de varios de ellos de larga duración sobre estas enferme-
dades, que han contribuido de manera importante a comprender la
etiología de este tremendo problema de salud pública (Dawber et al.,
1957; Kannel et al., 1961; Kannel el al., 1970; McKee el al., 197}). Treinta
y cinco años después de su comienzo, este notable estudio sigue produ-
ciendo hallazgos de valor (Kannel et al., 1981) e indudablemente ha
aportado un conocimiento esencial en la contención de la epidemia
estadounidense de mortalidad cardiovascular, que alcanzó su cima a
mediados de los años sesenta (Stallones, 1980). El mayor experimento
formal en humanos nunca llevado .a cabo fue el ensayo de campo de la
vacuna Salk, en 1954, con cerca de un millón de niños en edad escolar
como sujetos (Francis et al., 1957). Este estudio proporcionó las bases
prácticas para la prevención de la políomelitis paralítica.
La misma época vio los primeros estudios epidemiológicos relacio-
nando el hábito de fumar con la salud y que llevaron finalmente a la
aparición del informe Smoking and Health presentado por el Surgeon
General, en 1964 (USA-Depart. de Salud, Educación y Bienestar, 1964),
3

, ::::'
EPIDEMIOLOGIA MODERNA

que marcó un verdadero hito. Desde aquel momento. 1:1 investigación


epidemiológica ha atraido, cada vez más. el interés público. Conrorme se
ha ido elevando la marea de la preocupación social sobre los ractores
ambientales y la salud en general. estudios epidemiológicos sobre mu-
chos lemas han sido lanzados (1 primera p:'lgina por los medios de
dirusión. Algunos de ellos han sido controvertidos. aunque los medios de
dirusión pueden haber sido responsables en parte. en muchos casos. de
azuzar la controversia. Algunos de los estudios que m~ls atrajeron la
atención del público rueron los relacionados con:

-la eficacia de la medicación antidiabética oral:


-el erecto del dietilestilbestrol (DES) en la descendencia:
-«agrupamiento en racimo» y transmisión inrecciosa de la enrerme-
dad de I-Iodgkin:
-reserpina y cáncer de mama;
-enrermedad de¡ legionario;
-radiaciones ionizantes de bajo nivel )' leucemia;
-sacarina y cáncer de vesicula:
-vacunación contra la gripe porcina )' sindrome de Guillain-Barré;
-hormonas durante el embarazo y derectos al nacer:
-tampones y síndrome del .fhock tóxíco;
-Bendectin y derectos al nacer;
-ubicación de residuos peligrosos;
-sustitución estrogénica y cáncer de endometrio;
-caré y cáncer de páncreas;
-rumadores pasivos;
-Agente Naranja:
-Síndrome de lnmunodefitiencia Adquirida (SIDA).

A pesar del notable ascenso de la actividad epidemiológica en los


años recientes. sigue habiendo abundantes pruebas de que. como ciencia.
la epidemiología permanece en mantillas. En las ciencias establecidas es
dificil encontrar grandes desacuerdos y conrusionismo acerca de los
conceptos o medidas más básicos. Mientras que los fisicos estiln de
acuerdo en la definición de masa o de energía. los epidemiólogos discre-
pan rrecuentemente en las definiciones de incidencia (y más vale no
hablar del tema de la definición en si de epidemiologia). En 1975. apare-
ció un artículo en el American Journal or Epidemiology titulado «Defini-
ción de tasas: algunas puntualizaciones sobre su uso correcto e incorrec-
tO» (Elandt-Johnson. 1975). No se proponian conceptos o definiciones
revolucionarios, pero el articulo era útil, dada la cantidad existente de
lectores que no conocían las definiciolles de las medidas básicas usadas
en epídemiologia. Es notorio que todos los textos introductorios publi-
cados en la década pqsterior al articulo de Elandt-Johnson. excepto uno,
continúan equivocando las definiciones de las medidas básicas que ella
discutia. Poseer conceptos claros sobre causalidad )' las ideas relacion¿¡-
das con ella. como el periodo de inducción. de igual manera que sobre
las definiciones de medidas básicas, es algo rundamental para una com-
LA .\PARICIONDELA EPIOEMIOLOGIA 5

prensi()n de la investigacj()n epidemiológica. No obstante. ni siquiera


estos puntales han sido aún integrados en el lecho de roca de esta
<.Iisciplina. El desacuerdo acerca de plIntos bilSicos conceptuaies y meto-
dol()gicos ha conducido en algunos casos a profundas diferenci~rs en la
interpretación de los datos. En 197R. surgió una controversia sobre si los
e~trógenos exógenos son carcinogenicos p~lra el endometrio: algunos
estudios de C~IS0Sy controles h~lbí~ln pl~lnteado una asoci~lción extrema-
d~lmente fuerte. con un aumento dcl riesgo de h~ISt~l 15 veces. pero un
grupo ~lrgumentó que un sesgo de selección er~l responsable de c~lsi todo
el efecto {Smith (.'1 al.. 1975: Zíel v Finkle, 1975: Mack, el al., 1976:
Horwitz y Feinstein, 1978; Hutchi-son y Rothman, 1978: Jick el al..
1979: Greenl~md y Neutra, 1981). El desacuerdo y la confusión en torno
a ideas bilsicas en epidemiología no certifica necesariamente la terque-
d~ld de los epidemi()logos: un~l interpretación mils benevolente seria la de
que las ide~ls b¡isicas fund~lmentales p~lra la nuev~l ciencia no han despla-
zado aún la jerga complaciente dc I~l form~l de pens~lr tr~ldicional.
i,Por que ha sido tan lenta en norecer 1~1epidemiologia'? La respuesta
radica parcialmente en I~l dificultad que existe a la hora de llevar a cabo
una investigación epidemiológic~l. Las medídas de incidencia de la enfer-
medad son los pil~lres bilsicos de la inferencia epidemiológica. T~lles medi-
d~lS incluyen I~l observación de I~l ocurrenci~l de enfermed~ld en relación
con los segmentos de personas y tiempo en que ocurren. No se trata de
un proceso sencillo. En su form~l típic~l. la enfermedad raramente ocurre
en la experiencia persona-tiempo (véase capitulo 3), por lo que se necesi-
tan un tiempo y un esfuerzo consider~lbles par~l llevar ~l cabo las medi-
ciones básicas. Los epidemiólogos ~lfrontan también el problema de
obtener cooperación de otra gente para realizar sus observaciones. El
investigador carece de control sobre el entorno «experimental» y tiene
que desenvolverse h~lbitualmente con limit~lciones impuestas por el pre-
supuesto y las preocupaciones acerca de la privacidad de los sujetos. El
producto final de tan angustioso y frecuentemente frustrante ejercicio es
sólo el primer paso para acumul~lr conocimiento epidemiológico.
Dificultades así han des~llent~ldo dur~lnte mucho tiempo la invesliga-
ción en esta ciencia y v~ln ~l seguir haciéndolo. Las economias de escala
resultantes de .estos problemas observacionales h~ln favorecido que se
Ilevar~l a cabo en empl~lzamientos donde los regístros médicos y las
estadísticas vi1ales son cuid~ldosamente recogidos y se hallan disponibles
para su uso, o donde la riqueza de la sociedad puede soportar los caros
esfuerzos neces~lrios par~l reunir la información precisa. Los problemas
logisticos encontrados a la hora de medir la íncidencia de una enferme-
dad h~ln conducido, igu~llmente, al ~lscenso de los estudios de casos y
controles como herramienta central de la epidcmiología moderna. La
investigación de C~lSOSy controles es. en muchas maneras. emblemiltica
de la síntesis moderna de conceptos epidemiológicos. La metodología de
dichos estudios posee b~lses teóricas coherentes y constituye una opción
atractiva como forma de aumentar en epidemíologia la eficiencia de la
medíción. Desgrací~ldamente, el abordaje de casos y controles ha sido,
6 EPIDEMIOLOGIA MODERNA
.-~- -
con frecuencia, erróneamente considerado como un sustituto de segunda
categoría de los estudios de seguímiento. Sólo en base a una firme funda-
mentación en los principios epidemiológico$ puede el estudiante de epi-
demiología darse cuenta de que no hay razón para este menoscabo de la
citada ínvestigacíón. Dado que este tipo de comprensión. que afecta a
una amplia gama de temas, es de importancia crítica para la conducción
e interpretación correctas de la investigación epidemiológica de todo
tipo, centrarse en los conceptos y métodos epidemiológicos resulta
crucial para cualquiera que aspire a entender la epidemiología moderna.
Las pasadas dos décadas han presenciado igualmente un rápido
crecimiento en la comprensión y sintesis de 10$ conceptos epidemiológi-
cos. El principal estimulo para el desarrollo de la teoría parece haber
sido la práctica: la explosión de actividad epidemiológica acentuó la
necesidad de mejorar la comprensión de los pilares teóricos. Por ejem-
plo, los estudios clave sobre tabaco y cáncer de pulmón de principios de
los años cincuenta fueron científicamente notorios no sólo por sus sus-
tantivos hallazgos, sino igualmente porque demostraron la eficacia y
gran eficiencia de los estudios de casos y controles (Wynder y Grahan.
1950; Doll y Hill, 1952). De la misma manera, el análisis de los datos
provenientes del estudio cardiológico de Framinghan estimuló el desa-
rrollo de 1a metodología multivariada más popular de las usadas ho)': el
análisis de regresión logística múltiple (Cornfield. 1962: Truett el al.,
1967).
Los conceptos fundamentales de la epidemiología dependen poco de
otras disciplinas científicas, como tampoco dependen de resultados em-
píricos. Por tanto, la capacidad de formular una teoría de los conceptos
epidemiológicos ha sido posible durante siglos: el hecho de que se trate
de un fenómeno del siglo xx es independiente de ningún paso adelante
científico o técnico, Por contra, ha sido el desarrollo económico de las
naciones prósperas de nuestro siglo lo que posibilitó el lujo de llevar a
cabo investigación epidemiológica, y esto, a su vez. motivó el desarrollo
conceptual que constituye la «aparición» científica de la epidemiología.
Hasta hace poco, virtualmente todos los epidemiólogos eran médi-
cos, Su interés en dicha ciencia estaba por lo general centrada en los
patrones de ocurrencia de una enfermedad particular, Quizá debido a
que esos investigadores subordinaban el interes en los principios epide-
miológicos a sus indiscutidos objetivos de comprender la etiologia de la
enfermedad, no se produjo movimiento alguno en el sentido de desarro-
llar una teoría de la investigación epidemiológica. M uchas de estas
investigaciones, ahora afortunadamente olvidadas. fueron pobremente
diseñadas y conducidas por carecer de una teoría así.
Históricamente, los médicos han colaborado de un modo fructífero
con los estadísticos, que aportaban formación a la hora de realizar
observaciones sobre poblaciones grandes, así como en el análisis de los
datos. Gran parte del desarrollo teórico de la moderna epidemiología
fue aportado por estadísticos -Cornfield, Mantel. Cox, Breslov.' y
Prentice son algunos de los que contribuyeron notablemente. La in-
LA APARICION DE LA EPIDEMIOLOGIA 7

nuencia del pens3miento estadístico en esta ciencia. sin embargo. no ha


sido en su totalídad positiva. Era lógico que los estadísticos. al~poner su
formación en juego frente a problemas epidemiológicos. tomaran presta-
dos métodos con los que estaban familiarizados en otras áreas de traba-
jo. Tales métodos acabaron frecuentemente incorporados a la práctica
epidemiológica, no siempre sobre una base teórica coherente.
Un ejemplo de la influencia negativa del pensamiento estadístico en
la práctica epidemiológica ¡o constituye el predominio de la comproba-
ción de hipótesis, propia de la primera ciencia. en el anúlisis de datos de
la segunda. El motivo por el que la comprobación de hipótesis estadísti-
ca se desarrolló fue aportar bases para la toma de decisiones en experi-
mentos agricolas y de control de calidad. Los citados experimentos
fueron diseñados para responder a preguntas que requerían acciones
específicas, por lo que los resultados debían ser clasificados, en la medida
de lo posible, en categorias discretas cualitativas. Así fua como surgió la
práctica de declarar las asociaciones en los datos como «estadística*
mente significativas» o «no significativas», usando criterios arbitrarios
que se convirtieron en convención. La noción de significación estadística
ha terminado por impregnar el pensamiento epidemiológico, lo mismo
J que el de otras disciplinas. Desgraciadamente, la comprobación de hipÓ-
tesis estadísticas es una forma de análisis que ofrece menos capacidad de
obtener información de los datos epidemiológicos que otros métodos
alternativos, con énfasis en el cálculo de medidas interpretables.
Otro ejemplo de la aplicación inadecuada de la estadística en epide-
miologia ha estado en el área del análisis multivariado. La metodologia
estadística del modelaje multivariado ha sido frecuentemente traspasada
-1 en rebajas por liquidación a la epidemiología, sin prestar suficiente
atención a los conceptos subyacentes en el área de esta disciplina. Mu-

J chas prácticas comunes en el análisis multivariado son frecuentemente


inapropiadas en un contexto epidemiológico: el uso de variables in-
dependiente continuas. términos producto para evaluar interaccjones,
algoritmos por pasos para determinar el modelo y reducción de la
varianza para ev31uar el mismo, son todos ellos potencialmente proble-
máticos. El análisis multivariado es una importante herramienta analÍti-
ca para el epidemiólogo. pero no puede ser usado de forma adecuada sin
haber considerado primero los principios que gobiernan su uso a este
nivel. Hoy día, sin desmerecer las importantes contribuci'ones en este
terreno de muchos que se consideran a sí mismos antes que nada estadis-
ticos o médicos, los epidemiólogos han conseguido una identidad sepa-
rada. Ser médico ,o estadístico, o incluso las dos cosas a la vez. no es
cualificación suficiente para ser un epidemiólogo. Lo que se precisa es la
comprensión teórica de los principios de la investigación epidemiológica
y la experiencia de aplicarlos.
La epidemiología se ha buscado su sitio como disciplina científica.
En tanto en una época los resultados en este terreno eran acogidos
fundamentalmente con escepticismo, se genera actualmente en torno a
ellos cierto grado de respeto. A mediados de siglo, los epidemiólogos
8 EPIDEMIOLOGIA MODERNA
-.
pasaban dificultades para persuadir a la comunidad cientifica de que
existía una relación entre el fumar y el cilnccr de pulmón. En 1984. la
situación habia cambiado hasta ta] punto que una débil asociación
epidemiológica observada entre e] beta-caroleno y la ocurrencia de]
cilncer fue el estímulo que produ.io una hipólesis bioquímica sobre anli-
oxidan les que fue publicada en Scil'llcC'. El pape! comienza con la obser-
vación de que:

(E)studios epidcmiológicos indican que la incidcncia de c{lnccr podria


ser ligeramente m{ls baja entre individuos con una ingesta por encim,!
de la media de beta-caroteno y otros carotcnoides (I3urton e Ingold.
1984).

La respetabilidad que emana de esta integr.lciól1 de la epidemioiogia


en el seno de las ciencias biológicas proviene en gran medid.l del ~urgi-
miento de una comprensión más clara de los conceptos epidemio1ágicos
que se han convertido en base de la epidemiología moderna.

REFERENCIAS

Ast, D. B. Denlal public health. En P. E. Sarlwcll (cd.). P'.l've1l1ive M(.dicil,(. a1ld


P,lhli(' Hl'{lllh (9th ed.). New York: Mcrcdilh. 1965.
Burlon. G. W., and lngold, K. U. Beta-carotcnc: An lInusu(ll typc Or lirid
antioxid(lnt. S('il'1Ic{' 1984: 224:569-573.
Cornficld. J. .Ioinl dependcnce or thc ri~k or coronarv hcarl di~ca~c on ~crllm
chole~terol and systolic blood prcssure: A discri~,inanl rllnclion analysis.
F('d. Prnc. 1962; 21:58-61.
Dawbcr, T. R., Moore. F. E., and Mann. G. \'. II. C{)ronar\, hcarl discasc in lhc
Fragmigham study. Am. J. Pllhlic Heallh 1957: 47:4-24.
Doll. R., and Hill. A. B. A slud)' or the actiology or c(lrcinoma or thc lung. B,..
¡\fed. J. 1952: 2:1271-1286.
Elandl-Johnson, R. C. Dcfínition or rales: ~omc rcmarks on thcir lISC and
mi~lIsc. Am. J. Ef1i{I('1Itinl. 1975: 101:267-271.
Francj~. T.. Naricr. J. A., Voight. B. S.. ct al. Evalualion or Ihc 1954 Ficld Trial
or Poliomyclilis Vaccine. Final Rerorl. Ann Arbor: Poliomyclilis \¡accinc
Evaluation Cen(er. Universi(y or Michigan, 195i.
Greenland, S.. and Neutr(l. R. An (lnalysis or dcleclion bi(l~ (\nd rroposcd
corrections in the study or cstrogens and endomelrial canccr. J. Ch,.{)[I. Di.\".
1981: 34:433-438.
Horwitz, R. I., and Feinstcin, A. R. Ailernative analytic mcthods ror C(lSe-
conlrol sludies or estrogens and endomctrjal canccr. ¡\'. E1I..1;'/. J. M(.d. 1978:
299: 1089-1094.
l-IlIlchinson, G. B.. and Rolhman. K. J. Corrccling a bi(\s? ¡\;. E1I.1;'/.J. M(.d.
197R: 299: 1129-1130.
Jick. H., W(llkins, R. N.. Hunler, J. R.. et al. Rcrl:lccment cstrogens and cndo-
metrial cancer. ¡\r. E1Igi. J. Me{l. 1979; 300:2Iti-222.
Kanncl. VI¡. B., Dawbcr. T. R.. Kagan, A., et (iI. F(lclor~ or ri~k in thc devclor-
ment or coronar)' hearl discase-six ycar rollow-ur expcricncc: The Fra-
mingham study. AI11I. ¡/11(?r1l.Ml'd. 1961; 55:33-50.
LA APARICION DE LA EPIDEMIOLOGIA 9

Kannc¡. w. n.. w()lr. P. ;\.. Vcrtcr. .J.. CI ;Ii. Eri<.Jcmiologic asscssmcnl ()r lhc "oic
or hlood pre$sllre in :\trokc: The Frumil1gham 5tudy. J..-l..\1..~. 1970:
214:301-310.
Kannel. W. B.. an<.J Abhott. R. D. [ncidcncc and rrogno5i$ of lInrccognized
myocardi;¡1 jl1farction. ¡\n lipdatc on thc Framil1gh.lm study. ,V: EI/.~/. J.
¡\1ed. 1984: 311:1144-1147.
Mack. T. M.. Pikc. M. C.. Hender~on. B. E.. ct al. Estrogen$ and cndometria¡
cancer in .\ retirement community. N. EI/.~/. J. ,\1ell. 1976: 294:1262-1267.
I McKee. P. A.. Castclli. W. P.. McNam;¡ra. P. M.. et al. Thc natural hi~tory of
congestive heart f.lilllre: The Framil1gh.lm ~tlldy. N. EI/""/. J. l\1ell. 1971:
285:1441-t446.
Smith. D. C.. Prentice. R.. Thompson. D. J.. et al. A$$ociation of exogenous
estrogen and endometrial carcinoma. N. EI/.~/. J. .\1('ll. t975; 293:1164-116i.
Stallones. R. A. The rise 3nd fall of ischemic hcart disease. S('i. Americal/ 1980:
243:(5)53-59.
¡
Truett. J.. Cornlicld. J.. .lnd Kanncl. W. ..\ mllltiv.lriatc an.lly~is (}f thc risk of
coronarv heart di$ease in Fr.\mingh.lm. J. C/¡r(m. Dis. 1967: 20:5t 1-524.
U.S. Depa;tment of Health. Educ.lt¡on and Wclfare. Smoking and Health:
Report of the Advi$ory Committee to the Surgeon General of the Public
] Health Service. Public Health Service Pliblication No.1103. Washington.
D.C. Government Printing Omce. 1964.
Wynder. E. L.. and Gr;¡ham~ E. A. Tob.1CCO smoking ~lS ~l possible etiologic
factor in bronchogenic carcinom~\. f\ 5tlldy of six hundred 3nd eighty-rour
provcd casc$. J.,.J.I\l...I. 1950: 143:329-336.
Zie¡. H. K., and Finkle. W. D. [ncreased risk or endometrial carcinoma among
users of conjugatcd estrogens. N. EI/,I,'/. J. i\.fed. 1975: 293:1167-1170.

-I

~j
.,
-. INFERENCIA CA USAL
EN EPIDEMIOLOGIA

En Los añosomá,'1!;icos,Selma Fraiberg ( 1959) caracteriza a todo bebé que


está empezando a andar como científico, atareadamente empeñado en la
diligente misión de desarrollar una estructura lógica en relación con los
extraños objetos y acontecimientos constituyentes del mundo que él o
ella habitan. Ninguno de nosotros nace con concepto alguno de conexio-
nes causales. De chiquillo, cada persona va haciéndose un inventario de
explicaciones causales que den sentido a los acontecimientos que percibe
y que conduzcan en última instancia a incrementar el poder de controlar
dichos acontecimientos. Los padres pueden atestiguar con delicia cómo
los críos se afanan en poner en pie hipótesis causales y luego meticulosa-
mente comprobarlas, muchas veces a base de exasperantes repeticiones,
1 motivadas más que nada por la alegría de la confirmación científica.
Alcanzada cierta edad,.el niño, cuando entre en una habitación, buscará
en la pared el interruptor que encienda la luz eléctrica y, una vez que dé
con uno que lo haga, encenderá y apagará una y otra vez, simplemente
para confirmar su descubrimiento más allá de ninguna duda razonable.
Experimentos del tipo de los diseñados para probar el efecto de la
gravedad en líquidos de caída libre, son conducidos habitualmente con
cuidadosa atención, modificando de manera sutil las condiciones inicia-
les y reduciendo las influencias extrañas, siempre que fuera posible. a
base de llevarlos a cabo de forma segura, lejos de las interferencias
paternas. El fruto de tan científico quehacer es el esencíal sistema de
creencias causales, que capacita a cada uno de nosotros para navegar
por este complejo mundo.
Aunque el método de proponer y comprobar hipótesis sobre causali-
dad lo va sacando adelante cada chiquillo con la intuición, el proceso
inferencial que implica ha sido objeto de debate filosófico a lo largo de la
historia de la filosofia científica. Vale la pena considerar brevemente la
historia de las ideas que describen el proceso inductivo característico de
la inferencia causal, para entender mejor el punto de vista moderno
sobre la cuestión y sus impJicaciones para la epidemiología.
'2 LA APARICION DE LA EPIDEMIOLOGIA

FILOSOFIA DE LA INFERENCIA CIENTIFICA

La lilosofia de la ciencia que dominó desdc cJ nacimient() dc la in\'cstit!a-


ción científica histórica. hast.1 el comienz() de la re\101ución científica. fue
la doctrina del racionalismo. Según ella. el conocimicnlo cientilico se
acumulab.1 .1 tr.\vés de 1.\ r.\zón y 1.1 intuici¿)n. y n() dc la observ.lcii)n
empírica. En la .\ntigua Grecia. la única ciencia cmpírica quc gozó dc
preeminenci.\ fue la astronomi.\. Sin emb.\rgo. incluso la observ.lción dc
los cielos era minimizad.\ por Platón. que considcrab.1 las observaciones
celestiales fuente no fiable de conocimiento. comp.¡r.ld.1 con la r.\zón
(Reichenbach. 1951 ). La forma más elevad.1 de conocimiento se conside-
raba que eran las matemáticas. un sistema construido sobre un marco de
.\xiomas por medio de l.I lógica deductiv.\. La gcomctría de Euclides
cjemplific.¡ el ide.ll racionalista.
Los escépticos del racion.\lismo. que creyeron que 1.\ fucnte )' el .juez
illtimo de! conocimiento
desarrollaron una doctrina
son las percepciones
competidora.
de fenómenos naturales.
conocid.l como empirismo. Los
1
grandes pioneros del empirismo mOderno fueron Francis Bacon. John
Locke y David Hume. Bacon se dio cuenta de que 105 primeros empiris-
tas. a pesar de ensalzar la ciencia empirica. sobreenfatizaban 1.\ observa-
ción hasta el punto de que la lógica .jug.lb.l un papel escaso en 1.\
acumulación del conocimiento. Comparó .1 los racionalistas con l.ls
arañas. te.jiendo todo el tiempo telar.lñas de su propia sustancia, ya los
viejos empiristas con las hormigas. que recogen y recogen materi.tl sin
ser capaces de encontrar un orden en ello. El visionó al nuevo empirist.\.
al que comparaba con una abeja. recogiendo m.\teri.ll. digiricndolo y
añ.ldiéndole cosas de sus propias sustancias. crc.\ndo así un producto de
superior calidad. Según Bacon. la razón introduce relaciones .Ibstractas
de orden en el conocimiento observacional. Es famosa su frase «conoci-
miento es poder», con lo que queria decir que las relaciones .\bstr.lctas
implican predicción. Así. «el fuego es caliente» no e~ sól() descriptiva dcl
fuego, sino también predictiva acerca de la n.\turalez.1 de fuegos r,úl1 no
observados. Puede obtenerse 1.\ predicción por medio de un proceso
conocido como i/l{('r('f1cia Í11(IIICliv(l o /,ír¿ica i,I(/¡/Clil'(I. A diferencia de 1.I
..
deductiv.l. la lógica inductiva no es au\ocontenida y estil abiert.\. por
tanto. a errores. Por su parte. la lógica deductiva. por ser autocontenida.
no puede est.lblecer por si sola una teoria de la predicción, puesto que
carece de conexión con e] mundo natural.
B.\con formalizó el proceso de 1.\ infcrcnci.\ inductiva. demostrando
cómo la citada lógica deductiva no podrí.\ ser nunca predictiva sin los
fr\ltos de 1.\ inferencia inductiva. John Locke popularizó los métodos
inductivos que Bacon había formaliz.\do y ayudó a establecer el cmpiris-
mo como doctrina dominante en la filosofi.\ científica. Hume fue el
crítico: puntualizaba que la inferencia inducti\'a no acarrea una «necesi-
dad lógica», con lo que quería decir que la inducción no tiene la fuerza
lógica de un .lrgumento deductivo. Demostró igualmcnte cómo el decir

\
INFERENCIA CAUSAL EN EPIDEMIOLOGIA 13

que la lógica inductiva es un proceso válido. incluso pese a carecer de


necesidad lógica. simplemente porque parece que funciona. es un argu-
mento circular: ninguna cantidad de experiencia con la lógica in.ductiva
podria ser usada para justificar lógicamente su validez. Hume dejaba asi
claro que la lógica inductiva 110 puede establecer una conexión funda-
mental entre causa y efecto. Ningún número de repeticiones de una
particular secuencia de acontecimientos. como el encender una luz apre-
I
. tando un interrumptor, permite establecer una conexión causal entre la
acción de pulsar el interruptor y el encendido de la luz. No importa
cuántas veces la luz aparezca después de que se le dé al interruptor. la
posibilidad de una ocurrencia coincidente no puede ser descartada. Este
carácter de incompleta de la lógica inductiva llegó a ser conocido como
«el problema de Hume».
I Varios filósoros han intentado darle respuesta. LLl escuela del positi-
,.
vismo 1ógico, que surgió del Círculo de Filósofos de Viena. incorporó la
lógica simbólica de los Principia l\1alhemalica de Russell y Whitehead a
su análisis de la verificLlción de las proposiciones científicLls. El punto
1 clave de esta filosofia era que el sentido de una proposición pivotaba
sobre la veríficabilídad empírica de ILl proposición según principios lÓgi-
cos. Tal punto de vista, no obstante, se mostró inadecuado como filoso-
.I fia de la ciencia. porque. como Hume había indicado, no hay cantidad de
evidencia empírica que pueda verificar concluyentemente el tipo de pro-
posición universal que es una ley científica (Popper, 1965). El problema
de I-Iume seguía sin ser resuelto con este abordaje.
Dada la desesperanza que genera la imposibilidad de una verifica-
ción concluyente, algunos lilósofos de la ciencia adoptaron un sistema

1 graduado de verificabilidad,
des propuestas por Rudolph
incardinado en la lógica de las probabilida-
Carnap. Bajo esta filosofia, las proposicio-
nes científicas son evaluadas según una escala de probabilidades. Sobre
1 la base de la comprobación empírica, las hipótesis se convierten en más
o menos probables según el resultado de la comprobación. La descrip-
ción por Heisenberg.del «principio de incertidumbre» y la aceptación de
los mecanismos cuánticos por los lisicos a principios del siglo xx., esti-
mularon esta visión probabilística de la confirmación cientifica. Los filó-
sofos. fuertemente innuenciados por los fisicos contemporáneos, abando.
naron la bllsqueda de la causLllidad:

El cuadro del método cicntifico que la filo~olia moderna dibuja es muy


diferente de las concepciones tradicionales. p~\SÓ el ideal del cientifico
que conocc la vcrdad ~\b~olllt~l. Los conocimientos de la naturaleza ~on
más como dados quc ruedan que como estrcllas giratorias: están con-
trolados por I~\s leyes de la probabilidad. no por la causalidad: y el
cientifico se parece mi\s a un jugador de ~Ipuestas que a un profeta
{Reichenbach. 1951 ).

r
I
La noción de verificabilidad median~ la lógica probabilística no
f
t
j
echó raíces. Lo inadecuado de esta filosofia fue revelado por Karl Pop-
¡
,.
!
~
¡;
'4 EPIDEMIDLOGIA MODERNA

per. que demostró que las afirmaciones de confirmación probabilistica.


al no ser ni axiomas ni observaciones. son en si mismas afirmaciones
científicas que requieren juicios de probabilidad (Popper. 1965). El «re-
greso infinito» resultante no solucionaba la crítica de Hume al proceso
inductivo.
Popper propuso una solución más persuasiva. Aceptaba el criterio de
H ume de que la inducción basada en la confirmación de una relación
causa-efecto. o confirmación de una hipótesis. nunca ocurre. Todavía
más, planteó que el conocimiento sólo se acumula mediante la falsifica-
ción. Según este punto de vista. las hipótesis acerca del mundo empirico
nunca son probadas con la lógica inductiva (de hecho. las hipótesis
empíricas en absoluto pueden ser «probadas» nunca. en el sentido en
que se utiliza esa palabra en lógica deductiva o en matemáticas). pero
pueden ser desaprobadas, es decir, falsificadas. La estrategia consiste en
formularlas mediante la intuición )' la con.ietura. usar la lógica deductiva
para inferir predicciones sobre ellas y comparar las observaciones con
esas predicciQnes deducidas. Las hipótesis que han sido puestas a prueba .1
y no falsificadas son confirmadas sólo en el sentido de que siguen siendo
expJicaciones razonablemente buenas de Jos fenómenos naturales, hasta
que un día son faJsificadas y sustituidas por otras que explican mejor lt\s
observaciones. El contenido empírico de una hipótesis, según Popper,
pues, se mide de acuerdo a cuán faJsificable es ésta. La hipótesis «Dios es
uno» no tiene contenido empírico, porque no puede ser falsíficada por
ninguna observacíón. Las hipótesis que. hacen muchas prohibiciones
acerca de lo que puede suceder son más falsificables y, por tanto, tienen
más contenido empírico, en tanto las que hacen pocas, tienen menos de
éste. La falta de contenido empíríco, sín embargo. no es equivalente a
falta de validez: una afirmación sin contenido empírico pertenece a un
dominio que está fuera de la ciencia empírica.
Popper rechazaba también eJ abandono de la causalidad. Argumen-
taba vigorosamente que una filosofia de la ciencia que fuera indetermi-
nista únicamente podría tener consecuencias negativas sobre el desarro-
llo del conocimiento, y que el «principio de incertídumbre» de Heisen-
berg no ponia limites estrictos al descubrimiento científico. Para Popper,
el creer en la causalidad era compatible con la incertidumbre, puesto que
las proposiciones científicas no están probadas: son sólo explicaciones
tentatívas, que serán sustítuidas al final por otras mejores, cuando las
observaciones las falsifiquen. Vale la p~na señalar que al menos un lisico
prominente, igual que él, no tuvo reparos en creer en la causalidad:

...No quisiera verme forzado a abandonar la causalidad estricta sin


defenderla con más fuerza de lo que he hecho hasta ahora. Me parece
bastante intolerable la idea de que un electrón, expuesto a radiación,
pueda escoger «por su propia voluntad» no sólo el momento de saltar ,
sino también su dirección. En ese caso, me metería a zapatero remen-
dón. o a empleado de una casa de apuestas en lugar de a lisico
(Einstein, 1924).
INFERENCIA CAUSAL EN EPIDEMIOLOGIA ,s

Recientes avances en la fisica teórica parecen prometer dar la razón a


la creencia de Einstein en la causalidad ( Walddrop, 1985).
La filosofia de la ciencia de Popper tiene muchos adictos. pero los
filósofos científicos recientes atemperan el falsificacionismo estritto que
él proponía. Brown ( 1977) cita tres objeciones fundamentales al punto de
vista popperiano: I) la refutación no es un proceso cierto puesto que
depende de las observaciones, que pueden ser erróneas; 2) la deducción
puede permitir predicciones a partir de las hipótesis, pero no existe estruc-
tura lógica mediante la que comparar las predicciones con las observa-
ciones, y 3) la infraestructura de las leyes científicas en que las nuevas
hipótesis están insertadas es, en sí misma, falsificable, de forma que el
proceso de refutación se reduce sólo a una elección entre refutar la
hipótesis o refutar la infraestructura de la que surgen las predicciones.
Este último punto es el esencial de los filósofos postpopperianos, que
argumentan que. en ciencia. la aceptación 0 rechazo de una hipótesis se
produce a través del consenso de la comunidad científica (Brown, 1977)
y que los puntos de vista prevalentes en el seno de ésta, a los que Kuhn
( 1962) se ha referido como «ciencia normal», sufren ocasionalmente
] cambios de gran envergadura que llegan a ser revoluciones científicas.
Lo que éstas sancionan es la decisión de dicha comunidad científica de
descartar una infraestructura. en lugar de falsificar una nueva hipótesis
que no podría ser incardínada con facilidad en el marco de la anterior.

UN MODELO GENERAL DE CAUSA

Los filósofos de la ciencia han clarificado la comprensión del proceso de


inferencia causal, pero sigue existiendo la necesidad, al menos en epide-
miología, de formular un modelo general y coherente de causa que
facilite la conceptualízación de los problemas epidemíológícos. Sin un
modelo así, conceptos como interacción causal, tiempo de induccíón y
proporción de la enfermedad atribuible a causas especificas no tendrían
fundamento ontológico.
Podemos definír como causa de una enfermedad a todo aconteci-
miento, condíción o característica que juega un papel esencial en produ-
cir su ocurrencia. La causalidad es un concepto relativo que sólo puede
ser entendido en relación con alternativas concebibles. Se puede pensar
en que fumar un paquete de cigarrillos al día durante diez años es una
causa de cáncer de pulmón, dado que esa cantidad de tabaco fumado
puede jugar un papel esencial en la ocurrencia de algunos casos de
cáncer de pulmón. Pero esta construcción postula un grado menor de
fumar, como sería el no fumar, a modo de alternativa. Fumar sólo un
paquete de cigarrillos al día durante díez años es algo preventivo del
cáncer de pulmón sí la alternativa es fumar dos paquetes diarios durante
el mismo período, porque algunos casos de esa enfermedad, que hubie-
ran ocurrido de fumarse dos paquetes al día, no ocurrirán. Análoga-
mente, no podemos considerar que tomar anticonceptivos orales sea una
'6 EPIDEMIOLOGIA MODERNA

causa de muerte (por causar enfermedad cardiovascular fatal) hasta quc


no sepamos cuál es la alternativa: si la alternativa es tener un niño, un
acontecimiento que pone en peligro la vida, el tomar anticonceptivos
orales quizá prevenga la muerte. Así pues, causa y prevención son
términos relativos, que deberian ser vistos como dos caras de la misma
moneda.

Concepto de causa sL{flciente ). cau.\'as componente.'i

Los conceptos de causa y efecto se establecen pronto en la \'ida. El niño


que suelta una y otra vez un juguete y lo ve caer, o tumba un vaso y
observa cómo se derrama la leche, está aplicando su propio método de
razonamiento a las proposiciones causales y. al hacerlo. está elaborando
su propio concepto de causa. Una caracteristica de tan temprana con-
ceptualización es la asunción de una correspondencia «de uno a unm>
entre la causa y el efecto observados, en el sentido de que cada una de
dichas causas es vista como necesaria )' suficiente en sí misma para
producir el efecto. Así, el chasquido del interruptor hace que las luces se
enciendan. No son apreciables las causas invisibles que también operan
para producir el efecto: la necesidad de que haya una bombilla no
fundida puesta en el casquillo, con un cable que va del interruptor a ella,
)' el voltaje para que se produzca una corriente cuando se cierre el
circuito. Para lograr el efecto del encendido de la luz, cada una de ellas
es tan importante como darle a la llave, porque la ausencia de cualquiera
de estos componentes de la constelación causal impediria el erecto. Para
mucha gente, las raíces del primer pensamiento sobre causalidad persis-
ten )' se ponen de manifiesto en los intentos de encontrar causas únicas
como explicación de los fenómenos que observa. Pero la experiencia y la
renexión deberian persuadirnos fácilmente de que la causa de cualquier
efecto consiste por fuerza en una constelación de componentes que
actuán en concierto (Mili. 186.?). Una «causa suficiente» podria ser
definida como un grupo de condiciones y acontecimientos minimos qlle.
inevitablemente, producen la enrermedad: «minimos» implica que ningll-
na de las condiciones o acontecimientos es supernuo. En etiología de
una enrermedad. el que se complete una causa suficiente puede ser
considerado equivalente al desencadenamiento de esa enrermedad. Para
erectos biológicos, la mayoría. ya veces todos, los componentes de una
causa suficiente son desconocidos (Rothman. 1976).
Por ejemplo, fumar es una causa de cáncer de pulmón. pero en sí
mismo no es una causa suficiente. En primer lugar, el término .fitJ1/(/r es
demasiado impreciso como para ser usado en una descripción causal.
Hay que especificar el tipo de tabaco, si con filtro o sin filtro, la manera
)' la frecuencia de inhalación y la duración del hábito. Más importante
al In. el fumar, aunque se defina explícitamente, no causará cáncer en
todo el mundo. Así que, ¿quiénes son los «susceptibles» a los efectos del
tabaco?, o, para decirlo de otra rorma. i,cuáles son los otros componen-
INFERENCIA
CAUSAL
ENEPIDEMIOLOGIA '7

les de la constelación causal que actúan junto con el rumar para produ-
cir cáncer de pulmón'! Cuando los componentes causales permanecen
desconocidos. existe la inclinación de asignar un riesgo igual a todos los
individuos cuyo estatus causal, para algu~os compon~nte-s, es cónocido e
idéntico. De esa manera, se dice que los grandes rumadores tienen
aproximadamente un riesgo a lo largo de su vida del lO por 100 de
desarrollar un cáncer de pulmón. Hay una tendencia a pensar que todos
nosotros estariamos sometidos a un I0 por 100 de probabilidad de
cáncer de pulmón si nos hiciéramos grandes rumadores, como si e!
resultado, aparte del tabaco, ruera puramente una cuestión de suerte. Es
más constructivo, sin embargo, valorar la asignación de riesgos iguales
como el renejo únicamente de nuestra ignorancia acerca de los determi-
nantes de esa enrermedad que interaccionan con el rumar cigarrillos. Es
probable que ;llguno de nosotros pudiera pasarse empalmando los
cigarrillos durante décadas, sin la menor posibilidad de «hacer» un
1 cáncer de pulmón. Otros están. o se convertirán. en «ravorecidos» por
circunstancias en este momento desconocidas y sólo necesitan que se les
añada el fumar a su casi suficiente constelación de causas para iniciarlo.
] En nuestra ignorancia acerca de estos componentes causales ocultos, lo
mejor que podemos hacer a la hora de valorar el riesgo es asignar el
valor medio a todos los expuestos a un patrón dado de indicadores de
riesgo causal conocido. Conforme progrese el conocimiento, las estima-
ciones del riesgo asignado a la gente se acercarán a uno de los valores
extremos, el cero o la unidad.
Cada constelación de causas componentes representadas en la figura
2.1 es mínimamente suficiente, (es decir, no hay causas componentes ni de
sobra ni ajenas) para producir la enfermedad. Tales causas componentes
pueden jugar un papel en uno, dos o tres mecanismos causales.

Fuer;:a de la.\" causa.\"

La figura 2.1 no recoge aspectos dcl proceso causal del tipo de la


secuencia de acción o la dosis, ni otras complejidades. Tales aspectos de
dicho proceso puedcn ser acomodados por el modelo mediante una
definición apropiad¡l de cada componente causal. Este modelo de dia-
grama usado facilita una comprensión de algunos conceptos epidemioló-
gicos importantes. Imaginemos, por ejemplo, que en la causa suficiente I,
A. B, C y D son todos ellos factores comúl1mente prescntes o experimen-
lados por la gente. Supongamos que E fuera raro. Aunque todos los
factores son C¡lUSa, podria parecer que E es un determinante m{ls fuerte
de la enfermedad. porque los que tienen el E difieren grandemente en
riesgo de los que no lo tienen. Los demás, causas componentes más
comunes, dan como resultado diferencias menores en el riesgo entre
aquellos que las pOSeen y aquellos que no. porque la rareza de E
mantiene bajos loS riesgos derivados de todos los otros factores. Por
tanto, la fuerza aparente de una causa está determinada por la prevalen-

~
18 EPIDEMIOLOGIA MODERNA

CAUSA CAUSA CAUSA

SUFICIENTE SUFICIENTE SUFICIENTE

I II III

Fig. 2.1. E.\"qllemati::ación conceptual dc trc.\, cal(.\,a.~ .\,l~riciellt('.\, d(' Ima .cl!(ernle.
dad ( Rothman, 1976) .

cia relativa de las causas componentes. Un factor raro se convierte en


una causa fuerte si sus complementarios son comunes. Deberia quedar
claro que, aunque tuviera tremendo significado en términos de salud
pública, la fuerza de una causa tiene escaso significado biológico, en la
medida en que el mismo mecanismo causal es compatible con cualquiera
de las causas componentes, sea fuerte o débil. La identidad de los
componentes constituyentes de la causa es un fenómeno relativo que
depende de la distribución específica en-un-tiempo-y-lugar de las causas
componentes en una población dada.

1
Il1teracción entr(' causas

Dos causas componentes de una causa suficiente única se considera que


tienen una interacción biológica mutua. El grado de interacción observa-
ble depende de los mecanismos reales que sean responsables de la enfer-
medad. Por ejemplo, en la figura 2.1. si G fuese una sustancia hipotética
que no hubiese sido creada, ninguna enfermedad podria ocurrir a partir
de la causa suficiente II; como consecuencia. los factores B ~. F serian
biológica mente independientes. Ahora supongamos que se reduce la
prevalencia de C porque es sustituida por G o por algo que produce a G .
En tal caso, la enfermedad que ocurre proviene de la causa suficiente II
en lugar de la I o la III y, como consecuencia, B y F interaccionan
biológicamente. Por tanto, el grado de interacción biológica entre dos
factores es, en principio, dependiente de la prevalencia relativa de otros
factores.

Proporciá11 de el?fermedad debida a CGU.\"GSe.\"pecfflcGs

En la figura 2.1, asumiendo que las tres causas suficientes son las únicas
que operan, ¿qué proporción de enfermedad es causada por A? La
INFERENCIA CAUSAL EN EPIDEMIOLOGIA 19

respuesta es toda: sin ,4 no se daría ese proceso patológico, Se la consi-


dera «causa necesaria», ¿Qué proporción es debida a B? B es una causa
de enfermedad a través de dos mecanismos, I y II, y toda enfermedad
que surja a través de cualquiera de estos dos mecanismos es decida a B.
Eso no quiere decir, por supuesto, que toda enfermedad sea debida sólo
a A, o que una proporción de esa misma enfermedad sea debida sólo a
B; ninguna causa componente actúa sola. Se entiende que estos factores
interaccionan con otros para producir la enfermedad.
Se ha postulado recientemente que un porcentaje tan alto como el 40
por 100 del cáncer está causado por exposiciones ocupacionales. Mu-
chos científicos han entrado en polémica contra esta pretensión (Higgin-
son, 1980; Ephron, 1984). Uno de los argumentos usados para rebatirla
era como sigue: el."( por 100 del cáncer está causado por el fumar; el.].'
por 100, por la dieta; el z por 100, por el alcohol, y así sucesivamente;
cuando se suman todos estos porcentajes, sólo queda uno peq'-Ieño para
-] las causas ocupacionales. Esta argumentación está basada en una con-
cepción ingenua de la causa y el efecto, que no tiene en cuenta las
interacciones. No hay, de hecho, límite superior a la suma que se estaba
] haciendo; el total de la proporción de enfermedad atribuible a varias
causas no es el 100 por 100, sino el infinito. Simi1armente, el pronuncia-
miento de que el 90 por 100 del cáncer está causado por el entorno
alcanzó mucha publicidad (Higginson, 1960); por extensión del argu-
mento previo, sin embargo, es fácil demostrar que el 100 por 100 de
cualquier enfermedad está causada por el entorno y el 100 por 100' es

I ]
también heredado. Cualquier otro punto de vista está basado en una
comprensión ingenua de la causación.
I
i
Período de inducción
t
El diagrama de causas nos aporta igualmente un modelo para concep-
tualizar el período de inducción, que puede ser definido como el período
de tiempo que hay desde la acción causal hasta la iniciación de la
enfermedad. Si en la causa suficiente l la secuencia de acción de las
causas es A, E, C, D y E y estamos estudiando el efecto de E, que
asumimos que actúa en un punto dado en el tiempo, no observaremos la
ocurrencia de enfermedad inmediatamente después de que actúe E. La
enfermedad aparecerá sólo una vez que la secuencia sea completa, por lo
que habrá un retraso en tanto C, D y finalmente E, actúan. Cuando E
actúa, ocurre la enfermedad. El intervalo entre la actuación de E y esa
ocurrencia es el tiempo de inducción para el erecto de E. Un ejemplo
claro de tiempo de inducción prolongado está en la relación causa-efecto
entre la exposición de un feto femenino al dietilestilbestrol (DES) y el
desarrollo subsiguiente de un carcinoma de células claras en la vagina.
El cáncer ocurre generalmente entre los quince y los treinta. años de
edad. Puesto que la exposición ocurre antes del nacimiento, existe un
tiempo de inducción de entre quince y treinta años. Durante ese período,
20 EPIDEMIOLOGIA MODERNA

otras causas están presumiblemente operando: algunas evidencias sugie-


ren que la acción hormonal durante la adolescencia podria formar parte
del mecanismo (Rothman, 1981).
Es incorrecto caracterizar una enfermedad como de periodo de in-
ducción prolongado o corto. El tiempo de inducción sólo puede ser
conceptualizado en relación con una causa componente específica. Para
cada una de éstas es diferente, )' para la que actúa en último lugar e~
igual a cero. Si se identifica entre mujeres jóvenes que habian sido
expuestas al DES una causa componente durante su adolescencia que
condujera al carcinoma de células claras en vagina. tal causa tendría un
tiempo de inducción para su acción carcinogénica mucho más corto que
el del dietilestilbestrol. Por tanto, el citado tiempo de inducción caracte- 1
riza un par causa-efecto )' no sólo el efecto.
En carcinogénesis, los términos illiciador y pr0111otor han sido utiliza-
dos para referirse a causas componentes de acción temprana )' de acción
tardía. El cáncer ha sido frecuentemente caracterizado como proceso
patológico de período de inducción largo, pero esa es una concepción
errónea, porque cualquier componente de acción tardía en el proceso
causal, como puede ser un promotor, tendrá un periodo de inducción
corto, que será siempre de cero para, al menos, una causa componente,
la última en actuar. [La enfermedad, una vez iniciada, no ne~esaria-
mente será visible. El intervalo cronológico entre su ocurrencia y su
detección ha sido llamado período lalente (Rothman, 1981), aunque otros
han usado este término como intercambiable con el de período de
inducción. Tal período latente puede ser reducido mediante la me.iora de
los métodos de detección de la enfermedad.)

Colllenido empirico del modelo

Según Popper, e] contenido empírico de una hípótesis o teoria deriva


de ]as prohibiciones que hacen sobre lo que puede ser observado. El
modelo de causa que aquí se propone realiza numerosas prohíbiciones
acerca de los procesos causales. Prohíbe que las cau:;~~ ocurran después
que los erectos. Afirma que los erectos unicausales son imposibles, si la
manera en que se produce el efecto de una causa componente especifica
se interpreta que es parte de la constelación causal. Prohíbe un tiempo
de índucción constante para una enfermedad en relación a sus diversas
causas componentes. La utílidad fundamerital de un modelo como éste
radica en su capacidad para aportar un marco conceptual a los proble-
mas causales. El intento de determinar la proporción de enfermedad
atribuible a varias causas componentes es un ejemplo de ralacia que el
modelo desvela. Como veremos en el capítulo 15, también la evaluacíón
de las íriteracciones se clarifica mucho con su ayuda.
¿Cómo acomoda el modelo la variación en dosis de una causa com-
ponente? Puesto que el modelo parece abordar cualitativamente la ac-
ción de las causas componentes, podría parecer que la variabilidad de
INFERENCIA CAUSAL EN EPIDEMIOLOGIA 21

dosis no puede tener cabida en él. Este punto de vista es pesimista en


exceso. Para afrontar el concepto en cuestión, la único que se necesita es
postular un conjunto de causas suficientes, conteniendo cada una de
ellas como componente una dosis diferente del agente en cuestión. Dosis
pequeñas requerirían un conjunto de causas complementarias, precisas
para completar una causa suficiente. mayor que las dosis grandes (Roth-
man, 1976}. No es necesario postular un grupo infinito de causas sufi-
cientes que se acomode a un espectro de dosis, sino que basta con que se
acomode a los distintos mecanismos por ]os que los diferentes niveles de
dosis den nacimiento a la enfermedad. De esta forma, el modelo puede
tomar en cuenta el fenómeno de un período de inducción más corto
acompañando a dosis mayores de exposición, porque así se precisaría un
número menor de componentes complementarios para completar la
causa suficiente.
Los pensadores estocásticos pueden poner pegas a lo intrincado de
este modelo determinista. Podría invocarse un modelo estocástico para
describir una relación dosis-respuesta, por ejemplo, sin una multitud de
mecanismos diferentes. Dicho modelo acomodaría también el papel del
azar, que aparentemente se omite en el anteriormente descrito. No obs-
J tante, el modelo determinista que aquí se presenta da cabida al «azan>,
aunque lo hace reinterpretándolo en términos de acción determinista,
más allá de los límites ordinarios de conocimiento u observabilidad. Asi.
el resultado de tirar una moneda es considerado habitualmente un acon-
tecimiento al azar, pero teóricamente tal resultado puede ser completa-
mente determinado mediante la aplicación de leyes fisicas y una descrip-
ción suficiente de las condiciones de partida. Podría parecer, en princi-
pio, que un modelo determinista es más limitador que otro estocástico,
porque el primero excluiría los procesos aleatorios de entre los mecanis-
mos causales. Es posible argumentar, sin embargo, que lo que es verdad
es justo lo contrario: los modelos estocásticos aceptan el papel de esos
procesos, pero al hacerlo limitan las explicaciones científicas susceptibles
de ser aplicadas, porque se renuncia a intentar explicar el acontecimien-
to aleatorio. Como se ha dicho antes. Popper (1965} polemizó con
firmeza contra aceptar ninguna metafisica indeterminista por esta razón.
argumentando que incluso el principio de incertidumbre de Heisenberg
y la teoría cuántica no podría y, de hecho, no está haciéndolo, ofrecer
barreras a las explicaciones deterministas. En realidad, ahora está que-
dando claro que hasta la teoria cuántica puede tener una explicación
determinista (Waldrop, 1985}. Popper aconseja que «... deberíamos abs-
tenernos de enunciar prohibiciones que impongan límites a las posibili-
dades de investigación». El aceptar los sucesos aleatorios como compo-
nentes de los mecanismos causales hace precisamente eso, en tanto un
modelo determinista puede dar cabida al azar en forma de ignorancia
acerca de componentes no identificados -ignorancia que es susceptible
de elucidación conforme se expanda el conocimiento.
-

22 EPIDEMIOLOGIA MODERNA

INFERENCIA CAUSAL EN EPIDEMIOLOGIA

Consideremos las hipótesis epidcmiológicas a la luz dcl contenido empí-


rico, o lo que es lo mismo, las prohibiciones puestas sobre qué pucdc
ocurrir. Seglln este criterio. muchas proposiciones epidemiológicas pare-
cen poseer poco contenido empirico. Por e.iemplo. consideremos la pro-
posición de que el fumar cigarrillos causa enfermedad cardiovascular.
i.Qué prohibiciones hace esta afirmación para darle contcnido? Est~1
claro que no todos los fumadores desarrollarán enfermedad cardiovas-
cular. Por tanto, la proposición no puede prohibir ese proceso patológi-
co entre los no-fumadores ni su ausencia entre los que sí lo son. Podria
entenderse que la citada proposición quiere decir que la media de los
fumadores desarrollará más enfermedad cardiovascular que la media de
los no-fumadores. Suponiendo que no estuviesen operando sesgos como
el de confusión y el de clasificación incorrecta. ¿prohíbe la afirmación
encontrar la misma tasa de enfermedad cardiovascular entre ambos
grupos? Desde luego que no, puesto que el efecto del humo de los ciga-
rrillos podría depender de una causa componente que cabe estuviera
ausente en los grupos comparados. Se supone, por tanto, que la propo-
siciÓn implica al menos la prohibición de que se diese una tasa mils
I
pequeña de enfermedad cardiovascular entre los que sí fuman. Si uno
f
acepta, sin embargo, que un factor dado puede ser tanto causal como
i preventivo, seglln las circunstancias. ni siquiera esta prohibición puede
ser adscrita a la afirmación.
t Sin ninguna prohibición, la proposición quedaría desprovista de
sentido. De donde debe derivarse ese sentido es de asunciones u observa-
f,
ciones realizadas sobre las causas componentes complemcntarias, asi
como de una más elaborada descripción del agente causal. el fumar y el -1
resultado, la enfermedad cardiovascular. Esta elaboración es, en parte. el
equivalente a una descripción más detallada de las caracteristicas de los
individuos susceplibles a los efectos cardiovasculares del humo de los
cigarrillos.
El conocimiento biológico que se posee de las hipótesis epidemioló-
gicas es con frecuencia escaso, lo que convierte a veces a las hipótesis
mismas en poco más que vagos pronunciamientos de asociación entre
exposición y enfermedad. Poseen escasas consecuencias deducibles que
puedan ser falsificadas, como no sea una simple reiteración de la obser-
vación. ¿Cómo prueba uno la hipótesi.<; de que la exposición al DES de
fetos femeninos en el útero causa adenocarcinoma de la vagina, o que el
fumar produce enfermedad cardiovascular? No todas las hipótesis epide-
miológicas, por supuesto, son simplistas. Por ejemplo, la de que los
tampones causan síndrome del shock tóxico, al actuar como medio de
cultivo de los estafilococos. conduce a deducciones comprobables sobre
la frecuencia del cambio de tampones así como sobre su tamaño y
absorbencia. Incluso formuladas de manera vaga, las afirmaciones de
asociación pueden ser transformadas en hipótesis, con un contenido
-
INFERENCIA CAUSAL EN EPIDEMIOLOGIA 23

considerable. mediante su reformulación como hipótesis nula. Por ejem-


plo. la frase «el fumar no es una causa de cáncer de pulmón» es una
afirmación altamente específica y universalmente aplicable, que prohíbe
la exístencia de causas suficientes que contuvieran el fumar én forma
alguna como componente. Cualquíer prueba que indícase la existencia
de causas suficientes así. falsificaria la hipótesis. El criterio de Popper
sobre contenido empírico. pues. presta una base científica al concepto de
hipótesis nula, que ha sido consíderada muchas veces símplemente como
un artilugio estadístico.
A pesar de los problemas filosóficos existentes en relación con la
inferencia inductiva, se han manejado comúnmente criterios para llevar-
la a cabo. Las justificaciones que se han ofrecido para ello han sido las
exigencias de los problemas de salud pública, que requerirían que .se
actúe y el hecho de que, por encima del conocimiento imperfecto, hay
que hacer ínferencias causales. Un grupo de estándares muy usado rue
avanzado por Hill (1965). Su popularidad como criterios para la inreren-
cia causal hace que valga la pena examinarlos en detalle:
Hill sugirió que se consideraran los siguientes aspectos de una aso-
ciación encontrada para intentar distinguir su carácter o no de causal: 1)
ruerza; 2) consistencia; 3) especificidad; 4) temporalidad; 5) gradiente
biológico; 6) plausibilidad; 7) coherencia; 8) evidencia experimental, y
9) analogía.
1. Fller;:a. Por «ruerza de una asociación». Híll entiende la magni-
tud de la razón (o ratio) entre las tasas de incidencia. Su argumento
consiste esencialmente en decir que las asociaciones ruertes es más pro-
bable que sean causales que las débiles, porque si ruesen debidas a
confusión o cualquier otro sesgo, la que está produciendo el sesgo
tendría que ser más ruerte aún y, consecuentemente, es presumible que
acabara haciéndose evidente. Las asociaciones débiles, por el contrario,
es más probable que ruesen explicables por sesgos no detectados. Sin
embargo, el hecho de que una asociación sea débil no descarta una cone-
xión causal. Ya se ha dícho que la ruerza de una asociación no es un
rasgo biológicamente consistente, sino más bien una característica que
depende de la prevalencia relativa de otras causas.
2. COI1.\,i.\,lel1cia.La consistencia se refiere a la observación repetida
de una asociación en poblaciones diferentes. bajo circunstancias diferen-
tes. La ralta de consistencia. sin embargo, no descarta una conexión
causal, porque cllgunos efectos son producidos por sus causas sólo bajo
circunstancias inusuales. Dicho de rorma más precisa, el erecto de un
agente causal no puede producirse a menos que actúen, o hayan actuado
ya, las causas componentes complementarias hasta completar una causa
suficiente. Tales condiciones no siempre se darán. Más aún, puede espe-
rarse que haya estudios que difieran en sus resultados porque difieran en
sus metodologías.
3. Especij¡cidad. El criterio de especificidad requiere que una causa
conduzca a un erecto único, no a efectos múltiples. Este argumento ha
24 EPIDEMIOLOGIA MODERNA

sido planteado no pocas veces. especialmente por los que. buscan exone-
rar al tabaco como causa del cáncer de pulmón. Las causas de un efecto
dado, sin embargo, no puede esperarse en base a lógica alguna que
carezcan de otros efectos. De hecho, la experiencia cotidiana nos enseña
repetidamente que acontecimientos únicos pueden tener muchos efectos.
La argumentación de Hill sobre este estándar de inferencia está liena de.
reservas, pero, aún así, el criterio me parece inútil y engañoso.
4. Temporalidad. La temporalidad se refiere a la necesidad de que la
causa preceda en el tiempo al efecto.
5. Gradienle biológico. Se refiere a la presencia de una curva de
dosis-respuesta. Si se adopta la respuesta como expresión epidemiológica
del efecto, medido como función de incidencias de enfermedad compara- 1
tivas, entonces esta condición se cumplirá ordinariamente. Algunas aso-
ciaciones causales, sin embargo, muestran no tener tendencias aparentes
del efecto en relación con la dosis; un ejemplo es la asociación entre el
DES y el adenocarcinoma de vagina. Una posible explicación es que las
dosis de DES que se administraron fueron todas suficientemente grandes
como para producir el máximo efecto, pero el desarrollo en la vida real
de tal enfermedad depende de otras causas componentes. Tampoco las
asociaciones que muestran una relación dosis-respuesta son, necesaria-
mente, causales; el efecto de confusión puede dar como resultado una
tendencia así en la relación entre un factor de riesgo no causal y la
enfermedad, si el propio factor de confusión muestra un gradientc biolt)-
gico en su relación con ia enfermedad.
6. Plausibilidad. Este término se refiere a la plausibilidad biológica
de la hipótesis, lo que es una preocupación importante, pero puede
resultar dificil de juzgar. Sartwell (1960). enfatizando este punto, citaba
las observaciones de Cheever, en 1861, quien comentaba sobre la etiolo- J
gia del tifus, antes de que se conociera su modo transmisión:
«Dejaría de ser ridículo para el desconocido que pasó la noche en
un camarote de tercera de un barco emigrante adscribir el tifus que
cogió allí a los bichos de que pueden estar infestados loS cuerpos de los
enfermos. Una causa adecuada Que .<;earazonable er. sí misma dcbe
corregir las coincidcncias de 12 simple experiencia.»

7. Coherencia. Tomado del ihforme del Surgeon General sobre ta-


baco y salud (1964) el término coherencia implica que una interpretación
de causa y efecto para una asociación no debe entrar en confiicto con lo
que se sabe de la historia natural )' la biología de la enfermedad. Los
ejemplos que pone Hill de coherencia, como el efecto histopatológico del
fumar sobre el epitelio bronquial (en referencia a la asociación entre el
fumar y el cáncer de pulmón) o la diferencia de incidencia de este proceso
según sexos, podrían ser razonablemente considerados ejemplos de plau-
sibilidad así como de coherencia; la distinción parece ser buena. Hill
enfatiza que la ausencia de información coherente, distinguiéndola de
forma clara de la presencia de información confiictiva, no debe ser tomada
como prueba en contra de que una asociación sea considerada causal.
INFERENCIA CAUSAL EN EPIDEMIOLOGIA 25

8. Evide/1cia ('-,=perimcI1tal. Tal evidencia es raras veces obtenible


con poblaciones humanas.
9. A/lalo.,,!:ía. Las posibilidades de la analogia en el plano de la
comprensión están limitadas por la inventiva imaginación de I"s científi-
cos, capaces de encontrar analogías en cualquier parte. A pesar de todo,
el tipo de analogías sencillas que Hill ofrece -si una droga puede causar
malformaciones congénitas, quizás pueda hacerlo otr~- concebible-
mente refuerza la credibilidad de que una asociación sea causal.
Como se ve, estos nueve aspectos de evidencia epidemiológica que
Hill ofrece para valorar si una asociación es causal, están plagados de
reservas y excepciones: alguno puede que sea erróneo ( e.S'peciflcidad) u
ocasionalmente irrelevante (evidencia e.yperimental y, quizás, analogía).
Hill admitía que:

1 «Ninguno de mis nueve puntos de vista puede aportar evidencia incon-


testable a ravor de o contra la hipótesis de causa y erecto, y ninguno
puede ser requerido como .\"ine qua non.»

Al describir la inadecuación de estos estándares, Hill va demasiado


lejos. El cuarto, la temporalidad de una asociación, es sine qua non: si la
«causa» no precede al efecto, esa es realmente una evidencia incontesta-
ble de que la asociación no es causal. Aparte de esta condición, que es
parte del concepto de causación, no hay criterios fiables para determinar
si una asociación es causal.
En honor a la verdad debe decirse, para ser justos con Hill, que él
claramente no pretendía que estos «puntos de vista» fueran utilizados
como criterios de inferencia; afirmaba en verdad que no creía que en el
tema de la inferencia causal pudiera utilizarse ninguna regla tajante. Si
alguien utiliza sus puntos de vista considerándolos poco menos que una
«guía para la inferencia», hay que recordar que no fueron propuestos
como tales. Ciertamente, resulta dudoso que el proceso inferencial pudie-
ra adquirir realce por la rutinaria consideración de criterios de ningún
tipo de «guía» (Lanes y Poole, 1984). Sabemos por Hume, Popper y
otros que la inferencia causal es, como mucho, tentativa y sigue siendo
un proceso subjetivo.
El fallo de algunos investigadores en reconocer la imposibilidad
teórica de «probar» la naturaleza causal de una asociación ha conducido
a infructuosos debates, entre escépticos que esperaban tales pruebas y
científicos persuadidos de estar haciendo una inferencia sobre la base de
evidencias existentes. La responsabilidad que tienen los científicos de
hacer juicios causales fue el punto que Hill recalcaba en su discusión
sobre causalidad:
«Todo trabajo cientifico es incompleto -sea observacional o experi-
mental. Todo trabajo cientifico es susceptible de ser invalidado o
modificado por el avance del conocimiento. Ello no nos confiere la
libertad de ignorar el conocimiento que ya tenemos o posponer la
acción que éste parezca demandarnos en un momento dado.»
26 EPIDEMIOLOGIA MODERNA

Recientemente, Lanes (1985) ha propuesto que la inferencia causal en


absoluto forma parte de la ciencia, sino que radica estrictamente en e]
ámbito de la politica pública. Según este punto de vista, dado que todas
las teorias científicas podrían estar equivocadas, los que deben tomar
decisiones políticas deberian sopesar las consecuencias de las acciones
bajo varios prismas teóricos. Los científicos tendrían que ínformarles de
las teorías científicas y dejarles la elección de una teoría y una forma de
actuación. No muchos científicos de la salud pllblica se sienten inclina-
dos a una separación tan estricta entre la ciencia y ]a política. pero.
como filosofia de trabajo, tiene la ventaja de no colocar a los científicos
en la embarazosa posición de ser abogados de una teoría en particular
(Rothman y Poole, 1985). La historia muestra, ciertamente. que en cien-
cia es preferible el escepticismo. 1
REFERENCIAS -1

Brown, H. I. Perceplion, Theor)' and CommitmenJ. Th(' N('II. Philo.\"oph)' ~r


Science. Chicago: Universit)' or Chicago Press, 1977.
Einstein, A. Letler to Max Born, 1924. Citado en A. P. French (ed.), Ein.\"tein. A.
Cenlenar)' Volume. Cambridge, Mass.: Harvard University Press. 1979.
Ephron, E. The Apocalyplics. Cancer and Ih(' Big Lie. New York: Simon and
Schuster, 1984.
Fraiberg, S. The Magic Years. New York: Scribner.s. 1959.
Higginson, J. Populatjon studies in cancer. Acla Unio. ¡nl('rnat. C(}I'lr(/ Cal1-
crum 1960; 16:1667-1670.
Higginson, J. Proportion or cancer due to occupation. Prer. M(!d. 1980; 9:180-
188.
Hill, A. B. The environment and discasc: Associatjon or causation? Prnc. R.
Soc. Med. 1965; 58:295-300.
Kuhn, T. S. The Struclure oJ Scienlific Revolulion.\" (2nd ed.). Chicago: Unjver- -1
sity of Chicago Press. 1962.
Lanes, S. Causal inference is not a matter of scjence. A m. J. Epidell1iol. 1985;
122:550.
Lanes. S. F., and Poole, C. ..Truth in packagjng?'. The unwrapping or epidemio-
logic research. J. Occup. Med. 1984: 26:57]-574.
MilI, J. s. A System oJ Logic. RaliocinQlive al,d ¡nd,(c{iv(' (51h ed.). London:
Parker, Son and Bowin, 1862. Citado en D. VI'. Clark and B. MacMahon
(eds.), Prevenrive and Communi{)' Medicine (2nd ed.). Boston: Litlle, Brown.
1981. Chap. 2.
Popper, K. R. The Logic oJ Scien{ific Di.\"cnv('r.t.. Ncw York: Harper & Row.
1965.
Reichenbach, H. The Rise oJ Scientific Philo.\"(1ph.t.. Bcrkeley: University or
California Press, 1951.
Rothman, K. J. Causes. Am. J. Epidemiol. 1976; 104:587-592.
Rothman, K. J. Causes and risks. En M. A. Clark (ed.), Pulmol1arl' Di.\"ea.\"c:
J
DeJense Mechanisms and Populalions al Ri.\"k. Lexington, Ky.: Tóbacco and
Health Research Instjtutc, 1977.
Rothman, K. J. Induction and latent periods. Am. J. Epid('mi()l. 1981; 114:253-
259.
INFERENCIA CAUSAL EN EPIDEMIOLOGIA 27

Rolhman. K. J. Causation and causal infcrencc. EI1 D. Schollenfeld and J. F.


Fraumeni (eds.), Cullcer Epidemiolog)' and Prevenli(m. PhiladcJphia: Saun-
ders, 1982.
Rothman. K. J. and Poolc. C. Science and policy making. Am. J. PII11Ii(. H(,(lllh
1985; 75:340-341.
Sartwell, P. On the methodology of investigations of etiologic factors jn chronic
discases-rurthcr commcnts. J. Chr(}1'. Di.1". 1960: 11:61-63.
U.S. Department of Hcalth. Educaljon and Wclrare. Smoking and Hcalth:
Report of lhe Advisory Commiltee lo lhe Surgcon Gcneral of lhc Public
Health Servicc. Public Health Service Publicalion No.1103, Washington.
D.C.: Government Printing omce. ] 964.
Waldrop, M. M. Slring as a theory of everything. Scie/lce 1985: 229:1251.1253.

~
\
.-1
3. MEDIDAS DE FRECUENCIA
DE UNA ENFERMEDAD

La más clara de las muchas definiciones de Epidemiologia que han sido


P!.opuestas ha sido atribuida a Gaylord Anderson (Cole, 1979). Su defini-
1 clon es:

Epidemiologia: el estudio de la ocurrencia de los procesos patológicos.

Otras ciencias se orientan también hacia el estudio de la enfermedad,


pero en epidemiología el enfoque se centra en su ocurrencia. Como rama
de la ciencia, la epidemiologia se dedica a la evaluación de hipótesis
científicas. Estas son, frecuentemente, planteadas como proposiciones
cualitativas. La forma <mula» de tales proposiciones es altamente refuta-
ble y, como se discute en el capitulo anterior, deriva su contenido
empirico de esta caracteristica. A diferencia del enmarcado de hipótesis,
la investigación cientifica, que incluye la actividad de intentar la refuta-
ción de dichas hipótesis, se predica sobre la medición. Hipótesis formula-
das cualitativamente sobre la evolución, la formación de la tierra, el
efecto de la gravedad en las ondas luminosas o el método mediante el
cual encuentran su camino los pájaros durante la migración, son todas
puestas a prueba mediante mediciones de los fenómenos que se relacio-
nan con ella. El fisico Kelvin planteó bien la importancia de la medición
en relación con la ciencia (citado en Beiser, 1960):

Suelo decir que cuando puedes medir aquello de lo que estás hablando,
y expresarlo con números, es que sabes algo acerca de ello; cuando no
puedes expresarlo con números, por el contrario. tu conocimiento es de
naturaleza débil e insatisfactoria; puede que sea el principio del conoci-
miento, pero habrás avanzado escasamente en tus pensamientos hacia
la etapa de ciencia. cualquiera que sea el tema de que se trate.

De Hipócrates a Sydenhan, los médicos han considerado las causas


de la enfermedad, pero sólo cuando la medición de su ocurrencia sustitu-
yÓ a la reflexión acerca de esas causas, el conocimiento sobre causalidad
realizó enormes saltos adelante. La tarea fundamental en investigación
29
30 EPIDEMIDLOGIA MODERNA

epidemiológica es, pues. cuantificar la ocurrencia de los procesos patol()-


gicos. Se trata de evaluar hipótesis acerca de la causalidad de la enferme-
dad y sus secuelas y relacionar al mismo tiempo su ocurrencia con las
caracteristicas de la gente )' el entorno en que viven.
Existen tres medidas básicas de frecuencia de una enfermedad. La
lasa de illcidencia es una medida de la fuerza instantánea de ocurren-
cia de la misma. La incidencia acumulada mide la proporción de gente
que se con\'ierte, durante un periodo de tiempo especificado. de no
enfermo en enfermo. La prevalencia mide la proporción de gente que
tiene la enfermedad
interrelación en un
serán ahora instante
descritas concreto. Dichas medidas .y su
en detalle.

1
INCIDENCIA

Cuando se intenta medir la frecuencia de ocurrencia de una enfermedad


1
en una población, es insuficiente registrar sólo el número de gente o la
proporción de población que está afectada. Es necesario también tomar
en cuenta el tiempo transcurrido hasta que se produce la enfermedad.
J
Para entender esto, consideremos la frecuencia de una enfermedad que
en última instancia afecta a todo el mundo, es decir, la muerte. Puesto
que todo el mundo se verá finalmente afectado, el tiempo entre el
nacimiento )' la muerte se convierte en el factor determinante para la
medición de la ocurrencia de ésta. El tiempo establece la diferencia entre
las dos situaciones que muestra la figura 3.1.
Así pues, una medida de incidencia debe tomar en cuenta e] númcro
de individuos que caen enfermos en los periodos de tiempo experimcnta-
dos por los miembros de tal población. durante los que estos aconteci-
mientos ocurren. La tasa de incidencia es, de esa forma, definida como el
J
número de comienzos de enfermedad en la población dividido por la

...I

Tiempo - Tiempo -+
X = muerte X = muerte

Fig.3.1. Dos patrone.\' diferente.\' de oclirrencia d(' /lIla ei~rcrmedl1d.


MEDIDAS DE FRECUENCIA DE UNA ENFERMEDAD 31

suma de los períodos de tiempo de observacíón de todos los individuos


de dicha población:

número de comienzos de enrermeda(j


Tasa de incidencia =
r de períodos de tiempo

donde L indica la suma de los períodos de tiempo de todos los indivi-


duos.
Para muchas aplicaciones epidemio)ógic:ls, )a posibi)idad de que una
persona adquiera una enfermedad más de una vez es descartada. ya sea
por convención o por motivos biológicos. Si la enfermedad es. por
ejemp)o, la rinitis, mediremos simplemente la incidencia de «primeras»
ocurrencias, aunque ese proceso patológico pueda repetirse varias veces;
para cáncer, enfermedad cardiaca y muchos otros cuadros, la primera
ocurrencia sue)e ser de mayor interés para el estudio que otras ocurren-
cias subsiguientes en ese mismo individuo. Para un resultado como la
muerte, o una enfermedad como la diabetes. que se considera que no
recurre, sino es un estado permanente una vez diagnosticada, só)o pue-
den estudiarse primeras ocurrencias. Cuando los acontecimientos que se
están contando son primeras ocurrencias de enfermedad, e) período de
observación de cada individuo que desarroll:l la enfermedad finaliza con
el inicio de ésta.
Dado que )a tasa de incidencia es un cociente, con una frecuencia en el
numerador y una medida de tiempo en el denominador, su dimensionali-
dad es tiempo- 1, es decir, el recíproco del tiempo. El denominador de la
tasa puede también ser considerado el producto de mu)tiplicar el tama-
ño de la población por el período medio de tiempo de observación de un
miembro de la misma, aunque este producto es, como cualquier produc-
to, SÓ)o una descripción taquigráfica de la correspondiente suma. ,Es
corriente referirse al denominador de la tasa de incidencia como .una
medida de «persona-tiempo», para distinguir el sumatorio de esos tiem-
pos de !o que sería el tiempo ordinario de reloj. Tal medida de persona-
tiempo constituye la experiencia observacional en la cual se puede des-
cribir el comienzo de la enfermedad. Implícito en esa medida está el
concepto de que una cantidad dada de persona-tiempo, digamos 100
persona-años, puede estar derivada de observar poblaciones distintas
en circunstancias distintas. Es decir, se asume que son equivalentes las
observaciones de 100 personas durante un año, 50 personas durante dos,
200 personas durante seis meses ó 1 persona durante cien años. Cada
unidad de esa magnitud persona-tiempo se asume también que es equi-
valente a, e independiente de, las demás unidades persona-tiempo. Esta
asunción, aunque razonable por lo general, podría carecer de garantías
en situaciones extremas -por ejemplo, observando a un individuo du-
rante cien años para obtener 100 persona-años-. Las citadas unidades
de persona-tiempo están así habitualmente constreñidas por la edad, que
elimina oscilaciones extremas de la independencia de las mismas. No se
32 EPIDEMIOLOGIA MODERNA

1
c
.o

Ct
:0
0
c.
~
Q>
-0
0
tC
(O
E
(O
1-
'1

Fig.3.2. Tamaño de u/la pohlació/1 FIja de J .000 perso//a.\", e// ./imcinn dl'lliempo.

puede obtener 100 persona-años de experiencia en el rango de edad


«cincuenta a cincuenta y cuatro años» si se cuenta con menos de 20
individuos.
Conceptualmente, es posible imaginar la experiencia en este plano de
dos tipos distintos de población, la pohlació1!.fi.ia y la pohlación dinámica.
La primera no admite que se añadan nuevos miembros, mientras la
dinámica si lo hace. Supongamos que estamos midiendo la la.\"o de
mortalidad. definida como la tasa de incidencia de la muerle, en una
población fija de 1.000 personas. Tras un periodo de tiempo suficiente.
los 1.000 originales habrán menguado a cero. Un gráfico de la población
respecto al tiempo podría tener un aspecto como el de la figura 3.2.
La curva va declinando hacia abajo, porque finalmente los 1.000
individuos morirán todos. La población es fija en el sentido de que
J
estamos considerando el destino de sólo las 1.000 personas identificadas
inicialmente. La experiencia persona-tiempo de estos 1.000 individuos
está representada por el área que está debajo de la curva descendente
J
del diagrama. Conforme cada uno de ellos va muriendo. la curva hace
una muesca hacia abajo: ese individuo va no contribuve al conjunto de
observación persona-tiempo de la población fija. La- contribüción de
cada individuo es exactamente igual a la duración del tiempo en que ese
individuo es seguido desde principio a final; en este e.jemplo. pueslo que
la población enter~ es seguida hasta la muerte, el final es la muerte de
cada individuo. En otras ocasiones. la contribución a la experiencia
persona-tiempo continuaría hasta el comienz() de la enfermedad o hasta
algún arbitrario punto y final a la observación, 10 que viniera antes. ~1
.Supongamos que vamos sumando el total de la experiencia perso-
na-tiempo de esta población fija de 1.000 seres y obtenemos un total de
75.000 persona-años. La tasa de mortalidad sería (1.000/75.000) añ()-I.
puesto que las 75.000 persona-años representan la experiencia de las
1.000 hasta su muerte. Una población fija que afrontase una tasa de
mortalidad constante declinaría en tamaño, pero en la práctica esa «caí-
---,--
o\AEDIDAS DE FRECUENCIA DE UNA ENFERMEDAD 33

da exponencial» no ocurre virtualmente nunca. Debido a que una pobla-


ción fija envejece de forma continuada durante el periodo de observa-
ción. las tasas de muerte o enfermedad en este tipo de poblaciones
cambian. por lo general. con el tiempo. a consecuencia del cambio de
edad. La metodologia de las tahla.\, {ie vi{ia es un procedimiento por
medio del cual se evalúa la mortalidad (o morbilidad) de una población
fija en pequeños intervalos sucesivo$ de tiempo. con lo que puede ser
elucidada la dependencia de la mortalidad respecto del tiempo.
Una población dinámica difiere de una fija en que no restringimos
las observaciones a ningún grupo prefijado. Por el contrario, las obser-
vaciones se van extendiendo a los que entran a formar parte de ella,
conforme va pasando el tiempo de observación. La gente entra en una
población de varias maneras. Algunos nacen en ella; otros emigran allí.
Para una población de gente de una edad especifica, los individuos
entran a formar parte de ella al cumplir esa edad. De modo similar. un
individuo puede salir de la experiencia observacional.. persona-tiempo
asi: muriendo. cumpliendo una edad que se salga de ese grupo definido,
emigrando y poniéndose enfermo, si sólo se están estudiando primeros
ataques de un proceso patológico. Si el número de gente que se incorpo-
ra a una población se contrapesa exactamente con el de los que salen de
j ella en cualquier período de tiempo, se dice que la población está en
«situación estable». El estado estable es una propiedad que se aplica sólo
a las poblaciones dinámicas, no a las fijas.
La gráfica del tamaño de una población dinámica en situación esta-
ble es simplemente una línea horizontal. La gente está continuamente
incorporándose y abandonando la experiencia persona-tiempo en una
forma que podría representarse diagramáticamente con la figura 3.3.
En el diagrama, el símbolo > representa a un individuo que entra a
la experiencia persona-tiempo, un segmento lineal representa su contri-
bución a la misma, la terminación de la línea indica que alguien se
marcha de esa experiencia persona-tiempo y X indica la separación de
dicha experiencia debido al comienzo de la enfermedad. En teoría, .si la

c
.o

ro
:3
0
o.
ro
Q)
"tJ
0
.c
ro
E
ro
1-

Fig.3.3. Tamml0 {le II/la poblacióll dillÓnlica. en el tiempo, con IIna illdicación de
la renovacióll de la población.

~
3/, EPIDEMIOLOGIA MODERNA

tasa de incidencia es constante a lo largo del tiempo, cualquier porción


de la experiencia población-tiempo de una población dinámica en situa-
ción estable aportará una buena estimación de la incidencia de enferme-
dad. El valor de la incidencia será la razón entre el número de casos de
comienzo de enfermedad, representados por X y el área bidimensional
del gráfico (población x tiempo). Dado que esta razón es equivalente a
la densidad de comienzos de enfermedad en el área observacional. se
puede llamar también a la tasa de incidencia «densidad de incidencia»
(Miettinen, 1976). Otro sinónimo de esta medida es la fiterza d(' morbili-
dad (o fuerza de morlalidad, si se trata de muertes).
El rango numérico de una tasa de incidencia va de cero a infinito.
como corresponde al rango de densidades de puntos en un espacio 1
bidimensional. ¿Cómo puede ser infinita la incidencia de una enferme-
dad? Infinidad es el teórico límite superior para una enfermedad que es
universal )' ataca rápidamente. Si una población que viviera en una
colonia espacial se viera expuesta de repente toda e]la sin trajes protec-
tores al entorno del espacio, ]a tasa de incidencia de la muerte sería
extremadamente a]ta, aunque no tanto como infinita, porque las muertes
no serían instantáneas. Ese valor ]ímite de infinito sólo sería aproximado
en el instante mismo de un holocausto que ocurriera de repente. Quizá
sea sorprendente para algunos que una tasa de incidencia pueda exceder
el valor de 1,0, lo que parece que indicaría que más del 100 por 100 de
una población se vería afectada. Es cierto que, como máximo, sólo el 100
por 100 de una población puede adquirir una enfermedad, pero la tasa
de incídencia nc) mide la proporción que sufre un proceso patológico.
Esa medida no es una proporción -recuérdese que la tasa de incidencia
se mide en unidades de] recíproco de tiempo-. Entre 100 personas no
puede ocurrir más de 100 muertes, pero esas] 00 muertes pueden ocurrir
en 10.000 persona-años, en 1.000 persona-años, en 100 persona-años o
incluso en 1 persona-año (si las 100 citadas muertes ocurren tras una
medida de 3,65 días cada una). Una tasa de incidencia de 100 casos (o
-I
muertes) por 1 persona-año se expresaría como:

ó J

casos
0,27 ---'.
MEDIDAS DE FRECUENCIA DE UNA ENFERMEDAD 35

El valor numérico de una tasa de incidencia. en si mismo, carece de


interpretabilidad. porque depende de la selección arbitraria de la unidad
de tiempo. Cuando se presentan tasas de incidencia, pues, es esencial dar
también las unidades de tiempo apropiadas. ya sea como en los ejémplos
anteriores o como 8,33 meses- I ó 1.92 semanas-l. En los textos epide-
miológicos, las unidades se dan con frecuencia sólo de modo implícito.
en vez de explícitamnte. como. por ejemplo, al decir «una incidencia
anual de 50 por 100.000». Esta última cantidad es equivalente a decir:

50 casos
ó 5 x 10-4 años-1
100.000 persona-años

Es preferible, sin embargo, no usar expresiones tales como «inciden-


cia anual de»; esta expresión es análoga a describir una velocidad de 60
millas/hora como «una velocidad horaria de 60 millas», Aparte de cha-
pucera, lleva a cabo una implicación inadecuada acerca del tiempo,
como si la medida se aplicase a todo el intervalo de tiempo citado,
cuando de hecho no es asi. Una velocidad de 60 millas/hora no se aplica
a una hora de tiempo; uno no necesita viajar a esa velocidad durante
una hora ni echar una hora en medirla. La velocidad 60 millas/hora es
~J un concepto instantáneo: no es complicado concebir que se puede viajar
a esa velocidad en un instante específico en el tiempo. El que la velo-
cidad se exprese como 60 millas/hora, 88 pies/segundos ó 0,57 unidades
astronómicas/siglo no significa ninguna diferencia; todas indican la
misma velocidad, y las unidades de tiempo que se utilizan para expre-
sarla carecen de peso alguno en la naturaleza instantánea de tal medida.
El mismo principio se aplica a la tasa de incidencia (Elandt-Johnson,
1975). Como la velocidad, es .siempre un concepto instantáneo, aunque
se usen unidades de persona-años o persona-siglos. Por tanto, no hay
nada anual en una «incidencia anual» y sería preferible que no se usase
esa terminología.
La dimensionalidad de la tasa de incidencia, es decir, el recíproco de
tiempo, la convierte en una medida con dificultades a la hora de ser
asimilada intuitivamente. No obstante, la medida tiene una interpreta-
ción. Volviendo a la figura 3.2, puede verse que el área que hay debajo
de la curva es igual a N(T), donde N es el número de gente en la
población fija y T es el tiempo medio hasta la muerte. Esto es equivalen-
te a decir que el área bajo la curva es igual al área de un rectángulo,
cuya altura seria N y cuya anchura, T. Puesto que T es el tiempo medio
hasta la muerte de N gente. el total de la experiencia persona-tiempo es
N(T). La tasa de mortalidad en tiempo promediado tras seguimiento
completo, entonces, es N/[N(T)] = l/T; es decir, la tasa de mortalidad
equivale al recíproco del tiempo medio transcurrido hasta la muerte, o,
más generalmente, la tasa de incidencia equivale al recíproco del tiempo
medio hasta el comienzo de la muerte (Morrison, 1979). Por tanto, una
tasa de mortalidad de 0,04 años- 1 indica un tiempo medio hasta la
muerte de veinticinco años. Si el resultado no es la muerte, sino ya sea el~
36 EPIDEMIOLOGIA MODERNA

comienzo de una enfermedad o la muerte sólo por una causa específica.


la interpretación anterior debe ser ligeramente modificada. El periodo en
cuestión seria entonces el tiempo medio hasta el comienzo de la enferme-
dad, asumiendo que una persona no está a riesgo por otras causas de
muerte. Es decir, la medida es un tiempo a condición de que no haya
otros «riesgos competidores» de muerte. Esta interpretación de las tasas
de incidencia como el inverso del «tiempo de espera») medio no será
válida a menos que la tasa de incidencia plled~ ser usada para describir
una población en situación estable o una población fija sometida a
seguimiento completo. Por ejemplo, la tasa de mortalidad para los
Estados Unidos en 1977 fue 0,008R años - 1, lo que sugiere una duración
media de la vida, o esperanza de vida de ciento catorce años. Otros
análisis indican que la esperanza de vida real en t 977 fue de setenta y
tres años. La discrepancia es debida a la falta de una situación estable.

INCIDENCIA ACUMULADA

A pesar de la interpretación que puede darse de la tasa de incidencia.


ocasionalmente es más conveniente usar una medida de ocurrencia de 'la
enfermedad más rápidamente manejable. Tal medida es la «incidencia
acumulada», que puede definirse como la proporción de una población
fija que cae enferma en un periodo de tiempo' dado. Si se define riesg(J
como la probabilidad de que un individuo desarrolle una enfermedad en
un intervalo especificado de tiempo, entonces la incidencia acumulada es
una medida del riesgo medio. Como cualquier proporción. sus valores
van de O a 1 y carece de dimensión. Es ininterpretable, no obstante, si no
se especifica el período de tiempo a que se aplica. Una incidencia acumu-
lada del 3 por 100 puede ser baja, si se refiere a un periodo de cuarenta
años, mientras que será alta si se aplica a un período de cuarenta días.
Es posible derivar estimaciones de la incidencia acumulada a partir
de la tasa de incidencia. Consideremos una población fija (Fig. 3.4).
En el tiempo !. lAr = (Po - P,)! Po: dicho en palabras. la incidencia
acumulada en el tiempo I es igual al número de gente que ha abandona-
do la población fija en ese tiempo 1 debido a la enfermedad, (Po - P,).
dividida por el número incial de gente que había en dicha población. La
tasa de incidencia en el tiempo I es la razón entre los nuevos casos y la
experiencia de observación persona-tiempo. Así pues:

-óP
1,
p,Ó!

o, escrito en términos de cálculo diferencial,

-dP dP
Ir = l,dl =
P, dI P,
I
I
, MEDIDAS DE ~RECUENCIA DE UNA ENFERMEDAD 37
!

¡
,
!
!
!
i
c
! .o

tU
:(5
0
o.
tU
Q)
"0
0
! .c
tU
¡ E
(O
! 1-
í
l
i
¡
J

Fig. 3.4. Tamaño de una pohlación fija. en jimci(m del {ienTpo, indica17do 1(1!
pequeño decrecimien{o e17 ellie17TpO {.

] (se usa el signo menos porque el cambio en p es negativo en relación a i;


sin ese signo menos. la medida de incidencia sería negativa). Integrando
ambos lados:
~

¡
I f~J,dt = ln(P,) in (Po)
J

1 Tomando antilogaritmos,

= P,/ Po
exp(
y como

tendremos

IAt = 1 -f~ I, dt
exp

Esto se calcula como

lAr 1 exp

J
36 EPIDEMIOLOGIA MODERNA

dondc el sumatorio del índice, i, está sobre categoría.<; de tiempo que


cubren el intervalo [O, tJ.
Para una tasa de incidencia constante
e -1 f.r
IA

Dado que e"'( = I + ." para 1.:1:!menor de aproximadamente 0.1. una


buena aproximación para una incidencia acumulada pequeña (menor de
0,1) es

IA , == )
"-'
1.61
I , ó IA, ~ IL\l
j

si la tasa es constante en el tiempo. Así pues, para estimar riesgos


pequeños. basta con multiplicar simplemente la tasa de incidencia por el
periodo de tiempo. La aproximación de arriba ofrece otra interpretación
de la tasa de incidencia; puede ser vista como la razón entre un riesgo a
corto plazo y el periodo de tiempo de ese riesgo. cuando su duración se
aproxIma a cero.
La medición de la incidencia acumulada tiene como premisa la
J
asunción de que no hay riesgos competidores de muerte. Por tanto, si un
individuo de cuarenta años afronta una incidencia acumulada o riesgo
de muerte cardiovascular de] 35 por 100 en treinta años, lo que se
interpreta es que tiene esa probabilidad de morir por enfermedad cardi().
vascular, siempre que estuviera libre de otros riesg()s que pudieran con.
ducirle a la muerte. Puesto que nadie se encuentra líbre de esos riesgos
competidores, la medición de una incidencia acumulada, para cualquier
otro resultado que no sea la muerte por todas las causas, es una medida
hipotética. En princpio, para periodos largos ese parámetro es inobser-
vable v debe ser inferido. debido a la influencia de riesgos competidores.
U~ tipo específico d~ incidencia acumulada es la la.S"ade 1('lalidad
«<case-fatality rate»), que es la incidencia acumulada de la muerte entre
aquellos que desarrollan una enfermedad (es técnicamente, por tanto, no
una tasa, sino una proporción). El periodo de tiempo para medir la
citada tasa de letalidad se mantien~ a menudo sin explicitar. pero es
siempre mejor especificarlo. Cuando no está formulado, es que presumi-
b]emente ha}' un corto periodo de riesgo aumentado. Para períodos
]argos de riesgo de morir tras el comienzo de la enfermedad, es preferible
usar la tasa de mortalidad entre loS que padecen ]a enfermedad, en vez .1
de la tasa de letalidad en cuestión, con 10 que puede ser tomado en
cuenta el tiempo rea] en que cada individuo está a riesgo. Puesto que en
una situación estable el reciproco de. una tasa es e] tiempo medio trans-
currido hasta el acontecimiento, la tasa de mortalidad global de una
enfermedad en una población se relaciona con la tasa de incidencia y
con la tasa de mortalidad entre los casos de la siguiente manera (Morri-
son, 1979):
1
MT = T -
1/1 + l/Mc

."
...
.~EDIDAS DE FRECUENCIA DE UNA ENFERMEDAD 39

donde ,\1 T es la tasa total de mortalidad de la población: T es la


esperanza de \,ida; Ti es el tiempo medio hasta el comienzo de la
enfermedad: T2 es el tiempo medio desde el comienzo de la enfermedad
hasta la muerte: I es la tasa de incidencia de la enfermedad, y ¡\'1c es la
tasa de mortalidad en tre los casos.

PREVALENCIA

A diferencia de las medidas de incidencia, con énfasis en los episodios,


las de la prevalencia se centran en el esta(us de enfermedad. La prevalen-
cia puede ser definida como la proporción de una población que está
afectada por una enfermedad en un punto dado del tiempo. El término
preL1alellcia pulllual es usado a veces pala significar la misma cosa. Un
individuo que fallece de una enfermedad sale al hacerlo, por tanto. del
grupo que constituye el numerador de la prevalencia; consecuentemente,
la mortalidad debida a una enfermedad lo hace disminuir. Enfermedades
con tasas de incidencia grandes pueden tener prevalencias bajas si son
rápidamente fatales, pues. La gente puede salir también del conjunto de
la prevalencia al recuperarse de la enfermedad.
Se ha dicho antes que una población en situación estable posee un
número igual de gente entrando y saliendo de ella durante cualquier
unidad de tiempo. Este concepto puede ser extendido para referirlo a
una subpoblación de gente con pato logia o depósito de prevalencia (es
decir, el numerador de la prevalencia). En una situación estable, el
número de gente que se incorpora al depósito ( pool) de prevalencia se
contrapesa con el número de los que salen de él:

, flujo de entrada flujo de salida


=
(al depósito de prevalencia) (del depósito de prevalencia)

La gente entra a dicho depósito, pues, desde la población no enfer-


ma. Si el número total de personas en una población es N y el depósito
de prevalencia es P, el tamaño de la población no enferma que «alimen-
ta» el depósito es N -P. Durante cualquier intervalo de tiempo, t, el
número de gente que entra en el depósito de prevalencia es

I ill(N P)

donde I es la tasa de incidencia. Durante el mismo intervalo de tiempo


L\t, el flujo de salida desde el depósito de prevalencia es

I' ÓtP

donde I' representa la tasa de incidencia de salida desde el depósito, es


decir, el número de los que salen dividido la experiencia persona-tiempo
de los que están en el depósito de prevalencia. Vimos antes que el
.J
40 EPIDEMIOLOGIA MODERNA

recíproco de una tasa de incidencia en una situación estable equivale a la


duración media del tiempo transcurrido antes del acontecimiento inci-
dente. Por tanto, el recíproco de I' es la duración media de la enferme-
dad, 15.Con ello,

Flujo de entrada J~I(J\' -P) = nu.io dc salida = (l/[j)~IP

l ~({J\' -P) = {1/¡)) ~IP

P/(J\' -P) = 1/J

P/(N -P) es la razón entre los enfermos )' los no-enfermos (podría- f/l

mos llamarles sanos. si no fuera porque lo que queremos decir es que no


están enfermos de una enfermedad específica, lo que no implica ausencia
de todas las enfermedades) en una población, o equivalentemente, la
razón entre la prevalencia y el complemento de la prevalencia ( l -
1
prevalencia). La razón entre una proporción y la cantidad 1 menos dicha
proporción la llamaremos ve1l1~ia«<odds»). En este caso. P/(N -P) es la
-1
venl~ia de prevalencia, o ventaja de tener una enfermedad respecto de no
tener la enfermedad. Por tanto, la ventaja de prevalencia es igual a la
tasa de incidencia multiplicada por la duración media de la enfermedad.
Si la prevalencia es pequeña. digamos menor de 0.1, se ded uce q ue:

Prevalencia = ID

porque para valores pequeños de la prevalencia, esta prevalencia se


aproximará a la venta.ia de prevalencia. MilS generalmentc (Freeman y
H utchison, 1980), -]
ID
Prevalencia = I + 1!5

que puede obtenerse de la expresión de venta.ja de prcv.1lcncia que antes


se trató.
La prevalencia, por ser una proporción. carece de dimensiones. y sus
valores están comprendidos entre O y 1.0. Las ecuaciones anteriores son
acordes con estos requisitos, porque en cad.l una dc ellas la t.tsa de :1
incidencia, cuyas unidades son el reciproco delticmpo. está multiplic.ld.1
por la duración media de la enfermedad, dando un producto sin dimen-
sión. Más aún, el producto incluye valores entre cero e infinito, lo que se
corresponde con el rango de la vent.l.ia de prevalencia, en tanto 1.1 J
expresión

Jí5

1 + Jí5

está siempre en el rango entre O y 1.0.


MEDIDAS DE FRECUENCIA DE UNA ENFERMEDAD .11
~---
Raras veces tiene la prevalencia interés dirccto I.:n aplicaciones cliol().
gicas de la investigación epidemiológica. Puesto que la rrob.1hilidad de
sobrevivir p.ldeciendo la enlermed.ld .1fecta a 1.1prev.1Ienci.1. los csludios
de prevalencia o estudios basados cn C.1SOSprcv.1lcnlCS oblicncn ~isocia-
ciones que rencjan los dctcrminantcs dc ¡.1 ."urcr\,ivenci.1 un.1 vcz quc se
padece la cnfermedad así como las C.1USa~ tic tal cnfcrmed~ld. tJn~l
supervivencí.l mejor y, por l.lnto, una prcvalcncí.1 mi1s alta. rodri.1n
realmente estar relacionadas con I~l acción de f.lctores preventivos que
mitigasen de alguna manera la enfermcdad, una vez que se produjese.
No obstante. par.l un tipo de enfermed.ld. a saber, las malformacio-
nes congénitas, la medida que h.lbitualmente sc cmplea es la prcvalencia.
La proporción de niños nacidos con algun(l malformación es una tasa de
prevalencia, no de incidencia. La incidencia de malformaciones se refiere
a la ocurrencia de éstas entre las poblaciones susceptibles de embriones.
Muchas malformaciones conducen a una muerte embrionaria temprana
o a la muerte fetal. que son clasificadas, si se las reconoce. como .lborto
en vez de como nacimientos. En consecuencia. los niños m.llformados en
el momento del nacimiento representan sólo a ~lquellos individuos que
1 sobrevivieron con sus malform(lciones
como nacidos. Esta es, ciertamente.
lo suficiente p.1r.1 ser registrados
una medid.1 de rrevalencia, con un
punto de referencia en el tiempo que es el momento de nacer. Por lo
J general, se considera
malformaciones
mi1S útil y desc.1ble estudi.1r la incidenci~l de l~lS
congénitas que su prevalencia, pero habitualmenle no es
posible hacerlo. En consecUenCi(l. lo que se esludi,l en este {lre,l de
investig.1ción son los C.1SOSprev.llentes en vez de los de incidencia.
L~l prevalencia se usa .1 veces para medir 1,1ocurrencia de enfermeda-
des degenerativas no let.lles. que no teng.1n un momento de comienzo
claro. En esta y otras situacioness, se mide la prevalencia simplemente
por conveniencia, y se infiere acerca de la incidencia, realizando asuncio-
nes sobre la duración de la enfermedad. Por supuesto, en aplicaciones
epidemiológicas fuera de la investigación etiológica. como puede ser la
planificación de recursos y prestaciones sanilari.1s, la prevalenci.1 ruede
ser una medida mi1S afinada que la incidencia.~

REFERENCIAS

Cole. P. The evolvil1\! C¡lSe-control sludv. J. Chr(}I,. Di.\". 1979: 32: 15-27.
Bciser. ¡-\. Th(' ¡v(}rltT (If Phl..\"ics. Ncw York: McGr¡\w-Hill. 1960.
Elandl-Johnson. R. C. Dcfinition of r¡lteS: Somc rcm¡lrks on lheir li.'ie al1d
misuse. ,il". J. EpiJ('II'i(}l. 1975: 102:267-271.
Freeman. J.. and ¡:-llilchison. G. B. Prev¡\lcncc. il1cidcncc and duralion. ..1/1'. J.
E¡>id('/1liol. 1980: 112:707- 723.
Miellinen. O. S. ESlim¡lbilily ¡lnd cslimalion in casc-refcrcnl sludics. .ill'. J.
Epill('/1li()l. 1976: 103:2:?6-235.
Morrison. A. S. Sequential pathogenic componenls or rates. ¡/11'. J. El'i{ll.IIIi(}l.
1979; 109:709-718.
4. MEDIDAS DEL EFECTO

Los epidemiólogos usan el térm~no efecto en dos sentidos. En un sentido


general, cualquier ejemplo de enfermedad puede ser el efecto de una
causa dada. En otro más particular y cuantitativo, un efecto es la
diferencia en ocurrencia de enfermedad entre dos grupos de personas
] que difieren con respecto a una característica causal; dicha caracteristica
suele ser llamada una e.\posición.
Los efectos absolu/os son diferencias en tasas de incidencia" inciden-
cia acumulada o prevalencia. Los efectos rela/iL'o.\' implican razones entre
estas medidas. U na proporción atribuible es la proporción de una pobla-
ción enferma, para la cual la exposición es una de las causas componen-
1 tes de la causa suficiente que produjo la enfermedad.

EFECTO ABSOLUTO

Supongamos. que todas las causas suficientes de una enfermedad en


particular fueran divididas en dos grupos, las que contuvieran una
causa específica y las que no. La situación podría ser resumida por
medío del siguiente diagrama (Fig. 4.1 ).
U y U' representan colecciones diferentes de factores causalcs. Nólese
que la enfermedad puede ocurrir con o sin E, que es la exposición de
interés. El efecto absoluto de dicha exposíción E corresponde biológica-
mente a la exístencia de causas suficientes que requieran a E como
componente. Epidemiológicamente, el efecto de E puede ser valorado
midiendo la tasa de incídencia de las causas suficientes que contienen a
dicha E. La gente que posee la exposición puede, no obstante, desarro-
llar la enfermedad a partir de un mecanismo que no la incluya, por lo
que no basta con medir la tasa de incidencía de la enfermedad entre los
expuestos. La tasa de incidencia entre los expuestos es reflejo de la
incidencia de los dos grupos de causas suficientes representados en el
diagrama. La tasa de íncidencia de las causas suficientes que contienen E
43

-
44 EPIDEMIOLOGIA "~ODERNA

.(

Fip,.4.1. Do.1" lipo.1" dc Cf1lI.I"G .\"lif/cicnlc pora 1111{1l"!f<'rllICdad.

-] I
debe calcularse restando de la tasa de incidencia la tasa de las causas ,

suficientes que carecen de E. Dicha tasa puede ser medida en una


población que se parezca a la expuesta.' pero que carezca de la exposi- -I ¡

ción. Así pues. si I 1 es la tasa de incidencia de la enfermedad en una


población expuesta, I I -lo representa la tasa de incidencia de esa
enfermedad que tiene la exposición como causa componente. El efecto
absoluto es la diferencia entre la tasa de incidencia de una pohlaci(Jn
expuesta )' la de una población no expuesta.
A esta medida se la conoce con frecuenci~ directamente como {1(~,-
rencia de (G.~a.~.Entre los sinónimos. se incluye el riesgo atribuible (Wal-
ter. 1976). que deriva de una medida con relación cercana. la {1((('r{'nci{/
(1(, ri('.~f!o. a veces también usada como sinónimo de diferencia de tas:ls.
..
E 11 rigor. sin embargo, la diferencia de riesgo dcberia denotar llnica- J
mente una diferencia entre riesgos o incidencias acumuladas, )' no entre
tasas de incidencia. Por tanto. mientras l.1 diferencia de tasas posee un
rango que va del menos infinito .11más infinito ). la misma dimension.1Ii- J
dad que tenga la tasa de que se trate (si es de incidencia, tiempo- I ).
la diferencia de riesgos tiene valores entre -] y + 1 )' es adimen-
sional.
El término riesgo Glribuihle carece de justificación, si no existe un.1
relación causa-efecto entre la exposición )' la enfermedad. Si la exposi-
ción provoca un cambio en la incidencia o en el riesgo, esa diferencia
entre riesgos o tasas que se observa puede ser ciertamente atribuible a la
exposición, pero muchos científicos podrian poner pegas. con razón. a la
innecesaria implicación causal inherente en el término riesgo atribuible
(o tasa atribuible), En la medida en que una diferencia entre tasas ~ea
realmente atribuible a la exposición. sin embargo, la medida es útil p.1ra
estimar la magnitud del problema de salud pllblic(l que dicha exposición
representa. En este contexto vale la pena señ.1lar que el erecto absoluto
no se ve afectado por cambios en la tasa de incidencia basal de un¡1
enfermedad.
MEDIDAS DEL EFECTO 45

EFECTO RELATIVO

El efecto relativo está basado en la razón entre el erecto absoluta y una


tasa basal. Medidas análogas son usadas de manera rutinaria siempre
que se mide un cambio o un crecimiento. Por ejemplo, si la inversión de
una suma de dinero ha producido una ganancia de 1.000 dólarcs cn un
año, el incremento absoluto del valor no revela lo e[ectiva que fue la
inversión. Si la inversión inicial fue de 5.000 dólares, que crecieron a
6.000 en un año, lo que hacemos para juzgarla es relacionar la ganancia,
6.000 -5.000 dólares, con la cantidad inicial. Es decir, cogemos los
1.000 ganados y los dividimos por los 5.000 del capital inicial, con lo que
obtenemos un 20 por 100 como ganancia relativa, en comparación con
la absoluta.
De igual manera, en epidemiología evaluamos el efecto relativo to-
mando el efecto absoluto o diferencia de tasas, y dividiéndolo por un
valor de referencia, que habitualmente es la tasa entre los no-expuestos.
Así, si lo es la tasa de incidencia entre los no-expuestos e II la tasa de
incidencia entre las personas expuestas, el efecto absoluto es:

] II lo

y el efecto relativo es

Ii -lo -~ -I
[4.1]
-¡;- -10

1 Comparada con el erecto absoluto. la medida del erecto relativo es


con frecuencia un indicador más claro de la ruerza de una asociación o,
bajo las circunstancias adecuadas. del rol causal (Cornfield y ~aenszel.
1960). En consecuencia, es la medida que se usa habitualmente en inves-
tigaciÓn etiológica. Tiene dos componentes, como se ha dicho. la razón
entre las tasas de incidencia (/1¡10) y la constante (-I). En su forma
tipica, la constante es omitida en la medida: los epidemiólogos se refieren
usualmente sólo al componente cociente de la misma: se la c.onoce como
ra=ól1 de ( las) fa.\"as de il1Cill('11cia o razól1 ll(' rie.\",go.que son términos
puramente descriptivos. y también como rie.\",'l;nr('larit~(). fa.\"a relarira. o
simplemente ra:óll de rasas. Si se omite la constante, existe una transla-
ción en la escala. En ese caso, cuando no hay erecto. / 1 = lo y la medida
completa da al ser calculada l -l = 0. en tanto el componente de
razón de tasas es la unidad. Es importante recordar esta translación de
escalas al interpretar medidas de razón de tasas. Por ejemplo. si una
exposición tiene una razón de tasas de 3, y una segunda exposición tiene
una razón de tasas de 2. el erecto de esta segunda exposición es sólo la
mitad de grande que el de la primera, debido a que el valor «basal», el
valor que corresponde a la ausencia de erecto, es, de entrada, la unidad
para la medida de la razón de tasas.
46 EPIDEMIOLOGIA MODERNA

Aunque los epidemiólogos, repito. h~\hjtualmenle usan únicamenle la


medida de razón entre las tasas. omitiendo el -1. a veces no lo hacen.
Pueden hacer referencia, por ejempl0. a un «30 por 100 de riesgo mayor
entre los expuestos»; esto quiere decir que la razón entre J I e J() es 1.3.
pero sale ese 30 por 100 al restarle 1. A veces se conoce a la med ida
completa (11 -lo)/lo como ('.'(C('.\"(1
d(' riC'.'il!n r('/alirln. para distinguirlo de
11/lo (Cole }. MacMahon, 1971 ).
Puesto que el cálculo de un efecto relativo significa dividir una t~lsa
por otra, la medida no tiene unidades. Su valor \'a de -l a + 0:;,.o desde
0 a 00 si se omite de la medida la constante.
El valor del riesgo es dependiente del tiempo. De modo similar. el
valor de la razón entre dos riesgos o dos incidencias acumuladas depen-
de del período de tiempo sobre el que se computen dichos riesgos o
dichas incidencías acumuladas. Para un periodo de tiempo largo, el 1
riesgo o la incidencia acumulada se aproximarán a la unidad. lo mismo
que la razón entre dos riesgos, que también tenderá a la unidad. sin que
importe cuáles fueran los valores de las tasas de incidencia subyacentes.
(Se trata de una manifestación epidemiológica del aforismo: «Al final.
nos vamos a morir todos.» )
Para un periodo de tiempo corto. el riesgo y la incidcncia acumu-
lada son aproximadamente iguales al producto de la tasa de incidencia
por el tiempo, con lo que la razón de dos riesgos o do~ incidencias
acumuladas es aproximadamente igual a la razón de las dos tasas de
incidencia subyacentes. La aproximación de la razón de incidencias
acumuladas a la razón de tasas de incidencia e.c;me.ior para incidencias
acumuladas más pequeñas, o equivalentemente. intervalos de ticmpo
más cortos, aproximándose a la igualdad conforme el intervalo de ticm-
po se aproxima a 0. Aunque tanto el riesgo como la incidencia acumula-
da se aproximarán a 0 conforme el intervalo de tiempo se vaya haciendo
cada vez más pequeño, la razón entre esa.c;dos medidas en disminución
se acerca al valor límite no-cero de la razón entre las tasas de incidencia.
Estas relaciones pueden sumarizarse simbólicamente de la siguiente ma-
nera:

IA = 1 -e-//}./ -+ 1 conforme !lr -+ 0::;

~-+1 conforme ~1 -+ O)
lAo

lA ~ lL\t --+ O conforme 6[ -+ O

lA1 11
-+- conforme .1[ -+ o
lAo .10

A diferencia del efecto absoluto, la unidad de mangitud del relativo


dependerá de la que tenga la tasa de incidencia basal. Esa dependencia
es una de las mayores dificultades a la hora de interpretar medidas
relativas, porque el mismo efecto absoluto en dos poblaciones puede
MEDIDAS DEL EFECTO

corresponder a efectos relativos muy distintos (Pcacock. 1971) y al revés.


los mismos efectos relativos para dos poblaciones pueden corresponder
a efectos absolutos también muy diferentes.

PROPORClON í\TRIBUIBLE

Para obtener el efecto relativo, se dividía el efecto absoluto entre 1.1 t.1sa
de los no-expuestos, con lo que se medí.1 el incremento absoluto de
ocurrencia de la enfermedad en múltiplos de la tasa de ocurrencia en
ausencia de exposición- Si se divide el efecto absoluto entre la tasa de
ocurrencia de los expuestos, en vez de entre la de los no-expuestos, el
resultado que se obtiene es una medición de la proporción de enferme-
dad que se da en los expuestos «relacionada coro> la exposición, la prn-
porción alrib,lihle. Se ha llamado también a esta medida ji-acción etiolñgi-

1 ca (Miettinen.
1971 ).
1974) y porcentaje del rie.~go atrib,lihle (Cole y MacMahon.

La proporción atribuible (PA) para la pobl~lción expuesta se define


como
j
I RT- 1 [4.2]
PAE: = ~ =
Ii RT RT

donde I, es la incidencia entre los expuestos~ /0 es la incidencia entre los


no-expuestos, y RT es la razón de tasas, 1,/ /0. Puede ser interpretada
como la proporción de casos expuestos para los cuales la enfermedad es
atribuible a la exposición. Lleva implícito'el sentido de qué cantidad de
la enfermedad en una población expuesta puede ser prevenida bloquean-
do el efecto de la exposición o eliminando ésta.
La proporción de todos los casos que ocurren en una población
mezclada de individuos expuestos y no-expuestos y que es atribuib.le a la
exposición, puede determinarse como

Ir -lo
PAT =

Ir

donde JT es la tasa de incidencia total en la población combinada de


I
i individuos expuestos y no-expuestos y Po representa la proporción que
¡
, está expuesta. Dividiendo por Polo el numerador y el denominador de la
f.
, expresión anterior, tenemos

¡
RT- 1
1.
~ PAr
RT + 1/ Po -1
t

r Puesto que la razón de tasas de incidencia puede estimarse mediante


f la razón de ventaja de la exposición P1{1 -Po}/[Po{l -Pl}]' donde P1
48 EPIDEMIOLOGIA MODERNA

es la proporción de casos que está expuesta (véase (;apítulo 6), podemos


escribir también la expresión anterior como (Miettinen, 1974):

(RT I)P¡ = PAr. ?1


PAr
RT
Si una exposición es preveniblc. de forma que 11 < 10' el efecto
absoluto es negativo y la razón de tasas es menor de 1.0. La proporción
atribuible es indefinida para los factores preventivos, pero una medida
análoga, la .fracción (o proporción) prevenida fue definida para loS pre-
ventivos por Miettinen (1974) como:

RT

Es~a fracción prevenida puede ser interpretada como la proporción


de los casos potenciales (en ausencia de exposición) que fue prevenida
por la exposición.
J
REFERENCIAS

Cole, P., and MacMahon, B. Attribut:lblc ri~k rercenl in casc-conlroJ sludic$.


Br. J. Prev. Soc. Med. 1971; 25:242-244.
Cornfield, J., and Haenszel, ~r. Some aSpeCl$ of rctrosrcctjve $ludjes. J. Chr(m.
Dis. 1960: 11:523-534.
Miettinen, O. S. Proportion of disca$e cau~cd or rrevenled hy a gjven exro~urc.
trait or intervention. Am. J. Epidemiol. 1974; 99:3:?5-332.
Peacock. P. B. The non-comparabilit)' or relatjvc ri$k$ from diffcrcnl sludjcs. J
Biomelric 1971; 27:903-907.
Waller. S. D. The estimation and interrretation of attribulablc risk in hcallh
research. Biometrics 1976: 3:?:8:?9-849.
j

J
J
;'
1 {
, I

J
-
I r-
"
-
~. ESTANDARIZACION DE T.~SAS

Las medidas epidemiológicas de! efecto descritas en el capítulo anterior


significan todas la comparación de medidas de incidencia, riesgo o pre-
valencia. La comparación de tasas usando medídas del efecto es concep-
tualmente dírecta, pero en la práctica se ve sujeta a una variedad de
distorsiones que, en la medida de lo posible, deben ser evitadas. La
estandarización de las tasas es un método elemental y tradicional de
reducir esa distorsión cuando se compara. Las cuestiones subyacentes
tras ella serán definidas y discutidas en detalle en capítulos subsiguien-
tes, pero la estandarización es una herramienta de comparación de tasas
tan básica que resulta apropíado introducirla sin dilación ahora, a conti-
nuación de las medidas del efecto.

1 EL PRINCIPIO DE ESTANDARIZACION

Supongamos que queremos comparar la mortalidad de Suecia con la de


Panamá en 1962. Suecia, con una población de 7.496.000 personas tuvo
ese año 73.555 muertes, con una tasa de mortalidad de 0,0098 año -1, en
tanto en Panamá, con 1.075.000 habitantes hubo 7.871 muertes y una
tasa de mortalidad de 0,0073 año-l. ApareriteI1lente. la tasa de mortali-
dad sueca fue un tercio mayor que la panameña. Antes de concluir que
la vida en Suecia en 1962 tenia considerablemente más riesgo que la vida
en Panamá, deberiamos examinar las tasas de mortalidad en relación
con la edad. Para lo que nos interesa, son suficientes los siguientes datos
de mortalidad especifica por edades (Tabla 5.1).
Para la gente por debajo de.los sesenta años, la tasa de mortalidad
era mayor en Panamá. Para los que tenian sesenta años o más edad, era
un 10 por 100 mayor en Suecia que en Panamá. Las comparaciones
especificas por edades, que muestran menos mortalidad en Suecia hasta
los sesenta ,años tras lo cual la mortalidad en los dos países es similar,
producen una impresión extremadamente diferente de cuando se compa-
ran las mortalidades globales sin tener en cuenta la edad. Es evidente, a
49
50 EPIDEMIOLOGIA MODERNA

Tabla 5.1. Mortalidad en Suecia y Ponomci ("1/ 196~. por ('dadC'5

EDAD
0-29 30-59 60+

Población
Suecia ......... 3. 145.000 3.057.000 .294.000
Panamá ....... 741.000 275.000 59.000
Muertes
Suecia ....... ..
Panamá .......
3.523
3.904
10.928
\.421
59.104
2.456
J
Tasa de mortalidad
Suecia ......... 0.0011 año - 1 0.0036 año - I 0.0457 año - I
Panamá . ....... 0.0053 año - I 0.0052 año - 1 0,04 16 año - I

partir de los datos de la tabla, que las distribuciones de edad de Suecia y


1
Panamá son completamente diferentes; la experiencia de mortalidad de
los panameños en 1962 estuvo dominada por un 69 por 100 de pobla-
ción por debajo de los treinta años, mientras en Suecia sólo el 42 por 100
de la población tenía menos de esa edad. La menor tasa de mortalidad
de Panamá puede ser explicada por el hecho de que los panameños eran
más jóvenes que los suecos, y la gente más joven tiende ti tener una tasa
de mortalidad inferior a la de la gente más vieja . .
Cuando se divide el número total de casos en una población por el
total de la experiencia persona-tiempo, la tasa de incidencia resultante es
conocida como tasa bnlla o cruda. Una tasa cruda mide la experiencia
real de una población. Como vimos en el ejemplo anterior. la compara-
ción entre tasas crudas puede inducir a engaño, porque podría estar
distorsionada por diferencias en otros factores que pueden afectar al
resultado. como es la edad. Una comparación entre las tasas de mortali-
dad crudas de Suecia y Panamá sugeria que la mortalidad era un 34 por
100 mayor en el primer país. pero luego supimos que esta comparación
está innuenciada por el hecho de que los suecos eran más viejos que los
panameños ~ La estalldarización es una forma de eliminar la distorsión
introducida por una diferente distribución de las edades, pues.
El principio que subyace tras la estandarización es el de calcular
tasas crudas hipotéticas para cada grupo de la comparación. usando una
distribución artificial idéntica del factor en función del cual debe estan-
darizarse; esa distribución artificial es conocida como el estándar. Para
comparar la mortalidad de Suecia y Panamá en 1962, estandarizada por
edades, debemos escoger un estándar de edad; podría ser la distribución
por edades de una de las poblaciones que se comparan (o sea, la de
Suecia o la de Panamá), o bien la distribución por edades combinada o
cualquier otra distribución por edades que fuese de interés potencial. La
elección de dicho estándar debe, por lo general, estar guiada por la meta
:sTANDARIZACIDN DE TASAS 51

de la inferencia. Por ejemplo. cuando se compara un único grupo ex-


puesto a un agente específico con otro no-expuesto. la distríbución del
expue~-to es con frecuenc¡a la elección más razonable como estándar.
porque el erecto de interés ocurre entre los expuestos. .
La tasa estandarizada se define como una media ponderada de
las tasas específicas por categoría. con los pesos sacados de la distribu-
ción estándar. Supongamos que queremos estandarizar las tasas de mor-
talídad de Suecia y Panamil en función de la siguiente distribución por
edad estándar:
Peso
Edad (porc{'ntaje) ¡~
0-29 0.35 l1
í'f
:'
30-59 0.35
~
60+ 0.30 ..
~
.,...
Debemos multiplicar cada uno de los pesos anteriores por la tasa de ¡.;.
mortalidad que tiene su correspondiente categoria de edad; la suma de :..
.',
.
las categorías de edad dará la tasa estandarizada. Para Suecia tendría- ~.
mos
Peso
Edad Tasa (i(! 111orralidad (porcentaje) Producto
0,00039 año- 1
0-29 0,0011 año-\ 0,35
0,0036 año- 1 0,00126 año -1
30-59 0.35 ~¿
0,0457 año- \ 0,01371 año- 1
60+ 0,30
0,01536 año-1
La tasa de mortalidad estandarizada por edades para Suecia, estandari-
zada sobre la distribución por edades del cuadro anterior, es 0,01536
año- I. ¿Posee esta tasa de mortalidad alguna interpretabilidad directa?
Podría conceptualizársela como la tasa de mortalidad global que habria
tenido Suecia si la distribución por edades de los suecos hubiese sido no
la que realmente tenian en 1962, sino la distribución del estándar. Puesto
que dicha distribución estándar está más marcadamente desviada hacia
la categoria de mayor edad que la población real, la tasa de mortalidad
estandarizada es mayor que la cruda. La tasa estandarizada es el valor
hipotético que tendría la cruda si la distribución por edades hubiese sido
la del estándar .
Al estudiar las tasas de mortalidad específicas por edades de Panamá
en 1962 de acuerdo al mismo estándar de edades, obtenemos los siguien-
tes resultados:
Pe.'iO
Edad Tasa de 111ortalidad (porcentaje) ProdLIcto
~;
0-29 0,0053 año-1 0,35 0,00186 año-1
i

30-59 0,0052año-1 0,35 0,00182año-1 ~

60 + 0,0416 año- 1 0,30 0,01248 año -1


0,01616 año- 1 f

i;

i
¡
52 EPIDEMIOLOGIA MODERNA

Al comparar las tasas estandarizada~ se obser\'a una diferencia de


mortalidad estandarizada de 0,0008 año- J a favor de los suecos, o, po-
niéndolo en términos relativos, diremo~ que los panameños tienen una
mortalidad estandarizada que es un 5 por 100 mayor (la razón de tasas
estandarizada es 1,05).
La elección del estándar puede afectar a la comparación. Si lo.c;dalos
de mortalidad se estandarizan de acuerdo con la distribución por edades
de Panamá, los pesos serían:

Pe,\,o

Edad ( pnrcel1[a:ie )

0-29 0.69

30-59 0.26

60+ 0.05

Aplicando este estándar, las tasas estandarizadas serían 0.0040


año- l para Suecia y 0,0073 año- l para Panamá. Ahora la díferencia
entre tasas estandarizadas es de 0,0033 año-1 en favor de los suecos. o,
lo que es lo mismo, un 82 por 100 de mayor mortalídad para los
J
panameños (la razón de tasas estandarizadas es 1,82). A diferencía del
estándar previo, que ponia casí igual énfasis en las díferentes categorías
de edades, la distribución por edades de los panameños está fuertemente
descompensada hacia la categoría de edad más .joven. precísamente
aquélla en la que los suecos tienen consíderablemente mcjores resultados
que los panameños. Esta' diferencia se refleja en la comparación de las ]
tasas de mortalidad estandarizadas.
Debe hacerse notar que cuando el estándar de edad es la distribucíón
de edad de Panamá, la tasa estandarizada para este país es la misma que
su tasa cruda. Como también lo es una tasa estandarizada, la tasa cruda
J
es una media ponderada de las tasas específicas por categorías, con los
pesos iguales a la distríbución por edades de la poblacíón real.
Examinemos la idea más de cerca. La fórmula de una tasa estandari-
zada, TE (SR en los textos en inglés) es:

Lpi~
TE
}::;Pi
]
donde 1; son las tasas específicas por categoría en la categoría i, )' p; son
los pesos para la categoría i, derivados del estándar. Al dividirlo por
:J
L p;, cualquier grupo de pesos, {p }, se convierte en un grupo de propor-

ciones que tienden a sumar la unidad. Si se escogen los pesos de forma
que su suma sea uno, como en el ejemplo anterior. no es necesario
incluir ¿:p; como divisor de la fórmula porque eso sería divídir por la
unidad. Cada 1; tiene un numerador, el número de casos, y un denomi-
nador, que es típicamente una cantidad de experienciapersona-ticmpo.

-j
EsTANDARlZACION DE TASAS 53

Llamemos al numerador de ~ .\1 y al denominador ni" La tasa estandari-


zada es calculada entonces como
~ I'.
L Pi .:-:

n.
TE = - I

Supongamos ahora que estamos estandarizando con respecto a la


distribución de la población real. En ese caso. el estándar, que es el
conjunto de los pesos. {Pi}, es idéntico a la distribución en la población
real de la experiencia persona-tiempo, que es el conjunto de denomina-
dores {11i}. Si Pi = ni para todos los valores de i, podemos escribir la
fórmula como

L /1. .~
I

TE = -
Ilj -.1
-~
L \'.
= tasa cruda

Por tanto, podemos confirmar la validez de la primitiva aserción de


j que una tasa estandarizada puede ser interpretada como la tasa cruda
hipotética, si la pobl~\ción tuviese la (jistribución del estándar; si el
estándar usado es la distribución real, la tasa cruda «hipotética» es la
tasa cruda real.

ESTANDARIZACION «INDIRECTA» VERSUS «DIRECTA»


-1
La ~efinición dada de estandarización en la sección precedente ha sido
calificada durante mucho tiempo como estandarización «directa», para
distinguirla de otros abordajes alternativos, el más popular de los cuales
ha sido conocido como estandarización «indirecta» (Wolfenden, .1923).
En tanto la «directa» es un proceso que pondera un grupo de tasas de
acuerdo con una distribución estándar, la estandarización «indirecta» se
supone que es un proceso diferente, en el que el estándar, en lugar de
ap9~t~r la distribución ponderada, proporciona un grupo estándar de
tasas, que se ponderan luego según la distribución de la población bajo
estudio. Este proceso. por si sólo, no puede caracterizar ninguna expe-
riencia de enfermedad en la población que se está estudiando, porque
hasta este momento no contiene información alguna de tal ocurrencia de
enfermedad en la población estudio. El proceso es usado, por lo tanto,
para generar una tasa «esperada» o un valor esperado de la tasa cruda,
o el número total de casos en la población. La comparación entre la
población estudio y la estándar es conocida generalmente como ra::óll (le
Inorbilidad ( o mortalidad} estandarizada, o, simplemente, como RME
(en los textos en inglés, SMR). El rasgo distintivo por excelencia de una
RME es ser una razón entre un número «observado» de casos y un
número esperado.
54 EPIDEMIOLOGIA MODERNA

Refirámosnos, por conveniencia, a la pohlación estudio como «cx-


puestos». El número observado es el número total de casos en esta
población expuesta. El esperado se obtiene multiplicando las tasas por
categorias específicas de la población n(\-expucstí1 por los denominad(\-
res de la población expuesta en cada categoria. Si la tasa de 10-" cxpue-,,-
tos en la categoria i es Tli' con un numerador )'1 i y un denominador 11(;. 1
y la tasa de los no-expuestos en la categorí('. i es T o;. con un numcrador
.)'Oi )' un denominador 1I0i. la RM E se obtiene de I~: siguiente manera:
1
RME

Esto es equivalente a hallar la razón entre la tasa cruda en la robl~lción


expuesta y la tasa estandarizada «indirectamente» o tasa esperada: la
estandarización pondera las tasas por categorias específicas de la pobla- (
ción no-expuesta en función de los pesos de las categorías correspon- ] 1
dientes de la población expuesta: I

{
L )'1 i

'] ~
Lnli
RME \
}'Oi

Lnli.~

LnJi

Esta fórmula es idélltica a la anterior, excepto en que tanto el numera-


dor como el denominador de la RME han sido divididos por 2. /11;.
Escrita de esta forma, se ve claramente que la RME es la razón entre dos J f'
tasas estandarizadas, que han sido estandarizadas en función de la distri-
bución de los expuestos. Su numerador es la tasa cruda de la población
expuesta, y el denominador es una media ponderada de las tasas especí- 1
ricas por categoría de la población no-expuesta. ponderada en función
de la distribución de la población expllesta. Así pues, ambos grupos de
tasas específicas por categoría en las poblaciones expuesta y no-expuesta
se ponderan en función de la distribución de la población expuesta.
No existe nada en este proceso de estandarización que garantice una
distinción metodológica respecto de la estandarización descrita previa- J
mente. La llamada «estandarización indirecta» e$, como la llamada
«estandarización directa», simplemente el proceso de obtener una media
ponderada de tasas específicas por categoría. En una RME, los pesos
para hallar las medias de las tasas siempre se deri\'an de la población
expuesta, el grupo que da pie a los casos observados, con lo que el
estándar es siempre la población expuesta. Pero existe un sólo concepto,
unificado, de estandarización, a pesar del hecho de que se enseñen dos
diferentes «métodos» para llevar a cabo el proceso en la práctica.
ESTANDARlZACION DE TASAS 55

Por desgracia. hav un malentendido bastante comlln en relación con


la estandarización indirecta por eJ que se entiende que el estándar es el
grupo no expuesto, quien proporcionaria un conjunto de tasas est{lndar.
Esta falsa concepción ha sido la fuente de un error melodoló"gico fre-
cuente: la comparación de RMEs con est{lndares diferenles. Suponga-
mos que los obreros de una fábrica son clasificados en dos grados de
exposición a un agente tóxico potencial, según la parte de la planta en
que trabajen. Si se evalúa la mortalidad utilizando RMEs con tasas de
no-expuestos sacadas de datos de Ja población general, como suele
hacerse muchas veces, la valoración incorrecta de esas RMEs generaría
la creencia de que la «razón de mortalid:.ld cslandarizada» p:.lra cad:.l
tipo de exposición se c:.llculó en función del mismo estándar. porque
dicho estándar. bajo esta concepción errónea. se entiende que es la
población general que aporta las tasas utilizadas para calcular el nllmero
de esperados para cada RME. De hecho. sin emb~lrgo. ~lunque cad~1
RME tiene el mismo grupo de no-expuestos, cada una está estand:.lriza.
da en función de un grupo dístinto de obreros. Las dos. ciertamente,
usan estándares díferentes; por lo tanto, no son comparables entre sí y
no deberían ser comparadas para evaluar el efecto relativo de las dos
exposiciones en cuestión. Esto no quiere decir que tal evaluación no
deba ser hecha; puede llevársela ,1 cabo f{lcilmente utilizando un están-
dar común para los tres grupos de tasas implicadas, la población general
1 y los dos grupos expuestos.
Consideremos un ejemplo. Supongamos que tenemos dos categorías
de edad, joven y viejo, y las tasas que se dan en la tabla 5.2.
1 Las tasas para las exposiciones 1 y 2 son idénticas en cada categoria
de edad; para la gente joven, la tasa es díez veces la de la población
general (no expuesta) y para la vieja, dos veces.
En primer lugar, estandaricemos adecuadamente todas las tasas en
función de la distribución por edad de la población general. Para la

Tabla 5.2. Ta.\"a.\" (le incillencia /¡ipotética.\". por ('dade.\". para (lo.\" .'Srnpo.\" lle
e.\"po.\"icióll )' una pohlacióll ,'{eneral

Población
CJtegoria de edad Exposición E.xposición :.
general

Jóvenes

Casos.
Persona-años ... 50 50 5

100.000 I( ).000 I. 000


0,0005 año- I
Viejos
Incidencia. 0,00: i año-l 0.005 aña-l

Casos.
Persona-años ... 400 4 40
200.000 I. 000 10.000
0.002 año- 1 0,004 año -
Incidencia. 0,004 año-1
56 EPIDEMIOLOGIA MODERNA

propia población general, ello da una tasa cruda de 450/(300.000 per.c;o-


na-años) = 0,0015 año-1. Para la exposición 1 tenemos

1
y para la exposición 2. idéntico resultado. porque las tasas especificas
por categoría son idénticas a la de la exposición 1. La razón en tre las
tasas estandarizadas, que se conoce como ra:ón tic ta.,"o,,"c,,"tandariza(I((,v
(RTE, SRR para los texto$ en inglés) para la exposición I en relación con
la población general es:
o ,004 "-1 ano
--I
RTE¡ 0.0015 año- i 2.87

y para la RTE2 se obtiene el mismo resultado. Al estandarizar sobre un


estándar común, las razones de tasas estandarizadas para este ejemplo
deben ser iguales, porque las tasas específicas por categoría de las pobla-
ciones expuestas a los factores 1 y 2 son idénticas.
Examinemos ahora qué sucede cuando se calculan la~ RMEs para
las exposiciones 1 y 2. Para la 1, la RME se obtiene a partir de

Para la exposición 2, la RME es

observados 5 + 40
RME2 =
j

45
-
2.20
-0,5 + 20

Las dos RMEs son drásticamente dircrcntes. no porque el erecto de ]


la exposición I sea sustancialmente mayor que el erecto de la exposición
2 (los erectos son iguales), sino porque la población sometida a 1 es. en
su mayoría, joven, y la sometida a 2, mayoritariamente vieja. Entre la
gente joven, el erecto relativo es mucho más grande y, en consecuencia,
I
la RME1 es mucho mayor que la RME2. La única razón para la
diferencia existente entre las dos RMEs es la diferente distribución por
edades de las dos poblaciones expuestas. Aunque para estandarizar por

~
ESTANDARlZACION DE TASAS 57

edad se ha empleado un proceso de estandarización, dicho proceso


incluyó aplicar un estándar de edad diferente a cada grupo expuesto. a
saber, la distribución de edad de la propia población expues.ta. Este
ejemplo pone de manifiesto el peligro de la concepción equivocada de
que, con la estandarización «indirecta». el grupo que aporta la tasa a
partir de la cual se generan los números esperados es el cstándar. Según
tal concepción, uno podría creer falsamente que las tasas en ambas
poblaciones somelidas a las exposiciones 1 y 2 han sido estandarizadas
según edad «<indirectamente») usando un estándar común (la población
general) y que. por lanto, RME1 y RME2 son comparables. Para evitar
este error, es importante darse clara cuenta de que existe un único
concepto de estandarización que corresponde a la que ha sido descrita
como «directa». El cálculo de las RM Es no constituye un abordaje
distinto -es simplemente el mismo proceso, usando como estándar la
población expuesta de la RME-. Comparar entre sí RMEs viene a ser
lo mísmo que comparar medidas con unidades distintas y, por lo tanto,
carece de validez. íncluso si en la computación de tales RMEs se usa el
mismo grupo de tasas en los no-expuestos. De lo que se trata simple-
mente es de usar un estándar común y obtener razones de tasas estanda-
rizadas que puedan ser comparadas de forma válida.
Puesto que muchos estudios epidemiológicos. especialmente los que
tratan acerca de exposiciones ocupacionales. presentan comparaciones
entre RMEs, quizá pueda parecer sorprendente que la invalidez de tales
comparaciones haya sido bien conocida durante décadas. Hace más de
sesenta años. Wolfenden (1923) señalaba que «aunque en la mayoría de
los casos, el método indirecto proporcionará una aproximación cercana...,
no obstante. debería sustituir al método directo -especialmente en los
casos importantes- sólo tras el debido examen». Una década después,
Yule (1934) adoptaba una posición más firme, declarando que el método
«indirecto». que él prefería llamar el «método de cambio de base» (en
contraste con el método «directo», al que se refería como el «método de
base fija»), «no es plenamente un método de estandarización en inodo
alguno. sino que es sólo seguro para comparar simples parejas de pobla-
clones».
¡,Cómo ha permanecido tan popular un método no válido? Aparte de
por la inercia de la tradíción. que tras muchas décadas debe ejercer por
fuerza una gran influencia. existen dos razones citadas ambas por Yule.
en 1934. como ventajas del «método de cambio de base»: 1) La RME
puede ser calculada sin lener un conocimiento específico de los valores
que el factor de estandarizacíón tiene para los casos expuestos. Por
ejemplo. una RME estandarizada según edad no requiere conocimiento
de las edades de los casos expuestos. 2) La RME está sujeta usualmente
t
~
a menos error de azar que una razón de lasas estandarizadas. computa-
da usando un estándar que no sea el grupo expuesto. Esa mayor estabili- I
dad estadística deriva de la no dependencia de la RME respecto de las
tasas específicas por categoría en la población expuesta; para obtener la
RME, la tasa cruda de la población expuesta es comparada con la tasa
58 EPIDEMIOLOGIA MODERNA

estandarizada de la población de referencia. La primera ventaja raras


veces resulta importante, puesto que la información. si no se la tiene ya
en la mano, es fácilmente obtenible )', Jo que es peor, las cifras del
denominador de la población expuesta, que requieren un esfuerzo mu-
cho más grande para ser obtenidas. siguen siendo necesarias. La segunda
ventaja, una reducción en el error aleatorio, existe a expensas de un
posible sesgo. A pesar de estas pequeñas ventajas. Yule ponía énfasis en
que «la no comparabilidad, estrictamente hablando, de estas tasas debe
ser siempre llevada in mente». Excepto en las circunstancias en que las
ventajas de usar RMEs en una comparación de varios grupos compensa-
sen claramente las desventajas del estándar cambiado que resulta, debe
emplearse siempre un estándar común y deben evitarse comparaciones
entre las RMEs.

REFERENCIAS

Wolfenden, H. H. On the methods of comparing the mortalities of two or more


communities, and the standardization of death rates. J. R. Sla!. SOCo ]923;
86:399-41l.
Yule, G. U. On sorne points relating to vital statistics. more e~recially statistics
of occupational mortality. J. R. Sial. Soco 1934; 97: 1-84.
6. TIPOS DE ESTUDIO
EPIDEMIOLOGICO

El paradigma de proceso científico es la observación controlada que se


consigue a través de un experimento. En un sentido amplio, el experi~
mento científico es un conjunto de observaciones, conducidas bajo cir-
cunstancias controladas. en donde el hombre de ciencia manipula las
condiciones para averiguar el efecto que tal manipulación produce sobre
J el resultado. Algunos quizás ampliarían esta definición, e incluirian en la
misma las observaciones controladas sin realizar manipulación de sus
condiciones; según este criterio, las observaciones astronómicas durante
el eclipse solar de 1919, que confirmaron la teoria general de la relativi-
dad de Einstein, podrían ser consideradas como un experimento. No
obstante, la palabra e.\"perimento connota usualmente manipulación de
las condiciones. De forma muy amplia, dicha palabra se usa también
para describir cambios tentativos introducidos incluso en ausencia de
observación controlada, como podía ser el caso de los procedimientos
docentes «experimentales» que un profesor intentase.
El objetivo de la experimentación es la creación de conjuntos dupli-
cados de circunstancias en los que sólo varia un factor que sea relevante
en relación con el resultado, lo que hace posible observar el efecto de la
variación de tal factor. Para lograr este objetivo, se requiere la capacidad
de controlar todos los aspectos de importancia que pudieran afectar al
resultado sometido a estudio. En experimentos de ciencias físicas, se
puede conseguir el objetivo controlando la temperatura, la presión y el
campo electromagnético, o incluso un subgrupo de éstos. En las ciencias
biológicas, sin embargo, las cuestiones que afectan al resultado son a
menudo tan complejas y ocultas que no se las puede hacer uniformes.
Cuando se estudian las causas del cáncer, por ejemplo, resulta imposible
crear condiciones que diesen lugar invariablemente a un cáncer tras un
intervalo de tiempo fijo, ni siquiera si la población fuese un grupo de
ratones de laboratorio seleccionados genéticamente. Inevitablemente,
habrá lo que se llama «variación biológica», que se refiere a la variación
en el conjunto de condiciones que producen el efecto.
59
6. TIPOS DE ESTUDIO
EPIDEMIOLOGICO

El paradigma de proceso científico es la observación controlada que se


consigue a través de un experimento. En un sentido amplio, el experi~
mento científico es un conjunto de observaciones, conducidas bajo cir-
cunstancias controladas. en donde el hombre de ciencia manipula las
condiciones para averiguar el efecto que tal manipulación produce sobre
J el resultado. Algunos quizás ampliarían esta definición, e incluirian en la
misma las observaciones controladas sin realizar manipulación de sus
condiciones; según este criterio, las observaciones astronómicas durante
el eclipse solar de 1919, que confirmaron la teoria general de la relativi-
dad de Einstein, podrían ser consideradas como un experimento. No
obstante, la palabra e.\"perimento connota usualmente manipulación de
las condiciones. De forma muy amplia, dicha palabra se usa también
para describir cambios tentativos introducidos incluso en ausencia de
observación controlada, como podía ser el caso de los procedimientos
docentes «experimentales» que un profesor intentase.
El objetivo de la experimentación es la creación de conjuntos dupli-
cados de circunstancias en los que sólo varia un factor que sea relevante
en relación con el resultado, lo que hace posible observar el efecto de la
variación de tal factor. Para lograr este objetivo, se requiere la capacidad
de controlar todos los aspectos de importancia que pudieran afectar al
resultado sometido a estudio. En experimentos de ciencias físicas, se
puede conseguir el objetivo controlando la temperatura, la presión y el
campo electromagnético, o incluso un subgrupo de éstos. En las ciencias
biológicas, sin embargo, las cuestiones que afectan al resultado son a
menudo tan complejas y ocultas que no se las puede hacer uniformes.
Cuando se estudian las causas del cáncer, por ejemplo, resulta imposible
crear condiciones que diesen lugar invariablemente a un cáncer tras un
intervalo de tiempo fijo, ni siquiera si la población fuese un grupo de
ratones de laboratorio seleccionados genéticamente. Inevitablemente,
habrá lo que se llama «variación biológica», que se refiere a la variación
en el conjunto de condiciones que producen el efecto.
59
60 EPIDEMIOLOGI/, MODERNA

En experimentación biológica, pues. el objeti\'o de crear conjuntos


duplicados de circunstancias en los que sólo v.ariase un factor relevante
es irrealista (podría argumentarse que este ob.jetivo es igualmente irrca-
lista en las ciencias fisicas). En consecuencia. tal ob.jetivo se atcnúa
intentando crear circunstancias en las que el grado de variación de
factores extraños que afecten al resultado sea mantenido pequcño en
relación con la variación del factor sometido a estudio. Cuando el efecto
sigue a la causa bajo estudio tras un periodo de inducción iargo, las
fuentes de variación que podrían modificar el efecto son potenciaimente
.más numerosas y más diliciles de controlar.
Los distintos tipos de estudio epidemiológico tienen sus raices en los
conceptos de experimentación científica. Cuando los experimentos epi-
demiológicos son factibles, su diseño está guiado por e] principio de
reducir la variación debida a factores extraños frente a los factores en
estudio. Los experimentos epidemioJógicos incluyen ('/7.\"a.va,~ clíl/ícos (con
pacientes como sujetos), ensayo.\" dc can7po (con sujetos sanos) y ('/7,\"a.l'(I.\"
cnmunitaríos de íntervenciól7 (con la intervención realizada sobre grupos
de sujetos sanos). Cuando los experimentos no son factibles, se diseñan
estudios no-experimentales que simulen lo que podria haberse aprendido
si se hubiese llevado a cabo un experimento. Los estudios no-experi-
mentales incluyen estudios de seguímiento (en los cuales los sujetos son
seleccionados con referencia a su status de exposición), estudios de ca.\"ns-
controles (en los que los sujetos son seleccionados en referencia a su
.\"tatlls de enfermedad), estudios de seccíón troI7,\"l'er.\,aly de 111ortali(iad
proporciol/ol, que son una variedad de los estudios de casos y controles,
y estudios ecológícos, e.n los que la unidad de observación es un grupo de
gen te.

ESTUDI as EXPERIMENT ALES

En un experimento, aquellos que están expuestos al agente o causa


putativa lo están porque el investigador le~ ha asignado dicha exposi-
ción. Más aún, la asignación de la exposición debe ser parte del proto-
colo de estudio -es decir, debe estar intencionadamente hecha para
conseguir el objetivo científico del estudio-. Por ejemplo, supongamos
que un médico que está tratando el dolor de cabeza ha prescrito un~l
medicina de marca a sus pacientes ricos y un equivalente genérico a sus
pacientes pobres, porque la presumida mayor fiabilidad de la versión
patentada no compensaría, según su juicio, el mayor costo en que se
haría incurrir a las personas de medios modestos. Si ese médico se
dedicase posteriormente a llevar a cabo una investigación para evaluar
las dos medicaciones, no podría considerarse a sí mismo conduciendo un
experimento, a pesar del hecho de que como investigador había asigna-
I
do las exposiciones. Para llevar a cabo un experimento propiamente
..
dicho, debería haber asignado las drogas de acuerdo a un protocolo que
redujese la variación entre loS dos grupos con respecto a otras causas
TIPOS DE ESTUDIO EPIDEMIOLOGICO 61

potenciales de dolor de cabeza. En un experimento se pretende que !a


asignación de exposición ayude al estudio. en vez de al sujeto individual.
Puesto que lo que determina la asignación de categoria de exposición
son los objetivos del estudio y no las necesidades del sujeto. h;1y ciertas
restricciones éticas que limitan las circunstancias en que los experimen-
tos epidemiológicos son factibles a aquellas situaciones en que los intere-
ses del sujeto son tenidos en cuenta por el científico; específicamente.
debe haber una razonable seguridad en que esa persona no podría ser
tratada de otra mejor forma que según las posibilidades que le ofrece el
protocolo. Una limitación obvia es que las exposiciones asignadas a los
suje.tos deben quedar reducidas a factores potencialmente preventivos de
una enfermedad o de las consecuencias de una enfermedad. Esta limíta-
ción, sola, confina la mayor parte de la investigación etiológica a la
variedad no-experimental. Una segunda restricción impuesta es que las
alternativas de exposición deberán ser igualmente aceptables. a la luz del
conocimiento actual. La tercera consiste en que los sujetos admitidos al
estudio no deberán, por ese hecho, verse privados de alguna forma mejor
de tratamiento o medida preventiva no incluida en el estudio. Por
ejemplo, no es ético incluir una terapia con placebo en procesos para las
cuales existe ya un remedio o una medida preventiva aceptada. Además,
los sujetos deben ser plenamente informados de su participación en un
experimento y de las posibles consecuencias que se derivasen de ello.
Incluso con estas limitaciones, se llevan a cabo muchos experimentos
epidemiológicos. La mayoría caen dentro del {lrea especializada de los
ensayos clínicos, que son estudios epidemiológicos sobre tratamientos
1 diferentes para pacientes que ya padecen alguna enfermedad. (en.\"o.vose
usa como sinónimo de e.'(perimento). Los experimentos epidemiológicos
con factores de prevención primaria, que tienen como objetivo básico
impedir el comienzo de la enfermedad, son menos comunes; se les cono-
ce como ensayos de campo o bíen ensayos comunitarios de intervepcíón.

EnsQ)'os clínicos

Un ensayo clínico es un experimento en el que los sujetos son pacientes.


Lo que se persigue es evaluar uno o más tratamientos nuevos para una
enfermedad o proceso. Las exposiciones en un ensayo clínico no son
factores de prevención primaria. puesto que no impiden la ocurrencia de
la enfermedad inicial, sino que son preventivos respecto de las secuelas
de la misma. Por ejemplo, una dieta modificada tras un infarto de
~;
miocardio puede prevenir el reinfarto y la muerte subsiguiente. o agentes ;::
~
quimioterápicos pueden prevenir la recurrencia del cáncer. ~
~
"
Los sujetos de los ensayos clínicos deben ser diagnosticados como
poseedores de la enfermedad en cuestión y deben ser admitidos al estu- J
dio con la rapidez suficiente tras el diagnóstico como para permitir que
la asignación del tratamiento ocurra en un momento adecuado. Debe
excluirse a los sujetos cuya enfermedad ruese demasiado leve o demasia-
62 EPIDEMIOLOGIA MODERNA

do severa como para permitir la forma de tratamiento o tratamiento


alternativo que están siendo estudiados. La asignación de tratamiento
debe haber sido diseñada para minimizar la variación de factores extra-
ños que pudieran afectar a la comparación. Por ejemplo, si algunos
médicos que participasen en un estudio favoreciesen la nueva ter3pia. es
concebible que pudieran innuenciar la asigllación de sus pacien1cs o. de
entre éstos a los más seriamente afectados, al nuevo tratamienl(). Si los
pacientes más seriamente afectados tendiesen. con certeza, a r..~cibir eJ
nuevo tratamiento, se comprometeria eJ poder llevar a cabo UI1:1evalua-
ción válida del mismo. Para evitar este problema y otros coneclaclos con
él, es costumbre asignar los tratamientos en los ensayos clínicos de una
manera que promueva la comparabilídad entre los grupos de tratamien-
to con respecto a caracteristicas «básícas» y que sea además impredeci-
ble y escape al control del personal que está realizando el estudio. Es 1
casi universalmente aceptado que un esquema de asignación al azar
constituye la mejor manera de cumplír estos objetivos (Byar ('I al.. 1976:
Peto el al., 1976). La validez de un ensayo depende, en última instancía,
del grado hasta donde el proceso aleatorio consiga una identidad de
distribución de las caracteristicas básicas relevantes.
)
Ensayos d(' campo

Los ensayos de campo difieren de lo~ ensayos clínícos en que tratan con
sujetos que aún no han adquirido la enfermedad y n() s()n, por tanto.
pacientes. Mientras las complicaciones de una enfermedad dada pueden
ocurrir con alta probabilidad durante un tiempo relativamente corto, lo
típico es que el riesgo de que una enfermedad ocurra en gente que está
libre de ella sea pequeño. En consecuencia, los ensayos de campo requie-
ren, por lo general, un mayor número de sujetos que los ensayos clinicos I
)' son. por ello, más caros. Más aún. puesto que los sujetos no son
pacientes, quienes habitualmente acuden a un lugar central a que se les
trate, un ensayo de campo necesita típicamente visitar a los su.ietos a J
nivel de «campo» (en el traba.io. la casa o la escuela) o establecer centros
desde los que pueda ser llevado el estudio ). a los cuales se insta a los
sujetos a que informen. Estas características del diseño incrementan,
como es lógico, los costes.
Lo caro de los ensayos de campo limita su uso al estudio de factores
preventivos de enfermedades o bien extremadamente comunes. o extre-
madamente graves. Se llevaron a cabo algunos para determinar la efica-
cia del uso de grandes dosis de vitamina C en la prevención del resfriado
común (Karlowsky el al., 1975; Dykes )' Meier, 1975). La poliomielitis,
un padecimiento raro pero serio, constituyó una preocupación de salud
pública suficientemente grande como para garantizar lo que quizás haya
sido el mayor experimento formal con humanos que nunca se haya
intentado, el ensayo de la vacuna Salk, en el que se administró ésta o un I
placebo a más de 1.000.000 de escolares (Francis el al., 1955). Si el

J
53

desenlace en forma de enfermedad ocurre raras veces. es milS eliciente


estudiar sujetos que se piense están sometidos a un alto riesgo de pade-
cerla. Así, el ensayo de 1a vacuna contra la hepatitis B fue realizado con
una población de homosexuales de la ciudad de Nueva York. entre los
cuales la infección de la hepatitis B ocurre con mucha mayor frecuencia
de lo que es normal entre los neoyorquinos (Szmuness. 1980}. Un razo-
namiento similar se aplica frecuentemente a los ensayos clínicos. de los
que suelen excluirse a los pacientes con bajo riesgo de complicaciones.
Análogamente, se han llevando a cabo algunos ensayos clínicos sobre el
efecto de la reducción de los niveles de colesterol sérico sobre el riesgo de
infarto de miocardio con sujetos que ya habían experimentado un infar-
to previo, porque esos pacientes tienen un elevado riesgo de padecer un
segundo episodio (Leren. 1966: Detre y Shaw, 1974). Sería mucho más
costoso hacer un ensayo para estudiar el efecto del descenso del coleste-
rol sérico sobre una primera ocurrencia de infarto de miocardio. porque
habría que incluir muchos más sujetos para conseguir un número razo-
nable de los sucesos que se estudian. El ensayo de campo MRFIT
(Multiple Risk Factor Intervention Trial} fue un estudio acerca de algu-
nos factores de prevención primaria del infarto de miocardio, incluida la
dieta; pese a admitir únicamente individuos de llto riesgo y poner el
empeño en reducir el riesgo a través de varias intervenciones simultá-
neas, el estudio incluyó 12.866 sujetos y costó 115 millones de dólares
(Kolata, 1982).
Como en los ensayos clínicos, las exposiciones deben ser asignadas
en los ensayos de campo de una forma que facilite la comparabilidad
entre los grupos y elimine cualquier discreción a la hora de ubicar
.sujetos por parte de los investigadores. Un esquema de asignación al
azar es, de nuevo, la elección ideal, pero las dificultades de poner en
práctica un esquema asi en un ensayo de campo a gran escala pueden
sobrepasar a las ventajas. Por ejemplo, podría ser conveniente distribuir
las vacunas a grupos que recibieran una sola «tacada» de vacunación,
especialmente si el almacenamiento y transporte de las mismas es dificil.
Como esas elecciones pueden afectar seriamente a la interpretación de
los hallazgos experimentales, hay que sopesar cuidadosamente ventajas I,
y desventajas.
~
En.\"ayos COmllnitario.'i de intervención
I
El ensayo de intervención en la comunidad es una extensión del ensayo
de campo, que incluye una intervención sobre bases comunitarias am- I
plias. Conceptualmente, la distinción gira en torno a si la intervención
podría ser puesta en práctica separadamente para cada individuo, o no.
Mientras una vacuna se administra de uno en uno en la población, la
nuoración del agua, no: se administra a suministros de agua jndividua-
les, en lugar de a personas individuales. Por tanto, la nuoración del agua
no pudo ser estudiada con un ensayo de campo convencional. Por el

~
,

~
64 EPIDEMIOLOGIA MODERNA

contrario. fue evaluada mediante ensayos comunitarios de intervención,


en los que fueron seleccionaáas comunidades enteras }' la exposición se
asignó sobre bases también comunitarias. Otros e.iemplos de medidas'
preventivas a poner en práctica sobre bases amplias comunitarias po-
drian ser los programas de reanimación de emergencia de respuest,l
rápida ): programas educativos conáucidos mediante el uso de medios de
comunicación de masas. como el Proyecto dc prevención de las quema-
duras de Massachusetts (MacKay )' Rothman. 1982).
Algunas intervenciones se aplican a grupos de sujetos más pequeños.
mejor que a comunidades enteras. La intervención sobre la dieta se hace
más convenientemente por familia o por vivienda: un,l intervención
ambiental puede afectar a una oficina, planta o edificio residencial com-
pleto. Un equipamiento deportivo protector habría que asignarlo a un
equipo o una liga entera. Grupos de intervención pueden ser unidades
del ejército, aulas, ocupantes de un vehículo o cualquier otro grupo cuyos
miembros serían expuestos simultáneamente a la intervención. El funda-
mento científico de los experimentos de este tipo es idéntico al dc los
ensayos comunitarios de intervencíón; lo que separa a todos estos estu-
dios de los ensayos dc campo ordinarios es el hecho de que en ellos la
asignación individual de exposición es 0 no posible 0 no práctica. La
asignación aleatoria de la exposición a grupos de individuos puede ser
factible. pero cuanto m3yor sea el grupo en relación con el tamaño lotal
de la población en estudio. menos se consigue eso con la ¡lsignación al
I
azar. Si sólo están implicadas dos comunidades. un¡¡ de las cuales recibi-
rá la intervención y la otra no, como en el ensayo de nuoración del agua
Newburgh-Kingston, no puede importar ~i la comunidad que recibe el
núor es decidida al azar o no lo es; las diferencias en las características
base tendrán la misma magnitud cualquiera que sea el método de asig-
nación .~sólo estará afectada la dirección de la diferencia-. Cuanto
más se parezca a la asignación individualizada lo que permita el diseño
del estudio. más cercana a una distribución idéntica de las características
básicas será la que se podrá conseguir mediante un proceso aleatorio. I
ESTUDIOS NO EXPERIMENTALES

Las limitaciones impuestas por l~l étic~\ y el costo re~tringen, en la


mayoría de las circunstancias. la in\'estigación epidemiológica a los
estudios no experimentales. Al tiempo que no es ético para un invesliga- 1
dor exponer a una persona a una potencial causa de enfermedad simple-
mente para aprender acerca de su etiología. la gente, queriendo o sin , ,"
querer, se expone con frecuencia a si misma a muchos factores polencial- I ~
,
mente dañinos. El alcance de tales exposiciones ha sido descrito con
elocuencía por MacMahon ( 1979): t
I ¡
: :
La gente escoge una amplia gama de dosis de diversas sustancias que
pueden ser tóxicas. Considérense el hábito del cigarrillo. al que sc han
expuesto cientos de millones de personas -a niveles que van desde
TIPOS DE ESTUDIO EPIDEMIOLOGICO
55
~-~--
casi cero I para aquellos e.xpuestos sólo a través Jel fumar de los otros)
a los tres o cuatro cigarrillos por hora que está dcspicrto. dcj adicto-
y las consiguientcs dos millones o más de muertes ror c:incer Jc
pulmón cn e! último mcdio siglo sólo cn cstc pais. Considcrcsc el hccho
de quc menos dc la mitad Jc las mujcrcs amcricanas rasan la meno-
pausia sin. o bien sufrir que le quitcn quirúrgicamente cl lllcro. o ser
dosificadas libremcnte con hormonas que se sahe aumcntan cl ricsgo
dc cánccr cn los animales. o ambas cosas. Considérensc las implil:acio-
nes del hecho de que más de cincuenta millones dc mujcrcs cn todo cl
mundo toman rcgularmente, para lincs contraccptivos. una combina-
ción .de hormonas que, cscncialmente, anula la función de sus propios
OV:lrtOS.

~
...el entrecrllz~lmicnto dcl suministro de agua dc la Southwark and
f
Vauxhall Company con la dc la Lambeth Company, en gran parte de ¡
Londres. arroj~lba dudas so:bre que el tema pudiera ser discernido ~
.
hasta el punto de dar lugar a pruebas incontrovertibles en un sentido o ~
~
en otro. En los subdistritos (...) suministrados por ambas compañías. la f:
:
mezcla dcl suministro era de la naturaleza más íntima. Las tubcrías dc
~t~

66 EPIDEMIOlOGIA MODERNA

cada compañía ba.iaban por todas las callcs y entraban en casi todos
los patios )' callejuelas. Unas pocas casas eran servidas por una com-
pañia y otras pocas por la otra. según hubiera sido la decisión del
propietario o del ocupante en el momento en que las compañías de
agua se hallaban en activa competición. En muchos casos, un3 única
casa tiene un suministro díferente de las restantes. en cualquicra dc la~
aceras. Cada compañía sír\'c tanto a rico~ como a pobrcs. tanto a
casas grandes como pequeñas; no ha)' diferencias ni en la condición ni
en la ocupación de las personas que reciben el agua de las distintas
compañias (...) es obvio que no podria haberse diseñado ningún experi-
mento que hubiera puesto a prueba de forma más complcta los efectos
dcl suministro de agua sobre el progreso dcl cólcra que éste.
El experimento, igualmente. era de la mayor escala. No mcnos de
trescientas miJ personas de ambos sexos. de toda edad y ocupación ~'
de todo rango ~. categori~l, desdc los gentiles ~\ los muy pobres. fucrolJ
divididos en dos grupos sin haberlo elegido y. en la mayoria dc los
casos, sin su conocimiento; un grupo era el dc los que recibían agua
contaminada con las aguas fecales de Londres )/. entre ellas, la quc
provenia de los pacientes de cólera; el otro grupo tenia su agua bastan-
te libre de impurezas.
Para poner en marcha el experimento. todo lo que hacia falta era
enterarse de qué suministro de agua tenía cada casa individual en
donde hubera ocurrido un ataquc fatal dc cólera...

Hay dos tipos fundamentalc.<; de estudios no expcrimcntalcs: lo.<;


estudios de seguimiel1lo (o de cohorle} )' los estudios de co.\"0.\"
). COI1I
ro!(I.\,.
El estudio de seguimiento es un análogo dirccto del experimento, del que
difiere sólo en que el investigador no asigna la exposición. En los estu-
dios de casos y controles, aunque pueden extraerse paralelismos con
los estudios de seguimiento, las bases conceptuales del diseño difieren lo
bastante dc los paradigmas científicos como p.ara que emer.ja un grupo
de aspectos metodológicamente propios en relación con el diseño, el
análisis y la interpretación.

E.\"ludio.\" d(' .\"eguimienlo 'COhOrl(',\"

Un estudio de seguimiento es aquel en el que dos o más grupos de gentc,


libres de enfermedad y que difieren según el grado de exposición a una
potencial causa de la misma, son comparados con respect() a la inciclen-
cia de esa enfermedad en cada uno de dichos grupos. El estudio de
seguimiento, definido de esta manera, comprende todos los estudios
experimentales, así como los experimentos naturales de Snow sobre el
cólera. El elemento esencial en un estudio de seguimiento es que para
cada grupo del mismo se pueden calcular las tasas de incidencia (Ios
grupos de estudio son llamados a veces cohor[('s, palabra latina con que
se conocía a una de las diez divisiones de las antiguas legiones romanas).
En el experimento natural de Snow sobre agua potable y cólera, él
fue capaz de derivar, aproximadamente, la mortalidad relativa por dicha
TIPOS DE ESTUDIO EPIDEMIOLOGICO 67

enfermedad. usando corno denominador las viviendas. de forma separa-


da para la larnbeth Cornpany y para la Southwark and Vauxhall Corn-
pany (Snow, 1860):
"
Según un informe envi;ldo al Parlamento. la Solllllwark ¡lnd V;luxh;lIJ
Company sirvió desde el I de enero al 31 de diciembre de I R53 ;l
40.046 casas, y la lambeth Company, a 26.107. durante el mismo
periodo; consecuentemente. puesto que se prodlljeron 286 ataques
fatales de cólera en las cuatro primeras semanas de la epidemia en
casas suministradas por la primera compañia y sólo 14 en casas sumi-
nistradas por la segunda. la proporción de ataques mortales por cada
10.000 casas fue la siguiente: Southwark and Vauxhall. 71: lambeth. 5.
El cólera fue. por tanto. catorce veces más fatal en este periodo entre
las personas que tomaban el agua impura de la Southwark and Vaux-
hall de lo que era entre los que tomaban el agua más pura de Thames
Ditton.

LA DEFINICION DE COHORTES y DEL PERIODO


DE SEGUIMIENTO

J Clasificar individuos en dos o más grupos y Juego medir la frecuencia de


ocurrencia de la enfermedad en ellos es algo sencillo. No obstante, sólo
cuando se definen estrictamente las cohortes y el período de seguimiento.
de acuerdo a unos principios básicos ya la comprensión biológica. es
posible realizar inferencias con sentido.
Un axioma importante es el de que una causa siempre precede a su
efecto. Por tanto, los individuos expuestos no deben ser considerados
dentro del período de seguimiento hasta después de que haya ocurrido
la exposición. Esta obvia restricción es una delimitación teórica que
necesita ser restringida aún más para dar acomodo a un tiempo de
inducción biológicamente apropiado -el período durante el cual se
completa la causa suficiente- y al período latente -el período e.;,<istente
tras la causación, pero antes de que la cnfermedad sea detectad.a (Roth-
man, 1981)-. Por tanto. para los supervivientes de las bombas atómicas
del Japón, el efecto de su exposición a la radiación sobre el subsiguiente
riesgo de cáncer no debe ser evaluado con un período de seguimiento
que comenzase el día después de la exposición. Para tener en cuenta un
mínimo tiempo de inducción y un período latente, habria que comenzar
el período de seguimiento algunos meses o años después de la expl?sióll
de la bomba, dependiendo su valor exacto del riesgo especifico de cancer
que se fuese a evaluar. ..
En caso de que los períodos apropiados minimos de inducclon y
latencia fuesen desconocidos, tal desconocImIento no autonzana a co-
menzar el período de seguimiento inmediatamente tras la ~xposición. .~n
ausencia de conocimiento específico, debe realizarse una cIerta asunclon
acerca de la duración del citado período de inducción mínimo: el co-
mienzo del seguimiento de forma inmediata tras la exposición se corres-

I
~ ,
..'"
..:~f
68 EPIDEMIDLOGIA
MODERNA

ponde con la asunción de que el período mínim() para la inducción de


una enfermedad )' su latencia es cero. asunción extrema )' probablemente
incorrecta. El ir variando lo que se asUme puede aportar información
acerca de la duración de los periodos de inducción y latencia (Rothman,
1981) puesto que cuanto más cerca esté dicha asunción respecto dc la
realidad, mayor será el erecto medido (Véase en el capítulo 7 la discusión
sobre clasificación incorrecta no diferencial). Análo{!a5 asunciones deben I
realizarse sobre la duración máxima del período- de inducción y del
periodo latente.
Si la exposición es en sí crónica. en lugar de ocurrir en un punto en el
tiempo, la definición de exposición se hace más complicada. Sc dcbe
entonces conceptualizar un periodo durante el cual la exposición se
acumula hasta un nivel suficiente como para desatar un paso en el
proCeso causal: esta acumulación de experiencia de exposición puede ser
I
función compleja de la intensidad de exposición y del tiempo. El
período de inducción comienza sólo una vez que la exposición ha alcan-
zado este hipotético punto desencadenante. Los epidemiólogos ocupa-
cionales han medido muchas veces el tiempo de inducción para la expo-
siciÓn ocupacional a partir del momento de la primera exposición, pero
este procedimiento implica la asunción extrema de que el primer contac- I
to con la exposición llegó a constituir una exposición biológicamente
efectiva. Cualquiera que sea la asunción que se adopte, debe hacérsela
parte explícita de la definición de cohorte y del período de seguimiento.
Un sujeto que cumple 105 criterios de entrada en \lna cohorte no
debe ser excluido de ella sobre la base de la experiencia de exposición
una vez: dentro. Supongamos que el objetivo de un estudio de seguimien-
to es e.y.a}uar el erecto sobre la mortalidad de fumar dOS o más paquetes
de cig~rriI1os durante diez años seguidos. Asumamos que el perío-
do de inducción mínimo es cero (para la muerte por infarto de miocar-
dio) y que el máximo es de cincuenta años (para la muerte por cáncer de
pulmón). La gente que fuma dos o más paquetes diarios durante su vida
adulta serán elegibles como sujetos del estudio exactamente a los diez
años de empezar a fumar. Una persona que fumó durante cinco )' luego
lo dejó durante uno, y así en ciclos repetidos, nunca podrá ser elegible,
puesto que la entrada en la cohorte exige diez años fumando seguidos.
Los sujetos que entran en la cohorte no deben ser excluidos si luego 1
dejan de fumar: un cambio en la exposición puede presagiar un cambio
en el s/a/ti.\" de enfermedad, o puede simplemente estar en función del
tiempo. En cualquiera de estas situaciones, el realizar una exclusión e.\
pOSt .fac/o dará como resultado un sesgo. En los ensayos aleatorios
constituye un consejo estándar afirmar que todos los sujetos, una vez
colocados al azar, deben ser incluidos en el grupo que les haya tocado, 1
pase 10 que pase tras la ubicación aleatoria (Peto e/ al., 1976). Esta regla
puede ser hecha extensiva a todos los estudios de seguimiento: una vez un
sujeto ha entrado en una cohorte, tal sujeto no. debe ser excluido dc la
misma sobre la base de ninguna experiencia subsiguiente de exposición.
Es razonable, sin embargo, excluir parte de la experiencia potencial dc

]
seguimiento de un sujeto. si tal experiencia se encuentra fuera de la
relevante ventana de tiempo definida por las asunciones de los periodos
de inducción y de latencia. Esa experiencia. que se excluye del seguimien-
to relacionado con la exposición. puede ser despreciada o. si es adccua-
do, considerada como una experiencia relacionada con la no-exposición.
Definir la no-exposición puede también ser complicado. Potencial-
mente, incluye la experiencia de los sujetos expuestos antes de que
tuviera lugar la exposición o. más generalmente. la experiencia de los
expuestos fuera de la ventana de tiempo definida por las asunciones
sobre período de inducción y latencia. Cuando se están evaluando varias
exposiciones, la no exposición debe corresponder a la ausencia de toda
exposición. Un error común, que quizá se dé más en los estudios de
casos-controles que en los de seguimiento. consiste en comparar cada
grupo de expuestos con el grupo complementario de no-expuestos. evi-
tando tener un grupo de referencia único bien definido. Tal uso de un
grupo movible de referencia en relación con la exposición. es fácil ver
que es incorrecto cuando los grupos comparados se categorizan en
función de niveles diferentes de una única exposición. Por ejemplo. seria
claramente un error comparar fumadores de pocos cigarrillos con «no
fumadores de pocos cigarrillos» (comprendiendo tanto no fumadores
como grandes fumadores). Similarmente. es incorrecto comparar cada
una de varias exposiciones diferentes con el grupo de referencia cam-
biante que comprendiera el complemento de cada uno de ellos: hacer eso
puede dar como resultado que causas apareciesen como [actores preven-
tivos y conducen, por lo general, a subestimaciones de los efectos.

COSTE

Los estudios de seguimiento constituyen generalmente grandes empre-


sas. La mayoría de enfermedades afectan sólo a una pequeña proporción
de una población, incluso si se sigue a ésta dur::lnte muchos años. Se
requiere un número sustancial de casos de enfermedad para obtener
estimaciones sólidas de la incidencia y, por lo tanto. la experiencia
persona-tiempo que dé cabida a dichos casos debe también ser sustan-
cial. Esa experiencia persona-tiempo puede acumularse siguiendo a llna
cohorte durante un gran lapso de tiempo. 1\lgunas cohortes sometidas a
exposiciones especiales [como las víctimas japonesas de las bombas
atómicas (Beebe, 1979)], o que poseian historiales médicos y personales
detallados [como el estudio de la cohorte de Framingham. Massachu-
setts (Kannel. 1984)] han sido seguidas ciertamente durante décadas. Si
se intenta que. un estudio aporte resultados «más sobre la marcha». sin
embargo, la experiencia persona-tiempo requerida puede ser lograda ~:
aumentando el tamaño de las cohortes. Por supuesto, los estudios de ~
grandes poblaciones durante mucho tiempo son caros: no es infrecuente
que un estudio de seguimiento cueste millones de dólares, y ha ocurrido J
~
'!
alguna vez que el coste final se pase en 100 millones de dólares de lo
70 EPIDEMIOLOGIA MODERNA

presupuestado. La mayoría de] gasto se deriva de la necesidad de esta-


blecer en una población grande un sistema continuado de monitoriza-
ción de la ocurrencia de enfermedad.
Lo costoso de los estudios de seguimiento limita a veces su viabili-
dad. Cuanto menor sea la incidencía de enfermedad. menos factible seril
realizar un estudio de este tipo. Otro factor que dificulta adicionalment~
esa víabilidad es que el pcriodC" de inducción entre la hipotética causa )
su efecto sea largo. Un tiempo de inducción largo contribuye, ip.\,(I.í(¡Cl(J.
a tener una incidencia global ba.ia, debido al aumento de unidades
persona-tiempo en el denominador, pero impone igualmente la carga de
tener que hacer un e~tudio que abarquc. para detectar algún erecto. un :~

intervalo en el menor de 10$ casos tan largo. y en la práctica considera- ';r

blemente más. que el periodo de inducción mínimo. Los estudío$ dc ..

seguimiento van mal para enfermedade$ rara~ con período dc inducción t:

largo en relación a la exposición de interés. i() que no e$ otra cosa que


decir que. en la mayoría de los casos. 10$ e~tudios de seguimiento resul-
tan caros en relación con la cantidad de inrormación que proporcionan.
El costo de los estudios de seguimiento puede ser reducido de diver-
sas maneras. Una de ellas consiste en utilizar un si~tema de monitori7;a-
ción de la ocurrencia de enrermedad ya existentc. Por ejemplo. se puede
usar un registro regional de cáncer para ir tomando nota de la ocurren- I
cia de estos procesos entre los miembros de la cohorte. Si el gasto de la
determinación de los casos está siendo a$umido ya por el registro. el
estudio será considerablemente más barato.
Otra forma de reducir costos es apoyarse en cohorte,c; históricas. En
vez de identificar los miembros de la cohorte concurrentemente con la
iniciación del estudio y de que la planificación del periodo de seguimien-
tO se produzca durante el mismo. el investigador puede escoger identifi-
car a los miembros de la cohorte sobre la base de registros de exposición
previa: En ese caso, el período de seguimiento hasta la ocurrencia de
enfermedad puede encontrarse total o parcialmente en el pasado. Sí ¡0
está totalmente. los investigadores deben también apoyarse en los regis-
tros como criterio para determinar la existencia de enfermedad en los
miembros de la cohorte. Si el período de seguimiento comienza antes del I
momento durante el cual el estudio se lleva a cabo. pero se extiende
dentro de éste, puede diseñarse un mecanismo de vigilancia activa o un
nuevo sistema de monitorización para valorar la enfermedad. Cuando I
tanto la exposición como la enfermedad son históricas, el e~tudío es
descrito como estudio de cohorle relro.\"pecliva, de .\"eg/1imie/lln relro.\"pec-
livo O de COhOrle histórica. El grado en que el seguimiento sea retros~
pectivo, es decir, cubra un período de tiempo anterior al estudio, será
1
,
lo que el estudio cueste menos que otro equivalente prospectivo.
Una tercera forma de disminuir el gasto es reemplazar una de las
cohortes, específicamente la no-expuesta, con información de la pobla-
I ~
J"
(

ción general. En lugar de recoger i~formación nueva de una población f

no-expuesta de gran tamaño, se usan, para la comparación, datos exis- J


~
tentes acerca de la población general. Este proceder tiene problemas

]
':
':

TIPOS DE ESTUDIO EPIDEMIOlOGICO 7'

obvios. En primer lugar. es razonable sólo si existe una cierta seguridad


de que solamente una pequeña proporción de la población general está
expuesta al agente que se estudia. En la medida en que parte de la
población general esté expuesta. existirá un error de clasificación inco-
rrecta que introducirá sesgo en la comparación. en el sentido de subesti-
mar el efecto (véase capitulo 7). Segundo. la información que se obtenga
en el estudio deberá ser comparable en calidad a la ya existente para la
población general. Si se usan datos de mortalidad. la causa de muerte
recogida en los certificados de defunción es la que debe utilizarse para
clasificar a los sujetos del estudio. puesto que los certificados de defun-
ción son también la fuente de información sobre datos de mortalidad
para la población general. Si hubiera que usar información médica
adicional sólo para la cohorte expuesta. los datos obtenidos de ella no
serían comparables con los de la población gener:1l.
Una cuarta forma consiste en llevar :1 cabo un estudio de casos y
controles dentro de la cohorte, en lugar de incluir a la población entera
de la cohorte en el estudio. Tales estudios «anidados» de casos y contro-
1 les pueden frecuentemente ser llevados a cabo al costo de sólo una
fracción de lo que costaria un estudio de seguimiento y seguir producien-
do los mismos hallazgos, con casi el mismo nivel de precisión. El abor-
j daje de casos y controles, discutido más adelante, se está haciendo cada
vez más popular incluso en la epidemiología ocupacional que ha sido
durante mucho tiempo un reducto para la tradición de estudios de
seguimiento (Paddle, 1981).

1 RASTREO DE LOS SUJETOS

Los estudios de seguimiento que duran muchos años presentan proble-


mas logísticos que pueden afectar de modo adverso a su validez. El
J problema central 10 constituye el seguír la pista a los sujetos del estudio.
Ya sea éste retrospectivo o prospectivo, frecuentemente resulta dificíl
localizar a una gente o sus regístros una vez pasados muchos años tras
que se hubieran enrolado en un estudio de cohortes. Si éste es prospecti-
VO, puede resultar posible establecer contacto periódíco con los sujetos
ímplicados en el mismo y con ello mantener información actualízada
sobre su localízación. Dicha labor de rastreo incrementa los costos de
los estudios prospectivos de seguimiento, pero la creciente movilidad de
la sociedad plantea la necesidad de hacer mayores esfuerzos a este nivel.
Perderle la pista a un número sustancial de sujetos puede plantear
serias interrogantes acerca de la validez del estudio. Cuando un estudio
de seguimiento sigue el rastro de menos de, aproximadamente, el 60 por
100 de los sujetos es, por lo general, considerado con escepticismo,
pero incluso un 70 ó un 80 por 100, o más, pueden ser demasiado bajos
para ofrecer seguridad suficiente de que no habrá sesgo, si existe razón
para creer que esas pérdídas en el seguimiento pudieran estar correlacio-
nadas tanto con la exposición como con la enfermedad (Greenland. 1977).

~¿

:\'¡~¡"~;i
1
72 EPIDEMIOLOGIA MODERNA

COHORTES DE EXPOSICION ESPECIAL y


DE POBLACION GENERAL

Un rasgo atractivo de los estudios de seguimiento es la posibilidad que 1


ofrecen de valorar toda una gama de posibles efectos sobre la salud a
partir de una exposición única. Un seguimiento de mortalidad es tan
rácil de realizar para todos los casos de muerte como para las producidas
por cualquier causa específica. Por lo general. la vigilancia sanitaria para
certificar la presencial final de una enrermedad puede ser ampliada para
incluir muchos o incluso todos los qemás procesos, sin que ello signifi-
que demasiado trabajo adicional. Un estudio de seguimiento puede.
I
pues, suministrar un cuadro global del erecto de una exposic.ión dada en
términos de salud. Es precisamente e] intento de conseguir tal inrorma-
ción global acerca de las exposiciones lo que motiva la identificación de
cohortes «de exposición especial», que son grupos identificables que han
surrido exposición a agentes de interés. Ejemplos de ellas son las cohor-
tes ocupacionales expuestas a ractores presentes en el lugar de trabajo. ]
los soldados expuestos al agente naranja en Vietnam; los residentes de la
zona del Love Canal en Niágara, Nueva York, expuestos a residuos de
productos químicos; los Adventistas del Séptimo Día, sometidos a dietas J
vegetarianas; o las víctimas de la bomba atómica, expuestas a radiacio-
nes ionizantes. Tales exposiciones no son comunes y requieren la identi.
ficación de cohortes expuestas que aporten información suficiente al
estuáio.
A veces, algunas exposiciones comunes se investigan con estudios de
seguimiento sobre un segmento de la población, que es definido sin tener
en cuenta el slalu.'I de exposición. Cohortes «de población general» así
han sido utilizadas para estudiar los erectos del tabaco, los anticoncepti-
vos orales, la dieta y la hipertensión. Para ser bueno, un estudio de
cohorte de población general debe tener como objetivo evaluar exposi-
ciones que haya experimentado una proporc~ón importante de gente: de
lo contrario, la .cohorte no-expuesta será inericientemente grande en
relación con el tamaño de la expuesta. Los estudios en cuestión orrecen
la ventaja de permitir a los .investigadores estudiar un abanico de enfer-
medades, resultantes de más de una exposición. Una población sometida
a estudio puede ser clasiricada según el hábito de fumar, el consumo de I
bebidas alcohólicas, el uso de drogas, el historial médico y muchos otros
factores de potencial interés. El hecho de que, por lo general, la inrorma-
ción sobre la exposición deba ser obtenida por medio de entrevistas con
cada sujeto (a diferencia de la obtención de información a partir de los
1
registros). que es lo que rrecuentemente se hace con las cohortes de
exposición especial, constituye una desventaja.
I
ESTUDIOS DE CASOS y CONTROLES

El uso )' la comprensión sofisticada de los estudios de casos )' controles I


es el desarrollo metodológico más notable de la epidemiología moderna.
TIPOS DE ESTUDID EPIDEMIOlOGICO 73

Existen, conceptualmente, vinculaciones claras entre los estudios experi-


mentales, los de seguimiento no experimentales y los de casos y contro-
les, pero estos últimos difieren, sin embargo, lo suficiente del paradigma
científico de la experímentación como para que un abordaje descuidado
de su realízación e interpretación conduzca a la equivocación conceptual
y, posiblemente. al error grave.

FUNDAMENTACION DEL DISEÑO DEL ESTUDIO


DE CASOS y CONTROLES

Imaginemos una población dinámica de individuos expuestos y no-


expuestos en situación estable. La información relevante sobre inciden-
"
cia de enfermedad para un periodo de tiempo de duración I. puede '.

resumlrse como

a
II = ,~ ,
-I

e
j b
lo= -;:.:-;

donde 11 e lo son las tasas de incidencia entre expuestos y no-expuestos,


respectivamente; a y b son los respectivos números de individuos que
desarrollan la enfermedad durante el intervalo de tiempo I, y Pl y Po son
los respectivos tamaños de población. En un estudio de seguimiento se
miden el numerador y el denominador de cada tasa: hacerlo exige listar
a la población entera y mantenerla sometida a vigilancia. El estudio de
casos y controles es un intento de tornar más eficientes las observaciones
realizadas en la población. En él. los casos son los individuos que .C:1en
enfermos durante el periodo de tiempo, esto es, un total de (a + h)
individuos. Los controles son una muestra de las cohortes combinadas
en que tuvieron lugar los casos. Si se toma como controles a una
proporción, k, de las cohortes combinadas exp~esta y no-expuesta y el
número de tales controles es c para los expuestos y para los no-expues-
tos, las tasas de incidencia para unos y otros pueden ser calculadas asi:

k!:..-
II
c/
~:

e ~
i
J
I

J
~
,
c

.-~---~ , ~ ~.,-.,. -;-"'"'


71. EPIDEMIOLOGIA MODERNA

Si k. la fracción muestral de los controles, es conocida. pueden


entonces obtenerse estimaciones de la incidencia de enfermedad para e!
grupo tanto de los expuestos como de los no-expuestos. exactamente
como en los estudios de seguimiento. No obstante. incluso si k es desco-
nocida, que es la que suele suceder. la incidencia relativa. o razón de
tasas [RT. o ralC' ralio (RR) en inglés, conocida frecuentemente como
rie.\'go relalivo]. se obtiene como:

RT = ~ -ad
[6.1]
10- ~

Como la fracción de muestreo, k, es idéntica para expuestos y no-


expuestos, se elimina de la división, lo mismo que 1. La cantidad resul-
tante, ad/bc. es la razón de ventaja de la exposición (razón de la venta.ja
de exposición entre los casos a la venta.ia de exposición entre los contro-
les). conocida muchas veces como, simplemente, razón d(' venla:ia. Esta
I
eliminación de la citada fracción muestral de los controles en el cálculo
de la razón de ventaja proporciona, pues, una estimación no sesgada de
la razón de tasas de incidencia a partir de los datos de casos y controles
(Sheehe. 1962; Miettinen, 1976). La condición central para llevar a cabo
estudios válidos de casos )' controles es que los controles sean seleccio-
nados independientemente de su slalll.~ de exposición, para garantizar I
que pueda eliminarse la fracción muestral, k. del cálculo de la razón de
ventaja.
Se puede conceptualizar el diseño de casos y controles como un
diseño de seguimiento en el que la experiencia persona-tiempo de los
denominadores de las tasas de incidencia está muestreada, en vez de
medida como tal. El muestreo debe ser independiente de la exposición; el
proceso de muestrear, al desvelar el tamaño relativo de los denominado-
res persona-tiempo para las tasas de incidencia en expuestos y no-
expuestos, permite el cálculo de la magnitud relativa de las tasas de
incidencia. Visto asi, pues, el diseño de los estudios de casos )' controles
I
cabe considerarlo como una forma más eficiente de estudio de segui-
miento. en el cual los casos son los mismos que habria que incluir en un
estudio de seguimiento y los controles proporcionan un medio rápido )'
no costoso de inferir la distribución de la experiencia persona-tiempo
según la exposición en la población que dio lugar a los casos.
J
SELECCION DE CASOS y CONTROLES

La discusión anterior parte de la presunción de que. en un estudio de


casos y controles, todos los casos que se dan en la población son
incluidos como sujetos. Podemos modificar este argument() para hacerlo
menos restrictivo: los casos que se incluyen en un estudio de casos y
controles representan la totalidad de los mismos, provenientes de una
población hipotética que produjo los casos, que han sido seleccionados.
TIPOS DE ESTUDIO EPtDEMIOLOGICO 75
---

Un caso no seleccionado se presume, pues. que surge de una distinta


población de origen. En segundo lugar, el objetivo al seleccionar los
controles es escoger individuos que sean representativos de aqllcllos que.
de haber desarrollado la enfermedad, habrían sido scleccionadC5s como
casos y, por supuesto. escoger dichos controles independíentemente de la
exposición. De esta manera, los estudios de casos y controlcs no necesi-
tan incluir todos los casos que ocurren en una población reconocible.
como, por ejemplo, dentro de unos límites geográficos; los casos identifi-
cados en una única consulta. o incluso por un único médico. constituven
posibles series de casos. en tanto se entienda que la población de do~de
derivan los mismos está restríngida a las personas que habrían sido
incluidas como casos si hubiesen desarrollado la enfermedad. Los con-
troles deben ser seleccionados para que representen a tal poblacíón.
Algunos libros de texto hacen hincapié en la necesidad de que la
selección de casos y controles sea representativa; lo que se ha aconsejado
es que los casos se supongan representatívos de todas las personas que
padecen la enfermedad y que los controles deberían ser representativos
de la poblacíón total no enferma. Semejante recomendación es clara-
mente errónea.
Se puede restríngir un estudío de casos y controles a cualquíer típo
de casos consíderados de ínterés: casos femenínos, casos de edad, casos
severamente enfermos, casos que muríeron pronto tras el comíenzo de la
enfermedad, casos leves (a menudo dc mayor interés que los severos,
cuando se estudían malformaciones congénítas, sí los casos severos mue-
ren en el útero), casos provenientes de Filadelfia, casos que se dan entre
obreros de una fábrica y así sucesívamente. Los casos, en ninguno de
estos ejemplos, serían representativos de todas las personas que padecen
la enfermedad y, con todo seguíría síendo posíble realizar estudios de
casos y controles perfectamente válidos usando series de casos tan poco
representativas (Cole, 1979). Es cíerto que hay que seleccíonar los casos
independientemente de la exposíción, pero la prevalencia de ésta entre
los casos puede, a pesar de todo, ser mayor o menor que la que se diese
entre otras personas con la enfermedad, sí los mismos difieren respecto
de esas otras
la edad. personas
el sexo que padecen la enfermedad en factores tales
o la severidad. , como

Es igualmente erróneo buscar controles que sean representatívos de


toda la población sana. Cuando se seleccionan los controles, el principal
objetivo es seleccíonar sujetos que representen a los que en el estudio
podrían convertírse en casos; si se seleccionan los casos a partir de un
hospital de entre muchos en la cíudad, los controles tíenen que represen-
tar a aquella gente que, si hubiesen desarrollado la enfermedad en estudio.
habrían sido envíadas al mísmo hospital. Esa gente puede dí[erír grande-
mente de la población general en edad, raza, sexo (por ejemplo, si los
casos salen de un Hospital de la Admínistración de Veteranos), .5tatus
socieconómico, ocupación, etc., y, consecuentemente, podrían difcrir
también de la poblacíón general en cuanto a exposición.
Ha habido estudios epídemiológicos, basados en poblacíones defini-
76 EPIDEMIOLOGIA MODERNA

das en sentido geográfico. que incluían en las series a todo caso ~


enfermedad que ocurría en ese área geográfica y como controles a una
muestra representatíva de la pobla,:íón base (aunque usualmente con
algún tipo de restricción de edad). Estudios así son escasos en número.
porque resultan caros. La mayoría de los estudios de casos-controlcs. sin
embargo, están basados en series de sll.ietos a los que se dcterminan
como tales sólo a partir de factores específicos de selección que operaban
por fuera del control del investigador, como. por e.jcmplo. el que acudie-
sen a uno o más consultorios previamente designados. Son razonables y
válidos. siempre que el investigador seleccione a los sujetos independien-
temente de la exposición y escoja a controles que si hubiesen estado
enfermos habrían recorrido el mismo camino de fuerzas de selección que
los casos. El reto en estudios de este tipo es convertir tal definición
conceptual de los su.jetos controles en un protocolo para seleccionarlos.
Una de las razones para recalcar las similitudes y no las diferencias
entre los estudios de seguimiento y los de casos y controles es que
existen numerosos príncipios que se aplican a ambos tipos de estudio.
pero que son más evidentes en el contexto de los de seguimiento. Puesto
que un estudio de casos y controles se conceptualiza siempre en el marco
de un hipotético estudio de seguimiento, muchos principios relacionados
con la selección de sujetos se aplican idéntícamente a ambos tipos de
I
estudio. Por ejemplo, es ampliamente reconocido que los estudios de
seguimiento pueden estar basados en cohortes especiales. en vcz de en la
población general. Lo es también que los estudios de casos y controles
I
pueden ser llevados a cabo muestreando los controles dentro de esas
cohortes especiales. La utilidad de este tipo de estudio precnfocado dc
casos-controles demuestra que es incorrecta la proposición de que los
I
controles, en los estudios de casos )' controles. tengan que ser representa-
tivos de todas las personas de la población que no padecen la enfermedad.
Otra ílustración de esta idea general de que. frecuentemente, ciertos
princípios aplicables a los estudios de casos-controles pueden ser entendi-
dos mejor a la luz.de principios dc los estudios de seguimiento. está rela-
cionada con el concepto de «oportunidad de exposición». El tema es si en I
un estudio de casos y controles la oportunidad de ~xposición debe estar
controlada (Poole, 1985). Excluir a las mu.jeres estériles de un estudio de
casos-controles sobre anticonceptivos orales. o aparear según la dura- I
ción del empleo dentro de una industria en un estudio de exposición
ocupacional, son ejemplos de intentos de controlar la oportunidad de
exposición. En un estudio de seguimiento, no existe preocupación si un
sujeto dado ha tenido oportunidad de haber estado sometido a exposi-
I
ciÓn; el interés está en el hecho de la exposición, y no en la oportunidad
de la misma. (Dicho sea de paso, si un factor que resalta o disminuye la
oportunidad de exposición es también un factor de riesgo de enferme-
I
dad, se convierte en un factor de confusión y debe ser controlado.) La
irrelevancia de la oportunidad de exposición en los estudios de casos y
controles, como muchos otros principios, se hace clara cuando se trasla- I
da la cuestíón al terreno de un estudio de seguimiento.

3
TIPOS DE ESTUDIO EPIDEMIOLOGICO 77

Hemus visto que en una población dinámica. un estudio de casos v


controles puede permitir la misma estimación de la razón de tasas d~
incidencia que se obtendría si se hubiese llevado a cabo un estudio de
seguimiento. Un rasgo conceptualmente importante de la selección de
controles es su elegibilidad para convertirse en casos. Supongamos que
el período de estudio abarca tres años. Un individuo libre de enfermedad
en el año 1 es un control potencial, pero puede que desarrolle la enfer-
medad en el año 3, convirtiéndose así en un caso. ¿Cómo se trata en el
análisis a un individuo así? Hablando en términos prácticos. por supues-
to' ímportará poco, porque el estudio es improbable que tenga muchos
sujetos elegibles para ser tanto un caso como un control, pero la cues-
tión es interesante porque toca las bases teóricas de la razón de ser de
los grupos controles en un estudio de casos y controles. Dado que el
individuo en cuestión desarrolló la enfermcdad durante el período de
estudio, muchos investigadores se sentirían tentados de contabilizar a
esa persona como caso. pero no como control. Recordemos, no obstante.
que sí se hubiese estado llevando a cabo un estudio de seguimiento, cada
persona que desarrollase la enfermedad habria contrib~ido a la expe-
riencia persona-tiempo del denominador de la tasa de incidencia hasta el
momento de comienzo de la enfermedad. El grupo de control de los
estudíos de casos y controles se prctende que proporcíone estimados del
tamaño relativo de los denominadores de las tasas de incidencia en los
grupos que se comparan. Por tanto, insistimos. en un estudio de casos y
controles, cada caso debe ser elegible como control hasta el momento
del comienzo de la enfermedad y cada control debe ser elegible para
convertirse posteriormente en caso durante el período de estudio. Un
1 índividuo seleccionado como control y que luego desarrolla la enferme-
dad, debe ser contabilizado como control y como caso (Lubin y Gail.
1984). Esta sorprendente conclusión es más f{lcil de digerir si considera-
mos un estudio de casos y controles sobre muertes por cualquier causa:
puesto que toda persona se convertiría finalmente en caso si cl cstudio se
mantuviese durante tiempo suficiente. no existe otra altcrnati\':r sino
aceptar que los casos sean elegibles para ser con(roles en cualquier
momento antes del comienzo de la enfermedad.
En la medida en que la información de exposición puede c~lmbiar
con el tiempo, la inclusión de la misma persona en diferentes momentos
en un estudio puede conducir a tener difercnte inform~lCi()n acerca de esa
exposicíón en los diferentes momentos en que se valore. Por ejemplo. si
en un estudio de casos y controles las víctimas de un envenenamiento
son los casos, se les podría preguntar por la comida ingerída en el día o
los días anteriores: si un alimento contaminado fue la causa de la
enfermedad para algunos de ellos, la historia de exposición para dichos
individuos podría diferir mucho de lo que hubiera podido obtenerse de
los mismos unas semanas antes, cuando, en ese mismo estudio, tendrían
que haber sido incluidos como controles.
Algunas veces, un estudio de investigación incluye un periodo de
riesgo limitado que finaliza antes de que comience el estudio. Por ejem-

(
78
I
EPIDEMIOLOGIA MODERNA
-
p}o. un estudio de casos y controles sobre una epidemia de enfermedad
diarreica tras una reunión socia] puede comenzar después de que todos I ~
~

los casos potencia]es hayan ocurrido (porque el máximo tiempo de


inducción ya se habría consumido). Si los controles se seleccionan de
entre los que estaban ]ibres de enfermedad al final de ia epidemia. no
puede conseguirse una estimación sin sesgo de ]a razón de tasas de
incidencia. Sin embargo, la razón de venta.ia (ecuación [6.IJ) proporcio-
nará una aproximación razonable de la razón de tasas de incidencia.
siempre que las incidencias acumuiadas durante el periodo de riesgo
sean bajas, es decir, menos del 20 por 100 y que la prevalencia de
exposición permanezca razonablemente constante durante e] período de
estudio (Greenland )' Thomas. 1982). Si el investigador prefiere estimar
la razón de riesgo en vez de ]a razón de tasas de incidencia, lo que es una
razonable preferencia cuando e] periodo de riesgo est{\ bien definido.
puede seguir usándose e] estimado de ]a razón de ventaja (puesto que,
I
para riesgos pequeños, la razón de tasas de incidencia se aproxima a la
razón de riesgos) aunque debido a que ahora están en juego dos aproxi-
maciones, la exactitud no es tan grande (generalmente es preferible la
I
estimación directa de la razón de riesgos, pero las propiedades estadísti-
cas del parámetro razón de ventaja son atractivas en algunas circunstan-
cias, como se discute en el capítulo 11). La tabla 6.1 ilustra la exactitud I
de las aproximaciones para diferentes valores del riesgo.
Los estudios de casos y controles pueden también estar basados en
casos prevalentes, en lugar de incidentes. En vez de incluir como casos I
sólo a aquellos que desarrollan la enfermedad durante un período espe-

Tabla 6.1. Exactitud de la apro.~imación de la ra::ól1 de (lel1t~;a o la ra::ól1 dc'


I
tasas de incidencia )' la razón de rie,\,go.t, para e,\"tudio.\'de ca.\'0,~.1' controJe.v
en que se seleccionan los controle.t tra,t un periodo dc rie.\'go d~(inido
I modificado de Greenland ). Thomas ( 1982) J

Razón de
Riesgo en los
no-expuestos
Riesgo en los
expuestos
Razón

vcn ta.ja
de
tasas de
incidencia *
Razón
riesgos
de
I
0.5
0.4
0.6
0.6
1.50
2.25
1,32
1.79
1.20
1.50 I
0.3 0,6 3.50 2,57 2.00
0.2 0.6 6.00 4.11 3.00
0,1 0.6 13.5 8,70 6.00
0.1 0,4 6,00 4,85 4.00
0.1 0,2 2.25 2.19 2.00
0.05
0,05
0.2
0,1
4,75
2.11
4.35
2,05
4.00
2.00 I
0,02 0,05 2,58 2,54 .?.50

.La razón de tasas de incidencia puede scr calculada a partir


rR.) y de los no-expuestos rRo) como (In(1 -R1)]/(1n(J -Rol].
de los rics~os de los expucslll~
I
!,:
;;
!'

]
cífico de tíem po (es decir, casos incidentes) es posible seleccionar como
tales cualquier caso de enfermedad existente en un punto en el tiempo. Si
la duración de la enfermedad no está reJacíonada con la exposición. un
estudio de casos y con trojes basados en casos y controles pre,'alentes.
seleccionados durante el periodo de riesgo, dará una razón de ventaja
que constituirá un estimado sin sesgo de la razón de tasas de incidencia.
Si la exposición afecta a la duración de la enfermedad, entonces dicho
estudio de casos y controles basado en casos prevalentes será incapaz de
distinguir entre el rol etiológico de la exposición y su efecto sobre la
duración, a menos que tal efecto sobre la duración fuese conocido. En
consecuencia, es muy preferible siempre que sea posible seleccionar casos
incidentes en lugar de prevaJentes. Como se discutió en el capítulo 3. la
situación de estudio más común en donde se manejan casos prevalentes
es el estudio de las malformaciones congénitas. En estos estudios. los
casos descubiertos en el momento de nacer representan casos prevalen-
tes, porque han sobrevivido con su malformación desde el tiempo de la
ocurrencia hasta el nacimiento. Sería más útil, desde el punto de vista
etiológico, tener en cuenta todos los casos incidentes, incluyendo los
abortos afectados que no sobrevivan hasta el momento de nacer. Mu-
chos de éstos, sin embargo, no sobreviven hasta el momento en que la
contabilización como tal es factible, con lo que se hace virtualmente
] inevitable que los estudios de casos y controles de las malformaciones
congénilas estén basados en casos prevalentes. Otra situación en que se
usan comúnmente casos prevalentes es el estudio de condiciones crÓni-
cas no letales, como la obesidad.

VENTAJAS y PUNTOS DEBILES

En tanto los estudios de seguimiento son útiles para evaluar una gama
de efectos relacionados con una única exposición. los estudios de casos y
controles pueden aportar información sólo sobre el efecto que aflige a
los casos seleccionados. Es posible. desde luego, seleccionar series mÚlti-
ples de casos con varias enfermedades, pero un abordaje así implica
emprender varios estudíos de casos y controles simultáneamente (las
diferentes series de casos podrian o no requerir series de control separa-
das, dependiendo de las condiciones de determinación de las series de
casos). Por otra parte, un estudio de casos y controles puede proporcio-
nar convenientemente información sobre una amplia gama de exposicio-
nes, potencialmente etiológicas, que podrían estar relacionadas con una
enfermedad específica en tanto. típicamente, un estudio de seguimiento
se centra en sólo una exposición {Ios estudios de cohorte de población
general son una excepción, aportando información sobre un amplio
espectro de exposiciones y enfermedades).
Ciertas fortalezas y debilidades que poseen los estudios de seguimicn-
to tienen simétricas debilidades y fortalezas en los estudios de casos y
controles. Ya se ha mencionado la capacidad de los primeros para
80
I
EPIDEMIOLOGIA MODERNA
-
c\'aluar una gama de efectos relacionados con una exposición. micntras
un estudio de casos y controles puede e\'aluar una gama de exposiciones
relacionadas con la enfermedad. En tanto la evaluación de los efectos ell
enfermedades raras es problemática en los estudios de seguimicnto. las
enfermedades raras se ajustan bien a los estudios de casos y controles: a )
su vez. éstOS son insuficiente.l; para evaluar los efectos de exposiciones
que sean infrecuentes en la población de donde provienen los casos. En
los estudios de seguimiento. se señalaha que cl rastreo de ios su.jclOSpara I
evitar que se les perdiera la pista constituía una seria preocupación. En
los de casos )' controles. la preocupación análoga es la de determinar la
exposición correcta para cada sujeto, para evitar de ese modo la pérdida
de sujetos sometídos a exposición desconocida. En los estudios "dc segui-
miento. dado que el .\"lall'.'i de exposición se delermína antes dc que sea
conocida la presencia de enfermedad para el su.ielo o para el invcstiga- I
dor, no existe posibilidad de que el resultado de la enfermedad e.ierza i
J
influencia sobre la clasificación de exposición: en los de casos y contro-
¡
les, si la información de exposición proviene del sujeto una vez comenza- 1-
da la enfermedad, el conocimiento de ésta podria afectar a los dalos ~
I!
acerca de la exposición. Esta posibilidad de sesgo en los estudios de casos
y controles no tiene equivalente en los de seguimiento. Por supuesto, el
conocimiento de la exposición puede afectar ,1 la dclerminación dcl .\"lall'.'.
de enfermedad de los sujetos en los estudios de seguimiento, pero tal
dificultad existe para cualquier tipo de estudio. En compensación por los
inconvenientes de poseer una fuente potencial adicional de sesgo. los
estudios de casos )' controles son más pequeños )' menos caros. en tanlo
los de seguimiento son habitualmente grandes y costosos. Finalmenlc. la
mayor eficiencia de los estudios dc casos y controles es un,1 vcnlaja que
puede compensar su mayor posibilidad de sesgo.
Los estudios de casos y controles han gozado de una rcputación
pobre en la investigación epidemiológica, jugando a veces e] papel de
chivo expiatorio que sólo se llevaba los palos. Los que denigran la
investigación de casos y controles hacen frecuentemente referencias des-
deñosas a los estudios «retrospectivos», sin hacer la distinción que los
epidemiólogos tienen en cuenla entre estudios de seguimienl() retrospec-
tivos )' estudios de casos }' controles: el grueso de lo~ resqllemores frente a
los llamados esludios retrospecti\'o.l; se hace recaer. sin embargo. sólo
sobre los esludios de casos v conlroles. Es innegable que presenlan m{ls
oportunidades de sesgo y d~ inferencia errónea que olros lipos de inve~-
ligación. Un motivo está en la posibilidad de sesg() de memoria al
clasificar la exposición. La razón prim,lria dc error. no obslanle. no tiene
nada que ver con la validez de la información que puede oblenerse de los 1 ~

estudios de casos y controles: depende de la rclaliva facilidad con que se I (~;


I~~
pueden montar. Debido a que poner en pie un esludio de casos y
~
controles no tiene.por qué ser extremadamente caro ni consumir much() I~
liempo, muchos de ellos han sido llevados a cabo por in\'estigadores
aficionados, sin siquiera una idea rudimentaria de los principios epide-
miológicos. Un botón de muestra puede ser el tipico estudio basado en
TIPOS DE ESTUDIO EPIDEMIOLOG¡CD 8'

una serie de pacientes vistos por un solo doctor. o por un grupo de


médicos, con o sin series de control. Esa investigación sin una buena
base científica puede producir ocasionalmente resultados fructíferos. o
incluso extremadamente importantes, pero lo mils probable es que sean
erróneos por haber sido violados los principios básicos de la investiga-
ción. La pobre reputación que padecen los estudios de casos y controles
proviene. pues. más de su inepta conducción que de ninguna debilidad
inherente en el abordaje concept'Jal. Resulta estimulante observar cómo
son más cada vez los estudios de casos y controles diseñados, in[orma-
dos y analizados con respecto a los principios que rigen el correcto
diseño de estudios, minimizando así la posibilidad de sesgos que distor-
sionasen los hallazgos.

ESTUD{OS DE SECCION TRANSVERSAL VERSUS


ESTUDIOS LONGITUDINALES

El rasgo diferenciador esencial entre un estudio de seguimiento y otro


de casos y controles es la característica de identificación sobre la base
de la cual se determinan los sujetos. Para los estudios de seguimiento.
esta caracteristica es algún antecedente de enfermedad potencialmente
-J etíológico (la exposición) y para los de casos-controJes es la ellferme-
dad. Algunas veces. pueden llevarse a cabo estudios en los que se
incluyen los individuos como sujetos, sin tener en cuenta ni la exposición
ni la enfermedad.
Si se enrola a una población en un estudio y luego se sigue a los
individuos que están libres de enfermedad para medir la ocurrencia de
ésta, estaremos ante un estudío de seguimiento de población general. Un
estudio que incluyera como sujetos a todas las personas que están en la
~ población en el instante de la determinación, incluidos los que padecen
la enfermedad, es conocido generalmente como un estudio de ,\'ección
i transversal. Aunque con frecuencia se les presenta como diferentes tanto
de los diseños de seguimiento como de loS casos y controles, se les puede
conceptualizar como el ani1!ogo. en casos y controles, del estudío de
seguimiento de población general. Los casos son series de prevalencia de
individuos que poseen la enfermedad y los controles, lo que resta de la
población en estudio. Habitualmente, la información de exposición se
determina simultáneamente con la información de enfermedad: tal clasi-
ficación coincidente en el tiempo, de la gente con respecto a la exposición
ya la enfermedad, se piensa que es la esencia de un abordaje de sección
transversal. Sin embargo, la investigacíón tiene normalmente más senti-
do cuando el investigador considera la categorización de exposición en
relación con el período de tiempo que seria etiológicamente relevante
para la enfermedad en curso, es decir, en relación con un período de
inducción que tenga, a su vez, sentido.
Los estudios de sección transversal tratan a veces de exposiciones
que no pueden cambiar, como el grupo sanguíneo u otras característícas
82 EPIDEMIOLOGIA MODERNA

personales invariables. Para tales exposiciones, una información puntual


es tan útil como cualquier otra. Para exposiciones variables, sin embargo.
tal información momentánea puede ser menos deseable que otra infor-
mación sobre el pasado que fuera más relevante desde el punto de vista
etiológico. En un estudio sobre la etiologia del c;incer respiratorio que
comparase información del hábito de fumar en casos, no casos. los
hábitos tabáquicos de los sujetos en ese instante no serían de tanta
importancia como sus historia al respecto. Un aborda.je de secci()!1
transversal ante tal cuestión podría ser considerado como un estudio de
casos y controles que tuviese un grupo control excesivamente grande
(porque poca gente en la población padecerá cáncer respiratorio) y con
una información acerca del hábito de fumar proviniente de un período
I
de tíempo inapropiado.
Aunque la información del momento puntual suele ser demasiad()
reciente como para ser significativa en relación a etiologias, ocasional-
mente existe .justificación adecuada para su uso. Si hay alguna razón
para creer que se da una buena correlación entre la exposición actual y
la pasada exposición de interés y se considera probable que el recuerdo
de exposiciones previas no fuese de fiar, podria ser razonable valorar el
.~lalus de exposición del momento como un indicador aproximado de la
exposición que nos interesa. Los estudios sobre preferencias dietéticas, I
por ejemplo, suelen recoger información detallada sobre el momento,
porque con ella se puede obtener información precisa sobre el consumo
de alimentos, mientras que el recuerdo sobre información dietética ha-
bria sido probablemente vago y poco fiable. Los estudios dependientes
de la exposición presente, cuando la exposición previa es la importante.
se resentirán obviamente en su validez en la medida en que la exposición
previa difiera de la actual.
I
Idealmente, pues, la investigación etiológica debería ser siempre 1011-
giludinal y no de sección transversal; es decir, se debe tener en cuenta
siempre un período de tiempo entre la exposición y el comienzo de la
I
enfermedad que se corresponda con un periodo de inducción coheren-
te. En los estudios de seguimiento, el intervalo se acomoda restringiendo
la acumulación de experiencia persona-tiempo en el denominador de las I
tasas de incidencia para los expuestos, al período de tiempo tras la
exposición que corresponde a los limites del posible período de induc-
ción. En los estudios de casos y controles. por su parte. el intervalo se
acomoda relacionando con la enfermedad el slalu.~ de exposición en un
momento que antecede al comienzo de la enfermedad en una cantidad
que, de nuevo, corresponda a los límites del posible período de inducción.
Supongamos que se estuviera estudiando si la exposición al moquillo
canino, en el perro de uno, causa esclerosis múltiple y el periodo de
inducción (hasta el momento del diagnóstico) se asumiera que está entre
diez y vienticinco años. En un estudio de seguimiento, los individuos
I
expuestos no contribuirían al cómputo de persona-tiempo a riesgo hasta
diez años después del momento en que el animal tuvo el moquillo. Esa
contribución a la experiencia de riesgo comenzaria a los diez años y I
~
TIPOS DE ESTUDIO EPIDEMIOLOGICO 83

duraría quince más (la duración del intervalo de tiempo de la inducción)


o menos. si el sujeto fuese retirado del seguimiento (porque él o ella
muriera. se perdiera o fuese diagnosticado de esclerosis múltiple). Sólo si
la enfermedad fuese diagnosticada durante este mismo intervalo-, se con-
sideraría que estaba potencialmente relacionada con la exposición. En
un estudio de casos y controles, por su parte, los casos de esclerosis
múltiple serían clasificados como expuestos si su perro hubiera tenido
moquillo durante el intervalo entre diez y veinticinco años antes del
díagnóstico de esclerosis múltiple. Si la exposición al moquillo ocurrió
fuera de esta ventana de tiempo, el caso sería considerado no-expuesto.
Los controles serían preguntados con referencía a un período de tiempo
comparable y se les clasificaría de una manera similar.
Un ejemplo de esta técnica fue un estudio de casos.y controles sobre
estenosis pilórica, que examinaba el papel de la exposición al Bendectin
en los primeros meses de la gestación (Aselton el al., 1984). Se asumieron
como «ventanas» diferentes lapsos de tiempo de una semana de dura-
ción al principio del embarazo. Los datos indicaron que la exposición
durante la semana 5 o después de la semana 12 conducia a un riesgo
relativo estimado de menos de 2.0, en tanto la estimación era de 3.0 o
mayor para la exposición al Bendectin durante las semanas comprendi-
das entre la sexta y la doce. El efecto máximo, con un riesgo relativo de
3,7, fue estimado para la exposición durante las semanas ocho y nueve
después de la concepción. Este ejemplo ilustra cómo los análisis epide-
miológicos pueden ser usados para definir un estrecho período de acción
causal, incluso si a priori se sabe poco s9bre tal período. Si se hubiese
llevado a cabo sólo un análisis, usando una única definición de exposi-
ción en lugar de este abordaje, poca o ninguna información sobre la
relación temporal entre exposición y enfermedad se hubiese conseguido,
y el cálculo del efecto máximo habría resultado probablemente subesti-
mado.
Como se dijo anteriormente al discutir la definición de cohorte,
incluso si no existe un conocimiento específico acerca del período de
inducción, el tema debe ser contemplado a pesar de todo. Es importante
para un investigador darse cuenta de que no se puede realizar ningún
estudio epidemiológico ni análisis de datos en este área para evaluar
t
causa y efecto sin hacer asunciones, explícitas o implícitas, sobre la
i
relación temporal entre la exposición y la enfermedad.
Cualquier sistema que clasifique a los individuos como enfermos o i
no enfermos en relación a alguna exposición, se basa en asumir algo
sobre el tiempo de inducción. Si un estudio de casos y controles incluye ~
~
como exposición relevante cualquier historia de exposición ocurrida
desde el nacimiento (o concepción) hasta el diagnóstico, incluirá induda-
blemente algún período que carezca de interés para la exposición de que
se trate, diluyendo el efecto de la exposición importante. Si un estudio de
sección transversal relaciona la exposición actual con la enfermedad (el
comienzo de la cual puede, incluso, haberse anticipado en fecha a la
exposición), está incluyendo igualmente una asunción sobre el período

~
I
8~ EPIDEMIOLOGIA MODERNA

de inducción. A menudo ésta permanece implícita y oscura. Si se quiere


realizar una buena investigación, no obstante. ha~. que hacer explícítas
las cosas que se asume y evaluarlas en la medída de lo posible. Un paso
en esa dirección consiste en entender los estudíos de sección transversal
con exposícíones que varían en el ticmp(l como estudios de casos ~'
controles. en los que se asume específicamcnte un tiempo de inducción
de cero.
Cualquier cosa que sea )o que se asume acerca de] período de induc-
ción, afectará a los resultados del estudio. porque las asunciones no
a.justadas producen un tipo de clasificación incorrecta que tiende a
reducir la magnitud de las asociaciones ~. a subestimar los efectos. Este
período puede ser usado para aprender acerca dcl periodo dc inducción.
como demuestra el estudio sobre 1~1estenosis pilórica: repitiendo el
análísis de los datos, al tiempo que se \'(lrían los límites que se asignan a]
citado período de inducción, es posible determinar qué asunción acerca
de éste lleva a una estimación mayor del efecto. El período de inducción
asumido que dé un mayor estimado del efecto será e] que me.jor describa.
sobre la base de los datos del estudio que se tiene en manos, el aspecto
temporal de la relación etiológica que se investiga, presumiendo. por
supuesto, que exista esa relación etiológica (Rothman, 198 I ).

ESTUDIOS DE MORTALIDAD PROPORCIONAL

Un e,frudio de morralidad proporcional incluye sólo su.jet()s muertos. La


proporción de sujetos expuestos muertos a los que se ha asignado una o
más causas específicas de muerte. es comparada con una proporción
correspondiente de sujetos muertos no expuestos, Como medida del
erecto de la exposición se adopta la resultante ra::ón de morralidad
proporcional, abreviada muchas veces como RMP, A simple vista, la
comparación entre proporciones de su.jetos que mueren dc una c:lusa
específica en un grupo expuesto )' otro no expuesto se parece a un
estudio de cohorte que midiera incidencia acumulada. El p:lrecido. sin
embargo. es engañoso, porque un estudio de mortalid:1d proporcional
no incluve la identificación de las cohortes. Todos los sujetos están
muertos ~n el momento de entrada al estudio, por lo que no l~ay períod()
de seguimiento.
I
La premisa de los estudios del tipo qllC nos ocllpa es que. si la
exposición causa (o previene) una enfermedad ratal específica, deberá
haber proporcionalmente más (o menos) muertes por esa causa entre la
gente muerta que estuvo expuesta que entre la que no lo estuvo. Está
claro que este razonamiento tiene un fallo importante: la medida de la
RMP no puede distinguir entre el efecto de un:1 exposición que previnie-
ra la muerte en algunas categorías y el de otra que causaba la muerte en
otras categorías, o alguna mezcla de tales acciones {McDowall. 1983),
Por ejemplo, un estudio de mortalidad proporcional podria hallar un I
exceso proporcional de muertes por cáncer entre grandes consumidores

)
TIPOS DE ESTUDiO EPIDEMIOLOGICO 85

de aspirina, comparados con personas que no usasen la aspirina. pero


este hallazgo podría ser atribuible a un efecto preventivo de dicho
fármaco sobre las muertes cardiovasculares, que componen la gran ma-
yoría de las muertes no debidas a cáncer. Una asunción impllcita en
todo estudio de mortalidad proporcional consiste en que la tasa de
mortalidad global por categorias que no sean las que se estudian, no está
relacionada con la exposición.
La ambigüedad a la hora de interpretar una RMP no es necesaria-
mente un defecto fatal, puesto que la medida abrirá muchas veces vías
que valdrá la pena explorar acerca de relaciones causales. En muchas
situaciones puede resultar que sólo fuesen de interés una o unas pocas
estrechas categorías de muerte y podría juzgarse no plausible el hecho de
que una exposición afectara sustancialmente a las restantes categorias
que forman el grupo de referencia. Algunos epidemiólogos han argumen-
tado que quizá incluso sería deseable evaluar desviaciones respecto de la
frecuencia de muerte relativa, en lugar de diferencias absolutas en la
mortalidad (Kupper el al.. 1978), pero la fundamentación de ese punto
de vista no está basada en consideraciones biológicas.
Muchas de las dificultades que surgen al interpretar los estudios de
mortalidad proporcional pueden mitigarse si se los considera como una
variante de los estudios de casos y controles. Hacerlo, requiere concep-
tualízar una población combinada de individuos expuestos y no expues-
tos en la que se dieron los casos; los casos son los muertos, tanto
expuestos como no expuestos, en la categoría o categorías específicas de
interés. Hasta aqui, la descripción podría ser la de un estudio ordinario
de casos y conlrolcs basado en casos fatales. La distinción proviene de
las series de control. El principio para seleccionar una serie de controles
es escoger individuos que representan a la población base de donde han
salido los casos, con objeto de conocer la distribución de la exposición
en el seno de esa población. En lugar de muestrear a los controles
directamente de entre la población base, nosotros podemos sacar una
muestra de las muertes que se producen en ella, puesto que la distribu-
ción de la exposición entre las muertes muestreadas es la misma que la
de la población base -es decir, la exposición no debe estar relacionada
con las causas de muerte de los controles (McLaughlin el al., 1985).
Esta estipulación es la fuente de los problemas de interpretación de una
RMP, pero si mantenemos in menle los objetivos de una selección de
controles, se hace claro que no vamos a estar abocados a seleccionar
como controles otra cosa que todas las muertes de las categorias desig-
nadas como casos. En su lugar, podemos seleccionar una calegoria
especifica o un grupo de categorías especificas de muerte, escogidas
sobre la base de una presumida falta de asociación con la exposición. De
esta forma, otras causas de muerte para las cuales se conoce, sospecha o
simplemente parece plausible, una relación con la exposición, pueden ser
descartadas. El principio que subyace tras la selección de las categorías
de muerte controles, para incluírlas en el estudio, es idéntíco al principio
de seleccionar una serie de control en cualquier estudio de casos y

~~~~it:~~ f~.,,:"~:~~ ~~::~


86 EPIDEMIOLOGIA MODERNA

controles. Las muertes de las categorías no incluídas como parte de las


series de control deberían ser excluidas del estudío o probablemente
tratadas como grupos de casos alternativos.
,
El tratar un estudio de mortalidad proporcional como si fuese de
casos y controles puede. de esta forma, resaltar la validez dc las compa-
raciones que se hacen. Por otra parte, al analizar los datos como datos
ordinarios de un estudio de casos-controlcs )' centrarse en la odd.'\ ralif)
(o «razón dc ventaja»), las habituales medidas epidemiológicas del erecto
que pueden obtenerse en dichos estudios de casos )' controles pueden
ser objeto de inferencia (Wang y Miettínen. 1982). La claridad concep-
tual que resulta de considerar los estudios que nos ocupan de la forma
que se ha explicado, permite elimínar el término «estudio de mortalidad
proporcional» del léxico de los epidemiólogos )', con él. el uso de la
inelegante razón de mortalidad proporcional.

ESTUDIOS ECOLOGICOS

Todos los tipos de estudios descritos hasta el momento comparten la


característica de que las observaciones realizadas pertenecen a personas
individuales. Resulta posible llevar a cabo investigaciones en las que la I
unidad de observación sea un grupo de gente y no un individuo; tale.,;
estudios son llamados ecológico.,". Los grupo.,; pueden ser clase.,; de una
escuela, fábricas, ciudades, regiones o naciones. El único requisito nece- I
sario es que se pueda disponer de información sobre las poblacione.,;
estudiadas, para medir cada población con respecto a la exposición y la
enfermedad. Las medidas preferibles para cuantificar la ocurrencia de Ii
enfermedad en poblaciones son la incidencia o la mortalidad. La exposi-
ción se mide tambíén mediante algún índice global; por ejemplo, los
datos regionales sobre el consumo de alcohol pueden sacarse de los
datos de los impuestos que pagan las bebidas alcohólicas, la información
I
sobre el ,,"lalus socioeconómico de los distritos geográficos. a partir de
los censos que se realizan cada diez años, y los datos del medio ambiente
(temperatura, calidad de aire y todo lo demás), pueden obtenerse local o
I
regionalmente.
Debido a que en los estudios ecológicos, los datos se basan en
mediciones a las que se saca la media para poblaciones enteras. el grado I
de asociación entre exposición y enfermedad es, por lo general, más
tenue. Además, el haber utilizado medidas aproximadas de exposición
(por ejemplo, datos de impuestos por alcohol, en vez de datos de consu- I
mo) y enfermedad (mortalidad, en vez de incidencia) atenúan aún más
las asociaciones. Las mayores dificultades de los estudios ecológicos, no
obstante, provienen habitualmente de la falta de disponibilidad de los
datos considerados necesarios para controlar el efecto de confusión en el
I
análisis. Un inadecuado control de éste, junto a asociaciones que de
entrada están atenuadas, producen resultados que pueden ser de cuestio-
nable validez. El problema de las inferencias inadecuadas a partir de
I
TIPOS DE ESTUDIO EPIDEMIOLOGICO 87

datos ecojógicos ha sido denominada «la falacia ecológica» (Morgens-


tern, 1982) (véase también Cap. 14). Pese a tales problemas, estos estu-
dios han sido útiles para describir diferencias en poblaciones: incluso
aunque estuviesen confundidas por factores desconocidos o incontables,
tajes diferencias señalan al menos la presencia de un efecto que vale la
pena seguir investigando.

REFERENCIAS

Aselton. P.. Jjck. H., Chentow. S. J., et al. Pyloric stenosjs and maternal Bendec-
tjn exposure. ,4m. J. Epidemio'. 1984; 120:251-256.
Beebe. G. W. Ref1ectjons on the work of the Atomic Bomb Casualty Com-
mission in Japan. Epidemio'. Rev. 1979; 1:184-210.
Byar, D. P., Sjmon, R. M., Friedewald, W. T., et al. Randomized cljnjcal trjals.
Perspectjves on some recent ideas. N. Engl. J. i\1ed. 1976; 295:74-80.
Cole, P. The evolvjng case-control study. J. Chron. Di.r. 1979; 32:15-27.
Detre. K. M., and Shaw. L. Long-term changes of serum cholesterol with
cholesterol-altering drugs in patients with coronary heart djsease. Cjrcu-
'alión 1974; 50:998-1005.
Dykes. M. H. M.. and Meier. P. Ascorbic acid and lhe common cold. Evalu-
ation of its emcacy and toxicjty. J.A.j\.{.,4. 1975: 231:1073-1079.
Francis, T. F., Korns. R. F., Voight, R. B., et al. An evaluatjon of lhe 1954
poljomyeljtjs vaccjne triaJs. Am. J. Puh'jc Heallh 1955: 45[May Suppl.J: 1-63.
Greenland, S. Response and follow-up bias in cohort studjes. Am. J. Epidemio'.
1977; 106:184-187.
Greenland. S., and Thomas. D. C. On the need for the rare djsease assumption
in case-control studies. Am. J. Epidemio'. 1982: 116:547-553.
1 Kannel. W. B., and Abbott, R. D. Incjdence and prognosis of unrecognized
myocardiaJ infarction. An update on the Framingham study. N. Eng'. J.
l\1ed. 1984; 311:1144-1147.
Karlowski, T. R.. Chalmers, T. C.. Frenkel, L. D., et al. Ascorbic acid ror the
common cold. A prophylactic and therapeutic trial. J.A.¡\.{.A. 1975:
231:1038-1042.
Kolata. G. Heart study produces a surprise result. Science 1982: 218:3r:.32.
Kupper. L. L., McMichael. A. J.. Symons. M. J.. et :ll. On the utility of propor-
tional mort:llity analysis. J. Chron. Di.r. 1978: 31: 15-22.
Leren. P. The eITect or plasma cholesterol lowering diet in male survivors or
myocardial infarction. Ac(a !\1ed. Scan{i. [Suppl.J 1966: 466:5-92.
Lubin. J. H., and Gail. M. H. Biased selection of contro¡s ror case-control
analyses of cohort studies. Bi()me(rics 1984; 40:63- 75.
McKay, A. M.. and Rothman. K. J. The incidence and severity or burn injuries
rollowing Project Burn Prevention. ,4m. J. Puh'ic Hea'lh 1982; 72:248-252.
MacMahon. B. Stregths and limitations orepidemiology. En Natíonal Academy
of Sciences. The Na(ional Re.rearch Council in '979. Washington. D.C.:
Natjonal Academy of Sciences. 1979.
McDowall. M. Adjusting proportional morta¡jty ratios for the inf1uence of
extraneous causes of death. S(al. Med. 1983:- 2:467-475.
McLaughlin. J. K.. Blot. W. J.. Mehl. E. S., et al. Problems jn the use or dead
controls il1 casc-control studjes. I. General rcsults. A,l1. J. Epi{lell1io'. 1985:
121:131-139.
88 EPIDEMIOLOGII. MODERNA

Mjettinen. O. S. Estimabjlity and estjmation in case-referent studies. Am. J.


Epidemio¡. 1976; 103:226-235.
Morgenstern. H. Uses of ecologic anaJysis in epidemiologic rescarch. Am. J.
Pub¡ic Hea¡lh 1982; 72:1336-1344.
Paddic, G. M. A strategy for the identification of carcinogcns in a largc. com-
plex chemical company. En R. Peto and M. Schncidcrman [eds.J (B~nhury
Report No.9), Quanl((¡calio11 o.r OCCIlpaliO1lal Cancer. Ncw York: Cold
Spring Harbor Laboratory, 1981.
Peto. R. Pike. M. C.. Armita2e. P.. et al. Desi2n and analvsis of randomizcd
c¡inical trials requering pr~longed observali~n or cach patient. I. lntroduc-
tion and design. Br. J. Cancer 1976; 34:585-61.:..
Poole. C. Exposure opportunity in case-conlrol studies. Am. J. Epid('",i(}l. 1986:
122. En imprenta.
Rothman, K. J. lnductjon and latent periods. A,l,. .J. Epid('m;(ll. 1981: 114:253-
259.
Sheehc, P. R. Dynamic risk anal~'si~ in retrospcctivc m:1tched pair sludie~ or
disease. Biomelric.~ 1962; 18:323-341.
Snow, J. 011 lhe Mode of Communicalion of Chol('ro (2nd ed.). London: John
Churchill, 1860. Facsímil de la edición rejmpresa en 1936 por Hafner. Ne\\"
York, 1965).
Szmuness, W. Hepatitis B vaccine. Demonstration of cmcacy in a controllcd
clinical trial in a high-risk population jn the Unjted States. !\;. Engl. J. Med.
1980; 303:833-841.
Wang, J., and Miettinen, 0. S. Occupational morlalit)' studies: prjnciplcs of
va¡idit)'. Scand. J. r.flork Environ. Heallh 1982; 8: 153-158.

-J
7. OBJETIVOS DEL DISEÑO
DE ESTUDIOS EPIDEMIOLOGICOS

Todo estudio epidemiológico debe ser entendido como un ejercicio de


medición. Esta sencilla forma de verlos aporta. en si misma. una guia
firme a la hora de planificarlos, llevarlos a cabo e interpretarlos. Entre
los objetivos específicos de todo estudio epidemiológico debe estar
siempre el obtener estimaciones de una de las previamente descritas
medidas de ocurrencia de la enfermedad o del efecto, o de algún de-
rivado de las mismas. Los objetivos de un estudio se expresan a veces
de forma cualitativa: por ejemplo, «conocer si el consumo modera-
do de alcohol diariamente durante el embarazo produce bajo peso al
nacer». Algunos científicos se muestran reacios a hablar con tanta ligere-
za de causa y efecto; pero un atrevimiento asi en el enunciado de
hipótesis y en la descripción de objetivos de un estudio, vale para
mantener firmemente enfocada la auténtica meta y es, por tanto, muy
preferible a hacer insípidas afirmaciones sobre «asociación» en lugar de
«causa». Por lo demás, un objetivo cuya formulación, de tipo cualitativo,
comenzase «conocer si...» será más débil que una afirmación del tipo
«determinar la proporción de niños nacidos con un peso por debajo de
los 2,5 kg en relación con las mujeres que consumen cantidades modera-
das de alcohol diariamente». Se puede resaltar aún con más detalles este
enunciado de los objetivos, pero la distinción esencial que nos ocupa
está entre formular un objetivo cualitativamente (por ejemplo, contestar
«si» o «DO» a una pregunta) o hacerlo cuantitativamente (medir algo).
El parámetro especifico a medir debe quedar claro. explícita o implí-
citamente, a partir del enunciado de los objetivos del estudio. En algu-
nos, el objeto a medir puede ser simplemente una tasa de incidencia o
cualquier otro cálculo de la frecuencia de enfermedad en una población.
En muchos otros, lo que se trata de medir es el efecto de algún agente o
característica, y los parámetros de interés pueden ser la diferencia o la
razón de incidencias entre los expuestos y no-expuestos al factor en
estudio. Si el estudio es de esos complejos en que los objetivos son. por
ejemplo, «evaluar la medida en que la acción carcinogénica de fumar
tabaco sobre la mucosa oral está innuenciada por el consumo crónico de
89
7. OBJETIVOS DEL DISEÑO
DE ESTUDIOS EPIDEMIOLOGICOS

Todo estudio epidemiológico debe ser entendido como un ejercicio de


medición. Esta sencilla forma de verlos aporta. en si misma. una guia
firme a la hora de planificarlos, llevarlos a cabo e interpretarlos. Entre
los objetivos específicos de todo estudio epidemiológico debe estar
siempre el obtener estimaciones de una de las previamente descritas
medidas de ocurrencia de la enfermedad o del efecto, o de algún de-
rivado de las mismas. Los objetivos de un estudio se expresan a veces
de forma cualitativa: por ejemplo, «conocer si el consumo modera-
do de alcohol diariamente durante el embarazo produce bajo peso al
nacer». Algunos científicos se muestran reacios a hablar con tanta ligere-
za de causa y efecto; pero un atrevimiento asi en el enunciado de
hipótesis y en la descripción de objetivos de un estudio, vale para
mantener firmemente enfocada la auténtica meta y es, por tanto, muy
preferible a hacer insípidas afirmaciones sobre «asociación» en lugar de
«causa». Por lo demás, un objetivo cuya formulación, de tipo cualitativo,
comenzase «conocer si...» será más débil que una afirmación del tipo
«determinar la proporción de niños nacidos con un peso por debajo de
los 2,5 kg en relación con las mujeres que consumen cantidades modera-
das de alcohol diariamente». Se puede resaltar aún con más detalles este
enunciado de los objetivos, pero la distinción esencial que nos ocupa
está entre formular un objetivo cualitativamente (por ejemplo, contestar
«si» o «DO» a una pregunta) o hacerlo cuantitativamente (medir algo).
El parámetro especifico a medir debe quedar claro. explícita o implí-
citamente, a partir del enunciado de los objetivos del estudio. En algu-
nos, el objeto a medir puede ser simplemente una tasa de incidencia o
cualquier otro cálculo de la frecuencia de enfermedad en una población.
En muchos otros, lo que se trata de medir es el efecto de algún agente o
característica, y los parámetros de interés pueden ser la diferencia o la
razón de incidencias entre los expuestos y no-expuestos al factor en
estudio. Si el estudio es de esos complejos en que los objetivos son. por
ejemplo, «evaluar la medida en que la acción carcinogénica de fumar
tabaco sobre la mucosa oral está innuenciada por el consumo crónico de
89
90 EPIDEMIOLOGIA MODERNA

alcohol», se hace necesario mencionar explicitamente el parámetro que


se va a usar (algún indice de interacción} puesto que los epidemiólogos
no han alcanzado aún acuerdos sobre la forma idea] de medir tales
interacciones. Si los objetivos del estudio están más claros. como podria
ser «evaluar el grado en que la toma de una aspirina diaria áisminuye e]
riesgo de padecer un primer infarto de miocardio». resultará bastante
seguro presumir que el ob.ieto a medir seri\ alguna comparación (me-
diante diferencia o razón), ya sea de tasas de incidcnciu ('1de incidcncia~
acumuladas. La premisa inicial. que se está midiendo algo, hace que
tant('1 el análisis del estudio como 1,1 presentación de los datos deban
seguir caminos especificos.
Cuando uno está revisando o leyendo un estudio epidemiológico, lo
primero que debe hacer es escudriñar la formulación de objetivos para
conocer el objeto de medición que dicho estudio sc plantea. Cuando se
es el autor, la primera prioridad ha de ser formular los oh.ietivos dc
forma clara )' cuantitativa, para de.iar sentado el parámetro que se quiere
medir. Cualquier estudio que tenga los objetivos deficientemente .concep-
tualizados será, ip.\"0-:facto, de calidad endeble. El proceso de" refinar una
formulación de objetivos que hubiera sido planteada con vaguedades,
agudiza no sólo dicha formulación de objetivos en sí, sino también la 1
comprensión por parte del investigador o del lector .
La meta fundamental que debe perseguir un estudio epidemiológico
es la agudeza en la medición: estimar el valor del parámetro que es
objeto de medida con poco error. Las fuentes de error en la medición
permiten clasificar a éste como o bien GI('Grnrin o bien .\"i.\"teI11áric(}.
Los
principios del diseño de estudios emergen con claridad cuando .c;cconsi-
deran abordnjes distintos con el objeto de reducir ambos tipos de error
de medición.

PRECISION (CARENCIA DE ERROR ALEATORIO)

L~D'.ecis¡Ól1 en las medidas epidemiolt)gicas se correspondc con la


r~~~Q~ p~l. -~[.r2I debido ~J.~-:?S!I:Puede ser me.iorada de dos formas: la
fundamental consiste-en-lñcrementar el tamaño del estudioi,se la puede
mejorar también modificando el diseño, para aumentar la eficiencia con
que se obtiene la información de ese número dado de sujetos sometidos
a estudio.
¿,Qué es exactamente el error aleatorio? Mucha gente cree que el azar
juega un papel fundamental en todos los fenómenos fisicos y, por impli-
caciÓn, también biológicos. Para algunos, esa creencia es tan dominante
que confiere a los acontecimientos por azar un papel importante como
causa componente de todo )0 que experimentamos. Otros creen que la
caus~lidad debe ser contemplada de manera determinista, queriendo
decir con ello que si se consigue identificar plenamente los factores
relevantes de un conjunto dado de circunstancias. se llega sin dilación.
tras analizarlos suficientemente. a una predicción perfecta de los efectos
OBJETIVOS DEL DISEÑO DE ESTUDIOS EPIDEMIOLOGICOS 9'

que resultan de tales causas. Bajo este punto de vista. pues. toda expe-
riencia está predestinada a desplegarse de manera teóricamente predecible
y cursa. inexorablemente, según patrones de acción previos. Incluso con
esta extremadamente determinista \fisión, sin embargo, es insignificante
la posibilidad que el hombre posee de adquirir suficiente conocimiento
como para predecir efectos con exactitud, en cualquier cosa que no sean
patrones triviales de causa-efecto. La impredecibilidad de determinados
resultados los hace indistinguibles de sucesos ocurridos al azar. Es posi-
ble, por tanto, poner en pie una descripción unificadora de esta imprede-
cibilidad, que haga el error aleatorio equivalente a la ignorancia acerca
de los determinantes en una situación dada/jDicho en pocas palabras. el
error aleatorio es esa parte de nuestra experiencia que no podemos
predecir,l,¡En principio. anticipar el resultado de una moneda lanzada al
aire representa un problema de fisica, cuya solución es factible mediante
la aplicación de leyes fisicas. La inadecuada información, no obstante,
provoca habitualmente que el resultado de nuestras predicciones no sea
distinguible de las conjeturas hechas al azar. Si las fuentes de variación
que no podemos explicar son realmente debidas al azar, o no, es algo
que nos da la mismo: nosotros deberemos tratar esa variación como
debida al azar en tanto no podamos exlicarla y, por tanto, reducirla,
relacionándola con factores conocidos.
j El error aleatorio en un estudio epidemiológico tiene muchos com-
ponentes, pero uno de los más notorioil'es el proceso de selección que
sigan los sujetos específicos del mismo. Se suele llamar habitualmente a
este proceso el I11lleslreOy al error aleatorio concurrente error mlleslral.
Los estudios de casos y controles implican un proceso de muestreo
como tal, pero todos los estudios epidemiológicos {incluidos los de
seguimiento, que no exigen muestreo real de sujetos), se dice que tienen
error muestral. La explicación es que dichos sujetos de un estudio,
muestreados en la realidad o no, son considerados como una muestra
figurativa de la población hipotética que podría haber sido involucrada
en el mismo. Los sujetos incluidos, pues, son una muestra de la experien-
cia biológica de una población conceptual más amplia. Por esta raz.ón. el
dicho estadístico de que no hay error de muestreo cuando se estudia una
población entera, contraponiéndolo a cuando se sacara de ella una
muestra, no se aplica a los estudios epidemiológicos, aun si, como se ha
dicho, se incluye en el estudio una población completa. Conceptual-
mente, por tanto, )os sujetos reales son siempre una muestra.

TAMAÑO DEL ESTUDIO

~ La principal manera de reducir el error aleatorio o, lo que es lo mismo,


\\ incrementar la precisión en un estudio epidemiológico, es aumentar el
\ tamaño del estudio. Un método que se usa para ver si éste es adecuado,
, consiste en calcularlo sobre la base de fórmulas estadísticas del «tamaño
92 EPIDEMIOlOGIA MODERNA

de'una muestra» (Schlesselman. 1974: Rothman \' Boice. 1982 I. Dichas


rórmuias relacionan el tamaño del estudio con lás siguientes variables:
1. Ni,'el de «significación estadística» (crror al fa).
2. Probabilidad de no detectar un erecto rea] (error beta}.
3. Magnitud del erecto.
4. Tasa de enfermedad en ausencia de exposición (o prcvalenciu de
exposíción en ausencia de enrcrmedad/.
5. Tamaño relativo de jos grupos comparados (es decir. razón de
sujetos expuestos a no-expuestos, o de casos a controles).
Las fórmulas para calcular el tamaño de un estudio especifican las
dimensiones que se necesitan para detectar un erecto de magnitud postU-
lada. para un nivel de significación, error beta y tuc.io lo demás. dados. EJ
encanto cuantitativo dc cáiculos así les otorga un falso rigor, que puede
dar pie a errores. Los investigadores podrian sucumbir demasíado fácil-
mente a la tentación de creer que la apariencia de precisión de un
cálculo de tamaño señala con exactitud una demarcación entre tamaños
de estudio que vale la pena contemplar y otros que serian insuficiente-
mente grandes. Semejante diferenciación no existe en la realidad. El nivel
\\de significac!ó.n es completamente arbitrario y ~I error bc~a también lo
es. IncJuso SI estos se fijasen en valores convencIonales, i.como se deter-
minaría la magnitud del erecto? Mediante un juicio arbitrario. a menos
que la investigación sobre el tema en cuestión fuese ya bastante sólida.
en cuyo caso el estudio no iría a añadir mucho¡\De manera similar. 1~1
estimación de la prevalencia de exposición o de la tasa de cníermedad es
frecuentemente objeto de conjeturas. Con tantas decisiones y estimacio-
nes arbitrarias, el número al que se llega a partir de las fórmulas está
su.ietQ a considerable manipulación, como todo investigador espabílado
sabe.
Uri. método con algo más de información para decidir el tamaño
\ deseable de un estudio consiste en usar cálculos de la po1L'l1cia. La
~potencia es el complemento del error beta: es la probabilidad de detectar
(como «estadísticamente significativo») un nive] dc erccto postulado.
Para un erecto distinto de cero, ]a potencia de un estudio se aproxima a
1.0 conforme aumenta el tamaño de] mismo. Resu]ta fácil para lo,<;
distintos nive]es de erectos postulados construir curvas de potencia de,<;-
plegando en la gráfica la potencia contra el tamaño. Tajes curvas sumi-
nistran una indicación de la capacidad de información que tendria un
determinado estudio. de poseer un tamaño e.<;pecífico)' son por ello más
útiles para planificar éstos que un simple cálculo del tamaño de la
muestra, aunque la misma ecuación, manipulada algebraicamente, puede
ser usada para calcular ya sea la potencia o el tamaño.
Una familia de curvas de potencia, utilizadas para planificar un
estudio que detectase los diferentes valore.<; del riesgo relativo, podría
tener el aspecto de la que se muestra en 1a figura 7.1. Dichas curvas
indican la potencia de estudios de los tamaños dados para detectar
(como «estadísticamente significativos» ) los valores indicados del efecto.
('ig.7.1. Curva.\" de pof('l1cia para un esflldio de ca.\"o-confrol COl1lm mimero igual
tle ca.\"os )' controle.\" (/Ilfa = 0,1; prevalencia de e.'\"posición = 0,3).

Las curvas de la figura 7.1 muestran también gráficamente la medida en


que habria que aumentar el tamaño del estudio para conseguir una
mayor polencia, a los distintos niveles de riesgo relativo. El uso de estas
curvas de polencia, a la vez que es más informativo que los .fueros
c~ílculos del lamaño de un estudio, comparte, sin embargo, algunos de
sus mismos inconvenientes. Examinar familias de curvas en lugar de una
única, para una potencia y un nivel de efecto especificados, climina del
proceso de pl~lnificación gran parte de la arbitrariedad, aunque sigue
estando presente la arbitrariedad que significa apoyarse en un nivel dado
de «significación estadística». La superfici~\lidad del concepto de «signifi-
cación estadística» ~ll ~\plicarlo i.\ la epidemiología. será examinada luego:
baste por ahora Con poner énfasis en que, mientras al calcular una
potencia o un tamaño se clasifica a loS estudioS como «con éxito» o «sin
éxito» en tanto determinan si un efecto es «estadísticamente significati-
vo», resulta inapropiado considerar que loS estudios «no significativos»
carezcan por completo de información o tengan incluso «error» (como
cuando se dice que tienen error beta). En un abordaje de la planificación
a base de cálculos Como éste, se hallan inherentes muchas sobresimplifi-
caciones: cuando se calcula cualquier tamaño O potencia, temas como I~l
relación dosis-respuesta, la confusión, la clasificación incorrecta. la inter-
acción y otros, son, por lo general, ignorados, pese a que dich~\s cuestio-
94 EPIDEMIOLOGIA MODERNA

nes pueden afectar a la capacidad de información de un estudio en gran


medida, hasta el punto de volver superficiales juicios basados en cálculos
de tamaño o incluso en curvas de potencia.
La deficiencia esencial que padecen las consideraciones sobre tam~lño
o potencia de un estudio es que pueden ser vistas como si consistiesen
sólo en una forma de esquivar lo que constituye el tema centr31 dc este
capítulo; a saber, la precisión. El interés fundamental dc un cicntífic()
está en la medición y tener precisión en la medición implica la capacidad
de obtener valores replicados que difieran poco entre si. porque el error
aleatorio que les afectase fuese pequeño. Preocuparse por la precisión es
preocuparse por la variabilidad aleatoria de lo que uno mide. Es bien
sabido que puede aumentarse la precisión incrementando el tamaño deJ
estudio, pero la idea de reducir la variabilidad en 13 medición se encuen-
tra oscurecida en los cálculos de potencia o de tamaño. que se centran en
la detección y la comprobación estadisticas, en vez de en la precisión a!
medirj'Estos últimos conceptos están relacionados con 13 precisión sólo
de forma indirecta. Por ejemplo. cuando no hay una relación postulada
entre exposición y enfermedad, los cálculos de la potencia no se pueden
realizar ()', por tanto, no hay nada que «detectar»); por el contrario, el
tema de la precisión no deja de ser importante para el investigador que
planifica un estudio, aunque tuviese motivos para pensar de antemano la
posibilidad de que el efecto va a ser cero.
Una forma más satisfactoria de estimar la precisión de un estudio
consiste en plantear los datos del mismo y calcular la precisión de
estimados del efecto, justo como se haria en el análisis de los datos.
mediante el uso de intervalos de confianza. Esta via, igual que el c;ilculo
de potencia o del tamaño dc la muestra. requierc realizar algunas asun-
ciones arbitrarias sobre la magnitud del efecto y el nivel de confianz~l.
pero tiene algunas ventajas claras//f.n primer lugar, es factible incluso
para efectos iguales a cero. Segundo, libera el investigador de tener que
pensar en términos de «significación estadistica» al planificar el es-
tudio. .
Existe, adicionalmente, un sentido más profundo en e] que todos los
juicios son arbitrarios cuando se planifica el tamaño de un estudio. Las
consideraciones a este respecto discutidas hasta aquí son todas ellas dc
tipo técnico, y fracasan a la hora de tener en cuenta el valor de la
información obtenida. .¡.La decisión clave al planificar cl tamaño de un
estudio, y consecuentemente la precisión del mismo, es la de dcter-
minar cómo sopesar el valor de una mayor precisión en sus resulta-
dos frente a un costo más elevado. Esta decisión equivalc a realizar un
análisis de coste-beneficio entre gastar mayores esfuerzo.<; o fondos a
cambio de conseguir mejor precisión. Una mayor precisión tiene valor
para los beneficiarios de la investigación, pero ese tal valor es indetermi-
nado, puesto que siempre resultará inseguro calcular cuántos beneficia-
rios habrá, ahora y más adelante. Consecuentemente, el problema del
coste-beneficio carece de solución; sólo son factibles conjeturas informa-
les sobre el tamaño que deberia tener un estudio epidemiológico para ser
)'

OBJETiVOS DEL DISEÑO DE ESTUDIOS EPIDEMIOLDGICOS 95

eficiente, en relación Con un determinado coSto. Tales conjeturas pueden


incorporar, a partir de las curvas de potencia, información acerca del
estudio que se ha planificado. pero incluyen también aspectos intrinca-
doS de multitud de factores sociales. políticoS y biológicoS que no son
meras consideraciones técnicas susceptibles de ser incardinadas en una
ecuación. En último análisis, la cuestión del tamaño más apropiado para
un estudio no es una decisión técnica que deba ser determinada median-
te el cálculo, sino que constituye un juicio, y son la experiencia, la
intuición y el discernimiento quienes lo realizan.

EFICIENCIA DEL ESTUDIO

Un estudio de seguimiento de 100.000 hombres para determinar la


magnitud, si la hubiere, de reducción de la mortalidad cardiovascular
debida al consumo de una aspirina diaria, podría considerarse que
tendría una buena precisión por el simple hecho de ser tan grande. Si
nos enterásemos. no obstante, de que sólo 100 de esos hombres tomaban
la aspirina diariamente, tendríamos que revisar nuestra opinión, porque
la información de dichos 100 sujetos expuestos no seria sustancial, pese
al hecho de tener los 99.900 restantes para comparar. Si descubrimos,
además, que todos los hombres tenían entre treinta y treinta y nueve
años, revisaríamos otra vez nuestra opinión sobre la precisión del estu-
dio, porque de hombres por debajo de los cuarenta años de edad se
puede obtener poca información acerca de enfermedades cardiovascula-
res. Si todos los que tomaban aspirina estaban entre cuarenta y cuarenta
y nueve años, pero los demás pasaban también todos de los cincuenta, la
eficiencia del estudio estaría, finalmente, severamente en solfa, depen-
diendo de cómo se manejara en el análisis esta no-superpOñible diStribu-
ción por edades. .'
\ Existe una variedad de aspectos del diseño que afectan a la eficiencia
de un estudio y que a su vez afectan a la precisión dc los resultados del
mismo. Entre ellos se encuentran la proporción de sujetos expuestos, la
proporción de sujetos que han desarrollado o desarrollarán la enferme-
\ dad y las dístribuciones de los sujetos de acuerdo a variables clave que
: deben ser controladas en el análisis.
La eficiencia de un estudio puede ser juzgada según dos escalas
diferentes. Una, relaciona el contenido tot~ll de información de los datos
con el número total de sujetos (o cantidad de experiéncia persona-
'\ tiempo) del estudio. La segunda, el contenido total de información con el
\.costo de adquirirla. AIgúnas opciones en el diseño del estudio mejoran el
contenido de información por sujeto estudiado, pero sólo a cambio de un
¡incremento en el costo: el apareamiento individual es un ejemplo de ello.
ti/' La cuestión de la eficiencia se valora mejor juzgando la información en
/ relación con su costo, en lugar de en relación al número de sujetos
estudiados, que no es en sí mismo un interés de primer orden.
96 EPIDEMIOLOGIA MODERN/I

v ALIDEZ (CARENCIA DE ERROR SISTEMATJCO)

La validez de un estudio se puede desagre~ar h;lbitualmcnte cn d()~


componentes: la validez de las inferencias extraidas. en tanto pertenecen
a ¡os sujetos rea¡es de estudio (vaiidl?: ill1ernaj: ~. la \'alidcz de esas
inferencias en tanto se ap¡ican a la gente que est~1 fuera de la poblaciol"'.
en estudio (vaiide.: e.\lerna o genl?rali=ahili(la(I;. Ba.io ta] esquema. I,!
validez interna es c¡aramente un prerrequisito para que rueda darse la
externa. Esta manera de dicotomizar la va¡idez puedc tencr implicaci()-
nes poco afortunadas para el proceso inferenci~1l. dado quc p~lrcce poncr
el énfasis en un abordaje mecánico consistenten en «aplic~lr» los resulta-
dos del estudio a otras «poblaciones diana» par;1 el proccso de gencrali-
zacion científica. Una visión más adecuada, descrita después. se basaría
en que la esencia de ¡a generalización científica es la formulación de
conceptos abstractos relacionados ('()n ¡os factores en estudio, conceptos
que en si mismos no están ligados a pob¡aciones específicas. La validez
interna de un estudio sigue siendo un prerrequisito para que el mismo
contríbuya de forma úti¡ al proceso de abstracción, pero el de generaliza-
ción está, por lo demás. separado de ¡as preocupacíones de la valide7
interna y de la mecánica del diseño del estudio. En este texto se usa 1;1
terminología de validez interna y externa, pero ha~: que llevar en I~I
mente las diferencias entre los do~ citado~ procesos.

VALIDEZ INTERNA

La validez interna implica validez de inferenci:1 para los propios su.ietos


del estudio. Específicamente implica, errores aleatorios aparte. una medi-
ción a.iustada. \iarios tipos de sesgo pueden disminuir la validez intern~:
Sackett ( 1979) ha enumerado docenas de sesgos posiblcs. susccptibles de
distorsionar la estimación de una medida epidemiológica. La distinci()n
entre estos sesgos resulta a \reces dificil de hacer. pero pueden idcntilicar-
se tres tipos generales de el1o.i1sesgo de selección, sesgo de información :
confusión. Tales categorías ¡no siempre están claramente delimitadas:
factores que parecen ser responsables de un sesgo de selección pueden
también ser considerados, bajo ciertas circunstancias, como factores de
confusión. Para terminar, una útil distinción pr{lctica entre la confusión
~' los otros sesgos consiste en considerar a éstos como confusión si se les
puede controlar en el análisis de los datos: en el capítulo 8 se discuten los
métodos que se utilizan para enfrentarse a ellos.

SESGO DE SELECCIÓN
El contenido esencial de un estudio cpidemiológico e¡; la comparación de
enfermedades o de frecuencias de exposición entre dos o mil¡; grupos. Un
sesgo de selección es un" distorsión del erecto medido: result" de I()s

'--
procedimiento~.utill!:::l-dos p~lr:.1 seleccionar sujetos. que condllcirian ~l
unae-.mm-áclon del efecto. entre los-¡ncliiidos eil el estudio. distinta Jei
estim~ldo obtenible p~lr~l I¿l población entera. te()ricamente considerada
diana del mismo.
Un~l v~lriante de tal sesgo es cl dc lllIIV,\.('I('('ci(jll. CU~ll1dos los Ccntros
de Control de EI1fermedades (CDC. eñlng~lñVCstigaron I¿l incidencia
subsiguiente de leuccmia entre las tropas que h~lbian estado presentes Cl1
la prueba atómica Smoky, en Nevada (C:.1ldwcll t!1 ([I., 1980), se logró
.-
seguIr el rastro al 76 por 100 del total de tropas identificad~ls como

miembros de dicha eohorte. Al 82 por 100 dc estos sold~ldos les h~lbi~ln


seguido la pista los investig~ldores. pero cl 18 por 100 restante de «ras-
tre~ldos» contactaron ellos por propia inici~ltiva con los responsables.
como respuesta a la publicidad que se hizo de la investig~lción. ESt~l
~Iutoderiv~lci()n dc sujctos es considcr~lda ordin~lri~lmente una ~lmen~lZ~l
para la v:.1lidcz. pucsto que las r~lzones p~lr~l Ilcv~lrl¿l :.1c~lbo podri~ln estar
asoci¿ld¿lS con el result~ldo quc se estudi~l (Criqui t!1 ([1., 1979). En el
estudio de Smoky. por cjcmplo; hubo cu~ltro CaSOSde leucemia entre el
IR por 100 de sujetos que se dcriv~lron ~l si mismos. y otros cuatro entre
el 82 por 100 ~l los que ios investigadores h~lbi~ln seguido la pista. lo que
puso de m:.1nifiesto que la autodcrivación fue realmente un problema en
el cstudio cn cuestión.
La autoselección puede producirse igualmente antes de que los suje-
tO~ sean identificados p~lra el estudio. Por ejemplo, encontrar que la
mortalidad de los obreros en activo es menor que I~l de la pobl¿lción en
conjunto es ya rutinario (McMichael. 1976: Fox y Collier. 1976). Este
«efecto del obrero sano» se deriva, presumiblemente, de un proceso de
despistaje. quiz~ís autoselección en su mayor parte, que permite ~l gente
relativamente sana convertirse en (o mantenerse como) obreros. en ttlnto
los que permtlnecen desemple:.1dos, retirados. incapacitados o de tllgún
otro modo rUertl de la pobltlción trabajadora ~lctiva son, como grupo.
menos sanos. .

Otro tipo de sesgo de selección que ocurre antes de que los suje(os
sean identificados para el estudio es el .\"(',\"go(li([,1;111áslico(Sackett. 1979).
Cuando se il1vestigtlba por primera vez la relación entre anticonceptivos
orales y tromboembolismo venoso medi¿ll1te es(udios de casos y contro-
les de pacientes hospitalizados, existió ya preocuptlción por el hecho dc
que alguntlS de ~lquelltlS mujeres hubiertln sido hospittllizadas con Ul1
diagnóstico de tromboembolismo venoso debido a que sus mcdicos
sospechasen relación el1(re esta enfermedad y los al1ticonceptivos ortllc~.
de forma que htlbían indagado sobre la toma de estos medicamentos Cl1
las pacientes que presentaban síntomas sugestivos (Sartwell ('I (II.. 1969).
Estudiar a ptlcientes hospittllizadas con tromboembolismo, por ttlnto.
podría dar como resultado un estimado extlgerado del erecto de los
anticonceptivos orales sobre esta enfermedad, si la hospitalización y I~l
determinación del diagnóstico hubiesen estado inl1uenciadas por la his-
toria de uso de los anticonceplivos orales.
Se pueden describir muchas variedades del sesgo de selección. El
9S EPIDEMIOLOGIA MODERNA

clcmento que todas tienen en común es qllr la rclación entre exposición


y enfermedad es diferente para los que participan y para aquellos que
serían teóricamente elegibles para el estudio. pero no participan (Grecn-
land, 1977). La cuestión central fue correctam~nte sumarizada por
Greenland *:

((El scsgo de selccción cs unn posibilidad tcórica siemprc quc. aJ princi-


pio del estudio, existan cn algunos indi\.iduo~ corrclalo.~ dei resultad",
capaces de influenciar la participación dc ésto~ en e! mj~mo. Talcs
correlatos pueden ser no medidos ° incluso no rcconocidos por c!
investigador. Surge entonccs In cuestión: i.haSI;\ qué punto cs probable
que exista un importantc e[ccto dcl ses[!o en una situación dc estudiC'
dada? Responder a estc! prc~unt3 requicrc u~a:- c()nocimienl(\ dc Mlu-
raleza sub.ictiva para dcrivar juicio cpidcmioló!!ico acerca dt: ],:
..razonabiiidad" dc la existencia dc un !;esgo asi.»

SESGODE INFORMACIÓN
Una vez identificadas las series que ha)' que comparar, dc~ proccder~e ¿l
obtener la inrormación que será sometida a comparación. 1\1 cvaluar un
efecto, el sesgo puede darsc a causa de errores comctidos en ]a obtenci¿)n
de la información que se precisa. Un sesgo de inrormación puede produ-
cirse siempre que haya errores en la clasificación de los su.ietos, pero ]as
consecuencias del mismo son direrentes se~\ln ~i el error de clasificación
en un eje de ]a misma (sea la expo~ición o ]a enrcrmedad) es. () 110.
independiente de la clasificación en el otro ejc. La exi~tcl1cia de errores
de clasificación que no son independientes dcl otro c.ic sc conocc com('
clasi(icación incorrecta di(erencial, en tanto a la existencia dc errores dc
clasIficación, sea para ]á exposición o para la enrcrmedad, que son
independientes respecto del otro eje se ]a llama cla.\"((icación incnrreclll
no di(erencial.
S.upongamos que se pone en marcha un estudio dc seguimient() par:~ .
comparar las tasas de incidencia de enfi~ema entre rumadores ~. no
fumadores. El enfisema es una enrermedad que puede permanecer sin s~:
diagnosticada si no hay una atención médica no habituaj. Si los fumad(l-
res, a causa de tener preocupación por los erectos del tabaco sobre su
salud o como consecuencia rea] de otros erectos que el rumar les puedc
producir (como la bronquitis). buscan atención médica en un grado
mayor que los no-fumadores, e] enfisema podría ser diagnosticado más
frecuentemente entre ellos que entre los n()-rumadores, simplemente C()-
mo consecuencia de una mayor atención médica. I\ menos que se diesen
pasos para asegurar un seguimiento comparable. se produciría un sesgo
de inrormación: se encontraría entre los fumadores, en comparación con

.Greenland estaba escribiendo sobre los e.l;tudios dc seguimienl(). pcro si cn 10!; c!;llldio~
de caso!; y controles el «resultado» !;e con!;idcra !;er una expo!;ición. cl punto !;C le$ aplica
igualmente bien a cllos.
OBJETIVOS DEL :)ISEÑO DE ESTUDIOS EPIDEMIOLOGICOS ?9

los no-fumadores. un «exceso» de incidencia de ~nfisema qt:e no está


relacionado con ningún efecto biológico del fumar. Este es un e.iempio de
clasificación incorrecta diíerenciJI. puesto que ~l hecho de que se sub-
diagnostique el enfisema. un error de clasificación incorrecta. ocurre más
frecuentemente para los no fumadores que para los fumadores. Sackett
( 1979) lo ha descrito como un sesgo de diagnóstico. pero a difcrencia del
de los estudios de anticonceptivos orales y trombocmbolismo. descrito
antes, no es un sesgo de selección, dado que ocurre enlre sujetos ~'a
incluidos en el estudio. No obstante, vale la pena hacer notar las simili-
tudes entre algunos sesgos de selección y los sesgos de clasificación
incorrecta diferencial.
En estudios de casos y controles sobre malformaciones congénitas. la
información etiológica podria ser obtenida mediante e:ltrevista con las
madres de niños m~llformados. tomando como controles ;1 madres de
niños sanos. Resultaria asi otra variedad de clasificación incorrecta dife-
rencial. conocida como 5(.,5g0 J(' m(!1110rill. si las madres de los niños
malformados recordasen sus exposiciones de forma m:'\s completa que
las que tuvieron niños sanos. Se supone que el nacimiento de un niño
malformado sirve de estímulo para que una m~\dr~ rememore todo
acontccimícnto que pudiera h.\ber jugado algt¡n p.¡pel cn tan desc\fortu-
nado desenlace. T.¡les mujeres. presumíblcmcnte. recOrdar~ln cxposicío-
nes del típo de una enfermcd~\d infeccíosa. un lrauma o un.1 toma de
medicamentos m~ts aju.<;tadamente que 1.15m~tdre.<; dc niños s~tl1o.<;.que no
tcndrian un estímulo comparablc par~l h~lcerlo. En consccuencia. 1:\
información sobre esas exposiciones s.¡ldr:'l a col~\ciól1 m~ls frecuentc-
mente por parte dc las m~ldres de níños m.\lform~ldos. con lo que surgir~l
un supuesto efccto a partir de este se.<;go de rccuerdo y no relacíon~ldo
con efecto bíológíco alguno. El sesgo de memori~l es una posibilidad en
cu.\lquier estudío de casos y controles que utilíce una respuesta anamné-
sica, puesto que. por delinición. los casos y los controles son gente que
difieren con rcspecto a su experiencía de enfermed~\d, y esta díferenci~\
puede afectar lo que se recuerda. Klemcttí y S.\xen ( 1967) encon lrárol1
que la duracíón dcl tíempo transcurrido entre I~l exposición y e! recuerdo
cra otro importante indicador de la exactitud dc c.<;te: ~lquellos estudios.
por tanto, cn los quc el tiempo medio transcurrido desde que se produjo
la exposición fuese diferente para los casos entrevist3dos y para los
controles, podrian sufrir un~l cl.lsificación íncorrecta diferencial.
L.1 cjasific~lción incorrecta diferenci.ll puede d~\r como result~ldo un
sesgo de inform~lcjón que exagere o subestime un erecto. En los cjemplos
~lnleriores, la cl.1sific~\ción incorrecta sirve p,lra exagerar los ercctos SO-
metidos ,1 estudio. pero no es difIcil im,lginar ejemplos en sentido contr.\-
rlo.
Otro tipo de problema de mala clasificación puede ocurrir cuando
una clasificación de exposición o enfermedad es incorrecta para iguales
proporciones de sujetos en los grupos comparados. Esta clas(li('acit)'l
iI,corr('cta llo-dif('r(lllcial ha sido. considerada. por lo gener~ll, como una
amenaza para la validez menor que la diferencial, puesto que el se.'\go
,00 EPIDEMIOLOGI¡, MODERNA

que introduce va siempre en una dirección predecibie: haci~ I~ condición


nula (Bross. 1954: Copeiand el al.. 1977). Considerese. como e.iempio. un
estudio de seguimiento que comparase la incidencia de cimcer iarin!!eo en
bebedores de alcohol con la incidencia en abstemios. Asumamos a-uc lo~
bebedores tienen realmente una incidencia de 0.00050 añ(I-- I. en. tanto
los ab$temio~ la tienen de 0.00010 añ(l- I (sólo] ,'S de I-! antcriori. A",u-
mamo., que ~:'3 de I~l población estudio son bchcdorcs. pcro sólo e] 50 por
] 00 de ello~ lo reconoce. El resultado es una pobiaci(>n cn ia quc ] !3 dc
ios sujetos están identificados (correctamente) como bcbedores )' poseen
una incidencia de enfermedad de 0.00050 año- !. pero ios .?,13restantes
están formados a partes iguales por hcbedores ~. no bebcdores, entre lo~
cuajes ja incidencia media va a ser de 0.00030 año- !, en vcz de 0.0001(\
año- ! (Tabla i.l). Ej efecto, si se le estima en tcrmino~ absolutoS. ha sido
reducido por la clasificación incorrect,l de 0.00040 ai1o- ¡ a 0,00020
año-1;en términos relativos, la razón de incidencia se h~ reducido de 5
a 1.7. Este sesgo hacia el valor nuio resulta de un,l clasificación incorrec-
ta no diferencial de algunos bebedores de alcohol com(\ no-bebedores.
Tal clasificación incorrecta puede ocurrir simultáneamente en ambas
direcciones; es decir, puede haber abstemios incorrectamente clasificados
como bebedores. En el e-iemplo, si además de que la mitad de los
bebedores estuviesen incorrectamente clasificados como abst~mios, I !3

Tabla 7.1. E.r(.clo d(' la cia.\"(I¡cació11 i11Corr('(./ (I 11n di;rr('11('i(l1 d('1 cn11.\"11/71n
d(' alcohol .\"obr(' IlJ e.\"limació11 d(' 1(1 d(r('re11(.i(1 .1. ItJ ra;(j11 d(' IlJ.~(1.v
d(' incid('11cia d(' cá11('('r laringen ( d(lI().\" hi!'nli.,icn.\")

Tasa de
J
Difcrencia
Razón de
incidcncia de tasas
ta$a$
x 10~ año) x IO~ año)

No clasificación incorrecta
1.000.000 bebedores 50
40 5.0
500.000 abstemios ]0

La mitad dc los bebedores clasilica-


dos como abstemios
500.000 bebedores 50
20 1.7
1.000.000 «abstemios» (el 50 niv 30
son en realidad bebedores)
La mitad dc los bcbedores clasifica-
dos como abstemios )' 113 de los
abstemios clasificados
dores 00 como bebe-

666.667 «bcbcdores» (cl 25 n;., son 40


en realidad abstemios) 6 .,
833.333 «abstemios» (el 60 n/'nson 34
en realidad bebedores)
OgJETIVOS DEL :>ISEÑO DE ESTUDIOS EPICE~..'IOLOGICOS '0'
-
áe los abstemios estuviesen igualmente m:ll clasjllcados como hchedore-".
las tasas resultanles serían de 0.00040 año- 1 para 10s «bebedores» ~'
0.00034 año- 1 para los «abstemios». L:.l clasificac¡ón incorrect::1 sumaro-
ria ha borrado casi completamente la diferencia ~xistenle entre ¡os gru-
pos.
Cuando existe un efecto. pues, el sesgo por c!asific~lCiól1 il1correct~ no
diferencial de ¡a cxposicíón siempre se produce c:-: la direcci()n del valor
nulo. La clasificación incorrecta no diferencial de la enfermed.ld es
ligeramente más complicada. En los estudios de c~sos y controle-". en los
que los sujetos son inicialmente seleccionados segíln la padezcan o no, la
citada malclasificación no diferencial de .'ilall(.'i de enfermedad también
introduce un sesgo hacía el valor nulo. En los de seguimiento. sin
embargo. el efecto de la clasificación incorrecta no direr;ncial depende
de la medida del erecto que se esté estimando y de la dirección en que
ocurra la clasificación incorrecta en cuestión -esto es. sobredimensiona-
miento o infradímensionamiento-. Es m~ls frecuente este ílltimo. Si sólo
se reconocen y contabilizan como tales una proporción de los c~so-"
reales. pero esta proporción es igual rara los grupos expuestos y no
expuestos y no se da sobrecontabilización. la medida de razón de tasas
no se ve arectada. La direrencia de tasas. por el contrario. estará se-"g.ld.l
hacia el valor nulo: especific::\,mente, el eslim~ldo será igual al valor sin
sesgo multiplicado por la proporción de casos contabilizados. De habcr
sobrecontabilización. los casos de interés se diluyen con sujetos adicio-
nales que no padeccn I~l enfermedad. Si tales sujetos están añadidos con
proporcionalidad a los tamaños totales de los denominadores de expue-,,-
tos y no expuestos, el resultado en principio deberá ser un estimado de la
diferencia de tasas sin cambio. pero una r.azón de tasas, por el contrario.
con sesgo hacia el valor nulo.
Dado que el sesgo de la clasificación incorrecta no diferencial \'a
siempre en dirección al valor nulo, no ha constituido históricamente
motivo de grave preocupa-ción para los epidemiólogos, que. por lo' gene-
ral' han considerado más aceptable subestimar !os erectos que sobreesti-
marlos. A pesar de cllo, la clasificación incorrecta no dirercncial es un
problema serio: el sesgo que introduce e.,<pJica probablemente much.ls
discrepancias entre estudios epidemiológicos. Muchos estudios tratan la
información de una manera que garantiz~ un grado sustancial de Cl.1Sifi-
cación incorrecta. Por ejemplo. supongamos que la aspirina reduce mo-
mentáneamente el ries¡ro de infarto de mioc.lrdio. La p.llabra /llcll1/('llltí-
!lealllellle implica un p~riodo de inducción bre'.'e. Cu.llquier estudio que
considerase el uso de la aspirina por ruera del estrecho inter\dlo de
tiempo antes de la ocurrencia de un infarto dc miocardio. como exposi-
ción , estaria clasificando incorrectamente dicho uso de la droga: - existe
un uso de la aspirina relevante al propósito que nos ocupa y otro que es
irrelevante, porCJuc no permitiría actuar causalmente a la exposición.
bajo la hipótesis causal, con su período de inducción especificado. ~1u-
chos estudio~ preguntan .lccrca de «haber us.ldo» (haber usado en .llgu-
na ocasión a lo largo de la vida de un individuo) una droga u otra
102 EPIDEMIOLOGIA MODERNA

exposición. Tales índices acumulados en el tiempo de vida de un indivi-


duo mezclan de forma inevitable las exposiciones posiblemente relevan-
tes alIado de las irrelevantes, introduciendo un sesgo hacia el valor nulo
a través de una clasificación incorrecta no diferencial.
En los estudios de seguimiento en que existen categorías de enferme-
dad con pocos sujetos, los investigadores se sienten ocasionalmente
tentados a combinar tales categorías de resultados para incrementar el
número de sujetos en cada análisis, ganando supuestamente con ello en
precisión. Este refundido de categorías constituye un error serio. La
ganancia en precisión se produce al precio de un sesgo casi garantizado
en la estimación de la razón de tasas, sesgo que puede hacer ininterpre-
tables los resultados del estudio o conducir a interpretaciones erróneas.
Por ejemplo, Smithells y Shepard (1978) investigaron la teratogenicidad
del medicamento Bendectin, una droga indicada para la náusea durante
el embarazo. Como sólo nacieron en su estudio de seguimiento 35 niños
con una malformación, centraron sus análisis en el resultado único
«rnalformación». Pero no existe un teratógeno único que cause todas las
malformaciones; si su análisis no consiguió encontrar un efecto, el fallo
pudo haber sido simplemente resultado de haber agrupado muchas
malformaciones que no estaban relacionadas con el Bendectin con las
que sí lo estaban. De hecho, a pesar de la pretensión de los autores de
que «SU estudio aporta una prueba sustancial del que el Bendectin no es
taratógeno en el hombre», sus datos indicaban una relación fuerte (aun-
que imprecisa) entre ese medicamento y las malformaciones cardiacas.
De estudios en que se agrupa un amplio abanico de resultados sin
relación etiológica, lo más probable es que sólo salgan afirmaciones
carentes de fundamento acerca de una ausencia de efecto.
Hasta cierto punto, el sesgo hacia el valor nulo que una clasificación
incorrecta no diferencial introduce está operando, prácticamente. en
todo estudio epidemiológico. Tal sesgo es un motivo serio de preocupa-
ción, en particular cuando se interpretan estudios que parecen indicar
ausencia de efecto. Consecuentemente, en estudios que indican poco o
ningún efecto, resulta crucial para los investigadores tener en cuenta el
problema de la citada clasificación incorrecta no diferencial, para deter-
minar en qué medida podría haberse oscurecido un efecto real. Alterna-
tivamente, la preocupación acerca de dicha clasificación incorrecta no
diferencial carece de justificación en estudios que describan un fuerte
efecto no-cero. Los críticos de un estudio argumentarán, alguna que otra
vez, que datos de exposición pobres (o una pobre claisificación de enfer-
medad) pueden invalidar los resultados, pero este argumento es incorrec-
to, como se ha dicho, si los resultados indican un efecto no-cero. Tal
clasificación incorrecta, es cierto, puede introducir un sesgo, pero éste se
producirá siempre en la dirección de subestimar el efecto.
La importancia de apreciar la dirección del sesgo proviniente de una
clasificación incorrecta no diferencial fue bien ilustrada por la inter-
pretación de un estudio sobre espermicidas y defectos .de nacimiento
(Jick el al., 1981). Dicho estudio referia un aumento de la prevalencia de
OBJETIVOS DEL DISEÑO DE ESTUDIOS EPIDEMIOLOGICOS 103

algunos tipos de desórdenes congénitos entre mtljere~ a las que se identi-


ficÓ como que habian retirado una pre~cripción para espermicidas du-
rante un intervalo especificado antes del nacimiento. La infor~ación de
exposición mostraba llnicamente una corrclaci()n gr()~cra con clu~o real
de espermicidas durante el periodo de tiempo teóricamente relevante.
pero la malclasificación que resultó fue no diferencial. puesto que la
información de prescripción estaba registrada en una terminal de com-
putadora antes de que se supiera el resultado. Una de las críticas que se
hicieron al estudio fue que las inexactitudes sobre la información de
exposición generaba dudas sobre la validez de los hallazgos (Felarca (.'1
al., 1981: Oakley, 1982). Fuese cual fuese el sesgo que esto producía.
conducía a una subestimación del efecto real en cuestión. por lo que
semejante crítica no es apropiada (Jick ('1 al., 1981a).
Hablando en general. pues. es incorrecto desdeñar un estudio que
informase de un efecto. simplemente por el hecho de tener una clasifica-
ción incorrecta no diferencial sustancial, puesto que la estimación dei
efecto sin esa malclasificación sería incluso mayor. dado que ésta se
aplica uniformemente a todos los sujetos. Por tanto, las implicaciones de
-) una clasificación incorrecta no diferencial dependen fuertemente de si el
estudio es percibido como «positivo)) o «negativo)). El poner énfasis en
las mediciones y no en la descripción cualitativa de. los resultados del
estudio, disminuye la probabilidad de malinterpretación. pero incluso
i asi, es importante tener en mente las probables direcciones y magnitud
~
del sesgo.
~
I
CONFUSIÓN «<confounding», en los textos en inglés)*

] El concepto de confounding es ccntrnl en la epidemiologia moderna. Aun-


que el fenómeno se da también en la investigación experimental, es un
tema considerablemente más importante en la no-experimental. Como
consecuencia, la comprensión del concepto de confusión sólo se ha
desarrollado recientemente, en paralelo con el auge de la investigación
no-experimental. Sería conveniente describir el tema que nos ocupa en
torno a sus rasgos fundamentales, primero. e ir grndualmcnte luego a
una definición más refinada.
A su más simple nivel, la confusión puede ser considerada como una
mezcla de efectos. El estimado del efecto de la exposición de interés.

.Dada la gran c~ca~cz tic tcxto~ cn castcllano quc hayan Iratlucido esle Icrminn. traducir In
era una de las deci~iones má~ tlilicllcs tic adoptar. Finalmente me ha parecido preferible hacerlo.
por entender que no hay ra1:\)n alguna para utilizar "jerga" y privar :II Icctor "ordinario» en c~pañol
de unas posibilidadcs quc el equivalente angloparlanle si po~ee en ~u idioma. Debe quedar claro. en
todo caso. que la ralabra "confounding» no ~e reficre al /'¡¡.r{n (quedar aturdido. no .~aher qué
hacer. ...; la palabra cquivalente en inglcs ~eria "conrusión»1 ~ino all!c{" " acr;¡," (estar oscureciendo.
ocultando algo. «embrollado» en definitiva...I. Confounding. como ~ustantivo. no aparece en cl
"Oxford Dictionary of Current English»~Oxford University Press. 1985. Sí aparece \'confound» =
perplex. baffie. confu~e (pág. 150). rN. (1('1 T.J

r-
'04 EPIDEMIOLOGIA MODERNA

específicamente, estará distorsionado por estar mezclado con el efecto de


un factor extraño. La distorsión introducida por un factor de confusión
puede llegar a ser grande y puede conducir a la sobreestimacion o
subestimación de un efecto, según la dirección dc la~ asociacioncs que
dicho factor de confusión tenga con la exposición y la enfermed.ld. La
confusión puede, incluso. cambiar la dirección aparente dc un efecto.
La idea de que un factor extraño cambie la dirección de una asocia-
ción ha sido llamada «Parado.ja dc Simpson)'. Supongamo~ que un
hombre entra en una tienda para comprarsc un sombrero y encuentra
una estantería con 30, 10 de ello~ negros y 20 grises. Descubre que 9 de
los 10 negros le están bien, pero que de los 20 grises sólo le están bien 17.
Por tanto. toma nota de quc la proporción de sombrcros ncgros que le
cuadran es del 90 por 100. mientras que entre los grises es sólo del S.'i
por 100. En otra estanteria de la misma tienda encuentra otros 30. 2\)
negros y 10 grises. En ella. 3 (15 por 100) de los sombreros negros Ic van
bien, y de los grises, sólo 1 (lo por 100). Antes de quc esco.ia el suyo. la
tienda.cierra como final de jornada y él vuelve a la mañana siguiente.
Durante la noche, el empleado ha apilado todos los sombreros en la
misma estantería: ahora ha)' en ella 30 de c(lda color. El cliente recuerda
que, el día anterior, la proporción de sombreros negros que le est:.lbal1
bien era mayor en ambas estanterías. Hoy se da cuenta de que aunque
tiene delante los mismos sombreros. cu~\ndo se les mezcla sólo el 40 por
100 (12 de 30) de los sombreros negros le esttln bien. mientras que de los
grises es el 60 por 100 (18 dc 30). Aunque cste curioso c~lmbio es
conocido como la Parado.ia dc Simpson. el fenómeno no es re:.llmcntc
una paradoja; no se contravienen ni la lógica ni ninguna dc las premisas.
Este fenómeno es análogo al de confusión. que puede distorsion~lr una
asociación. incluso hasta c! punto de cambiar su dirección (I{othman.
1975). .
Para que un factor extraño confunda. dche tcner un efccto: es dccir.
el factor debe ser predictivo de la ocurrencia de enfermedad. No es
necesario que tal efecto sea causal: lo más frecuente, de hécho, es que
únicamente se identifique como factor de confusión a correlatos dc
f(lctores causales. Un ejcmplo comlll1 es la clase soci(ll. presumiblemcntc
relacionada en sí misma de manera causal con pocas, si es quc con
alguna. enfermedades, pero que es un correlato de much~ls causas de
enfermedad. Similarmente. algunos entienden que la edad. que está rcla-
cionada con casi todos los procesos patológicos. es en sí misma sólo un
marcador artifical de cambios biológicos más fundamentales. Desdc este
punto de vista. la edad no seria un factor de riesgo caus(ll. pero sí. sin
embargo, un potencial factor dc confusión en muchas situaciones.
Un factor de riesgo extraño es dc confusión sólo si sus efectos
devienen mezclados con el efecto ba.io estudio. (La confusión puedc
ocurrir. incluso, si el factor que se estudia tiene efecto cero. La expresión
«mezcla de efectos» no se pretende que implique que la cxposición
sometida a estudio tenga un efecto no-cero. En sentido contrario. si el
factor extraño carece de efecto --es dccir. si no está asociado con la
OBJETIVOS DEL DiSEÑO DE ESTUDIOS EPIDEMIOLOGICOS 105

enfermedad-, no causari1 distorsión all!una I.:n el estimado <.Icl efecto de


la exposición.) L:l mezcla de los erectos-surge. por tanto. de una asocia-
ción entre la exposición y el factor extraño. Por ejemplo. consideremos
un estudio para dctcrmin[lr si los hchcdorcs dc alcohol expcrimcnt[ln
una mayor incidcnci[l de ci1ncer de boca que los abstcmios. El fumar es
un factor extraño que está relacionado con la enfermedad (fumar produ-
ce un efecto sobre la incidcncia de cáncer or[ll) v esti1 tambicn asociado
con el beber alcohol. puesto que hay mucha geníe que son «[lhstinentes»
en general y evitan el consumo de [t!cohol. el fumar, y quizás otros
hábitos. Consecucntemente. los bebedores de alcohol incluyen entre ellos
una proporción dc fumadores mayor de la que se encont~aria entre los
no bebedores. Puesto que el fUm[lr aumenta la incidenci[l del cáncer dc
boca. las perSOn[lS que hcben alcohol prc$cntarian una incidencia de éste
mayor que l[lS no hehedoras. independientcmente de ninguna innuencia
del hecho en sí de beber alcohol, simplemente como consecuencia de 1[1
mayor cantidad dc con$umo de tabaco entrc díchos hchcdores, De esta
forma. el erecto visible de hcber alcohol estará distorsionado por el crecto
de fumar: los dos efectos apareccn entreme7cI:ldos si se compara simplc-
mente a los bebedores de alcohol con los que no )o son. El grado de
sesgo o distorsión depende de 1[1magnitud del erecto que tenga el rumar.
así como de la ruerza dc 1[1asociación entre el alcohol v el citado hi1hito.
Tanto la ausencia de erecto sobre 1[1 incidencia de cftncer de hoca por
parte del rumar como la ausencia de aSOCi[lCión entre el fumar y 1[1
ingesta de alcohol conducirían a una no-conrusi()n. Para ser un factor de
confusión,
con ínsistimo$.
el consumo el fumar debe estar asociado con el C{lncer oral .y
de alcohol.

) Dicho en términos generales, para que esté conrundíendo. un r[lctor


de confusión debe hallarse asociado a la vez con la exposición que se
\ ~studia y con la cnrcr~cd.ad que se cstudía, .Es necesari?: sin embargo.
! Imponer algunas restrIccIones a e.c;ta amplIa formulaclon de J[lS dos
; asociaciones que definrn a un ractor de conrusión. c

Sí la exposición sometida a estudío po~ee un erecto. cualquicr corre-


lato suyo estar{l también asocíado con la enrermed[ld. como consecuen-
cia de tal asociación con un r[lctor de riesgo para esa enrcrmcdad. Por
ejemplo, supong[lmOS que el consumo frecucntc de cerveza est[\ a~oci[ldo
con el consumo de pizza. y ~upongamos tamhién que el consumo rre-
cuente de cerveza cs un factor de riesgo par[l el ci1ncer de recto. i.Seri[1 el
consumo de pizza un f¡lctor de confusión'? 1\ primera vista. p[lrecería que
la respuesta es si, puesto que el consumo de pizz[\ e.c;til [lsoci[ldo tanto
con el bcber alcohol como con el c{lncer rect[ll. Pero si dicho consumo
de pizza estuviese asociado con el cáncer rectal ",ólo de forma secundaria
a su ,1sociación con el consumo de cerveza. no sería f[lctor de conrusi()n,
Un factor de confusión dcbe ser predictivo de la ocurrencia de enferme-
dad aparte de su asociación con la exposición: es decir, incluso entre los
individuos no expuestos, debe la variahle potencialmente confu.<;ora est[lr
rel[lCionada con el riesgo de enfermar. Si el consumo de pizz[1 fuese
predictivo de cáncer rectal también entre los no hehedores de cer,'eZ¡l. si
'06 EPIDEMIOLOGIA MODERNA

sería factor de confusión. De estar asociado con el cáncer rectal sólo a


partir de su asociacíón con el consumo de cerveza. insistimos. 110 ¡(,
seria. (La situación en que una variable es factor de ricsgo de enferma;-
únicamente entre los indi,7iduos expuestos es aquella en que se da inter-
accíón entre la exposición y otra variablc. Este tcml\ se toca en e:
capítulo 15: no produce sesgo).
Análogamente a esta restricción que se impone I\ la asociación cntrc
un potencial factor de confusión ~. la enfermedad. el factor de confu.~iór¡
debe estar asociado con la exposición entre la pobiación de donde
surgen los casos )7 no meramente entre dichos casos de enfermedad.
como consecuencia de que ambas variables fuesen factorcs de riesgo
para padecer la enfermedad.
Es también importante clarificar qué se entiende por el términ<)
e.~lraño en la expresión «factor de riesgo extraño». Este término implica
que la capacídad predictiva del riesgo de enfermedad incluye un meca-
nismo distínto al que se está estudiando. Consideremos específicamenlc
un mecanismo causal en el que

(exposición) ~ (alteración de la fisiología) ~: (enfermedad)

¿Seria una variable que midiese ei estado fisiológico alterado un factor


de confusión? Es ciertamente un factor de riesgo para la enfermedad. y
está también correlacionada con I~ exposición. puesto que proviene de
ella. Es incluso un factor de riesgo de la enfermedad para individuos no
expuestos, presumiendo que la alteración de la fisiologia pudiera apare-
cer a partir de otras causas distintas de In exposición en cuestión. No
obstante, esa variable no debe ser considerada de confusión. puestO que
el efecto de la exposición estaría mediatizado a través del efecto de la
alteración fisiológica. En este ejemplo no hay mezcla de efectos: el ilnico
efecto que existe es el que nos ocupa. (Otras causas de alteración de la
fisiología, sin embargo, actuarían confundiendo si estu,'iesen correlaci()-
nadas con la exposición). Cualquier factor que represente un paso en la
cadena causal entre exposición y enfermedad no es un factor de confu-
sión.
Por lo general, no es lo más comilt1 que se haya postulado un
mecanismo explitico para la acción causal de la exposición. ¿Cómo.
entonces, puede un investigador decidir si un factor es de confusión o
no? Las decisiones como ésa deben ser tomadas sobre la base de la
mejor información que haya disponible. sazonada con un pOquito de
juicio experto. Profundas incertidumbres acerca de un mecanismo P()-
drian justificar el manejo de un potencial factor de confusión considerán-
dolo alternativamente como tal. una vez, y como si no lo fuese, en la
siguiente, en análisis distintos. Por ejemplo, al evaluar el efecto de una
dieta grasa sobre el riesgo de padecer cáncer, no está claro cómo tratar
los niveles de colesterol sérico. Parecen ser un factor de riesgo de cánceí
y están por otra parte asociados con la dieta grasa. pero es posible que
OBJETIVOS DEL DISEÑO DE ESTUDIOS EPIDEMIOLOGICOS

mediasen también en la acción de esa dicta grasa sobre el rieseo de


cáncer; es decir. quizá fuesen un factor interm~ediario en la misrita se-
cuencia etiológica. A la vista de esta incertidumbre. habría que conside-
rar los niveles de colesterol sérico factor de confusión y evaluar "el erecto
de una dieta grasa sobre el riesgo de padecer cáncer a través de una
medíación distinta del citado colesterol sérico (controlando la confusión
por éste) y por otro lado, considerarlo también como si fuese causa
intermedia y, consecuentemente, evaluar el efecto de la dieta grasa igno-
rando en el análisis al colesterol sérico.
Llegados a este punto, podemos considerar una definición más refi-
nada del fenómeno de la confusión. El concepto esencial es la super-
posición del efecto de un factor de riesgo, extraño, sobre la estimada
relación existente entre la exposición que se estudia y la enfermedad que
resulta. Para ser un factor de confusión. esta variable extraña debe
poseer las siguientes tres caracteristicas:

Una variable de confusión debe ser un factor de riesgo de enfer-


mar.
No es preciso que la variable de confusión potencial sea causa real de
la enfermedad, pero, caso de que no lo fuese, debe ser marcadora de otra
que si sea causa real dc la enfcrmedad o del diagnóstico de la misma. La
asociación entre el potencial factor de confusión y la enfermedad de que
se trate no debe dcíivarse, dc forma únicamente secundaria, de estar
asociado a su vez con la exposición que podria ser causa de la enferme-
dad. Por tanto, una variable de confusión debe ser un factor de riesgo
incluso para la gente que no posea la exposición en estudio. Más aún.
debe ser factor de riesgo para la enfermedad en individuos no expuestos,
incluso después de ejercer control sobre otros factores conocidos de
confusión.
Se ha sugerido que la certeza con que una variable es considerada
factor de riesgo para una enfermedad debería estar basada, en principio,
en un conocimiento a priori {Miettinen y Cook, 1981). Según este punto
de vista. los datos pueden servir de guia para conocer la relación entre el
potencial factor de confusión y la enfermedad, pero es la relación real
que exista entre ambos, no la observada en los datos. la que determina si
puede producirse la confusión. Si el estudio es grande, los datos reneja-
rán más ajustadamente la relación subyacente, pero en los pequeños
constituyen una guía menos de fiar.
Los siguientes ejemplos ilustran el rol que se propone que juegue el
conocimiento previo al evaluar una ocurrencia de confusión. Si los dalos
indicasen, en un estudio sobre exposiciones ocupacionales y cáncer de
pulmón, inexistencia de relación entre el fumar y el cáncer de pulmón,
tal ausencia de relación no significaría que el tabaco no estuviese confun-
diendo el efecto, en el estudio, de las exposiciones ocupacionales. De la
misma forma, si en un estudío sobre exposición a la luz solar y melano-
ma, el conocimiento a priori sugiere que no existe relación entre el chicle
de mascar y la ocurrencia de este tumor, no deberá considerarse al chicle
'08 EPIDEMIOLOGIA MODERNA

factor de confusión. independientemente de que en el estudi(\ apareciese


una asociación suya con el melanoma. Los investigadores. en la práctica.
habitualmente se apoyan mucho en sus datos a la hora de inferir rel.i-
ción entre un potencial factor de confusión y la enfermedad. debid(\ a
que e] conocimiento anterior es. con rrecucncia. inadecuado. Por c.iem-
plo. en poblaciones en que faltasen las causas componentes complemen-
tarias. una causa real de enfermedad no apareccria relacionada con ést.l.
Una discordancia entre datos ~' conocimiento pre\'io acerca de un sospe-
chado o conocido factor de riesgo. por t.lnto. pone sobre l.I mesa un.i
inadecuación en el detalle del conocimiento que se posee. ~. n(\ en los
datos. De manera similar. un conocimient(\ anterior de ausencia de
erecto por parte de un posible factor de riesg(\ puede resultar inadecuad{)
si está basado en estudios con considerable clasificación incorrecta no
diferencial. o en estudios lie\'ados a cabo en pohlaciones en que faltaban
causas componentes complementarias esenciales (es de~ir. factores de
susceptibilidad). En otra linea. es también collcebible que ese conoci-
miento previo de ausencia de erecto pudier.1 estar basado en convicci{)-
nes suficientemente firmes como para sobrepasar cualquier prueba. en
sentido contrario, que hubiera en los datos. Asi. las personas a quiencs
hubiese tocado la loteria tendr:'ln presumiblemente el mismo ricsg() de
enfermar que aquellas otras a las que no. puest() que tal selección fue un
muestreo aleatorio; sobre la base de este conocimiento previo. la selec-
ción en el sorteo de la loteria no ()perarin c()nfundiend() ninguna relaci()n
exposición-enfermedad, incluso aunque pareciese que lo hacia en un
conjunt() determinado de datos.
2. Una variable de confusión debe estar asociad~1 c()n I., exposici()n
en estudio en la población de donde provienen los cas()s.
La asociación entre una potencial vari.\blc dc confusiól1 ). 1.1cxposi-
ción no debe derivar secundariamente de una asociación entre exposi-
ción ), enfermedad. En un estudio de seguimiento que midiese riesgo.
esta .estipulación implica únicamente que la asociación. entre la poten-
cial variable de confusión y la exposición. debe estar presente en I()s
sujetos seguidos. En otro estudio de seguimiento. que esta vez midiese
tasas de incidencia, la asociación debe estar presente con respect() a la
experiencia persona-tiempo de los su.jetos. Por tanto. en los e~tudios de
seguimiento, la asociació.n exposición-confundidor puedc ser evalu.\d.\ .1
partir de los datos que se tienen a mano y n() depende. siquiera teóric.l-
mente, del conocimiento previo.
Si el estudio es de casos )' controles, la estipulación implica quc la
asociación debe estar presente en la población fuente o en la experienci~l
persona-tiempo que dieron lugar a los casos )' de Ins cuales fueron extr~lí-
dos, por muestreo, los controles. Si la seric de los controles es gral1de.
debe aportar una razonable guía sobre la existencia o no de asociaci()11
entre la potencial variable de confusión y la exposición. En cualquier
caso, la preocupación, en útima instancia, se centra en el grad() de
asociación existente entre el potencial factor de confusión y la exposición
dentro de la población fuente que produ.jo los casos dcl estudio. de 1;1
OBJETIVOS DEL DISENO DE ESTUDIOS EPIDEMIOLOGICOS 109

cual los controles son sólo una muestra. En principio. quien determina
en un estudio de casos y controles si exi~te confusión es el conocimiento
a prinri sobre la población origen de los casos (M iettinen y Cook. 19R1).
Desgraciadamente. pocas son las veces en que se dispone de esa-informa-
ción fiable a priori sobre asociación entre factores de riesgo en poblacio-
nes específicas. Por tanto. en la práctica. incluso en estudios de casos v
controles, los datos que se estén manejando son los que habitualmente
tendrán que servir para evaluar la asociación entre la exposición y la
potencial variable de confusión.
En un estudio de seguimíento sobre exposición ocupacíonal y cáncer
de pulmón, entonces. si el fumar carecí ese de asociacíón con la exposi-
ción ocupacional en las cohortes del estudio. no estaría confundiendo.
Tampoco lo estaría en un estudio «anidado» de casos y controles que se
llevase a cabo en el seno de esa misma pobl~lcíón. incluso si el grupo
control manifestase asociación entre el fumar y la exposición ocupacional
Puesto que la población origen, como se ha dicho. no poseia asociación
entre el fumar y la exposición ocupacional. los sujetos expuestos no
afrontari~ln un m~lyor riesgo de cáncer de pulmón por ser fumadores.
con lo que este hábito no estaria confundíendo. Consideremos, como
ejemplo adícional. un experimento aleatorio: en ellos. todo factor de
riesgo tiene, en expectativa. asociación cero con la exposición. Sin em-
bargo, si en el proceso real de muestreo aleatorio acontece que un factor
ídentificado de riesgo está. a pesar de haberse realizado el muestreo ~ll
azar. asociado con la exposición. actuará como factor de confusión en el
experimento.
3. Una variable de confusión no debe ser un paso íntermedío en la
secuencia casual entre exposición y enfermedad.
Este criterio requiere disponer de información por fuera de los datos.
El investigador debe decidir si el mecanismo causal que conduce de la
exposición a la enfermedad íncluiría como paso intermedío al potencial
factor de confusión. Si es así. la variable no será de cünfusión.
Es ímport~lnte recordar que la confusíón es un sesgo y, por tanto.
debe ser consíderada y trat~lda como un prohlema cuantítativo. MilS 4ue
su mera presencia o ausencia, lo que ímporta evaluar es la cantidad de
confusión. Los métodos existentes para evaluar cuantitativamente la
confusión son descritos en el capítulo 12.
Una clasificación íncorrecta puede afectar a las variables de confu-
sión. En concreto. si una variable de confusíón está clasíficada incorrec-
tamente, resultar~í maniatad~l la capacidad de controlar su efccto en el
análísis (Greenland. 1980). La clasificacíón íncorrecta no diferencial de
una exposíción o de una enfermedad sesga los resultados del estudio en
dirección a la hipótesis nula. pero una malclasificación no diferencial de
una variable de confusión, atenúa el grado en que la confusión puede ser
controlada y causa con ello un sesgo en cualquiera de las direcciones.
dependiendo de la dirección que dicha confusión tenga. Por esta razón.
el clasificar íncorrectamente a los factores de confusión puede llegar a ser
"o EPIDEMIOLOGIA MODERNA

un problema serio. Si la confusión e$ fuerte ). lc. relación exposición-


enfermedad, débil o cero, clasificar incorrectamente un factor de confu-
sión puede conducir a resultados extremadamente desenfocados. Por
ejemplo. una relación causal fuerte entre fumar y cáncer de vejiga.
emparejada con una fuerte asociación entre fumar )' beber café. convierte
a] fumar en un potente confundidor de cualquier posible relación entre
beber café )' cáncer de vejiga. Puesto que controlar la confusión que
ejerce el fumar depende de que se disponga de información ajustada
sobre dicho hábito )' dado que resulta inevitable cierto grado de clasifi-
cación incorrecta de la información relevante sobre e] mismo. se lo mida
com() se lo mida, al final es inevitable siempre algún nivel de confusión
residual (Morrison. 1982). Este problema de la confusión re.1;idual se
vuelve peor, incluso. si la única información disponible sobre e] hábit()
que nos ocupa fuese una dicotomia simple entre «fumar alguna vez»
1
versu.\' «no haber fumado nunca», puesto que la ausencia de especifica-
ción detallada sobre el fumar impediría un adecuado ('()ntrol de la
confusión. La resultante sería especialmente problemática, porque para
muchos investigadores y lectores daría la impresión de que la confusión
por fümar habria sido controlada.

VALIDEZ EXTERNA

El proceso de generalización a partir de un grupo de observaciones


requiere llevar a cabo un juicio sobre qué conlenido de esa~ ob~ervacio-
nes se pueden extrapolar. Un juicio así exige la comprensión de cuáles
condiciones son relevantes y cuáles no lo son para realizar la generaliza-
ción. Reichenbach (1951) describió con talento la esencia de la gcnerali-
zación cien tífica:

«La esencia del conocimiento es la gel1erali;:nciñl1. Que el fuego puede


ser producido frotando madera de una cierta forma, es un conocimien-
to derivado de la generalización a partir dc experiencias individuales:
lo quc se formula quiere decir que frotar madera de tal forma produci-
rá ..siempre" fuego. El arte dc descubrir es. por tanto, e] artc de
generalizar correctamente. Lo que sea irrelevantc, como e] a~pecto o cl
tamaño particular del trozo de madera que se utilicc. debe ser excluido
dc la generalización; lo que sea relevante, como, por ejemplo, el que In
madera esté seca, debe ser incluido en ella. El significado del tcrmino
re/evante puede así ser definido: es relevante aquello quc debe !;er
mencionado para que la generalización sea válida. La separación entre
factores relevantes e irrelevantes es el comienzo del conocimiento.»

Para considerar un ejemplo epidemiológico, generalicemos lo~ resu)-


tados de un estudio sobre tabaco y cáncer de pulmón en hombres a una
J
población diana de mujeres. Hacerlo, pre~ume que ser varón es irrcle-
vante para la acción carcinogénica del fumar sobre el tejido pulmonar.
juicio basado eri el conocimiento acerca del mecanismo probable de la
carcinogénesis y en la similitud biológica entre los pulmones masculino y
OBJETIVOS DEL DISEÑO DE ESTUDiOS EPIDEMIOLOGICOS

femenino. En sentido opue~to. un estudio $ohre dieta e infarto de mio-


cardio en hombres no debería ser con$ider~do generalizahle :1 mujeres.
puesto que la diferencia fisiológica entre los sexos puede desempeñar un
papel en dicho proceso causal. Determinar la validez de una generaliza-
ción es. en l¡ltima instancia. pues, cuestii>n de juicio informado.
Algunos epidemiólogos han enseñado que la generalización a partir
~ de un grupo de estudio depende de si éste es un subgrupo representativo
1 de la población diana. en el sentido de muestra. O sea. que mientras
Reichenbach consideraba que la generalización científica es un arte.
1 otros la han considerado un aspecto mecánico del muestreo. La confu-
1 sión existente en torno a este punto está profundamente arrnigada. como
~ lo indíca el hecho de que se use el término «tamnño de la muestrn» para
) referirse al número de sujetos de un estudio. De 5er la generalización
científica simplemente cuestión de genernlízación estadística. habría que
- limitarla, literalmente, a aquellos individuos que hubiesen sido incluidos.
;
a i a través del muestreo. como sujetos dcl cstudio. Lo cierto es que esta
a errónea concepción ha innuenciado el diseño de muchos estudios epide-
miológicos. Si la idea fuese válida. no sería aplicable a los humanos
nJ
ningún resultado obtenido en investigación animal. Más aún. cada po-
blación requeriría su propio conjunto de estudios epidemiológicos. y
habría que rcpetirlos para cada nueva generación.
La tendcncia a usar grupos de estudio «representativos» dcriva pro-
'5 bablemente de experiencias iniciales con estudios para los que el proceso
1- inferencial debía ser puramente estadístico y no científico. Los que tra-
.~ bajan con ciencias sociales se apoyan frecuentemente en la inferencia
l- estadística, porque las decisiones sobre lo que es relevante y lo que no.
1-
de cara a la generalización, son más dificiJes cn ese terreno y porque las
poblaciones son considerablemente más diversas en los fenómenos so-
ciológicos que en los biológicos. En las ciencias biológicas, sin embargo.
le los investigadores llevan a cabo experimentos usando animales con
1- características seleccionadas para resaltar la validez del trabajo experi-
s: mental. en vez de representar a la población diana. Los diseños de
1- estudios epidemiológicos son más fuertes, por lo general. si la selección
le
de los sujetos está guiada por la necesidad de realizar una comparación
el
válida. lo que podria requerir establecer restricciones severas en la admi-
lo ¡ sibilidad de los mismos hacia una estrecha gama de características, en
la

1('
vez de por un intento vano de hacer que esos-sujetos fuesen representati-
~r I vos. en sentido de ser muestra, de potenciales poblaciones diana.
re En última instancia, la meta científica de un estudio es contribuir al
conocimiento científico. El proceso inductivo, que consiste en sintetizar
conocimiento a partir de observaciones sigue, después de siglos de exa-
.1. men, sin ser bien entendido (véase Cap. 2). Está claro, no obstante, que
1a implica moverse de las particularidades de un grupo de observaciones a
e. la abstracción de la hipótesis o la teoria cientifica. Las teorias científicas.
Ir como el ejemplo de Reichenbach sobre la madera que ardía. están
la divorciadas del tiempo y del espacio: son abstracciones que constituyen.
y
en sentido filosófico, formulaciónes universales. La esencia de la genera-
112 EPIDEMIOLOGlfI MODERNA

lización científica es, pues, el proceso de pa~.'lr de ob~ervaciones. e~pecífi-


cas según tiempo y lugar, a un enunciado universal abstracto. Este
proceso no es ni mecánico ni estadístico, ni incJuye una población diana
específica. En este sentido, el término validez externa es un apclativ()
equivocado y cuando se habla de generalización, debería interpretarse
que se habla de abstracción. Los grupos de estudio representativos en
sentido estadístico de poblaciones mayores n(1 reforzarán, por general.
la capacidad de reaJizar enunciados universales abstractos a partir de
observaciones, pero si lo harán los seleccionado~ de acuerdo a caracte-
risticas que hagan posible que un estudio distinga de modo efectivo entre
hipótesis científicas en competencia.

REFERENCIAS

Bross, I. Misclassification in 2 x 2 table~. Binm('(ril.'; 1954: 10:478-486.


Caldwell, G. G., Kcllcy, D. B., and Heath. C. W., Jr. Leukemia among partici.
pants jn military maneuvers at a nuclcar bomb test: A preljminary report.
J.A.M.A. 1980;244:1575-1578.
Copeland, K. T., Checkoway, H., McMichael, A. J.. et al. Bias duc to misclassi-
fication in the estimation or rclalive risk. Am. J. EJ1idemiol. 1977; 105:488-495.
Criqui, M. H., Auslin, M., and Darrctt~Connor, E. Thc cfTect of non-responsc on
risk ratjos in a cardiovascular djsease sludy. J. Ch,.n1l. Di.\". 1979;32:633-63R.
Felarca, L. C., Warde11, D. M., and Rowlcs. I3. Vaginal spcrmicides and con-
genital disorders. J .A .M .A. 1981 ;246:2677.
Fox, A. J., and Colljcr, P. F. Low mortaljty rates jn industrial cohort studie~ duc
to selcction for work and survivaJ in thc industrv.. Br. J. Prel.". Snc. M('d.
1976;30:225-230.

Greenland, S. Responsc and follow-up bia~ in cohort ~tlldics. A"I. .I. E"iden,iol.
1977;106:184-187.
Greenland, s. The efTect of misclassification in the pre~ence of c()variales. Am. .I.
E"idemiol. 1980;112:564-569.
Jick, J., Walker, A. M.. Rothman, K. J.. ct al. Vaginal spermicidcs and congenjlal
disorders. J.A.M.A. 1981;245:1329-1332.
Jjck, J., Walkcr, A. M.. Rothman, K. J., ct al. Vagjnal spcrmicide~ and congcnital
disordcrs~reply. J.A.M.A. 198Ia:246:2677-2678.
Klemctti, A., and Saxen, L. Prospcclivc vcrsus rclro~pccti\,c approach jn thc
search ror environmental causes or malformatjons. Am. J. rllhlic H('ai(h
1967;57:2071-2075.
McMichae1, A. J. Standardizcd mortality ratjos and thc ..hcal!h)' workcr cfTccl:
Scratchjng beneath the surfacc. J. OCCII". M('d. 1976; 18: 165-168.
Micttinen, O. S., and Cook, E. F. Confounding: Esscncc and dclectíon. A",. .I. .1
EJ1ide"riol. 1981; 114:593-603.
Morrison, A. S., Burjng, J. E., Verhoek, W. G.. e! al. CofTec drjnking and cancer
of lhc lower urjnary tract. J. Nal. Cmrcer 1".\"1. 1982;68:91-94.
Oakley, G. P., Jr. Spermicides and birth defccts. J.A.M.A. 1982;247:2405.
Reichenbach, H. TI,c Rise oJ Scienl(f/c Plrilo.\"()J1hJ.Nc". York: ~Iarper & Ro\\".
1965.
Rothman,. K. J. A pictorjal rcprc~entation ()f conf()undil1g in cpídcmiol()~ic
studies. J. CI,ron. Di.\,. 1975;28:101-108.
OBJETIVOS DEL DISENO DE ESTUDIOS EPIDEMIOLOGICOS
"3

Rothman. K. J.. Jnd Boice. J. D.. Jr. E{1idemi(}I(}~ic :lnal.I".~i.\" 11.i(h (I l'rn~rm1lmah/(,
C"lc/(la(or(2 nd ed.). Chestnut Hill. Mass.: Epidemioiogy Resourccs Inc.. J9R2.
Sackctt. D. L. /3ias in ;¡nmytic rcscarch. J. Chrnn. D;.\". 1979:32:51-f\3.
Sartwell. P. E.. Masi. A. T.. Arthcs. F. G.. et al. Thrombocmboli~m and oral
contraceptives: An cpidemiologic casc-control study. /lm. J. E{1;(IE'm;nl.
1969:90:365-380.
Schlesselman. J. J. Sample sjze reqlliremcnts jn cohort and case-control studics
of diseasc. ..Im. J. E{1ideln;(}I. 1974; 99:381-~R4.
Smithclls. R. W.. and Shcpard. S. Teratogenicity testing jl1 humans: A method
dcmonstrating thc safcty of Bcndcctjn. T('ra(oln,r:-'. 1978; 17:31-36.

1
J

~ -1

II

e
II

:r

¡V,

IC
8. ESTRA TEGIAS EN EL DISEÑO
DE ESTUDIOS EPIDEMIOLOGICOS

La forma adecuada de ver un estudio epidemiológico es considerarlo un


ejercicio de medición cuya meta es la exactitud. Lo que pretenden las
estrategias de su diseño es reducir las fuentes de error. tanto sistemático
como aleatorio. Una reducción del error aleatorio mejóra la precisión de
la medición, mientras que la reducción del sistemático aumenta su
validez.

MEJORA DE LA PRECISION

Como se describió en el capítulo 7, la manera fundamental de mejorar la


1
É precisión de un estudio consiste en incluir más sujetos. Aparte del tama-
,~ ño, la característica del diseño que afecta más a la precisión de un
i estudio es la subdivisión de los sujetos {o unidades de observación
persona-tiempo) en grupos de estudio. Se puede formular la eficiencia de
i un estudio, entonces, como la cantidad de observación acerca del efecto
dívidida por el número de sujetos del mísmo (nótese que, en estadística,
la información se define como el recíproco de la varianza). Cuan.do el
factor en estudio no produce efecto alguno. la fragmentación en subgru-
pos iguales constituye el diseño más eficiente {Walter. 1977): por ejemplo.
en ausencia de efecto, es más eficiente tener 200.000 persona-años de
observación, divididos en 100.000 para el grupo expuesto y 100.000 para
el no-expuexto, que tener una razón del reparto distinta de la unidad.
De forma similar, en un estudio de casos y controles. en ausencia de
efecto. lo más eficiente es tener un número igual de casos y controles.
En presencia de efecto. la subdivisión que resulta óptima para la
eficiencia difiere, respecto de una hipotética subdivisión a partes iguales.
en una cantidad que es función del parámetro que se está estudiando
(Walter, 1977).
Otra forma de ver la eficiencia de un estudio relaciona la cantidad de
información sobre el efecto qué se obtiene con el costo de obtenerla,
independientemente del número de sujetos que haya en el estudio. El
115
8. ESTRA TEGIAS EN EL DISEÑO
DE ESTUDIOS EPIDEMIOLOGICOS

La forma adecuada de ver un estudio epidemiológico es considerarlo un


ejercicio de medición cuya meta es la exactitud. Lo que pretenden las
estrategias de su diseño es reducir las fuentes de error. tanto sistemático
como aleatorio. Una reducción del error aleatorio mejóra la precisión de
la medición, mientras que la reducción del sistemático aumenta su
validez.

MEJORA DE LA PRECISION

Como se describió en el capítulo 7, la manera fundamental de mejorar la


1
É precisión de un estudio consiste en incluir más sujetos. Aparte del tama-
,~ ño, la característica del diseño que afecta más a la precisión de un
i estudio es la subdivisión de los sujetos {o unidades de observación
persona-tiempo) en grupos de estudio. Se puede formular la eficiencia de
i un estudio, entonces, como la cantidad de observación acerca del efecto
dívidida por el número de sujetos del mísmo (nótese que, en estadística,
la información se define como el recíproco de la varianza). Cuan.do el
factor en estudio no produce efecto alguno. la fragmentación en subgru-
pos iguales constituye el diseño más eficiente {Walter. 1977): por ejemplo.
en ausencia de efecto, es más eficiente tener 200.000 persona-años de
observación, divididos en 100.000 para el grupo expuesto y 100.000 para
el no-expuexto, que tener una razón del reparto distinta de la unidad.
De forma similar, en un estudio de casos y controles. en ausencia de
efecto. lo más eficiente es tener un número igual de casos y controles.
En presencia de efecto. la subdivisión que resulta óptima para la
eficiencia difiere, respecto de una hipotética subdivisión a partes iguales.
en una cantidad que es función del parámetro que se está estudiando
(Walter, 1977).
Otra forma de ver la eficiencia de un estudio relaciona la cantidad de
información sobre el efecto qué se obtiene con el costo de obtenerla,
independientemente del número de sujetos que haya en el estudio. El
115
"6 EPIDEMIOLOGIA MODERNA

coste de adquisición de la información en grllpos de estlldio diferentes es.


con frecuencia. dispar. Por e.iemplo. los e",tudios de seguimiento retro~-
pectivos se basan muchas veces a la hora de comparar en datos de
población. Tales datos de población se adquieren a un precio que es
inferior. en varios órdenes de magnitud. a 10 que cuesta la informacior.
de la cohorte expuesta. De forma parecida. los casos. en un estudio de
casos y controles, podrian escasear ~' ser por tanto caros de detectar. en
tanto los controles podrían ser todo 10 numerosos que se quisiera. En
situaciones así. se obtiene más información por unidad de costo expan-
diendo la serie que se compara en relación con la serie índice. La razón
de subdivisión óptima para la eficiencia re.<;pecto del coste se ha demo~- '""'"1
trado que es aproximadamente igual al reciproco de la raíz cuadrada de
la razón entre los costes (Miettinen, 1969). Por tanto, si los casos cuestan
cuatro veces más que los controles, el investigador debe plantear",e
inclu,ir dos veces más controles que casos. La «regla de la raíz cuadrada»
ha demostrado ser sólo estrictamente aplicable para efectos pequeños o
nulos; Morgenstern y Winn (1983) han propuesto un abordaje más
generalizado de cara a mejorar la eficiencia de coste, que toma en cuenta
la magnitud del efecto que se con.ietura y el tipo de datos. Su fórmula
capacita al investigador para, con un gasto dado, optimizar en un estudio
la precisión de la estimación de] efecto.
Resulta imposible algunas veces prolongar indefinidamente la serie
índice. usualmente porque existen restricciones prácticas que limitan la
factibilidad de extender e] período o el área de estudio. Para tales series.
el coste de adquirir sujetos adicionales es esencialmente infinito, y la
única estrategia disponíble para adquirir más información consistiría en
ampliar la serie de comparación. Cuando se aumenta el tamaño de la
serie de comparación en relación al de la índice. la cantidad de informa-
J
ción en el estudio no alImenta proporcionalmente. Si llamamos r a la
razón entre el tamaño de la serie de comparación y el de ]a serie índice,
la proporción de información teóricamente conseguible a partir de la
serie índice mediante tamaños distintos de la de comparación. es aproxi-
madamente r/(r + I) para una comparación en bruto. La figura 8.1
ilustra los rendimientos decrecientes. conforme se aumenta r.
La figura expresa claramente que, para una comparación cruda. tiene
poco sentido gastar recursos en lograr una razón por encima de 4 ó 5.
puesto que casi toda la información que se puede lograr se ha «extraído»
ya de la serie índice utilizando una serie de comparación sólo 4 ó 5 veces
mayor. La única justificación para conseguir razones superiores a estas
cifras se daría en aquellas circunstancias en las que el costo de obtener la
información adicional fuese despreciable, como pasaría. por e.iemplo, si
todos los datos estuviesen ya accesibles en una ficha de computadora
que tuviera que ser leída «in totO»: en circunstancias así. no hay razón
para ignorar una información utilizable qlle carece de costo real, aunque
debe hacerse notar de nuevo que una razón de reparto de 500 no es
mucho me.ior que otra de 5, con respecto a la cantidad de información
que se puede obtener.
100%

Q)
:3
""Ui
o
80
0-
C
00
"U
!O
E 60
O
C
Q)
~
c: 40
.o
"U
O
o.
0
~ 20

j o 2 3 4 5 6
Tamaño de la serie de comparación en relación al de la serie índice (r)

Fig.8.1. Proporci(jn °l'rO.\"il110da de iI!formación que .\'e J1llede ("on.\,e.~llir [rj(r + I )]


en una serie de /0I11año fijo, segljn el/amaño de la serie (le col11paración en relaci(jn
con el (le dicha .\'('rie íll(lice .

Estos argumentos se aplican a las comparaciones crudas en el análi-


sis de datos. ¿Qué efecto tiene sobre la eficiencia, y por tanto sobre la
precisión, la estratificación de datos? Cuando se analizan los datqs de
acuerdo a estratos, las comparaciones esenciales se hacen dentro de
éstos. El argumento precedente debe aplicarse entonces a la razón entre
tamaños de grupos dentro de cada estrato. Un estrato que contuviese
una serie de comparación diez veces más grande que la serie índice (o
viceversa) es probable que esté malgastando información. Un estudio
con una razón de subdivisión global favorable, digamos 1,0. puede
poseer razones de reparto en el interior de los estratos que variasen
gradualmente, de valores bajos a altos: no es infrecuente encontrarse
algunos de ellos con los valores extremos de cero e infinito. Cuanto más
pequeños son los números dentro de los estratos, más extrema será
probablemente la variación en la razón de reparto (los valores extremos
resultan de tener cero sujetos o cero experiencia persona-tiempo en un
grupo del estrato en cuestión). Los números pequeños dentro de los
estratos resultan de tener una cantidad demasiado pequeña de sujetos en
relación con el número de estratos que se crean; tal problema puede
darse incluso en estudios grand.es, puesto que el número de estratos que
se requiere en el análisis aumenta en proporción geométrica con el
"8 EPIDEMIOLOGII\ MODERNA

número de variables sobre las que se estratifica. Este problema constitu-


ye, ciertamente, la mayor limitación de] análisis estratirlcado.
Cuando se prevee que habrá que estratificar. puedc ser ~en~at() hu~-
car una razón de reparto mayor de la que se utilizaria en caso contrario.
Si la razón globaJ es, digamos. 2, Jos valores de la razón específicos por
estrato pueden variar entre valore~ bajos. inferiores a I~ unidad ~. valores
altos, mucho mayore~ que esa cantidad. Por tanto. habril algunos c~tr~l-
tos en los que se comparen muchas observaciones de 1:1~erie indice con
pocas observaciones de Ja serie de comparación. en tanto. en otro~,
muchas obscrvaciones de Ja dc comparación serán derrochadas frcnte a
pocas de la seríe índice. Esta ba.ia eficicncia puede reducir con~idcrahle-
mente la precisión. Si la razón global que sc escoge es 4 ó 5, puede que cllo
desplace a las razones específicas por estrato. de forma q\le éstas tiendan
a estar todas por encima de Ja unidad. contri huyendo así a un diseño
considerablemente más eficiente. Si se prevcc una variación importante
de la razón de reparto entre lo~ estratos. podría ser.iustificable una razón
global de lO o incluso mayor.
Alternativamente, en un an:ílisi~ e~tratíficado se ruede m~lntcner I~l
precisión diseñando el estudio de forma que se garantice que la razón de
reparto no varía severamente entre los estratos. Esta meta pucdc ser
conseguida seleccionando sujetos de comparación, individualmente o en
grupo, que tengan la misma distribución que los sujetos índicc con
respecto a las variables de la estratificación. E~tc proceso se conoce con
el nombre de «apareamiento»; en los capítulos 12 )' 13 se tratan en
detalle la estratificación y el apareamiento.

MEJORA DE LA VALIDEZ

ELECCION DE LOS GRUPOS DE COMr¡\R¡\ClON

En un estudio de seguimiento. el grupo de comparación sirve para


obtener un estimado de cuál podria haber sido la incidencia de enfermc-
dad en el grupo expuesto si la exposición hubiese estadC' ausente ()
careciese de efecto. Para conseguir esta meta. no es indi$pensablc encon-
trar un grupo no-expuesto que sea exactamente igual al expuesto en
todos los aspectos, excepto la exposición. Basta con encontrar un grllpo
de comparación que sea similar al expuesto con respecto a los factores
predictivos importantes de la incidencia de enfermedad. El grupo de
comparación, pues, puede diferir con respecto a factores no relacionados
con la incidencia de la enfermedad. De hecho. tal grupo de comparación
puede ser distinto incluso respecto de factores que afectan a la incidencia
de enfermedad, siempre que éstos puedan ser medidos y adecuadamente
ajustados en el análisis de los datos. Algunos argumentan que cuanto
más cercana la identidad de los grupos comparados con respecto a todos
los factores medibles, mayor será la validez. puesto que algunos factores
pueden afectar a la incidencia de enfermedad sin que el investigador I()
ESTRATEGIAS EN EL DISEÑO DE ESTUDIOS EPIDEMIOLOGICOS 119

sepa. Tal punto de vista no es. en re.'1lidad. contradictorio con el criterio


de que los grupos comparados deban ser idénticos respecto de todos ios
predictores importantes de la incidencia. pero supone pesimistamente
que el investigador no puede disponer de una visión suficiente de la
etiologia de la enfermedad como para basarse en ella a la hora de
diseñar el estudio. Como cuestión práctica. grupos que sean idénticos
excepto en la exposición de interés, no se encuentran fuera dellaborato-
rio y, quizás, ni siquiera dentro. En la investigación no experimental, el
investigador debe considerarse satisfecho con tener en cuenta sólo los
factores que se piensa son relevantes para la ocurrencia de la enferme-
dad. Por tanto, si, por ejemplo, se supiese que el género no tiene innuencia
sobre el riesgo de padecer la enfermedad sometida a estudio. seria acep-
table comparar los grupos expuesto y no expuesto, aun teniendo distin-
tas distribuciones por género.
Cuando se va a escoger un grupo dc comparación. la preocupación.
tipicamente, se centra en los factores que podrían llevar a un sesgo de
selección. Aunque los sesgos de confusión constituyen también un pro-
¡.
blema. se les puede controlar en el análisis si se les mide. Una distinción
~
conceptual útil, precisamente, entre sesgo de selección y confusión con- ¡,
t
;
siste en ver si el sesgo puede ser eliminado en el análisis o no. Por ~
ejemplo, un estudio de seguimiento que comparase la mortalidad entre
los cargadores con la mortalidad en la población general, estaria sujeto a
la critica de que dedicarse a cargar es una profesión que implica autose-
lección de individuos en buen estado fisico, entre los que cabria esperar
una moTtalidad más baja que la de la población general. Un estudio asi
no podria ser considerado como determinación válida del efecto que
tiene sobre la mortalidad el trabajo de cargador, por culpa del sesgo de
selección. Ahora bien: ¿qué pasaria si el estado de forma lisica de un
individuo que se hace cargador pudiese seT medido y comparado con los
sujetos extraidos de la población general? Si una medición así fuese
factible y pudiese controlarse en el análisis la diferencia en el estado de
forma fisica. el problema del sesgo de selección sería mejor considerarlo
como de confusión, ya que éste se puede eliminar. Dado que tales
mediciones dej estado de forma al entrar en una profesión generalmente
no están disponibles, sería mejor. en una situación asi, enfocar los esfuer-
zos del investigador hacia la elección de un grupo de comparación que
evitase el sesgo de selección. Una posibilidad podría ser el abordaje de
PafTenbarger y Hale ( 1975) en un estudio "sobre estibadores. en el que
compararon la mortalidad cardiovascular en grupos de ellos, ocupados
de diferentes cometidos con niveles distintos de actividad fisica, sobre la
presunción de que los factores de selección para haber entrado al puesto
de trabajo eran similares para los subgrupos que se ocuparon de tareas
que demandaban mucha o poca actividad, porque la asignación de
trabajo se hace después de haber ingresado en la profesión.
En los estudios de casos y controles, el grupo control proporciona un
estimado de la distribución que la exposición tiene entre la población
fuente, donde se originaron los casos. Como sucedía con los de segui-
'20 EPJDEMIOLOGIA MODERN/,

miento, no es necesario que el grupo de comparación sea idéntico al


índice con respecto a todos los factores aparte de la exposición. sino sólo
respecto de los de importancia. En la medida en que la selección de
casos estuviese infiuenciada por factores relacionados con la exposición. e]
grupo control deberá hallarse sujeto a los mismos. Los factores de
selección no relacionados con la exposición no tienen por qué ser idénti-
cos para las dos series, pero, de nuevo. existen frecuentemente dificulta-
des para valorar cuáles de entre ellos son los determinantes. Como
nunca se encontrarán grupos completamente idénticos. el proceso de
determinar qué factores son relevantes a la hora de escoger un grupo de
comparación constituye un elemento crítico del diseño de un estudio
epidemiológico.
El sesgo de selección fue el tema central en la controversia acerca del
papel de los estrógenos exógenos en la génesis del cáncer de endometrio.
Varios estudios de casos y controles habian encontrado una asociación
fuerte, con un aumento de cerca de diez veces en el riesgo, para las
mujeres que habían estado tomando regularmente estrógenos durante 1
una serie de años (Smith el al., 1975; Ziel y Finkle, 1975; Mack el al.,
1976; Antunes el al., 1979). La mayoría de los ínvestigadores interpreta-
ron este aumento como una relación causal, pero otros sugirieron que
los estrógenos estaban provocando simplemente que los cánceres fuesen
diagnosticados, no que ocurriesen (Horwitz y Feinstein, 1978). El argu-
mento se basaba en la premisa de que se sabe que los estrógenos inducen
el sangrado uterino y, por tanto, la administración de estas hormonas
llevaría presumiblemente a muchas mujeres a demandar atención médi-
ca, haciendo así que una variedad de cuadros ginecológicos fuesen detec-
tados. El sesgo resultante fue llamado «sesgo de detección>}. El remedio
que se propuso fue utilizar una serie de control a base de mujeres con
enfermedades ginecológicas benignas que estuviesen también sujetas al
citado sesgo de detección, en vez de otro de control formado por mujeres
con cualquier enfermedad maligna, enfermedad no ginecolágica o ninguna
enfermedad. como habían hecho estudios anteriores. La pega de este razo-
namiento fue la incorrecta asunción de que eran los estrógenos los que
hacían que una sustancial proporción de cánceres endometriales, de otra
forma condenados a permanecer sin diagnosticar, fuesen diagnosticados.
Incluso si la administración de estrógenos adelantase la fecha de diag-
nóstico del cáncer de endometrio, un adelanto así no conduciría en sí
mismo a ningún sesgo de importancia. Presumiblemente. una pequeña
proporción de cánceres de endometrio preexistentes, que de otra manera
no hubiesen sido diagnosticados, saldrían a la luz, pero hay pruebas
considerables de que, como cualquier otro cáncer, el endometrial genc-
ralmente progresa hasta causar síntoma-" que llevan a -"u diagná-"tico.
Aunque un estadio inicial permanente. no progresivo, de este tipo de
cáncer es una posibilidad, estudios que excluyeron tale-" tumores en situ
de la serie de casos siguieron encontrando un fuerte erecto de la admini-,,-
tración de estrógenos sobre el riesgo de padecer cimcer (Horwitz ).
Feinstein, 1978; Antunes el al., 1979). Por otro lado, el grupo alternativo
ESTRATEGIAS EN EL DISEÑO DE ESTUDIOS EPIDEMIOLOGICOS 121

de comparación que se propuso. formado por mujeres con procesos


ginecológicos benignos que. por lo general. no causarian por si mismos
síntomas conducentes al díagnóstico. producía una sobreestimación de
la proporción de población fuente de los casos que estuvo ~puesta a
estrógenos. puesto que la administración de estas hormonas ciertamente
causaria el diagnóstico de una proporción sustancial de dichos cuadros
benignos (H utchison y Rothman. 1978). Ese uso de la serie de control a
base de cuadro ginecológicos benignos conducía a un sesgo de selección
que subestimaba gravemente el efecto de 10s estrógenos exógenos sobre
el riesgo de padecer cáncer de endometrio (Green1and y Neutra, 1981).
La principal lección que debe aprenderse de esta controversia es 1a
importancia de considerar cuantitativamente en la medida de lo posib1e,
y no cualitativamente, los sesgos de selección. Si no se presta atención a
la magnitud de los potenciales sesgos de selección, la elección de un
grupo de comparación puede resultar, como en este ejemplo. en un sesgo
tan grande que se oscurezca una asociación intensamente fuerte; con la

1 misma facilidad, alternativamente;


resultar falsamente exagerada.
una asociación despreciable puede

No siempre es posible impedír un sesgo de selección medíante una


elección astuta del grupo de comparación. Consideremos el sesgo de
seleccíón ínherente en e1 estudío de casos y controles sobre anticonceptí-
vos orales y tromboembolismo. Una mujer que tuviese síntomas consís-
tentes con un cuadro de tromboembolismo era, presumiblemente, más
fácil que resultase enviada el hospital para ser evaluada al comprobar su
médico que estaba tomando anticonceptivos. Dicho sesgo de selección
exageraria la asociación entre anticonceptivos orales y enfermedad
tromboembólica, o produciria falsamente una asociación positiva. Para
impedir ese sesgo, lo primero que habria que considerar es enrolar en e1
estudio a un grupo de comparación que estuviese sujeto a las mismas
fuerzas de selección por usar anticonceptivos orales. Incluso sí alguien
fuese capaz de buscarse un grupo así, sin embargo, ya hemos visto las
dificultades que se afrontan cuando se íntenta anular el sesgo de selec-
ción encontrando un grupo de.comparación para el que las fuerzas de la
selección sean de la magnítud correcta. La forma más fácil de lograr lo
que se pretende consiste en eliminar, tanto como se pueda, las fuerzas de
selección relacionadas con el uso de anticonceptivos orales. En este
ejemplo, un abordaje sería definir las series de casos incluyendo só10 a
las mujeres cuyos síntomas y signos cump1ieseñ un conjunto de criterios
diagnósticos objetivos de enfermedad tromboembó1ica. Reformulando
los criterios diagnósticos, casos que en otras circunstancias habrian sido
incluidos simplemente por su historia de uso de anticonceptivo orales. y
no por sus manifestaciones de enfermedad, no estarian ahora incluidos.
El grupo de comparación, además, podria ser escogido para determinar
el uso de los anticonceptivos orales en la pob1ación fuente de los casos
sin tener en cuenta fuerzas de selección basadas en la historia de contra-
cepción oral obtenida por e1 médico. Por supuesto, si los casos a 1os que
se iban a aplicar los criterios. diagnósticos objetivos incluyesen mujeres
'22 EPIDEMIOLOGI/, MODERNI..

que hubiesen sido derivadas porque usa han anticonceptivos orales. e!


sesgo de selección no podría ser eliminado de esta forma.
La identificación de los controles a muestrear en los estudios de
casos y controles depende frecuentemente de la disponibilidad de un
listado, del tipo de un directorio de residentes en un área geográfica.
Otras formas de hacerlo podrían ser la derivación a partir de los casos.
como amigos o vecinos de éstos (tales abordajes son equivalentes a la
selección apareada y requieren un análisis apareadol o el muestreo
general, como la encuesta puert2 por puerta (también habitualmente
sobre bases de apareamiento). Un método cada vcz más popular de
identíficar a }os controles es el método de estudio que consiste en marcar
un dígito al azar (Waksberg, 1978). Este método es razonabiemente
adecuado para identificar controles sacados de la población general en
áres en que la prevalencia de teléfonos en las casas es alta. Las entrevi~-
tas telefónicas son muchas veces casi tan efectivas como las personales y
considerablemente más fáciles de llevar a cabo. La ta$a de respuesta a
estas entrevistas telefónicas no ha sido sustancialmente peor que la
obtenida mediante otros abordajes. para encontrar controles a partir de
la población general (VI'ard el al., 1984). La eficiencia de marcar un
dígito al azar puede resultar especialmente beneficiosa si $e la compara
con los altos costos del apareamiento individual. por lo que. insistimos.
constituye un método relativamente eficiente de encontrar controles
apareados de entre la población general (Robi$on )' Daigle. 1984: V\'ard
el al., 1984). Existe un software de Entrevista Telefónica Asistida por
Computadora (CATI) que controla la entrevista mediante computadora.
registrando las respuestas conforme ésta va avanzando )' que puede $cr
combinado con el marcado de un dígito al azar para elevar la eficiencia
de los métodos telefónicos de recogida de datos.
Algunos epidemiológos han recomendado el uso rutinario dc dos o
más grupos de comparación. extraídos de formas difereñte$. Su premi$a
es que ninguna comparación única puede controlar adecuadamente to-
dos los sesgos posibles y no cabe tener confian7;a en la validez de los
resultados a menos que las comparaciones entre la serie índice y varios
grupos distintos de comparación indiquen todos. aproximadamente, un
mismo resultado. Otros argumentan. por el contrario. que es remota la
posibilidad de que un. investigador deposita$e igual confianza en la
validez de comparaciones basadas en dos o más grupos diferentes y que
con grupos de comparación distintos lo que hay que esperar es que
surjan resultados distintos. ¿Qué tendría entonces que hacer un investi-
gador si un estudio, largo y costoso. produce resultados discrepantes con
dos grupos de comparación? Si depositase una confianza mayor en uno
de ellos, los resultados del otro re$tarían credibilidad a sus hallazgos. En
consecuencia. algunos epidemiólogos recomiendan escoger $ólo un gru-
po de comparación, aquél en el que $e tiene mayor confianza. Una
posición intermedia podría ser sensata; parece razonable e$coger sólo un
grupo de comparación, a menos que otro adicional pudiese añadir algo
no común que fuese importante controlar. Por ejemplo. 'para controlar
ESTRATEGIAS EN EL DISEÑO DE ESTUDIOS EPIDEMIOLOGICOS 123

influencias ambientales durante la edad adulta, podría ser razonable


escoger como control a una esposa, en tanto para controlar entorno
durante la infancia (y género) sería razonable escoger como controles a
hermanos (Gutensohn e/ al.. 1975).

FUENTES DE INFORMACIÓN

La adquisición de información sobre enfermedad, exposición y variables


auxiliares presentan cada una problemas diferentes.
La información sobre ocurrencia de enfermedad puede ser extraída a
través de una variedad de medios. Entre ellos se incluyen las preguntas a
sujetos acerca de síntomas antes de la realización deJ diagnóstico. el
examen a sujetos para realizar un diagnóstico, las preguntas acerca de
diagnósticos médicos mediante entrevistas o cuestionarios y la consulta
a sistemas médicos de registro o registros de estadísticas vitales para
determinar los diagnósticos o el hecho de la muerte de sujetos deJ
estudio. Cuando se dispone de eJlos, los registros ya existentes pueden
aportar una información que resulta eficiente con respecto al costo; el
ahorro de dinero proviene del doble beneficio de no tener que rastrear
en un estudio de seguimiento las pistas de los sujetos sanos para com-
probar que siguen corno tales y el de no tener que realizar el trabajo
médico de los exámenes. Pero, por otro lado, si el estudio es de segui-
miento. hay que estar seguro de que !os registros disponibles aportan
información de las cohortes que se investigan al completo. Verificar.
siempre que sea posible, los diagnósticos al menos de una muestra. si no
de todos los casos, resulta una buena práctica. La confirmación anato-
mopatológica del cáncer, por ejemplo, es deseable para reducir la clasifi-
caciÓn incorrecta en los diagnósticos. No es indispensable, sin embargo.
dar este paso; estudios excelentes pueden estar basados en datos en que
los diagnósticos son sólo de presunción. siempre que se interpreten con
propiedad la magnitud y la dirección de las incorrecciones de clasifica-
ción resultante. Como se discutió en el capitulo 7, si un estudio muestra
una fuerte asociación positiva. la clasificación incorrecta de diagnóstico
constituye una preocupación pequeña. puesto que tal clasificación inco-
rrecta, de ocurrir en forma no diferencial para sujetos expuestos y no-
expuestos, sólo causaría una subestimación de la magnitud de la asocia-
ción. Si un estudio mostrase ausencia de asociación. por el contrario, el
uso de diagnósticos de presunción constituiria una seria preocupación.
porque existiria entonces la posibilidCld de que la clasificación incorrecta
obliterase una asociación. DesgraciCIdamente, la magnitud de una aso-
ciaciÓn no es conocida durante la etapa de planificación, cuando deben
tomarse las decisiones sobre los criterios diagnósticos. Resulta. por tan-
to, en general preferible usar criterios diagnósticos restrictivos. A pesar
de todo, puede ser dificil para algunas enfermedades, como la esclerosis
múltiple, establecer un diagnóstico definitivo, por lo que en estas situa-
ciones prácticamente cualquier conjunto de criterios serían de presun-
ción.
124 EPIDEMIOLOGIA MODERNA

La inforrnación sobre exposiciones proviene menos frecuentemente


de registros que la inforrnación sobre enfermedad, puesto que resulta
dificil la mayoria de las veces que se la hubiera registrado con antela-
ción. EjempJos de exposición para Jas cuaJes escasas veces se recoge
información lo constituyen factores como el tabaco. el alcohol. 105 apar-
tados de una dieta y el contacto con aJgunas fuentes de infección. Ciertas
exposiciones, como el uso de medicamento!' prescritos, están registrados.
pero raramente en un formato que sea de aJguna utiiidad para los
epidemiólogos. No es posibJe acceder a los datos de farmacia de 105
Estados Unidos habitualmente, por ejempJo, ell modo alguno que per-
mitiese un útil enlace de registros. Se registran las exposiciones ocupa-
cionaJes sólo en la medida en que existe información que describe las
actividades de Jos puestos de traba.io. La información sobre exposición
reaJ de los empleados, por tanto, debe ser la mayoría de las veces
inferida, sobre la base de la naturaleza de sus empleos. Así pues. aunque
la información ocupacional registrada resuJta extremadamente útil. exi!'-
tirá por lo general una considerable clasificación errónea en las determi-
naciones de la exposición real de los empleados a agentes en el Jugar de
trabajo, si se toman como base los registros ocupacionales. Estos probJe-
mas de clasificación se harian tolerables cuando sucediese que los estu-
dios resultan de otra forma inviables, especialmente si los resuJtados de
otros estudios demuestran una fuerte asociación no-cero a pesar de la
clasificación incorrecta.
Cuando no se puede obtener información sobrc Ja exposición a partir
de registros escritos o computarizados, se hacc necesario apoyarse en J~\
memoria humana a través de Jas entrevistas. En los estudios de casos y
controles, la información de exposición obtenida por este método está
sujeta a sesgo de memoria (véase capítulo 7). En caso de que este
problema constituyese una preocupación importante, puede afrontárselo
utilizando información de exposición pre-registrada, si se dispone de
ella, o escogiendo controles que aunque no padeciesen Ja enfermedad en
estudio, poseyesen, sin embargo, un estimulo de recuerdo equivalente.
Un ejemplo de este último aborda.je podría ser, en un estudio sobre
malformaciones congénitas, una serie de control hecha a base de niños
con malformaciones distintas de las que se estudiase. Sólo la!' que se
pensase que no estaban relacionadas con la exposición en estudio debe-
rian ser permitidas como criterio de elegibilidad para los niños controles.
Un método frecuentemente utilizado para conseguir mediante entre-
vista información acerca de sujetos que están incapacitados o muertos,
consiste en obtenerla a partir de Jas esposas u otros miembros de la
familia. El acuerdo entre la información obtenible de los sujetos mismos
y de personas que hablasen por ellos puede ser razonablemente bueno
-1
para algunos factores, como las variables de la dieta (Humble el al.,
1984) pero puede ser flojo para otros, como la historia de síntomas
psicopatológicos (Mendlewicz el al., 1975). El determinante de mayor
importancia para la validez de una información subrogada parece ser el
tipo de persona que responda: los hermanos son los que producen la
:STRATEGIAS EN EL DISENO DE :STUDIOS EPIDEMIOlOGICOS 25

información más ajustada accrca de detallcs familiares y acontecimientos


de los primeros años de vida. mientrc'ls las csposas ;: los dcscendientes la
dan mi1s aíinada sobre 1.1edad adulta (Picklc ('I al.. 19R31.Como con
cualquier clasilicación incorrccta. la magnitud dcl sesgo producido por
la subrogación dc datos dependc dcl gr.1<.lo de Ilo-fiahilidad (Kupper,
1984).
Si uno prclendc medir la exposición relacionada con más fuerza con
la ocurrencia dc cnrcrmedad en un estudio epidemiológico. resulta ine\'i-
table cierto grado de cJasilicación incorrecta de la misma. Hasta cierto
punto. cualquier variable que se mid.\ en un estudio epidemiológico
puede ser considerc'lda como sólo una vari.\hle subrogada de alguna otra
medida. más adecuada, del fenómeno subyacente. Consideremos la me-
dición dcl consumo de cigarrillos como causa de cáncer de pulmón.
Asumamos, a erectos de la discusión. quc la cantidad inhaJada de benzo-
pireno es la que mejor predice el riesgo de cáncer de pulmón. Incluso en
un estudio de seguimiento. y ciertamente en uno de casos y controles. no
seria posible esperar medir la cantidad de benzopireno inhalada. i.Qué es
lo que se puede medir? Quizás el consumo diario de cigarrillos. Pero
luego hace ralta saber qué tipo de tabaco se utiliza. hasta dónde se
consume la colilla. si el cigarrillo tiene fillro y cuán profundamente
inhala el humo el individuo. entre otras cosas. Por lo general, ninguna
de ellas puede ser calculada con ninguna razonable exactitud. Incluso si
se pudier.l. la medid.1 ideal de la exposición deberia integrar dicha infor-
mación durante un periodo de tiempo y tener en cuenta un período de
induccíón razonable, que, sín embargo, es usualmente desconocido.
Cuando se estudia. por tanto. el consumo de cigarríllos y el cimcer de
pulmón. haria ralla. teórjcamente. ínrormación exacta sobre el uso de
cigarrillos duranle cíerlo período de tíempo, mucho antes de que el
cáncer de pulmón ocurríese o pudiese ocurrir. Puesto que el tíempo
exaclo es incierto y puede que hubiera que inlentar una varíedad de
posibilidades en un análisis dado. se necesita en principio una informa-
cíón ajustada sobre la exposición para un período que cubriese muchas
décadas, incluyendo los detalles de cómo varió la exposición. con el
tiempo a largo de dicho periodo. Puesto que una inrormación históríca
de semejante exactitud no es conseguible. resulta inevitable cometer
algún nivel de incorrección al clasificar la exposición. Una gran ventaja
de la inrormacíón a partir de entrevístas viene dada por el hecho de que
és.tas pueden aportar informacíón de la exposíción en direrentes momen-
tos del pasado. cosa que la información registrada por lo general no
hace. La inrormacíón regístrad.\ acerca de la exposicíón puede ser íne-
xacta. con respecto .\1 tiempo. lambién de una nue\'a forma. Por ejemplo.
un indivíduo puede solicitar una receta para un medicamento y no
empezar a tomarlo hasta mucho después. pasado un buen tíempo. La
ínformación regístrada parecería sugerír que el individuo estuvo expues-
la en el momento en que se cumplimentó la prescripción, pero no en el
de después. ex¡\ctamente al contrario de como en realidad sucedió. Debe
recalcarse. pese .\ todo. que eslos errores de clasificación incorrccta de la
'26 EPIDEMIOlOGIA MODER'~/.

información sobre exposici()n. aunque impregnan y h:1~t(l Cierl(\ punlC'


sesgan los resultados de tod(\ estudio epidemiológico. son por J() genera:
errores no diferenciales que reducen las asociaciones pero no las exa!:!c-
ran.
Si resulta inusuaJ que un estudio pueda c.c;tar basado en illf()rm:1ci()n
ya registrada, tanto de exposición como de enfermedad, 1()da\1ia c~
menos frecuente que exista suficiente información registrada como para
controlar adecuadamente en eJ anáiisis los factores de confusión. Ya .c;~
discutía en eJ capituio anterior que la exactitud al determinar io~ facl('-
res de confusión es algo tan importante como la exactitud cn la~ varia-
bles fundamentales que se estudian. En la medida en que un factor d,::
confusión esté clasificado incorrectamente () se utilice una variable SUt"I-
rogada en lugar de un factor de interé$ más directo. se e.c;tari¡ impidicn-
do eJ controJ de la confusión que ese factor e.icrce (GeenJand. 1980:
Kupper, 1984). Por ejemplo. en el caso extremo de qu,.: la rnformaciól1
obtenida sobre la confusíón careciera de correlación con 10$ valores
reales del factor que la ejerce, el a.iuste según el factor de confusión
medido constituiría un ejercicio vacío, sin efecto alguno sobre los resul-
tados; con tal proceso de ajuste no se eliminaria de los datos confusión
alguna. En el mismo grado en que el factor de confusión medido no sea
una medición perfecta del factor de confusión «idealizado», permaneceri\
en los datos un nivel residual de confusión. Esta confusión residual se
convierte en una preocupación especialmente importante si la exposición
tiene un efecto débiJ o cero )' si eJ del factor de confusión es un erecto
potente.

PREVENCION DE LA CONFUSION

En el diseño de estudios epidemiológicos $e utilizan tres métodos para


prevenir la confusión. Uno, la randomización. sólo es aplicablc en expe-
rimentos. Los otros dos métodos. la restricción y el apareamiento. son
aplicables tanto en estudios experimentales como no experimentales.

RANDOMIZACION

La ra1ldomizació1l, o ubicación al azar. es un proceso que se sigue en los


experimentos y que implica la asignación aleatoria de los sujetos a las
categorías de exposición. (La randomización no debe ser confundida con
el «muestreo aleatorio», que es un método de muestreo que no tiene
nada que ver con el diseño experimental.) La ubicación aleatoria ofrece
grandes ventajas sobre los esquemas alternativos de asignación y. conse-
cuentemente, es el método de elección para asignar los sujetos en lo~
experimentos.
Al asignar exposición, la meta, por fil1puesto. e~ crear grupo~ de
estudio que tuviesen una igual propensión por el resultado -es decir.
ESTRATEGIAS EN EL DISEÑO DE ESTUDiOS EPIDEMIOLOGIC:>S 27

iguales incidencias de enfermedad, en ausencia de !a exposición asigna-


da. Si existen sólo unos pocos factores que determinen la incidencia y el
investigador los conoce. un plan ideal seria aqué1 que asignase las expo-
siciones de forma que consiguiese idénticas distribuciones de los determi-
nantes de la enfermedad en cada grupo. Para conseguir dichas distribu-
ciones idénticas. sin embargo. habria que uti1izar un esquema de asigna-
ciones en el que fuese posible predecir correctamente la asignación de
sujetos con características especificas, una vez que se supiesen las ubica-
ciones de los sujetos previamente enrolados. Esta capacidad de predic-
ción abre el proceso asignador a manipulaciones que podrian acabar
con los objetivos del estudio. Por consiguiente, es preferible utilizar un
esquema en el que sea imposible conocer la asignación de un individuo
dado. hasta después de realizada ésta. La randomización cumple tal
criterio.
Un inconveniente de la randomización es que no conduce a distribu-
ciones idénticas de los determinantes de la enfermedad, sino sólo a
distribuciones que tienden a ser idénticas. aumentando esta tendencia
] conforme se incrementa el tamaño de los grupos del estudio. Así pues, la
randomización va bien para estudios grandes, pero es menos efectiva
para otros más pequeños (Rothman. 1977). En el caso extremo en que
sólo un sujeto está incluido en cada grupo (como en los ensayos comuni-
tarios de nuoración, con una comunidad en cada grupo), la randomiza-
ción es completamente inefectiva. Como compensación por esta falta de
fiabi1idad en estudios pequeños. la randomización tiene la ventaja de que
tiende a hacer idénticas las distribuciones de todos los factores. no sólo
la de los que han sido identificados como importantes por el investiga-
dor. Por controlar todos los factores, conocidos y desconocidos. que
tienen influencia sobre la incidencia de enfermedad y por aportar un
mecanismo para ubicar a los sujetos que es resistente a la manipulación.
la randomización es una poderosa técnica de cara a evitar el efecto de
confusión. Se puede mitigar su inconveniente de ser no-liable en estudios
pequeños, evaluando y controlando en el anillisis de los datos cualquier
confusión debida a factores de riesgo conocidos o sospechados, en la
medida en que lo permita el pequeño tamaño del estudio.

RESTRICCION

La confusión no puede ocurrir si a la variable con esa potencialidad se le


prohibe que varie. Restringir los criterios de admisibilidad de los sujetos
es, por tanto, un método extremadamente efectivo de prevenir la confu-
sión. Si se mide sobre una escala nominal. como la raza. el sexo o la
religión a la variable que puede confundir, la restricción se cumple
admitiendo como sujetos en el estudio sólo a los que caen dentro de
categorías específicas (usualmente, sólo una única categoria) de cada
variable de interés. Si la variable potencialmente confundidora es medi-
da de acuerdo a una escala continua. como la edad. la restricción se

.1
'28 EPIDEMIOLOGIA MODERNA

logra definiendo para ella un rango que !\ea ~uíicientemente e~trecho


como para corresponder con un e~pectro de incidencia de enfermedad
relativamente homogéneo. Sólo se admite como suieto~ dcl e~tudio a lo~
individuos que están dentro de ese rango. Si la eda-d de lo~ su.icto~ de un
estudio varia poco, la edad no puede ser en cJ mismo un factor de
confusión sustancial.
La restricción es una excelente técnica para impcdir la confl1~i()n.
puesto que no sólo es extremadamente efcctiva sino que. ademils. no
cuesta nada. La decisión de si admitir en el cstudio ~l un individuo dado
puede ser tomada rápidamente y sin rcferencia a otro~ miembro~ del
mismo. La principal desventa.ja es simplemente quc la re~tricción de los
criterios de admisibilidad puede contraer el con.junto de su.ietos disponi-
bles por deba.jo del nivel deseado. Cuando ha~' su.jeto~ rotcnciale~ en
abundancia ha~' que emplear la restricción a fondo. porquc cIJo me.jor~1
la validez a bajo costo. Cuando se dispone de menos de ello~. l~lS
1
venta-jas de la restricción deben ser sopesadas frente a la~ dcsventa.i:l~ dc
tener un grupo de estudio disminuido.
Una posible prevención relacionada con I~I restricci()n consistc en
que un grupo de estudio homogéneo constituirá una pobre ba~c a la
hora de generalizar los resultados del estudio. Tal preocupación es
ilusoria, no obstante, porque la generalización científica no es un procc-
so estadístico; es un proceso de extensión del conocimiento. a tr~lvés de
una serie de explicaciones sometida~ a comprobación. Una inferencia
acerca de la etíologia de una enfermedad derivada de un grupo dc
estudio homogéneo. constituye una b~lse par~1 I~, ~encraJiz~lci()n científic~1
sobre el problema en estudio mucho mils filerte que cualquier otr~1 quc
fuese posible extraer a partir de un con.iunto de nhser\.acione~ ba~:ld~l~en
un grupo de estudio heterogéneo. En un e~tudio hecho ~ohrc un grup()
heterogéneo. la validez será meno~ se~ur~J y la~ condiciones bajo la~
cuales se sostiene la relación observada. menos especificables que las de
otro que estuviese fundamentado en un grupo de cstudio homogéneo. E]
proceso inferencial implica la formulación de concepto~ abstractos a
partir de observaciones concretas. e~pecilicas: al mc.iorar la validez y la
especificidad de las observacione~ epidemioll,gic~ls. la re~tricción en los
criterios de admisibilídad. más que desvirtuar, resall~1 la inferenci~1 cienti-
fica.

APAREAMIENTO

Un estudio de seguimiento es una generalizaci()n dcl paradi~ma cicnlifi-


CO, el experimento. En estudio~ de seguimicnto, en lo~ que el inve~liga-
dor no puede asignar expo~iciones, parece natural. para impedir 1;1
confusión, seleccionar los sujetos según un procedimient() tal que ~e
distribu)'an idénticamente en cada uno de los ~rupo~ comparados los
potenciales factores de confusión. Si n() sc u~a la re.c;tricción. aún ~c
siguen pudiendo conseguir distribuciones idéntica~ para los grupos C()nl-
J

ESTRATEGIAS EN EL DISEÑO DE ESTUDiOS EPIDEMIOLOGICOS 129

parados a través del apareamiento de caracteristicas en la seiección de


los sujetos. La serie índicc. que en los estudios de seguimiento es el grupo
expuesto, se admite sin restricción alguna: luego se selecciona la de
comparación (no-expuestos), buscando conseguir distribuciones idénti-
cas a la de la serie índice para uno o más factores potencialcs de
confusión. Los sujetos de comparación pueden ser apareados individual-
mente. uno a uno, con los sujetos de la serie índice, o puede apareárselos
por grupos «<apareamiento de frecuencias»). En un estudio de segui-
miento con apareamiento. ninguna de las variables potencialmente con-
fundidoras sobre las que se haya apareado puede estar confundiendo,
porque ninguna estará asociada con la exposición en la población del
. estudio. A pesar de la aparente simpleza de este argumento. el aparea-
miento es uno de los lemas más complicados de la teoría epidem1ológica.
Las complicaciones surgen porque la lucida forma en que el apareamien-
to previene la confusión en los estudios d~ seguimiento no es aplicable a
los de casos y controles.
La técnica que nos ocupa se usa raras veces en estudios de segui-
miento. porque es demasiado costosa. Encontrar un sujeto de compara-
ción que posea el conjunto de características adecuadas respecto a cada
] uno de los factores de apareamiento. puede significar una búsqueda de
grandes dimensiones y un laborioso mantenimiento de registros. El
. típico gran tamaño de los estudios de seguimiento convierte. pues. al
apareamiento en un método caro para controlar la confusión en tales
estudios. Cuando se analiza la eficiencia como cantidad de información
por sujeto, el apareamiento aumenta realmente la eficiencia de un estu-
dio de seguimiento. pero si se la toma como cantidad de información por
-1 unidad de costo, el apareamiento es un método extremadamente inefi-
cien te de controlar la confusión en ellos. Walker ( 1982) ha propuesto un
método que mejora grandemente la relación coste-eficiencia de los estu-
j dios de seguimiento apareados; el método incluye la colección de datos
sobre factores de confusión sólo para los pequeños subgrupos de sujetos
que contribuirán a la estimación del efecto. En los estudios de segui-
miento, no obstante. es en general más eficiente, en relación al costo,
controlar la confusión en el análisis que intentar impedirlo mediante el
apareamiento.
Lo caro que resulta el apareamiento es un serio inconveniente inclu-
so para los estudios de casos y controles, que tienden a ser considerable-
mente más pequeños que los anteriores. Incluso para una lista modesta
de características, aparear los controles a los casos resulta una tarea
dificil, que consume importantes esfuerzos y resulta, en consecuencia,
cara si se la compara con métodos alternativos. como la restricción, o
con técnicas diseñadas para controlar la confusión en el análisis de los
datos. Anteriormente, en este capítulo, se mencionó el apareamiento
como una forma de incrementar la precisión y con ello mejorar la
eficiencia del estudio. Esta mejora de la precisión, no obstante, puede
que tuviese que ser conseguiqa a un costo considerable. Igual que en el
caso de los de seguimiento, la eficiencia de los estudios de casos y
130 EPIDEMIOLOGIA MODERNA

controles se juzga mejor relacionando la información ohtenida o la


precisión de la medición. no con el número de sujetos estudiado$. sino
con el coste de obtener la información. Valorando la eficiencia de esta
manera, la aparentemente mayor eficiencia en el diseño lograda median-
te el apareamiento puede resultar serio menos. en relación al costo. que
el admitir un gran depósito de potenciales controles rara el estudio y
controlar. valga la redundancia. la confusión en el análisi~ mediante la
estratificación. En el capitulo 13 se hace un tratamiento mils detallado
de este tema.

REFERENCIAS

Antunes. C. M. F., Stollcy, P. D.. Roscn$tcin. N. B.. ct ;tl. En<iomctri;tl c;tnccr


and estrogen use. Report or a large case-control $tudy. N. Enf{l. J. .}f('d.
1979;300:9-13.
Greenland, S. The effect or misclassification in thc rrcscncc or c()v;tri;ttcs. ..1",. J.
Epidemiol. 1980;112:564-569.
Greenland, S., and Neutra. R. An analy$is or dctcction bias Jl1d proposcd
corrections in the study or estrogens and endomctrjal canccr. J. Chr(}n. Di.\".
1981;34:433-438.
Gutensohn, N., Li, F. P., Johnson, R. E.. ct al. Hodgkil1.s disca$c. t()nsillcctomy
and ramily size. N. El/gi. J. M('d. 1975;292:22-25.
Horwitz. R. 1., and Feinstein. A. R. Altcrnatjve analytic mcthods ror case-
control studies or estrogens and cndomctrjal canccr. N. E".~/. J. i\f(.d.
1978;299: 1089-1094.
Hutchison. G. B.. and Rothman. K. J. Corrccting a bias? N. Engl. J. ;\f(.d.
1978;299:1129-1130.
Humble. C. G., Samet. J. M., and Skipper. B. E. Comparj$on or sclr-and
surrogate-reported dietary.inrormation. .4m. J. Epide,11Íoi. 1984;119:86-9R.
Kupper, L. L. Effects or the use or unreliable surrogate variables on the validity
or epidcmiologic research studics. ..Im. J. Epid(',1Ii(}l. 1984; 120:634,,638.
Mack. T. M., Pike, M. C., Henderson. B. E.. ct. al. Estrogens and endometrial
cancer in a retircment community. N. Enf{l. J. J\fed. 1976;294:1262-1267.
Mendlewjcz, J., Fleiss, J. L., Cataldo, M.. et al. Accuracy or the family hjstory
method in affective illness. Comparison with dircct intcrviews in ramily
studies. ..Irch. Gen. P.rvchiatrl. 1975;32:309-314.
Miettinen. O. S. Individu~l1 matching with multiplc controls in the ca$e or ;tll-
or-none response. Biometrics 1969; 25:339-355.
Morgenstern. H.. and Winn, D. M. A method ror determining thc ~ampling ratio
in epidemjologic studies. Stati.\'tic.\" J\fed. 1983: 2:387-396.
Paffenbarger. R. S., and Hale. W. E. Work activity and coronary hcart morta-
lity. N. Engl. J. Med. 1975; 292: 545-550.
Pickle, L. W., Brown, L. M., Blot, W. J. Inrormation available rrom surrogatc
respondents in case-control interview studics. /11/1.J. EpideI/Ii()I. 1983; 118:99-
108.
Robison, L. L.. and Dajgle. A. Control selection using random digit dialing ror
cases or childhood cancer. Am. J. Epid(!mi(}l. 1984:120:164-J66.
Rothman, K. J. Epidemiologic methods in clinjcal triasl. Can("('r 1977;39:1771-
1775.
ESTRATEGIAS EN El DISENO DE ESTUDiOS EPIDEMIOlOGICOS
.~
.~ 1

I
.

~
ESTRATEGIAS EN El DISENO DE ESTUDiOS EPIDEMIOlOGICOS
.~
.~ 1

I
.

~
9. EL PAPEL DE LA ESTADISTICA
EN EL ANALISIS EPIDEMIOLOGICO

Muchos estadísticos han contribuido al des(lrrollo dc la tcoria epidemio-


lógica y muchos epidemióJogos prominentes tuvieron su formaci{)n pro-
fesional fundamental en la estadística. No resultará. por tanto. sorpren-
dente que los conceptos estadísticos dominen el discurso de gran parte
de lo que se publica en epidcmiologi(l. La corrccta comprensión yaplic:l-
ción de los conceptos estadísticos es algo c.<;cncial para el ¿lnilJisis dc
datos epidemiológico. pero las prácticas y las ideas estadísticas han sido
a veces transferidas a la cpidemiologia sin una adccuada consideración
de si encaj(lban bien o no.
La estadística juega dos papeles fundamentales en el Jnálisis epide-
miológico: determinar la variación debida al azar y controlar el efecto de
confllsión. Aunque en epidemiología existen otras aplicaciones estadísti-
cas pertinentes, como la evaluación de interacciones entre factores. las
dos citadas representan las áreas epidemiológicas fundamentales que
requieren métodos estadísticos.

DETERMINAC10N DE u\ VARJ¡\BILIDAD I\LE/\ TORIA

COMPROBACION DE L/\ J-IJPOTESIS ESTADISTJC..\

Históricamente, la determinación científica de la variabilidad aleatoria


ha sido llevada a cabo predominantemente medianle la comprohación
de hipótesis estadísticas o «pruebas de significación». H:.1CCmás de
cuarenta años, Berkson ( 1942), escribia:

«Dificilmente sería una exageración decir que la estadística. tal y como


se la enseña hoy día en la mayoria de las escuelas. está compucsta casi
únicamente de le.rt de significación, aunque no siempre se los presente
como tales, algunos comp;lratívamente sencillos y directos, otros cla-
borados y abstrusos.»
133
134 EPIDEMIOLOGIA MODERNA
--~
El omnipresente uso de ]os «\'a]ores dc p» ~' la referencia a hallazg('1~

«estadisticamente significativo~>, en 1(1literatura médic¡¡ actuaj. demuc~-


tran eJ papel dominante que 12 comprobaciáJ1
sigue jugando en las ciencias biomcdicas
de hjrót~sis ~stadislJ~a~
a la h('1ra dc analizar los daloS.
1
Muchos investigadores entienden que resultari¡¡ infrucluoso enviar a
publicar papel alguno quc careciese de pruebas estadisticas de «significa-
ción». Su creencia no e-"til vacia por complct('1 de sentid('1. puesto qlJC I()s
editores dc revistas y quiene~ decidcn cn ellas sc ¡Ipoyan por lo gcl1cral
en dichos t('.~t.~de significación. como si fuescn indicadores de Sofislica-
dos y expresivos aná]isis estadisticos. a la \'CZ quc como forma primor-
dia] de determinar ia variabilidad muestra] de un estudio. Tal prcocupa-
ción toma cuerpo en ]0 mucho que se centran en quc los «va]orcs de p»)
sean menores de 0,05; según I() sean. o no. los rcsultados ~e considerariln
«significativos» o «no significativos».
Las raíces de la preocupación por el conccpto que no~ OCIJpa estill1
en los temas de investigación que interesaron a aquellos profesionalcs 18
que a principios de este siglo fueron pionero~ en e] desarrollo de la teoría
estadistica. Los problemas de que se ocupaban eran indu~tria]es ~' a!!ríco-
las, ~' era típico que incluyesen experimentos que debian constituir 1(1
base de elección entre dos o mils cursos "de acción a]ternativos. Los
experimentos. pues, estaban disef1ados con ob.ieto de producir re~ultad()~
que capacitasen para tomar una deci~ión, por i() quc ¡o~ mélodos esta-
disticos empleados se orientaron a facilitar la citada toma de decisiones.
Los conceptos que fueron creciendo a parlir dc esta hcrencia y ho)' se
aplican en la investigación clinica y epidemiológica rene.ian poderosa-
mente este origen.
La comprobación de un~! hipótcsi~ cstadistic~¡ se ccntr~\ en !a hip(í-
te.\"i.\"nula. que es una hipótesis sobre ia no existencia de asociación entrc
dos variables. Si los datos aportan pruehas contr~1 ella. puede ~er recha-
zada en favoí de otra hipótesis allernativa no-nuia. Lo tipico es qlJe esla
hipótesis alternativa sea vaga: si la nula afirma que no ha~. asociación. la
alternativa debe afirmar simplementc que si la ha~.. La hipólesis alterna-
tiva pued~. igualm~nt~. ser unilaleíal, afirmand() especirlcamente quc
existe una a~ociac¡ón positiva (o ñegativa). En términos de una medición
epidemioló~ica dcl efecto, la hipótesis alternativa inc]lIye una ampli~1
gama de valores. que van desde un efecto diminuto a otro exagerad,,-
mente grande. Esta amplia gama dc posiblcs erectos consistentes con 1~1
usual hipótesis alternativa implica un amplio abanico de posibles resul-
tados en los datos que sean consistentes con ella. Por el contrario, la
hipótesis nula corresponde a un único valor <1cl efecto y es, por tanto,
consistente con una gama mucho más estrecha dc posibles resultados de
los datos. Si aceptamos la idea de Popper de quc podemos falsificar
hipótesis, pero no confirmarlas, resultaril natural que nos concentremos
en una que sea lo más especifica posible, porque I" fa]sificación de una
hipótesis especí/ica es más filCil que la de otra quc fuc~e vaga. L¡1
comprobación de una hipótesis estadistica consi~te. pues. en un inlent(}.
de falsificar I~l hip¿)tesis nul~1 ~. aceptar. por cxc]usión. 1;1 alternativ~l.

~
EL PAPEL DE LA ESTADISTICA EN EL ANALISIS EPIDEMIOLOGICO 35

En el proceso de poner a prueba una hip()tcsis estadístic~1ha). in\'olu-


crada una toma de decisiones. porque rechazar o ;Iceptar una hipótesis
es en si una decisión. E] «valor de ?» es la principal estadistica que se
uti]iza para comprobar una hipótesis. Indica la probabilidad. asumiendo
que la hipótesis nula ruese verdad. de que los datos obse\'ados se ~Iparta-
sen de una ausencia de asociación en la medida en que actualmente lo
hacen O en una medida mayor, como consecuencia únicamente del alar.
Los va]ores de ? se calculan a partir de modelos estadísticos que. se
piensa, describen el patrón de observaciones que se daría si el azar ruese
la única razón de su variabilidad. Forman una estadística continua. con
valores comprendidos entre cero y uno. Valores pequeños de p indican
un grado bajo de compatibilidad entre la hipótesis nula y los datos
observados, en \,irtud de la baja probabilidad de que un resultado tan
extremo como. o m{ls extremo que. los datos observados pudiera habcr-
se generado si la hipótesis nula ruese verdad. Tales valores pequeños de
?, por tanto, desplazan la credibilidad de la hipótesis nula hacia la
alternativa. que sirve a modo de relativamente mejor explicación de los
datos. Aunque el valor de p es una medida continua con un significado
razonable, se le usa rrecuentemente para rorzar una decisión cualitati\'a
en torno al rechazo de la hipótesis nula. Como criterio de juicio se utiliza
un punto arbitrario, habitualmente el 5 por 100, tomando dicho punto
para clasificar lo observado como «significativo», si ? ~ 0,05. en cuyo
caso se rechaza la hipótesis nula, o «no significativo», si p > 0.05. en
cuyo caso no se la rechaza. En general es incorrecto, por razones que
más adelante quedarán claras, pensar en «aceptan) la hipótesis nula en
ravor de la alternativa cuando no se la puede rechazar: por lo tanto, «no
rechazada», no es lo mismo para una hipótesis nula que aceptada.
¿Qué pasaría si la hipótesis nula es cierta en la relidad. pero a pesar
de todo se la rechaza? Si el criterio de rechazo de los valores de p es del
5 por 100, esto será lo que ocurrirá. de hecho, 5 de cada 100 veces en que
la hipótesis nula ruese cierta. Se llama a tales rechazos incorrectos
«errores de tipo I» o errores alra. Si es ralsa y no se la ,rechaza. el
resultado es un error de tipo II o beta. Existe una interrelaci()n entre loS
errores de lipo 1 y II. que depende del punto de señalización que se
escoja para la «significación estadística»: reducir el error de tipo I cuan-
do no hay erecto requiere que el segmento que se utiliza para que los
valores de p sean juzgados como estadísticamente «significativos» sea
menor, pero un segmento de «significación» más pequeño aumenta la
probabilidad de que se cometa un error de tipo II si existe erecto.
Aumentar el valor en que se establece la «significación estadística».
reduce el error tipo II cuando hay un efecto, pero aumenta el de lipo 1 si
no lo hay. .
Estos conceptos, de errores de los tipos I y 11, se hallan ligados a un
proceso de toma de decisiones que requiere que se interpreten los datos.
de manera que produzcan la decisión de rechazar o no la hipótesis nula.
como antes se señalaba. Hasta qué punto domina esta toma de decisión
al pensamiento investigador es algo que se refleja en la frecuencia con
136 EPIDEMIOLOGIA MODERNA
---
que el valor de P, una medida continua. es rererida únicamente o hien
como parte de una desigualdad (del tipo de p < 0.05 o p > 0.05) o
incJuso como nada, centrando en su Jugar el cnrasis de la evaluación en
si ha~' «significación estadística» o no la hay.
Un modelo de anáJisis orientado a la loma de decisiones resulla
justificable cuando la elección entre dos alternativas tiene como base un
único estudio. Sin embargo. esta no es la situación virtualmente nunca
en la investigación epidemiológica ni. a los erectos que nos ocupan. en
ninguna investigación biomédica. Ello no quiere decií, por supuesto. que
los datos epidemiológicos no jueguen un papel instrumental en la toma
de decisiones en salud pública. Lo que quiere decir, por contra. es que
los resultados de un estudio único raras veces. si es que alguna. constitu-
\'en la base de una decisión. No se racilita 12 toma de decisiones de
acuerdo a los resultados de un conjunto de estudios cuando cada uno de
elJos está clasificado como una decisión «si» o «nO». Degradaí Ja infor-
mación hasta hacer de eJla una dicotomia es contraproducente. incluso
para la toma de decisiones. y puede conducir a errores.
Revisando 71 ensayos ciinicos que renejaban una direrencia no «sig-
nificativa» (P > 0.05) entre los tratamientos comparados. Freiman ('I (II.
(1978) encontraron que, en la gran mayoría de ellos, Jos datos indicaban.
o al menos eran consistentes con. un erecto moderado o incluso razona-
blemente fuerte a favor del nuevo. En todos ellos, Jos investigadores
originales habian interpretado sus datos como indicativos de ausencia de
efecto, porque Jos valores de p eran «no significativos estadisticamente».
El error de interpretación surgió porque se habían basado para su,c;
anáJisis estadísticos únicamente en las pruebas de «significación». en ve7
de apoyarse en otros análisis más descriptivos e informativos. Al no
conseguir rechazar Ja hipótesis nula, los investigadores de estos 71 ensa-
yos la «aceptaron» indebidamente como correcta, lo que resultó en un
probable error de tipo 11 para muchos de Jos estudios llamados «negati-
vos». El error dc tipo 11 surge cuando Ja magnitud de un efecto. Ja
cantidad de inrormación de los datos ~. la variabilidad aleatoria se
combinan para dar resultados insuficientemente inconsistentes con la
hipótesis nlJla como para permitir que se la pudiera rechazar. Este rallo.
de no reciJ:lzar la hipótesis nula debicndolo hacer, puedc ocurrir bien
porque el :.fccl" sea pequeño. las observaciones demasiado poco nume-
rosas o r"1 amhas cosas. Pero lo que más nos interesa. pese a todo. es el
hecho n(' <Iue un error de tipo II (o de tipo I) sr produce porque el
investigador h:l intentado dicotomizar los resultados de un e",tudio en
las categorías «significativo» y «110 significativo». Dado quc resulta innc-
cesariu semejante degradación del estudio. el error que puede resultar de
una clasificación incorrecta de sus resultados es asimismo innccesario.
¿Cómo ha sido posible que una muleta metodológica tan poco atrac-
tiv~1 haya arraigado tanto? Sin" duda, gran parte del enamoramiento con
la puesta a prueba de la «significación» proviene de lo aparcntemcnte
objetivo )' concJuyente del veredicto de «significativo». Una declaraci()ll
de «significación» n de su ausencia puede acabar suplantando la neccsi-
EL PAPEL DE LA ESTADISTICA EN EL ANALISIS EPIDEMIOLOGICO ;37

dad de cualquier int~rprctación real de los dalos. o puede servir de


mecanismo suslitutivo del pensar. promulgado por la inercia de la ense-
ñanza y de la práctica ordinaria. La nitidez de un resultado aparente-
mente contundente puede. también. resultar mils gratificante a investiga-
dores, editores y lectores que un hallazgo que no pudiese ser inmediata-
mente encasillc.ldo. El proceso rutinario de poner a prueba la «significa-
ción» es sólo superficialmente parecido al proceso intelectual de conjetu-
ra y refutación que Popper describía como método científico. El irrerre-
nable homenaje que las ciencias sociales han rendido a este concepto ha
sido atribuido. como se dijo, a la aparente objetividad que un procedi-
miento de «significación» puede aportar (Atkins y J arret, 1979):

«Vamos a echar un ojo ya vcr qué cs signilicativo» es algo que no está


demasiado Icjos de la forma en que algunos investigadores abordan la~
cosas. y si los datos incluyen quiz:í algunos cientos de variables. las
tentaciones prácticas de utilizar una regla de deci~ión hecha a mcdida
son enormes... La presión por decidir. en situaciones en que el propio
uso dc modclos de probabilidad admite la incertidumbre de la inferen-
cia. tiene consecuencias ciertas para la presentación del conocimiento.
El te.,"t de ~ignilicación parece garantizar la objetividad de las conclu-
sioncs del invcstigador e incluso ~e Ic puede prescntar como si aportase
un apoyo crucial para la teoría global en que fue encuadrada la
hipótesis de invcstigación. Como hcmos visto. l~lS prucbas de signilica-
ción no pueden hacer ninguna de estas cosas -pero reconocerlo de-
masiado abiertamente es algo que no interesa a nadie quc esté implica-
do.

El origen de la casi universal aceptación dcl margen del 5 por 100


para los hallazgos «significativos» está ligado a la forma comprimida en
, que se publicó originalmente la tabla de chi-cuadrado (Freedman el (11.,
1978). Antes de que las computadoras o las calculadoras pudiesen dar
con facilidad aproximaciones rápid.1S de tal distribución, se us.lban de
forma rutinaria las tablas. Puesto que hay una distribución diferente de
l la chi-cuadr.ldo que corresponde a cada posible valor de los grados de
:
i libertad. tales tablas --para una distribución cualquiera- no po.dí~ln
1
recoger muchos puntos. Incluian típicamente los valores al l por 100. ~I
5 por 100 y unos pocos niveles mils. lo que estimuló la práctica dc
I
i comprobar la chi-cuadrado calcul.lda a partir de los datos propios. par~l
ver si excedía los niveles señalados en la t~lbla.

Eslimaci()" d(,1 inlcrt'alo

Si las pruebas de «signilicaciól1» inducen a error, i,cómo habria quc


presentar los resultados? De acuerdo con el espiritu de la senlenci.¡ de
Kelvin sobre que la ciencia es medición, es mejor conceptu.¡lizar cl
asunto como relacionado con ella, y no como un problcma de loma de
decisiones. Conceptualizar un estudio como un ejercicio de medici¿)n
'38 EPIDEMIOLOGIA MODERNA

exige más precisión a la hora de presentar los resllltado~ que I? simrie


dicotomía que una comprobación de hipótesis estadisticas representa.
Cualquiera que fuese el parámetro objeto de inferencia en un estudi()
epidemiológico -normalmente es una meáida del cfeclo. sea un~ raz()ll
de tasas o una diferencia entre ellas, pero puede ser también simplemente
una tasa de incidencía o cualquier otra medida epidemiológica- estará
medido según una escala continua. es decir, una escala con un númer()
infinito de valores posibles. A partir de los datos dcl estudio. se pueáen
generar estimaciones del parámetro. La mejor de éstas. presentada co-
mo un \'alor único sobre la escala continua de medición. se conocc com()
esr;,nación puntual. Un estímado puntual e~ un indicador del grado de
asociación o de la magnitud deJ efccto presente en los datos. Puesto que
es únicamente un punto en una escaln de posíbilidades infinitas. no
constituye una estimación fiable. Matemáticamente. la posibilidad de
que sea correcto es uno/infinito, o sea, cero. De cara, sin embargo. a
incorporar en el proceso de estimación la toma en consideración de la
variabilidad aleatoria de las observaciones. es preferible calcular el efccl()
utilizando para el parámetro un rango de valores. Tal rango represen-
ta un conjunto de posibles valores de éste que sería consistente con los
datos observados, dentro de límites especificados. Se le conoce como
inlervalo de confianza )' al proceso de calcularlo, esri1"aciól1 del i17ferL'a!tJ.
La amplitud de un intervalo de confianza depende de la cantídad dc
variabilidad que haya en los datos. pero también de un valor arbitraria-
mente seleccionado que especific..1 el grado de consistencia entre los
límites del intervalo )' los citados datos. Este valor arbitrario es el nivel
de confianza, que se expresa habitualmente como porcenta.ie. Si el nivel
de confianza es el 90 por 100, se constituirá el intervalo con amplilud
suficíente como para tener un 90 por 100 de posíbiJídades de contener en
su interior eJ valor deJ parámetro -o, la que es lo mismo. teniend() en
cuenta eJ grado de variabilídad que haya en los datos, en el 90 por 100
de las replicaciones deJ proceso de obtención de éstos, eJ intervalo (en
ausencia de sesgo) incluirá el pari\metro. EJ nivel de confianza puede ser
fijado en cualquier cifra, porque es arbitrario, pero lo más normaJ es que
se usen valores del 95 por 100, del 90 por 100. u ocasionalmente de] 80
por 100.
Existe conceptualmente una relación directa entre el nivel de confian-
za )' eJ nivel de error alfa de comprobación de la hipótesis. El nivel de
confianza es equívaJente aJ complemento deJ nivel a1fa. es decír, J -a.
Para entenderlo, considérese el diagrama de I~I figura 9.1.
Supongamos que se lleva a cabo un test de la hipótesis nula con
a = 0,10. El hecho de que el intervalo de confianza del 90 por 100 no
incluyese el punto nulo indicaria que la hípótesis nula sería rechazada
para un valor de rx = 0.10. De manera distinta, el hecho de que el de! 95
por 100 lo incluyese. significaría que la hipótesis nula no seria rechazada
para a = 0,05. Puesto que el intervalo deJ 95 por 100 incluye el punto
nulo y el del 90 no, se puede inferir que eJ valor de p es mayor de 0.05 )'
menor de 0,10.
:;}.~,

EL PAPEL DE LA ESTADISTICA EN EL ANALISIS EPIDEMIOLOGICO '39

tmervalo de confianza del 95 %


Intervalo de confianza dei 90 O,~

( ~

Fig. 9.1. Dos inlervalo.f de con.t7an:a Superplle.flOS ( «anidado.\")) ). co" l'ln'a)'nr


de el/os il'cluyl'ndo el pul'IO "ulo.

Lo que intenta cl ejemplo precedente no es sugerir que los intervalos


de confianza puedan ser usados como pruebas sustitutivas de la «signifi-
.;ación» estadística. Aunque eso fuese verdad, usar los intervalos de
~
confianza de esta manera acabaría con todas las ventajas que los citados ,:

intervalos tienen sobre los test de «significación». El intervalo de con-


~ anza hace mucho más que determinar el grado en que la hipótesis nula
;!i'
es compatible con los datos.LTransmit~ ~n~ id~~..?i~I!!!.~n.~~I!l.~~d~ la
mggniJ.u~~cl-~f~~t9-Y.qe-la varj"abilidad inherente del estimado. Por el
\c?ntr~rio, el valor de p recü6~eseqüeTñdl.casÓló-ef. gr3do-aeconsisten-
cla existente entre los datos y la hipótesis nula y no revela nada ni sobre
la magnitud del efecto ni sobre su variabilidad (Bandt y Boen, 1972). El
que un intervalo de confianza aporte más información que un valor de ?
j no es demasiado sorprendente, porque el intervalo de confianza está
definido por dos números y el valor de ? sólo por uno. Apoyarse
únicamente en valores de ?, por lo tanto, puede resultar extremada-
1 --
mente erróneo. El ejemplo siguiente ilustra lo que decimos.
Consideremos un estudio sobre una nueva droga, E. que se compara
r con un tratamiento estándar, A. dando como resultado los datos que se
muestran en la tabla 9.1. Un test en torno a la hipótesis nula de que los
) dos tratamientos son igualmente efectivos da un resultado de p = 0.06
(el método que se utilizaria para c;1lcular dicho valor de p es descrito en
el capítulo 11). Se podria presentar estos resultados de distintas maneras.

Tabla 9.1. Dalos hipOlélic().\" (1('1 ensa)'o clínico (le III/ 1/111!l'Otralamie',t()

1
Tratamiento
)
Resultado
1 A B
)
1 Favorable 7 14
) Desfavorable 13 6

Total 20. 20
'40 EPIDEMIOLOGIA MODERNt-

La menoS informativa consistiria en hacer constar que la difcrenciLl


observada es «no significativa». Se transmitiríLl algo más de informaciáll
si se rene.iase el valor real de p; a este respecto. cxpresar cl valor de !'
como una desigualdad del tipo p > 0.05 no es mucho me.ior que infor-
mar los resultados como «no significativos». en tanto que decir p = 0.0("\
da explícitamente un valor a ésta. en lugar de degradarla a la categoríL!
de escala nominal de medida. Una me.iora añadida podría consistir cn
decir P'21 = 0.06, queriendo denotar que se está usando una hipótesis de
dos lados. en vez de utilizar en su lugar otra unilateral. Cualquier valor
de P, por explicito que sea. sin embargo. no consiguc transmitir c]
hallazgo descriptivo de que el 70 por l00 dc los pacientes tratados con B
tuvieron un buen resultado. en comparación con el 35 por 100 de loS que
)o fueron con A. )o que da una díferencia cntre las proporciones dcl 35
por 100. Un intervalo de confianza dcl 95 por 100 para la difercnciLt dc
proporciones da unoS valores que van dc -I por 100 a + 71 por 100 (Ios
valores positivos favorecen al tratamiento E). La posición del limite
inferior del intervalo de confianza corresponde a] resultado de la prucba
de «significación»: el intervalo, pues. incluye la díferencía cero, lo que
Corresponde a etiquetar la observada diferencia entre tratamientos como
«no significati\'a». Cuantitativamente, el que la frontera inferior dc]
intervalo de confianza al 95 por 100 llegue sólo un pOqUíto más allá de
la diferencia cero corresponde a un valor de p que es lígeramente
superior a 0,05. El intervalo de confianza completo. sin embargo, indica
que estos datos, aunque compatibles Con la ausencia de diferencia real
entre los tratamientos, son igualmente compatibles con que B fuese
marcadamente más efectivo; el rango de posibilidades consistente con
los datos sugiere, en general, una considerablemente mayor .eficacia del
tratamiento E. En sintesis, el intervalo de confianza completo resume los
hallazgos de forma clara y sin ambigüedades. El valor de P, por contra.
no da indicación de la magnitud de la diferencia entre los tratamientos
y, si se le usa meramente como test de hipótesis, daria como resultado .1
un error de tipo II, presumiendo que el B fuese realmente mejor que el
A, lo que parece plausible a partir de los datos.
/ Los intervalo:, de confianza aportan simultáneamentc información
'\~sobre la magnitud y la precisión del efecto, manteniendo estrechamente
i lígados a estos dos aspectos de la medíción. El USo dc p o pruebas de
«significación» los difumina. Con )o que se pierde el enroque centrado en
la medición. Consideremos una causa de enrcmledad sobre la que se
están realizando hipótesis )' que está síendo sometída a estudio; supon-
gamos que, de hecho, no e~tá asociada ní causalmente ni de otra manera
con la enfermedad. Los resultados del estudío no pueden ser tranquiliza-
dores de lo seguro del agente si están inrormados exclusivamente en
términos de confirmación de hipótesis estadisticas. Como hemoS visto
con anterioridad, resultados «no significativos» pucden. a pesar de todo. J
ser compatibles con erectos sustanciales. La ausencia de «significacil>n»
en sí misma no proporciona seguridad alguna. .
Los consejos estadisticos clásicos recomiendan que. si loS dato.'i indi-
EL PAPEL DE LA ESTADISTICA EN EL ANALISIS EPIDEMIOLOGICO !41

-50 -40 -30 -20 -10 0 +10 +20 +30 +40 +50
Favorecen al control Favorecen al tratamiento
-J
(Pr- P,} X 100

Fig. 9.2. Líl'rill'.\" d(' ('Ollf¡ml:a a19() {J()r lO() d(' /a di(c.r('1Icia l('rdad('ra ('n'rl' {J()'..
ce1lIaie.\" de lo.\" 71 i!11.\"a)'().\".La ('()llllI/lla ¡;e'.'icall!lI L'I C('1Il'.(/ (le cada inll'rla/(1 ill(li-
ca (.'1valor obserradn. Pr -Pr {Ja'.a cada ell.\"a)'n ('(}I'iadn (le Fr(.'ima1l et (II. í 19i,y I
con {Jermi.\"o (1l'1 Nell' En.,¿la1ld J(}Llr1lal oJ J\ledicin(.".

can falta de i<significación», resultaria importante tener en cuenta la


potencia del estudio para detectar hipótesis alternativas especificas sobre
si la magnitud del erecto es «significativa». Dichos cálculos de potencia.
sin embargo, son sólo indicadores indirectos de la precisión y requieren
que sea llevada a cabo una asunción sobre dicha magnitud del erecto. Al
planificar un estudio puede ser razonable hacer conjeturas sobre la
misma. Al presentar resultados, por el contrario, es preferible siempre
utilizar la información que se tenga a mano sobre el efecto para estimarlo
indirectamente, en vez de especular acerca de él. Un intervalo de con-
142
EPIDEMIOLOGIA
MODERNA

fianza transmite la información deseada com(\ rara dar se~uridad cas(\ de


no haber efecto. mostrando cómo de grande lendría que ser ésle rara ser
razonablemente compatible con la~ observaciones. o puede inuic.lr 1¡¡
carencia de información necesaria de cara ~1poder asegurar un.l ~\usenci:l
de efecto. En su análisis dc los 71 ens.lyos clínico", «11eg~ltivos». I:rciman
el al. (1978) usaron intervalos de confianza para la diferencia de riesgos .1
la hora de reínterpretar lo", hallazgos de dichos estudios. Tales inter\,alos
de confianza indicaron que muchos de los tr.\tamienlos sometidos ~\
comparación eran realmente beneficio~os (Fig.9.2). Las in.\decuad.ls
interpretaciones por parte de los autores. en la mayorí.1 de los casos.
podian haber sido evitadas ~i hllhiesen centr.\do su atención en el inler-
valo de confianza. en vez de en los resultados de un test estadistico.
Para que un estudio permita tener seguridad acerca de la ausenci.\ de
.un efecto, los limites de un intervalo de confianz.\ apropiad(\ dehen est~\r
cercanos al valor nulo. La cuestión de 1.1«significación» estadislic~\ es. en
realidad, irrelevante. Considérense. por ejemplo. los dos grupos de resul-
tados de estudios sobre la misma hipotetizad.\ rclación caus(1-efecto que
muestra la figura 9.3. El estudio A era grandc y daba resultados preci~os
o. lo que es lo mismo. un intervalo de confianza estrecho. en tanto el JI
era pequeño y su intervalo dc confianza salía ancho. i,Qué estudio
expresa mejor un efecto potencialmente d.\ñino? El estudio A indica que
el efecto es muy probable que esté alrededor dc cero; el limite superior
del intervalo de confianza está cercano al punto nulo )' transmite la
seguridad de que el efecto bajo estudio no es demasiado grande. El H.
por contra, era impreciso. es decir, conducia a un interval(\ de confi.ln7.a
ancho, )' no consigue afirmar la au$encia de un efeclo grande. Por t.\nto.
el estudio J'f da seguridad, pero no así el E. No obstante. un te$t e~t~,-
distico de «signirlcación» no resultaria «significativo») rara B per(\ sí
para A, puesto que el punto nulo está dentro del intervalo en el caso
de E, pero no así en el de A .
J

Estudio A

Estudio B ..-

Efectos más grandes

t
Punto
J
nulo

Fig.9.3.
Resullado.~ de do.~ e.\"ludi().~hif1()lCti('().~.
EL PAPEL DE LA ESTADISTICA EN EL ANALISIS EPIDEMIOLOGICD
43

:e En este ejemplo. como en el que se daba en la tabla 9.1. ej conli~lr


~r únicamente en el test de «significación» Ilevari.l precisamente a una
¡a interpret.lCión de los hallazgos contraria .1 1.1correct.l. En 1.1tabla 9.1. ~I
:a test de «signific.lt:ii)n» indicab.l ~lusencia de éSl.\. cuando en re~\lidad los
.11 d.ltOS indic.lb~\n un crecto poderoso. En el estudio ..I. en el segundo
a ejemplo. el test si dab.\ «significativo». aunque el estudio es b¡'lsicamente
)S «negativo». en cl sentido dc que ~lport.l una evidencia contrari~1 a un
a erecto grande.
lS La estimación del interv~11o. se ha argumentado, tiene un inconve-
s. niente que se .lplica t.lmbién ~1los test de-«significación» -a s.lber. que
el procedimiento depende de una selección arbitraria. ya sea, por una
parte, dcl nivel de confianz~1 o. por olr.l. dcl nivel .11[.1. Un(l maner.l de
le
esquivar tal .lrbitr.lried~ld consiste en considerar la posibilidad de calcu¡.\r
Ir e informar series superpuestas de inter,'.\los de confi~lnz~l: por ejemplo. loS
:n
intervalos al 50 por 100, 60 por 100.70 por 100. So por 100 y 90 por 100.
1-
Los intervalos de mi\s confianz.l son mils amplios e incluyen siempre
le
dentro de si cualquier otro intervalo menor. Como limites extremos. un
)5
intervalo de cOnfi.lnza del 100 por 100 cubre la gama entera de valores
B
del parámetro que se estima y otro del 0 por 100 es simplemente 1.1
10
estimación puntu~\I: ninguno de los dos revela n.lda sobre la precisión. si
le
bien el degcnerado intervalo de confianz~\ del 0 por 100 describe magni-
;)r
tud. Conforme .lumenta el nivel de confi.lnz¡l. desde el cero .11 100 por 100.
la
aumcnta I(l .lmplitud del interv.\lo. pero no .1 una tasa const~lnte. S.lbe-
8. mos. a partir de la teoria estadística. que la distribución de muestreo dc
~a los h~lbituales estimados dc 1.1Smedidas epidemiológicas es aproximada-
0. mente norm.t!. Podemos, en consecuenci~l. inferir que un intervalo de
1- confianza no integra cl valor del parámelro con una probabilidad uni-
;sí forme a lo largo de todo el intervalo. Es considerablemente más proba-.
c'
" O ble que cl pari\metro esté localizado centralmente dentro de un intervalo
que no que estuviese cerca de sus límites. Se puede ejemplificar este
patrón medi~\nte los intervalos de confianz~1 superpuestos que se mues.
L tr.\n en la tabla 9.2 y que est¡'\n basados en los datos de la tabla 9.1.
¡
! La implicación fundamental de la no uniformidad de la confianza
dentro del intervalo es que la ubicación prccisa de los extremos de un
intervalo no es importante a la hora de realizar una interpretación
adecuada. Es decir. series sucesivas de intervalos de confi~lnza «anida-
dos» pueden suministrar una interpretación ajustada dc la precisión de
la estim~lción. pero cs raro que como consccuencia de considerar estos
intervalos de confianza diferentes surjan interpretaciones distintas, por-
que 1.1 localización ex~lcta de los límites del inter,'alo tiene pocas conse-
cuencias prilcticas. Es. más hien. la posición aproximada del intervalo en
su conjunto, sobre su escal~l de medición. lo que gobierna la inter-
pretución. Realizar un test de «significación». por cl contr~lrio. equivale a
meter todo lo que nos interesa con un embudo en el punto de la
localización precisa de los límites de un intervalo de confianza. al tiempo
que se ignora la información. mils importante que aportan loS datos
sobre la magnitud prohable del efecto.
'44 EPIDEMIOLOGIA MODERNA

Tabla 9.2. Jn(('rrnJn.\. ti(' ('ntl{inn:(1 ,\.,,!,rr!,I"'V/".. !,(1r(1 J(t tlilt".t'tl(.i(1


de !,ro!,orción t/e 1(1,\ t/a((I,v hi/,(lli,li('".\ (i(' 1(1 lt/hÍlI íJ.I

Intervalo dcJ 50 DI~ 0.24-0.46


Intervalo dcl 60 °¡'n 0.22-0.48
Intervalo dcl 70 °¡ó 0.18-0;52
Intervalo dcJ RO DI-;' 0.14-0.56
Intervalo dcl 900,0 0.09-0.61

El peso fundamental en la discusi()11 precedente. sobre 1.1determin.l-


ción de la variabilidad aleatoria. ha sido demostrar la inadecuación dc !.!
más apreciada de las herramientas estadísticas. la puesta a prucb.l dc la
«(significación» estadistica. Este pUl1t() de vist.l. dc que son prcfcrihlcs
las estimaciones a los tests. ha sido tamhicl1 soslenid() por estadístico~
(Atkins y Jarret. 1979):

Los método~ dc e~timación compartcn muchos dc lo~ problcma~ dc las


pruebas de significación -porque estiln igualmcnte b(l~ados en (l~UI1-
ciones dcl modelo prob:\bilistico y requicrcn límites dc precisión «~\rhi-
trarios». Pero al menos no exigen quc sc formulcn irrclcvantes hipi:I-
tesis nulas, ni fuerzan a que haya quc tomar dcci~ione~ ~obrc la «~igni-
ficación» -Ios es1imado~ puedcn prcscntar~e y e\.~llu:\r~c mcdianlc
criterios estadi~ticos y de (}frn fip(}. por parte dcl inve~tigador () dcl
lector. Los estimados de una inve~tigación. (ldemils. pucd('n ~cr cnmr;l-
rado~ con otros. Pese a que cs frccuentc que difcrcntes mcdicioncs. <,
metodos de investigación. o aborda.ies Icóricos conduzcan;¡ rcsult.\d()s
«distintos», no sc trata dc un.\ dcsvcnt(lja: t.lles difcrcllcias rcncj.\n
diferencias teóricas importantes sobre cl significad() dc la investi~ac.i()n
y las conclusiones a extraer de ella. y son precisamente tales difercn-
cia~ las que quedan oscurccidas cuando sc informa simplementc dcl
nivel de significacíón de los rc~ull..dns.

Hablando claro. y dado que la compr()bacii)l1 de si existe «sigl1ific(\-


ción» estadistica es la que promueve tal cal1tidad de malintcrpretacioncs.
seria razonable no utilizarla el1 absoluto y lo mismo puede ser dicho dcl
uso de los valores de P: tener por costumbre 110 utilizar 10$ test pucde
acarrear el deseable efecto de acelerar su inevitable fallecimiento com() )
I
!
método de inferencia.
t
¡
DETERMINACION )' CONTROL DEL EFECTO I
DE CONFUSION r

En un estudio epidemiológico. si la confusión. a cargo de \'tlriables de 1:ls t


que se sospecha, no fue antes impedida por la forma de diseñar la I
.

selección de los sujetos, es en el análisis donde ha~' que considerar Sl1


determinación y control.
I
I
145

v (1Ivr(I('il}/l d(' 1(1 ('(ll1lil,\"i(}/l

Dado que resolver la cucstii>n dc si cxistc () 110 confusi()n Implica rrc-


cuenlemente un.1 loma de u~cisiones sohrc si (si o no1 col1trolar en t:1
análisis .I un f..clor dotado de esa potenci.llid..d. existc un.. lendenci..
natural a utiliz.lr el .1par..lO dc la comprobacii>n de hipólesis estadistic.1S
en el citado proccso de valor..ción dcl cfccto de confusión. El rcsultado
es que se comparan. entre grupos dc estudio. las distrihuciones «hasales»
de ciertas características. Si no se encucnlran diferencias est.ldística-
menle «significaliv..s». se extr..e la conclusión dc que no existe confu-
sión. en l..nto si se encuenlr..n. se acepl..n como indic..dor..s de la
polencial prcsenci.. de dicho efecto.
I\unque es común utilizar la comprobacii)n de hipótesis para este
propósito como se h.1 dicho. lal uso es in.1decu..do. La C.1nlid..d de
confusión dependc dc la combinación de dos .Isociaciones distint.1s: 1.1
que hay enlre el r..clor que I.. ejcrce y I.. exposición y la existente enlre
J ..quél y la enfermed..d. Si un.. de CSl.1S ..sociaciones es ruerte y la otra
esli. ..usentc, no c..be que pudiese d.lrse confusión ninguna. El resull..do
~
de un les! esladistico. sin emb.1rgO. alcanzarí... o no, «signific..cíón»,
dependiendo de cui.1 de I..s dos ..soci~lciones componentes fuese medid.1.
La m..gnilud de la confusión. como otros sesgos. no depende del
;
t..m..ño dcl estudio (excepto en un expcrimcnto con r..ndomizaciónl:
t
depende de la magnitud de 1.ls .Isociaciones que dieron pie a ella. Por ~I
r contr..rio. los v.llores de ? dependcn t~.nto dc I.. magnitud dc I.. ..soci..-
( ción como dcl l..m.lño del esludio. La comprob..ción de hipótesis est..-
~" dísticas. pues, result~l in..dccu.1da incluso como medid.1 de la m.1gnitud
~
1 de una de 1.1S.lsoci..ciones componentes que determinaron !.. confusión.
~ Podría succdcr quc cn un esludio pequeño cst.1 fuesc sust.1nci.11 y 1.1Scom-
probaciones de hipi)lesis estadíslic~.s no .llc~lnz.1sen v.llores de ? «~igni-
fic~.livos» porquc los números que gcncr~.ron 1.1S.lsoci.1ciones er:~ln pe-
queños. Si los d.1tOS del mismo estudio fucsen rcplic.1dos ".lri.1S veces. 1.15
asociaciones componentes que delermín.1n 1.1 m.lgnitud ue la confusi¿')n
se mantcndrían ex..ct..mente igU.11: sin emb.1rgo. .1unque ..ument..r el
tam.1ño dcl estudio no .úect.1rí.l .1 la m..gnitud de la confusión. converti-
ría en m{.s pequeño el v~llor de ? hast.1 h~lcerlo fin.1lmente «significati-
vo». En un estudio suficientemente gr~.nde. pr{lctic~lmente tOd.l .lsocia-
ción sería estadíslic.1menle «signific.1tiva». ya fuese 1.1confusión ue resul-
las trivial o importante. Por ello. el resull.ldo de un test de «signific.1-
ción» no pueue ser interpret.ldo como medid~l útil del erecto de confu-
sión.
El único propósito de poner a prueba una hipótesis est.ldístic~l es
ev.1luar el rol dcl .IZ..r como posible explicación de las asoci.1ciones
observad.1s. Incluso en experimentos randomiz.1dos, no obstante. donde
las diferencias basa les entre los grupos se explican siempre por el .Izar
porque precisamente 1.1Sha producido un proceso aleatorio. puede tener
lugar la confusión y debería controlárscla cuando .1si fuera. La comp.1ti-
'4E EPIDEMIOL()GIA MODERN¡.

bi1idad con el azar de las diferencias en los niveles hasa1cs es irrelevanlc


para la magnitud de la confusión.
Valorar adecuadamente el efecto de confusión requiere 5er 5en5ible al
grado de sesgo que puede existir en una medida del efecto y que ha sido
introducido por una variable con 1a potencialidad de confundir. Como
cosa práctica. dicha determinación se lleva a cabo comparando 1a esti-
mación bruta del erecto con 1a que 5e obtiene una vez que la confusión e..;
e1iminada. El grado de é5ta se infierc entonces ,¡ partir de la di5Crepanci,l.
si existe a1guna. entre 1a estimación bruta ~. la que se obtiene cuando se
elimina la confusión.

C011trO/ d('/ ('(ecto (Ir CO1!fil,\"i(j11

En el análisis dc los datos, el control dcl erecto de conrusión se logra o


bien mediante la e.\"1ro1((icaci()n.que lo reduce o lo elimilla evalualldo cl
efecto de una exposición dentro de los estratos de la variable quc ejcrcc
la confusión, o mediante el onlíli.\"i.~177UI1iv(1ri(1d().
que la tiene en cuent(1
«<ajusta por ella») a través del modclaje matcmático.
En un análisis estratificado. el objeto es comprobar los grupos de
estudio expuesto y no-expuesto. o casos y controles, dentro de categorías
homogéneas o rangos estrechos de la variable dc confusión. C(lda estra-
to suministra un estimado del efecto no confundido, porque la falta de
variabilidad de la variable de confusión en su $eno impide la confusión
de las comparaciones intra-estratos. Existen principios y métodos esta.
di$ticos que se pueden aplicar para combinar los result(ldlo:-; tic estas
comparaciones especificas por estrato en un llnico estim(ldo global. El
abordaje especifico a utilizar depende de la met(1 dcl ani\lisis y. hasta
cierto punto, de los datos. En el capitulo 12 se presenta una discusión
detallada del análisis estratificado: la estrategia que usualmente se adop-
ta es la de combinar los estimados del erecto especifico~ por estr(\to en
otro único global. mediante el Cillculo de la mcdia ponderada dc los
primeros. Se puede escoger los pesos que sc utilizari\n para calcul~lr I~I
media. de forma que representen una distribución estándar de c(lra a la
comparación, o se los puede escoger, en aras de la eficiencia est.ldístic(l.
para obtener un estimado del erecto tan preciso como fuese posible a
partir del análisis estratificado.
El análisis multivariado, por su parte. exigc la construcción dc modc-
los matemáticos que describen simultáneamente el efecto de la exposi-
ción )' el de otros factores que pudicran est~lr confulldiendo o modifican-
do a aquél. La estadistica tiene un papel que jugar a 1(1hor(\ de estimar
los parámetros de dicho modclo matemático (1 partir de los datos. lo qlle
constituye habitualmente una complicada tarea de cillculo quc rcquicre
el uso de una computadora. Sin embargo, las consideraciones estadisti- J
cas no deberían ser lo fundamental en la construcción del modelo mate-
mático. La selección de los factores que deben entrar en el modclo, la
formulación matemática del mismo ~' la m.\nera en que se codifiqucn
ELPAPELOELA ESTAOISTICA
EN ELANAliSIS EPIOEMIOLOGICO 147

dichos factores en términos especificos para el modelo. no son cuestiones


de naturaleza estadística: por el contrario. dependen de la comprensión
biológica del proceso de enfermar y da las relaciones matemilticas de los
factores en estudio.
El modelaje multivariado se usa en la investigación epidemiológica
por dos razones: con fines explicativos. a modo de mediación para la
inferencia científica. o bien para propósitos predictivos, en relación con
riesgos de enfermedad sobre la base de la consideración simultánea de
un conjunto de factores. La meta suele ser realizar una inferencia científi-
ca acerca de efectos: caso de tratarse puramente de una predicción sin
inferencia. la cuestión de la confusión no resultaría importante. puesto
que ese propósito lo puede cumplír cualquier buen grupo de factores
predictivos, causales o no caus:.1les, confundidos o no. (A largo plazo, no
obstante, pudiese mostrarse que los ractores de riesgo caus:.lles son los
más fiables para la predicción.) En situaciones así, un objetivo runda-
mental podria ser conseguir reducir un grupo grande de variables a otro
más pequeño capaz de predecir de modo eficíente el riesgo. Para conse-
guir un grupo pequeño de ractores predíctivos que ruese casi tan ínror-
mativo como el grande, se han desarrollado ciertos algoritmos estadísti-
cos. Los dos mils comunes de entre ellos, los procedimientos llamados (le
pa.ro para arriha y pa.ro para ahalo. según si los términos se añaden a un
grupo inicial pequeño o se detraen de otro inicial grande, usan repetida-
mente la comprobación de hipótesis estadísticas para determinar la
contribución, también estadística, de cada término al modelo global.
Aunque estos algoritmos automáticos de modelaje son satisfactorios
para desarrollar modelos de precisión, no se los considera deseables
cuando la meta del análisis es la inferencia científica. Por ruera de la
situación en que el modelo multivariado se usase para predecir. no hay
ninguna razón que oblígase a reducir el modelo hasta conseguir un
conjunto pequeño de términos. Resulta desaconsejable tener tantos tér-
minos como para que hiciesen grande -digamos el :?o ó el 30 por 100-
su número en rel:.lcíón con el total de observaciones. Utilizar modelos
multivariados con varias docenas de términos resulta iQualmente tedíoso
y caro. Sin embargo, como decimos. cuando el objeti;o es la inrerencia.
la preocupación acerca del erecto de confusión y acerca de la aptitud del
{ modelo prevalece sobre cualquier otra preocupación competidora por
conseguir simpleza en el mismo. Un algoritmo estadístico por pasos.
podría omitir del modelo díversos factores, ninguno de los cuales ruese
indívidualmente «estadísticamente significativo:-> pero que, tomados jun-
tos, resultasen ser los responsables de una cantidad sustancial de efecto
de confusión. Lo importante siempre es mantener, por encima de todo,
las metas del análísis epidemiológico: cuando se intenta inferir la magni-
tud del efecto de uno o más factores específicos en un análisis multivaria-
do, es necesario, antes que nada, escoger un tipo apropiado de análisis
multivariado e incluir en él posteriormente un conjunto de fuctores
explícativos tan completo como fuese posible, desechando algoritmos
estadísticos concebidos para otros propósitos.
-1
148 EPIDEMIOLOGIA MODERNA

SUMARIO
La epidemiologia, como la mayoria de las ciencias modernas. se ha~~1
para el análisis de los datos en principios y aplicaciones est,ldisticas. L(l
estadistica. sin embargo, sirve a los epidemiólogos únicamente como
herramienta para conseguir sus ob.jetivos cientificos. Con demasiada
frecuencia se han utilizado en estudio.c; epidcmiológicos procedimicntos
estadísticos que tenian poco en cuenta los oh.ietivos dc aqlJclla cicncia.
Los ejemplos abundan: incluyen el u~o de método.c; de muestreo p~lr~1
estudios cuando no están indicados, el uso de análisis de la varianz~1 u
otras técnicas estadística.c; que no producen como resultado mediciones
epidemiológicas y, )o más frecuente de todo. el basarse inadecuad~lmente
en la puesta a prueba de hipótesis estadisticas. El concepto de «signirlc~1-
ción estadistica» se podria suprimir del léxico dc lo.c;epidemiólogo.c; Sil1
que se perdiese nada. Si se lo usa para valorar el erecto de confusión.
resulta simplemente incorrecto: utilizado para comprobar estadistica-
mente la asociación entre exposición y enfermedad. induce con frecuen-
cia a error y nunca describe la magnitud del efecto o la precisión de la
medicíón, En este último caso, utilizar los intervalos de confianza en vez
de tos valores de p o «significación estadistica». da lugar 3 una nótable
mejora en la claridad de la iriterpretación por parte de todo el mundo c
impide que se produzcan manifiestas malinterpretaciones por parte dc
lectores o investigadores descuidados.
Para un epidemiólogo, dominar satisfactoriamente la estadistica cm-
pienza con el principio de que los objetivos epidemiológicos dcberian
cumplir los requisitos adecuados en cuanto a diseño del estudio )' an;lli-
sis de los datos. Los métodos estadístico.c; se adoptan, o si hace falla se
inventan, para conseguir los objetivo.c; epidemiológicos, No se pllede
defender, en nombre de la consecución de un objetivo estadistico, com-
promisos en el diseño o el análisis del estudio. ni el uso de un mélodo
estadístico que no sea conforme con los objetivos del mismo.

REFERENCIAS
Atkins, L., and Jarretl, D. The significance or .significancc lcsls.. En J. Irvinc. I.
Miles, and J. Evans (eds.), D('m)'.flif\:in.R Social Slali.flic.\". London: PlulO
Press, 1979.
Bandl, C. L., and Boen. J. R. A prevalenl misconceplion about samplc si7.c.
statistica) significance, and clinical imporlancc. J. P(',.iodmll. 1972:43: I X 1-
183.
Berkson, J. Tests or significance considcrcd as evidcncc. J. AII/. SIal. A.\".\"0('.
1942;37:325-335.
Freedman, D., Pisani, R., and Purves, R. Slali.flic.\". Ncw York: Norlon, t978.
Freiman, J. A., Chalmers, T. C., Smith, H.. et al. Tl1e importance or bela, thc
Type II error and sample sizc in thc dcsign and inlcrprclation or the
randomized control trial. Survey or 7) "negativc" trials. !\7. El/gI. J. M('d.
1978;299:690-694.
10. FUNDAMENTOS DEL ANALISIS
DE DA TOS EPIDEMIOLOGICOS

Las observaciones en estado crudo que constituyen los datos contienen.


en un estudio bien planificado. la información que satisface los objetivos
] del mismo. En el capitulo 7 se hizo hincapié en que todo estudio es un
e.jercicio de medición y en que la meta máxima de cualquier estudio es
conseguir exactiLud al medir. De manera similar. la meta del análisis de
datos consiste en extraer la pertinente información. relativa a medicio-
nes. de entre las citadas observaciones crudas.
En su forma típica. existen varias et:1pas diferenciadas en el análisis
de los datos. En 13 preliminar. el investigador debe revisar los que han
sido registrados. comprobando su exactitud. su consistencia y en qué
medida están completos; se llama frecuentemente a este proceso edición
de los datos. Acto seguido. para que luego puedan ser sometidos 31
subsiguiente análisis. tiene que sumarizarlos o transformarlos a una
forma concisa. por lo general de tablas de contingencia. que recogen la
distribución de las observaciones de acuerdo a los factores clave: se
conoce a esta etapa del análisis como redllCción de lo.\"dato.\". Finalmente.
editados y reducidos. son utilizados para generar las medidas epidemio-
lógicas de interés. tipicamente una o más mediciones del efecto (como
por ejemplo. estimados del riesgo relativo). con los intervalos de confian-
za apropiados. Se considera a veces :1 esta última etapa del análisis el
l análisis propiamente dicho. pero es más conveniente referirse a ella
como estimaciót7 del efecto (o simplemente quizás ('.\"til'7ació/7.si la meta
del análisis es estimar frecuencia de enfermedad y no medir un efecto).
Para algunos investigadores, esta última etapa del análisis incluye inevi-
tablemente la comprobación de hipótesis estadísticas. El capítulo ante-
( rior explicaba por qué dicha comprobación de hipótesis constituye un
componente no deseable del análisis de datos en la mayoría de las
situaciones en Epidemiología. No obstante. puesto que la teoría estadís-
tica que subyace tras la estimación de intervalos se encuentra íntima-
mente relacionada con dicha técnica, resulta útil tener en consideración
lo que se dijo cuando se la trató anteriormente como fundamento para
la comprensión del análisis de datos epidemiológico.
150 EPIDEMIOLOGIA MODERNA

EDICION DE LOS DA TOS

No hay excu~a que pueda justificar el que no se escudriñen intcnsamcnt('


los datos crudos en Qusca de errores )' no se corrijan éstos, siempre que
sea posible, Los errores se introducen de forma rutinaria en los datos en
una gran variedad de modos: al proceder a su edición, unos son detccta-
bles )' otros no,
En un estudio epidemiológico, los datos proviencn por lo t!clleral o
bien de un cuestionario, ya sea auto-administrado o pasado por Un
entrevistador, o de registros existentes, q\le ~e tran~criben para proccder
a su investigación. Dichos datos. sacados del cuestionario o del forma\o
de resumen de un registro. pueden ser transcri\os de aquella forma
primigenia a otra codificada. que posibilite melerlo~ en una milquina.
habitualmente mediante perforación. Con frecuencia se hace necesario
codificar las respuestas. Por ejemplo. lo!' dato~ sobre ocupación obteni-
dos mediante entrevista hay que clasificarlos según un código mane.iable.
e igual sucede con la información sobre medicamentos. historias clinicas
y muchos tipos distintos de datos. Otros. como la edad o el año de
nacimiento (el año de nacimiento es preferible a la edad, porque se
tiende a recogerlo con más exactitud y no cambia con el tiempo), aunque
muchas veces están agrupados en categoria~ amplias cuando se publica
un informe, deben ser registrados de forma precisa )' no agrupado~.
porque los valores reale~ permitirán posteriormente ma)'or nexibilidad
en el análisis. En concreto, podria ser necesario agruparlos de forma
diferente para poder comparar con diversos otros estudios, Algunas
variables de escala nominal, con sólo unos pocos valores posibles. po-
drian ser precodificadas en sus formas originales tachando el cuadradito
prefijado perteneciente a la categoria que correspondiese. Sin embargo.
para las variables de escala nominal en que caben muchas categorías.
como el país de origen o la ocupación. la!' preguntas precodíficadas no
resultan prácticas. Ahora bien, si se pudieran precodificar todas las
rúbricas de los datos, sería factiblc recogerlas en una forma original quc
pudiese ser leida directamente por una máquina, mediante scanning
óptico o algún método similar. De no ser asi. resultará por lo general
necesario traducir la información desde su forma primigenia antes de
poder almacenarla en una máquina o en una forma legible por una
máquina.
Una cosa posible )' habitualmente Qeseablc es no reescribir los datos
en un formato secundario durante el proceso de codificación. En lugar
de generar errores adicionales de transcripción, resulta preferible irlos
codificando al tiempo que simultáneamente se los transcribe a los siste-
mas de almacenamiento de la computadora, Es posible diseñar un pro-
grama informático que permita ir metiendo los datos item por item.
desplegando los códigos de cada catet!oria en la terminal de la pantalla,
para facilitar la codificación. Si se los codifica )' reescribe a mano.
requerirán por lo general, a menos que estuviesen codificados en ho.ias

'-
FUNDAMENTOS DEL ANALISIS DE DATOS EPIDEMIOLOGICOS 51

de lectura por scanning óptico, que en cuaiquier caso haya que perforar-
los: en consecuencia, el meter los datos directamente durante la codifica-
cjón reduce tanto los costes como las equivocaciones, Cuantas menos
operaciones de reescritura. pues, haya entre el registro primitivo y la
versión que la máquina almacena. menos probable será que se produz-
can errores. Si es inevitable reescribir, resulta lltil hacerse una idea del
grado de error de codificación que contendrá el material producido
codificando una cierta proporción de los form,ltos por duplicado. inde-
pendientemente. La información así obtenída puede ser utilízada para
juzgar la magnitud del sesgo que la clasificación incorrecta debida a
errores de codificación habrá introducido.
La edición b,ísica de los datos requiere ir comprobando cada variable
en busca de valores ilegales o inusuales. Por ejemplo. el género se puede
codificar con un I para varón y un 2 para mujer. Habitualmente se
utiliza un valor aparte. como puede ser un 3. para designar los resulta-
dos desconocidos, Es preferible no asígnar a nadíe el códígo cero. si se lo
puede evitar, porque algunas máquinas o programas interpretan la falta
de información o los códigos no numéricos con un cero, No utilizando
este número como código específico, por tanto. ni siquiera para la
información desconocida. se hace posible la detección de errores de
perforación o de la información que falta. Cuando se procede a edítar es
importante examinar la distribución de cada variable. Todo valor inad-
misible debe ser contrastado frente a los formatos originales en que se
recogieron los datos. Valores que resultasen inhabituales. como que el
género fuese desconocido. o una edad o fecha de nacimiento no norma-
les, deben ser comprobados también.
Además de someter a comprobación a los valores incorrectos o
inhabituales, debe examinarse la distribución de cada variable, para ver
si parecen razonables. La proporción de varones que uno espera, ¿.esla
mitad, un 80 por 100 (cifra que es razonable si los sujetos sorl enfermos
con, digamos, cáncer de vías respiratorias altas), o aproximadamente el 2
por 100 (si estamos trabajando con personal de enfermeria,'? Una evalua-
ción de este tipo puede revelar problemas importantes que de otra forma
no saldrían a la luz. Por ejemplo, un error de programación podría
hacer que todos los datos de cada registro electrónico se desplazasen en
uno o más caracteres. dando como resultado una colección de sinsentidos.
que a pesar de todo pudíesen no ser detectables mediante, por ejemplo.
un análisis multivariado (lo que es. de hecho, una pega importante del
abordaje multivariado). Lo factible de un desastre asi resalta la necesi-
dad de comprobar cuidadosamente la distribución de cada variable
durante la edición de los datos.
Las comprobaciones relacionadas con la edición que hemos conside-
rado hasta ahora se refieren a cada variable de los datos tomada por
separado. Aparte de esa edición básica, es habitualmente aconsejable
revísar la consístencia de los códígos a base de relacionar variables. No
es ímposíble. aunque sí improbable, que una persona de diecíocho años
tuviese tres hijos. Los varones no deberían haber sído hospitulízados
152 EPIDEMIOLOGIA MODERNA

para ser sometidos a histerectomia. La gente que pasa de 2 m de altura


es dificil que pese menos de 50 kg. Una edición terminada implica mu-
chas comprobaciones de consistencia como éstas y es mejor hacerlas
mediante programas de computadora diseñados específicamente para
sacar a flote este tipo de errores (MacLaughlin. J 980). Es verdad que.
ocasionalmente, un resultado aparentemente inconsistente podria colaí
al revisarlo como correcto, pero lo normal es que mediante este procedi-
mi~nto se hagan visibles muchos errores. Resulta también importante
revisar la consistencia entre varias distribuciones. Si en un eSllldio.
exactamente 84 mujeres son codificadas como premenopáusicas para
una variable. «tipo de menopausia». es buena señal que exactamente
también 84 sean codificadas con el mismo calificativo para la variable
«edad en la menopausia» (para esa variable. el c0digo «premenopilusici\»
debe adoptar un número diferente de) que se asigne a desconocidC'
-por ejemplo: 98 para premenopáusica y 99 para desconocido'.
Una ventaja importante de codificar y meter los datos a través de un
programa informático es la posibilidad que éstos ofrecen de editarlos
automáticamente mientras se los introduce. Así. los valores inadmisibles
o inusuales van siendo despistados conforme se los va metiendo. Los
inadmisibles pueden ser rechazados y corregidos sobre la marcha. pro-
gramando la máquina para que imprima en la pantalla un mensaje de
error y dé a la vez una señal audible que alerte al operador acerca de la
equivocación. Sobre los valores que. aunque legales. son improhahles. se
puede llamar su atención de forma parecida. Un programa de entrada de
datos sofisticado podría también revisar la consistencia existente entre
variables y eliminar algunas incoherencias potenciales. aportando auto-
máticamente los códigos adecuados. Por ejemplo. si una mujer es preme-
nopáusica, el programa puede suministrar automáticamente el código
correcto para «edad en la menopausia» y saltarse la pregunta. (Por
contra, algunos investigadores podrían preferir la redundancia de esa
segunda pregunta como salvaguarda contra un posible error en la pri-
mera.)
Incluso si se dispuso de un mecanismo sofisticado de edición durante
·la entrada de datos. sigue siendo importante. antes de proceder al anúli-
siso editar los que se tenga almacenados. para ver en que medida estún
completos y cuán razonable es la distribución de cada variable. Ninguno
de estos aspectos pueden ser evaluados mediante un programa de entra-
da de datos.
Todo investigador con experiencia sabe. en resumen. ql1e incluso los
esfuerzos más meticulosos de recogida de datos padecen de errores que
son detectables durante una edición cuidadosa. Si se plantea a ésta como
un componente sistemático de) manejo de los mismos. la existencia de
dichos errores no constituirá un problema serio. Si se la ignora. el
resultado pueden ser complicaciones importantes.
FUNDAMENTOS DEL ANAliSIS DE DATOS EPIDEMIOLOGICOS '53
--

REDUCCION DE LOS DATOS

La idea fund~lmenlal cn relacii}n con 1~1reducci<)n de los dalos consiste


en que. en un conjunto dc ellos. ciertas observaciones son equivalentes
enlre si y resulta m:is filciJ entendcrse con las equivalentes una \'ez que se
las ha resumido. La forma de rcsumen es hahilualmente una lahJa de
contingcnci~l en dondc la frecuencia de los sujelos (o unid~tdes de ohser-
-,
v~lción) que poseen cualquier combinaci<.)n especilica de valores de la
vari~\ble es tabul~td~t por variables de inlerés. Se presume que un~l tabla
así contendr:i. en forma resumid~l. esencialmente toda la inform~tcii}n
relev~lnle que hubiese en los datos. f\ parlir de las lablas de contingencia.
el in\'estig~ldor puede ya proceder ~\ la estimación dcl efecto. Por otra
parte. como se ha dicho. la tabla despliega la distribución de los sujetos
de acuerdo a \'ari~lbles clave, con lo que transmite directamente ~11
investigador una intimid~\d con los datos que no sería fi1cil de obtener de
ninguna otra manera.
L~l reducción de los datos en forma de tablas de contingencia se
predica para ~\ni1Iisis en que se considera que no existe preocupación por
] la confusión o la modificación del efecto o en los cuales hay, como
m(iximo. ltnicamente un número pequeño de variables que pudieran
confundir o actuar modific:.\ndo el efecto. Si el an{llisis en cuestión debc
tener en cuenta un gran nllmero de vari:.1bles. serit preciso recurrir al
an{\lisis multivariado. utilizando el modelaje m:.ltemi\tico. Para poderlo
llevar a cabo, no es necesario reducir los datos a una tabla de contingen-
cia. No obstante. ~l pesar de todo y para asegurar que el investigador
adquier:.1 algun:.\ familiaridad con los d:.\tos es aconsejable. incluso al
planificar un ~tn{\lisis multiv:.\riado. reducir cstos al formato de tabla de
contingencia par:.\ las variables de interés central. Insistimos: manejarse
con un análisis compendiado. sobre 1:.1base de presentar los datos según
este tipo de tablas es una buena idea. incluso aunque estuviese .clara la
necesidad de re~tliz:lr un ~tni\lisis multiv:lri~\do.
Colapsar en categori~\s que resulten útiles par~\ un~\ tabla de col1tin-
gencia los d~ltos editados requiere siempre alguna toma de decisiones.
Para vari~\bles de escala nominal, como la religión o la raza. que ya
estiln c~ltegoriz~ld~\s. el proceso estil claro. Para vari~\bles continuas. sin
embargo. el investigador debe decidir cu~intas categorías h~lcer y dónde
coloc~lr las fronteras entre ellas. El número dc c~\tegorias dependerá. por
lo general. de la c~tntidad de datos disponibles. Si son abundantes. es
siempre preferible dividir una variable en muchas categorias. Pero. por
olro lado. cl propósilO de la reducción de dalos es sumarizar éstos
concisa y convenientemente: crear muchas categorí~ts. pues. va en contra
de esta idea. P~lra controlar el erecto de confusión, raras veces resulta
necesario disponer de mi1s de aproximadamente cinco categorías {Coch-
ran, 1968). Si lo que se categoriza es una variable de exposición pnrn
examinar estimados del erecto según varios niveles de la misma. es
también poco usu~\1 que se precisen más de aproximadamente cinco
154 EPIDEMIOlOGI/I
MODERN/1

categorías. Ahora bien. sucede que lo~ dato~ ~on mucha~ vece~ tan
limitados en número que re~ulta indeseablc crear «nada menos» que
cinco grupos para una variable dada. Cuando las obser,.acione~ est:'\n
desperdigada~ en demasiadas categorias. lo~ números dentro de éstas se
vuelven estadisticamente inestables y producen grandes errores alcato-
rios en los estimados del erecto.
Puesto que la mayor parte de la conrusión debida a un faclor dado
puede ser eliminada mediante un análisis e~tratiricado basado en sól(,
dos categorías de una variable continua (Cochran. 1968), si los dalos de
que ~e di$pone son escasos resulta deseable mantener pequeño el nÚme-
ro de categorias. en torno a dos o tres. IncJuso un cuerpo dc datos quc
fuese grande puede ser dispersado hasta dar grupos exce~ivamente del-
gados si la tabla de contingencia implica demasiadas dimensiones. es
decir. si se usan demasiadas variables para cla~iíicar a los su.ietos. COI1
tres variables, aparte de exposición y enrermedad. y tres c~\legorías p~\ra
cada variable. habria 27 tablas de 2 x 2 (.\sumicndo que lanlo la exposi-
ción como la enfermedad fuesen dicotómic.I~). Con dos variables más. de
tres categorías cada una, tendriamo~ un tolal de 243 tablas de 2 x .?.
suficientes como para estirar ha~ta hacer demasiado delgado inclu~o UI1
cuerpo considerable de datos, puesto que un estudio de 10.000 personas
tendria únicamente como media en torno(\ 10 ~u.icto~ por cada ccld~1 de
dicha tabla multidimensional. Si se está planificando un análisis estratili-
cado y es necesario estratificar de acuerdo a diversa~ variables. probable-
mente sólo unas pocas cntegorias, quizá~ t:\11 pocas como dos. pucdan
ser utilizadas pnra cada variable. Con sólo dos categoria~ por variablc.
la estratificación por cinco variables requiere 32 en vez de 243 t.\bla~ de
2 x 2. y un estudio de 10.000 su.ieto~ daria ahora como medio 7R por
casilla. en lugar de 10, ganando con ello en precisión. al precio de alguna
confusión residual potencial dentro de las categorias. -1
El investigador debe decidir también dónde trazar la linea divisori.1
entre las categorías. No ha)' un mélodo comúnmente aceptado p.\r.1
h.tcerlo. Una preoc\lpación que sc expres~\ frecuentemente esti\ referida a
que lo~ límite~ tienen que «mangonear~e»). e~ decir. h~~. que de~pl~17.ar
-después de haberlos examinado de forma preliminar- los estimados
del efecto de una forma quc lo~ ~llterc en I~\ direccíón descadil. Ta]
preocupación adjudica al investigador un nivel de deshonestidad que es
de esperar sea inhabitual. Por otra parte, despla7.ar en la categorización
\Inos límites rara~ veces tiene un efecto sustancial sobre la magnitud de
un estimado y ello. en todo ca~o. serí~\ debido a la exi~tencia de un gran
componente de error aleatorio. Por cl contrario. frecuenlemente rcsulta
útil tantear la distribución de una "(1riable antes de decidir en qué punto
dar cl corte entre categoría~. Si tiene. por e.iemplo. más de una moda.
podrí;¡mos hallarnos ante categorias «natur;¡le~». La distribución pucdc
también e~tar lo suficientemente despl:tz:tda hacia una cola como par~1
que fronteras preconcebidas entre categoria~ condu.iescn a una incficien-
te separación de los su.ietos. con demasiados pocos sll.ietos en alguna~ de
ellas )' demasiados en otras. Debido (1esta~ r~lzones. por tanto, resulta lil
FUNDAMENTOS DEL ANALISIS DE DATOS EPIDEMIOLOGICOS ~55

mayoría dc las \'CCCSprcfcríblc definír las calcgorías finales \.iespllés de


haber re\'isado los dalos. por mucho que cl conscjo ordinario diga que
es. de alguna manera. mils objetivo hacerlo ignorando la dístríhllción de
las observacíones que se tienen a mano. ..\ pesar de lodo lo anterior. si
los límites intcrcalegorías que lienen .~enlido son inhcrentes a la \'ariable.
puedcn y deben ser cspecíficados a pri(}ri. Por ejemplo, si sc está catego-
rizando sujelos de acuerdo al consumo de analgésícos. cs deseablc crear
categorías que correspondan a las varías índícaciones terapéuticas exís-
lentes para el uso de estos fármacos, cuyas dosis recomendadas pueden
ser específicadas por adelantado. A veces resulta también rccomendable.
especialmente para una variable de exposición. retener las categorías
extremas en el análisis sin fusionarlas con las vecinas, puesto que las
extremas son. muchas veces, las que dan pie a los contrastes m(ís infor-
mativos biológicamente.
Un problema común cuando se crean categorías es la cuestión de
cómo tratar los finales de escala. Categorías poco definidas pueden dar
lugar a una notoria confusión resídual. especialmente si no hay plIntos
de dclimitación teóricos para la variable. Por ejemplo. las categorias de
edad del tipo 65 + .sin límite superior, permiten una gama considerable
de variabilidad. dentro de la cual pudiera no alcanzarse la deseada
homogeneidad dc exposición o de resultados. Otro ejemplo sería la
separación de los erectos que consumir alcohol y rumar tabaco ejerccn
sobre el riesgo del cáncer de boca: dentro de la categoría «grandes
rumadores» es una razonable posibilidad el que los mayores fumadores
bebiesen más alcohol que aquellos que fuman menos dentro de esa
misma categoría (Rothman y Keller, 1972). Cuando se considera proba-
ble que se produzca una conrusión residual por estar las categorías poco
definidas, hay que colocar fronteras estrictas en cada una de ellas, inclu-
yendo a las que están en los extremos de la escala.
Un método conveniente para luego ir ensamblando los apartados
definitivos consiste en categorizar inicialmente los datos de forma. mu-
cho más fina de lo que sería necesario. Esa categorizacíón estrecha
facilita la revisión de la distribución de cada v.lriable y pueden luego
crearse cate!!orías m{ls utilizables fundiendo las adyacentes. La fu5ión dc
estratos ady-acentes de una variable de conrusión órdenada según rango
se puede justificar por la falta de erecto de conrllsión que se introducc si
se mezclan las categorí.1S: esta mezcla no introducirá tal crecto siempre
que la distribucíól1 de exposici()n sea la misma en el seno de los contro-
les, o denominadorcs persona-tiempo. entre los distintos estratos, o si la
proporción de casos o la tasa de enrermedad son las mismas entre los
sujetos no-expuestos, también entre los distintos estratos (Miettinen,
1976b). La ventaja de empezar con más categorías de las que en última
instancia serán necesarias es que la mezcla de categorías se puede conse-
guir, convenientemente. en segundos o minutos con lápiz y papel. en
--.
tanto que disgregar categorías en subcategorías no puede hacerse sin leer
la ficha entera de los datos, añadiendo así otro recorrido de la computa-
dora.
ESTIMACION DEL EFECTO ()! COMrROR/\CIOJ\
DE LA HIPOTESIS)

Cm11f'rnbllCióll dc la 11if'ále.\"i.\"

En el análisis de los dalos. a diferencia dc I() quc sucede en la más amplia


área de la inferencia cicnlífica. 1,1comprobación dc hipÓlcsi~ sc rcficre
generalmente a la e\'aluación de un~1 hipótcsis nul:l. L.l introduccii)n. a
principios del siglo xx. de los conceptos de evaluacióll estadística condu-
.io a prestar atención a la importanci.\ quc tiene ,'alorar el p:\pcl del crror
aleatorio en la~ ohservaciones. La comprobación dc hipi)tesis "a. pues.
dirigida a la cuestión de si el error alc:ltorio es cl único re~pons3 blc de
una asociación obser\'ada. La estadistica que se utili7.:1 par:l evaluar e~t;¡
pregunta es el valor de P.
Dicho valor de p se interpreta habitualmente como la proh,\bilidad
de que una asociación, como mínimo tan fuerte como la que se estil --1
observando en ese momento en los datos. pudiera habcrse dado si la
hipótesis nula fuese verdad, es decir. únicamente por azar. rue$to q\IC un
valor bajo de p denota, en el marco de la hipótesis nula. una probabili-
dad baja de resultados tan extremos como los observados o más extre-
mos que ellos, tales valo'res bajos de p se toman como indicación de quc
los datos son más compatibles con la hipótesis altcrnatí,'a dc un efccto
no-cero. que con la nula. Un \'alor de p no debe scr confundido con la
probabilidad de que la hipótesis nula sea correcta: se le calcula a.\'/1l11il'n-
do que es correcta. Valores extremadamente ba-io~ de p puedcn darse
incluso cuando la hipótesis nula es verdadcra: de hecho. esti\ garanlizado
que se darán en una pequeña proporción de la~ veces en que sc produzc.\
dicha circunstancia. La capacidad informaliva de un valor de -p provicne
únicamenle de la interpretación de que v~\lorcs SU)'OSpequcños indican
relativamente menos consistencia entre los datos )' la hipótcsis nula y
una consistencia relativamente ma)'or con la alternativa. acerca dc un
efecto no-cero.
Imaginemos que un estimado tuvicse una dí~tribucíón mucstr.\1 con-
tinua sobre su escala de medición. con el valor ccro correspondiendo a la
hipótesis nula de no-efecto. La figura 10.1 ilustra la hipotética densidad
de probabilidad del efecto estimado: la forma de campana de la curva
está asegurada, para estudios grandes. por el teorema estadístico dcl
limite central. Valores del estimado iguales o mils extremos que el obscr-
\'ado corresponden en lo probable de su producción a la zona somhrea-
da del diagrama. La definición l11á.\'l'.\lrl'1110 puede $er unidireccion~ll. en
cuyo caso se dice que el valor de p tiene «una sola cola» o quc es
«uniltlter~\l» y se lo representa sólo por la zona sombreadtl bajo uno dc
J
los finale~ de la curva, o puede también ser bidireccional, en cuyo caso la
p «con dos colas» corresponde a la suma de las áreas sombreadas bajo
ambos filIales de la misma.
Para calcular el valor de p es necesario pos1ular Un modclo estadisti-
co que describa la distribución de probabilidades dc los dalos cuando se

~.-~,
FUNDAMENTOS DEL ANALISIS DE DATOS EPIDEMIOLOGICOS '57

t t
o Valor observado

Medida del efecto

Fig. 10.1. Distrih,(('i(ín d(' ,(}s (',\"tÍJJJ(1dt1,\' d('1 ('fe(,/(} ('II el m(1r('(J d(' 1(1 hi!,fí/('si,\'

/J/(la t'll (',\"tl(dit1,\" ,~rmld(',\" { di,\"trihucióll cO1lti1//((1 ) ,

asume la hipótesis nula. Si In distribución de los estimados del efecto que


son calculables a partir de los datos fuese realmente continua. carecería de
J consecuencias el que se definiese el {lrea de In cola de la cur\'a como el
área correspondiente a los estimados del efecto iguales o m{\s extremos
que los obser\'ados de hecho. o simplemente como el área correspon-
diente a estimados más extremos que los obser\'ados. Lo ti pico. sin
embargo. en Epidemiología, es que los datos a partir de los cuales se
calculan los estimados del efecto sean frecuencias discretas y la distribu-
1 ción de los estimados del efecto suela ser también discreta. en \'ez de
continua. Para una distribución discreta. el (írea que representa el valor
de p está ilustrada en la figura 10.2. Tradicionalmente~ se ha dclinido a

Valor de p con dos colas

=A.¡.B.¡.C+O

ó
= A + B + 1/2(C + O)
"U
ca
:::2
:o
ca
.D
o
~ I
.
t t
o Valor observado
Medida del efecto

Fig. 10.2. Di.\"trihllci()1I de lo.\" ('.\"timado.\" ticll;!ecto e1l ('11l10rco tic 1(/ hipl)t('.\"i.\"

mJa ( tii.\"trihllció1l (Ji.\"creta) .


158 EPIDEMIOlOGIA
MODERNA
dicho valor de p como la suma dc tanto~- la~ 7.ona~ li!!ernmente ~omhre:l-

das como las pintadas de negro en ella. La~ liger;mente ~ombreadas


corresponden a la probabilidad de las observaciones en ~í (~' a lo~
valores equivalentes en dirección opue~ta). en tanto las de negro I()
hacen a la probabilidad de separacione~ mi1~ extremas respecto dcl valor
nulo que la~ que han sido observada~ en la rcaiidac!. Para distribucionc~
discretas. obviamente, sí que importa el que se defina el \'nlor de r com()
incluyendo la probabilídad de que se die~c el re~ultado oblenido (I
incluyendo, por el contrario. únicamente I<.I~valores mi1s extremos.
El problema que tienc la dc[jnición lradicion31 dcl valor dc r es quc
conduce a sostcner inconsistenci3s. Por cjemrlo. i.quc r:l~a si el valor
obser\'ado del estimado del efecto estuvíc~e en el centro de 1:1dislríhll-
ción. justo encim3 del \'alor nulo: Dc acllerdo con 1.1definición lradici(l-
nal. cada cola incluiría entonces mil~ de 1:1mitad dc 1:1di~lrih1lción \. el
valor de p con dos col3s sería mayor de 100 por 100. lo ClI:lI" II()
1
concuerda con el punto de vista de que rerresenla una rrobahílid.I(!.
Una definición alternativa del valor de p, que supera este problema. es
aquella en que la probabilidad de que se diese el valor observado dcl
efecto se hallarla repartida. generalmente dividícndola en parte~ iguales
(Lancaster, 1949; Lancaster, 1961 ). En ese caso. el valor de p con una
sola cola corresponderia a la probabílidad de los valores más extremo~
más la mitad de la probabilidad del valor observado. Se ha llamado n
esta definición la de la «media p» (Lancasler. 1961). Se ohtiene general-
mente la p con dos colas multiplicando por dos el valor dc la r con una
sola, se la defina a ésta como se quicra.
Con datos discretos. las dislribuciones dc probahilidad utili7.:ldas
para obtener el valor de p puedan dar pie a c:'llcl!lo~ il11rincados: cu:lnd()
se los calcula directamente de est.1 manera. sc 10~ conoce como raf(}r('.\-
c.xacl0.~ dc p, Habitualmente es más ~encillo recurrir n una aproxima-
cíón de la distribución discret.l. apoy.indo~c en el hecho de que un:1
curva normal se aproximará razonnblemenlc bien a la forma de 1;1
distribucíón: cuanto ma\'ores sean las frecuenci:l~ incluídas en los d:lto"
discretos, mayor será ei número de v3lore~ quc pueden ser .1sumidos
para el estimado del eíecto y mejor la aprnxim3ción normal a I.1 dislri-
bución discreta. La ventaja que ofrece uliliz3r la cilada distribuci()n
normal consiste en que los ci1lculo~ neces;lrins p:lra obtcncr los \'alorcs
de p son considerablemente más sencillos que )()S que h;ly que rc(llizar
para hallar un valor exacto dc P.
En un intento de hacer me.ior 1(1aprnxim:lcj()n norm(ll cu(lnd() las
frecuencias son pequeñas. Yates (1934) sugirió un procedimiento con
«corrección», que se reduce a de~plazar el v(\lor obser\'ado del e.,\tim:1dn
del efecto hacia el valor nulo en una distancia que correspondc ;1 la
mitad de la probabilidad de que se dier(ln los d;11()Spresente~ en el C:1SO
de que la hipótesis nula fuese verdad. Se prelendc que tal a.iustc comren-
se el hecho de que el valor observ:ido dcl efcclo lo quc constiluye
realmente es el valor central de un r(lngn qlle corre.,\ronde. en la e~c(1l:l
de medición del erecto. a la región que C(ld(1 valor discrcto represenla.
FUNOAMENTOS
OELANALISISOEDATOSEPIOEMIOLOGICOS '59

Puesto que la probabilidad del rango entero del \'alor obser\'ado está
incluida en la definición tradicional del valor de P. la «corrección» de
Yates mejor~1 habitualmente la aproximación a como se define. también
lr.\dicionalmente. el valor exacto de Po Por el contrario. si se utilizase 1.1
definición de la media P. la sugerida operación aritmética empeoraria
ciertamente la aproximación. puesto que el valor observado ya represen-
taba el v.\lor central de su rango discreto. En el presente texto. la
«corrección» de Y.ltes es ignor.lda.
Para una comprobación estadística en torno al valor nulo. sobre la
b.\sc de un.l distribución normal, la fórmula general viene dada por la
ecuación 10.1:

.4 -E
x =
[10.1 ]
--¡¡;-
v

II es el valor observado del estimado del efecto. E es el valor espera-


do para A bajo la hipótesis nula y Ves la varianza de A. también bajo la
hipótesis nula. Dando por sentado que. en esas condiciones. ;/ esti1

] normalmente distribuida. l estari1 entonces también distribuida


mente bajo la hipótesis nula. pero con una media de cero y una des\'ia-
normal-

ción est,indar de la unid;ld. Una variable aleatoria con distribución


norm;l1. una media dc cero Jv una desviación estándar igual
~ a uno es
Ilama<Ja (/(',vvia('i(jl/ I/Vrllla! C.fl(íll(/ar: otros sinónimos son ra:(jl/ Críli('(1 y
va/vr Z. En este texto se usa en la fórmula l como nomenclatura para
enfatizar que el cuadrado de la desviación normal estándar tiene una
distribución de chi-cuadrado con «un grado de libertad» -y cierta-
mente es asi como se define la estadística chi-cuadrado con un grado de
libertad. {Chi-cuadrado con I/ grados de libertad es simplemente 1;1suma
de I/ chi-cuadrados independientes con uno sólo.) El valor de p se
obtiene a partir del de l sacilndolo de las tablas (o rórmulas computacio-
n.lles) de 1.1distribución normal esti1nd.1r. En esencia. )o que la ecuación
10. I hace es tr¡lnSform.1r un.1 estadístic.1 normalmente distribuida. con
un.1 expect.1tiv;1 y una varianza c.1Iculadas. en una desviación normal
cst,ind;lr (expectativ;l de cero y desviación estánd;lr de 1:1unidad). p;lr;1 l.I
cu.II h.1y convenientemente disponibles t;lbl.ls det¡11ladas que permitcn
oblener los valores de p, Seri.1 posible elevar l al cuadrado y obtener
dichos v;11ores de p .1 partir de las lablas de chi-cuadrado. pero dado que
h.1bilu.1Imcnlc CSl.1S tienen consider.lblemenle menos detalles que las de
1.1 citada distribución normal estándar. no existe razón alguna para
hacerlo.
H.1St;1 ;Iquí. 1.1 presenle discusión presumía que la obser\'~\ción de
interés p.1ra nosolros era el estimado del erecto derivado de los datos.
Aunque como norma general es así, cuando se c¡llcula l es más conve-
niente muchas veces postular para la variable aleatoria A una medida
que contenga toda la información estadística esencial acerca del erecto,
pero para la cu~11sea posible calcul~lr la varianza de manera mils rácil y
160 EPIDEMIOLOGIA
MODERNr.

exacta. Resulta conveniente. por tanlo. dcsi~n:lr como ,1 ;¡1 númcro tIc
sujetos expuestos que en el estudio padecen la enrermed(td: mediantc
esta sustitución. e} número esperado p;¡ra A ha.io la hirótcsis nllia no
seril cero. sino que deberá 5er calculado a pi.lrtir dc los dalOS. sohrc 1i.1
base de} modelo probahilíslico que fue5e pertinenlc. Los modclos quc
pari.l e5tudios epidemiológicos son rc}e\,antcs a e5lc rc~pcClo scriln dcs-
crilos en los capitulos 1 J ~' 12.

E,,"1Í111aci(),1 d(' ('{ecln.,"

La mejor estimación numérica ilnica dc un cfccl(). de cnlrr un con.iunt()


de datos. se conoce como c,\"liI11aci(111
f1111111Ial.
P\Jest() quc \Ina cslimacii)11
puntual constituye sólo un punt() en \Ina escala C()111inuac()n un nlJmcr() 1
infinito de valores posiblcs. existen esencialmcntc ccr() proh~\hiiidades dt'
que resulte correcta. incluso si no hay fuentc dc sesgo. Por Il) t~lnt().
aunque los estimados puntuales sirven c()mo indic~\dorcs iJtilcs dc la
magnitud de un efecto, es importante suplement~\r l~l información que
proporcionan con una medida del error alcatorio que pudiera haber cn
los datos. La comprobación de hipótesis ruede scrvir a tal cfccto. pcro el
valor de p es una estadística no descable par~\ e\'aluar cl error alc.\t()ric.
porque no aporta información .llguna accrca dc la m~gnitud dcl CfCC1Oy
permite sólo indirectamente delermin~r e] grcldo de error alc~\torio que
ha)' en un estimado. Como se insistía en el capítul() 9. el mayor inconvc-
niente de los ,'alores de p es que tiendcn ~ scr utilí7.c1dos par.l poncr il
prueba la «significación» como met~ an~lític~l. dcs,'í:\n(lo la atcnción
le.ios de su objetivo propio, que es 1~1estimCJció11dc efectos. El uso dc los
intervalos de confianza, que no tienen ni11gunCJde las pega~ dc los
valores de P. constituye un ahordajc mejor.
Un intervalo de confianza expresa un r~n!!() de val()res que rodc:ln a
la estimación puntua] y que "ienen a ser como un~1especic de «r.\ng() de
muestreo») de] estimado. El nive] dc confian7.:l. q\\e c~ seleccionado por el
investigador arbitrariamente. constituye el marc() de rererencia dcntro
del cual puede ser interpretado el rang() mue$tral. La mayoría dc I()s
investigadores utilizan repetidamentc cl mi~m() nivcl de confi~1nz~1par:1
facilitar las comparaciones: 1os valores quc se utilizan comúnmente son
el 90 )' el 95 por 100.
La conexíón entre los intervalos de confianza )' 10$ valore~ de p,
descrita en el capítulo 9, deberia ser expresad.l en término~ miiS rorm~\lcs.
De la misma manera que un intervalo de confianza. las p miden tambicn J
un ran,go muestral, pero se lral.l especificamentc dcl rang() de m\lc~-
treo de los datos ba.io la hipótesis nula. El punto nulo en la escal~i dcl
erecto es el punto de referencia para la comprobación de l.I hipóte.<;is ). cl J
valor de P, una medida de la discrep.incia entrc lo~ d.\toS )' el punlo dc
referencia en términos de probcibilidades. Un intervalo de confianza. en
contra$te. fija la probabilidad dc que se produzc.l un valor arbitrari~l-
mente escogido, que es dependicnte del ni"cl desead() dc confianza y que
FUNDI\t.'ENTOsDELANALIsls DEDATOSEP'DEMIOLOG¡COs ~61

varía de punto tic rcrl:rcncia. el cual se convicrtc en límite para el propio


intervalo de conlianza. :\si pucs. para determinar la dclimit.lc¡ón inrcrior
de un intcrv.II() tic conli:lnza dcll)() por 100. sc :1.just~Il:1 punto tic rctcrcn-
c¡~\ h~lSt.\ quc cl ~\rc~1 tic la col~1 superior SC~ICX~lct~lmente l:1 5 por lO()
(Fig. 10.3). Par~l los límitc5 tic conlianza al (}O por lO(). la tiirccci<)n <.icl
~Ijustc ticl punto tic rcrcrcnci~\ scr~i p~lrticndo tlcl \'alor nulo h~lci~\ cl
estimado puntu~ll. si cl v~llor tic l' con una COI~l C5 mcnor dcl 5 por 100.
lo que Ilcv.l ~I ohtcncr un punto inrcrior dc scñaliz~lción del marl!en dc
confianz.\ que est~lr~i situ.1do por encima dcl valor nulo (para erectos
positivos). Si I~l ? con una sola cola es mayor del 5 por 100. hay que
ajustar el punto dc rcrcrenci.1 ~Ilejilndose del valor nulo. en dirccción
opuesta .11estimado ptlntual para h.lcer que el ~irea de la COI~l baje tlcl 5
por 100, d.\ndo como rcsultado un intcrvalo tic conlianza quc incluir:i.
como entre paréntc5is. ~11\'~\Ior nulo. Si 1.1 ? de un~\ cola es exactamente
el 5 por I()(), un~\ de la5 m.lrca5 dc ese interv~110 tle conli~lnz~l dcl 90 por
100 seri1 igU~ll ~11valor nulo.
L.\ m~\ner~l mi\5 .\ju5t.\da de determin.\r un limite dc conli~lnz~1 consis-
te en utilizar Ci11culo5 ex.\ctos, .\ni\logos ~\ los quc se utilizan par~l c~llcu-
I.lr exactamentc los v.llores de ? Sin emb~trgo. los que se necesitan p.\ra
obtener los límites de confianz~\ son por dos r~lzones con5iderahlemente
mils dificile5. EIl primer lug~lr. el aju5tc dcl punto de rererencia para
calcular el ilre~t dc la cola signilica poner ~l prueba un.t hip¿)tcsis no-nul:l.
Los modclos estadísticos quc dcscrihcn I~I situacii>n no-nula son :llt~l-
mente complic.ldos, en comparación con 105 dc 1~1hipótesis nula y exigen
que se re.11icen muchos mils Cil1culos. Segundo, esos complic.\dísimos
cálculos deben ser repetidos en un proceso reitcr~ltivo tante.lndo v.llores
]

iJ
(O A B Area de la cola
:2
15 Curva A: 5 %
(O
-O Curva B: valor de p
o
5. con una cola
:J
":J
":J
(O
iJ

.~
C)
O

límite de confianza Valor Valor observado


inferior al 90 % nulo (estimado puntual)

Medida del efecto

Fig. 10.3. Rall.~o d(' 1111(e.\,treod(' lo.\, dato.\, ('II rejerl'lIcia lÚ valor 1/1(1(,.I' (1IIín,ite
de co(~jillll;a illjerior al 9(} !'or 100.
162 EPIDEMIOlOGIA
MODERNA

deI punto de referencia. hasta que el ilrc~l dc la cola se~l acorde con cJ
nivel de confianza que se desea. Por i() tanto. el c~llculo de los limitc~
exactos de confianza es prácticamente invi..lble si no se dispone de un
equipamiento a base de computadoras electrónicas prot!r..lrnablcs.
Existen afortunadamente much..ls tccnicas sencillas~ an{llo!!as ;¡ la
fórmula ]0.1. para obtener limites de confianza aproximados- Como en
el caso de la comprobación de hipótesis. la exactitud dc las tccnic:l~
aproximadas depende del ntlmero de ohser\'aciones. porque todos I{)s
métodos dependen de la distribució~ normal de los estim~ldos dcJ cfecto.
garantizada por el teorema del limite central cuand() l~lS obscr\.aciones
son suficientemente numerosas.
Una asunción que simplifica las cosas y que con [recuellcia ~c re..llizJ.
es considerar constante. a lo l~lrgo de ~lI escala de medicil)ll. la \.ari~lbilj-
dad muestra! del estimado del efccto. e~ decir. auc I:! \.~lrianz:1 ocl
estimado dcl e[ecto se toma corn() con~tante. illd;rendicntementc d:;:1
~
valor del estimado. Para comprobar una hipótesis no es necesario ~lSlJ-
mir e~t(). porque el valor de p se c~lcula sobrc la a~unción de. quc I~I
hipótesi.~ nula se mantiene y por tanto. lo que preocupa al poner a
prueb.i una hipótesis es estimar la varianza sólo sobre el valor nulo. Con
un conjunto grande de observaciones. el rango de muestreo para el
estimado del efecto es suficientemente estrecho corno para hacer apr()-
piada esta asunción: incluso si la varianza cambia sustancial mente a lo
largo de la escala de medición en que se mide el efecto. en un ran(!()
.~
suficIentemente estrecho será casi constantc. En consecuenci~l. la sirnpli-
ficadora asunción de que la varianza se~ constante es corrccta asintóti-
carnente: es decir, la asunción se \'a haciendo m{J.<\apropiada con[ormc
aumenta el ntlrnero de observaciones utiliz;ldas en eJ rroces() de estilll~l-
ción. .
El abordaje habitual y el más simrlc qlle ~e utili7.;1 r~lra c..llcular
limites de confianz..1 aproximado~ consiste en estim~r 1:1 desviación es-
tándar dc la curva normal que represent.1 la distrihuci()11 Illuestral arr()-
ximada dcl estimado dcJ efecto. El iJrea que h;I~. h;l.i() un scf!mcnl()
simétrico de una cur\'a normal es runci()n especifica dc la desviación
estándar: de hecho. esta rclación proporciona la tlnic:1 posihilid~ld de
interpretar la desviación est:ind~lr com() medida de v:1riabilid~ld. Si 1:1
distribución no es normal. no existe interpretación :11f!Un~1dc este par:!-
metro que tenga sentido, aunque se podrian c~llcu¡..lr. pcSC a todo. lo.~
int("rvC\los de confianza por medio de cálculos exactos. Para cualquicr
CUr\":i normal, el 68 por 100 del área que ha)' ba.io ell~l sc cncuentra en 1:1
regil'll <iistante hasta una desviación estánd..lr (SO) del punto centra!. Oe
esta manera, valores de medición inform;ldos con la [órmuln :t SO com()
medida de variabilidad. l~ que quicl:-en expresar es un estimado puntual
con un intervalo
la distribución
de c0nfianza acompañante
muestral sea en rc:llidad
del 6R por ]00. siempre que
normal. Cuand() se ha csco-
]
gido un nivel de confianza. el \'~llor h~lbitualrnentc no seril del 68 sino
comúnmente dcl 80, 90 ó 95 por 100. F.sto ni\'eles dc confianza se
corresponden con las regiones marcadas por los puntos 1.2R2. 1.645 ~.

~
i i i i i i i
O\n
tO-:t
-1 o +1 IJ)O
.".<D
0). tO. Media <DO)
.--

Unidades de desviación estándar

Fig. 10.4. /1 rt!o hlljO lllla Cllrt'a IlOrllllll.

j 1.960 veces la unidad de desviación est{lndar. respectivamente. respecto


del valor centra en cualquier dirección (Fig. 10.4).
Para hallar un intervalo de confianza basado en 1.1asunción de una
distribución normal es necesario estimar tanto el valor esperado (media)
del efecto como la desviación estándar. El valor esperado se entiende
que se obtiene mediante el estimado puntual y 1.1desviación estándar
también se la calcula simplemente a partir de los datos observados. Para
-1 construir intervalos de confianza. teniendo una diferencia de tasas como
medida del efecto, la fórmula resultante sería:

RD :t z .SD(RD) [10.2]

en don~ RD indica el estimado puntual dc la diferencia de tasas (el


símbolo
ción estándarsignifica q ue es un al
~correspondiente estimado), Z es el múltiplo
Ilivel de confianza deseadodey laSD(RD)
desvia-

indica la desviación estándar estimada del estimado puntual: el signo


menos produce el limite inferior del intervalo y el más. el superior. El
citado estimado puntual y la desviación estándar se sacan. como se dijo.
de los datos, seleccionimdose arbitrariamente para Z un valor que dé el
nivel de confianza deseado: por ejemplo, 1,645 para una confianza del 90
por 100 y asi sucesivamente. Frecuentemente, en una formulación como
la que se da en la ecuación 10.2, se llama a la desviación estándar error
esrándar (la abreviatura inglesa es SE). En algunas circunstancias. hay
que hacer una distinción importante entre desviación estándar y error
estándar. Este último es la desviación estándar de la distribución mues-
tral de los valores medios; si las observaciones originales provienen de
una distribución normal, es importante distinguir la desviacióIl estándar
'64 EPIDEMIOLOGIA MOnEnN/,

perteneciente a dicha di$tribución normal respeclo d(' I:t de~viació!l e~-


tándar de los valore~ medios, dand(l asi pie a 1:1necesidad de un términ()
$eparado. error estándar. En e] contexto de C$tc libro. sin embarg(1. I()
que nos interesará por lo general es la di~trihución dc muestreo de I()~
e$timados puntuales. que corresponde al error estilndar. aunque e-" tam-
bien perfectamente aceptablc utilizar cl tcrmin() de-"vi(lción cstilndar.
puesto que un error e$tándar es un tip(1 cspccific(l de clla.
Si la medida dcl efecto que intere~a e-" llna razón de tasas. cn Ili.L'ar Jc
una diferencia entre ellas. podría ser razonahle utilizar 1(1fórmula 10..? y
--
sustituir simplemente RD por RR. Es prefcriblc. sin emharg(). utilizar
/'-.
una ecunción diferente. porque par~ RR la di$trihución muestral e-"
a~imétric:l y en consecuencia, tal di$trihución
dos de la razón de tasas no est,-lri¡ distrihuida
de muestrco
normalmentc.
de los c~tim:l-
a mcnos que 1
se dispong,-¡ de un nilmero de (lbser\'acio!les relaliv:lmente grandc. i,l)ar
qué es asimétrica para RR la distrihució!l muestral: Su valor minim() es
cero, en tanto el mi1ximo es infinito. Los errores aleatorio$ plledcn
conducir a que haya discrepanci,-ls mayores en e] Jada que estil par
encima de la media de las que serían discrepancias correspondientes en
el lado de abajo. Vale la pena resaltar en este punt(l que la distrihución -I
de muestreo p'-lra RD si es simctrica. Aunque la quc correspondc a Í~R
se aproxima a una curva normal para un nilmero suficientemente grande
de observaciones, cuando l,-lS obser\'aciones ~e encuentran relativamcnlt:
di$persa$ es costumhre utilizar por ~jstem(1 un,-¡ transformación de esca-
la~ p,-\ra introducir simetria y par¡1 estahlecer limites dc confianza ~()brc
una escala de medición quc signific¡ue una me.ior aproximacii)n a la
distribución normal. Esto se logr,-l convenientemente utiliz,-lndo un¡1
transformación logarítmica. La fórmula par(1 oeterminar los limite~ de
confianza tra~ la citada tran~formación logarítmic¡l dc 1,-1r,-lZón de tasas e~:
J
In (I{R) ::t Z. SD(111 (RR)) [)0.~J

Se trata de una fórmula análog:1 a la [ ) 0.2]. diferenciilll(\ose s()lo en qUl' -J


In (RR) sustituye a RD. Ya que antes se h:lhían planteado los límites de
confianzu sobre la escala lo!!arítmica transformada. ahora es necesario
volver atrás la transformación para que loS limites puedan ser inter-
prelados en su escala original. Para conseguirlo hace falla hallar el
antilogaritmo de los límites que result~lrol1 de I~l fórmula 10.3. El proces(}
en su conjunlo se resume mediante I~l fórmula:
J
exp [111 (RR) :t Z .S[)(ln (RR))] [10.4]

En tanlo la fórmula JO.2 da lll10S límites de ool1fianz~1 equidi~t.lntes


respecto del estimado puntual. la 10.4. dehido a la transformación de
escalas, da otros que. como se ha dicho. son asimélricos respecto de cl.
En la escala logarítmica. los límiles son simctricos. pero en la original el
eslimado punlual es la media geomctric~1 enlre los límiles inferior ~'
superior: es decir. la razón enlre el punto de delimilación superior ~. el
FUNr>AMENTOS DEL ,'NALISIS DE DATOS FPIDE~AI()1 ()r;Ir:os 155

citado estimado puntu~ll c~ la misma que I~l qllC h:ly clltre c~te ~.'el \()pe
inferior .
Las [10..?] y [1().4] <¡011la~ f()rm\II~\s ~ener:llc~ m:"I.O; ~cnl.:ill~\.o;r:lr:l oh-
tener por derivl1ción límites de confi~lnZl\ aproxim:ldos r:lr~l mcdid:1S dcl
efecto expresad..ls en términos de diferencia dc tasa~ y r~lzón de tasas. res-
pectivamente. Sc h~ln propuesto muchas \écnica~ c~pccificas. c:tda una c()n
un balance diferente' entre facilidad de ci1iculo y cx:lctitud. 1\lgunas fórmu-
( las dejan de lado la ll~unción de que la desviaci()n e~ti1ndar sea unif()rme ..1
lo largo de la escala dc medición y utilizan. por tllnto. técnicas reiterati-
vas para estimar su \'alor en las zonas fronterizas del intervlllo: el
método de Cornfield ( 1956) para calcular límites de c()nli:tnza de la
razón de ventajll es un ejemplo de este tipo de razón de riesgos y
diferencia de ricsgos. Los c:"llculo~ reiterativo~. como tamnién se !\eñllla-
ba antes. requieren I~\ :tsistencia .de pr()gram~ls de c()mputadorl1. con lo
que las ventajas tc()ricas van :tc()mpañ..ldas de desventCl.iCls rri\ctic:ls.
La técnica específica mils sencilla para Ilc\'ar a can() \In~ estimación
de] intervalo es cl mét()do «bas..1do en el test» {Miettinen. 1l)7ó:l), que
asume que el estimado dc la desviación esti1ndar de Il1 distrihución
muestral del estimado del efecto obtenido pl1ra el valor nulo constituye
un razonable estimado dc la desviación esti1ndar de la distribuci()n para
] cualquier otra parte a lo largo de la escala. Esta :lsunción difiere ligera-
mente de la habitual. consistente en que el vl11or c~llculado dc la des\'ia-
ción estándar en el cstimlldo puntual \'a a ser :ldecuado para los puntos
]imítrofes dcl intervalo: aunque ambos abordaje$ asumen que el \'Cllor de
la desviación estándar estimado en un punto de la escala se :tplicará
i tanto al extremo inferior como al superior. el valor calculado en el
~ estimado puntual está colocado más o menos centralmente entre los
límites del intervalo, en tanto el valor nulo no )o está e incluso pudiera
situarse fuera del mismo. Si la desviación estándar cambia a )o largo de
la escala de medida del efecto, el grado de error que habrá en 10$ límites
aproximados será probablemente menos severo si se estima la de$viación
estándar en el punto central del intervalo de confianza en vez de en el
punto nulo. que no tiene conexión con la ubic~lción de los límites. .Por el
contrario, si se e$coge el punto nulo como punto <¡onre el que se estima
la desviación estimdar. los limitcs de conlil1nz:l resultantes tender:"ln a ser
más ajustados cuando caigan en las proximid:ldcs dei cit:tdo p\lnto nulo.
con lo que podria llegar a argumentarse que vale la pen:l obtener m:lyor
exactitud cerca del valor nulo. incluso si ello signific~l
-- sacrificar :11\!una
exactitud cuando los límites c~llculados se encuentren lejos del mismo.
Aplicar la asunción de ]os límites has..ldos en el test Ilc\,ll II lina
concisa formulación para obtener los límite$ de confianza hllsados en el
test estadistico de 1~1ecuación 10.1. Consideraremo$ la reformul:lción de
dicha ecuación 10.1 para la diferencia de tClsas:

-..
[{D -E
l=.SD(RD)
166 EPIDEMIOLOGIA MODERNA

-""' /, ""'
donde E, la expectativa de RD ha.i() la hipóte$i~ nula. e~ cero. ~. SD(RDI
se calcula a~umiendo que la hipótesi~ nula e~ cierta. E$to da:
RD
,

[10.5]
~

donde SD()(RD) indica que l~1 de5\'iación c5tílnd:lr estíi cstim:ldíl el1 el
valor nulo. Se puede reescribir e5t:l ecuación 10.5 así:
---
I~ I )
SD(I(I~O) :: ~---
l

~. realizar SU51ilucione~ en la r()rrnula 10.1, I() que d~l. r:lra los Jimilcs
inferior y 5uperior:

:tz~
-
1
l

2'
+-
-"I
[10.6]
I. I

En la fórmuia [ 10.(i] sc asume quc 1:1 i: c~ UIl le~l esladi~lic() que evalúa
RD per se. Mietlinen recomendaba insertar en dicha fórmula [10.6] cual-
quier e~tadistica de X que representase un les! igualmente eficientc dc 1,1
hipótesis nula sobre la base de lo~ rnismo~ dato~. Por ejempl(). ~e la
podria sustituir por la habitual, basada en la distribución del núrncro dc
casos expuestos (véase Cap. II para la forma en concreto .de hacerlo).
La contrapartida dc la ecuación 10.5. utilizando como medida dcl J
efecto una razón de tasas. tras transf()rmación logaritmica es:
X = ,., In (RR),., [10.7]

SDo(ln (RIt))

que puede volver a e~crjbirse como:


--

111 (RR)

I: ~]
y hacer sustituciones con ella en la fórmul:l 10.4 para dar

J
que se puede simplificar hasta dclr:
-
RR(' :tZll)
[10.8]

-J
FUNDAMENTOS
DEL,\NALisiS DEDATOSEPIDEMIOLOGICOs 167

Como sucedía con la fórmula 10.6. el atracti"o tic la IO.R está en sustituir
la estadística ;(, basada en O. por una X altern.1tiva )' más conveniente
que pone a prueba la hipótesis nula. La misma estadística. ciertamente.
puede ser uti]izadi.l en las fórmulas 10.6 y 10.8 para generar límites de
confianza para la diferencia de tasas y para la razón de tasas. Nótese que
cuando el va]or de X es igua] a] multip]icador 2, e] punto de delimitación
inferior debe corresponder y corresponde exactamente a] valor nulo. que
es cero para la diferencia de tasas )' uno para su razón.
Las fórmu]as para caJcu]ar límites de confianza aproximados basa-
dos en el test que se dan con las notaciones 10.6 y 10.8 son extremada-
mente fáci]es de aplicar y proporcionan como resultado útiles inter,'alos
de confianza en una amplia variedad de situaciones. Los únicos números
que se requiere sacar de los datos son un cá]culo puntual de! estimado
del efecto que sea apropiado y la estadística z. sacada de la comproba-
ción de hipótesis. En rigor. el uso de la citada estadística Z' en estas
fórmulas basadas en el test. es la justificación fundamental de cualquier
discusión detallada sobre la comprobación de hipótesis estadística en la
1 epidemiología" moderna. puesto que para evaluar el error aleatorio es
preferible la estimación de un intervalo de confianza en vez del uso de
los valores de P: y éstos añaden verdaderamente muy poca información
] cuando se da el intervalo de confianza.
Desgraciadamente, el principio de los límite$ basados en el test es
invá]ido como método genera] de estimación del intervalo í Halperin,
1977; Gart, 1979). Las simulaciones han sacado a relucir los pobres
resultados del método, que por otra parte eran de esperar, cuallJo se
dan grandes alejamientos de la razón de ventaja respecto del valor nulo
(Brown, 1981: Gart, 1982) y, además, Greenland (19R4) ha suministrado
un contra ejemplo con la SMR que refuta la "alidez general del abordaje.
Este autor dice:

El problema que tienen los limites hasados cn el tcst no es (como 5e ha


sugerido) la falta de estabilización de la varianza en aplicaciones cspc-
cificas. sino por el contrario que el principio nos exige que igunlcmos
dos diferentcs tests estadisticos de muestros grandes. Puesto quc tales
estadisticas son únicamente equivaJcntes en la \'ecindad de la hip(}tesis
nula. cl principio en si mismo es fala7-.. Por dcsgrocia. el tamaño de
la \'ecindad en cuestión paro la que el principio es válido \'ariará entre
parámetro y parámctro,

A pesar de sus inconvenientes teóricos. los límites basados en cl test


pueden ser útiles como método «chapucero» para estimar el intervalo.
Se sabe que obtiene buenos resultados para los límites de la razón de
ventaja cuando dicha razón de ventaja está entre 0.2 y 5.0 y puede ser
igualmente una herramienta aceptable en otras situaciones. En el próxi-
mo capítulo se ilustra una comparación entre los distintos métodos para
estimar el intervalo de confianza. con algunos datos sencillos.

.J
168 EPIDEMIOLOGI/, MODERNA

A. iU.\'1(' par(/ cnnlparaci011l'S mlíl1 iplcs

f\1uchos estadísticos han hecho oír su preocupación acerca de ia inter-


pretación dc los valores dc p o pruebas de «significación» cuando se -1
rcalizan comparaciones múltiples. Tal preocupación tiene unas bases
que descansan en los siguientes arf!llmentos: supon!!amos que un con.,
.junto complejo de números completamcnte aleatorios f\lescn cvaiuíldos
en 1.000 asociaciones. Se parte de la premisa dc que no existe ílsocinci()n
real en los datos, pero se están cxaminando 1.000 difcrenles mediciones
huscánd()Ja. Si .,\e reali7.a una comparación de «si~nificación>} al 5 por
100. habrá aproximadamente 50 ~Isociacione!\ «significativas>, en esos
datos. tOdílS ellas repre$entando errores de tipo lo crrores alfíl. es decir
50 a$ociaciones «estadisticamente significílli\'as»
azar. La cuestión es, pues. que el a7.ar !!aranli7A1 una cierta proporción
que ocurrcn sóJo por
de 1
asociaciones así y cuando se e$tudiíln muchas son posihlcs tambicn mu-
chas falsi1mente positivas.
La forma estadística tradicional dc afrontílr e~te «problemn» h~1 sido 1
hacer más rígidos los tests de significación, ya fuese cambiando el
critcrio por otro más estrecho, como lilílizar el 1 en Jugar deJ 5 por 100,
() innando realmentc los v~llorc~ calcuJados dc p mcdiantc algún factor
que dependiese deJ n(lmero de compi1racionc~ reílli7.adas. Puesto que )o
tipico es que los epidemiólogos. en $\1 exh~lusliva ev~lluaci()n de dalos
obtenidos a elevado precio, lleven a caho comp~lraciones múlliplcs. h~1
sido frecuenlc que recibiesen admoniciones p~lr,1 estar alcnto$ al prohlc-
ma.
No está claro, sin ern¡'"rgo,
una mejora. En primer luf!ar, el argumento
quc la solución rccomcn(Jada
anterior, como toda compr()-
sif!nifiquc
1
bación de hipótesis, parte de la premisa de que la explicación de todos
los llamados resultados «$if!nificativos» cs el a7.ar. una especie de ~uper
hipótesis nula. Ahora bien, ¿por quc razón deheriam()s asumir quc el
a7.ar es una explicación prohable de la$ asoci:lri()ne~ q\!C ~e ob~er\'an'!
Ciertamente. por el contrario. h.\)' motivos p:lr.1 argumentar que r.!ras
veces (alf!unos dirian que nunca) es esa 1.1 explic(!ción de los halla7.gos.
Por tanlo, si el azar no es I~I explicación dc una asociación posili\'.\
«significativa», el halla7.go no representa un error tipo I o alfa. Aparte. si
se hace más restrictivo el criterio de despista.ie de la «signific.ición»
estadistica se paga una pena: ~l.'\ociaciones reales no-nulas pueden que-
darse sin ser detectadas (un error dc tipo II) porque n() alcan7.a.,\en a
cumrlir e~()s criterios más estrechos. Un;1 consideración elemental de 10$
critcri!,')s del .\"crel'11i11g(o «criba.ie») que es de aplicación aquí. especifica
clar.lmente que a partir de UI1 criterio único (el nivel de «signific~i-
ción»), el nlJmero de falsos po.,\itivo.,\ sólo se puede rcducir a expensas de
aumentar 1.1 frecuencia de falsos negativos. i.Valc la pen~1 reducir los
]
falsos positi\'oS a expensa.,\ de los fa.,\o.,\ ne!!ativos? La pregunta no puede
ser respondida en término.'\ genera le.'\: requiere una comprensión mils
profunda de las consecuencia.'\ de dar resuJtados falso.'\ positivos )' falsos
FUNDAMENTOS
DELANALISISDEDATOSEPIDEMIOLOGICaS 169

negativos en cl I.;onlcxto dcl marco de la invcsli1!aci(}n (Ic que sc !ratc.


uña cosa. no obstante. esli1 absolulamente I.;lara~cuaics<1uiera qlle .-;can
los argumentos para reducir las oportunidades de que se produzcan
falsos positivos en favor tic los fal~os ncgativos. no licnen nada quc vcr
con las comparacioncs múltiplcs: se aplicari~ln igual dc hien a una
comparación llnica.
El qllid del problem~l de la comparación mlllliple pnrece c~lar en que.
al realizar muchas comparacioncs e inform~lr sólo dc l~lS que son «esta-
dísticamentc significativ:ls». es dificil imput:1r al v:110r de ¡> 1:1 inter-
pretación dcsead:1: en la hipótesis nula. una proporción hien definida dc
los tests seri1n «signific:1tivos», pero si el denominador. el nllmero de
comparaciones. cs grande y desconocido. rcsulta poco menos que impo-
sible una interpret:1ción ra7.onable de los v:1lores dc ? que se obteng~ln.
Si se hubieran reali7.ado muchas comparacione~ y c~\da una dc cll~\s
hubiese sido informad~l individualmente. digamos. por ejemplo. en una
publicación separad:1. resultaria absurdo hacer a.iustes con los v~llores de
? hallados en cad~l informe, sobre la base dcl nllmero tot~ll de ésto~" De
estar indicados semejantes ajustes. lo quc se seguiri:1 también. en con~c-
cuencia, es que 10 deberia hacer un investigador es ir manteniendo un
tot:11 de comp:lraciones hech~IS durante su carrcra y ajust:1r todos los
] tests de «significación» de acuerdo al tot:l1 momenti1neo de comparncio-
nes realiz:1das h~lsta esa fech:1. Cuando mi1s ,\"('17i(}r fuese el investigador.
más habria que innar cl valor de ?, Ya t:11 cfccto, i.no hnbria que lom:1r
en cuenta :1 la hor:1 de hacer esos ~ljustes el nllmero previsto de futuras
comparaciones, lo mismo que las que ya hubicran sido hech:1s? Dcberi:1
result~lr obvio que est~ls preocupaciones son irrclevantes para cl prohlc-
ma que se estuviese investigando: convierten el valor dc ? dc ser una
estadística que transmite información sobre una asociación específica
existente en los datos, a una que dependicra de experienci:.\s no relacio-
nadas del investigador o de su estado psicológico. Nadic h,a sugerido
hasta ahora que se hagan ajustes en las comparaciones mllltiples en caso
de que se informasen los resultados individualmente cn publicaciones
separadas. Pero. ¿no resulta. cntonces. inconsistente considerar la posibi-
lidad de realizar tales ajustes. estén los mismos resultados agregados
en una o varias publicaciones'! i,Tendria un documento que re\"isase
asociaciones, individualmente informadas. que ~ljustar los valores de I"!
Si no hay por qué hacer ~ljustes con ellos cuando se informa indi\'idu:\I-
mente en publicaciones separadas. lo lógico cs que cl proccso de nmon-
tonar los resultndos juntos en un lugar tampoco debiera afectar a éstos
en sí mismos, independientemente de cuándo y cómo se produjese cl
«amontonamiento». Por lo tanto, no se deberían hacer ajustes en caso de
comparaciones múltiples incluso si se estuviesen publicando al mismo
tiempo un número grande de ellas, siempre que estuviese claro cuántas
comparaciones han sido hechas y que todos los resultados «negativos»
(esto es, «no significativos») se han informado all:1do de los «positivos»
o «significativos».
Hay un problema cuando no se inform:l de los rcsultados negativos,
170 EPIDE~~IOL(1(';IA MnOERNA

y es quc result(} dificil entonces interprelar ;Idccuadamentc los valores de


p para los hallazgos positivos que si se inrorman. Pero sigue siendo un
error. no obstante. creer que se puede me.iorar la interpretación a.iustan-
do los valores de p o cambiando el criterio para que un resultad() se con-
sidere «5ignificativo». Los valores 3.iustados son tamhién imposibles de
intcrpretar. puesto que comunican incluso meno$ acerca de la asociación
que se da: cambiar el critcrio de (significacinn» no solucinna realme!1te
cl problema: c()mo 5e discutió anteriormente. lo único que produce e.c;U!1
error de tipo I más pequeño. a expensa.c; de un mayor erro,; de tip() 11.
Como e~ habitual. alg(1 se gana en claridad recurriendo al uso dc los
intervalos de confianza en Illgar de la$ prucba$ de significacióJ1. El
equivalentc a multiplicar el valor de p por algiJn factor de a.iu~te. para
compensar por la$ múltiple$ comp.tracione~. significaria ampliar cl inter-
v.tlo de confianza.
c:1!1tidad de información
Pero tal inter\'alo mit$ amplio nn tiene relación con la
exisle!1te en lo~ dato~ .tcerca del erecto en 1
cuestión: dependerá por el contrario del niJmero de comparí1cione~ que
el investigador pudiera haber hecho. El problcma de este .thord:1.ie es
que parece contravenir la presunción lógica de que los resultados ohteni- 1
dos sobre un erecto deberian rene.i.tr I.1 cantid.td de inrorm.\ción snhre el
mismo existente en los d:.ttos. nada mits y n:.tda menos. Si se ohticncn
intervalo$ de confianza más amplio~ para compensar por las múltiples
comparaciones. un lector que tuviese un interés centrado itnicamente en
un item sufriria un ca5tigo innecesari(1 en término~ de la información
impartida por los referid05 hallazgos. simplemente porque el invesliga-
dor original no se hubiese centr.tdo tamhién en e] problem:.t que recof!e
esa riJ hrica.
Lo mejor que puede hacer un epidemiólogo cuando 5C ve obligad() a
rehlizar comparaciones múltiples. d:.tdo que no parece exi5tir problem:.1
alguno que requiera ningún a.iusle. a menos que los resultados positivos
de un gran número de comparaciones sean refcrida5 5in información
.\Iguna sobre el niJmero total de éstas y puesto que incluso entonces
parece que ajustar los re~ullado5 sólo 10$ hace más dificiles dc inter-
pret:.\r: lo me.ior que puede hacer. in5i~timos. e$ ignorar los conse.io$ de
que realice tales ajuste$ en los resultado~ que obtuvo. C.td:.t hallazgo
dehe ser jnrormado como si sól() él ruese el centro del estudio, Si el hecho
de que e! númer() de comparaciones fuese grande hiciese invi.\hle rererir
todos los hallazgos. seria importante dejar claro cuánta$ asociaciones se
han evaluado. Si no puede deternlinarse cuitntas comp:.traciones se rc.tli-
zaron. las C\~ociaciones no inrormadC\s previamentc deben ser considera-
d.\$ como meramente sugestivH~. \iale la pena recalcar. por otro 1.ldo.
que cualquier hallazgo nuevo deberia ser considerado siempre como suge-
rencia. incluso cuando sólo se ha realizado una comparación. H:.tllazgos
que se refieren (1 una a~ociación
inrormada. no deberian convertirse
o ausencia de C\soci.\ci()n previamente
en un:.\ confirmC\ción o refulaciól1 mils J
débil por el simple hecho de que ,'iniesen acompañados de mucha~ otr.ts
comparaciones no relacionadas. puest() qtle los hallazgos pre,'iamente
informados sobre e) tema se remonlariC\n .1 una hipótesi~ anterior.

]
FUNDAMENTOS DEL ,\NALI~IS DE DATOS EPIDEMI()LOG;COS '7'

REFERENCI¡\S

Br()\\.n. C. C. TJ¡c v:lliJily ()r :Irrrnxim:llc mctJ¡()(I~ r()r itlICrv:III:~lin,ali(,n ()f thc
odds rati(). .1",. J. 1:.',i(ÍI""i(li. Il)XI:II-~:474-4X().
Cochr~ln. W. G. TJ¡c clTccti\,cncss ()r:ldjllstmcnt hy ~lihcl:lssilic;¡li()n in rcm()\'ing
hi~l~ jn ()h~Cr\':lli()l1~tl sllioic~. IJi(}}lt('/ri(..\" I !)()R: :4::9-"-.\ 1.\.
Cornficld. J. ,\ ~tati~lic:l1 rr()hlcm :lri~ing fr()m rctrosrecli\.c sllloic~. (11 J. Ncy-
m~ln 'cd.) f'r(lc('(.(ii"I.'.\" .n,irt! IJ('rkc((..I. .S".I"'I',I(}.\.i"II,. V ()I. 4. Rcrkc¡cy: Uni\'cr-
~ity ()r C,I(irorni~1 Prc~s. 19-"6. rr. I ~5-14R.
Gart. J. J. Sl~lli~lic;¡1 :ln~l¡y~cs ()r Ihc rcl~ltivc risk. ¡::1//,i,.(I". 1{(.(lllh p('r.\",,('("I.
1979:3:?:157-167.
G:lrl. J. J.. and Tll()m;¡s. D. G. TJ¡c rerr()rm~lncc t)r IllrCC ;lrrr()xjmalc C()I1Ii-
dcncc Ijmil mcth()ds r()r thc ()dds r;¡li(). ..111/.J. E(,;th.II/i(,I. 1()R1:11-":J-")-470.
Grccnl~lnd. S. ¡\. C()llnICrCX;¡mplc I() thc Ic~t-h;¡~cd rrinciple nr sctlin!:! c()nfi-
dcncc Ijmits. .,II/. J. E"i(fI.II/i(ll. 19R4:1:!0:4-7.
JI~llperjn. M. Rc: ..E~lim~lhílily ;¡nd cslim~lti()11 il1 C:I~c-l:()nlr()1 ~tlloic~... I.cttcr I()
the Edilor. ..III,. .1. ¡::,,;(I(.lI/i(/l. J!)77: IO5:496-4l)X.
LanC;¡Slcr. H. O. Thc comhin~llion ()r proh~lbililics ;¡risil1!,! rr()m d:lt;¡ jn oi~crctc
dislriblltil")ns. fli(II/,('/'.ikf1 1949:-\6:370-3R2.
Lancastcr. H. O. Si!c!nific~lncc ICsIS in discretc lli~lrihllli()n~. .1. ..1,1,. .S"If1I. ..1.\".\"(/c.
1961 :56::?2}-2.14.
MacL;lllghlin. D. S. i\ d~lla \'aiidali()n pr()!c!ramnllclcll~. C(I,I"",I. Pr(ll,'. fli(I',,('(I.
19RO:II:43-47.
Mietlinen. O. S. E~limahi¡ily ;Ind c~ljm~lli('1n in l.~I~c-rCrcrcnl Sllldic~. ,.III/. .1.
Epi(I(,lI/i(/l. 1976¡l: 103:226-235.
Micttinen. 0. s. Slratiric~\li()n hy a mllllivari~\IC C()nr()llndcr score. ..ll1/. J.
E"i(I('/IIi(1l. 19i6b: 1()4:609-620.
Mjcltinen. 0. S.. and NlIrminen. M. Cl)mparali\,c ~ln~lly~i~ ()r t\\'() r;¡le~.
1 Slali.\'li(..\' 1\1('(1. 1985:4:213-226.
Rothman. K. J.. ~lnd Keller. A. Z. TJ¡e cITcct or j()int cxp()~lire I() alc()h()1 ,lnd
tobacco on risk or cancer or the mouth ~Ind pharynx. J. C"rm,. Di.\,.

J 1972:25:711- 716.
Yates. F. Contigcncy tablcs involving small nllmhcr~ ;¡nd thc chi-~qllarc tc~t. J.
R. Slmi.v/. Svc. Sllppl. 1934:1:217-235.
.
~

11.

El tipo mi1s simple de al1;ili~is cpiuemioli)gico. que es el basado en datos


brutos o (T"tlo... (es decir. 110 estratilicados), se aplica cuando no es neccs..1-
rio tener en cuenta ningún factor mi1s aparte de 1..\exposición y de la en.
fermedad que fuese de interés. ;\unque no es infrecuente ver dalos presen-
j tados únicamente en forma brula, lo lipico es que el investig..1dor necesile
primero explorar aniuisis más complicados cmpleando la eslratilicación
o métodos multivariados para e\'aluar el rape! ue otros f..\ctores. Un,l
vigorosa restricción mediante covariables en la selección de sujetos (de
forma que se prevenga la confusión). Ile\'a frecuentemente a un ani11isis
simple o crudo. Los ensayos clínicos que emplean la asignación ale:1tori..1
de los sujetos pueden también ser muchas veces s..\tisfacloriamenle anali.
zados en forma bruta. si los invesligadorcs esli1n convencidos de que 1..1
randomización ha prevenido satisfactori.1menle el citado efecto de con-
fusión. El análisis bruto. por su sencillez. ticne un atraclivo dcl que
carecen los análisis mi\s complic:ldos.

COMPROBACION DE I11POTESIS CON DATOS BRUTOS

El epidemiólogo. al col1ceptllalizar lipos de dalos epidemiológicos liende


a separar los datos de seguimiento respecto de los datos de caso-conlrol.
Para la comprobación de una hipótesis estadística. no obstante. el mode-
laje estadístico lleva a una diferente clase de separación. se-gún qlle los
datos sean unidades persona-liempo o persol1as. como obserVtlCiol1es
básicas. En tanto las unidades de observación se miden en términos de
persona-tiempo llnicamente en los estlldios de seguimiento. no todos los
estudios de seguimiento se presentan con su~ datos expres¡ldos en form¡\
de tasas de incidenci¡l con denominadores en términos de per~ona-
tiempo. Si todos los sujetos son seguidos durante un periodo constante.
podría ser conveniente expresar las tasas de incidencia como estimados
del riesgo. esto es. como datos de incidencia acumulada en los que el
número de casos est{l relacionado no con una cantidad de experiencia
173
.J
----_.__.. ... _-- - -EPIOEMIOLOGIA
- MODFRNA

persona-tiempo. sinn con el número total ele personas qllc flleron se~\Ii­
das. Los ensayos c1inicos se presentan él menudo de esta manera. Cuan-
do los denominadores de medidas de incidencia son presentadns cnm()
contabilizaciones de personas. en vez de como medidas de expericncitl
persona-tiempo. el modelo estadístico que se aplica para I;l comproha-
ción de la hipótesis es el mismo que se aplica a los datos de casos y
controles. en los que todas las observaciones tamhién son recuentos de
personas.

COl17prnhaciól1 dc hiprJ1 e.'ii.\· con dmo'\" ('11 la forlllo 1'('1".w1I1a-liclII/W

Los datos de tasas brutas dc incidencia consisten en el númen) total lit:


casos y de unidades persona-tiempo. tanto parél la categoría expuestos
como para la no-expuestos. Utilizaremos la forma de presentación de \;1
tabla 11.1. La aparente sencillez de esta tabla puede enmascarar sutile7.as
analíticas que deben ser tenidas en cuenta. Específicamente. la experien-
cia persona-tiempo de la columna de los «expuestos» deberia dclinirsc
de acuerdo con un modelo plausible, tentatívo. en relación con elliempo
de inducción. Antes de que un individun se convierta en expuesto. lod"
su experiencia persona-tiempo es. naturalmente. persoml-lie.mpo no-ex-
puesto (aunque este hecho no se incluye muchas veces como tal en el
análisis). Si la exposición ocurre en un punto en el tiempo y el model('l de
período de inducción que se está evaluandn exige que transcurra un
plm~o mínimo de inducción de cinco años. entonces los cinco años
posteriores al punto de exposición para cada individuo snn igualmente
experiencia persona-tiempo no expuesta. en vez de expuesta porque. de
acuerdo con el modelo de tiempo de inducción. se remonta a un período
de tiempo anterior en que la exposición se hallaba ausente. Encuadrar
las unidades persona-tiempo dentro de la categoría de exposición apro-
piada es una tarea que hay que hacer sujeto él. sujeto y puede necesitar
reglas complicadas si la exposición es crónica. Los casos incidentes se
encuadran en la misma calegorín él. la que se estún añadiendo las uni-
dades persona-tiempo concurrentes -por ejemplo. un caso incidente
cuatro años después de la exposición sería encuadrado en la categoría
«no-expuesto», si el modelo de tiempo de inducción especificaba un
tiempo mínimo de inducción de cinco años. El modelo estadistico
empleado para la comprobación de hipótesis de los datos persona-

Tabla 11.1. Forma elC' I're.'ien1l1ciim elC' /o.'i e/film e/C' ltI.'illS hru1l1s dC' i"cide'IIcia_
eOll d('IIominadorC's per.wna-I ;emllO

Expuestos No expuestos Total


Casos (1 h
Persona-tiempo NI A',·
ANALISIS DE DATOS CRUDOS '75
tiempo es la distribución binominal
~---c (Shore (" lIl.. 197(1}. Un acontcci-

miento aleatorio que tiene solamente dos rcsultados posibles .,. e }'. que
ocurren con probabilidades lijas. se conoce como ensayo de Bernoulli.
Lanzar una moneda al aire es un ejemplo. Supongamos que la proh:lhili-
dad de uno de los dos resultados. digamos .,'. sea f1. La distrihución
probabilística del número total de .'(f que pucden ncurrir en N ensayos
de Bernoulli indcpendicntes con una p constantc se cnnoce como distri-
bución binominal. Matem:íticamente. la prohahiJidad se expresa como

P'inúmero total de .'(.\' = .\") = -1')1,"-.~'

N!
Jondc
(~~) es
.\!(N 1!

La media de la distribución binominal es ¡Vl' y la varianza es ,V1'(1 -p).


Al aplicar el modclo hinominal a los datos brutos persona-tiemp().
cada caso se considera como un ensayo de Bernoulli independiente. que
tiene como «resultado» las dos posibilidades de ser expuesto o 110-
expuesto. De acuerdo con la hipótesis nula de que la exposición no tiene
relación con la enfermedad. la probabilidad de que un caso dado sea
clasificado como expuesto o no-expuesto depende solamente de la pro-
porción respecto deI total de la experiencia persona-tiempo total que sea
asignada a la categoría expuestos; esto es. cada caso tiene. bajo la
hipótesis nula, una probabilidad igual a N l/T de ser clasificado como

1 expuesto.
Los IW t casos son. pues. considerados como ;\11 ensayos de Bernoulli
independientes y la distribución de los casos expuestos sigue una distri-
bución binominal bajo la hipótesis nula, con p = N l/T. La probabilidad
de los datos observados bajo la hipótesis nula puede escribirse como:

.i
Pr(nunlero de casos expuestos = (1) =
(\1
al
)( /V
i
~r ) ( IV( ) "
a ~r
-:I

Un valor exacto de p para el Fisher con una cola pucde obtenerse LI$i

.\, ,

I Pr(número de casos cxpucstos = k)


k=1I

El sumatorio anterior suministra la cola superior dc la distrihtlci()n: la


cola inferior puede obtenerse sumando k sohre un rango entre O y II.
Para obtener el valor de la media ?, en lulZar del \.alor de ? del Fisher
tradicional, únicamente dcberia añadirse al-sumatorio para cada cola 1.1
mitad de la probabilidad de los datos observados. Cuando se calculan
los valores de la media ?, las colas superior e inferior de la distribución
tienen la deseable propiedad de que suman la unidad.
'76 EPIDEMIOLOGI/.
MODERNA

Con nllmeros grandes no son neccsarios estos cillclllo~ cxactos. ror-


que cualquier prueba estadistica asintótica d¡lril arroximaciollcs (t.iUSli.J- I
das del valor de P. La prueba estudistica se computa con la fórmul(1
[11.1]. empleando el número dc casos expllesto-, como ,'ariablc alcat()-
ria. Basándose en las fórmulas de la media \" la ,'arianza dc] númcr() de
éxitos en una distribución binominal. la cxp~ctati,.a nula para el nllm~r()
de casos expuestos es !\iIM./Ty la ,'arianz~t es ¡\.¡J!\'I.r\.I"T:.. )o que d~j

{I -1\.1 /'If..T
% = ~--
---

IJ

IMI!\.I!\.CI
1
I
\! T~
L(')s \,al(')rcs de l pllCrlCIl tr(lIlSr('1rm:lrse cn \.;limes dc r) :! parlir <II.: I;I~
tahl(ls dc l(l distrihllción normal esláJIJ~lr.
P(lra ej e.jempl('1 11.1. l(l prob(lbilidad OC I()s d;llns nhscr\.ados I)a.i<) 1;1 1
hipótesis nula puede calcularse así:

Pr(41 casos expuestos) = = o.() 122


1
Un valor exacto de p para la cola superior del Fishcr puede obtcllcrsc
repitiendo los cálculos para los resultados positivos mil!' extremos. ha~ta
los 56 ca~os expue~tos. Para 42 ca~{)~ exr\IC~los. los c{llculos dan:

1
Pr(42 casos expueslos) = = O.O()ó4

De forma similar. Pr(43 casos expueslos) = 0.00J 1. Pr(44 casos cxpucs-


tos) = 0.0013 y Pr(45 casos expueslos) = 0.0005. La pequeña magnitud
de esta última probabilidad indica que no dcberia ser necesario calcular
los restantes términos del sumatorio. y3 que ~u contribución seria más
pequeña al In y no afectarian por ello materialmente a la suma. El valor
de p con una cola equivale. pues. a 0.0111 + 0.0064 + 0.003] + 0.0013 +
+ 0.0005 = 0.024. El valor medio de P con cada col,! lendria 1í2(0.0 121) J
~
~

Ejcmpl(} 11.1. C (l.\,(J.~ d(' ('{i1lc{'r d(' m(lm(l .1. f1(.rXml(I-(IIi(J.\ d(' (}hx(.rr{1('i(i,l f1{1r{1
1111~iere,\' C011 11Ihl'rcliI0.fi.\', l'."f1li(,.\'I{1.\, r{'f1('lid(lm('111(' {I m1iltif1I('.\' f1,I(lr(I.~('(If1i(lX d(.
rn.l.o.\, X.l" ml!i('rl',\' (,011 11Ih('r("lil(J,fi.\' 11(1 a\,í (,.\"pli("\"la\ (B(Ji("(' .1' M(m,\'(m. 19ii)

Exposición a la radiaciúl1
(

Si No Total

Cáncer de mama
]
41 I5 56
Persona-año5 28.010 19.017 47.027

~
ANALISISDEDATOSCRUDOS 177
~-- -
como primer sumando. dando un valor dc f' dc ().017 (cl \'alor real es
0.0174 y podria redondearse hasta 0.0018. si la suma se c()ntinuase en
algunos sumatldos milsl. Los valores de f' con dos colas pueden ()btencr-
se-simplemente doblando los correspondicntes \'alares dc ¡> COI1 una.
Los números del ejemplo son sulicientcmcnte grandes c()mo rara
emplear la aproximación normal en la rl>rmula [11.11. lo que es un
cálculo milS sencillo:

4
41 33.35 7.65
x -!
-, = 'V!I~
--
- = 2.08

I (5 ~. 010)(i 9.017)
3.67
~ (47.027)2

En las tablas dc la distribución normal csti\ndar. un v(¡lor tIc X de 2.0R


corresponde a un valor de p con una cola de 0.019. que concuerd(\ muy
bien con el v(llor eX(lcto de 1:.\ media p con una col:.\.

Cml¡prvha('i(;,¡ ti(, hi/'tí/('.'ii,\" ('(11/ tia I (1,\"(1(, r('t"'('/¡I(1

Los dalos de $eguimiento o de prevalencia que tuvie$en denominadore$


con$istenles en el número de personas en riesgo. rueden tratarse como
dalos de caso-control a erectos de comprobación de la hipótcsis estadísti-
ca. Para cada uno de eslos tipos de dalos. la inrormaciún b¡tsica puede
desplegarse en rorma dc una tabla de 2 x 1 en la que las cuatro ccld.ts
son rrecuenci.ts de sujetos ci.tsific.1dos de .\cuerdo con 1.\ presenci.1 O
ausencia de exposición y enrermed.1d. La rorro.\ de present.\cii)n que
utilizaremos se da en la tabla I 1.2.
Superficialmente. la tabla 11.2 se parece a la 11.1. excepto por la
adición de una fila mi1s para los no casos. Los denominadores de la
tabla 11.2, sin embargo. son rrecuencias o recuentos de sujetos, en vez de
acumulaciones de persona-tiempo.
De nuevo. la aparente sencillez de la tabl.t puede enmasc.1rar .tlgun.ts
sutilezas a la hora de determinar la clasificación de los sujetos.
Para datos de casos y controles, la clasificación según exposición
depende de una definición apropiada y con sentido de la t.tl exposición.
de acuerdo .1 un modelo biológico de periodo de inducción que especifi-
que la evolución temporal de 1.1 exposición de que $e tr.1te. en rel.1ción

Tabla 1.2. Pr<',\,('1II(1("i(i1l 1'(//"(1 1111(1/(1hl(1 hrll/(1 (1(' 2 x 2


178 tf'IDEMIOLOGI" MODERNA

u la enfermedad. En un e~tudi() ~()hre cilncer de la c(1vidad ()ral. r()r


ejemplo. lo~ paciente~ con cáncer pueden tender a emplear lo~ lavad()s
regulare~ de boca con má~ frecuenci:.1 que los controles. pero tal US()
puede ocurrir como consecuencia de síntomas precoces de la enferme-
dad, o de su tratamiento suhsiguiente (la radioterapia en la región de la
orofaringe tiende a atrofiar las glándulas salivare~ ~' producir ma] aiien-
to). Un modelo de período de inducción que tu\'ie~e "entido deheria
clasificar como no-expue~to-" únicamente a aquello~ indi\,iduo~ que flle-
ron expuestos al a!!ente fuera del i:lpso de tiempo durante e1 cllaJ la
exposición podría haber estado etiológicamente relaci()nada con la cn-
fermedad.
Para dato$ de seguimiento analizado$ con una tabla dc 2 x :. pre~lI-
miblcmente todo$ los sujctos sc encontraban libres de la enfermcd:.ld al
comienzo del período de seguimíenlo: 1~1cla~ific~\ción de exr()~ición ~c
refiere al momento de iniciación del seguimicnl() y 1:1de enfcrmedad. :.11
morncnlo de completarlo. La ocurrcnci:1 dc la enfcrmcdad no dchcria
contar como tal, pues, a no ser que ()curriese durante el lapso de ticmro
especificado por un modelo de period() de inducción. Todo proccso
patológico de interés que ocurriese ante~ o de~pué~ del lapso de induc-
ción ((hipotetizado» deberi~1 ~er ignorado: ~i la ocurrencia aparccc ante~
del lapso de tiempo. seria razonable excluir al ~u.icto por no haber est(ldo
libre de enfermedad cuando empezó el período relevante de seguimiento. J
Si el periodo de seguimiento h(1 sido tan I(\rgo como par(1 quc una
proporción sustancial dc sujetos hubieran mlJerto por cau~a~ no rclaci()-
nadas con el resultado que no~ intere~a. e~ prereríhle emplcar denomin~l-
dores persona-tiempo. en vez dc analiz:\r lo~ dato~ con ~Ina t~\hla dc 2
x 2.
La tabla de 2 x 2 puede considcr(\rse como I~I repre~entación dc do~
series de observaciones independientes: para 105 estudio~ de C(\so-con-
trol. la~ observacione.c; son obser\'aciones de exposición ~' las do~ serie.c;
independientes
de ~eguimiento,
de sujetos Son los C(lSOSy los controles: par~\ lo~ estudio~
las observacione~ )o son de enrcrmedad y I(\~ do~ ~erie~
J
independicnte~ puede considcrarse quc se (Iju~tan al modelo de una
di~tribución binomial: ba.io la hipótesi~ nula, la probabilidad de una
oh~ervación ((positiva» en cad(\ un(\ de la.c; series binomi(lles. indcpcn-
díentemcnte ob~ervadas. es la mi~rna.
Con~ideremos un estudio de seguimicnlo dc "'I Sll.icln.c; cxr\le~tos y
"1(1 no-expueslos. En la serie expuesto$..l/ su.ielos dcsarrollan la enrerrnc-
dad y en la serie no-expue~to~. lo hacen h su.ictos. La prob~lbilidad dc
que ex(\ctamente o y h ~ujclos desarrollen la enrermed(\d entre lo~ ex-
pue~to~ y lo~ no-expue~to~, respectivamente. es, de acuerdo con el rnodc-
lo binominl:

Pr(a ca~os expuestos y h ca~os no-expue~to~) =


]
.~]
J

:J
\
::.:-~;~

,C1rrf¡1¡
;:' ...:

ANALISIS OE OATOS CRUDOS 179 ~

que es el produclo dc las probabilidade~ hinomiules para c~lda uno de


los dos grupos indepcndienles. expueslos y no-expucsIOS. L~1 pr()b¡¡bili-
dad de desarroll~lr la enfermedad entre los ~xpueslos es 1'1; entre los n()-
expuestos.l'o. Bajo la hipólesis nula. estas dos prOb~lbilid~ldes son igua-
les: p I = 1'0 = p. lo cual da

-~.
il Pr(a casos expuestos y h casos no-expuestos) =
':;--c-

N t
)( ' No

1)1 = (p)"/I(1 -p)'\(" :.}~~~~.


!ij a h
[ 11.3]
..c

--.
Para calcular el valor de la expresión [11.3] para una tabla particular de
~'~.~:~
. ü 2 x 2. es necesario disponer de un estimado de !'. Por lo general. I' se
estima directamente ;1 partir de los datOs. I.'mple;1ndo la proporcii>n lotal
~:.~..:~(~..

:;c~
de enfermedad a partir de los márgenes de la lahla. M I¡T. Sustituyendo
g p por ¡'vfl/T da

Pr(a C:lSOS expuestos y h caso~ no-expuesto~) =

I =
I N 1
)( ¡Vn'

, (I h J
(¡\.f,iT}'\t,(,\f,,/T)¡\tn [11.4]

De la expresión [ 11.4] es posible obtener un valor de p que represente


~

,~;
;.:'
una prueba exacta basada en dos distribuciones binomiales independien-
tes, siempre que quede claro cómo se calculan las desviaciones respecto
I del estado nulo que son más extremas que las observadas. Asumamos
que se observa una asociación positiva entre exposición y enfermedad.
Asumamos también que a y h son el número de casos expuestos y no-
expuestos realmente observados. Para otras posibles realizaciones de los
datos, en que el número de casos expuestos excediese a a. mientras el de
no-expuestos fuese h o menos. la desviación total respecto de la condición
~ nula es más extrema que la que se observa realmente. De modo similar .
si el número de casos expuestos es a. pero el número de casos no-
c~~~
expuestos es menor que h. de nuevo la de.~viación respecto al nulo sería :,~'¡t~:
I más extrema que la realmente observada. Las posibilidades precedentes
son fáciles de clasificar. pero. ¿.qué pasaria si el nllmero de casos expues-
tos fuera a + I y el número de casos no-expuestos. h + l ? i.Qué pasaría
con otras combinaciones como a + l y h + 2? Es dificil decir si estas
B posibilidades representan situaciones que se apartan del nulo en mayor ~:]j1it
medida que las observaciones reales. Para decidir definitivamente si una ¿
desviación es más extrema, seria preciso evaluar una medida del erecto
~ para cada resultado hipotético de los datos y compararla con la medida
del efecto calculada a partir de las observaciones reales. Es interesante
recalcar que la decisión acerca de qué resultados ,c¡onmás extremos de-
~ penderá de la medida del erecto que se emplee.
.Para ilustrar lo que decimos. consideremos el ejemplo 11.2. Los
datos «observados» indican una diferencia de riesgo estimada de 0.05.
D

:!il;:;;:¡::
i:¡~;¡.~~:)¡;::~~~;:~:
:..:::.~:;.:;; .;:::'~:;.¡;:::
::.~~::.;.~;::':~,

~
\:¡:;~::
.:.;;:\;.~~\~
::::::,:?:s;
:;1 ."
"-,"'
EPIDEMIOLOGIA MODERNA
180
1 I § I I
I i ~ 10--
1 ,...
...I S: v. .". c
~
~
;

r-.¡ : ~
c
.C Z
c
I
I
!
I .oc~

1
c'- rl
-! u I
~ ; .~ , 0
I::
~>1::.'
-I
~
-I

; ("; ,
i

~
"'
rJ
-I
I t- ---
---

]
...I --r-1
t.: I c..
..., I i u.;
., ,
~ I
.~ !
~ i I "'
.-.I - I -c
I
,
~
~ I -r;
"'"' I: ' c..
-\C' 1- ,.'.' :=:-
~ ~ i I >-: -
1- I ~
~ .E
t:..~ c o
::: .:: , .c I z .,. v, -.o
.I:: -I .-
c c '..1
.--c: u
.~ ... I I 0
.~
-c ..
~~ I c: I ~
~ > o ~
1 -."' I
-~ I
~ c I i ~
~ I \C -::- ~,
j
--I c.
~-!::. o< 1
..~ I,., ,
~"' --,
::: : :
:-~
--I
... I .I
1
~ ~ I .9 I
~~
...~
I ~
~ I
I:::: I ~ ~ V")V")c
~~
~
:: t:.. I I t,)
- C:ic.IVV)C>-: I
...::
-~
~~ I
c:
>
~
I z
o I
I

~
f
.
Ir, -'..1
C-,.., ! ...;.;
.-=
~
\,.¡ ... 1
.o
~
c
I 0
:
"
I
"
v: '.
..
.-o
.~ -
c
-c:
...1'"'1 I v:
r,) 000
='
c..
I --r-1
I ,
.~ I
~ I I X ¡
"' I u.; ¡
C I t
¡
~
Q
o
~ C(¡
- "' ~
- GJ .-,..
.-o ~
1- Q/) --
Q
"' c:
Q.
GJ ~GJGJGJ
.~ ;..
E
GJ ~~GJGJ
.~
~
I I/)
cu~ "'-
c
"'-
C': vcC':
"' c: .Ü ~ ~
.o
.-tJ
u c:
1- .0 .0
C'; GJ N ¡o,;
E~C';~
.=0~~
~ c "'
uZ UJ
~
~':
II'.
i~
~
~: ~~,~:;k~1~; =-
.:'~,.." ~
'c
'.'.'.~~
,':.."/'""",
..
~
;r:o~~~;"E~J;R~,~
.: --.,0,- .::.,~--:
t\\;\rf:ti;i:
;,:;;
~- -~,.J~;;-:;;;
:,..:;\;:::;:~'~
..:;; "

ANALIsls DEDATOSCRUDOS 181


... ~)

una razón tic ric~l!o dc 1.l1 \' una ra7:ón Je \"cnl:lja dc I..:..:.. Las \"ari:lC.:i()-
nes l v 2 son ()tr(~~ dos posible~ resultados de los'd~ltos. prc~umicndo 1.1ue
se están e~tudiClndo el mismo númcro de su-jeto~ cxplle~tos ~' !1()-I.:XpUCS-
tos. Emplcando I:l metlida «difercncia dc ril.:sgo» p.1r.1 dctermin~lr !.lS
desviaciol1cs rcspcc!O dcl Ilulo. la v.lriaci()n 2. pcro no a~í la 1. si es una
desvi~lción m:i$ c.xtrcma rc~pccto al nulo. El11plc:lndo 1.1 mc<.1id:t «ra7()11
de riesgo». l1i la vari:tción I ni 1.1 2 i() SOI1. P~lra la medida «ralÓI1 dc
D l ventaj.1». lo son ambCl~.
C.1d.1 UI1.1 de l~lS difcrentes medidas Jcsignan ~1UI1 conjunto tlistil1to
B
; . de resultados como mils extremos. Esta ;Imhigücdad hacc problcl11.itico
L.
r
el empleo de dos distribuciones hinomiales indcrendientcs como mo<.1clo
para la comprobaci()11 dc hip()lcsis a r~lrtir tic una tah!.1 tic .:. x ~. Otro
:~Rd [ problema que ticne cl uso de 1.1Sdos bil1omiaJes cs cl gran nlJl11cro de
,1 rcsultados posiblcs. Por cjcmplo. si iV I = ;VII = .:.5. hay 676 resultados
,
,"

posibles para los 1.1:1!0$ [(N, + I) .( Nll + I )]. Para simplificar los
cálculos. pue<.1e hacer~e un.1 asunción rel:lcionad:t con :Imho~ prohlema~.
~~';
c', I La a~unción para lo~ d~ltos dc set!uimiento () de rrevalencj:1 consislc en
que el l1úmero total de ca~os re~llmel1tc ohser\'adoS sc 10m:1 como c()ns-
tante (M.lntel y 11ankc~'. 1971). P~lra d:I!()s dc C:1so-contr()l. las dos
I distribuciol1es hinomi.llc~ se rcficrcn no:1 I.IS series dc expuestos ~. 110-
ex puestos. si 110 ~I 1.1Sseries I.lc caso~ ~' con I rolcs ~' 1.1 corre~pond icn tc
asunción C.:s1.1UCc.:1¡tirmcro !()I,II Jc SU,iel()S CXP\ICStOS I:S consl:lnlc. L()
que esenciall11cntc hacclt cst:t~ :Isunciones ~~ /ij.lr !0<.1()S!()S tot.\It:s m.lrgi-
n:1les de la t.1bla Je 2 x .:.; por lo t~lnIO. si la ccld.1 (I aument.1. la~ ccl<.1:1s
h y c deben c:1d.1 una disminuir en un.t canti<.1:It1 cquivalentc. y la ccl<.1a (I
aumentar en un.1 cantidad il!\lal. Una VCl m:1nteni<ios C()n~t.1ntc~ tOdoS
I los márgenes. sólo hay una v-:1riable ~1Ie:1!Oria a de~cribir: la \'ari.lcil)n en
cualquier celda de la I.lbla de 2 x 2 con m:irgenes !otales fij.ldos e$l:í.
pues. concatenada con la vari.1ción concomital1te de cad.1 una de 1~ls
D otras casillas. H.1hitualmente. por tan!o. la cuestión ccntrCli \'icl1e :1 ser
simplemente la casilla a de la tabla. que e~ 1.1quc se tom:1 como \'.lri:1ble
aleatoria.
D La asunción de que todo~ lo~ (otalc~ m:lrgin:1lL's dc una lahla de 2
x 2 estén fijados. puede ju$tificarse
para enfocar el problema (de la comprobación
metodológic.1mente como me<iiacit)n
dc hipótcsi~) direct.1mente
r~r
sobre la asociación existente entre expo~ición ~' enfermedad. En jerga
H I

estadística. el «parámetro de perturbación» se elimina fijando lo~ !otales


marginales: comprobar la hipótesis nul.1 emple:1ndo un modelo Je dos

fi binomiales
parámetros.
independiente$
1.1$proporciones
requiere que se delerminen los valores de (1().\"
PI y po. en t.1nto quc el problema analítico il
puede reducirse a determinar el \'alor de UI1.1 medida única. Tal mcdid:1
es la r.1Zón dc vent:lj:1. igual a PI ( 1 -1')/[!'11( I -PI )]. quc e~t:i por
~ completo detcrminada por el valor de la celd.\ a si los to!.lles marginale~
se toman como fijo~. Comprobar que se prnduce un alejamiento de 1.1
razón de ventaja re,<;pecto de la unidad es equi\'alcnte a comprohar un
alejamiento de 1'1 con respecto :1 1'0. ya que la condición nula de PI = 1'11
~
es equivalente a una razón de ventaj.l de un.1 unidad. pero fijar los

n
~.I
u

'::~:~

:"'.~

;;t]~i~J:
ti~i~~-~
,,'~
.~1::
.~.i~i~~~:¡::;~;i~;::f;
;;J~1:;:;~:f..;~:;;:,.::;:;;;;:(.
i!!;,~¡~;
j~\t~;~\~~~~:rl:
I~t

ANALISIS DE DATOS CRUDOS 183

.~
1 La probabilidad de seis casos expuestos seria 0.0028: para siete C~\SOS
expuestos. 0,0002 y para el resultado más extremo. ocho casos expuestos.
0.000009. El valor total de p con una cola, calculado segiln el metodo de
Fisher. sería de 0.0748 + 0,0185 + 0.0028 + 0.0002 + 0.000009 = 0.096.
El valor medio de p con una cola sería 0,0374 + 0.0185 + 0,002R +
0,0002 + 0.000009 = 0.059. El valor medío de p con dos col:ls. t:lnto del
Físher como de la media P, podría obtenerse dobl~lndo el valor de la p
D de una cola.
Para este ejemplo, el modelo hípergeometrico requiere el cálculo de
sólo cínco probabilídades. De haber empleado el modelo de las dos
r~\ dístribuciones binomiales independíentes. con 390 casos y 1.254 contro-
les como las dos seríes independientes. huhiesen sido necesarios por el
contrarío miles de cálculos para dcterminar qué resultados eran iguales .-:-:.
:!;,
¡.'
t1 de extremos o más. y luego habria que h~lber c~llculad('1 tambien la
¡,.
.. probabilidad de cad~l uno de estos resultados. La simplífic~ldor~l ~lsun-
ción de la distribución hipergeometrica. que fija todos los totales margi-
;~';
~
-:-,
I nales. reduce enormemente
Lo razonable
la complcjidad
de I~l asunción
de los cálculos.
hipergeometrica. incluso para datos
"'~:~.
tales como los del ejemplo 11.3 en que las frecuencias de las cuatro
celdas son pequeñas. se hace evidentc al comproh;¡r sus rcsultados con
I
~~

los obtcnidos empieand('1 el modeio dos-hinomiaJ. Empleando éste y


usando la magnitud de la razón de ventaj~l p~lra determinar qué result~l-
dos son des\'iaciones iguales o m(ls extremas respecto al valor nulo. se
encontró que el valor de ? para el Fisher era de 0.094 y cl valor de la
media ?, 0.071. (Estos cálculos requieren varias horas de uso de un ~-
~:
programa BASIC en una microcomputad('1ra.) L~l concordancia cntre los ¡:
I dos abordajes
hipergeométrico
es sorprendente cuando uno considera que en el c,llculo
sólo se han íncluido cinco probahilidades separadas.
;:
~
i!
!i

~. mientras que en el modclo binomi:ll se incluyen miles. Con frecuencias


~;I'
I más grandes en las celdas, mejora la coincidencia
ambos diferentes modelos. Sean cuales fueran las discrepancias
entre los resultad('1s de
entre los
resultados de los dos abordajes. no indican nínguna inexactitud p('1r
:':~:Wj
parte del modclo hipergeometrico: puesto que la asunción de los totales
D marginales fijados suministra una prueba v:llida, aunque los m,irgenes
no estuviesen realmente fijados por el diseño del estudio. un test de la
hipótesis nula basado en el modelo hipergeometrico es tan válido como ~0;~\j¡¡:,¡.J~
,..::.~ ,~
,
~ otro basado en el modelo dos-binomial. Como el ~lbordaje hiper-
geométrico es extraordinariamente
modelo de elección. más sencill('1. c('1nstituve
. claramente el
,¡);}f~~1;~.,

~ Desgraciadamente, incluso el modelo hipcrgeométrico puede reque-


rir un número oneroso de cálculos sí todas las frecuencias de las celdas
son de cierto tamaño. Por ello, en la mayoría de las ocasiones se usa una
prueba estadistica asintótíca para calcular el valor de ? La prueba
~
estadistica asintótica puede. derivarse partiendo tanto del modelo dos-
binomial como del modelo hípergeometrico. Con este último, la variable
aleatoria sería la celda a. número de casos expuestos. La expectativa
~ nula para el número de casos expuestos es N I ¡\1./T y la varianza hiper-

:::;:,;;:r~;~:i~;:~~ -~=:~.~;.:
..:~~:..;.,1;:,., ;.;~;, :":"
""i:';:t.::: ;;~:¡¡~;¡:;:;:
:¡~¡¡: :;,.¡,;
..::~~:.:::~:;
~~~J:. !;
~ .;,;:~:;:':;*,,:
:~(::~~;:;:.~ :~~:,i:~:;

~
[ 11.6]

quc p,lrccc similar a la ecuación [I 1.1] para datos persona-tiempo. Si se


()htu\'icsc una prueba estadistica asintótica del modelo dos-binomial en
1\I!:!ar tIc ohtcncrla a partir dcl hipergcomctrico, se podrían comparar las
tI()-; pr()rorcioncs binomiales observadas, al N I y hl N o. Bajo la hipótesis
n\lla. la cxpcctativa de la difcrcncia cl1tre estas dos proporciones es cero.
La v¡lrianza podria estimarse de diversas maneras; la usual consiste en
Iltili,ar una varianza común conjunta para las dos proporciones bino-
mialcs ya que, bajo la hipótesis nula, las probabilidades binomiales para
Co;¡IStlos distribuciones son iguales. Así, M I IT se toma como un estima-
tI() tIc 1¡1prohahilidatl binomial conjunta y la varianza de la diferencia en
pr()p()rci()ncs pucdc expresarsc como

~!-!..)( ~ ) r -1- + ~
, T T LN1 No

1(, lllll.: ll:

z = 7]

f]
1.¡1 Ill¡llliplll¡tcii)11 algcbrai(.;a ue la ecuacii)11 .7] da una expresión casi
i(ll'lllic;I¡11;1 lIJ.6J:

a -N.Af.IT
.~]

J~~~

L" lllliL." dirL'rcncja elllrc ItiS dos r()rmul"s cs Iti T- 1 dc la cxprcsión del
JCII1111Iill;IJ()r dc la ccut,ciól1 [11.()1. C.¡'ICsc rcL'mrlazt\ por Tel1 la [11.8].
(.I)m() 11il1~una dc It\s dos r¿)rmlllas cs .'rlict'ble a mel1os quc T sea
..Jl"'Jc cl rulllo .dc visla rr;í<.:liL.() aml)as son jdcl1licas.
hllhicsc l'lllrlL';'dl) lilla rrllL'I);1 csl;,(lísliL.a asjlll(!lica para calcu-
ANALISIS DE DATOS CRUDOS 185
-~-
lar el valor de p con los datos del ejemplo 11.3, habríamo~ obtenido,
'empleando la ecuación [11.6],

..
lo que da un valor de P, con una cola, de 0,040. Como cabría esperar, el
vaJor de p resultante de la prueba asintótica es más cercano al valor
exacto de la media p que al valor exacto del Fisher (véase Cap. 10),.pero
la aproximación no es muy buena. Obsérvese que bajo el modelo hiper-
geométrico sólo hay nueve resultados posibles para la celda a; evidente-
mente, el número de resultados es demasiado pequeño para que la
aproximación sea válida. Una regla de andar por casa y que se emplea a
menudo consiste en que la prueba estadistica asintótica debe aplicarse
solamente cuando la expectativa nula más pequeña para cualquier celda
de la tabla de 2 x 2, basada en los totales marginales, sea mayor que 3.
No obstante, si hay alguna duda sobre lo adecuado de esta aproxima-
ción asintótica, lo mejor es evaluar exactamente el valor de P.

ESTIMACION DE EFECTOS CON DA TOS BR UTOS

Estimación COlI dato.t de .tegllÍllli('nto

ESTIMACION PUNTUAL

La estimación puntual de las medidas del crecto, exprcsadas ya sea el1


forma de direrencia o de razón, implica hallar la dirercllci:1 o la razón
de los valores observados de incidencia o de riesgo. Así. In cstimnción
puntual de la direrencia de tasas de incidencia (IRD) seria:

{1 ¡,
IRD = '::\1-;- -~

y el estimado puntual de la razón de tasas de incidencia

IRR = a/NJ

De modo similar, para dalos de riesgo (incidencia acumulada), en los


cuales los denominadores son recuenlos en l':Jgar de medidas persona-
tiempo, el estimado. puntual de la difcrencia de riesgo seria:

a h-
I

RD=N:"-¡-::
RR=~

h/No

Si cl objeto de inferencia es la razón de tasas de incidencia, en vez de


la razón de riesgo. entonces la razón de riesgo que se puede calcular
directamente a partir de los datos de riesgo, empleando la fórmula
3nterior. conduce a una subestimación del efecto. El grado de subestima-
ción depende del nivel de los riesgos, siendo ligero para riesgos pequeños
y mayor para riesgos grandes (véase Cap. 4 y Tabla 6.1). Un abordaje
álltcrl1(ltivo para la estimación puntual con denominadores que son re-
ClICI1tO.l; consiste en utilizar la fórmula de la razón de ventaja

lflll' ...()hrccslima cJ erCClo más o mcl1os CI1 Ja n1jsm;t exlcnsjón en quc la


ri17i)11 dc rics~o lo suhcsljn1a (TabJa 6.J ). pcro tjCJ1C Ja VeJ1taja dc ser el
J11isI1J() csljlJ1ad()r cl11pJcado CI1 c.<;ludio.<; dc caso-col1lroJ (rórmuJa [6.J]).

Sll~I,\(.I()N DI INTI:RVAI.O

I;.\fill",( i,i,l ,1c.11,lf(.n.(II" 1:.-.\(I("I(1C()II Dlil().~ d(. !>.('1!;'(imi('111(). La csljma.


L'i(111Jl' lIll il1ll'r\.alo rucdc scr cx~cla o arroxjmada. Para la exacla,
l'(}IJJ(1 r"r;¡ ("I(ul,lr un \.alor cx;lclo dc r. dl'hc cmrlcarse un m()dl'lo
csl"di,lico arr()rjado quc dcscrjha la dj.c;lrjhlll:i()n dc rrob,lbjlidad de los
d,II(},. 1:1 IIJ(ldcl(}. gcIJcr,lll1Jcnlc, scríi llIJ,1 C:\ICIlSi(}IJ Jcl lIljljz,IJO r,lra
l.íll¡.III.lr lIlJ \.,llor exaclo de r. l)ar,1 1,1 comprOb,lL'ii,1l dl' la hjrúlcsis
11111.!. 'I.. ¡ISII'JJl' lI'l crcl:lo ccr() y .c;cIc iIlC()rr(}r:1 cn Cl11Jodclo csl:ldjstjco;
r;lr;1 (;lll.lii;lr limilc5 dc confianl:l cxaclos, cl modclu csladjsliL'u dcbc scr
L'ílr"7 <lc :I((\m(ld:lr ercctos no-cero.

I)., I()S 1)1' TASAS DI: IN('IDEN('IA (PERSO~A-l1EMI'(»). Para la difc-


rcIJt:i¡\ Jl' tas:ls dc incidcncia, sc prcscnta una difil"ultad al intentar
postlllar Ul1 modclo estadístico a partir del cual pucda calcularse un
intcr\"alo dc conlian7..a exacto. Para la comprobación dc hipótcsis, el
111()Jl.I() billomial dcsc¿insa en I¿i ~isII11Cil)n dc quc M., el número total
dc I()s cas()s. es una constante. Esta asuJlción es análoga a la de los
tol:IIl'~ Il1arginalcs fijados en el modclo hipcr!!cométrico para tablas de 2
x 2. I)aril la cstimación del inlcrvalo, cl prohlcma que tiene asumir que
.\1 I es C()11stante consiste en que. con rcspccto a la diferencia de tasas de
il1ciJencia. el valor Afl no es simplemenle un «parámelro de perlurba-
cil,11)' que estadisticamenle careciese de peso en la medida del erecto; el
\"JII)r dc "Ii imponc un límitc en la magnitud de la direrencia de tasas de
ANAlJSIS OE OATOS CRUDOS 187

incidencia (un valor pequeño de M J es compatible únicamente con


valores pequeños de tasas), requiriendo por ello que la variabilidad
muestral de M J sea tomada en cuenta al estimar la diferencia de tasas de
incidencia. Por tanto, el modelo binomial simple con un M I fijo no
puede'emplearse para calcular límites exactos de confianza para la dife-
rencia de tasas de incidencia con datos expresados en términos de
persona-tiempo. La contrapartida para datos persona~tiempo del mode-
lo más general dos-binomial para tablas de 2 x 2 seria un modelo
consistente en dos distribuciones de Poisson independientes, en el cual
los casos expuestos y no-expuestos ocurren cada uno independiente-
mente de los demás y con frecuencias descritas por una distribución de
Poisson. La citada distribución de Poisson, no obstante, carece de límite
superior para el número de acontecimientos (es decir, casos) que pueden
ocurrir, por lo que no puede emplearse para los cálculos anteriores sin
un truncamiento arbitrario. Por estas razones, la estimación del inter-
valo exacto para diferencias de tasas de incidencia no es posible fácil-
mente.
Resulta apropiado. no obstante, fijar M J para estimar la razón de
tasas de incidencia, porque la medida razón depende de la razón de
casos expuestos a no-expuestos, no de la magnitud absoluta de las
frecuencias. Por ello, M I puede considerarse como un parámetro perlllr-
bador que esladisticamente es independienle de la medida de razón de
tasas. A efectos de estimación, el sencillo modelo binomialllnico emplca-
do para la comprobación de la hipólCSis debe scr modilicado para
acomodar un efecto no-cero. Puede conseguirsc esto haciendo constar
que la probabilidad de que un caso sea expuesto, dados ¡\11, est{t rclacio-
nada con la razón de tasas de incidencia de la siguicrlle manera:

Los limites exactos de confianz.a para IRR pucden ob&encrsc haciando la


probabilidad de la cola de la distribución binomial igual a !X/2 y 1 -cx/2,
donde 1 -cx es igual al nivel de confianza deseado. Si llamamos !! al
punto delin1itador más bajo del intervalo de confianza para la probabili-
dad de que un caso sea expuesto y ii al punto de delimitación más alto
de dicho intervalo de confianza, entonces

[ .91

üNo
mR= [ 10]
(I -ü)N.
Ii ~:cf~ll!
."C,-;,:~:::;:. .
..,

l ANAliSIS DE DATOS CRUDOS 189

~
Fisher. podri~IJl C~III..'\lI~lrsc :1 p:lrlir tic I~I,'; I.:CU~IL'j(),1C,'; r ,1)~' .101 L'(\I11(1
:\
"l
slgUC:

~"
0.05 = -!J).~h k
¿1 I
k ,= .¡ I

~ (,
().t)5 = \ ii I~'.
j, L..
... k:.¡2

Estos cálcul{)s $e ltaccl1 mcjor C()11una c()mrut¡¡uor:l o ror UI1 ml:touo ue


n
,1t:.ljO que incluye 1:1 di.'itrihlJci()n F (Rothm:JI1 y B()ice. 19X.:.: Ar()\\,I1I~c.
11
1965). Una s()llIci()n de cns¡¡y(') y crr()r r:lr:J I¡¡s rrcccdcnlcs crll¡lci()nes
ua l! = O.6IR y li = ().X27. uc d()ndc s¡¡lc illJi = I.I() :/ n:ffi" = .1.:.5.

u Si se c¡¡lcul¡¡11 los limitc.'i L'11h:lse :11 \,:1I{)r L'X:ICt() ue. p UI.: liJ m~{li¡¡
cntonces 1,1SCcu¡¡cj(')nc$ :1 res(')lver s()n:
P.

.~I,
( '5(' )
9
) !.lll ~
0.05 = ::;- -1!).'(' -k
.~-
.:-:.. k
..~- \ ,
.~: y . ." ,
,~
0.95 = , + l()~h k
t ~::.;:::.

~.;;;.."~':
Los límites de confianza slJrcri()r c infcri()r ;ll ()() r()r I()() uclermill,ld()s
por las anteriores ccuacjones has¡¡das en 1:1 mcdia P. -'()Il !J = ().62h :. Ii
= 0.8205. corresp()ndiendo a lR.R = I.J4 :' mR = J.I().
.;~~i;"
::;:~;
DATOS DE IN('If)EN('IA ,\('tfMVL\DI\, Si los del1omil1:1dores SOI1 re- ':::~1;;i'.
cuentos en lug.1r de unidades persona-tiempo. un interv:llo de confi:lnz:l '..:~11~;::
,:;;\~,::
p¡lra la diferencia de riesgo podría c.1Icu¡.lrse t~()ric:lmente .1 p:lrtir del .;.::~:
modelo dos-binomi(ll, El c~llculo. no obstante. implic:lria 1:1 delermil1a- ':;:-;:
ción reiterntiva de 1.1 prob¡lbilidad eX¡lcta de 1:1 cola h:l~ada en dos
binomiales independientes y. por tanto. no es r:icil de ~.iecutar,
Los límites de confianzn para la medid:l de la r:lzón de riesgo e."t¡in
rI
t,
,- también sujetos a la misma dificultad de compllt:ICi()n. porque cl \';llor
de dicha medida depende del nllmero total de C:IS<)Sy requiere cl u~o dc
.:~~ii,
dos binomiales independientes, Si. por el contrario. sc ernrle.1 lit medida
de razón de ventaja para 1¡1e$timación. amho~ mi1rgel1e$ tIc 1.1tahla Je 2
x 2 pueden ser considerado$ fij.1dos y lo.'\ c:ilculo.'\ ~e sirnplilic:lri:ln
mucho. ya que la cit.1d¡1 medida de la raz{)n tIc vent:lja es independiente
del número total de ca$os. Corno la razón de ventitja e$ sol.lrnente una ,c::¡i.~~.:'i~;

aproximación de la rnzón de riesgo. el c~llcul<) ~ic 10$ limite~ L'xact<)~ tIc la


primera no produce límites exactos de conlianZ¡l para 1.1 segund:l. L:I
aproximación es buena solamente ~i 10$ rie$gos $on pequcño$. en cuyo
~ caso el intervalo exacto de confianza de la razón de ventaja pllede
emplearse como razonable intervalo de conli¡lnza ,~ustituti"o de m ra7:(1n
de riesgo.
B El modelo estadístico que describe la ,'ari:lci<)n de una cclda l'n lll1:1

D
,---c".-

:;~.;:¡c .::~'::~.~.::{¡j~.;.~: , .:.:~ ": c;


:.:..
.i~:~:~
~:.~:.~;;.:c :..~:.:::;.". '.;;;;':,

~
:;;,::

j~~r; .~;: :;ifLJ ;;!~jfl~;~

n ANALISIS DE DATOS CRUDOS


19'

...
l
Ni\,ci tic ;lnlicllcrp()~

Di.lrrca 7 12

9
a
2
No di.lrrca
TOlalc$ 16 14

n
I
!
,
para los límites J~ la media ? La solución dc las ecuacioncs que
anteceden puede consumir mllcho tiempo. ~'a que cada repetición en el
,1
r'

[ proceso exige que se Ilevc a caho Ilna suma complicada. pero no e~ ni dc


¡. lejos lo complicada que resultarían los cillculos que se prccisarian si se
~t~'
emplease un modclo cst:ldí~tico de dos hinomialcs independiente~. ~:..~:...""".

;.:~~
~..," Los datos del cjemplo 11.4 describen los resultados p:lrci:llcs de un
~~:'; estudio de seguimiento. e\'aluando el riesgo de p:\decer diarrea en niños
sometidos ,\ I:\ctancia m¡,ltern:\ en BangJ:ldcsh durante un periodo de
once días. según la detcrminaci()n de varios títulos de ,Inticucrpos cn la
leche del pecho de sus madres. Un valor exacto dc ? dc 1:1hipótcsis nul~l
dc no :1sociación. da ?II) = 0.02 p~lra el valor de ? de Fisher ~. ?iII =
0.01 para el valor de 1:\ medi~\ ? El estimado del riesgo rcl~ltivo ~I rar1ir
de estos datos. comp~1rando cl grupo expuesto :1 titulos ~lltos con cl
expuesto :1 títulos bajos. e~ (7/16)/(12,!14) = 0.51. El de la razón de
ventaja dífiere notablemente de est¡,l cifr,l. dcbido ~I que los riesgo~ ~on
;.¡::.
muy ~lltos: el cit~ldo cstim~\d() de 1:1-razón de ventaj:1 es (7 x :?)/( I:. x 9) =
= 0,13. Se puede calcular un íntervalo de col1fi~\nza exacto p¡,\r,\ I~\ r,lZÓI1 de
ventaja empleando las fórmulas [ 11.11 ] y [ 11.1 :.] p,\ra obtener los limi-
tes de Fisher. Los límítes de confianza ~ll 90 por 100 son 0.0 17 y 0.75 1.
obtenidos por cl método de solución de ecuaciones de ensayo y error de
l¡,lS fórmulas ~lntes citad,lS. Si. por el contrario. se dcse:\scn los límites
exactos de I~I medi:\ ? podrí,ln ohtenerse :\ p:lrtir de las ccuaciones
[11.13] y [11.14] y .~on 0.0:?5 y 0.608. Esto~ límites ex~lctos de la razón Jc
ventaj:.\. sin emb,\rgo. no pueden ser empleados como límites de confian-
,:jt~~::~::-
za de la razón de riesgo. puesto que con estos datos. la razón de \'entaja
~ es una pobre aproximación para la razón de riesgo.

8
La eslimación aproximada dcl illlcrvalo a partir dc Jato~ de ~cgl1imiclllo
brulos es direcla.
~ DATOS DE TASAS DE INCIDEN('IA (Pf:RS()N¡\-TIE/IIP(»). Col1~iJercmo~
primero los dalos de tasas de incidencia con denominadores persona-
liempo. Se pueJen estimar do5 medidas dcl cfecto: diferencia de t:l~a~
u y razón de tasas. Como la medida de diferencia de tasas tiene \ll1a

o
~.
~--~---,-- ..'c~.,;,~-~
,.:,: ,
:.. -,'"

:;:;-,
:. :t~¡~\;;:;:
.:;: -.¡;¡.,
:.~.
.:;~.::~;i~:~j [:::;¡::;.:¡.¡;~ifu::~¡::i~[¡~~:~

~
ANAliSIS DE DATOS CRUDOS 193

cálculo de]osintiJogaritmos, se consigue mucha mayor exactitud que si


se obtienen 'IoS 1ímites calcuJándolos simctricamente 'Sobre la razón de
.tasas misma. ~sí,;procederemos

La desviación estándar de la razón de tasas de iricidencia puede


aproximarse con la fórmula

/!-;!
~~Tb
De nuevo, empleando los datos del ejemplo 11.1, podemos estimar la
razón de tasas de incidencia como

41128.010años
= 1,86
15/19.017 años

y el In (1,86) == 0,618: La desviación estándar del estimado puntual


transformado logarílmiramente es

.JI/4i + 1/15 = JO:¡jijT = 0,302

Un intervalo dc confi:lnza al 90 por 100 para clln (RR) sería entonces

0,618 .i ,645(0,302) = 0,12,

el cual, después de sacar el antilogaritmo para invertir la-transformaci()n,


da un intervalo de confianza entre 1,1 y 3,0. El proceso en su conjunto
puede rcsumirsc como sigue

:,645.jl/4i + 1/15] =
exp [III (1,86) i 3,0

Estos lírnítes concuerdan bien con los lírniles exactos al 90 por 100 de la
media P, calculados anteriormcnle corno 1,1 y 3,1.
Una forma altcrnativa de haccrlo podría ser ernplcar la fórmula
basada en el test

RR'I:1:ll1.)

en la cual X tiene un valor de 2,08 para los datos del ejemplo 11.1.
Utilizando Z = 1,645 para limites al 90 por 100, el abordaje basado en
dicho test da un intcrvalo desde 1,1 a 3,0. que igualmente está en
excelente concordancia con los limites exactos de la media P.
:;;;~::~;;¡:i;:;:;:;:~:":.i;~,:.
.:".~.'-:'~::...~,:~\:~~...

¡::";,:'

~.::.~i;
!;a!,i~. .:::

ANALISIS DE DATOS CRUDOS 195

La desviación estánd:lr estimada del In (RR) es

i'-
'-"j

y el inlcrvalo dc confianza .11 90 por 100 cs

cxp [ -0.673 ::!: .645(0.304)] = 0.31. 0.84

Ailernalivamente. loS límites basados en eltesl podrían calcultlrSc como

RltII.tZlll = O,51(1.t l.h45¡-1.J01.I = 0.32.


0.82

De nuevo. los dos métodos aproximados par~\ I~\ estimación del iI1Icr\'~\lo
de confianza concuerdan bien.
Si la inferencia a partir de los datos de seguimicnto con dcnominado-
res de recuento tuviese que estar basada en la razón de ventaja. en vez de
en la razón de riesgos. entonces la fórmula par~l la desviación estánd:\r es
(Woolf. 1955)

SD[ln (razón dc venlajal] = 1:- + -+ -+ -


V (I h c (I

Para el ejemplo 11.4. la razón de ventaja es (7.2)/(9.1.?) = 0.]3 y el


logaritmo es In (0,13) = -2.04. La desviación estánd.lr es

SD[ln (razón de venlaja)] =

y el intervalo de confianza aproximado al 90 por 100 es

exp [In (0.13) :!: 1.645(0.915)] = 0.03. 0.58

Los límites de confianza basados en el lcst se calculan como

0.131Itt.h4s1-1.J41 = 0.03. 0.55

Considerando los muy pequeños números implicados en cstos cálculos.


~ las dos estimaciones aproximadas anteriores del intervalo para la razón
de ventaja coinciden tolerablemcnte bien, no sólo una con la otra. sino
también con el intcrvalo de confianza de la media p exacta para la razón
~
de ventaja, que anteriormente se calculó era de 0.025 a 0.608.
El abordaje de Cornfield ( 1956), que se describe con mayor detalle en
el capítulo 12, es una técnica de aproximación teóricamente prcferiblc.
~ ya que implica volver a recalcular el error estándar usando frecuencias

:.

:;~;
;!~¡:
..!:f~7~

~
;,:"':...' ,.;..~,..,

\t\~:l*~~~ ;:";-,:::' :~~..:.~.~..¡.~...;.,.

~~f;~i~i\\~@
¿::.;;.:

196 EPIDEMIOLOGI" MODERNA

de cclda adeclladas qll(, c()rre~p()ndcn ¿iI \':II('1r <lcl límitc dc c()l1fianza.


A5i pues, el proceso es reiterativ() e i1lcluye $u~tancialmc1llt.' 111ilSt:¡ilclll()s
quc ()tros métodos de aproximacii)n. P¿lra I()s dat()s dcl c.icmplo 11.4. c.:1
¿lbord¿ljc dc Cornficlu da lI1l i1llcr\,¡lll) dc C(mri;lni'.:1 :11l)() r()r I(){) OC ().()~
a 0.55. concorda1ldo en e$la ()casión con el ~Ib()rua.ic b~l!;adl) C1l cl lc.:sl.

Daln,\" di' ('a,\"(I-Cm11/'m

Para dalos de caso-controJ. J.¡ medid.1 cpidcmiolll.t!icíl dc intcrcs ccntr:11


es la razón dc ventaja. el estimad()r punlu.11 dc IIi Cll:lI cs

R = tl(1
h('

La estimación del intervalo de confi.ln7.a cxact() dc I~t raZl)J1 dc ventit.iil cs


idéntica para los datos de caso-control y de seguimicnlo. y se hasa cn las
fórmulas que van dc 1í1 [11.11] .1 I~t [11.14]. Lo.c; intervalo.c; de confi¡tn7.a
aproximados de la razón dc venl.lja ¡¡ partir de d~tlos de C¡lso-control se
determinan cmpleando los mismos rnctodos q\lC' par;} los datos dr seg\li-
miento. lI~ann() la transformación logarítimic¡¡ con una de la.c; siguienlc~
rórmula.c;

Rcl t;~¡1:1
o exp {111(R ::tz SD[ln IR)]:

donde

SD[ln (razón de venta.ia)] ~ I ~ ~- ~ + -+ ~


\ 'I h (. (I

Consideremos el ejemplo I J.3. Los limilcs dc confi~ln7:.' cx¡lcln!\ .119() por


100 para la razón de ventaja, utilizando las ecu~lci()nes l J 1. J I J y [ 11.1 :!J
para los límites de Fisher, son 0.77 )' 13.6: emplcando 1.1~ ecuacionc!\
[11.13] )' [ll.J4] para los límites de 1~1medí.1 !'. los re,c;ultados ~on 0.94
y ~1,1. Los limit~s de confian7.a aproxímados ul90 por lO() puedcll dclcr-
mmarse como sIgue:

In (R = In (3,24) = 75

SD[ln (razón de ventaja)] = 0.71

exp [In (3,24) :t 1,645(0.71)]

o, empleando el abordaje basado en el lest

3.2411'! 1.(,4~'1.7~1 = 9.8

,~!~. ¡~:
J
ANALISIS DE DATOS CRUDOS 97

Como era tic csrcr:tr. I.'St()S rcslllt:t(I()s CnI1CliCr(I:\ll ml.i()r C()11 I()s límitcs
exactos de 1.\ mctii.\ ¡> qlle cnl1 los límilcs CX:tl"\OS tic I;is/tcr. L.\ :trro.xi-
m:\ción 11() cs rerrcct:\. rer() t:lmr()C() cs ticm:lsi:IJ() r()hrc. c()l1siJcr:\l1ti()
que dos dc I.\s cu.ltro ccldas tic 1.1 t:lhl:\ 2 x 2 r()SCCll rrccllcl1cias ()hscr-
v.\d.\s de s()I() cu.\tr(). El mct()Jo tic C()rl1ficlti J:I lIn il1tcr\,:\lo al ()O r()r
n tOO de t.t a 9.R. idcJltic() :tl ticl :thord:t-jc COI1 h:tsc CI1 c:1 tcst.
u

~
,'1 REFERENCIAS

Boicc. .J. D.. ;ln<.1 M()n"nn. I~. I~. IJrc:l!;1 (;:lnt:cr in \\,omcn :lflcr rl:rl::lII:(1 I1l1-
orosc()pic cx:lmin¡llinn!; ()r tJ1c chcst. J. IV(lrl. (.clll(.I.r 111.\"1.1()7i:S9:~~.1-X.1~.
Br()wnlcc. K. 1\. .)'llli.\"li("(11 71,(.(lr.. (111(1,\I(.,h(I(IIII(II.'.. ill .\.("i(.I1("(.(m(I,:i,l.'i//(.I.rilll.'.
Ncw y ()rk: Wilcv. I ()(,5.
Cornlicld. J. 1\ ~t:lti~tit::11 pr()hlcm :lrisin~ rr()m rClrOSrI:L.ti\.c stlluil:s. 1,1.1. NI::-
man jcd.). Pr(II.(.{.(lil1l.'.\" ¡"/,i/"(1 B(.r".(.".I. .)../I1"IIXill/I1. V()I. .J. IJl:rkl:lcy: Ilni\.cr.
sity of C:llir()rni:1 Prcss. I ()5(,. rr. I :l.5-14X.
Fishcr. R. 1\. TJIC I()!:!ic I)r inúllt:li\,c inrcrl:ncc. .1. I~. .)'(iI. .\i/(... Sl:ril:s :\.
19~5:9R::1.9-54.
Gart. J. J. TJ¡c comrari!;on «< rr()r()rlion~: ;1 rc\.il:\v ()f "i~,1ifit::lllt:C II:Sls. \..(1'11i.
dcncc inlCrvuls unJ uujllslmcnlS for str:llilit::lli()n. I~{.r. 111,. .\i,ll. 111\1.
197J:39:I~H-I(,l}.
GJass. R. J.. Svcnncrholm. ..\. M.. .<;1()II. IJ. J.. CI ul. Pr()lcclinn ,I~aill!;t (;h(lll:ra in
brc:1Sl.rcd childrcn by antihi(ltics in brt'¡I~t milk. .V. EI1f,'I. .1. .\1(.(1.
1983:308: 1389.1392.
Mantcl. N.. and Hankcy. B. F. Pr(lgrammcd analysis ()r a ~ x;. contingcnt:y
table. ..f/11. .)/{11. 1971 :25:40-44.
RotJ¡man. K. J.. and Roicc. J. D. E"i(I('/I1i(II(1.f,'i(" ..111l1l \"i.\" 11.ilh II Pr(I.f,'rl/ll/I1ll1hl{'
C{llc/(llIr(1r (2nd cd. ). Brooklinc. M ¡\: Epidcmiolngy Rc$()lirccs 1nt:.. 19X;..
Rothm:1n. K. J.. Fyler. D. C.. Goldhlatt. ¡\.. et ;11. Exogen()lis h()rmones and
other drug exposures ()r childrcn \vith congcnital hcart di~easc. ..//11. J.
E"i{ll'mi(ll. 1979: 109:433-439.
Shorc. R. E.. Pa~lcrnack. n. s.. and Curncn. ~1. (j. 1~l:lalin!:! illnllcnza 1."1'iuc-
mics I() childlloo<.1lc\lkcmia in tllm()r rcgi~tric~ \Vilhnllt ;¡ <.Iclincd pnrUlali()n
~ basc: 1\ I:ritiqllc wilJ¡ 5uggcsti()ns r()r improvcú mcthod~. ..1/11.J. E"i(".,lli(ll.
1976: 103:527-535.
woolr. R. On cstimating lhc rcl:llion hct\vccn hl<.)(,d gr()lip anú Llisc¡I$C. ..1ll1/.
H/(11,. G('11(,t. 1955:19:251-253.

u
¿ .
~... ~::x"~"'.:;.':'¡¡..;.
v ~.~.;;... ..

;~:
'I ,~ .f~
12. ANALISIS ESTRATIFICADO

Dos diferentes intereses analíticos motivan la división de los datos en


estratos: uno es la necesidad de evaluar y eliminar la COl1ji/Jiál1. el otro.
valorar y describir la modificaciól1 del ('fecto . Como la estratificación es el
método preferible de enfrentarse con ambas cuestiones analíticas. resulta
fácil que el estudiante que comienza se haga un lío en su intento de
distinguir entre los fines y los procedimientos implicados en la conside-
ración de estos dos aspectos del análisis de. datos epidemiológicos.
La modificación del efecto se refiere al cambio en la magnitud de una
medida del mismo. de acuerdo con el valor de una tercera variable
(además de la exposición y la enfermedad). que recibe el nombre de
modificadora dl'1 efecto. La modificación del efecto difiere de la confu-
sión en varios aspectos. La diferencia más central es que mientras la
confusión es un sesgo que el investigador espera prevenir o, si fuera
necesario. eliminar de los datos. la modificación del efecto es una
descripción . elaborada del efecto mismo. Es. pues. un halla;~go que debe
ser referido, más que un sesgo que deba evitarse. El análisis epidemioló-
gico está generalmente encaminado. pues. él eliminar la confusión y
descubrir la modificación del efecto.
Resulta una comparación útil pensar que la confusión es una
perturbación. que puede o no estar presente. dependiendo del diseño del
estudio. Por supuesto. la confusión se origina a partir de la interrelación
entre los factores de confusión y las variables del estudio en la pohlación
origen, de la cual se seleccionan los sujetos a estudiar. No obstante. la
restricción en la selección de los sujetos. por ejemplo. puede prevenir que
una variable se transformase en factor de confusión. en una situación en
la que. de no hacerse así, actuaría confundiendo. La modificación del
efecto, por el contrario, más que ser una perturbación. cuya presencia
dependiera de lo específico del diseño, es un fenómeno natural que
existe, independiente del estudio. Es un fenómeno que éste intenta
divulgar y describir en la medida de lo posible. Mientras que la
existencia de confusión con respecto a un factor dado depende del
diseño de un estudio, la modificación del efecto tiene una constancia
conceptual que trasciende por encima del mismo.
199
~::;;::;~::;(;¡¡g~;¡;;;;;.;;.;;i;¡:;.;..;. :
::~~::;:~~~:
:~l,~f:~~i .;;t:..:.'(0¡)";:~;.;?,m"...~.

~~ ~

200 fPIDEMIOLOGIA MODERNA

Ahor~1 bicn. ~i I~I modific~lciól1 dcl ercCI(). en ~lI .,\enlid() mils amrlio.
e,c; un~1 c()n~lanlc de la nalur.lleza. n() rucd(' c()rre~r()lldcr ~l nin~lln:1
rr()ricd~ld hi()I()gica. r()rqllc hay un a.,\rcCI(\ dcl <.:()nCCrl(\ qllC 11(1cs
ab~()lul(): en ~ll conlexl()
e5reci(jcar
mil'C; gcncr.ll. inclllye cl m()di(jcar
quc medid¡1 del mi~m() e.<;la m()dificad.t,
un CrCCI() .,\i11
PuC.<;l(1quc h¡ly dos
1
medida,c; dcl ereclo. la5 dc dirercncia y la,c; dc ra7,(m. qllC ~e li~an
c()mÚnmenlc el1 eridemi()l()gja. ~I~í c()m(1 ()lr:l'C; qllc ~c ll.,\:ln c()n mcn()s
rrccllcl1ci:l. cl c()ncert(1 dc m()di(jcacii)11 dcl Cr(..rl(l. ~in e~pcci(jc.lci(\ncs
m:i,c; ampli.I$. e,c; dema~i~ld() amhigll(1 com() r:lr:1 .,\cr llljl cn laJll(1 lJli(,'
de,c;crirciól1 de l.1 naluralcz.t.
En I~t fit!ur.1 12.1. 1:.1edad rlledc ~cr c()l1~idcr:ld:1 c()m() m()djfic:ld()r:1
dcl erCCl(1 dc eXp()5jcjón. plJe~l() que la djrcrcnci.1 dc la5a~ dc incidcnci:.1
cnlre expue$I(),c; y no expue~los aumenl.1 c()nr()rmc allmenla 1¡1edad. ror
el C()nlr~lri(). I~I razón incidel1ci~1 enlre eXrlle,c;I(1~ r:lrlid~1 r()r incidcncia
enlrc n(\ expue~I(1.'.;. cs consl~lnlc .1 lo l:.lrg(1 dc 1;1mism.l. ¡\sí rlICS. 1:1cd;I(1
m()difica el ereCI(1 dc exp()~ición c()n re.<;rect(1 a 1:1 medid¡1 del CreCI()
«direrencia». per(1 no con resrcct()
col1trari~1 se de~cribe en la figllra
a la medid.1 «razón»,
12.2. L.I dircrellcja
Lcl siluacii)n
ell I.as t~l~as dc 1
incidenci~1 enlre expue~t()~ y n()-expuestos e,c;c()n~t.lnlc .1 I() larg(\ dc 1:.1
edad. pero la razón incidencia entre lo~ eXpUeSl()S rarlida p()r incidcncii1
el1lre 1()5 n()-eXpueslos. dismil1uye con ella. E~to~ diagr.lma5 ilu5lran r()r
qué 1.1modific<lción del erecl('1 dcbc descrihir.<;e. sól() en relación con un;1
medida especjfica del mismo. Si e51á au~enlc re5reCI() lant() a ):.t medid:1
direrenciC\ c()m() a )a medida rn7.Ón. dcberil e~lnr rresenle c()n re5reCl() ~I :]
las olra5 medidas. a meno~ que )a la~a de enrermedad enlre 1()5 no-
exrue~los carecie5e de a~ociación c()n cl p()lencial m()dificad()r dcl CrCClO.

"O
~
j
"O
C>
E
Q,
-
c:
Q.'
C>
"O
~

c:
C>
"O

c

J
EDAD

Fig. 12.1. J1Ici(IC'1Icia tiC' la f'1{f<'rlll('(I(I(I/,()r ('.\.pv.\'iCi(i,1 )" ('tllId. i1l(li('(mtln 1(11(/
ra:(i,l tI(' in("iti('11('ia ("O1l,\,(al'((' ('{1)1 1(/ (,tI(It1.

..

~R:
I il
,t

ANALISIS ESTRATIFICADO 21)1

'1

n
~

~
i..- ~.

e.

~.
~..

n ~~

Fig, 12.2. ¡/Il'id('II('i(/ d(' Itl ('nj('"II('dtld 1'(lr ('.\"I'(/,\'i('i(jn l' (,dtld. inr!i("tIIld(1 II/1t1 ;.
ii
((ile,encitl ('on,\'lon/(' de ;'Irid('ncin ('(1/1 la ('da((. "

;
Este C:lpilUlo presenla las e.c;tralegias analilicas rundamenlales pt\ra
hacer rrenle a la conrusión ya la modificaciOO del erecto en un :tnnli~is
estr~tificado. Las inlerpretaciones biológicas y de .c;¿\lud pública de la
I.
citada modificación del erecto se consideran en el capilulo 15.

f
EV ALUACION y CONTROL DE LJ\ CONFUSION r
,

~
!!
:,
La confusión es una distorsión en un,l medida del erel.:to. di$tor$ión que ¡;

resulta del erecto de otra v~lri~lble que est{l a SU vez (lsoci~ld~l con la
exposición que se estudia. En el capitulo 7 se la definió y se discutieron
las caracteristicas generales de los factores de confusi()n. Recordemos
que un factor de confusión debe:
f
I. Ser un factor de riesgo de cnfermed~ld entre los no-expue.<;to$.
2. Estar asociado con la variable de exposición en la poblacic)n de
la cual proviene el caso.
3. No ser un paso intermedio en el camino -causal entre la exposi-
ción y la enfermedad.
Los datos de caso-control del ejemplo 12.1 demuestran lin efccio de
confusión por parte de la edad. Si se estim~l a partir de los d~ltO$ brlItO$
el erecto de los anticonceptivos orales sobre el rie.<;go de infarto de

:ttff;" ;~~¡~:.

~
...;...;,;r;~~;..';'...;';;;;; 'c'
".,'~-'
"~m'.~~¡ .,
,,{""':-:...~.;,..

'~::1:::;~~;;ili rgI~~~
,
~.
~'ff}f-

1
202 EPIDEMIOLOGIA MODERNA

Ejempl{l t 2.1. nn'n.1" cn.I"(I-c(m,r(11 dc.l"('rihi('I't!f/ ('1 ('feCI(1 (1(,1,1.\,(1 (1('


n/1,iC(11'C('p,ivo.1" o,nle.\,. .I"(1hrc (,1 r;(..~J!fl (h' ;/11(1"(1 (1(' mill(.,lrt!;(1.
cnn 1(1 ed(ld ('m,fim(li('/1d(l.

Ca~o~ dc infartC' de
miocardio 21 26 lti R~ 39 114
li ., 24
Controle~ 59 95 154

Rnzón dc vcnt:l.i,1
e~timadn 2.8 .:..~ :?.2

miocardio. la razón de ventaja estimada e,<;dc 2.2. Sin emhargo. ,<;ilo,<;


l
datos se dividen en dos categorias de edad. el estimado dc la razón de
ventaja en cada categoría es 2.8. lo que corre~pondc a un cfecto 50 por
]00 mayor que el estimado de 2.2 ([2.8- 1]/[.?.;. -I] = 1.5).
Es claro que la variable «edad). en el e.iempl('1 1;..1. cumple los
criterios para ser factor de confusión. Primero. I~I edad es un factor de
riesg('1 para el infarto dc miocardio entre lo,<;n('1cxpllestos. est('1es. entre
lo,<;que no usan lo,<;anticonceptivo~ or¿lles. S~themos en gcncr¿11quc la
edad es un fuerte factor de riesgo de infarto dc miocardio: más
directamente. podemos ver que entre los slljeto~ de e~tc estudio en
particular que no usan los anticonceptivos. la pr('1porción de ello~ que
han sido clasificados como caso~ e~ mayor en la c¿ltcgori¿1 de cd1ld
entre 40 y 44 año~ (88/183 = 0.48) que entre los categorizad('1s < 40
(26/85 = 0.31 ). Estas proporci('1ne~ no representan níngtln~t medida epi-
demiológica que tenga sentido: puesto que ~e tr:lta de datos de casos y
controles, rene.ian la razón global ca~o~-contr('1les qllc lo¡; in\'e~tit!adorc~
han elegido arbitrariamente. La~ pr('1porcionc~ podrían ser de~crita~ ~l
como «prevalencia de enfcrmedCld entre los ~lI.iCIO'<; dcl e~tuclio no-cxpues-
tOS», 1.0 que d~ldo el di~cño de cas('1 ~. control. n('1 ~()n prevalcncia~
significativas. A pesar de todo, p:tra que la edad estuviese confundiendo.
estas proporciones deberían variar con ella.
Para que la edad fuese un factor de confusión. además. dcbcri~1 e~tar
asociada con el uso de anticonceptivos orales en la población orit!cn que
dio lugar a lo~ casos. Si miramos a los controles. que son elet!idos por
D
muestreo entre la población fuente. notamos que la proporción de los
que usan contraceptivos orales es mucho mayor (17/76 = 0.22) entre los
controles más jóvenes que entre los más viejos (7/102 = 0.07). lo que
indica que esta condición se ha cumplido.
Puesto que la edad no puede ser consideracla como un vínculo causal
entre el uso de anticonceptivos orales y el infarto de miocardio. reúne
todos los criterios necesarío~ para ser factor de confusíón en estos dato~.
Existe un método más directo. no obstante. por el cual puede v¿tlor¿trse

,. ..." ~ ...

.::.-:"'~..~.t~ ~
.~
"..~..;;:
.~.
; .j,~t'm¡¡.,i':,~¡,;,lg ~.:~~::
1¡~lt
: :;':-::
;:~\;:!. ::~~~
:;:~~:'; .:~;~;:~:t;.~~j:t"~.~:
.::;{:~'::?f~.

l
ANALISIS ESTRATIFICADO 203

la confusión. Resulta posible evaluar su magnitud c()mparand() cl


estimado dcl erecto obtenidn de los datos brutos con el ohtenido dc los
dalos eslralific:ld()s (siempre lllle se determine que cl potenci:\1 confundi-

, u dor no es un cslabón en la sccucncia c.\usal). I gnor.\ndo.


fuese. la confusión
cualquiera que
residual por 1.\ edad que pudiese haber dentro de
estas dos categorias. podcmos decir que la r~lz()n dc tasas de incidencia.
in no confundida por I~l cdad. del uso de anticonceptivos orales sohre el
riesgo de infarto de mioc~lrdio es de 2.8. puesto que la estimación es de
2.8 p~lra cada uno de los dos estratos de edad. La estimación basada en
los datos brutos es. no obstanle. de 2.2. Si estos estimados fueran
idénticos. los datos indicarian que no hay conrllsión. La m~lgnitud de
esta en los dalos. pues. se mide por el gr~ldo de discrepanci~1 entre I~l
estimación brula y la no confundida.
I\lgunos investigadores han intentado v~llorar la c()nfusión :I tr:l\'é$
de pruebas estadistic~\s de 5ignificacii)n. Por ejemplo. en un en~a~'o
clinico. las distrihllcione$ por ed~\d de 10$ grupo$ de tr~ltamicnto ~' de
comparación pueden scr confrontadas medianle un te~t de la I: ~i e~ta
prueba estadistica es «significativa». 1.\ edad podria considcrar$e como
poseedora de la potencialidad de confundir. mientras que la .lu~enci~1 de
I «significación»
hay un uso incorrecto
implic~\ría que I~\ ed~ld no 1~lpo~ee. Pr()bablemente
rutin~lrio de 1.15prucb:l$ estadislic:.ls má~ I~\stimo-
no

so que el incluido en esta práctica común. D~ldo que la confusión C5 un


sesgo que depende de la magnítud de dos asociaciones ---conru50r con
exposición y COnrU50r con enfermedad-. una valoración apropiada de
la confusión debe estar basada en la magnitud de dichas asociaciones.
La comprobación de si existe «signific;ción» estadística refleja una
mezcla de ambas magnitudes. asociación y número de observaciones. y
por tanto no corresponde a una valoración de magnitud de asociaciones
únicamente. Un número grande de observ.\ciones producirá «significa-
j ción» estadistica en situaciones en las que I~\ magnitud de una de las
asociaciones componentes de un factor potencial de confusión fuese t~\n
endeble que no posibilitase una conru$ión sustancial. I\ la inversa.
E asociaciones potentes que producen una 5eria confusión podri.ln ser
juzgadas como «no significativas» si el número de ob5er\'aciones fue.~e
esc..1so. Por tanto. se insiste. la confusión nunc.1 debe valorarse medi~\nte
I pruebas estadisticas.
Aunque es posible obtener una apreciación general de 1.\ presencia o
ausencia de conru5i()n en los dat05 cxaminando si cl r~lctor rotcncial <Ic
confusión está asociado con la enfermed~ld entre los no-expuesto~ )' cnll
la exposición entre los no-enfermos. la magnitud del cit~\do erecto en los
datos es difícil de estim.lr de esta forma. porque la confusión representa
una función de amb.\s dichas asociaciones componentes. Mils aún.
cuando varios f.\ctores esti\n simultáneamente confundiendo. las ~lsocia-
ciones componentes deberian idealmente ser examinadas como condicio-
nadas por los otros factores de confusión. complicilndose con ello cl
problema. El método preferible de valorar una confusión consi$te en
comparar de forma directa el estimado bruto del erecto y el estimado de

c. .

];:{~1~~'

~
~ !1t :'ir~J~¡ --"

204 EPIDEMIOLO(jIA
MODERNA

é$te no confundido. (Una excepci()n $eriil li\ il1hahitual ~iluaci()11 CI1 lJlIC.'
el conocimiento anterior tiene rnii$ pe~o quc 1¡\ evidcl1cicl de 10$ d&lt()~
(Icerca de I(\ confusión, corno sc disculii) CI1 cl CilpiIUI() 7. () CI1 lilS
ocasiones en que se juzga que el facl()r ron e~a r()tenci.llidad es un
e$lahón en l.1 cadena causal). Esta Cornr.lr.ICiún rcvcl.1 dc forrn&1 CI&lril v
sin arnbigücdadcs la magnitud dc la confu~ii)n. quc cl invc~tig.ldor pllcd~
luego torn.lr en cucnt3 de cara a postcriores (lnillisis o cl illforrnc dc los
rcsult(ldos. Más aíln. si fuc~c 1lcccsario. podri.1 Ilcv.irscl()s .1 c.lh() .11
ticrnpo quc sc controlaban otr()s factores.

E.\"lil"aci()11 """I,(al ti(' 'm ~f(.CI(1 ,milfJrl"('

En el ejemplo 12.1. el estimcldo puntual d~ la razón dl. t~lsa5 dc


incidencia era 2.8 en cada uno dc los dos estratos de edad. por lo quc no
hay dificultad en inferir que un estimcldo gloh;11 del cfecto no confundido
por la edad deberia ser 2.8. Incluso si cl valor dcl p:lrc\mctro dcl efccto cs
idéntico. a lo largo dc los estratos. no obstclntc. es rclzonclble esper~lr quc
los estimados del mismo variarán entre estrato~ distintos por causa dcl
error aleatorio. Lo tipico. pues. es que el investig~ldor debcl obtener un
e~timado global dcl erecto a partir de lo~ d¡ltOS estratificcldos. haliclndo
un~1 media ponderC1da dc los estimado~ del cfccto especificos por e~tralo.
Si sc asume que el valor p~lramétrico dcl efcclo es liniformc -csto cs.
constanle sobre el rango variablc dc confusii\ll --cada eslr.lto entoncc~
clporl~1 un estimado separado dcl mismo p~lr~imclro. con los e~lim"dos
especificos por e~tralo variando ilnicamcnle de formcl cllc~ltcria. 1\1
ponderar las estimaciones par¿¡ hallar una medicl. e~ acon~e.i¡lhlc cl~ignar
mayor peso a las estimaciones específica~ por estrato con menor variahi-
lidad debida al azar y vicevers~\. Teóric~\mente. el proccdimienlo óptimo ]
para reducir la varian7..1 dc la media ponderclda !!Iohcll e~ a~i!!n~lr a los
valores específicos por estralo pcsos que sean in,'ersamente proporcion~l-
les a la varianza de cada uno de los citados estimado~ específicos por
est rato:

~ [Ili. (e~tim:ld(l dcl cfect(l Cll cl c~trat() i)]


Estimado global del efecto =

¿ III

en donde

JI¡ =
(varianza del estimado del erecto en el estrato i)

Este mét()do dc estimación puntulll. Cl1 cl quc lo"' cstrlltO1\ inúivi<.1ull-


les se ponderan para rerorzar III precisiól1 del estimado glohal. se c()n()cc

:;~::.;~~;::;;:::ii.
.,~:;:;..; "i;~::i::~j::" --'%.:,:.:;':' ".:;~;
';.~: :..
:.~'~':;::~¡~;?::;j:

,',;~~::;~~:w
;r¡:) ..¡~;:.,i.:

~~.i1iEí.
:;;;;:.;~~~:;;~;:;
'".,'«.x-:.
::~¡

i*~~~~t~~

ANAliSIS ESTRA TIFICADO

como 1'('(Jlill.", * ( El lector dehc tcncr cn c\lcnta qllc cl tcrmin() 1'(1(1/(.(1


-«conjuntado»- lo usan a veces los estndísticos pnra sigl1ilicar ((crll-
do»).
El pooling .c;epllcdc Ilcvar a caho dircclnmcl1tc. C::llc.:\II:\l1d() I()s rL'~C)~
D qllc .'iC V;111;1 1IIili7.;lr p:lr:t ohlcllcr la mc(li;1 clc Ic)~ c.'ilim:t(lc).'i (lcll:rCC:lcl
cspt:cílic.:().'i p()r c~tr;II(). :t r:lrlir llc l:t v;lri;IJIi'.:t t:sliI11iJU:t (1t:Il.'J"c.ol:I().
4l1t: sc
sacaril por scpar~ld() dL' los datos dc Cadtl estr~ll(): cstc mcl(1do re4l1icrc
g dísponcr. dcnlro Jc ~st()s. Jc il1rormacii)11 slllicicntc como p~lra ohtcncr
eslim~\do.c; razonable.c; (Ic dicha v~\rianza. O(ro ~lborJ~ljc. el mélodo de I~\

n máxima probabilidad.
proJuce cl e.c;limaJo conjun(ado
implicn I~\ .c;olución dc una .c;erie de ccllacione$ y
sin dctcrminar
especifico.c; por cstrato. Dicho ilbordaje dc m~ixim~l pr(1bahilid~\d
cxplícit~lmenlc los pesos
plledc
.'icr entcndido c(1mo un pr(1Cc.c;o de pOndcr~lCii)11 en ~I que los pes(1.C;
l
f
"
e.c;tuvje.c;en implicjtos cn 1~ls ec\lnciones que c()nd\lccn ill cstim~ld(1 pun-
lual. L~I dcscripcii)11 110 cs c()rrccta lileralmcntc. plICSt() q\lC. por c.icmplo.
l1ingún mcc~\niSmo dc p()nderacj()n r\lnci(1l1aria .'ii lin(1 de los estim;ld(1s
e.c;pccílic()s por cslr:lt() rllcsc inlil1ilo. cn tanto 4l1c cl ah(1rdaje qllc n(1.C;
ocupa si pr()dllcc cn es{a sitlltlcíón lin re.c;lil(:ld() linil() apr(1pi~ld(): en
rigor. 1~1capacíd;ld para ohtcner elicícntcmen{c la mcdi~1 dc cstjmad('1s
e.c;pecificos por e.c;tr~lt() qlle r\lescn err;llic()s clland() lo.c; dat()s son
rclalivamclllc e.'iCa~()s e~ llna dc lilS m;ly()rc.'i vcl1la.ias dt:1 ah()rda-ic dc
milXima pr(1bahi¡id;ld. O{r() grtlp() dc cstimíl(l()s c(1l1jlrn{ad('1s. l<.ls Jl:
Mantcl.llacl1~zcl. posecl1 pcSO~ cxplícjl()S imhllido~ cn la.'i r()rm\lI~I~: son
l(1s mils rilciles dc c;llc\llar y. c()nsidcrand(1 q\le S\lS pr()picdades estadis{i-
cas s(1n c~lsi t~111bllcna~ c()m(1 10.C;dílicilc.c;-uC.C:llc\llílr c=stimadorcs de
mtixima probabiliJad. c()nslituyen rrec\lcn{emCnlC el mcloJ() Je clección.
En las siguienes secci()nes se pre.c;cntan lo.c; 3 abordajes ~lnleri(1rcs del
pooling: el directo. lilili7.and(1 pcsos cxplícit(1.C; inver.<;amentc pr('1p()rcio-
nalcs ~l los cslimad()$ cspecífico.c; por cstral() dc la vari~ln7:~\: el de la
máxima prOh~lbilid~\d y cl M~lnlel-Haen.c;zcl. Las rórm\llas especifica.c;
utili7:adas parn delcrminar lo.c; c$timadorcs c()njllntados dependcn Jel
lipo de d~ltos quc .c;e (engl\n )' dc la medid~l dcl ereclo q\le se eslé
" cstimando.
M

POOLING CON VARIANZAS INVERS/\S


(POOLING DIRECTO)

E,\"fil"a('i(;,l !'lalfl(al tiir('('fam('llf<' ('mljl((lfatia ti(' Im (~ft'('f(, llllif(".",e


B cml (lafO,f per,fmla-fi('I',!'n"

I)II:I:I~I:N\IA 1)1: TASAS 1)1: IN('II)I:N("IA. UliJizal1do la forma dL' rrCSL'll-


m lación de I.t lahl.t J 2. J. J.t v.lri.tnza dcl eslim.ltlo tIc lu tlifcrenci,t dc la~;t~

.Es un tcrminn inglc rcrn hny ya dc u~n gcl1cral: .;igl1ifil:a "cn 1In Jl.'pc",ilcl
~
comítn». «conjuntado». (N. tit'/ T.)

Im

~:
.:;::;;'::;:.;.:;;:';::~':
..".::~:0;;~~;?:::.
;";t:
\&~%J~~~\:
1~:~~J~

~t:
',;~~,!

Tabl:l 12.1. Fnr",a d(' !,r{'.\"('fllari(;fI (1(' (1(1'(1.\" m. 1n.\ti.\ (It. ;,,(.;(I('fI('i(/ (.(1"
d{'nnm;fladnr('.~ !'('r.\"nna-I;{"',!'(} ('n ('I ('.\"1,(11(/ i m, I(n (m(íli.\"i.~ (..~I'(II(¡¡(.ad(1

Exrlle~l() N() cxrllc~to Total

Casos a. h
I I MJi

Persona-ticmpo /\'1 i ""I), 7; ]


cJc incidcnci:t (IRD) prnvcnicnlc <Ic \1 11 Cslr:tl(1 C()11Crcl(1 CII lll1 clll:'IJisis
e5Ir:llific:ld(1 e~ nprnxim:ldamcnlc:

a. /I. I

Var (IRD;) = -
I +-

r 12.1J
1r.,1]. !\'¡,;
II

(ver fórmula
difercncia
I ]-15). Por lo l(1nlo. un e~limador
de tasas de incidencia
con.iunludo
que fuese constante (1 lo
de una
largo de
1
lo~ estratos. se ruede obtener de la fórmula

IRb = .
[ 1:.2]
) 11
"-

en donde

[1.:..3]
J
y

h.
I

Noi

como con los datos crudos.


Como ejemplo de pooling utilizado en la estimación de una diferen-
cia de tasas de incidencia, consideremos los datos del ejemplo 12.2. En la
tabla 12.2 y sobre la base de las fórmulas [ 12.I ]. [ 12.2] y [ 12.3]. ~e dan lo~
estimado~ e~pecificos por estrato de la diferencia de tasas de incidencia
para dichos datos, las correspondientes varianzas también especificas
por estrato y los pesos para el pooling. El estimado conjuntado de la
diferencia de tasas se obtiene hallando la suma del producto de cad,\
estimado especifico por estrato por su peso, y dividiéndola por la suma
'~.1
.
de los pesos. El resultado es 5.95 x IO-4año- I, que está. como era de

-..
.

,m~¡
;~, ;¡~t¡!!~f~~~]~
.::~\:~~:.:-.;~;¡.~~;~~:::;;;;::;;W:::~-¡;;:.~:;,;.~,.
,-:.-:;~.~~.!~ :;(:...r :,.!f~':~..~~ '.:fc.:.

I!lt !~[I~'
f;;..'~:..,.

ANALISIS ESTRATIFICAOO ~O7

EjcmpJo 12.2. M,,('/,fll,'i !,nr ('n{('r",('dad ('n/'""ari(, !"'/' .1!/"'1"',\' ¡',\,!N'¡'ít¡¡'"X d.


D.
('(1(1(1t!nfr(' ",(~¡li('(1,\, l'artm(',\' hrif(ini('(},\' ,\'(..~,in ('lmX'¡m¡1 lIt' ¡'i.~¡,/'rlll"x
I ( Dnll .I' !I i". 19(Í(Í )
.'

Fumadores No rumadorc~

B Edad M ucrtes Pcrsona-años M licrtc~ Pcr~ona-.lño~

35-44 52.407
D
,
45-54
32
1()4 43.248 12
2 I R. 790
1().(,iJ
,.
-" "\...
55-64 206 28.612 -,-, 5.71()
65-74 186 12.663 2~ :?.5R5
75-84 10:! 5.317 .1 I 1.~()2
9 Tolal 630 142.247 101 ."\9.220

esperar. cerca de la difcrencia de tasas estim~lúa p~lra cl C$lr~lt() q lIC ~S

el que posee la vnrinnza más pequeña y el peso mayor.


La diferencia de tnsas de incidencia crudas es

630 10r
~., ~-., -= tR.5 x IO-~ año-
142.247 ~iños

que difiere considerablemente del estimado conjuntado. 5.95 x 10 -.1


año- I, lo que indica la presencia de una cantidad sustancial de conru-
sión por la edad en estos datos.

RAZÓN DE TASAS DE IN("IDEN("IA. Para e...timad()re... de una r~z()n. eJ


pooJing se realiza tra... una tran...formación J()garitmica de !()... e...limados.
lo que estabiliza las varianza Lo... pes05 son lo... in\'er5()~ dc la~ \-arian-
rJ1
~1
zas de los estimados de la razón de tasas de incidencia ( I R R) especifico~

I Tabla 12.2. E.\"lin10d(1.\"


de incidel1cia.
e.\"{'('cífic(1.\"
C(11/ la.\" L'arian.:a.\"
{'nr l'.\"lrOI(I.\" (/1- '(i di(-r('1/(.i(1
.I' ,(1.\" {'f'.\"V.\" pllrll 1'1 flf1fllÍ11.f,
(/I. la.\"n,{

de 1(1.\"dl1l(1.\" (1t'1 eil'111l"n l :! .:!

Estimado de In diferencia de V~rianza Peso


Edad
tasas dc incidencia ( x 104 :lños) x IORaños~' x ,0-"am\~ -:)

I 35 -44
45 -54
5,04
12,8
1.73
16.1
57.~
!\.~ J
55 -64 23,0 11I O.l)()
65 -74 38,6 535
I 75 -84 -20,2 1810
().19
O.()6

B
~

:~~;::::;\~~¡1 ~¡~¡~~~11~,

~
J'~! :~'~¡,;
1
208 EPIDEMIOLOGIA. MODERNA
~- ~~-~.--
por estrato. transrorrnados lo!!í\ritmicamcl1lc. l'I1:1 rilrmul;1 ilproximati\'.1
para la ví\riama es

í(lj + 'I,.
I lI2.4] 1
y ror tanto el reso rara el rooling es:

ll/J,
11' = ---
,
li; + h,

y el estimador con.iunlado. una vcz que se d~1 la vuclla a I~I lr,ln.<;formcl


ción logarilmica es:
1
IRR = exr
'II'
.:-
[12.5]
1
I

donde J
~!!
lI\R; IA'
hil J\ (ii ;1

como en los datos crudos. '


:
a
Se demue~tra la aplicación de la fórmula [ 12.5] utiliz::tnd() lo~ dalos dcl ..,
c.icmplo 12.3. que pro\'ienen de un esludi() de ~urcrvi\'enci:1 dc r:tcienlc~
con neuralgia dcl trigémino. La razón varón-hcmbr.1 dc ta~:ts dc m()rl;lli-
dad con los datos brutos es (90/2465 año)/(131,'3946
e~timado conjuntado, controlando la edad y utilizando
año¡ = 1.10. Un
las dos calego-
J
rias de ésta del c.iemplo 12.3 se obtiene COIl lo~ cálculos quc ~c dan en la ~
tabla 12.3. En concreto, se hace hallan(io la suma dc) peso en cada
estralo. multiplicándolo por ellogarilmo dcl cstim.t<.1u punlual e~rccilir()
de éste. dividiendo esa suma par la suma dc los pesos y hallando luego cl
antilogaritmo del resultado para dar la vuelta a la transformación. )o rl
u

Ejemplo 12.3. J..f nr1alidad por (,dcl(I.1' ,\"('.,.() (1(' p(I('i(JllI(',~ ('(m 11('II/'(II,f!icl (1(,1
1rig¿.lnino ( Rn1l,mal1 .1' M 011,"nn. ]973 ) D
Edad < 65 Edad 65 + Totales

Varones Mujeres Varones M ujeres V3roneg Mll.iere~

M uertes 14 10 76 121 90 131 f1


Persona-años 1.516 .701 949 2.245 2.465 3.946 ~1

"-" ,.

;;.:.

;:i,;:

~
¡~~;~:;;;:;¡¡:
1~~::-;;-~!:J:'~.
':\~:~~:}ft~
~~:%\\~\~\t.\:

ANALISIS ESTRATIFICADD 209

r:lhla 12.J. 1:.,\,f;/II,IJ(I.\. ,..\,p(.(.ili(.(I.\, P(I'. ('.\"f'.(fl(1 (1(' '{f '.ll:lj" de la.sas lle iIIcide1lc;a
1'1"' I ,.,(",\,f;I'.',ll".i(I',('.\. 1(1,~(f'.iff1l;('(f.\,. /,l('.il"'=lf.\" .'. P{..\"(J.\"
l'ar(1 ('11'(1(1li",~
,1{' I(J.\, (1{(f(J,\"J{.I ('i{."lpln 12.J
J
1~!\tim¡luo dc la razól1 Logaritmo Varianza Peso
Edad
uc ta!\a!\ uc il1cidcl1cia dc IRR de In (fRR)

<65 1.57 0.45 0,17 5,83


65+ 1.49 0.40 0,02 46,7
~

4llC d:1 1.5() r:lr:1 I()~ dat('1.C;del ejcmplo 12.3. La gran discrepancia
cxi~tcltlC cl1lrc cslc e~limad('1 110 c('1nrul1dido y el crudo. que era 1.10.
iltdic:1 4uC cl rcsullado crudo c.c;t~lh~l ~u~tal1cialmente sesgado por la
COl1rU~i()lt 4uC la cdnd cjercía.

E,\'l;111(/(';(j,1 !"11Iflltll c!irl'C'ftllIIC'/1f(' C(}1~jlmfac!a (le lm ~1'eCfO 1ll1iforme


('(111c!(I'(/,\' c!l' ÍI1(';(I<'11C;a tlCIIII111Iotlo.

1)1!1:!t!:~(lA I)!: IN(l!)EN\IAS :\\U~lt)L:\l)AS. En la tabla 12.4 se da la


fl'rm;1 lit: rrl:s\.,Jllal"il)ll Je Ja.c;tnbla5 de 2 x 2 estratificndas. La varianza
:lrrl'~illl¡IJa Jc l.1 llifcrenci.1 de riesgo (RD) en el estrato i es

Clj(N1i -aJ bj(Noi --,¡}h


Var (ROj + [12.6]
N~j N51

donde

RD

':lhl:1 2. ".11111
ti(' flr('...('/1f(lciri/1 ti(' 1(/.\"lahla,\" ti(' 2 x 2 e/1 el eslralo i de
1111(/lltili5i.\' ('5Ir(/f(li(.tltiv
~-~~
¡:xpucstos No expuestos Total

( 'aS('lS (lj h, MIl


No casos Cj d, Mo1

Total N, iVO1 1;

El rcso rara Coll.iul1lar estimados específicos por estrato de la diferen-


~ ,ia de ricsgos es el iltverso de la variunza:

NtiN~i
II' [12.7]
N~i{li(N1i aJ ...N~lhl(N()~ hJ

B
~

I :%j "~:: ~~1


;..~~ :'~~:::~i~;¡:~¡;).;:::;::.~;':~~~;'io:~-<~r;~?
",,~*,~,;~..!~-1~..~~"1\0'?:~ ',~.-:. ;~:

~-::
~~:\.:

i11J

2'0 EPIDEMIOLOGIA MODERNA


~--

Un e$limador conjuntado de la diferencia de rie$go.c; e.c;

I 111 RD;

RD=' [12.R
, Ir
i...
I
Los datos de incidencia acumulada dcl ejcmpl<' 12.4 indican una
d ifcrencin de riesgos cruda de .10:2()4 -21,!205 = 0.04.4\. pcr() est:í
confundida por la ed..\d, como se muestra en la tabla 1~.5. cn dondc se ve
que I..\~ diferencias de riesgos especificas por edade~ esti\n todas en las
proximidades de 0.035.
El estimado con.iuntado de la diferencia de incidencia.:; acumuladas.
eliminand() In confusión. se obtiene de la~ f¿,rmula~ [1::..7] ~. [12.R]: com()
~e muestra en la tabla 12.5. la categoria de ed(\d mi\~ ,'ie.ia produce un
estimado de la diferencia que nos ocupa con una varianza mucho mayor
que la de la categoria más .joven y por tanto se asigna a ésta un pcS()
1
mucho más grande. El estimad() con.juntado es 0.034. 1(1 que rcne.ia el
.1
mayor peso que. como se ha dicho. se ha asignado a la categoria mi\s
j
-'(1Ven.

Ejcmplo 12.4. C()IIIl'aració1l. p()r .p;'."pn.~ tl(. (,(i(I(1 (..~l'('('ifi(.0.~. tl(. 1II1(('rl('.~ (1(.hi,ltl.~
(I lotla.~ IlI.~ ('m(.~ll.~ l'nrn lo.~ 1!rllp(/.\, (lt. lraI01'1;(.111() ("()11Inlh,(la111itlll .,. (.ml
pl(I(.(,h(¡. Pr(/.f!rOllll: tl(' tl;(lh('I('.~ tl('1 Grllp(¡ Li1lir('r.~;lari,1 ( J97(/)
~--
Edad < 5.~ Ed:111?: 5.< T(lI:1I~
-- 1 (llh"l:lmid:1
~ PI:lcch(l T ulh"I:lmiu:1 PI:lcch(\
T ()Ihutamida Placcb()

t\1 uertes 8 5
22 16 30 21
98 115
7f, 69 174 IR4
Superviviente$
Totalc~ 106 120
9R R5 2(14 20~
j
Tabla 12.5. E,\"t;madn,~ (!.\"p(!cffi{'n.~ pnr ('.~rrarn {1{' 1{1 (li({'r('llci(1 (I<' ;,lcid{'11{.i{1
aclmllrlada, Cfl11 l'ariml:n.~ ,1' P(!.~().~[larn ('1 p()flli11!-'.
de In.~ d(1rn,~ {1l'1 ~i{'m[lln 12.4

E51imado de la diferencia Varianza dc la diferencia


Edad Pe~o
de incidencia acumulada de incidencia acumulada

<55 0.034 0.00099 1.009


0.00357 2RO
~55 0,036

I~AZÓN DE INC-IDENCIA ACUMULADA. El estimador de la razón ~e


obtiene. como antes. utilizando una tran~rormación logarítmica. La

..;.~~.
~

~1Itf.~.1
~..~~~...;~,:-"..~~~;:-¡:;""'~.,.,
¡~i ti ~~#~~f~~~".:~.~~ ¡t; ~;~¡*:;
~1
.1: ;~~li4
-o,':"':,:

l
ANALISIS ESTRATIFICADO 211
l
\'¡lrianza ;lproximada dcllog,lritmo de la razón de incidencia acumulada
(RR) cspecilic,1 por c~tralo cs:
',-.
i.- j
[ 12.9]

El peso para cl p()oling es igual al inverso de esta varianza:

ujbjNtjNo1
= -0- [12.10]
G¡d¡N1¡ + h,c;Noi

\' el estim~lcJOr lillilic:.tdo es

RR = exp [12.11]

dondc

oi/N11
RR = --
~
h.IN
II o i

l"Ollsidcrcl11os de nuevo el ejemplo 12.4. esta vez para estimar la :.;'


~
razón de riesgos. E! estimado crudo es (301204)/(211205) = 1.44. Con
una inspeccil)n visual es dificil valorar en qué grado está presente !a
confusión. puesto que los dos estimados específicos por estrato de la
~
razón tIc incidencia acumulada incluyen el estimado crudo, como se 6

muestra el1 la tabla 12.6. Aplicando la fórmula [12.11] y utilizando los ~

pesos l\llC sc l11ucstran en la citada t:lhla 12.6. se obtiene un estimado no


m c()nfundiuo p()r la cdnd. La varianza del estimado del t:recto es conside- ~

j
r~lhlemclllc m:is !.!rande en la cntegoria de edad más joven. justo al '.

contr~lri() dc I()s rcsull~ldos que se \'en en la tabla !2.5 para la estimación


(le la tlifl.rcI1tj~1 t.ll' I icsgos. Valores pequeños del riesgo llevan a estimados
est~lhlc~ dc 0¡111.lifl:rcnci:.l. pero inestables de su razón. Para !a estimación

'.a"l:I , 2.(,. 1;..\II1II(1(I(I.\'(..~I'('cífi(.(I.~ 1'(lr ('.~I'.(11n de la '.a:ón de incidenc;a


(1("/IIIIIII(1d(1. 111111r(1".\.f(),.",aC;()"c.~ 1(1.~arilm;Ca.~, var;an;:as y pesos
/,(I'.a (" /,nnling, (le In.~ (Itlln.~ (Iel ~ielllplo J2.4
,- --
Ed. d E~tim:\d() dc 13 razón Varianza Peso
Logaritmo
.1 dc incidcnci3 acumulada de In (RR,}
de O,
--
<55 1.81 0.59 0.31 3.25

~55 !.!9 0.18 0.09 t 1 ,6

B ,
:.
~: ,;::'

;lli~;:~1~¡[~~~.
;~:-.""*~-':
:~;;:;~

~
¡~~~.;¡;~~

:;;t¡:~~:.~:: ~~~~::"
~;.;~~ !2: :~~

212 EPIDEMIOLOGIA
MODERNA

de la razón entre riesgos, pues, se asigna un re~o rclalivame!1tc f!rande (I


1:1catef!oricl de edad más vic.ia. El nntilogclritm() de la medi:1 r()ndcrada
de los logaritmos de los estimad()s de la ra7.()n de ric~g() c~rccirico5 r()r
e~lrat() d(i cl c~timado con.iunt(ld(), quc es I.~I p:lra I()s d:llos dcl e.icmrlo I
12.4. L(I discrcpancia entre el e~tim(ldo crudo. 1.44. )' cl !1o-conrundido.
1..11. indicn 1:1 medida de la c()nrusión.

F..\"li/llllCi(1/1 PI(II/I(al C(II~;,111/(I(lll Jir('('I(III'('/'/C. (1(' 1('1 (,f('('/(1 ,m~f(lr(II(. ('(111


(1(1/(}.~d{' C a,\"(1-C(}111rnl ( (I (1(' PrCralrl1('i(ll, El pa r:i mctr() dc in tcré~ dcl
erccto. cuand() se tienen dato~ dc Cas()-c()nlr()l. es 1:1 ra7,Ón dc venla.i~\.
que ~irve com() cstimador de la razón de tas~\~ de incidcnci:l. E~ t:lmhién
la mcdida de intcrés cu~\nd() I() que se licllen s()n dato~ dc prev:llcnci:l
pr()venientes de estudios de sección tr~ln~\lcrs:ll. l()~ cu:lles. p()r la~
raz()nes que se dieron en el c~pítul() 6, dehcn f!eneralmenlc ser lr:ll:td('ls
c()ml' datos de ca~()~ ~' c()ntr()les. C()m("\ ~c di~cutí~1 cn cl II. J~I raz()n de
venta.i~1 puede t:1mbíén ser uliliZíld~\ com() un e~timad()r apr()Xímcltiv() dc
la razón de ricsgos o razón dc prevalenci:1~. a partir de lahla~ dc 2 x 2
con datos de incidencia acumulad:1 o de prev~\lcncia. en cuy() caso scricln
dc aplicación para el pooling las mismas rórmula~ que sc dan má~ ah~l.j()
para d..llos de caso-control,
r..lr:lla razón de venta.ia. coml' para ()lr()s e~timad()rc~ dc raz()ncs. cs
descablc una transrormación logarílmica anle~ dc p()ndcr:lr lo~ c~limCl.
dos e~pecírlcos por estral(), La varianza apr()ximada del estimad()
específic() por estral() del I()garitm() de la razón de venla.j:l (OR) e~
(woolr. 1954):

-+-+-+- [ 12.12]
a. h. (' d.
I I I ,

y por tanto, el peso es:

a.h,('.(f,

I
I I I I
\\"; = ..
a.h.('.
I I I
+ a.h.d.
I I I
+ a.('.d.
I I I
+ h.('.d.
I I I
I ~ + ..:.. + -
-+ h c (i I

aj i i [12.1~]

y el estimador conjuntado será:

6R = exp [ 12.14]

¿ \I'
i
.
Los datos de caso-control dcl ejcmplo12.5 describen una asociaci()n
cntrc el uso de c~permicida en torno al momento de la concepción y cl D
ries~() de sindrome de Down. El estimado bruto del erecto es

c,~c'
~~~i¡t¿¡~;
:t~~::;t¡~¡::
j~¡¡f~]~
;~:::~~~.:.~,;,;...\:~;;::::,¡~~~::r:

~
-.;,¡"':..-;,.;.;.;;¡.;
:.~~~:~k~ ~.
::f~t\
~~~¡I ~lf{t.~\\l%f~~\:;~
,- ili~.

i\Ni\LlSIS ES rni\ TlrlCADO 213


1

f.:jl.III'lffl 12.~. Ni,i".\. ,.",' './Ili"./II(.(I(/,1 1.(".'lí(/(.(/ (."/I!f(;/'ila .1' .\"í"dr(1/I'e (1(' D(1I1'/I.
/i",."/,, I' '"""/'.1'1,.\ "\.,t,',,"\". .\.('.I!'í" ('11,.\",1 ,1(' (..\""(.r,,,i(.i(la 1'(lr ,,(/rle de la ma(lre
,t,'/,'.\. ,1,' I,t 1"tl,",'I'(.i,íI1 .1' I(t ,.(1",1 tt""(".I"tl (./I I.I1'a'.l() ( R,tlhm(/l/. 1982 )

I:cl:lcl 111;llt'rll:l' " .t~


u
¡',
,
,,(, \Ic C.'SrCrlllicid:1
,

T 111;11
m
L~ Síll(lr 1\1111'

tic I ), '\' I) !2 4 4 12 16
( i \111 ..Clft... I(J I (l"l) I {,.' X(1 91 109 1.145 .254
1111:11 1(1 I.II(,X li) X9 95 113 1.157 .270

l'ahl:1 12.i. 1 \IIIII(lti(IX (.xl'(.(.ili/"(I.v l'(I(. (.Xlr(lln (1(' In rll:(jl/ tle venlajn C(}n

Ir(lI/vI(lml(l( 1'll/t..v Itll.'tIrill/lj(.(I.v. r(lrj(II/:(I.f .I' pe.fo.\" para el poolil/p,

tlt' 1(1.\" (ll11(1.~ (/(.1 (.;(.mpln 12.5


~~
Edad mat(.'rn:,1 1{;lZ(I" Jc Ll1gar~~I'o Varianza
Peso
\"cnt:\.i:1 de 01{; de In f6R;

'\~
0.46 2.20
1.54 0.65

(4. 11,~.'i1/112.I()I}) -'.5. 1.;1;lpliL"aL"il"' tic 1:1r()rmula [12.4], basada en loS


ci\lclll()~ tic 1:1 lahla 12.7. da un rcsllltadl) de óR = 3,8, lo que indica
sólo un gradu IT1l)dcslu dc cunfusi()n debida a la edad maternal en el
parto.

POOLIN( lJ.rll.IZ¡\NDO EL METODO DE LA MAXIMA


PROI~AI~I JI)l\f)

I La di5(.'u~i()11 rICIl¡1 del citado método de e5timación escapa al alcance de


este lihro: CIl mlll'lto5 tCXtO5 e5tadisticos se le describe adecuadamente.
En P(\(.':I'C; r:II¡II)r:ls. cl ahordaje implica especificar la ecuación de
probabilidad dc I()s Jatos como fullciún del parámetro de interés; el
estimad() tic mitxilna prohabilidad de dicil() parámetro es el valor de éste
que hace mits proh1lhlcs. hajo el modelo probabilístico. a las observacio-
nes que sc tiellcll 11 mano. L~l maximi7;~lciún se consigue habitualmente
mnximi7.:lntl() el I()garitmo de la probabilidad en vez de la probabilidad
misma. p()r4l1c los 2 máximos se dan en el mismo valor del parámetro y
el máximo del lognritmo de la probabilidad es. por lo general, más fácil
de determillar, H:lcicndo igu~ll a cero la primera derivada de la función

~:
-.~:~::;;:; ~:~. :;:~;:~~~;

.;~f{:!.::;~{~f~Y~.i~ .;~~{.~~',.~.:;~

jt~~" ~;~:.
;;"
:.~

214 EPIDEMIOLOGtA MODERNA

log-probabilidad. se obtienen una ecuación o conjunto de ecuaciones


que proporcionan el estimado de mi\xima probabilid:.ld dcl parilmctro.
Para la mayoría
reiterativa
de las aplicaciones. eslo requiere la solución
de una ecuación de alto orden o de un ~i~tema de ella~. l:.\rc.1
]
claramente de computadora y no de l&ipi7 y p.lpcl. Talcs complic&ldas
ecuaciones no implican ningún conjunlo direCl() de pe~os con lo~ que ~e
obtuviera la media de los estimados dcl efcclo espccífico~ por c~tr.\to.
pero la solución estil siempre denlr() de] rango de é~lOS y ~e comport¡¡
como si fuese una media pondcrada. en el ~cntid() de quc par.1 el
estimado del efeCl() se dan. apropiadamenlc. pe~o~ grande~ .1 lo~ e~tr.lto~
que tienen \'arian7..as pequeñas. Como contr.lp.\rlid&1 de la5 dificullade5
de computación. los eslimadores de máxima prob.\bilidad ticnen las muy

,
deseables propiedades estadísticas de tOdO5 105 e~timadore.c;. ser alta-
menlc eficiente~ ~. minimamenle sesgado~ a~inlólicamentc.
Una des\'entaja grande de los eslimadores directamente conjuntados
con.c;isle en que lo que se loma como pes() deJ pooling para cada estr.lto
es el inverso de la varian7.a del e~timad() del efect() para ese estrato.
como si únicamente se la hubiese estimado a partir de lo~ dalos del
mismo. Para datos con frecuencia~ pequeñas. los citados estimados de I.1
varianza. ~. por tanlo, los pesos pueden ser altamenle inex.\cto~. r&\ra j
datos que contienen una o más frecuencias cero. ciertamenle. algunos de
los e~timados de la varianza antes dad05 son infinitos. con I() que les ~
corresponde un peso de cero. Con~ideremos. por ejemplo. la fórmula 1
[12.12]. que estima la varianZiI dellogarilmo de la ra7.on de vent(\.ia para
una tabla de 2 x 2. Si alguna de sus cuatro celda5 e5 cero. I~\ fórmulcl da
un valor de infinit() ~. hay que a~ignar a la tabl.1 un valor también de ¡
cero. (Más al In. el logaritmo de 1~1razón de venl.l.ia para e~e estrato no
sería finit() con una celda de cero). Si la~ 'restante5 celdas ~on grandes.
habría una considerable cantidad de informació11 en I.1 labIa que se
perderia al asignar un peso de cero. rue~t() que 1.1razón de ventaja es o j
cero O infinito. que son las posibilidades más extremas. parece obvia-
mente incorrecto ignorar tal información. Una solución propuesta a este "
'
,.'. ~ problema ha consistido en modificar la fórmula [ 12.12] y. por extensión, ti
otras parecidas a ella. añadiendo un valor con~tante (habilualmente 0.5
'.

ó 1.0) a cada frecuencia ob~ervada (Haldanc, 1955) o !\\1~tituir la5


frecuencias cero. cuando se dan, por una const(lnte pequeña. Aunque n
esta solución mitiga el problema y elimina la dificultad de dividir por
cero, no supera completamente la inexactitud de los estimados dc 1(1
varianza para cada estimado del efecto específico por estralo, cuando D
algunas de las observaciones son pequeñas. Cuando alguna de las
frecuencias observadas es pequeña, es preferíble aplicar el abordaje de
máxima probabilidad. En lugar de tratar cada estralo aisladamente.
como hace el método dcl pooling directamente ponderado al asignar los
pesos, «ajusta» automáticamente las observaciones de cada estrato dc
una manera que integra la informacíón entre todos ellos.
En las siguientes secciones se presentan las ecuaciones de la estima- ü
ción de máxima probabílidad de una medida uniforme del efecto. En
~..1

:~~
.,,-~-
"~~:;,¡¡;;;;;".
-~::-

~
:~:~~\~~\~~
~

1
I\NALISIS ESTRATIFICADO 215

L':lda (;:I1i(). SC pllc(lc ()htcl\cr cl rcsultado cscribiendo la ecuación proba-


hili~tica dc los datos (;omo funcii)11 dc ul\a medida uniforme del efecto,
dc la~ ohscrv:lciollCS y dc cualquier p.\rilmetro de «perturbación» que
cstuvic~c impli(;ado y I\aciendo luego 1.1 derivada del logaritmo de la

prob.\hiliu.ld igual a cero.

I~..\"Iim(I('i(í" 11(' 1IIIi \. i,II(1 1".(¡/'(lhilid(I(1 (1(' 1Iil ~(c.('to /l11i/orl'1e (,011 datos

!)l'r,\"()II(I-1 i('II'I'().

I )II'I:.II.I'N( '1/\ I )1: I',\SAS I )1: IN<'II >I:NI 1/\, 1,&1cstimación de m{lxima pro-
b,lbiliJaJ llc la Jircrcllt.:ia tic tasas dc incidencia necesita la solución de
un COl1jUl1to Je et.:uaciunes que son Ull(l m{ls que el número de estratos,
,\dcm:'ls tic rcsl)I\'er la dircrcncia de tasas de incidencia (IRD), es nece-
~ario resol\'cr tamhicn el valor de la tasa de incidencia en el seno del
grupo 110 CXptlCSto Cll cada estrato. satisfuciendo las siguientes ecuaciones

tic prohahilitlad:

[12.15]

v. para calla cslralo

".
lli I
+ .~
~ = o [12-16]
1{01

donde íRo cs cl estim,\do conjuntado de la diferencia de tasas de


incidel\cia. R()i es el estimado de la tasa de incidencia entre no-expuestos
cn cl estr,lto i. y la forma de presentación general sigue el modelo de la
t,\bla 12.1. I~os estim,\dos { f<Oi} son estimados de parámetros de pertur-
b,1ci¿)n q\!C dchen ser calculados de cara a resolver el estimado que se
desea. IRa, Es conveniente comenzar la solución de las anteriores
m ecuaciones utilizando 1,\ tasa observada en los no exQuestos, dentro de
c,\da cstrílto. como v,110r de partida. pero el valor de Rol que satisface la
ecuílci()n puede diferir considerablemente del valor observado. La solu-
ción final de 1,1secu,1ciones [ 12.15]..1 [ 12.16] se consigue mejor empezando
con \!11 valor de ensayo para l-Rb. resolviendo repetitivamente para
c~\da l~"i y ev;llual\do luego el lado izquierdo de la ecuación [12.15]. Los
n valorcs de cnsayu repetidos de 1'Rb requieren cada uno una solución de
tipo reitcrativo (le la ecuación 12.16 en cada estrato, con lo que el
proceso gloh,\I. si no se lo lleva a cabo en una computadora, es
~ fral\camcl1tc tedi()~o.
Par,1 lo~ datos del ejemplo 12.2, 1,1solución de máxima probabilidad
de IRb c~ 5.91 x 10-4año-l, lo que está muy de acuerdo con el
9 resultado dircctílmente conjuntado de 5,95 x 10-4año-1, previamente
()htcnido,

..=":. c

':..;.:~.

;IJf;'

~
~.
j~:~~.

\~~~:~:~;.
:;;;:~:;;,¿;~::
...:...;,«~.~-=.

1¿~~~f~~~ ,-
?~~~i:'\:;;r~

I
2'6 EPIDEMIOLOGIAMODERNA
RAZÓN DE TASAS DE INCIDENC-IA. ~---
Para la estimación de máxima

probabilidad de la razón de tasas de incidencia (I R R ) no ha)' r()r mcdi(\


parámetros de perturbación. con lo que se obtiene el estimado mediantl:
la solución repetitiva de una ecuación única:

l ) .:.. ) 7 J

Para los datos del ejemplo 12.3, el estimado de máximcl prob.lbilidad


de IRR es 1.50. que es el mismo que se obtiene por pooling directo.
Cuando las frecuencias observadas son razonablcmente grandes. como
lo son en este e.iemplo. cabe esperar un bueIl acuerdo eIltre ambos
abordajes. Por otra parte, la escasa dispersión existcntc entre los
estimados especificos por estrato confina a todos los estimados con.iuIl-
tados dentro del mismo rango pequeño de valores posibles.

E.~limación dl' má.\"il"a prohahili{/ad dr un ~r('CI(1 Un~rnrl"r


cml {/aI0.~ {Ir incidrllcio nCU11llllll{!tl.

l)IFERENCIA DE INCI[)EN('IA~ AruMlJLAI)AS. La e~timaci()11 de milxima


probabilidad de ¡.1 diferenci.1 de incidel1ci.l~ acumul¡lcl¡l~ ( r~o¡ implica.
de nuevo. la e~timación de un conjunto de parilmetro~ de perturhaci()n.
el riesgo en el seno de los grupo~ n<,-expue~tos de cad.l estrato. Como
j sucedia con los dato~ persona-ticmpo. el nümero de ecuacione~ e~ uno
~ más que el de e~tratos: .
-
I i Roj +aj R D I ¡\! I i -a; :;=::: = O
[12.1 g]
; I -Ru; -RD
I
y para cada estrato i,

.ai ' hi Nli -ai ¡\'Oi -hi


+ = O [12.19]
ROi + RD ROi I -f<Oi -RD I -f<Oi

donde f<Oi es el estimado de máxima probabilidad dc l.1 incidellcia


I
acumulada entre no-expuestos en el estrato i y la presentación sigue la
forma de la tabla 12.4.
Si se resuelven para RD las ecuaciones anteriores utili7...mdo los
dalos del ejemplo 12.4, el estimado de máxima probabilidad de la
diferencia de riesgo da 0.034, que es virtualmente idéntico al valor
obtenido por pooling directo. El rango exlremadamente estrecho quc D
separa los dos estimados puntuales especílicos por estrat() asegura. en
este ejemplo. un buen acuerdo para cualquier estimador con.iuntado.
i
~
]
.;i:..
:~

1[.
~ii~~~:
fJ:
..~
;::.;;-,..'¡;;¡:;;j

~!¡~~,f~t
c..,
.~~::>~
~j,~ ':.~:
';¡.:;~ \~1\
:,~~~.
:;:~.~
~i1 ~~~;,i.;;;;.<.,~;.o:
~~

ANAliSIS ESTnATIFICADO 217

I{Ai'..'N 1)1: IN(.II)I:N(lAS A(.UMULAIM5. Para la cstimación de máxima


rroh;ll,ili(I:IÚ (Ic 1:1 raz()t1 úc il1cidellCia$ acumuladas (RR), otra vez el
ric~~() cl11 rc I()s 11()-~Xrllc~t(,~ dc cada C$lrato es un parámelro de per-
1IIrh:IL.ii)11 (IIIC (1(.I)c.scr cslim:ld(,. rcr() la $olución de máxima proba-
hili(I:I(1 1):lr:1 L':I(I:1 1~,li ,)('SCC 1I11a $()llICji)11 dc tjpo aproximado. condi-
L'i()I1:ld:1 I)()r J{ i~ .I~as Cl:II:ICi()11CS $011:

2. {~- (RR)R~II
o [ 12.20]
i

r :1< I t r:11

1{ I¿ )(I, Nli)
1?,

2( i{ 1{) I;

-.
ai + No; + (RR)(hj +

2(RR)7¡
[12-21]

La rcs()lucii)1l <.Ic estas ecuaciones de RR. utilizando los datos del


t:.icmrlo 12.4. d:\ un cstimado de máxima probabilidad de 1,31, de nuevo
idénlico al c~tjmado directamente conjuntado.

E,,"t;,lll1ri(;,l de 11/lí.\-i,lll1 !}rnhahilidalllle /(n efecto uniforlne con datos de


('(I,,"(}-('(}lllrnl ( (} lle pr('Valellcia) .La estimación de máxima probabili-
dad dc una razón de ventaja uniforme es la solución, m, a las
siguientc~ ccuaciones:

¡ a, -L a, = o [12.22]

La cantid:ld lil es el valor «esperado» de la celda a en cada tabla de


2 x 2. c.llculada como runción de la razón de ventaja. Para cada tabla
de 2 x 2. (ii pucde ser c~llculad3 a partir de la rórmula

ti [12.23]

d(\n<.1c la r(\rm;¡ de prescntación ~igue a la de la tabla 12.4. Si loS


nlII11Cr(\S <.Icntrll <.le un cstrato son grandes, la ecuación [12.23] puede ser

8
:~

~~ :ili¡
f;~;~
,'"","!:~
; :..

:(:~~i.
'~~~"';'i";~:!';' .~;:
~

218

6R = á¡t?¡
[I :?241
I;-;-¡;

en donde ú;. (,;. ti y (7;. son 1()5 víllore5 e~rer¡ld()5 dc I~I~ ccld;ls que ,';011
conrorme5 con la~ ecuacione~ [12.22] ~. [12.24] ~. c()n I()s 1()1¡llc5 m¡lr!!incl-
les de la tabla de 2 x 2 (Gart. 1970). Resol"icnd(\ la ecunción [ 12.24]
explicilamen\e para tli en término5 de 7;, ".. ;, ¡\1. j ~. 00 dn I
~

I
:;
.,
ái = ABS {ABSl~(~ + !\'11 + Af1i "

[ 12.25]

que es computacionalmente mucho más sencill;¡ quc I;¡ ecu;¡ci()n [ 12.2)]. .


La [12.24] representa la solución de máxima probabilidad de una razón de
ventaja uniforme basada en tablas 2 x 2 con dos binomiales indepen-
dientes: ta] solución «no condicionada» (está condicionada en un mar- I
gen de la tabla de 2 x 2. pero no en ambos) da por lo general resultados
casi idénticos a los que se obtienen de la dificil-de-calcular fórmula
condicional [ 12.23], excepto cuando el número medio de sujetos por
estrato es pequeño. En esos casos. el aborda.ie no condicional puedc
I
estar sustancialmente sesgado y es preferible utilizar el condicional o
el estimador de Mantel-Haenszel (Breslow, 1981; McKinla)'. 1978: Lubin.
1981). (La estimación conjuntada directamente ponderada es también
I
poco de fiar. como se dijo antes. si el número de su.ietos por estrato es
pequeño).
La estimación de máxima probabilidad dc la razón dc ventaja en un I
conjunto de tablas de 2 x 2 requiere uncl solución repetitiva dc Icl
ecuación [12.22]. emparejada ya sea con la [12.23] ó la [12.25]. ulili7~lnd<)
valores de tanteo para 1:1 citada razón de vcntaja ha~ta qllC Icl ecucl- I
ción [12.22] esté satisfecha. Para los datos del ejemplo 12.5, el estimada
de máxima probabilidad condicional de la razón de venta.icl (es decir ,
utilizando la ecuación [12.23] es 3,76; el no condicional (utilizando la I
[12.25] es 3,79. A pesar de las pequeñas frecuencias que tienen las celdas
de los casos y de una moderada discrepancia entre los estimados especi-
ficos por estrato de la razón de ventajCl (3,4 para las madres más j<)venes
y 5,7 para las más viejas), los dos abordajes probabilisticas prod\lcen
I
resultado~ casi idénticos porque el número total dc sujetos por estrCIto
es grande. Más aún, los citados estimados concuerdan en gran medid.1
con el directamente conjuntado para estos datos, que es 3.82. m

~
i~~;~:¡;;;::..::;.:;:~:::::.;::::;::¡"'.;;:::-¿;~:;::;~~;,;.;:,,;.
,...;t;;~.~..'.' ~ ~...~:;:...ó'~.'.'.;f:..

~~~\\~~~.
~.~;

1
..,
ANALISIS ESTRATIFICADO 219

POOLIN(i C()N ESTIM¡\DORES DE MANTEL-HAENSZEL

Malltc1 y 11:II.;IIS71:1 11959) l1an propllcsto una fórmula sencilla como


I.;slim.lc1clr 11c:1111;1r:IZC}11 uc vcJ1laja liJ1ifc)rmc CJ1 un conjunto de tablas de
2 x 2. I.~I cslimauor cs

] OR,\fll -
L.
i
(/jl(,/7;

[ 12.26]
I "\('\/T¡

Esta ri)rmula rerrcscnta lII1a medi:1 ponderada. sin transformación


logaritimica. de 1()s estimados especilicos por estrato de la razón de

I venta.j:l. COl1 lll1 pcso para cada estrato igual a bici/Ti:

11-tf.
I -! -!-'/I-l- = 11.d-
-'.;o!.

/I- ( '. 7: -r;


, I' I

Estos pes()s SO[} il1vcrsamel1lc propor<:i()l1l1Ies a la varianza dellogaritmo


de la razón de ventaja bajo la condición nula. Consecuentemente, el
estimador conjuntado de Mantel-Haenszel está ponderado de forma
óptima para los estimados de la razón de ventaja específicos por estrato
cercanos a 1.0. Su evaluación estadística teórica, con respecto al sesgo y
a la precisión. ha demostrado que es comparativamente mejor que el
estimador de máxima probabilidad (de las fórmulas [12.22] a la [12.25])
bajo UI}ll vllricdad de condiciones (Breslow y Liang, 1982). En tanto los
estimadorcs conjuntados directamente requieren frecuencias razonable-
~
mente grandes el} cada estrato. el estimador de ManteI-HaenszeI, como .'
¡;

loS coI}diciollados de máxima probabilidad, consiguen buenos resulta-


dos incluso si las frecuencias en los estratos son pequeñas, o si los datos
B contienen algún cero ocasional. Más aún. tiene la ventaja adicional de
ser extremadamente simple de calcular. Por ejemplo, el estimador de

i Mantel-Ilaenszel de una razón de ventaja uniforme para los datos del


ejemplo 12.5 se calcula como

I o R.\, "

Este resultadu es casi idéntico al estimado de máxima probabilidad (y al


m conjuntado dircctamente) pero es extraordinariamente más sencillo de
~
conseguir. Ltl combinación entre ser fácil de computar y poseer propie-
dades estadisticas deseables, convierten a este estimador en la elección de
~ prcfcrencia ptlra la mayoría de las situaciones en que se desea un
f
estimado de la razón de ventaja para un conjunto de tablas de 2 x 2.
Por analogítl con él, es razonable construir estimadores ponderados
~

~~." ,--

;~&Ir~¡~
~
..,.-, , c
;?':I¡ ..~~~':i-:~

III

1
220 EPIDFMIOLO(;IA MODERNA
~-

]
L a;I\III;/~
i
RRAf/1 = . [ 12.27]

\
J:-
¡
};
I\ .1
I;'
r:
I,

Esta fórmula es un estimador


tasas de incidencia
máxima probabilidad
unirorme
(Walker.
sencillo. no reiterativo.

1985). La fórmula
emplearse para incidencias acumuladas.
1981: Tarone. ]98]).
dc una razón de
casi tan eficiente como el e~tim.ldor
1~.27 tamhicn
dc
puedc
para ohtencr RRhf11 (Nurmincn.
,
Para los datos del ejemplo 1.:..3. la f()rmul.1 [ 12.27] d.1
1
(14)(1.70t)/(3.217) + (76)(2.245)/(3.194)
IRR~fl1 = = 1.50
(IO)(1.516)/(3.217) + (121)(949)i(3.194)
]
que es idéntico a efectos prilclicos tanto al resultado de m:lxima
probabilidad como al conjuntado directamente.
La aplicación de la fórmula 12.27 a los dalos del ejemplo 1.?.4 da

(S)(120)/(226) + (22XS5)/( 183) --


RRMII = (5)(106)/(226) + (16)(9S)/(183) .33

e) cual también está razonahlemente cerca de amhos.


~
Greenland y Robin.c; ( 1985) han .C;ll!!erido extender el mclodo de
Mante!-Haenszel a medidas de diferencia. La.c; propiedade.c; estadistica.c;
de los estimadores de Mantel-Haenszel para medidas de difercncia son
mejores que ningún otro abordaje cuando se tienen dalos muy escasos
'en los estratos. pero la varianza de sus medidas del erecto es mucho
mayor que la que se obtiene ya sea con el método directamente ponder(l-
do o con el de máxima probabilidad cu:.lndo lo.c;dalo.c; son (tbund(lntc.c;. I
Las citadas medidas de direrenci.\ de Mante!-H.lenszel no se cubren
aquí. n
u
Cm17f'rohació77 de 1{117if'(jt(!,\,i,\,e,\,tadi.\,tic(1 !7(1'.(1d(1f(1.~e.\,tr(1fif¡(.(1d(1.~

Pueden encontrarse ejemplo~ en los que el e~timado con.iuntado de n


la diferencia de tasas mueslre una asociación negativa. en tanto cl
estimado conjunlado de la razón de lasas la mostra~e positiva para
los mismoS dalos, lo que indicaria aparentemenle que no hay una B
perfecta correspondencia enlre las medidas de razón )' diferencia, con

¡~:;;;;¡:
'

-~

-~~
~" ""~..~-' ~f~l~
=:e-.'. ;t~~ ¡~~
~:.:.~,1%~~:ot~~~;~~.
:::'";:~::':~

;"'

ri
ANALISIS ESTRATIFICADO 22'

relación a la ausencia o dirección del efecto. Estas discrepancias proce-


~ den de la variacil>n introducida por los diferentes sistemas de pondera-
ción. " crectos dc c;omprobación de la hipótesis estadística. existe una
(;orresr<)I\Jcn(;i:1 tc<)ric~1de difercntes medidas en el punto nulo y, en
I COi\SCCUCII~i~l. s<,!o h(ICC falta c()l\sidcrar un tinico test de la hipótesis,
cualquicl'a 4uC sca 1.:1p:ll'(imctro 4uC sc Iltili~c par(l valorar el efecto. Los
test dc liS() i\1iis ~<)il\tlil cl)l'rcsp<)II(lcil ,II tip<) dc prucbas condicionales
I con dat<)s sil1lplcs <IIIC ~lSUmcn ya sca lll1 l\tlmerO fijado de casos para
datos de tasas de il\cidencia. o tolales m(lrginales fijados para las lablas
de 2 x 2. Estrictamente hablando. son pruebas de desviación -respecto
de la unid(ld-- de la razón de ventaja o de la razón de tasas de
I incidcnci(l. pcro son villid(ls como pruebas de la hipótesis nula, sea cual
rucrc la mcdid~1 dc intcrcs.
CI)n los <.I:ltos cstr:ltiric(ldos. resulta posible que el efecto pudiese
I variar sust¡lnci:llmcntc dc un estrato a otro. No obstante, la comproba-
cil)n dc la hipi)lC~is $e realiza generalmente con respecto a la desviación
glob:ll dc los <.I~llosen relación al valor nulo de no-asociación. Esto es.
I inclu$o ~i cl valor del p(lr{lmetró del efecto varia entre los estratos, la
comprobación <.lela hipótesis represent(l un test de desviación de alguna
medida global única del efecto respecto de su valor nulo: es conveniente
I \"cr este proceso como una puesta a pruebt1 de la desviación de un esti-
mado con.iunl~ldo del efecto respecto del vtllor nulo. Si los valores especí-
ficos por cstrato de 1(1r(l¡;ón de ventaja. O de la rozón de tasas de inciden-
cia. son idénticos. las pruebas descritas más adelante son extremadamente
I poderosas: en efecto. en la jerga estadística son «uniformemente las más
poderosas». lo que quiere decir que son las mejores pruebas posibles de
la hipótesis nula bajo esas circunstancias. Si los valores de la razón de
ventaja. o de Itl razón de tasas de incidencia. varían a través de los
estratos. es concebible que pudieran construirse pruebas especializadas
que fuertm más poderosas que las de desviación global respecto al valor
I nulo aqui descritas: esas pruebas especializadas habrían de ser diseñadas
para delectar un palrón particular de variación del efecto a lo largo de
los estratos. En general. no obstante. las pruebas de desviación de los
estim(ldos con.iuntados respecto al valor nulo siguen siendo válidas, pese
B a que teóricamente no fuesen las más poderosas que pudieran aplicarse
en una sitU(ICión dada. Desde el punto de vista práctico, por lo general,
no hc.ly otra tllternaliva úlil.
. En ciertas situ~lciones. resulta concebible que estimados de un erecto
pudiesen ser ruertemenle positivos en algunos estratos y fuertemente
negativos en otros. En tales circunstancias. el estimado conjuntado de
dicho crecto podría estar cerca del valor nulo, como resultado de
haberse equilibr(ldo las estimaciones opuestas del efecto en los estratos
individuc.lles. En esttlS circunstancias, la desviación global de los datos
~ respecto dc la condición nula tendría poco significado, en la medida en
que los estimados opuestos del efecto renejan una divergencia real del
ptlrámctro. cn vez de simplemente la variabilidad aleatoria del estimado
del cfecto en torno al valor nulo.

--
§
~~--., .
:;~:,
';;:;,;;

:~:;':i':,.'~~
i~~~¡~~:
~~~~~t~;r~~~~;:,#i1[:~j '".:

~
" ,,::;'"¡;:~::;";¡~~~
.~.. .,..:¡t.~~..0:..

1Jlt{i~~ :~~~;;~~~~1if~:

EPIDEMIOLOGIA
MODERNA
]
222

La comprobación de la hipótesis estadistica para dalos estratificados


representa una prolongación directa de las técnicas que $e aplican a
dalos brutos. Las pruebas exacta$ se ba$an en cálculos dc probabilidatlc!i
de un conjunto de estratos; la probabilidad de observar un con.iunlo dc
resultado$ e$ el producto de la probabilidatl dc cada un() tIc cllo!i.
con lo que la probabilidad de ob$ervar el conjunlo de ob~ervacione~ cn
los datos estratificados se calcula como el producto de la probabilidad
del resultado en cada e$trato. E$la últim~ prob~bilidad se determin~
utilizando el mismo modelo probabilislico empleado para los dalos
brutos. Aunque esta ampliación de la comprobación exacta a dato$
estratificados es conceptualmente simple. en la práctica el gran número
de combinaciones de resultado$ puede hacer las computaciones tedio$a¡;
de enumerar )' de llevar a cabo. exceplo si se las realiza con una
computadora.
w prueba$ aproximada" para dalo" estratificndo~ conservan la
forma general de la expresión [ 10.1J )' simplemente prolongan las fórmulas
para datos bruto$ que se dan en el capitulo 11. obteniendo los compo-
nentes del te$t estadistico (número observado de ca~os expueslos. nÚme-
ro esperado bajo la hipótesis nula )' varianza) a base de sumar las
1
contribuciones de cada uno de estos tres componentes sobre el con.iunlo
de estratos.

COMPROBACION DE HIPOTESIS CON DA TOS


ESTRA TIFICADOS PERSONA- TIEMPO
]

Con7prohoción de 17ipó1e.\'i,\' e.yac1o con da1n,~ e,~rrar~fi('adn,~ per,~ml(1-


riempo. Para datos estratificados. las probabilidade~ globales necesa- ~
rias para calcular los valores exactos dc p $on 10$ productos de la$
probabilidades obtenidas dentro de cada e~trato, El número total de
resultados posibles es por regla general grande. especialmente en compa-
ración con los datos brutos, lo que hace dificiles los cálculos del valor
J
exacto: de p para dato$ estratificados. En la práctica. rara vez se llevan a
cabo. A pesar de todo, los principios para obtener valore$ exactos de p
con datos estratificados son prolongación directa de los que son aplic;¡-
ble$ a los datos crudos y las operacione$ se pueden programar rilcil-
mente en una computadora.
La fórmula de probabilidad para el número de casos expuestos en un
estrato único es idéntica a la empleada con los datos brutos:

Pr(número de casos expuestos en e) estrato i = Gj) =

= MI j\(~\GI(&\"j
f,V"
aj )\ 7i ) \ 7i )
t ..La
..' .- probabilidad de que un conjunto de N estratos tenga exactamente
aj casos expuestos en cada estrato i, i = 1.2. ..., I\', es el producto de la

j
v. ., ... .

:~:.:':.:::r~:.~!~~:.~::~¡r~¡:ij:f;cl:~:i1
".

~~}~~:ftl~~;¡*o'!..
::f;
~
.:*';:i~~;
~~~\f)
¡1~~t~\V

¿ ~~~

ANAUSIS ESTRATIFICADO 223

probabilidad de ellcontrar exactamente al casos expuestos en cada uno


de dichos eslratos:

Pr(dcl conjunto de observaciones {UI}) = n ( M li


)( ~'
I~\ al J/ ,

[12-28]

Existe Ultil <.:iertil <.:()mplejidad en determinar qué resultados de los datos


se cOltsitlcril ig\I:1I dc cxtrcmos y m:ls extremos en relación con las
ob~ervilci(,I)cs r<.:il¡I:S. El prohlcma exi~e que se tengan en cuenta todas
las COlltbilt:l<.:i()III:S posihlcs tic valorcs para el posible número de casos
1 expuestos en <.:ada cstruto. <.:on el nllmcro en cada uno de ellos sujeto a la
limitn<.:ióll dcl ItlJllterO total de casos cxpuestos que realmente ocurrie-
ron en ese estrato.
Por ejcmplo. con$ideremos los datos presentados en el ejemplo 12.6.
I-I ay un total tle 16 casos en los tres estratos de edad, de los cuales 9 son
expuestos. El resultado más extremo. condicional al número de casos
I ohservados en cada estrato. seria que los 16 casos fueran expuestos, 2. 12
y 2 re$pectivilmente en cada uno de los tres estratos de edad. Considere-
mos lo~ resultados po$ibles pura que los casos expuestos fuesen 15. Hay
tres formas por I~l~ que 15 de lo~ 16 C~tSOSpodrÍan ser expuestos: el caso
no explle~to p()(lri;¡ caer en cualquiera de los tres estratos de edad. Estas
tres posihilitlatlcs corresponden a las distribuciones de casos expuestos:
1-12-2. 2-11-2 y 2-12-1. En la tabla 12.8. se da una enumeración
I completa de totlo~ lo~ posibles resultados. para al menos 9 casos
expuestos. Las 54 combinaciones constituyen los resultados de la cola
superior de lu distribución probabilística adecuada para comprobar la
I hipótesis nula de no asociación entre la categoría de dosis y el neopJas-
ma tiroideo. Para obtener el valor exacto de p en dicha cola superior
hay que calcular la probabilidad de cada uno de estos posibles 54
1 resultados según la fórmula [12.28].
Por ejemplo. la probabilidad de las observaciones reales 0- 7-2, se
~
~
~

calcula. de ucuerdo con la fórmula [12.18], así:

,) I 9.942

~~

1.530' n
= (0.8175) x (0.00054036) x (0,3501)
.'\.747)

0,000155

La suma de la probabilidad de todos los resultados de la Tabla 12.8 es


igual al valor exacto de p para la cola superior del test de Fisher,
comprobando 1.1llipótesis nula de no asociación entre nivel de exposi- t

'T~f.
-;-"
-~
:-~

~;;
~:
I!: ~~i';~

Ejemplo 12.6. ¡',cid",,(io d(' ",('nl'la,\"",f' tirnid('fl, .\,(,~,ill (,d(ld, ('II h(""hr(l,\
I'aro la,~ ".'"I"I(',\"ta,\" (/ "'(,1'0,\" d(' I(}() rll(I,I' a ""i,\ (1(' J(}(J r(l(1 (1(' r(,fli(lf'ifil/
( H('",l'eh"a,m ('I til, 197.~)

0-14 años 15-29 :,ñ()~ 30+ ¡lñOS


---

300+ <IOO 3()O + < I 00 3()(\.;. < 100


rnd rud rad racl r¡ld r¡ld

2 I 5 ")
á. ()
Ca~O5 o

Persona-años .054 9.942 2.665 15.410 2.217 53()

Tabla 12.8. Erll(1ci(ill d(' 1(¡(""," 1(1.\ cmllhill(ICiml('.v p(I.\.ihl('.v (1(' (.(1.~(¡.\ ('.\.p,,('.,"'(I.\,
pnr ("(1I(',I!(lrill.," d(' (,d(I(!. ("(II/ (l/lI/('lIV.V '¡"("1'(' ('(1.\.(1.\.('.\.pll('.\."I,\,
p(lrll 1(1.\' "(II(),\' ,,(,/ (:i('lI/¡1l(1 12.(,

Distribución Di~trjbucion Di~tribución


N." total de casos N." total dc caso~ N." lotal dc C.ISOS
de casos de ca~O5 eXpUC~IO~ dc casos expue~tos
expuestos
por categoría pnr cale~nrja exrue~los por cate~nri:\
expuestos explle~to~
dc edad dc edad uc cdaIJ

16 2-12-2 12 0-12-0 10 0-10-0

15 1-12-2 12 0-1 I-I 10 (1-9-1

15 2-12-1 12 0-10-2 )0 O-~-1

15 2-11-2 12 1-11-0 10 1-9-0

14 0-12-2 !2 1- I ()-I lO I-~-I

14 1-12-1 1:? 1-9-2 10 1- 7-2

14 1-11-2 12 2- I 0-0 10 2-~-O

14 2-12-0 12 2-9-1 lO 2-7-1

14 2-11-1 !2 2-R-2 10 2-6-2

14 2-10-2 0-1 l-O 9 0-9-0

13 0-12-1 0-1()-1 9 O-f'-1

13 0-11-2 ()-9-2 9 0-7-2

13 I-I :¡-O 1-10-0 9 I-~-()

13 1-11-1 I -9-1 9 I-i- I

13 1-10-2 1-~-2 9 1-6-1

13 2-11-0 2-9-0 9 2-7-0

13 2-}0-1 II 2-R-I 9 2-()- I

13 2-9-2 2-7-2 9 2-5-2

ción a la radiación e incidencia de neoplasma tiroideo. AIgehraicamente,


la probabilidad de la cola superior se expresa así:

[ 12.29]

H
f

¡.: I

.'

:...
,.~

'.¡:;o; ¡~~!~t~¡:
~
::¡;¡..:::~:',;,'::
:~=~~.~

r~;\~l~~~
~~l~~~\~\~
¿

J ANALISIS ESTRATIFICADO :225


--

ll(111ljc.:tii rCprCSl'111:1c.:1valor dcJ nllmero dc casos cxpueslos en el estrato


i, ti = LÁj, (I ~ Llli' y 1\11 = l:M1i. La suma de todas las proba-
hilidadcs Jc.: las <:(1111hinacioncs listadas en la labIa 12.8. es 0.000600.
Curiosamc.:11Ic, la s lIma dc las probabilidades correspondientes a las
9 comhinal:ioI1C.:s 4ue son juslo lan exlremas como la observación
re.ll con cxaclamcnlc nueve C.1SOScxpueslos. es 0.000522. casi tan grande
como la suma dc los 54 resultados obtenidos en la tabla 12.8. Si se
incluycn las nucvc combinacioncs con diez casos expuestos, la suma
aumenl,! hasta 0.000592. e incluyendo las posibilidades con 11 casos
expueslos sube a 0,000599. Está claro que no es necesario efectuar las 54
compulacioncs par.1 conseguir una respuesta suficientemente exacta
para cualquier inlcrprelaci()n cienlífica, ya que para el valor de p un
Jígilo Jc prccisi()n cs generalmente suficiente.
r.\r:1 c.:1 valllr cxal:lo dc l' dc la cola inferior del Fisher. que se
l'.llc\lI.lrí:1 1:\1:111(1(1 1:1 cfc<:lo clbscrvado es menor que-. el valor nulo. el
sumal()ri(1 l'S:

g VOj
.\1
[ 12.301
..I
7';

donde. de nuevo 1, = L. ki. y asi sucesivamente.


Para obteller el valor exacto de la media P. sólo debería incluirse en
cl sumatori() la mitad de la probabilidad de las observaciones tan
extremas como las observadas:
Probabilidad de la cola superior

[ 12.31 ]

Probabilidad dc la cola inferior

I "
Il~I i
)( '~
~
-Ln
2 k=n i=1 k.¡;
I I )
[ 12.32]
m
Para los dalos del ejemplo 12.6. el valor exacto de la media p
superior seria la milad de 0.000522. que era la probabilidad de los nueve
D resultados posibles con exactamenle nueve casos expuestos. más la
probabilidad de lodos los resullados posibles más extremos que nueve
casos expuesto~. lo que daba un total de 0.000078. Por tanto, el valor
~ exacto de la media p superior es 0.00034.

c V/l1prvha('itjl/ , .I/J'().\"i/ll(1(la (le la Hi,J(;'e.ris con Datos Estratiflcados


~ P('r.\,V/1t/- Ti('/1'l't) Para dalos estratificados. se construyen pruebas esta-

~
~
~

:.
,:1:?$~;~:;

~[
9 l~~~:r
\~ti ';,;,;

226 EPIDEMIOLOGIA
MODERNA

disticas asintóticas de acuerdo a los mismos principios empleado~ para


con los datos brutos. La variable del test sigue siendo el número de casos
expuestos, que es la suma de aj n lo largo de los estratos. La expectativa
nuln y la varianza de dicho número de ca~os expue~tos se calculan
dentro de cad.1 estrato )' estos resultados sc van sumando .1 lo largo dc
ellos. Así. la citad.\ expectativa nula parcl el númcro dc caso~ cxpue~los
es
I
)' la varianza. basada en el modelo binomial: I
.!\. 0 '

Var (A) = f ~1 J!"'~ , I

i= I T,

que da como prueba estadísticr1

L
".
ai -~
". .
!\'liM1i
1
1;1 I.L= I TI
x=
II
.
¡=~
M1i!\'Ji!\rOi
~.,-
!
[12.33]
i
\ i= I T~

La fórmula [1.:..3~] e~ idéntica a la [11.1]. parr1 datos brulos personn-


tiempo. excepto en que los tres componentes de la prueba estadistica se
obtienen sumando sus contribuciones especificas por estr.llo. a 10 1.lrgo
de los mismos.
Para los d.\to.c; del e.iemplo 12.6. la prucba e.c;tadística sc calculn como
I
sigue

A = non de casos expuestos = O + 7 + 2 = 9

E(A) 2 1[9%(
1.054 ) + (
12 18:075
2.665 ) + 2 3:'?:47
2.217 ( ) = 3,14

.
Var(A) 1.054
= 2 !6:9% ( )( !6:9%
9.942. + 12 ( 2.665 )(
"i8:¡j75 "i8:¡j75
IS.4101 )
I+

'+ 2
'. -3.747
(
~ )( ~'

3.747
) = 2, 16
, , , ,
, :
'Y , , ..
: , , C\ : ¡
,¡-; " ,,

A -E(A) 9 -3.1~ = 3,98 I


, .
xc=
¡Var (A) ~
B
~1

L ; 1
" 1

-~~--~ ,,~ --.,.-~-..,-


:

~
~;
~\~:~~~
~~1~1~ ¡l~
:$!oti':t*'
;:-;:.;~.;!i:j¡:t,

~
,,:;;;:'~;;:;;~:;:
,;..::~~:;~~...:0;-:
'c~"
~,
~~~:~:: :\~;::~:~:~;~;,;\~:
~l;i.r:~

ANALISIS ESTRATIFtCADO 227


~--- -~ ~-
'~1 lo que corresponde a un valor de p con una cola de 0,000034, o con dos
cola.<;. dc ().()()()()69.
El valor de l'. c:llculado a partir de esta prueba estadística aproxima-
da. lo mi.<;mo qllC cl valor exacto de P, es muy pequeño, pero ambos no
..7
d concuerdan en exccso. El valor exacto de la media p es cerca de 10 veces
la magnitud del valor de la p aproximada. La discrepancia proviene de
lo pequcño dc lo.<; númcros implicados, pero también está relacionada
con el hecl1o dc que la aproximación normal es más pobre en los
cxtrcm(ls dc I;l distrihuci(>n.
A pCS¿lr dc ()do. la comparación entre la prueba exacta y la
(l.<;inti>1ica pl(llltC:l I.l cuestión de la naturaleza de los criterios de
aplicahilid¿ld dc (lich:l prueba estadistic:l asintótica con respecto al
nllmero dc (lhscr\,acioI1es. No hay respuesta sencilla a esta pregunta.
pero h:ly <.¡uc rcc:llcar un punto importante: la condición de número
grandc Ilecc.<;ita aplicarse .<;(>loa los sumatorios implicados en la fórmula
[ 12.331. 110 a cada cstrato individual. Para datos persona-tiempo, pues. la
fórmula L 12.33] .<;cria aplicable incluso si cada estrato tuviese únicamente
un caso. con tal que hubiese suficientes estratos como para permitir que
la distribución dcl número tot.:11 de sujetos expuestos. en todos ellos. se
aproxim¡lse .<;uficientemente bien .:1 una distribución nonnal. La condi-
ción dc nllmero grande. necesaria para que la fórmula [ 12.33] fuese de
:lplic.\ci()n. pues. podria alcanzarse teniendo pocos estratos con muchas
oh~crval.:io!1cs c~ld;t uno. o muchos e~tratos con datos escasos. Con un
cstrato. dil.:lla f(lrmul;1 [L2.33] se reducc .ll¿l [11.1]. Un estrato sin ningún
C.lSO, L'.lreI.:C Jc iltr()rmaci(l!1 y contribuye con nada a A. E(A), o Var (A).
COI11() sc~ulldo cjemplo de aplic.tcii)lt dc I¿l fórmula [12.33], considere-
mos los d:II()s del cjcmplo 12.3. El gran número de casos en cada uno de
los estratos h:lce inneces¡lrio contemplar ninguna prueba exacta. El
valor de p puede det.erminarse como sigue (considerando el género
masculino como «expuesto»):

A = "." de casos expuestos 14 + 76 = 90

rn
1'.(
~ / I) = 24 (~'3,217) + 197
( ~
3.194 = 69,8

Var (¡1) = 24( I2T7


I.SI6 )( 3.217
1.701'
+ 19 7 ~ (
3.194 )( )
~
3.194 - 4
-7,1

90 69,8
x =
2,94
~ .fi7J
P(II = 0,0017

;;.i.!¡;~

~11tt.: ~~;~~¡
:."~:;:\'
;~~ ~~¡~
..;~"
!"..."'
.,.:"" ~~

E~
I

COMPROBACION DE HIPOTESIS CON DATOS


ESTRATIFICADOS DE INCIDENCIA ACUMULADA, DE
PREVALENCIA O DE CASO-CONTROL (TABLAS DE .:. x 2
c ()/)II)1'()ha(';(j/I tiC' II ;¡>(í1('.";,\' E,\.(I('1a ¡>(I1'a T(lhl(I,\. E,\'1ra1(lic'(lti(I.\" ti(' -"' x
]
2, Como con datos pcr~on,l-ticmpo. la comproh.\cii)n <.Ic la hipi)tc1\is
exact.l para t.lbl.\s dc :! x:! e~tratificad.l~ PllC<.1ccon~cgllir~c cnllmcr.\n.
do todos lo~ re~lilt.\do~ po~ible~ del nllmer(\ de caso~ explle~tos a i()
largo de los estratos, La prob.lbilidad COn.i\lnt.1 dc cad.1 combinacii)n sc
calcula como el producto dc las prob.\hilidadcs hipergeométricas dc
cada tabla de 2 x 2, El ,'alor exacto de p ~e determina de la mancra I
habitual. sumando 13s probabilidadcs de la cola dc la distribución, Se
consider.l que cada tabla de.:. x 2 tiene todo~ los [otales marginales
fij.\dos. Empleando la formí1 de pre~cntación dc la Tabl.1 12.4, tcndrc-
mos parn los v~lores de p de Fisher.

~
;J

I\. A' n; I
D
M1i -A
P'ik ~ tI) = \
12.35]
k~nl:\xf(J.MI-".1

(A¡.J
para la cola inferior. cuando cl estimado del efecto es menor que cl ví.\lor
nulo. Los sumatorios son k = }::;k;. donde kj es e) número d~ Cí.ISOS D
expueslos en cada labia de 2 x 2. ya. !\71 A'(). y M I se relicrcl1 í.1}::;(1;.!:!\1. ;.
~ !\7o;. ~. -I
~
/I1 .
""' j. respecllvamente.
Para oblener e) valor exaclo de la media P. s61o dchc ¿Iñí.ldirse í.11
~umalorio de I~I COI¿l I¿\ mitad de la proh:¡hilidad de los rcsult¿ldos igual
dc exlremO$:

!\'1
ml"I~.t.A/t
ki
~/I
. D
L 2.361
1 ..J
k=n+\

g
::~~
~]!z
',' >,-{, :.!
'::...:.:;:~~ ~
.-~

~:.;
¿l~~~:.: :ii#!
;:~:

J ~~Ii~ ..,
.:-.
.

ANALISIS ESTRATIFICADO 229


f

Probabilidad de la cola inrerior =

a-l N
+ I n [12.37)
k:m:lx(O.,\fl-Nn) i= I

f;
I
1 Estas f()rmulas pucden utilizarse para hallar un valor exacto de p
t
. corrcsp()ndicntc a los datos del ejemplo 12.5& Había cuatro casos
expuestQs en cl cstrato «joven» y uno en el «viejo». En el estrato joven. el
nllmero de casos cxpuestos puede oscilar entre O y 12 dentro de las
rcstriccioncs imptlcstas por los totales marginales. En el viejo. dicho
nllmCr() oscila cnlrc () y 14. En total hay 13 x 5 = 65 resultados
posiblcs para I()s dos estratos. De estas 65 posibilidades. 50 son separa-
ciones po~iti\':ts nl:ís extremas respecto de la condición nula: que el
resultad() realmcnlc ohserv:ldo: un total de 5 posibiJidades, incluyendo
los dato~ obscrv:ldo~. son igual de extremos. teniendo exactamente
cuatro casos cxpuc~tos. Estos 55 resultados. iguales o más extremos,
están enumerndos en la tabla 12.9. .
La probabilidad. en el ejemplo 12.5. de observar el resultado real se
determina como
f

P,idalos observados)

)c
.
(
b
~

I
Para los cinco resultados posibles que dan cuatro casos expuestos, las
probabilidades. en el orden en que dichos resultados se hallan enumera-
dos en la labIa 12.9, ,~on 0,0118, 0,0150, 0,0039, 0,0002 y 0,0000 {este
último es realmente 0,00000149), que totalizan 0,0309. E] total corres-
pondiente ptlra los resultados que dan cinco casos expuestos es 0,0066 y
~ partl seis CtlSOSexpuestos, 0.0010. El valor de la p de Fisher para la cola
superior de Itl distribución puede. por tanto, estimarse como 0,0309 +
0.0066 + 0.00 I0 = 0.0385. asumiendo que los resultados con más de
~ seis CtlSOS expuestos no contribuyen materialmente a la suma. La

rn
~

?~T:r~;'.::;."~

:;~f~:: 11
~
",'..",
~.,,~."

,
¡~l~~;t

." ",,-""- [.
r
]
230 EPIDEMIOLOGIA MODERNA

probabilidad de la cola completa es cn la realidad 0.03!{7. basada en las


55 posibilidades de la tabla 12.9. por lo que dar el corte después de sei,';
casos expuestos resulta razonable. Los) O restantes resultados. que dan
tres o menos casos expuesto,'; )' quc no estiln enumerados
12.9. son responsables. en tcrminos dc prob.lbilidíld.
en ¡.1 tabl.1
dcl I -O.O3R7. o SC.l.
]
aproximad.lmente el 96 por 100 dc la distribución: dc hecho. lo,';
resultados 0-0 )' l-o juntos responden dcl 54 por 100 dc l.1 distribución.
Para obtener el valor exacto dc la media I> par.l 1.1 cola superior I
solamente habria que incluir la mitad de la prob.lbilidad de conseguir
cuatro casos expuestos. lo que da un valor de I> de 0.0233.
I
Cmll"rohaciól1 a"rO.\"Í11lotlO tic 1(1 l,i,,()I(',\"i.\" ,,(lr(1 Tl1hl(1.~ E,\"I rl1I i(i('(1d(1." tic
2 x 2. La extensión de la f¿)rmula [11.6] a tablns e~tratifjcadas de 2 x 2
e.c:annloga a la extensión
antes. la contribución
de 1(1 [I 1.1] a datos pcr~ona-ticmpo.
a cada un" de los tre~ componcntcs
Como
dc] te~¡
I
estadístico -número de ca~os expucstos, cxpcctativa nula dcl númcro de
casos expue~tos )' varianza -se halla separadamente par:1 cada estralo y
.j

Tabla 12.9. Emml('rtl('i(;,1


(,.\PIIC',~IO.~. pnr Colr?oria
ti(' I(Jti(/,~ /(1.\: ('()lllh;,I(I('i(JII(',\:
ti<, rtltl(l. (,011 til,II('1/I),~ CII(/lrn
pn,\:ihl(',\:
('ti,\n,\
ti<, (,ti.\'(I,\:
('.\.pll(',\I(I,\
I
cnrrC',~pn1ldir1l1C',~ (I Jn,~ daln,\: (Jr/ ~i('mpJ(1 /:!...~

Di~trihución Di~t ri buci<'1l1 Di~lrihllción


N." lolal de caso~ N" 101:11 de ca~(1~ N." 101:11 dc ca~o~ j
0:
de casos expueslos dc casos ex pUC~1O~ dc c.."\~o~ cXpIIC~IO~ !.
expueslos por cale~orj:l ex rUeS1 o~ por C¡Ite!!(1ri¡\ expuc~IO~ por C&lle!!oria
de edad de cdad dc cdau ~
I

16 12-4 10 10-0 6 6-0


15 12-3 lO 9-1 6 5-1
15 11-4 lO 8-2 6 4-2
D
14 12-2 10 7-3 6 3-3
14 11-3 10 6-4 6 2-4
14 10-4 9 9~0 5 5-0 D
I~ 12-1 9 R-I 5 4-1
!~ 11-2 9 7-2 5 ~-:?
"' "
13 10-3 9 6-3 5 ,,-.'
13 9-4 9 5-4 5 1-4
12 12-0 8 8-0 4 4-0
12 II-I 8 7-1 4 3-1
12 10.2 8 6-2 4 2-2
12 9-3 8 5.3 4 1-3
12 8-4 8 4-4 4 0-4
7 7-0
n
1I 11-0
11 10- I 7 6-1
9-2 7 5-2
8-3 7 4-3
7-4 7 3-4
n
f] ¡.
u !

::.~:.::::c' :~~:,
~

.~I;t:~~~
;i>"'..."i*í:i'i'.'¡'.:- -
~:;t~~. :~;;::f¡;;:i~~;';;~~
:,:,;;; .;,;;,,;;

,:~~¡~~I;::

!D
"

ANALISIS ESTRATIFICADO 231

se suman luego a lo largo de ellos. Así, la expectativa nula del número de


ca~os expuesto~ es
o
I: .
.
~.
l:;
TJ
y la v,lrian7:a. has,ld,l en el modelo hipergeométrico, es

.
Var (A) = f ~ojM~
n j=l Tj(7¡ -I)
tJ
lo que Ja como prucba estadistica

u ~
L al -L
~ NIIM II
i=l i=l ~
X = [12.38]
I f
i= I
~liNoiM
Tt (~
1//\.{01
-1)

E! anterior test estadístico. propuesto por primera vez por Mantel-


I Haenszel en 1959 y que se conoce como prueba de Mantel-Haenszel. se
lIS¡l mllchl) CI1 an;'llisis epidemiológicos y otras ocasiones en que se
emrlc:ln tabl.l~ c~tralificadas de 2 x 2. Es óptimo en poder estadístico
I cu¡\l1do 1¡\ ra7.()n de ventaja es uniforme 3 lo largo de !os estratos. pero
~\dcmil~ e~ gel1eralmente 13 prueba más útil y conveniente incluso si
d icha r~\zón de ven taja varia a lo .largo de ellos. La X adopta un valor
cero sólo cu.lndo el estimador de conjunto Mantel-Haenszel de la razón
de ventaja (Fórmula [12.26J) se iguala 3 la unidad, con lo que la prueba
estadística pucde ser considerada como una prueba estadística de la

I desviación óR,\I". respecto de la unidad. La condición de aplicabilidad


de nllmero grande no está referida a los estratos individuales. sino
solamente a lo~ sumatorios de la fórmula [12.38]. Los citados estratos
individuales pueden tener cada uno tan pocos sujetos como un par de
~ ellos. siempre que ningún total marginal sea cero; si el total marginal es
cero. el estrato Carece de información. La prueba estadística será
aplicable si existe un número suficiente de estratos, incluso con datos
I escasos. Como veremos en el capítulo 13, esta prueba es la que se aplica
inclu~o rara cl al1:llisis de datos ápareados.
L.l 11ir(¡tcsis nula de no rclación entrc tolbutamida y muerte estudia-
R d¡l cn cl Programa de Diabetes del Grupo Universitario con los datos
estratificados por edad del ejemplo 12.4 puede ser evaluada con la
prueba de Mantcl-Haenszel. El número de casos expuestos, donde
~ «expue~tos» indica terapia con tolbutamida, es 8 + 22 = 30. El número
esperado btljO la hipótesis nula es
c't,¡¡j.".";.::'

~ E(A) = (106)(13)
+
(98)(38) = 6,10 + 20,35 = 26,45 ,
226 183

R
U
.

::,.:" ;?o",

.~~.
,
::;'.- ,~,..:.. :::',!:-:'

~
;~.

~ ;w81
r
232 EPIDEMIOLOGIA MODERNA

)' la varianza del nilmero de casos expuesto5

Lu prueba cstudistica es

~o 26.45
~=
.09
,\i) 0.60

que da un \'alor de p con una cola de 0.14 ~. un valnr dc " cnn I:lS dns
colas de 0.28, Nótese que, pue$10 que la tolbutamida era considerada
comC' un preventivo de las complicacione.c; de la diabetes. la.c; ~eraraciC'-
nes respecto del \'aJor nulC' se esperaba que ocurriesen en la direcci()!l
opuesta. Por Jo tanto. el valor de p de una cola dcberi.l corre~pondcr
teóricamente a la cola inferior de la di~tribución. en la dirección de
prevención. en lugar de a la superior. Como 10$ datos demuestran una
asociación positiva entre tolbutamida ~' muerte. el vaJor de p de una sola
cola debe ser 1 -0.14 ó 0.86. EJ valor de p de dos colas e$ 0.28. sea cual
fuese la dirección de la expectativa previa acerc.l de la.c; dcs\'iaciones
respecto deJ valor nuJo.
Si se apJica la prueba de ManteJ-HaenszeJ a lo.c; e~casos dalos dcl
ejemplo 1~.5. la prucba estadistica es

lo que da ?(1) = 0.008, Un resultado que es considerab1cmenle direrenle


del valor exacto de la media p de 0.023. La discrepancia no es
sorprendente. a la vista de lo pequeño de los números )' de la llamativ:l
asimetria de la distribución. en la que más de la mitad de la distribución
probabilistic.1 corresponde a los dos resultados más extremos, de entre
las 17 posibilidades para el número de C.lSOSexpuestos. I
lnl('rvaln.~ ..le Cmrfial1Za para e.~IÍ1"ada.~ ('0I~;,I1'ladl1.\, dC'1 ~fe('I(1

Los inlervalos de confianz.1 de e"timados conjuntados dcJ crcclo pucdcl1


calcularse exactamente. a partir de modelos estadisticos adoptados para
describir la vari!lbilidad de los datos. o pueden calcularsc de modo
aproximado a partir dc fórmulas asintóticas. Los cálculos exactos son
extraordinariamente complicados y aumentan rápidamentc en dificultad
conrorme se incrementa e) número de observaciones. No obstante, la

.(.::

;~¡¡~¡i;¡~1:'
.;;.-:-:~, :;-t..
':.
f""~,;,;,~r:"~; ,?;* ¡~~~;~;;;J;~::;¡:;~
,*!:>::;::W'l~

~~ill~:~~~!~i:.

~
ANALISIS ESTRATIFICADO 233

fácil disponibilidad de microcomputadoras en la actualidad hace conve-


niente en muchas situaciones e) cálculo exacto de los límites de confianza
de los estimados conjuntados del efecto, puesto que los requerímientos
de programación y memoria no son grandes; el tiempo empieado en )os
cálculos sí que puede ser largo aún lenicndo una computadora, pero el
coste de tiempo de )a computadora para tales aplicaciones se está
hacíendo ahora ínsígnificante. A )a vista del re)ativamente gran esruerzo
que se emplea en la colección y procesamiento de datos epidemiológicos,
parece que vale la pena obtener límites exactos de confianza de datos
escasos, incluso estratiíicados, si se tienen a mano los medios para hacer-
lo. Consecuentemente, en la siguiente discusíón se presentarán rórmula~
exactas para )os limites de confianza, siempre que sean aplic.tbles.
Para )a mayoria de las situaciones, por contra, será preferible para el
cálculo de los límites de confianza utilizar las directa~ y convenientes
fórmulas no iterativas. La elección de una rórmula. aproximada de
estimación del intervalo depende generalmente del tipo de estimador
puntual utilizado, puesto que la aproximación de la varian7.a depende de
cómo se calcule el estimado puntual. Por ello, la descripción de los tipos
.de límites de confianza aproximados se presenta de acuerdo a los tiros
de estimadores puntuales conjuntos descritos con anterioridad en este
capítulo.

INTERVALOS DE CONFIANZA PARA DATOS


ESTRA TIFICADOS PERSONA- TJEM PO
Diferen('ia de 1(1,\,a,\,dc Incidencia, No exisle un mclodo para ohlcncr
los limiles exactos de conlian7.a de una dircrencia de tasas de incidenci:l.
porque el número total de casos es indcpcndicnlc dc la citada dircrencia
entre las tasas, Limitcs aproxim(ldos sc pucden ohlencr dc distintas
maneras. según el método de estimación puntual, .

~TIMAl)O PUNTUAL PONI)ERAOO OIRl:\TA~'rNl1:. El abordajc bilsico


se basa en la regla estadislica gcllcral dc quc la Vari¡¡n7..1 dc lin.1 sum.1
de variables alealoriJs independientes es la suma dc 1.1varian7.1 dc Cíld.1
variable aleatoria. O.ldo que el estim.ldor directamente conjunt.ld() dc
la direrencia de tas(ls de incidcncia es una Sllm(1 de v(lriClhlcs (11cCItoriCIs
(Ios estim(ldos especilicos por e~tr(lto de 1(1 direrenciCI de t(l~(l~ dc inci-
dencia) multiplicadas por una const(lntc (el pc~o para el conjllnt(ld()).
varianza total del estimador conjunl(ldo sería:

N 2
"'1
~ L
1=I

~
;::;.~J~.~~~~:¡i:.\\~;:.~~::~,~ ~

::..

'!it"'!
r
234 EPIDEMIOLOGIA
MODERNA

El peso está elevado al cuadrado porquc cucllquier rnullipliccldor con~-


tante de una variable lo está como mullipliccldor de la varianza. Cada
peso, 'I';, se toma como el inverso de la varianw de IRD; en el pooling.
con lo que la varianza global es

\J~lr (dc fRb col1jul1l:lUO) (

-\"' "' ~I j, -I I ~Ii -


-L... 2- 2- [ 1:?.39]
j=1 (~ "i) (~ IIi) ~ II';
"-
I

Esta varianz;a puede utilizarse con el estimador COtl.iUlltado y la fórmula


[10.2] para computar limites de conrian7...1 aproximados.
Consideremos e) estimado coniuntado de )a direrenci:l de ta~a~ de
incidencia de los datos del e.iemplo 12.2. 5.95 x 10-..año- J. De la
ecu3ción [12.39]. la varian~ del estimado es 3proximadamente el inverso
de la ...urna de los pesos. o

1/(65.16 x IO6año2) = .5.15 x 10-8año-2

I() que da una de$viacil)11 e$till1dar de

."'
I
9 1() -4 --I
"\11.535 >: JO-¡;añ()-2 = .-., X Un()

Un inter\'alo de confianza. al 90 por IOC. del e$limado con.iuntado ~e


puede obtener como
D
5.95 x )()-4año-1 = 1.645(1.239 x )0-.1 año- 1} =
= 3.9 x 10-4año-l, 8,0 x 10-4año- I n
u
Un segundo método de obtener limites de confianza aproximados para
diferencias de tasas de incidencia consiste en computar limites b:l$ados
en el test a partir- del estimado puntual y la X de la fórmula [12.33). D
utilizando la fórmula [ 10.6). Para loS datos del ejcmpl() 1~.~. 1,1X c~ 3.319.
dando. para limite's de COnfi¡lnZ¡1 al 90 por 100:

IRD(I :t Z/X} = 5,95 x 10-4año- 1(1 :t 1,645/3,319) =


I
=
30
., x
10 -4-
ano,
-I 89
.x
10 -4-
nn()
-I

D
resultado mil~ amplio que el obtcnido arriba. El abordaje basado en cl
test produce res.t)ltados amplios porque n(l asigna un peso extrcmada-
mente grand~ al estrato de edad más joven, como hace cl método D
directo; los pequcños números del citado estrato de edad más joven dan
como resultado una varianza pequeña de la diferencia de tasas de
incidencia esti~nada a partir de ese estrato. B

u
J~.,:~'"~:

;~.,:c -',,'
:~t::;~,:.~::::

~
c .,:~~~',';:,*~~;.,:
'.;' Ot:.;~..S%'
'i;...i:!::.;].:;..

¡.~~~~ --

p ANAliSIS ESTRATIFICADO 235


l ~~

1:'C;TI~1AO()PUNTUAL OE MÁXIMA PROnAmlLIDAD. La estimación de


rni1xima probabilidad de IRb requiere la estimación simultánea de
mi1xima probabilid,ld de los parámetros de perturbación Rol de cada
estrato. Dichos estimados ajustados o suavizados de Rol pueden ser
utiliz.1dos en COlljuIlción con el estimado conjuntado de IRD, para
D conseguir un estimado mejorado de la varianza de la dif~rencia de tasas
de incidcnci,1 en ca<.1,l estrato. sustituyendo hi/Nol por Ro'. y a,/Ntl por
R()j + IRb en 1,1fórmula [12.1]. El estimado mejorado de la varianza es

Rol + IRb Rol


V:lr IIRn.\
' 11 = N" +.No,
-.rl2.4ol
n
u
L.l v.lrianz.l total del estimado de máxima probabilidad conjuntado
puede obtenerse tomando los pesos así:
u N,iNo1
\1' = N()I({(Oi + 1'Rb) + Nti({(OJ [12.41]

quc cs el reciproco de la varianza de la fórmula [12.40]; estos pesos se usan


luego para ohlener la varianza global. como en la ecuación 12.39.
Para lo.,\ dal()s dcl ejemplo 12.2. los pesos eslimados de acuerdo con
ILl f¿)rmllILl 12.41 son. desde la calegoria de edad más joven a la más
\'iejLl. 57.6 x 1()haño2,4.9 x 106año2. 0.7 x 106año2 y 0.2 x 106 año2.
L..l suma dc cslos pesos es 64.1 x 106año2 y, por tanto, la varianza se
hLllla: .

-1 6 -8- -2
Var (IRD) = 64 0 6 -., = 1,5 x 10 ano

I ,1 x 1 ano.

que es un valor cercano al de 1,53 x 10-8año-2 obtenido de los pesos


directamente conjuntados. Un intervalo de confianza al 90 por 100 para
cl estimt\do de m¡lxima probabilidad de 5,91 x 10-4 años-1, se obtiene
hallando:
~ -
~ 5.91 x IO-4año-1 :1:: 1.645 {J1.56 x lO-8año-2) =

= 3.9 x IO-4.año-1 8,0 x 10-4año-

qllc es virtllalmclllc iuéntico a los límites obtenidos a partir de los pesos


lililiwdos en cl p()()ling directo.

Ra;lí,l ti(, Ta.\"a.\"ti(, ¡,lcitlellCia. Los limites de confianza del estimado


conjunt.\do de 1.\ razón de tasas de incidencia a partir de los datos
e~tr.ltific.\do5 puedcn obtenerse por computación exacta o por métodos
m .lproximado5. IJ.\ computación exacta requiere el cálculo reiterativo de
una complic.\da suma de probabilidades y, consecuentemente, disponer
m tic una comput.ldor.\.

..
rn
~~.
~
¡,::
i~~V~~
..:.: c
.;:::~; ~{r~\~¡~..¿:¡..~

~
~. ;;,~;.,;.,.

236
LiMITE.~ DE \ONFII\NZI\
EPIDEMIOLOGIAMODERNA
EXl\rlO()5. La ohtcl1ción0- --0de limjtc~ dc COnfi.lnZ(\
r
exactos requiere que la probnbilidad de In cola tic la~ ob~ervacione~ ~C.l
expresada en términos de razón de t,lsa~ dc il1cidenci.1 (I R R )o En cl
e~trato i vamo~ a llamar I(; a I~I prohnhilidad dc quc un C.I~O ~C;I
expue~too De la rórmula [ 11.9] o de In [ 11.1 OJ. ~c puede Ohlcncr la ~i~ujcl1.
te rel(lción:

= [12.42

,,:

Los límites exactos de Fisher para 1RR e rrm r>tleden delermil1ar~c (1


partir de la fórmula [12.42] ~. dc lu modificación siguiente dc la [1:..29]

Al I '.'
¡\1
IXI2 = I I
k 1!, [12.43]
k=1I ;= I

'.'
M,
M
1 -a!2 = \ \
;)ki(l -11 2.44
~ .L-
k=a+ = I k.

en la que k represent(] el nümero de casos expuestos en el estrato i.


k = Lkj.a = LajyM, = ~"fJj.ElvalordeIRRquesatisfacelasecuacione.<;
[ 12.42] y [ 12.43] corresponde al punto de delimitación exacto del limite de
confianza inferior de Fisher: empleando la ecuación [ 12.44] en lugar de
la [12.43], se obtiene el superior. Los limites exactos de la media p pueden
obtenerse agrupando en la cola sólo la mitad de las probabilidades de
k = a:

,. I.'
...,.. --
'u.
-I

+ U.
-I
) MI;-k

[12.45]

lo que da el punto limite inferior y sustituyendo a/2 por I -a/2 se saca


el punto limite superior.
Con ayuda de una computadora, pueden calcularse los límites de
confianza exactos al 90 por 100 de la razón de tasas de incidencia.
empleando los datos del ejemplo 12.6. El intervalo al 90 por 100 tipo
Fisher es de 2.43 a 18.0 y el intervalo al90 por 100 de la media P. de 2.71
a 16.0.

-.
:-,~.
.;.~,:,;~.
,:~.~~~::

~~
~~~*

~::::~,..; ;:Á'--- ~~-

ANALISIS ESTRATIFICADO 237

l.iMI'I'I:-~ I)E ("()NI:IANZA APROXIMADOS. La rorrnulación de los limites


~1
;trroxim:ldos tic los trcs dircrcntcs tipos de estimados puntuales es corno
SlgllC:

j
..J 1, !.:.~\.(;,II(I(/(1¡>,111(11(1/!);r('('((IIII('II((' Pml(/(!r(I(/n, La varianza de la ra-
Z()1l dc la.c;a~ de iltciueJtcia direclamelllc colljulllada debe ser estimada
Ira.c; llevar a cabo lJlla lransrormación log,lritmica. de modo que los
limite$ puedan ser colocados en dicha e.c;cala. La rórmula de la varianza
$e parece a la [ 12.39]:

Var :In (de líiR conjuntado}J = [12.46]


I IV¡

u donde

a.h.
= I I
[12.47]

P:lr~l los d~llOS del ejemplo 12.3. II = 140/24= 5.83.1~'2= 9.196/197=


.¡6.7. v

1
Var [In (de IRR conjuntado,J = I = 0,019
5,83 + 46.7

El estimado puntual directamente conjuntado es 1.50. dando un inter-


valo de confianza al 90 por 100 de

,645 JO,O19] =
exp [In .50) :t ,20, ,88

1. E.~{inl(I(I(} PIf/I{II(l1 (1(' ,\1á.\"im(1 Prohahili(lad. El estimador de máxi-


ma probabilid.ld de la razón de tasas de incidencia que es asintótica-
mente eficiente posee un estimado de la varianza de

~ íRR
Var (IRR) = [12.48]
f ' J\1liNo'/N li

i= I !
)2
m ~
Nl1

Para aproximar la varianza de In (fRR), es necesario dividir lo anterior


por (IRR)2:

I
Ví.lr [In (ffiR)] = [12.49]
M I/NoJN1/
~\2
~ NI,}

I ~ ,.

-
-~ .1f¿, ~...:.~,.:-.-;.~,.í'::..~~ ~
.,,~&:.;
.~1¡
;;~~~~~t:lj~~~i~@~~f:~~~~ ~:~::;: ~:

~~i
~f:\i~Th\f~\ ~itl\~
~

236 EPIDEMIOLOGIA MODERNA


-
La fórmula anterior es idéntica a la fórmula [12.46], si (íRR) Nti!"'O; fs,
sustituye a a¡lbi, en el peso dado en la fórmula [12.47]. j~S
ulT
Para los datos del ejemplo 12.3, el estimado de máxima probabilidad
dic
de IRR es 1.50 y la varianza de In (IRR) es -1

lal
c 0.019

COl

J )~

~
-01

lo que da un intervalo de confianza al 90 por) 00 de

exp [In (1,50) :.t 1,645.fi5J5f9J = .20, 1.88


Te

Este estimado del inter\'alo es virtualmente idéntico al que se obtu\'o por '}1!
foI
el método directamente ponderado.
] 6.
Para los datos del ejemplo 12.6, el inter\'alo de conrlanza aproxima-
do al 90 por 100 en torno al estimado de máxima probabilidad de IRR.
que es 6,55 es Qe 2.77 a 15.5, lo que concuerd3 bastante bien con el
intervalo de la media p exacta al 90 por 100. de 2.71 a 16.0. IN

3. Estimado Puntual de Manlel-Hael1.~zel. E] estimador Mante]- 1(


Haensze] para la razón de tasas de incidencia (fórmula 12.27) puede D(,
considerarse como una media ponderada de los estimados específicos " } 10

por estrato de la razón de tasas de incidencia, con pesos iguales a : n-

hiN 1ii Ti y los límites de confianza aproximados calculado~ sobre esta úC

base. Sin embargo, puede calcularse para la \'arian7.a una fórmula más G r
estable considerando cada ai y b; como una variable de Poisson \ n
..'
independiente (Tarone, 1981), o considerando que cada ai es una
variable binomial independiente, condicionada a "1 I i {Greenland y
~ir
Robins, 1985). Este últim~ abordaje conduce a ~sr
~~

[ 12.50]

:J o
Para el ejemplo 12.3, la fórmula anterior de Var [In (úi:R}.(1/)] = 0.019, :.
¡.

el mismo resultado que se habia obtenido utilizando anteriormente el


procedimiento de ponderación directa. El intervalo de confianza resul-
tante, 1,20-1,88, es igualmente idéntico al intervalo del estimado puntual i.J
directamente ponderado.
Es posible también obtener limites basados en el test para los datos
rJr,3
del ejemplo 12.3, con el estimado puntual de Mantel-Haenszel (1,50) y la
~.
estadistica X de la fórmula [12.33] (2,94):
e$t
r"
¡ j st
,50(1 f 1.645/2.94) = 1,19,1,87
.:c

-,

::i~;::~i::;~¡;~;t::~
:;¡ipj;,.¡;:;r.~.,;(,*;

f,- ¡*J~*~~~~
ANAlisis f.sTRATIFICADO 239

Estos limites basados en el test están en buena concordancia con los


resultados obtenidos con otros métodos. Para el estimado puntual
directamente ponderado, también se puede obtener limites basados en
dicho test.
Para los datos del ejemplo 17.6, donde IRR)f" = 7,30, la varian7..a
calculada con la fórmula [12~0] es 0,344, lo que da un intervalo de
confianza al 90 por 100 para [RRMII de 2,8 a 19. Para los mismos datos,
los limites de confianza al 90 por I 00 basados en el test puede calcularse
con una X de 3,98 como

7,3QfJfl.64"3.981 = 3,2,17

Teniendo en cuenta lo pequeño de los números implicados. ambos


intervalos aproximados tienen una concordancia razonablemente buena
con el intervalo de confianza exacto al 90 por 100 de la media P, de 2.7 a
16. .

INTERVALOS DE CONFIANZA PARA DATOS DE INCIDENCIA


ACUMULADA ESTRATIFICADOS

Dif('r('1Icia dc Ric.\go. Dcbido a la prescncia del parámetro de pertub¿l-


ción. R()i. en cada estrato. no cxiste procedimiento alguno para obtel1er
límites de confianza exactos de una diferencia de riesgos o una diferel1cia
de prevalencias conjuntada. Sólo se pueden obtener límites de confianza
aproximados, mediante métodos análogos a los descritos anleriormel1te
para datos de tasas de incidencia.
ESnMAou J'UNTUAL 1JIRI;(I-AM[;NTE r()N/)[;RA[)O. La vS\rianz¿1 de la
diferencia de riesgos conjuntada puede expresarse en términos de pesos
especificos por estrato. en la misma forma que se utilizó para datos de
tasas de incidencia {fórmula 12.39):

Var (RD conjuntada) = [ 12.51]


Illi

donde los pesos son los qlle se dieron en la fórmula J 2.7

N3 AI3
w =
Jj/'OI
I N~/a,{N11 -aj) + N:1h~Noj -hJ

La raíz cuadrada dcl anterior estimado dc la varianza de la fórmula


[12.51] puede ulilizarse con la fórmula [10.2] para obtener limites de
confianza aproximados. En el ejemplo 12.4, los pesos específicos del
estrato son 1,009 y 280 (Tabla 12.5), de modo que L"I = 1,289 y el
estimado de la varianza sea 1/1 ,289 = 0,000776. La raíz cuadrada es
~

240 EPIDEMIOLOGIA MODERNA l


0,028, con lo que un estimado del inter\'alo de confianza al 90 por 100.
empleando el estimado puntual ponderado, de 0,034, sería

0.0.14 :t
.645(0.028) = -0.012. O.ORO

Una alternativa consiste en utilizar límite~ dc confian7.a ha$ados en cl


test (fórmula 10.6), apoyándosc en la X dc la rórmula 12.38. Para los
datos dcl ejemplo 12.4. la): es 1.09 ~. el intcrval() de c()nfianzí1 en
cuestión: l
0.034( :t .645/1.09) = -0.017, O.OR6

que es ligeramente más amplio que el que resultó cuando se utilizaban


los estimados dt: la varianza espccirlca por estratos.

ESTIMADO PUNTUAL DE MÁXIMA PROnAm!.1nAD. De nuc\'o. las solu-


ciones del máximo de probabiliqad para el estimado con.iunt(ldo RD y
el riesgo en los no-expuestos ROi de cada estrato, pueden emplearsc
para mejorar la estimación de la varianza de la direrencia de tasas en
cada uno de dichos estratos. Los estimados me.iorados pueden obtcnersc
sustituyendo ROi por h;!¡\.o; y ROi + RD por aj/¡\'I;: estas ~ustitu-
ciones pueden hacerse directamente dentrC' de la fórmula [ I ~.7]. dando
los pesos me.iorados siguienles:

"'liNOi
w =
¡..'TOi(Roi + RD)(l -ROi -RD) + ¡\'liRoi(l -ROi)

[ 12.52]

que pueden usarse en la fórmula [12.51] para obtener un estimado de la


varianza del estimado de máxima probabilidad de RD.
Con los datos del ejemplo 12.4, para 105 estrat05 1 )' 2 respectiva- j
mente. los pesos calculados con la fórmula [ 12.52] son 1.008 )' 280. 28 que
da una varianza de 11(1,008 + 280) = 0.000776. Nótese que los
estimados de los pesos y de la varianza son casi idénticos a los
resultados obtenidos por eJ procedimiento de ponderación directa no
repetitiva, porque el número de observaciones dentro de cada estrato es
grande. El resultante intervalo de confianza al 90 por 100 es -0.012,
0.080, como lo fue con el método de ponderación directa.

RaZÓll de R;('.\'go. Los limites exactos de confianza para la razón de


riesgo no son calculables, puesto que la ecuación de probabilidad
contiene los parámetros pertubadores, f<o;, para cada estrato ;. Si lo~
riesgos son pequeños, no obstante, la medida de razón de ventaja puede
emplearse para aproximar la razón de riesgo. Como la razón de ventaja
puede estimarse sin parámetros de perturbación, la probabilidad puede
expresarse condicionalmente en todos los márgenes de las tabla.<;de 2 x

$. :~~~;~f:~~~c

~::;ii¡~~:.
*
~
:~~~~ ~~
.;.;:;c::,-::;:;:jC
.~...:,..~~. ;:j~.
::;,.,:~.:'
;.'" ~~J1~~~

~:~.

r.'.c
n

ANALISISESTRATIFICADO 241

2. I(} lfIlC rCrlllitc cl cillculo Jc lo~ límitc~ exacto~ de confianza de la


r:lz()11 <.Ic vcllt.lj¡¡ c.;olljuntaJ(I. Este proccJimiento se Jescribe más ade-
lanlc rara d¡¡to~ de caso-control.
D E~ po~ible obtener límites de confianza
c.;onjunlado~ de la razón de riesgo con estimadores
aproximados de estimados
puntuales directa-
mente ponJerado~. de Mantel~Haenszel, o de máxima probabilidad.

B 1:5iIMA()() PUNiUAL DIRECTAMENTE PONDERADO. Como siempre, los


limile~ de confian7:tl tlproximado$ de medidas de razón deben ser puestos
cn e~c~lla IO!!tlrilmictl. Para oblener la varianza del loearitmo del esti-
n m~ldo <.Ic la ~tl7:Ón de riesgo conjuntada. se pueden utilizar las fórmulas
[: I .:..J,()1 y [ 12.10]. P~lra los dalos del ejemplo 12.4. los pesos específicos por
cstr~lt() dtldos cn la tabla 12.6 son 3.25 y 11.6. El }:I\'¡ = 14.85 y
u 1;1 v:lri;1117:1 (Icl I.:~timado puntual
1.14.~5 = ().(lh7.1.. I~:I mcditl ponderada
lran~formado logaritmicamente
de 1os logaritmos
es
de los esti-
m~ld()~ dc la r:lzi}11 de rie~go. e~pecíficos por estratos, es 0,270, que es
D cl arltilog~lritmo dl:.l estimado conjunlado de la razón de ríesgo, 1,31.
Los limites de conlianza aproximados al 90 por 100 pueden calcularse
l.'omo sigue:

O.2iO :t
.645(.,j'o:O673j) = -0,157, 0,697

e-O.1S7, eO.697 = 0,86, 2,0

ESTIMAD() PUNTUAL DE ~IÁXIMA PROBABILIDAD. La fórn1ula [ 12.10]


r>uede r~ejorarse .~lIstitllyendo ai por IV 1iRoiRR y hi por NOiRoi, donde
ROi y i~ I~ SO11 los c~timados de máxima probabilidad adecuados. Los
pCSOS 1llcjl)raUOS S(}I1:

u = (RR)(I -ft.o;)N1;
-.

(RR)Ro;No;N
+ (I
1;
-ft.o;RR)No1
[12.53]

1\1
l) que pueden emplearse en la fórmula [12.46] para obtener un estimado de
la varianza conjuntada. En el ejemplo 12.4, el estimado puntual de
máxima probabilidad de la razón de riesgo es 1,31, j¿OI = 0,0~04, j¿O2 =
m 0.1781. y los pesos mejorados son 3,44 y 11,4. El L}v¡ para estos últimos
es 14.83 y la varianza del estimado puntual transiormada logaritimica-
mente es 1/14,83 = 0.0674. casi el mismo resultado que se obtuvo de los
~ estimados de la varianza específicos por estrato. El intervalo de confian-
za al 90 por 100 se obtiene sobre la escala logaritmica como

In (1.31) :!: 0,156, 0,698

y loS límites reales son


~
e-O.156
.,
eO.698 0,86, 2,0

~ .':

~~~'i-.::! ~

;Bi*;
)~}~~\~~j;~~
.~1~~;~~:~~~t~~:
~~

:;;;.~~;.-.
~

1
242 EPIDEMIOLOGIA
MODERNA
~~ -
ESTIMADO PUNTUAL DE MANTEL-I1AENSZEL. El estimador puntual
Mantel-Haenszel de la razón de riesgo a partir de datos de seguimiento
con denominadores de recuento adoptn la mi~ma forma que el e~limador
puntual de la razón de tasas con denominadore~ per~()na-tiempo (fórm\l-
la [12.27]). La varianza del I()garitm() de RRAlII e.~ aproximadamcl1lc
(Greenland y Robins. 1985).

".
,
"-'
{¡\11 ;1\' " '( -, ¡ ~)/T?
.i= J
Var [in {RRAfll)] = [1.:..54:
'..' h A.:
L f
i...,
i= 1
~~;~
T
I
.L.~ 7 l
I
Para los datos del ejemplo 12.4. la expre~ión anterior da \;ar
[In (RRMII)] = 0.0671: si se la empare.ia con el estimado puntual de
RR"tl/ = 1,33, los limites de confianza aproximados al 90 por 100 ~on: I
exp (In ,33) = .645, ,/0-:067! = 0.87 :!.o
I
que son casi idénticos a lo~ límite~ calculado~ para el e~tímado punlual
directamente ponderado }' el de mi\ximal"r()babili9ad.

INTER\'ALOS DE CONFIANZA DE LA RAZON DE \'ENTAJA


CON DATOS ESTRATIFICADOS DE CASO CONTROL
(O DE PREV ALENCIA)

Los limites de confianza del estimado conjuntado de la razón de ventaja


I
a partir de tablas estratificadas de 2 x 2 pueden obtenerse mediante
computación exacta o mediante métodos aproximados. La computación
exacta es en sumo grado compleja para cualquier conjunto. de datos que
no fuesen extremadamente escasos )' requiere un programa de computa-
dora (Thomas, 1975).

Límites exacto.~ de con(ionza. La expresión de probabilidad de las


observaciones de un conjunto único de N tablas de 2 x 2, condicionada
a los totales marginales de una de dichas tablas de 2 x 2 ya la razón de
ventaja es:
n
(N )( No1
t1
) ORG
N ,li
(I .b.
..

Pr(datos) = n ~7 .
[12.55]
.~lnIA/~í.NI,)
i~ I
) ORk
J~ I,
No;

I
k=mAxIO.Mli-"n
"
\ k \M ti -k

;:~;:-;
...;.:.~.-:.
.,,--:.,..-:
~...:~.-
:.:;;:;:,":~
,..
~
:.::(~.~:.
~1i~~ #.
#;~~ ~;
~~¡t~
:k!?~i~:
c ::':¡~)~¡~~r~li:
::.:"

~~[~&;::,i'.

9
"ó:~

ANALISIS ESTRATIFICADO 243

~
Las probabilidades de la cola para los límites de confianza exactos
pueden hallarse obteniendo la suma de las probabilidades calculadas en
1.\ expresión [ 12.55] correspondientes a todos los valores posibles de La¡,
D iguales o mayores .\1 valor real observado ya todas las combinaciones
posibles de frecuencias de celdas que producen un valor dado de La¡.
r.\ra conseguir los limites de confianza exactos de la media p hay que
9 .\ñadir a la suma de cada posible combinación en la que La, iguala al
v.\lor observado sólo la mitad de la probabilidad determinada por la
expresión [ 12.55]. El limite de confianza exacto inferior se obtiene determi-
n nado. mediante pruebas de ensayo y error, el valor de la razón de
ventaja que produce una probabilidad de la cola superior de ~/2 (X es
igu.\1 al complemento del nivel de confianza deseado). El límite de
B c()nfianza superior se obtiene sumando todos los valores totales de La¡
4ue son me!lorcs o iguales que el valor observado y hallando el valor de
1.\ r.\7:i>!l de vel1laja que da una probabilidad de cola inferior a (X/2.

I COl1 los datos del ejemplo 12.5, el valor observado para La¡ es 4; las
55 comhin.\ciones para las cuales La; ~ 4, se enumeran en la tabla 12.9.
Empleando la expresión [ 12.55] para determinar las contribuciones a la
rrohahilidad dc la cola. loS limites de confianza al 90 por 100 de la
metlia l' cxat:ta sc i1alla que son 1.30 y 9.78. Los correspondientes límites
l:isl1er son I.O<} y 10.9.

I
LÍ11Iil(I.\" de ('m~/i(lIl=a apro.X"imado.r

E.~llMAJ)() PUNTUAL DIRECTAMENTEPONDERADO.Para obtener límites


de confianza aproximados del estimado conjuntado directamente ponde-
rado de la razón de ventaja. se pueden emplear las fórmulas [12.46] y
I [ 12.13J. Como es usual con las medias de razón. los límites se plantean
en la escala logarítmica y luego se los vuelve a la escala original. Para
los dalos del ejemplo 12.5, utilizando los pesos indicados en la tabla 12.7.
rn la suma de los pesos es 2.85 y la varianza estimada del logaritmo de la
razón tIc venla.ia L'onjuntada es 112.85 = 0.351. Los límites de confianza
aproximados al 90 por 100 son
I exp [In (3,82) :t .645 ~0.351 ] = 1,44. 10,1

8 que difieren en alguna medida de los límites exactos, pero tal discrepan-
cia es tolerable, especialmente si se considera la amplitud del intervalo. A
la vista del pequeño número de casos del análisis, la aproximación
parece razonablemente buena.
E
ESTIMAI)() PUNTUAL DE MÁXIMA PROBABILIDAD. Cuando se tiene una
I cslim(lCión punlual de máxima probabilidad.
dc la varial1za sc pueden utilizar
para obtener un estimado
las entradas de celda que cuadren en
la~ lablas dc 2 x 2. Los valores de a¡, Gi, ci y di que satisfacen la

~
~~~~-:; .-~-.~-~-.:: ,.
:::~:~:;:~;.,.
.c~:.:..c *.

:¡::~~:;:..

~
~11~ !f~~~Í~(~~~
...""
.-'-~~--
:::

244 EPIDEMIOLOGIA MODERNA

ecuación [12.23], o la [12.24] y los totale~ marginales de cada tabla de


2 x 2 pueden ser sustituidos en la ecuación [ 12.13] así:

11' -
i- ..f [ 12.56]

-+7+-+---
(i. I 1>,I [.. I (I. I

La varianza del estimado puntua1 de la razón dc ventnja transformada


logarítmicamente, es 1f'i.11'i.
Para los datos del ejemplo 12.5, las frecuencias de las celdas del
estimado de máxima probabilidad no condicional que satisfacen la
ecuación [12.24] se dan en la tabla 12.10, A partir de estas frecuencias de
celda adecuadas, \\'1 = 2,31 y 11.2= 0.54. lo que da ):\I'j = 2.85 :. una
varianza de 0.351, Los limites de confianza aproximados al 90 por 100
son

exp [In (3,79) :!: ,64 5 "\/O;33T J = .43.10.0

Emplear la ecuación [12.23] en vez de la [1.:..24] para calcular las frecuen-


cias adecuadas concordantes con la probabilidad condicional. es consi.
derablemente más dificil; para estos datos, la$ celda$ a de los estratos
usando la ecuación [1223] son 3.238 y 0,762. casi idénticas a los valore~
incondicionales de la tabla 12.10 y que producen e! mismo intervalo de
confianza aproximado. Dado que la computación necesaria para obte-
ner las entradas de celda condicionales adecuadas. a partir de la
solución reiterativa de las ecuaciones [12.22] y [1.:..23] es dificil. resulta más
fácil calcular en su luFar los límites de confianza exactos.

Otro abordaje, que fue propuesto inicialmente por Cornfield (1956)


para una tabla de 2 x 2 única, fue ampliado por Gart (1971) a un

Tabla 12.10. Entrt:da.\" de celd(1 dl' má."iI7l(J !,rnh(Jhilid(Jd adecll(Jd(1.\" !'(1ra


lo.\" dato.\" del t.:iemplo 12.5: el e.\"tinlado con:iullt(Jdo d(' la razón
de V(!Il(~;(J e.\" 3.79

Edad matcrna < 35 Edad materna 35 +

Uso de e~pcrmicjda Uso de e~permicida

+ Total + Total

[1
Síndrome U
de Down 3.247 8,753 12 0.753 3.247 4

Control 103,753 1.059.247 1.163 5.247 85.753 91

Total 10~' 1.068 1.175 6 89 95

~~:' ;~~,~~I~
~
ANALISIS ESTRATIFICADD 245

col1junlo de labl~ls de 2 x 2. El límite aproximado inferior es la solución


a 1:1 ccuaci()ll

2%12 =
[ 12.57]

a J()nde Ej es el valor esperado de aj condicional


vclltaja cn cl límite inferior del intervalo
al valor
de confianza.
de la razón de

H Z'/~ cs cl valor de la estadística normal estándar que corresponde al


11ivcl de confianza deseado, y

u V.lr (Lli, -,
-I +
;';"'1 ¡:;'I

1):lr:1 ohtcncr cl límitc superior del intervalo. se reemplaza 22/2 por


-Z7/2. La ccu;¡ciim [ 12.57] debe resolverse reiterntivamente para cada
lil¡litc. 1~ll prillcipio. cste método tiene la ventaja de aproximar la
I \.;lrian7.:1 usallllo las frecuencias de celda que corresponden al valor del
límite de confianza de la razón de ventaja. en lugar del estimado puntual.
Para los datos del ejemplo 12.5, las frecuencias adecuadas para la
celda (1. usando In ecuación [ 12.57] para obtener el límite inferior de
interv:110 de confianza al 90 por 100. son 1.542 para el estrato más joven
y 0.356 par3 el más viejo; nótese que éstas no se añaden al raf = 4,

u como en la estimación
d1.1S dentro
puntual. porque ias frecuencias de celda adecua-
de c1.1da tabla siguen siendo conformes con los totales
m1.¡rgin1.1Ies de esa tabla individual. El límite de confianza inferior que
s(lti$f1.1Ce la ecuación [12.5i] es 1,48. Para el superior, se requiere una
~ solución reiterativa que obtenga las frecuencias adecuadas para la celda
(I. que son 5.i72 y 1.370 para el estrato joven y viejo, respectivamente. El
limite de confian7.1.1 superior correspondiente a estos valores es 9,72.
~
I:.I)IIMAI)() PUNIUAL I)E MANTEL-HAENSZEL.Han sido elaboradas las
propiedadc~ 1:~ladi~ticas del estimador Mantel-Haenszel de la razón de
ventaja bajo do~ ~ituaciones limite frecuentes: que el número de sujetos
m por cstrnto se haga grande o que el número de estratos se haga grande,
lcl\iendo pocos $ujctos en cada uno de ellos. (Hauck, 1979, Breslow, 1981).
Para dicho estimador de Mantel-Haenszel de la razón de ventaja se han
~
propuesto fórmulas de la varianza distintas, adecuadas a cada una de
estas situaciones limite: Breslow y Liang (1982) propusieron ponderar
las dos fórmulas para obtener una combinada, que fuese de aplicación
~ gcneral. M{1S recientemente. Robins y coautores (1985) han desarrollado

,,~
~

~~~~
;~~;~~%~; ,.".'
'.;:::~:.~:;;;~;::~;;
~~...

'¡~:
:¿t~~~;:~:~:

~.~~~ ~~~:~~!~~I~'tJ;

l
246 EPIDEMIOLOGIA MODERNA

ulla fórmula única de la varianza que deberia ser de aplicación general


para el e~limador en cuestión:

". ,.. ,
L l',Rj
\
'-- ( r.s., I + QI.R.I ) I Q,S,

Var [In (ORAf¡¡)] =


2
i=

L -I)".
I

R. J2
+ i= I
[ f s,J'
+ -;- ,- ,
[12-58]

j= I
,.I ~..1

dondc ~

r. = (a, + d.\fT
I I 11.1 I

( '. ) '
QI = ( h,
" -1-
' I TI
R. = a.(t.í7~
I I I I

\'

s. = b.c.IT
I! I I

Para los datos del ejemplo 12.5. la rórmuJa anterior da una varianza
estimada de 0.349 que produce. a su vez. un intervalo de confianza al 90
por 100 de 1.43 a 10.0, resultando que e~ casi idéntico a los limites de los
~stim:1dos puntu(!le~ directamenle pondcrado )' de probabilidad máxi-
ma. -1

LO5 limite5 de confianza al 9(1 r()r I (){) ha5ado5 en el test para los
dat()~ dcl e.iemplo 12.5 ~e obtiencl1 3~i:

3.78(1:I.fo4S/~.411 = .53 9.37

que son mils estrechos que los obtenido~ con la fórmula [12.58]. El
ahordaje de lo~ limites de confianza aproximados con base en el test
ruede ser utilizado también con el estimado puntual directamente
pollderado.

EV ALUACION y DESCRIPCION DE LA MODIFICACION


DEL EFECTO .,.

La~. técnica~ para obtener un estimH<i() conjuntado de un erecto que es


unirorme a través de las categoriHs dc una tcrcer(1 variablc n() dcherían
aplicarse si no parece razonable asumir que el cfect() e~ con certeza
unirorme. Cuando se cree que el erecto varía a través de lo~ e~tratos
...e~to es. cuando se presume que existe modificación del mismo ...el
enfoque central del análisis y la presentación de los datos deben pasarse 1
de controlar la confusión a describir cómo el factor de estratificación

-~,

¡~[I. ~~[:
~
.

1 ANALISIS ESTRATIFICADO 247


~j

modifica el efecto. Es importante darse cuenta de que la confusión,


n cuando está presente, se manifiesta sólo en la medida bruta del efecto;
cuando en los datos se halla presente la modificación del mismo. por
contra. ninguna de las opciones con que se cuenta para describir el
efecto implica tal medida bruta, con lo que el tema de la confusión
J qllcda dc~pl~l7:~ldo por la de~cripción de dicha modificación del efecto.
J)ctcrminar ~i la modificación del efecto está presente en loS datos
rcsulta cl~lramel1te. pues, una decisión importante que debe adoptarse
en todo análisis estratificado.
Es import~lnte introducir una nota de precaución acerca de la
metodologia a utilizar para valorar la modificación del efecto. La
evaluación de este fenómeno con frecuencia parece descansar en una
g aplic:.1cii>n aparentemente mecánica de las pruebas estadísticas. Las
cuestiones epidemiológicas de la interacción subyacentes a la evaluación
c~t~ldí~lica de l~l modificación del efecto son sutiles-" y pueden quedar
rl cmpa!1tanada~ COn un abordaje puramente mecánico. Dichas cuestiones
~e di~culen en el capitulo 15. que aporta una perspectiva epidemiológica
a los método~ estadísticos descritos en la siguiente sección.
I En adición a I~ls consideraciones epidemiológicas. existen considera-
cio!1es e~tadísticas que reclaman un abordaje cauteloso de la evaluación
a esle nivcl de la modificación del efecto. Los test estadísticos más
I generale~ 4uC ~O!1de aplicación aquí poseen poca potencia, porque las
altcrnativa~ a 1~1hipóte~is nula que ponen a prueba no son muy
espccifica~. Como re~ult~ldo, los valores de p «no significativos» son
incluso mil~ dificiles de interpretar correctamente. Más aún. dadas las
muchas i!1nucnci~l~ de los s-eseos de selección. clasificación incorrecta.
C.:()l1rusii)11y ()tros ~C$gos. ,lsi como las de los efectos causales, es poco
frccucnte que rucda esperarse que ningún efecto sea precisamente
I ul1ir()rmc e!1 !1inl!.lln~l c~cala de medición. Por tanto, la hipótesis nula de
qllC ll!1 elcct() c~ Ilnirorme a mcnudo ~e remonta a nada más que un
pl¡llltcalnicnl() I:stildístico que htlbria de tlCeptarse, como mucho, sólo en
I t¡lnto 4ue apr()ximacii>n ,l la realidad y que por lo general debe ser
col1templtldo con escepticismo.

m Er([h(((('i(jll de 1([ Illvdij¡cacióll del efecto


El primer pC.lSO al evaluar la modificación del erecto, consiste en inspec-
cionar los estimados específicos por estratos del mismo. Aunque cierta
m variabilidc.\d debida al azar de los estimados especificos por estrato es de
c~perar ~lun cuando el parámetro subyacente ruese uniforme, una varia-

I m
hilidad exccsi\'a, o patrones de variación obviamente. no aleatorios
puedcll haccr~c cvidcnte~ tl la simple inspección. El juicio del investiga-
uor :It;crt;a (Ic Itl modifictlción del erccto no debe limitarse a )o que
:Iparczt;tl cn los UtltOS que tiene a mt\no; cutlndo disponga de ellos, el
inve~ligad()r dcbc integrar en el proceso de evaluación el conocimiento
cxlcrior proveniente de estudios previos o de visiones biológicas más

gcncralp;s.

l o
.

~:~,~;i;;i:-.I:.-t.-.~.r;;.~t:;
---:::-.-"~.
.~

~
Jl~ ~~-~

248
Lo
-." típíco.
---~-- no obstante.
EPIDEMIOLOGIA MODERNA
es que el conocimiento externo sea reducido y 1
que los investi[!adores deseen una evaluación estadistica del grado en
q\IC la varíabilidad de los estimados del erecto específicos por estrato
ruc~c consí~tcnte con una conducta puramente alealoria. Con este
oh.iclivo. pucden emplcarse ul1a variedad de.pruebas esladislícas. Parte
<I(' <lícha varícdí\d proviene del hect)o de q\IC las medidas de razón )'
<lifcrenciíl rcq\lieren e\'aluacioncs ~Cpar(I<I:ls de la modificación del efecto
Cll cucsliill1. pueslC' qllC' la \ll1ir(lrmi<l;I<I tlr la mcdi<la <le ra7."n implica
!):Ihilll:llmcnlc modificaciól1 <lcl cfl:rl(\ la! L.Om('I In rccn!!r I~ medida de
~f
(lircrcl1ci:l y viccvcr~:I. El cII)rlr{' {1\: 1:1, rr\lch;,~ e~I;I<lislí{:CI~ sc ha
(li~c\lli<lo cn el capít\llc' 9. e~rL.ci:llllIL'I)lr CII rcliIL.j¡,ll (I 1:1(1(~lcrlllil1acii)n
(Icl scntido <lc la «~i[!nificaci()n e~I;I(lislic;I)\. q\IC tri\,j;\li7í1 1(\ il1ler-
pretclcióll de medidas quc. de no ~cr por ello. e~t(\rian Ilencls de ~cI)tido.
f:1 \1~() dc prueha~ dc ~ignificaci"n es más defendible. ~in cmhargo.
c\lando una deci~ión inmediat¡1 dCrCIlde del resultado de una v(\loración
e~tadislic(\ única. Tal podria ",er el ca~o cu~\ndo UI1 investigador e~tuviese
il1tentando decidir si el grado de \'clriabilidcld que ha). en un conjunto de
estimados del efecto especificos por e~trclto es consistente con la varia-
ciál1 alcatoria de un ereclo uniforme. o alternativamente. si en los datos 1
-existe modificacíón del crecto.
L~IS pr\leb,ls e~tadistic~s dc la hir"tesi~ nula de que el efecto es
\ll1iformc (es decir. no exhibe m()dífic,lción} son generalmente de dos
lipo~. \1110 basado en UI1 estimado directamel1te cOl1iuntado del efecto
\lllir()rmc ~. el otro cn un estim;l<ln tic m;ixim(l proha.bílidad.
Para los estimados directamcntc con.jllntados. el principío bá~ico de
1:1 pr\lcb¡\ es comparar cad,\ estimado dcl efecto específico por estrato
con el con.iuntado. ele\'ar la dírerenci~ al cuadrado y dividir por la
\,¡\rial1za del e~timado del efectC'l e~pecífico por e~trato. El cociente que
resulta se suma a lo largo de todos los estratos. produciendo una ,']
estadí~tica l2. con un nllmero de grados de líbertad igual a uno menos
"que el de e~tralos:

". (R. -R):


..\ I
v~.-1 = L..
I.f. .-
,- I
\ :.' \ r ( R.)
I
[ 12.59]

Para medida~ del efecto en f()rmt1 de diferencia. puede aplicarse directa- ,


. I
mente la fórmula anteri()r, haciendo qlle Rj den()te la diferencia especíri- ¡.
ca p()r estrat() y R, el estimad() dcl efecto directamente conjuntado. Las
varianza~ especíricas por estrato dcl denominador son los recíprocos de
I()s pes0~ lltilizado~ pnra ohlener cl e~timndo conjunlad(). Para medidas
IJ
del efcclo expresadas como razollcs, es deseable emplear una transfor-
m(lción )()garílmica:

1)
= f ~-(Rj -In (~)J2
2
[ 12.60]
XN-
;";:'1 Vur [In (R;)]

1!
.' 1
,
~...j

r
"~

,;:c;~

~~~t.~:
~-lti1;t;:!::t) ¡~lii~~~
~
~i:;.:;¿~:.: .:.:,',.;..;,;::t;.' ;:;~..:..; ~".,J. .,,~...;..)-.,~ ~II;
ANALISIS ESTRATIFICADO 249 ~.

1:11la que Ri del1ota .1hora el estimado del efecto en forma de razón


cspecílico por est r.1to y n. la medida de razón directamente conjuntada.
l'()mo I:jemplo de .1plicución de la prueba anterior sobre modificación
(Icl cfccto COI1 lIl1.1 diferencia de tasas de incidencia. consideremos los
cstim.1dos del cfecto estratificados que aparecen en la tabla 12.2. El
cstimado dircctamel1te col}juntado de la diferencia de tasas de incidencia
l:S 5.95 x I() 4alio-l. Empleal1do los estimados puntuales específicos
p()r cstrato y sus v:lrial}zas de la tabla 12.2. la fórmula [ 12.59] da un X2 de
X..1H.(;()I} Cll:lt r() gr:ldos de libertad. En las tablas de dístribución de X2. el
1:()rrcspol1dicl1tc v:1lor de p COI1 dos colas es 0.08. lo que indica el grado
tic col1sistcl1ci.1 dc los datos de dicho ejemplo 12.2 con la hipótesis de
que la difercl1ci.1 de tasas de incidencia es constante a lo largo de las
c:1tcgorias tic cd:ld.
l' mudo de illlstr.1ciól1 de la rórmula [ 12.60]. usada para evaluar la
hcter()gcl1citl.ld dc lIl1.1 medida del efecto expresada como razón. consi-
tlcrrnlus Ius dalos del ejemplo 12.5 y los c:i1culos derivados de ellos de la
t.\hla 12.7. El cstim:ldo conjuntado de la razón de ventaja es 3.8. La
;\plic:l¡;ii)11 dc 1.\ rórmllla [ 12.60] a los estimados específicos por estrato de
la t.1bla 12, 7 da lIl1.1 Z; COI1 un grado de libertad de 0.14 que corresponde
.1 un \,.\lar de p dc dos colas de 0.7. lo que demuestra que los datos son
(;OI1SiSICnICSI:OIl la hipótesis de una razón de ventaja uniforme.
Las prllehas dc I.: dadas en las fórmulas [ 12.59] y [ 12,60]. como los
~stil1l¡ld(lrl:s Jirc¡;I.\mcntc conjuntados en que se basan. dependen de que
sc :lsll111an J~lllr(1 de loS estratos números grandes de observaciones.
l.(111 rrccul:l1C.:ias dl: celda pequeñas. los tests n~ son fiables. Con frecuen-
c.:ias dc ¡;e/da (;cru. podria incluso no scr siquiera posible obtener la
\,~lri.1117..1O I()s ~stim.1dos del efecto especificos por estrato. Un abordaje
~lltl:rllati\'o col1siste el} utilizar una prueba estadistica basada en la
eslimacii)n dc m~ixim.1 probabilidad de una medida uniforme del efecto.
Este ~lbord.1jc. Ilam.1do prueba de razón de probabilidad. construye la
I prucba estadíslica .1 partir de 1.1 comparación de ecuaciones de proba-
bilid~ld de los d.1tOS l'>ajo dos hipótesis: una es que el erecto es uniforme
:' 1.1 olra. que el efecto ~ldquiere UI1 valor diferente en cada estr:lto.
¡\lInqllc la pruch.1 de razón de probabilidad es también asintótica. el
rcqucrimicl1to de nllmeros gr.1ndes dentro de cada estrato no es tan
rcslri(;liv() (;(1mO I() es en l(lS fórmulas [12.59] y [12.60]; la prueba puede

g lIlilizarsl: allll ¡;ll:ll1do CI1 los datos hllhicse frecuencias de celda peque-
i1.\s. l.(111 rrc(;ul:l1l.i:ls dc (;clda que fllcscn cero. esta prueba falla. aunque
sc la pll~dc 111l)dilicar ligcr.1mcl1tc. sustiluyel1do el cero por un valor
pl)sili\'() pI.:4l1l.:i1l). rara (;onscgllir un rcslllt.1do razonablemente ajustado
CI1 mllchos C(\sos. L~IS pruebas requieren el cálculo previo del estimado
d~ mi1xim.\ prob(lbilidad de un erecto uniforme. pero. por otro lado. no 1
rcqllicrcn rcilcr~\ciól1 e implican sólo una computación sencilla. Cuando
n los d(ltOS esti\n rel(ltivamente dispersos. el abordaje de razón de proba-
hilidad debe d(lr resultados más exactos en la comprobación de si existe
I1ll)dilicacii)11 dcl crccto.
Q I.a fOrl11l1lacii)11 de estas pruebas de razón de probabilidad sobre

---

"*
.-.
,:.;..; ¡;.~.
;~~:
f~~:::~.::.,. i:!~:1~~~~)~~\
~...,;..,..~.

250 EPIDEMI0LOGIA MODEnNA

m()dilicaci(}n dcJ efccto dcrcndc dc la medid;1 dc éstc y delliro de datos


Cl1 c(}l1sidcraciól1. Para difcrenci;1 dc lasas dc incidencia (I R D) la prueba
cs

..'"' -.
I\.
,
(IRoi + II~O)¡\.li

z~
--."
--I {l; 111 [ 12.61]
-
i = I (I I

N()tcse q\le el estimad('1 col1jul1tado de rnáxim(1 probabilidad de IRD es


r,lrte de la rórmula del test. corno tarnhién 1('1es el estimado de máxima
rr('1h,\bilidad de IRo en cada estrato. Dichos estimados de IRo deben
('Ihte\lerSe en la estirn(\ción de I RD. por 10 que no se necesita una
estimaci()11 adicional. más allá de la pUl1tUíll de mi\xima probabilidad.
r;lr;1 aplicar líl rórmula [12.61].
rar;\ I()s dnt('1s del e.iernpl() 12.2. el e.c;timati('1 de rnáxim(l pr('1hahilidad
coll.iuntado de la diferencia de t(lS,lS de incidcncia e~ 5,91 x 10-.:.año- I;
lo~ estirn(ldos de rnilxima probabilidad e.c;pecificos por estrato de la
.il1cidcnci,\ cl1tre
84() J: no
1() -5- fum(\dores
-I. 1640 son. desde
1() -3- los -1.más63"jóvenes
0 .' a -3-
10 los más
-I.
\ ...
\e1os. .\) x ano. ..x ano. ..' x ano .
1.).5~ x 10-2 año-' '"
" 1.917 x 1U-2año-l. ,Empleando estos estimados
CI1 1,1rórrnulí\ [ 12.61] se obtiene un valor de X" de i .4 con cuatro grados de
liherlad. lo que se corresponde con un valor de p con dos colas de 0,12.
Estc valor h,\ de compararse al de O.og de la íórmuJa [12.59].
rara la razón de tasas de incidcl1cia. lí\ prueb,\ de uniformidad de la
r:\7.()n de pr('1babilidíld es:
...' r I -~
R I~ .11 f J j )
.,
Y-
I.". -
= !
-Lo
\ a,
I
111
--~
+

j.,1 (aj(IRI~ + !\oil!\Ji)

.-

IRR

+ n.I In ~:;: [ 12.62]

II~I~ + J\TOilJ\11i

La prueba requiere que se obtenga el estimad(\.de máxima probabilidad


de I RR. pero no hay por medio paritmetros de perturbación.
Para los datos del ejemplo 12.2, cl cstimado de máxima probabilidad
de 1R R es 1.42: la prueba de ):'2 de la fórmula [ 12.62] da un valor de 12.1
c(\n cuatro grados de libertad, que corresponde a un valor de p con dos
colas de 0.0 16. Asi pues. dichos datos son al In menos consistentes con la
existencia de una razón de tasas de il1cidencia uniforme. Para la razón de
tasas dc incidcl1cia. el patrón de variación entre estrato )' estrato es
cxtrernndamenle regular. disminuyendo de forma continua desde la
calcgoria Inils joven a la dc mil!\ edad. Tal patrón regular de variación
a rroj:1 una nucva dud:l sobrc la vi1li<lcz de la asunción de una razón de
la.,\ils de il1cidcnciil lIl1irormc.

~
,

':;v:
~~~;~\.

4.
~.:;}~~~~!~\
:111
251
ANALISIS ESTRATIFICADO

Para la difcrcllcia de incidencias acumuladas. la prueba de razón de


rr()hahiliu(ld anillog,l ,1 la fórmula [12.61], es

, 2.i ¡-ai In () + h, In ( ~ , +
XÑ-I-=
,.-1 L ai \ h, )

:J

[12.63]

que otra vez implica no sólo el estimado de máxima probabilidad de la


diferencia de riesgo. sino también los parámetros perturbadores {Rol}.
Para los datos del ejemplo 12.4. el estimado de máxima probabilidad
de la diferencia de riesgo es 0.0343 bajo la asunción de uniforrnidad. Los
estimados de milXima probabilidad especificos por estrato del riesgo
entre las personas no expuestas. son 0.0415 y 0.1892 en los estratos
jóvenes y viejos respectivamente. Los dos estimados específicos por
estralo de la diferencia de riesgos son 0.0338 v 0.0363. mostrando una
6 \'ariación extremadamente pequeña. Concordantemente, la X2 de la
fórmula [12.63] es 0.001. con un grado de libertad.correspondiendo a un
valor de p de 0.97: ello indica la extraordinariamente alta consistencia
existen le cntre los datos y la hipótesis estadística de una diferencia de
riesgl)S 11l1iforme en estas categorias de edad.
»ara la raz(>n de incidencia acumulada, la prueba de razón de
r>rohabilidad acerca de la uniformidad es:

..-
X:V-I -

[12.64]
que difiere notnhlemente de la prueba correspondiente para la razón de
tnsas de incidencia (fórmula [12.62]). La diferencia proviene del hecho de
que dicha f()rnlula [ 12.62] se desarrolla a partir de una. expresión de
! fi:1
I 1!:1
probabilidad que es condicional al número total de casos de cada
estrato. eliminando con ello parámetros de perturbación. Para datos de
incidencia acumulada. no obstante. no es correcto basarse condicional-
fi mente en el número total de casos de un estrato y por tanto debe
utilizarse una expresión de probabilidad no condicional; una conse-
cUenCii.l es que los estimados de los parámetros de pertubación {Rol}
üJ forman así parte de la prueba estadística.
~ Los di.l.tos del ejemplo 12.5 pueden evaluarse en relación a si existe
uniformidad de la razón de riesgo. El estimado de máxima probabilidad

ill

g -,." .

.::~~~;:i
j~,

III .~~*~[l~:\;::f.: ~ci~~.


:.~:
~~!:~;
t~;~l:~~~i

If~
;;-:,;;

25:' EPIDEMIDLOGIAMODERN"

es I..~ II. hasad() en la asuncióll dc dicha unir()rmidad. Lo$ estimado$ del


rar:imctr() de pertllrbacióll (es decir. )O~ estimado$ dc máxima probabjli-
d:ld dcl riesg() cntrc los no-expuestos rar(\ c(\d(\ estrato) son 0.0504 y
().17X I cli las ca tc~()rj:ls m..ls .i()\'CI) ~. m..ls vic.i:t. rcspccti\'amentc. La r2 de
1;1 r(,rmlll:l
.- 112.h41 c()n lln I!rad() dl. Ijhcrt;ld cs ().45~ qllc corrcsrondc a un
.\.;11(11 I' (ll' ()..~. Asi rlICS. I()s dalo, S()II r:li'()I);II)lclllCllIC C()nsiSICnlcs con
llll:1 r;II.('11 d(.. ri~s~(' lIl)ir()rlllt:. ;1 r:::.;;lr dl' 1;1 :11':trclltc \.ariaci()11 cIltrc 10$
slil1):I(¡()S esrccífic;()s r()r eslrat(' d:.. ¡:t r;lZ('n li,.., rjcs~() (I.g ~. ).21.
1':1r:l d:t I ()S dt: C:lS('-c('n I rol ( o rrc\,:t Icllcia ). l:t rrllcha dc lIl1irormidad
dl. l:t r:lz()11 dt: rr()h:thilid;ld dt: 1:1 r~lz()11 dl' \'Cllta.i~1 cs

;:;

+ {ii In ( ~
(i.I ) [ 12.65]

1
d()lIde las frecuencias de celd¡1 adccuadas ti;, h,,. ti y Ji. $()Il I()~ valores

qllC sati~facen la ccuaciol1 [1:,24~1.

P:lr.\ lo~ dato~ del e.íempl() 12,5. el estimado (n() condicionalj de


m.1xima probabilidad de la razón de venta,ia e~ 3.79. La~ frecuencias
adecuada~ para 1,! celda {1 son 3.1473 y O.75.?i para los estrato~ más ~
.1
~ ,i()\'en ~. mit~ vic,i() respectivamente: la~ otras se obtienen a partir de los
mar{!ene~ de cada tabla de ~ x :. medianle sustracción. La rórmula
[ I :..~5] d,\ una l~ de 0.13. con un gr,\d() de lihertad. que corresponde a un '..1
.I

I
\',\Im de r. con do~ cola~, de 0.7, EStOS resultados son casi idéntico~ a los
oblcnido~ en la rórmula [ 12,60].
..1
Olra prueba de uniformidad de la razon de venta.ia sobre un
C()niUn1(\ de tabla~ de 2 x 2 fue propuesta por Zelen (1971), La prueba
..,
de Zelen plantea que se sumen los l- calculados para cada tabla de 2 x
2 lel cuLldrado de la rórmula [ 11.6] u [ I 1,8]) y que se resten de la suma de
los cuadrados de los l2 de M antel-Haenszel (rórmula [ 12.38]). El procedi-
miento de Zelen. sin embargo. no es \'álido en general: se han citado
contra ejemplos en lo~ que una razón de ventaja uniforme da una >:2 grande
para el test de Zelen y un resultad() de >:~ de cero cuando las razones de
vellta,ia especifica~ por estrato difieren considerablemente (Mantel er al.,
1977). N() se recomienda este procedimiento,
Ninguna de la~ prUebL\S consideradas
cuenta el pntrán de variabilidad
en esta sección tienen en
de los estimados del erecto a través de
J
lo~ estratos, Lo~ valores de >:2 calculados con la aplicación de estas
prucba~ son independiente$ de cualquier ordenación de los estratos, Si se
reorden"sen éstos. el resultado dc líl prueba no diret:iría. En principio.

~~

~Jj~4~j ,~~~~;
~

ANALISIS ESTRATIFICADO 253

es posible poner en pie pruebas más potentes dirigidas a patrones espe-


CiriCOS de variacil>11 de los estimados del erecto a lo largo de los estratos
como allcrn,ltiva a la uniformidad. Para hacerlo, sería necesario postular
tal palr()n. r()r ejemplo. la prueba de uniformidad de probabiJidad de
la r,\7.()ll dc tasas llc il1cidellciu. p,\ra loS d,ltOS del ejemplo 12.2. produce
UI1 val(~r dc I' tic ().OI6: los estimados del erecto declinan casi exponen-
\."ialmcl\(c. Sil1 cmhargo. con lo que litilizando como patrón alternativo
dc variaci()I\ lilla curva cxpol1cnci(ll. sc pllcdc construir un test de uni-
a rormidad mi\s polcnte. Con este método de mayor potencia, resulta un
v,\lor de p esencialmente mils pequeño (Miettinen y NefT, 1971). La
prucba mejor,lda tiene en cuenta el patrón de declive de los estimados
de la razón de tas..ls de incidencia conforme aumenta la edad.

!)(,.\"(",.ip('i(í" II(, 1(1 ,11('di¡i('(1('ió', Ilel ejeclo


l
C.-uando los cstimados especificos por estrato varian lo suficiente como
para indicar que probablemente hay variación en el efecto subyacente,
u resulta impropio prcscntar tanto una estimación bruta del efecto como un
estimado conjuntado. Dicho estimado conjuntado del efecto es una
media ponderada de los estimados especificos por estrato, pero como se
supone que los pesos están concebidos para promover la precisión.
rcllejan por clio el número de observaciones que hay en los estratos
illdividuales. El estimado conjuntado tiene. en consecuencia. la potencia-
lidad de inducir a error. a no ser que sea razonable suponer que los
estimados del efecto varian únicamente de forma aleatoria en torno a un
vaior uniforme del efecto. Si el efecto. en sí mismo, varía a lo largo de los
estratos. entonces el valor del estimado conjuntado calculado sobre la
asunción de uniformidad dependerá de la distribución de los sujetos en
los estratos de una forma peculíar para cada estrato individual y que
seria dificil de especificar. El estimado crudo es una alternatíva peor,
puesto que ni siquiera representa una medía ponderada de los estimados
D
específicos por estrato.
¿Cómo. pues. debería describirse el efecto cuando se juzga que varia
n entre los estratos'? Un método simple consiste en presentar los estimados
seper~\damente para cada estrato. El estudio puede consíderarse. así,
como un conjunto de subestudios individuales que se informan por
separado. Para cada estrato, se pueden informar los estimados puntuales
~ y los intervalos de confianza. Este abordaje se usa a menudo cuando la
modificación del efecto se produce para un factor dicotómico, como lo es
el sexo.
0
~
ESTIMADOS DEL EFECTO ESTANDARIZADOS
il..j
.;;;'1
~;j El inconveniente que tiene informar separadamente por estrato los
rc$ultados es que se divide el cuerpo global de datos, dando como
producto cstimi.\dos del efecto menos precisos en los estratos individua-

:~~

~x."... ..¡::t.;.t- .'c ;;.~


;~-..
,~~; :~!~f4~~ jtr~~%~~$~t;Gr;;lli¡~~
.~;,
~

,~;

25.: EPIDEMIOLOGIA MODERNA ~ 1


.,
='
~
les. Si la variable de estratificación posee muchas categorías. habrá
~
comparativamente poca precisión para cada uno de los varios estima- .
,
dos. Más aún. un con.iunto de muchos estimados del efecto puede que
ofrczca una descripción del mismo más detallada que la que ofrecería .~I
rc~IJ!llir el creclo !!Iohal en un solo niJmero. pcrC' tambíén transmite mu- :'t
,1
l'll:1 mello~ capacidad de captación global en S\l descripción detallada. El
\lllil'(\ prop()~ilC' del an:'lli~is dc dato~ es reducir una información inhe-
rc!ltcme!llc compleja a una forma menos comple.ia y. por tanto. más
filcilmc!ltc i!lterpretable. Te!liendo presente esta meta. resulta apropiadC'
rl:I!lICarSC si n(' hahria algu!la rorm" sensata de reducir un con.iunto de
c~timados especificos por e~trato a una única medida global. La dificultad .1
lJUC tiene el estimado de conjunto es la forma impredecible o inespecifi-
t:ahlc en que comhina la información que existe a lo largo de los estratos. ~
I
l i!la manera ra7.ollable de superar esta dificultad consiste en combinar la t
1
información a través de lo~ mismos. utilizand(l un sistema especificado
de ponderaciones -esto es. estandarizaí las tasas que componen la t
medida del erecto. según una distribución estándar de la variable de
estratificación. La venta.ia de la estandarización es que se pueden i
explicitar rácilmente los pesos de la información especifica por estratos, '1 1¡
permitiendo que el proceso de obtener la media de los diferentes valores
dcl estimado del efecto provenientes de lo~ diferentes estrato!: se produz-
ca de un modo teóricamente replicable y epidemiológicamente pleno de
se!ltidu.
Ocasionalmente se pOne en guardia a lo!: in\1estigadores para que
c\.iten la estandarizaci()n dc los estimado~ dei efecto. caso de existir una
«cxcesi\'a) variabilidad de los mismos entrc estratos. puesto que tal
\.ariahilidad quedaria oscurecida ell c] c~timado global. Por ejemplo. si
I()s estimados del erecto en dos estratos apuntan en direcciones opuestas.
indicand(l digamo~ prevención para 10!: hombres y causa para las ~l
mujeres. un estimad(\ estandarizado podria indicar prevención. causali-
d:,(i Q no erecto. dependiendo de la elección del estándar. Este problema .1
~r da. no ohstante. con cualquier medida resumidora única. Una medida
J
de rcsumen estandarizada tiene. a] menos. la venta.ia de que pondera los
cstimado~ djvergente~ de un modo definihlc. Es incorrecto hacer que la oÍ
1
u!lirormidad del erecto sea un prerrequisito para la estandarización: "j

cua!ld(, cxi~te ulliformidad. cl poolin~ {(1 con.iu!ltación\ es preferible a la ~]


esta!ldarización. de cara a optimizar la precisión. Esta última es útil
pri!lcipalmente cuando el erecto varía a lo largo de los estratos. Por
supucsto. es siempre verdad que una medida de resumen puede oscure-
cer una variabilidad sub\'acente. Si tal variabilidad es extrema. como
sucle suceder cuando los~ estimados del efecto apuntan en direcciones
contrarias. podría ser razonable inrormar los detalles especificos por
estrato. En los demás casos, el investigador puede decidir, apropiada-
mente. que un resultado resumen transmitirá lo suficiente del mensaje
quc se pretende sin oruscar el detalle imporlante. para permilir así la
e~tandarización. Después de lodo, no existe limite para el proceso de
scparar datos seg\ln niveles de detalle: incluso subgrupos pequeños y

?:W2

i~
-~,
,~~1: .~.~..
~~.

1i1~;~
ANALISIS ESTRATIFICAOO 255

T:Jhl:J 12.11. E.,"li11/(1df/.\, d(' '.aZ(j,1 dl' la.\'a.\' d(' iII('idl'lIcia de 111UerleS
1/(.hidl1,\, II (.'lt(.,.,II(.llall ('nrmlaria (,/1 ¡;lma(lorl'.," re.\,pecl0 a lIO .¡;ll11adores.
(.lIlr(. m(;(/i('(1.\, h,.il(í,1i('().," 1~(lrm1(,.\'. .\,('Klíll la eda(1 ( da/(1.\, d('ll'jell1plo 12.2 )

Intervalo de confianza exacto


Edad Estimado puntual de IRR
(media P) al 90 por 100
---
35-44 5.74 1,91 , 24
45-54 2.14 1.32 . 3.63
55-64 1.47 1.06 , 2.07
65- 74 1.36 0.98 , 1.91
i 5-x~ 0.90 0.65 , 1.28
~
.Intervalos dc c.:o'lli:\m:\ c:1lcul:1dos :1 p:lrtir de l:1s fórmu¡as [1 J.9] y [1 J.JO}

;¡parentemente homogéneos representan la experiencia agregada de


;¡Igunos individuos que estuvieron sometidos al efecto de interés y de
otros que no.
Consideremos de nuevo los datos de tasas de incidencia dados en el
c.icmplo 12.2. Es evidente que la razón de tasas de incidencia no es
lllliforme con la cdad, declinando de un valor de 5, i en el estrato más
j(lvcn .1.iu5tO dch:l.io de la unidad en el más viejo. Un abordaje razonable
tic 1.1 prc5cnt.1Cii)n tic estos datos podria consistir en mostrar los
rcsultados específicos por estrato. en vez de presentar ningún tipo de
clfr.l resumen (T.lbl.l 12.11). Por el contrario. a pesar de la interesante
variabilidad visible en los datos, pudiera ser deseable, y se lo podría
dcfender, un único estimado sumarizador. En tal caso, habría que
utilizar un estimado estandarizado de la razón de tasas de incidencia: en
calidad de estándar, una elección razonable seria la distribución perso-
n.l-.lños de los doctores varones británicos fumadores, que llevaría a la
SMR:

630
,42
444,41

Naturalmente. una elección diferente como estándar afectaría al estima-


do del erecto a informar. Por ejemplo. sÍ a cada categoría de edad se le
asigna un peso igual. la razón de tasas estandarÍzada resultante seria:

f 32 104
,
1,16

I~a difcrCllCi(l. relativ(lmente grande, de los dos anteriores estimados del


l:rcct() rcncja tlnicamente la diferente elección de pesos implicada en la

D ..

-,. ..c

:~

~s~~~~;~~.~.' ~~~~
~ ..~ -":.-.:..~-

256 EPIDEMIOLOGIA
MODERNA
j l
sclccci¿}n del estcilld¿lr. El segundo abordaje asigna pesos relativamente
mayores a las calegorias de edad más viejas. en las que el efecto es
pcqucño.
Los estimados est¿lndarizados. como 105 de conjunto. son siempre
IllCdias ponderadas de estimad05 dcl efccto específicos por estrato. Para
1IIcdidas dcl cfecl() que ~on difcrencias. la ponderación es la misma de 105
)
I'C~()S dcl cst;'llldar. PUCSl(1 que la difcrcllcia de la~as estandarizada puede ~
~Cí cxprc~ada como: ,
1
'11..R 1 1i

SI~D = .::11"i/<li
---~II"I - ::'-!0-

r;lr; r.11 r.,1

(1(\II(It' Ilj CS cl rl:S(\ csl¡ind;lr r;lra la c;ltc!!(\ría i. R1i es I;¡ la5a enlre lo~
:..\rllcc;t()~ c!1~,:?1cstr;II(\ i. R,)j c~ 1;1 I;IS;I cntrc los n()-eXpue5tos en el
L"\lr;II(\ i ~. kl); cs cl c.c;tim;ld() dl' la diícrc!1ci;J de la5a~ en el mismo
cslrato i. Par.1 mcdida~ del CfCClO que .c;on razón de tasas. 5in embargo. la
raZ()11 eslandarizada de la~a~ cs un;\ nledi(1 ponderada de valores
,
c~rccifico~ por eslralo. que ponderan dicha5 razone~ de tasas especificas
por e5trclto de acucrdo al producto del pcso del estándar por la tasa
~ntr~ I()~ n('-expuc~to5:

r.,I.~RR.
I J
-L,,';Ro¡RRj
-r.11"R o -- [12.66]
I I ~II.:
J

./,.
Ol~lldc R I~ es c1 cslimadl) de la razón dc 1~15a$en el e$trato ; y 11'; =

11¡R(\j.
La c~lructura dr la f()rmula II :.,6ó] revela p()r qué las dos razones de
la~as cslalldari7,:loas quc c()mbinall los c~timados puntuale5 específicos
p()r CSlral() de la tabla 12.11 esti\1l rucrtcmenle innuenciados por los
pcqueoos estimad()s dcl ercclo dc las c¿ltc1!()rías de edad más vieias, -J
I )ild() quc II'; c~ el product() dcl pcS() u5¡ldo para la e$tandarización )'
f\(li' cl \'alor de csltl Roj innucneiar:í la pondcración de los estimados
L"'rl:cífico~ por cstrato, Dchid() a ello. R()i aumenta fuertemente con la
~l
I.:Ua(¡ partl los dat()~ dcl e.icmplo I.:...:.. ma~nificandC' a5i la innuencia de
I()s ~rupo~ dc cdad mil~ vie.ios sobre 1:1 razón de tasas estalldarizadas
~Iobal. Incluso la SM R. e5tandarizadtl como está según la distribución
dc cd:ld de lo~ j()vcnes entre los pr()pios fumadores, es sólo un modesto
1.4:. dcbido a 1:1 innucncitl del Roj cn la cxpresión [12.66],
Ba.io cicrtas c()ndiciones, 1:1ccuación [ 12.66] puede scr aplicada a datos
dc cas()-control p:lra ohteller cstim:ldo~ dc 1:1razón dc tasas estandariza-
das a partir de cstudios dc ca.1\('-contr()1 (t\1iettinen, 1972). Considcremos
la SM R quc, como 5icmpre, cstil estalldarizada scgún 1:1 di5tribución de
la rohlación expuesta. Si N I i es el numer¡ldor y D I j el denominador de
la tasa en la población origen expuesta de 105 su.ietos que ha)' en la
categ()ri.1 ;, entonces aj = ,frn(il(N1i) y ti = ./~o(i)(D1i)' donde aj es el
;
Illlmer() de caso.1\ expue5tos en el estrato; del estudio de casos y i:j

%]:
-.
~~
~.
'-~ ':~.~"'.:: ,~,..
~~tJ.:~~~;
~~:w;itf~~~:~:~;j;
~~~\\\~~
~

l
257
ANALISISESTRATIFICAOO

l:l)11lrolc$. <'; e$ cl I1Úmero de controles expuestos en el estrato i y ha(l} y


f,flth SUll 1.1$rr.\cciunc$ muestrale$ de caso$ y controles en el estrato i de la
pohl.1ción origen, Para estandarizar de acuerdo a la distribución de la
rohl.\ci()11 cxpucsl.\. \('j debcria $cr lumado como DIl = cli hO(l}' Rtl puede

ser c~crilo como

u R1i =
QiIJ:a(il

{'i/frn(il

n tic r()rI11:1 llllL' ~ I~ I i -= ~lli,./~" Similanncl1lc.

I~()i = ~
di¡j~ofil

í

v ¡v
bici
= L
III¡Roi
j= I dJca(jl

Si la rracci(>n de muestreo de 105 casos es constante a lo largo de los


estratos. lo que será verdad si los casos han sido seleccionados indepen-
dicntcmentc dcl r(lctor de estratificación. entonces

[12.6i]

L..I expresión [12.67] tiene la usual rorma de una SMR: a saber: razón del
numero observado de casos expuestos respecto de un número «espera-
do» o nulo. Dicho número esperado no es idéntico al del mismo nombre
que se utiliza para poner a prueba una hipótesis estadistica, que parte de
la premisa de que la hipótesis nula es correcta, lo que es algo que no
pucde ser ,1sumido cuando se procede a estimar. El número esperado de
1.1cx presión [ 12.67] il1dica cui1ntos casos expuestos se habrian observado
si la exposición c.lreciese de erecto, pero no implica ningún total
marginal que incluyese la celda a, puesto que esta celda a es, en cada
t.1bl.1 de 2 x 2. la que difiere respecto del valor nulo cuando la
exposición posee un erecto.
En los estudios de C:lso-control, resulta posible escoger otros están-
d.1res para proceder a la estandarización de los estimados de la razón de
t.1sas. Por ejemplo, si se toma \\'j como el tamaño del denominador de la
población no expuesta en la categoría i, igual a Dol = d¡/!co(i\' entonces

f ~Idi
SRR = i= 1 Ci
[12.68]
N
L bi
i: 1

~;:~?~~; !~.-~.
:'58 EPIDEMIOLOGIf\
MOOERNf\
I.:
:Isumiendo otr¿1 vez que la fraccián muestral de los casos es constante
I
.1 i() largo de los estratos.
Sc rueden calcular intervalos de confianza rara medidas del efeclo
cstandarizadas. rer() deben renejar el ratrón de los resos asignados por
cl csl.indar- rara diferenci.ls 01.' 1:lsa~ csland.lrizadas. una fórmula
;lrr(l\imildil <11.'lil \':lriiln7,:1 es'
-I

I \
\:ar (SI~D) ~ -~ Ir¡ \:ar (RD I l J 2.69]
( '11..)- , =
-I

c!()llc.1C I'.; es cl res() del eslándar rara la categoria i y la \iar (RD;) se


nhlielle de la r()rmula [ 12.1 J o de la [ 1.?.6]. dependiendo del tiro de datos.
r:lr(i obtener limjte~ dr confianza arroximados. puede utilizarse la raíz
c\I:Ic!rad(1 de \'.ar (SRDI a la hora de calculaí la desviación estándar de la
r(,rmula [1().21. J)ar(1 medida." de razóll de tasas. ha~' que utilizar la
Ilabilual
ri,rmula
transrormncii)n
arr()ximada
lo!!aritmica. Con datos de seguimienlo,
de 1.\ \.arianz:1 rar:1 el logarilmo
una
de una razón de .,
tasas eslandariz.\da e~

\;ar[ln (SRR)] ~ r.1~.f , "ar( ~lj) ¡;\1"? \iar (Ro;)


(~II.iR1j)2 + , [ 12. 70J
(¡;\I¡Ro;).

d()nde \:ar (R1i) ~ \:ar (R(I;) pueden estimarse a partir del primer y
sc~lIlldo~ quchrados. rcspcclivamclltc. de las fórmulas [12.1] ó [12.6].
depelldiclld(\ dcl tip() de datos: la raiz cuadrada de Var [ln(SRR)] se
rllCdc cmplcilr CJl lil exrrcsi¿)J1 [ 10.4] para hallar limites de confianza
1
apr()ximados. -~
Para e.iemplificar la aplicaciól1 de la fórmula [12.70]. determinemos los
limites de confianza aproximados, al 90 por 100. de la SMR calcula.da en
el e.iemplo 12.2. Los pesos del estándar. que para una SMR es siempre el
.grupo expuesto. ~. los sumandos de las sumas necesarias para la varianza
del logaritm() dc la SMR se dan en la labia 12.12. La varianza es:

1.997.56
444.4 J:
= 0.00159 + 0.01025= 0.01184
I

~.¡

La desviación estándar es. por i() tanto, ,\fó"ijTij;i. = 0,1088 )' el


in tervalo de confianza al 90 por 100 en torno a la S M J{ de 630/444,41 = '1
1.4.? es ~j

,645(0, 1088)] = ,19, ,,70


exp[ln .42) :t

J
Los cillculo!' anillogos. para un estándar en que se asignase a cada
c.ltegoria un reS() de 1.0. que da una r.lzón de tasas estandarizada de
1.ló. d.lrian com() resultad() una varianz.1 de 0,0161. correspondiendo a

~.~~.
.~.;:~:...;.::

~ji:..

1;1
~
",..-
1

ANALISIS ESTRATIFICADO 259

Catc~ ~Ori~l
11',
I \VjR,j \viRo1 1"lVar(R,,) wTVar(Ro,)
dc c' dad
--
<
~5- 44 51.4()7 32 i.58 32 15.56
45- 54 4.1.14X 104 4S :.63 104 197.03
J .'i.1\- (,4
h.'. 74
2X.ó12
12.6(,.~
206
IX6
14C

131
t.30
'.16
206
IR6
703.04
671.91
75. X4 .)..~ 17 102 112 ~.74 102 410.02

l To! 1~11 142.147 630 44~ :.41 630 .997.56

un,\ dc$vi,\cil)n cst(índar de 0.1169. El intervalo de confianza al 90 por


I!)!) p,\ra la SRI~ con pesos uniformes es

u exp[ln(I.16):t
.645(0.1269)] = 0.94. 1.43

N() PllC(lc rc:lliz:lrsc rormulación gener~11 alguna de la varianza del


1()~:lrilm() lll: 1:1 r;I/('!1 (ll: tas:ls cslalldariz¡I<.1a si .¡¡e la calcula a partir de
c.lal()s <.Ic C.:;ISl)-l."()lllr()I. pucsto qllc para ellos la propia fórmula de la
varii.ln7.:1 dcpcndc dc la ~Iec(;iún de un estándi.lr. Para la SMR (calculada
dc la ri)rmul.1 I: 12.671, que utiliz;.l la distribución de los sujetos expuestos
cn la población origen a modo de estándar, la varianza se puede
aproximar mediante:

.~ 2 ( 1 I I

L
i= 1
(biCi)
-!~-+-+-
di / \bi Ci di
)

n Var [In (SM R)] + If ~\2-

L aj
I ,i= 1 di )
n
[) Uliliz:.lndo los dalos del ejemplo 12.5. se puede calcular que la SM R es
3.78 y la Vllr [In (SM R)] = 0,350, lo que da un intervalo de confianza al
90 por 100 de,
~
,645(.,,¡ ~0,350)] =
exp[ln (3,78) :t ,43. 10,0

9 Sucede que este estimado puntual y el intervalo de confianza concuerdan


bien. en este caso. con el estimado puntual de máxima probabilidad (no
m colldicional) y el inlervalo de confianza al 90 por 100 de la media p
~ exacta. que previamente se calcularon y que eran 3.79 y entre 1,30 y 9,78,
respcctivamente: si bien es razonablemente común un acuerdo así, no
CStil garanti7.ado, al estar implicados principios diferentes en la pondera-
9 l:i()ll tic lo.c;resultados específicos por estrato entre los dos abordajes.

r-
' 1
:
~
..

~::-:::T:.~~;:J:¡l:~ ~~

~~í ,;~~;
~

EPIDEMIOLOGI/I M()DERNA
26(\

lllilizal1dl) com{'1 estál1d.lr l.I di.c;lrihuciól1 dc l{'1s .c;ujctos 110 exrueslos


CI\ I.i robl.ICi()11 origcl1 les dccir, r(>rI11ui;, [12,6RJ) $C e~tim..1 la \.ari~\l1za

t'I)I\) I):

\;ar [In (SRR)] =

I)ara los dalos del e.iempl() 12.5. la SRI~ de la fórmula '12.6g] es 3.9g y
1:1 \:ar [111 (SRI~)] = O.3Rl. dalldo lil1 inlervaJo de confianza al 90 por

1{){\ dc

exr (111 (3.9R\ = ,645( 10000)J = .44 .o

lJNCIONES DEL EFECTO 11


<..utlndl) sc Illitlc al factor modificador del efecto sobre una escala
continuil. com(1 pucde ser e] caso de la edad. resulta posible plantear una
.CC.:II;ICi¿'Illmtllcmiltica qut' dcscrib~\ la variación de la medida del efecto
c<'m<) funci()n dcl m(1difictldor dcl ciltltl(1 cfeclo. Por c.icmplo. si la razón

.
dc la~i\~ pilrccc \'ariar dt' form:\ lincal COIl la edad. es posible expresar
I
dicha ra7:011 tIc ta~i\S como función de Jinca recla de la edad:

I\R = tlo -1- (1;(edad)


~l
t
d(}11dl' (III C~ CJ \'al('r de la «intcrl.:cpci(,n)' ~ tI: Ull cocficienle que describe
lo;¡
el cambi(, cn 1:1rtl7.Ón de ta~a~ para Ull illl.:remellto de la edad consistiese A
: ~"1
L'1\ la llnidad, Lo~ coeficientc~ al} ~ (11 pucdcn scr estimados mediante un ~ $
.~
.~"~
rroccdimicnto de regre~ión pollderada simple,
Una funcil)n lineal n(' es necesariamcnte una buena descripción de la
relaci(,n matcmática existenle entrc la medida del ereclo y el modificador ..J
: 1
del mi~mo: pudiera suceder que \'alicse la pena plantearse transformacio- ~--1
ncs que me.iorasen tal descripción, Lo~ e~timados específicos por estrato
de la razón d~ tasa~ de incidencit! de 10~ dato~ del ejemplo 12.2 (Tabla
12.11) ilu~tran en IRR un decli\'e progresivo con la edad. En la figura
1;1
12..1..~c dc~pliegan I()~ e~timados e~pecíficos por estrato. Es evidente que
una lil1ca rccta 11(' \'(1 a cuadrar lodo ¡o bien que sería de esperar. En la
~'!!
fi!!tlra 1.?.4. se ocsplicga cllogaritm(' dc cctda e$timado de I RR específico
A 1
por coad: par:l I:ts cinc(' catc!:!ori:ts OC edad, de la mit$ joven a la más
vicia. uicho$ valorc$ $on 1.74(,9. (!.7(,03. 0.3841. 0.3046 y -0,1001. 1--
res'rcclivamcnlc. Estos \'alores se ¡1.i\lstan mc.ior a un patrón líncal, Para
1:,1
I(,s d:tloS dcl c.icmplf' 1.?.?.. puC$. pttrccc razonable de$cribir el efccto del u
fumc\r. mcdido por la razi)n de l:ls:ts de incidencín como función de la
cd:td. ulilizalloO una función I(,!:!~tritmictt dc Icl IRR:

In (II~I{ = {I" + (]I(edad)

':.~~.

it; .f.~;..
.-;-*
o 40 50 60 70 80
EDAD

Fig. 12.3. E.\'timado.\' de la r~=ÓlI de ío.\'a de i"cidencia de mllerte coronaria para


médicos británico.\, ji""adore.\" comparado.\' con ,'('./i,madore,\', por ed(ld ( dafo.( drl
eje",plo 12.2)

2.0
IV
.

c:
OJ
-0
1 . r.

c:
a>
-0 10
II) .
IV
II)
~
a>
-0 0.5
c:
.0
N
IV
~~~
o:: -..
o

40 50 60 70 80
EDAD

Fig. 12.4. LoKaritm(l de l(l.t e.ttimad(l.~ de la ra=ó" d(' ta.ta~ d(' i"ridr"rin d('
mucrt(' coro"aria para ",(;d;co.~ hritá,,;co.~ fi'mad(}r('.~, C(I',lpnr(ld(l.t C(I/I II(/ ./I11/l(ld(/-
res, por edad ( d(}t(l.~ dcl ('j('mpl(l 12.2 ) )' lí"ca dc reRr('.~ió" Jlmld(.rad(1 all(. clln(l,.a.

~
~

EPIDEMIOLOGIA MODERNA

Lo~ coeficiente~ de esta ecuación pueden determinarse fácilmente me-


diante un procedimiento de regresión lineal. Es importante utilizar una
regresión ponderada que asigne a cada observación especifica por
estrato un peso que rene.ie la precisión de ese estimado: tal propósito lo
cumpliril UI1 pes(1 que sea proporcional al reciproco de la varianza de
111(I R Rj). Para la regresión ponderada. los pesos específicos por edad se
c¡¡lculan. pues, como los reciproco~ de las varianzas obtenidas de la
formul¿¡ [ 1~.4]. y son 1.88. 10.76. 24.65. 24..14 ~. 23.77. del más joven al más
\.ic.jo. respccti\'amente. Nótesc cl pequeño peso acordado para la catego-
ría de edad má~ joven. en la cual sól(1 se observaron entre los no
fumtidores do~ acontecimientos: tal pcqueño número de acontecimientos
CI1 la tasa denominador de la razón de tasas conduce a obtener para ésta
una \'ar.ianza grande. La categoría más .joven. consecuentemente, no
c()ntrihu~le much(1 a que I¿¡ linca de regresión ponderada se adecúe. Un
an;ilisi~ de rcgrcsil)n pOl1dCrtidtl de los cuadrados minimos (Kleinbaum ~.
I.:.llppcr. 197R). utilizando los peso~ de arriba. da 00 = 2.29 )' al =
.-0.0.10. Para expresar la I R R como función de la edad utilizando estos
resultados. podemo~ dar la vuelta a la transformación logarítmica:
/", , .,()
IRR = ('I-.. -O.O301t:dad»)

L.I anterior ecuación cnmarcada dcscribr la razón de tasas de


incidcncia com<' runción de la edad y ruede ser utilizada para estimar la
I R r~ a cualquicr edad dada. Por e.icmplo. a la edad de sesenta y cinco
Clli<)s. el estimado de IRR e~ exp (2.:!9 -0.030(65)1 = 1.43. A la de 40,
.'.0: lo~ \.alore~ predicho y obser\'ado ~on rclati\'amentc discrepantes a
lo~ cuarenta años. porque para generar lo~ coefícientes se utilizó el
con.iunto entero de las categorías de edad, pero el inestable estimado de
I R R en la categoria de edad más .io\'en contribu~ró con poco peso. Para
I<)~ ochenta años. no obstante. la IRR estimada de 0.91 a partir de la
ecutlción de regresión es casi idéntica al valor observado de 0.90. a causa
de lo~ ma~'ore$ pesos que se asignaron a las categorias de edad más
vie.ias. El patrón global indica decli\'e gro~eramente exponencial de IRR
COll la edad. hasta que el erect() de,<;ararecc enteramente entre lo~ setenta
~. cinc<' ~ lo~ ochcnta (la ararentc in\'cr~i(,n en la dirección del erecto. a
las edade~ mil~ \'ie.ias. no e~ ~ufícicntementc chocante como para exigií
interpretación biológical.

REFERENCIAS

Hrc~I('1\\'. N. Odd~ ralio estimators when the data are sparse. Biometrika
, 9R , :68:73-R4.
nrcsl('1\\.. N. E.. and Lian~. K. \'. The variance or the Mantel-Haenszel
cstimnlor. Bi()111(,lric.~1982:38:943-952.
( .ornficld. J. A statistical problcm ari~ing rrom retrospective studies. Proc. Third
/J(',.".(,/(..I.S.I.',lp(J.~.1965:4: 135- '48.

~~

~.
l~~:~:~; ;~J%: ~

~- ~ ,,:..,.,..~..

ANALISIS ESTRATIFICADO 263

1 1)011. R.. and Ifill. A. B. Mortality


(Ihscr\,alions 011 coronary
or British
lhrombosis.
doctors in relation to smoking;
En W. Haenszel (ed), Epidemiological.
..If1f1r(/(I(.h(..\' 1(/ Ih(. Slud)' ()f Callcer alld O,her Chronic Disea.fes. Natl. Cancer
1".\/ .,\f ()11(). 1966: 19:205-268.
(iarl. J. ",. Point ~lnd interval estimation or the common odds ratio in the
comhinalion or 2 x 2 tables with fixed marginals. Bio,"etrika 1970;57:471-
475.
Uart. J. J. The comparison or proportions: A review or significance lest,
u col1fidcncc inlcrvals and adjuslmcl1ls ror stratification. Rev. Int. Stat. h,St .
1971: 39:148-169.
Urccl1land. S.. and Robins. J. M. Estimation or a common efTect parameter rrom

n ,parse rollow-up dala. BimJJeIrics 1985: 41:55-68.


11aldanc. J" 13. S. Thc cstimation and signific3nce or the log3rilhm or a r3tio or
rrcqucncic5" ".I/J/J. 1{1/m. Gell(,l. 1955:20:309-311.
Ilauck. \V. W. Thc largc 5amplc \'ariancc orthc Mantel-Haenszcl estimator ora
(;(Immon odds r:llio" BimJJ('lric.~ 1979: 35:817-819.
Ilcll1rclm:lnn. I." 1-1.. l-Iull. \V " J.. Phillips. M.. et al. Ncoplasms in persons
(rc:llcd \Villl .,-r:lys in inr~lncy-rourth survey in 20 years. J.. Nall. Callcer
I)J.\/ .1975:55:519-530.
Klcjnh:lum. D. G.. and KlIppcr. L. L. A.pplicd R('gre.fSio" Allal)'sis al1d Other
i\f,r/lil'(lri(II(. .\f(.,h(IJ.\,. Norlh Scjtualc. MA: Duxbury Press, 1978. P. 243.
Lubil1. J. H" /\11 Clllpiric~11 cvalualion or thc usc or condilional and uncon-
dili()nal likclihoods ror casc-conlrol data" Biom('trika 1981:68:567-571.
Mal1n. J. 1.. Inman. W" H. W.. :1nd Thorogood. M. Oral conlraceptive use in
oldcr women ~ll1d ratal myocardial infarction. Br. lWcd. J. 1968;2:193-199.
Mul1lel. N.. and Hacnszel. W. Slatistical aspects or the analysis or data rrom
rclrospecli\'e 5tudies or disease. J. ,Va/1 Callcer I/Jst. 1955:.?2:719- 748.
Manlel. N.. Bro\vn. C.. and Byar. D" P. Tesls ror homogeneity or effect in an
epidemiologic invesligatjon. .,.jm. J. Epide,"iol. 1977;106:125-129.
McKini3\'. S. M. The efecl or nonzero second-order jnteraction on combined
cstimálors or lhe odds ratio. Biometrika 1978:65: 191-202.
Miettil1en. O. S. Slandardization or risk ratios. A./Jl. J. Epidel"iol. 1972: 96:383-
3P'8.
Mjeltil1el1. O. S.. and NefT. R. K. Computer processing or epidemiologic data.
H(lrt 81r/1. 1971:::98-103.
:--'¡llrmincl1. N" I\symptolic cmciency or general noniterative estimators of
c()mmol1 rcl~lti\.c risk. Biom('trika 1981:68:525-530.
Rohil1s. J. M.. l~rcsl()w. N.. and Grecnland. S. Estimators or the Mantel-
Ilacnszcl varjant;c consistcnt in both sparse dala and large strata limiting
!¡1 models. 8i()IJI(.(ri('.f 1986:42:311-323.
liJ l{olllman. K. J. Spcrmicidc use and Down's syndrome. Am. J. Public Health
.It)R2: 7.?:399-401.
1{(llhman. K. J.. and ~1onson. R. R. Survival in trigeminal neuralgia. J. Chron. ,I
f
B /)i.f. 1973:26:303-309.
Rolhm~ln. K. J.. and Boice, J. D. Epidcnliologic A/Jalysis with a Programmable
( ir/(.,r/(lt()r. Brookline. MA: Epidemiology Resources, 1982. (Primera
l"(lición pllhlicada por U.S. Government Printing omce, Washington D.C.,
NIII Pllblit;atiol1 No.79-1649. June. 1979.)
T:II"IIl:. 1{. 1:. ()n summary cstimators or relative risk. J. CI,ron. Dis.
I 'IX I :.'\4:4(,.\-46R.
111,1",:,0;. 1). (i. I:xact :lnd a~ymptotic mcthods ror lhe combination of 2 x 2
I :11,lc~. ( illllf1llt(.r.\. (lI/d ni()m(.r/i(.(11 R('.\,l.(I'.('h 1975;8:423-446.

~~
'~..:.:- ;- o
.:::
..~'~'
~::.-"
gt,
;~'.~
;~t;f.:
.1~i~~. ~J~\~" ...
:;;;o:;;.;...:..:..;;.'-.,

261\ EPIDEMIOLOGIA MODERNA

Ul1ivCr!\jly Grour Diabcte~ Program. A study or the eITects or hypoglycemjc


a~cl1ls on vascular compljcatjon~ in patients with adult onsel djabetes.
l)i(lh('/('.\" 1970:19(Suppl. 2): 747-830.
Walkcr. A. M. Small sample propertje~ or some estimators or a common hazard
ratio. Al'pi. SIOI. 1985: 34:42-48.
\Voolr. B. 011 cstimaljn~ the rclation belween blood group and djsease. An1l.
1{1111,.(;(.11('1. 1954:19:.?;51.25~.
7.C¡Cli. '...1. Thc analy~i~ or ~cvcra] .:. x: contjngency tab)es. B;omL'rr;ka
1~71:5f;:I:?(}.I.1i.

fJ

,f I
j .
!

~~

~.~:(~:~~: !¡¡1\
;:~: ;J::~:

J~-,-.

13.

u El término (lpllr<'cll"i()I'ln* hace referencia a la selección de una serie de


compt\ración -sujetos no expuestos. si el estudio es de seguimiento o
controles. si lo es de caso-control- que es idéntica. 0 casi. a la serie
illJice con respecto a uno O más factores potenciales de confusión. Los
mecanismos del ,\pareamiento pueden aplicarse sujeto a sujeto, lo que se
llcscribe como (//1tlr('(lmit.'11loill(iil'i(illal. o por grupos de sujetos. lo que se
I.:OI1OCecomo (Ir{trew,liel1Io de ji'eCll()11Cia.S". Los principios generales que
~on de aplicación a los datos apareados son idénticos para ambos
mec,ln1smos.

,<'t.
~;
r ](ir EPIDEMIOLOGIA MODERNA

1.:lbla 13.1. J>(}hltl(.i(;ll (}ri~('ll hi,,(}léli(.a (1(' 2.00().0{)O d(' persona.\".


('II ltl (111('lt, (..\",,(}.\'ici(ill lIllm('llla el rie.\"1!o ell dit?: vt?ce.\")' los varone.\"
li('llen (.inc(} I!('c('.\" má.\' ri('.\"~o qU(' la.\, h('lllhras, .1. la ('."(po.\'ición
('.\"lá .fi,erl('lll('nl(' a.\'(}cillda cml ('I gént?ro

Varones (1.000.0001 Hembras (1.000.000)

Ex rllcst()~ N(\ exrue~to~ Ex rUeSla~ No expue~ta$


190!1.000) (1()().()()()1 (100.000) (900.000¡

l{i\.'..!-',\\.,lllInalic\ ().()()5 ().( )( I().'i o.oo I 0.0001


N\IIII. U\.' casos cn un
:llic1 4.5()(1 ;so I IO(J 9(1

..14.5(1(J + )(){))!I.OQO.OO(J
1{ICSI!('
-(5(1rclall"() hrtlto = + 90)/I.OOU.OOO
-= 32.9

I¿)gica deriva de su erecto sobre la eficiencia del estudio, no sobre su


validez. En estudios de casos y controles. la verdad es .que seria más
acertado decir que. más que prevenirla. el apareamiento introduce con-
fusión.
L{\ diferente de la$ implicacione$ deJ apareamiento para estudios de
sc!:tuimiento ). de caso-control e~ algo fácil de demostrar. Consideremos
una población origen de 2.000.000 de individuos. distribuido$ por edad y
~CX() en la forma que se indica en la tabla 1~.l. Tanto la exposición como
el gcner{\ masculin(1 son factores de riesgo para la enfermedad: para la
l'1rimer;\. el rieS.1;!<1relatívo es 10. ~. para varones respecto de hembras, 5.
Existe tambien un,\ confusión sustancia!. puesto que el 90 por 100 de los
individuos expuestos son varone$ y sólo ellO por 100 de los no-expues-
tos 1{\ son. El riesgo relativo bruto en la población origen, comparando
expuestos con no-expuestos. e$ 32.9. considerablemente diferente del
\"llar n<' confundido. que es 10.
Consideremos ahora qué ocurriria si se planificase un estudio de
seguimiento extrayendo la cohorte expuesta de la población origen ex-
puest,\ ~. apareando por sexo la cohorte no expuesta con la expuesta.
Supong,\mos que se incluye en el mismo ellO por 100 de la citada
población origen expuesta: si se seleccionase a los sujetos independiente-
mente del género. tendriamos en la cohorte expuesta, aproximadamente,
90.0(){) varones y 10.000 hembras. En la población origen, de 1.000.000
de individuos no expuestos. habría que sacar un grupo de comparación
con est,\ misma caracteristica. Si dicho grupo de comparación se extra-
.icsc. como el expuesto, independientemente del género, el estudio de
seguimiento en cuestión tendría (variabilidad muestral aparte) el mismo
grado de confusión que existe en la población origen, puesto que el
estudio de seguimiento seria entonces una simple muestra al 10 por 100
de la misma. Seria posible, no obstante, reunir la cohorte no expuesta de
modo que la proporción de varones en ella fuese idéntica a la que hay en

Kllt~~:~~~&j~ ,~
~~'

;;i~~:
:ltf:~.
¡~\im~ ~t1~l\\j
<;

l
AP AR EAM I ENTO 267

.1.:thl:l 13.2. 1~('.\"ltllltlltl.~ ('.~,,('radv.~ d(! Im e.~/udi() d(! .~(!j!,lti(/lielll0 llpareado,


II(' tm ltñll 11(' lhtr{/(.ilill. (1(' I()().()()() ,~I~jel().\' e."plt(!.\,l().\' y vlr().\, I()O.OOO 110-
1'.\.plt('.\"(I,\'. ,\'{/(',t(I(I,\' de la p()hlaci¡'/1 ()rif:(!n d(!.\,crila en la lahla 13.1

I Icmhras Total
V;,rlllll:~

No
1:.XI"Il:SIIIS :xpllcstas
I;Xrllcstos

10 I 460 46
( .;ISIIS 45() 45
10.00O IO.OOO IOO.OOO 100.000
1111;11 ()().( 1( 1() ,)().()()()
RR = 10 Bruto RR = lO
I~ 1{ I()
~-

l-
la ro¡,ortc ~xpue5ta. El propósito de aparear por el sexo la cohorte no
t:..~puesta al grupo expuesto es prevenir la confusión por dicha rúbrica.
u I)e los I()().()()() \.ar('1nes no expue$tos en la población origen, 90.000
t:.starían ~" lIl' ~rllr<1 de comparación apare~ldo, correspondiente a los
I)().()()()v;lrollc.<; CXr\l~st<'.<;dcll:.<;tudio. De las 900.000 hembras no expues-
las. I().()()() rcsull;¡ri¡lll sclcccion;¡das p¡lra emparejarlas con las 10.000
11t:.llll,r;ls I;xpllCSI;¡s.
Los resultados «esperados» del estudio de cohorte apareada descri-
to :lqui se indican en la tabla 13.2. El riesgo relativo esperado. en la
población estudio. es de 10 para los varones y lO para las hembras y
también es lO para los dalos brutos del estudio. El apareamiento ha
cumpiido. aparentemente. sus propósitos: no hay confusión por el sexo.
ruesto que el sexo en la población estudio, debido a haberse apareado.
110e5t{1 relacionado con la exposición.
L¡l situación difiere notablemente. sin embargo, si por el contrario lo
u lllle se realiz,l e5 un estudio de caso-control. Consideremos un estudio de
I;ste tipo b,lS,ldo en el total de 4.740 casos que ocurren durante un año
CIl la población origen. De estos casos. 4.550 son varones. Supongamos
~
tj elltollces que se seleccionan de la población origen 4.740 controles apa-
re..ldos por género a los casos. de modo que 4.550 de los controles sean
también v..lrones. De los 4.550 varones, se espera que alrededor del 90
ffi
ti por 100, 4.095, e5tarán expuestos. ya que el 90 por 100 de los varones de
1,1pobl..1ción origen lo están. De los 190 controles hembras, esperamos
4ue alrededor del 10 por 100, 19. estarán expuestas, correspondiendo al
I () por 100 que lo está en la población origen. Para la serie de los
~ <.:Olltroles en su conjunto, el número esperado de sujetos expuestos es
4.095 + 19 = 4.114, de un total de 4.740. Para los casos, 4.500 + 100 =
&1 4.600 de los 4.740 estarían expuestos. El estimado bruto del efecto,
[d b..lsado en la razón de ventaja de los datos brutos es:

(ji (4.600)(626)
[.1 Riesgo relativo bruto = = 50
,
(4.114)(140)

"~

~:~l~~~. ~~j]
:~\~~\\~~\~
~
..-""

'tf~;, ~

~l
~i
,¡;F. EPIDEMIOlOGIAMODERNA ~:.

~;

lf\lt' es lill.1 SllSt.lllt:ial subestimación del efecto no confundido de la ~:.


~

cxp('sici(,,1. 111tercsantcmente. los dato~ de caso-control dan el resultado ~:

L"11rrcct()o RR = J()o si sc estratifican lo~ datos en estrato~ varones y


l"'tr.II('S hcmhr.ls (Tilhla J3,3). En ella. la discrepancia entre los resulta-
(1(1, hrlllos ~ I(,s cspccífico~ según estrato e~ una manifestación de la
(1'llf\ISi()11 dchid;l al srxo (n(>tese que los estimados del efecto específicos
pllr ~ex(1 son idél1tic('~ el1trc si ~. distintamente diferente~ de los brutos).
¡ ,1:1 L"('nftISii)ll 11(' L'S rL'nL'.io dL' la ori~inal dcbida al sexo en la población
.1;ri!.!l'll. Sill(1 In:i" hi::ll 1111:1t'('llfusii,11 il1tr(,ducida en el csludio por el
rrl~loc."I' dcl apilrc:lmiclll(l. Ell I(,s c.~ludio~ de caso-control. ap~trear sobre
f:IL"lllrcS ;ls(lt:i;I<I(,s ;I 1;1c.xposici()n intr(,ducc confusión en lo~ datos. haya
II 111111a~';1t'('nfllsi()lj cn 1;1 r('hl;tlcii,n (,ri~cn. Si inicialmcnte la h~I~' en
1'11;1,((111\11S\It'l'<ii;1 CI\ cl c.icmpl(). cl pr(ICCSO dc uparc~tr sustituirá la
'1\IL"i;III'I'r ,111:1l\tlCV;l co;t.r\IL'tur;1 del cit;ld" cfccto de confu~ión. La que se
1IIIrl'(iIILOr por c! ;Iparc.lmicnt(' opcr;1 ~cncr~tlmcnte cn la dirección de un
S'.:SI!(I h;lria cl \'alor nulo dcl efccto. sea cual fuere la naturaleza de la
L'I'I~fu~ii,n quc h.thia en la pohlación origen. En el ejemplo. la fuerte
L'11I1ftISi()n positi\..1 (p,,~itiva indica ses~o en la misma dirección del efec-
IIII cn la poh¡"cii'ln ori~cn fuc recmpl,tz~lda por una fuerte confusión
nr!!;lti\;I (negati\Oa indic;.1 sesgo en la direccion opuesta a la del efecto) en
1(ls d:lI('S de c:lso-control,
i.l)('1 qué cl aparc;.lmicnto introduce confusión en un estudio de caso~
~ contr()les'? En este tipo de esludioso la fin~llidad de la serie control e.f,
pr<,porci<,nar Ul1 e~timadoo en la pohlttción origen de lo~ casos. de la
distrihut:i()n pcrsona-ticmp(' de la pohl~ici()n expuesta en relación a la
I\('-c:xrucsta. Si J(IS controlc~ a ap;.trcar con los casos se seleccionan
S ~lll\ Ul1 fact()r lf\ll' esluviese correl;.lcionado con la exposición. la pro-
I'()rci()n de e.xp()sici(,n hruta en los controle~ resultará distorsioada en
dirccci()n de h.lcers:.' ~imilar a la de los casos. Si el factor de apareamien-
1(1L'~tll\.iesc perfcct;¡mentc corrclacionudo con la exposición. la distribu-
cii)11 de e:xposiciiln de los controle~ sería idéntica a la de los casos y el
csllmad(' dcl ricsgo rcl;.itivo bruto seria 1.0. puesto que los controles
c"l;in rIL'!!idl)S p:lr:1 lfuC scan idél1ticos :1 lo~ casos con respecto al citado
factor <ir apar<:anlicnto. Es il1tcrCS:ll1tc cl hecho de que el sesgo del
,.:stiln;ld(1 dcl CrcL.tll ha<:ia cl valor 11ui() 11(' dependc dc la dirección
lit.' la 1:(lrrelacii)nl:l1trc la cxJ'('~iL"i()n ~ el fal:t('r de apareamiento: en tanto
exist:l una corrclat:i()n no-ccr(). positi\'a o neg;.ltiv;.l. la distribución de
L'.xposici()11 hrul.1 cl11re lo~ c<,ntrolcs cslttr;i dislorsionada en dirección
simil;lr a 1:1dc 1(15casos. Un;.1 perfecta c<,rrel;lción negativa entre el factor
de aparcttmicnto y la exposición. seguirá llevando a distribuciones de
cxposici()!l idént icas parn casos y controlcs ya un estimado del riesgo
rclati\,o hrulO dc 1.0, porque cada control se aparea con un valor
i<icnlit:(1 dcl f;lctor de apareamiento del caso, garantizando, asimismo, la
idcnlidCld dc 1.1 variahle de exposición,
Si sliccde quc el factor de apareamiento no está correlacionado con
1:1cxp(,~ici<)no el proceso que nos ocupa no innuirá sobre la distribución
dc cxposici<)n de lo~ controlc~ y. ConSCC\lCntcmente, el ap,lreamiento no

I
"..;~~
~i-

mi...xot...;.::-:..:..,,~~
~~. ~¡~
.~
~.

l APAREAMIENTO 269

-.1

" ' , -*
.:,:~:;;~Jt~;
J~¡:.~¡:¡~~:.
~~-
~"~.

27(1 EPIDEMIOLOGIA
MODERNA 1
il1troducirá Cl1 csos casos se$go alguno, Puesto que e$til ostensiblemente
moti\'.lti(1 por la nece5idad de controlar la confusión que elOos) factor(es)
dc aparcamient() produce(n). cabria esperar. por lo general, que existiese
cicrta corrclaci()1l entre é~tc(csto~) y la expo~ición, Si tal correlación es
ccr(). cs quc cl f;lct()r dc aparc.lmicnt() 11(\ estaba collfulldiend() de ante-
Iltalt(), plICSt(\ lJlIC un factor (It' confusi()1l dchc estar asociad() tanto con
]
1;1 cxp()~ici()lt como C()1l la ellfcrmctl;lti,
1\;lrcL.t' quc el apareamiento. aunqut' concebid() para c()ntrolar la
L\)Il(lISi()n, n(1 coll~i!!ue ese ob,ieti\'o en lo~ estudios de ca5o-control,
t\r;lrclltcmcntc. cfcctlla 5implcmente una 5ustitución de la anligua es-
trllctur¡1 dc c(1Itfusi()lt por otra nueva, Dc hecho. puede incluso introdu-
t'irl.1 ti('lltlc prcviamcltlC 1l0 cxi5lia ninguna: si el factor de apareamiento
Il() e~ti\ rclacionad() COIl la enfermedad en la población origen. en condi-
ci()nc" Il(\rmalcs no c()nflllldiril: n(\ ()bst¡lnte, si está correlacionado con
I;! cxposiciól1 en Ull estudi() d~ caso-control, 5~ convertirá en factor de
(,:oltfllsi()1l tra~ lJue sc apc.lrease por él, Ell la tabla 13,4 se ilustra esta
sitllaci()Il, ell dolldc la exposicióll tiene un efect() correspondiente a un
rics.!:!(\ relati\,o de 5,6 y no hay collfusiól1 en 13 población origen; sin j
cnlbar!:!(). si ~c usall lo~ ca~os com() base para un estudi() de caso-control
~ se .Iparea por gcller() a I()~ caso,<; una 5erie de control. el \'alor esperado
tic! estimad() hrut() de! CfCCto $acad() del estudi() citado de ca50-control
c~ 2.1. cn VC7.dcl \'alor corrcct(1 de 5.6. En la población origen. el sexo no
c.;til c(lrrclacion;ld(1 COIl 1;1cnfermedc.¡d cntre los n()-expue~tos. siendo la
rrc\.alcl1cia de 1.1 misma dc dos sobre mil. tant() para los \'arones como
p;lr:1 1¡1, hcmhras n(1 CXpllC~t:¡S. El ScX() sí est{1 fllcrtemente correlaciona-
(1(1 t'(\1l 1;1cxp()sici()lt. sill cmhargo. En el e$tudio dc ca$o-control. el sexo
cst.i l'()nrulltliclttl() porlJlIt: fue un factor de apareamiento que estaba
L'(\rrclilcion¡lti() con 1.\ exposición. A pe5ar de la ausencia de correlación
entrc scxo ~' enfermedad entre los no-expuestos de la población origen. el
ar:lrcamientn ha introducido en los dato~ de caso~ \' controle5 una
c()rrcl:¡ci()11 elttrc scxo ~' enfermcdad en el $cn() de los cilado~ no-cxpues-
t(\s. 1:1 rCSUll,\d{1 es un e$timado bruto del efecto, 2.1. que subestima
scri:¡mcntc el \';llar corrccto. que es 5.6,
I.il confllsi()lt illtroducid(1 en un e~tudio de caso-contro! por el apa-
r'.::¡micllto e11modo alglln{\ carece de remedio. Obsérvese que en las tablas
1.1".""~ I ~.4, !()S estimado~ del eíecto específicos por e$trat() son válidos: la
(;('Ilfusión pucde eliminar5e mediante un análisi~ estratificado que lle\'ase
a un estimatlo conjuntado del efecto tras estratificar según el(Jos) factor(es)
dc ;Ip;¡reamicnlo. La tabla 13.4 ilustra la necesidad de un análisis que
climillc esta confusi()n debida a factores de apareamiento, ya que la
tccni(;a pucde call.C;¡lr confu5ión, aunque originalmente no hubiese ningu-
Ita (como ante.c; $e $cfialab¡l), En dichí1 tabla, el criterio de selección
Iltili7ado para apare;¡r 10$ controles hace a esta serie de control no
rcprcsclltaliv¡1 dc la poblaci()n ori!!ell con respecto a la exposición: ello
L.()lldllciria (1 lIll Se5!!() de .c;elecci()n. 5i no fuese por el hecho de que se le
plll'dc L'ontro!:¡r Clt el anillisis. lo quc hacc factible considerarle como un
f;IL'\Or dt' L.ollftlsi()n,

~~

~~-~
~
APAREAMIENTO 271
1
~
.-
5
J
~ ~
~ ':: ~
;,., I
:--.:: ."'
~ ~
"' ... 1-
'"' ::
"::1 "' .:::
-~
--
~ ,.
~ ~
~ ':::
---= ~
--
:§ ~
."
~ ':: ~ ¡ ---
-::.~
-.- ~ Ñ 5
:: ": ;
-~=
u ~
.-~
..

.: ~
..:

::.
~

:!1
-=
.c z

~
".)
~
i
I
,
i

~
~
c
~ -o.
""'
-.-
,., .- - ~ I '1
~"' ;)
(~
.~..t. "'
.,
.~ :: 0"\ c
~ ~ c
..::: -- :J ~ c
"'-:: ~
~ ~ o. 0' c
""
~~~ - ..'
~-- -
--
-~
~ ~
-
::~ ...
, .-
:IJ
~
.L:
.::? -:;
.--
:"" ~ -
...
~ ~ .o
~":: .Ü
:-:
~ ~ ..- ::5
,. -
O
0-
~-=
.-
"' ~
--.
-~
~~
~ -=
~ -
..-
~ ~
i'
..,: 5 ."'
~ t"\ "'
~
~"'::
:E
~
~ "'='
~
"'=' (/)
¡~ ~ ~
I' ~ E -:
~ ...::.
~ ~ o
E c f-
...~
~ o
c Z
,UJ
1:!1
9 ~
.~
1I11 1;¡ :~~
~

EPIDEMIDlOGII\ MODEnNI\

1..111111l:sllltlill li\.' scl.!liimicl1t(' <.Jlil' C(1111r:lr;ISC rics!l()s, no ~c rcqllicre


;11.'l'icI11 ;lclil'i(111&11 :11J:!liI1:1 Cl1 cl al1illisis r;lr&1 t;(llltr(llilr la t;(ll1fusi()11 il1tro-
(i\ll'ill:1 1)1Ir I(,s f¡lct(lrcs dl: ararC¡\micl1to: tlicll() procc¡¡o ha climinado ya
l'II;llljllicr l'(lnfllSi(ll1 dchitlo a cllo~, El1 cOl1tr&l$tc, aparcar en UI1 e$tudio
(il' <:;IS()-<:lll1trol exigc lil1 col1trol añadido, el1 el ani\li~is, de la col1fu~ión
(!;"hi(!:1 :1 I()s f:lct('r~s tll' ararcamiel1t('\ cit(ldos, incluso si no están con-
fllll(lil'11<i1) CI1 la r()I)I:ICi()11 ori!!cl1. sicmprc quc dicl1o~ factores estuviesel1
l'(1rr...'I:lciol1:1d()s <:c)11 1:\ exr()~ici¿,n, i,A qué $C debc esta discrepancia? En
1111l"'tll(II(1 tic ~c~lijmicl1to, el aparcamiento $C Ije\'a a cabo sin tener en I
('11;,'111:1l'¡ ,\1(1'/1,\ (I ciJfcrmcll;lli. qUl' c"' dc¡¡conocidl) cu¡llldo se le inici(l.
1"l'\illi::II(I(\ C011 cllc) 1;1 ap:lrici()n dcl $C$~O, El1 uno de caso", y controles,
I'C)I 1.'1 \.'c'"lr:lric). l'1 al):lrcamicnl() implica 1:1 e~pccific.lción tanto del
\11111(\ <i\.' l'nrcrJl'l'll:I(1 C()llI() dcl dr cxr()$ici()11 y conduce (1 a~ociaciones
(1\11(lil.'il\II:llc~ Cl1tl clll()sl r;\CI(lrlcsl ti I.' aparcamiCnl(' t&lnll) Con la exposi-
l'll'r l'!\I'I'\
(1:.' l':I~I'~
l'()11 1;1 l'llfl'rll'l'dad,
\ l'('11Ir('lcs.
dIll1t1(,
S\.,g\111 ¡¡\.' sct\¡llaha
1\I~ar C()11 cllo
t:\mhien
a scsgos,
antes.
Eil
si los factores
un estudio
no
I
1."1;111 l'1)I:rl.I:Il"i(,J':I(lc,s ~(III 1:1 cxr()"'ici()I1. el apare:\micnt('\ no produce
1.'1)llrIISil\11. 1~11csI;1 siluaci(,I1, puctlc quc tle el1trada !lO la hubiese habido
C!l 1:¡ p('hlaci()11 ()rigcll, por 1(1 quc resullaba innecesario aparear,
rlll'st(\ que 11(\ $C cumple, por tanl(). el ob.ietivo que se pretende
\('\.i:a r la cOl1fu~i()n ). resulta razonablc pregunlarsc por qué siquiera plan-
Il.;!rSC aparcar Cl1 c,"ludios dc cas('\-control. La utilidad deJ apareamiento
CI) I()~ mismo, rr.'\'icl1c 110 de su capacidad para prevenir la confusión.
~i!lc) dc 1:1 mc.ior~1 tll' cficicncia que arorla a la hora de controlar la misma,
F,I! I~! t:lhl;! 13.~, I()., cstralOs ma$culil1(1 ~' remenil1() tienen cada uno el I
mism<' l1ilmCr() (Ic C:ISOS ~' c()nlrolcs dchid('\ .ll diseño aparcado, Si se
s,.:ll'cl.i()I1:111 4.74(1 <:('l1tr()les ~il1 aparCamiCl110, la mitad ~erian varones. y
1.1()Ira
hell1hr:ls,
mit~ld.
pUeSl(\
hcmhras,
que
1-1&lhria, r()r
.:..-'70 es Ul1 nümer()
tant(). un exces('\ grallde
innecesariamente
de controles
grande de
I
CO!llr()lc.' par&1 19(! ca~os: I.l cal1lidad de información total no aumenta
~listanci:llmentc mils allil dc cil1co o seis controles por caso (véase Fig,
~,1) y. p()r col1$i~liicntc. I.1 inrormaciól1 recogida sobre tantas hembras
cstarii p&lrcialmel1lC despcrdiciada. Por el contrario. habria sólo .2.370
cI\nlroles
Il1l'licit:11ll.
\.:lrol1e~
tc11cr
rara
l'~tr&llos
los 4.55(¡
CJ1 10~ que
caso~ de C$C mism('\
la razón de controles
sexo, En general.
a casos \'arie
es
I
,11"1;111l.ialmcllte :1 amh()~ 1:ldo", dc la ul1idad, La forma extrema de tal
illl'lil:iclll"i;1 (ICUrrl' cual1do ha~' tnllcho.s eSlr~\tos individuales con uno o
miis l:~ISI'S v l1il11!lll1 slljcl() control (razól1 dc conlrolesjcasos = 0) y otros
c~tr¡llo~ CI)n UI1(; () miis colltroJes ~il1 nil1gül1 caso (razón controles/casos
= il1rinil()I. E~tralos asi nO proporcio!lal1 información alguna a un
a!l:ilisi.s c,c;lralific&lti(\, Si en la selecci()n de los controles, sin embargo. se I
li.S:1 el ararc.lmielll('. hahr:i en e~tc lipo de análisis menos estratos no
il1r()rm:llivos dc II)" qllc r()dri.1 h.lhcr caso de no hacerlo: un número fijo
dl' c()l1lroles
cad(, exlrcmadal1lcntc
ap:lrc:ldos por
eficicntc.
cada c.\S() proporcionaril
Tal mcjora dc la eficiencia
un análisis estratifi-
se manifesta-
I
r¡i CI1 fOrl11a dc
rlll1tlJ&ll qlle
m¡\s e~trccho",
10$ <.Juc plldicral1
limilcs
col1seguirsc
d'c col1lianza
de cualquier
el1 torno
otra
al eslimado
manera. Así
"

--

~~:?',~ ~

É~:
;~~"'

.~
;j~,:'f~
\;~l.
~~~ ~~~
A.~ ;.;:;;..~~;;;., J"".'.;.;.¡¡;'.¡~

APAREAMIENTO 273

pues. aparear en los estudios de caso-control puede considerarse como


un medio de conseguir análisis estratificados más eficientes, en vez de
como un medio directo de prevenir la confusión. La estratificación (o un
abordaje multivarii.ldo equivalente) seria necesaria para controlar la con-
rusión con 0 sin i.lpi.lreamiento, pero éste la hace más eficiente.
Esa eficiencia que el i.lpareamiento proporciona en el análisis de
d~ltOS de casos y controles se consigue a un precio importante. Una parte
<.\cl mismo con.c;istc en una limitación para la investigación: si en un
estudio de este tipo se aparea por un factor. ya no se puede seguir estiman-
uo su efecto. porque su distribución se ha fOrz~ldo que sea idéntica para
;llllh()s .!:!rup()s. <..()nsccuentcmcnte. en un estudio de casos y controles no
rucdcn ."er ohjeto ue in\.estigación los factores de apareamiento (excepto
cn t~lnto quc m()dific~ldores de efecto -véanse págs. 310-314. Evaluación
Jc la modific~lcil)n del efecto con datos apareados). Otro precio que se
pagi.l es la comple.jidad ~lnalitica i.lñadida que se requiere para controlar
la confusión debid~l a factores que no han sido apareados. Controlar
simultáne~lmente tanto los factores apareados como los no-apareados es
posihlc. pero. por lo general. sólo mediante análisis especializados. habi-
lualmente modelos multivariados. ,\ la vista de la creciente disponibili-
J¡ld Jc computadoras. 11cvar a c~lho estos anillisis no plantea dificu.ltades
scrias. pcr() c.:1illvcstigador se ve oblig~ldo a depender de computadoras y
pro~r~lmas inrorm;iticos par~1. an~llizar unos datos que en otro caso
lendria qut: l1i.lhcr analizado de manera mils directa.
Un precio ~ldicional implicado en el apareamiento individual es el ~
.,

gasto. en sentido estricto. en que hay que incurrir durante el proceso de


clcgir su.ietos controles que tengan la misma distribución de factores de r
apareamiento hallada en la serie de los casos. Si se está apareando según
varios factores. lo típico es que haya que pasar sobre muchos sujetos que f"
1:
son controles potenciales para encontrar uno que tenga las mismas }
caracteristicas que el caso. Aunque es cierto que este arduo proceso
puede conducir a un análisis eficiente estadisticamente. esa mejora de
eficiencia sólo 5e consigue a un costo considerable.
Si se juzga la eficiencia de un estudio desde el punto de vista de la
m c~lntidad de inform~lción por sujeto estudiado (eficiencia de tamaño), el
~lpare~lmiento puede ser visto como un medio de mejorar la eficiencia de
! ~ un estudio. Pero si. altern~ltivamente. 5e la juzga como la cantidad de
I 9 inform;lción conseguida por unidad de coste empleada en obtenerla
{cliciencia de coste) i.lparear puede. p~lradójicamente, tener el efecto
opuesto de disminuir la eficiencia del estudio. ya que el esfuerzo desple-
g g~ldo para encontrar sujetos apareados podria haberse empleado simple-
mente en recoger información de un número mayor de sujetos no apa-
reados. Con o sin apareamiento, la confusión habrá de ser controlada en
el análisis de datos. Con él, un análisis estratificado ser-á más eficiente en
I: ~
!. tamaño: 5in él. los recursos destinados a la recogida de datos podrían
incrementar el número de sujeto~. con lo que aumentaría la eficiencia de
!, § co~te. Dado que para un investigador esta última constituye una preo-
I cupacil)n mil~ fundamental que la de tamaño, las aparentes ganancias en
cficicncii.1 lichilia~ ~ll ap,lreamiento podrian resultar ilusorias.
[1
U
l~--- ,~.:..,:..~...~ -

..t~
,~:~. ::;¡:i:;:;i
::~?~~~~
,ii
E PIDEMIOLOGIA MODERNA

1 }l' L'StL' Ill(ld(l. cl CrCC\() hclleficios() del aparcamiento sobre la efi-


L'll'IJl'i;\ lll'1 C.1;ltl(li(l, que es la raz()n pril1cipal de su uso, parece ser
L'(IIJ1~r(1, ('il'rtaI11CI)II.:, si cl ~ast() en que ~e incllrre por el mismo reduce el
JIIIIJI~r(1 1(llal dc su,ictos de UI1 estudio, la decisión de aparear puede
I L'o;llll;lr Cl1 quc (II final sc dispon!!a de menos inrormación total. expresa-
l\;t CSt;1 pl)r 1;1 ;ll1lplitud dcl interval() dc confianza de la medida del
l'fL'l'\(', 411l' 1;1 411C sr 11;lhria ohlenido sin tornar dicha decisión, Una
;1!'rL'l':¡ll'j()n m:l~ ¡ll1lrlia dc los costes que cl aparcamiento impone ~' de
1;1' :1 IJJl'IJlld(, Jnil~r;ls \'enla,i:ls quc ofrecc. prcsumiblemente persuadirá a
II" L'ri(ll'llli(II()~(1-; s(11')rc la con\,cnicncia de e\'itar esta técnica en mucha~
(IL':ISi()IIL'.. 1.:114Ul' s...' .\;1 u~a dc mancr:.1 rutinari(l, Puesto que el ob,ietivo
lllll' ~l' hllsca I.:~ l'()nlr()lclr la conrusión ~' e~lo ~ólo puede obtenerse
Inl'(II;lnl...' I()s :111:ilisis clprl'pi(ldos, indepcndiclltemente de si se emplea el
:IJ';lll';llni:.'nt(' (, Ill). su liS() rutin:.1rill rar:.1s veces esti\ .iustificado,
;\ r\.'0;:lr de t()d(). l1a~ algun~\~ ~iluacione~ el1 la~ que resulta deseable.
(1 iIICIIIS(1 ncl'cs:lri(), aparcar, Si el proceso dc obtener la inrormación
o;c,l')r:.' 1(1SStl,iCI()S dcl cstlldi() es Cc\rl), es dcseahle optimizar la cantidad de
iIII11rln:ll'ic)11 4tlr sr r()nsi~;1 por cad:1 tin() <lc ellos, Por e,iemplo, si la
illl(,rI1J;ll'i()11 Ol' L',xr()sicil)11 el1 un estuoil' de caso-control implica una
rrtich;\ L'ara Ol' 1;lh()ralori('\ con muestra~ de san~re, el investigador
Ól"iCílríl 4tlC 1:1 illl(lrln;lL'ii)n de cada Stl,iCIO conlribu~.a )o máximo posi-
t'l1:.'. ¡;11 1:1 I1lCOill:1 t:11 411l' t:1 ~aslo dc disponer de controles apareado$ es
!')1.'411L'illl l'll L'()n11);lr;lL'i()IJ Cl)n el de obtcner I~I información de exposición
(I: r:I(!;! sllit:I('. Il:SIIII:1 prcrcrihlc planificar un anillisis estratificado en el
1/IIl'¡:\ l'SlraliriL';ll.iI111 IJ() L'()llOUCC (I la pcroidLI dc información, es decir: es
(1\.'sL'al')ll' aparc:11 los col1troles ourLlnte la selección dc los ~u.ietos, de
11111(111
lJIIL' ha~;! t:IJ uicl1() anillisis una razón uniforme de controles a
L';lo;(,~, Ii( )r SupUl"'t ('. si se prcvc q tIC n('\ V:1 a ha bcr conrusión, no hay
Ill'L'L'sill;llI dl' ar:lrt:ar: por e.iemplo. la restricción de amba$ series podria
!')rl'\t'llir líl l'()nrIISi()IJ sin nccc~itlao oe estraliflcar ni de aparear, Si, por
l'('lltr;l. L'S rrohahlc quc la ha~'a, cl ararcamicnlo asegura que su control
L'I) t'¡ ;IIJ;ilisis n('\ si!!niricaril 1;¡ p¿.roioa OC lIna inr()rmación a tan alto coste
c,I')I<.,llida, La dif~rcrlL'ia csel1L'ial quc hacc atractivo el apareamiento en
l'sl;1 ~iluacinl1 c~ el all() prcci() de ampliar cl tamaño del estudio: cuando
rL'.;lllt;! c;lr<, ('\hll.:ncr m;\s 5u.i~tos, \'ale la pena, pues, pagar e] costo del
;11';lr\.';111)i-.:nll' p;lra sacar plen(' rendimiento :.1 la información que se ha
rL'l'()~iol', l:n uIla ~iluaci()n asi. aparear sirve tanto a la eficiencia de
1;lln:li1(, l'OI1l(l a la OC costc,
¡\ n1~11()~ lJIIL' t:1 aparcamicnlo hay~1 preparado el camino para hacer-
1(1. l" l'()lltrol Ot' 1;1 ('onrll~ión en el ani\lisi~ algunas veces no es posible,
I Ina~iIICI1lOS un fal'lor potencial de confusión que se midiese en una escala
11()l1lil1al C()11 I1ltlchas categoria5: e.iemplos podrían ser variables como
\'l'l'ino:lo, parcnlt:sC() ~' ocupación, Controlar por parentesco seria impo-
sihll', :1 mcno~ lJUl' rara los C~ISOS ~c selccL'i(ll1asen controles que fuesen
pariCl11l'S su~'os: cst() e~, se ncccsita (\parc:.lr por parenlesco para poder
L'('l1tr()larl(" Estas v~\riahles sc distingucl1 tic otras tttmbién dc escala
n()mil1í\l, como ('I SCXO, por su multiluo de categorias, lo que asegura que

;:..: .~~~~;~:~:" .:~:

-,.~.
.~~ ~;~
-~."
:i1-!"i;.':
j;!1::; :;,...;.. ~.-- .;, ".

~
APAREAMIENTO 275.
~
Jcl1tro Je c.1da una de ellas caerán uno o muy pocos sujetos. En un [t
allillisi5 c5tr.1tific.1do 5in apareamiento. la mayoría de los estratos tendría ~
~.
s(ilo UI1 5ujeto. ruese un caso o un control y ninguna inrormación sobre ft
cl crecto. .1 no 5er que los sujetos control hubiesen sido apareados a los t
C.:.IS0Sp.1ra el valor del raCtor en cuestión. Variables continuas como la r

1:(lad tiencn lamhiél1 un.1 multitud de valores. pero estos se combinan


r;,¡l'illnCl1tc medial1lc :lgrupamicl1tos. evitt1ndo el problema rundamental.
Si las calc!:!orías (Ic 1111.\variahle dc escala nominal pudiesen ser combi-
11;1<i:lSJc r()..111.1..;IZ()II;lhll:. p()<iri:l cvitarsc 1:1necesidad de apareamiento.
SI: 11;111 r..()1)llcst{) 111l't()J()S p:l..a C()lls<:!!lIirl() (vé:lsc. por ejemplo. Mietti-
11l:ll. I {)7ó). rl:..(1 ..l:llll iC..Cll 1111;111;'¡
lisi5 111111t i va ..i;ldo como paso prelimi-
11;1..;lll:st..atili{;.\(I(I. ,\p:lrc.1r r()r v.1rit1blcs dc escala nominal con muchas
c.:ategorias ascgura <lUC. dC5pués de la estratificación por el potencial
factor de conrusión. cada caso tenga para comparar uno o más contro-
'1 Ics .lpt1ret1dos.
u Un prohlema rundamental que tiene el análisis estratificado es su
ihc.lpacidad ptlr.1 controlar simultáneamente la conrusión por varios
ractore5. El control de cada ractor adicional implica desplegar los extra-
I los existentc5 sobre una nueva dimensión: el número total de estratos
nece5arios se hace exponencialmente mayor conforme se incrementa el
ntllT1CrO dc \'.lri.lhles de estratificación. Para estudioS con muchos racto-
res dc conru5ión. cl ntlmero de estratos de un análisis estratificado que los
l:()ntroltlse todos simulti1ne.1mente podría ~er tan grande que la situación
.'i~ pa..e{;iese .1 aquelli.1 ~n la que hubiese conrundiendo un ractor medido

I cn e5cali.\ nomin.11 con multitud


~ujetos por estrato y dificilmente
de categorias. Habría uno o muy pocos
alguna información comparativ2. acer-
C.1del erecto de ninguno de ellos. Si se prevé un gran número de factores
de col1rusión. puede ser deseable aparear para asegurar un análisis ~stra-
I tificado Con capacidad de información. Por el contrario. no es absoluta-
mente necesario aparear a menos que hubiera variables de escala nomí-
nal con muchas categorías. puesto que un análisis multivariado puede
I h.1Cer rrente simulti1neamente
inclu5o en situ:lciones
a la confusión debida a muchos factores.
en que ralla la estratificación. Por su parte. inciuso
UI1 ani11isis multi\'t1rit1do cs inadecuado para controlar la confusión por
v;lriahlcs de escala nominal con un número grande de posibles valores.
sin cmh.lrgo. si el apare.1miento no ha proporcionado la necesaria infor-
m(lcii)n comparatiV(l dentro de las categorías,
Podemos resumir la utilidad del apareamiento en los estudios de
c.1so-control de 1.1 siguiente manera: es un medio útil de mejorar la
cficicl1cia del estudio. en términos de la cantidad de información por
SlljCtO cstudit1do. si la cantidad de información que se puede obtener de
u c5e análisis más eficiente excede a la que se podría obtener simplemente
estudiando más sujetos sin llevarlo a cabo. Está indicado aparear por
potenciales ractores de confusión que estuviesen medidos en una escala
11ormint11 con muchas categorías o cuando el número de variables con
CS(l potencialidad es tan grande que la estratificación esparciría los
su.ictos en fr.llljas demasiado delgadas a lo largo de los estratos. En esta

u
-~-

-. :::;:.
.:.~.:.

~
-~ ;;¡~";;:

..".;.;.~..:-'"'-..

.,." fl"DEMIOLOGI/I MOOfnN/,

1lllim;1 Silll;ICi(\Il. cl allilli~is mUlli\.¡lrill<l() cs lIlla allerllativll ra7.onahlc:


SL'ri;1 r;ll.lihlc ;lllll Sill cslralifica<:ii)ll. N() ()h~llll1lc. il1cluso cl al1i\lisis
mlllli\.llriad() rcslllla invillhle para colltrolar la conrusión debida a un
r;ICI()r
rlc;lsc
<lc escal;1
cl aparcall1iclll0.
Ilomillal COIl muchas calcgorias. a mel1os que se em- 1
.\, ';)I'( '(11'(".('tI", ;('/ " , J

l ill Il'rllli,I(\ \1.1;;1(1(1t:°'1 frccucncia cn rclaci<)n con 10.1;estudios apareados


l" l'¡ (ll' .\(lh,.(.(II"lr(.(lllli(.,II(I. l-a intcrprctaci()11 dc cstc término ha cam-
hJ;I(I(\ (."\';Ind(\ ~l' 11¡\ (li.1;puc~t(\ dc una c()mrrcnsión más afinada de los
rrinl'i"i(\s lJU{' ~\II,~.accI1 Iras los cit;ld('1s estudios aparcados. Original-
ml'nlL'. l'l ti:rn1in(\ f\lr Iltili7.:ld(\ CI1 rcfcrcnci:1 a 1:1 pérdida de \'alidez que
,
s:.' '1Ifli:1 CII UII cstll<ii(\ (ll' L'a~(\-runlr()1 a parlir de que el grupo control se
hllhle,l' aparca<lf\ t:ln il1timamcntc al dc los caSoS que la.l; distribucione,<¡
dl' exposición diriricsen m\I~. poco. Esta primera interpretación del SO-
hrca~lrcamient(\ <;l' hasah:l en un análisi,<¡ defectuoso, que fracasaba a la
h(\r:l d{' corre!!il 1;1confllsi()11 il1troducida. Con un análisi~ adecuado. el
an:lr(;amiel1l('~ II(' iJ1lroduce en ab$oluto problema alguno de \'alidez. ~t
F
N()leSe qll~ cn UII esludi('1 de seguimiento con apareamiento. hasta el aná- .1
¡i~i~ hrut(1 e.' \.:ilid(1. dc mod(l que el sobreaparcamiento nunca fue visto
C('m!' U'l pr('hll'm;\ en lo~ estudio.' de este tipo. Hemo,<¡ vist('1 que. cierta-
mt'lltc. ('xi~\c c.;{' prohlcma de \';llidc7 de¡,id{1 al ~Ipareamiento en los
estlldios de c:t~(\-{"(\nlrol" ~i 10'<¡dato,<¡ brulo,<¡ se emplean para hacer infe-
rcncias. F.ste pr(\\'lrm;, dcsaparece. sin cmhargo, si se empiea en el análi-
si~ i:l e,<¡tratifit::lI."j(,11 por los facl('1re~ de aparcamicnto.
L;¡ il1lerprct;ICi()11 moderna del sobreapareamiento se relaciona con -
i;1 eficiencia dcl estudi(l. m:l~ que Con su validez. Consideremos un
e~ludi() de cas('s y controles apareados individualmente y Con un solo
c(lntrol aparc~I(I() a cad;1 caso. Cada estrato del análisis consistirá en un
C;I~(1 ~. un conlr<,I. a n(1 ser que se combinasen algunos de dichos
(',tr~ltO!\. Un estrat() no puede proporcionar información a un análisis de
l.ISO-l'('1lltrol si cualauier .-- lotal mar[!inal de la tabla de 2 x 2 es i\Zual a
cl'r(\. Si un ca~(\ ~ un conlro! apareadC' únicC' son ambos expuestos o
ilmhos n(' expuesl()!\. un('1 dc lo~ m:irgcnes de la tabla de 2 x 2 será cero
~. csc par de ~U.iCIO~ 110 col1tribuir¿ln al anillisis con ninguna información.
Si sc aparc:ln \.arios conlrole~ a un ca~o único )' todos los controles
ticncn cl mi~m('1 \':.II('1r de exposición que el caso, todos expuestos o todos
n(\-cxptlesto~. cl mar~en resultante cero señala, asimismo, que el coryjun-
t(1 aparca(lo de c()nlrole,<¡ y caso no contribuirá al análisis. Puesto que el
;lp:lrcamicnIO ticn{' como misióll selccc¡onar controles idénticos al caso
indicc l'()11 rc,<¡pl:cto a c('1rrelalo,<¡ de la exposición, lo tipico es que en un
;Inilli~is aparcad<) I(\ informacii)11 d{' muchos ~u.ietos se «pierda». Obvia-
mcnlc, CSI(\ pcrdilla de informacii)n disminuye la eficiencia del estudio,
rC(ltll'il'n(I() 1(\111(11;1 illformacii)n p<)r ~11.ict() c~tudjad('1 como la informa-
CiOl1 r()r di)lar ga~tado. Ap,lrcar tiene el efccto nelo de aumentar la
cficíc,ll.ia del csIlldio sólo por el hcchC' de que el análisi~ estratificado, en
r
.. ¡
--
,

-~
¡*.
J[] ~.~~;;:;;;.~::;;.~~.:;;~;;,,;...:. ,;;;.'",»*",;.~"".;.",..,..~,

APAREAMIENTO

;Iu.,\cncia de apare~lmiento. es ordinariamente incluso menos eficiente que


c.:1mismo lipa de .lll~ilisis con él. Recordemos. no obstante. que el aparea-
micI1lo cn UII csludio de caso-control puede introducir confusión. inclu-
S() si m) cxislia 11illgunt1 en la pobltlción origen. cuando el factor de
;lp:lrc:lllliClll(' cst:i L'orrclaL'i()lltl<.I() con la cxposición. pero no con la
I.:nrcrmcdad. r~n lal C~lSO. cl aparc~lmicnto disminuye la eficiencia del
I.:sludio. ohlig:.1ndo :11 investigador a encerrarse en un análisis estratifica-
il do por el ft\ctor dc tlpareamiento. tmálisis que perderá inevitablemente
informtlCión sobre los conjuntos apareados que tuviesen historias de
cxposicii)n complett1mente concordantes. mientras que sin apareamiento
n p!'dria haberse empleado un análisis bruto mucho más eficiente. Como
no era necesario apt1re:lr de entrada y hacerlo tiene el efecto de empeorar
la cliciencia del estudio en relación al tipo de análisis que podria haberse
fI IIl'\ado a c:.lh() sin .lpare.1miento. .lparear en esta situación puede con
propied.ld ser calificado de sohreapareamiento.
.
i ES1C tcrmi\1o. plICS. se entiende que es aplic:lbie al apareamiento que
! prOVOC.1 Unt1 pcrdida de información a la hora de realizar el análisis
~
p('rque. de nl) I,aherse hecho. el análisis estralificado resultante habria
~
-,id() ill\1ccesario. I~~I medida en que se pierde información por aparear
dcpell(ler~i del grad() de correlacii)n entre el faclor de apareamiento y la
l'xposicii)n. Un correlato fuerte de ésta que no tuviese relación con la
cnfermedad C$ cl peor factor por el que aparear. puesto que llevará a
estratos relativamente poco informativos en el análisis. sin ganancia a
c~lmbio. Consideremos. por ejemplo. un estudio sobre la relación entre
beber café y cáncer de vejiga: supongamos que se pensase aparear por
consumo de leche en polvo a la vez que por una serie de otros factores.
Como este factor es un fuerte correlato del consumo de café. muchos de
los estratos individuales del análisis apareado estarán en completa con-
cordancia en cuanto a beber c:lfé y no contribuirán al análisis; o sea.
pt1ra muchos de los casos. los controles apareados a ellos estarían clasifi-
cados de forma idéntica a los mismos en relación al consumo de café,
simplemente por ht1berse apare:ldo según el consumo de leche en polvo.
Si este producto no tuviese relación con el cáncer de vejiga. nada se
D h.lbria conseguido :.lpareando. Aunque no existe problema de validez.
este :.\parc.1miento es contraproducente y, en consecuencia, puede consi-
der.1rse como sobreapareamiento.
m Aparear por un factor de riesgo que no esté correlacionado con la
exposición sometida a estudio no llevará a aumentar la correlación de
1.1Shislorias de exposición de casos y controles. Tal apareamiento po-
dritl. pcsc a lodo. considerarse sobreapareamiento porque afecta adver-
samente .\ la eficiencia de costo. aunque no lo haga a la de tamaño. (De
modo similar. aparear por cualquier factor que fuese meramente una
l:onsecuencia de la enfermedad podría también considerarse como so-
~ hrCapt1rc.lmicnlO.) Por contra. sobreaparear por un factor que estuviese
a.,\oCit1do con 1.1cxposición. pero no con la enfermedad, como los indica-
d()res dc l)portunidtld de exposición (Poole, 1986), reduciría tanto la
9 l'lici<.:nci~1 o<.:L'osle como la de tamaño. es decir, un investigador gastará

;~~;:
=,:::;-;- c :.;
":'.-
:."'.' :---:'t-- ;~i~~;
,.:.'

\':': ,~::;:;, .,., ::::~~:~::,: .','::;'

~
...;0:¡;.~.;,;;;;w;

EPIDEMIDLOGIA MDDERNA

m&i~ para oblellcr del mismo número de su.jetos la información que


p()dri:\ haber obtenido sin aparear por dicho factor )' obtendrá menos
illformación por su.jeto después de haber gastado más. Estas pérdidas de
eficicncia se sufrirían. además. por controlar un factor que en modo
all!unoestaba confundiendo.
~ Si un factor es factor de riesgo déhiJ ~. correlato de la exposición

rllCrll:. c.icrccr:i Ul1 crcclo dc confusión débil: aparear por un factor así
iI11riic:lr:i una rcrdida relativamenle grande de información. en compa-
raci()n con el an&ilisi~ brutu. a causa dc la estrecha correlación con la
cxpo...ición. El &ln¡'lli...is bruto. no obstantc. deja de ser una alternativa
:Inropiad&\ si cllaclor e... un factor dc confusión genuino. Una alternativa
r:I'/.(\nablc de apareamiento de un factor de confusión la constitu~'e el
;ln¡llisi~ e...tratificado sin aparear. Hacerlo me.iora teóricamente la eficien-
l"1;l ai C...l;lhiliz;lr la razón controles,ca...o~ que habrá en ~I análisis. pero la
rcdllce de hcch(1 porquc causa pérdida de información en algunos estra-
I()S Cl1 los qllc 1;1 información de cxposición fuese concordante. Si los
cstral(\~ clcmcnlíllcs corre...polldicn1cs a cada con.junto apareado tienen
Ul1 I)llmcr(\ ra7011ablemcnte !!r:.lnde de col1lroles. es improbable una
t'()nCOrdaI1cia completa: por cl contrario. ti.ll concordancia es mu~. pr()-
h;lblc cu&lndo i() que se aparea es una pare.ja. Si en el análisis dichos
cstr¡\tos clementales pueden combin:.lrse. lo que es una posibilidad cuan-
d() ~ál() h¡I~. uno., pocos factores de ap:.lreamiento con un modesto
nllmCr() de categorias. es mucho menos probable que ha~'a márgenes
cer(\ p:.lra la~ tahlas de 2 x.? de dich() análisis. La probabilidad se
rcdllce aun mil~ si lo~ faclore~ de apareamiento no están fuertemente
l:orrelacion&\dos con la cxposición. aunque deberia recordarse que la
c(\nfu~il\n que impulsa a aparcar depende de 1:.\ magnitud de la asocia-
cil)n entre el factor potencinl de conru...ián ~. la exposición: si no ha~.
a"()ciacii)n. n() híl~ t:onfu~ión. Si sc picnst\ que e! diseño de un estudio
r')d(i;1 Ilc\'ar :1 nluch()~ estr¡llo~ clcmenlales con márgenc... cero. el \'alor
(1l:1ararc;lmienl() c...tt\hilizand() la ra7.i)ll cnlre caso~ ~' controle~ de c:.\ra (1
nlcj()rar 1:1cficit'nci:¡ del e~tudio debe scr sopesado frcnte a la pérdida de
inf~)rlllación dcri\.adu de] hecho de que ha~.a historias de exposición
conC()rd:lnle~. Aparear sobre un factor de confusión débil que fuese un
correlat() fuertc de In exposición podria ser considerado como una forma
dc sohrcapare(1miento. ya que aparear en si resulta caro y puede condu-
cir a un ani\lisis menos eficiente que la alternativa de estratificar sin
ararc¡lmiento. La forma fundamental de me.jorar la eficiencia del estudio
l'uanc.l(\ ...e con...ic.lera la posibilidad de aparear por un correlato fuerte de
la exr()sici()n con~iste en aumentar la razón de controles a casos. dismi-
nll~.cnd() de e~e modo la probabilidad de que aparezca un margen cero
en la labIa de 2 x 2 que corresponde a cada conjunto apareado.

'tIIIIj('/If() .\'()hr i,ltfica(/(¡ d(' calidad de ÍI~rormació,1

Otra raz()n por la que algunas veces se emplea la técnica que nos ocupa
es ohtcner comparabilidad en la calidad de la información recogida. Una

~:;:;;:"c ~.
,.0;~

¡~?~
.

j~~i~[ ;".;,"-~::;. "i"-~rl~::--."

1 APAREAMIENTO 279

sitll:ICiilll líric:t Cll 1:1 qtlc tal aparcamicnto podría llevarse a cabo seria
1 tlll csl tldí(} dc ca!\o-(;olttrol
111tlcrt(} ya y 11t1hicra que entrevistar
cn el qtle alguno o todos los casos hubiesen
a otras personas para obtener
información ,tccrca de la exposición y de posibles factores de confusión.
~
r. 1 En principio. los controles de los casos fallecidos deberían estar vivos, ~\.
::.:
porque constituyen una muestra de la población origen que dio lugar a
los C,lSOS. En la pritctica, como se presume por lo general que los datos
dc entrevist,tr ,1 tcrcer,ts personas diferiritn en calidad respecto de los que
H se obtendrían entrevistando directamente a los sujetos, muchos investi-
~adorcs prefieren ap,lre,lr a C,tSOS muertos controles muertos. No está
claro. sin emb,lrgo. quc sca justificable aparear según la calidad de la
p
~l informaci(>n. Si bien el uso de estos controles muertos puede justificarse
cn csttldio~ dc ttmort"lidad proporcional». esencialmente como una con-
\'cnienci,t (\'ca~c (."r. (}). no Itay certeza de que aparear sobre la calidad
f
,J UC inf(}rm:ll:i(ln rt:lillzc,t cl scsgo tot,ll, M uchas de las asunciones acerca
UC la <:~tlill,lu uc I(>s datos rccogidos a terccras personas. por ejemplo. no
cstiln comprohadas {Gordis. 1982). Más ,lún. la comparabilidad de la
l:alidad de la información sigue permitiendo el sesgo debido a la ciasifi-
(.'~lción incorrecta no diferencial. que es más grave en los estudios aparea-
dos que en los que no lo están (Greenland. 1982) y que puede ser más
severo que el sesgo debido a una clasificación incorrecta diferencial que
surgiese de la no-comparabilidad (Greenland y Robins, 1985b).
Resumiendo. los lados oscuros que tiene el apareamiento en los
cstudios de c~lso-control y la relación del apareamiento con la confusión
:' con la eficiencia del estudio. son mucho más complicados de lo que
lIno cn principio pudiera suponerse. Se ha empleado frecuentemente esta
técnic,1 en ocasiones en que hubieran sido preferibles alternativas más
scncillas :' más baratas. Aparear está claramente indicado sólo en cir-
<:unst,lncias estrictamente definidas. En muchas situaciones de estudio, la
uccisii)n dcsc~lnsa cn consideraciones de coste y eficiencia que bordean lo

I impondcr:lhlc.

,\N,\LISIS DE CASO-CONTROL APAREADOS

El punto más importante del análisis de los datos de caso-control apa-


rcados es que el apareamiento introduce un sesgo en el estimado bruto
~ dcl efecto. dirigido hacia el valor nulo si el factor de apareamiento está
cl)rrclucionado con la exposición ya sea positiva o negativamente. condi-
L'ional al ,1;1(/11(,\"
de enfermedad. Este sesgo puede ser visto como un
! tip() de confusión. puesto que está presente en los datos brutos, pero se le
rucde climi11ar completamente. estratificando según los factores de apa-
rcamienlo. Por 10 tanto. la tarea fundamental en un análisis de caso-
m contr('1l aparcad('1 es estratificar según dichos factores.
Pue~to que ya .c;cha discutido la estratificación, no habría necesidad
, ~ (Ir rl:1h()rar m{1s ~ohre cl an{1lsis de caso-control, a no ser por un rasgo
L'sprL'ial quc tiencn: ;.1 menudo. el factor o factores de apareamiento

J.

".~~

..

;~1;j¡~~¡i1f~
~

28(\ EPIDEMIOLOGIA
MODERNA

r(\Sl'l'11 1:lnla~ c:llc!:!°rias p()~ihles que el anilli~is e~1ra1ificado consta de


UII l'slral(1 por <:ad:1 t'a~o dl'1 csludio, Tal ra~~<.\ n() introduce conceptos
allalili<.:o~ nuevos. mil~ ,lllil de los di~culidos en el capítulo 12, pero
c()n<lu(..l' <.:()n frccllcncia a análi~i~ con (.locen,ls () cien lOS de e~tratos. Si el
111111lCr(1 c.1l' ésl()s <:s !:!raI1dc. la~ f()rmula~ de dicho C(lpiIUI() se vuelven
;lhllrri(las dc apli<.:ar a mal10. aUI1(.IIIC para dat()~ apareados sc la$ puede
,iI111'lifi<:ar. p()r 1(1qlll' su arlicaci()11 COI1 li1pi7 y papel 110 es tarea ardua,
III<.:IIIS(\ C()11 Il1ill" lll' csl r;II()~.
Si plldicra l.<ll1scgllir~l: la e~1ralificaci(111 sin crear un número grande
JI.' l'sl(\s cslr~lto~. sc rodri~1 al1aliz,lr el e~ludio COI1 apareamienlo ulili-
,',alld() UI1 aborda.ic c~lrarlificado ordil1,irio, Por e.iemplo, si los sujeto$
l',I:ill aparcad()s s()I() por edad y ~cxo. 110 ha~' nece$idad de llevar a cab(1
1111«al1:ilisis ap;lrc:ld())1 cspel.iali7,ad(l. qUl: lo que hacc es crear e$tralos
111(li\.ic.lli:lles r:lra <.:;ida COI1.illlll() ,lparcad(1 dc $u.iclo$. Es suficiente con$i-
d rar 1:1 cdad ~ el ~CX(\ (..OI1l(\ raCl()rC~ d,.: c(1nru~ion que dcben $er '1
<.:1\l1lr()J;IU()' cn c¡ ;111;llisi~ ~ crcar llnicamCl1le los pocos e$tratos por edad
~ SCX(1 quc hahrial1 sid<1 ncce~arios ~i 11(1~e hubie~e Ilevad(1 a cabo el
:11':lrcamicI11O el1 1:1 ~elecci()n de 10$ ~u.iClO.'i. Lo~ factores de confusion
auil.i()llalc~ pUCd<:11scr f¡icilmcnlc conlrolados en un análi$i~ así. incluso
si n() ~()11raclorc~ dc aparcamicnlo. mcdi,lnlc una e~tralificación añadida
(\ Ul1 an:ili~i~ mullivariado. El ap,lre(lmicl1t(\ de frecuencias se mane.ia
,icmpr(.' ulilizal1d(\ UI1 ,ll1illi$i~ «no ap(lreado». e$ dccir. utilizando las
li.';l.lli<.:¡ISal1alilic:l~ habíluales para controlar la c(1nru5ion. Ba.io 10$ méta-
d(\~ de un cln:ili~ís ~lpclrecldo n(1 sub~'ace ningún principio especial. La
JIL'<:e~idad de all:llizar de rorma apareada e$ puramen1e práctica ~' surge
Ul' la I1cl.e~ida(1 UL' c.\cfillir 1(ls e~lral()~ de UI1¡1 mal1era en que re~ulta
il1c\ilah\L' un I1UI1Il'r() {!ral1dc de ellos. C()I1l() es el cas() con UI1 an~llí$i~ en
ell"lI:II a\!!lIl1cl \.ariahll'-dl'
--
cs<.:al\111()mil1~11(.\)11much~ls calc1!.ori,l~ fuc$c una J
d...' la~ \.ariah\c~ dc ap~lrcamiCnl(). CU~111d(1ulla \(Iriable a~í estil conrul1-
diel1do. ~c precisa aparear il1di\'idualmcl1lc parcl permilir el control de lcl
CI)l1rusi()I1. En olr~ls situaciones. sin embclrga, aparear por frecuencias (1
11(\ haccrlo en ah~()luIO col1$litu~'e una me.ior opción de diseño. porque
hal,itu:llmcnle e~ mils eficiente con relaciol1 al CO$lo. Incluso si $e utiliza ..
ar~lrcamicnl(\ iI1di\'idual. el1 la medida en que los factores de éste estén
I(I(\()~ c()nlrolcldo~ el1 el análisis. n(1 ha~' (1bligacion de u1ilizar los méto-
(i(l~ del ~lnilli$i~ ,Ip,lreado individualmente. a menos que. el número de
c;llcgoria~ del cll1illi~i$ rue~e inevi1ablemenle grande en relación con el
l1ul1lcr<) dc ca~os.

1:".\liI11(1("i(ill pll11lll(11 (1('1 ri(',\I!(/ r('I{llil'(1 rr,I;(j,1 d(' vent{{i{1)


(I p"rtir ,1,' ,1{1/(1.\ J,' (',I.\'(/."(1/l1r(}1 ap01r(Judv,\'

(0()m() es normal con dalos de caso-control. la razón de ventaja, por ser n


\in CStillltlOO dl' líl rtiZ('n de t,iSciS de incidencia o riesgo relativo, es la
nlcoidtl dc inlcrcso Para estim;irla, se puede utilizar tanto el método de
prohahilidad milxima como el de Mantel-llaenszelo Este último aborda-

:1
,.."..
~".--;c:
-~
~\~tc: :?;':::~;¡:

.' oc
;~~.
:'3.

\~~j~~:~r~~ .$~~:~J;
C-:..

APAREAMIENTO 281

.ic I.'S inils simple. pero el de máxima probabilidad no es tan complicado


rara datos apare~ldos como lo es para el análisis estratilicado habitual.
La I.'slimacii)n de milxima probabilidad de la razón de ventaja puede
scr «c.:ondicional» ~l ambos m,\rgenes de las tablas de 2 x 2 o bien «no
L"()11di<:i(>llal». que 4uicrc dccir condicional a sólo un margen, Las dos
f()rmas d~ln resultados c~lsi idénticos excepto cuando el número medio de
Slljcl()S por I.'slrato es pc4ueño, en cuyo C~lSOel abordaje no condicional
" rllC.:dc.: I.'sl¡lr suslall(;ialmclllc scsgado y 110 debe ser utililado (Breslow,
tJ I()XI: Luhill, IlJXI), Los anillisis aparcados son la forma extrema de los
l:sl r:11iliL"a(I()s cn cl scl11ido dc qlle t icl1cl1 los mcnos su jelos pusibles por
l'slr:II(). 1:1 rc(lllisit() Il1iI1iI11() c~ 1111C.::IS()y 1111control p()r cada uno. pcro.
:1 l)l'S;lr <Il. I(IC\I,. l~slll(li()s 1.'1141.c !()d()s lo~ I.'~tratos son pares aparcados
1)11L"(Ic.:rl rt:'iIIII;lr 1..'~lr¡;m:ldamclllc il1formativo~, Para análisis apareados,
1(", tllt:(I1(II1' rr(I¡';II,iiisliL"Os aplicahlcs -'on los basados en la probabiJi-
n liad l.\llldiL"i()llal.

I:S"J"IM¡,\l'I()N l>lJNTU¡\L DEL RIESGO RELATIVO


\ P.'\I~Tlr~ DE PAr~ES C,\SO-CONTROL APAREADOS

l'u¿ln<.!O un llnico control e$til apareado individualmente a cada caso. los


~stratos clcment¿llcs del ¿lnillisis son tablas de 2 x 2 con sólo dos sujetos.
l~Oll ulla exposici(}n <.!icot{}mica. para los dos sujetos existen sólo cuatro
patr()ncs de exposición posible~: ¿lmbos expuestos. ambos no expuestos.
i
~I l.:¿lSOexpuesta y el control no expuesto y el caso no expuesto y el
i
~ 1.:()nlr()ll.:xplICSI(). EIl la l¿lhla 13.5 5e lo~ muestra. Nótese que cuando la
~
Ilistl)ria Jc ~xpl)sil:i()n es idél1tic:l para el caso y el control. en la tabla de
i 2 '< ~ sc ua lll1 IOI¿11m¿lrgil1¿ll igual a o. La primera y la última de dichas
!
lal'llas Jc ~ x ~ l.'11 la I ).5. ..1 ~' n. licncn lln I('lt¿ll marginal de O y. en
L'l)llSl.'CUl:IIl:i:l. n() l:()lltril'luycn ni a I¿l cstiln¿lci(}11 ni ¿lla comprobación de
Ilipi)tcsis cst¿ldistic¿l.
El estimado de máxima probabilidad condicional de la razón de
vent¿lja es simplemente I¿t frecuencia de conjuntos apareados del tipo B
D
T:lbl:l 13.5.
P(ltrml(.'.5 (1<,l'.\"po.5icióll po.5ihl<,s para lm caso .~I un línico

a cvlltrol apareallo

,.1
D

a E u T E u T

(":ISO o o
o o
m ('¡l11lrll\

T()talc~ 2 o 2 o 2 2

Cl I:. = 1:~1'"C~IO: {I = 110 explle~to: T = total.


t::J

I9 .

:~& ~:::~;;:::;:;:~:~~¡~:~:::!.:.:;~¡: .c,..~


~

,~:~~~ :!5&:
APAREAMIENTO 283

'1
I:.~TIMACION I>UNTUAL DEL RIESGO RELATIVO
l.ON R CONTI~OLES APARE/\DOS EN CADA CASO

l)ar~1 la siluacióll m,is general de lener R conlroles apareados a cada


caso. exisle un nllmero mayor de palrones de exposición posibles. cuyo
Illllllcro cxacl() dcpcllde del valor de R. Considerando equivalentes a
n 1(ld()s I()s R L'Olllr()lcs. exislell R + I resullados posibles distintos para
'J <-::1(1:1 <-:OlljUllto :Ipareado de col1troles. que corresponden al número de
<-:()11Ir()lc~tlel (;()l1jlll1tO ¡Ipareatlo que eslill1 expuestos y que van desde cero
~.~I)IIC~I()s CI1 1111~xlrcmo (1 R cxpucstos en el otro. Como el caso puede
<-:sl:lr 1:1111(1<:XI)II<:SI() L'Om(1 J1O-CXpucst(). cl número lulal de palrones
l'lll..;il)lcs (1<:<:'(I'lllsi<-:i(lJ1 cs :rR + I). Una forma conveniente de resumir
111..; dat\)s <-:(111SisIC ..;illlplcmc!1te en ir haciendo concordar la frecuencia de
III..; <-:(II1.iul1t()s ;Ir:lrcados en c,\da patrón de exposición. utilizando la
rorm,1 de rrCSC!1I:\L'j()n de 1,\ labia 13.6.
IJa frccue!1<:ia 1110cs el número de ellos que no poseen ningún sujeto
<:.~pucsto: <:Slos estratos clementales lienen un total marginal de cero. y
110 colltrihuye!1 ~ll anillisis. De manera simi]ar. J;R refiere los conjuntos
que 1)0 poseen su.ictos no-expuestos: también tienen un tota] marginal de
<-:ero y tampoco contribuyen al aná]isis. Los .?R restantes tipos de con-
juntos SOI1 todos il)rormativos y representan tab]as e]ementales de 2 x 2
COIl I('ltalcs m,¡rgi!1ales 110 igu,lles a cero. Nótese que conforme aumenta
R. aumenta también la probabilidad de que un conjunto dado sea
il1f()rmati\'l'l. puesto que la probabilidad de que todos los controles
tellg,¡1l la misma c,xposición que el caso se va haciendo más pequeña. Si
hay UI1 90 por 100 de probabilidad de que un control apareCIdo tenga
uIla historia de cxposici()1l concordante con la del caso. la probabilidad
tIc qu<: <:1C(111.iul1t(1:lparc:ldo dc dicho C,¡SO contribuya al análisis va del
I () por lO() p:l r,\ I~ = I :II I -{0.9)5 = 41 por 100 para R = 5. Si un
col1tr()1 aparcad() liel1e UII R() ror I()O de probabilidades de poseer una
cxposiciól1 <-:0l1cordanle. la probabilidad de que un conjunto sea infor-
mati\'o está entre el 20 por 100 para R = I y el 67 por 100 pa.ra R = 5.
Vamos a llamar 111 al numero total de sujetos expuestos de un
col1junto apareado. El valor de 117va de cero a R + I, pero los conjuntos

1.3hla 13.6. R('.Sllm('I' dl' I(),s datOS. cllal'do .se tienel' R col1lroles aparl'ados
(I cadll ('a,s(). il'dical'do la jrecllencia (I;J de lo.s COI'j,II1lOS
a!'ar('(IJn,s ('()I' cad(l !'atróll de e.~!,osición pn,sihle

,H
Número de controles expuestos

o 2 3 R

4
u
~
.,~
;~~..
\fr~\~\r:\:~~;W~
.:lffl;;.~:~;';;:;:~.~;,

I' .~~J~t~~~~l~.

2R4 EPIDEMIOLOGIA MODERNA

inr(}rmati\'os SOll aqllellos pclra los cuales I ~ //1 ~ R. con todos los I
t(}tall's n1:1r~il1:lles n(} il!uc\les a cero, Parcl un valor dado de m. hay dos
r:llr(}nl's
r(}IIUl'11
rl)~ihlcs
:1 quc el casI}
ut: cxposición
se.1 CxpUC$to
p.lrc\ el conjunto
). III -I controles
ap.\rccldo.
también
que corres-
lo sean
1
11 :1 lllll' l'1 Cc\SI) '1() i() sca ). III controles si lo 5Can, ¡\ partir de la
llislril,\lIl'il)'l hipcr~c()mélric:1 1l() cel1lral, 1:1 probc1bilidad de quc, dados
1/1 s\lil'I(1S cXPUCSII}S, 11n Ca~(1 lo ~C;¡ t;¡mhicn, e~: ]
111(OI~)
I'r Il';ISII SC;I l'xrIICSI<\, uC\<los 1111 =
I~ + -111 + 111(OR)

OR
[13.3]

III

y 1;¡ flrohahilid¡ld de qlle cl cas() sea no-expuesto es el complemento.


...
~
(R + -111)¡m -i
I)r 1t:;lS(' ~C;I 11().expuesto. dado$ III) = [ 13.4]
::t
III

:I

1{l:S\III:1 dL' 11l1C\'() t:(}11\.CI1icI1IC c()11sidcrar q\lL' las ohscr\'acione$ sigucn


1111;1<.Iislrihllr.;i(}11 hiI1()111i:ll. rcro. C(}11 Ul1 arareamienl() de R-a-l. exis-
Il. 1111:1 <.Iislrihllci()11 hil}()mial .c;erarad(1 rara c(ldu \.alor dc 171. Asj ;'1

;..1

r:lr;1 III = I. h;I~. 1111 1()lal <.Ic f;(1 + .fr;, C(}J1.iuJ11O.C;). dado que exacta-
mc111L' I sli.icl(} dc liJ1 c(}n.illnto e.c;til exrueslo. la probabi)idad de exposi-
l.i()I1. :1 partir dc I;\ ccliaci()J1 [ 13.J]. es OR/(OR + R). La probabilidad
1
<.Ir ()hscr\.(\r ex.lclameJ1te ./1(1 y .I~I con.iuntos con el caso expuesto )' no-
j
CXrIICSI(). rcsrccti\.ameJ1te. dado un total de.I;() + .k\ conjuntos con un
Pcl
sll.icl() cxrllc~to c.c;
.j

i>r = (1;11 ..t. fl~l ) ( -~~. ) (


.rl.' R fnl

\ 1111 ,OR + I~, ..OR + R )

1,;1 rr(}hilhilidild total dc los dato.c; es el producto dc las probabilidades


hill(lmialcs corrc5pondicntes a cf.\da valor de /II desde 1 a R:

+ 1;¡.1" OR )'; 1
I)r =
~ I RJI ( I; ."1
1/1: .1; ,111 )((R+ 171)i177 + OR

(R + -I1l)i,11
[ 13.5]
R + IR)r;,...

.."'
~

;iil.~~

~
~.

rI
~1

111

R
\
Lo
"'=

1-;1 ecuaci()n [13.6] se reduce a la [13.2] para R = I. Con R = 2. se la


ruede resol\'er explicitamente para OR , (Miettinen. 1970). pero para

\'alores de R ma~'orcs de esta cantidad. es precisa una solución reiterati-


va. Incluso asi. la citada ecuación [13.6] representa un ejercicio compu-
(;Icional bastante sencillo. comparado con las onerosas computaciones
l!ue sc haccn neccsarias para obtener un estimado de máxima probabili-
dad condicion~lda de la razón de ventaja para datos estratificados no
~lpareados.
Los datos del ejemplo 13.1 representan los valores de exposición
individual para c~lda sujeto en un estudio apareado de casos y controles
con 18 C~lSOSy cu~ltro controles apareados a cada uno de ellos. Los casos
(;ran mujeres con emu~lr~lZO ectópico: los controles. mujeres sin embara-
10 cctúpico. extr~lidas de la misma pobl~lCión origen y apareadas indivi-
dualmente a ellos SCgÚll nllmero de emb~lrazos. edad y nivel de educa-
ci()11 del m~lrido. Todos los sujetos habian tenido, como máximo. un
m cmbar~lZO anterior. Historia positiva indica que la mujer había tenido al
mcnos un aborto inducido.
Si solamcntc sc 11ubiesc apareado a cada (.aso el primer control, los
n illvl.'~ti!:!;Idorcs huhicsen observado
L"()ll hi~t()ria p()~itiva de exposición
nueve p'i,res concordantes (cuatro
y cinco con historia de exposición
I1Cg~lti\.~11y otr()s llueve pares discordantes. En ocho de éstos, era el caso
~ -;
*;

t.'1expuesto. compar~ldos con sólo uno. en el que lo era el control, lo que


'.;
d~l un estimado del riesgo relativo de 811 = 8. Considerando todos los
L"ol1troles que fucrol1 estudiados. hay 2(4 + I) = lO tipos de patrones de
I.'xpo~ici()11 p~lr~l los conjuntos ~lpareados. En la tabla 13.7 se muestra la
m distribuci()1l de p~ltrones de exposición de los datos del ejemplo 13.1.

j u
b,
:;:f~i~1:~
t~

~~~ ~~
.,~-:.:.:
;j~~;:~

~
jf~;~ :ii~1
~~ ~
1 ;

'Rr, EPIDEMIOLOGIA MODERNA

Ejcrllplcl 13.1. Ili,\"lorio "r('¡;i(/ dc' {/hnrln il'dl'cidn


('/IIN' "",i('N',1 ('(m ('mh{/raz,1 cci(i"ico .I' ,\"li,~ cnn,roJc,~
(lf}(I1'('{/dn,l'. Da'o.~ dc' TrichopnuJnu,~ el al.
;:'
( Miellin('ll, 1969 )
';í'

~~'::
Control ;Íj:
.;.
C:ISO
..
.' A

..¡. ..¡.

-
--

+ -;- +
+ +
+ + +

- + - +
+
+ ...

;
!'
-! =- :Ihorlll indll'idn prC\,íll; -= no ahorlo inducido f

rrCVI(\,

Seis de lo~ coll.iulltO~ apare.\dos tiel1cn historias de exposición com-


plctamel1te col1cordantes )'. por tanto. son no-contribuyentes al análisis.
r.\ra estimar la r.\z6n de venta.ia o el riesgo relativo de embarazo
cctópic() tras un abortQ inducido. se pueden utilizar los datos de los -
rc~tantcs conjuntos. ~ustituyendo en la ecuación [13.6]: : I
II 4 -5 -3 = O ~
~- /,
~
OR °,~ + 4 61? + 3,!2 6R + 2:3
~
.,
~
l.ill¡1 s()I\lci()11 dc cl1say() y error da m = 23.
("0111(1 aJtcrl1ativa al método dc estimación de máxima probabilidad,
Sl' r\lcdl' utilizar cJ dc Mal1tcl-.lacllsZcl. Cuand() la razón de aparea-
micnto cxccde ¿I UJI control por C¿lSO.¿lmbos aborda.ies no son idénticos.
L¡\ ri)rmul~1 [12.2ól se puede reescribir, para un apareamiento de R-a-l,
dc la si!!uicnte m~lnera:
11
\ (R +
¿..., 11l).f;.m- I
nl: 1 ;~ f:
[13.7]
I 11~f~.m
"., , 1
m=] ..

4~.
:!¡:-

.-.~.~¡~:7~:'.

~
-"--.
~;
-,,-:

.,~
APAREAMIENTO 287

":lhl:l 13.7. P(/(r(ill d(' ('.,"pn.\"iciÓlI (le 1(1.\" 1('1' ('(1IljUIl((I.\" (111(/r('(((/(J.\.
(1('1 ('j('III"I(1 13.1
---

Número de CI :>Ics cxpucstos

2 3 4

lOS CXrIICSI()S ... 3 o


I()S 110 CX pllCSI OS {) o o

\p¡i~lndo la rl)rmula 3.7 a los datos de la tabla 3.7, se tiene

4(3) + 3(5) + 2(3)


óR "" = = .?2. = 33

I (.I )

4ue tJificrc llamativamente del eslimado de máxima probabilidad condi-


L'iOllal. que era 23. La gran diferencia entre ambos puede atribuirse al
hecho de que sólo h.ly 12 conjuntos informativos y II de ellos apoyan
una asoci.lción positiva. lo que representa un resultado extremo teniendo
(latos de ~llgun.1 manera exiguos. En consecuencia. no resulta sorpren-
dcntc que dos c5tim(ldores difercntes den resultados en cierta medida
tJiscrepantcs. Breslow t1981) ha demostrado que: estadisticamente, el
~stim.1dor tJe M.1ntcl-I-Iaenszel es consistente para datos apareados. es
lan ~ficiente como el método de máxima probabilidad condicional cuan-
tlo 1.1 Ol~ = I y es casi igual de eficiente para una gama amplia de
situaciones.

ESTIMACION PUNTUAL DEL RIESGO RELATIVO


CON UN NUMERO VARI¡\BLE DE CONTROLES
APAREADOS A CADA CASO

('lIando se tienen un nllmero variable de controles apareados a cada caso,


sc plleden resumir los datos mediante un conjunto de cuadros como el
lic 1.1tabl.1 13.6. correspondiente c.lda uno de ellos a un valor distinto de
n. L.l prob.lbilidad de dichos datos es el producto de las expresiones
proh.lbilístic.ls qlle corresponden a cada valor de R y la ecuación que
produce el estimado de máxima probabilidad de OR es una simple
ex tensión de la ecuación [ 13.6]:

R
¿ r L .I'I. ," -, 1 R + fo.m-
'" = I ¡;.m- = o
L [13.8]
1( L 00 m= 1 (R + -1'1 OR
Los dalos del ejemplo 13.2 provienen de un estudio de infarto de
mi()cardio c hisloria de consumo de c:lfe (Jick el al., 1973). Los autores

:'".;,,;'

i
"':

,;,¡;:~~
~~
¡~: :~¡j
~~¡\~
:¡::'~~;:~:~~;:~;;:

,-:;;.,

'
f 'f;
j .-~:

2118 EPIDEMIOL ;IA MODERNA


---

illtclll:lron LlrarC:lr dos controles a CL\dL\ ca~o. pero para 27 de éstos sólo
Ilahi:l un c:ol1lrol Llrarcado disponible. El re~ultado fueron 27 pare5
:Ir:trc:luos ~. R~ lriplcles Llpare.ldos. El us<, de estos dato5 y de la ecua-
l'j{111 II.\.X I par:1 uclcrmil1.\r el e~lim:td(1 dc mi\xima proh.lbilidad de la
r:1/1111llr \'l:III:t.i:1 pr(1UIIC:C 1:1siJ:!uicl1lC l:CII:ICii111 rroh:thilislic.\:

~ l
J = o
I + --:;:::;..
~l)
-3joi.- ~-
' ...'
) 1{ () l~ -1 .OR
O R + 2 O r~ + I i':!

U;111d11 Sl: rc.:sllclvc 1;1 al1lcri()r ccuaci¿)11 por cl1sayo y error. sale óR

~.I).

~.il.mpl(1 1.'.2. l)i\:l'.ih,I('i,i/1 (i, ('(1,~1),~


J(. il/f(/,.,(1 d(. //Ii()(.a'.di() .I' .~U.\"('mlt'.ole.\"
flll",(III/,,\ \1'.1:1111 1(/ ('lm/iJ,I(1 (/¡, ('(/fl.' llll(' 1,(.hí(I/:: 1(/,\".\"lli('ln,\" qll(' tnmnhn/1
1./!111' I,. .' 1(/:(1.\ J,' ('I/fi.. (/1 Ji(/ 11((.'.1//1(..\.('h,id(I.\ ( .¡i('l\ ct al, ¡9i .1)
NlllllCrO,- dc contr(')lc!; quc hcbínn 6 + tazas al día

-,-- ~-
Parc~ ararc¡id()~ Triplcte~ apareado~

() o
I
<..;!,(\ 1
(\~ 1;11:.1~ ;11 ui~1 ¡; F t~ 2:; 4
II 1;l/;I~ ;11 di:1 .1:, ~ 20 22 3

L:\ ~ellcraliz:ll'i()Jl de la f()rmula [ 13.7] para el estimador de la razón


Ul' "t'Jlt:\.ia de MaIltel-Haenszel con datos de caso-control apareados,
\rnirllU(\ \in nllJllcrc variable de con\roles. R. adscritos a cada caso, se
pl\rur (,btcncr con facilidad a partir de la fórmula [ 12.26]:

[13.9]

Si se aplica CSt.1 r()rmula a lo~ d.ltos del ejemplo [13.2], sale un


cstimad() de M.lIttcl-J-laclt5zcl así:

.q\l~ ~s casi idéntico al de milxima probabilidad y considerablemente más


r:\t.'il uc ()hlCl\er..

Ii !~:~;\~
~~~:?::.
~,:.:

~
,;;.
::!¡;t~:\~~;t~~~ r,~:.

.:o;¡;,,:..:

~l Ci,lllf1rnhlll'i(j,1 (1(, hif1(j,('...i,~ es,adí,~[ica (,O/I da,o,~


II(' (.n,\.n-('IIII'rl)! (lf1nr('a(!(),~

1)llcst() quc cl an.ilisis de datos de caso-control apareados es equivalente


.1 Iln all¡ilisis lIlIC sc Ilcvasc a caho e.<;tratific.indolos según los facto-
rl's llc.: ¡lr;lrc.:;llllic.:IIII), 1;1 1.:()lllrroh;l<.:i()1l tic Ilip<)tc.<;is para datos ;lpa-
rc.:ad()s sc rcaliz.l Silllrlemcnte .lplil.:.lndo cl .Ibordaje general para datos
c5tratificados a los ~~tratos que el apareamiento define. Como sucede
C()1l la c.<;tim.lci()n pulltual, algunas de las fórmulas se pueden simplificar
cn C.ISO de .Ip.lrc.lmicllto, porque las tablas de 2 x 2 sólo pueden tener
lill nllmero limitado dc confíguracione~: dado que, en su forma típica. un
;lllillisis aparcado implic.l muchos estralos, dichas simplifícaciones pue.
11c.:1lmostrar.<;c imp<)rtalltcs. Incluso los dos 5ubbioques de despliegue de
J;lI()S del e.icmplu l13.2j ilustr.1n este punlo, porque resumen datos de
115 estratos. que corresponden .1 los 115 conjuntos apareados.

I
l"OM PI~()13,\l.ION 1)1: I1IP()TESIS PAR¡\ PARES
DE (',\SO-CONTROL i\PARE..\DOS

Para pares aparcado!;. haciendo OR = I y calculando la probabilidad


tic la cola. se puede calcular un valor e.'(.lclo de p a partir de la ecuación
r 1.1.1]. Este c.ilculo es simplemenle la probabilidad de la citada cola de
uIla distribución binomial con una probabilidad de 0.5 para cada ensayo
hinomial. Para el valor de p de Fisher es:

p de Fisher =
11~flnt ('¡¡0 + .fol
Jln+Jol

k = J lO k
)(~) [13.10]

8
p:t ra I; o ~ .f~ I. Si .1;)I > .1;o. la cola inferior debe calcularse mediante
suma sobre el rango O ~ 1\ ~ .1;0.
Para oblener el valor exaclo de la media P, sólo habria que incluir la
mitad de la probabilidad de los datos observados. Para la cola superior,
e5la modificación da:

Si .I~ I > .1;o. la cola inferior debe calcularse mediante suma sobre el
rango O ~ k' ~ ,1;o -I.
l~onsideremos los datos del ejemplo 13.2 en relación sólo a los pares
:lrarc~ldos. Los 16 pares para los cuales la historia de exposición era
1.:()llcordalllc no conlribuycn a la evaluación y deben ser ignorados. De

,~.
.:-~: ~,

;~.-;:
I~
.::~:::~:~;::
:\~~.
\~:f~f\\;::.:~:;;; .:~¿;
::f'
~,.

'!II' ErIDEMIOLOljl/, MOnEnNI\ l


I(,S rcsl:'1\ICS 1\. X so" di,c;cordan\c!' con cJ caso expues\o. El valor de p
cX:'CI(1 tic \:i,c;hcr con un.., col.., cs. a par\ir de la fórmula [13.10].

= U.OR()6+ 0.0269 + 0.0054 + 0.0005 = 0,1

1:1 \Oall)r dc la mcdit¡ p es la mismt¡ suma. excepto para el primer


~lImando. que st:rit¡ '!2().ORO6). dand() un valor de p con una cola de

(1.070
Ulilizand() C\'l',\"1 estadíslic() de Mantel-Haenszel (rórmula [12.38]) se
rlledc calculttr un vt¡lor de p aprOXim(ldo. Para pare~ apareados. queda
simpliflc(ld() a

.1;u -.1¡) I [13.12]


I.y- -.
1
,,/:¡;0 + .¡~J

quc es una f()rma dcllest descrito en primer lugar por McNemar (1947)
~ ,\1 quc se c<'nocc frccuenlemente como lest de McNemar.
Par..\ I()s datos de los pares apareado.' del e.iemplo 13.2. esta fórmula

d;1

8- ~
z = :i-i = .51
,
l1\IC l:()rrcspondc a un \'al(1r del' c()n \Ina l:ola de 0.07. I() que concuerda
!,\icl1 l:()n cl valor CX¡IClO de 1¡\ mcdi¡\ I' inclus<, para estos números
,..~
i
manirlC~lamentc pequeños. ;.1

P'1
j
COMPROB/\CION DE HIPOTESIS CUANDO SE TIENE R I

CO~TJ~OLES APAJ~EADOS A CADA CASO

LtI comprobaci()n de la hipótesis exacta cuando se tienen R controles


aparC¡It1os .1 c.lt1a cas() es considerablemente más complicada que la
L"omprohacit)n de la misma con parejas apareadas. Los datos pueden
L"('lI,~itlcr:lr~e como UI' coi'.iunt() de R di~trihucioncs binomiales, con la
flll'L"ii)l' tIc prohahilid.ld cxprcsatl~1 CII li, r()rmlll~1 [ 1.1.5]. Par~l I~I COmpr()-
h~lL"ii'lll dc hip()tcsi~. el v~llor dl.: I~I r~17.i)n dc vcnta.ia de ltI expresión [13.5]
sc hacc i.!:!llal a la unidad. Lcl prohal')ilid~\tI dc la c()I~1 superior se dctermi-
I'~I c\.all1~lnd() la citatl~1 f()rmul~1 [ 1.1.5] par~1 cada posible 'distrihución de
I(),'\ d~ltOS J')artl lof; cuales el númcr() de C~IS0Sexpllestof; es igualo mayor
qlle el númer() observ.\do (Ios casos expuestos para los que todos los

, 'f

..
..;.

:~."'T;:.-.
.~.

~iJ~~} -,...
:~~:f:
.rr ,;;:::.;;.~:~:~~;;.~.: .,.~.. -c~rt,~(i;
n
APAREAMIENTO 291

(."()Itl!"olcs aparc~I<.los son también expuestos pueden ser ignorados). El


n \'al()!" uc " ue I:islter exacto es. por lo lanto.

I)r(}h:lhiliuau dc la cola superior de Fishcr =

" I ,~
'I I ."' I + ' ~(. .1/1
) I 11' ) k," 'R + 1- )
11' f;.~-,+fn.~-k,
--
"
I.
II /II:
II
I 1,'!I R + I , R +

I [13.13]

ti(}11t1C(I CS clnllmcr(} tolal de casos cxpuestos en conjuntos que tuviesen


:11 menos lII1 1.:011lrol 110 explleslo. MI es el número total de conjuntos
n qllc 110 son complclamenle concordanles.
11ilmcro rosil')lc tic cas()s expllcstos con 111 -1
km es la permutación de!
controles expuestos. es
lll:t:ir. 1.:111llmcro I()lal tic casos cxpucslOS que podrian haberse observado

y \."11trl: los colljllnlos aparcados que realmente tenian 111sujetos expuestos


~. I,. I.'S la 'lIma (1\."k ",:

:I II = \
I!
/; .1"-
." !

\R f .J- .
~ 1\11 =
'-' 1.111- I' h.m
m=1

R
k = )~ k m
m=1
~ .
1:1 stlmalorio de la cola incluye todas las combinación de los datos que
podrian dar origen a lodos los \'alores de k en el rango que va desde a
;i 1,~\Sla .\11" Para ¡~\ probabilidad de la cola inferior. e! rango de! sumato-
4
,
.
) rio de ". V~\ desde O h~\sta a.
" P~\ra oblener el valor medio de p exacto. es necesario incluir sólo la
s
~ mit~\d de la prob,\bilidad para k = a. de la manera siguiente:

Probabilidad de la media p de la cola superior =

n = ~ I n '.f;.n,-,.+ .f~.m\ (. 111 ¡k... ~ + 1 -!~\¡¡..-,+!0..-k.


+
-k=n nl=1 km )\R + 1 R + I )
(
k," +!0..-kM
+
.\1
\
I n.
R (f I .m -I + j~.m m R + I -,")1;

k=7+lm=1 km R + I R + 1
[13.14]

Para el valor de la media p de la cola inferior, el sumatorio de la ecua-


L'il)n [ 13.14] debe ser para O ~ k ~ a -1. en vez de a + 1 ~ k ~ JW1.

g Considcrcmos los dalos el ejemplo 13.1 (Tabla 13.7). Dejando a


un lado el C.1S0expuesto que tenia cuatro controles expuestos apareados,
hay 11 casos expuestos. con lo que a = 11. El número total de conjuntos
inr()rmalivos. :\II, es 3 + 5 + 3 + O + 1 + O + O + O = 12. Sólo hay

.l
g

$.

i¡j~:

:;;~:.':;.::.".'::""': , :-:,;-.-;',"

~
.

::f.::~~:~: ,o;.
:~~:~:

~~~t\~f\tf~~'

:'9;' EPIDEMIOLOGIA MODERNA l


\111 cnI1.i\lnl() dc \.:II()rcs dc :1\",: par:1 I()s cualcs I()d() con.iunt() inrormati-
\.(\ licl1l. \111 C:IS(' l'XpUCSt(): ~.¡¡ quc \1:I~. cualro. cinco. lre~ y cero conjun-
I(\s. rl'Srl'l.li\.:lmcI1Ic. p:lr¡¡ "I = I. .?. ~ y 4. I(),c; \.:1Iorcs d~ k", serían. 4.5.3
~ (I. rcsrL'L"li\.:lmcnlc. p:lr¡1 ()hlCnCr cl rCSull¡¡d(, más extremo. con todo~
1(" L:¡IS('S L'XrUC~I()s. II:I~ trc,c; palr()nc~ dírcrcntes que podrían producir
~ 1\,,! =- I] .S()n. cn1rc7.and() c()n cl patr()n obser\.ad{). 3. 5. 3. O: 4. 4. 3. O
~ ..¡. :'. .;;. (). Asi rIICS. 1:1 c()I:1 ~lIpcri()r tícnc ClIalr(' rcsultad{)~ posíble~ que
illl.il'~ L'll 1(", Jal('s (,hscr\.;¡dl'~: \1~I~. d()." rcsult~ld{)!' igual d~ exlremo~ y un
rl."IIII:'(I(, m:l~ L'."lr('m(' alln.
(.:,lcl\lL'111()S 1:1 rrl)hahilid:ld d (;:id;¡ lIn(' de eslos cuatr{) resultados.
(.('nsiJcrcm()s rrimcr() cl re~l\lt:,J(, m:is cxtrcm{). 4. 5. 3. o. Empleand()
1¡\ l'xrrL'si(,11 r I ~.1.1,1. 1:1 rr()h;¡hilidall cs:

4' (~) (~:).'(~) {1=


.¡ ) (,

= = O.()OOOO354

\~
'1
J)ar.! 1(\-, .d.\10S ohscr\.ados. la probabilidad es
-.1

i
~1

,:1

J):lr~1 los dos rcsultados posibles restantes. las probabilidades son

!'"1

.~l

--\

l.i\ sum:1 de las probabilidades de los cuatro resultados posibles es


().(I(I(I(ll)4. qlle es cl ,'alor exaclo superior de la p de Fisher. La media p

~
-..r:

;~:-.~.
.

:;-'J~'!
.--
..'.
:::~~~t~~~

1~J~:=
APAREAMIENTO 293

sllpt:rior. in<.:luiria justo la mitad de la probabilidí.ld de los resultados


1 r:lra los <.:uales L /í", = II. a saber

: ().()()()()5662 + 0.00002654 + 0.00000708) + 0,00000354


., 0,000049

llUC C-" poc;o mils de la mitad del valor exacto de p de Fisher. ya que el
J rcsllltad() oh-"crvad() cs el scgundo resultudo más extremo posible en la
L'ola superior.
La L'omprobacióll aproximada de hipótesis con R controles uparea-
ti{)-" ,l cad,l caso puede. una vez m,1s. obtenerse con la prueba de Mantel-
Ilaenszel (f()rmula [12.38J). Con un caso y R controles en cada estrato.
1;¡ prucha puede replantearse en términos de la distribución de los
(.."onjunt()s ,1pareados como:

z = [13.15]

P:lra los datos de la labIa 13.7. la fórmula anterior da:

23
--

5
x

que corresponde a un valor de p con una cola de 0.00003. Este valor


concuerda razonablemente bien con el valor exacto de la media p supe-
rior. considerando loS pequeños números implicados y lo extremo del
resultado observado.
~
:;.;j

COMPROBACION DE HIPOTESIS CON UN NUMERO


V ARIABLE DE CONTROLES APAREADOS A CADA CASO
~
Las ri>rmulas [ 13.13] y [13.14] pueden ser rácilmente ampliadas para dar
c:.lbida :.1 razollcs variables de controles respecto de casos. efectuando
~ el producto de las probabilidades binomiales sobre todos los valores de
R:
Pr()h¡lhilidad de 1,1cola superior de Fisher =

J:J
=)nrI
.\tl R ('f.I.ln -+ I .O.m
h.
)~ m ) k," ~R + 1- ,n ) ¡¡,M-I+fo.M-k.

ki::-" ,~ III ~ I km R + l R + 1

[13.16]

-$

.-.::;;,¿¡~~~~.:;
';': :

~
~"

294 EPIDEMIOLOGIA MODERNA


l
I>r()hahilidnd de 1c.1
media ¡> de la cola ~uperior

II
111
10".
'R + -',I +.fn... -k
~ I rol n (II.," R + I R+
-1-" R ,"~I k",
\',
\
'fl.", -t. ./o.nl III Ion.
R+ -m ,11-*-1 +1;,-*-1..*

7. II
"'
R + I R+
[13.17]

ll(111Ul' 1;¡ rorm;¡ Ul' rrcscl1\acii)11 cs iucl1\ic;¡ a la dc las rórmulas [ 13.13J ~.


11).14J. /\ul1quc las rórmulas [13.16J ~' [13.17J son similares a la~ rórmu-
1~ls [13.1.1.l ~. [13.14]. ~u arlicación es considerablemenle más dificil.
r()rqlll' cl l1úmcr("\ dc rcslll\ado~ ro~ibles c()rrespondicntes a cada valor
Ul' ¡ PllCdc scr clc\.;ldo. EI1 cl e.iempl('1 13..;: hay ul1a binomial para R = 1
~ J(I~ hiI1()mi;¡lc~ r:lr;1 R = 2 ;¡ co1l~idcrar en los c{llculos: el l1úmero
1()I;¡1 dc rC~UII~\dos rl)sihlcs para la~ \res hinomiales es 11 x 38 x 26 =
I ().XóR. Dc éslos. 3.52.:. eS\ál1 en el ~uma\ori()
r()rmul~ls l13.1 óJ ~. [ I ~.17J. l-lay 279 comhinaciones
de la cola surerior de las
de las \res binomia-
1
Ir' qlll' rr(}dlICC1l ex~lclame1lle 47 C~\SOSeXrues\os. que es el númer(l ..,
(lhscr\,;IJ(). ErCCllIar I~I ~llma dc 3.55.:. ~um~\ndos. cad~\ UI1(1 de los cuales
l.' cl rr()dlll"ll) dc Ircs rr(}h~\hilid~ldcs hil1l}mi;¡lcs. es una tarea de comru-
t;I(¡(lr;1 l !11;1L'\,;\llJ;ll"ii)11 dc 1;1cxrrcsii)11 [ 1~.I ó~1COll los d~\los del e.icm-
rl(\ 1.1..2. d;1 ().()()."2,;-\r;¡ra cl \,~lll}r <.Jr J) dc l:ishcr de la col~\ Sllrerior ~.
(1.()()2¡.; r;lr;1 cl \.;II()r lll. I~\ mcdi;1 r surcrior.
L;I rrl\rh;1 CSI;lllislic;1 arroxim;\d:l OC 1:1 r()rmllla [13.15J rllcdc tam-
hil.IJ sL'r r;i(iI111l:11Ir alnrli;¡J;1 rar;1 aC(}ln()O~lr lIl1 1lllmCr() \';Iri:lblc de
~l
l.()l1lr(}Il:s Ilc\.~ll1dl)
d()r s()hrr lo~ ,~\Iorcs dc I~:;1 caho las sumas Cll cl nllmerador ,
- en el denomina-

':1
i

z = [13.18] r.,

I, f
i '- I; .",-
\' 1¡'" "' "

I';t r: cl CjCI11pl() .'I...:.la fórmula aprc.)xima<.!a ,\nlcrior <.!,!

+ 16 -(~)(:
z = = 2,79

v
lJIIl' L"(\rrC~r(\lltll' a lill \'alar de J> can una cola de 0.0026. en buena
t'(\nson:lncia con cl \'alar tic la medi.1 !' ~urcrior.

,;,. .

iB .,~~.
c.;,..."..,
Al..,"'~
~;~~~~

..
, :..;;.;;~~~~."i;i;,~'oi.;;:'",;.: ~",k:";,;.;;oc",x;,;'.;:;:.~~~->:;,-;;:::.,-;;:-~:'.;,:" ~.~

\PAREAMIENTO 295

1:,\'til"(ll'i(j" /1('1 il/ll'rr'lil() (le la raz(jl/ de vel/tajll COI! datos


lil'lirl'lillv,\" (1(' {'li.\"(}-l.'m1 t rv/

I:STJMA('ION DEL INTERVALO PARA PARES


g 1)1: <..AS()-<...()Nl.I~()L APAr~EADOS

I.(JS limilcs tic C.:OI11i:1117:a


exacto~ de la razón de ventaja a partir de
pil rcjas a pa rcatlas dc caso-cun trol pueden calcularse basándose en la
tlislrihllCii)11 de proh;lbilidad de lo~ posibles pares discordantes, condi-
l.'i()11:11 ;II 11l11l1CrOI()lal de dichos pares discordantes, expresando la
prohabilidad c.:omu ful1ciól1 de la razón de ventaja (véase la fórmula
I~13.1] )
/
11 ("1
\
I; o + !o I '- QR
Z¡- ;., .=
'¡k ("{5j;:""+T )';0+.fOI-k
k=)I" k \QR +
[13.19]

11'¡.(/11 '.1;0 + j~I


-..,' "',- = \ )( ~'
'-y--- ~o+fol-k
'J~,+ I , k OR+1 -o-R:+ i)
[13.20]

Las f()rmtllas allteriores. cuando se resuelven para QR y "O""[, dan los


límites de l:OllCiaI1l.1 ~X.1CtOSde Físiler. P.lra obtener límites de conCianz:l
~xaclos de 1.1 medi~l P. sólo se añade a la cola la mitad de la probabili-
d.td de I.. = ,1;0:

:XI.?
, = -:;
I ~f;o + JOl ( )( QR ) flO ( I +
-ho 1 .}101

-+- J.,lt¡.r,t,
¿
('I"
.I()
+ í
"'(II
)(QR + r"\R
~
1
) ( k
-/
QR
I
+
) fIO+fOI-k
[13.21]
.

k-lIII¡1 k QR+I QR+I

JOI
-:x/2 = ~ ( J~o + J~1\ ( ~' ,110 1
+
2\ ,ho }\OR: + 1, .,()""R:+l

+
f'nffn, (1;0 + 101\ ( ~ \k
1 flo+fol-t
[13.22]
k=fIU+l k} -o-R: + 1} ,O'R:+T1

La solución de las ecuaciones [13.19] y [13.20] o [13.21] y [13.22j.


se reduce a encontrar los límites de confianza exactos de un parámetro
hillomial. ". que es función de la razón de ventaja: " = OR/(OR + I).
("ol1sideremos los datos del ejemplo 13.2 relacionados con parejas apa-
re~ld~lS.Con II pares discordantes. ocho de los cuales tienen un caso
expuesto. el cálculo de límites. de confianza exactos de la razón de

,[~
i~~..

I-~
~
::~~}:~;;
','::. :j~i~
.,.,...

~\\:~.:'{

-~-
~~r,\ ..\~\~.:

2~(; EPIDEMIOLOGIAMODEnNA

v~I\la.ia. corrcsrol\dc a rol\er límíle$ dc confianza exaClos al parámelro L

hil\omíal ~sljm¡I(lo ror och() éxílo~ cn II el\sayos. Los límíles de con- :,:.1 p

1i;11\i':1 cxactos dc I.:.jshcr al 90 ror I ()O SOI1. a parljr de las rórmulas r:

11.".ll) I ~. [ I ~.20:1. 0.435(, ~. 0.92 t ~ para cl parámelr() bjnomjal. I() que ,.

l.('rrl.~r()I1(I~ :1 lIl1 i I1lcr\.., I() dc conlia I\Z:I cxaclo dc Fjsher al 90 por t ()O ] q

~lllrl. {}.77 ~ 11.7 rara la r¡,z()n dc venl:1.ia. Sj sc emplcan las r6rmulas n

11.1.~ II ~. 11.1.:21 r;lra <.'()11S~!!lIir los límilc~ cxaclos dc la mcdia P. los a

rl's,III;IO()S SOl1 ()...7().; ~. ().9()J() pnra cl p¡\r¡imClr() binomial. correspon- d


]
Uil.l1d() :1 ().~l) ~. I.).-" I p.\r:, lo.' limilc.' cxaclo.' dc la razón de venta.ia al lí

l)() r()r I()l). Lo ¡\mrli() dc los Ijmile.' rcnc.i.¡ I() pequeilo del númer() de d

a
r¡lrCS disl.ord¡ll\(es.
1
r¡lr¡1 parcs dc C¡lS()-conlrol ¡lparc.\dos sc pueden delerminar Ijmiles d

(IL' t"('I1Ii¡lnZa .\rroximado.' dc di\"crsas rormas. Un mélOd() consisle en 11

dctcrmjn¡lr I()s limj(c.' dc conrjanza dc la rrobabilidad dc quc un par q

t!lsl'('rtliln\C lu\"iesc lI11 <.:¡IS() CXrlle$I(). basill\dosc en las caraClerjslícas de 1 1;

nll\cSlra gr¡llldc qllc ticl}c la dislribuci¿)n binomíal ~' luego convcrlír u

cslo~ limjtes de COnli¡ln7.¡1 e\\ lo~ correspo\\dicn\es de la razó\\ de venta.ia.


()Iro.' lil¿.'IOdos i\\clllyCI1: las caraclerislica~ dc mue$lra grandc de lo~ l~
..
cslimadorcs dc m~lxjma prob.\bilidad. la rormula dc Robí\\s('r al. (t986) J:
dl. 1.1 '.:lrí.1nza dcl lo~arilm(' dcl eslimadl' dc Mantel-Hael\szel (rórmula ,.,
i r
112.~~11 ~. cl rr()cct!imie\\to b.1$ad() en cl \c~l. ,~
\.amo.' a c()nsidcrar. e\\ prjmer Il\f!ar. la aproximaci6n que $e basa en a
c
1:\ di~\rihucic)\\ ml\CSlr.11 dc la dí$tribl\ci¿)11 bíl\omial que licne una \.a-
rj:l\\z:1 rq:l1 r:1ra lIl1:1 11 ~ra\\dc. d()l\dc 11 cs cl nllmcr() de cnsa~'o~ bi\\()- 1$
miillc~. r c.' la rr()h:lhilidad t!c «cxito» ~ (I = I -r. I)~lr.\ parc.ius
:lrilrc:ld:IS dc 1::IS()-t"()IJtr()I.I; = f;c,!( Ilcl 4. 1;)1). y los limilcs dc conrlanza
UL. ,i l'llt:llL'll st:r :lrr()Xill}illl()s 11}l:t!i:ll}tL' 1:1 ri)rml\I¡1
J
J .II QI~ I
[13.23] .' J (, ¡

t./1 (1 + .f~ I ):I :


-, ~~
,

dol1dl' Z es el valor de la di$tribuciun normal eslándar correspondiente (l


}

al ni\cl de col1óal1za deseado. el si!!l1() más da el limite de confianza


J
"
I;.
'
.i
~llp(.'ri()r ~. el menos. el inferior. Los correspondientes limites de la razón ; 1¡
,.
dl' \cnla.ia \.ienell dados por QR = r¡( I -1!) ~. 00 = 13/(I -fi). o
«.} ;
; i

;. {
f I;

[13.24] :¡
9 t

~j i
t
J (:

: ~
.

[ 13.25]

¡1

,,~.

.;j~~~.
:::~":¡:

¿,~~:.
"",",,,j,~~~;~;~~~

J APAREAMIENTO

l~l)s anteriores límites de confianza aproximados son fáciles de calcular.


rcro inexactos. a no ser que el número de pares discordantes fuese
ra7.()n;lblemente grande. Para valores de la razón de ventaja alejados del
\'all)r nulo. el nllmero de pares discordantes debe ser muy grande para
l!ue la aproximaci()n resulte adecuada. La dificultad estriba en que. si el
D Illlmcro de en.c;ayos es modesto. la distribución binomial no se aproxima
tI lllltl Jistribuci()ll n()rmal dem~lsiado bien. espccialmente si la probabili-
ll:IJ Jc ~xito cstil Icjo.c; de 0.5. La fórmula [ 13.23] siempre produce
~ limites de confianza p~lra p que son simétricos con relación a p. a pesar
Jcl hccho de que la distribución muestral puede ser notoriamente
tlsimétrica par~l los \';II()res de p alej~ldos de 0.5. centro del rango de la
Jistrihución. r\ partir de la fórmula [13.23]. es posible calcular un
illlcr\'alo ltC cmlfi;lnza r:lra I' con un límite fuera del rango admisible.
llUI.: .:s JI.: t) a I. I)()r I..'.icmplo. si se obser\'~lron dos éxitos en 10 ensayos.
~ lil f()rmula r 1."'.:.\ I J~I Ull illter\.alo de confianza al 90 por 100 para p con
lJII Jinlilc il1fcri()r llc -().0()R: ocho éxitos en 10 cnsayos dariall. I.:on la
IlliSJll;1 f¡lrllllll;l. llll lilnite superior de I.OOR. Estos límites de I' fuera del
r;IIJ~11 ;1(IJllisihll.:. l."1'rrL'sponden ~l v~llores nel!ativo.c; de la razón de venta-
ia. SL'~lin 'l: la dl:lL'rnlin~lha con l~lS fi)rmulas [ 13.24] y [ 13.25].
1,111ml.:tlldl) 111~is;l.ilISt~ldo p~lr~1 obtcllcr limites de cOnfi~lnza aproxi-
m:ld()s ll~1 par~im~trl) billomial. fue propuesto por Wilson ( 1927). Este
;lh()r<.1:ljl: tonl~l ~Jl C1IL'Jlt~1I~l ;Isimetria de I~l Jistribución y. ell consecuen-
I.:i~l. IlllllC~l d~l rcsull~ldos fuera del rango admisible. La fórmula de Wil-
s()n es:

T l
~
' z'
+ ~ + Z J '~
'r '1 "',
+ -
Z2
"7'
J [ 13.26]
T + 22 T 2T- TJ 4T2

tlollde T es .1;n + 1;11'Z es Z 1-2/2' el signo más tia el límite de confianza


slIpcri(1r dc I' y cl menos, el inferior. Los límitcs de confianza de !a razón
dc vcntaj;.l ~ale. COI110 antes. que son /2,¡{! -/2) y fií( I -fi). Si .fto = 8 y
1;11= 2. 1(1slimilcs dL' confianza Jc l' al 90 por 100, a partir de !a fórmula
11...',2(¡1 ~on 1).5..¡I :' 11.1).11.hicn tlcntr() tlcl r~lngo que se considera admisi-
hlc ~' rcllcj;.llldo la ~lsimctria dc la Jistrih11ción muestral.
Para la~ II pareja~ ~lp:1re;.ld;.ls tliscord;.llltcs de los datos del ejemplo
13.2. 1,1 rórmul;.l [ !3.23] da unos límite~ de confianza de! parámetro
m hinomial :11 90 por 100 que son 0,506 y 0,948, correspondiendo a !,03 y
! !l..3 para la razón de ventaja. Estos límites, especialmente e! superior,
t:uncuerdan muy poco con los límites exactos calculados anteriormente.
L~l rórmula [ 13.26], por el contrario. da un intervalo de confianza de
dicho parilmetro binomial al 90 por 100 de 0,479 y 0,885, correspondien-
Jo ~ll1ll intervalo de confianza para la razón de ventaja de 0,92 a 7,72.10
que concuerda mucho mejor con el intervalo exacto al 90 por 100 de !a
media P.
L;.l razón entre pares apareados discordantes es simultáneamente el
cstím~ldo Jc mi1xima probabilidad y el estimado de Mantel-Haenszel de
w

c:
~~

.~
.:~~..:,~.;.;.:.~:.::.. !~~
:r\~~tr~~~i~r~ir

~
:~~~?~i; .~;...

4c !iii'J~

EPIDEMIOLOGIA MODERNA l
la r¡¡ZOn de venl.¡.i¡¡. Par.l dalO$ apare.¡dos de caso-control. la varianza
<.\cl cstimcl<.\() de milXima probabilidad de la razón de venta.ia ha sido ~~
<.\cSLli¡a por tvtiettinen (19701. Como e$ habitual con los eslimadore$ de Jr
r;¡z(,¡l. los limites de cOl1fianZCI se obtienen por transrormaciól1 logarilmi-
<:;1 (Icl e~timad(1 )' luego se invicrle lal lr.¡n~rormación. Para pare.jas
;¡rilrc;l<.\as. la f()rmula de mueslra grande de la varianza dellogarilmo de 1~
1:1 r:¡7.()ll <.\c vcl1la.ja es

1
[ 13.27] A
.1JIJ.fII J

qllc da linos limite,c; de col1ríanzu aproximados de la razón de venta.ia de


'-tI
bi
II {1
cxr 111 [ 13.28]

.I~ I .-.~
~

~,
L I ( I; o ) + Z I Ii (' + .f~ I
ex p I1 --- J n
[ 13.29]
r -I f .(

/(111 \. .IO.IOJ

-IR p
1);lr:\ I()s d:ltos de p:lre.i:ls :lp:lrc:ld:ls dcl c.jempl() 13..:.. la varianza se o
L'~lim:1 :1 r;lrtir dl' l.1 r()rmul.1 [ 1~..:.7J ~. e~ II '2A = O.45~ ~' los limites de
"te'
collri.lnz.\ :III.)() por 100. COn las rórmul.ls [ I J.2g] ~. [ 13.29]. dando 0.88 y
X.12. Co!lsider.l!ld() la~ pocos pares implicadas. esta aproximación da
cxcelentc~ rcslllt;ld()~ rar;1 los d:llos I.JUl' IJ()S ocupan: el pU!lt() de delimi- "
tL\Ci()1l i!lrerior es c.I.C;i i!!u;11 al limite infcri()r exacto dc la media p -\' el I
~
super!or estil r.1ZOllableme!lte cerca del correspondiente limite exacto
q
supcrl()r. ,~ II
C-am() los estim.tdores de máxima probabilidad y de Mantel-Haens- "

lci sall las mismas p.lra pares .1pareado~ de caso-control. no es sor- ..ic
c
prL'lldc!lte el}C()ntr.lr que I.1 r¿)rmula [ 1.:..5g] de la varianza del logaritmo
~] . r
dcl c.c;tim.ldor de M.lntel-Haensze1 sca idéntica a la rórmula [13.27].
c
cu;lnd() sc .lplic.1 .1 dichas p.lre.ia~ .1r.lrC:ldCls.
(
()tr.1 f()rm.1 de .1bordar las limj\e~ dc callri.1nza apraximado~ de la
r.lz(\JJ dc \'cnt.l.i.l. estimados a p.lrtir dl' pares de cas()-control aparcados.
cs el métod('\ basado. en el test. Con este tipo de pares, los limites !;11
"j
h.I.C;.ldos en dicho les\ son:

~~
.10 } (I fZlxl
J
[ 13.30]
~j
f~1

d()11de i: es el valor de la ecuación [13.12]. Como las ecuaciones [13.28] -1


y L I J.29] representan un método directo y teóricamente óptimo de J
ohtcner límites de confianza aproximados de pares de caso-control apa-
rcild()s. e~ prereríble por lo general hacer uso de ellas en vez de utilízar el
ilh()rda.ic ba~ado en el test. la~ rormulaciones binomíales de las ecuacío-

¡~~~~\~t~~ ..~.

:,':~.
t1~;~~
j;~~.i;~~~::-
c.; ~\\l~~t~~m;. ¡~ ~~~.t;~~':
-
,...'-o!... :l:ru[=j c ,~>;.:~..."' ,~,~~~:':i-.~:.;:0.;:"~

I:S.rl t\11\(.ION 01: I NTI:I~ V I\ LO ('ON R CONTI{OLES


.\1)¡\ 1{1:¡\ ()()S ,\ C,\D¡\ C¡\SO

I~;I cstimacii)n dcl intcrvalo exacto de la razón de ventaja. cuando se


1i I.:1'1.:1' I~ L"()ot r()lcs ;1r:1 rcad()s il cada caso. procede de la ex presión proba-
i)llislil.;1 11c.:III, (1;111" l"l.rila l\1111() rtlocii)n dc la razón dc ventaja:

()I{ ) ~"
n.-
'I.", Cm ~;

I) tl¡lll\~
",-1" /1".1-1
.II' ".¿)-R."~-(",/ "OR+Cm

[13.31]
lllllllll: ( .,,' = (R + I -1111/11,. y el reslo de los símbolos siguen la
11(11:ICi()11 uc la labia 13.6. La expresión [13.31] represenla el producto de
I~ rr(lh;lhiliuadc~ hin()mialc~. CI1 las que el parámetro binomial corres-
r()lluil:111l: a la prohahiJidad de «éxito>l (es decir. un conjunlo apareado
1."(111 liI1 C:ISO cxpUCSlO. dado que el conjunto tuviese m sujetos expuestos),
l:S
I)r (t:~IS() ~xpucsto d~ldos 111sujetos expuestos} =

OR
o R + (R + I -IJ7 111/1
\.IUC puctle tieriv:lrse de la distribución hipergeomélrica no central. Los
limitcs dc c()nlianz:l cxacto$ $C determinarán reiterativamente. sumando
l:1 \'al()r tic la cxpresi()ll [ 13.3 I J, para todo resultado posible de los datos
liuC se ap:lrtara por igl.l.\I. o de forma más extrema. respecto de la
Ilip()lcsi~ nul.\. comcl1z.\ndo desde los dalos observados; la suma se
c:llcl.1l.\ p:lr.\ valorc$ de ens.\yo de la razón de ventaja. hasta que el área
\.le 1.1c()I.\ se.1 igl.l:lJ .~I \'.llar deseado. De este modo. los límites exactos de
B I:isltcr SOll I.\s soll.1ci()ncs de 1.\5 siguientes ecuaciones:

," I R :1; ./11- I + .1~.m


112 = ¿ I-I
k "II nl = k",
[ 13.32]

\ .

) km
-o-R:
x/2 =
-o-R + C:

m
[ 13.33]

~~
"':

;~~;
,',;;.;.;..,...,:'

:-=.¿.~-;.¡:.:;

:;~~\\;1\W.l\~
~;

f~:

'4 ' ( >1{


4 \1 (5 )( Of~ ) (3)(
5 OR )3

/J.
( .1 ) ( ( ) 1{ I ..¡) )f~ I- 4) ,5. ()I~ .+- 1/2, ,3 6R":j:"""i;;J

jl;¡ pr()h;¡hili<.1;¡<.1 <.I~ los dato!i ohscrvados)


D
(1 )3

)1

B 4
) ¡ OR
)()
J. 5 , OR ) (3)('
~ OR \ 3
?1= (4 \(5R:¡:-:¡ 5 (~ 3 ,OR + 213) ~
I :~;

"

,
Il.1 probabilidad del resultado mils extremo). ",
I>ara \:1 limite exacto de confi¡,ln7.a inferior de Fisher hay que sustituir
I(\s \'all)rCS Jc cns.ly() Je 1.1 r.1zún dc ventaja en est,ls exprcsiones hasta
lIUC l.I sum.l de los cuatro sumandos se.1 igual a :x¡2. El superior se
(;btiene l:ncontr.lndo el \'alor de la razón de ventaja para el cual P.1 sólo
es I -~í2. ( Los restantes términos ?1' P2 y ?3 están incluidos en la otra
C()1.1 p.lrn el limite superior de Fisher.) Si se decide que :x sea el lO por
I ()(). los límites de confianza exactos Fisher ai 90 por 100, se halla que
SOll 3. i8 para el límite inferior y 496 para el superior.
Par.1 obtener los límites de confianza exactos de la media ?, se
emple,l el mismo procedimiento. excepto que únicamente se incluye en el
sum,ltorio la mit¡,ld de las probabilidades calculadas para PII ?2 y ?3: el
limite inferil)r es el \,.llor Je la razón de ventaja para la cuaI1/z(PI + ?~
+ ¡>.,) + ¡>.¡ = ~/2 y el superior. el v¡,llor de dicha razón de ventaja para
cl cual 1;'~(PI + P2 + ¡>J) + ¡>4 = I -1/2. Medíante ensayo y error,
plIC'C;.puedcn calclllarsc los límites exactos de la medía ? al 90 por 100 y
S()11 4.59 y 252. La gran discrepancia entre los dos límites superiores
CX.lt:tl)S. el de l:isllCr y el de la medía ? proviene del hecho de que sólo
h.ly un result¡,ldo posible más extremo que el realmente observado: el
4ue los puntos de delimitación superiores del intervalo de confianza sean
t.1n diferentes como 252 y 496, difícilmente va a afectar a la inter-

pretación epidemiológica.
¡\ p¡'lrtir de 1¡,1Sfórmulas [13.28] y [13.29], cuando se las amplía a R
¡;untroles. se pueden obtener límites de confianza aproximados del esti-
m.ldu de máxima probabilidad de la razón de ventaja con R controles
,I p.1rea d os.

;,~
.~..

¡¡~;q
~;
~
;t:if~t :~:;.;'~
..:;,"-

.,.:.: 11 :~r~\\:~6~f
[\~,~
"1r
I
302 EPIDEMIOLOGIA MODERNA

La fórmula de la varianza (Miettinen. 1970) que representa la exten- f ~-

si<)n de ILI expresión [ 13.27] para 10$ citado$ R controles es: I :li

-1"
[ 13.36] ,rl

.-f~

'.f"
--
(\()l1d(' OI~ e~ el cstimc.ld() de milXimc.l probabilidad condicional de la
r¡lzl)11 d(' \'cnlu.ia. C IIi es ( R + J -III)/III y las ,r siguen la notación de
1¡1 l;lbl¡¡ 13.6. Los limile~ de confianza aproximados se calculan como
sIgue: .

Q.R = exp [13.37]

"01{ = exp [In (00 [ 13.38]

tlondc el error estilndar es la raíz cuadrada de la varíanza de la expresión


[1 ~.)6J.
P..lra 10$ d..lt()s del e.iemplo 13.] el estimado de máxima probabilidad
de la raz()l1 de \'enta.ia es 22.6 y la varianza de su logaritmo es

I -

Varlill(()RIJ:;;;.
L 44 50(3¡2) 30{2/3 J -
'"1 .--+ .,
.:..:..6 (22-:-(; +4)~ +(.:.:..6 + 31'2)2 {22.6 + 213)-

.
== 1.1282
0.8864 .'.1
,~bl
,

IR
I() quc da un intervalo de confianza aproximado al 90 por J 00, a partir
dc I¡¡~ ecuaciones [13.37] y [13.38]. de
Jn

Q.R = exp [In (12.6) -1.645vil,1282] = 3.94

~J (
lel

00 = exp [111(22.61 + ,645,(i]282] = 130


J~

El limilc il1fcri(')r es un,\ aproximación razonablemenle buena del ~I

limilc infcri()r cxaclo dc 1¡1mcdi" ¡>. pcro cl supcri(')r estil nolorinmentc


rllt:r;l. ¡\ rl:snr (II: 1()(I(). II() 11:1
y difcrcn<:in m¡¡lc.;rial cn In inlcrprclnhilid¡¡d J'
dl: limilcs supcriorcs quc fuesen 130 y 252, por lo quc no hay problcma ~n

píilCtico. pese " la aparente incxaclitud. Discrepancias de esta mag-


nilud. a partir de diferentes aborda.ies al estimar el intervalo. no resultan Di
inusunlcs CUand(l ~ucede que el límite superior de la razón de venta.ia es

"-
v.::
'.!.

.,~i~~-,,:0;.
:'~, :-..
:.~;~ ,.~..!\..
..~,,;..

~
~f:.~:
~~I~f ;'~:\~~.;.\\;

f)iJ'~
APAREAMIENTO 303

I.'xlrcmadamente alto: es importante recordar que para estos datos el


I.'slimado puntual de la razón de ventaja es 22.6. en si mismo un valor
(amhién cxtrcmadamcntc alto.
I)ara cl I.'slimador tic Mantel-Haen...zel de la razón de ventaja. la
r(1rmulc.1 dc la variallza vicnc d~ltla por I~I cxprc$i()n [12.58] (Robins ('[ {iI.
fIJHó). 1~11S1.:()J11pI11IClltCSOC llil.:llil fi1rmlJla ¡;U:IIIOO ..¡c aplican a dal()$
al}~lrC~ldos I.:l)11 UII~I razl>11 llc ap~lrc~llnicnto rija de 1~-a-1 son

R (R + 2 III)(R +
\p,R. =
L.. I I L .1;.nl-1 [ 13.39]
III ; I

R 1)(R + I
I ' (nl -III)
~Q;R; = \
, 1.ln- I [ 13.40]

",--;- 1

9 ~
'-
I
PiSj = [13.41]

) Q'L) .= \R r III( III + 1)


-I I :-;-1 lO .1" (R + 1).! [ 13.42]

R
I . R + -111
\ R. = \
I I.m- I [ 13.43]
Lo I
,"";"1 R +

R 111
"i:' "i:' ,.
L.. .)i = ~ I().m (R + 1) [13.44]
I m-1

¡\plic:.1ndo est:.1 ri)rmula :.1 los dalos del ejemplo 13.1. para los cuales
OR\t11 = 33. 1:.1varianza se calcula que es 1.5179. para un intervalo de

<.:011
fianz:.l al 90 por I ()O de

exp [In (33) ::!: .645Jl,5179] = 4,35, 250

El allterior estimado de la varianza de 1,5179 es mayor que el correspon-


Jicllte que se obtiene con el e$timador de máxima probabilidad, cosa
llUC (."lbria esper,lr a la vista de la separación extrema con respecto al
D \.,stado Ilulo. Recuérdese que se dijo que el estimador de Mantel-Haens-
l.ci cs l,ln eficiente como el de máxima probabilidad condicional sólo en
la vc(.'ind,ld de 1,1condición nul,l.
()tro método de aproximar la estimación del intervalo de la razón de
~
vcntaj,l. p,lra R controles ,1pareados a cada caso, es el proceder en base
;11 tcst. Como siempre, estos límites son

B 6R(1 t7:llJ

.~r9

'~.~~7:

~
~:~i%%:~;j
:-.,:::'::.:.:.
;;;;:.,',.;.'
r.l1
~:
r ,I

:
~'.
¡;;

~.:

30.: EPIDEMIOLOGIA
MODERNA

dolldc X cs cl re~ullado dc In expresjón [ 13,15J. En principio. djcho~


lín,ilcs ha~ados CI' el Ic~t podrjan usarse lant(l con el esljn,ado de
1";lxjll'a rr()hahilid.ld c()n,() con cl dc Manlel-l~acns7,cl a I"od() dc punlO
dt: .lllc1.,.ic. Para los dalOs dcl ejcrnpl(l 13,1. la r c!' 4.0. I() que da un I
illlc:r\.all\ dl. CI)nfiaI17.;' al <)(I r()r 10(1 ci'lrc 6.~ ~' RI. cllal'd() ~c u~u corno
rllllll\ dt: ancla.ic cl cstjmad() de rn.ixil"~1 rrl)hahjlídad de 22.6 y de 7.R a
I "1,1), l'II:'IIC.II'L'I.<!llC: ~c liljli7,.1 c, c1 dc M;llllcl-llacn~7.cl. qllC c~ 33. En UI'(I
\ I)'rl' ca"('. I()s lirnitcs h.lsad()s CII el tc~t !'(In c\:idenlcmelltc dcrna~jad()
~s,rL'l.h('~ \ 11() ~c:r\'íri,,11 c()ml\ "rr()xim"ci()n adl.'Cliad(1 í' I()s Ijrnjtes de
..
c()l,fial17:" cx"cl()~. L()~ limitc~ b~l~ados Cll prllch~l!' ~()n adecuados habl-
Illalmcntc cn I., vccilld~ld dcl \'f.llor Ilulo de la ra7:6n de vellta.ia. per() para (:.,;¡

cs'o~ da'()s, qllc ~c arartan ruertcl"cn'c re~pcc'o de In coi'dicjón J'ula. i::

,t!.

los Ijl'li,c~ CI' CliC~ti(ll' c()nstitllycn lilla (lrr()xin,acjón pobre. .~

f¡.
,~

¡1

I:Sl'l 1\1"('1 ( >N I)EL I NTEI~V ALO CON UN NU M ERO \' ARIABLE ".
~;

,.

or ('()NTI~()LES ArAI~EADOS A CADA CASO ~.

(.()11 t11l 1ll1mCr() \.ari:lhle dc c()1llrolcs apareados. la expresión de proba-


hilid:ld dc I()s dal()S, c()m(\ ft1nción dc la razón de venlaia. e$ una
rxlc1lsi()ll d,.: la f()rmt1Ja ll~.~I]. halla1ld() cl rr()dUClO dc la$ r~obabilida.
ot:' s()hrl' caoa \.:ll()r dc R:
(' ( ) J~
~ 1;1.",
.,,:
')I" Ili:llllS1
, ( ) J~ -!c ¿ )II"'
,~ ,,: Ii.."

d(~J)d,.: I(~s simh('llos tiCI1Cll cl \.alor qllc ~c cxrlic('I cn la ccuaci6n .13.31].


l~"s rr(~hj'hilidadcs dc I" c(~I.I. r"r., ohteJ1Cr limites de confianza
cxi'CI(~s. ~l. c:Jlc\'I.,ll Com() c\lal1dn !\C lcnia lIn.l ra7.ón dc ararcamiento
fi.ijl (r()rm\llas ! 1.1.-'2J ., [13.3)J). coJ) li' cxrrcsiól1 [13.45J rcpre!\cntand(~
I" rr(~h"hili<.1(J<.1 <.Ic cada rcali7.(JcióJ) dc 10$ d.llos cn cl sumatorio dc la
cI~lj'.
t-()~ d;¡\()~ dcl e.icmrl() 13.2. para lo~ cuale", exislen 3.522 lérminos en
cl s\lm¡,\()ri() dc djch;¡ c()I,\. n() rcqucrjríal1 ()rdil1aríamenle un cálclllo
l'X¡ICl(\ dl' limjlcs dc c()nrianza. dchjdo ¡¡ qllc los nllmeros l!randes a",el!u-
rilJ) q\IC las r()rml'la~ mi,s apr()xim:lda~ par;¡ dclcrmíl1ar il1lCrval()~ de
C()llriaJ)7:1 sl'ri\J) satisr:lCl()rja",. L()~ límílc~ dc c()nriaJ)7.a cxacto",. pucs,
dchcll l':llc\lI:lrsc rcilcrc'tí\.amcJ)lc. dc rorma que se rcaJíceJ) las oreraci()-
J)cs dcl s\lmalorio dc la coJa con Jos 3.522 lérmíno", una y olra vcz haslc\
q\'C ~c alcaJ)cc Ja ~()J\lci()n. E~lcl tedjosa tarca. no obstante, no es díficíl
c\I:ll1d() ~c \I.C;a UJ):I comr\lladora. Lo~ Jímite~ dc confianza exaclo~ de
J:i~llcr all)() ror lO() rara Jos dalo.c; deJ e.iempJ() 13.2. son 1,28 y 3,10: los I
Jimilcs cxacl()~ dc Ja mcdia r. aJ 9() PC?r 100, soJ) 1,32 y 3,01.
t-os Jímilcs dc <.'()J)[jaJ)za aproximados dcl eslimado de máxima pro-
h:lhilid:ld L\)lldi<..j()J);¡J d(' J;¡ razóJ) dc velll,\.ia. COJ1UJ1 J1úmer() variabJe D
dL' (()lllr()lcs apilrcad()s. r\lcdcJ1 ha~arsc eJ1 la~. rórmula.c; [13.37J y
~1
~!

,
~
.: ~

:~=':
~; ~!~~

~
:1;~: :~\~~ill:l~\;~~

"- c

¿
~
~
~~.
r~

¡~:
~\~

1J:

~~:'

v /, ~
;ir 1.111(OR)] = ~'
[ 13.46]
00 I Í (.I;.m-I + ./~.m)Cm
R In- I (00 + C",)2

Jollde la notaci(>n significa lo mismo que en la fórmula [ 13.36].


Para los Jalos Jel ejemplo 13.2. el estimado de máxima probabilidad
Je la raz(>n Je \iel1laja es. a partir de la ecuación [13.8], 1,9835. Sustitu-
yendo esle valor en lugar de OR en la ecuación [13.46], junto con las
rrcl.:ucncias ()hSCrV¡¡llas. Ja rara la \'arianza Jellogaritmo de la razón de
vcnlaja e inlervalo de confianza aproximado al 90 por 100
~

~~.
/'-
\¡'ar [111 (Of~ = t
-., 1- JI )R(2} 26(1/2) 1 ~
,1)XjSL ().9xJ5+I"j1-+- f-'.9R35+2)2 + ( 1.9835 + 1/2)2 J

= {).()ó20

QR = exp [In ( 1.9835) -1.645..J'O.O62] = 1.32

OR = exp [In ( 1.9835) + 1.645.¡0:062J = 2.99

Como era de esperar con tales números moderadamente grandes, estos


limites de confianza aproximados están extremadamente cerca de los
limites exactos de la media P. que son 1.32 y 3,01.
El estimador de Mantel-Haenszel para los datos del ejemplo 13.2 es
2.062. Lf.l vf.lrial1za para una razón variable R de controles con respecto
f.l casos. puede obtenerse a partir de la fórmula [12.58], haciendo extensi-
vos los componentes de la misma, de las fórmulas [13.39] a [13.44], a
todos los valores de R. Así pues, cada uno de los seis sumatorios
deberian sumarse para todos los valores de R. Para los datos del ejem-
plo 13.2. la varianza del estimador de Mantel-Haenszel puede calcularse
por esta vía como 0,0659 que es ligeramente mayor que la varÍanza del
estimador de máxima probabilidad de" 0,0620. Los límites de confianza"
1~
aproximados al 90 por 100 del citado estimado de Mantel-Haenszel,
~ pf.lra los dalos del ejemplo 13.2, son

QR~fll = exp [In (2,062) -1,645J0:0659] = 1,35

OR"ll = exp [In (2,062) + 1.645J0:0659] = 3,14

.:;}~

:ii~~~~;~;
~1~~ ;~~;;.
.",...~I.~,'.t'.;¡:Ji'

j;~.:::'!~.;;:~;;:;.;,¡¡,~~.
.

~
:~~~~~~~r:
{f~}~; $~\\f?~~
~,
~-- ,~~;;

:1nr EPIDEMIOLOGlf\ MODERNA


1
( .li;I'lll(1 I.! r.I7.()ll dc :'Irarcamjcllt(\ varia. también puedell aplicar5e d;
Ijmjll.'s Ul' l"(\llriall/.a :lrroxiJl1aUOS ba5:ldns CI1 cl tC5t. 5U.jctos a la precnu-
l.i(\11 Ilsli;11 uc (JIIC Sll cx:lctilll<l sc rcsjclltc SC!!lll1 cuilnt() 5e apartell )os
:t~
ll;lt(\~ rL'SrCl"tll uc 1.1 coll<.1iciall Ilula. Ell tallt() quc )os )jmjtes basados el1 A
l.1 1l'~1 rIICr()11 llll:1 r('lhrc arr(lxjm.lciall rara I()s dat()s del c.iempl() 13.1. )o
(!lll. iIIJil.:,h.1 \111 crcct(\ rllertc. se r()dri.1 esrerar razonnblemente Ull
111L'i()r rClllliI11iL'llt(1 COIl los d¡lto!' dcl e.iemrl(\ 13..:.. quc 5e 5Cparan 5ólo ~
111(1l¡l'~I:lllll.11tl" (Icl cslad(1 Il\ll(). Para eslo!' dat()s 1:1 i:, (1 rnrtir dc la
r(1rIl1111;1 11 1X¡. cs =.7~). lisall<l() cl estimad() rulllunl de máxima proba-
hilil!;ll! <ll. I.()i', los iimjlc.~ <I(' C()llriall7::1 ha5ados el1 ellest al 9(1 ror JOO --1
,(111 I.,i~ ~ 2.l)h. (I\lC S(\11 c:Isi i<.1ClltjcoS al illlcr\'al() ()htel1jdo empJcalld() e -!
1;1 c\rrl"si(,11 dl" 1:1 \.lri;II1Z:1 <.Icl )ogílrjtm() dcl estimador de máxima
'I; ~-
rr(1'"\;II"\ili(I¡I<I ~ c.Isi i(lcl1tjc(,S a los limites CxílCI()S de 1:1 media P. Em-
\1r ,:;
rlL'¡'lll!(1 l'1 l"sljm.I(I(1 plll1tll:11 dc Malltcl-flacl1s7.el de 2.06. I()s limites dc c
l.(111rl;111/:! I"\as.lu(,~ CI1 cl t(',1 al <)() por I(I() S()1l J.~) ~ 3.t6 que están
:le :
l'l'rl.;111\1.; :! 1(1.' rcs\lI:.lll(,., l'hlCl1i<.1os cmpicalldl1 1:\ rarmula dc 1:1 \.arjanz:1
u:.' J{(1¡"\iIlS. J., l/l. ( I <)~61.

S"r"ll()I()S ()[: SEGlJlt\1IENTO APAREADOS

1.1 ;lr;lrl:;1111icllt(' rlIL'JC C()11SC~liir Cll e~tlldi()~ dc ~cguimiel1t{' ){, que

,
11(' rll<:(IC Cll Ic'~ dl' C;!S()S : c()l1lr()lc.<;: PllCdc imredir 1,1 c()nrusi()n. Las
L'('J11r;lr;IL.i(,J1CS hrlll;ls dl' ric.<;!!(, rr(),.iJ1iel1leS dc UI1 estlldi() de $eguimien-
1(1 ílr;lrc;IJ(, c;lrCL.CJl dl' ~CS!!(\ <.'()11reSrCCI() a los raclore~ de ap.1reamiel1-
1('. JL.I,iJ(\ ;1 1;1 ;lliSL'I1Ci;1 Jl. íIS()ci;l<.'i(,J1 el11rc la cxr().<;iciól1 ~' ésl()s CJ1 e!
'L.II(1 dl. I(,s Sll.icl('~ dL'1 csllldi(\ t.liaJ1J() sc iJ1icia el ~ef!liimienl().
¡\ I':.'sar dc CSI,I crjcílci;l. I(,~ csllltlj()~ dc $cgllimicl1l() ar,lrcad()~ ~()11
.,
r;lr(l.. L;I ra7()11 rllJ1damCl1lal e., cl el1('rmc c()$te de aparear grandes ] !
L.('11('rlcs: CSI()1; csIlJdi~s tjCJ1CJ1 ()rdiJ1ariamCl1le mucho~ m,is $u.iel()s que
1(\, d:.' L';I~('-<.'()lllr()1 ~. cl i\r;lrcamicl1l() cs. r()r re);l ~cncral. un proce$o el1
L.IlIIJL..SC C()ll~llmc Ijcmp(). Wa)kcr (1l)~21 híl ~ligerid() lin mélodo rara
n1t..¡('r;11' L.si;1 I'()hrl. efjt'icncii\ el1 rclaci()Jl al c()sle. limitando la recogida
J ~
r
!
J(.. J;II()~ ¡IL.l'rt';1 dc raclores dc COllrllSi()n n(\ arareados a aqucllos con-
.ilInl('S CI1 I()s qllc se rrodllcc lil1 ac()nlecjmiel1to. Otra razón por la que
r3;; i
j
:. i
1(" csI\IJi(,~ dc scg\limicl1l() ap,lread(,~ SOll raros es qlle e) apareamiento
!
s(\I(\ rlIL'(Il: scr ra7()l1ahlcmCI1IC Ilc\ad() ,1 C,lh() C()11 $l:.ielos como tale.<;. en ¡
I:lnl(\ <.JliL' CJl cli"l<.Jliicr esllldi() dc $c.!:!uimielllo a )arg() plazo. J3 medida
rl r
()rlim;1 dL' cxrl'ricnL.i;1 qllc dchc scr li~ada es la dc rcr.<;ona-ticmro. Sj U f
cn lill C.,\tlldi() dc .'\c~llimicl1l() ,1 larg() rla7;o .<;cemrlca el aparcamiento en
cl nl()mcnl() d(' la .<;clccci()11 dcl sllicto. la.<; di.<;tribllCiolles idél1lica.<; entre
scrics
L'('l1r()rmL'
c()mraradas
1;1 l'xrL'ricl1cia
dc )()S ract('rcs
dc scglljmient()
.r()r I()s qu('
dC' los
.<;e,Irarea
grupos
rodría
c()mrarados
cambiar
co-
J
n1CI17;ISl' a dircrir.
1);lr;1 C~llIdi()" (\rarc:ld(,s Cll (11Jr cl rcri()(I() dc ,';c~liimicnl(' c~ ~lIfi-
l:ir;111l'mcntc t'()rl() com(' 1',lr" .illstiril:;lr cl IIS(' (IL' (lal()s dc il1citlcncia
(\L'11111111;1(1;1
l'll '.C7 ur I(),'; dl' tas;l!' UL. il1L'idcIICi¡l. lill (\Ilillisis hrllt() dc I()s

~%:f:~m~~
~~~~1: ~.
\~~1¡~ ~4.
...
:?::::~:~;

APAREAMIENTO 307

tlato.c; tlaril re.c;ultados que no estarán confundidos por los factores de


¡lr~lrcamiento [pc.c;c ~\ que dicho análisis bruto proporcionará un estima-
ll() tIc I~l v~lrial\7.~1 dema.c;iado grande (Greenland y Robins. 1985a)].
(\ucm~is de prevenir la confu.c;ión. el ~lpare~lmiento contribuye también a
la cficiencia del e.c;tudio reduciendo la variación del estimado deI efecto:
tljcha rcduccii)l\ .c;urge de la correlación en el resultado de enfermedad de
I()s sujctos ~Ip~lreado.c; que esta técnic~l introduce.
J ( .()11sidcrcm()s 1111estudio de ~cguimiento aparcado con T pare.c; de
"ujctos cmp~lrcjlldos expuestos y no-cxpuestos. Supongamos que la dis-
n lrihución de frecuencias de esos pares según el resultado en los sujetos
;J cxpuestos y no-expuestos es I; I para los pares en que ambos desarrollan
I~l enfermedad. !; () para ~\quellos en los que sólo el expuesto )o hace. !o I
rar~l aquellos en que sólo desarrolla la enfermedad el no-expuesto y !00.
cualldo no I~l desarrolla ninguno. La diferencia de riesgo puede ser
I.:stim~lda con la f()rmula:

, - I; I + .1;0 !; 1 + j~1 {¡o -101


I~D = R
Rn=-"=--- T T
T
[13.47]
I
la razón de riesgo'

/"- ~¡; 1 .:.. ¡;0)/T ¡; 1 -1- ¡; O


RR = -
-
[13.48]
(11-11 + !o1)/T ./~1 + 101

La comprobación de hipótesis estadística para estos datos es idéntica


a los procedimientos utilizados para datos de caso-control; tanto el
método exacto como el aproximado se aplican igualmente bien a datos
de seguimiento en los cuales todas las observaciones son frecuencias. Los
limites de co!1fianZ~l exactos de las medidas anteriores son diliciles de
ohlener. pero existen excelentes métodos aproximado~ que toman en
clIcnta la reducci()!1 en la variación que el apareamiento introduce.
D El aborda.ic In;ls directo incluye fórmulas de la varianza que corres-
p()!1dcl1 a los estimadorcs dados en las fórmulas [13.47] y [13.48]. Para
cl estimado dc la difcrcnci~l de tasas. la varianza es:
m
--
Vtlr (RD) = [13.49]
~ T3

0 1:1 cstimtldo de la varianza de la medida de razón de tasas transformada


[J Il)gtlritmicamcnte es:

.1;0 + 101
[ 13.50]

~ (~ 1 + j~O}(~ I + 101}

[1
--."'": '~~.~.~.".
.;:.".?::'~.:~~:;.c,.?;.:~.~.'..

I)~ .~:¿;-. ;~~;.


.~~\\~~~
;}.lij
, ,
30e EPIDEMIOLOGIA MODfRN/I
J

Lo~ c.C;limado~ dcl crcCl() qllc sc hallall " rarlir de las rórmulas
[ I ~.4 7] ~. [ I ~.4RJ .c;on 105 que se ()hlieJ1cJ1 de los dalos crudos. pero las
corrc.c;p()ndicnlc~ \."rian7.a~ dc la~ rórmula.c; [13.49J y [13.50J son meno-
rcs. p(\r 1(, gcncr"l. quc I".c; quc .c;cc()l1~i~uen c()n un análisis bruto. Otro
p()sihlc "hortla.ic dc 1" c~timaci<)11 dcl inlCrval() dc confianza consiste en ]
Illili7.;lr limiles dc confiaJ17.a ha~ad()s en cl 1(..\"1.ulilizand() la X de la
r(,rmlll;1 [ 1.~.121.
1:1 cicl1'pl(\ I-'..~ illlslr;1 dalos dc un c.c;llldi() dc ~c~uimiel'l() dc 45g
'1111.it"rl'scn,h;lr,,7.:'d;ls lll'l' h;lhi:\11 1()1'1"(1() prcvi:\mcl1lc al1lic()nCCplivos
(\r¡llcs: cl !!rllp(' dc c()mp;lraci()n C()"si.c;IC cn un nllmcr() igu,,1 de mll.ieres
(IIIC "II"C;1 I(\s h;¡hi:\n utili7.;¡d(1 ~' tlilC rllCr()ll ;'p"rc"d;¡s il1didllCIlmcnlc a
1;ls CXpIJCst:\S .c;e~l,ll cd;I(1 y Illll'lCr(' dr: 11i.i(\s( 1{(\hiJ1S()n. 1971 ). Los p;¡res
Sc)ll clasific:ldo~ sc~lln si c;¡d" m;¡drc h" d:ld(, :1 IIIZ ;¡ UJ1t,iñ() qllc tllviesc
Ilna dl' CI' l rc lIn !! rll P() dr CIJ10rm;¡ lidíldcs P('t cnci;¡lmcl1lC rcl;¡ci()n:\das ~
C()11 lil cx r()sici()n .( El Icct ()r dche rep;¡ r;¡ r e11 qlle csl()~ d;¡ t()S. ;¡ li nqlle I
p;lrcccn tIc iJ1cideJ1ci;¡ aclImlllCIda. S()1l rc;¡lmcntc dc rrcvalcJ1cia. PUCSl()
quc eslíill cxcluid()~ los ab()rt()s).

F:j('mp\() 13.3. /)i,\"lrih,IC';(í,1 (". p(lrl',\' l'111!'{1r~i{1cI(),~ clc mllil'rl',~ l'1IIh{1r{1=ada,~


t'.\""I(',~/tI,( .1. 111)-('.,"!,11('.\"1(1.\(I {111riCmICl'l"il'n.~ nr{1Il'.~ .\"l',J?lil! a1lnrmalidade.~
.\'(""C.C.;tlllfICitl.\ ('1! l,l.~ rC'(';(;11 1I{1Cid(),~ ( Rnhi1l.\"()1!. 1971 )
,
Madre n(\ expUe$la

A J)()rmalid¡ld Anormalidad
Total
I t
~:
prc~cntc
au~cntc

t\,1ildrr cxpllcsta
Anormalidad prcscntr 2f\ 85 113
,\n(")rmalidad ausente 61 284 345

Totalcs 89 369 458 I


El c~timado dc la dircrencia de riesgo a partir de esto.<;datos. con la
rórmul;\ [ I ~.47J. e,c;(8.' -6 I )1458 = 0.05.?. Se puede calcular un inter-
I
\':11(\ dc conrian7.a al 90 por 100 a partir de la varianza que la fórmula
[ 13.49] determina:

45R(85 + 61) -(85- 61)2


\'ar (RD) = 0.000690
45g."\

<.Ianc.lo para )O~ )ímílc~ de conríanza

0.0524 :t
,
..(,45,\./O.OOU6l)(}
-
= O,OU9, 0.096 n
Es po~ihlc. tamhién. utilizar el abordajc ba~ado en el f('.~f. sobre la base
dc la % que se ohticnc de la rórmula [13. 12]. aplicada a 105 datos del
u

~~-~7

~I ¡~~~~;
:~~
~ íQI.I
, ;.i;.~.;i
-,

APAREAMIENTO 309
~--
~-icmplo 1.1..1.. El valor de X par,l este ejemplo es (85 -61)/~f46 =
l.lJX6. dando lIn intervalo de confianza de la diferencia de tasas al 90
r()r lO() dc

().{).'i24( :t .645 ,I)Xó) = 0.009, 0.096

((Ill: l:S ¡;sl:ll¡;i:IIIIIl:IIIl: idcllti¡;o :II rl:s\lltad() ()htcllido utilizando la fórmu-


la 1.1J.4(} J. ~
I~esulla inlere$anle comparar eslos resultado$ con los límiles de l'!
~
<:()Illianza que se sac:ln con los dalos brutos. ignorando el apareamienlu.
IJ;I labia de 2 x 2 p.lra los d.llOS brulos se mueslra en la tabla 13.8: las

¡;lllradas dc las ccldas de dich.1 labia $on los totales marginales de los
r;lres del e.jcmplo 1.\.3. Usando .el cuadrado de la fórmuJa [11.17]. la
\':lriallZ.l dc l.1 difl:rcl1cia de riesgo es ~

V:¡r(l{bl = (113)(345)
4582 + (89~ = 0.000748
4582

4uC cs algo m.is gr,lnde que el estimado de la varianza que toma en


l.:u~J1la la razl)IJ de apareamienlo. ¡\ partir de este valor. se puede calcu-
lar un iI1ler\',11o de confianza ,11 90 por 100. que da:

0.0524 ::t .645.,¡0.000748 = 0.007 0.097

La razón de riesgo puede estimarse a partir de los datos del ejemplo 13.3
como 113/89 = 1.27, utilizando la fórmula [ 13.48]. La varianza de la
transformación logaritmica. tomando el apareamiento en cuenta es. a
partir de la fórmula [ 13.50]

.- 85 + 61
Var[)n(RI~)J ~ = 0.0145
~
.'
(113)(89)

que da un inlervalu de confianza al 90 por 100 de


f -
exp [In ..27) ::!: .645.J°.Ot45] = ,04, ,55

Tabla 13.8. Dalo.\". hrlllO.\" del eje"lplo 13.3

Exposición a anticonceptivos

Sí No Total
---

Bebé normal

Si.
No. 113 89 202
345 369 714

458 916
o Tolal 458
t
i'
,
~~~
.;~r: It{;
~
%~:
;'ii
,..

EPIDEMIOLOGIA MODERNA
J
3'0
Los limites de confianza de la razón de riesgo basados en el test, al 90

nor 100. SOIl:


I
.27(! i .(,45/I.qRn = .04. ,55

l\lll.: es cscncialmcllte cJ mi~m() re~ull¡ldo. De los dalos brulos de la


tahl;\ 1.'\.8. utiliz¡lnd() 1¡\ rl)rmul¡\ 11.8]. lenemos:

Var [In (11.11.)]=

I
quc c()rrcsronde a un intervalo de confianza al 90 por 100 de

--

.27 + ,()45,,;fO.O157] = .03 .56


cxr [111
si)ll' li~cramcnte m:l~ ~rande~ que lo~ que toman el1 cuenta el aparea-

mICIII().
El an;lli~is de estudio~ de seguimiento apareados que tienen varios
su.iclOS no-expuestos aparcados con cada su.ieto expuesto es análogo al
quc se emplea para dalos apareados. Los datos crudos proporcionan un
estimado del efect() no sesgado. en tanto la razón de apareamiento sea
COI1~tante. Si \'aria. dehen aplicarse los métodos del capitulo I:. para
dat()s dc scguimicnlo, agrupand() a lo~ su.ieto~ en estratos según categC'-
rialsl dcl (dc losl factortes) dc aparc¡\mienlo. dc cara a asegurar el control I
til' la 1.:1)11fusi()n.
lJna dc I¿I~ uifcrcncia~ con re~pcct() al apareamient() entre los est\l-
uio~ dc scguimient() I. los de casC'-conlrol es la cantidad de informaci¿)n
quc proporcional1 los dalOS acerca del efectC' de un factor de aparea-
n1ientC' sobre la ocurrencia de enfermedad. En un estudio de caso-
conlrol Il() existe manera de evaluar directamente el efecto de un factor
quc huhicse.sido apareado. El proceso de selección asegura una distribu-
ci()n idclltica, tant() en casos como en controles. de cualquier factor
:Iparcau(). En uno de se!:!uimiento. sin embargo. la identidad de distribu-
I.:i()n sr con~i!:!lIc para su.ietos expuestos y nC' expuestos. antes de que se
(Irsarrollc 1;1cnfcrmcd;ld. El resultado enlre sll.ietos clasilicados a niveles
tiifcrcl1lcs dc U\1 factor de apareamiento está aún por determinar y
PllCUC. por tanto. ser e\'aluado mediante una comparación directa que
110 cst;i confundida por Itl exposición.

[VALUACION DE LA MODIFICACION DEL EFECTO


('()N DATOS APAREADOS

J:","~:0:;...'~
!t~f~¡~~ii
..~ :.-.:.::::J..;:~;::.-;::~
:::¡;;r;~¡;:.:~:;:¡~i
;~
-:~,;~ ; ;i/~~.

i~~*1(:~~j~:
I:: ~Y1

APAREAMIENTO 3"

cxtremadamente pequeños cuando se realiza un análisis apareado. por-


que los estratos corresponden a los conjuntos apareados. el abordaje
cst~ldístico habitual con que se evalúa la modificación del efecto no es de
;¡plic~lCii,n. Sigue siendo posible. no obstante. valorar si el efecto es
L'on$tantc a lo 1~lrgo de los niveles de un ractor de apareamiento en caso
Jc 4ue. p()r e.icmplo. s()lo estén implicadas unas pocas categorías del
Inisma. No vamos ~I toc~lr esta cuestión en detalle. sino que discutiremos
UII (;~lSa sencillo p~lra dcmostrar 1~1idea.
Supang~lmos que un estudio de caso-control con pares emparejados
se llevase a cabo con 200 de éstos. De los 200 pares. supongamos que 60
son discordantes: 40. con el caso expuesto. y 20. con el caso no-expuesto,
1 de forma que el estimado global de la razón de ventaja sea 2.0. El
~$timado global se calcula sobre la asunción de que la razón de ventaja
~s constante para todos los estratos. pero supongamos que queremos
e\alu~lr cst~ldistic~lmcnte si es ése el caso con respecto al sexo. que rue
liI1O O(; I()$ r;I(;I()rCs de ~lparcamiento. Para evaluar la modificación del
t:rcclo CJl I.'st()S {lat(ls aparcaoos scglln sexo. únicamente resulta necesario
SCpilrtlr I(IS rilrl'S Jiscordtlnlcs en suhgrupos masculino y remenino y
rr(ll.:cocr tI ~()llslr:lst~lr I(IS I.'stim~ld()s ocl crcl.:to ablcnidos de díchos
subgrupas. l)c los 4() parcs discordanlcs con un caso expuesto. suponga-
mos que .1I son pares varones y 9 hembras. en tanto 15 de los 20 pares
discordanles en los cuales el control está expuesto son pares masculinos
y 5 son remeninos. Entre varones. la razón de pares discordantes es
JI¡15 = 2.1. comparada con 915 = 1.8 entre mujeres. La similitud de
estas razones indic3 que los datos son razonablemente comparables con
una razón de tasas uniforme. Un lest estadístico de la hipótesis de que
existe una razón de ventaja uniforme para varones y hembras no seria
otra cosa que un test acerca de la asociación de la tabla de 2 x 2 que se
muestra en la tabla 13.9.

Tabla 13.9. Di.l"trih,lción de parl'.1" di.l"cordantes sl'gtín


e.'(pn.l"iciól! -" gél!ero para datos apareado.\' hipotéticos

Varones Mujcrcs Totales


~

Caso expuesto. . 31 9 40
B Control expuesto 15 5 20

Totales. ... 46 14 60

Un test estadístico X para estos datos. sacado de la fórmula [11.6], da


1. = 0.21. que corresponde a un valor de p de 0,8 y es razonablemente
~ -;1
, :"
. consistente con la hipótesis de que el erecto es uniforme.
"""'
Extendiendo el procedimiento anteriormente descrito, pueden cons-
truirse 1('.SI.S
más generales de modificación del efecto para datos aparea-
dos. Utilízando la fórmula [12.60] junto con la [13.36] (o una de sus
B

..
~
1?(.;:?-~¡if,..:::;:.::I.;l~;;;;;::::.~:.::;:
."..
~!~

[t i~.
~8~1 ::~
:11::
.",.,o¡;..

3'2 EPIDEMIOLOGIA MODERNA

cqui\'alcntes mi\s sencillas). se pucden comparar en una única prueba


c$timados del efeclo provinientes dc varia~ subcalegorias para estimar
las \.arianza~ apropiada~ a cada uno de los estimados comparados,

J:VALlJACION DEL EI:-l:C,'() [)L~ AI)AI~EAR CON DATOS


()E (.ASO-CONTJ~OL

Ilcml'~ \'isl(' qllc cl proccs(' ur aparcar pllcdc. por ~í mismo. i111roullcir


COJlrll5i()n cn un e~ludi() de ca50-COJltrol siemprc qllc cl ractor dc .lp:lrc:l-
mienl() ~ca un correlat(l de la expo~ición. La conrusión que se introduce
5C convierte en ~u~tituto de cualquier.1 otra que se hubiese observado
para dich(l ractor en au~el1cia de .Ip.lreamiento: habria confusión en la
medida el1 que el ractor el1 cue~tión. ademils de estar correlacionado con
lit exposicióJ1. e~tll\'iese tambicn rclacionad(l con el estatu~ de enferme-
dad. Si el factor de apareamient(l no está rclacionado con el estatus de
ellrerrned.ld y. por 1(1 tanto. no estil conrul1diendo inherentemente. apa-
rcar por él represel1ta sobreaparearniento porque el esruerzo de hacerlo y
la pcrdid.1 de eficiel1cia en el ani\lisis aparead(l que se requiere no rne.io-
raJl la valide7 del e5tudio. El cit.ldo anillisis apareado seguirá siend(l
prcciso iJ)cllls(l 5i cJ raCIOr por el que sc aparea no hubiese estado
ilctllaJ1do Com() raCIOr de conrusión. puest(l que. corno se ha dicho
rcpetidamente. aparcar por cualquier correlat(l de la exposición introdu-
cr una conrusi()n que nccesita un anillisis estratificado para que se la
elimil1e.
El castigo por aparcar por un factor (I conjunt(\ de factore~ que. en
COJ1.iul1to. 110 estiln correlacionados con la exposición no e~ tan severo. Si
los ractores de apareamiento n(l introducen correlación en las historias
dc exposición el1tre c.\SOS y controles. aparcar no habrá introducido
COJlrllSiól1 algu!1.1 en I(\s dato~ y el anillisis apareado no tiene por qué ser
J'lantenido. Evitar este últirn(l pucde ser útil para sustentar la eficiencia
del e~tudio impidiendo la pérdida de inrorrnación de los conjuntos apa-
rcados de casos y controles COn historias de exposición plenamente
concordantes (I para permitir la e5tratificación por factores que no han
sido apareados. Los raCl(lreS de ap.lreamie!1to que en los datos no están
correlacionados con la exposición repreSeJltan. probablemente. factores
qllC n(' hahrian estado c(\nrul1dicJ}do incluso sin apareamiento, por lo
que estc n<' dehc scr vi~to corno productivo, pero la capacidad que se
ticnc a!1tc una silllación .Isi de abandonar un análisis apareado innecesa-
ri<) miti~a cl prohlem;l.
La e\'alll:lci<)J} de 1¡\ rclaciól1 exi~tel1te entrc los ractores apareados y
la cxposición cs e~cl1cialmente una ev.lluación de la conrusión introduci-
da por el apareamiento y se la Ilev.1 a cabo. por lo general, de la misma
f(}rm:1 que ~e evalú.1 la co!1fu~ión. El e~tirnado del erecto se calcula de
dos manera~: prescrv.I!1do el ap.lrc.lrniento e ignorándolo. Si el estimado
dcl erccto que se sac.1 del anilli~i~ apareado difiere materialmente del
crudo. dich.1 difere!1cia puede ser .Idscrita a la confusión resultante de la

.-:';:~ i~~;';
.~.,~:.:

~
~

APAREAMIENTO 313

correlación entre los factores de apare~lmiento y la exposición. J.a dife-


rcncia. si existe alguna. será usualmente tal que el estimado crudo del
I.:fc(.'to csté mils (.'crc,1 quc cl collfundido rcspccto dcl valor nulo. siempre
(I\IC 1,1 r:IZ()ll (Ic :Ir:lrcamicnto dc colltrolcs ,1 C,IS0S sca constantc a lo
1:lrl!(' (IL' I(,s C('lljllntos. Si no h,IV difcrcnci,1 rnateri,11 cntrc el estimado
hrl~to y L'I rcslllt¡ido dcl allillisis apareado. cl investigador puede concluir
ljuc el ,lp,\rc,lmiL'nto no introdujo ni controló confusión ninguna. y se le
rllCdc ignorar en L'I allillisis. Debe enfati7.,lrse que 1,1evaluación del ,1pa-
rc:lmiento. ComO dc la confusi(>n en general. no debe b,lsarSe en pruebas
~stadisticas. sino cn la m,lgnitud dcj sesgo visible. reflejado en los estima-
1 dos puntuales
Consideremos
que se comparan.
como ejemplo los datos de la labia 13.7. El estimado
Jc milxim¡\ rr()hahilidad dcl ricsgo relativo. a partir del ani11isis cstratifi-
(.',ld() lararc,ldol. ~s :?3. El bruto. calculado de las proporciones de expo-
,i(.'ii,n hrlll:\s. I~ IX r,lra los casos y 16172 para los controles. es 7.0. La
<.Iis(.'rcp,\n(;ia i,ldic;l que loS f(lctores de apareamiento estaban correlacio-
IJiltl(,S I.:()II 1:1l'.xp()"i(.'i()n y. por lo tanto. que hay que mantener el análisis
:11);lrc:\d("
Si la r:IZ('IJ (Ic :lparC;lIJlicnto es constante ,1 lo largo dc los conjuntos
¡Iparcados. 1(1:lsociación bruta entre exposición y enfermedad está habi-
tu;llmcnlc rn,is ccrca del valor nulo que la que está condicionada al
control dc los f,l(.'t(,rcs dc apare,\miento. En circunstancias inusuales. no
(,hstalllc. la as(,(.'iaciúll brut,l entre exposición y enfermedad está más
Ic,j()s resrecto dcl valor nulo que 1,1ljue aparece tras estratificar por los
ract('rcs de apareamiento ( KoepseJI. 1984). Esta anomalía se produce
,-;()lo si h,ly una corre!,lción negativa de historias de exposición entre
casos y sus apare,ldos controles. En condiciones ordinarias. la correla-
L"i()11~s r('Siliv:l. rcro pucdc ()c~lsion,llmente ser negativa, ya sea por la
\':lrial)ili(la(1 mlll:stral (, r()r un:¡ rnotlifical:il)n e,~trem,l del erecto. Si
I.:str:llilic:¡r r(lr I(IS 1:¡(.'t(lrl:s tic ap;¡rcamicnto conduce a un estimado del
g l:rl:CI(, 4llC l:sl¡i nl:is ccrc;I Jl:I \'al(lr nul() quc el crudo. dicho resultado
(Ichc scr illtL'rrr~taJ(, C.;('IIJOUIJ a\'is() Jc 4uC los datos son anómalos de
algun,l m,lncra. K(ICpsclllla rccomcnd,ldo cn tales situaciones examinar
n ,si h,¡y modificaci(>n dcl crccto: dicho p,lSU es generalmente
idc,l. incluso sin el erecto paradójico del apareamiento.
una buena
Vale también la
pcna verificar que no se han pas,ldo por allo errores en el procesado de
datos ni cn el etiquetado.
D

i\N¡\LISIS MUL TIV¡\RIADO DE DATOS APAREADOS


~
Los métodos de probabilidad condicional descritos en este capitulo
m ,; 'i
rara l.'stimar la raz()n de ventaja con datos individualmente apareadoS.
;'¡

rllCdcl1 expresarse malemtlticamente en la forma de una ecuación de


rl.'glcsi()n logistica condicional {Prentice y Breslow, 1978). Los doS abor-
(lajl.'s analíticos son equivalenles en tanto la variable de exposición no
Sl.':1 dic()t()mic~l y 110 se consideren. aparle de las variables de aparea-

í ,

...
".
."'

;~~~;
~-~~

EPIDEMIOLOGIA MODERNA
3'~
micnto. otro~ f(lctore~, El análisis de regresión logistica condicional
ofrece al.l!llna~ ventaj(ls. no obstante. Una. fundamental, es la capacidad
p:lra c('1ntrolar convenientemente otros factores que fueron medidos,
rcr(, n(' ~c (lpare(1 por ellos, Utilizand('1 el análisi~ estratificado conven-
t'i(\11al. frcc\lentemcntc n(' hay form(l algun(1 de controlar de modo efccti-
"\'('I I()s factores dc aparcamiento ~' l('1s factores no incluidos en el algorit-
mt\ dl' aparcamicnto,
(Ic :Iparcar y dclcrminar
Si rcslllla de hcch('1 po~ible que, al ev(lluar el efect('1
que ha introdllcido poca ('1 ninguna confusión
I
drhidil ,1 los fact()rcs por los que sc rc.lliz(). los conjunto~ aparcados
plldicscn rc~ultar deS!!.l,iad()s ~' lo~ datos. estratificados por factores
s(\I'1re los q\le n() se h:\bia aparcado, Si, por cl contrario. el apareamicnlo
h,1 iI1Ir()dllt'ic.lo una c('1rrelaci()n m(lteri(ll cn la~ hi~torias de exposición
cnlrc casos ~' controlc$. cl an:\lisis dc re!!rcsión logistic.1 condicional (u
('Ilrt)" mt)dclos condici('1n:l1c~1 permitc tanto eliminar la confusión intr('1-
dllt'ida por el aparcamiCnl(1 como cl c()nlrol de f(ICIOres de confusión
adit'iooalcs O(\ .1parcac.lo~, E~ t:1mbien p('1~ible. aunque inhabitual. que
10" f:lctores de aparcamienlo e~tl1vie~en c('1nfllndiendo sólo sobre la con-
dit'i()n del c('1nlr('11 dc los facl('1res dc confll~ión no apareados (Fisher y
r.llil. \q74: t\1icttincn. 1974). situ(lci()n quc el análisi~ logístico condicio-
n:11 pllede di(\.l!noslicar ~' :1 la que puede h(\cer frente con efectividad,
E~le úllim('I met('1do permite de igual modo la e\'aluación. simultánea-
I
mcntc. dc 1:1exp('1~ici()o a \'arios niveles. proce$o que es de cualquier otra
f()rma cspct'ialmeotc
1ól. El il1con\'coicnlc
dificil cuaodo sc lici1en datos (\p(lreados (véase Cap.
del aborda.ic multi\'ariad('1 es qllC se requiere una I
complllad('1r.\ ~. Sll corresp('1ndientc ,\.{~/(II'(lr('. p(lr.l el anillisis: el cstralifi-
cad(, t'on\'cncion.\1 $(11('\rcquiere un I~lpiz, un papel )'. quizás. un.\ calcu-

lador.1 de bolsillo.
L(\ con$trucción del modelo multivariado para el análisis de re!!re-
$i()n 1('1.l!í$tica se discule en el pr6xim() capitulo, lo mismo que la teoría
qllC sllby.1ce tras dicl1('1 mét()do,

1~1:1;"1:.'~':N('IAS

Hreslo\\". N. Odd~ rali() e~timalor~ \\'hen thc data arc sparse. Bimll('lrik{/

19R 1:fi~:73-R4.
Fi~hcr. L.. :Ind Palil. K. Malching and unrelaledness. Am. J. Epidemiol.
I
1974:1()():347.349.
G()rdis. L. Should~ dcad ca~es be malched lo dead conlrols? Am. J. Epidemiol.

19~:?: 115: 1-5.


( ;rt:I.'I\I:I'\d. S. Thc c!Tccl or mi~claggificalion in malched pair casc-conlrol
sltldil.'~. Am. .I. f./'i(I(.,lli(ll. 1982:116:402-406. ..
(;rl.'cnl:I,\d. S.. and J~()hin~. .J. M. r:slimalion ()r a common e!Tcct paramcler from
~rarsc r()llo\v-ur dala. Bi(IIII('/ri(..~ 1985.1:41 :55-68.
Cjrccnl:lnd. S.. and Robing. J. M. Confounding and mi~classifcalion. Am. J.

E"i(i(.mi()I. 1985b: 1:!2:495-506.


.Jick. H.. Mieltincn. O. S.. Ncrr. R. K.. CI al. Co!Tec and myocardial infarction. ¡..".
E,I.f!I. .I. M(.(I. 1973:289:(,3- 77.

.~;-.:
1~t:
~
;~~;;~\i~~~~: ¡~~:

~~;;"'

l 315
APAREAMIENTO
.--~-
Kl\Cpscii. T. Unm~llchcd analysis or malched dala: rs lhe hias always conserva-
tjvc'? ..1,11.J. E,li(ll.mi(ll. 19R4:120:463-464.
l.lihin. J. H. ¡\n cmpiric~11 cvalualion or lhe usc or condilional and uncon-
Jiti(\IILlllikclilll)l)l.IS ror C¡I~c-conlrol dalLI. 8i(ml(.(rikll 19RI:68:567-571.
¡\1l:Ncmar. (). Notc 1111lhc 5Llmpling or lhe diITercncc bclwccn corrected r>ropor-
t i()11S ()r rCr(;CntLIgc~. P.'i.l.(.h(I"I('(rik(1 1947; 12: 153-157.
i\1icttjncn. (). S. IndividllLII mLltchinl! with mullirlc conlrol~ in the case or all-or-
n()nc rCSrt\n!;cs. IJillnl('(ril..'i 19(,9::.5:.1:1.9-355.
~.'icttincn. (). S. l:stimLltion or rclatjvc ri~k rrom individually matched scries.
IJim,I(.(ri(..'i Il)7();.;6:75-R6.
-J \Iictlincn. (). s. (.tll1rollndinl! and crrcct modi(jcalion. Ilm. J. E"i(/(""i(l/.
Il)7J: 1()(): "I) ".1.
\lil.:ttjncll. (). S. Strati(jI.:LltilIn h: ;1 mul(ivari.llc conroundcr score. /11". J.
1;.'I'(/¡."li(I¡. Il)7(,: I ()4:(}()q-h2().
1'(I(,lc. (. 1:,r(l'lirl.: (Ipr(lrtllnity in I.:.Isc-con(rol 5lUdics. Anl. J. E"i(/('"li(JI.
Il)X(,: I ~:: ": "X.
l)rl.:nlil.:c. I~. L.. ;Intl Brcsl{"1\v. :-.J. E. Relrospective studies and railurc timc
m('JI.:I!;. Ili(lnl(.(rI¡.;1'197R:65:1."3-158.
1{{lhins. .1. \'1.. IJrcslo\\'. N.. Llnd Grecnland. S. Eslima(ors or lhe Mantcl-
Ilat:nsl.ci varian(;c con5i5tcnt ¡n
m(ll1cls. Ili(Jnl(.(r;{..\" 19R6:42:311-3:.3. bOlh sparsc
.-- dala Llnd lar2e slrata limitin2

({(Ihinson. S. (.. l)rl.:~nan(; (\utcomc rollowing orL11 contraccptivcs. .4,11. J. Oh-


\".'. (;1.'1(.("1// 1()71:IOq:."\54-:1.5R.
\\';IIJ.;I..r. .\. \~. 1IIjt"it:11IC asscssmcnt (If conroundcr cITccts in matchcd rollo\V-
llr ,(lilli\.,s. .11'I'i. .)ll1(. 11)R2:JI:~93-297.
\\'ilsl\n. I:. IJ. l)r(,h;INc jnrt:rcl1(;c. TIIC ILI\V or succcssion and stalislical inrcrcnce.
.1. ..j,I,. .\/(//. .1.\.\11(.. 19:.7:.:..:.:~09-.?11.

F1
í"'

I¡J

~~~1~ ,~

':;:f::~~~!¡ ~.
:-;;~:~'::c:::.:
~:;' ~I') ~
~
:.,
:::.:
,;..
.,;.
r~"

14.
;::..
;,-,,:
;;1:
"~
~...

J ~'"':

~~',

..~;

~,
.:
!':':.

~
;,.,

~
fi

L~I primcr~1 experiencia que se tiene con el análisis multivariado le deja


;1 lino con la impresión de que acaba de serle re\'elado un milagro de la
leL'nolo~i.1 dcl .lnillisis de datos: el método permite controlar la confusión
y cv.lluar 1.ls intcr.lcciones de multitud de variables con gran eficiencia
t.'st.ldisticd. Mejor .lún. una computadora te hace todos los cálculos y te
imprime con limpieza los resultados. La temeraria exoeriencia de orde-
l1arle l\l1C c()nsig.1 todas estas metas analíticas. para I~ego simplemente
pt)n~r en ()rden y publicar cl sofisticado «output» con apenas una pausa
p:lra volver ;I tccl~~lr. es indiscutiblemente tentadora. Ciertamente. puede
il1cluso Jle~.lr ;I ser decepcionante ver cómo el análisis que culmina el
Ir.lh.l.i() dc sem.ln.ls. mc$cs o .\ños de recogida de datos se acaba en un
lit:mpo 1.111<:orlo y los resultados se comprimen de tan compacta manera,
Por útil ttue pueda ser. sin embargo. el análisis multivariado no es
un.\ p:.\nace.\ c$t.1distica. Su mayor inconveniente radica en la barrera
ttue inserl:.1 entre el in\'estigador y los datos. Otros métodos analíticos
f:.lcilit:.\n una comprensión intima de estos. haciendo consciente al inves-
tig.\dor de !.l exi5tencia de irregularidade$ o deficiencias -unas pocas
cntradas de celda criticas con frecuencias pequeñas, por ejemplo-, Los
métodos multiv:.\riados dificultan esta intimidad con los datos. Otro
inconveniente. relacionado con éste. se halla en la falta de capacidad de
captación para comunicar a otros el mensaje de los resultados. Algunos
lectore5 se sienten poco familiarizados e incómodos con los modelos
m;ltcmiiticos 4uC se manejan y totl05 ellos. lo mismo que los investigado-
res. ()hticncn una compren5ión mils clara de los datos si lo que se
prcsentan S()t1 fre<:uenci:.ls tahulatl:.ls,
La crecientc disponibilidad de hllrdll'(lre y .~~/ill.are de computadoras
ha 5ignilicado el pistoletazo de 5alid:.\ para una avalancha de datos mal
digeridos. gran parte de ella caracterizada por sus análisis desectructura-
dos y pobremente conceptualizados, que conducen al investigador hacia
la meta de la investigación por accidente, si es que le conducen a alguna
p:.lrte. En la literatura cientifica, uno se encuentra frecuentemente con
situaciones en las que loS métodos analíticos descritos en anteriores

317

~
j~;~t:t~~~~~'

--
r.iJ
I
31p EPIDEMIOLOGIA
MODERNA

<.:;¡pitui('s dc c~tl' libro podrian haber sido aplicados, pero se los dejó de
lild() Cl1 r;¡\.or dcl anillisi~ multivariado y con otras en las que se aplica a
I(IS diltos \';¡rios modclos multivariados. cu~lndo con uno o dos habria
,id(, c;uli<.:icI1IC, Al cridemiúlogo. de el1lrada. le merece má~ la pena
ilrl'~;¡rsl:. ~icl11prc quc rue~c posible. el1 lo.c; procedimientos del análisis
~,lr;¡tili<.:ildo. quc ~on má.c; directo~ y que en~endran una mayor familiari-
(l;¡d l\)11 I()s dato~ tanto p~lr.1 el inve~tigador como para e] Icctor.
( "u;¡l1d(, e] citad() anilli~ic; estratific~ld(' sr h~lce impracticable. el mul-
11\.ariild() es il1dudahlcmel1tc lJtil com(' ahordaie allalitico. La viahilidad
(I~ 111.'\ar .1 c;¡h() cl cstr~ltilicadt' depelldc del numero de subcategoria.c; a
1\, I;¡r!!(' d~ las cualc.C\ hclyil quc dispcr~l.lr It).c; datos: sí son demasiado
I1UIll~rl)Sol.'i. los datos qucdariln e~troltilicoldo~ de rorma en extremo delga-
d:\ il II' l;¡rl1l'
-~ dc dich:ls suhcatc{!oria.c; \ el al1i\lisi.c; se volverá ineficiente
..
1(, 1.1111.. c~ i() llli~nl(1 que decir quc lo.c; estim.ldo.c; resultante~ serán impre-
cisos. r;1 an:ilisis lllui\i\'ariad() proporciona una manera de preservar la
precisil)n al ticmp<) que se controlan mucha.c; variables. postulando un
m(,dc]<1 miltcmiltico quc permitc utilizar lo.c; d~lto~ de modo más eficiente
paril e~timilr simultilneolmente mucho~ erectos. La medida en quc e~te
!.'r<)<.:cso al1:lli\ico repre~el1tc uno\ me.ior:l el1 la eficiencia. y no sólo un
s<.:s~('. dcpcl1dc dc la adccuación
IllIIÓl'I(1 mil\Cmiltico.
dc las .lsuncione.c; incorporadas
Un :lnilli.c;i.c; es\ratilicoldo. quiz(i.c; limitado
en el
a alguna~
I t
\.ilriilhlcs cl;¡vc. coIl~tituye con rrecuenci:l UI1 prúiogo sensato del multi-
~
\.ilriaÓI). rlle~\O quc ruede arro.iar luz ~ohre cl groldo el1 que los dato.c; se
rnllCS\roln col1rorme~ COI1 la~ aSUI1CiOlle~ dc un modelo multivariado I
!.'articular. Pese iI que c()nsumc mil~ tiempo. una combinl.-lci()n de estrate-
!-!ias analitica.c; suc!c ser mi\s rructircra el1 cuanto a dar pistas sobre los
(lato~ qUl' cuo\lquicr ahorda.ic por scraroluo. I
<.'ul.lndo se ha ortoldo par un análisis multi\'ariado. el tiempo que se
cmrlca en rll.lnilicar la con~\rucci()n dc UI1() () UI1O~ pocos modelos de e~te
\ir(). el1'\"e7 de ordcn~\r por la~ buenas la generación de ,'arios direrentes. .I'
I
tt.'lldrii C"l)mO producto trab~l.iar meno~ ~. con resultados más claros. En
1;¡.; 111l'.i(:\tescircunstancia~. e] producto final seri\ un resumen elegante de
1{" d;¡t()s. dt=~cribiend() la.c; complicadas
mul'h;¡~ \"ariablc.c;.
il1\errelaciones existentes entre I
r:n su scl1tid() mil~ I.lmplio. análisis multi\'ariado es cualquier análisis
lll' dat('1~ que tom;¡ mucha~ \'ariablc.c; en cuenta. Un concepto unificador
qll~ c;l1h~.ace a sus diferen\es \iras e.c;el uso de un modelo matemático
quc rcsp()l1dc dc 1.1 intcrrelación en\re la.<; ,'ariables del análisis. Las
l.<.:II;¡<.:i(,nl'~ pr()hilhilisticas prcscntad.\s en el capítulo 12 para estimar
n)l'Jid;¡s l.,.'idcmi(l!cI!!iL':ls dcl crc<.:t<,;llliem!.'(' que se conlrolaha 11.1conru-
sic,I\. SI)I\ c.icmplos dc I()s 1111)dcl<).<;miltcm:i\icos que constituyen un
:In:i!ic;i~ multi\.ariad(). MIICh<ls Olr()S Il:ln .'ij<lo desarrollados. h.lbilual-
11\~ntl.. <.:011!.'ropi)sil<)S c~pl:ciali7.ados. El oln.iiisi.<; por ractores. por e.icm- I
pl(\. es \In:l mctotl()lo~ia cOI1Cebid.l rara c()I~lpsar UI} número grande de
\.ilriilhlc~ predictoras CIl otr{) nlti.c; pequeño de «factore~) que representan
suh!:!ruros corrclacionatlo~ del con.iunt<' dc volriables origil1al. El an{ilisis
dl' sl'rics tcmporolle~ cs UI1 mctodo diri~id() a evaluar la asociación entre

~.~"'.!:~...,::,.":.;.; ,..':;.;~'-c.~~T~~.:'-:{:

.:~
;~~;
~~~1¡
c.;.~.: :,:,:.."'...;.,.;,~"
.--1.~*"~/.<~ ,..~ "

~-
~

ANALISIS MULTIVARIADO 319

v:lri:lhlcs. 11licnlr:ls Sc loman en con~ideración la variación dependiente


1 ¡lcllicI11r(} y 1:1 l:()rrclaci()11 enlre la~ variables ~eleccionadas. El abordaje
llllC Ila Icllid() 1111:1 clplil:aci()n mils ampli¡l en epidemiologia es el análisis
(Ic rt:~rcsii}11 mílllirlc. <I\IC poscc numcrosas varianles: en sus formas más
~1.:11l'r:llt:s. SUhSlll11C I11llcII()s ¡}Iros ,Ihordajcs mulliv,lriados. como el ,lná-
lisis 1¡}!:t,lrilll1ico linc,11 (Iog-lincal). los ,lhord,lje~ probabili~ticos descritos
1.:1I cll:apiIUI(} 12. cl ,lnilli~is de co-v,lrianza e incluso el análisis de series

] lt:mp()r,llcs.
1:1 ,111illi~is 111t1ltivari,ldo es un lema avanzado que ha sido objeto de
IIIUI:II~}S lihr(}s. lJn,l discusión plenu de sus aplicacioncs resulta impo~ible
a<lui. !)()r I:Onlr,l. el objetivo de este capílulo es describir en términos
I SClIl:ill(}s los m(}delo~ matemáticos
I.:stra tC!:!i,l q tiC el epidemiólogo
básicos que se utilízan y discutir
debe adoptar para construir e interpretar
la

1 111(}dcl(}s multivari¡ldos.
j

)1)r:LOS MA TEMA TlCOS BASICOS

IfIJ(,/fl 1;,I('fll

1:1 Il\odcll) lI\;is rulldamental que describe la relación entre dos variables
cs la lilll:~1 re(;ta. E! modelo lil\eal par~1 dos de dichas variables sirve de
Irall\p()lill para l)lrOS lI\¡is (;u11\pli(.;ados. entre dos o más de ellas. La
l:(;lla(;i(,ll dc la lillCa recIa que rclaciona dos variables tiene dos paráme-
Ir(I,. f(lrllllllilU()' !lahilualmcnlc como 1.1 intercepción. o constante y la
pcndicl1lc. o cucli(;icnte-:

}' afl + al,'( [ 14. J ]

1:11I~\ CCU¡\l;i(}11 114.11, 11{1es 1¡\ intercepción o constante: es decir, ao es el


yalt}r II1I.:t.lio t.1~ 1¡\ vari¡\ble }' cu¡\lldo la variable ,\, I es igual a cero. El
(}Ir() p.\ri\metro. 111.es I(\ pendiente de la línea que relaciona X 1 e Y. y
rcpresent,\ cl 11l1mero de unidades de cambio de y por cada unidad de
L".\mbio Cll .\.I. El sumando I: es el término de error, y representa una
scp.lr.\ci()n t.iebid.\ .II .\z,\r" de la v,\riable dependiente respecto del valor
~sr(.'rat.I(}. El error medio se asume generalmente que es cero. El rango
tt.'l}riL"o t.\nto de (III como de (1, y,\ de menos infinito a más infinito. La
lil!ur.\ 14.1 ilustr,\ ~r,ilic.\mente el modelo line.\1 con 2 variables.
-Es raro quc 1,\ ;cl,\cil)11 real cntre dos v,\riables sea lineal: la asunción
illh(.'rcnt~ Cll l;u.\lquier ,\ni\lisis que depende de un modelo matemático
I.:S quc csc mot.I~lo constituye una descripción simplilicadora que no
s~ 1;(.}llrOrm¡\ 1lL'l;l.:s,\ri.\mente segt\n la relación que hay en la realidad
~Iltrc I,\s v.\riahles. pero si 1,1 representa de forma suficientemente cer-

.1.:1 inlcrccpci(Jn c~ ll:lmad:l en muchos lextos matemáticos «ordenada en origen»,

\', Ih'¡ T. J

a
i~
f:~:l~~~~.1~*~~
!ffl' ..,~..~w'
¡t~~~~
~;;:' r*;~~~~~~
,,!,~:' ~t.~~~
;;-
:~~1l~~f~
~IJí
~:

1 ri.
~~

~t
r,,:
32(! EPIDEMIOLOGIA MODERNA

,-,
.,.
~;
;;I:

¡¿
.
:;:.c

I [:,

x +x,

;
"
;
;
i
!

-y

Fig. 14. I{('"r(',\('///(/("iril/ ,f!r(ifl("11 (Ir' J(/ ('("/,(I("i,i/1 tiC' /(1/{/ J;//('11 r('C1a

cana como para quc .c;can razonable~ la~ inferencia~ que se extraen
s()hre I¿I ba.c;e dcl mismo. L(1 separación de los datos respecto del
modclo puede rene.iar una discrepancia entre este ~. la naturaleza. así
como fuentes de inexactitud (1 I~! hor:l de obtener la informacil)n. Un
(,h.ictiv() scnsato consiste en ele.1:!ir UI1 m('dl'lo que se a.iuste a los dato~
Sllficicntcmcnte como para quc la milyor fucntc de scparación dc los mi~-
m()s con rcspccto al modelo pr()\,en~a de inexactitudes inherentes a ellos
: n() dc I() inapropiado de éste.
La figura 14.2 ilustra una relación casi lineal entre el número de ;
~
ci!:!arrillos fumados al dia y la mortalidad por cáncer laringeo estanda- ,
"
rizada por edades (Rothman ('I al.. 1980). Raras veces siguen unos .,
t
datos epidemiológicos un patrón lineal de forma tan cercana como éstos. .~
1
Cuando las obser\'aciones no caen exactamente sobre una línea, pero ,...
siguen mostrundo un patrón básicamente lineal a pesar de una cierta ;i

dispcrsi(ln. el invcsti~ador debe (1royar~c en método~ e~tadísticos de


:ldL'ClJaci()n rara ohtCJ1Cr la ecllacilln de la linea que mejor cuadre. La
ccuaci()n dc la línc¿I.«que mcjor se adecua» ruede determinarse mediante
una \'¿¡ricdad de técnicas. Los me.iore.c; método~ son aquéllos que toman
cn Clicnt~1 la c~lntid(Jd de información rene.iada en cada observación; un

~~~~~~¡~~~i~li~;
,."".,

",~'

¡~~ir~¡
::<~:::;;~~i~ik~~
(~:
ANALISIS MUlTlvARIA[Ja 321

~
~
~
~
c
':J
01
~
U)
~
~
«I
N
"t:
~
-0
C
~

~
~
«I
:2
m
~
O
~

o 10 20 30 40 50
Cigarrillos fumados al día

Fig. 14.2. M orlalidad c.\'la1ld{"i:oda por ('{1{/{1d('hi{lo o ('(i1l{'('r larí1l,r:('o, ,\,('ltli1l ('1
mím('ro d(' cigarrillo.\' jiIIlIOdo.\' diariam('1Il('. (1 p{,,'ir dr lo.\' d(110,\,d{' Kahll ( Rnlh-
man et al.. 1980).

mélodo común que se utiliza es el de los cuadrados minimos pondera-


dos, que minimi7.:.1 la suma de los cuadrados de las desviaciones vertica-
les de cada observación respccto dc la linca, pondcrando cada dcsvia-
ción al cuadrado segúl1 un valor que rencja 1:.1car1tidad de il1rormaciól1
que posee esa observación. La ecuación dc la lir1ea que mejor se adecua
en la figura 14.2 es }' = 0,86 + 0,2926X, donde r es la tasa de
mortalidad estimada, medida en muertes por IO~ pcrsona-aiios, y >.. e~ el
número de cigarrillos fumados al di~l. Para 110 fUm(ldoreS, 1~1t~IS(l dc
mortalidad que este modclo lincal prcdice es 0.R6 por IÓ~ .persona-años;
para fumadores de 40 cigarrillos al día, 0,86 + (40 x 0,2926) por
105 persona-años. El resultado dcl paréntcsis cs 11,70, cirra quc hay quc
añadir a las il1ici(lles 0,86.
En el lenguaje estadístico, la ecuación [14.1] sc conoce corno una
ecuación «de regresión», lo que indica quc UJl conjunto dc variables, en
este C(lS0 X J, SOI1 utilizadas para predecir o dcscribir a otra variable, Y.
A X I se la llama «variable indepel1díente» y a Y, «variable dependiente».
La ecuación [14.1] es la de una regresión lineal sencilla, porque dicha
ecuación posee únicamente una variable indepcndier1te. Sin embargo,
seria posible ampliarla, añadiendo variables independientes adicionales;
cuando posee múltiples variables independientes, la ecuación se llama de
regresión lineal múltiplc:
}' = ao + al X l + a2 X 2 + aJX J + ...[14.2]
:;~.:~,~~¡iá~fd:
,~,,~~~~""~,
:~~~.r;r~\~'t(f;~,\~~;~:t~~

~:
,.,

.t
~.

322 EPIDEMIOL

E~ltl ccut\ciól1 sif!uc siel1do lineal. pero la linea recla cruzn un espacio
(,.'(tI1 mils dl.: dos dimensiol1es. una por ctlda variable dc la ecuación. f
il1L.Illill:1 1:1 \'arjahlc ucpelldiel11e.
1:1 r:ls!.!() cl:lvc ucl al1illisis mullivtlri:lu(). quc Ic hacc scr Ul1tl Iccnica
1;111 \llil rtlr:1 cl tll1illisis cridcl\1i(tli)~i(,.'(I. csl;i Cl1 cl hcchl) uc quc Itl il1fc-
r\.,ll(i;l h:lsall:l Cl1 cl c()cricicl11C <ic ciI;llq\licr \'ari:lhlc illdcrCIldienl(' del
11,(1ucl() CSI:"I C()11llici()l1adtl tl I:I~ rcslal\ll:~ \.:Iri:lhlc~ iI1UCrcl1dicl1lcs del
11\IS111('. r:Sl;1 il1ll.:rrrcl:l(,.'i()l1 c()l1dici()11;,1 si~l1ific;I q\ll' CI1 \111 m()ucl() SCI1-
l.illl\ Sl. rlll:Jl. (,.'(11\lr(tl:lr sim\lll;il1c:1111~111l. 1..1C()11r\l~ii)l1 (Ichi(ltl ¡1 lii1 ~ral1
1111111L'r('d rtlClltrC~ ~ qllC !\C r11cdr dCICrmil1tlr :1 p:lrtir dc I()s c()cfi-
l.il;l1lL'S :I(lcc\l¡ld()~; cl cfcct(l d(' C:ldtl r:lCI()r. 5in q\lc 1()5 rC51tlnte5
f:I'L.I ( 1rl:S ucl m()licl( 1 acIlICl1 col1f u I1d icndl)llI. siem rrc q liC las tlsul1ciol1es
11l;11L'111ill ic:ls dc J ich(, m()dcl() 5ca 11 rtl7.()I1¡1 hlc5.

7 1'(11'.\:1 (11'/11(1(.i,III('
,¡/'1,,1(}/1('/(¡ lí,I('(/, tllltili.\i.\ l(.1gi.\" I j('(}

La cc\laci{)11 r 14.1 :1. () ~u exlcnsi¿)11 [ 14.2]. repre~enlan la forma bá~ica de


ml)dcla.il' e~ladislic() para virlualmcnlc lodas las aplicaciones epidemio-
Il}!:!icas. llay modclos más complicados quc rueden. ror lo general, ser
cxrreSad()5 el1 una forma que corres ronde a alguna de esla5 ecuaciones,
y S\I C()mrlc.iidad deri,'aril de que se hayan hecho lransformacione5 en
\1l1a (} má5 de las \'ariable5 del modelo. Dicha5 transformacioncs posibili-
lal1 a UI1 modcl() lil1cal describir rclaciones inherentemenle no lineales.
J}()f e.iemrlo, ~\1rol1gamos que }. representa la tasa de incidencia y que la
\':\riablc independienle e5 la edad. con los dalos siguiendo el palrón de la
fi~ura 14.3. U n~: linca rccta que relacionase I~I tasa de incidencia y la
edad constituiria un~l adecuación robre. rcro consideremos la posibili-
d.ld dc definir l.I \'ariable independiente como el cuadrado de la edad: )..1
= (cdad)2. La rel.\ción cnlre }. y la ,'ariable de edad lransformada seria
ahora perfeclamente lil1eal. El uso creativo de lransformaciones capacita
.\1 modelo lineal para acomodar5e a casi cualquier relación no lineal.
T~11 nexibilid~\d tiene un precio, si el numero de término~ del modelo
sr alImenta. Añadir términos reduce los «grados de libertad» residuales
del mismo. haciendo decrecer con ello lu erlciencia de la estimación. Esta
pérdid.l de eficienci~1 es habitualmente pequeña. excepto cuando el mo-
delo posee ya un nllmero relativamente grande de restricciones para esa

c:an!idad de d~ltOS.
El\ \1n ~Inilli~is cpidcmiológico es comun que una variable tenga sólo
dos ,.alores, quc corrcsponden a 1.1rresencia o ausencia de enfermedad o
a l.1 rrc~encia o ~\\1~cnci.\ dc cxpo~ición. A los modeló5 de regresión
ha~ados en \ariablc~ dcpendiente~ dicot¿)micas se los conoce como «re-
J;rcsionc~ binaria~». Sllpongamos qlle sc llevase a cabo un estudio de
se~uimicnto para evaluar la aparición de enfermedad en un grupo ex-
ruc~t(' ~. otro n()-cxpllesto. En ~u forma má~ sencilla, los dato~ consisti-
rian CI\ do~ oh~crv.\cione~ hinarias ror cad~l sujelo: ~i e~tahn expue~to, o
110. y si hahia caído enfermo al final de1 período de seguimiento. o no.

~
¡j'.;:
~;~
,0-.,-
c~..';»:;,,:~~.;.;..,
IG
~:., .-~ ,.~ ~ :..
'.> :-:..'.~..;:V'.;~.~
~. ~~
\~~~!~\;~~~~~~J~~:~~.'.;:~:
~

I.

I~ .~:;."

ANALISIS MULTIVARIADO 323

...

s
I ::; .:
:::

:;.

.J

10
Ü
C
al
-0

l ~
~
""'
~
:/1
~
0-

Edad

I:ig. 14.3. La ttl.\"Q d(' i,1Cide,lCia tJUlllellta .\"ef:lí1l el cuadrado de la edad.

I Los dalos del ejemplo 11.4 ilustran tal situación: si tanto la variable
illdepcn<.\icntc Com() la dependiente son binnrias, los datos se resumen
mcdi¡lntc UJ1¡1tahla de 2 x 2. Se puede ¡lplic¡lr a los mismos una regre-
D sión t¡lmbién hinari¡l: resulta convenicnte codificar cada una de las
\:ari:lhlcs con los valores O (> I dcl1otan<.\o. rcspectiV¡lmente, la ausencia y
presencia de exposición o de enfermedad. Utilizando este esquema de
codificación, el término constante ao corresponde a la incidencia acumu-
l¡lda en el grupo no-expuesto. Por lo tanto, al. el coeficiente de la
v¡\riable independiente del modelo, corresponde a la diferencia de inci-
~ dencias acumuladas (o diferencia de riesgos) entre los expuestos y los
l1o-expuestos. Por supuesto, la diferencia de riesgo se puede estimar de
forma direct¡\ a partir de la tabla de 2 x 2 que describe los datos. con lo
que la regresión lineal, cuando se tienen datos binarios sencillos, resulta
innecesari¡l. El modelo de regresión, sin embargo. se puede extender
filcilmente para ¡lcomodar muchas variables adicionales y es ahí donde
~
~, radica su ventaja. Si se hiciesen diez observaciones más por cada sujeto,
..~
rcprescntando diez f,lctores de confusión, podría controlárselos simple-
mente ¡lñ,\diendo al modelo lineal una cantidad tan pequeña de términos
como diez, que corresponderían a los diez factores de confusión citados.

, ~~~

}~~~;:i~;:t~;;::.. .::.

,.;:~~~je:
.;~

~
~~ lh

37.: EPIDEMIOLOGIA MODERNA

Sll colllrol ~imullilne() por medio de la eslralificación, por el contrario.


rcsullaria dificil. porque requeriría un minim() de 21°, o sea 1.024 estra-
I ()s.
l:n cl müdcl() dc rcgrcsi()n. 1:1inlcrprclaci()n eridcmiülógica de] coefi- 1
t:il:nI t.' ul:rcndc (1l:1 lip() uc Ual()s. Si. p(lr l:.il:l11pl(l. sc arlicase lin modelo
Sl:lll.ill() dc rcgrcsi()n hinari,1 :1 dal(ls dl' <.:as(l-conlrol con fOrmal() de
1:1¡.'1:1(It.' ~ ). 2. (1(1C(lrrl:SpOlldcria a la uifl:rcncia dc proporción dc casos ]
: t:()nl r(llc~ c x rlIC~1 ()s. E~lo~ \'alorc~ posccn roca inlerpretación epidc-
nliol()!!ica inhcrcnlc: a parlir del müdelo. no se puede oblener directa-
mcnlc 1:1mcdida de interés. la ra7.()n de venlaja, y de ahí que para datos
dL' cas()-conlrol el modelo resulle inapropiado.
111Cillso cuando la re!!resi()n hinaria sencilla se aplica al tipo apropia-
U(I Ul' dalns. cxi~le Ull;t ()h.icción tel)rica C()nlr¡¡ su uso. La incidencia
:lclll11ulada licllC: lin ran~(l leóric() que \'a de O a 1. Una linea de regre-
si()n. ~in emhar!:!ü. carece IcóricamenlC de límiles. En consecuencia, es
pt)sihll' que lin I11(lucl(1 dc rc~rcsil)n pudiesc dar estimados de la inciden-
1.
CI:I aclll11ulada quc caycscll fucra dc su rango teórico. En la práctica.
r:lras \'CCC~ c~lar¡in los eslimados de la incidencia acumulada muy por
d~ha.i(\ dl: cer() (I por cncima de uno. ~' en todo caso sólo por combina- ...J
.t
Ci(lnC~ cxlrcl11a~ de los \,al()res de las \'ariables independientes. Cuando .4

CS() ~uccdicsc. e!' razonable suslituir lales estimadores inadmisibles por el


\'alor lc()rico m¡iximo o mínimo. según el caso.
I\UI1qllC la cil:ld:1 oh.icci()n lcóric(1 no sea un impedimento serio para ,
i
cl US(\ dc la rc~r<.:~il)n hin;lria con dalos dc seguimiento, ha motivad() la
\llili7.acii)n dc (llrO~ l11ouelos que carccen de esle problema. Lo único que
st.' nL't:c~il:1 cs Iransfor'11:lr lina variahle rncdid.1 en forma de proporción,
Ul' l11:lnl'ra quc 1.1 \'ariablc transform.ida leng3 un rango teórico de
I11cno~ infinilo a I11¡i~ infinilo. en lugar de desde cero a uno, Dicha
,
Ir¡\nsf()rm'ación ~l: ruede rcaliz(\r el1 dos elapas: si }' es una proporción
-;:~
l'(ln lit) rango enlrc () y I. }../( I -}'). a lo que se conoce como «venta.ia»
dl: }... rosec un rango enlre cero e infinito: el segundo paso consiste en
h;lll:tr el logaritmo de la venla.ia. In [ )./( I -}')], que tendrá un rango
L"llrc mL'no~ in/inilo ~' más infinito. El logarilmo de dicha ventaja de }' se
l'()nt)ce como «Iol!il». Un modelo lineal con e] «lo2il» como variable
dcpl:nuicnle c!' un~a simple variante de la ecuación [ 14.1 ]:~

}"
111
= a() + al ).'1 [14.3]
J -}'

Sr I r¡II.1 dc Ul1 m()dcl() de regrcsi()ll de la dependencia de \Jna proporción


c~rerada () probabilidad de }.. sobre '\.1. Con variables independientes
.ldici()ll:lle~. 1., ecuaci()n [ 14.3] puede ser rácilmente ampliada. Se la
rllcde rccscribir cn rorm.\ logislicu como:

(,"" +al.\"

)' = .
,,;;-":j--;;-;T ---,,-Ion+ol.\:tl
[14.4]
+ (' 4- (

:~
;~~'
.4-'..

ANALISIS MULTIVARIADO 325

quc e~ algehr:.1icamcnte identic:.l a la ecuación [14.3]. La [14.4], amplia-


(1.1 <.:()n variahlc~ ilt<.1ependienles :.ldicionales, conslituye el modelo de
rt.:!.!rcsii)n /tJ,l.'íxfil'll 1IIIi/fir/I',
I.a c.lCfilliciól1 c.lcl «I()gil» a~cgura quc cl valor de y e~tari1 siempre en
L'I rallg() cltlrc I:t.:ro y tIno. sin quc importc cl valor dcllado derecho de la
I.'cuacii)lt 114..\ I. I~sta rc~lriccii)n impuc~l,t a la variable dependiente
rllctlc scr ~nlclttli<.1a como una vcntaja tlcl modelo 10gistico, aunque
(It.:sc.lc ~I punl() c.lc \'i~ta pr..1clico e~ secundaria.
EsiC moc.lclo logistico po~ce igu:.1lmente una implicación importante
tlt.: c~lra ;1 la ilttt.:rrrclaci()n tic ~u.c; coeficienle.c;. Si la variable indepen-
(licltl(.' I.'S hilt;lri.1 ,v sc 1:1 mi(lc I:om() I =CXpIIC.C;tO yO=no-expue.c;to.
'1 11.1 l:orrt.:sp()II(lc :II :11!:!()rilm() c.lc la \'Clllaia tic cIlfcrmedad entre 10$
It()-~Xpll(.'St()S ~:'

:"!,1

Clo
(I() = In
[ 14.5]

tlOl1dc ("In indic:l cl rie~go de enfermar entre los no-expuestos. El10garit-


m() tle la \.ent~lja de enfermedad entre los expuestos es ao + al, con lo
l)liC {I I se corre~pol1de con la diferencia entre los logaritmos de la ventaja
tic l:l1rCrnl~lr o. cl)lii\'~llel1tcmcnte. con ellogaritmo de la razón de venta-
.I~I.

(/ = In rCII(1 -.SIo)l [14.6]


L Clo( 1 -CI1 J,

Por lo tanto. el Llntilogaritmo del coeficiente de una variable indepen-


diente binaria 011 en una regresión logistica constituye un estimado de la
rL1Zi)n de ventLljLl. Si los datos son de incidencia acumulada, la inter-
rrctLlc;il)n ue UiC;i1LIrazón de ventaja está sujeta a todas las reservas que
SOI1 i1abituLllmcntc de Llrlic~lci()n cuando se usa una razón de ventaja con
datos de incidenc;iLl acumulada (\,éase Cap. 6 y Tabla 6.1).
m
Puesto que el modelo logistico puede suministrar estimados de la
gj
r~lZÓn ue venlaj~l. se le puede ap1icar a datos de prevalencia o de caso-
control y obtener medidas epidemiológicas de utilidad. En tanto la
regresión binaria lineal no transformada producia resultados epidemio-
I()gicos interpretLlbles sólo Con datos de incidencia acumulada, y daba en
I.'SCC;LISOun estimLldo de únicLImente la diferencia de incidencias acumu-
l;1d;ls. 1.'1mouclo ue regresión 10gistic~1 resulta útil para un gran número
dc ;lrlic;~lciont:s. ;I sLlber. Llquell;ls en l~lS que la razón de ventaja es de
illtcrcs I.'pidcmioli>gico. Esta convenienciLl del citado modelo 10gistico
I.'S mucho más importante que la conveniencia teórica que motivó su
~ desLlrrollo.
~ l~emos visto que la transformación logistica, al cambiar el rango de
1:1variable dependiente, cambiaba simultáneamente la interpretación de
I(>s cot:fic;ientes del modelo, lo que hace resaltar también la utilidad del

r-1
U

~~

;ii~~.
1\
;~~:;~~\\~\~:

~-

..,
32r; EPIDEMIOLOGIA MODERNA

mismo. La transformación posee otros aspectos concomitantes, sin em-


bargu. que imponen límites a su utilidad y que deberían ser siempre
Ile\.ados en mente por el investigador cuidadoso. Supon~amos que en :1
\'CZ de con una variable independiente binaria, el modelo logístico se
aplica~e con una variable independiente ordinal () con una continua. Un
c.icmpl(1 podría ser aquélla que indica~e la conducta en relación al hábito
de fumar. con la variable adoptand() los valores de O. 1. 2. 3 y así
slICesi\.amcnle para del1otar el nllmcr() de paquete~ de ci~arrillos fuma-
c.!()Sal dia. El cocficicl1le p,lra 1:1\'ariahlr fun1ar reprc~entaria la c,lntidad )
iI1L"rCI11l:11Iilldcl «I(lgil) qllC corrcsril11dc ;1 \in camhi(1 i.J!U;ll ;iI¡\ unidad
lll' 1;\ \.:Iri:lhll: i,IOCrCI1OicI1IC CSil) cs. cl il1rrCmcnl(1 ocl «llI~il» ror cada
r;I(IIIClc ;lllicim1¡11 fUI11:1c.!<1 p<)r c.!i:1 .1:1 al II il()~arit'u<1 dcl cocliciclllC se
inlcrprcl:¡ c()m() la ra7.()11 c.!c vCl1ta.iil quc c.!cscrihc la tasa de enfcrmcc.!,ld.
:1 CU:llqllier l1i\'cl d(lO() dc hi\bil() dc fumar. Cll relación ,\ la tasa corre~-
r()I1c.!iCI1IC a f\lmarse \111 paqucle menos tll di:1. En el model() esta inhe-
rCl1ll. lJIIC cada uI1ic.!ac.! adiciol1al dc incremenlo de la variable indepen-
]
diel1le o cada paquete adicional fumad() al dia. multiplica a la razón de
\'cnla.ia. o equi\'alenlemenle a la tasa de enfermedad. por un factor 1
collslanlc. Por lo tanlo. se~ún el modelo (véase Fi~. ]4.4) cada variable .

..
,t
}

i ~

f;-i~, 14.4. EII (,1111(}(/('1(1 1(},!!:;,\'li('(1 ,\,(' 11all(1 illlplíCil(1 un(1 re/ación e-'\'pollellcia/
('III/'(' 1';"('1(',\ (1(' c.\.,,(},\'i('i(in l11Iílli,,/(',\' .1' ,.ie,\,.~(1 d(' l'1!ft'rmedad,

"'1
, t
.~

'.
;~~

~~jj¡:
;~~;.: :~~¡~,

~
;'.;1',:

~i¡il
;:'.{:~~ft;~;

AL
111~ ;l~rg~~r~~~~:~:f:'

~~:.~:.-.

:':":1

ANALISIS MULTIVARIAOO 327


-'j

illdepelldiente medida en más de dos puntos describe inherentemente


~11l.1relación expone.nc~al ~on la frecuencia de enfermedad. Tal patrón
Inhcrentemente multlpIlC3tlVO es una servidumbre importante del mode-
I(~ logistico (Greenlund. 1979). Raras veces va a querer un investigador
aJu~turse ~ un mo.delo en el. que se 3SU.ma automátic3mente que las
van.1blcs Indcpendlcntes contInuas u ordlnales poseen una relación ex-
rollcllciul con 1.1ellfcrmedad. Por fortuna. se puede esquivar el problema
Jl:fi/licIlJ() :1 Jich:ls \'Uri.1hlcs illdcpcndiclltcs como hinarias: esta estrate-
!:tia sc discutc cn lin.1 secci()n posterior. «Diseño de modelos multivariados
rara re.1lizar il1fcrcltcias».
Una limitacil)lt Jcl modclo logistico múltiple. relacionada con la
~ allterior y qlle IlO se puede esquivar con fucilidad. es la relación multipli-
~?J
<.:ativu que cn cl moc.lelo po~cen unas con otr3s las variables independien-
tc~ ~cpar.lda~. Plie~to que cada una de ellas contribuye a una suma que
}1 ~s 1:1 logaritmo de 1.1 ventaja de enfermedad. las diferentes variables del
Í'J modelo tienen entre si una relación multiplicativa respecto de la tasa
de ocurrencia de la misma. Tal relación multiplicativa equivale a asumir
que 1.1medida del efecto de un factor dado. expre~ada en forma de razón.
a es constanle a lo largo de las categorias de los demás factores. Esta
asunción pudiese no resultar un handic3p serio -en rigor. es una asun-
ción que se hace con frecuencia en el análisis estratificado- pero a
diferenci.1 de éste. el modelo logístico no permite evaluar dírectamente si
rcsult.l adecuado rc.1Iizarla. La asullción multiplicativa puede ser evalua-
da cx:tmin~IIlJo la magnitud de los coeficientes de los términos que
rcprCSCl1tall rrOd11<:to de dos variables independientes en el modelo. Una
I:Villt/i/t:ic;/t nl:is llirccta tic lit mcdi(lit ~n l!tlC sc ticnc en pie la asunción
multiplicativa. resulta posible utilizaltdo cl modelo de riesgo relativo
generalizado de Thomas (1981}, que enmarca al modelo logistico en 00
,
'.

cuestión en un modelo multivariado más generalizado y capacita al ~


investigador para comparar 13 adecuación de las asunciones matemáti-
cas de una amplia gama de modelos especificos, de los cuales ellogistico
;,
no es sino uno más. I!
;'
Represente o no la asunción multiplicativa inherente en el modelo r:
;;
logis\ico un.l descripción matemática adecuada de los datos, la evalua- <:
.
.

m cil)n de una interacción biológica (en contraposición a la estadística} ~


"
:o
entre factores. en un modelo logistico, está complicada por la naturaleza
multiplic3tiva del modelo (Greenland, 1979). Este tema se discute en el
~ capitulo 15.
Vale la pena hacer notar que para datos de casos y controles en los
que los datos de exposición y enfermedad son dicotómicos. se puede
formular una regresión logistica teniendo como variable dependiente ya
~ea a la enfermedad o a la exposición. Si es la enfermedad, el modelo es
matemáticamente idéntico al utilizado para estudios de seguimiento
( Prentice y Pyke. 1979). Si la variable dependiente es la exposición, la
~ presencia de enfermedad debe ser incluida como variable independiente,
y el estimado de la razón de ventaja se obtiene como el antilogaritmo del
coeliciente del término de enfermedad en el modelo (Prentice, 197~~Por
~

I.
::.~¡~:}¡

'.-:~~] ¡~~.:¡~\;
32P EPIDEMIDLOGIA MODERNA

r
10 1!cncral. eslos do.c; abordajes son más o menos. si es que no exacta-
mcnlc. cquiv.1Iellle.c; ( Breslo\\' y Powers. 197H), Resulta generalmenle más
1 ~
r:icil uliliwr a la cl1rermedad como variable dependiente, porque este
(
IlICtod() pcrmilc la evaluación dcl crccl() de divers.l$ variables de exposi-
ri()11 dirL'rcntcs cn UI1 nlism(\ 111()dl:I(\ ~. rllCdc rilcilmcnlc d.1r cabid.1 .1
L'XI')osici()ncs medid~l.C; con más dl: dos c:1lc~orias.

F.llllfl(l('/fl (1(' rj("\,,f!(),\' "rf)!,()r('jf))1tllc

L()." modclo.<; matcmáticos descritos en secciones previas corresponden a


.tn:ilisi." ell lo.<; cualc.<; loS datos se pueden resumir a modo de frecuencias
dc lílhla." de contillgel1ci.l. Si el modelo e~t{1 adecuadamente definido. los
:111{llisis dc I.1 r.1Z()11 de VCl1títj.1 has.ldos en díttos de tabla de contingen-
ci:l. <!lit' .<;c prCSCI1I:lroll CI1 anlcriore.<; carituloS. rueden ser todos ellos
clcrtalllcntc rcformul¡ldos cn término~ logí.<;tico." con idénticos re~ullado~
(CJart. 19711. No ob~tantc. lo~ modelos logisticos sólo se pueden utilizar
COII d:lto.<; dc frccucncia: p.\ra formular modelo~ matemáticos que ~irvan
C(1ll dal()S tIc las:l~ tIc iIICidcl1Ci¡1. CI1 loS que los denominadores son
t1lcoidas dc pcrsoll:l-ticmpo ~. no frccucnci¡ls. se requiere un abordaje
oislinto.
lin método 11:1con~i~lido en utiliz¡lr como variable dependiente. en
un t1l()dclo dc rc~resión linc¡tl. 1.1 cantidad de tiempo transcurrido por
cad:1 ~u.icto ha~ta el acontecimiento de interés. o alguna transformación
dc dich.1 cantidad. L:1 principal dificultad de este abordaje directo está
cn <.JUC.cn la mayor p.lrte dc 10." estudioS. 1¡1gran mayoría de los su.ietos
~Oll arartado~ dc la oh~erv¡\ción antcs de que desarrollen el citado
acontccimienlo de interés. ya ~ea porque el e~tudio finaliza. el seguimien-
1(, del illdividuo se pierde o el individuo muere por otra causa. La
f!cncr.tlizaciól1 dc modeloS de regresión ordinaria. a utilizar con datos
fucrtcmente cen~urados, re~ulta problemática ~' plantea dificultades com-
putacionales (Brc~lo\\.. 19791. El aborda.ie es apropiado si casi todos los
~u.iclos desarrollan el acontecimiento durante el periodo de seguimiento.
Un método más flexible ha ~ido el plal1le¡ldo por Cox ( 1972). quien
propus(' un modelo de regresión que predice como variable dependiente
1:1 ra7i)n de ta~as de incidencia y en el cual ~e evalúa la probabilidad
c('11oicil'l1almcntc al cI'n.iunto de ~u.ictos que pcrm.lnccen ba.io ob~erva-
ci()11 tr¡l.<; la ocurrenci¡\ de cada caso. Este modelo se conoce como el
modelo de los «riesgos proporcionales», porque se asume que la razón
de t.IS11~de incidencia (entendiel1do la tasa de incidencia como riesgo) es
constantc a I(, largo dclticmpo -e~ decir, los riesgos son proporciona-
Ic~ * En la rorma en que se lo propuso originalmente. el modelo es
inherel1tcmente multiplicativo. como el logistico. con el que se halla~

.E~t;1 1!1,Cji)l) dc «rjc~!!o» cs. c()m() sc VC. 31!!() djrcrcntc a la que sc mí\ncjí\ con cl
lI()mhrc ((rj~k» el1 mllch()~ tcxt()~ dc erjdemi()I()~i;¡. En in!!Jcs. 1;¡ conrllsiól1 no es rosiblc.
ror cl II~O dc do~ r:'I:lhr:ls distillt:l~. «risk» y «hnz:lrd». ( "'. dcl T.}

I
i~

~$~tJ:1:..

~
,;:~::;
:\ft~~i\~\;~~:

;rf~~~ !~~I~I
~!
ANALISIS MULTIVARIADO 329

rcl~lciol1ado de form~l muy cercana. La construcción e interpretación de


los 1érminos del modelo son fundamentalmente las mismas que las del
modclo logistico. EI1 rigor, cuando se agrupan en intervalos los tiempos
dc los acontecimientos, dicho modelo logistico se puede adaptar a los
d~ltOS y producirá frecuentemente resultados casi idénticos a los que se
()hticl1cn COI1 cl an~ilisi~ de riesgos proporcionales {Abbott, 1985). Como
~ucedí~l COI1 el primero. este segundo modclo se puede incardinar en un

] l11odelo de riesgo rclativo gener~llizado (Thomas.


Nclder. IYR3) lo que permite evaluar la ~lsuncíón multiplicativa.
J981; McCul1agh y

I\parte de las limitaciones mencionadas antes para el modelo logisti-


1 co. una dificult~ld que tiene el de los riesgos proporcionales es que
rcsult~1 oner()s() ~!l térmil1os de c:ilculo en relación con estos modelos
11111Itivariad()s. rUCS!O <.Juc 1~1evaluación probabilística es complicada y
11ay quc iria rCpilil.'!lÚü para un numcro grande de subconjuntos de los
datos. Par~l conjul1tos de dalos de seguimiento razonablemente peque-
li()s. del tipo dc los quc con frecuencia se encuentra uno en los ensayos
~Ií!licos. 1~IScomputaciones no plantean dificultades serias a una compu-
~ lador~l de ~llta velocidad. Howard (véase la discusión de Cox. 1972) ha
rropucst() un .1lgoritmo recursivo. que h~l sido modificado por Gail el al.
( 19H I) y que reduce considerablemente el número de cálculos. Incluso
<.:1)11 cl algoritmo recursivo. sin embargo. el modelo de riesgo~ proporcio-
,-

n¡llcs rodria 110 ser pr.1ctico o factible COI1 el equipamiento de computa- ~-


.,.
..-

li(\r:ls lit: quc sc disr()l1e l1uy día. dados lo~ grandes conjuntos de datos ¡:;
~,.
<.JUCS()11<.:1)1111111I.'S ;1 ~sle nivel en los seguimientos epidemiológicos rela-
<.:ionados ~UII 1.1ill\"cslieación etioióeíca. En circunstancias así. una alter- ~:

11ati\.~1 r~IZOI1~lhle cs ~lg;upar los d~ltOS por periodos de tiempo yjo edad.
l.:oI1siderand() .1 1.1 vez un modelo logistico condicion~ldo segun las
Jivers~ls c~llegorí~ls temporales YlO etarias. pero no segun los muchos
subconjuntos Je individuos que permanecen bajo observación en cada
runt() en el tiemp() (Breslow. 1979: Abbott. 1985). Sí. como se espera,
continua el progreso tecnológico en el equipamiento in[ormático, el
tiempo y el coste de los cálculos que se precisan para adecuar a un
~ nllmero grande de datos un modelo de riesgos proporcionales puede que
t1 pronto resulte de poca importancia.
El müdelo que nos h~l ocup~ldo es uno de entre una variedad de
métodos que sirven para estudiar datos con problemas en el eje tempo-
r.11. K.1lbncisch y Prcntice ( 1980) dan una excelente descripción de estos
mé!oJ(}s.

,\ f (Id(,/(1,\' fl',!,'-lill('(II(',\"

~ Los modelos log-lineales están también intimamente relacionados con


los modelos de regresión logística. Se trata de modelos útiles para tablas
~
de contillgencia que poseen un eje o dimensión correspondiendo a cada
variable sometida a estudío. El logarítmo del valor esperado para cada
L'clda de una tabla de contingencia multidímensional así, se predíce

~~~;~:.;:: ~~~;:.i~ -~
.,,1

c~*: ,,;-:-¡~.~.
33(1 EPIDEMIOLOGIA
---~-
MODERNA
J
com() Ull:1 ful1cii)11 lincal a buse de tcrmil1os, Dichos términos correspon-
dcn a cílda variahlc dc la labia mullidimensiol1al, al tiempo que existen
\'ari:ls comhinacioncs de \'ariables represenlando los correspondienles
Icrmillos dc iIIICracci()t!. Los lolules marginales de la tabla multidimen-
si()I1¡11prororcional1 rcslricciol1es a los \'alores esperados que se conside-
r¡111adccllados r~lra 1~lsccldas,
( ()II cl modcl() arroriado. esrccific~ldo en el conlexlo, de predictor
hillilri() \' v:lri:lhlc~ dr rcsull:ldos. 1:1SOlllCi()11 de máxima probabilidad de
IIII III()(I~I() 1o'J!.-lillc:11 scril idcnlica a la solllción de máxim~1 rrobabilidad
ll\.' I(IS \'al()rcs c~rcrad()s rara la eslim(lcii)n de la razón de venlaja In"
t.('mlln CI1 lit! <:onjllt!l(1 de lahla~ dc :! >< 2. de la manera que se describía
cn el carillll<" I.:.: El cslimad<" de m~iximil rrob.lbilidad de la razón de
1¡;
vl.:nt¡l.i:1 rllcd(' ohlenersc a rartir dc los valores esrcrados de celda del SU
nl(IJ\.'I(1 1(,~-lil1cill lil1¡1 \'c'/. :Idccllallll, ,iIISI(1 l"(lm() ~C Ilacía a parlil dc loS
\¡II()rcs lambicll adccllado~ qllc eman~lball de la ecuílción [1.:.,25], Más
al In, lin m()dcll) de regresiót! lof!istica aprori(ldamenle especificado dará r,\
lambién los mismos reSUll~\dos, Todos e~los mélodos son reformulacio- I.c 1i¡
I1Cs matem:itica~ de un mismo modclo sut1yacente. el de una razón de
vcnla,ia qllc es con~lantc a I() larg<" dc la~ cat.egorias de uno o más
.~Il
f:lclores distintos: es un modelo mulliplicativo porque conforme cambia m
lit tasa dc los n<,,-expuestos. la tasa de los expuestos debe multiplicarse
ror lil1 faclor constante de cara a que la razón de tasas de .incidencia, o 1~
1¡1 ra7()n dr \'Clllaia. seall i!!lialmentc cOnslantes.
l(,s modelos iof!-lincal~~ han sid<" rorlllares enlre lo~ estadislicos
!)()rqlle ()frecen lil1a esrecie de ncxit1ilid¡ld cstadistica: 11<"exislc esrecifi-
l"ilt"í()11 (Ir Ul1a \'ilriat1lc dcrCI1(licJlte ~. ()lr(1 <:Oll,illl1t(' d(' \'uri~lhlc~ illdc-
rl.:l1dic:IIIC:;. ni d\.. lil1¡\ cnfcrlllC:d:ld ~' lilla \':II iablc: dc cxrosicil)n todas I S(

las \'ari:lbles sc tratan de mot!o eqlli\'aJclIle como comronenles del , :q

mot!clo ., Aunquc estc lrutamicnlo ecuménico de las variables ofrece a


lin¡¡ orortunidau de explorar las maneras en las que un factor que actúa
conflll1diendo ~e relacion(1 con otro que también lo hace, así como con la
I~
cxpo~icinn. poco~ epidemiólogos verian en esto una venta.ja, Los análisis u
cridcmiológico~ eslán centrados. generalmente. en una interrelación es- !\
rc<:ifica de las variable~ ~' si no lo eslán. probablemente deberían estarlo,
l:na dc~\'enta.i(1 que sc ha citado del modelo 10g-lineal es que incluso I~
e
\'ari:lhlc~ conlil1ua~ deben ser categorizadas para presentarla~ con for- d
mal(, de tablas de contingencia. en tanto un modelo de regresión logís- I r
tit":1 rlledc dur cabida a vuriables predictoras discretas o conlinuas, No
[
('¡'lstal1lc. esttl limitacii}n n<" es grave, rue~to que como se argumenta en r
1¡1 sC:l'ci()n si[!uicl1le, «Di.c;cil(1 de Modelos Multivariados para realizar
Infcrcl1cia~»,~la calegorizacii)n de variables continuas es frecuentemente I~
dcsc¡¡hlc inclll.C;o en modclos lo!:!í$ticos de regresión. El mayor inconve- r
nicl1lc del modcl() log-linc(11 e.l; el mismo que tiene el modelo logístico
dc rcgrc~ión .~I .c;aber. Sll inherente (1suncíón multiplic(1liva,
n~

:::~l~!~.
,.,;o.
"",..
:~~".fij:;;.*: .: ,

-~I.
l ANALISIS MULTIVARIAOO 331

.\ 1 ( 1(/('/( 1,\' 1111//' ;!'(ir ;,1(/(1.\' f1l1 r(1 ('.V, 11(/;0.\" d(' ('{1.\,(1-('(1111r(l/ OfJ{lr('(I{/OS

1:1 :11\;ilisis ti~ tlalos de c.\so-conlrol .1pareados requiere habitualmente


4u~ sc controle. cn t:1 ani1lisis. la confusión que los factores de aparea-
11\i~nto introdu.icrol\ en el proceso de selección de sujetos. Los análisis
~spcci.llizados discutidos en el capitulo anterior son. de hecho. simple-
111~nlc lécnic.1s tic eslr.1tific.1Ción aplicad.\s a datos apareados. en los que
] <.::Illa l:()I\junto apare~ldo constituye un cstr.1to único del análisis. Una
i,llrtlrlal\tc limil(lci(ll\ lfuC posce cl (In(ilisis ~lparc.1do mediante cstratifi-
'"i1 L.:I<.:i(ll\ ~s tltlc. pllr III !:!cncr:11. n() rcsllll.1 aplo par(1 contrOI(lr 1.1confusión
\)rll(ltl<.:i(I;1 Iltlr I1I1 r:IL:I(lr (III~ 1\(1 s~ ha ap~lrc~I<.1o en la selección dc
'111l:lcl". I..~I:I lilllll;ll"illll 1)IIt;tit; ,llrt:rarst: ~mplc~lndo mo<.1clos multi\,a-
rl;ltlt IS.
( .\)II\t) 1.:11Itls L"slu<.1i()sti~ t:~lS(I-Colltr(11 cl p~lri1111ctro dc interés es la
r:ll()I\ dc \"~I\l~lj~l. ~1111()<.1clomlllti\-aria<.1o pertincntc es el modelo logis-
I it:t) y ,lIS gcncr~lliz~lciones (Thom~ls. 1981 ). ~1p.1rtir de los cuales puede
't:r ~slim~I<.1~l f~i(,:ilm~nle dich~l r~lzón de ventaj~l. Si los únicos factores de
:lrart:amicnlo SOll v~lri.1bles con ~ólo unas pocas categorías. el modelo
mlllti\.ariado ~c puetlc construir incluyendo como varíables independien-
Ics <.leI mismo lérminos que correspondan a estos factores. y el aparea-
mit:nlo s~ri1 relcv.1nte p~lra el .1nt.\lisis sólo en la medida en que toda
v:lriable ar~lr~~ld~1 I.'n la ..'e!eccíón de sujetos debe ser incluida en el
m()<.1t:I(). L;.lS \'~Iriables de confusión ~ldicionales que no han sido apa-
rt:aJ;ls cn la seie<.:ciLln de suje1os pueden ser añadidas también al modelo.
Si los t¡lctores de apare.1miento son variables con muchas categorias.
sc pl~lntc~l un problema porque el modelo se aproxima a la situación de
lfu~ hubicsc un lérmino por cada conjunto apareado. Esta situación es
al\~il()g~l ;1 un ~ln~llisis estr(ltific~ldo que tuviese un cstrato único corres-
p(ln<.1icndo ~1c~lda conjunto ~lpareado. Recuérdese que la estimación de
mi1xima prob.lbilidad de la razón de ventaja no puede llevarse a cabo en
Ull ~lni1lisis eslralific.1do si cada conjunto apareado constituye un estrato
sep~lr.1do utiliz.1ndo el (lbordaje no condicional de dos binomiales inde-
pen<.1ientes (fórmulas [12.22] y [12.24]), porque el procedimiento de
cstim(lci(>n da lug.lr a un sesgo sustancial cuando los totales marginales
tic c~ld.1 cstr~lto son pequeños. El sesgo se elimina. no obstante, condicio-
1\.lndo la estim.1ci()n a ambos márgenes de cada tabla de 2 x 2 (fórmulas
112.22] y r 12.23]). De modo similar. sí el número de términos de un
11\()<.1elo mullivari(ldo se h.lce grande en relación con el número de
suj~tos del ;.lnillisis. como ocurre cuando se introduce un término separa-
do para cada conjunto apareado. la estimación de máxima probabilidad
no condicional se ses2a. El modelo IO2istico 2eneralmente se adecua
mediante un procedimiento de máxima p~obabilidad. que es esencialmen-
lc la contr.1partida del procedimiento de estimación no condicional
cmple.1do en un análisis estratificado. A pesar de todo, es posible cons-
lruir un modelo logistico en el que los coeficientes se estimen por un
procedimiento de .1decuación que es también la contrapartida del méto-

~
,
:~,~::; :,;:; :
$.
;~~.
X:~I~1~
3 ~.

.).
EPIDEMIOLOGIA MODERNA

ti(, t'()lltiicional tic e~lilllaci()n dc rn¡ixima probabilidad de la razón de


\.CIII¡I.i:1 ( !>rcnticc y lircslo\\". J l)7HI, I:~I¡1 cslrllclllra condicional e~ rnate-
111¡ilit:¡1111Cnlr ~imilar, allnlJlic no t(\11 complic¡ltia. al modelo de rie~gos
rr(1r()rciollalcs dc (-O\ ( 1972). CII t:1 cll:II la cxpcricncia de ~upervivencia
lil' IIIl !!rllp() ~e m()dcla c()lldiciollaln1cl1lc a Jo~ que ~obreviven en cada
rlllllt' dcl tiemp(' somctid(),c; a ()h~er\'~lci()n, Com() sucede con el citad()
In('(lrl(1 (Ir rics!!os proporcion~llcs, 1¡1 aliccll~lci()n dc I~I rcgrc~i()n logistica
l't'llliic:i()nal plll'lic acarrcar cOmplll¡ICi()nc~ ~I !!1'~ln c~cal~l. pero el rnét()-
lil1 pcrmilc <.Iue los d~llos dc ca,c;('-conlrol apareado,c; sean analizados con
L'I Ilccc'C;ario cOlllrol de los f~1Clore~ de ap.1rcamiento. así corno el control
<.Ic lo,c; faCI()re,c; dc confusión adicion~1Ie~ por los que no se apareó, El
.11~()ritmo recllrsivo de Gail ('I al. (l9RII reduce considerablcrnente la
t'ar~:1 cornplllacion.11. \\:~1Iker (19821 h.1 hech() notar que el rnodel()
II ,!-!:isli<.'(' c:()nliit'i()11:11 ~. cJ mo(lcl() (1(' ric,c;!!os proporcionale~ ~on tan
"illlilarl's <.111<.'I()S rr()!:!r;llll:IS Ol' t'()IIIPIII;I(\('r;¡ qllc ,c;irvcll par(1 lino se
1'llrJcn lililiz~1r para cl ()lr(l,

I (1(1(,I(}.\ (It .i('.~.f!(1 /,('/(II ir(1 .l'('/I('/,(I/(',\"

Th()mas ( 19R I ). al comprobar la similitud de las ecuaciones de probabili-


dad csladistica~ que se usan para los análisis apareados de caso control,
p~lra los de regresión logística múltiple ~. para el modelo de riesgos
proporcionales propuest() por Cox. ha desarrollado un modelo más
general basado en medida-" del erecto expresadas en forma de razón. que
suhsume estos ~. otros modelos. Su modelo general permite comparaci()-
nes entre. por e.icmpl(). modelos aditivos versus modelos multiplicativos
del riesg() relativo. creand() mezclas de los modelos con formato de
modelo general y eValUaJld() la contrihución relativa de cada componen-
te dc la mezcla. \\ialker ~. Rothman ( 1982) describieron un método
sencillo par~l elegir entre un model() de riesg() relativo aditivo y otro
multiplicativo. Con el m()del() general de riesgo relativo. no obstante.
I'\tll'llcll .Idccuarsc. mc7.clarsc ~. compararse una gran variedad de m()de-
Il)S m~ltcmütico-" específicos dcl mismo. Esta metodología supera muchas
de la-" limitaciones inherente-" a los modelos multiplicativos y es por ello
una notable ampliación de las opciones disponibles para el análisis
epidemiológico multi\.ariado.

DISEÑO DE MODELOS MUL TIVARIADOS


PARA I{EALIZAR INFERENCIA

L.I fil1alidnd habitual de los modelos multivariados en el análisis epide-


mi()I()f!ico es pcrmilir la estimación de medidas epidemiológicas del
erect(). al ticmp() que se controlnn eficientemente diversos factores de
C()llrusi()n, Los modelo,c; multivariados rueden emplearse también para
\'alorar una intcracci()n: esta aplicaci()ll se discute en el caritulo 15. La

~~:
:!¡t:i~~~i~ ~~~}~¡:
\;f\~1~\~f\\\1
--'--' ;;,,-- ..,.;;;..:.;
;..~~~ :

l ANALISIS MULTIVARIADO 333

v:lriahle dependiente generalmente es un término indicador, esto es, una


variahle binaritl con valores posibles de cero o uno, que denotan la
catcgorizaci()n de un sujeto dado Con respecto a unt\ enfermedad. La
\'arit\hle
l:1 modclo de como
exposición y todas
variables las variables o de
independicntcs confusión se incluven
predictoras. . en

Unt\ variahle de un t\n:ilisis epidemiológico no corresponde. necesa-


riamentc. a un término único en un modclo rnultivariado, Se requiere al
mcl1OS uno p('1r ctldt\ vnrit\ble. t1unque t\ veces hacen falla varios. El tipo
m:is simplc dc variahle cs una dc cscala nominal que tuviese sólo dos
~] I.:atcgorít\s. talcs 1.:01110varón y hcmbra. Una variablc tal se incluiria en
lln modelo rnultivariado corno un término tlnico: una variable indic3do-
ra que tu\'iesc val('1rcs de tIno y cero que correspondiesen a las dos
] L':ltc!:!wias scri:l. pIICS, Itl rcprc~el1ttlCiól1 numéric3 de la variable «sexo»
l:O dicho m()dclo multivarit\do, Consideremos ahora una variable de
~scala nomioal c()n tres categorias. talcs como blanco, negro y oriental
tllle. ilnicamcnte :I l:fectos del ejemplo. t\sumiremos que son categorias
rnutuamcnte cxclu)'entes y colectivtlmente exhaustivas, No es apropiado
~l~ignar vtllore~ numéricos diferentcs a estas tres categorias e incluirlas
c()mo un si)lo término, Como las tres categorias no representan aspectos
cuantittltivt)~ de Untl sola medida. un término único no permitiria una
tlcscripci('n complcttl del efecto de la variable. Con tres. entonces. se
11eccsitan cn ~I m(\tlelo dos de los citados términos: una de las tres
1.::1
Ic!:!ori~\s. p(\r e,icmpl(). hlanco. dehe de~ignarse arbitrariamente como
c~llcg()rin dc rcfcrcl1cia: los dos términos del modelo son términos indica-
d()re~ que corrcsponden n la presencia de una de las dos categorias no
hlancns, Sup()ngumos que los términos de raza son las variables ,'( I y ,'( 1
y quc i\'1 indica 11cgro y i'( 2 oricntal. Sí el sujeto es blanco, tanto X l
como .\.2 adoptan el valor cero, Sí el sujeto es negro. entonces X I = 1 y
,\': = O. y si el ~ujeto es orientt1\. .'( I = O y i'( 2 = 1. Los coeficientes
adecuados de loS ,'( I y .\'2 representt\n medidas del efecto de la caracte-
ristictl negro u oriental con relación a la caracteristica blanco. Importa
poCO qué categoría se selecciona COmo la de referencia: es por lo general
huena idea. sin embargo. seleccionar una que tenga una gran proporción
de su.ietos, puesto que la e~tabilidad estadistica de los coeficientes del
modell.) ~n relaci¿)n con la vari~\hle en cue~tión dependerá de tal elección
de Itl calegoria de rcfcrel1cía. Si la \'ariahlc tiene una categoria de referen-
Ci~1«natural». cse ~rUro deheri:l Icncr pri()ridad. incluso si no fuese el
mt\yor, Por ejcmplo. al cvalUtlr el rie,c;go de lesión por participar en
acti\'idades atléticas escolares varias. loS que se abstengan de cualquier
t\ctividad forman un grupo de referencia natural, incluso si algunos otros
grupos de la clasificación fuesen más grandes.
En general. si una variabie de escala nominal tiene 1" categoria5,
entonces se necesitan en el modelo 11 -I términos para describir el
efccto de cada una de las 1! -I 'categorías de esa variable en relación a
llnt\ categoría ba$al, Si se incluyen términos índicadores para toda~ las
L':\tcgorít\s. el modelo seria redundante y se tornará imposible resol\'er el
sistema de ecuaciones que da las estimaciones de loS coeficientes sin

Q ."

~~

':~~;.
334 EPIDEMIDLOGIA MODERNA

al!.!\lllil restricción m.\tcmiltica adicional. Las direrentes categorias de


una \"ariahlc dc escala nominal pueden entcnderse como un conjunto dc
\.aritlhles que pucden ser cvaluadas. por separado. en relación a una
l.íltc!!oria de rercrcncia arhitrariamcntc clct!ida: 1(\ que las constituyc
l.('m(1 rolecci()n apartc cs qUl' S()1l n1\IIUaml'l1ll' cxdIJ~'cl1lcs y. por tíll1tO.
11(' il1dcpCl1dicl1tcs. Tc()ricamcntc. la fílllíl dc indepcl1dcl1ciu clltre los
t::rmill()S dl' \In modcl(1 multivuriad(, plíllllCíl P()C(\ prohlcma. íl 11(1scr
quc l1uhicse unu pcrrcct.! corrclaci()11 entre dos de elios (o cntre cualquicr J ¡

tcrmino y cualquier combinación lincal de los dem{ls). en cuy() caso el


modl'I(\ es redundantc. En w práctica. correlaciones muy altas entre dos
tcrminos dcl modelo. aun si la correlacióll no es perrecta, pueden llevar a
una iJlcstabilidad estadistica a la hora de acomodar los coericientes
rclacionados. rcne.iand(1 el dilicil problema estadistico de desenredar los
cíc:clos de dos \.ariahle~ altamente correlacionad(ls.
1\1 COI1!\truir un 1l1()dclo. el primcr paso es dertnir la variable depen-
dicntc. El invc~ti~¡ldor proccdcr¡i a continuación a definir el término o
IL'rnlill(1S dc: cxp(,.'\ici()I1. Lu variahlc de cxpo5ición pucde repre5entarse en
cJ modcl() de rormtl tall sellcill¡1 como es mediante un¡\ variable indicado-
ra llnicu: c~ decir. una \'ariable con valor de uno. 5i el su.ieto es expuesto.
~ ccr(\ cn Ctl~() colltrtlrio. Si la \"aritlble de expo5ición es nominal con más
dc do~ cale!!oritls. dche expre~arsc en el model() en rorma de varios
tcrminos. seglln sc describia en el párraf(, anteíior. Si es ordinal. o un
intcr\'¡¡I(,. es posihlc exprestlrla en e! modelo como un término llnico.
I laccr e~t(\ COI1 \111¡1\'tlriablc ordinal exige a~i~nar punluacione~ a las
calct!oritls. tr~ll1srormal1do en erecto la escala ordinal en otra a base de
il1ler\'tllos. Tal1l() rara una \"ari(\hle ordil1al puntuada como par¡1 una de
i!1tcrv¿llos. el iJl\'e~lig~ldor dcbe valorar si e~ razonable permitir la rorma
il1l1erenle de la curva que se construyc del1lr('1 del modelo. relacionando
la e.xposición )' la medida del erecto que se usaril. Con Ja regresión
1()gisljC¡\. por e.iemplo. UI1 término de expo~ición conlinua e~tará necesa-
ri:lme~llC relacionad(1 de modo exponencial con la ventaja de riesgo de en-
fcrmcdad. dc mtlnera que cada unidad aliadida de exposición multiplica-
r¡i la \.cl1ta.ia ba~al por UI1 v¡llor const¡lllte. que corresponde al anti-
l()~aritmo de! coeficie!1te de regre~ión Iqgistica. Una curva exponencial
difil"ilmel1tc seria ¡lpropitlda. ~.a quc. com(' sc describi(l anteriormente.
cllo implic¡\ritl que ulla unidad de cxpo~ición. por e.iemplo. el duodécimo
cigarrillo rumado c¡lda dia. incremenlaría má~ la ventaja de enrermedad
que cualquicra de las unidades de exposición que estuviesen por deba.io
del mismo. como el octav() o el undécimo cigarrillo rumados cada día.
En consccuencia. el invcstigador debe adoptar precauciones antes de
i!1ci\lir CII \111m<1dcl() multiv¡lriado térmil1os continuos, de intervalo ni
()rdillalcs punluados. tI 11(\ ser quc Icnga una evidencia po~itiva de que la
cur\'a implicita ell el m()delo es apropiada.
Una construcción alternativ.l consiste el1 categorizar una variable de
il1terval() o continua (una variable ordil1al ya está categorizada) y tr¡\tar-
líl com(\ si ruera l1()mil1(\I. il1cluvcl1do en cl modelo varios términos de
cxposici{)IJ. En rril1cipio. esla aproximtlci()11 puede p¡\recer torpe. puesto

~.

~II¡~
.m:~i~~r~;~~~~:;:~1fu~:
"1> "...v , ~,~;
.,
ANALISISMULTIVARIADO 335

llll~ 1:1 illr()rlllaci()11 tic lo~ dato~ sobre cxpo~ición. sca ordenada por
rallgo I) (;olltinua. sc pierde y se necesitarán ahora varios términos en el
m()delo dondc ante~ .~()Io ~e requeria uno. Es verdad que la potencia
l:st:ldistica de una prueba de tendencia que evaluase una relación dosis-
rcspuest.l. incorporada en el v.llor de p adscrito al coeficiente de una
variable continua. se pierde con este método. Por el contrario, la inclu-
si()n de varios términos de exposición permite utilizar la información
acerc.l de cada nivel de exposición para generar estimados del efecto que
no cstcn constreñidos a seguir ningun patrón especifico. La simplicidad
cs algo que en un modelo multivariado se ha visto casi siempre como
mlly descable. pero su lógica interna se basa habitualmente en la adop-
t:il)ll II~ m(){I~llls 1.:1111 pr{)p()sitos prcdictore$ o descriptivos. Cuando se
L.II)rl(;;111 1111111t:111,. I.:CIIII() .!.!t:llt:r:lllllt:lll~ -;c 11:ICCcn cpidcmiologia. para
11¡II.:t:rillf~rt:ll(;i:1 "llhrt: l:1 ral')ci tic r:ll.:tl)rCS cspccificoS. la simplicidad del
Ill()dclo Il() l:S lina IllCt.l importante. PI)r tanto. la inclusión de varios
términos en vez de lino no representa un inconveniente real en lo que a
I.l complejidad dei modelo se refiere. La ventaja de ser capaz de estimar
por separado. sin un patrón impuesto. el efecto a cada nivel de exposi-
ción con relación a un nivel basal. supera las desventajas de este aborda-
je en la mayoria de las situaciones. Cuando hay datos suficientes. relacio-
nc$ de dosis-respuesta complicadas como las que tienen forma de U o
I U invertida. pueden detectarse y estimarse sin temor a que el modelo no
describie$e .ldecuadamente los datos.
Tras definir cl término o términos de exposición del modelo. el
I in\,estigador
planteamientos
debe (;entrarse.en los factores de confusión. Para éstos. los
son en gran medida los mismos que para la exposición.
Cad.l \'.lriable debe ser traducida para introducirla en uno o más térmi-
nos del modelo. De nuevo es deseable usar un conjunto de- términos
indic.ldores que permita una relación menos constreñida entre el factor
que confunde y la enfermedad. La meta analítica es un tanto diferente
para las variables de confusión. En vez de realizar inferencia acerca del
erecto del factor que actua confundiendo. el objetivo es tomar en consi-
deración el mismo. de forma que el efecto de la exposición no resulte
distorsionado. Para conseguirlo. no obstante. se necesita esencialmente
~ dar en el modelo el mismo tratamiento a dicho factor de confusión que a
la exposición. Para el primero no resulta importante apuntar ajustada-
mente la forma de I.l curva de dosis-respuesta, pero. por otra parte. hay
poco que ganar por lo general reduciendo el número de términos del
Illodelo. a no ser que los datos estuviesen desperdigados o deficiente-
Illcnte distribuidos. Más aun. en algunos análisis un factor de confusión
de la exposición podría tener por derecho propio algun interés, en tanto
que constituye exposición. Si las variables en cuestión están definidas de
manera óptimí.l en el modelo, se pueden realizar con facilidad inferencias
~
:Iccrca de Ií.l exposición y de varios factores de confusión a partir de un
(¿1
modelo único. Por el contrario. si se sabe que el citado factor de confu-
sión tiene una relación «monótona) con el resultado enfermedad, es
posible conseguir un mejor control de la confusión manteniendo la
EJ

's~

.:-:~: {~:,:.;;

~
~~~f;~~ ;\~

33(, EPIDEMIOLOGIA MODERNA

(\rll~11;lcji)J1 11alllral dc la5 calegoría5 CJ1lIJ1 llJ1ic() lérmiJ1() punluado. sea


(\rdjJ1al l' c(}l1linuo. El lira y an().ia cl1lrc la c.\pacidad de adecuar una
Cllr\.;¡ mc.i()r. cmplcaJ1do lIl1 C()I1.illJ1l() dc lérmil1()s indicadores, y el orden
11¡ll\lml )' 1¡\ rcrdida dc mcnos «grad()s dc libcrlad» que resullan de
l'111rll.:;\r \111 lérmil1() lll1ic(, J1(' csl;i bicJ1 Cl1lcl1did() c()m() para re.llizar
l111¡1rCC()mCI1da(."ii)11~cI1cral. l:sli\ cl¡lro. sjJ1 cmbargo. que la iJ1Cerljdum-
hrl' s(}brc la ClIr\';1 q\IC rcl;¡ciol1a cl raCl()r dc canrusi()n )' la enrermcdad
;\(."lll¡' a rav()r dc lralar ¡iI rrimcr() dc la misma rorma que a la exposición.
mt'(lial1lc \111C()J1illnl(' dc lérmjl1()s il1dicadorcs.
l¡11 mél(}d(\ (."¡\mlll\ CII la rlleSl;¡ cn pic dc m()dcl()s mllltivariad()s es el
¡Ih('rda.ic r()r pasos. CJ1 cl qllc sc ..lñadell () se sustrael1 término5 al
m()dcl(1 r()r CI¡lraS !\liccsi\.as. dc acllcrd() COI1 lIn critcrio dc «sit!lli(jc..l-
l"ii)nl. csladisli(."a qllc csti\ rclaci()n¡,d() C()11 la medida cn quc lu .ldccU.I-
(."ii\11 llcl mi!\m(\ Sl: \'C arcclad;\ r()r la rcrdida () gan,\ncia dcl tcrmino
si!:!,licl1lc. La idc;1 dc lIn rr()ccs(, dc !\clcccii)1l alll()mática rc5Ulla lenlad()-
r;\. l'spccialmcllll' rar;, 1;\ rcrs()lla qllc csl;í canslrllyend(, el m()dcl() ~. sc
sicnll' inci)moda il1lcrrrCland() m()dcl()!\ mullivari..ldo5. A pes..,r dc todo,
cslc mél()d() cs i,1adccuad() rara la may()ri.1 de las aplicaciones epide-
11\i(,I()l!icas y dcbc scr cvil;\d(). P()slllla com() met..\ quc el modelo debc
scr rarsim()J1i()s() c()n respcct() ..\1numcr() dc término5. pero dichu mela no
l'S rcrlincl1lc rara cl al1;í¡isis cpidcmi()l()gic(). que sc cel1tra en el erect() de
f~,clorcs c~pccífic()s. El mél()d() cmplca l~\ «!\igllific..,ción» cstudí5tica para
\.;II(\rar la adcc,I;lcii,l) dc lIll m(}dcl(}. eJ1 luf!..lr de juzgar lu nccesidad de
c()lllr(\I~,r la (."()nrllsj(;n r(\r raClorcs csrcciri(;os. 5()bre I..l basc dc la canlj-
d;\J Jl' csl~\ q\IC cst;í imrljl::.1d.l. Es posihlc que dicz raclores dirercntes
l'~llI\"icsCI) C(\nrllndicl1(I(1 Cll cal1lidad m()dcrad.\. rer() que il1di\'idual-
IIIC.:111l'nin1!lIl)() t'slllVicSl. rcla(;iol1adl' c()n la cl1rcrmcdad dc r()rma SlI(j-
l.il'nICmCJ1ic rllcrtc c()m(' r~lra areCl..1r 1..1adecu.,ción del model() de un
m()d(, «csladi~li(;(lmCnlC sigl1ific..ltivo». UI1 aborda.ie por pasos podría
11l'\.ar ;) lIll m()del() qllc exclll~'ese I()s lérminos relacionados con todos
t:11(\s.,Pcr(). i.qllc ~c g,ll\aria ccJ1sllral1d() cl m()dclo p(lra excluir estos
Il'rmiu()s: Si la m~lv()ri~\ dc I(}", r;lcl()rcs cslllvie~cl1 c()J1rundiend() en la
Il1i~m;, dircccii\l1. I(; qllc c~ lIl1(1 p(\sihilid;ld. p()dri(1 haber una canlidad
\;IISI;II1Ci(11 dc C()J1rllsi()n cn el al!rc\!ad() dchiJa ..\ I()s r..\ClOres exclllidos,
il)ciIIS() si l1il1gllJ1() r()r si 5(}1() c¿nl;ihllia dc unu rorm..1 «est(ldisticamenle
'i1!!niricali\.a)1 (ll m()dcl(). Cierl¡lmenlc I(l vel1lai(1 rul1damel1tal de emplear
III~ m()dcl(1 mlllli\.ari..1d() el1 lIn al1i\lisis cride.mjológico cs su capacidad
rar~1 (."()nlr(\lar cficieJ1lemeJ1le ul1a mullilud de raClOre$ a I~l vcz. Uljljzar
lIl\ (\hl\rd;l.ic r()r r~IS()S J1l) cs sóll\ dcrr()ch(ldor, sjno que niega algunas de
las \'cJ1l;lia-" dcl al1~llisis mlllli\'(lri(ldo. Evil(lr cualquíer opcíón por pasos
\. cn ...li illl!ar il1lCl1l¡lr c()nslruir lll1 m()dcl() mlllli\,.lri(ldo gl()bal unico
~lllC illclll~'~Sl' ¡1 I()J(}S I()s ra(."l()rcs dc c(}nru~j()n jmp()rlaJ1lCS, .ilJnl() con el
lt:rmin() (\ lérmil1(\s dc cxr()$ici(\I1. es ;llg() qllc simpljfic(l y rorlalcce un
~,I);í lisis.
I.()s m(\dclos mlllli\.ariaJ()s rllcdcl1 l'lili7.¡lr~C lamhicJ1 par..1 valorar la
11)C,Jifit';ICi(;11dcl CrcCI(' () la inlcr;lc(."i(;I1. l~()s dCt;lllcs sc disClllCJ) CI1 cl cari-
1111(1I :'. rc.:r() rcslill;1 imr(\rl:IJ1lc 11:ICt'r c(\11sl;lr qllC ~i sc ..1i1;ldcn al m()dclo

:..
~

$(:
{~~~¡¡:: ;11~
',JIJ; ~~
~:, :.~~~.
:~~
\~J~~
:jL;~.:;-

l ANALISIS MULTIVARIADO 337

I()~ tcrmi!los de i!lleracció!l que incluyen la exposición. se vuelve dificil


v:II()rar cl CrCclo dc la misma. Si la exposición. o un nivel dado de ella,
I.:sl:i prcscl11c s()lo C!l un único tcrmino. tal erecto puede ser estimado a
r:lrtir (Icl L"(IcliL"icIIIC (Icl mismo. Si sc incluvcn en el modelo los térmi-
11(IS-rr(I(IIIL"I(IS l'Jllrc 1:1cxr()siL"il1'1 y ()Iras va~iahlcs. cl crccto de la misma
sl: (lirllll(lir:í s(lhrc I(IS v¡lri(ls Icrlllill()S 411C 1:1 incluyan: un cxamen dcta-
11:ltI() tIc cst()S l.llilll(IS rllCdc rcvcl:lr i!lr()rmacil)n sohrc cl efecto, pero a
IllC!ludo sc haL"e imposible un,l evaluación de forma directa. Por ejemplo.
si cn un modelo un término indicador de exposición se suplementa con
()Ir() de interacción que incluyese el producto de exposición y edad para
tomar en cucnta una ínteracción por esta última, el investigador puede
c!lL"()nlrarse con un cocficienle negalivo para el término de exposición y
(1lro positivo par:1 el de inleracción exposición-edad. Bajo tales circuns-
lallL"ias. puede que "O sea rácil delerminar. si el erecto lolal de la exposi-
l'i()11 es pOSilivo o negativo. Un,l aproximación sensata consiste en evitar
llllC los Icrmil1(1S lle i!lleracción incluy,ln la exposición. a menos que
cvalu,tr la modific.1ción del cfeclo ruese una mela analilica específica. en

] ~U'!O ~.ISO dcbe adopl,lrse


~;lpilUlo. En conlr,lsle.
el abordaje
añadir lérminos
que se describe en el próximo
de inleracción que incluyan el
rr()dUClO dc dos o m,is covari,lbles plantea poco problema: por lo
gcl1er,tl. se ruede adecuar sin graves inconvenientes un modelo con
~ualquier nivel de complicación deseado para los ractores de confusión.
il1~luyelldo complicadas inleracciones entre ellos. (La única preocupa-
~i()n eslil en que la dispersión excesiva de los datos puede llevar a una
I inestabilidad estadistica a la hora de adecuar el modelo con los términos
:lñadido5.) Por cjcmplo. 105 lérminos de inleracción edad-sexo permiten
tomar cn consideración direrentes efectos de la edad para varones y
I1C.:mbras. Lo intrincado de un modelo que incluye lérminos de interac-
Ci()ll l'ntre covari,lbles no inhibe la posibilid,ld de, realizar inferencia
dirccta acerca dcl cfccto de 1,1exposición y rermile el control efectivo de
1,1 ~onfusió!l. dejando ,II modelo ,tdaplarse al patrón de los factores de
confusión que se ,1decuan de forma más cercana a los datos.
Un,l de las medidas asociadas con rrecuencia a los modelos multiva-
riados es el coeficiente de correlación. El coeficiente de correlación múlti-
rlc C5 la correlación simple producto-momento entre la variable depen-
diente y el conjunto de estimados suyos generados por el modelo que
~orresponde ,1 los puntos de los dalos individuales. El cuadrado de la
correlación múltiple corresponde a la proporción de la varianza de la
v,lri,1ble dependiente que se explica por el modelo: no obstante. no posee
interpretación epidemiológica. Las correlaciones. simples o parciales. son
medid,ls de asociación entre dos variables: las correlaciones simples son
medidas brutas. mientras que las parcíales están controladas según otros
factores. Los coeficientes de correlación son generalmente inadecuados
par,l inferencias epidemiológicas. puesto que no orrecen ninguna inter-
prct,lbilidad ,1 este nivel. El valor de un coeficiente de correlación depen-
de de 1,1distribución y del rango de las variables componentes y conse-
ctlcntcmente. de r~lctores del diseño que no deberían tener peso en la

~.

.~:h~~
33~

illfcrcll(;i:l CiClllífic:I, Dclltro dc Ull ran!!o suficientemente estrecho de dos


\.:Iri;lhll."". 1:1..;correl.lciollc.c; scrilll pequcñ:ls. fuese cual fuese el grado de
;IS()l.j;I<..i(.'1l .c;()hre UIlO m..ls (lmplio. Por cllo. .Ipoyarse en lo.c; coeficientes
llL' l.()rrCI;I(;ii)11 p;lr;1 haccr illfcrcl1ci.1 pucdc illducir a error y es algo que
llL'hL'ri:1 l'\'itar,1¡c, La.c; infcrcl1cia.c; nbtenida.c; dc cneficientes de regresión
11(' CSI:ll1d:lri7.(ldo.c; I1n est(\n su.ietas al mismo problem(l que las extraidas
dl. Il)~ c()eficicntcs dc correlación. pcro e! uso dc cara a la inferencia de
l.\lcficienlcs dc c()rrelaci()11 estalldarizados es prohlemático. ya que dicho
\.'(ll'ril.ll.'llle cst;llld;lri7.ad() dcpcl1dc dc la frecuencia total del factnr dc
ril."'!!(1 y del re.c;ull;ld(, dcl estudio: por 1:1 mism:l razón. los análisi.c; por
mcdi(, dc ata.i()s. qllC dcpel1dcn fucrtemente de correlaciones parciales.
d1.'hcl1 ,l¡cr e\'it(ld()s cnm() hcrramicnt.l .lnalítica el1 la epidcmiologia
f(jrcrl11:1I1d ('1 {11.. 19X61.
r~esllmiendo. 1;1 il1lcrprel;lción de UI1 model(, multi\'ariado que sr
lllili7aSl' par;1 lIll :In.ilisis cridcmiolo!:!ic(' sr r.lcilit(l con cl cmpleo de
tcrmil1os il1dicadores. inclusn si para formarlos resulta necesario romper
.\.ariahles ordinales o cnl1tinuas al objeln de liberar al investigador, en
al~ul1a mcdida. de I"s c(lnslriccinnes matemáticas del modelo multiva-
ri:l(lo. Este pr()cedimicllIO cnmplica el modelo al añadirle más términos,
pcr() rcrmite m(l~'or nc.xihilidad. Un" rel"ciól1 monótona entre un factor
dl' <.'(ll1rlISii)n ~' 1:1cnrcrmcd"d. si se c()nnce con seguridad, podria justifi-
(;ar el u.c;()de Ul1 Icrmil1(' úl1ico para ohtener un nivel de control óptimo,
pl'r(1 si,l(, .c;i 1:1 pel1diel1tc dc 1(1cur\'a se corresrondc bien con lo que el
m()dcl(\ imrula, [vitand<, los "Igoritmos por pas()s, ruede reducirse la
<.'l)lllple.jidad 101"1 del ;lll;ilisis. puesto que se permite al in\'e.~ti!;"dnr
l'Cl1lr:lrsc ell lIl1 m()del(' lll1ic() cnl1 t()dos los términos rclcvantes. Los de
iI1ICr"cci{.'IJ rllCdcll aña<.1irsc para dar respucsta a la interrelación entre
f:I(;1()rc~ de collrusiól1. per(' resulta <.Iesc"hlc e\.itar término.c; producto
I.IliC il1clu~.al1 I" cxposici()1l dchid() II qllc O.I;C1Jrc<..en I" interpretación, .1 no
Sl'( 4lll' el c~ll1<.1i{1dc 1,,1 i,Jlcr;ICci(\IJ fllesl' 11l1a de la.c; metas analiticas
(\C;I"l' <..al). 15). (, cl ill\'(;,1¡li!!,,(I(lr 111\'icsc ("()llfi"IIZ" Cl1 1;1 CX"ClillId dcl
m()dclo. Por illtimo, en .ll1illisis epidemíol¿)!;icos no deberían emplearse
J(,S l'\leficientes de c()rrelación ni los de regresiól1 estand(lrizados.

MODELOS !\1 UL TI\' ARIADOS EN ANALISIS ECOLOGICOS

Lo~ e~ludio~ cn lo~ quc la unidad de observación e~ un grupo de gente


CIl \'C7 de Ull indi\'iduo. sc conocen como e~tudios ecológico~ (véase Cap.
ól. La medida del resllllado en un aniili~is ecológico e~ habitualmente
llnil \'ari:lhlc contillu:l. com() 1:1 tasa de mortalidac.l de un pais, lo que
(li.c;lill!!ue a lo~ c~tlldio,(¡ ccológicos dc otr(1S cstlldio~ cpic.lemioli)gico~ y
rl.'qllicrc Ull ahorda.il' analilic(1 difcrclltc (ll: (1lr(1~ que tllviescn como
re~lIltad(1 lIn:1 vari(lhle discreta. El modcl(l.il: multi\'ari(ldo e~ un:1 forma
con\'ellientc dc di~eccionar 1(1 vilriabilidad de la \':lriahlc re~ult;lc.I(, y la
cxrlic(1 como fullción de diver~a~ otra~ v¡lri(lblcs illdepenc.licnles, Lo~
an~llisis multi\'ariado~ aplicado~ a un análisis ecológico se correspondcn

~.
I
ANALISISMULTIVARIADO 339

hict1 COl! UI! prohlcma de regresión clilsica. ya quc /o tipico es que midan
l:ll una e$cala (.'olltinua no $(>Io la variable rcsult~ldo. sino también a
todas I~l$ v~lriables independientes. Puesto quc la unidad de observación
c~ una población. la información sobre variables predictoras se mide
como un promedio de población. que es una variable continua. Inclu$o
vari~lbles discretas. como el género, se hacen continuas cuando se las
promedia para ulla población: el género es una variable binaria. pero la
proporción de una población que son varones es esencialmente conti-
nu~l.
Aunque con dato~ a~i podria parecer que un modelo de regresión
L'1..1~ic~1 enc~lj~lria hicn. hay que llevar con claridad en la mente algunos
1t1:lticcs a la hor:1 tic re~lli7.ar el anillisis. Primero. dado que cada unidad
(Ic ()hscrvacii)11 cs Ijll:1 pohlación y pue~to que las poblaciones difieren en
1:1111:lri().la (.'alltitl:lti tic informaci(>n de cada unidad observacional diferi-
,:;i. 1):lr:t tom;lr c~to adccuadamente en consideración en el análisis. la
rL'~rcsii)l! dchcr~i ser ponderada. Este procedimiento toma en cuenta
a~ignar ;1 cada ob~ervación un peso que refleje la cantidad relativa de
información incorporada en Ja misma. Como pesos podrían tomarse los
reciprocos de la varianza estimada de cada observación; para una tasa
de incidencia o de mortalidad. serian el cuadrado del denominador
dividido por el numerador. Otro esquema razonable de ponderación es
pesar cad~1 observación simplemente según el tamaño del denominador
de la tasa.
Un segundo punto a tener presente es que los coeficientes del modelo
habitualmente no pueden convertirse a las medidas epidemíológicas
usuales del efecto. Aunque la variable resultado pudiera ser una medida
del tipo de una tasa de incidencia o de mortalidad. las variables indepen-
dientes representan. como mucho, valores promedios de exposición y no
pueden reflejar con exactitud el efecto de un cambio en el nivel de la
exposición sobre la ocurrencia de la enfermedad, a no ser que la asun-
ción lineal del modelo fuese razonablemente exacta. La más de las veces.
las variables independientes del mismo son en cualquier caso aproxíma-
I das. por lo que la interpretación epidemiol()gica de los coeficientes resul-
t~l problemática. estando en el mejor de los casos sujeta a considerable
~e$go. Los estim~ldos del erecto de los estudios epidemiológicos pueden
I cstar grandemente exagerados
~csgo «de cruce de niveles» (Morgenstern,
por un fenómeno que se conoce como
1982). Con todo, teniendo
datos ecológicos las inferencias epidemiológicas son ocasionalmente po-
sibles y hasta podria ser factible valorar el grado de sesgo (Stevens y
Moolgavkar, 1984). Ejemplo de variables aproximadas son los datos
sohre impuesto~ recaudados por consumo de cígarrillos o de alcohol, en
lug~lr
~ U ndetercer
loS reales
punto sobrees queel elconsumo
control de de launos u otro. resulta dificil en los
confusión
]
anillisis ecológicos. puesto que las observacíones individuales son datos
promedio o datos aproximados de poblaciones, llevando por ello a
asociaciones atenuadas e intercorrelaciones entre varíables que limitan el
control de la confusión {Greenland, 1980; Morgenstern, 1982). Más aún,

.J

~~~::~;~,

-.:.:-;i:="",-;~j:'~{:~:i" ,.," :~,;;:~;.:;;;i;~:


--:':::

~;~~Ifr~
~~c
;~~~~~~~;J~~

,~
1;:;'
340 EPIDEMIOlOGIA
MODERNA

CI' I()s cslll<.1i()S ccol()gicos c,<; ror I() gencral mils dificil oblencr dato~
..illllicr:1 :Irr()xima<.1os dc all!l1n()~ r:lCl()rC~ ql1C ~e c()n()ce o ~c ~o~pccha
l'lll. ;ICIII:I" t'()"fll"dicndo. L:I f:lll:l dc di~rnnibilidad de información II:",) W;

rL'll.\.;111Il. CS cl ha,,<.1ic:lr mil~ ~cri() c" los anilli~i~ ecológico~.


1:.1' III' model() dc rc!!rCSi()11 lil1cal. la variablc dcpendienle tienc un
.
1 "~~:: ~:.
~c

.~ "!1; " -

r:111!!(1dl. mc,,()s infinil() ;1 mils inrinilo. rer() 1:1lasa de incidencia .vn ~ólo
~.C.:;,
llc ccr(1 :1 m;'ls inrinil('. La i"c()mpar~lhilidad dc los rangos puede ser :i j' -
rt:..l1cll;, m()dificLl"d(, 1:1 l:ls:l <.I(' i"cidenci:l mediante lransrormación I()-
~:Iritl"ic;t [;.n ta"I() qlll' csl:l tran~rOrmLICi()I' cs malem,ilicamcnlc alrac-
li\.;I. pl)rqlll' prc\,icnc ql1C cl m()<icl(, rr()dl17.C:l e~limad()s negalivo~ de la
l:lS:I <ic i"ci<ienciLI.la rri"cir,11 c()nsideraci()" cs si elm()dcl() multiplicati.
\,(1 qllC rL'sl111:l c()nslil\lyC \11':1 mc.ior dcscrirció" dc los dal()S ql1e el
:I<iili\'(' qllC sc arlic:l si" dich:l lransform~lci()n logLlrilmica. Los lérminos
C()I'li"II().; <.Icl m()(lcl() mllllirlic"liv(\ tc"drían. cnm() en el modelo logisli-
l.(I. 11";1 rcl;lci()J1 cxro"CI'Ci;11 I()~ u"o~ COII lo~ olr()s. Scria posible em-
rlC;lr \I" con.iunl(\ dc \,:Iri;,hlcs il,dicad()r:ls p:lra cada variable conlinua
, .
<icl m()<icl(). pcro r\leSI() ql'C Itls v:lrinblc~ conlinuas son promedios de : :;..,
i;..~~. .
r()hl:lcii",. sc vl1clven m\lci,() m;'ls diricile~ dc inlerrrelar. A n() ser que
\1":1 r:17()I' csrccíric;, 1(\ dcm:l"d:lsc. parccc prercriblc llevar a cabo la
m:I\.()ri" <ic lo~ :IJ1;',li~i~ ccoli)1!icos ml1lli\'ariados como regresiones linea-
.~
Il.S "(1 Ir;l"srorm:ld:ls.

\;¡:.NT¡\.I¡\S "'I' llMITACIONES


1)1. 1.()S t\101)I:l.OS J\,1tllTIVARIADOS

1:1111's il11:ilisis critlcmioli)~icos. lil cstratirlcilción sc ha presentado como


l:1 m¿.I(\dl) tlL' primer(1 linc:l p(lra contr()¡ar 1:1 confusión ~. e\'aluar la
11)11(lirll.at:i('11 tlel efcclo. l:l cl:lsiricaci()11 crul.tltla tic los datos. en función
tlr m\It:11as \'aritlhles simullilncamcnlt:. pucde dcsperdigar las observacio-
nl'~ tic f()rmtl demasiad() delgada ~ohre las muchas $ubcategorias reque-
ritl(ls, h¡lcicnd() asi la cstratiricacii)11 imrracticahle cuand() el investiga-
tlllr 1IIvicse quc prcstar alcnción a un ntlmer(\ relativamente grande de
\.ari:lhlc~ cn el ani\lisis. El punto e~peciric(' en que la estratificación se
\'uclve inmanc.iahlc dependc dc la cantidad de datos. del número de
\'ariahlcs ~' cale~orias. dc la distribución de los datos sobre estas varia-
hlcs y del .iuicio del in\'estigador acerca del precio que merece 1(1 pena J
ser ra~ad<) para conducir un anilli~is e$tratificado. Ciertamente. la estra-
tiricaci()n orrct:c al~un:ls \'cnta.ias clara~: r(1r 1(1gcneral el análisis ruede 1
IIl"\.arsc :1 caho t"O11apcnas 1111acalcul:ldora dc hol~ill(1 (aunquc habitual-
mt.:11tc se cmrlca \In ordcnad<)r. lIlIC cs a 111L'11\ldoncccsari(1 p(\ra gencrar \
1()s dat()s e~tratific:ld()~I: cl in\'csligador ~c ramiliari7.a con 1(1~ datos y t
1
rucde ()hservar la distrihucii)n dc cada \'ariahlc a 1(1largo de l(1s c~trat(1s: ~
cl palri)n dc los estimados del creclo a travé~ de 1(1!' mismo!' $e hace
\:isihlc rilpidamcntc ~: la pre$entación del análisi!' tiene capacidad de
captaci()\l par:1 lo~ Icct(1re$, mucho$ dc los cuales se $ienten más conror-
t(lhlcs CO\l los a\l:\li$i!' cstratificado$ que con los multivariados, especial-

f1
¡J

"..::m~

:~~:
11it

~
'.:~~;~::~\:~~. ~.;~t.~::

; ~.;.: :

l ANf\LlSIS MUL TIVARlf\OO 341

IllClllc I;U:Illtl() SC rrl:~l:lllaI1 allccl(.)r I(.)s tlat(.)s eslratilicad(.)s para que los
c~cruliI1e. L~I pril1cipallimitación del análisis estratificado es su incapaci-
ti~ld para hacer frente a mi1s de unas pocas variables a la vez. a no ser
que cl ap.lrc~lmiento haya proporcionado distribuciones similares, a lo
largo tic los cstr.1tos. de las series comparad.1s. Sin .1pareamiento. confor-
j mc cl número de ohscrvaciones dentro de los estratos disminuyese con el
:Iumento dcl nllmcr(.) dc éstos. 1.1 r.1zón de controles a casos (o en
cstudios de seguimiento. la razón de sujetos no-expuestos a expuestos)
nuctu.1ril al .1Zar cn OI1d.IS dcscontrol.ld.1s sobre el valor medio; estas
nuctu.lcioncs inycct.1n tlclnasi.ldo error alcatorio al proceso de estima-
l;i()11. <:ausantl() 1Iila pcrtlitla tic cficicncia del estudio que pone en

1 l'lcli~r(1 1¡1 inICrl'lrl:I:I<.:i(in tIc I(IS rcsultatlos. En estas circunstancias.


llllir.::¡ ;111L'111all\;¡ ;111:1Iíti<.:arcslllt:1 "cr algulla ft)rm.1 de análisis multiva-
la

ri~It1().
IJ~ls \CJII~I.jas y limit.lcioncs dcl ~ln~llisis multivariado son en gran
mctlida I~I im.lgcncll espcjo de las del análisis estratificado. Mientras que
cl :In.ilisis cstratificado sc vuelve ineficiente frente a muchas covariables,
cl multivariudo es por lo general muy eficiente. Por el contrario. en el
~ln~llisis multiv.lriado se echa en falta la capacidad de captación global
lJue licne el primero. La computadora viene a intercalarse como intrusa
cntre las observaciones crudas y las medidas epidemiológicas que resul-
t¡ln tle cllas. oscureciendo a los ojos tanto del investigador como del
Icctor algunas de las interrelaciones entre las variables del estudio que
p()sccn m.\s scntido. Sólo una larga experiencia con el modelaje multiva-
riatlo cmpe7..1r:i a parecerse a la sensibilidad tratando datos que se
\)hticnc dc un ~In.ilisis cstratificado. Los cillculos son tan complicados
quc cl invcstigador se ve obligado a depender por completo del equipo
inform.itico y dcl .\,(~/i),.llr(' de que disponga. Los errores de dicho s~fi1\.a-
r(' puedcn p.lsar desapercibidos a través de muchos análisis. porque no
h.1y rorm.1 sencilla de comprobarlos en su integridad. Además, la eficien-
L'ia cst.1distica tle los modelos multivariados tiene un precio, que es la
asunción de que una forma matemática dada describa la relación de las
vari.1bles del estudio. La extrapolación más allá de los límites de las
\)hServ.1Ciones. que es algo que muchos investigadores son reacios a
R
l~l hacer y que es fi1cil de eludir en los análisis estratificados, resulta dificil
(le evitar en los modelos multivariados. Ciertamente, en un análisis
multivariado 1.1extrapolación y la interpretación son cuestiones criticas
a la hora de ganar en eficiencia. Asumiendo que el modelo matemático ¡:
~
tlcscrihe la distribución condicional de una variable sobre un rango de
v:llorcs p~lra los cu.1les f.1It~ln 1.ls obscrvaciones directas, el modelo puede
cxpres.lr 1.1rel.1ción combinada de muchos factores simultáneamente con
scncille7. y elcg.lncia. Si el modelo es incorrecto, sin embargo, la mejora
(Ic cficicnci.l pucdc quedar negada por un grado intolerable de sesgo:
q Inils ~lún. t.11scsgo no seri1 detcctable sin esfuerzos especiales y la precau-
¡'-1
~ ción que c.1racteriza a esfuerzos así puede verse minada frente al gancho
scductor de un modelo nítido y de aspecto eficiente.
I~stos inconvcnientes que tiene el análisis multivariado convierten al

~f.
;~~:
~~\~r~

fl'lDEMIOLOGII\ MOOEnNI\

cs\ra\ific.ld() en la alternativa deseable. cuando los datos lo permitan, En


muchas $ituaciones, los análisi~ estratificados y multivariados pueden ser
L'()mrlemcl\t.\rio~ para proporcionar apreciacione$ útiles acerca de los
dat()s. L.\ ~r(\n fuerz.\ del análisis multivariado radica en su capacidad
para controlar simultáneamente un gran númer() de variables. meta que
el eslra\i~c.\d() con frecuencia no puede conseguir, De modo similar, un
:In;ilisi~ aparcado de cas()-control que emplea la estratificación puede
l'()ntr()lar con cficiencia llnicamente aquellos factore~ que han sido apa-
r::;ldl)S: un análisis de regresión lo~istica condicional permite controlar
f;lclorcs adicionales más allá de aquéllo~ que se aparean, Para tales
aplicaciones, el ar.álisi~ multi,'ariado es un componente necesario del

reperloril) al\alitico de! epidemiólogo,

LISO DE UNA PUNTU AClON RESUMEN


PARA EL EFECTO DE CONFUSION

Com() las ventajas e inconvenientes de la estratificación y el modelaje


multi\'ariad() son complementarios, es razonable plantearse cómo po-
drian combinarse los dos aborda.ies en una metodología única que
contu\'icse las \'enta.ias de ambos, El inconveniente básico de la estratifi-
cación es la pérdida de erlciencia que resulta de la creación de un gran
númer(\ de estratos para controlar simultáneamente la confusión por
muchas variables, En principio. debería resultar posible combinar mu-
ch(\s de c~tos e$trat(\s ~in introducir ninguna confu$ión $ustancial. pero
la dirlcultad estil cn idcntific,lr cuáles. Si hubiera sólo una variablc
c()1lfundicndo. digamos la cd,ld. ~' los e$tratos hubie$en sido creados por
cada año de la mi$ma. el gran número resultante de ello$ seria innecesa-
rio. puest(\ que casi toda la confusión debida a la edad podria ser
controlada con un puñado de categorías etarias (Cochran, 1986), Colap-
s:lr los cstratos de edad redundantes no presenta dificultad alguna.
porquc la cdad e.<; una \'ariable continua y las categorías vecinas se
pucden fundir en unos pocos estratos de edad más amplios.
La idca que ha~. detrits dc resumir el efecto de la confusión es definir ~

j
una \'ariahle continua unica que atIne la información rele\'ante acerca de
la~ pr<.'picdade~ de toda~ las variables a este respecto (Bunker el al.,
1969: Miettinen. 1976: Rosenbaum )' Rubin. 1983). Consideremos un 1
expcriment(\ aleatorio. Una propensión para desarrollar enfermedad, si
l,l r,lndClmización funcion:l bien debería estar distribuida por igual entre
los ~rupos dc intcr\'ención, No hay. no obstante. forma directa de com-
1
pr()h:lr estas distrihuciones. puestCl quc la propensión a la enfermedad
n() pucdc medir~c direclamentt' mils quc midiendo la incidencia de la
misma. quc es el rc$ultado del estudio ~; quc pCldria verse innuenciada
por la intervención en si. Lo que $e necesita para evaluar la eficacia de
dicha randomización es alguna indicación del riesgo de enfermedad
cntre lo~ individuos de los diferentes grupo$ de tratamiento aparte del
efecto de la intcrvencíón, La distribución de los factores de riesgo cono- n

:~

:t~~ ~~::;;~~
ANALISIS MULTIVARIADO 343

cid os sirve como indicador de esta propensión a la enfermedad. No


()hstante. un estudio puede lener poca o ninguna confusión incluso si las
<.Iistribuciones de 'Ios ractores de riesgo conocidos no son idénticas,
ruesto que es posible que descompensaciones a ravor de algunos de ellos
rUCSC!1 co!1lrarcsadas ror descompensaciones de otros, La confusión
I()lal quc existicra rodria ser rilcilmente controlada si la contribución de
1()ti()s los racl()rc~ tic riesgo conocidos a 1,1 rropensión a desarroJlar la
l.:!1rcrmedad pudiera ser sumariz,ld,l cn una mcdida ú!1ica,
1>:lra c()mhinar en 11!1a mcdida llnic,l (una puntuación resumcn dcl
l:ICl.I() <.Il: 1:1<:()llrIISi()II) la illr()rm,lci()!1 sohrc cl ractor de ricsgo, se rucde
111ilil:ar 1111111()ticl<.) multivariado, El método es de aplicación tanto a
.'-1
I.:stutlios II() I.:xpcrilllC!ltalc~ como a experimentos. En estudios de segui-
111it:lltO. 1.11plllltU;II.:I()11 <:onstituye un,l aproximación al riesgo de enrer-
m.1r, En I()s dc C.ISOS y controlcs no pucde serIo: la medida análoga
rlll.:tic 1.:!l11.:1Id1.:rsc 4l1c scri,1 1,1 prob.1bilidad de resullar clasificado como
<.:as(). a <.:O!lt1iCj()11tic I.:Sl,lr cn cl csludio. 1\lgunas de las desventajas que
C()111Ic\'a t:J all,ilisis multivari,ldo no se aplican al utilizar modelos de esa
natur.1leza p,lr,1 generar puntuaciones resumen del erecto de la conru-
,-;ión. Si el modelo multivariado se utiliza simplemente para generar
puntuaciones que van a emplearse de cara a la estratificación y no
dircct,lmente rara realizar inrerencia. el problema de la ralla de capaci-
dad de C~lpt,lción del modelo se ve aliviado,
1.;1 <.:onstrucción de un modelo multi\',lriado para generar puntuacio-
I1CSdc rcsumcl1 dc la <.:onrusi¿)n. e~ directa. No sólo se conseguiria casi
1.:()11 CII:1141Iil:r lip() (Ic 11l()dcl() malcmiltico. sino que seria posible haccr la
<.1c.:lini<:i()11tic sus lcrmi!1o~ tan c.:omrlcja c.:omo sc desease. incluidos los de
l.:.xp()si<:i()!1. sin ()Sl'llrcc:cr la illtcrprclaci()n. rucslo que ésla no está basa-
tIa tlircclal11ClIlc CII cl modclo. Las vari.lhlc~ dc exposición pueden estar
rcprescl1l,ldas ror varios términos del mismo. incluyendo. si se desea.
lérminos de inter,lCción y términos polinómicos de orden más alto. Es
deseable omitir en el modelo ractores que ruesen ruertemente predictores
dcl resultado pero que en ese caso no estuviesen relacionados con la
e,xposicióll de inlerés y por lanto no estuviesen conrundiendo: incluir
lales ractores no mejora la \'alidéz. pero puede afectar adversamente a la
eficiencia por introducir menos superposición de la distribución de casos
v l1o-casos, Tr,ls ,1decuar el modelo. hay que estimar las puntuaciones
p.\r,\ l',lda sujeto. Como se trata de la puntuación del riesgo de enrerme-
d.\d (o de la proh,lbilid,\d de cJasilic~lción de enfermedad} condicional a
1.\ au~c!1cia de 1,1 exposición que se desea. los valores de dicha puntua-
ci()11 deben c,llcul,lrse colocando la exposición al valor no expuesto.
i!1dcpc!1dicntcmel1te de 1,1 exposición real. par,\ todos los sujetos y em-
rlcalldo lucgo los olros datos de cada sujeto para calcular la puntuación
rC~tlmCI1 .1 p,trtir del modelo multivariado una vez adecuado (Miettinen.
1976). ¡\llern.1tiv,lmente, las puntuaciones se pueden calcular a partir de
lin modelo ,tjustado a datos relacionados sólo con sujetos .no expuestos.
Un,t ve7: que se han calculado las puntuaciones. éstas pueden em-
plc~lrse como una variable resumen del efecto de los factores que actúan

nc .

[r.

:i~~;
~i: ;*
::~~tr~t\f:~~ ~1;~¡~;:;!:!~ :~;%.

::;~4;;;.::;;~

EPIDEMIOLOGIA MODERNA

collflllldicl1do, sobrc la cual puede basarse un análisis estratificado. El


;111;ílisis ~c prosi!:!uc como si fuese un confusor continuo único. como
pl)(lri;\ ser la cdad. El producto final tiene muchas de las ventajas de
alllh()s alliili~i~: cl cstralificad() y multivariado.
EIIllClodo ticl1c ~u~ illcol1vcnicntes, no obstante. Una debilidad es la
L'()lnplc.iidad dc tcl1er quc adecuar primero un modelo multivariado,
L.aIL'III..r las pul1tllaciollC~ ~ luego llevar a cabo un análisis estratir.cado.
1:11rclaciol1 COI1 la complc.iidad dcl procedimiento se da cierta compleji-
dad .ll1adida dc intcrprctaci<.)n: a partir de los e~tratos no siempre estiI
ciar() qllc variables han ~ido controladas y con cuánta efectividad. Hay
otros prohlcma~: como ~liccdc con cualquier modelaje multivariado. la
\"alidcl si~ue dcpendicl1d(1 de i{) adecuado del modelo. El procedimiento
cs «circul.lr» en la medida CI1 que las puntuaciones para el agente de
confusil)ll emplcada~ en l.1 estratificación se han estimado a partir del
modclo adecuado a los datos que habia que estratificar. Pike el al. (1979)
han señalado que la comprobación de hipótesis estadísticas basadas en
el proccdimiento estil se~gada. Quizil estos inconvenientes expliquen por
quc cl mctodo no se ha hecho popular. A pesar de todo, el principio
ticnc su atractivo ~. puede quc demuestre ser úti! como forma de ganar
cicrta capacidad añ.ldida dc comprensión en análisis complicados.

J~I:I:I:I{I:N(.I¡\S

I\hh()tl. R. D" L()pi~tic rc~rc~~iol1 in survival analysjs" Am" J. E,,;deI71;ol.


19R5:121:465-471.
Hrl:~ln\\.:N" Stati~tical mcthod~ ror censored survival data" E/!viro/1. Hlth. Pt'r-
"..'1(.(";: 1979:32: 19 1-192"
Arc~ln\\". N" E.. and P{)\\.crs. ~;- E- Arc lhcrc two logislic regressions ror retro-
~rccti\,c ~tlldic~? /J;(IIII("r;(.-~ 1978;34:1()()-105-
Hlil1kcr- ..T. p-- Forre~t- ~'. ..1-- Jr.- Mostcller. F-. cl al. Th(' Nat;(1/!al Hal(/tha/!e
.~-',I(il -..1 .)llltlI. tJf ,h(. "tJ.~.~;h/r /1-~.\.(}(-i(l';(111B(',I\"('e/1 Halo'hm,(' A,,('-~,h(',~;a
(I}/(I jl(I,~'tJf1(.r(ll;rr H(.f1(1';(. N('('r(/,~i,~, B('th<,.~d(1: N(1t;mlal J/!.~litulc,~ ~r Hcalth,
/\"(/,,(II/(III/,-~,;,/I'(. (~f G(',/('r(ll M('J;('(11 SC;(./!('(.,~, 1969.
( -(I(.hr(I/'. II-, G, Th(' (~fr('('I;'.(./1(',\".\. Ilf' (/«(ill,\"'m('", h.l. ,\"I(h('I(1,~,~~(icati(1/!i/! remo"i/!g
h;(l\ ;,' (lh-..('r'.(/I;(l11tJI ,~"IJ;(',\". /Ji(I/7'("r;(.,\" 19('R:24:295-313"
(.{)x. D. R- Rcl!rc~~i{)n m()dcl~ :lnd lirc lablc~ Iwilh di~cussion). J, R- S,al" Soc.
/J. 11)7~:~4:1 R7-220.
( i;lil. t\1. II.. l-llhil\. -1- II-. :l1\J 1{llhil1!;tcil1. 1.- V. Likclih()()d calculation~ ror
m:llchl:J ca!;c-c{)ntr{)1 !;IIIJic!; :11\<.1s\lrviv:ll !;Iudic~ wilh licd dcalh times.
JJi(I11/(.'r;k(1 19R I :6R:703- 707 ,
(i:lrl. .J. .1, Thc c()mp:lrj~("1n ()r pr()p()rliol1~: A rcvicw or significanle lesls, confi-
dcncc il1tcrval~ al1d a<.1-iu~lmcl1ls ror slratification. R('v. 1,,1. Slal- J/!.~t.
1971:.'1,9:14~-1('9.
Grccl\l.\nd. S. Limilalion~ or Ihc logi~lic analysi~ or epjdemiologic dala. Am. J-
Ef1;(¡('m;(/I. 1979: 110:('93-698-
Grccnland. S" Thc crrccl or mi~classificalion un lhc pre~ence or covarjates. Am.
.I. J;,I;J(.m;m. 19RO:112:564-569,

-*
...:~.t~~:
;~'>:: ~~~\,:~~.¡

~:

ANALISIS MUL TIVARIADO 345


~

( jrccnl:lrnl. s.. St;lllc~~clmtln. J. J.. Criqui. M. H. Thc rallacy or employing


st:lnd¡lrdizcd rcgrcssion cocmcients and corrclations :lS mc:lsures or effcct.
..1,1,. .1. 1:..p;tl(",,;(J!. 19R6:123:203-208.
Kalhllci~cll. J. D.. and Prcnlice. R. L. Th{' S,ali.\"I;('al ,'ll/al.I..\"i.\" ()r Failur('-Ti",e
I)(,,(,. Ncw Y()rk:Wilcv. 19R().
Ml:( .,lil¡It!I\. I).. al\d Ncldcr. J. A. (i(,I/(.'.(,li;(.d l~il/(.('r M(I(I(,/.\". Ncw York: Ch3p-
mall allu 11:111.19H3.

J Micllincn. O. S. Strt\lilication
l:.il;(I(.I11;(,I. 197(,: J04:609-620.
by il multivariate conrounder score. A",. J.

M()rgcn~tcrn. II. lJscs of ecologic :Inulysis in epidemiologic research. Am. J.


l'llhlí(. HI,h. 19R2:72:1336-1344.
I)ikc. \1. t~.. 1\lldcr~()n. J.. alld Dav. N. Some insights into Miettinens multivari-
;llC c()nfollndcr "c()rc :'rproach to c3se-conlrol sludy an3lysis. Epide,"ini.
(i,l11l11. 1¡/1¡'. 1l)79:33:10~-IO6. ~

I)rcnlit;c. 1{. l)sc l)f thc lugi~lic model in retrospective studies. Biom('lric.\" l~.

l~i(,:.~?::,q4-(,()h.
I)rclllit;c. 1{. I~.. alld P~'kc. I~. Ll)gislic dise~lsc incidence models and C3Se-COnlrol
dal:l. 11i(I/II(.fri".(( 1979:66:408-41 ::..
l)rl:llllcc. I~. L.. :Illtl Bresll)\V. N. E. Relrospective studies and failure time
m()uc¡~. ní(II11('frika 1975:65: 153-15S.
J{()scllh~llIm. p R.. and RlIbin. D. The ccntral role of lhe propensity score in
()h~cr\'alion~11 stlldies ror causal effects. Bi(l/lll.'rika 1983:70:41-45.
I{()lllmall. K. J.. (..ann. C. I.. 1:I~lndcrs. D.. et al. Epidemiology of laryngeal
c;l"ccr. 1:,,;tl(.I/I;(II. RC1.. 19R():2:195-?09.
SIC\,I:IIS. J{. ( i.. antl Ml)()lg:lvk~lr. S. 11. 1\ cohort ~malysis or lung c3ncer and
~m()kin{! ill Hritish malcs. ..11/1.J. Ep;tl{!mi()/. 1984:119:624-641.
rll()mas. D~ C. (Jcllcral rc¡alivc risk modeis ror sur\,ival time and matched C3SC-
¡;1)lllr()1 an~llvsis. /J;(II,'(.'r;('.~ 1981 :37:673-676.
W¡llkcr. 1\. M. ÉmCienl ~Is~essment or ¡;onfounder effecls in matched folJow-up
,tlldics. :1""i. .)I(lf. 19R2: 31:::.93-297.
\V.llkcr. 1\. M.. alld Rolhman. K. J. Models or v3r~'ing paramelric form. ..111,.J.

E,,;tl(.I/,;(II. 19R~:115:129-137.

s
m i

i
~

r.l
ü 4

":;:.:':[:;.-\:..j::,;,:~:~;:r~;.
'!~

11'11~ ~~~.
8!1
N.
15. NTERACCIONES ENTRE CAUSAS
I

()u~ mctodol()gia c.c; la adecuada para evaluar interacciones es algo que


ha sido ardoro.c;amcnte debatido. Por una parte están aquellos que a la hora
de ~.c;coger un modelo de independencia de efectos aplicarian criterios esta-
di.c;tico.c; o pur~\mente arbitrarios: según este punto de vista. se puede
juzgar la inleracción a partir de una variedad de puntos de referencia
que .c;irvan a lo.c; propósitos del investigador. y el resultado de la evalua-
l.'ii>Jl puede depender de la elección de dichos puntos. En el otro lado están
lo.c; epidemiólogos. progresivamente convencidos de que existe una única
dcfinicii)n epidemiológica adecuada de independencia. que es la que debe
ser ~\plicada para obtener una evaluación de la interacción que posea
sentido.
La discusión se ha sostenido a dos niveles. En un primer nivel. es un
~xamen de lo.c; principios que rigen la definición de independencia de
efecto.c; con fines epidemiológicos. presumiendo que existe un punto de
refcrencia no ~\rbitrario. A un se!!undo nivel. se trata de discutir si a
p~\rtir de una evalu:,\ción de la interacción que parta de una definición ",
t\rbitraria de independencia puede surgir interpretación alguna que ten-
ira sentido. I .,~

-A modo de ilustración de los argumentos. supongamos que las tasas :x'


.,'1t
de incidencia de ci\ncer de pulmón dependiesen de la exposición al humo ~;;~

de los cig~lrrillos y al asbesto. de acuerdo a los patrones de tasas que


mu~~t r~\ la tabla 15.1. i,Qué interpretación puede extraerse de estas tasas
CIl rclal;i()1l COl1 la interacci()n entre fumt\r y asbesto?
Con re.c;pecto a la medida absoluta del efecto, la direrencia de tasas.
exi.c;te en estos datos una sustancial modificación del erecto. Especifica-
mente. el efecto del fumar es un incremento en la incidencia de cáncer de
pulmón de 9/100.000 año -1 entre los no expuestos al asbesto, pero de
451100.000 t\ño -I entre los expuestos a él. Fumar tiene un efecto absolu-
to cinco vece.c; mayor entre los expuestos que entre los no-expuestos. De
modo similar, el erecto del asbesto es sustancialmente mayor para los
rumt\dores que pt\ra los que no lo son.

J ,-,...

;~

~É~
¡~1~~~~~.
~:;~;.;.~.e.",
-' g "

.,.. ...~.

, ~
~
~
',:

348 EPIDEMIDlOGIA MODERNA ~,~


~

Tahla 15.1. T(I.\"{/.,. hif>nI(;{i('{1,~ d(. iII('idC'll(,io


~~:
(1(' ('(ill('('r (1(' f>llh,,()1l ( ('.\"f>r('.~{1d{1.\: (,Il fnrllla
~:
(1(' (,(1.\:('.\: f>nr (.i('11 mil ,,(.r.\"(,Il(I-{/lin.\" )
.\:(..l.'li,1 ('.\."n,\:i("i(ill {/1 h,(III(1
tl(. ("i.!!(lrrill(I.\: .\. (iI (1.\:h(,.,"l(1
I I

t\SI!l:Slc\

Ilm:1 i
~
S() 1(1

I)(\r l'll'(\I\tr:lri(\. si Sl' l':III.:I/!:lll n\r(litl:ls tll'1 cfcct(\ cn f(\rm:1 tic ra7.(\n
p:\ r:1 I.:u :1¡<.1II icr:1 tic I:\s c x p()sil.:i()ncs tlcn t r(' tic cada ca tcgoría dc la o! ra. 1
...
sr Cl\ClICl1tr:l quc dich~1 r,lZÓI1 cs uniformc. Así pucs. los fumadores .'t
expcrimcllt:ln una incidencia de c¡mcer de pulmóll que es diez veces la de
los n(\ fumadores t~ll\tO en presencia como en ausencia de exposición
ashesto. Dc form:l ~imilar. 1:1 exposiciól\ ,II asbe~to se relaciona con un
al I
~Iunlcnlo dr I~I incidellcia dl' C¡II\CCr dc pulmóll dc cinc() veces. en
ft/m:ldoreS ~. n() fum,ldorcs. lJtili7.~llld(). pucs. como guía la medida del
cfect(\ qUl' :ldopta 1:1 form~1 de r:l7.()n. n() cxiste illdic~lción de modific~i-
I
cii"ln al!!ul1a dcl CfCCto dcl rum~lr debida ~ll ashest(' () vicever~a. Equi\'a-
Iclltcmcl1tc.
I\alcs
CU;II<.1uier modclo m(\tem:iticl)
o. lo que es 10 mismo. ulla relaci()n multiplicativa
basad() Cl1 efcctos prop()rcil\-
entre los
1
J I
f~lctores n() il1dic:lril 5ohrc la b~l.'\e de c.'\to5 datos interacción ninguna i-
clltrc 10." cit:\doS agcntes. Por cjemplo. el coeficiente de un término que
ft/esc pr(\duct(\ e/1tre a5be5tos ~. fumar ell un aná1isis de regresión logísti- I
C¡l mllltiple ba.,\ada ell datos conformes con las tasas de la tabla 15.1
scrí~1 cero: un alli\lisis log-lineal. que tiene igualmente como premisa un
model{"\ multiplicativo. también indicaria auscncia de interacción. En
rea)id~\d. cualquier evaluación estadi.'\tica de la heterogeneidad de la
razón de tasas n() encontraria discrepancia respecto de la hipótesis nula ;,

de que ésta es uniforme


Para los que han propuesto
en datos que sc confoima.,\cn segun estas tasas.
que el c()ncepto de interacción entre fac-
1
~
~
00:
~,
I
tores es inherentemente arbitrario por ser dependiente de la elección del
punto de referencia (Walter y Holford, 1978: Kupper y Hogan: Darroch. '"
~
1974). la comparación de razone.,\ de tasas, diferencias de tasas o posible- \

mente alguna otra medida del efect() se pueden utilizar todas igual de .~
.
bien para evaluar dicha interacción. Estos investigadores sostienen que
la converiiencia estadistica a la hora de conducir el análisis constituve
\lIla parte' integral del proceso de decisión. que determina la medida" a
utilizar para evaluar la inleracción entre variables. Darroch (1974) utili-
7.("1diver,c;os criterios dc conveniencia estadísticn )' concluía que «la defi- I
11ición multiplicati\'tl (de no interacciól1) es preferible por un pequeño
m:\rgen», De formtl similar, ~'nlter y Holford (1978). que también expre-
,c;~\ro1lsu preferencia por modelo~ multiplicativos. argumentaban que «la R

J;1

;,~;;
.: ,

;-;.-"
;!~~,:
~.;.;

INTERACCIONES
ENTRECAUSAS 349

tlcfil1icii)ll de interacci()n. en ausencia de un modelo fisiológico específi-


\.'0. es ciertamel1te arbitr,-lria y la elección de la definición debe depender
1:11algul1a medida de la conveniencia en el .1nálisis de los datos observa-
dl)S». Este concepto de interacción. en el que el punto de referencia que
<:()rreSpolldc .1 la ausencia de la mism,-l no e$tá anclado a ningún cimien-
Il) tei)rico c$pecífico. ha sido llamado «interaccián estadística» (Roth-
man. 197R). P.lra las tasas de la tabla 15.1. la interacción estadística está
simultí1l1e.1mente presente y ausente. según si el punto de referencia de la
il1dcpcl1del1cia de erecto$ corresponde a un modelo 3ditivo o a uno
11lllltiplicativo.
E$ cicrt,-lmcl1tc verdad que .1 crectos estadísticos se pueden utilizar
\.,on igllal Clic.1cia lina varicd3d de modelos para describir el patrón de
tasas de 1.1citada tahl.l 15.1. Si el objetivo es simplemente la descripción
() ~I desarrollo de un modelo COI1 propósitos predictivos. seria defendible.
;I la hora dc escogerio. colocar la economía de descripción por delante
dc olros criterios. Este proceso puede justificar. para un análisis particu-
lar. la seleccii)11 de un modelo que exhibiese ausencia de interacción y
()rrecicse. por tal1to. una descripción más parsimoniosa que otros mode-
los alternativos. EI1 un proceso asi. la interacción entre factores depende
\.,omplct.lmcnle dcl modelo: su presel1cia o ausencia es un artilicio esta-
tlístico qllc indica lo biel1 que el modelo elegido describe los datos y
carece de implicaciol1es a erectos de inferencia. más allá del modelo
mismo. Entendid.1 desde este plinto de vista arbitrario. la interacción es
I c4uivalcnte al col1cepto de modificación del efecto. que igualmente se vio
qllC cr,1 lil1 \.'('IICCptO arbitrario dependiente de si el efecto se medía en
tcrmil1os absolutos o rel.ltivos.
El '-111~11isis epidemiolól!ico. no obstante. intenta habitualmente ir más
all~1 del modelaje estadístico. El concepto de interacción estadística.
vil1clli.tdo \.,omo est~l a la .1rbitrariedad en la elección del modelo.
prccisa lle il11crpretacii)n epidellliológic.1 porque 110 descansa en un
rundamel110 teórico explícito. Si no se hace una implicación de inferencia
llllC vay.l m~ls all..1 dcl modelo. un concepto puramente estadístico de la

u il1tcraccii)11 110 p()dria contribuir '-11'-lnálisis epidemiológico


llllC tuviese sel1tidl). Este hecho queda suficientemente
de una forma
bien ilustrado por
la il1lCrprela\.'i()11 dual qlle emerge con respecto a la presencia de interac-
~ \.,iilll csladistic~l a p.lrtir de las t.IS.1S de la t'-lbl,-1 15.1. Si el fenómeno fuese
~~~ "implemcnte lil1 illvento estadístico que permitiese interpretaciones con-
tr,lria$ .1 partir de los mismos datos. no podría contribuir al conocimien-
:~ I() ciclltífico.
¡

DEr-INICION DE INTERACCION
~
Utilizando como marco conceptual el modelo causal general presentado
I.:n cll.::lrítulo 2. resulta rosiblc desarrollar una definición no ambigua de

1 1.1 intcr.tcci()n
stlliciclltcs
epidemiológica.
UC cnf'crmcuad
En dicho modelo se veía que las causas
comprcnden un.t constelación de causas com-

:]

I
--"':.;
:~

j~~'
.::~;:~~~~~~~~

r-. .~;.

35(1 EPIDEMIOLOGI" MODERNA ]


.;
p()11CnIC~ qllc .<;CcorrC~p()11dcn C(\ll lo", raCI()res illdividllales qlle son el ;
..
(\h.icl() dc 1¡¡ inrcrencia bllscad~1 en cl an~llisi", epidemiológico. A direren.
Ics C.lllS¡lS ~lificicnle", dc cnrcrmcd~ld le", c()rrcsponden mec~lnismos cau- 1
~
~alcs dirercnlc~. Si dos C(lU~(lS c()mpOnellle", .lClúan par(\ producir enrer- '1
ml:(I(\d
mclllc
C11 r()rmil
all!lIn()s
dc C.lll!\a
C.l!\(\!\ de la misma
!\lificicnlc
para
c()lnlll1.
l(lS cuales
.lp.lrcccrilll
I~l"' dos causas
c()n~ccucnIC-
compo-
Fl
i
I
!
ncl1lc!\ c()mparlCn I¡l rcsp()n",ahilid(ld c.lll"'al: cn allsencia dc cualquiera "
~
(\l. clii'~. csl()~ I:.'S()~ II() (Il.llrrir;il). 1:~t;1 t\)r.lrticip.lt.i()11 CII lil1.1 C¡lll~a
Sllril.il.nt... Cs 1;1 h.I~1: <:()I)<:t'rtll;11 (¡l. 1;1 illtrr:,cci(,ll.
Si (\it.h.l\; (1()s 1::llIS:I~ 1:()I))I)(llll.llll..~ ;ll:tllal1 Ilnicamcl)tc :1 Ir:lvC~ de
t.:'ll~a~ ~lifil:icnlCs difcrcntcs. SllS al.ti()I)('~ S()11 C()11CCrlllalmcnlc il)(\Crcn.
dicl)tCS. Par:1 l.1 cpidcmi()I()!!iil Ic(,rit;1 rc!\lIll;1 axjom(ilic(\ q\IC cl crcc1o
(\h\;(II\lt(1 (\r lIlla Call!\a C()mp()nCnlC ilnica sc midc p()r 1¡¡ l~l~a tlc illciden.
~:;
t.iil l\IIC corrCSr()ll(\r
i,)cill\,CI1 cl r;lct()r
¡¡ 1;1 la!\i'
cn cllcsli¿)n.
dc otllrrcllCi:,
[sla
dc I~IS call~as sllficicntes
la~¡¡ n() pllede ~cr ob~er\'ada.
qlle
pero ~i
~
~ I ~:
inrcri.d.l: cnlrc It).c; CXplle.c;10"' a lin¡¡ C.lll~a c()mponcnle. la la~a de inciden-
ci¡1 dc cnrcrmcd(\d es la !\lim3 dc la", la~as de ocurrencia de do", clase~ l "
I ~

distintils
(Icurrcnci¡¡
dc call~a~
d(' Cilll"'~IS
~lIficienle~.
~lIrlcienles
Un,l
quc
p(\rlC
Conlienen
de la suma
e) faclor.
e~ la
que
lasa
es la tasa
de
;; ~
¡ ;

~
l\lIC jntcrc~a. La ()Ir¡¡ r.lrle es )¡¡ lil~a dc ocurrcncia dc las causas surlcien-
J I ~.
Ic~ qllC C.lrcccn del mi~m(). Si n() cxi!\IC C()nrllsión. esla úllima tasa se
.:' ~
:c
<:(Irrcsr()ndc l¡¡mhicn c()n ¡¡¡ l(l~a cl1lrc )os n(l-expueslos. Por ¡o lanto. ¡a .,
,.

dircrcllci;1 cntrc las l;l!\aS dc ocllrrcnci(\ dc cnrcrmedad en expueslOS y no- .: I ~


"
: .,
l'XrllCSI()S c()rrc",pon(\c al ercClO ah!\0¡lII0. es dccir. a 1(\ lasa de incidencia
l
dl. la mc(\i(I;1 cn q\l{, sc c()mpICI;ln l;lS C('lISas ",uricienle~ quc contiencn l.l
l.:IIIS;' l\)mp()I)l.l)ll. (ll' ill1crcs. Si cl r;lclor ~c rcprc~cl1la por If. podcmo~
j I
rl'rrcsl.'l)lar csla rclaci()11 dc la si!!uicIllC mallcra: "f

~
~ ~
I
~ .,
.,
(). CIl Icrmill()~ dc la~ (I:lrla~» cau$ale~ que corre~pondcn a loS compo-
I1C'1lc~ dc la~ medida~ epidcmi()lógica~. i...I
j

,.-- ffi [CVJ {:


=

[ J G
u;
<

~
';' fl
Ij
I

..¡
~. !
ti('llt1C l! rCrrCSCIllcl Cal1s:ts C()mrmlCl1leS dc cl1rcrmcd,ld de$con()cida$ o
r()1111)('I1CI1ICSllllc simrlcmc11tc 1l() cslil11 csrecificad,\~ el1 e$le an{llisi~ en
rCIrlirlllCIr. /\si rtlcs. mcdir cl CrCCl(' tic la cxr()Rición A rcql1icre sepnrar
l'1\ Uf'S l"()mr()11Cl1lCS la laRa dc ocurrcl1ci:t dc la enrermedad enlre genle
l\tlL' tiL'I\L' tlil"lt:, cxl'osici(,11 /1: U11rrimcr(' quc rerreRenla lo~ epiRodio.<; de

.L-'l

~j

~t~

il~¡' ;llil ~. i:~m~


¡~~

~
--;.-~-.-;
".:-,--
"'. ¡':}f
~~~f:~f:~~~:i:
,.~ ~1:!f\~\~~: ~T~~~

.:~.:
:::::~.;;:

1 IN7ERACCIONES
ENTRECAUSAS 351

L'llfl.:rmcdad quc resultan de causas suficientes que la incluyen y un


';i "L't!Ulldo que representa los que surgen de mecanismos que no la inclu-
YI.:Il y rara los cu.\lcs tal exposición a 11 es incidental.
Si ampliamos el mismo modelo a una segunda causa componente
L'SI'l:L"iri<.::I(la. /J, 11ahr:'\ cu.\tro clases de causas suficientes de enfermedad
:1 ((IIISi(ll:r.lr: .I<.1Ul:II.IsqllC ticnen tanto ,l 1I como a E, .\qllellas con A pero
11(11:(111 II. las 4llC ticllcn .1 /J pcro no a 1( y lus que no tienen ninguna de
1
l'II.ls:
:J

1
I.a !:!t:IIIC CXrllt:~I:1 .1 ,.1 y 11 pucoc ocsarrollar la enrcrmedad a partir
\Il' t:uallluicra llc I:~la-" cl~lscs OC mcc~ll1ismos. La tasa oe ocurrencia de
11)smcc~ll1ismo-" completos que col1lienen ~l /I y E. que corresponde a la
I mctlida
ructlc scr ~lb~olllta
llclil1id~l llelt:omo:
erecto inlcractivo de los ractores .4 .v E en cuestión.

II) -:-: R( ,.1 n) -R( ,.1 m -R( ,.1 E) + R( AB) [ 15.1 ]


1(

¡c

¡
~~

~,
~
~-
!i'

'--
@ ,,'
j:
.,

~
~
'é-:
:¡¡
"
;;
¡;
r;
.;
~
~
!
:1

i
R(/IB) = R(iliJ) + R(AB) -R(AB) [15.2]
,
(
"

1-) !'

R(A B) -R(,;r m

ill [15.3]

il ...
~.

~;~~.
.,;::.);;:

~~~\t';' i;I~;:lr;~'[
3!i:' EPIDEMIOLOGIA MODERNA

.JC\ I.IIIL' rL'rrCS(.'lll:1 lil l'()11Úil'i()ll (Ic :1(lilii\'iú;11.1 Úl' I()s crCCI()S í\hs()lliI()S o. I()
I.llil.. I.'S 1;1 mism:1 l'()S:I. 1(1 '111ir()rllliú(I~1 Úl.. I:IS ÚirCr(.'11Ci(,S dc las(ls ÚC UI1
r¡II..I(lr ¡1 1(1 Ií\r~c' ú(.' I()s cslr:ll()s ú(.'1 (1)lrc). Sc puCÚC rcrormular I.. cxprc-
SiC'11 11.l\.)J (.,11 Icrmi\1()s d(.' Crccl() rCI¡llivl.l lvé(,sc rórmUI,1 [ 4.1 ]). dividiel1-
Ú(, r(11 R( ..T7jl:

J~'~(.."/) - = [1~1{(.1Jj) -I] + [I~R(ABJ -I] [ 15.4]


I ;1 J,)l.(II(I:I I~I{ .-I h:1 sid(1 dcscrj(¡1 r()r C()lc ~. ~1(,cMah()n (19711 com()
.'l.\l.\..S(1 dl' rics!.!cl rcl;¡lj,.()\). Lils cxrrc.'ii()l)c~ [ 15..1.J ~. [ 15.4J indican que.
h;li(' 1;¡ C(llldi~i()I) dl' il)dl'rClldcJ1ci¡l. cl CrcCI() c()J1iunl() de dos raclore~ e~
i.;!11;¡1 :I 1:1 Slim;¡ dl' I(,s CrCC()~ dc c:ld:1 raCI('r cllajld() :lcllla sill el OlrO, se
11)i(I;1 :1 djcl)(,s CrCCI()" cn tcrmill()s :lhsollllOS () relativo~. El grupo de 00
r\..rl.1 \..J)l.I;1 dl' I:,s C(,mr:lr;¡l.il'J)CS dchc ~cr cl grllpo no-expue~(o ¿¡ niJ1guno
lt,: 1(" 1:lr()rc,<; L:I adi(ividilu u~ eICCI()~. ab~()lutos o relativos. es el
1'llll((' (,11 rcrcrellcia :II cllal dcbel) medir~e 1i1.<;.<;epar()cioJ1e.<; respeclo de la
',...

il)UCpCIlUeJ1ci:1 dc :lcci(')1l qtl(, lieJ1en sigJ1iricado. Lo.<; modelo.<; estadisticos


t"om(1 1;1 rcgresi()1l I()gi~(ic:l. qllc plal1tean implícitamenle definiciones de
1:1 i 1)<.1crCl1dl'l)l.i:l :II (erll.11 i vas. careccl1 col1.<;ecuentementc de consistencia
L.('ll 1(1~ cimi('I)()s cri<.1cmi()I()gic()s Icoric()~ d(' dond(' se derivan la.<;
1))l.llid:" ha~ic:I~ d(' lil cpi<.1cmio¡o!lia. E~(o qlliere decir que. ror e.iemplo.
11(\ s rllcd:lll lItilizar moucl()~ mllllirlica(ivo~ rara evalllar ereclos inter-
ac(i\,(,s: <.Ir 11l'cI)(). sc Ics rllc<.1c lIlili7.ar. pcr() 110 el1 l.I rorm.1 habilual de
L.S(II1)ar e! c()cricicl1l(' dc tlll lcrmil1(' rroduClo del modelo. Ha~ que
l.\alll;lr 1.1 iI1(Cr:l~ci()I) S()hrl. tll1:1 cscal:1 ilui(i\.a. com() .<;c cxrlica mil.<;
:lucI;II1(l' Cll l.S(C ~;Irillll().
L.a ill)r('rlallCia dl. adllcrirs(' ;1 1:1 dcfil1ici(')11 eridcmiolo!!ica aproria-
ll;1 dl. ill(l'raCl.i(11l c~t;i illl~(r:l<.1;1 ror lIO cstllui() col1cebid() parn e\.aJuar la
iO(Cra.l.l.i()n Clllrc alllicul1ccp(ivo~ oralc~ e hirertcl1sion en )a génesis
l.all~:11 dcl accitlcl1le \a~cllJar cerahr:ll CI1 mtl.icre~ .iovelle~ (Gruro de
lr:,ha.i(, Cll C()):lbl)racioI1 r.lra cl C~IUlli(1 dcl accidcntc ccrebrovascular
l.11 Illll.icre~ .i()VCllCS. J 975). Ell 1i1 tilhl:1 1-'.2 e~lill1 resllmidos los re$ulla-
tl()S Ul' esle e~11.1di() tlc ca.<;o~ ~' col1lrolcs ~ohre el a.\'.c. Irombótico. Nótese
qlll' l.:IU;1 cslimadll del rje~g(1 relativ() uliliza la mism(\ categoría de
I
rCrcrrJlcia: m1.1.ieres qllc 11(1 lItiliz~lb:l11 al1tiCOI1CCplivo~ orales ~' quc tenían
I;: rrcsi()1l ilrtcri:ll l1ormal. Lo.<; U()S r~lclorcs dc rie$go poseen una rela- ¡
t.i()1l mco()~-qlle-mllltiplicali\.a, p1.1C~I() quc )os estimados del riesgo para
C;¡<.1:I r.,L'lor ell au~cl1ciH dcl otro, cuando se les multiplica. dan un I:
l'r()dllClll mayor C.¡lIC cl e.<;limado dcl ric~g() relativo observado realmente
c
l'11 Illll.icrcs qtlc rUSCi~11l :Imh()~ rHL'I('I"CS dc rjc.<;go. Sc hahria $ati$rccho
1111:1rl'I:ll'il)11 mllllirlic~lliv(1 .<;i las mtl.icrc.c; con ambo.<; raclore~ de riesgo, I:
1)i r('rlcllsi(,1l ~c\,cra ~. liS() dc :I1l1 ic()llL'crl ivos ()rales. I tlviesen un riesgo J
rL'I:11 i\'(1 dl' .1..1 x Ó.lJ = 21.4. CIl VC7 dc 1.1..ó. qllc fuc el valor observado.
S(\I.,rl. 1:1 h:ISl' tlc la :IS1II)Ci()11 illsrrl:1 CI1 I()s modclo~ de ereclo~ I:
iI1(IL'1'cJ1dicIlICS mllllirlíL'ali,.(),';. C~I('s (11)~ facl()rc~ ue rie$go manifie5tan
111);1 illlcr:l(.'ci()11 I1c!!~lliva II «al1la!!l)11isIl1()). P()r cl col1trario. cuand() se
C()11Slrllyl. I.1 illdcl.'Cl1dcl)cia C()m(1 ~Itli(jvillad dc creclos, exhiben una

..
-~::.y:;:~.~'::~;.
.::~:::~~::::;:
;;:."::;?;:.,
:¡;~~::::~.

"..
-
...
:;{:i
::::0::-::;:.:.-';;
:~~:.:~~~f~,':::,
.,,-., ~ ..
:~~;,~
¡:f~;t~. :::.:;;:~~\;~
~:~:~1~J~!:~~
.di

l INTERACCIONES ENTRECAUSAS 353

T abla J 5.2. R i{'.,".({n relal il'() Je (Icci(l{'nle l'(I.,"clllar c{'rl'hral


I/"(mlh(ili(.(} .\.{'~Iín N II.'"(} lle a}llic(}11Ceplivo.," (}ral('.," .,.la
.,"{'!,{'}.iJlld (le la hipl'rll'n.,"i(jn ( Grllf1(} (le Irahai(} en
(.nlah(}raci(in par(l {'I ('.,"IIIJin Jel accidenle cl'r{'hr0!'(I.,"('IlI(lr
('11 mllil'r{'.," iñv('11e.\,. 1975 )

Anliconccplivos orulcs
Uso

J Sí No

Severidad de la hipertensión
Severa 13.6 6.9
.1 1.0.
Normal 3.1

.(..aIC!:!llri:1 tic rcfercncl:l

il'tcr:lcci()n positiv:l () «sinergi$mo»). pue$to que el exceso de riesgo relati-


\'(, (Ic I()s quc ticncll :lmhas expo,';iciolles e.,; mayor que la suma de los
ril;S~()S rcltltivos L'11 cxcc.';o de ctld.1 ractor col1siderado aisladamente.
I):lr:l ClllSO de antic()nceptivo$ ort11es sólo. dicho exceso de riesgo relati-
V() ~s 3.1 -1.0 = 2.1: para la hipertensión arterial sola. 6,9 -1,0 = 5.9:
par,1 ambos ractores la cirra es 13.6 -1.0 = 12.6. mayor que la suma de
~.l) y 2.1 (Ios rics~os re!,ltivos de 1.1Tt1bla 15.2 pueden ser comparados en
1,1mism,l form,1 que It1S tas,ls de la 15.1. porque los estimados del rie.,;go
rl:lativo tiel1el1 lodo~ ul1a categoria de referencia común). Si el estudio de
1.1il1tcrtlcci(,n iucse s()lo cuestión de conveniencia estadistica. la elección
l:lltre do!\ interpretaciones ,lparentemente contradictorias. antagonismo
por un It1do y sincrgismo por otro. dependeria totalmente del modelo
m,ltemillico utili~,ldo para definir cuál habria de ser el riesgo de las ~,
~
mujcrcs quc luvic:-cn ,1mbo$ ractores de riesgo. si dichos ractores de ,.
..

ric!\go fuc~cl1 illdcpcndientes. En ~u informe. en lugar de la aditiva. los ;


it
-
~lutores eligicrol1 usar la definición multiplicativa de los erectos indepen- :-:
~
d icnle.,;. ~
~
r:1 uso de UIl,1 uefinici()11 de independencia inapropiada viola algo
~
m:is quc simplemente un conjunto e.,;téril de axiomas epidemiológicos: la ¡;.
..
;,
iI1ICrprettICi()11 prilClic,1 y biológica de los erectos interactivos sigue los t:
\
prillcipios cpidemiológicos ( Koopman. 1981 ). Consideremos qué que- )
~
rian conocer los illvcstigadores en el ejemplo del a. v.c.: ¿tiene más peligro
clu.,;o de anticonccptivos orales para mujeres con hipertensión que para
I
la.,; normotens,lS con respecto al riesgo de accidente vascular cerebral'? Si f

!()S dos riesgos son independientes. eso debería implicar que una mujer t
informada que arrontase la decisión de utilizar anliconceptivos orales y
s()pcsase en dicha decisión el riesgo de surrir un a.v.c., no necesitaría
Ici'l:r cn cucnta SU rresi()n ,1rteri,11. 1ndependencia significa que se puede
I rc:1lizar la C\,:lIUt1Ci()11del rie.,;go de los anticonceptivos orales sin referen-
l.:i,l a la tcnsii)11 ,lrtcri,ll.
Lo quc ~l; sigue ,de esto es que una interacción negativa debería

J
-~~

~~:
c-",;:~.
~fIJj~J
1
3~4 EPIDEMIOLOGIA
MODERNA

implic;nr. partl U!1(1 usuarin de las citadas pildoras. que la hipertensión.


mils nllil del efcct<' que tiene por separad<, sobre In incidencia de acciden-
te cerehro\'ascular. mitiga el efecto sobre éste de los anticonceptivos
(1ralcs. e!1 tal1t() In il1teracciól1 positiva deberia implicar que la hiper-
ICIJsi(1IJ. adem:ís dc 5\1 propi<, cfec;to. exacerba el de los antico!1ceptivos
(1ralcs. UI1 sistema dc il1terpretac;iól1 dc erectos il1tcr(lctivos que permitie- I
s...' simultill1camcl1tc \111:1il1tcrprctaci()11 dc mitigncii)n y ex(lcerh(\ción de ,
,
\in rics.\:!() biol()!!ic;o a partir de los misl1Jos datos no puede ser\'ir para un
J'r<1r(1slto cicl1tific;() lltil. <)lIeda tlquí claro. pues. q\lr la arbitraried(ld
il1llcrel1te al c;ol1cep1o «il1tcraccii)11 esttldisticn» debc ser est\ldiadamente
c\'itadtl en los COl1tcxtos epidcmiol()!!icos. cualquiera que fuesel1 las exi-
.!:!CI1C;itIS esttldisticas, UI1 epidemi<)lo!!() 11<' p\lede acepttlr una defi!1iciól1
dc il1teracciól1 ttll1 reltl.inda com(' partl permitir q\le los datos de la tabla
I ~,.: scnl1 il1terpretados como sil1cr!!ism(, por algu!1os investigtldore5 ~'
;IIJta~()11ismo por (1tros: U!1:1 de CSltlS il1lerpretaciol1es. como minimo,
dchc ser il1corrccttl.
El \ISO por pt\rte de los autores de U!1 criterio multiplicativo de
ilJdcpc!1del1cia co!1d\lce a Itl col1clusió!1 inapropiada de que el efecto de
1(1Stll1ticol1ceptivo5 oralcs sobre el (i. \',c. es mayor entre mu.ieres normo-
tCI1StlS que e!1tre mu.icres COI1 hipertcnsión severa: eslo es, los anli-
l"ol1ccpti\'o~ Oralc5 SOI1 mil~ peligrosos el1 relación al a. v.c. para mu.ieres
11()rm()lCn~a~ q\IC J¡ipcrtcl1~as. Ul1t\ linca dc l"ol1se.i<' basada en esta inter-
prctaci¿)11 iritl cl1camil1ada. Il).!:!icamenlc. n las mu.iere~ su.c;ceptibles frentc
;11 cfl'l:l(\ dc los íllllicol1l"cpti\'os orilles. ;1 stlhcr. 1(1$ mu.iere5 con una
J'rcsil1lJ artcri:11 l1orlllíll. E:11cl d(\t'\IIllCl110. dc 11ccho. It\ (Idvertencia que
s...' cxrlicitílh:1 cr:l: «,.. crccllIos q\le 1(1s aIlticol1CCptivos or(lles 110 debe-
rial1 !\cr \Itiliztltlo~ por mu.icre.c: con l1il1gl111 grad() de tensión arterial
t\lttl" ((Jrup() dc trtlha.io Cll COltlhoracióll pt\rtl el estudio del accidente
ccrchro\'tlscult\ r CI1 m\l.icrcs .ió\'el1cs. 1975 ). Los a lItores no ofrecen justifi-
ctll"ióll al!:!un:l por 1:1illcoll~istcllcia I¿)gica que existe entre sus datos y su
l'(1IlCI\ISil)l1: empero. ésta scilala q\le. dc alguna manera. los autores han
dchid{, darsc cucnt(1 dc quc S\J inicitl] a~uncióll metodológica sobre la
illtlcpclldcllci:l hacia a!!\I:I por tllgul1tl partc.
l:.11 colltliciol1es de situación e~tahlc. el Illlmero dc C(IS0S de una
cllfcrmctlad que OC\lrrCI1 ell Ulltl pohltlción dill¡ímic(1 libre de ella es
proJ'orcional ,\ la tasa dc il1citlcl1citl. Si \111(\~ClltC dt\do. la exposición A.
tl\lmcllta Itl ttl!\a tIc i!1cidcncitl cl1trc \111s\lbgr\lpo de la pOhJtlCióll que
ticllc Itl cxposicii)!1 B ell cal1tidad ahsolllt:1 m:l~/Or q\IC elltre cl s\\bgrupo
:11 qlll' Ic falt:1h:\ dich:l exp()~il.il11l H. 1:1 cxp{)sicii)n II prodllcirtí mt'\s
CíIS(1Sdc 1:1cl1fcrmcd:lti clltrc \ll1a pohl:lci()n q\IC tuvicsc 1,1cxposici¿)1l H
q\IC cl1trc lilla p()hlacil)11 del mismo talll,\ño no exp\le~la a E, En conse-
cliCncia. los co~tos cn términos de salud pública de la exposición A serán
ma~'orcs para In suhpobl(\cióll expuest(1 a B quc para la subpoblación
11('-cxpue~ta, Por el col1trario. si la suma de las diferencias de tasas de
incidellcia t\tribllible~ sep,\radamcnte a las exposiciones A y B fuese igual
a la diferencia Cll ttIS,\S de illcidencia entrc los expuestos a ambas )' los
CXJ'lICStos tl !1ill~\llla de cll:ls. los costos elJ términos de salud pública de

~. 'c" .C'-, ".,.c :":

:~:.[~~j
¡~,~.'

~~:~il
~
' :.::.; ,.{:;;,;-.
,-.,- -

:~~.\~~~;
..~,

~~~
:cc
..:.~;...,~ ;",,;:,:,,;,.;;,;:.;,.~,,~:,~;,;;;

INTERACCIONES
ENTRE
CAUSAS 355

1:1cxposici()n :1 cu.llquier:l de los agentes no estarían relacionados con la


c.:xposición .II olro ( Rolhman el a/.. 19RO). Así pues. en términos de salud
rllblica. 1.ls consecucncias de la interacción entre factores son la manifes-
t.lción aplic.lda .1 una población de la definición biológica de interac-
I:i()n ~ntrc I:.IUS.IS I:omponentes de una enfermedad.
Lo in.lpropi.ldo de utilizar un modelo multiplicativo para describir
cfcl:tos indcrcndicllles es c~pecialmentc importante a la luz del hecho de
l!ue la mayoria de los .Inálisis epidemiológicos incluyen tal asunción.
i\lgunos .lnálisi5 la hacen explicita. como el estudio en colaboración
-,I)hrc cl .I.V.C. En otro~ 1.1a~unci()n estil implícita y surge del uso de un
mlldclo mullirlicUlivo. como puede ser la regresión logistica. o de un
:111:ili~is I:slr:ltifit:~It1I) cn cl quc sc asumicse que la razón de tasas cs
llnif<)rmc :1 lo lar!:!o tic lo~ c~tratos. Dicha asunción de una razón de
t:lS:l~ Ilniformc rllct!c scr <Icrinida como convcnicncja estadística en si-
Iuacione~ en I:I~ que no exista interés en realizar inferencia acerca de
inleracción entre la exposición y la variable de ~lratificación. Si la

J inlcr:ICci()11 cs dc illlcres. no ob~t.,nte. asumir uniformidad de la razón de


las:ls rc~ulla nl) scr :Ipropi.ldo porque rl.lntca un.1 descripción incorrecta
tic.: 1:1rCi:lt:wll c.:.,iSIC.:IIlC cntre los factorcs dc riesgo bajo la condición de
illtlcrcntlcI1C.:i:l. 11)(IUC h:tcc tlilicil ju7:g.lr dcsviaciones de la misma. Sí se
ricns:t 4uC 1:1rclal:i()n el1trc los f.lctorcs cs multiplic.ltiva sobre la base de
lIll 1111)tlclll hill/il~il:l) c.:spccilico dc interacción. una razón de lasas unifor-
InC o llll mot!elu II1l1llivariado multiplic.1tivo son aplic:lbles para el mode-
I.lje ll~scriplivo. pcro esc objetivo descriptivo difiere de lo que es inferir el
gr.ldo de des\"iación rcspecto de la independencia de acción que tienen
<.Ios o más f.lctores.
L~l simplicid.ld conceptual de la idea de que interacción e indepen-
I dcnci.l corresponden. respectivamente. a la acción conjunta de factores
en un.l o m:is c:tllsas suficientes ya la acción separada. en causas
suficicntes difercntcs. h.\ sido cuestionada por Koopman ( 1977). Argu-
I menl.lb.1 que en 1.1medida en qlle las c.1usas complementarias
~I)mponentc~ indcpcndientes
de causas
comparten clcmcnlos comunes. los efcctos
de I.I~ C.IUS:tS quc .Ictll;¡n :1 tr~lvés de mecanismos separados no son
L'OmpICl:lmcI11\.' illllepcndicI1tC$. Si d()~ faclorcs. por ejcmplo. .4 y B
] prot!llccn cnfcrmcll.lt! .1 Ir.IVC$ tic (;:tU$;¡~ slIficicntes ~eparadas con una
(;~Iu$a complcmcnl.lri.1 llnic.l. (.. lle form.1 que !IC y BC fuesen cada una
causa~ ~uficjentcs. enlonces !(,4m en la ccll.tción [15.1] es negativa.
implicando que los factores /1 y B son .1ntagonistas. En términos biológi-
jj
cos .4 y B son factores que estarían compitiendo por un único «depósi-
to» de individuos susceptibles. los que tienen C. Si el conjunto de causas

J componentes complementarias para los factores A y B comparten uno o


mils elementos comunes. habrá cierto grado de competición entre ellos
por las person,ls susceptibles y en ese sentido también cierto grado de
1 :Intagonismo. Sólo si los conjuntos de causas complementarias son com-
] plct.lmcnte distintos. sin elementos comunes. A y B serán completamente
indcpendientcs.
L.l competici()n por individuos susceptibles es presumiblemente un

,.~~¡¡:;
;~~~~.
..:;::-;¡;,
;:;:;::;;'-,~,::';:i:;! ,

~
",::-:;i-o,:
.-/.;:~:~

2d!;Ij !i!18~; ":1~.

-f¡.t;

35(; EPIDEMIOLOGIA MODEnNA

rCIll}mCn(1 comlJn. ¡.ln\'~llid(l e~te rCJt()mcJt{1 cl p()~tul~ldo dc quc las C~IU-


S¡IS L'()mpOncnles quc ~lctu~ln cn caus~ls suficientes distintas son indcpen-
uicntl:~: Supon.!:!~lmos. por c.icmplo. qllc 11¡1) das C~IUS~IS~uricientes rara
1111¡1l'llfl:rmCU¡lu. c()mo Cl1 1¡1 ri.!:!ur¡1 15.1,
( .I:~ 1111¡1C¡IU~¡I n<.,L'csari~1 ) cstit prescl1tc cn ~lmh¡IS C~lliS~IS suficicnles.
¡,111tcr¡lL'cion~1 .4 COIl m ,)uc~t{) qu<.' r¡lr~1 A y IJ ~c d~1 cicrt~l surcrrosición
Ul' L':IU~¡IS complcment~lri~lS ---~I ~~Iber. c-- /f y IJ deben competir por el
«dcr()~ita)1 de ~usL'ertibles qll(' tiene C ~.. por tanto. son antr1ganistas, Se
I r;lt:1 <I(' UI1;1 form~1 in<lirl:L't¡1 de ~lntagoni~mo. d~ldo que podcmo~ im~l!!i-
11¡lr f(1rm:1s mils uircct;ls. cn I~\s que lill cfccto resultarírl de alguna
11l:lnCr¡\ hloque:1d(1 cu¡lnuo Ir ~' R e~tll\'ie~cn rrc~cntes .junta~. Un c.icm-
pl(\ sl'nL'illl1 UC CSt:1 r()rm¡1 uircct:1 dc ~Int:t~()ni~mo podrí~1 scr una qucm(i-
(111r;l qot' fuesc rc~ult¡ldo ucl L'Ont¡lcI(\ L'()II 1;1 ricl uc ~oluciones fucrtc-
n1C111l' :11L':llin:ls (I rucrtcmcntl' :íl"id:ts: CIl 1:1 mc7.c);I. 1:1!\ d()s C:IUS:IS dl'
qIIL'11J:I(lur:1 Sl' IJl.'lltr:tlii'.:lri¡lll litl'r¡llnJcJtll' U11;1 :1 1:1 ()tra. Il:I~I:1 n(1 rr(\-
Uli(ir ItiIJ~IJI1 crect(). UIl:t rorm:t Ul' rl.'rrcsclltar di:lgr~lm~ítican1clltc );I
r()rma illdjrect~1 d<.' ~lllta!!Olli~mo quc rcsulta dc lil comrctición por indi-
viduo~ ~usceplíhle~ se muestr~1 en la figura J 5.2,
f es 011 f¡lctor comrlcmentario con C y re~ult~l tanto del comrleja AD
(()mo ucl BE. Pue~to que C es necesario para la enfermedad. podemos
(
c()llsiuer~lr qué sc rcquicre rara una causa suficiellte entre los que tienen
(.. En c~le i1mbito re~trictivo. los factore~ A )' B son inderendientes.
rue~t(' que )1<' h¡I). ~urerrosición de su~ cau~as complementarias. El
tl'Jll:I est:í CIl qllr cl modelo de cau~a~ ~uficicntes ). comronentes es una
l"(1nccrtu;lli7.¡ICi()11 -,in1rlc. rer(' comrlct~lmente general. que ruede ser
I~
l'!al)()r:ld I r~lra dar ~Il'omodo ;I modeJos causales más comrlicados ya
tl"(1' ui\'L'rs().<; <il' inlcr:tcri()n. ror t~IIlI('. cl argumcnt<, dr Koorm¡\n no
()hli!:!:1 :I ~11')~¡l1don.1r cl l11odelo casual componentes-suficientes como Ir I~
l.(1nL'Crtll¡lliz~1ción dc 1¡¡ inter(iccion.
"1)Orm:l11 (19i71 ha scñ~ll;ldo t¡¡mhién que sc rueden rroducir inter-
¡tt:l.i,1n(.'~ dcl')iuo ~I c()ncxi()n<.,s C~lus~llc~ Clttrc varia~ cau~a~ componentes I~
u C:IIIS:lS suficientcs diferentes. rero facilmel1te también se puede dar
r
c:lhi(l:I ¡1 esta el~\bor~lndo el mode)o. Existc presumiblemente un meca-
nlsm(\ cau~al que col1duce como result~ido a la acción de cada causa
Ir (
l.()mpOllcntcs en rarm~1 de c~lusa suficiente: I~I sencilla representación de

I~
a

I~.
(

"'
I~

'.-i~. IS.I. l)(I.1 ('m/.~(lol ,IO,!(¡(,;(,111C'.t;,1(' ('/!ll,rme(I(ld ('(11/ 11110 ('(/11,\"0 ('(JmpOI/C'l/l('
111/1/11/1.

~':ij~;.

.
:~~.
,~~Ir
.',; ::~rt

~
1[~;
:.~~;f~t~~

,
~ .1

..,#'

I:il!. 15.2. !),1\' ,'(11',\11,\ \'II/it';('111t',\' tlt' l'II!(".lllt'tI(lt1 /'(III 1(11(/ t'(//I,~(/ ('(}/1Ipml('llh'
'"11/,,111,.

1;IS \¡Irtas t::llisalcs no sc prctende que describa complejidades semejantes.


rl:r() tampoco las Ilicga. Puesto que el agrupamiento de causas compo-
Ill:ntcs complementarias en causa suficiente no puede por lo general
I.'spl.'t:ificarsc m(is allil de un nivel superficial. excepto en ejemplos singu-
lilrl.'s I) rl.'hllst:¡ltl()S y pucsto que la distribución habitualmente descono-
t:itla tle estas causas t:omponentes complementarias. en una población
tlatla. innucl1ciar:i el grado dc scparación respecto de la independencia
(Ic efcctos dc do.c; call.C;as componentes que actúan en causas suficientes
tlift:rt:lltcs. la c\,¡IIII¡ICi()ll tic la illtcraccióll causal 110 re.c;ulta posible con
IllUch.1 prcci.c;ii)11 exccpto el1 casos extremos. ( En realidad. eso mismo se
1)1)(lria dccir accrc.1 tic Itl evtlluación de la acción causal en si. puesto que
la dCSCol10cida di.c;tribución de ci.lusas componentes complementarias
dctermintlril Itl magnitud e incluso la presencia de un efecto en circuns-
..~ tal1cias cspecífictlS.) Por ejemplo. si se observa que dos factores nunca
tI
po.c;cen un efecto. se lo defina como se quiera. en ausencia uno del otro.
J
pcro pOSCCI1 un efecto cuando actúan (juntos». es lógico concluir que
ambos poseen 1111papel en un mecanismo ctlusal común que conduce al
t'L'sultado. De formtl anilloga. un tlgente para el cual la curva de dosis y
t'c.C;pUC$ttles 1111~1 función a base de pasos. con un umbral agudo debajo
(\cl c;ual 110 hay efecto y encima del cual existe un efecto claro. mostraria
illtcrtlcción consigo mismo: es decir. pequeñas «dosis» del agente interac-
] t..i()lltlritln con ItlS dosis subsiguientes para causar dicho efecto (Rothman,
I t)74). Por fuertl de tales ejemplos extremos. sin embargo, para explicar
1111con.iullto de obscrvacíones que implicasen dos factores de riesgo se
\')llt:dt:n haccr Ilipi)tcsis acerca de una amplia variedad de posibles meca-
Ilislllo.c; Ctlustllcs.

:~~~;¡¡í
-,$
,¡~.

~
358

t\1 EDICION DE LA NTERACCION

1):,r:1 L'\.:llli:lr 1.ls inlcr.,ccioncs h.ln si<.1() propllc~IOS mllchos m¿lo<.1os ba-
S:IU()S CI1 1;1 COI11prob.ICii)11 <.Ic hipi)lcsis cstadí~tic.l.C;. PoC()S <.Ic cllo.c;. sjl1
L'mh:lr!!(). ~c cenlr.111 CI1 l.1 cslím.lcii}n dc p~,ri\mctr()s quc orrczc:.ln alguna
il1lcrprCI:lcii}n epidemiol()~jc¡1 uc I()s creclos jnter:.,clivos :lnilloga a I~I
cslim~lci()n <.Ic crcclos lll1i(.'(}s.
IJ:I mc<.1i<.1¡1<1t' il1lcraCl.i()11 uCril1iU¡1 CI1 1;1 ccll:lcii}11 [ 15.1 J cs la al1illoga
par¡1 <.Iici1(\ Crcclos inlcracliv()s .1 1:1 mc<.1iua .Ihsolul.' dc ereclos senci.
Ilos: CJ1 1¡lnl() q\IC lal. dchc !\cr visla COI11() la mcdida epidemiológica de
il1lcraccii)n mils rundamcnt.ll (Koopman. 1981 J. Se la puedc reescrjbjr
a~l:

I(AIJI [R(/IB) R(/rn)]

:[R(/ljj¡ . 1~(/.rnJ] . R(,4B) .


5.5]
R(ABJ]}

CIl dl)ndc la eslruClur:1 dc la medida puedc ser \'isla como la diferencia


cl1lrc el cfecl() ah~01ul(1 dc 1.1 exr(l-"icióJl c(ln.iunlo a A ~' B ~' la suma de
Il1S CrCCll)S ahSl)lul(lS u(' .1 \ 1/ illdi~'idualmcnle. siend() \'alorado.<; cada
llnl) <.Ic los CrCCll)~ con I~( ,.i1JI Com(1 lasa dt rcferencia, A Ilerna I ivamen le.
1;1 I:IS:I <.Ir cnrcrmedad entr(' 10.1;con,illnlamcnle expucslOS se puede expre-
s:tr t'(1111(1

I~( 11) = R( -,m) + R(tlR) -Rr..ml] +


[15.6]
/« ,1/I) /~I 1..iRJl + J(...1nl

1(1qllC dcmuc~lra los compoIlclllCS adilivos de la la~a que se da enlre los


quc licllCI1 una cxposicióll coll.tullla como para ser 1.1 de fondo. también
O~ la ;rtrihuiblc al faclor A sólo. de la atribuible al faclor B sólo y de la
¡Ilrihuiblc a 1(1 intcracción (Apcnci.1 dc Protccción de! Medioambiente,
!()X(): \V.llkcr. 19RI). La prop()rción dc cnfcrmedad entre los que tienen
¡Imhas c~posicioncs qu(' es alrihuihlc a l¡l] ilJlerClCcióll es:

I(ABI
¡\P(/tB¡
R(An¡

A B
u

A +
+ +
,~
u ;

::~.-.".,.~.,-~

'~

.í~ :;@: ;¡i1


!~~~~~~:~.<¡t:

j)~~\\~~%~l
~~~~J
;:,"":...:-'-'

1 359
INTERACCIONES ENTRE CAUSAS

E$ti.l expresión puede ser reescrita en términos de razones de tasas


IL'!1 rclación COn la taSi.l R( ..m)) como:

AP(.4B) = [15.8]

()Ira medida de potencial interés epidemiológico es'

..\ P( A E)
@
¡\P*(/IB) = - =
.,\P(.-l .¡. E)

[15.9]

RR(A B) -1
f\.P(..t + E) = -- [15.10]
RR(AB)

Si se necesita estandarización. debería utilizarse en el lugar de


R R( II E) la correspolldicnte SM R para los expuestos tanto a A como a B
Cll rclacil>n con los expuestos a ninguna de ellas. ¡\P*(,.lB) será \00 por
I l ()O ~i !linguno de los factores. ni A ni E. poseen efecto aisladamente.
pero .juntos P%o<.\uccn la enrcrmedad. Sin embargo. AP(A S) y AP*(/t S) ~

¡:
ser;lll cer() Cll:lI\U() ll)s r:lclorcs tengan erectos aditivos. t

()tra metli<.\,l tIc i!ltcraccil>n qllc ha sido propuesta (Rothman. \974:


~ I~othm¡lll. 1976) es cl í!ltlit:e de sinergismo, S. definido como: ~
¡;
t
~
b
m
c,
'J
[15.11]
,~
+ +

::J =

':~

;~%:
~
La r.lz()n .) seril il!ual a la unidad bajo COildiciones de aditividad. excede-
r¡i a la unidad sí~la direrencia de tasas observada para exposición con-
l~~
.illllta cxcedc .1 l.1 magnitud predicha ~ohrc la base de la suma de las
f!r
<.lircrcnci.ls de tu~a.c; y seril menor a uno cuando lu aditividad de lo~
crcct().c; ~cparado~ predice un valor mayor que el observado. La presenta-
c.:i()n de la rórmula [ 15.11 J e~taba inicialmente circunscrita al ámbito de Jci
es
!:IS uirl'rCIlCias de riesgo. per() una rormulación ba~.lda en lus diferencias
u:.: t;JS:IS cs m.is SCllCill.1 y collceptu.llmcntc equi\'alentc. L.l razón S es
.ln.il()¡;;J .11p.lr:imctr() dl: 1:1razón UC tasas. en la medida en que propor-
t'i()n.1 lln:\ c~cala rclativa para medir la interacción de dos factores de
n(
rics!!('. en dondc la unid.ld repre~enta el punto nulo que delimita los ¡
' 1 nt

d()minios dc los erectos positivos ~. negativos. Di\,idiendo por R(AB) el


.in
I)llmcr:ldor ) c! dcnomin.ldor dc la ex presión [ 15.11 J da: v:

..)
n"
[15.12]

¡¡
C11 ll()11JI.' r~ r~( I JC11()ta 1:1 r:17.()11 Jc t:tS:1S en rcl.lci()n
La adici()n de «cxcesos de riesgos relativos» para
con
evaluar
la t.lS.1 R(AB).
sinergismos
1 p
n
(Coll' ~. MacM.lhon. 1971) es equivalentc en el plano lógico al uso del a
i11dicc .). como re$ult:t evidenle a partir de la estructura de la expresión
115.~1. j f(

l)lilizand() I()~ princIpIos anteriores. se pueden constuir fácilmente


otras medida~ dc inleracción. Por e.iemplo. una medida del tipo:
1
'
:~
.
:-
~.

1(/181
I{ER RI~(/lJJ) RR(,1[j¡ RR(AB) +
.:,
1
u

[15.13]

<.I()ll<.1t' REr~1 $ignifica «exce$(' de riesg(\ relativo debido a la intcracción»


ICll ill~lés: Relative Excess Risk due to lnteraction). podría ser útil como
mcdid¿1 relati\'a de la fuerza de un erecto interactivo.
Existe una concxión entre el indice de sinergismo S y la medida
A P*( ¡1/]). an¿ilog~1 a la relación existente entre la medida de razón de
tasas ~. 1¡1 prororción í.ltribuible (también llamada «fracción etiológic3»).
A rartir dc 1í.1cxrrc$ión [t5.t.?] tcncmos que:

,). -I RI~(,1B} -I~R(/lnl -1~1~(.:rn} + I


---=!)" RI{(/1 n¡ -I ¡\P*(¡f B)

[15.J4]

iI~~; ~~

¡~-~.
~~~~~~~

~
INTERACCIONES
ENTRE
CAUSAS 361

análogo a la expresión [15.9]. Por tanto, un valor de S = 2 implicaría


que AP*(AB) = 50 por 100, o que el 50 por 100 de la carga de
enfermedad causada por los factores A y B es atribuible a su interacción.
La estimación puntual a partir de datos crudos de las medidas antes
citadas es directa, e incluye sólo la sustitución en las fórmulas de los
estimados de las tasas o de las razones de tasas que resulten apropiadas.
Vale la pena hacer constar, no obstante, que en la estimación de la
interacción existe con frecuencia un importanle problema práctico, y es
en concrelo obtener los números de sujetos adecuados en las calegorías
necesarias. El cálculo de los intervalos de confianza es más complicado y
no será tratado aquí. Walker (1981) ha discutido la estimación del
inlervalo para AP(AB) y Rothman (1974, 1976),13 estimación del inter-
valo de s.
En presencia de un efecto de confusión, estimar la interacción se hace
más dificil. Flanders y Rothman (1982) presentaron un método probabi-
lístico para estimar S a partir de datos estralificados de caso-control. Tal
abordaje es adecuado con uno o posiblemente dos factores de confusión,
pero si hay .que controlar varios se hace necesario considerar métodos
multivariados porque el número de sujetos dentro de las categorias
acaba consumiéndose con rapidez, conforme aumenta el número de
factores de estralificación.

Ejl'mplo 15.1. Tllh(/c(1 )' alc(II,(11 ('II r('/(/li(íll al C(íll(.(,r


d(. hlll.a ('Ilfre l'('f('ralln.\" dl. gl(('rra ('ar(II1l'.\" flnr d(.h(Ij(1
d(. 1(1.\" .\"l'.\"('lIf(/ al;n.\" d(' ('d(/d ( 1(1",(/d(1 lh. If .aIÁ C'r .11981 }

1"(ld~f¡cad(1 d(. Rnfl""all )' Kl'I1('r. 1972)

Fum;ldor

Uso dc alcohol No -Si

N('1
('asos 3 8
C'ontrolcs 20 -18
Si
Ca~()~ 6 225
t~ontrolcs 12 166
-

Como se explicaba en el capitulo anterior, el problema fundamental


para evaluar la interacción en )os modelos multivariados es que la
interpretación de los términos-producto del polinomio depende de la
estructura matemática que subyazca al modelo. De manera especifica, si
el modelo es multiplicativo, como, por ejemplo, una regresión logistica,
las desviaciones respecto de la aditividad no se corresponden con desvia-
ciones respecto de cero de los coeficientes de un término-producto. A
pesar de todo, para evaluar dichas desviaciones respecto de la condición
de aditividad se puede utilizar uh modelo logistico múltiple. La forma dc
-~

I.
3¡;2 EPIDEMIOLOGIA MODERNA
--~

collstruirl() e~ utilizar térmillos indicadore~ sacados de cada categoría de


;
cxposici()n coll.iunta. Si definimos la catc~oria de referencia de modo que
s¡;a 1;1 dc lo~ n()-expucsto~ a nin!!ull() de lo~ dos factores de ries~o. ~
.;
Il¡;ccsitariamos tre~ dc estos tcrmillos illdicadores: uno por la presencia
01.: C¡¡<.1;1cxpo",icii)J) cJ) ausellcia dc 1;1 olra y un() quc il1dica",e la presencia
<.Ic la cxposici()11 coll.iullta. La razi)11 <.Ic vcnta.ia quc estima el efecto de la
cxp()sici()11 CII alISCIICi¡¡ dc 1;1 otrtl Cs cl al1tilogaritmo dcl coeficiente del
It'rIlliJ)(\ correSp()ll<.1icI1IC: 1:1 quc cslilllil cl CrCCI(\ dc 1¡1cxposicióll coll.iull-
1;1 l.' l'l :llltil().L!:lrillll(\ (Ic 1;1 SIIIII:1 (ll. I()", c()cficiclltcs <.Ic los trcs tcrnlil1o~
i 11<.1
ic;l<.1orcs. L:.",tos tres c",timado", dcl crccto sc pueden insertar en las
CCII;ICioIlCS [ I).R] par(] cstimar AJ>(AIJ). rI5.12] par~! estimar S. [15.13]
p;¡r¡1 e",timar J{ EJ~ I y 1.15.14.1 ptlra estimar AP*(/t E). Lo.<; factores de
t:(\llfusii)J) sr pllC<.1CIl l'ol1tr()lar illt:luyClld(1 términos correspondicnte.<; a
cll('s ell el m()delo logistic() múltiplc. aul1que e$ta extensi()n conlle\'", el
hahllllal aviso. ,1 sahcr: que las rcstricciol1e$ matemáticas impuestas por
cl mo<.1clo scaJ) reali",tas. A partir dc la matriz varianza-covarianza del
I1l()<.1cl(1 lo~islico. UI1;1 ve7 adecuado. se pueden obtel1er los intervalos de
c()J)fia n7.il pcrt i l1en les.
l:1 c.icmplo 15.1 prc",cnla los datos d<: ca$()-col1lrol de veteranos de
~IICrr"
sL'rir
\'arol1cs
ill(lcpcl1oicntc
por dch:l.i() dc I()s scsCl1la
<.Ir COIllr()I. El
¡llios
cstimil<.1(\
y C()II cill1ccr
d<: la raz()J) dc
oral.y
tasas
dc una
para
t
' :

s()I(\ rUmtlr, Sill col1sidcrar la in~¡;sta dL' alc()llOI. es:


: yo .

,,:..
.
.-~
1~1~.f = (1~1(3) = 2.96 I.~

1:1 c~limacJ() tic la ra7.()11cJc ta$nS para li$O del alcohol. en ausencia de
((rlll1\ar>1 e$:

RR II --(61(201
(12)(31 = 3.3~

"1;\~
1:1 cstimadn <ic 1:1 raz()!1 dc tasa., de la e.xposición combinada en .~
J'l'I:IL.i(:ln L.(I!1 la cxrnsici()n a !1illgün factor es:

(225)(20) = 9.04

(J66)(3)

r)\lc~t() que ~c trata de dato~ dc casos y controles, se' carece de tasas


disrnllihlcs :I rartir dc la~ cuales se pudiera estimar J(AB). Es posible, sin
cmh:lr~<). estimar cualquier medida relativa de interacción.
El cxccsn dc ric~~() dehid() a la interacción. RERI. se estima con la
r<)rmula [ 15.1.1~1a~í:

RÉRI = 9.04 3..1.1 -.?.96 + = 3.75


I
8?

!ti
,~~':' :~~:
~~1~¡i*:~:
r~r*}~,~
;l~~l~U{~G:,~kji:~~
]~

INTERACCIONES ENTRE CAUSAS 363

IJa proporcil)11 Jc cill1cer de boca elltre estos veteranos que resulta


;llrih\lihlc a 1:1 il1lcr:ll'l'iól1 ucl 1Ii!hito de fumar y el uso de alcohol es, a

1':lrlir llc la fi)rmul:1 115.R 1:

J.JJ - 2.96 + 1 RERI 3.75


AI)(tl/)
<.).()4
0.4
l).O4 j\¡¡:(A"iii 9.04
-.
)/9.04 = 0.89.
1)IIl:SI(} lIUl:. p(}r 1;1 rl)rl1lui;l I. 5.1()J, AP(ll+.!)=(9.04

P()(Il:I1l(}S 1;:1\I;UI:lr A j)*((I/') I;omo:

,\rf m ().41
0.47
\ 11"'(rll I
O.Xl)
:\ I)( 111

!\si 1"IIL'S. I()S ll;II()S l"r()porcionan 1111estimado de que. de todos los


1.";I~(I' llL' l";llll"L'r 11l' 1)1I<.:a l:a u~ali()~ P( )r cl lISO cnm binado de la baco v
.11l:()IIIII. 1;1 illlc.:r;l<.:l.j(111 (It: I(}s li(IS f.ll:lorCS cs rcsponsable de casi la mitad

llc.: c.:II()".
I ~lili/;111ll() -.;i ¡lllii<.:c lic .;incrgismo. .). de la fórmula [15"12] para
IIIC.:uir la iolCril(..<.:i(}11 l:olrC fumar v hcbcr .11cohol en la ocurrencia de
l.:i\I\l:t:r ()ral. l)hICOl:mIls: .

9.()4 -
,). .87
2.96 + 333 2

4\11: illJiL"~\ \ln¡1 n\()Jl:r¡IJ(\ c(\nliJ~\u uc ucsvi(\ción respcclo de la relaci()n


;IJiti\.a. Ni,tl:sl: 4\1l: 1(\ I(\S(\ Jl:hiJ(\ (\ 1(\ inlCr(\cci()n cs mayor que la debi-
.-
J;I ;11.:\1:lllI\lil:r(\ tll: 1(1" ral:I(lrl:S inui\'iJu(\lcs. p\lcsl() quc e¡ RERI = 3.í5.

tllll: L'S 1\\;I~llr tl\l1: .:...~~ I' I.()(,.


s~ p\l~lll: l:(\Il:\lI:lr i\ i):t:(1111 t(\mhicn (\ r(\rlir uc .\.. c()mo:

.~7
\ 1)*(111 ~ 0.47
.5" .87

I{I;.I:I:I~I:N(:IAS
(i\ll:. I).. al1d ~1acMal1(\I1. n. ,\llrihul,lble risk perccnt in case-control studics.

IJr..I. Pr(.r. .<)'(1(".\f (.cl. 1971 :25:242.244.


l.(\llah(\rali\.c (jrollp ror lhe Sludy or Stroke in Young Women. Oral contracep-
li\"cs al1d slr(\kc il1 young \\.omcn. .1...I.I\.f...1. 1975:231:718-722.
l)arr('(;I1. .,. N. Mliilirlic~lli\.c ~Ind ~Iddilive inler,lclioll in contingency lables.

11i(I/"(.{'.ik(1 1l)74:61 :207.214.


1:.11\.ir(\l1mcnl,11 Prolcction Agcncy. omce or Pesticides and Toxic Substances.
slil,\r(\rl ()ocuml:nl: AshcSlOS-col1l,lining m,lleri,lls in schools. Healll1 efrcClS
al1u 111:lgnillluc or cxposllrc. EPA-560/12-RO-003. W,lshington. D.C.: U.S.
( il ,\"\:r\lmcnl I)rilll ing ()m\:c. Oclobcr. 1980.

n
;C;~f~{t JJ1fl~;~¡~f

36~ EPIDEMIOLOGIA MODERNA

FJ:Il\dcr~. W. D.. al\d 1~()thmul1. K. .1. JnlcraCli()n or nJcohol and lob.lcc{) in


J:\ryl\~c:IJ canccr. -,1,11..1. EI'i(I('llli(}I. J9¡;;2:J 15:371-379.
K(\(\rmal1. J. S. C:llI~al modcl$ :Ind ~ollrcc~ or inler.lcljon. A,II. .1. Epi(l('mi()l.
, ()ii: IO(,:4.l9-444
K(\(\rm:lll. J. S. Il\lcr:lcliol1 bClwccl1 di~crclc cuuscs. Am. J. El'i(I('",i()l.
19RI:J J.l:716-724
Kllrrcr. L.. .Ind Ho.t:!:ln. M. D. Inlcr.lclion jn erjdemi()lo!!ic sludíes. Am. J.
1:.I)i(i(.mi(}I. 197X: I OX:44 ';"-45-'.
Rnt¡'m:ln. K. .1.. and Kcllcr. A 7.. Thr CrrCCI (\r.ioint cxrosur(' l() alcoh(\1 and
1(1¡';IC.:l"(' {'n ri~k (,r C;IIIC.:cr (,r tlll' nl()lIt¡' ancl rh.lrynx. .1. Ch,.ml. Di.t.
11.}-~;.:..'¡,;71J.716.
1{(\I¡'m:ln. K. J. Syncrg~. al1cl ¡,nla!!oni~m ín cau~('-crrcct rclalionships. Am. J.
r.j)l(i(.mi(}I. 1974:91.}:.'¡,85-.lRR.
I{n(¡'man. K. .I. Th(' c~ljmalion or ~~.ncrg~. {)r anla~oni~m /1,,¡. J. El'idemi()l.
l(}i(,:IO.'\:5()h-511.
J{()t¡'maI1. K. .I. Occam.~ r:I7.()r rarc~ ll1C cl1{)ICC umong stali~ljcal modcjs. A"l. .1.
E,}i(I(.,lli(,I. 197X:I08:.~4i.~41.}.
1{()lhmal1. K. J.. Grccnland. S.. and Walkcr. A. M. Conccrt$ or inlcraction. Am.
.I. Epi(I('IIIIf1/. 19RO:I J~:4ói-470.
\\:alkcr. A. M. Pror()rli()11 ('Ir di~ca~c atlrihlllablc lo lhe c()mbincd CrrCCl or lw(\
laclor~. 11/1. .1. EI)i(I(."I;(}I. 19RI:I{):~I-R."
\\allcr. S. f).. al\(1 J lolrnrd. T. R. Addili\.c. mlll(irlicC1li\,c .,nd ()lhcr m('1dcl~ ror
Ui"c.:;ISl. risks. A,ll. .'. l:.jll(I(.,II,(}I. 197X:J()X:.'¡,41..l46.

~~%
¡j¡:
';;~'i'.

~
:~~l~~~~\\\~~t
Iv .~~~~ .
"
,.
I

6 ANALISIS CON NIVELES


DE EXPOSICION MUL TIPLES

l':

f~'

~
,:.
I.'

,~-
f ::'
,:
"
¡'-
¡:'
..

~:

11.ISt.1 :Iqui. I.1 discusi()11 del an{llisis de datOS ha presumido que las
\.Iri.lhlt;s dt; I.:xp()sici(111 cslahan medidas sobre una csc.1la dicolómica.
:\qucil.ls quc lo esluviesen segtln una cscaia nominal con más de dos
calcgori.1S. pueden ser tratad.l; a erectos analilicos como un conjunto de
'!~Iriabl~$ dicolámic.ls. comparando c.lda categoria con una. de referen-
L"ia: :Isi pucs. un c$tudio que relacionase el origen étnico de los residentes
Cl1 I1 ¡Iwai I.:on la inl:idencia de un.l enfermedad. podria tomar como
1.::ltcg()ria dc rcfcrclll:ia cl tlncestro haw.liano y considerar los ancestros
I.:llino. j~lPOnés y ~uropeo como tres "ariables distintas. De cara al anáii-
sis. v.lriablcs de cxposición que fuesen ordinales o continuas podrían
igu~llmente C()I.lpsarsc en dicotomías. La cuestión es que el uso de más
de dos categorí.ls lo 11()rmal es que divida los datos de forma demasiado
ri11.1como par.l dar l:.lhidtl al control de la confusión y seguir mantenien-
-,
p do a la vez un~l razonable precisián en la estimación. El hecho de
i l:OlapS.lrl.1S. sin cmhargo. implic.l también un~l degrad.1ción de la escala
de medición subyal:cnte y la pérdida de información potencialmente
importante. El gr.ldo en que los dalos indicasen una tendencia del efecto
a lo largo de varios niveles de exposición o la ausencia de tal tendencia.
puede arrojar luz .lcerca de la biologia de la relación sometida a estudio
y gUi.l de cara a cualquier intervención en términos de salud pública.
L~I pérdida de información que se sufre al Col.lpsar en categorías una
,'ariahlc cO11tinua sC mitiga m.ll1tcl1icndo para la misma más de dos
l:atcgorías orden~ldas por r.ll1go. Es I()gico. 110 ()hstante. plantearse pri-
Incro si siquiera resulta l1eces.lrio l:OI~lPS.lr en c.ltegorías. Teóricamente
debcrítl ser posible extraer mils inrormaciún de. los dalos utilizando en el
anillisis los valores reales de las observacione~. en vez de sus frecuencias
cn categorías seleccionadas. Es decir. en vez de basar un análisís en
l:atcgorias de gente que. por ejemplo. fuma O. de I a lO cigarrillos. de 11
~I 20. de 21 a 40 o de 41 .a 60 al día. debería resultar más informativo
utiliztlr el número real de cigarrillos fumados al día por cada sujeto
individual. P.lra extraer de mediciones continuas toda la informacíón
L"uantit~lliv.l prescnte cn l.lS observaciones. existen muchas técnicas esta-~

365

-~
c':: .

~¡~~;
-

366 EPIDEMIOLOGIA MODERNA

dislic,ts que han sido rrecuenlemenle aplicadas en epidemi010gia. Por


desgracia. aplicarlas puedc abrir la puert,\ a la aparición de problemas ,luI
scrio5. qlle muchas veces sobrepasan en peso a las teóricas ventajas. ca
..
lJna dificultad rund,\mental de los estudioS de seguimiento es que 1,¡ ] rn

<)L.urrcl1cia de enrermedad sc mide por medi{) dc tasas dc incidcncia. que ,,10

c;lrCCCI1 de scl1lido a n() scr quc csluviescn calculadas para poblaciones. ~n


csl<) cs. p,¡r.1 prupos dc individuos. Si la exposici()n se mide segun una
,?e
escala conlinu.l. sin colapsar en grupos. no se definen poblaciones para
Jlf!
I;I~ l.llalcs pllcd:¡n estimarsc direcLamcl1Lc las cil;ldas l.¡SaS de incidcnci.¡. ..'
.( 1
Si rcsulLa posihlc conccpLualiz.¡rla par.1 un individuo. como función del l' su
«licmp<) de espcra» de dicho indi\'iduo ha~ta el comienzo de la enrerme- ur
dad (la lasa dc incidenci.¡ es el reciproco del licmpo de espera. si la jf
mism;1 e~ COnSl:.lntc a lo largo del ticmpo). pero sin un modelo malemáli- -
l"(\ lJU prororcionasc cn!:!rana.ic .1 los d:lLos resull:lria dificil. en auscnciu
d,.: a!!rupamicnLos. dar scnlido a la disLrihuc.:i<)n de los liempoS de espera de ] ~~~
" .
lodo." los su.ielo." dei esludio. Así pues. lo quc moli\',1 la agregación en El
c.¡lc.!!ori.ls de los su.ielos con nivele5 de exrosición similares es la necesi- 'pr
dad de calcular lasas de incidencia eslables. En los estudios de caso- fpl
conlrol. ruesto que el anillisis se centra en la estimación de razones de j2
t,¡sa~ dc incidenci.¡. es de aplicaci()n un.1 linea de razonamiento similar.
Si cl an;ilisis tIc los dalos SI: has:l (n() apropi.¡d.¡menle) en la compro-
j
h;¡c.:i<)n dc hip()lesis e~ladislic:ls en lug.¡r dc en la eslimación. el uso de
dalos continuoscn \'CZ de a~rupados pucdc p.lrecer indicado para me.io-
íílí la polenci.¡ est.¡distic:l. Par.¡ d;\tos dc c.¡SO-COnlrol. 1.¡ comprobación
dc uníl hipl>lesis esladistica se reduce ,1 comp.lrar las dislribuciones de
cxpo-,ici()n dt: I;\s scries dc los casos ~. los conlroles. Para evaluar si las
l\l\lcstras dc tll)S dislrihuciol1cs conlinua.,\ difieren. sc puec.len uliliz.\r tests I,:
,.

I:stadislicos dcllir() dcl dc la ¡; dicl\<) lest pucdc hasar.'\e en loS \'alores rea- ~

Ics ohser\'ados ~' no en un" di-,lrihución dc rrecucncias oblenida medianle


a~ruramicnto. Si bien e~ cierlo qllc de esla m:lncra .'\c puedc conseguir.
en leori.l. cierla mejora de 1.¡ potenci,¡ de cara a la comprobación de una 9
hipótesis esladistica como tal. comprobar una hipólesis no debe ser un
oh.ieliv{) fundamental del an(llisi-, epidemiológico. porque la ganancia en
p<)lencia esladi.,\tica añade mu~. roca información de inlerés. El formato
qllC h¡,~. que d.¡r .¡ los d.\tos para un:1 c<)mrrohación así no se pre-,ta con
racilidad ¡1 la e-,limaci()n dc nil1gllna mcdida dcl CrcClo que lenga epide-
miol()gicamente senlido )' ése e-, el ohjcli\,() analilico centr.¡I. Dc este
modo. 1.¡ me.iora en potencia estadístic.¡ lo que sir\'e es para desviar la
alcncíi)1l del ani\lisis, rasándola de 1:1 cstimación a la comprobaci()n de
hir()lcsis. i() que es inherentemente no dcseable. Una posiblc ramifica-
ci{)n de: hecho de cenlrarse en lales situaciones en esto último es que la
inrerencia cualitativa que depende únicamente del resultado del test
p¡lede inducir extraordin.¡riamenle al error. Puesto que un tesl de la f
.'\omcte básic.\mente a prueba la-, diferencias en los valores de las medias,
11ucdc rcsull:lr desproporcion.llmentc innuellciado por una observación
¡'Inica () por Ull05 pocos \,.¡lorcs margin.\les (punto-, extremoS de loS
d¡¡tos).

;.~

~
;;:-{~ti
:~~\f;
-~~,,;;... :~.:;;;;.:~.;:-~..,,;;;¡;~:~:;;;,.:;:.:;;;¡;;.

16. ANALISIS CON NIVELES


'1 DE EXPOSICION MUL TIPLES

,
a
Ilasl;1 ;1<.1lli. I~I <.Iiscllsi()n de! :lnillisis de daloS ha presumido que las
\ ;Iriahll:s dc cxp()si<.:i(ln cslahan medidas sobre una escala dicotómica.
1\4l1ciI~IS 4l1c lo c~lu,'iesen .'icgtln una csc~lla nominal con más de dos
c:ltcgori~ls. puedcll ser tratad~IS a efectos analiticos como un conjunto de
,'ariablcs dicotómicas. comparando cada categoria con una de referen-
cia: asi PllCS. un CSIudio que relacionase el origen étnico de los residentes
cn I fawai con la iI1<.:iden<.:ia de una enfermedad. podria tomar como
1::llc!!ori;1 <.Ic rcfcrcll(;ia cl ancestro 11~lwaiano v considerar los ancestros
--
cllino. j(lponeS :" ~uropeo como tres ,'ariables distintas, De cara al análi-
sis. variables de cxposición que fuesen ordinales o continuas podrian
igu~llmenle COI(lpSarSC en dicotomias. La cuestión es que el uso de m(ís
de doS categorias lo 11()rmal es que divida los dalos de forma demasiado
lina como par~1 d~lr c~lhida ~11conlr()1 de la confusión y seguir mantenien-
do a la vez una razonable precisión en la estimación. El hecho de
colapsarltlS. sin cmhargo, implica también una degradación de la escala
de medicióll subya<.:cnte y la pcrdida de información potencialmente
importanle. El grado en que los dat()s indicasen una tendencia del efecto
D :I lo largo de varios niveles de exposición o la ausencia de tal tendencia.
puede arrojar luz acerca de la biologia de la relación sometida a estudio
y guía de cara a cutllquier intervención en términos de salud pública.
L~l pérdida de información que se sufre al colapsar en categorías una
,'ariahlc conlinuCl sc mitiga mtl11lcnicndo p~lrtl la misma más de dos
(;:llcgorias l)rdell¡ld~lS por r:lngo, Es I()gi(;(). 110 ()bstante. plantearse pri-
mcro si siquiera rcsulta necesario colaps:lr en Ctltegorías, Teóricamente
m debería ser posible extr:ler mils información de.lo~ datos utilizando en el
anilli~is los valores reales de las observaciones, en vez de sus frecuencias
cn Ctltegorías seleccionadas. Es decir, en vez de basar un análisis en
(;atc~orías de gente que. por ejemplo. fuma O, de 1 a lO cigarrillos, de 11
a 20. de 21 a 40 0 de 41 a 60 al día, debería resultar más informativo
Iltilizar el número real de cigarrillos fumados al día por cada sujeto
individual. Ptlra extraer de mediciones continuas toda la información
L'uanliltltiva prescnte en las observaciones, existen muchas técnicas esta-~

365

~~~¡*¡i] t~~f~~~~;;~~{
:i:':.;j~J
c~~::.
¡:~:~¡!f~;:;?::iiy:~ :~~'
~~;;,;:~~j~t~~tJt}:. ¡m¡~~?¡ :.~:
:~~~t~~;:

t
.~
"
,;.
'o:

366 EPIOEMIOLOGIA MODERNA

distictts que han sido frecuentemente aplicadas en epidemiologia. Por


des~racia. aplicarlas puede abrir ltl puerta a la aparición de problemas
scrios. que muchas veces ~obrepasan en peso a las teórica$ ventajas. ~a
1,.
.:
f:~.

lJna dificultad fundtlmenttll de los e~tudios de ~eguimiento es que la


(Icurrcncia de cnfcrmedtld sc midc por medi(l dc tasas de incidcncia. que
t~;,
c:lrCCeJl de ~cntido ti no ser que c~tuviescn calculadas para poblaciones, :nc',:
CSI(1 es. partl grupos de individuos. Si la exposición se mide según una
Fe;)
esctll:1 continutl. ~in COltlp~ar en grupos, n(l se definen poblaciones para
Ig.~::
1;ls l'IJ:llc-" pUCd:lJl c~timar~r directtlmCnle la~ Ciltldas ta~a~ de incidcncitl. r "
'1
::~
",.

Si rcsull:l posiblc conccptualiztlrltl ptlrtl UJl illdividuo, como función del


«ticmp(l de espera» de dicho individuo ha$la el comienzo de la enferme-
dtld (Itl ta~a de illcidencia e~ el recipr(lc(I del liempo de espera, si la
misma e-" COIlSlanlc a i{) largo dellicmpo). pero sin un modelo matemáti-
l\' lJUC pr()pOrCiOJlaSC cn~rantl.ie a lo~ dalo~ re~ulttlria dificil. en ausencia
d:.' ~I~ruptlmiento~. dar scnlid(l a la di~trihut:ii)n de lo~ tiempo~ de e~pera de
lodo~ lo~ su.ielo~ dcJ esludio. Así pues. i{) que motiva la agregación en
categorja~ de los su.ieto~ con nivele~ de exposición similares es la necesi-
d:ld de calcular ttlSa$ dc incidencia estables. En 10$ estudios de caso-
control, pue~tC' que el anilli~i$ $e centra en la estimación de razones de
tastl~ de incidencitl. e~ de ttplicacii)n untl línea de razonamiento similar.
Si rl :ln~ili$i~ de I(I~ d~ltO-" sc h~I~:I (n() tlpropiadamentc) en la compro-
h:lCi()Jl de hipc)tesi-" esladistic:ls en Il1g~lr dc en I~I e$timación. el uso de
d:IIOS continuos CJl \'CZ de a~rupadC's pucdl' p~lrecer indicado para me.io-
r:lr la potenci~1 estadistica. Par~1 d~1t(l~ de t:tl$o-control, 1;¡ comprobacic)n
dc UJltl hip¿)tesi-" esttldístictl ~e reduce ti Comparar las distribuciones de
cxposicii)n dc ItlS serie~ de 10-" casos ~. 10~ conlrolcs. Para evaluar si las
111UCslrtl~de d(ls dístríhuci()nes c(lnlinutl~ dificrcn, $C pueden utilizar test$
cstadi$tit:O-" del tip() dcl dc Itl t: tiicl1(1 tcst pucdc ha$tlrSc cn lo~ \'alores rca-
Ic~ oh~ervatio~ y n(l en untl distrihución de frecuencia~ obtenidtl mediante
:I~rupamicnIO. Si hien e~ cierto que tic esttl mancra $C puedc conseguir,
en teoritl, cierta me.iortl de Itl potencitl de cara a la comprobación de una
Ilipótesi$ estadistica como tal. comprobar una hipótesis no debe ser un
(lh.íeti\,o fundamental del análisi!' epiderniológico, porque la ganancia en
potcncitl esttidistica añtlde muy rOC:.l informtlCión de interé!' El formato
qllC htly que dar a lo~ dtltos ptlr¡1 un¡1 c()mproh;¡cic)n a~j no ~~ presta con
ftlt:ilidtld a 1:.1e~timtlción dc nin~unt' mcdida dcl cfcctC' que tengtl epidc-
miol()~ictlmente senlido \. ése e!' el (lhíeli\'o tin:.llitico centrtll. Dc e$te
modo: la me.iora en pole~lCia esttldistic~1 lo que sir\'e es para de~\'iar la
tllCnción del anilli~is. pasándoltl de la estimación a la comprobación de
I}ipótc~is, lo que e~ inherentemente no deseable. Una posible ramifica-
ci()n de: hecho de centrarse en tale$ situacione~ en esto último es que la
infcrcncia cualitativa que depende únicamente del resultado del test
ruede inducir extraordinariamente al error. Puesto que un test de la I
somete básicamente a prueba las diferencias en lo~ valores de las medias,
rucde resultar de~proporcionttlmcntc innuenciado por una observación
\Inica (I por unos poco~ valores mar~intlles lpunto~ extremos de los
dilto.,\).

':";c",;;!:;.~,\,,. ':;.$'

~~.

~
", ~Jf::!
ANALISISCONNIVELESDE EXPOSICION
MULTIPLES 367

( .()n!\idercmos el siguiente ejemplo hipotético. Supongamos que en


1111;¡r()hl;¡<;ii)11 de ohreros que lrabajan con energia nuclear se llevase a
L.;¡h() un estudio de <;asos y controles sobre cáncer de cerebro. Imagine-
111 ()S 4ue los grupos de esludio comprenden 12 casos y 12 controles, para
!IIS <;uules las exposiciones acumuladas de radiación son las que se dan
1.:11I:lf?,jemrlo 16.1. ,\sumamos que no se pueden medir las exposiciones
(ll: 111l:11()SJe ().I rem con precisión y se loma. como media, que son
i.\:!uales ,1 0.05 rem. La exposición media de los casos es 4,4 rem. compa-
r;¡d,1 <;011sólo 0.59 rem para los controles. La diferencia de las medias es
sustancial. Un test de la 1 que comparase estas dos distribuciones daria
un,l I = 1.71. con 22 grados de libertad, lo que corresponde a un valor
1.1l:I' <.,on un,l <.:ola de 0.05.
I'()r supuesto. nunca hay que aplicar un test de la t a menos que
I1Uhil:se <.:ierta indic,l<;ión de que uno se enfrenla a di",tribuciones mues-
tr;¡lcs ;¡prOXi!l1,ldamcnte normales. lo que no es el caso con estos datos.
1:11ril.!or. 1.:194 por 100 de la exposición total a la radiación de los casos
rr()\.i~nc Je los <;,lSOS I. 2 y I. Unos pocos valores extremos pueden.
rllL'S. innuen<.:i;¡r Jesproporcionadamente a la media y resultar extrema-
J;¡lncntc inductores de error (Baron el al.. 1984).

Ejcmplo 16.1. Dar().\" hip(11i!ricn.1" de


('.\.pn,\"ici()/1 (/clmllllada a la rad;(ICióll
II(, C(I.SII.S .\' ('(lI/rrvil!.s 1!1/ Im e5rlldio
.\"()hre cá1/cer cerehral

Casos (rem) Controles (rem)

15.6 0.05
2. 21.8 2. 0.2
3. 0.05 3. 0.3
4. 0.05 4. 1.4
5. 0.2 5. 0.05
6. O.OS 6. 0.05
7. 12.4 7. I..:.
8. ().O5 8. 0.05
9. 0.05 9. 0.4
10. 0.2 10. 0.05
0.05 0.05
12. 2.3 12. 3.3

En lugar del test de la I se podría aplicar otro no-paramétrico, como


L'I Mann- Whitney. El test de Mann- Whítney, basado en los rangos de las
()hs~rvaci()nes. no requiere que se asuma la normalidad. A pesar de todo,
sL' mantiene el problema de que un análisis asi no estaría dirigido a
rr()ducir medidas epidemiológicamente interpretables (Poole el al.,
14H41. C.ltcgorizando la exposición, se logra de forma sencilla evitar
1..'1rrol'!lc.:ma. Si en los datos del ejemplo 16.1 se utiliza 0.1 rem para

o
.J.", ...,

-=-

B[;;:¡~fu\:i~;.~:l;¡¡i

iJ
i~~~J
:, ,,~:~i"...*
;r¡
¡ftf!::;~¡,~~::¡~m~ .~-
j;.~;i~~.::.;

,~~::~::..:
2~~:.. :~c';~lt*~: ,~.:.:.,;,;:,::
,..:-
i:-

I f~

~
36!1 EPIDEMIOLOGIA MODERNA

dclimit.lr cxpo~ición alt.1 1'("..\,/{.1;exposición b.\.i..l. se obtiene


mad() dc la r..lzi)n dc t..\sas de 1.0. Si. por el contrario.
un esti-
se utiliz..\
I ~:

1.0 rcm com() catcgoria fronter,-l. el e~timado de la ra7.Ón de tasa~ que se


ohticnc e~ 1.5. La interpret..\ción dc lo~ dalos ~iguc e~tando abierta a
cicrta di~cu~ión. puesto que el estim~ld() dcl CfCCt(1 ~c ba~a ~ólo en unas I i ~~
P()C..I~ ob~crv..lciones )' dcpendc fucrtcmcntc dc d()ndc ~e coloque la
cate~ori..1 de delimitación: est,-\ dcpcndcl1cia renc.ia c1 hcch() dc que I..I~
~
L\)lil~ superiore~ dc las dos di~trib\lciol1cs de cxposicit)ll dificren c()l1sidc-
r;lhlcmcl1tc. pcr() las mcdial1as ~OI1 idcl1tic..ls. Con m.i~ d..ltos. 1.1 citad~1
dcpcl1dcl1ciu del cfecto rc~pccto dc lu ubicación dc I~I catcgoria frontcr..1
di~minuiri..1 )' podri~ resultar factible utilizar varias calegorias dc exposi-
ciol1 mil~ fina~ para cvaluar la tendcncia del mi~m() conforme se incre-
mc!1ta 1..1exposición. evitando asi una catcgorización dicotómica sin
:- :~.
limitc~ claros por arribf.l ~' por aba.io. Con todo. la interpretación
r()C() má~ clar..1 con esta categorización bruta. inclus() con sólo dos
es un
I
c~\tet!oria~ poco delimit..\das. en tanto que de 1..1observación de que la
cxpo~icinn mcdi~1 dc lo~ C~\~()~e~ ~ictc vecc~ ): mcdia la de los controles,
11ahria quc extracr una il1fcrc!1ci..1 quc Ilcv..lri..1 '-I c!1gaño. Resulta fácil " " ,; ,
I
, ..~;;'
ima!c!in.1r ~itu~\ci()nc~ C!1 que ú!1ic..\mentc un sujet() con un valor de
.'-
exp()sición extremo fue~e suficientc para distorsionar un análisi~ basado 4 ~

cn v..llore~ medios.
La desproporcionada innuencia de la~ observaciones extremas es
un() ~ólo de los varios problema~ que podrian surgir de un análisis que ,

n() categorizase las variable~ de exposición.


c()mparación de dos distribuciones
Es igualmente
de exposición
posible que la
rcvelase únicamente
.;.~: ~-~ . 11 -1
1I

di~crcp..\ncias menores en una medida de tendencia central del tipo de la 1 (


t
mcdia o la mediana. al tiempo quc las colas de las mismas diferian "
c
sustanci..llmente rene.ial1do una relación fuerte entre exposición y enfer- a

medad. Estc problema fue detectado por MacMahon el al. (1970). que
fucron los primeros en informar de la gran relación existente entre la
edad en el primer parto )' el ries{!o de cáncer de mama (Fig. 16.1 ).
..-
Comcntal1do la~ razones de por qué semc.iante hecho no habia sido
informad() previamente. llam..\b..\11 1..1..\tenciól1 sobre lo siguiente:~
I
E~tc nC' e~ en modo algunC' el primcr estudio en el que se haya
ohscr\'ado un;¡ dircrcncia cn cüncer de mama entre caso~ y controle~
~c!:!\m la cdad durantc el primcr parto. En mucha~ comparaciones
previas de ca~os del citado tumor y mujere.c: no arectadas, se había
encontrado quc los casos eran. por término medio. mas vie.ias al
ca~ar~e. al tener el primer embarazo o cn ambas cosas. (...) Sin embargo,
parecc quc la gente que primero traba.ió en el tema no. consideró que
la~ dirercncia~ rue~cn ~uficientcmentc importante~ como para juslificar
t:
una exploración dctallada. Del rallo en no darse cuenta de la magnitud
dc la~ difcrcncias dc ric~go rclativo quc ~ubyacen a la relación, puede ,~
haber re.c;ultado la aparenle falla dc intcrés en ésta. Semejante incapa- ~
cidad p¡ira rcconocer la fucrz:1 dc la relación puede ser atribuida
fundamcntalmenlc al hecl\o dc ulilizar análisis basado.c: en e~ladislicas
dc rcsumen. dcl lipo dc la~ media~ y lo!' réditos, En los paises donde se

c-. -~~~~;

~;::
;.:;~~.~~,.
.:.:.;,:,.
;:::~;,:; ,,"'

~
l~;\~~;; :?~

~. ~g~

ANALISIS CON NIVELES DE EXPOSICION MULTIPLES 369


~~ ~- --

flan Ilcvado a cabo la mayoría de los estudios epidcmiológicos sobre


c~ta cnfermedad. la proporción de mujeres que ticnen su primer chiqui-
llo a cdad temprana cs relativamente pequeña y las citadas estadisticCls
dc rcsumcn fr~lcasan a la hora de revelar los altos riesgos experimenta-
do~ ror rcqllcños .c;cgmentos de la ['Iob!nción. Por ejemplo, en los
rrcsclllcs datl)s. sac~ld()s dc "oston. I~l mcdía de cdad en el primer
r:lrtl) <:r;1 27.1 :llil)s cnl()~ ca~o~ y 25.5 cnlo~ controlcs. Por mucho que
csta difcrcl1ci;1 SC:I alt:lmclltc significativa cn (crmino~ cstadí~ticos. difi-
<:ilmclltc Ic flcv:lria a 11110 a sosrccflar cntrc los ricsgos rclativos el
rango Ilc ca,c;i cuatro vccc~ quc muc~tra I" I"hla 3 (Fig. 16.1).

.
1.4
.
.

] .

.
.
J Mujeres nulíparas
.
1.0
o
~ .
;; . .
.
"§ .
. .
o
01
0.8 .
tn

I .~
cx:
. .
.
.
0.6 .
.
. e e ¡:
,
~'
. ~
. ~

0.4
. ~
~

0.2

! I I I I' ,

o 15 20 25 30 35 40

Edad al primer parto


{años)

I:ig. 16.1. Rie.\".~(J(relativo al rie.\"go de 1.0 para mujeres nulíparas,1 de cáncer de


111(1111(1
.\"(',f!lin ('da(' ('11 t!1 prinler. parto. tolnado (le J\.facM ahon et al ( 1970) .

..:,~ "

~~: :~1;
:.t~:;:

:;~1§-'1

370 EPIDEMIOLOGIA MODERNA

La lección a extraer de estos e.iemplo~ coincide con el tema central


del prescntc texto: el objetivo fundamental de un análisis epidemiológico
cs cslimar la magnitud del efecto (es decir. la diferencia en tasas de
inridcncia\ com() función del esta tus dc cxposición. El mayor problema
I.lUC tit:llCll las mcdid¡¡s contillULtS dc cxp()sici()n cs que ~u u~o ~e acompa-
liLI rrccllentcmente de procedimientos de re~umen. que se centran va ~ea
cn ILt comprobación de hipótesis estadisticLls () en la comparaci'ón de
medidLls de tendencia central de la \'ariable de exposición. Ni una ni
()trit. sin embargo. pueden dar cumplimient() a ILt meta que en términos
dc mcdicion se desea. La categorización de la exposición facilita la
c~timL1Ción del erecto como función s uva. utilizando los métodos catel!ó-
ric()s y¡\ discutidos para cxposicione~ dicotómicas. Por supuesto. a pa;tir
de datos continuos se pueden estimar tL1mbicn funciones del erecto.
ulilizand() modelos m¡¡tem:tticos. aunque en tales ani11isis hay que consi-
dcrLlr IL1 inrluenciii potencialmente detractora de lo~ valores extremos.
La categorizacián I'(". .\.(' n() climinL1. ciertamentc. el problema de las
oh~cr\.acione~ extremas. Si amL11gLlma c~tas con valore~ menos extremos.
diluiril su erecto distorsionan\e. Llunl.lllr I:ts amplias () P()C() delimita-
das por arribLt () por abajo) categorias quc se precisan para rcLllizar tal
dilucii)ll resultan indeseiible~ debid() ii que conducen a una distorsión
dentr()-dc-lii-categoria similar a 1.1que se produce cuando se apoya uno
{!Iobalmente en valore~ medios. Una catel!orizacián más fina tenderá a
~islLtr dicha~ observaciones extremas en c;tegorias separadas. donde se
la~ puede descartar .1utomáticamentc CL1SOde no existir datos de compa-
raci<)n disponibles dentro de la misma. A pesar de todo. un análisis que
se hasase en puntuar la~ categorias seguiria siendo. en principio, suscep-
tihlc de IL! distorsión debida a la presencia de grupos de valores del tipo
que no~ ocupa en las categorias extremas. En consecuencia. muchas
\'cce~ es deseable lle\'ar a cabo el análisis con varios niveles de exposi-
cii)n. utilizando únicamente para ésta -como análisis inicial o como
suplemento de otros aborda.ies- una categorizacián de escala nominal
(esto es. ~in puntuar la~ categoriasJ. Hacerlo así puede poner de manifies-
l() \,.llore:- extremos a los que debería ignorarse. o darles menos peso. en
.1nillisis posteriores que estuviesen basados en puntuaciones de catego-
ría~ o en medicione~ continuas.

ESTIMACION DE EFECTOS PARA NIVELES


DE EXPOSICION MULTIPLES

E.~,inla('i(),1 pUII'llal por cole¡!:oría. de .forlllo .~eporada

En Un análisis epidemiológico que hiciese frente a más de dos niveles de


exposición. existe un método directo que consiste en considerar separa-
damente cada uno de ellos en comparación con una categoría de exposi-
ción de referencia. con lo que el análisis se reduce a series analíticas
ba~adas en categoria~ dicotomizada.c; de exposición. Por e.iemplo. si la
~¿

I
ANALISISCONNIVELESDEEXPOSICION
MULTIPLES 37'

\'ariahle de expo:;ici()n ruesc la exposición media diaria de la piel a la luz


tlircL'ta dcl sol. dicha variable podri~l c~ltcgorizarse dc la siguiente mane-
r:l: 111<'/1(1,\'(1<'().") h(lr(I,\'. ('/Ifr(' ()..tj ,1! 1.9 h(lr(1,\" [1(12.() (1 3.9 h(lra,\,. [1(14,() (1 (j.9
¡'tlrtl,'i l' [1[' 7.(} II .'1',1)h(lrf/,\" 1:1 grupo dc rcrcrcnci~l natural seria la
l':IIl:~(lri:1 11/('I/tl.'i II(' (J..tj h(lr[I,\', <.':Iua lIlla tic las rcstantcs cuatro potlrí(ln
"~r 1:(llllr:lsl:I(I:IS 1:(1111:1(It: rL'rL'rcllcia p:1ra ()btcllcr cuatro cstim(ldorcs dcl
~f~L'I() sL'p:lr¡I(I()s. l:sL'11ci¡11111ClllcIlcv¡lntl<1 a l::lho cuatro an~íli~is ha~:l<.10,~
l:JI L'()lllpar~ICi<)IIC:; <Iic()t()micas. La c~timaciól1 puntual se realizaria en la
rorma descrita en los capítulo~ previos. cuando se trataban las variables
<.Ic l:xposici()n <.Iicot()mic:1s,
Si l::;t:l prcsclltc la confusi()n. ~c Ic puedc hacer frente en la misma
r()rm~l cn que ~c hacía con la~ cjtada~ variables dicotómicas de exposi-
L'illl'. l:S dcl:ir. ml.:tli~lnte I~l estratificación, Puesto que uno de los objeti-
\\IS fundamcntalcs tlcl an~llisis c~ exalnin~lr el patrón de los estimados
pllntu~lles por nivel de exposición, es importante asegurar que los mis-
mos sc~ln mutuamente comparables. Asi pues. si se utiliza un procedi-
micnto de est~lnd(lrización para combinar la información específica por
I:slratos accrc~l tic un r~lclor de confusión o de un modific.'ldor del erecto
:1 I() 1~lrg(1 tIc tlich()s l:~tr~lto~. rc~u¡t.'l imperativo que para cada estimado
pllntU¡11 tI I.:I crcct() tlUe sc ohtcng~1 se ulilicc un e~tándar común. Compu-
lar U!l~l SMR Ir~lz()ll de mort~llitl~ld esland~lrizadal p(lra cada categoría
II() ~s v¡i/id(). pucsto que cada SM R implic~lría un estánd.'lr diferente. a
s~lher. la distribución de la categoria de exposición de que se tratase
Ivé~lse Cap. 5). Seria razonable. sin embargo. utilizar cualquier categoría
de exposición, incluida la de referencia. como estándar común para
ponderar los datos específicos por estrato a cada nivel de exposición.
Otras elecciones razonables a este respecto son la distríbución de todos
los sujetos que tengan alguna exposición. o algún estándar exterior.
Si para obtener un estimado puntual global del erecto a cada nivel de
cxposíción ~e utiliza el pooling {o «conjuntamiento») en lugar de la
~:
t;st~lndarización. la ponderación de cada estrato será función del número ~

de observaciones en cada uno de ellos y no necesariamente equívalente


p¿lr~1 cada nivel de exposición, Si la asunción de que el parámetro es
uniforme a lo largo de los estratos del factor de confusión resulta válida.
tle,ia de ser crucial de cara a la validez que las diferentes categorías de
cxposición tengan diferencias en la ponderación. La asunción de unifor-
midi.ld puede, no obstante, ser dificil de defender: no resulta suficiente
tlemostrar falta de «significación estadística» en un test de la hipótesis
nul~l de que el erecto es uniforme. Más aún, para medidas del efecto
expresadas en forma de razón, tal uníformidad debe estar presente sólo
hajo las circunstancias especiales en que exístiese interacción entre la
varii.lble de estratificación y la exposición que sucede que se conforma
:;cgún un modelo multiplicativo. Consecuentemente, si el análisis requíe-
re 1(1 comparación del nivel de exposición -estimados específicos del
crccto- debe extremarse la precaucíón a la hora de utilizar el «pooling)
hajo una asunción de uniformidad. A menos que exista una gran seguri-
tlad ~obre que es razonable asumir uníformidad a cada nível de exposí-

¡~.
372 EPIDEMIOLOGIA MODERNA

cíi}l1. debe emplearse la eslandarízación recurriendo a un eslándar co-


mull.
Los dalos del ejemplo J6.2 provicncn dc un esludio de caso-conlrol
sohrc cinccr de nulmón (Doll y Hill, 1954). Los eslimados de máxima
probabilíd;td de una razón uníformc de lasas a lo largo de 105estralos de
gél1cro. dcl nivel más bajo de consumo de cigarrillos al más alto, son: 1,0
Ila categoría de referencia), 2,5, 5,3 y 8,3. Pueslo que los dalos exhiben
nolori;ts difcrencías para varones y mujeres en los estimados del efecto a
cada ni,'el de exposición. dichos eslimados resultan inapropiados. En su
lug;tr. habria que obtener estimados estandarizados según un eslándar
común. Pílra estos dalos de caso-control, la fórmula general de las
rítz~)I1CSdc tasas eslandarizadas (expresión [ J2.66]) se hace:

~ a.
L., II.. -.!..
.,
SSR =
, c.
,

~ h.
16.1]
L., "'. -.!..
I.' ( 1I

[j('mplo 16.2. N,í,l,e,o d(' "a('i('111('.f ('a1l cáll(.(,' de ,,/II,I,ó/I y "aci('Il/('.f


«(//II,()/c.~. ,,(}, .\"('.\'(/ .r ('alllidad 11'á.f ,('('i('Il/(' de laha('o CO".fUI',id(}
d(' .{llrl"a r('gllla' ( D{}/1.r Hill. J954 )

Varones
Numero de cigarrillos fumados al dia

o 1-4 5-14 5+

c¡¡~()~ 2 33 250 364


( '.(1111rolc~ 27 55 293 274
Ri{ .o R. ~ 17,9

M ll.jcrc~
Númcru de cig:lrrillus rum¡ldu~ al día
-

o 1.4 5-14 15 +

".iI~().. 19 7 .I 19 15
('(\Illrolcs 32 12 lO 6

~R :,o ,o 3,2 4,2

d()ndc Irj es el peso del factor de eslralificación para la eslandarización


del estntlo i y aj. h,. Cj y dj son las rrecuencias de celda del estrato i,
siguiendo la nolación dc la labia 11.2. Los Pc$Os deben ser runción de
las rrccucncias de los controles (Micttillcn. 1972) (véa.,\e Cap. 12). Cuando
se \()m.1 c()m() c.tlcgoria tIc rcfcrcncia cl pcS() rara la cs\andarización. la
;~:

;~m(
71
373

J Var (sRi~1 ~ (sRI~)2


[16.2]

Si se escoge como estilndar el grupo de referencia. para calcular la


\'arian7.~l 11~ly quc lJtili7.ar la fórmula [12.71] en lugar de la [16.2]. En
I:sle ejemplo. el uso con carácter de estándar de la distribución de todos
I(JS su.iclos ~ol1lrolcs asignaria a los datos de los varones un peso de 649
~' tic ()() ~I los Jc las mu.icrcs. Partiendo de la rórmula [ 16.1 ], los estima-
Jos dc la razón de tasas estandarizadas serian 1.0 ( la catcgoria de
referencia I. 5.1. R.O ~' 12.1. Otra elección razona ble de estándar seria la
Jistribu<.:i()11 dc Iodos los controles expuestos. asignando con ello un
rt:so dc ó2~ ~I I()s dalos de varones y de 28 a los de mujeres: este estándar
rr()du,Ce,t:Slimatl()s del efecto de 6.2.9.3 y 14.3 para las tres categorias de
10:,\
P()SI<.:J()1111() ~L'r().
('u~ll1do se utiliza la técnica de conjuntar. un problema que surge de
tr~llar en UI1 ~ll1¡ílisis il1dcpendiente cada categoria por separado es que el
<.:()I1,ilJlltO de I()s cslimados del efecto pudiera resultar que no fuesen
..:oherclltes elltre si. Por ejemplo. los ~stimados de máxima probabilidad
Je la razúl1 Je t~lS~IS para los datos del ejem plo 16.1 en los niveles de
'.:.xrosici()1l ~ y 3 .,Oll .?.5 y 5.3. respectivamente: la razón de estos estima- ~:

t~
dos es 5.3/2.5 = 2.1. Un análisis de esos mismos datos. utilizando el ti

l1ivel 2 como catcgoria de referencia. daria un estimado de máxima il"

probabilidad de la razón de tasas. para el nivel 3 en relación al 2. de 1.6.


4ue es considerablemente diferente del de 2.1 que se obtuvo con los
estimados del efecto que se sacaban cuando se comparaban los niveles 2
~. 3 con el I. L~I (liferencia surge dcl hecho de q ue el «pooling» usa pesos
ll(í ¡'(1('. dctcrminad()s por los datos. con lo que la ponderación difiere en
I()s dos an¡ílisis. L'Jl rrocedimicl1t() estal1dariz~ldo que utilizase un con-
] ,iUlll() dc pcS()S ~()mlln {;onduciria a rcsultados consistentes. También se
rucdel1 obtener estimados conjuntados consistentes utilizando un abor-
Jaje probabilístico ( Pike el al.. 1975; Hill el al.. 1978), un análisis multi-
variado o una modificación que se ha propuesto de los estimadores de
M~lntel-Haenszel (Mickey, 1985).

1~.~/in,a('i(j,l (le la lellllellCia glohal

La dificultad principal de estimar separadamente los efectos para cada


!1ivel de exposición es que se pierde información al no considerar la
l:()lllinuidad de la variable subyacente. Un análisis basado en la conside-
ral:ió!1 dc cada catcgoría por sepárado procede idénticamente, esté medi-

...
~
.
.

,.

..c.. ..' c -

:..~t
;~;~:
'~~: i~~.
1~~~~~I:i

~
"
¡~
0:;!0'..
W?.Q':-:. -, .-:-,

~{fj~- ~\~:

o:.;:
t
17' EPIDEMIOLOGIA MODERNA

da 1(1variablc categorizada en una escala nominal, en una ordinal o en


ulla Colltinu(l. Trat(lr cada categoría separadamente produce intervalos
dc confi(lnza quc no toman en cuenta el patrón global, si lo hay, de los
U;¡tos. lJIl nllmer() grandc dc categorias puedc llevar a tener pocos datos
-
dcntr(' de cad(1 una de ellas. dando como resultado imprecisión en loS
estimados del efecto específicos por cada citada categoría. Sin embargo,
cu:lnd() en lo~ dato~ existe una tcndcncia regular. lo~ estimados del
cfect() proveniente~ de las catel!nrias que la circundan proporcionan
informaci¿')n acerca de éste CIl una catcl:!orííl dad(l. Ciertamente. si la
catc!:.'°ría en cuc~ti¿)n po~ec ~()I(' llll()~ pOCO~ d:ltos. estimar con precisión
cl cfcct(, cn las C(ltcgorias por e11cima y por deba.jo de la de interés puede
rc~ultar suficientc p(lra ilportar una cxcclcnte indicación de] efecto en la
mIsma.
Un ejcmpl() de las formas en que ~c puede perder información si se
j
considera c:lda categoria separadamentc. aparece en un estudio sobre
mortalidad femenina por ci\ncer y cloración del agua (Young el al.. j
19R II. La cantidad de clorina del suministro de agua. que es inherente- :j.,
mente una variable continua. fue categorizada como ninguna. ba.ja, me- .I
d:.1 () .llt.l. L.I figura [ 16.2] indica los efectos estimados sobre el cáncer
de ccrebro. En los estimados puntuales, es evidente la existencia de una i
tcIlucnci.1 consi~tentc. Aunquc. tom.ldo~ por separado. cada uno de los
inICr\'.llos de confi.lnza c~ .Implio. 1:1c()n~istcllcia del patrón proporciona -I
i
Jllf(')rm;¡ci¿')n añ.ldid.l. Oad(\ lJIil' I(,s c;il.IUOS i11tcrv:llos de confian7.a no ¡
,
rcnci.ln e~ta inf()rmación adicion.ll. ~nhrellimcll~ional1 1.I v:.lriahiiid.ld
L'()ll.qUC deheria cstim.lr~e el efccto gl()bal dc la clorin.1 .c;ohrl' 1.1m()rtali-
t
d.ll1 p()r c:incer clc ccrchro. En cstc e.iemrlo. lo.c; autore~ terminaron de
arreglar el prohlema h.l~ilndose par.1 lit interrretación e11 valores dc I>; ~
puest() que ningun() er(\ «significativo». infirieron que no existía relación
entre el cilncer dc cerebro ~. 1.1 cloración del agua.
Dos leccione.c; importanle.c; hay que extraer de este ejemplo: I) es un
error basarse. para haccr inferencias. en la comprobación de hipótesis
e~tadisticas; y 2) es preferible e~timar una medida global única de ten-
dcncia del efecto. en vez de un conjunto de estimados separados del
mismo. Más adelante. en este mismo capítulo. se hace un reanálisis de
estos d.ltos. utilizando una medida de tcndencia única. ~

j
ESTUDIOS DE SEGUIMIENTO

Para lomar Cll cuenla el palrón de loS efecloS a lo largo de una serie
,.[,
ordcnada de calegoria~ de exposición, el invesligador pu.ede poner en pie
tIna ectlación dc regre~ión. La expresión más sencilla de tendencia es una
rcgrcsi{)n de linea rccta.
('onside(.cm()~ la adecuación dc una regresión lineal simple a un
conjtll1to de d~lto~ de ta~as de incidencia brutas. La incidencia de cáncer
dc m~lma entre mtljcre~ de Hiroshima )' Nagasaki que tenian diez o más
afi()~ dc edad en el momenl() de la explosión atómica está dada en el

iii
":":~

~~;~;~::
,-,.v:.i';:-

¡~~j[:
fli
ANALISIS CON NIVELES DE EXPOSICION MULTIPLES 375

7.37
7

6 5.92

5,54

RR

1
2.48-
2.15~
¿
1,814

0.72.¡.. 0.83
0.59

Ninguno BaJo Medio Alto


Nivel de cloración del agua

Fig. 16.2. Ra:ones de la.~a.~( RR ) e.~limadas e interoalos de confianza aj 95 por


I(I() de cáncer de cerehrn 1.'1/Irenllljerl.'s hlal/ca.~ de ~Visconsin. según el nivel de
] cloración del a~lla. tt>llludn de Youn.~ et al. ( 198 J ) .

ejemplo 16.3. de acuerdo a la dosis de radiación expresada en rad


(McGregor el (/1., 1977). Los dalos demuestran un incremento monótono
de la incidencia conforme aumenta la dosis.
r,lra estimar el componente lineal de tendencia, es necesario a:ignar
puntuaciones que representen la magnitud de la exposición de cada
c,ltegoria. La asignación de puntuaciones resulta necesaria simplemente
p,lr.l localizar los puntos de una forma que posea sentido en una griÍfica,
~ pue.<;to que la distancia horizontal entre ellos no está inherente ~n el

'-' hccho de que aparezcan ordenados en un ranking. Por ejemplo, la
Jistancia entre c,ltcgorias de la figura 16.2 está puesta arbitrariame1te y
pudier,l I1UC.;,lracterizar los incrementos reales en concentración de dori-

..

,.-c.c.~'.".'~~

tf:
::~~
ti~"~~;
~.
. ~R~ ~~~~. ,§4s~:
~
:\~\~~\~l~l\\\~ ::r:tf~;.

..~~~:\ :;;;.-,-,
~~"'. ;"",,:.~

37f, EPIDEMIOLOGIA MODERNA

11¡1. l\si~11cmos " la!\ cuatr() calcporia!\ dc Il}S datos dcl ejcmplo 16.~ las
,
rlllltllal'i(}I1C~ dl' (). 5. 55 ~. I )(). l{crrC!\Cl1t¡111 los punto~ mitad dc la
l'¡IIc.:!!l}ri:l. CXl'cpl(\ CI1 cl C(IS(' dc lil mily()r. <.IIIC rcqllicrc UI1(1 puntuación
ilrhitrari(1 ror tener uno~ limite~ il1defil1ido~. Si ~c dispol1e de 1(1 inrorma- 1
;
.
ci(}I1. e~ prererihle asif!I1(lr plll1tuilcione~ qlle rcpre~cntcn el valor medio
o<: 1¡1cxr()~ici(}11 CI1 cl ~CI1O dc c~" catc~()ri(l. (Nótc~c quc p(lra e~tos datos
0<: SI.:~lilmicl1t(). cl v(ll()r mcdi() CI1 tcrmillo~ idcale.C\ 110 ~eriil lil media no
r('110Crilda de t()d().C\ I().C\~u.jelos dl' csa c:llcf!oric.l. ~il1() má~ bien unc.1 que J
](, cstll\.icsl' ~Cglll1 la c()l1trihllción de cadc.1 liI10 de ello~ en término~ dc
rcrS('I1¡I-licmr().) Con dc.ltO~ ordinales ~ill vC.1Iore~ de exro~ici(}I1.illhcren-
tcs. si sc quicrc eslimar tel1c.1encic.ls ~if!uC sielldo neccsario asignar run- ]
tuaci()nes. ,!UJ1que rue5e arhitrariamente. Ell ca~o.C\ 3sí.l() que usualmente
sc utilizan ~()n puntu"ci()ne~ unir()rmcmcnte il1cremcntada~ que corres-
r('nc.lan al r.Jng() dc cada cate~()ria.
i

I.:j('mpl,}
Ih
I (,.3.
1J i,.I"i/¡1/l'11
( .(,,'i(I,\ (1(' "(i",.,.r ti(' "I(f"'('
I' 1\(I.~(','i((k i q1((' 1('lli(f11 tli(':
.\" fJ('r,\(m(,-(f';(J,\"
() 11'(i,\ ll';(I.\ ti('
(I ri(',\',~(1 fJ(fr(1 111'(I(.r(.,'i
(.ti(lti (." (.J 111m,I(.,11(J .
1
.'I

(h, II( (..\.fJI(L\"i(;1/ (fl(;l/Ii(.(I. .'i('.l'1il/ 1(1 ti(I.\:i,\ ti(' ,.~,tli(f('i(;,1 ('I/ r(ftl ( M ("G,.('J!(Jr ct aL J9ii )
~
Dosi~ (cn radJ 1
,i -",.
,.. '-
," ..

'. --fJ.
, , "

, ;,

...
c c' .'

('(!11 Ja,c;puntuacione~ a~ignadas, I()~ pl1nto~ de lo~ datos se de~plie- rI


iI ¡
1:!.111Cl1 UI1 grilfico (Fi~, J 6.31. Adecuar una Jinea de regresión sobre ~
~
cl1.\tr(1 d.\tos pl1nluaJe~ es algo directo, pero cada uno refleja una canti-
~
d.ld de información diferente ~. deben, por tanto. asignar$ele~ pesos
difcrCl1les. Un abordaje mcdiante cuadrado~ minimos de la regresión I
t
pl)I1(~rad.1 proporciona par.~ la pendiente ~. la intercepción las siguientes ,
~

fi)rmlll.ls (Kleinbaum y Kupper, 1978),


rcl1d iel1 te:

h, = [16.3]

illttrCcpción:

I;() = r' -,; 1,,\, [16.4] I

,~.
~. .

:~~:
.;.;-:';,;

::¡~t-~:
;:\~t~~Jl~;I:!

i~~
ANALISIS CON NIVELES DE EXPOSICION MULTIPLES 377

o 50 ,00 150 200


J Rad

~ I;i~. 16.3. !m.i(/¡'/"./I/ ( /I,(" J tI(' ("(in("('/" tI,' "'(1111(/ .t(',!!lín la tln.ti.t tI(' ratliación en
~
'.1/tI. !"/'.(/ !,1.\"1/¡/'(1.\"1/¡'/ t';(,/"fl/'1 lfí..;. '.'111 IIII11 ,('ntl('ncia lin('a/ es'i/',ada. ~

~
"

1 /;:
~
~
.

Jonde:

n "
-}.' -.J~1 )¿... Ir J' . I .J'
I;= I "'t~j
] n
,v "
I Ir, 2:: II'
;" I J
j = I

II es el nllmero de dalos que se representan en forma de puntos, j es un


índice para cada uno de ellos, wi es el peso de cada uno, X es la variaQle

.c.
~~

}~;k::l;,i{~~~~,:~ '~¡~~~:
:~~~~¡;\~1J\~f~~}1;
;:f.~::

.
~

-1
37f1 EPIDEMIOLOGI/I MODERNA

de exposición e }' es la tasa de incidencia. El error estándar de la


pcndicnle se puede calcular así (Grizzle el al,. ] 969):

j=
I.
I
11' ]
SE(/; = [16.5]

En cada una de las f()rmulas rrcccdcntes. el peso de cada dato


punlua] dcbc ser calculad() com() cl inverso de la varianza del mismo.
r)ar:1 dal()s crudos. com<'I I()~ del c.iemrl<1 16.3. dicha varianza viene
dada por la fórmula:
.
var
(' {1 )
-= -- {J

"I. N~

d()I.'dc (I es cl numero dc casos ). A; el dc pcrsona-años. Por lanlo. el peso


serlC\:

!\12
II = -1-

a. I

par;¡ cad;1 dat() puntual j (Las tagas de magnitud cero pueden plantear
lill prohlcm.l. plle~lo que el res() seria infinilo. Una solución es añadir
lllla cantidad arhitraria. com(\ rt)(lri;1 ~cr (1.5. al numerador de cada tasa:
()Ira. ulilizar un esqucma dc ponucración modificado. del tipo de 11" =
1\. J
.,.1
Para tasas de incidencia estandari7.adas (SI R la varianza es:

., a;

i ,ri~

Var (SIR = )

dondc 11"jse refierc al peso de estand arización del estrato i. (No se deben
conrundir los pesos que se emplean para estandarizar cada tasa con los
utilizados para la regresión dc la tendencia de tasas estandarizadas,
rcspectiv3mente.) El peso de rc!:!resi ()n para cada tasa estandarizada. al
calcular los "coeficientes de rc!:!rcsi ()n. es el reciproco. de la anterior
\'afIanza:

;~

I.~
;;, ,
",~
".."'
;::,:;;;~:~;~~;;::;;;¡;.;¡;~:~~:;";;.~:;:~:;¡'-;:~;:'.;~:~:::i¡"¡i~:;;:i~~;;
,,---, J,. .-J..H.;..:J;;~.~,..1i?Z..~..

..:,;"-=-'c... [i' :;~~;~ fi~l~

¡~.:.

.::¡:

ANALISIS CON NIVELESDE EXPOSICIONMULTIPLES 379


~:

I:::

Es recomendable cierta precaución al usar métodos de regresión con ~,~,

\ilsa,c; cslandarizada.c;. puCSlo que el proccso de estandarización en si


Illism() r\lctlc. CIl cicrla.c; circunstancias. introducir sesgo en la regresión ~~

11{IISCllhillll1l y 1{\lhin. I ()R4).


1:1 ~rr()r ~sl¡illtlar d~ la inlcrccpci()n. ¡;o. vicne dado por:
I

n ~

í ".t~f ~i
j= I
SE(/;f»)
J I;~.'
)~
~
í
y la cOVariallZ;1 dc 1;/1 con I; ~~
íi
"
~ Ihn.
--j=1 -r. "'r'(j
(ov ht) = n --" " -,2

Par.l cualquier punto. .'"k' la tasa puede ser estimada como:

Yk = ¡jo + ¡j¡-\,k

I
Cl)ll

n n
"'t\'f -2.\"k L 11!j.\'j + .'(f L Wj
.:...
-n --n j=1 n j=1 --
SE( }rJ =
J2
] L 11't\J ¿ Ilj -L Ilj.\, j
.j=1 j=1 j=1

1 La aplicación de las fórmulas [ 16.3] a [ 16.5] para determinar la línea


de regresión ponderada de cuadrados mínimos, es habitualmente sencilla.
porque lo normal es que sólo estén implicados datos de unos pocos
pun\('ls. L.\ linc.\ tlc tendencia resultante ofrece una forma d~ describir el
cfecto rnatcnli,\ic.,rnen\e c('lrno funci¿>n de la exposición. La línea adecua-
<1., a I().'\ (1;lt()s tlcll:.jcmpl<\ I ó..1, se da cn la figura 16.3. La pendiente. 2.43
x 10- " ari<) I r.,(I.. I. intlica la cantidad cstimada en la que se incremen-
t.., la tasa de incidencia por cada incrcmento en rad de la dosis. A partir
del error estándar estimado de 1..\pendiente. podemos calcular un inter-
'1
valo de confianza aproximado al 90 por 100 para la misma, así:
j
2.43 x 10-6 año-1 rad-1 :t 1,645(0.60 x 10-6 año-1 rad-l) =

= 1,45 x 10-6 año-1 rad-1, 3,41 x 10-6 año-1 rad-1

:¿;~I~:
~
EPIDEMIOLOGIA. MODERNA

Pítra eslimar la tasít de incidencia de cincer de Itlama CIl nlujeres expues-


lílS íl 100 ríld. uliliz311do la ecuación de regresióll. asigní\nlOS a .\" un
\"íllor de I ()() y oblenemos una tasa predichíl de:

198 + 2,43(100) = 441 x 10-6 año~ 1


106 años

con un error estándar de 62 x JO-6 año-l. Así pues, el intervalo de


(}nrianza al 90 por I 00 de la tasa con 100 rad, estimada a partir de la
regresión lineal, sería:

44 :.t 1.645(62)
= 339 x 10-6 año 543 x 10-6 año
10'. años

Usando modificaciones del método anterior, se pueden estimar ten-


dcncia$ no lincales. Una modificación consisle en asignar puntuaciones a
la \"ariablc de exposición. Mediante la asignación de puntuaciones que
rcncjan tal p.}trón no lineal, tendencias no lineales pueden resultar «Ii-
ncalilada$). Por ejemplo. las punluacione$ de la exposición pueden ser
t:1 cII(ldrado dcl valor de la misma. renejando una relación cuadrálica.
Mctlianlc Icl asignaci()n de ulla puntuación es posible incluso reordenar
Icl$ calcgoría$: una ve7. adecuada a las puntuaciones de exposición una
rclal:i()n lillcal. cinco calegorias 3 las que se asignascn las punluaciones I.
~. ."I..2. J dt:sL'ribirian unt1 rclación de V invcrlida con la exposición. Otra
fOrlll;¡ dc c$limar tendcncias no lineales consiste eJI usar transformacio-
nL.s tic CSL'cll;¡ dc 1;1$ tasas de incidencia y p()slcriormcnlc adecuar la
Ic!!lcsii)n lincal a dich;¡s tasas transrormatlas. Si sc elllplea este tipo de
I:Isas. rcsulla importanlc a la hora dc dclcrl11illar los pesos tomar en
(UCIII;¡ lils traJIsr()rmaci(,nes.

s JI)IOS )1: (~ASO-CONTROL

COl1 esludios de caso-control sólo se pueden estimar -sin tener que


recurrir :1 información externa- medidas rclativas del efecto. A cada
ni\'cl dc cxposicil)n. cl, cfccto es cstim:ldo CII rclacil)n al nivcl de rcferen-
cia. hahitualmente la categoría de exposición mi\s baja. Para dícha
cate!!oria de rcfercncia. el valor de la razón de tasas se define como 1,0.
Una tendencia lincal dcl efeclo seguiría, pucs. la forma de la ecuación:

RI~ = + "'.\' [16.6]


...J~ :~:::
;...; :,..~.,:¡.c
.".
;~f~: ~:~~:

~~~..:~d.;;¡fi~~;:

¡\"I¡\LISIS CON NIVELES DE EXPOSICION MULTIPLES 381

1 III,!l:llliO !a lasa r()r la raz(>n de casos a controles. a cada nivel de


I:XP( )SI(;IOII:
V~lll~lj~l de casos a conlroles = ho + hl~'(

I~~l rc~lui~11tC llc 1.1.ccua<:ión [ 16.6]. "', se puede estimar mediante el


L"l}l:iclltC h1i'h,l, lll}11UC "I y "n vicncn dcterminados a partir de las ecua-
L"i()I\cS LI6.Jj y [ló.4] (utilizalldo p.lra c~1da .1} I~l vent~lja de casos a
l:()lltrolcs en lugar de la tasa).
Los pcsos .l~ign~ldos a c~ld~l punto a la hora de adecuar la regresión
ucben rene.iar la vari~lnza de la ventaja de casos a controles. Para datos
L"ruz.I<.1()s.el rcso uc regresión. 11'j, a aplicar a cada punto que representa
IIIl U&II(}. dchc L"all:ui.lrsc .lsi:

= ~~ J-
II j((1 j t- hj: L-..v-;- + :V,>
I --hr-.
,,~
J
-
NIIVf)

Jl)nde II j y h j son las rrecuencias de casos y controles. respectivamente. al


nivcl Jc exposición i. N 1 es el número total de casos y No el número total
llc.: L'onlrolcs. Para datos cstratificados. deben estandarizarse las ventajas
a c;~lda nivel de exposición. hall.lndo:

~ 11'.- aij
i- I b..
.I} I
SO j = -r;;-

donde SO j es la venlaj;.l estandarizada y 111el peso para la estandariza-


ción en el cslralo i. El peso para la regresión debe obtenerse mediante:

L 1\'
11'. = ¿.
J ~!l + NiQ
-al}

2. 11'i! b2
i II N,lNio

i
El error estándar de I;' se estima ~lsí:

8 --",-
1-- \l'j
+
L \\'j-\J
~2 +
2 L \\!j"\J
--
."1 hi ha bah1
SE(/;'. = ~ ~~[fWJ~

j y el error est{lndar de un estimado de la razón de tasas, RRk' predicho a

ptlrtir de la ccutlción [ 16.6] es:

SE(RRk) ~ .~kSE(6'~

~-.;:;!;~:

;r:~::~~;
:~::¡;::~;"f**~:" :~.

~
382 EPIDEMIOLOGIA MODERNA

Consideremos los datos de caso-control estratificados del ejemplo


16.2. En la tabla 16.1 se acompañan las ventajas estandarizadas, sus
varianzas, los pesos para la regresión y las puntuaciones de exposición.
La aplicación de las fórmulas [16.3] y [16.4] da 6. = 0,0654 y 60 =
0.1671. De esta forma, podemos estimar b' = fi./{Jo como 0,0654/0,1671
= 0.392, con un error estándar de 0,1305. Para los fumadores de un
paquete al día (x = 20), la razón de tasas estimada a partir del modelo
de rcgresión seria l + 0,392(20) = 8,83, con un error estándar de
2(XO.1305) = 2.61. Como sucede habitualmente con las medidas expresa-
das cn forma de razón, para obtener los límites de confianza es deseable
cmplcar una transformación logarítmica, con:

1:1 inlcr\'alo de confianza al 90 por 100 de la razón de tasas para


rlllll:td()rcs dc un paqllctc al día scría, por t:llltO,

exp [In (8,83) ::t ,645(2,61/8,83)] = 5,42, 14,4

L.os c;ílculos anteriores se pucdel1 realizar con una calculadora ma-


Ilual sin grandes dificultades. En térmil10S ideales, una regresión adecua-
da rcspecto de las vcl1tajas de casos a controlcs debería tomar en cuenta
las c()\"arianzas entre tales ventajas y 10S distil1tos niveles de exposición,
4uC no s()n indepel1dicntes. Para hacerlo. no obstante. se requiere un
pr()ces() dc adccuaci()11 m;'ls complicado (Drapcr y Smith. 1966). que 110
rc"lllt;lrí;1 posihlc sin un;1 computad()ra y el .\"(I{'I\"(frr apr()piadn, El
ahl)rdajc alltcri()r falla a la hora dc tomar CI1 C\lcllta estas covarianzas Y.
CII c()nscc\lcnl.ia. no cs ()plilll;lml'lllc clicirlllc. PCI() c;lrccc dc scsgo (Sil-
\l.Y. Jl)7(») y ()frccc 1;1 \'cllta.ia dc 411C cs f;ll'liblc con un c4uipamicn(o
inr()1 m;ltic() mininl(),
f:.n oc;lsiones, cuando los da(os origil1alcs no esti\n disponihlcs. puc-
dc sl:r dcscahlc obtcncr la linea de tel1dcncia con 10$ estimados dc la

l.a!lla 16.1. '.('I"('i(I.\ ('.\/(/llti{l'.i:{lti(I.\" ti(' ('a,\.(),~ (} !'n",'.nl('.\". t(/riol/.:o,\". /,('.1{1,\" dc


'.(',~,.(..\i(í" .1. /,"~"'({I(i{I//('.\ ti(' ('.\'/,(I,\i(i(jl/ p(/'.a I(},\" dolo,\" del ej('I1'/,lo 16.2

Número de cigarrillos fumados al día

O 1-4 5-14 15+

S() 0.09646 0.5' 9928 0,89833


\!¡Ir (S()I o.()(Jm 0.0 1509 0,00369
PC~() J68.204 66.:! 73 271,251 t 30.257
Plinlll¡\(i()n dc ex rosici(~n O.O 2.5 10 20
I~~
~:;,:
]l~.. ;.::~¿\1\:~j\\~}\jt1;
~\:::
'~fiIJi 2:&íi

1 ANALISISCONNIVELESOEEXPOSICION
MULTIPLES 383

r:I7.()ll dc tasa.'\. Ull ejemplo podría ser volver a analizar los datos de la
ri~ura I ó.2 para t.:valuar si cxistcn tcl1dencias. Dichos análisis provienen
tic un al1illisis tle rcgresión logística y no se dipone ni de las frecuencias
origin(llcs ni de las venlajas de casos a controles. Pese a todo, sigue
sicndo posible estimar una línea de tendencia lineal en los eslimados,
:lul14ue se~l menos eficienlemente que si se tuviese acceso a los dalos
()ri~incllcs. El pclrillnetro h' de la ecuación [ 16.6] se puede estimar direc-
lamente a partir de csla otra:

" , [16.7]
, \V :.\"-J'
I I
-,
i=-

ll()110l: I~ I~ , C.:S1.'1c.:slim~IO() al 11ivel i de la razón de tasas especificas por


1.:~IIC~()ri~l. la ~;IIL'~()ría de rcrcrencia U = I) se ignora y

11' -
I 1 1 l
RR7 -+ -+ -+ -J
) a h c d

I>ara razullCS de tasas cstantlarizatl.ls h.1y que tomar {IJIj} como el


recíproco de la v.1rianza que se da en la fórmula [16.2] o, cuando sea
aplic.lblc, en la fórmula [ 12.70]. En .lusencia de los datos reales. se puede
estimar II'; :.1 p.1rlir de un error estándar. de un test estadístico o de un
inlcrv.llo de confianz.l (Vé.lSC más adelantel.
Eslc 111()ticl() tic rct!resi()n. como el .\nlerior. ignora las covarianzas '.
~ntrc los estiln.lti(IS r>lintllf.l¡es. qllc r>lictlcn ser sustanciales con este mo-
ticlu si las rrcclicl1cias de la catcgori.l tic rercrencia son pequeñas. El ~'

error estilndar de 1.1 r>endiente r>liede estimarse así:


i~
~
"
SE(h' = ~

JI5
j=l
Para cualquier valor de exposición, .~k' el valor estimado de la razón
Jc la$c.lS. RRk, se ruede obtener a partir de la fórmula [16.6] utilizando
~I ~slimado de la rendiente que recoge la expresión [16.7]. El error
~$Iilndc.lr de Ic.l razón de tasas estimada es simplemente:

SE(RRk) ~ .'t'kSE(6':

Los estimados de la razón de tasas de los datos de la figura 16.2


surgen de un modelo de regresión logística múltiple que incluye términos

~
.; :~¡~1~l.

:1~
.:\~~:!%~;~¡:~~~. .,::;?:-:::

il:ll~
J
384 EPIDEMIOLOGIA MODERNA

r;lr;1 \';Iri()~ racl()rc$ dc conrll'C;ióI1. Lo~ rC$O$ para adccuar una line,\ de
ICI1dcIICi,l:I I()~ dalo$ punlllale$ de la citad,1 figur,\ 16.2 pucden determi- !

11arSl' :1 p:lrlir dc 10$ inlcr\':II()$ dc confi:lnz:\. Pue$to quc el intervalo de I.


..
l.('nfi;1 ni'.:l :II 9) p('r J ()() (1h:l rc;1 lln,1 d i~1 :I nci:l. $ohrc 1:1 e$cal:1 logaritmica. ..
, ¡:
¡
lllll. c.' igll;11 :I ~ x 1.9ó .SErll1 (I~J~).l. sc pllcdc h:lllar 1:1 varianza de
4
1
111(f{I{):1~í: I
I
.1
-, 111(RR) -111 (Rl~ 3
t
\:¿¡r lln (I~I~)J =
1
1
I
2 x .96
[16.8] I

~. la \'(lrianza de la razón de tasas se puede estimar como


J
V:I r ( RR ) ~ I~ ~ \i :I r
111(1~'~)] [ ló.9]

El PCS() para la rc!!resión se ohticllC dcl rcciproco dc Var (RRI. El


ahord:l.ic anterior presume que 105 limites de confi.lnza se hall(lron em-
plcilndo una transrormacián lo!!aritmica. lo que habitualmente es verdad
~' desdc luego es siempre el caso si la estimación deriva de un modelo
lo~íslico múltiple o del modelo de rie5gos proporcion.lles de Cox, Para
\'crific.lr la validez de esta asunción. resulta prudente comprobar que
sl1bre la escala log~lritmica. el e5timado puntual es la media aritmética de
los limites superior e inrerior. o que el punto de delimitación superior no
tr~lnsrormado multiplicado por su homólogo inrerior e~ igual al cuadra-
U!) dcl e~timado puntual. Llamamo~ la atención sobre el hecho de que.
Cil cl CaSl) dc lo~ dalos de la figura 16.2. est.l condición se cumple para
1(1~ dalos punluale~ primero y lercero. pero no para el de enmedio.
rue~I() que lodo~ lo~ estimado~ vienen del mismo modelo. la explicación
dche estar en un error a la hora de inrormarlos. Sobre la base del valor
de I> que se informaba en el papel original. entendemos que el punto de
delimitación superior del dato puntual intermedio debería haber sido
.Iproximadamente 6.4 y no 5.92. Empleando las rórmulas [16.8] y [16.9]
y el valor 6.4 para el límite superior del dato puntual de enmedio, salen
lInos peso5 paríl los tres datos puntuales en cuestión de 0,9370,0,6944 y
O..Ci1ó.Ci.qllc corre5ponden a los niveles de clorina bajo. medio )' alto,
respecti\'amente (Tabla 16.2). A partir dc 1.I fórmula [16, 7] se estima que
lil pendientc e5 0.555. con un error estilndar estimado de 0,344. La
pcndicnte estimada se interpreta como un incremento de 0,56 en la
r~lzóll de las:ls dc c(lncer de ccrebrv por cada incremento en el nivel de
cloracii)n (por ejemplo. de bajo (I medio).
Eslimalld(1 cl Creclo del nivel allo de cloración (.\' = 3) en relación

:.::;.;:::~~,:::;:'::j~."..:.,"::;:::;:'~:::;.:.cc;~

:~~~:
.-

':~: ,\~,~~l:;\{~~¡~:~-
;::-:.

ANALISIS CON NIVELES DE EXPOSICION MULTIPLES 385


~-
"'.1
1.:1111:1 16.2. f:.\.,i"I('(lv,\' d(' 1(1 rll=()', d<, 'lI.~lI.~. vlIrill".-lI.\,. I'(',~(',~ d<, re1!re.\"ió1l
I' 1'lm,I1(I('i(m('.\' (1(' (..~f'(,,\"i('i()1I f'lIra I(}.~ (lalo.~ (1(' la .1¡,~I(ra 16,2

Calegoria de dosis de clorina

Ninguna Baja Mcdia Aila


..'.
1{ 1{ 1.00 1.8J 2.15 2.2 8

Var (RR) 1.0672 1.4401 1.8 992


Pcso 0.9370 0.6944 0.5 265

1)llllll1aciiln tic C., p(ISiCiÓII 2 3

1.:(~11
ci Jc 11il1gulla cj()raci()11. lencmos. utilizando la ecuación de regre-
,1()ll:
.--,
I~I~..".. = + (0.555)3= 2.66
/"'-

SE(I~I~..,I..
= 3(0.344) = .032

y. ~Il l:()mparal:i()n l:on los dato$ de la figura 16.2, un inter\'alo de


l:()llfian7;a al 95 p()r 100 de

exp [111 (2.66) :t .96( I.O32í2.66)] = .25. 5.69

La comparación de este resultado con los hallazgos de la figura 16.2


-;ll!:!il:rl: quc cl allillisis de regresión utiliza los datos de una forma consi-
dcra hlcml:tlll: ItlilS l:fí<.:iente.
L~I -;ctl<.:i¡Il:;r ~. 1(1 Jirecto del modeJo de los cuadrados mínimos que
11l:\,a a la f(lrmllla II (¡.71 reslllt.1n atractivos. pero el método tiene sus
rL"~:ls. Al f(lr;r.:lr 1:1lillC:l llc rc!:!rl:Si()ll a qllc rclSC por cl punto de rcfercn-
<.:i;l. csle modelo de rc!:!resiún asigna. de I1ccho. un peso extremadamente
~ratldc ;I 1.1 !o<.:;lliza<.:i()n de dicho punto en relación con la serie restante
dc plltltoS. Sin cmh¡lrgo. la posición rei.lliva del citado punto de referen-
l:ia l:slil dclcrmin~lda cn p.lrle por I.l variabilidad muestral de las obser-
va<.:i()11CSa l:SC Ilivcl de exposición. Sí la c.1tegoría de referencia posee
frccllctlcias pcqlicñas. 1.1relacíón entre sí de los puntos restantes renejará
mcjor 1.1 tctldctlcia 4l1e I.l relací(>n que tuviesen con el punto de referen-
<.:ia. 4l1c h.l sido fijado arbitrariamente. En consecuencia. este modelo
pllcdc ser considcr.1hlemenle menos eficiente que el que adecuase una
IClldctl<.:ia lillC~11 ~ll~lS venlajas de C~lSOSrespecto de controles y su grado
dc incficicnci.l dCpclldcril dc los nl!meros de sujetos que haya en la
<.:atc!!.oricl dc rcfcrcll<.:ia. Nl) l)hslatllc. incluso sin conocimiento específico
dc l~lS frccllctlcias 4l!C pcrmiticran v.!lor.lr el grado de ineficiencia en
<.:licsli()n. cl ml)dclo de l.lS r.lzones de t.lSas puede ser útil. Lo que está
ci.lro es que cualquicr ev.llu.lción de la tendencia. incluso utilízando un
modclo estadísticamente ineficiente, es mejor que ninguna, como ilustra
cl cjcmplo de la cloración del agua y el cáncer de cerebro.

.,.

.t~:;::.
~
~1~li';,1:;~:
~

3A(i EPIDEMIOLOGIA MODERNA

(.()~11)I{OI~¡\CION DE HIPOTESIS ESTADISTICA


1)¡\1{¡\ l)ETECTAJ~ TENDENCIA

I\ 1(1 larg() dc tod() este libr() sc ha hech() con firmeza énfasis en la


cstin11Ici()n de medidas epidemiológica~ quc posean sentid() com() mét()-
d(1 de prcfcrcncia frente (I la comprobación de hipótesis. Pesc a todo,
mll<:ho~ in\.estigadore~ que están dc acuerd() con lo~ ob,ietivos de la
\,'.;tin111<:i()I1.cuandl1 Sl' el1rrel1tan (I 1:1c\'(llu:lcii)n de tendel1cias recurren a
!;1, l'it¡ld;l~ C:l)l11prohacil)I1C,". i.!)or l.Jlil' 1;1c\'alu(lciól) de lcn<.1el1cia habria
(1\,' l'r1.:oisp()ncr II la comproh.lcii)n cstadi~tica: Quizás estos investigado-
rt:~ l'nticl1den quc si sc estiman lo~ crcctos ~cparadamente por categorias.
St' pllcdl' perder informaci()I) ~. I() quc haccJ) cs simplementc echar mano
(1\,' l',(1S mils ampli.lmel1te utiliz.llios mctodos quc prolongan I()s análisis
1'1ltl mi()I()~IC()!' hilsico~ de la' t.lhla~ <.Ir: )' :. Las mil~ import.lntes de
1..'1)trr csta,' pr()lol1g.lcioI1C~ son III~ dcscritas por Mantel ( 19631. que
il)<:luycl) l.1 estim.lción de re~resiól1. per(1 el1ratizan la comprob,lción
I
I.'Stll<.1ísticll, I\unquc los métodos dc rcgrcsión de 1.1 sección anterior :
,
<:l1111rlc11lo~ oh-;ctivo~ Cpi<.1Cllliol()gicos de estimar tendcl1cia~ en térmi-
n()s de medida~ eridcmiológicamentc interpretables, vale la pena exami-
11ar la mctodologia
El te~t estlldistico
de M.lntel por lo ampliamente
de Mantel-Haenszel (fórmula
utilizada que es.
[12.3R]) se aplica a
I
dalos sum.lrizados en form.1 de un con.iunto de tablas de 2 x 2. El
rrimer(1 lll' csto~ autores. ~lmpli(' { Il)(,.ll ia prueba p~lra dar c(\bid? a
d:lt('s quc estu\'icscn re~umidl)S COill(1l'()n.illllt() de t~lblas dc contin~encia
<:()11l'lI~lll.Juil'r n\lmcr() dc c~ltcgori;l~ de l'xp()sici()n () de cnrermcdlld.
l)ich:1 ampli.lci()11 posihilita tamhicl1 l.JUl' las \'ariablcs del estudi() sean
tratada~ Com(' medida~ continu.l~. En la m,1yOria de las aplicacione.\;
cridcmiológicas. la variable enfermed,id permanece como dicotómica.
pCr(1 la de exposición se categoriza en diversos niveles. Utilizando la j

n()mcnclatura de la tablu 16.3. la ampliación por Mantel del test es:

) a;

\ -L- ) !\.'.\. J" J


'\"" !\ ' .7
- L (1.;-\"j
j .:..,. J
= \c \
'1
"
.;...l1j.;...hj
j i I
"

~~ , j )2
L J\Tjo\j
1.
(~ "i )~(~ f\/j
dl\Jldc .\j rcprc$enla la puntuación asignada al nivel de exposición j e i
rcpre$enta el indice del factor de estratificación para el cual el despliegue
de lo~ datos de la tabla 16.3 representa un estrato. El test de ampliación
de Mantel. en la forma dada aquí. puede ser entendido como una
~eneralización a lo~ estrato~ de un test de tendencia lineal en proporcio-
nc~. PUC$lO que se trata de un tesl asintótico. como el de Mantel-

~~1~,;1k

',',~~.

~
?":::.

.fflj'
~i:c.
l r'"

I\N/IIISIS r::ON NIVELES n~ ~XPOSI(;ION MIJL TIPLES 387

1:1111:1 16..'. /-il/""(1 (1(' /'/'('-\'(""('("Ifi" JI' 1".\- (1(11(1.\, ('!,;t!('I";('I(jR'icn.\"


("(iII /'(I/'i(,.\' ,,;,-(0/(,-\ (1(' ('.\"/If,.\-;(-;(i"

Nivcl tic cxposición

o 2

( 'asl IS
lJ() {11 lI~ al
No t:asos hn h, h~ hl

Tolal Nn N N2 Ni

11:lt::1SZcl. 110 rCtllli(;rc Icner númcros gr~lndes en ningún estrato. De


~
I1Ct:illl. f\111CilIll:1 hi(;11 r.:liando r.:~\da eslralo es simplemente un par de
1::1S(\-r.:I)I1Ir01emp:lrc.iati()s. siempre que hllbiese bastantes de ellos como ~~:

il-?,
rara llllC sc r.:lilllplit:sc la r.:()l1dicil)n asintóIic~l.
~~~'
I rl1 tCsl de telldcncia lineal no tiene incorporada ninguna asunción
..'
Ilc lilll.'alidad: Sc limita a poner a prlleb;.l el c'OI"!,')I'(!I/fe lineal de la
ll.'ll(It:11Ci:\. \."llalqlliera que fuese la lendencia real. I\si pues, es útil para ~~

*.
(Ict~clar r.:lialqllier rclación monótona existente entre exposición yenfer-
m~u:lti. il1cillSO si la relación 110 es line;.ll. Por supuesto. puede haber ~;

:ls()ci~tcioI1CS 11~lm~llivamente no mOnólOn~lS con un componente lineal


qllc fuc.<;c \."omo b:ll~lnCe ccro. En la medida cn que sc sospcchascn a
rriori t~lles asoci~lciones complejas. se las puede evaluar mediante una
;lsi~n~lr.:il)11 tic rllnlllaciones que reneje esa visión apriorística.
M~lnlcl ( I IJh3) proporcionó igualmente fórmulas para los coeficientes
tic rc~rcsi()11 qllc miticn la Icl1ticncia linc~ll quc está siendo sometida a
rrllcha. pcro p~lr~l datos de c~lso-control no son fácilmente interprelables
1.:11Icrmin()s cpidcmiol()~icos, L~l lendenci~l lineal medida es una tenden-
Ci:l tic la prop()rci()n tic sujcto,c; que son caso,c;, Para dalos de seguimiento
qll~ rcprcscnl~ls~n ¡;OI1ortc,c; fija,c;. sc trata tic una tendencia de la inciden-
r.:i:l :lclimlll~l(l~l. pcr() para tintos de cnso-control. insistimos. no es equiva-
Icl1lc ~l un il1crcmcnlo lincal cn la tasa o en la razón de tasas, Considere-
'"\)S los datos 11ip()téticos del ejemplo 16.4, El incremento en la propor-
r.:i()ll dc slijetos quc son cnsos es perfectamente lineal, pero la razón de
las~\s ~lumcnt;.l dc forma mils que exponencial con los incrementos uni-
f()rmcs de la expo.0;ici()n. En contraste, el ejemplo 16.5 muestra una
Ic"ticnci~l CIl la ra7,ól1 de taS(lS que se incrementa linealmente con la
cxp()sici()I1. pero la proporción de sujelos que son casos sc incrementa
'.';;O
mcllos 4l1c lillc~llmcnte. ¡\si pues. no debe aplicarse a datos de caso- io.-1~~

",:~

\."1)111 rol cl c()cficicllte dc rcgrcsión obtenido por el procedimiento de ;,""

;~~
Mantcl. ~1i~-rJ.
¡\ pcs~lr tic II) .ll1tcriormente dicho. el test de ampliación de Mantel
¡;o"slituvc. sill c.;mhar\!o. incluso con datos de caso-control. una forma J~
;i~
v(ilid(l dé pl)IlCr ~1prU~b(l la hipótesis nUI(l de que no existe una relación
moI1()ton(l ~ntre exposición y enfermedad. Su interpretabilidad deriva
dcl hccho de que unc.l ~lusencía de tendencia significa exactamente eso:

1
,
:~~

";:.i.~~.
1~
.~
;f~:~~l
tr1~tt~~
~~;;i~\\~~~i~~
'-
-~-;:~.'-~..;;., -;,:.,..;.:,;,~.~:;;;~. ,.~~, ;~~;...;;;..

388 EPIDEMIOLOGIA MODERNA


, , ~-

Ejemplo 16.4. /)010.1 ¡';pnl(;1irn.\ tic r{I.\"O-Cmllrol qllC mollif/C'.\"101l


/11/(1 1('1lc!('Ilrio 1;,1{'01 (,II 1(1 prnpnrci()1I dc .\'"j('10,\ q'/C .\"m/ {'a.~n.\
, Nivcl dc cxro~ición

o 2 ~ Totul
)

l~j('mplo 16.5. /)(1/(1,1 h;P(1/i'/


111!(1 /('lld('1!(";(1
;("(1,\ d(' ca.\'(I-("n1!/rnl
1;1!('all!I1 la ra;(i11

Nivcl
qllC IIIn1!;fie.\"IO1!
dc la.\"a.~

de exposición
,
.,
() 3 Total

(.;I~O~ 20 3.1 4~ 5(1 14¡; .:

l)i 50 ~54 ~
(.olllrolc~ 80 57

T('1tal 10(1 100 10O JOO 400

J~:17()1l dc t¡¡S3~ .{) 2.0 3.0 4.0 I

UIl:l :luscncia de tendcncia. se la exprese en termino.c; de razón de tasas o


dc prop()rción dc SU.iel()S que son casos a Cad(l nivel de exposición: existe
UIl:l hipótesis nula común que hace válido al test: más aún. se trata
cicrt.lmenle de una prueh.1 est:ldistic.lmcntc potentc frente :I un.1 g.lma
ampli:l dc :llternati\.as :I la hip()lesi~ nul;1 (T;lr()nc : G.lrt. 19RO). Per(' el
test tiene el inconvenientc dc que si)l() es UII tcst y proporciQn:l únic(l-
mentc un \'alor de P. Para obtener una mcdida de tendencia con scntido
epidemiologico es necesario utilizar un método del tipo dcl descrito en la
sección previa de este mismo capítulo.

,~~

ANALISIS MULTI\'ARIADO PARA DETECTAR TENDENCIA

L()s modclns de riesgo relativo generalizado descritos por Thomas ( 1981 )


(,frCl-cIl \111modo dc evaluar tendencia en III razón de tasas mediante un ~J+~
I r~:
,?
,-.;;
k».

I\l('dclt\ mUlli\'nri.\do, En contra~tc- cl modclo de regresión logistica es


mlll'¡'t\ m:'l..; rcslriclivo- puc~I() quc prc~umc una relación exponcilcia) .'.':-:

c .

:f;fJ~I~:

~
::;;

:~ ;71~
/\N/\LISIS CON NIVELES DE EXPOSICION MUL TIPLES 389

\.'lltr~ il1<.'rclllclllos ll11iformcs ue la c.xposición y la venlaja de enfermedad.


1:1 1.:()cli<.,icnle uc Ul1 término de exposición continuo describe implícita-
mcnle. en una rcgresión logistica. un,l relación exponencial. Transforma-
I.:ioncs Jc la csc:\la ue exposición puedcn uar cabida a otras relaciones
I.:xp()sici()n-cnl'crmeuad. pero se consigue mi1s nexibilidad. como sucede
lIabitu,\lmcnle. c,ltegorizando la variable de exposición y usando térmi-
nos indicadores cn el modelo logistico par,l cada nivel de exposición no
I.:cro.
1\1 tener términos indicadores. el modelo de regresión logística pro-
1~()rcio\1a cstimados de 1,1 razón de tasas para cada nivel de exposición.
!)i<.,h() n1()Jclo rr()vee lambién estimados de la varianza. con lo que se
p()(lri:1 1:1111)1L':lr 1:1 (1lltpUt JI.: \,1 rc!:!rcsi()n \()gislica en los ani11isis antcs
\ll.:s\..rilcl' (ll: rL'1!rL'SIIIII rC)nJl:ril(lil para I.lctcctar tendencia. La ev:llu:lción
I.lc Icn(ll.:tll.:ti\ rcs\III;lnlc 11()cstar:II.:()'lrUllJiJa por ninguno ue los faclores
tcniJ<)s c.:n I.:ucnta \."1 cl moJclo logistil.:o. ()hlcniendo. a partir de dicho
moJclo I<)~isticu. cstim,\uos sep,lr,ldos uel efecto a varios niveles de
1 cxposición. el invcstigador puede mantener cierto «sentimiento» en rela-
ci()n con los datos. Dichos estimados separados aportan también una
clar~l im.1gcn de la lendencia rcal. sin la asunción dosis-respuesta incor-
p<)r.\d.1 cn el modclo logístico cu,lndo sc utilizan variables independien-
tes continu,ls. Más ~lún, categorizar en una escala nominal limita los
problemas de que las observaciones extremas innuyesen excesivamente
I I()s d,\ tos.
Los estim.ldos del efecto de la figura 16.2 se sacaron de un análisis de
rcgrcsión lop.istica: como hemos visto. es factible de modo razonable-
m~11tc ri1cil ,~n,lliz.lr mediante regresión lineal los citados estimados del
cfccto. cmpleando únicamente unos pocos cillculos basados sólo en estos
rcsultados publicados y sin tener acceso alguno a los datos originales. La
simpleza del anillisis de regresión a la hora de detectar una tendencia
I \ine,11 ~' su adaptabilidad a cualquier tipo de datos. desde crudos hasta
los resultados de un análisis de regresión logística. lo convierten en un
abord,lje ,ltractivo para la evaluación epidemiológica inicial de la pre-
] scncia de tendencia. El modelo de riesgo generalizado
constituve una alternativa multivariada
de Thomas ( 1981 )
eficiente y flexible; en cambio,
como se" ha dicho. por lo general la regresión logística no resulta apro-
piada: para evaluar la existencia de una tendencia en el efecto, los
~
modelos lol!ísticos deben únicamente ser considerados como un paso
prclimin,lr ;1 lISO de otros métodos.
n
I~EJ:'ERENC)AS
~ IJ¡lron. J. 1\.. Vc~~cy. M.. McPhcrSOn. K.. cl al. Malernal age and breasl canccr
~
risk. .1. NIII. (il1/(.(.'. 1".\"1. 19R4:72:13()7-13()9.
1)011. I~.. .anc.JI' ill. 1\. ". M orlalily or Brilish c.Joclors in rclation lo their smoking
hahils. ¡\ prcliminary rcporl. 8r. J\f('J. J. 1954:1:1451-1455.
I)rapcr. N. I~.. and Smilh. H. /1""lie(1 R(.,~'.('.~.~iml,ln{1I-,'.~i.~.New York: Wiley.
Il)(,6. .

~~wl
:~~i ,..
;¡~~
.l~r~~~~~:
~I~¡;*;m:1~~f¡ )~¡~*:~ ::.;;;:;'
c.
':;: .~,.

,. ."~~~"-~~

;(.~;
~-..,.
..T!l:~~ -¡

390 EPIDEMIOLOGIA MODERNA

Cjri7-"!.lc. J. E.. Slarmcr. C. F.. and Koch. G. G. Analysi~ or categorical data by


1ll1c~lr modcls. Bi())lle,ric.~ 1969;25:489.503.
Hill. A. P.. Pikc. M. C.. Smilh. P. G.. el al. Slratified analvsis or case-control
~Iudic~ "'ith thc faclOr under stud)' laking multiplc vajues. .1. Ch,.01!. Di.~.
197H;~1:547-555.
Klcinha\lm. D. G.. and Kurpcr. L. L. Apr/;(,(1 R('.1.".l'.~.~iml A1!(lI.I..~i.~ ond O,hl'r
1\1,llt;,.(I'.i(lhl(. ¡\f(.,I,(I(I.~. Nortll Scit\latc. MA. [)uxhtlry Press. 1978.
Macf\1~lhol1. H.. C:olc. P.. LiI1. T. M.. ct al. Agc al fir~t birth al1d hrcasl CailCCr
ri~k. B,/II. 11.'{0 197():43:209-221.
f\lanlcl. N. C'hi-squart' tc~t~ \Vith one degrec ()r freedom: Extcnsions of tht'
M:lntcl-Hacn~zcl proccdurc. J. Anl. S,a,. A.~.~()(. 1963;58:690- 700.
McGrc!:!or. D. 11.. L~lnd. C. E.. Choi. K. ct nl. Brcast cancer incidencc among
:lt()mic bomh ~urvivors. Hir~ohima and Na~:lsaki. 1950-69. J. Nal. Cmlcer
In~l. 1977;59:799.811. '~
Mic"cy. R. M.. und Ela~horr. J~. M. A gcncralization or thc Mantcl-Hucn~zel .:,

c~t¡m:ltor or partial a~~()Cialion ror 2 x .1 x K table~ Bimll("ric.~ ::;~.


i
I l)X~.A
( \1-. -).6 1~
1.t:."1, ..
f\lictlincn. O. S. StandardiZ(lli()n of risk ratios. Am. J. Epill(!miol. 1972:96:383-
j
~RR.
Pikc. M. C.. C~\~agrandc. J.. and Smitil. P. G. Statistical anal,'si~ or individua11v
m:ltchcd C:l~c-conlrol sltldies in epidcmiolo~y: Factor under slud~. a discret~
\.ari:lhlc takin~ mtlltiplt' \,altle~. /3r. J, 1',.(.1". .<)"()c.¡\f('d. 1975:29:196-201. t
J)(I\'lc. ('.. .1.Lanc~.
/:II.t!/. ¡\f(.({ S.. ano R()thman.
19R4:311:1382. K. .1. An¡II,'~i~
. or ()rdcred dala (LctICr). ¡\..

J~(,Scnh.ltIm. P. R..
:t!!C-:td.i\l~lCO :tndB;()"I(.'r;('.~
r:tIC!\. R\lhin. D.19R4:4():4:'\7-44:;.
R. Dimctlltic~ with re{!rcssion
~ analvses
. or

SiJ\.c~. S. D. S'(Jl;.f';l.(,II,!f(',.('n(.l'. M irJdlc~ex. En~land: Pcn~tlin Rooks. 1970. .


1
1 :tronc. R. I:.. ~lt1d Gilrt. J. .1. On thc r()hu~tnc~~ or combincd lesls ror lrcnds in
proportion~. .1. /Im. .S"I(ll. A.\".\.()(. II.)H():75:11()-116. .

Thom~I~. D. C. Gcncral rCI:lli\'e ri~k modcl~ ror stlrvi\,allimc and matchcd casc.
conlrl\1 :tMI~'~i~ Ri(,m("'.i('.~ 19R 1::17:(i73-(i76.
'1.(\lln~. T. R.. KC1narck. M. S.. and Tsi~llis. A. A Epidcmiologic ~Iudy or drin-
kin~ \V:tlcr chl()rill:ltion C1nd Wi~consill fcmalc canccr mortality. J. Na'.
~
(.(m("(". In.~l. 19RI:(i7:1191.1198.

I
t [
ti J

.~~;rn: .;:¡~~

.~~t::
,;~;J*~1[f~~¡~i~' [~!.;¡fu~}i~~~~~
INDICE

Agente naranja, 72 Cáncer de endometrio, y estrógenos, 5,


Aleatorio. Véase Asignación, error y 120-121
muestra Cáncer de pu lmón y tabaco, 6, 15-17,
Alfa, error, 92, 135 23-24,68,109,125- 126
Alfa, nivel, 138 Cáncer y beta-caroteno, 8
Análisis de dalos y ocupación, 19
fundamentos, 149-170 Caso-control, datos de
propósito, 253 apareados, 279-280. Véase también
Análisis logístico, 322-328 Análisis estratificado
Análisis multivariado por pasos, 7, 146- estimación con, 196. Véase también
148,336 Estimación puntual
Antagonismo, 352, 356 Caso-control, estudios de, 5, 60, 72-81,
Apareamiento, 128-130,265-314 84-86, 380-385
con modificación del efecto, 289-291 anidados, 71, 109
confusión y, 268-272 apareamiento en, 270-272
de frecuencias, 265 Categorización, 153-155
Eficiencia y, 273-278 de la enfermedad, 101-102
evaluación de su efecto con datos de de la exposición, 365, 367-368
caso-control,312-313 Causa necesaria, 18
en estudios de caso control, 273-274 Causalidad, creencia en, 13-15
en estudios de seguim iento, 306-310 Causas
individual, 265, 279-314 componentes, 17-18,20,106
principios del, 265-279 de enfermedad, definición, 15
sobreapareamiento, 276-278 especificas, proporción de enfermedad
sobre factores de riesgo, 277-278 debida a, 18-19
sobre indicadores de calidad de infor- fuerza de, 17
mación, 278 interacción entre, 18
Asignación aleatoria, 6 1-64, 68-69, 109, necesarias, 18
126-128, 145-146 suficientes, 16-18
Aspirina, 85, 101
Causas ambientales, 19
Alajo, análisis de, 338 Causas componentes, 17-18,20
AUloselección, sesgo de, 96-98
Causa, modelo general de, 15-21, 356-
Basado en el test, método de estimación 357
de un intervalo, 164-167 Ciencia Hnormah), 15
Bendectin, 83 Ciencia, medición en, 29
Bernoulli, ensayo de, 174 Científica, generalización, 111-112
Beta-caroteno, 8 C ientífica, inferencia, 11-15
Beta, error (tipo II h 92-93,135-136 Científico, método, 59-137
Clasificación incorrecta
Cálculos de potencia, 92, 141 de factores de confusión, 109-110, 125
Calidad de información, aparear sobre, diferencial, 98-100
278-279 no diferencial, 98, 100-104, 109, 124-
indicadores de, 278 l25
391
392 IN DICE

Codificación de datos, 149-152 Controles Datos persona-til


Coeficiente de correlación múltiple, 336 controles muertos, 279 193
Coeficiente de correlación, 336 fracción muestral de, 74 comprobación I
Cohortes, 66 selección de, 74-79 177. Véase
de exposición especial, 72 Cornfield, límites de confianza de, 165, puntual
de población general, 72 195-196 estratificados, e
definición de, 67-69 Criterios de diagnóstico, 123 mada de hi
Cohortes, estudios de, 66-72 Criterios de Hin. 23-25 estratificados, (
apareados, 265-273 Crudos o brutos, datos de hipótesi:
históricos, 70 análisis de, 173-197 estratificados, ÍI
retrospectivos, 70 comprobación de hipótesis con, 173- para, 233-2
Comparacioncs múltiplcs, ajuste para, 185 Datos referidos ¡
168-170 estimación del efecto con, 185-197 (subrogado
Competición por susceptibles, 355-357 Cuadrados mínimos, regresión ponde- Densidad de ¡ncid
Componente lineal dc la tendencia, 387 rada, análisis de
Depósito o pool (
Comprobación de una hipótesis, 14 de estimación de tendencia, 262
Desviación estáné
Comprobación de hipótesis estadística, de modificación del efecto, 376-385
Curvas de potencia, 92-93 Desviación norm.
14, 133-138, 149,156-160 Determinismo, 90
aproximada para tablas estratificadas Diarrea, 191
Datos
de 2 x 2, 330-232 Dietilestilbestrol, '
apareados. Véase Datos apareados
aproximada datos persona-tiempo es- crudos. Véase lambién Datos crudos Diferencia de tasa
tratificados, 225-227 Diferencia de tasa
de caso-control. Vease también Caso-
con datos crudos, 173-185 control 185, lOS-2C
con datos de persona-tiempo, 174- 177 de incidencia acumulada. Véase Da- Dígito aleatorio,
con datos de persona-tiempo estratifi- tos de incidencia acumulada un, 122
cados, 222-228
de recuent&, comprobación hipótesis Distribución bim
con datos incidencia acumulada es- con, 177-185 187,282, :
tratificados, 228-232 de seguimiento, estimación con, 185- 298-301
con datos de recuento, 177-185 196 .
con un número variable de controles de dos binon
estratificación. Vease Estratificación 179-180
apareados a cada caso, 293-294 de datos
de tendencia, 386-388 Distribución de e
proporcionados por terceras perso- Distribución de f
exacta con datos persona-tiempo es- nas, 124
tratificados, 222-225 Distribución F, 1:
Datos apareados Distribución hi¡x
exacta para tablas estratificadas de 2 análisis multivariado de, 313-314
x 2, 228-230 228
evaluación de modificación del efccto no central, 190
para parejas caso-control apareadas, con, 310-312
289-290 Dosis-respuesta,
Datos de caso control apareados, 279- 389
para R controles apareados a cada 306 Duración de la el
caso, 290-293 comprobación hipótesis estadísticas
Confirmación probabilística, 13 con, 289-294
Confusión, 103-110, 118-121 Ecuación de regr
estimación intervalo razón ventaja Edición de los di
análisis multivariado, 317-318 con, 295-306
apareamiento y, 265-279 Efecto
estimación puntual razón ventaja absoluto, 43-4:
clasificación incorrecta y, 109, 125 desde, 280-289
control de la, 146-147 medidas de, 43
modelos multivariados para, 331-332 relativo, 45-47
evaluación y control de la, 201-246 Datos de incidencia acumulada. Véase
magnitud de, 145 uniforme, esti
lambién Análisis estratificado 204-220
prevención de, 126-130 Datos de recuento, comprobación de
valoración de la, 145-146 Efecto del obrerc
hipótesis con, 177-185 Eficiencia
Conjuntamiento y conjuntado. Véase Datos de tasas de incidencia. Véase
Pooling de coste, 115-1
Análisis estratificado
ConocimienlO previo y confusión, 107- Datos epidemiológicos. Véase , de tamaño, 12:
de un estudio,
108 datos Empirismo, 12-1:
Consumo de alcohol, 89, 361 análisis de datos
Contenido empirico, de la hipótesis, 14 Enfermedad
edición de datos causa de, defin
del modelo causal, 20 reducción de datos
IN DICE 393

Datos persona-tiempo, 186-189, 191- duración de, 40


193 frecuencia de, medidas de, 29-41
comprobación de hipótesis con, 174- Ensayo de campo de la vacuna salk, 3
177. Véase /ambién Estimación Ensayos
puntual clínicos, 61-62
estratificados, comprobación aproxi- de campo, 62-63
mada de hipótesis con, 225-227 de intervención en la comunidad, 63-
estratificados, comprobación exacta 64
de hipótesis con, 222-225 Entrevista telefónica asistida por com-
estratificados, intervalos de confianza putadora (CA TI), 122
para, 233-239 Entrevistas, 125
Datos referidos por terceras personas telefónicas, 122
(subrogados), 124 Epidemiología
Densidad de incidencia, 34 definición, 3-4
Depósito o pool de prevalencia, 39-40 inferencia causal en, 22-26
Desviación estándar ¡SOl. 162-163 surgimiento de, 3-8
Desviación normal estándar, 159 Error
Determinismo, 90-91 aleatorio, 90
Diarrea, 191 muestral,90-91
Dietilestilbestrol,4, 19-20,24 sistemático. Véase Sesgo
Diferencia de tasas, 44, 191-193 Esclerosis múltiple, 83
Diferencia de tasas de incidencia (lRD), Esperanza de vida, 39
185,205-207,233-235 Espermicidas, 102-103
Dígito aleatorio, llamada telefónica a Estadística
un, 122 rol de la, en el análisis epidemiológi-
Distribución binomial, 175, 178, 179, co, 133-14~
187,282,284,289,290-291 , 295, Estandarización, 49-58, 253-260
298-301 en la evaluación de tendencia, 370-
de dos binomiales independientes, 373, 378-382
179-180 Estandarización ((indirecta», 53-58
Distribución de chi-cuadrado, 159-160 Estimación, 149
Distribución de Poisson, 187, 238 con datos de caso-control, 196
Distribución F, 189 del efecto. Véase Estimación del efecto
Distribución hipergeometrica, 182-185, de tendencia global, 373-385
228 Estimación de máxima probabilidad,
no central, 190 213·218
Dosis-respuesta, eval uación, 357, 365- condicional, 217-219, 281-282, 330
389 de un efecto uniforme con datos de
Duración de la enfermedad, 40 caso-control,217·218
de un efecto uniforme con datos de
Ecuación de regresión, 32 1 incidencia acumulada, 216·217
Edición de los datos, 150-153 de un efecto uniforme con datos per-
Efeclo sona-tiempo, 215-216
absoluto, 43-45 Estimación del efecto, 149, 160-167
medidas de, 43-48 con datos crudos, 185·197
relativo, 45-47 con datos de caso-control, 196-197
uniforme, estimación puntual del, con datos de seguimiento, 185-196
204-220 estandarizada, 253-260
Efecto del obrero sano, 97 para niveles de exposición múltiples,
Eficiencia 370-386
de coste, 115-117, 128-130, 273-274 Estimación del intervalo, 137-144, 186-
de tamaño, 128-130, 273-274 196
de un estudio, 95,115,128-130,274 aproximado, 191-196
Empirismo, 12-13 exacto, 186-191
Enfermedad para la razón de ventaja con datos de
causa de, definición, 15 caso-control apareados, 295-306
'" IN D ICE

para parejas de caso-control aparea- ret rospectivos, 80 nula, 23,134-13:


dos, 295-299 rol de la estadística en, 133- 148 Hume, el probJem¡
para R controles apareados a cada tasa de incidencia en un, 186- 189
caso, 299-304 tipos de, 59-87 Incidencia
para un número variable de controles Estudios de caso-control anidados, 71, acumulada, 36-3
apareados a cada caso, 304-306 109 anual, de períod
Estimación puntual. 138, 160, 185-186, Estudios de mortalidad proporcional, Independencia, 35:
204-205 84-86 Indice de sinergisn
de Mantel-Haenszel, 238-239, 242, Estudios de segu imiento, 60, 66-72, 374- Inferencia
245-246 380 científica, 11-15
de máxima probabilidad, 235, 237- aparcados, 306-310 inductiva, 12
238, 240-241, 243-244 Estudios ecológicos, 86-87 Inferencia cau~al,
del riesgo relativo a partir de datos de modelos multivariados en, 338-340 Información
caso-control apareados, 280-289 Estud io, eficiencia de un, 95, liS, 128- de exposición, 1
del riesgo relativo a partir de parejas 130, 274 estadística, 115
de caso-conlrol apareados, 281- Estudio, objetivos de un, 89 fuente de, 12]-1
282 Estudio, tamaño de un, 91-95 Infradimensionam
del riesgo relat ivo con R controles Exceso de riesgo relativo. Véase Riesgo Interacción estadü
apareados a cada caso, 283-287 relativo, exceso de Interacción negalí
del R relativo con número variable de Experimentación, objetivo de la, 59-60 Interacción posili\
controles apareados a cada caso, Experimento cien tífico, 59 Interacciones
287-288 Experimento natural, 65-67 definición, 349-:
de un efecto uniforme, 204-220 Exposición, 43 entre causas, 18
direc tamente ponderarla, 205-212, niveles múltiples de. Véase Niveles estadísticas, 348
237-239,241,243 múltiples de exposición evaluación de, ~
separadameme por categorías, 370- puntuación, asignación de, 375-377 medición de, 3S
m Exposición especial, cohortes de, 72 negativas, 353
Estimados conjuntados del efecto positivas, 353
intervalos de confianza para los, 232- riesgo relativo I
Factor de riesgo extraño, 104-106
246 (RER1),364
Falacia ecológica, 87 Intercepción, fiod
Est ratificación de los datos, 177, 146, Falsificabilidad, 14
199 Intervalos de co
F luoración, 3, 64-65 161, 185-1S
comprobación hipótesis estadística, Fórmu las del ~<tamaño de [a muestra»,
para, 220-232 anidados, [38-1
91 -95
en análisis de caso-control apareados, aproximados, 1
Fracción etiológica, 47
279 246
Fracción prevenida, 48 exactos, 160-16
Estratificado, análisis, 117, 147, 199-262, Fracciones de muestreo o muest rales,
317-319 para datos de el
73-74, 256-257 dos, 243-2 L
análisis multivariado versus, 340-342 Fuerza de morbilidad, 34
Estrógenos y cáncer de endometrio, 5, para datos de
Fuerza de una asociación, 23 estratificad
120-121 de tipo causal, 17-18
Estudio cardiológico de Framingham, para datos de p
F unción del efecto lineal, 260 ficados, 23:
3,69 Funciones del efecto, 260-264 para estimados
Estudio de cohorte histórica, 70
to, 233-24t
Estudios Generalización, 110 Investigación cpic
de caso-control. Véase de casos y científica, 110-112, 128 I RO. Véase Difen
controles Grupo de referencia, para la exposición,
de cohortes. Véase Cohortes
de mortalidad proporcional, 84-86
69
Gr upos de comparación, elección de,
'"
IRR. Véase Razól
de persona-tiempo. Véase Datos per- 118-123 Letalidad, tasa d<
sona-tiempo 38
de seguimiento. Véase Estudios de se- Heisenberg. Véase Princi pio de incerti- Linea de tendenCl
g uimiento dumbre Lógica, inductiva
diseño de. 89- 131 Hi pótesis • Logit, 324-325
experimentales, 60-64 comprobación estadistica de. Véase
longitudinales, 81-84 Comprobación de
• " Malestar. Véase I
no experimentales, 64-87 epidemiológica, 22-23 Malformaciones (
124
INDICE 395

nula, 23,134-135,138-139,156 Mantel-Haenszel, estimadores, 205


Hume, el problema de, 13 pooling con, 219-222, 238-239, 242,
245-246,282,286-287,288
Incidencia Mantel-Haenszel, test, 231-232, 290,
acumulada, 36-39 293, 294
anual, de período, 35 Mantel, extensión del test de, 386-387
Independencia, 353-355, 356-357 McNemar, test de, 290
Indice de sinergismo(s), 359-361, 363 Medición
Inferencia en la ciencia, 29
científica, 11-15 objeto de, 89
inductiva, 12 precisión en, 90-95
Inferencia causal, 11-26
Metodología de las tablas de vida, 33
Información Modelo de riesgos proporcionales, 328-
de exposición, 123-126
329
estadística, 115
fuente de, 123-127 Modelo lineal para dos variables, 319-
Infradimensionamiento, 101 322
Interacción estadística, 348-349 transformaciones de, 322-328
Interacción negativa, 353 Modelo logístico, 324-326
Interacción posítiva, 353 Modelos de riesgos relativos generales,
Interacciones 327-328, 332, 389
definición, 349-357 Modelos deterministas, 21
enlre causas, 18,89,347-363 Modelos estocásticos, 21
estadisticas, 348-350 Modelos log-lineales, 329-330
evaluación de, 347 Modelos multiplicativos, 325-330, 348-
medición de, 358-363 349, 354
negativas, 353 Modificación ,del efecto, 199-201, 336-
positivas, 353 338
riesgo relativo en exceso debido a la descripción de, 246-247, 253-262
(RERI),36O-363 evaluaciqn de, 246-253
Intercepción, modelo lineal, 319-320 con datos apareados, 310-312
Intervalos de confianza, 94, t37-144, Modificador del efecto, 199
161,185-196,196-197 Morbilidad, fuerza de, 34
anidados, 138-143 MRFIT (Multiple Risk Factor Inter-
aproximados, 161-164,237-239,243- vention Trial), 63
246 M uerte como resultado de la enferme-
exactos, 160-161, 237, 243 dad, 30, 38
para datos de caso-control estratifica- Muestreo aleatorio, 126-127
dos, 243-246 Multivariados, modelos
para datos de incidencia acumulada diseño para realizar inferencia, 332-
estratificados, 239-242 338
para datos de persona-tiempo estrati- en análisis ecológicos, 338-340
ficados_ 233-239 para datos aparcados de caso-con-
para estimados conjuntados del efec- trol,331-332
lo, 233-246 ventajas y limitaciones, 340-342
Investigación epidemiológica, 4-6 Multivariado, análisis, 7, 146-147,317-
IRD. Véase Diferencia tasas de inciden- 345
cia de datos apareados, 313-314
IRR. Véase Razón tasas de incidencia de tendencia, 388-389
versus análisis estratificado, 340-342
Letalidad, tasa de (Case-Fatality Rate),
38
Línea de tendencia, lineal, 383 Niveles múltiples de exposición
Lógica, inductiva y deductiva, 12 análisis con, 365-389
Logit, 324-325 esti mación del efecto para, 370-386
No-exposición, definición, 69
Malestar. Véase Enfermedad
Malformaciones congénitas, 41, 79, 102, Objetivos de un estudio, 89-112
124 Ocupación y cáncer, 19
396 INDICE

Oportunidad de exposición, 76, 277 Razón de probabilidad, test de hetero- Sección transversa
geneidad, 248-253 83
Parámetro de perturbación, 181 Razón de reparto, 115-118 Seguimiento, dato
Parejas de caso control apareadas Razón de tasas, 45, 193-194 185-197. V(
comprobación de hipótesis para, 289- Razón de tasas de incidencia (IRR), 45, estratificad(
290 186,207-209,216,235-239 Selección de series
estimación del intervalo para, 295- Razón de tasas estandarizadas (RTE).
299 Selección, sesgo dI
Véase también SRR Series de comparal
estimación puntual del riesgo relativo
Razón de ventaja (ORl, 74, 74, 181, 189, se Razón d.
a partir de, 281-282
212-213,280-281,331 Sesgo, 96-109
Período de inducción, 19-20,82,83-84 estimación de la, 325
máx imo,78 de confusión, I(
estimación puntual a partir de datos de información,
mínimo, 67-69, 70
de caso-control apareados, 280- de memoria, 99
Periodo de latencia, 20, 67
288 de selección, 96·
Período de seguimiento, 69
intervalos de confianza de, 242-246 diagnóstico, 97
Persona-tiempo, medida, 31-33
Reducción de los datos, 149, 153-156 Significación esta,
PMR (razón de mortalidad proporcio-
Regresión binaria, 322-324
nal), 84-85 146, 203
Regresión lineal, 319-320
Población Significación, con
Regresión lineal múltiple, 320
dinámica, 31-33 138
Regresión lineal simple, 319
fija, 31-33 Simpson, paradoj,
Regresión logística condicional
Politica y ciencia, 26 Situación estable I
análisis, 314
Pooling directo, 205-213 38-40
Regresión' logística multiple, 7, 313-314,
Pooling o conjuntamiento, 205, 371, 373 SMR (Stardardiz<
325
con estimadores de Mantel-Haenszel, Regresión ponderada, 260-262, 320-321, Véase RMI
219-220 375-385
con varianzas inversas, 205-213 Sobreapareamient
Regresión, análisis, logístico condicio- Sobredimensionan
con varios niveles de exposición, 373
directo,205-213 nado de, 314 SR R (Standardize
Regresión, coeficientes, estandarizados RTE
utilizando el método de maxima pro-
de, 338 Stándard, 50-53
babilidad,213-218
Porcentaje de riesgo atribuible, 18,47- Relación multiplicativa, 327-328, 330, Suficiente, causa,
48 331 , 348-349 355-357
Potencia. Véase Cálculos y curvas de Relativo, efecto, 45-47 Surgeon General,
Precisión en las mediciones, 90-95 Relativo, riesgo, 45, 74 sobre taba(
mejora de la, 115-118 exceso de, 45, 352-353 «S», Véase Indice
Prevalencia, 30, 39-41 debido a la interacción (RERI),
Prevalencia puntual, 39 360-363
Principio de incertidumbre, 13-14 Representatividad, 75, 110-112 Tabaco
Principio de incertidumbre de Heisen- RERI (Relative Excess Risk due to y cáncer de pul
berg, 13-14 Interaction), 360-363 y enfermedad Ci
Promotor, término, 20 Respuesta, codificación de, 149-151 Tablas estratifica(
Proporción atribuible, 18,47-48 Restricción, 127-128 comprobación I
a la interacción, 359-363 Retrospectivos, estudios, 80 da en, 230·
Punto nulo, 142, 143 Retrospectivo, estudio de cohortes, 70 comprobación I
Puntuación de resumen de la confusión, Riesgo, 35-36,45 228-230
342-344 atribuible, 44-45 Tamaño de un es
relativo. Véase relativo Tamaño, eficienci
Racionalismo, 12 Riesgo relativo, modelo generalizado Tasa de mortalidl
Radiación, 67, 97, 224 de, 327-328, 332, 389 especifica por e
Rastreo de sujetos, 71 Riesgos competidores, 36, 38 promediada en
Razón crítica, 47 Riesgos, razón de, 45, 186, 189,240-242 Tasas crudas, 50
Razón de incidencia acumulada. Véase Riesgo, diferencia de, 44, 185,239-240 Tasas, estandariz¡
también Estimación puntual Riesgo, factor(es) de, Tasa(s) de incidcr
Razón de morbilidad estandarizada
(RME), 53-58, 255-260. 371-373
apareamiento de, 277-278
extraños, 104-106 ,
, constante, 38
valor numérico
Razón de mortalidad proporcional Screening o cribaje, 168 Tendencia
(RMP), 84-86 SD. Véase Desviación estándar análisis multiv:
INDICE 397

Sección transversal, estudios de, 60, 81- componente lineal de la, 387
83 comprobación de hipótesis estadística
Seguimiento, datos de, estimación con, acerca de, 386-388
185-197. Véase también Análisis global, estimación de, 373-385
estratificado no lineal, 380
Selección de series de control, 85 Tendencia lineal en el efecto, 373
Selección, sesgo de, 96-98 Teorema del limite central, 156
Series de comparación, tamaño de. Véa- Término de error, modelo lineal, 319
se Razón de reparto Término iniciador, 20
Sesgo,96-109 Términos de interacción en modelos
de confusión, 103-109 multivariados, 336-338
de información, 97-103 Términos producto en modelos multi-
de memoria, 99 variados, 336-338
de selección, 96-97, 118-122 Test de la T (t-test), 203, 366-367
diagnóstico, 97 Test de Mann-Whitney, 367
Significación estadística, 7, 93-95, 133- Tiempo de espera, 36, 38-39,40, 366
146, 203 Tifus, 24
Significación, comprobación de, 133- Tipo 11, error (error beta), 92-93, 135-
138 136
Simpson, paradoja de, 104 Tipo 1, error (error alfa), 92, 135
Situación estable (población en), 32-33, Transformación logaritmica, 164
38-40
SMR (Stardardized Morbidity Ratio). Uniforme, efecto, 248-253, 355
Véase RME
Sobreapareamiento, 276-278 Vacuna contra la hepatitis B, 63
Sobredimensionamiento, 101 Validez, 96-112
SRR (Standardized Rate Ratio). Véase externa, 96-97, 111-112
RTE interna, 96-110
Stándard, 50-53 mejora de, 118-130
Suficiente, causa, 16-18,43-44,350-351, Valor de la P de Fisher, 175-176
355-357 Valores de P, 133-136, 138-140, 156-
Surgeon General, U.S.A., informe del, 162,168-170
sobre tabaco y salud, 3 de la media P, 158
HS". Véase Indice de sinergismo exactos, 158
Valores extremos, 367-370
Variabilidad aleatoria, determinación
Tabaco de, 133-144
y cáncer de pulmón, 6, 15-17 Variable de exposición, 333-335
Y enfermedad cardiovascular, 22, 207 Variables de escala continua, 333-335
Tablas estratificadas de 2 x 2 Variables de escala nominal. 150, 332-
comprobación de hipótesis aproxima- 333, 370
da en, 230-232 Variables de escala ordinal, 335
comprobación de hipótesis exacta en, Variación biológica, 59
228-230 Ventaja, 40, 324
Tamaño de un estudio, 91 Ventaja de prevalencia, 40
Tamaño, eficiencia de, 272-275 Verificabilidad, 12-14
Tasa de mortalidad, 32 Viena, Círculo de. 13
específica por edad, 49-52 Vitamina e, 63
promediada en el tiempo, 35-36
Tasas crudas, 50 Wilson, fórmula de, 297
Tasas, estandarización de, 49-58
, Tasa(s) de incidencia, 29-36
constante, 38
Yates, ((corrección de», 158-159
yalor numérico de. 35
Tendencia Zelen, procedimiento de, 252
análisis multivariado de. 388-389 Z, valor, 159

S-ar putea să vă placă și