Documente Academic
Documente Profesional
Documente Cultură
1. LA APARICION DE LA EPIDEMIOLOGIA 3
2. INFERENCIA CAUSAL EN EPIDEM IOLOGIA 11
Filosofia de la Inferencia Científica 12
Un modelo general de causa J5
Inferencia causal en Epidemiología 22
5. _ ESTANDARIZACION DE TASAS 49
El principio de estandarización 49
Estandarización «indirecta» Versus «directa» 53
9.
INDICE GENERAL
, ::::'
EPIDEMIOLOGIA MODERNA
REFERENCIAS
Kannc¡. w. n.. w()lr. P. ;\.. Vcrtcr. .J.. CI ;Ii. Eri<.Jcmiologic asscssmcnl ()r lhc "oic
or hlood pre$sllre in :\trokc: The Frumil1gham 5tudy. J..-l..\1..~. 1970:
214:301-310.
Kannel. W. B.. an<.J Abhott. R. D. [ncidcncc and rrogno5i$ of lInrccognized
myocardi;¡1 jl1farction. ¡\n lipdatc on thc Framil1gh.lm study. ,V: EI/.~/. J.
¡\1ed. 1984: 311:1144-1147.
Mack. T. M.. Pikc. M. C.. Hender~on. B. E.. ct al. Estrogen$ and cndometria¡
cancer in .\ retirement community. N. EI/.~/. J. ,\1ell. 1976: 294:1262-1267.
I McKee. P. A.. Castclli. W. P.. McNam;¡ra. P. M.. et al. Thc natural hi~tory of
congestive heart f.lilllre: The Framil1gh.lm ~tlldy. N. EI/""/. J. l\1ell. 1971:
285:1441-t446.
Smith. D. C.. Prentice. R.. Thompson. D. J.. et al. A$$ociation of exogenous
estrogen and endometrial carcinoma. N. EI/.~/. J. .\1('ll. t975; 293:1164-116i.
Stallones. R. A. The rise 3nd fall of ischemic hcart disease. S('i. Americal/ 1980:
243:(5)53-59.
¡
Truett. J.. Cornlicld. J.. .lnd Kanncl. W. ..\ mllltiv.lriatc an.lly~is (}f thc risk of
coronarv heart di$ease in Fr.\mingh.lm. J. C/¡r(m. Dis. 1967: 20:5t 1-524.
U.S. Depa;tment of Health. Educ.lt¡on and Wclfare. Smoking and Health:
Report of the Advi$ory Committee to the Surgeon General of the Public
] Health Service. Public Health Service Pliblication No.1103. Washington.
D.C. Government Printing Omce. 1964.
Wynder. E. L.. and Gr;¡ham~ E. A. Tob.1CCO smoking ~lS ~l possible etiologic
factor in bronchogenic carcinom~\. f\ 5tlldy of six hundred 3nd eighty-rour
provcd casc$. J.,.J.I\l...I. 1950: 143:329-336.
Zie¡. H. K., and Finkle. W. D. [ncreased risk or endometrial carcinoma among
users of conjugatcd estrogens. N. EI/,I,'/. J. i\.fed. 1975: 293:1167-1170.
-I
~j
.,
-. INFERENCIA CA USAL
EN EPIDEMIOLOGIA
\
INFERENCIA CAUSAL EN EPIDEMIOLOGIA 13
1 graduado de verificabilidad,
des propuestas por Rudolph
incardinado en la lógica de las probabilida-
Carnap. Bajo esta filosofia, las proposicio-
nes científicas son evaluadas según una escala de probabilidades. Sobre
1 la base de la comprobación empírica, las hipótesis se convierten en más
o menos probables según el resultado de la comprobación. La descrip-
ción por Heisenberg.del «principio de incertidumbre» y la aceptación de
los mecanismos cuánticos por los lisicos a principios del siglo xx., esti-
mularon esta visión probabilística de la confirmación cientifica. Los filó-
sofos. fuertemente innuenciados por los fisicos contemporáneos, abando.
naron la bllsqueda de la causLllidad:
r
I
La noción de verificabilidad median~ la lógica probabilística no
f
t
j
echó raíces. Lo inadecuado de esta filosofia fue revelado por Karl Pop-
¡
,.
!
~
¡;
'4 EPIDEMIDLOGIA MODERNA
les de la constelación causal que actúan junto con el rumar para produ-
cir cáncer de pulmón'! Cuando los componentes causales permanecen
desconocidos. existe la inclinación de asignar un riesgo igual a todos los
individuos cuyo estatus causal, para algu~os compon~nte-s, es cónocido e
idéntico. De esa manera, se dice que los grandes rumadores tienen
aproximadamente un riesgo a lo largo de su vida del lO por 100 de
desarrollar un cáncer de pulmón. Hay una tendencia a pensar que todos
nosotros estariamos sometidos a un I0 por 100 de probabilidad de
cáncer de pulmón si nos hiciéramos grandes rumadores, como si e!
resultado, aparte del tabaco, ruera puramente una cuestión de suerte. Es
más constructivo, sin embargo, valorar la asignación de riesgos iguales
como el renejo únicamente de nuestra ignorancia acerca de los determi-
nantes de esa enrermedad que interaccionan con el rumar cigarrillos. Es
probable que ;llguno de nosotros pudiera pasarse empalmando los
cigarrillos durante décadas, sin la menor posibilidad de «hacer» un
1 cáncer de pulmón. Otros están. o se convertirán. en «ravorecidos» por
circunstancias en este momento desconocidas y sólo necesitan que se les
añada el fumar a su casi suficiente constelación de causas para iniciarlo.
] En nuestra ignorancia acerca de estos componentes causales ocultos, lo
mejor que podemos hacer a la hora de valorar el riesgo es asignar el
valor medio a todos los expuestos a un patrón dado de indicadores de
riesgo causal conocido. Conforme progrese el conocimiento, las estima-
ciones del riesgo asignado a la gente se acercarán a uno de los valores
extremos, el cero o la unidad.
Cada constelación de causas componentes representadas en la figura
2.1 es mínimamente suficiente, (es decir, no hay causas componentes ni de
sobra ni ajenas) para producir la enfermedad. Tales causas componentes
pueden jugar un papel en uno, dos o tres mecanismos causales.
~
18 EPIDEMIOLOGIA MODERNA
I II III
Fig. 2.1. E.\"qllemati::ación conceptual dc trc.\, cal(.\,a.~ .\,l~riciellt('.\, d(' Ima .cl!(ernle.
dad ( Rothman, 1976) .
1
Il1teracción entr(' causas
En la figura 2.1, asumiendo que las tres causas suficientes son las únicas
que operan, ¿qué proporción de enfermedad es causada por A? La
INFERENCIA CAUSAL EN EPIDEMIOLOGIA 19
I ]
también heredado. Cualquier otro punto de vista está basado en una
comprensión ingenua de la causación.
I
i
Período de inducción
t
El diagrama de causas nos aporta igualmente un modelo para concep-
tualizar el período de inducción, que puede ser definido como el período
de tiempo que hay desde la acción causal hasta la iniciación de la
enfermedad. Si en la causa suficiente l la secuencia de acción de las
causas es A, E, C, D y E y estamos estudiando el efecto de E, que
asumimos que actúa en un punto dado en el tiempo, no observaremos la
ocurrencia de enfermedad inmediatamente después de que actúe E. La
enfermedad aparecerá sólo una vez que la secuencia sea completa, por lo
que habrá un retraso en tanto C, D y finalmente E, actúan. Cuando E
actúa, ocurre la enfermedad. El intervalo entre la actuación de E y esa
ocurrencia es el tiempo de inducción para el erecto de E. Un ejemplo
claro de tiempo de inducción prolongado está en la relación causa-efecto
entre la exposición de un feto femenino al dietilestilbestrol (DES) y el
desarrollo subsiguiente de un carcinoma de células claras en la vagina.
El cáncer ocurre generalmente entre los quince y los treinta. años de
edad. Puesto que la exposición ocurre antes del nacimiento, existe un
tiempo de inducción de entre quince y treinta años. Durante ese período,
20 EPIDEMIOLOGIA MODERNA
22 EPIDEMIOLOGIA MODERNA
sido planteado no pocas veces. especialmente por los que. buscan exone-
rar al tabaco como causa del cáncer de pulmón. Las causas de un efecto
dado, sin embargo, no puede esperarse en base a lógica alguna que
carezcan de otros efectos. De hecho, la experiencia cotidiana nos enseña
repetidamente que acontecimientos únicos pueden tener muchos efectos.
La argumentación de Hill sobre este estándar de inferencia está liena de.
reservas, pero, aún así, el criterio me parece inútil y engañoso.
4. Temporalidad. La temporalidad se refiere a la necesidad de que la
causa preceda en el tiempo al efecto.
5. Gradienle biológico. Se refiere a la presencia de una curva de
dosis-respuesta. Si se adopta la respuesta como expresión epidemiológica
del efecto, medido como función de incidencias de enfermedad compara- 1
tivas, entonces esta condición se cumplirá ordinariamente. Algunas aso-
ciaciones causales, sin embargo, muestran no tener tendencias aparentes
del efecto en relación con la dosis; un ejemplo es la asociación entre el
DES y el adenocarcinoma de vagina. Una posible explicación es que las
dosis de DES que se administraron fueron todas suficientemente grandes
como para producir el máximo efecto, pero el desarrollo en la vida real
de tal enfermedad depende de otras causas componentes. Tampoco las
asociaciones que muestran una relación dosis-respuesta son, necesaria-
mente, causales; el efecto de confusión puede dar como resultado una
tendencia así en la relación entre un factor de riesgo no causal y la
enfermedad, si el propio factor de confusión muestra un gradientc biolt)-
gico en su relación con ia enfermedad.
6. Plausibilidad. Este término se refiere a la plausibilidad biológica
de la hipótesis, lo que es una preocupación importante, pero puede
resultar dificil de juzgar. Sartwell (1960). enfatizando este punto, citaba
las observaciones de Cheever, en 1861, quien comentaba sobre la etiolo- J
gia del tifus, antes de que se conociera su modo transmisión:
«Dejaría de ser ridículo para el desconocido que pasó la noche en
un camarote de tercera de un barco emigrante adscribir el tifus que
cogió allí a los bichos de que pueden estar infestados loS cuerpos de los
enfermos. Una causa adecuada Que .<;earazonable er. sí misma dcbe
corregir las coincidcncias de 12 simple experiencia.»
~
\
.-1
3. MEDIDAS DE FRECUENCIA
DE UNA ENFERMEDAD
Suelo decir que cuando puedes medir aquello de lo que estás hablando,
y expresarlo con números, es que sabes algo acerca de ello; cuando no
puedes expresarlo con números, por el contrario. tu conocimiento es de
naturaleza débil e insatisfactoria; puede que sea el principio del conoci-
miento, pero habrás avanzado escasamente en tus pensamientos hacia
la etapa de ciencia. cualquiera que sea el tema de que se trate.
1
INCIDENCIA
...I
Tiempo - Tiempo -+
X = muerte X = muerte
1
c
.o
"Ü
Ct
:0
0
c.
~
Q>
-0
0
tC
(O
E
(O
1-
'1
Fig.3.2. Tamaño de u/la pohlació/1 FIja de J .000 perso//a.\", e// ./imcinn dl'lliempo.
c
.o
"Ü
ro
:3
0
o.
ro
Q)
"tJ
0
.c
ro
E
ro
1-
Fig.3.3. Tamml0 {le II/la poblacióll dillÓnlica. en el tiempo, con IIna illdicación de
la renovacióll de la población.
~
3/, EPIDEMIOLOGIA MODERNA
ó J
casos
0,27 ---'.
MEDIDAS DE FRECUENCIA DE UNA ENFERMEDAD 35
50 casos
ó 5 x 10-4 años-1
100.000 persona-años
INCIDENCIA ACUMULADA
-óP
1,
p,Ó!
-dP dP
Ir = l,dl =
P, dI P,
I
I
, MEDIDAS DE ~RECUENCIA DE UNA ENFERMEDAD 37
!
¡
,
!
!
!
i
c
! .o
"ü
tU
:(5
0
o.
tU
Q)
"0
0
! .c
tU
¡ E
(O
! 1-
í
l
i
¡
J
Fig. 3.4. Tamaño de una pohlación fija. en jimci(m del {ienTpo, indica17do 1(1!
pequeño decrecimien{o e17 ellie17TpO {.
¡
I f~J,dt = ln(P,) in (Po)
J
1 Tomando antilogaritmos,
= P,/ Po
exp(
y como
tendremos
IAt = 1 -f~ I, dt
exp
lAr 1 exp
J
36 EPIDEMIOLOGIA MODERNA
IA , == )
"-'
1.61
I , ó IA, ~ IL\l
j
."
...
.~EDIDAS DE FRECUENCIA DE UNA ENFERMEDAD 39
PREVALENCIA
I ill(N P)
I' ÓtP
P/(N -P) es la razón entre los enfermos )' los no-enfermos (podría- f/l
Prevalencia = ID
Jí5
1 + Jí5
REFERENCIAS
Cole. P. The evolvil1\! C¡lSe-control sludv. J. Chr(}I,. Di.\". 1979: 32: 15-27.
Bciser. ¡-\. Th(' ¡v(}rltT (If Phl..\"ics. Ncw York: McGr¡\w-Hill. 1960.
Elandl-Johnson. R. C. Dcfinition of r¡lteS: Somc rcm¡lrks on lheir li.'ie al1d
misuse. ,il". J. EpiJ('II'i(}l. 1975: 102:267-271.
Freeman. J.. and ¡:-llilchison. G. B. Prev¡\lcncc. il1cidcncc and duralion. ..1/1'. J.
E¡>id('/1liol. 1980: 112:707- 723.
Miellinen. O. S. ESlim¡lbilily ¡lnd cslimalion in casc-refcrcnl sludics. .ill'. J.
Epill('/1li()l. 1976: 103:2:?6-235.
Morrison. A. S. Sequential pathogenic componenls or rates. ¡/11'. J. El'i{ll.IIIi(}l.
1979; 109:709-718.
4. MEDIDAS DEL EFECTO
EFECTO ABSOLUTO
-
44 EPIDEMIOLOGIA "~ODERNA
.(
-] I
debe calcularse restando de la tasa de incidencia la tasa de las causas ,
EFECTO RELATIVO
] II lo
y el efecto relativo es
Ii -lo -~ -I
[4.1]
-¡;- -10
~-+1 conforme ~1 -+ O)
lAo
lA1 11
-+- conforme .1[ -+ o
lAo .10
PROPORClON í\TRIBUIBLE
Para obtener el efecto relativo, se dividía el efecto absoluto entre 1.1 t.1sa
de los no-expuestos, con lo que se medí.1 el incremento absoluto de
ocurrencia de la enfermedad en múltiplos de la tasa de ocurrencia en
ausencia de exposición- Si se divide el efecto absoluto entre la tasa de
ocurrencia de los expuestos, en vez de entre la de los no-expuestos, el
resultado que se obtiene es una medición de la proporción de enferme-
dad que se da en los expuestos «relacionada coro> la exposición, la prn-
porción alrib,lihle. Se ha llamado también a esta medida ji-acción etiolñgi-
1 ca (Miettinen.
1971 ).
1974) y porcentaje del rie.~go atrib,lihle (Cole y MacMahon.
Ir -lo
PAT =
Ir
¡
RT- 1
1.
~ PAr
RT + 1/ Po -1
t
RT
J
J
;'
1 {
, I
J
-
I r-
"
-
~. ESTANDARIZACION DE T.~SAS
1 EL PRINCIPIO DE ESTANDARIZACION
EDAD
0-29 30-59 60+
Población
Suecia ......... 3. 145.000 3.057.000 .294.000
Panamá ....... 741.000 275.000 59.000
Muertes
Suecia ....... ..
Panamá .......
3.523
3.904
10.928
\.421
59.104
2.456
J
Tasa de mortalidad
Suecia ......... 0.0011 año - 1 0.0036 año - I 0.0457 año - I
Panamá . ....... 0.0053 año - I 0.0052 año - 1 0,04 16 año - I
i;
i
¡
52 EPIDEMIOLOGIA MODERNA
Pe,\,o
Edad ( pnrcel1[a:ie )
0-29 0.69
30-59 0.26
60+ 0.05
Lpi~
TE
}::;Pi
]
donde 1; son las tasas específicas por categoría en la categoría i, )' p; son
los pesos para la categoría i, derivados del estándar. Al dividirlo por
:J
L p;, cualquier grupo de pesos, {p }, se convierte en un grupo de propor-
-¡
ciones que tienden a sumar la unidad. Si se escogen los pesos de forma
que su suma sea uno, como en el ejemplo anterior. no es necesario
incluir ¿:p; como divisor de la fórmula porque eso sería divídir por la
unidad. Cada 1; tiene un numerador, el número de casos, y un denomi-
nador, que es típicamente una cantidad de experienciapersona-ticmpo.
-j
EsTANDARlZACION DE TASAS 53
n.
TE = - I
L /1. .~
I
TE = -
Ilj -.1
-~
L \'.
= tasa cruda
{
L )'1 i
'] ~
Lnli
RME \
}'Oi
Lnli.~
LnJi
Tabla 5.2. Ta.\"a.\" (le incillencia /¡ipotética.\". por ('dade.\". para (lo.\" .'Srnpo.\" lle
e.\"po.\"icióll )' una pohlacióll ,'{eneral
Población
CJtegoria de edad Exposición E.xposición :.
general
Jóvenes
Casos.
Persona-años ... 50 50 5
Casos.
Persona-años ... 400 4 40
200.000 I. 000 10.000
0.002 año- 1 0,004 año -
Incidencia. 0,004 año-1
56 EPIDEMIOLOGIA MODERNA
1
y para la exposición 2. idéntico resultado. porque las tasas especificas
por categoría son idénticas a la de la exposición 1. La razón en tre las
tasas estandarizadas, que se conoce como ra:ón tic ta.,"o,,"c,,"tandariza(I((,v
(RTE, SRR para los texto$ en inglés) para la exposición I en relación con
la población general es:
o ,004 "-1 ano
--I
RTE¡ 0.0015 año- i 2.87
observados 5 + 40
RME2 =
j
45
-
2.20
-0,5 + 20
~
ESTANDARlZACION DE TASAS 57
REFERENCIAS
EnsQ)'os clínicos
Los ensayos de campo difieren de lo~ ensayos clínícos en que tratan con
sujetos que aún no han adquirido la enfermedad y n() s()n, por tanto.
pacientes. Mientras las complicaciones de una enfermedad dada pueden
ocurrir con alta probabilidad durante un tiempo relativamente corto, lo
típico es que el riesgo de que una enfermedad ocurra en gente que está
libre de ella sea pequeño. En consecuencia, los ensayos de campo requie-
ren, por lo general, un mayor número de sujetos que los ensayos clinicos I
)' son. por ello, más caros. Más aún. puesto que los sujetos no son
pacientes, quienes habitualmente acuden a un lugar central a que se les
trate, un ensayo de campo necesita típicamente visitar a los su.ietos a J
nivel de «campo» (en el traba.io. la casa o la escuela) o establecer centros
desde los que pueda ser llevado el estudio ). a los cuales se insta a los
sujetos a que informen. Estas características del diseño incrementan,
como es lógico, los costes.
Lo caro de los ensayos de campo limita su uso al estudio de factores
preventivos de enfermedades o bien extremadamente comunes. o extre-
madamente graves. Se llevaron a cabo algunos para determinar la efica-
cia del uso de grandes dosis de vitamina C en la prevención del resfriado
común (Karlowsky el al., 1975; Dykes )' Meier, 1975). La poliomielitis,
un padecimiento raro pero serio, constituyó una preocupación de salud
pública suficientemente grande como para garantizar lo que quizás haya
sido el mayor experimento formal con humanos que nunca se haya
intentado, el ensayo de la vacuna Salk, en el que se administró ésta o un I
placebo a más de 1.000.000 de escolares (Francis el al., 1955). Si el
J
53
~
,
~
64 EPIDEMIOLOGIA MODERNA
~
...el entrecrllz~lmicnto dcl suministro de agua dc la Southwark and
f
Vauxhall Company con la dc la Lambeth Company, en gran parte de ¡
Londres. arroj~lba dudas so:bre que el tema pudiera ser discernido ~
.
hasta el punto de dar lugar a pruebas incontrovertibles en un sentido o ~
~
en otro. En los subdistritos (...) suministrados por ambas compañías. la f:
:
mezcla dcl suministro era de la naturaleza más íntima. Las tubcrías dc
~t~
66 EPIDEMIOlOGIA MODERNA
cada compañía ba.iaban por todas las callcs y entraban en casi todos
los patios )' callejuelas. Unas pocas casas eran servidas por una com-
pañia y otras pocas por la otra. según hubiera sido la decisión del
propietario o del ocupante en el momento en que las compañías de
agua se hallaban en activa competición. En muchos casos, un3 única
casa tiene un suministro díferente de las restantes. en cualquicra dc la~
aceras. Cada compañía sír\'c tanto a rico~ como a pobrcs. tanto a
casas grandes como pequeñas; no ha)' diferencias ni en la condición ni
en la ocupación de las personas que reciben el agua de las distintas
compañias (...) es obvio que no podria haberse diseñado ningún experi-
mento que hubiera puesto a prueba de forma más complcta los efectos
dcl suministro de agua sobre el progreso dcl cólcra que éste.
El experimento, igualmente. era de la mayor escala. No mcnos de
trescientas miJ personas de ambos sexos. de toda edad y ocupación ~'
de todo rango ~. categori~l, desdc los gentiles ~\ los muy pobres. fucrolJ
divididos en dos grupos sin haberlo elegido y. en la mayoria dc los
casos, sin su conocimiento; un grupo era el dc los que recibían agua
contaminada con las aguas fecales de Londres )/. entre ellas, la quc
provenia de los pacientes de cólera; el otro grupo tenia su agua bastan-
te libre de impurezas.
Para poner en marcha el experimento. todo lo que hacia falta era
enterarse de qué suministro de agua tenía cada casa individual en
donde hubera ocurrido un ataquc fatal dc cólera...
I
~ ,
..'"
..:~f
68 EPIDEMIDLOGIA
MODERNA
]
seguimiento de un sujeto. si tal experiencia se encuentra fuera de la
relevante ventana de tiempo definida por las asunciones de los periodos
de inducción y de latencia. Esa experiencia. que se excluye del seguimien-
to relacionado con la exposición. puede ser despreciada o. si es adccua-
do, considerada como una experiencia relacionada con la no-exposición.
Definir la no-exposición puede también ser complicado. Potencial-
mente, incluye la experiencia de los sujetos expuestos antes de que
tuviera lugar la exposición o. más generalmente. la experiencia de los
expuestos fuera de la ventana de tiempo definida por las asunciones
sobre período de inducción y latencia. Cuando se están evaluando varias
exposiciones, la no exposición debe corresponder a la ausencia de toda
exposición. Un error común, que quizá se dé más en los estudios de
casos-controles que en los de seguimiento. consiste en comparar cada
grupo de expuestos con el grupo complementario de no-expuestos. evi-
tando tener un grupo de referencia único bien definido. Tal uso de un
grupo movible de referencia en relación con la exposición. es fácil ver
que es incorrecto cuando los grupos comparados se categorizan en
función de niveles diferentes de una única exposición. Por ejemplo. seria
claramente un error comparar fumadores de pocos cigarrillos con «no
fumadores de pocos cigarrillos» (comprendiendo tanto no fumadores
como grandes fumadores). Similarmente. es incorrecto comparar cada
una de varias exposiciones diferentes con el grupo de referencia cam-
biante que comprendiera el complemento de cada uno de ellos: hacer eso
puede dar como resultado que causas apareciesen como [actores preven-
tivos y conducen, por lo general, a subestimaciones de los efectos.
COSTE
]
':
':
~¿
:\'¡~¡"~;i
1
72 EPIDEMIOLOGIA MODERNA
resumlrse como
a
II = ,~ ,
-I
e
j b
lo= -;:.:-;
k!:..-
II
c/
~:
e ~
i
J
I
J
~
,
c
RT = ~ -ad
[6.1]
10- ~
3
TIPOS DE ESTUDIO EPIDEMIOLOGICO 77
(
78
I
EPIDEMIOLOGIA MODERNA
-
p}o. un estudio de casos y controles sobre una epidemia de enfermedad
diarreica tras una reunión socia] puede comenzar después de que todos I ~
~
Razón de
Riesgo en los
no-expuestos
Riesgo en los
expuestos
Razón
vcn ta.ja
de
tasas de
incidencia *
Razón
riesgos
de
I
0.5
0.4
0.6
0.6
1.50
2.25
1,32
1.79
1.20
1.50 I
0.3 0,6 3.50 2,57 2.00
0.2 0.6 6.00 4.11 3.00
0,1 0.6 13.5 8,70 6.00
0.1 0,4 6,00 4,85 4.00
0.1 0,2 2.25 2.19 2.00
0.05
0,05
0.2
0,1
4,75
2.11
4.35
2,05
4.00
2.00 I
0,02 0,05 2,58 2,54 .?.50
]
cífico de tíem po (es decir, casos incidentes) es posible seleccionar como
tales cualquier caso de enfermedad existente en un punto en el tiempo. Si
la duración de la enfermedad no está reJacíonada con la exposición. un
estudio de casos y con trojes basados en casos y controles pre,'alentes.
seleccionados durante el periodo de riesgo, dará una razón de ventaja
que constituirá un estimado sin sesgo de la razón de tasas de incidencia.
Si la exposición afecta a la duración de la enfermedad, entonces dicho
estudio de casos y controles basado en casos prevalentes será incapaz de
distinguir entre el rol etiológico de la exposición y su efecto sobre la
duración, a menos que tal efecto sobre la duración fuese conocido. En
consecuencia, es muy preferible siempre que sea posible seleccionar casos
incidentes en lugar de prevaJentes. Como se discutió en el capítulo 3. la
situación de estudio más común en donde se manejan casos prevalentes
es el estudio de las malformaciones congénitas. En estos estudios. los
casos descubiertos en el momento de nacer representan casos prevalen-
tes, porque han sobrevivido con su malformación desde el tiempo de la
ocurrencia hasta el nacimiento. Sería más útil, desde el punto de vista
etiológico, tener en cuenta todos los casos incidentes, incluyendo los
abortos afectados que no sobrevivan hasta el momento de nacer. Mu-
chos de éstos, sin embargo, no sobreviven hasta el momento en que la
contabilización como tal es factible, con lo que se hace virtualmente
] inevitable que los estudios de casos y controles de las malformaciones
congénilas estén basados en casos prevalentes. Otra situación en que se
usan comúnmente casos prevalentes es el estudio de condiciones crÓni-
cas no letales, como la obesidad.
En tanto los estudios de seguimiento son útiles para evaluar una gama
de efectos relacionados con una única exposición. los estudios de casos y
controles pueden aportar información sólo sobre el efecto que aflige a
los casos seleccionados. Es posible. desde luego, seleccionar series mÚlti-
ples de casos con varias enfermedades, pero un abordaje así implica
emprender varios estudíos de casos y controles simultáneamente (las
diferentes series de casos podrian o no requerir series de control separa-
das, dependiendo de las condiciones de determinación de las series de
casos). Por otra parte, un estudio de casos y controles puede proporcio-
nar convenientemente información sobre una amplia gama de exposicio-
nes, potencialmente etiológicas, que podrían estar relacionadas con una
enfermedad específica en tanto. típicamente, un estudio de seguimiento
se centra en sólo una exposición {Ios estudios de cohorte de población
general son una excepción, aportando información sobre un amplio
espectro de exposiciones y enfermedades).
Ciertas fortalezas y debilidades que poseen los estudios de seguimicn-
to tienen simétricas debilidades y fortalezas en los estudios de casos y
controles. Ya se ha mencionado la capacidad de los primeros para
80
I
EPIDEMIOLOGIA MODERNA
-
c\'aluar una gama de efectos relacionados con una exposición. micntras
un estudio de casos y controles puede e\'aluar una gama de exposiciones
relacionadas con la enfermedad. En tanto la evaluación de los efectos ell
enfermedades raras es problemática en los estudios de seguimicnto. las
enfermedades raras se ajustan bien a los estudios de casos y controles: a )
su vez. éstOS son insuficiente.l; para evaluar los efectos de exposiciones
que sean infrecuentes en la población de donde provienen los casos. En
los estudios de seguimiento. se señalaha que cl rastreo de ios su.jclOSpara I
evitar que se les perdiera la pista constituía una seria preocupación. En
los de casos )' controles. la preocupación análoga es la de determinar la
exposición correcta para cada sujeto, para evitar de ese modo la pérdida
de sujetos sometídos a exposición desconocida. En los estudios "dc segui-
miento. dado que el .\"lall'.'i de exposición se delermína antes dc que sea
conocida la presencia de enfermedad para el su.ielo o para el invcstiga- I
dor, no existe posibilidad de que el resultado de la enfermedad e.ierza i
J
influencia sobre la clasificación de exposición: en los de casos y contro-
¡
les, si la información de exposición proviene del sujeto una vez comenza- 1-
da la enfermedad, el conocimiento de ésta podria afectar a los dalos ~
I!
acerca de la exposición. Esta posibilidad de sesgo en los estudios de casos
y controles no tiene equivalente en los de seguimiento. Por supuesto, el
conocimiento de la exposición puede afectar ,1 la dclerminación dcl .\"lall'.'.
de enfermedad de los sujetos en los estudios de seguimiento, pero tal
dificultad existe para cualquier tipo de estudio. En compensación por los
inconvenientes de poseer una fuente potencial adicional de sesgo. los
estudios de casos )' controles son más pequeños )' menos caros. en tanlo
los de seguimiento son habitualmente grandes y costosos. Finalmenlc. la
mayor eficiencia de los estudios dc casos y controles es un,1 vcnlaja que
puede compensar su mayor posibilidad de sesgo.
Los estudios de casos y controles han gozado de una rcputación
pobre en la investigación epidemiológica, jugando a veces e] papel de
chivo expiatorio que sólo se llevaba los palos. Los que denigran la
investigación de casos y controles hacen frecuentemente referencias des-
deñosas a los estudios «retrospectivos», sin hacer la distinción que los
epidemiólogos tienen en cuenla entre estudios de seguimienl() retrospec-
tivos )' estudios de casos }' controles: el grueso de lo~ resqllemores frente a
los llamados esludios retrospecti\'o.l; se hace recaer. sin embargo. sólo
sobre los esludios de casos v conlroles. Es innegable que presenlan m{ls
oportunidades de sesgo y d~ inferencia errónea que olros lipos de inve~-
ligación. Un motivo está en la posibilidad de sesg() de memoria al
clasificar la exposición. La razón prim,lria dc error. no obslanle. no tiene
nada que ver con la validez de la información que puede oblenerse de los 1 ~
~
I
8~ EPIDEMIOLOGIA MODERNA
)
TIPOS DE ESTUDiO EPIDEMIOLOGICO 85
ESTUDIOS ECOLOGICOS
REFERENCIAS
Aselton. P.. Jjck. H., Chentow. S. J., et al. Pyloric stenosjs and maternal Bendec-
tjn exposure. ,4m. J. Epidemio'. 1984; 120:251-256.
Beebe. G. W. Ref1ectjons on the work of the Atomic Bomb Casualty Com-
mission in Japan. Epidemio'. Rev. 1979; 1:184-210.
Byar, D. P., Sjmon, R. M., Friedewald, W. T., et al. Randomized cljnjcal trjals.
Perspectjves on some recent ideas. N. Engl. J. i\1ed. 1976; 295:74-80.
Cole, P. The evolvjng case-control study. J. Chron. Di.r. 1979; 32:15-27.
Detre. K. M., and Shaw. L. Long-term changes of serum cholesterol with
cholesterol-altering drugs in patients with coronary heart djsease. Cjrcu-
'alión 1974; 50:998-1005.
Dykes. M. H. M.. and Meier. P. Ascorbic acid and lhe common cold. Evalu-
ation of its emcacy and toxicjty. J.A.j\.{.,4. 1975: 231:1073-1079.
Francis, T. F., Korns. R. F., Voight, R. B., et al. An evaluatjon of lhe 1954
poljomyeljtjs vaccjne triaJs. Am. J. Puh'jc Heallh 1955: 45[May Suppl.J: 1-63.
Greenland, S. Response and follow-up bias in cohort studjes. Am. J. Epidemio'.
1977; 106:184-187.
Greenland. S., and Thomas. D. C. On the need for the rare djsease assumption
in case-control studies. Am. J. Epidemio'. 1982: 116:547-553.
1 Kannel. W. B., and Abbott, R. D. Incjdence and prognosis of unrecognized
myocardiaJ infarction. An update on the Framingham study. N. Eng'. J.
l\1ed. 1984; 311:1144-1147.
Karlowski, T. R.. Chalmers, T. C.. Frenkel, L. D., et al. Ascorbic acid ror the
common cold. A prophylactic and therapeutic trial. J.A.¡\.{.A. 1975:
231:1038-1042.
Kolata. G. Heart study produces a surprise result. Science 1982: 218:3r:.32.
Kupper. L. L., McMichael. A. J.. Symons. M. J.. et :ll. On the utility of propor-
tional mort:llity analysis. J. Chron. Di.r. 1978: 31: 15-22.
Leren. P. The eITect or plasma cholesterol lowering diet in male survivors or
myocardial infarction. Ac(a !\1ed. Scan{i. [Suppl.J 1966: 466:5-92.
Lubin. J. H., and Gail. M. H. Biased selection of contro¡s ror case-control
analyses of cohort studies. Bi()me(rics 1984; 40:63- 75.
McKay, A. M.. and Rothman. K. J. The incidence and severity or burn injuries
rollowing Project Burn Prevention. ,4m. J. Puh'ic Hea'lh 1982; 72:248-252.
MacMahon. B. Stregths and limitations orepidemiology. En Natíonal Academy
of Sciences. The Na(ional Re.rearch Council in '979. Washington. D.C.:
Natjonal Academy of Sciences. 1979.
McDowall. M. Adjusting proportional morta¡jty ratios for the inf1uence of
extraneous causes of death. S(al. Med. 1983:- 2:467-475.
McLaughlin. J. K.. Blot. W. J.. Mehl. E. S., et al. Problems jn the use or dead
controls il1 casc-control studjes. I. General rcsults. A,l1. J. Epi{lell1io'. 1985:
121:131-139.
88 EPIDEMIOLOGII. MODERNA
-J
7. OBJETIVOS DEL DISEÑO
DE ESTUDIOS EPIDEMIOLOGICOS
que resultan de tales causas. Bajo este punto de vista. pues. toda expe-
riencia está predestinada a desplegarse de manera teóricamente predecible
y cursa. inexorablemente, según patrones de acción previos. Incluso con
esta extremadamente determinista \fisión, sin embargo, es insignificante
la posibilidad que el hombre posee de adquirir suficiente conocimiento
como para predecir efectos con exactitud, en cualquier cosa que no sean
patrones triviales de causa-efecto. La impredecibilidad de determinados
resultados los hace indistinguibles de sucesos ocurridos al azar. Es posi-
ble, por tanto, poner en pie una descripción unificadora de esta imprede-
cibilidad, que haga el error aleatorio equivalente a la ignorancia acerca
de los determinantes en una situación dada/jDicho en pocas palabras. el
error aleatorio es esa parte de nuestra experiencia que no podemos
predecir,l,¡En principio. anticipar el resultado de una moneda lanzada al
aire representa un problema de fisica, cuya solución es factible mediante
la aplicación de leyes fisicas. La inadecuada información, no obstante,
provoca habitualmente que el resultado de nuestras predicciones no sea
distinguible de las conjeturas hechas al azar. Si las fuentes de variación
que no podemos explicar son realmente debidas al azar, o no, es algo
que nos da la mismo: nosotros deberemos tratar esa variación como
debida al azar en tanto no podamos exlicarla y, por tanto, reducirla,
relacionándola con factores conocidos.
j El error aleatorio en un estudio epidemiológico tiene muchos com-
ponentes, pero uno de los más notorioil'es el proceso de selección que
sigan los sujetos específicos del mismo. Se suele llamar habitualmente a
este proceso el I11lleslreOy al error aleatorio concurrente error mlleslral.
Los estudios de casos y controles implican un proceso de muestreo
como tal, pero todos los estudios epidemiológicos {incluidos los de
seguimiento, que no exigen muestreo real de sujetos), se dice que tienen
error muestral. La explicación es que dichos sujetos de un estudio,
muestreados en la realidad o no, son considerados como una muestra
figurativa de la población hipotética que podría haber sido involucrada
en el mismo. Los sujetos incluidos, pues, son una muestra de la experien-
cia biológica de una población conceptual más amplia. Por esta raz.ón. el
dicho estadístico de que no hay error de muestreo cuando se estudia una
población entera, contraponiéndolo a cuando se sacara de ella una
muestra, no se aplica a los estudios epidemiológicos, aun si, como se ha
dicho, se incluye en el estudio una población completa. Conceptual-
mente, por tanto, )os sujetos reales son siempre una muestra.
VALIDEZ INTERNA
SESGO DE SELECCIÓN
El contenido esencial de un estudio cpidemiológico e¡; la comparación de
enfermedades o de frecuencias de exposición entre dos o mil¡; grupos. Un
sesgo de selección es un" distorsión del erecto medido: result" de I()s
'--
procedimiento~.utill!:::l-dos p~lr:.1 seleccionar sujetos. que condllcirian ~l
unae-.mm-áclon del efecto. entre los-¡ncliiidos eil el estudio. distinta Jei
estim~ldo obtenible p~lr~l I¿l población entera. te()ricamente considerada
diana del mismo.
Un~l v~lriante de tal sesgo es cl dc lllIIV,\.('I('('ci(jll. CU~ll1dos los Ccntros
de Control de EI1fermedades (CDC. eñlng~lñVCstigaron I¿l incidencia
subsiguiente de leuccmia entre las tropas que h~lbian estado presentes Cl1
la prueba atómica Smoky, en Nevada (C:.1ldwcll t!1 ([I., 1980), se logró
.-
seguIr el rastro al 76 por 100 del total de tropas identificad~ls como
Otro tipo de sesgo de selección que ocurre antes de que los suje(os
sean identificados para el estudio es el .\"(',\"go(li([,1;111áslico(Sackett. 1979).
Cuando se il1vestigtlba por primera vez la relación entre anticonceptivos
orales y tromboembolismo venoso medi¿ll1te es(udios de casos y contro-
les de pacientes hospitalizados, existió ya preocuptlción por el hecho dc
que alguntlS de ~lquelltlS mujeres hubiertln sido hospittllizadas con Ul1
diagnóstico de tromboembolismo venoso debido a que sus mcdicos
sospechasen relación el1(re esta enfermedad y los al1ticonceptivos ortllc~.
de forma que htlbían indagado sobre la toma de estos medicamentos Cl1
las pacientes que presentaban síntomas sugestivos (Sartwell ('I (II.. 1969).
Estudiar a ptlcientes hospittllizadas con tromboembolismo, por ttlnto.
podría dar como resultado un estimado extlgerado del erecto de los
anticonceptivos orales sobre esta enfermedad, si la hospitalización y I~l
determinación del diagnóstico hubiesen estado inl1uenciadas por la his-
toria de uso de los anticonceplivos orales.
Se pueden describir muchas variedades del sesgo de selección. El
9S EPIDEMIOLOGIA MODERNA
SESGODE INFORMACIÓN
Una vez identificadas las series que ha)' que comparar, dc~ proccder~e ¿l
obtener la inrormación que será sometida a comparación. 1\1 cvaluar un
efecto, el sesgo puede darsc a causa de errores comctidos en ]a obtenci¿)n
de la información que se precisa. Un sesgo de inrormación puede produ-
cirse siempre que haya errores en la clasificación de los su.ietos, pero ]as
consecuencias del mismo son direrentes se~\ln ~i el error de clasificación
en un eje de ]a misma (sea la expo~ición o ]a enrcrmedad) es. () 110.
independiente de la clasificación en el otro ejc. La exi~tcl1cia de errores
de clasificación que no son independientes dcl otro c.ic sc conocc com('
clasi(icación incorrecta di(erencial, en tanto a la existencia dc errores dc
clasIficación, sea para ]á exposición o para la enrcrmedad, que son
independientes respecto del otro eje se ]a llama cla.\"((icación incnrreclll
no di(erencial.
S.upongamos que se pone en marcha un estudio dc seguimient() par:~ .
comparar las tasas de incidencia de enfi~ema entre rumadores ~. no
fumadores. El enfisema es una enrermedad que puede permanecer sin s~:
diagnosticada si no hay una atención médica no habituaj. Si los fumad(l-
res, a causa de tener preocupación por los erectos del tabaco sobre su
salud o como consecuencia rea] de otros erectos que el rumar les puedc
producir (como la bronquitis). buscan atención médica en un grado
mayor que los no-fumadores, e] enfisema podría ser diagnosticado más
frecuentemente entre ellos que entre los n()-rumadores, simplemente C()-
mo consecuencia de una mayor atención médica. I\ menos que se diesen
pasos para asegurar un seguimiento comparable. se produciría un sesgo
de inrormación: se encontraría entre los fumadores, en comparación con
.Greenland estaba escribiendo sobre los e.l;tudios dc seguimienl(). pcro si cn 10!; c!;llldio~
de caso!; y controles el «resultado» !;e con!;idcra !;er una expo!;ición. cl punto !;C le$ aplica
igualmente bien a cllos.
OBJETIVOS DEL :)ISEÑO DE ESTUDIOS EPIDEMIOLOGICOS ?9
Tabla 7.1. E.r(.clo d(' la cia.\"(I¡cació11 i11Corr('(./ (I 11n di;rr('11('i(l1 d('1 cn11.\"11/71n
d(' alcohol .\"obr(' IlJ e.\"limació11 d(' 1(1 d(r('re11(.i(1 .1. ItJ ra;(j11 d(' IlJ.~(1.v
d(' incid('11cia d(' cá11('('r laringen ( d(lI().\" hi!'nli.,icn.\")
Tasa de
J
Difcrencia
Razón de
incidcncia de tasas
ta$a$
x 10~ año) x IO~ año)
No clasificación incorrecta
1.000.000 bebedores 50
40 5.0
500.000 abstemios ]0
.Dada la gran c~ca~cz tic tcxto~ cn castcllano quc hayan Iratlucido esle Icrminn. traducir In
era una de las deci~iones má~ tlilicllcs tic adoptar. Finalmente me ha parecido preferible hacerlo.
por entender que no hay ra1:\)n alguna para utilizar "jerga" y privar :II Icctor "ordinario» en c~pañol
de unas posibilidadcs quc el equivalente angloparlanle si po~ee en ~u idioma. Debe quedar claro. en
todo caso. que la ralabra "confounding» no ~e reficre al /'¡¡.r{n (quedar aturdido. no .~aher qué
hacer. ...; la palabra cquivalente en inglcs ~eria "conrusión»1 ~ino all!c{" " acr;¡," (estar oscureciendo.
ocultando algo. «embrollado» en definitiva...I. Confounding. como ~ustantivo. no aparece en cl
"Oxford Dictionary of Current English»~Oxford University Press. 1985. Sí aparece \'confound» =
perplex. baffie. confu~e (pág. 150). rN. (1('1 T.J
r-
'04 EPIDEMIOLOGIA MODERNA
cual los controles son sólo una muestra. En principio. quien determina
en un estudio de casos y controles si exi~te confusión es el conocimiento
a prinri sobre la población origen de los casos (M iettinen y Cook. 19R1).
Desgraciadamente. pocas son las veces en que se dispone de esa-informa-
ción fiable a priori sobre asociación entre factores de riesgo en poblacio-
nes específicas. Por tanto. en la práctica. incluso en estudios de casos v
controles, los datos que se estén manejando son los que habitualmente
tendrán que servir para evaluar la asociación entre la exposición y la
potencial variable de confusión.
En un estudio de seguimíento sobre exposición ocupacíonal y cáncer
de pulmón, entonces. si el fumar carecí ese de asociacíón con la exposi-
ción ocupacional en las cohortes del estudio. no estaría confundiendo.
Tampoco lo estaría en un estudio «anidado» de casos y controles que se
llevase a cabo en el seno de esa misma pobl~lcíón. incluso si el grupo
control manifestase asociación entre el fumar y la exposición ocupacional
Puesto que la población origen, como se ha dicho. no poseia asociación
entre el fumar y la exposición ocupacional. los sujetos expuestos no
afrontari~ln un m~lyor riesgo de cáncer de pulmón por ser fumadores.
con lo que este hábito no estaria confundíendo. Consideremos, como
ejemplo adícional. un experimento aleatorio: en ellos. todo factor de
riesgo tiene, en expectativa. asociación cero con la exposición. Sin em-
bargo, si en el proceso real de muestreo aleatorio acontece que un factor
ídentificado de riesgo está. a pesar de haberse realizado el muestreo ~ll
azar. asociado con la exposición. actuará como factor de confusión en el
experimento.
3. Una variable de confusión no debe ser un paso íntermedío en la
secuencia casual entre exposición y enfermedad.
Este criterio requiere disponer de información por fuera de los datos.
El investigador debe decidir si el mecanismo causal que conduce de la
exposición a la enfermedad íncluiría como paso intermedío al potencial
factor de confusión. Si es así. la variable no será de cünfusión.
Es ímport~lnte recordar que la confusíón es un sesgo y, por tanto.
debe ser consíderada y trat~lda como un prohlema cuantítativo. MilS 4ue
su mera presencia o ausencia, lo que ímporta evaluar es la cantidad de
confusión. Los métodos existentes para evaluar cuantitativamente la
confusión son descritos en el capítulo 12.
Una clasificación íncorrecta puede afectar a las variables de confu-
sión. En concreto. si una variable de confusíón está clasíficada incorrec-
tamente, resultar~í maniatad~l la capacidad de controlar su efccto en el
análísis (Greenland. 1980). La clasificacíón íncorrecta no diferencial de
una exposíción o de una enfermedad sesga los resultados del estudio en
dirección a la hipótesis nula. pero una malclasificación no diferencial de
una variable de confusión, atenúa el grado en que la confusión puede ser
controlada y causa con ello un sesgo en cualquiera de las direcciones.
dependiendo de la dirección que dicha confusión tenga. Por esta razón.
el clasificar íncorrectamente a los factores de confusión puede llegar a ser
"o EPIDEMIOLOGIA MODERNA
VALIDEZ EXTERNA
1('
vez de por un intento vano de hacer que esos-sujetos fuesen representati-
~r I vos. en sentido de ser muestra, de potenciales poblaciones diana.
re En última instancia, la meta científica de un estudio es contribuir al
conocimiento científico. El proceso inductivo, que consiste en sintetizar
conocimiento a partir de observaciones sigue, después de siglos de exa-
.1. men, sin ser bien entendido (véase Cap. 2). Está claro, no obstante, que
1a implica moverse de las particularidades de un grupo de observaciones a
e. la abstracción de la hipótesis o la teoria cientifica. Las teorias científicas.
Ir como el ejemplo de Reichenbach sobre la madera que ardía. están
la divorciadas del tiempo y del espacio: son abstracciones que constituyen.
y
en sentido filosófico, formulaciónes universales. La esencia de la genera-
112 EPIDEMIOLOGlfI MODERNA
REFERENCIAS
Greenland, S. Responsc and follow-up bia~ in cohort ~tlldics. A"I. .I. E"iden,iol.
1977;106:184-187.
Greenland, s. The efTect of misclassification in the pre~ence of c()variales. Am. .I.
E"idemiol. 1980;112:564-569.
Jick, J., Walker, A. M.. Rothman, K. J.. ct al. Vaginal spermicidcs and congenjlal
disorders. J.A.M.A. 1981;245:1329-1332.
Jjck, J., Walkcr, A. M.. Rothman, K. J., ct al. Vagjnal spcrmicide~ and congcnital
disordcrs~reply. J.A.M.A. 198Ia:246:2677-2678.
Klemctti, A., and Saxen, L. Prospcclivc vcrsus rclro~pccti\,c approach jn thc
search ror environmental causes or malformatjons. Am. J. rllhlic H('ai(h
1967;57:2071-2075.
McMichae1, A. J. Standardizcd mortality ratjos and thc ..hcal!h)' workcr cfTccl:
Scratchjng beneath the surfacc. J. OCCII". M('d. 1976; 18: 165-168.
Micttinen, O. S., and Cook, E. F. Confounding: Esscncc and dclectíon. A",. .I. .1
EJ1ide"riol. 1981; 114:593-603.
Morrison, A. S., Burjng, J. E., Verhoek, W. G.. e! al. CofTec drjnking and cancer
of lhc lower urjnary tract. J. Nal. Cmrcer 1".\"1. 1982;68:91-94.
Oakley, G. P., Jr. Spermicides and birth defccts. J.A.M.A. 1982;247:2405.
Reichenbach, H. TI,c Rise oJ Scienl(f/c Plrilo.\"()J1hJ.Nc". York: ~Iarper & Ro\\".
1965.
Rothman,. K. J. A pictorjal rcprc~entation ()f conf()undil1g in cpídcmiol()~ic
studies. J. CI,ron. Di.\,. 1975;28:101-108.
OBJETIVOS DEL DISENO DE ESTUDIOS EPIDEMIOLOGICOS
"3
Rothman. K. J.. Jnd Boice. J. D.. Jr. E{1idemi(}I(}~ic :lnal.I".~i.\" 11.i(h (I l'rn~rm1lmah/(,
C"lc/(la(or(2 nd ed.). Chestnut Hill. Mass.: Epidemioiogy Resourccs Inc.. J9R2.
Sackctt. D. L. /3ias in ;¡nmytic rcscarch. J. Chrnn. D;.\". 1979:32:51-f\3.
Sartwell. P. E.. Masi. A. T.. Arthcs. F. G.. et al. Thrombocmboli~m and oral
contraceptives: An cpidemiologic casc-control study. /lm. J. E{1;(IE'm;nl.
1969:90:365-380.
Schlesselman. J. J. Sample sjze reqlliremcnts jn cohort and case-control studics
of diseasc. ..Im. J. E{1ideln;(}I. 1974; 99:381-~R4.
Smithclls. R. W.. and Shcpard. S. Teratogenicity testing jl1 humans: A method
dcmonstrating thc safcty of Bcndcctjn. T('ra(oln,r:-'. 1978; 17:31-36.
1
J
~ -1
II
e
II
:r
¡V,
IC
8. ESTRA TEGIAS EN EL DISEÑO
DE ESTUDIOS EPIDEMIOLOGICOS
MEJORA DE LA PRECISION
MEJORA DE LA PRECISION
Q)
:3
""Ui
o
80
0-
C
00
"U
!O
E 60
O
C
Q)
~
c: 40
.o
"U
O
o.
0
~ 20
j o 2 3 4 5 6
Tamaño de la serie de comparación en relación al de la serie índice (r)
MEJORA DE LA VALIDEZ
FUENTES DE INFORMACIÓN
PREVENCION DE LA CONFUSION
RANDOMIZACION
RESTRICCION
.1
'28 EPIDEMIOLOGIA MODERNA
APAREAMIENTO
REFERENCIAS
I
.
~
ESTRATEGIAS EN El DISENO DE ESTUDiOS EPIDEMIOlOGICOS
.~
.~ 1
I
.
~
9. EL PAPEL DE LA ESTADISTICA
EN EL ANALISIS EPIDEMIOLOGICO
~
EL PAPEL DE LA ESTADISTICA EN EL ANALISIS EPIDEMIOLOGICO 35
( ~
Tabla 9.1. Dalos hipOlélic().\" (1('1 ensa)'o clínico (le III/ 1/111!l'Otralamie',t()
1
Tratamiento
)
Resultado
1 A B
)
1 Favorable 7 14
) Desfavorable 13 6
Total 20. 20
'40 EPIDEMIOLOGIA MODERNt-
-50 -40 -30 -20 -10 0 +10 +20 +30 +40 +50
Favorecen al control Favorecen al tratamiento
-J
(Pr- P,} X 100
Fig. 9.2. Líl'rill'.\" d(' ('Ollf¡ml:a a19() {J()r lO() d(' /a di(c.r('1Icia l('rdad('ra ('n'rl' {J()'..
ce1lIaie.\" de lo.\" 71 i!11.\"a)'().\".La ('()llllI/lla ¡;e'.'icall!lI L'I C('1Il'.(/ (le cada inll'rla/(1 ill(li-
ca (.'1valor obserradn. Pr -Pr {Ja'.a cada ell.\"a)'n ('(}I'iadn (le Fr(.'ima1l et (II. í 19i,y I
con {Jermi.\"o (1l'1 Nell' En.,¿la1ld J(}Llr1lal oJ J\ledicin(.".
Estudio A
Estudio B ..-
t
Punto
J
nulo
Fig.9.3.
Resullado.~ de do.~ e.\"ludi().~hif1()lCti('().~.
EL PAPEL DE LA ESTADISTICA EN EL ANALISIS EPIDEMIOLOGICD
43
SUMARIO
La epidemiologia, como la mayoria de las ciencias modernas. se ha~~1
para el análisis de los datos en principios y aplicaciones est,ldisticas. L(l
estadistica. sin embargo, sirve a los epidemiólogos únicamente como
herramienta para conseguir sus ob.jetivos cientificos. Con demasiada
frecuencia se han utilizado en estudio.c; epidcmiológicos procedimicntos
estadísticos que tenian poco en cuenta los oh.ietivos dc aqlJclla cicncia.
Los ejemplos abundan: incluyen el u~o de método.c; de muestreo p~lr~1
estudios cuando no están indicados, el uso de análisis de la varianz~1 u
otras técnicas estadística.c; que no producen como resultado mediciones
epidemiológicas y, )o más frecuente de todo. el basarse inadecuad~lmente
en la puesta a prueba de hipótesis estadisticas. El concepto de «signirlc~1-
ción estadistica» se podria suprimir del léxico dc lo.c;epidemiólogo.c; Sil1
que se perdiese nada. Si se lo usa para valorar el erecto de confusión.
resulta simplemente incorrecto: utilizado para comprobar estadistica-
mente la asociación entre exposición y enfermedad. induce con frecuen-
cia a error y nunca describe la magnitud del efecto o la precisión de la
medicíón, En este último caso, utilizar los intervalos de confianza en vez
de tos valores de p o «significación estadistica». da lugar 3 una nótable
mejora en la claridad de la iriterpretación por parte de todo el mundo c
impide que se produzcan manifiestas malinterpretaciones por parte dc
lectores o investigadores descuidados.
Para un epidemiólogo, dominar satisfactoriamente la estadistica cm-
pienza con el principio de que los objetivos epidemiológicos dcberian
cumplir los requisitos adecuados en cuanto a diseño del estudio )' an;lli-
sis de los datos. Los métodos estadístico.c; se adoptan, o si hace falla se
inventan, para conseguir los objetivo.c; epidemiológicos, No se pllede
defender, en nombre de la consecución de un objetivo estadistico, com-
promisos en el diseño o el análisis del estudio. ni el uso de un mélodo
estadístico que no sea conforme con los objetivos del mismo.
REFERENCIAS
Atkins, L., and Jarretl, D. The significance or .significancc lcsls.. En J. Irvinc. I.
Miles, and J. Evans (eds.), D('m)'.flif\:in.R Social Slali.flic.\". London: PlulO
Press, 1979.
Bandl, C. L., and Boen. J. R. A prevalenl misconceplion about samplc si7.c.
statistica) significance, and clinical imporlancc. J. P(',.iodmll. 1972:43: I X 1-
183.
Berkson, J. Tests or significance considcrcd as evidcncc. J. AII/. SIal. A.\".\"0('.
1942;37:325-335.
Freedman, D., Pisani, R., and Purves, R. Slali.flic.\". Ncw York: Norlon, t978.
Freiman, J. A., Chalmers, T. C., Smith, H.. et al. Tl1e importance or bela, thc
Type II error and sample sizc in thc dcsign and inlcrprclation or the
randomized control trial. Survey or 7) "negativc" trials. !\7. El/gI. J. M('d.
1978;299:690-694.
10. FUNDAMENTOS DEL ANALISIS
DE DA TOS EPIDEMIOLOGICOS
'-
FUNDAMENTOS DEL ANALISIS DE DATOS EPIDEMIOLOGICOS 51
de lectura por scanning óptico, que en cuaiquier caso haya que perforar-
los: en consecuencia, el meter los datos directamente durante la codifica-
cjón reduce tanto los costes como las equivocaciones, Cuantas menos
operaciones de reescritura. pues, haya entre el registro primitivo y la
versión que la máquina almacena. menos probable será que se produz-
can errores. Si es inevitable reescribir, resulta lltil hacerse una idea del
grado de error de codificación que contendrá el material producido
codificando una cierta proporción de los form,ltos por duplicado. inde-
pendientemente. La información así obtenída puede ser utilízada para
juzgar la magnitud del sesgo que la clasificación incorrecta debida a
errores de codificación habrá introducido.
La edición b,ísica de los datos requiere ir comprobando cada variable
en busca de valores ilegales o inusuales. Por ejemplo. el género se puede
codificar con un I para varón y un 2 para mujer. Habitualmente se
utiliza un valor aparte. como puede ser un 3. para designar los resulta-
dos desconocidos, Es preferible no asígnar a nadíe el códígo cero. si se lo
puede evitar, porque algunas máquinas o programas interpretan la falta
de información o los códigos no numéricos con un cero, No utilizando
este número como código específico, por tanto. ni siquiera para la
información desconocida. se hace posible la detección de errores de
perforación o de la información que falta. Cuando se procede a edítar es
importante examinar la distribución de cada variable. Todo valor inad-
misible debe ser contrastado frente a los formatos originales en que se
recogieron los datos. Valores que resultasen inhabituales. como que el
género fuese desconocido. o una edad o fecha de nacimiento no norma-
les, deben ser comprobados también.
Además de someter a comprobación a los valores incorrectos o
inhabituales, debe examinarse la distribución de cada variable, para ver
si parecen razonables. La proporción de varones que uno espera, ¿.esla
mitad, un 80 por 100 (cifra que es razonable si los sujetos sorl enfermos
con, digamos, cáncer de vías respiratorias altas), o aproximadamente el 2
por 100 (si estamos trabajando con personal de enfermeria,'? Una evalua-
ción de este tipo puede revelar problemas importantes que de otra forma
no saldrían a la luz. Por ejemplo, un error de programación podría
hacer que todos los datos de cada registro electrónico se desplazasen en
uno o más caracteres. dando como resultado una colección de sinsentidos.
que a pesar de todo pudíesen no ser detectables mediante, por ejemplo.
un análisis multivariado (lo que es. de hecho, una pega importante del
abordaje multivariado). Lo factible de un desastre asi resalta la necesi-
dad de comprobar cuidadosamente la distribución de cada variable
durante la edición de los datos.
Las comprobaciones relacionadas con la edición que hemos conside-
rado hasta ahora se refieren a cada variable de los datos tomada por
separado. Aparte de esa edición básica, es habitualmente aconsejable
revísar la consístencia de los códígos a base de relacionar variables. No
es ímposíble. aunque sí improbable, que una persona de diecíocho años
tuviese tres hijos. Los varones no deberían haber sído hospitulízados
152 EPIDEMIOLOGIA MODERNA
categorías. Ahora bien. sucede que lo~ dato~ ~on mucha~ vece~ tan
limitados en número que re~ulta indeseablc crear «nada menos» que
cinco grupos para una variable dada. Cuando las obser,.acione~ est:'\n
desperdigada~ en demasiadas categorias. lo~ números dentro de éstas se
vuelven estadisticamente inestables y producen grandes errores alcato-
rios en los estimados del erecto.
Puesto que la mayor parte de la conrusión debida a un faclor dado
puede ser eliminada mediante un análisis e~tratiricado basado en sól(,
dos categorías de una variable continua (Cochran. 1968), si los dalos de
que ~e di$pone son escasos resulta deseable mantener pequeño el nÚme-
ro de categorias. en torno a dos o tres. IncJuso un cuerpo dc datos quc
fuese grande puede ser dispersado hasta dar grupos exce~ivamente del-
gados si la tabla de contingencia implica demasiadas dimensiones. es
decir. si se usan demasiadas variables para cla~iíicar a los su.ietos. COI1
tres variables, aparte de exposición y enrermedad. y tres c~\legorías p~\ra
cada variable. habria 27 tablas de 2 x 2 (.\sumicndo que lanlo la exposi-
ción como la enfermedad fuesen dicotómic.I~). Con dos variables más. de
tres categorías cada una, tendriamo~ un tolal de 243 tablas de 2 x .?.
suficientes como para estirar ha~ta hacer demasiado delgado inclu~o UI1
cuerpo considerable de datos, puesto que un estudio de 10.000 personas
tendria únicamente como media en torno(\ 10 ~u.icto~ por cada ccld~1 de
dicha tabla multidimensional. Si se está planificando un análisis estratili-
cado y es necesario estratificar de acuerdo a diversa~ variables. probable-
mente sólo unas pocas cntegorias, quizá~ t:\11 pocas como dos. pucdan
ser utilizadas pnra cada variable. Con sólo dos categoria~ por variablc.
la estratificación por cinco variables requiere 32 en vez de 243 t.\bla~ de
2 x 2. y un estudio de 10.000 su.ieto~ daria ahora como medio 7R por
casilla. en lugar de 10, ganando con ello en precisión. al precio de alguna
confusión residual potencial dentro de las categorias. -1
El investigador debe decidir también dónde trazar la linea divisori.1
entre las categorías. No ha)' un mélodo comúnmente aceptado p.\r.1
h.tcerlo. Una preoc\lpación que sc expres~\ frecuentemente esti\ referida a
que lo~ límite~ tienen que «mangonear~e»). e~ decir. h~~. que de~pl~17.ar
-después de haberlos examinado de forma preliminar- los estimados
del efecto de una forma quc lo~ ~llterc en I~\ direccíón descadil. Ta]
preocupación adjudica al investigador un nivel de deshonestidad que es
de esperar sea inhabitual. Por otra parte, despla7.ar en la categorización
\Inos límites rara~ veces tiene un efecto sustancial sobre la magnitud de
un estimado y ello. en todo ca~o. serí~\ debido a la exi~tencia de un gran
componente de error aleatorio. Por cl contrario. frecuenlemente rcsulta
útil tantear la distribución de una "(1riable antes de decidir en qué punto
dar cl corte entre categoría~. Si tiene. por e.iemplo. más de una moda.
podrí;¡mos hallarnos ante categorias «natur;¡le~». La distribución pucdc
también e~tar lo suficientemente despl:tz:tda hacia una cola como par~1
que fronteras preconcebidas entre categoria~ condu.iescn a una incficien-
te separación de los su.ietos. con demasiados pocos sll.ietos en alguna~ de
ellas )' demasiados en otras. Debido (1esta~ r~lzones. por tanto, resulta lil
FUNDAMENTOS DEL ANALISIS DE DATOS EPIDEMIOLOGICOS ~55
Cm11f'rnbllCióll dc la 11if'ále.\"i.\"
~.-~,
FUNDAMENTOS DEL ANALISIS DE DATOS EPIDEMIOLOGICOS '57
t t
o Valor observado
Fig. 10.1. Distrih,(('i(ín d(' ,(}s (',\"tÍJJJ(1dt1,\' d('1 ('fe(,/(} ('II el m(1r('(J d(' 1(1 hi!,fí/('si,\'
=A.¡.B.¡.C+O
ó
= A + B + 1/2(C + O)
"U
ca
:::2
:o
ca
.D
o
~ I
.
t t
o Valor observado
Medida del efecto
Fig. 10.2. Di.\"trihllci()1I de lo.\" ('.\"timado.\" ticll;!ecto e1l ('11l10rco tic 1(/ hipl)t('.\"i.\"
Puesto que la probabilidad del rango entero del \'alor obser\'ado está
incluida en la definición tradicional del valor de P. la «corrección» de
Yates mejor~1 habitualmente la aproximación a como se define. también
lr.\dicionalmente. el valor exacto de Po Por el contrario. si se utilizase 1.1
definición de la media P. la sugerida operación aritmética empeoraria
ciertamente la aproximación. puesto que el valor observado ya represen-
taba el v.\lor central de su rango discreto. En el presente texto. la
«corrección» de Y.ltes es ignor.lda.
Para una comprobación estadística en torno al valor nulo. sobre la
b.\sc de un.l distribución normal, la fórmula general viene dada por la
ecuación 10.1:
.4 -E
x =
[10.1 ]
--¡¡;-
v
exacta. Resulta conveniente. por tanlo. dcsi~n:lr como ,1 ;¡1 númcro tIc
sujetos expuestos que en el estudio padecen la enrermed(td: mediantc
esta sustitución. e} número esperado p;¡ra A ha.io la hirótcsis nllia no
seril cero. sino que deberá 5er calculado a pi.lrtir dc los dalOS. sohrc 1i.1
base de} modelo probahilíslico que fue5e pertinenlc. Los modclos quc
pari.l e5tudios epidemiológicos son rc}e\,antcs a e5lc rc~pcClo scriln dcs-
crilos en los capitulos 1 J ~' 12.
iJ
(O A B Area de la cola
:2
15 Curva A: 5 %
(O
-O Curva B: valor de p
o
5. con una cola
:J
":J
":J
(O
iJ
.~
C)
O
Fig. 10.3. Rall.~o d(' 1111(e.\,treod(' lo.\, dato.\, ('II rejerl'lIcia lÚ valor 1/1(1(,.I' (1IIín,ite
de co(~jillll;a illjerior al 9(} !'or 100.
162 EPIDEMIOlOGIA
MODERNA
deI punto de referencia. hasta que el ilrc~l dc la cola se~l acorde con cJ
nivel de confianza que se desea. Por i() tanto. el c~llculo de los limitc~
exactos de confianza es prácticamente invi..lble si no se dispone de un
equipamiento a base de computadoras electrónicas prot!r..lrnablcs.
Existen afortunadamente much..ls tccnicas sencillas~ an{llo!!as ;¡ la
fórmula ]0.1. para obtener limites de confianza aproximados- Como en
el caso de la comprobación de hipótesis. la exactitud dc las tccnic:l~
aproximadas depende del ntlmero de ohser\'aciones. porque todos I{)s
métodos dependen de la distribució~ normal de los estim~ldos dcJ cfecto.
garantizada por el teorema del limite central cuand() l~lS obscr\.aciones
son suficientemente numerosas.
Una asunción que simplifica las cosas y que con [recuellcia ~c re..llizJ.
es considerar constante. a lo l~lrgo de ~lI escala de medicil)ll. la \.ari~lbilj-
dad muestra! del estimado del efccto. e~ decir. auc I:! \.~lrianz:1 ocl
estimado dcl e[ecto se toma corn() con~tante. illd;rendicntementc d:;:1
~
valor del estimado. Para comprobar una hipótesis no es necesario ~lSlJ-
mir e~t(). porque el valor de p se c~lcula sobrc la a~unción de. quc I~I
hipótesi.~ nula se mantiene y por tanto. lo que preocupa al poner a
prueb.i una hipótesis es estimar la varianza sólo sobre el valor nulo. Con
un conjunto grande de observaciones. el rango de muestreo para el
estimado del efecto es suficientemente estrecho corno para hacer apr()-
piada esta asunción: incluso si la varianza cambia sustancial mente a lo
largo de la escala de medición en que se mide el efecto. en un ran(!()
.~
suficIentemente estrecho será casi constantc. En consecuenci~l. la sirnpli-
ficadora asunción de que la varianza se~ constante es corrccta asintóti-
carnente: es decir, la asunción se \'a haciendo m{J.<\apropiada con[ormc
aumenta el ntlrnero de observaciones utiliz;ldas en eJ rroces() de estilll~l-
ción. .
El abordaje habitual y el más simrlc qlle ~e utili7.;1 r~lra c..llcular
limites de confianz..1 aproximado~ consiste en estim~r 1:1 desviación es-
tándar dc la curva normal que represent.1 la distrihuci()11 Illuestral arr()-
ximada dcl estimado dcJ efecto. El iJrea que h;I~. h;l.i() un scf!mcnl()
simétrico de una cur\'a normal es runci()n especifica dc la desviación
estándar: de hecho. esta rclación proporciona la tlnic:1 posihilid~ld de
interpretar la desviación est:ind~lr com() medida de v:1riabilid~ld. Si 1:1
distribución no es normal. no existe interpretación :11f!Un~1dc este par:!-
metro que tenga sentido, aunque se podrian c~llcu¡..lr. pcSC a todo. lo.~
int("rvC\los de confianza por medio de cálculos exactos. Para cualquicr
CUr\":i normal, el 68 por 100 del área que ha)' ba.io ell~l sc cncuentra en 1:1
regil'll <iistante hasta una desviación estánd..lr (SO) del punto centra!. Oe
esta manera, valores de medición inform;ldos con la [órmuln :t SO com()
medida de variabilidad. l~ que quicl:-en expresar es un estimado puntual
con un intervalo
la distribución
de c0nfianza acompañante
muestral sea en rc:llidad
del 6R por ]00. siempre que
normal. Cuand() se ha csco-
]
gido un nivel de confianza. el \'~llor h~lbitualrnentc no seril del 68 sino
comúnmente dcl 80, 90 ó 95 por 100. F.sto ni\'eles dc confianza se
corresponden con las regiones marcadas por los puntos 1.2R2. 1.645 ~.
~
i i i i i i i
O\n
tO-:t
-1 o +1 IJ)O
.".<D
0). tO. Media <DO)
.--
RD :t z .SD(RD) [10.2]
citado estimado puntu~ll c~ la misma que I~l qllC h:ly clltre c~te ~.'el \()pe
inferior .
Las [10..?] y [1().4] <¡011la~ f()rm\II~\s ~ener:llc~ m:"I.O; ~cnl.:ill~\.o;r:lr:l oh-
tener por derivl1ción límites de confi~lnZl\ aproxim:ldos r:lr~l mcdid:1S dcl
efecto expresad..ls en términos de diferencia dc tasa~ y r~lzón de tasas. res-
pectivamente. Sc h~ln propuesto muchas \écnica~ c~pccificas. c:tda una c()n
un balance diferente' entre facilidad de ci1iculo y cx:lctitud. 1\lgunas fórmu-
( las dejan de lado la ll~unción de que la desviaci()n e~ti1ndar sea unif()rme ..1
lo largo de la escala dc medición y utilizan. por tllnto. técnicas reiterati-
vas para estimar su \'alor en las zonas fronterizas del intervlllo: el
método de Cornfield ( 1956) para calcular límites de c()nli:tnza de la
razón de ventajll es un ejemplo de este tipo de razón de riesgos y
diferencia de ricsgos. Los c:"llculo~ reiterativo~. como tamnién se !\eñllla-
ba antes. requieren I~\ :tsistencia .de pr()gram~ls de c()mputadorl1. con lo
que las ventajas tc()ricas van :tc()mpañ..ldas de desventCl.iCls rri\ctic:ls.
La técnica específica mils sencilla para Ilc\'ar a can() \In~ estimación
de] intervalo es cl mét()do «bas..1do en el test» {Miettinen. 1l)7ó:l), que
asume que el estimado dc la desviación esti1ndar de Il1 distrihución
muestral del estimado del efecto obtenido pl1ra el valor nulo constituye
un razonable estimado dc la desviación esti1ndar de la distribuci()n para
] cualquier otra parte a lo largo de la escala. Esta :lsunción difiere ligera-
mente de la habitual. consistente en que el vl11or c~llculado dc la des\'ia-
ción estándar en el cstimlldo puntual \'a a ser :ldecuado para los puntos
]imítrofes dcl intervalo: aunque ambos abordaje$ asumen que el \'Cllor de
la desviación estándar estimado en un punto de la escala se :tplicará
i tanto al extremo inferior como al superior. el valor calculado en el
~ estimado puntual está colocado más o menos centralmente entre los
límites del intervalo, en tanto el valor nulo no )o está e incluso pudiera
situarse fuera del mismo. Si la desviación estándar cambia a )o largo de
la escala de medida del efecto, el grado de error que habrá en 10$ límites
aproximados será probablemente menos severo si se estima la de$viación
estándar en el punto central del intervalo de confianza en vez de en el
punto nulo. que no tiene conexión con la ubic~lción de los límites. .Por el
contrario, si se e$coge el punto nulo como punto <¡onre el que se estima
la desviación estimdar. los limitcs de conlil1nz:l resultantes tender:"ln a ser
más ajustados cuando caigan en las proximid:ldcs dei cit:tdo p\lnto nulo.
con lo que podria llegar a argumentarse que vale la pen:l obtener m:lyor
exactitud cerca del valor nulo. incluso si ello signific~l
-- sacrificar :11\!una
exactitud cuando los límites c~llculados se encuentren lejos del mismo.
Aplicar la asunción de ]os límites has..ldos en el test Ilc\,ll II lina
concisa formulación para obtener los límite$ de confianza hllsados en el
test estadistico de 1~1ecuación 10.1. Consideraremo$ la reformul:lción de
dicha ecuación 10.1 para la diferencia de tClsas:
-..
[{D -E
l=.SD(RD)
166 EPIDEMIOLOGIA MODERNA
-""' /, ""'
donde E, la expectativa de RD ha.i() la hipóte$i~ nula. e~ cero. ~. SD(RDI
se calcula a~umiendo que la hipótesi~ nula e~ cierta. E$to da:
RD
,
[10.5]
~
donde SD()(RD) indica que l~1 de5\'iación c5tílnd:lr estíi cstim:ldíl el1 el
valor nulo. Se puede reescribir e5t:l ecuación 10.5 así:
---
I~ I )
SD(I(I~O) :: ~---
l
~. realizar SU51ilucione~ en la r()rrnula 10.1, I() que d~l. r:lra los Jimilcs
inferior y 5uperior:
:tz~
-
1
l
2'
+-
-"I
[10.6]
I. I
En la fórmuia [ 10.(i] sc asume quc 1:1 i: c~ UIl le~l esladi~lic() que evalúa
RD per se. Mietlinen recomendaba insertar en dicha fórmula [10.6] cual-
quier e~tadistica de X que representase un les! igualmente eficientc dc 1,1
hipótesis nula sobre la base de lo~ rnismo~ dato~. Por ejempl(). ~e la
podria sustituir por la habitual, basada en la distribución del núrncro dc
casos expuestos (véase Cap. II para la forma en concreto .de hacerlo).
La contrapartida dc la ecuación 10.5. utilizando como medida dcl J
efecto una razón de tasas. tras transf()rmación logaritmica es:
X = ,., In (RR),., [10.7]
SDo(ln (RIt))
111 (RR)
I: ~]
y hacer sustituciones con ella en la fórmul:l 10.4 para dar
J
que se puede simplificar hasta dclr:
-
RR(' :tZll)
[10.8]
-J
FUNDAMENTOS
DEL,\NALisiS DEDATOSEPIDEMIOLOGICOs 167
Como sucedía con la fórmula 10.6. el atracti"o tic la IO.R está en sustituir
la estadística ;(, basada en O. por una X altern.1tiva )' más conveniente
que pone a prueba la hipótesis nula. La misma estadística. ciertamente.
puede ser uti]izadi.l en las fórmulas 10.6 y 10.8 para generar límites de
confianza para la diferencia de tasas y para la razón de tasas. Nótese que
cuando el va]or de X es igua] a] multip]icador 2, e] punto de delimitación
inferior debe corresponder y corresponde exactamente a] valor nulo. que
es cero para la diferencia de tasas )' uno para su razón.
Las fórmu]as para caJcu]ar límites de confianza aproximados basa-
dos en el test que se dan con las notaciones 10.6 y 10.8 son extremada-
mente fáci]es de aplicar y proporcionan como resultado útiles inter,'alos
de confianza en una amplia variedad de situaciones. Los únicos números
que se requiere sacar de los datos son un cá]culo puntual de! estimado
del efecto que sea apropiado y la estadística z. sacada de la comproba-
ción de hipótesis. En rigor. el uso de la citada estadística Z' en estas
fórmulas basadas en el test. es la justificación fundamental de cualquier
discusión detallada sobre la comprobación de hipótesis estadística en la
1 epidemiología" moderna. puesto que para evaluar el error aleatorio es
preferible la estimación de un intervalo de confianza en vez del uso de
los valores de P: y éstos añaden verdaderamente muy poca información
] cuando se da el intervalo de confianza.
Desgraciadamente, el principio de los límite$ basados en el test es
invá]ido como método genera] de estimación del intervalo í Halperin,
1977; Gart, 1979). Las simulaciones han sacado a relucir los pobres
resultados del método, que por otra parte eran de esperar, cuallJo se
dan grandes alejamientos de la razón de ventaja respecto del valor nulo
(Brown, 1981: Gart, 1982) y, además, Greenland (19R4) ha suministrado
un contra ejemplo con la SMR que refuta la "alidez general del abordaje.
Este autor dice:
.J
168 EPIDEMIOLOGI/, MODERNA
]
FUNDAMENTOS DEL ,\NALI~IS DE DATOS EPIDEMI()LOG;COS '7'
REFERENCI¡\S
Br()\\.n. C. C. TJ¡c v:lliJily ()r :Irrrnxim:llc mctJ¡()(I~ r()r itlICrv:III:~lin,ali(,n ()f thc
odds rati(). .1",. J. 1:.',i(ÍI""i(li. Il)XI:II-~:474-4X().
Cochr~ln. W. G. TJ¡c clTccti\,cncss ()r:ldjllstmcnt hy ~lihcl:lssilic;¡li()n in rcm()\'ing
hi~l~ jn ()h~Cr\':lli()l1~tl sllioic~. IJi(}}lt('/ri(..\" I !)()R: :4::9-"-.\ 1.\.
Cornficld. J. ,\ ~tati~lic:l1 rr()hlcm :lri~ing fr()m rctrosrecli\.c sllloic~. (11 J. Ncy-
m~ln 'cd.) f'r(lc('(.(ii"I.'.\" .n,irt! IJ('rkc((..I. .S".I"'I',I(}.\.i"II,. V ()I. 4. Rcrkc¡cy: Uni\'cr-
~ity ()r C,I(irorni~1 Prc~s. 19-"6. rr. I ~5-14R.
Gart. J. J. Sl~lli~lic;¡1 :ln~l¡y~cs ()r Ihc rcl~ltivc risk. ¡::1//,i,.(I". 1{(.(lllh p('r.\",,('("I.
1979:3:?:157-167.
G:lrl. J. J.. and Tll()m;¡s. D. G. TJ¡c rerr()rm~lncc t)r IllrCC ;lrrr()xjmalc C()I1Ii-
dcncc Ijmil mcth()ds r()r thc ()dds r;¡li(). ..111/.J. E(,;th.II/i(,I. 1()R1:11-":J-")-470.
Grccnl~lnd. S. ¡\. C()llnICrCX;¡mplc I() thc Ic~t-h;¡~cd rrinciple nr sctlin!:! c()nfi-
dcncc Ijmits. .,II/. J. E"i(fI.II/i(ll. 19R4:1:!0:4-7.
JI~llperjn. M. Rc: ..E~lim~lhílily ;¡nd cslim~lti()11 il1 C:I~c-l:()nlr()1 ~tlloic~... I.cttcr I()
the Edilor. ..III,. .1. ¡::,,;(I(.lI/i(/l. J!)77: IO5:496-4l)X.
LanC;¡Slcr. H. O. Thc comhin~llion ()r proh~lbililics ;¡risil1!,! rr()m d:lt;¡ jn oi~crctc
dislriblltil")ns. fli(II/,('/'.ikf1 1949:-\6:370-3R2.
Lancastcr. H. O. Si!c!nific~lncc ICsIS in discretc lli~lrihllli()n~. .1. ..1,1,. .S"If1I. ..1.\".\"(/c.
1961 :56::?2}-2.14.
MacL;lllghlin. D. S. i\ d~lla \'aiidali()n pr()!c!ramnllclcll~. C(I,I"",I. Pr(ll,'. fli(I',,('(I.
19RO:II:43-47.
Mietlinen. O. S. E~limahi¡ily ;Ind c~ljm~lli('1n in l.~I~c-rCrcrcnl Sllldic~. ,.III/. .1.
Epi(I(,lI/i(/l. 1976¡l: 103:226-235.
Micttinen. 0. s. Slratiric~\li()n hy a mllllivari~\IC C()nr()llndcr score. ..ll1/. J.
E"i(I('/IIi(1l. 19i6b: 1()4:609-620.
Mjcltinen. 0. S.. and NlIrminen. M. Cl)mparali\,c ~ln~lly~i~ ()r t\\'() r;¡le~.
1 Slali.\'li(..\' 1\1('(1. 1985:4:213-226.
Rothman. K. J.. ~lnd Keller. A. Z. TJ¡e cITcct or j()int cxp()~lire I() alc()h()1 ,lnd
tobacco on risk or cancer or the mouth ~Ind pharynx. J. C"rm,. Di.\,.
J 1972:25:711- 716.
Yates. F. Contigcncy tablcs involving small nllmhcr~ ;¡nd thc chi-~qllarc tc~t. J.
R. Slmi.v/. Svc. Sllppl. 1934:1:217-235.
.
~
11.
persona-tiempo. sinn con el número total ele personas qllc flleron se~\Ii
das. Los ensayos c1inicos se presentan él menudo de esta manera. Cuan-
do los denominadores de medidas de incidencia son presentadns cnm()
contabilizaciones de personas. en vez de como medidas de expericncitl
persona-tiempo. el modelo estadístico que se aplica para I;l comproha-
ción de la hipótesis es el mismo que se aplica a los datos de casos y
controles. en los que todas las observaciones tamhién son recuentos de
personas.
Tabla 11.1. Forma elC' I're.'ien1l1ciim elC' /o.'i e/film e/C' ltI.'illS hru1l1s dC' i"cide'IIcia_
eOll d('IIominadorC's per.wna-I ;emllO
miento aleatorio que tiene solamente dos rcsultados posibles .,. e }'. que
ocurren con probabilidades lijas. se conoce como ensayo de Bernoulli.
Lanzar una moneda al aire es un ejemplo. Supongamos que la proh:lhili-
dad de uno de los dos resultados. digamos .,'. sea f1. La distrihución
probabilística del número total de .'(f que pucden ncurrir en N ensayos
de Bernoulli indcpendicntes con una p constantc se cnnoce como distri-
bución binominal. Matem:íticamente. la prohahiJidad se expresa como
N!
Jondc
(~~) es
.\!(N 1!
1 expuesto.
Los IW t casos son. pues. considerados como ;\11 ensayos de Bernoulli
independientes y la distribución de los casos expuestos sigue una distri-
bución binominal bajo la hipótesis nula, con p = N l/T. La probabilidad
de los datos observados bajo la hipótesis nula puede escribirse como:
.i
Pr(nunlero de casos expuestos = (1) =
(\1
al
)( /V
i
~r ) ( IV( ) "
a ~r
-:I
Un valor exacto de p para el Fisher con una cola pucde obtenerse LI$i
.\, ,
{I -1\.1 /'If..T
% = ~--
---
IJ
IMI!\.I!\.CI
1
I
\! T~
L(')s \,al(')rcs de l pllCrlCIl tr(lIlSr('1rm:lrse cn \.;limes dc r) :! parlir <II.: I;I~
tahl(ls dc l(l distrihllción normal esláJIJ~lr.
P(lra ej e.jempl('1 11.1. l(l prob(lbilidad OC I()s d;llns nhscr\.ados I)a.i<) 1;1 1
hipótesis nula puede calcularse así:
1
Pr(42 casos expueslos) = = O.O()ó4
Ejcmpl(} 11.1. C (l.\,(J.~ d(' ('{i1lc{'r d(' m(lm(l .1. f1(.rXml(I-(IIi(J.\ d(' (}hx(.rr{1('i(i,l f1{1r{1
1111~iere,\' C011 11Ihl'rcliI0.fi.\', l'."f1li(,.\'I{1.\, r{'f1('lid(lm('111(' {I m1iltif1I('.\' f1,I(lr(I.~('(If1i(lX d(.
rn.l.o.\, X.l" ml!i('rl',\' (,011 11Ih('r("lil(J,fi.\' 11(1 a\,í (,.\"pli("\"la\ (B(Ji("(' .1' M(m,\'(m. 19ii)
Exposición a la radiaciúl1
(
Si No Total
Cáncer de mama
]
41 I5 56
Persona-año5 28.010 19.017 47.027
~
ANALISISDEDATOSCRUDOS 177
~-- -
como primer sumando. dando un valor dc f' dc ().017 (cl \'alor real es
0.0174 y podria redondearse hasta 0.0018. si la suma se c()ntinuase en
algunos sumatldos milsl. Los valores de f' con dos colas pueden ()btencr-
se-simplemente doblando los correspondicntes \'alares dc ¡> COI1 una.
Los números del ejemplo son sulicientcmcnte grandes c()mo rara
emplear la aproximación normal en la rl>rmula [11.11. lo que es un
cálculo milS sencillo:
4
41 33.35 7.65
x -!
-, = 'V!I~
--
- = 2.08
I (5 ~. 010)(i 9.017)
3.67
~ (47.027)2
:J
\
::.:-~;~
,C1rrf¡1¡
;:' ...:
-~.
il Pr(a casos expuestos y h casos no-expuestos) =
':;--c-
N t
)( ' No
--.
Para calcular el valor de la expresión [11.3] para una tabla particular de
~'~.~:~
. ü 2 x 2. es necesario disponer de un estimado de !'. Por lo general. I' se
estima directamente ;1 partir de los datOs. I.'mple;1ndo la proporcii>n lotal
~:.~..:~(~..
:;c~
de enfermedad a partir de los márgenes de la lahla. M I¡T. Sustituyendo
g p por ¡'vfl/T da
I =
I N 1
)( ¡Vn'
, (I h J
(¡\.f,iT}'\t,(,\f,,/T)¡\tn [11.4]
:¡
,~;
;.:'
una prueba exacta basada en dos distribuciones binomiales independien-
tes, siempre que quede claro cómo se calculan las desviaciones respecto
I del estado nulo que son más extremas que las observadas. Asumamos
que se observa una asociación positiva entre exposición y enfermedad.
Asumamos también que a y h son el número de casos expuestos y no-
expuestos realmente observados. Para otras posibles realizaciones de los
datos, en que el número de casos expuestos excediese a a. mientras el de
no-expuestos fuese h o menos. la desviación total respecto de la condición
~ nula es más extrema que la que se observa realmente. De modo similar .
si el número de casos expuestos es a. pero el número de casos no-
c~~~
expuestos es menor que h. de nuevo la de.~viación respecto al nulo sería :,~'¡t~:
I más extrema que la realmente observada. Las posibilidades precedentes
son fáciles de clasificar. pero. ¿.qué pasaria si el nllmero de casos expues-
tos fuera a + I y el número de casos no-expuestos. h + l ? i.Qué pasaría
con otras combinaciones como a + l y h + 2? Es dificil decir si estas
B posibilidades representan situaciones que se apartan del nulo en mayor ~:]j1it
medida que las observaciones reales. Para decidir definitivamente si una ¿
desviación es más extrema, seria preciso evaluar una medida del erecto
~ para cada resultado hipotético de los datos y compararla con la medida
del efecto calculada a partir de las observaciones reales. Es interesante
recalcar que la decisión acerca de qué resultados ,c¡onmás extremos de-
~ penderá de la medida del erecto que se emplee.
.Para ilustrar lo que decimos. consideremos el ejemplo 11.2. Los
datos «observados» indican una diferencia de riesgo estimada de 0.05.
D
:!il;:;;:¡::
i:¡~;¡.~~:)¡;::~~~;:~:
:..:::.~:;.:;; .;:::'~:;.¡;:::
::.~~::.;.~;::':~,
~
\:¡:;~::
.:.;;:\;.~~\~
::::::,:?:s;
:;1 ."
"-,"'
EPIDEMIOLOGIA MODERNA
180
1 I § I I
I i ~ 10--
1 ,...
...I S: v. .". c
~
~
;
r-.¡ : ~
c
.C Z
c
I
I
!
I .oc~
1
c'- rl
-! u I
~ ; .~ , 0
I::
~>1::.'
-I
~
-I
; ("; ,
i
~
"'
rJ
-I
I t- ---
---
]
...I --r-1
t.: I c..
..., I i u.;
., ,
~ I
.~ !
~ i I "'
.-.I - I -c
I
,
~
~ I -r;
"'"' I: ' c..
-\C' 1- ,.'.' :=:-
~ ~ i I >-: -
1- I ~
~ .E
t:..~ c o
::: .:: , .c I z .,. v, -.o
.I:: -I .-
c c '..1
.--c: u
.~ ... I I 0
.~
-c ..
~~ I c: I ~
~ > o ~
1 -."' I
-~ I
~ c I i ~
~ I \C -::- ~,
j
--I c.
~-!::. o< 1
..~ I,., ,
~"' --,
::: : :
:-~
--I
... I .I
1
~ ~ I .9 I
~~
...~
I ~
~ I
I:::: I ~ ~ V")V")c
~~
~
:: t:.. I I t,)
- C:ic.IVV)C>-: I
...::
-~
~~ I
c:
>
~
I z
o I
I
~
f
.
Ir, -'..1
C-,.., ! ...;.;
.-=
~
\,.¡ ... 1
.o
~
c
I 0
:
"
I
"
v: '.
..
.-o
.~ -
c
-c:
...1'"'1 I v:
r,) 000
='
c..
I --r-1
I ,
.~ I
~ I I X ¡
"' I u.; ¡
C I t
¡
~
Q
o
~ C(¡
- "' ~
- GJ .-,..
.-o ~
1- Q/) --
Q
"' c:
Q.
GJ ~GJGJGJ
.~ ;..
E
GJ ~~GJGJ
.~
~
I I/)
cu~ "'-
c
"'-
C': vcC':
"' c: .Ü ~ ~
.o
.-tJ
u c:
1- .0 .0
C'; GJ N ¡o,;
E~C';~
.=0~~
~ c "'
uZ UJ
~
~':
II'.
i~
~
~: ~~,~:;k~1~; =-
.:'~,.." ~
'c
'.'.'.~~
,':.."/'""",
..
~
;r:o~~~;"E~J;R~,~
.: --.,0,- .::.,~--:
t\\;\rf:ti;i:
;,:;;
~- -~,.J~;;-:;;;
:,..:;\;:::;:~'~
..:;; "
una razón tic ric~l!o dc 1.l1 \' una ra7:ón Je \"cnl:lja dc I..:..:.. Las \"ari:lC.:i()-
nes l v 2 son ()tr(~~ dos posible~ resultados de los'd~ltos. prc~umicndo 1.1ue
se están e~tudiClndo el mismo númcro de su-jeto~ cxplle~tos ~' !1()-I.:XpUCS-
tos. Emplcando I:l metlida «difercncia dc ril.:sgo» p.1r.1 dctermin~lr !.lS
desviaciol1cs rcspcc!O dcl Ilulo. la v.lriaci()n 2. pcro no a~í la 1. si es una
desvi~lción m:i$ c.xtrcma rc~pccto al nulo. El11plc:lndo 1.1 mc<.1id:t «ra7()11
de riesgo». l1i la vari:tción I ni 1.1 2 i() SOI1. P~lra la medida «ralÓI1 dc
D l ventaj.1». lo son ambCl~.
C.1d.1 UI1.1 de l~lS difcrentes medidas Jcsignan ~1UI1 conjunto tlistil1to
B
; . de resultados como mils extremos. Esta ;Imhigücdad hacc problcl11.itico
L.
r
el empleo de dos distribuciones hinomiales indcrendientcs como mo<.1clo
para la comprobaci()11 dc hip()lcsis a r~lrtir tic una tah!.1 tic .:. x ~. Otro
:~Rd [ problema que ticne cl uso de 1.1Sdos bil1omiaJes cs cl gran nlJl11cro de
,1 rcsultados posiblcs. Por cjcmplo. si iV I = ;VII = .:.5. hay 676 resultados
,
,"
posibles para los 1.1:1!0$ [(N, + I) .( Nll + I )]. Para simplificar los
cálculos. pue<.1e hacer~e un.1 asunción rel:lcionad:t con :Imho~ prohlema~.
~~';
c', I La a~unción para lo~ d~ltos dc set!uimiento () de rrevalencj:1 consislc en
que el l1úmero total de ca~os re~llmel1tc ohser\'adoS sc 10m:1 como c()ns-
tante (M.lntel y 11ankc~'. 1971). P~lra d:I!()s dc C:1so-contr()l. las dos
I distribuciol1es hinomi.llc~ se rcficrcn no:1 I.IS series dc expuestos ~. 110-
ex puestos. si 110 ~I 1.1Sseries I.lc caso~ ~' con I rolcs ~' 1.1 corre~pond icn tc
asunción C.:s1.1UCc.:1¡tirmcro !()I,II Jc SU,iel()S CXP\ICStOS I:S consl:lnlc. L()
que esenciall11cntc hacclt cst:t~ :Isunciones ~~ /ij.lr !0<.1()S!()S tot.\It:s m.lrgi-
n:1les de la t.1bla Je 2 x .:.; por lo t~lnIO. si la ccld.1 (I aument.1. la~ ccl<.1:1s
h y c deben c:1d.1 una disminuir en un.t canti<.1:It1 cquivalentc. y la ccl<.1a (I
aumentar en un.1 cantidad il!\lal. Una VCl m:1nteni<ios C()n~t.1ntc~ tOdoS
I los márgenes. sólo hay una v-:1riable ~1Ie:1!Oria a de~cribir: la \'ari.lcil)n en
cualquier celda de la I.lbla de 2 x 2 con m:irgenes !otales fij.ldos e$l:í.
pues. concatenada con la vari.1ción concomital1te de cad.1 una de 1~ls
D otras casillas. H.1hitualmente. por tan!o. la cuestión ccntrCli \'icl1e :1 ser
simplemente la casilla a de la tabla. que e~ 1.1quc se tom:1 como \'.lri:1ble
aleatoria.
D La asunción de que todo~ lo~ (otalc~ m:lrgin:1lL's dc una lahla de 2
x 2 estén fijados. puede ju$tificarse
para enfocar el problema (de la comprobación
metodológic.1mente como me<iiacit)n
dc hipótcsi~) direct.1mente
r~r
sobre la asociación existente entre expo~ición ~' enfermedad. En jerga
H I
fi binomiales
parámetros.
independiente$
1.1$proporciones
requiere que se delerminen los valores de (1().\"
PI y po. en t.1nto quc el problema analítico il
puede reducirse a determinar el \'alor de UI1.1 medida única. Tal mcdid:1
es la r.1Zón dc vent:lj:1. igual a PI ( 1 -1')/[!'11( I -PI )]. quc e~t:i por
~ completo detcrminada por el valor de la celd.\ a si los to!.lles marginale~
se toman como fijo~. Comprobar que se prnduce un alejamiento de 1.1
razón de ventaja re,<;pecto de la unidad es equi\'alcnte a comprohar un
alejamiento de 1'1 con respecto :1 1'0. ya que la condición nula de PI = 1'11
~
es equivalente a una razón de ventaj.l de un.1 unidad. pero fijar los
n
~.I
u
'::~:~
:"'.~
;;t]~i~J:
ti~i~~-~
,,'~
.~1::
.~.i~i~~~:¡::;~;i~;::f;
;;J~1:;:;~:f..;~:;;:,.::;:;;;;:(.
i!!;,~¡~;
j~\t~;~\~~~~:rl:
I~t
.~
1 La probabilidad de seis casos expuestos seria 0.0028: para siete C~\SOS
expuestos. 0,0002 y para el resultado más extremo. ocho casos expuestos.
0.000009. El valor total de p con una cola, calculado segiln el metodo de
Fisher. sería de 0.0748 + 0,0185 + 0.0028 + 0.0002 + 0.000009 = 0.096.
El valor medio de p con una cola sería 0,0374 + 0.0185 + 0,002R +
0,0002 + 0.000009 = 0.059. El valor medío de p con dos col:ls. t:lnto del
Físher como de la media P, podría obtenerse dobl~lndo el valor de la p
D de una cola.
Para este ejemplo, el modelo hípergeometrico requiere el cálculo de
sólo cínco probabilídades. De haber empleado el modelo de las dos
r~\ dístribuciones binomiales independíentes. con 390 casos y 1.254 contro-
les como las dos seríes independientes. huhiesen sido necesarios por el
contrarío miles de cálculos para dcterminar qué resultados eran iguales .-:-:.
:!;,
¡.'
t1 de extremos o más. y luego habria que h~lber c~llculad('1 tambien la
¡,.
.. probabilidad de cad~l uno de estos resultados. La simplífic~ldor~l ~lsun-
ción de la distribución hipergeometrica. que fija todos los totales margi-
;~';
~
-:-,
I nales. reduce enormemente
Lo razonable
la complcjidad
de I~l asunción
de los cálculos.
hipergeometrica. incluso para datos
"'~:~.
tales como los del ejemplo 11.3 en que las frecuencias de las cuatro
celdas son pequeñas. se hace evidentc al comproh;¡r sus rcsultados con
I
~~
:::;:,;;:r~;~:i~;:~~ -~=:~.~;.:
..:~~:..;.,1;:,., ;.;~;, :":"
""i:';:t.::: ;;~:¡¡~;¡:;:;:
:¡~¡¡: :;,.¡,;
..::~~:.:::~:;
~~~J:. !;
~ .;,;:~:;:':;*,,:
:~(::~~;:;:.~ :~~:,i:~:;
~
[ 11.6]
~!-!..)( ~ ) r -1- + ~
, T T LN1 No
z = 7]
f]
1.¡1 Ill¡llliplll¡tcii)11 algcbrai(.;a ue la ecuacii)11 .7] da una expresión casi
i(ll'lllic;I¡11;1 lIJ.6J:
a -N.Af.IT
.~]
J~~~
L" lllliL." dirL'rcncja elllrc ItiS dos r()rmul"s cs Iti T- 1 dc la cxprcsión del
JCII1111Iill;IJ()r dc la ccut,ciól1 [11.()1. C.¡'ICsc rcL'mrlazt\ por Tel1 la [11.8].
(.I)m() 11il1~una dc It\s dos r¿)rmlllas cs .'rlict'ble a mel1os quc T sea
..Jl"'Jc cl rulllo .dc visla rr;í<.:liL.() aml)as son jdcl1licas.
hllhicsc l'lllrlL';'dl) lilla rrllL'I);1 csl;,(lísliL.a asjlll(!lica para calcu-
ANALISIS DE DATOS CRUDOS 185
-~-
lar el valor de p con los datos del ejemplo 11.3, habríamo~ obtenido,
'empleando la ecuación [11.6],
..
lo que da un valor de P, con una cola, de 0,040. Como cabría esperar, el
vaJor de p resultante de la prueba asintótica es más cercano al valor
exacto de la media p que al valor exacto del Fisher (véase Cap. 10),.pero
la aproximación no es muy buena. Obsérvese que bajo el modelo hiper-
geométrico sólo hay nueve resultados posibles para la celda a; evidente-
mente, el número de resultados es demasiado pequeño para que la
aproximación sea válida. Una regla de andar por casa y que se emplea a
menudo consiste en que la prueba estadistica asintótica debe aplicarse
solamente cuando la expectativa nula más pequeña para cualquier celda
de la tabla de 2 x 2, basada en los totales marginales, sea mayor que 3.
No obstante, si hay alguna duda sobre lo adecuado de esta aproxima-
ción asintótica, lo mejor es evaluar exactamente el valor de P.
ESTIMACION PUNTUAL
{1 ¡,
IRD = '::\1-;- -~
IRR = a/NJ
a h-
I
RD=N:"-¡-::
RR=~
h/No
Sll~I,\(.I()N DI INTI:RVAI.O
[ .91
üNo
mR= [ 10]
(I -ü)N.
Ii ~:cf~ll!
."C,-;,:~:::;:. .
..,
~
Fisher. podri~IJl C~III..'\lI~lrsc :1 p:lrlir tic I~I,'; I.:CU~IL'j(),1C,'; r ,1)~' .101 L'(\I11(1
:\
"l
slgUC:
~"
0.05 = -!J).~h k
¿1 I
k ,= .¡ I
~ (,
().t)5 = \ ii I~'.
j, L..
... k:.¡2
u Si se c¡¡lcul¡¡11 los limitc.'i L'11h:lse :11 \,:1I{)r L'X:ICt() ue. p UI.: liJ m~{li¡¡
cntonces 1,1SCcu¡¡cj(')nc$ :1 res(')lver s()n:
P.
.~I,
( '5(' )
9
) !.lll ~
0.05 = ::;- -1!).'(' -k
.~-
.:-:.. k
..~- \ ,
.~: y . ." ,
,~
0.95 = , + l()~h k
t ~::.;:::.
~.;;;.."~':
Los límites de confianza slJrcri()r c infcri()r ;ll ()() r()r I()() uclermill,ld()s
por las anteriores ccuacjones has¡¡das en 1:1 mcdia P. -'()Il !J = ().62h :. Ii
= 0.8205. corresp()ndiendo a lR.R = I.J4 :' mR = J.I().
.;~~i;"
::;:~;
DATOS DE IN('If)EN('IA ,\('tfMVL\DI\, Si los del1omil1:1dores SOI1 re- ':::~1;;i'.
cuentos en lug.1r de unidades persona-tiempo. un interv:llo de confi:lnz:l '..:~11~;::
,:;;\~,::
p¡lra la diferencia de riesgo podría c.1Icu¡.lrse t~()ric:lmente .1 p:lrtir del .;.::~:
modelo dos-binomi(ll, El c~llculo. no obstante. implic:lria 1:1 delermil1a- ':;:-;:
ción reiterntiva de 1.1 prob¡lbilidad eX¡lcta de 1:1 cola h:l~ada en dos
binomiales independientes y. por tanto. no es r:icil de ~.iecutar,
Los límites de confianzn para la medid:l de la r:lzón de riesgo e."t¡in
rI
t,
,- también sujetos a la misma dificultad de compllt:ICi()n. porque cl \';llor
de dicha medida depende del nllmero total de C:IS<)Sy requiere cl u~o dc
.:~~ii,
dos binomiales independientes, Si. por el contrario. sc ernrle.1 lit medida
de razón de ventaja para 1¡1e$timación. amho~ mi1rgel1e$ tIc 1.1tahla Je 2
x 2 pueden ser considerado$ fij.1dos y lo.'\ c:ilculo.'\ ~e sirnplilic:lri:ln
mucho. ya que la cit.1d¡1 medida de la raz{)n tIc vent:lja es independiente
del número total de ca$os. Corno la razón de ventitja e$ sol.lrnente una ,c::¡i.~~.:'i~;
D
,---c".-
~
:;;,::
...
l
Ni\,ci tic ;lnlicllcrp()~
Di.lrrca 7 12
9
a
2
No di.lrrca
TOlalc$ 16 14
n
I
!
,
para los límites J~ la media ? La solución dc las ecuacioncs que
anteceden puede consumir mllcho tiempo. ~'a que cada repetición en el
,1
r'
;.:~~
~..," Los datos del cjemplo 11.4 describen los resultados p:lrci:llcs de un
~~:'; estudio de seguimiento. e\'aluando el riesgo de p:\decer diarrea en niños
sometidos ,\ I:\ctancia m¡,ltern:\ en BangJ:ldcsh durante un periodo de
once días. según la detcrminaci()n de varios títulos de ,Inticucrpos cn la
leche del pecho de sus madres. Un valor exacto dc ? dc 1:1hipótcsis nul~l
dc no :1sociación. da ?II) = 0.02 p~lra el valor de ? de Fisher ~. ?iII =
0.01 para el valor de 1:\ medi~\ ? El estimado del riesgo rcl~ltivo ~I rar1ir
de estos datos. comp~1rando cl grupo expuesto :1 titulos ~lltos con cl
expuesto :1 títulos bajos. e~ (7/16)/(12,!14) = 0.51. El de la razón de
ventaja dífiere notablemente de est¡,l cifr,l. dcbido ~I que los riesgo~ ~on
;.¡::.
muy ~lltos: el cit~ldo cstim~\d() de 1:1-razón de ventaj:1 es (7 x :?)/( I:. x 9) =
= 0,13. Se puede calcular un íntervalo de col1fi~\nza exacto p¡,\r,\ I~\ r,lZÓI1 de
ventaja empleando las fórmulas [ 11.11 ] y [ 11.1 :.] p,\ra obtener los limi-
tes de Fisher. Los límítes de confianza ~ll 90 por 100 son 0.0 17 y 0.75 1.
obtenidos por cl método de solución de ecuaciones de ensayo y error de
l¡,lS fórmulas ~lntes citad,lS. Si. por el contrario. se dcse:\scn los límites
exactos de I~I medi:\ ? podrí,ln ohtenerse :\ p:lrtir de las ccuaciones
[11.13] y [11.14] y .~on 0.0:?5 y 0.608. Esto~ límites ex~lctos de la razón Jc
ventaj:.\. sin emb,\rgo. no pueden ser empleados como límites de confian-
,:jt~~::~::-
za de la razón de riesgo. puesto que con estos datos. la razón de \'entaja
~ es una pobre aproximación para la razón de riesgo.
8
La eslimación aproximada dcl illlcrvalo a partir dc Jato~ de ~cgl1imiclllo
brulos es direcla.
~ DATOS DE TASAS DE INCIDEN('IA (Pf:RS()N¡\-TIE/IIP(»). Col1~iJercmo~
primero los dalos de tasas de incidencia con denominadores persona-
liempo. Se pueJen estimar do5 medidas dcl cfecto: diferencia de t:l~a~
u y razón de tasas. Como la medida de diferencia de tasas tiene \ll1a
o
~.
~--~---,-- ..'c~.,;,~-~
,.:,: ,
:.. -,'"
:;:;-,
:. :t~¡~\;;:;:
.:;: -.¡;¡.,
:.~.
.:;~.::~;i~:~j [:::;¡::;.:¡.¡;~ifu::~¡::i~[¡~~:~
~
ANAliSIS DE DATOS CRUDOS 193
/!-;!
~~Tb
De nuevo, empleando los datos del ejemplo 11.1, podemos estimar la
razón de tasas de incidencia como
41128.010años
= 1,86
15/19.017 años
:,645.jl/4i + 1/15] =
exp [III (1,86) i 3,0
Estos lírnítes concuerdan bien con los lírniles exactos al 90 por 100 de la
media P, calculados anteriormcnle corno 1,1 y 3,1.
Una forma altcrnativa de haccrlo podría ser ernplcar la fórmula
basada en el test
RR'I:1:ll1.)
en la cual X tiene un valor de 2,08 para los datos del ejemplo 11.1.
Utilizando Z = 1,645 para limites al 90 por 100, el abordaje basado en
dicho test da un intcrvalo desde 1,1 a 3,0. que igualmente está en
excelente concordancia con los limites exactos de la media P.
:;;;~::~;;¡:i;:;:;:;:~:":.i;~,:.
.:".~.'-:'~::...~,:~\:~~...
¡::";,:'
~.::.~i;
!;a!,i~. .:::
i'-
'-"j
De nuevo. los dos métodos aproximados par~\ I~\ estimación del iI1Icr\'~\lo
de confianza concuerdan bien.
Si la inferencia a partir de los datos de seguimicnto con dcnominado-
res de recuento tuviese que estar basada en la razón de ventaja. en vez de
en la razón de riesgos. entonces la fórmula par~l la desviación estánd:\r es
(Woolf. 1955)
:.
:;~;
;!~¡:
..!:f~7~
~
;,:"':...' ,.;..~,..,
~~f;~i~i\\~@
¿::.;;.:
R = tl(1
h('
Rcl t;~¡1:1
o exp {111(R ::tz SD[ln IR)]:
donde
In (R = In (3,24) = 75
,~!~. ¡~:
J
ANALISIS DE DATOS CRUDOS 97
Como era tic csrcr:tr. I.'St()S rcslllt:t(I()s CnI1CliCr(I:\ll ml.i()r C()11 I()s límitcs
exactos de 1.\ mctii.\ ¡> qlle cnl1 los límilcs CX:tl"\OS tic I;is/tcr. L.\ :trro.xi-
m:\ción 11() cs rerrcct:\. rer() t:lmr()C() cs ticm:lsi:IJ() r()hrc. c()l1siJcr:\l1ti()
que dos dc I.\s cu.ltro ccldas tic 1.1 t:lhl:\ 2 x 2 r()SCCll rrccllcl1cias ()hscr-
v.\d.\s de s()I() cu.\tr(). El mct()Jo tic C()rl1ficlti J:I lIn il1tcr\,:\lo al ()O r()r
n tOO de t.t a 9.R. idcJltic() :tl ticl :thord:t-jc COI1 h:tsc CI1 c:1 tcst.
u
~
,'1 REFERENCIAS
Boicc. .J. D.. ;ln<.1 M()n"nn. I~. I~. IJrc:l!;1 (;:lnt:cr in \\,omcn :lflcr rl:rl::lII:(1 I1l1-
orosc()pic cx:lmin¡llinn!; ()r tJ1c chcst. J. IV(lrl. (.clll(.I.r 111.\"1.1()7i:S9:~~.1-X.1~.
Br()wnlcc. K. 1\. .)'llli.\"li("(11 71,(.(lr.. (111(1,\I(.,h(I(IIII(II.'.. ill .\.("i(.I1("(.(m(I,:i,l.'i//(.I.rilll.'.
Ncw y ()rk: Wilcv. I ()(,5.
Cornlicld. J. 1\ ~t:lti~tit::11 pr()hlcm :lrisin~ rr()m rClrOSrI:L.ti\.c stlluil:s. 1,1.1. NI::-
man jcd.). Pr(II.(.{.(lil1l.'.\" ¡"/,i/"(1 B(.r".(.".I. .)../I1"IIXill/I1. V()I. .J. IJl:rkl:lcy: Ilni\.cr.
sity of C:llir()rni:1 Prcss. I ()5(,. rr. I :l.5-14X.
Fishcr. R. 1\. TJIC I()!:!ic I)r inúllt:li\,c inrcrl:ncc. .1. I~. .)'(iI. .\i/(... Sl:ril:s :\.
19~5:9R::1.9-54.
Gart. J. J. TJ¡c comrari!;on «< rr()r()rlion~: ;1 rc\.il:\v ()f "i~,1ifit::lllt:C II:Sls. \..(1'11i.
dcncc inlCrvuls unJ uujllslmcnlS for str:llilit::lli()n. I~{.r. 111,. .\i,ll. 111\1.
197J:39:I~H-I(,l}.
GJass. R. J.. Svcnncrholm. ..\. M.. .<;1()II. IJ. J.. CI ul. Pr()lcclinn ,I~aill!;t (;h(lll:ra in
brc:1Sl.rcd childrcn by antihi(ltics in brt'¡I~t milk. .V. EI1f,'I. .1. .\1(.(1.
1983:308: 1389.1392.
Mantcl. N.. and Hankcy. B. F. Pr(lgrammcd analysis ()r a ~ x;. contingcnt:y
table. ..f/11. .)/{11. 1971 :25:40-44.
RotJ¡man. K. J.. and Roicc. J. D. E"i(I('/I1i(II(1.f,'i(" ..111l1l \"i.\" 11.ilh II Pr(I.f,'rl/ll/I1ll1hl{'
C{llc/(llIr(1r (2nd cd. ). Brooklinc. M ¡\: Epidcmiolngy Rc$()lirccs 1nt:.. 19X;..
Rothm:1n. K. J.. Fyler. D. C.. Goldhlatt. ¡\.. et ;11. Exogen()lis h()rmones and
other drug exposures ()r childrcn \vith congcnital hcart di~easc. ..//11. J.
E"i{ll'mi(ll. 1979: 109:433-439.
Shorc. R. E.. Pa~lcrnack. n. s.. and Curncn. ~1. (j. 1~l:lalin!:! illnllcnza 1."1'iuc-
mics I() childlloo<.1lc\lkcmia in tllm()r rcgi~tric~ \Vilhnllt ;¡ <.Iclincd pnrUlali()n
~ basc: 1\ I:ritiqllc wilJ¡ 5uggcsti()ns r()r improvcú mcthod~. ..1/11.J. E"i(".,lli(ll.
1976: 103:527-535.
woolr. R. On cstimating lhc rcl:llion hct\vccn hl<.)(,d gr()lip anú Llisc¡I$C. ..1ll1/.
H/(11,. G('11(,t. 1955:19:251-253.
u
¿ .
~... ~::x"~"'.:;.':'¡¡..;.
v ~.~.;;... ..
;~:
'I ,~ .f~
12. ANALISIS ESTRATIFICADO
~~ ~
Ahor~1 bicn. ~i I~I modific~lciól1 dcl ercCI(). en ~lI .,\enlid() mils amrlio.
e,c; un~1 c()n~lanlc de la nalur.lleza. n() rucd(' c()rre~r()lldcr ~l nin~lln:1
rr()ricd~ld hi()I()gica. r()rqllc hay un a.,\rcCI(\ dcl <.:()nCCrl(\ qllC 11(1cs
ab~()lul(): en ~ll conlexl()
e5reci(jcar
mil'C; gcncr.ll. inclllye cl m()di(jcar
quc medid¡1 del mi~m() e.<;la m()dificad.t,
un CrCCI() .,\i11
PuC.<;l(1quc h¡ly dos
1
medida,c; dcl ereclo. la5 dc dirercncia y la,c; dc ra7,(m. qllC ~e li~an
c()mÚnmenlc el1 eridemi()l()gja. ~I~í c()m(1 ()lr:l'C; qllc ~c ll.,\:ln c()n mcn()s
rrccllcl1ci:l. cl c()ncert(1 dc m()di(jcacii)11 dcl Cr(..rl(l. ~in e~pcci(jc.lci(\ncs
m:i,c; ampli.I$. e,c; dema~i~ld() amhigll(1 com() r:lr:1 .,\cr llljl cn laJll(1 lJli(,'
de,c;crirciól1 de l.1 naluralcz.t.
En I~t fit!ur.1 12.1. 1:.1edad rlledc ~cr c()l1~idcr:ld:1 c()m() m()djfic:ld()r:1
dcl erCCl(1 dc eXp()5jcjón. plJe~l() que la djrcrcnci.1 dc la5a~ dc incidcnci:.1
cnlre expue$I(),c; y no expue~los aumenl.1 c()nr()rmc allmenla 1¡1edad. ror
el C()nlr~lri(). I~I razón incidel1ci~1 enlre eXrlle,c;I(1~ r:lrlid~1 r()r incidcncia
enlrc n(\ expue~I(1.'.;. cs consl~lnlc .1 lo l:.lrg(1 dc 1;1mism.l. ¡\sí rlICS. 1:1cd;I(1
m()difica el ereCI(1 dc exp()~ición c()n re.<;rect(1 a 1:1 medid¡1 del CreCI()
«direrencia». per(1 no con resrcct()
col1trari~1 se de~cribe en la figllra
a la medid.1 «razón»,
12.2. L.I dircrellcja
Lcl siluacii)n
ell I.as t~l~as dc 1
incidenci~1 enlre expue~t()~ y n()-expuestos e,c;c()n~t.lnlc .1 I() larg(\ dc 1:.1
edad. pero la razón incidencia entre lo~ eXpUeSl()S rarlida p()r incidcncii1
el1lre 1()5 n()-eXpueslos. dismil1uye con ella. E~to~ diagr.lma5 ilu5lran r()r
qué 1.1modific<lción del erecl('1 dcbc descrihir.<;e. sól() en relación con un;1
medida especjfica del mismo. Si e51á au~enlc re5reCI() lant() a ):.t medid:1
direrenciC\ c()m() a )a medida rn7.Ón. dcberil e~lnr rresenle c()n re5reCl() ~I :]
las olra5 medidas. a meno~ que )a la~a de enrermedad enlre 1()5 no-
exrue~los carecie5e de a~ociación c()n cl p()lencial m()dificad()r dcl CrCClO.
"O
~
j
"O
C>
E
Q,
-
c:
Q.'
C>
"O
~
"ü
c:
C>
"O
"ü
c
J
EDAD
Fig. 12.1. J1Ici(IC'1Icia tiC' la f'1{f<'rlll('(I(I(I/,()r ('.\.pv.\'iCi(i,1 )" ('tllId. i1l(li('(mtln 1(11(/
ra:(i,l tI(' in("iti('11('ia ("O1l,\,(al'((' ('{1)1 1(/ (,tI(It1.
..
~R:
I il
,t
'1
n
~
~
i..- ~.
e.
~.
~..
n ~~
Fig, 12.2. ¡/Il'id('II('i(/ d(' Itl ('nj('"II('dtld 1'(lr ('.\"I'(/,\'i('i(jn l' (,dtld. inr!i("tIIld(1 II/1t1 ;.
ii
((ile,encitl ('on,\'lon/(' de ;'Irid('ncin ('(1/1 la ('da((. "
;
Este C:lpilUlo presenla las e.c;tralegias analilicas rundamenlales pt\ra
hacer rrenle a la conrusión ya la modificaciOO del erecto en un :tnnli~is
estr~tificado. Las inlerpretaciones biológicas y de .c;¿\lud pública de la
I.
citada modificación del erecto se consideran en el capilulo 15.
f
EV ALUACION y CONTROL DE LJ\ CONFUSION r
,
~
!!
:,
La confusión es una distorsión en un,l medida del erel.:to. di$tor$ión que ¡;
resulta del erecto de otra v~lri~lble que est{l a SU vez (lsoci~ld~l con la
exposición que se estudia. En el capitulo 7 se la definió y se discutieron
las caracteristicas generales de los factores de confusi()n. Recordemos
que un factor de confusión debe:
f
I. Ser un factor de riesgo de cnfermed~ld entre los no-expue.<;to$.
2. Estar asociado con la variable de exposición en la poblacic)n de
la cual proviene el caso.
3. No ser un paso intermedio en el camino -causal entre la exposi-
ción y la enfermedad.
Los datos de caso-control del ejemplo 12.1 demuestran lin efccio de
confusión por parte de la edad. Si se estim~l a partir de los d~ltO$ brlItO$
el erecto de los anticonceptivos orales sobre el rie.<;go de infarto de
:ttff;" ;~~¡~:.
~
...;...;,;r;~~;..';'...;';;;;; 'c'
".,'~-'
"~m'.~~¡ .,
,,{""':-:...~.;,..
'~::1:::;~~;;ili rgI~~~
,
~.
~'ff}f-
1
202 EPIDEMIOLOGIA MODERNA
Ca~o~ dc infartC' de
miocardio 21 26 lti R~ 39 114
li ., 24
Controle~ 59 95 154
Rnzón dc vcnt:l.i,1
e~timadn 2.8 .:..~ :?.2
,. ..." ~ ...
.::.-:"'~..~.t~ ~
.~
"..~..;;:
.~.
; .j,~t'm¡¡.,i':,~¡,;,lg ~.:~~::
1¡~lt
: :;':-::
;:~\;:!. ::~~~
:;:~~:'; .:~;~;:~:t;.~~j:t"~.~:
.::;{:~'::?f~.
l
ANALISIS ESTRATIFICADO 203
c. .
];:{~1~~'
~
~ !1t :'ir~J~¡ --"
204 EPIDEMIOLO(jIA
MODERNA
é$te no confundido. (Una excepci()n $eriil li\ il1hahitual ~iluaci()11 CI1 lJlIC.'
el conocimiento anterior tiene rnii$ pe~o quc 1¡\ evidcl1cicl de 10$ d<()~
(Icerca de I(\ confusión, corno sc disculii) CI1 cl CilpiIUI() 7. () CI1 lilS
ocasiones en que se juzga que el facl()r ron e~a r()tenci.llidad es un
e$lahón en l.1 cadena causal). Esta Cornr.lr.ICiún rcvcl.1 dc forrn&1 CI&lril v
sin arnbigücdadcs la magnitud dc la confu~ii)n. quc cl invc~tig.ldor pllcd~
luego torn.lr en cucnt3 de cara a postcriores (lnillisis o cl illforrnc dc los
rcsult(ldos. Más aíln. si fuc~c 1lcccsario. podri.1 Ilcv.irscl()s .1 c.lh() .11
ticrnpo quc sc controlaban otr()s factores.
¿ III
en donde
JI¡ =
(varianza del estimado del erecto en el estrato i)
:;~::.;~~;::;;:::ii.
.,~:;:;..; "i;~::i::~j::" --'%.:,:.:;':' ".:;~;
';.~: :..
:.~'~':;::~¡~;?::;j:
,',;~~::;~~:w
;r¡:) ..¡~;:.,i.:
~~.i1iEí.
:;;;;:.;~~~:;;~;:;
'".,'«.x-:.
::~¡
i*~~~~t~~
n máxima probabilidad.
proJuce cl e.c;limaJo conjun(ado
implicn I~\ .c;olución dc una .c;erie de ccllacione$ y
sin dctcrminar
especifico.c; por cstrato. Dicho ilbordaje dc m~ixim~l pr(1bahilid~\d
cxplícit~lmenlc los pesos
plledc
.'icr entcndido c(1mo un pr(1Cc.c;o de pOndcr~lCii)11 en ~I que los pes(1.C;
l
f
"
e.c;tuvje.c;en implicjtos cn 1~ls ec\lnciones que c()nd\lccn ill cstim~ld(1 pun-
lual. L~I dcscripcii)11 110 cs c()rrccta lileralmcntc. plICSt() q\lC. por c.icmplo.
l1ingún mcc~\niSmo dc p()nderacj()n r\lnci(1l1aria .'ii lin(1 de los estim;ld(1s
e.c;pccílic()s por cslr:lt() rllcsc inlil1ilo. cn tanto 4l1c cl ah(1rdaje qllc n(1.C;
ocupa si pr()dllcc cn es{a sitlltlcíón lin re.c;lil(:ld() linil() apr(1pi~ld(): en
rigor. 1~1capacíd;ld para ohtcner elicícntcmen{c la mcdi~1 dc cstjmad('1s
e.c;pecificos por e.c;tr~lt() qlle r\lescn err;llic()s clland() lo.c; dat()s son
rclalivamclllc e.'iCa~()s e~ llna dc lilS m;ly()rc.'i vcl1la.ias dt:1 ah()rda-ic dc
milXima pr(1bahi¡id;ld. O{r() grtlp() dc cstimíl(l()s c(1l1jlrn{ad('1s. l<.ls Jl:
Mantcl.llacl1~zcl. posecl1 pcSO~ cxplícjl()S imhllido~ cn la.'i r()rm\lI~I~: son
l(1s mils rilciles dc c;llc\llar y. c()nsidcrand(1 q\le S\lS pr()picdades estadis{i-
cas s(1n c~lsi t~111bllcna~ c()m(1 10.C;dílicilc.c;-uC.C:llc\llílr c=stimadorcs de
mtixima probabiliJad. c()nslituyen rrec\lcn{emCnlC el mcloJ() Je clección.
En las siguienes secci()nes se pre.c;cntan lo.c; 3 abordajes ~lnleri(1rcs del
pooling: el directo. lilili7.and(1 pcsos cxplícit(1.C; inver.<;amentc pr('1p()rcio-
nalcs ~l los cslimad()$ cspecífico.c; por cstral() dc la vari~ln7:~\: el de la
máxima prOh~lbilid~\d y cl M~lnlel-Haen.c;zcl. Las rórm\llas especifica.c;
utili7:adas parn delcrminar lo.c; c$timadorcs c()njllntados dependcn Jel
lipo de d~ltos quc .c;e (engl\n )' dc la medid~l dcl ereclo q\le se eslé
" cstimando.
M
.Es un tcrminn inglc rcrn hny ya dc u~n gcl1cral: .;igl1ifil:a "cn 1In Jl.'pc",ilcl
~
comítn». «conjuntado». (N. tit'/ T.)
Im
~:
.:;::;;'::;:.;.:;;:';::~':
..".::~:0;;~~;?:::.
;";t:
\&~%J~~~\:
1~:~~J~
~t:
',;~~,!
Tabl:l 12.1. Fnr",a d(' !,r{'.\"('fllari(;fI (1(' (1(1'(1.\" m. 1n.\ti.\ (It. ;,,(.;(I('fI('i(/ (.(1"
d{'nnm;fladnr('.~ !'('r.\"nna-I;{"',!'(} ('n ('I ('.\"1,(11(/ i m, I(n (m(íli.\"i.~ (..~I'(II(¡¡(.ad(1
Casos a. h
I I MJi
a. /I. I
Var (IRD;) = -
I +-
r 12.1J
1r.,1]. !\'¡,;
II
(ver fórmula
difercncia
I ]-15). Por lo l(1nlo. un e~limador
de tasas de incidencia
con.iunludo
que fuese constante (1 lo
de una
largo de
1
lo~ estratos. se ruede obtener de la fórmula
IRb = .
[ 1:.2]
) 11
"-
en donde
[1.:..3]
J
y
h.
I
Noi
-..
.
,m~¡
;~, ;¡~t¡!!~f~~~]~
.::~\:~~:.:-.;~;¡.~~;~~:::;;;;::;;W:::~-¡;;:.~:;,;.~,.
,-:.-:;~.~~.!~ :;(:...r :,.!f~':~..~~ '.:fc.:.
I!lt !~[I~'
f;;..'~:..,.
Fumadores No rumadorc~
35-44 52.407
D
,
45-54
32
1()4 43.248 12
2 I R. 790
1().(,iJ
,.
-" "\...
55-64 206 28.612 -,-, 5.71()
65-74 186 12.663 2~ :?.5R5
75-84 10:! 5.317 .1 I 1.~()2
9 Tolal 630 142.247 101 ."\9.220
630 10r
~., ~-., -= tR.5 x IO-~ año-
142.247 ~iños
I 35 -44
45 -54
5,04
12,8
1.73
16.1
57.~
!\.~ J
55 -64 23,0 11I O.l)()
65 -74 38,6 535
I 75 -84 -20,2 1810
().19
O.()6
B
~
:~~;::::;\~~¡1 ~¡~¡~~~11~,
~
J'~! :~'~¡,;
1
208 EPIDEMIOLOGIA. MODERNA
~- ~~-~.--
por estrato. transrorrnados lo!!í\ritmicamcl1lc. l'I1:1 rilrmul;1 ilproximati\'.1
para la ví\riama es
í(lj + 'I,.
I lI2.4] 1
y ror tanto el reso rara el rooling es:
ll/J,
11' = ---
,
li; + h,
donde J
~!!
lI\R; IA'
hil J\ (ii ;1
Ejemplo 12.3. J..f nr1alidad por (,dcl(I.1' ,\"('.,.() (1(' p(I('i(JllI(',~ ('(m 11('II/'(II,f!icl (1(,1
1rig¿.lnino ( Rn1l,mal1 .1' M 011,"nn. ]973 ) D
Edad < 65 Edad 65 + Totales
"-" ,.
;;.:.
;:i,;:
~
¡~~;~:;;;:;¡¡:
1~~::-;;-~!:J:'~.
':\~:~~:}ft~
~~:%\\~\~\t.\:
r:lhla 12.J. 1:.,\,f;/II,IJ(I.\. ,..\,p(.(.ili(.(I.\, P(I'. ('.\"f'.(fl(1 (1(' '{f '.ll:lj" de la.sas lle iIIcide1lc;a
1'1"' I ,.,(",\,f;I'.',ll".i(I',('.\. 1(1,~(f'.iff1l;('(f.\,. /,l('.il"'=lf.\" .'. P{..\"(J.\"
l'ar(1 ('11'(1(1li",~
,1{' I(J.\, (1{(f(J,\"J{.I ('i{."lpln 12.J
J
1~!\tim¡luo dc la razól1 Logaritmo Varianza Peso
Edad
uc ta!\a!\ uc il1cidcl1cia dc IRR de In (fRR)
4llC d:1 1.5() r:lr:1 I()~ dat('1.C;del ejcmplo 12.3. La gran discrepancia
cxi~tcltlC cl1lrc cslc e~limad('1 110 c('1nrul1dido y el crudo. que era 1.10.
iltdic:1 4uC cl rcsullado crudo c.c;t~lh~l ~u~tal1cialmente sesgado por la
COl1rU~i()lt 4uC la cdnd cjercía.
donde
RD
':lhl:1 2. ".11111
ti(' flr('...('/1f(lciri/1 ti(' 1(/.\"lahla,\" ti(' 2 x 2 e/1 el eslralo i de
1111(/lltili5i.\' ('5Ir(/f(li(.tltiv
~-~~
¡:xpucstos No expuestos Total
Total N, iVO1 1;
NtiN~i
II' [12.7]
N~i{li(N1i aJ ...N~lhl(N()~ hJ
B
~
~-::
~~:\.:
i11J
I 111 RD;
RD=' [12.R
, Ir
i...
I
Los datos de incidencia acumulada dcl ejcmpl<' 12.4 indican una
d ifcrencin de riesgos cruda de .10:2()4 -21,!205 = 0.04.4\. pcr() est:í
confundida por la ed..\d, como se muestra en la tabla 1~.5. cn dondc se ve
que I..\~ diferencias de riesgos especificas por edade~ esti\n todas en las
proximidades de 0.035.
El estimado con.iuntado de la diferencia de incidencia.:; acumuladas.
eliminand() In confusión. se obtiene de la~ f¿,rmula~ [1::..7] ~. [12.R]: com()
~e muestra en la tabla 12.5. la categoria de ed(\d mi\~ ,'ie.ia produce un
estimado de la diferencia que nos ocupa con una varianza mucho mayor
que la de la categoria más .joven y por tanto se asigna a ésta un pcS()
1
mucho más grande. El estimad() con.juntado es 0.034. 1(1 que rcne.ia el
.1
mayor peso que. como se ha dicho. se ha asignado a la categoria mi\s
j
-'(1Ven.
Ejcmplo 12.4. C()IIIl'aració1l. p()r .p;'."pn.~ tl(. (,(i(I(1 (..~l'('('ifi(.0.~. tl(. 1II1(('rl('.~ (1(.hi,ltl.~
(I lotla.~ IlI.~ ('m(.~ll.~ l'nrn lo.~ 1!rllp(/.\, (lt. lraI01'1;(.111() ("()11Inlh,(la111itlll .,. (.ml
pl(I(.(,h(¡. Pr(/.f!rOllll: tl(' tl;(lh('I('.~ tl('1 Grllp(¡ Li1lir('r.~;lari,1 ( J97(/)
~--
Edad < 5.~ Ed:111?: 5.< T(lI:1I~
-- 1 (llh"l:lmid:1
~ PI:lcch(l T ulh"I:lmiu:1 PI:lcch(\
T ()Ihutamida Placcb()
t\1 uertes 8 5
22 16 30 21
98 115
7f, 69 174 IR4
Superviviente$
Totalc~ 106 120
9R R5 2(14 20~
j
Tabla 12.5. E,\"t;madn,~ (!.\"p(!cffi{'n.~ pnr ('.~rrarn {1{' 1{1 (li({'r('llci(1 (I<' ;,lcid{'11{.i{1
aclmllrlada, Cfl11 l'ariml:n.~ ,1' P(!.~().~[larn ('1 p()flli11!-'.
de In.~ d(1rn,~ {1l'1 ~i{'m[lln 12.4
..;.~~.
~
~1Itf.~.1
~..~~~...;~,:-"..~~~;:-¡:;""'~.,.,
¡~i ti ~~#~~f~~~".:~.~~ ¡t; ~;~¡*:;
~1
.1: ;~~li4
-o,':"':,:
l
ANALISIS ESTRATIFICADO 211
l
\'¡lrianza ;lproximada dcllog,lritmo de la razón de incidencia acumulada
(RR) cspecilic,1 por c~tralo cs:
',-.
i.- j
[ 12.9]
ujbjNtjNo1
= -0- [12.10]
G¡d¡N1¡ + h,c;Noi
RR = exp [12.11]
dondc
oi/N11
RR = --
~
h.IN
II o i
j
r~lhlemclllc m:is !.!rande en la cntegoria de edad más joven. justo al '.
B ,
:.
~: ,;::'
;lli~;:~1~¡[~~~.
;~:-.""*~-':
:~;;:;~
~
¡~~~.;¡;~~
:;;t¡:~~:.~:: ~~~~::"
~;.;~~ !2: :~~
212 EPIDEMIOLOGIA
MODERNA
-+-+-+- [ 12.12]
a. h. (' d.
I I I ,
a.h,('.(f,
I
I I I I
\\"; = ..
a.h.('.
I I I
+ a.h.d.
I I I
+ a.('.d.
I I I
+ h.('.d.
I I I
I ~ + ..:.. + -
-+ h c (i I
aj i i [12.1~]
6R = exp [ 12.14]
¿ \I'
i
.
Los datos de caso-control dcl ejcmplo12.5 describen una asociaci()n
cntrc el uso de c~permicida en torno al momento de la concepción y cl D
ries~() de sindrome de Down. El estimado bruto del erecto es
c,~c'
~~~i¡t¿¡~;
:t~~::;t¡~¡::
j~¡¡f~]~
;~:::~~~.:.~,;,;...\:~;;::::,¡~~~::r:
~
-.;,¡"':..-;,.;.;.;;¡.;
:.~~~:~k~ ~.
::f~t\
~~~¡I ~lf{t.~\\l%f~~\:;~
,- ili~.
f.:jl.III'lffl 12.~. Ni,i".\. ,.",' './Ili"./II(.(I(/,1 1.(".'lí(/(.(/ (."/I!f(;/'ila .1' .\"í"dr(1/I'e (1(' D(1I1'/I.
/i",."/,, I' '"""/'.1'1,.\ "\.,t,',,"\". .\.('.I!'í" ('11,.\",1 ,1(' (..\""(.r,,,i(.i(la 1'(lr ,,(/rle de la ma(lre
,t,'/,'.\. ,1,' I,t 1"tl,",'I'(.i,íI1 .1' I(t ,.(1",1 tt""(".I"tl (./I I.I1'a'.l() ( R,tlhm(/l/. 1982 )
T 111;11
m
L~ Síll(lr 1\1111'
tic I ), '\' I) !2 4 4 12 16
( i \111 ..Clft... I(J I (l"l) I {,.' X(1 91 109 1.145 .254
1111:11 1(1 I.II(,X li) X9 95 113 1.157 .270
l'ahl:1 12.i. 1 \IIIII(lti(IX (.xl'(.(.ili/"(I.v l'(I(. (.Xlr(lln (1(' In rll:(jl/ tle venlajn C(}n
'\~
0.46 2.20
1.54 0.65
~:
-.~:~::;;:; ~:~. :;:~;:~~~;
.;~f{:!.::;~{~f~Y~.i~ .;~~{.~~',.~.:;~
jt~~" ~;~:.
;;"
:.~
,
deseables propiedades estadísticas de tOdO5 105 e~timadore.c;. ser alta-
menlc eficiente~ ~. minimamenle sesgado~ a~inlólicamentc.
Una des\'entaja grande de los eslimadores directamente conjuntados
con.c;isle en que lo que se loma como pes() deJ pooling para cada estr.lto
es el inverso de la varian7.a del e~timad() del efect() para ese estrato.
como si únicamente se la hubiese estimado a partir de lo~ dalos del
mismo. Para datos con frecuencia~ pequeñas. los citados estimados de I.1
varianza. ~. por tanlo, los pesos pueden ser altamenle inex.\cto~. r&\ra j
datos que contienen una o más frecuencias cero. ciertamenle. algunos de
los e~timados de la varianza antes dad05 son infinitos. con I() que les ~
corresponde un peso de cero. Con~ideremos. por ejemplo. la fórmula 1
[12.12]. que estima la varianZiI dellogarilmo de la ra7.on de vent(\.ia para
una tabla de 2 x 2. Si alguna de sus cuatro celda5 e5 cero. I~\ fórmulcl da
un valor de infinit() ~. hay que a~ignar a la tabl.1 un valor también de ¡
cero. (Más al In. el logaritmo de 1~1razón de venl.l.ia para e~e estrato no
sería finit() con una celda de cero). Si la~ 'restante5 celdas ~on grandes.
habría una considerable cantidad de informació11 en I.1 labIa que se
perderia al asignar un peso de cero. rue~t() que 1.1razón de ventaja es o j
cero O infinito. que son las posibilidades más extremas. parece obvia-
mente incorrecto ignorar tal información. Una solución propuesta a este "
'
,.'. ~ problema ha consistido en modificar la fórmula [ 12.12] y. por extensión, ti
otras parecidas a ella. añadiendo un valor con~tante (habilualmente 0.5
'.
:~~
.,,-~-
"~~:;,¡¡;;;;;".
-~::-
~
:~:~~\~~\~~
~
1
I\NALISIS ESTRATIFICADO 215
I~..\"Iim(I('i(í" 11(' 1IIIi \. i,II(1 1".(¡/'(lhilid(I(1 (1(' 1Iil ~(c.('to /l11i/orl'1e (,011 datos
!)l'r,\"()II(I-1 i('II'I'().
I )II'I:.II.I'N( '1/\ I )1: I',\SAS I )1: IN<'II >I:NI 1/\, 1,&1cstimación de m{lxima pro-
b,lbiliJaJ llc la Jircrcllt.:ia tic tasas dc incidencia necesita la solución de
un COl1jUl1to Je et.:uaciunes que son Ull(l m{ls que el número de estratos,
,\dcm:'ls tic rcsl)I\'er la dircrcncia de tasas de incidencia (IRD), es nece-
~ario resol\'cr tamhicn el valor de la tasa de incidencia en el seno del
grupo 110 CXptlCSto Cll cada estrato. satisfuciendo las siguientes ecuaciones
tic prohahilitlad:
[12.15]
".
lli I
+ .~
~ = o [12-16]
1{01
..=":. c
':..;.:~.
;IJf;'
~
~.
j~:~~.
\~~~:~:~;.
:;;;:~:;;,¿;~::
...:...;,«~.~-=.
1¿~~~f~~~ ,-
?~~~i:'\:;;r~
I
2'6 EPIDEMIOLOGIAMODERNA
RAZÓN DE TASAS DE INCIDENC-IA. ~---
Para la estimación de máxima
l ) .:.. ) 7 J
1[.
~ii~~~:
fJ:
..~
;::.;;-,..'¡;;¡:;;j
~!¡~~,f~t
c..,
.~~::>~
~j,~ ':.~:
';¡.:;~ \~1\
:,~~~.
:;:~.~
~i1 ~~~;,i.;;;;.<.,~;.o:
~~
2. {~- (RR)R~II
o [ 12.20]
i
r :1< I t r:11
1{ I¿ )(I, Nli)
1?,
2( i{ 1{) I;
-.
ai + No; + (RR)(hj +
2(RR)7¡
[12-21]
¡ a, -L a, = o [12.22]
ti [12.23]
8
:~
~~ :ili¡
f;~;~
,'"","!:~
; :..
:(:~~i.
'~~~"';'i";~:!';' .~;:
~
218
6R = á¡t?¡
[I :?241
I;-;-¡;
en donde ú;. (,;. ti y (7;. son 1()5 víllore5 e~rer¡ld()5 dc I~I~ ccld;ls que ,';011
conrorme5 con la~ ecuacione~ [12.22] ~. [12.24] ~. c()n I()s 1()1¡llc5 m¡lr!!incl-
les de la tabla de 2 x 2 (Gart. 1970). Resol"icnd(\ la ecunción [ 12.24]
explicilamen\e para tli en término5 de 7;, ".. ;, ¡\1. j ~. 00 dn I
~
I
:;
.,
ái = ABS {ABSl~(~ + !\'11 + Af1i "
[ 12.25]
~
i~~;~:¡;;;::..::;.:;:~:::::.;::::;::¡"'.;;:::-¿;~:;::;~~;,;.;:,,;.
,...;t;;~.~..'.' ~ ~...~:;:...ó'~.'.'.;f:..
~~~\\~~~.
~.~;
1
..,
ANALISIS ESTRATIFICADO 219
] OR,\fll -
L.
i
(/jl(,/7;
[ 12.26]
I "\('\/T¡
11-tf.
I -! -!-'/I-l- = 11.d-
-'.;o!.
I o R.\, "
~~." ,--
;~&Ir~¡~
~
..,.-, , c
;?':I¡ ..~~~':i-:~
III
1
220 EPIDFMIOLO(;IA MODERNA
~-
]
L a;I\III;/~
i
RRAf/1 = . [ 12.27]
\
J:-
¡
};
I\ .1
I;'
r:
I,
1985). La fórmula
emplearse para incidencias acumuladas.
1981: Tarone. ]98]).
dc una razón de
casi tan eficiente como el e~tim.ldor
1~.27 tamhicn
dc
puedc
para ohtencr RRhf11 (Nurmincn.
,
Para los datos del ejemplo 1.:..3. la f()rmul.1 [ 12.27] d.1
1
(14)(1.70t)/(3.217) + (76)(2.245)/(3.194)
IRR~fl1 = = 1.50
(IO)(1.516)/(3.217) + (121)(949)i(3.194)
]
que es idéntico a efectos prilclicos tanto al resultado de m:lxima
probabilidad como al conjuntado directamente.
La aplicación de la fórmula 12.27 a los dalos del ejemplo 1.?.4 da
¡~:;;;;¡:
'
-~
-~~
~" ""~..~-' ~f~l~
=:e-.'. ;t~~ ¡~~
~:.:.~,1%~~:ot~~~;~~.
:::'";:~::':~
;"'
ri
ANALISIS ESTRATIFICADO 22'
--
§
~~--., .
:;~:,
';;:;,;;
:~:;':i':,.'~~
i~~~¡~~:
~~~~~t~;r~~~~;:,#i1[:~j '".:
~
" ,,::;'"¡;:~::;";¡~~~
.~.. .,..:¡t.~~..0:..
1Jlt{i~~ :~~~;;~~~~1if~:
EPIDEMIOLOGIA
MODERNA
]
222
= MI j\(~\GI(&\"j
f,V"
aj )\ 7i ) \ 7i )
t ..La
..' .- probabilidad de que un conjunto de N estratos tenga exactamente
aj casos expuestos en cada estrato i, i = 1.2. ..., I\', es el producto de la
j
v. ., ... .
:~:.:':.:::r~:.~!~~:.~::~¡r~¡:ij:f;cl:~:i1
".
~~}~~:ftl~~;¡*o'!..
::f;
~
.:*';:i~~;
~~~\f)
¡1~~t~\V
¿ ~~~
[12-28]
,) I 9.942
~~
1.530' n
= (0.8175) x (0.00054036) x (0,3501)
.'\.747)
0,000155
'T~f.
-;-"
-~
:-~
~;;
~:
I!: ~~i';~
Ejemplo 12.6. ¡',cid",,(io d(' ",('nl'la,\"",f' tirnid('fl, .\,(,~,ill (,d(ld, ('II h(""hr(l,\
I'aro la,~ ".'"I"I(',\"ta,\" (/ "'(,1'0,\" d(' I(}() rll(I,I' a ""i,\ (1(' J(}(J r(l(1 (1(' r(,fli(lf'ifil/
( H('",l'eh"a,m ('I til, 197.~)
2 I 5 ")
á. ()
Ca~O5 o
Tabla 12.8. Erll(1ci(ill d(' 1(¡(""," 1(1.\ cmllhill(ICiml('.v p(I.\.ihl('.v (1(' (.(1.~(¡.\ ('.\.p,,('.,"'(I.\,
pnr ("(1I(',I!(lrill.," d(' (,d(I(!. ("(II/ (l/lI/('lIV.V '¡"("1'(' ('(1.\.(1.\.('.\.pll('.\."I,\,
p(lrll 1(1.\' "(II(),\' ,,(,/ (:i('lI/¡1l(1 12.(,
[ 12.29]
H
f
¡.: I
.'
:...
,.~
'.¡:;o; ¡~~!~t~¡:
~
::¡;¡..:::~:',;,'::
:~=~~.~
r~;\~l~~~
~~l~~~\~\~
¿
g VOj
.\1
[ 12.301
..I
7';
[ 12.31 ]
I "
Il~I i
)( '~
~
-Ln
2 k=n i=1 k.¡;
I I )
[ 12.32]
m
Para los dalos del ejemplo 12.6. el valor exacto de la media p
superior seria la milad de 0.000522. que era la probabilidad de los nueve
D resultados posibles con exactamenle nueve casos expuestos. más la
probabilidad de lodos los resullados posibles más extremos que nueve
casos expuesto~. lo que daba un total de 0.000078. Por tanto, el valor
~ exacto de la media p superior es 0.00034.
~
~
~
:.
,:1:?$~;~:;
~[
9 l~~~:r
\~ti ';,;,;
226 EPIDEMIOLOGIA
MODERNA
i= I T,
L
".
ai -~
". .
!\'liM1i
1
1;1 I.L= I TI
x=
II
.
¡=~
M1i!\'Ji!\rOi
~.,-
!
[12.33]
i
\ i= I T~
E(A) 2 1[9%(
1.054 ) + (
12 18:075
2.665 ) + 2 3:'?:47
2.217 ( ) = 3,14
.
Var(A) 1.054
= 2 !6:9% ( )( !6:9%
9.942. + 12 ( 2.665 )(
"i8:¡j75 "i8:¡j75
IS.4101 )
I+
'+ 2
'. -3.747
(
~ )( ~'
3.747
) = 2, 16
, , , ,
, :
'Y , , ..
: , , C\ : ¡
,¡-; " ,,
L ; 1
" 1
~
~;
~\~:~~~
~~1~1~ ¡l~
:$!oti':t*'
;:-;:.;~.;!i:j¡:t,
~
,,:;;;:'~;;:;;~:;:
,;..::~~:;~~...:0;-:
'c~"
~,
~~~:~:: :\~;::~:~:~;~;,;\~:
~l;i.r:~
rn
1'.(
~ / I) = 24 (~'3,217) + 197
( ~
3.194 = 69,8
90 69,8
x =
2,94
~ .fi7J
P(II = 0,0017
;;.i.!¡;~
~11tt.: ~~;~~¡
:."~:;:\'
;~~ ~~¡~
..;~"
!"..."'
.,.:"" ~~
E~
I
~
;J
I\. A' n; I
D
M1i -A
P'ik ~ tI) = \
12.35]
k~nl:\xf(J.MI-".1
(A¡.J
para la cola inferior. cuando cl estimado del efecto es menor que cl ví.\lor
nulo. Los sumatorios son k = }::;k;. donde kj es e) número d~ Cí.ISOS D
expueslos en cada labia de 2 x 2. ya. !\71 A'(). y M I se relicrcl1 í.1}::;(1;.!:!\1. ;.
~ !\7o;. ~. -I
~
/I1 .
""' j. respecllvamente.
Para oblener e) valor exaclo de la media P. s61o dchc ¿Iñí.ldirse í.11
~umalorio de I~I COI¿l I¿\ mitad de la proh:¡hilidad de los rcsult¿ldos igual
dc exlremO$:
!\'1
ml"I~.t.A/t
ki
~/I
. D
L 2.361
1 ..J
k=n+\
g
::~~
~]!z
',' >,-{, :.!
'::...:.:;:~~ ~
.-~
~:.;
¿l~~~:.: :ii#!
;:~:
J ~~Ii~ ..,
.:-.
.
a-l N
+ I n [12.37)
k:m:lx(O.,\fl-Nn) i= I
f;
I
1 Estas f()rmulas pucden utilizarse para hallar un valor exacto de p
t
. corrcsp()ndicntc a los datos del ejemplo 12.5& Había cuatro casos
expuestQs en cl cstrato «joven» y uno en el «viejo». En el estrato joven. el
nllmero de casos cxpuestos puede oscilar entre O y 12 dentro de las
rcstriccioncs imptlcstas por los totales marginales. En el viejo. dicho
nllmCr() oscila cnlrc () y 14. En total hay 13 x 5 = 65 resultados
posiblcs para I()s dos estratos. De estas 65 posibilidades. 50 son separa-
ciones po~iti\':ts nl:ís extremas respecto de la condición nula: que el
resultad() realmcnlc ohserv:ldo: un total de 5 posibiJidades, incluyendo
los dato~ obscrv:ldo~. son igual de extremos. teniendo exactamente
cuatro casos cxpuc~tos. Estos 55 resultados. iguales o más extremos,
están enumerndos en la tabla 12.9. .
La probabilidad. en el ejemplo 12.5. de observar el resultado real se
determina como
f
P,idalos observados)
)c
.
(
b
~
I
Para los cinco resultados posibles que dan cuatro casos expuestos, las
probabilidades. en el orden en que dichos resultados se hallan enumera-
dos en la labIa 12.9, ,~on 0,0118, 0,0150, 0,0039, 0,0002 y 0,0000 {este
último es realmente 0,00000149), que totalizan 0,0309. E] total corres-
pondiente ptlra los resultados que dan cinco casos expuestos es 0,0066 y
~ partl seis CtlSOSexpuestos, 0.0010. El valor de la p de Fisher para la cola
superior de Itl distribución puede. por tanto, estimarse como 0,0309 +
0.0066 + 0.00 I0 = 0.0385. asumiendo que los resultados con más de
~ seis CtlSOS expuestos no contribuyen materialmente a la suma. La
rn
~
?~T:r~;'.::;."~
:;~f~:: 11
~
",'..",
~.,,~."
,
¡~l~~;t
." ",,-""- [.
r
]
230 EPIDEMIOLOGIA MODERNA
::.~:.::::c' :~~:,
~
.~I;t:~~~
;i>"'..."i*í:i'i'.'¡'.:- -
~:;t~~. :~;;::f¡;;:i~~;';;~~
:,:,;;; .;,;;,,;;
,:~~¡~~I;::
!D
"
.
Var (A) = f ~ojM~
n j=l Tj(7¡ -I)
tJ
lo que Ja como prucba estadistica
u ~
L al -L
~ NIIM II
i=l i=l ~
X = [12.38]
I f
i= I
~liNoiM
Tt (~
1//\.{01
-1)
~ E(A) = (106)(13)
+
(98)(38) = 6,10 + 20,35 = 26,45 ,
226 183
R
U
.
::,.:" ;?o",
.~~.
,
::;'.- ,~,..:.. :::',!:-:'
~
;~.
~ ;w81
r
232 EPIDEMIOLOGIA MODERNA
Lu prueba cstudistica es
~o 26.45
~=
.09
,\i) 0.60
que da un \'alor de p con una cola de 0.14 ~. un valnr dc " cnn I:lS dns
colas de 0.28, Nótese que, pue$10 que la tolbutamida era considerada
comC' un preventivo de las complicacione.c; de la diabetes. la.c; ~eraraciC'-
nes respecto del \'aJor nulC' se esperaba que ocurriesen en la direcci()!l
opuesta. Por Jo tanto. el valor de p de una cola dcberi.l corre~pondcr
teóricamente a la cola inferior de la di~tribución. en la dirección de
prevención. en lugar de a la superior. Como 10$ datos demuestran una
asociación positiva entre tolbutamida ~' muerte. el vaJor de p de una sola
cola debe ser 1 -0.14 ó 0.86. EJ valor de p de dos colas e$ 0.28. sea cual
fuese la dirección de la expectativa previa acerc.l de la.c; dcs\'iaciones
respecto deJ valor nuJo.
Si se apJica la prueba de ManteJ-HaenszeJ a lo.c; e~casos dalos dcl
ejemplo 1~.5. la prucba estadistica es
.(.::
;~¡¡~¡i;¡~1:'
.;;.-:-:~, :;-t..
':.
f""~,;,;,~r:"~; ,?;* ¡~~~;~;;;J;~::;¡:;~
,*!:>::;::W'l~
~~ill~:~~~!~i:.
~
ANALISIS ESTRATIFICADO 233
N 2
"'1
~ L
1=I
~
;::;.~J~.~~~~:¡i:.\\~;:.~~::~,~ ~
::..
'!it"'!
r
234 EPIDEMIOLOGIA
MODERNA
."'
I
9 1() -4 --I
"\11.535 >: JO-¡;añ()-2 = .-., X Un()
D
resultado mil~ amplio que el obtcnido arriba. El abordaje basado en cl
test produce res.t)ltados amplios porque n(l asigna un peso extrcmada-
mente grand~ al estrato de edad más joven, como hace cl método D
directo; los pequcños números del citado estrato de edad más joven dan
como resultado una varianza pequeña de la diferencia de tasas de
incidencia esti~nada a partir de ese estrato. B
u
J~.,:~'"~:
;~.,:c -',,'
:~t::;~,:.~::::
~
c .,:~~~',';:,*~~;.,:
'.;' Ot:.;~..S%'
'i;...i:!::.;].:;..
¡.~~~~ --
-1 6 -8- -2
Var (IRD) = 64 0 6 -., = 1,5 x 10 ano
I ,1 x 1 ano.
..
rn
~~.
~
¡,::
i~~V~~
..:.: c
.;:::~; ~{r~\~¡~..¿:¡..~
~
~. ;;,~;.,;.,.
236
LiMITE.~ DE \ONFII\NZI\
EPIDEMIOLOGIAMODERNA
EXl\rlO()5. La ohtcl1ción0- --0de limjtc~ dc COnfi.lnZ(\
r
exactos requiere que la probnbilidad de In cola tic la~ ob~ervacione~ ~C.l
expresada en términos de razón de t,lsa~ dc il1cidenci.1 (I R R )o En cl
e~trato i vamo~ a llamar I(; a I~I prohnhilidad dc quc un C.I~O ~C;I
expue~too De la rórmula [ 11.9] o de In [ 11.1 OJ. ~c puede Ohlcncr la ~i~ujcl1.
te rel(lción:
= [12.42
,,:
Al I '.'
¡\1
IXI2 = I I
k 1!, [12.43]
k=1I ;= I
'.'
M,
M
1 -a!2 = \ \
;)ki(l -11 2.44
~ .L-
k=a+ = I k.
,. I.'
...,.. --
'u.
-I
+ U.
-I
) MI;-k
[12.45]
-.
:-,~.
.;.~,:,;~.
,:~.~~~::
~~
~~~*
j
..J 1, !.:.~\.(;,II(I(/(1¡>,111(11(1/!);r('('((IIII('II((' Pml(/(!r(I(/n, La varianza de la ra-
Z()1l dc la.c;a~ de iltciueJtcia direclamelllc colljulllada debe ser estimada
Ira.c; llevar a cabo lJlla lransrormación log,lritmica. de modo que los
limite$ puedan ser colocados en dicha e.c;cala. La rórmula de la varianza
$e parece a la [ 12.39]:
u donde
a.h.
= I I
[12.47]
1
Var [In (de IRR conjuntado,J = I = 0,019
5,83 + 46.7
,645 JO,O19] =
exp [In .50) :t ,20, ,88
~ íRR
Var (IRR) = [12.48]
f ' J\1liNo'/N li
i= I !
)2
m ~
Nl1
I
Ví.lr [In (ffiR)] = [12.49]
M I/NoJN1/
~\2
~ NI,}
I ~ ,.
-
-~ .1f¿, ~...:.~,.:-.-;.~,.í'::..~~ ~
.,,~&:.;
.~1¡
;;~~~~~t:lj~~~i~@~~f:~~~~ ~:~::;: ~:
~~i
~f:\i~Th\f~\ ~itl\~
~
lal
c 0.019
COl
J )~
~
-01
Este estimado del inter\'alo es virtualmente idéntico al que se obtu\'o por '}1!
foI
el método directamente ponderado.
] 6.
Para los datos del ejemplo 12.6, el inter\'alo de conrlanza aproxima-
do al 90 por 100 en torno al estimado de máxima probabilidad de IRR.
que es 6,55 es Qe 2.77 a 15.5, lo que concuerd3 bastante bien con el
intervalo de la media p exacta al 90 por 100. de 2.71 a 16.0. IN
base. Sin embargo, puede calcularse para la \'arian7.a una fórmula más G r
estable considerando cada ai y b; como una variable de Poisson \ n
..'
independiente (Tarone, 1981), o considerando que cada ai es una
variable binomial independiente, condicionada a "1 I i {Greenland y
~ir
Robins, 1985). Este últim~ abordaje conduce a ~sr
~~
[ 12.50]
:J o
Para el ejemplo 12.3, la fórmula anterior de Var [In (úi:R}.(1/)] = 0.019, :.
¡.
-,
::i~;::~i::;~¡;~;t::~
:;¡ipj;,.¡;:;r.~.,;(,*;
f,- ¡*J~*~~~~
ANAlisis f.sTRATIFICADO 239
7,3QfJfl.64"3.981 = 3,2,17
N3 AI3
w =
Jj/'OI
I N~/a,{N11 -aj) + N:1h~Noj -hJ
0.0.14 :t
.645(0.028) = -0.012. O.ORO
"'liNOi
w =
¡..'TOi(Roi + RD)(l -ROi -RD) + ¡\'liRoi(l -ROi)
[ 12.52]
$. :~~~;~f:~~~c
~::;ii¡~~:.
*
~
:~~~~ ~~
.;.;:;c::,-::;:;:jC
.~...:,..~~. ;:j~.
::;,.,:~.:'
;.'" ~~J1~~~
~:~.
r.'.c
n
ANALISISESTRATIFICADO 241
O.2iO :t
.645(.,j'o:O673j) = -0,157, 0,697
u = (RR)(I -ft.o;)N1;
-.
(RR)Ro;No;N
+ (I
1;
-ft.o;RR)No1
[12.53]
1\1
l) que pueden emplearse en la fórmula [12.46] para obtener un estimado de
la varianza conjuntada. En el ejemplo 12.4, el estimado puntual de
máxima probabilidad de la razón de riesgo es 1,31, j¿OI = 0,0~04, j¿O2 =
m 0.1781. y los pesos mejorados son 3,44 y 11,4. El L}v¡ para estos últimos
es 14.83 y la varianza del estimado puntual transiormada logaritimica-
mente es 1/14,83 = 0.0674. casi el mismo resultado que se obtuvo de los
~ estimados de la varianza específicos por estrato. El intervalo de confian-
za al 90 por 100 se obtiene sobre la escala logaritmica como
~ .':
~~~'i-.::! ~
;Bi*;
)~}~~\~~j;~~
.~1~~;~~:~~~t~~:
~~
:;;;.~~;.-.
~
1
242 EPIDEMIOLOGIA
MODERNA
~~ -
ESTIMADO PUNTUAL DE MANTEL-I1AENSZEL. El estimador puntual
Mantel-Haenszel de la razón de riesgo a partir de datos de seguimiento
con denominadores de recuento adoptn la mi~ma forma que el e~limador
puntual de la razón de tasas con denominadore~ per~()na-tiempo (fórm\l-
la [12.27]). La varianza del I()garitm() de RRAlII e.~ aproximadamcl1lc
(Greenland y Robins. 1985).
".
,
"-'
{¡\11 ;1\' " '( -, ¡ ~)/T?
.i= J
Var [in {RRAfll)] = [1.:..54:
'..' h A.:
L f
i...,
i= 1
~~;~
T
I
.L.~ 7 l
I
Para los datos del ejemplo 12.4. la expre~ión anterior da \;ar
[In (RRMII)] = 0.0671: si se la empare.ia con el estimado puntual de
RR"tl/ = 1,33, los limites de confianza aproximados al 90 por 100 ~on: I
exp (In ,33) = .645, ,/0-:067! = 0.87 :!.o
I
que son casi idénticos a lo~ límite~ calculado~ para el e~tímado punlual
directamente ponderado }' el de mi\ximal"r()babili9ad.
Pr(datos) = n ~7 .
[12.55]
.~lnIA/~í.NI,)
i~ I
) ORk
J~ I,
No;
I
k=mAxIO.Mli-"n
"
\ k \M ti -k
;:~;:-;
...;.:.~.-:.
.,,--:.,..-:
~...:~.-
:.:;;:;:,":~
,..
~
:.::(~.~:.
~1i~~ #.
#;~~ ~;
~~¡t~
:k!?~i~:
c ::':¡~)~¡~~r~li:
::.:"
~~[~&;::,i'.
9
"ó:~
~
Las probabilidades de la cola para los límites de confianza exactos
pueden hallarse obteniendo la suma de las probabilidades calculadas en
1.\ expresión [ 12.55] correspondientes a todos los valores posibles de La¡,
D iguales o mayores .\1 valor real observado ya todas las combinaciones
posibles de frecuencias de celdas que producen un valor dado de La¡.
r.\ra conseguir los limites de confianza exactos de la media p hay que
9 .\ñadir a la suma de cada posible combinación en la que La, iguala al
v.\lor observado sólo la mitad de la probabilidad determinada por la
expresión [ 12.55]. El limite de confianza exacto inferior se obtiene determi-
n nado. mediante pruebas de ensayo y error, el valor de la razón de
ventaja que produce una probabilidad de la cola superior de ~/2 (X es
igu.\1 al complemento del nivel de confianza deseado). El límite de
B c()nfianza superior se obtiene sumando todos los valores totales de La¡
4ue son me!lorcs o iguales que el valor observado y hallando el valor de
1.\ r.\7:i>!l de vel1laja que da una probabilidad de cola inferior a (X/2.
I COl1 los datos del ejemplo 12.5, el valor observado para La¡ es 4; las
55 comhin.\ciones para las cuales La; ~ 4, se enumeran en la tabla 12.9.
Empleando la expresión [ 12.55] para determinar las contribuciones a la
rrohahilidad dc la cola. loS limites de confianza al 90 por 100 de la
metlia l' cxat:ta sc i1alla que son 1.30 y 9.78. Los correspondientes límites
l:isl1er son I.O<} y 10.9.
I
LÍ11Iil(I.\" de ('m~/i(lIl=a apro.X"imado.r
8 que difieren en alguna medida de los límites exactos, pero tal discrepan-
cia es tolerable, especialmente si se considera la amplitud del intervalo. A
la vista del pequeño número de casos del análisis, la aproximación
parece razonablemente buena.
E
ESTIMAI)() PUNTUAL DE MÁXIMA PROBABILIDAD. Cuando se tiene una
I cslim(lCión punlual de máxima probabilidad.
dc la varial1za sc pueden utilizar
para obtener un estimado
las entradas de celda que cuadren en
la~ lablas dc 2 x 2. Los valores de a¡, Gi, ci y di que satisfacen la
~
~~~~-:; .-~-.~-~-.:: ,.
:::~:~:;:~;.,.
.c~:.:..c *.
:¡::~~:;:..
~
~11~ !f~~~Í~(~~~
...""
.-'-~~--
:::
11' -
i- ..f [ 12.56]
-+7+-+---
(i. I 1>,I [.. I (I. I
+ Total + Total
[1
Síndrome U
de Down 3.247 8,753 12 0.753 3.247 4
~~:' ;~~,~~I~
~
ANALISIS ESTRATIFICADD 245
2%12 =
[ 12.57]
u V.lr (Lli, -,
-I +
;';"'1 ¡:;'I
u como en la estimación
d1.1S dentro
puntual. porque ias frecuencias de celda adecua-
de c1.1da tabla siguen siendo conformes con los totales
m1.¡rgin1.1Ies de esa tabla individual. El límite de confianza inferior que
s(lti$f1.1Ce la ecuación [12.5i] es 1,48. Para el superior, se requiere una
~ solución reiterativa que obtenga las frecuencias adecuadas para la celda
(I. que son 5.i72 y 1.370 para el estrato joven y viejo, respectivamente. El
limite de confian7.1.1 superior correspondiente a estos valores es 9,72.
~
I:.I)IIMAI)() PUNIUAL I)E MANTEL-HAENSZEL.Han sido elaboradas las
propiedadc~ 1:~ladi~ticas del estimador Mantel-Haenszel de la razón de
ventaja bajo do~ ~ituaciones limite frecuentes: que el número de sujetos
m por cstrnto se haga grande o que el número de estratos se haga grande,
lcl\iendo pocos $ujctos en cada uno de ellos. (Hauck, 1979, Breslow, 1981).
Para dicho estimador de Mantel-Haenszel de la razón de ventaja se han
~
propuesto fórmulas de la varianza distintas, adecuadas a cada una de
estas situaciones limite: Breslow y Liang (1982) propusieron ponderar
las dos fórmulas para obtener una combinada, que fuese de aplicación
~ gcneral. M{1S recientemente. Robins y coautores (1985) han desarrollado
,,~
~
~~~~
;~~;~~%~; ,.".'
'.;:::~:.~:;;;~;::~;;
~~...
'¡~:
:¿t~~~;:~:~:
~.~~~ ~~~:~~!~~I~'tJ;
l
246 EPIDEMIOLOGIA MODERNA
". ,.. ,
L l',Rj
\
'-- ( r.s., I + QI.R.I ) I Q,S,
L -I)".
I
R. J2
+ i= I
[ f s,J'
+ -;- ,- ,
[12-58]
j= I
,.I ~..1
dondc ~
r. = (a, + d.\fT
I I 11.1 I
( '. ) '
QI = ( h,
" -1-
' I TI
R. = a.(t.í7~
I I I I
\'
s. = b.c.IT
I! I I
Para los datos del ejemplo 12.5. la rórmuJa anterior da una varianza
estimada de 0.349 que produce. a su vez. un intervalo de confianza al 90
por 100 de 1.43 a 10.0, resultando que e~ casi idéntico a los limites de los
~stim:1dos puntu(!le~ directamenle pondcrado )' de probabilidad máxi-
ma. -1
LO5 limite5 de confianza al 9(1 r()r I (){) ha5ado5 en el test para los
dat()~ dcl e.iemplo 12.5 ~e obtiencl1 3~i:
que son mils estrechos que los obtenido~ con la fórmula [12.58]. El
ahordaje de lo~ limites de confianza aproximados con base en el test
ruede ser utilizado también con el estimado puntual directamente
pollderado.
-~,
¡~[I. ~~[:
~
.
I m
hilidad exccsi\'a, o patrones de variación obviamente. no aleatorios
puedcll haccr~c cvidcnte~ tl la simple inspección. El juicio del investiga-
uor :It;crt;a (Ic Itl modifictlción del erccto no debe limitarse a )o que
:Iparczt;tl cn los UtltOS que tiene a mt\no; cutlndo disponga de ellos, el
inve~ligad()r dcbc integrar en el proceso de evaluación el conocimiento
cxlcrior proveniente de estudios previos o de visiones biológicas más
gcncralp;s.
l o
.
~:~,~;i;;i:-.I:.-t.-.~.r;;.~t:;
---:::-.-"~.
.~
~
Jl~ ~~-~
248
Lo
-." típíco.
---~-- no obstante.
EPIDEMIOLOGIA MODERNA
es que el conocimiento externo sea reducido y 1
que los investi[!adores deseen una evaluación estadistica del grado en
q\IC la varíabilidad de los estimados del erecto específicos por estrato
ruc~c consí~tcnte con una conducta puramente alealoria. Con este
oh.iclivo. pucden emplcarse ul1a variedad de.pruebas esladislícas. Parte
<I(' <lícha varícdí\d proviene del hect)o de q\IC las medidas de razón )'
<lifcrenciíl rcq\lieren e\'aluacioncs ~Cpar(I<I:ls de la modificación del efecto
Cll cucsliill1. pueslC' qllC' la \ll1ir(lrmi<l;I<I tlr la mcdi<la <le ra7."n implica
!):Ihilll:llmcnlc modificaciól1 <lcl cfl:rl(\ la! L.Om('I In rccn!!r I~ medida de
~f
(lircrcl1ci:l y viccvcr~:I. El cII)rlr{' {1\: 1:1, rr\lch;,~ e~I;I<lislí{:CI~ sc ha
(li~c\lli<lo cn el capít\llc' 9. e~rL.ci:llllIL'I)lr CII rcliIL.j¡,ll (I 1:1(1(~lcrlllil1acii)n
(Icl scntido <lc la «~i[!nificaci()n e~I;I(lislic;I)\. q\IC tri\,j;\li7í1 1(\ il1ler-
pretclcióll de medidas quc. de no ~cr por ello. e~t(\rian Ilencls de ~cI)tido.
f:1 \1~() dc prueha~ dc ~ignificaci"n es más defendible. ~in cmhargo.
c\lando una deci~ión inmediat¡1 dCrCIlde del resultado de una v(\loración
e~tadislic(\ única. Tal podria ",er el ca~o cu~\ndo UI1 investigador e~tuviese
il1tentando decidir si el grado de \'clriabilidcld que ha). en un conjunto de
estimados del efecto especificos por e~trclto es consistente con la varia-
ciál1 alcatoria de un ereclo uniforme. o alternativamente. si en los datos 1
-existe modificacíón del crecto.
L~IS pr\leb,ls e~tadistic~s dc la hir"tesi~ nula de que el efecto es
\ll1iformc (es decir. no exhibe m()dífic,lción} son generalmente de dos
lipo~. \1110 basado en UI1 estimado directamel1te cOl1iuntado del efecto
\lllir()rmc ~. el otro cn un estim;l<ln tic m;ixim(l proha.bílidad.
Para los estimados directamcntc con.jllntados. el principío bá~ico de
1:1 pr\lcb¡\ es comparar cad,\ estimado dcl efecto específico por estrato
con el con.iuntado. ele\'ar la dírerenci~ al cuadrado y dividir por la
\,¡\rial1za del e~timado del efectC'l e~pecífico por e~trato. El cociente que
resulta se suma a lo largo de todos los estratos. produciendo una ,']
estadí~tica l2. con un nllmero de grados de líbertad igual a uno menos
"que el de e~tralos:
1)
= f ~-(Rj -In (~)J2
2
[ 12.60]
XN-
;";:'1 Vur [In (R;)]
1!
.' 1
,
~...j
r
"~
,;:c;~
~~~t.~:
~-lti1;t;:!::t) ¡~lii~~~
~
~i:;.:;¿~:.: .:.:,',.;..;,;::t;.' ;:;~..:..; ~".,J. .,,~...;..)-.,~ ~II;
ANALISIS ESTRATIFICADO 249 ~.
g lIlilizarsl: allll ¡;ll:ll1do CI1 los datos hllhicse frecuencias de celda peque-
i1.\s. l.(111 rrc(;ul:l1l.i:ls dc (;clda que fllcscn cero. esta prueba falla. aunque
sc la pll~dc 111l)dilicar ligcr.1mcl1tc. sustiluyel1do el cero por un valor
pl)sili\'() pI.:4l1l.:i1l). rara (;onscgllir un rcslllt.1do razonablemente ajustado
CI1 mllchos C(\sos. L~IS pruebas requieren el cálculo previo del estimado
d~ mi1xim.\ prob(lbilidad de un erecto uniforme. pero. por otro lado. no 1
rcqllicrcn rcilcr~\ciól1 e implican sólo una computación sencilla. Cuando
n los d(ltOS esti\n rel(ltivamente dispersos. el abordaje de razón de proba-
hilidad debe d(lr resultados más exactos en la comprobación de si existe
I1ll)dilicacii)11 dcl crccto.
Q I.a fOrl11l1lacii)11 de estas pruebas de razón de probabilidad sobre
---
"*
.-.
,:.;..; ¡;.~.
;~~:
f~~:::~.::.,. i:!~:1~~~~)~~\
~...,;..,..~.
..'"' -.
I\.
,
(IRoi + II~O)¡\.li
z~
--."
--I {l; 111 [ 12.61]
-
i = I (I I
.-
IRR
II~I~ + J\TOilJ\11i
~
,
':;v:
~~~;~\.
4.
~.:;}~~~~!~\
:111
251
ANALISIS ESTRATIFICADO
, 2.i ¡-ai In () + h, In ( ~ , +
XÑ-I-=
,.-1 L ai \ h, )
:J
[12.63]
..-
X:V-I -
[12.64]
que difiere notnhlemente de la prueba correspondiente para la razón de
tnsas de incidencia (fórmula [12.62]). La diferencia proviene del hecho de
que dicha f()rnlula [ 12.62] se desarrolla a partir de una. expresión de
! fi:1
I 1!:1
probabilidad que es condicional al número total de casos de cada
estrato. eliminando con ello parámetros de perturbación. Para datos de
incidencia acumulada. no obstante. no es correcto basarse condicional-
fi mente en el número total de casos de un estrato y por tanto debe
utilizarse una expresión de probabilidad no condicional; una conse-
cUenCii.l es que los estimados de los parámetros de pertubación {Rol}
üJ forman así parte de la prueba estadística.
~ Los di.l.tos del ejemplo 12.5 pueden evaluarse en relación a si existe
uniformidad de la razón de riesgo. El estimado de máxima probabilidad
ill
g -,." .
.::~~~;:i
j~,
If~
;;-:,;;
25:' EPIDEMIDLOGIAMODERN"
;:;
+ {ii In ( ~
(i.I ) [ 12.65]
1
d()lIde las frecuencias de celd¡1 adccuadas ti;, h,,. ti y Ji. $()Il I()~ valores
I
\',\Im de r. con do~ cola~, de 0.7, EStOS resultados son casi idéntico~ a los
oblcnido~ en la rórmula [ 12,60].
..1
Olra prueba de uniformidad de la razon de venta.ia sobre un
C()niUn1(\ de tabla~ de 2 x 2 fue propuesta por Zelen (1971), La prueba
..,
de Zelen plantea que se sumen los l- calculados para cada tabla de 2 x
2 lel cuLldrado de la rórmula [ 11.6] u [ I 1,8]) y que se resten de la suma de
los cuadrados de los l2 de M antel-Haenszel (rórmula [ 12.38]). El procedi-
miento de Zelen. sin embargo. no es \'álido en general: se han citado
contra ejemplos en lo~ que una razón de ventaja uniforme da una >:2 grande
para el test de Zelen y un resultad() de >:~ de cero cuando las razones de
vellta,ia especifica~ por estrato difieren considerablemente (Mantel er al.,
1977). N() se recomienda este procedimiento,
Ninguna de la~ prUebL\S consideradas
cuenta el pntrán de variabilidad
en esta sección tienen en
de los estimados del erecto a través de
J
lo~ estratos, Lo~ valores de >:2 calculados con la aplicación de estas
prucba~ son independiente$ de cualquier ordenación de los estratos, Si se
reorden"sen éstos. el resultado dc líl prueba no diret:iría. En principio.
~~
~Jj~4~j ,~~~~;
~
:~~
,~;
?:W2
i~
-~,
,~~1: .~.~..
~~.
1i1~;~
ANALISIS ESTRATIFICAOO 255
T:Jhl:J 12.11. E.,"li11/(1df/.\, d(' '.aZ(j,1 dl' la.\'a.\' d(' iII('idl'lIcia de 111UerleS
1/(.hidl1,\, II (.'lt(.,.,II(.llall ('nrmlaria (,/1 ¡;lma(lorl'.," re.\,pecl0 a lIO .¡;ll11adores.
(.lIlr(. m(;(/i('(1.\, h,.il(í,1i('().," 1~(lrm1(,.\'. .\,('Klíll la eda(1 ( da/(1.\, d('ll'jell1plo 12.2 )
630
,42
444,41
f 32 104
,
1,16
D ..
-,. ..c
:~
~s~~~~;~~.~.' ~~~~
~ ..~ -":.-.:..~-
256 EPIDEMIOLOGIA
MODERNA
j l
sclccci¿}n del estcilld¿lr. El segundo abordaje asigna pesos relativamente
mayores a las calegorias de edad más viejas. en las que el efecto es
pcqucño.
Los estimados est¿lndarizados. como 105 de conjunto. son siempre
IllCdias ponderadas de estimad05 dcl efccto específicos por estrato. Para
1IIcdidas dcl cfecl() que ~on difcrencias. la ponderación es la misma de 105
)
I'C~()S dcl cst;'llldar. PUCSl(1 que la difcrcllcia de la~as estandarizada puede ~
~Cí cxprc~ada como: ,
1
'11..R 1 1i
SI~D = .::11"i/<li
---~II"I - ::'-!0-
(1(\II(It' Ilj CS cl rl:S(\ csl¡ind;lr r;lra la c;ltc!!(\ría i. R1i es I;¡ la5a enlre lo~
:..\rllcc;t()~ c!1~,:?1cstr;II(\ i. R,)j c~ 1;1 I;IS;I cntrc los n()-eXpue5tos en el
L"\lr;II(\ i ~. kl); cs cl c.c;tim;ld() dl' la diícrc!1ci;J de la5a~ en el mismo
cslrato i. Par.1 mcdida~ del CfCClO que .c;on razón de tasas. 5in embargo. la
raZ()11 eslandarizada de la~a~ cs un;\ nledi(1 ponderada de valores
,
c~rccifico~ por eslralo. que ponderan dicha5 razone~ de tasas especificas
por e5trclto de acucrdo al producto del pcso del estándar por la tasa
~ntr~ I()~ n('-expuc~to5:
r.,I.~RR.
I J
-L,,';Ro¡RRj
-r.11"R o -- [12.66]
I I ~II.:
J
./,.
Ol~lldc R I~ es c1 cslimadl) de la razón dc 1~15a$en el e$trato ; y 11'; =
11¡R(\j.
La c~lructura dr la f()rmula II :.,6ó] revela p()r qué las dos razones de
la~as cslalldari7,:loas quc c()mbinall los c~timados puntuale5 específicos
p()r CSlral() de la tabla 12.11 esti\1l rucrtcmenle innuenciados por los
pcqueoos estimad()s dcl ercclo dc las c¿ltc1!()rías de edad más vieias, -J
I )ild() quc II'; c~ el product() dcl pcS() u5¡ldo para la e$tandarización )'
f\(li' cl \'alor de csltl Roj innucneiar:í la pondcración de los estimados
L"'rl:cífico~ por cstrato, Dchid() a ello. R()i aumenta fuertemente con la
~l
I.:Ua(¡ partl los dat()~ dcl e.icmplo I.:...:.. ma~nificandC' a5i la innuencia de
I()s ~rupo~ dc cdad mil~ vie.ios sobre 1:1 razón de tasas estalldarizadas
~Iobal. Incluso la SM R. e5tandarizadtl como está según la distribución
dc cd:ld de lo~ j()vcnes entre los pr()pios fumadores, es sólo un modesto
1.4:. dcbido a 1:1 innucncitl del Roj cn la cxpresión [12.66],
Ba.io cicrtas c()ndiciones, 1:1ccuación [ 12.66] puede scr aplicada a datos
dc cas()-control p:lra ohteller cstim:ldo~ dc 1:1razón dc tasas estandariza-
das a partir de cstudios dc ca.1\('-contr()1 (t\1iettinen, 1972). Considcremos
la SM R quc, como 5icmpre, cstil estalldarizada scgún 1:1 di5tribución de
la rohlación expuesta. Si N I i es el numer¡ldor y D I j el denominador de
la tasa en la población origen expuesta de 105 su.ietos que ha)' en la
categ()ri.1 ;, entonces aj = ,frn(il(N1i) y ti = ./~o(i)(D1i)' donde aj es el
;
Illlmer() de caso.1\ expue5tos en el estrato; del estudio de casos y i:j
%]:
-.
~~
~.
'-~ ':~.~"'.:: ,~,..
~~tJ.:~~~;
~~:w;itf~~~:~:~;j;
~~~\\\~~
~
l
257
ANALISISESTRATIFICAOO
u R1i =
QiIJ:a(il
{'i/frn(il
I~()i = ~
di¡j~ofil
"¡
í
v ¡v
bici
= L
III¡Roi
j= I dJca(jl
[12.6i]
L..I expresión [12.67] tiene la usual rorma de una SMR: a saber: razón del
numero observado de casos expuestos respecto de un número «espera-
do» o nulo. Dicho número esperado no es idéntico al del mismo nombre
que se utiliza para poner a prueba una hipótesis estadistica, que parte de
la premisa de que la hipótesis nula es correcta, lo que es algo que no
pucde ser ,1sumido cuando se procede a estimar. El número esperado de
1.1cx presión [ 12.67] il1dica cui1ntos casos expuestos se habrian observado
si la exposición c.lreciese de erecto, pero no implica ningún total
marginal que incluyese la celda a, puesto que esta celda a es, en cada
t.1bl.1 de 2 x 2. la que difiere respecto del valor nulo cuando la
exposición posee un erecto.
En los estudios de C:lso-control, resulta posible escoger otros están-
d.1res para proceder a la estandarización de los estimados de la razón de
t.1sas. Por ejemplo, si se toma \\'j como el tamaño del denominador de la
población no expuesta en la categoría i, igual a Dol = d¡/!co(i\' entonces
f ~Idi
SRR = i= 1 Ci
[12.68]
N
L bi
i: 1
~;:~?~~; !~.-~.
:'58 EPIDEMIOLOGIf\
MOOERNf\
I.:
:Isumiendo otr¿1 vez que la fraccián muestral de los casos es constante
I
.1 i() largo de los estratos.
Sc rueden calcular intervalos de confianza rara medidas del efeclo
cstandarizadas. rer() deben renejar el ratrón de los resos asignados por
cl csl.indar- rara diferenci.ls 01.' 1:lsa~ csland.lrizadas. una fórmula
;lrr(l\imildil <11.'lil \':lriiln7,:1 es'
-I
I \
\:ar (SI~D) ~ -~ Ir¡ \:ar (RD I l J 2.69]
( '11..)- , =
-I
d()nde \:ar (R1i) ~ \:ar (R(I;) pueden estimarse a partir del primer y
sc~lIlldo~ quchrados. rcspcclivamclltc. de las fórmulas [12.1] ó [12.6].
depelldiclld(\ dcl tip() de datos: la raiz cuadrada de Var [ln(SRR)] se
rllCdc cmplcilr CJl lil exrrcsi¿)J1 [ 10.4] para hallar limites de confianza
1
apr()ximados. -~
Para e.iemplificar la aplicaciól1 de la fórmula [12.70]. determinemos los
limites de confianza aproximados, al 90 por 100. de la SMR calcula.da en
el e.iemplo 12.2. Los pesos del estándar. que para una SMR es siempre el
.grupo expuesto. ~. los sumandos de las sumas necesarias para la varianza
del logaritm() dc la SMR se dan en la labia 12.12. La varianza es:
1.997.56
444.4 J:
= 0.00159 + 0.01025= 0.01184
I
~.¡
J
Los cillculo!' anillogos. para un estándar en que se asignase a cada
c.ltegoria un reS() de 1.0. que da una r.lzón de tasas estandarizada de
1.ló. d.lrian com() resultad() una varianz.1 de 0,0161. correspondiendo a
~.~~.
.~.;:~:...;.::
~ji:..
1;1
~
",..-
1
Catc~ ~Ori~l
11',
I \VjR,j \viRo1 1"lVar(R,,) wTVar(Ro,)
dc c' dad
--
<
~5- 44 51.4()7 32 i.58 32 15.56
45- 54 4.1.14X 104 4S :.63 104 197.03
J .'i.1\- (,4
h.'. 74
2X.ó12
12.6(,.~
206
IX6
14C
131
t.30
'.16
206
IR6
703.04
671.91
75. X4 .)..~ 17 102 112 ~.74 102 410.02
u exp[ln(I.16):t
.645(0.1269)] = 0.94. 1.43
.~ 2 ( 1 I I
L
i= 1
(biCi)
-!~-+-+-
di / \bi Ci di
)
L aj
I ,i= 1 di )
n
[) Uliliz:.lndo los dalos del ejemplo 12.5. se puede calcular que la SM R es
3.78 y la Vllr [In (SM R)] = 0,350, lo que da un intervalo de confianza al
90 por 100 de,
~
,645(.,,¡ ~0,350)] =
exp[ln (3,78) :t ,43. 10,0
r-
' 1
:
~
..
~::-:::T:.~~;:J:¡l:~ ~~
~~í ,;~~;
~
EPIDEMIOLOGI/I M()DERNA
26(\
t'I)I\) I):
I)ara los dalos del e.iempl() 12.5. la SRI~ de la fórmula '12.6g] es 3.9g y
1:1 \:ar [111 (SRI~)] = O.3Rl. dalldo lil1 inlervaJo de confianza al 90 por
1{){\ dc
.
dc la~i\~ pilrccc \'ariar dt' form:\ lincal COIl la edad. es posible expresar
I
dicha ra7:011 tIc ta~i\S como función de Jinca recla de la edad:
':.~~.
it; .f.~;..
.-;-*
o 40 50 60 70 80
EDAD
2.0
IV
.
'ü
c:
OJ
-0
1 . r.
'ü
c:
a>
-0 10
II) .
IV
II)
~
a>
-0 0.5
c:
.0
N
IV
~~~
o:: -..
o
40 50 60 70 80
EDAD
Fig. 12.4. LoKaritm(l de l(l.t e.ttimad(l.~ de la ra=ó" d(' ta.ta~ d(' i"ridr"rin d('
mucrt(' coro"aria para ",(;d;co.~ hritá,,;co.~ fi'mad(}r('.~, C(I',lpnr(ld(l.t C(I/I II(/ ./I11/l(ld(/-
res, por edad ( d(}t(l.~ dcl ('j('mpl(l 12.2 ) )' lí"ca dc reRr('.~ió" Jlmld(.rad(1 all(. clln(l,.a.
~
~
EPIDEMIOLOGIA MODERNA
REFERENCIAS
Hrc~I('1\\'. N. Odd~ ralio estimators when the data are sparse. Biometrika
, 9R , :68:73-R4.
nrcsl('1\\.. N. E.. and Lian~. K. \'. The variance or the Mantel-Haenszel
cstimnlor. Bi()111(,lric.~1982:38:943-952.
( .ornficld. J. A statistical problcm ari~ing rrom retrospective studies. Proc. Third
/J(',.".(,/(..I.S.I.',lp(J.~.1965:4: 135- '48.
~~
~.
l~~:~:~; ;~J%: ~
~- ~ ,,:..,.,..~..
~~
'~..:.:- ;- o
.:::
..~'~'
~::.-"
gt,
;~'.~
;~t;f.:
.1~i~~. ~J~\~" ...
:;;;o:;;.;...:..:..;;.'-.,
fJ
,f I
j .
!
~~
~.~:(~:~~: !¡¡1\
;:~: ;J::~:
J~-,-.
13.
,<'t.
~;
r ](ir EPIDEMIOLOGIA MODERNA
..14.5(1(J + )(){))!I.OQO.OO(J
1{ICSI!('
-(5(1rclall"() hrtlto = + 90)/I.OOU.OOO
-= 32.9
Kllt~~:~~~&j~ ,~
~~'
;;i~~:
:ltf:~.
¡~\im~ ~t1~l\\j
<;
l
AP AR EAM I ENTO 267
I Icmhras Total
V;,rlllll:~
No
1:.XI"Il:SIIIS :xpllcstas
I;Xrllcstos
10 I 460 46
( .;ISIIS 45() 45
10.00O IO.OOO IOO.OOO 100.000
1111;11 ()().( 1( 1() ,)().()()()
RR = 10 Bruto RR = lO
I~ 1{ I()
~-
l-
la ro¡,ortc ~xpue5ta. El propósito de aparear por el sexo la cohorte no
t:..~puesta al grupo expuesto es prevenir la confusión por dicha rúbrica.
u I)e los I()().()()() \.ar('1nes no expue$tos en la población origen, 90.000
t:.starían ~" lIl' ~rllr<1 de comparación apare~ldo, correspondiente a los
I)().()()()v;lrollc.<; CXr\l~st<'.<;dcll:.<;tudio. De las 900.000 hembras no expues-
las. I().()()() rcsull;¡ri¡lll sclcccion;¡das p¡lra emparejarlas con las 10.000
11t:.llll,r;ls I;xpllCSI;¡s.
Los resultados «esperados» del estudio de cohorte apareada descri-
to :lqui se indican en la tabla 13.2. El riesgo relativo esperado. en la
población estudio. es de 10 para los varones y lO para las hembras y
también es lO para los dalos brutos del estudio. El apareamiento ha
cumpiido. aparentemente. sus propósitos: no hay confusión por el sexo.
ruesto que el sexo en la población estudio, debido a haberse apareado.
110e5t{1 relacionado con la exposición.
L¡l situación difiere notablemente. sin embargo, si por el contrario lo
u lllle se realiz,l e5 un estudio de caso-control. Consideremos un estudio de
I;ste tipo b,lS,ldo en el total de 4.740 casos que ocurren durante un año
CIl la población origen. De estos casos. 4.550 son varones. Supongamos
~
tj elltollces que se seleccionan de la población origen 4.740 controles apa-
re..ldos por género a los casos. de modo que 4.550 de los controles sean
también v..lrones. De los 4.550 varones, se espera que alrededor del 90
ffi
ti por 100, 4.095, e5tarán expuestos. ya que el 90 por 100 de los varones de
1,1pobl..1ción origen lo están. De los 190 controles hembras, esperamos
4ue alrededor del 10 por 100, 19. estarán expuestas, correspondiendo al
I () por 100 que lo está en la población origen. Para la serie de los
~ <.:Olltroles en su conjunto, el número esperado de sujetos expuestos es
4.095 + 19 = 4.114, de un total de 4.740. Para los casos, 4.500 + 100 =
&1 4.600 de los 4.740 estarían expuestos. El estimado bruto del efecto,
[d b..lsado en la razón de ventaja de los datos brutos es:
(ji (4.600)(626)
[.1 Riesgo relativo bruto = = 50
,
(4.114)(140)
"~
~:~l~~~. ~~j]
:~\~~\\~~\~
~
..-""
'tf~;, ~
~l
~i
,¡;F. EPIDEMIOlOGIAMODERNA ~:.
~;
I
"..;~~
~i-
mi...xot...;.::-:..:..,,~~
~~. ~¡~
.~
~.
l APAREAMIENTO 269
-.1
" ' , -*
.:,:~:;;~Jt~;
J~¡:.~¡:¡~~:.
~~-
~"~.
27(1 EPIDEMIOLOGIA
MODERNA 1
il1troducirá Cl1 csos casos se$go alguno, Puesto que e$til ostensiblemente
moti\'.lti(1 por la nece5idad de controlar la confusión que elOos) factor(es)
dc aparcamient() produce(n). cabria esperar. por lo general, que existiese
cicrta corrclaci()1l entre é~tc(csto~) y la expo~ición, Si tal correlación es
ccr(). cs quc cl f;lct()r dc aparc.lmicnt() 11(\ estaba collfulldiend() de ante-
Iltalt(), plICSt(\ lJlIC un factor (It' confusi()1l dchc estar asociad() tanto con
]
1;1 cxp()~ici()lt como C()1l la ellfcrmctl;lti,
1\;lrcL.t' quc el apareamiento. aunqut' concebid() para c()ntrolar la
L\)Il(lISi()n, n(1 coll~i!!ue ese ob,ieti\'o en lo~ estudios de ca5o-control,
t\r;lrclltcmcntc. cfcctlla 5implcmente una 5ustitución de la anligua es-
trllctur¡1 dc c(1Itfusi()lt por otra nueva, Dc hecho. puede incluso introdu-
t'irl.1 ti('lltlc prcviamcltlC 1l0 cxi5lia ninguna: si el factor de apareamiento
Il() e~ti\ rclacionad() COIl la enfermedad en la población origen. en condi-
ci()nc" Il(\rmalcs no c()nflllldiril: n(\ ()bst¡lnte, si está correlacionado con
I;! cxposiciól1 en Ull estudi() d~ caso-control, 5~ convertirá en factor de
(,:oltfllsi()1l tra~ lJue sc apc.lrease por él, Ell la tabla 13,4 se ilustra esta
sitllaci()Il, ell dolldc la exposicióll tiene un efect() correspondiente a un
rics.!:!(\ relati\,o de 5,6 y no hay collfusiól1 en 13 población origen; sin j
cnlbar!:!(). si ~c usall lo~ ca~os com() base para un estudi() de caso-control
~ se .Iparea por gcller() a I()~ caso,<; una 5erie de control. el \'alor esperado
tic! estimad() hrut() de! CfCCto $acad() del estudi() citado de ca50-control
c~ 2.1. cn VC7.dcl \'alor corrcct(1 de 5.6. En la población origen. el sexo no
c.;til c(lrrclacion;ld(1 COIl 1;1cnfermedc.¡d cntre los n()-expue~tos. siendo la
rrc\.alcl1cia de 1.1 misma dc dos sobre mil. tant() para los \'arones como
p;lr:1 1¡1, hcmhras n(1 CXpllC~t:¡S. El ScX() sí est{1 fllcrtemente correlaciona-
(1(1 t'(\1l 1;1cxp()sici()lt. sill cmhargo. En el e$tudio dc ca$o-control. el sexo
cst.i l'()nrulltliclttl() porlJlIt: fue un factor de apareamiento que estaba
L'(\rrclilcion¡lti() con 1.\ exposición. A pe5ar de la ausencia de correlación
entrc scxo ~' enfermedad entre los no-expuestos de la población origen. el
ar:lrcamientn ha introducido en los dato~ de caso~ \' controle5 una
c()rrcl:¡ci()11 elttrc scxo ~' enfermcdad en el $cn() de los cilado~ no-cxpues-
t(\s. 1:1 rCSUll,\d{1 es un e$timado bruto del efecto, 2.1. que subestima
scri:¡mcntc el \';llar corrccto. que es 5.6,
I.il confllsi()lt illtroducid(1 en un e~tudio de caso-contro! por el apa-
r'.::¡micllto e11modo alglln{\ carece de remedio. Obsérvese que en las tablas
1.1".""~ I ~.4, !()S estimado~ del eíecto específicos por e$trat() son válidos: la
(;('Ilfusión pucde eliminar5e mediante un análisi~ estratificado que lle\'ase
a un estimatlo conjuntado del efecto tras estratificar según el(Jos) factor(es)
dc ;Ip;¡reamicnlo. La tabla 13.4 ilustra la necesidad de un análisis que
climillc esta confusi()n debida a factores de apareamiento, ya que la
tccni(;a pucde call.C;¡lr confu5ión, aunque originalmente no hubiese ningu-
Ita (como ante.c; $e $cfialab¡l), En dichí1 tabla, el criterio de selección
Iltili7ado para apare;¡r 10$ controles hace a esta serie de control no
rcprcsclltaliv¡1 dc la poblaci()n ori!!ell con respecto a la exposición: ello
L.()lldllciria (1 lIll Se5!!() de .c;elecci()n. 5i no fuese por el hecho de que se le
plll'dc L'ontro!:¡r Clt el anillisis. lo quc hacc factible considerarle como un
f;IL'\Or dt' L.ollftlsi()n,
~~
~~-~
~
APAREAMIENTO 271
1
~
.-
5
J
~ ~
~ ':: ~
;,., I
:--.:: ."'
~ ~
"' ... 1-
'"' ::
"::1 "' .:::
-~
--
~ ,.
~ ~
~ ':::
---= ~
--
:§ ~
."
~ ':: ~ ¡ ---
-::.~
-.- ~ Ñ 5
:: ": ;
-~=
u ~
.-~
..
.: ~
..:
::.
~
:!1
-=
.c z
~
".)
~
i
I
,
i
~
~
c
~ -o.
""'
-.-
,., .- - ~ I '1
~"' ;)
(~
.~..t. "'
.,
.~ :: 0"\ c
~ ~ c
..::: -- :J ~ c
"'-:: ~
~ ~ o. 0' c
""
~~~ - ..'
~-- -
--
-~
~ ~
-
::~ ...
, .-
:IJ
~
.L:
.::? -:;
.--
:"" ~ -
...
~ ~ .o
~":: .Ü
:-:
~ ~ ..- ::5
,. -
O
0-
~-=
.-
"' ~
--.
-~
~~
~ -=
~ -
..-
~ ~
i'
..,: 5 ."'
~ t"\ "'
~
~"'::
:E
~
~ "'='
~
"'=' (/)
¡~ ~ ~
I' ~ E -:
~ ...::.
~ ~ o
E c f-
...~
~ o
c Z
,UJ
1:!1
9 ~
.~
1I11 1;¡ :~~
~
EPIDEMIDlOGII\ MODEnNI\
--
~~:?',~ ~
É~:
;~~"'
.~
;j~,:'f~
\;~l.
~~~ ~~~
A.~ ;.;:;;..~~;;;., J"".'.;.;.¡¡;'.¡~
APAREAMIENTO 273
..t~
,~:~. ::;¡:i:;:;i
::~?~~~~
,ii
E PIDEMIOLOGIA MODERNA
-,.~.
.~~ ~;~
-~."
:i1-!"i;.':
j;!1::; :;,...;.. ~.-- .;, ".
~
APAREAMIENTO 275.
~
Jcl1tro Je c.1da una de ellas caerán uno o muy pocos sujetos. En un [t
allillisi5 c5tr.1tific.1do 5in apareamiento. la mayoría de los estratos tendría ~
~.
s(ilo UI1 5ujeto. ruese un caso o un control y ninguna inrormación sobre ft
cl crecto. .1 no 5er que los sujetos control hubiesen sido apareados a los t
C.:.IS0Sp.1ra el valor del raCtor en cuestión. Variables continuas como la r
u
-~-
-. :::;:.
.:.~.:.
~
-~ ;;¡~";;:
..".;.;.~..:-'"'-..
-~
¡*.
J[] ~.~~;;:;;;.~::;;.~~.:;;~;;,,;...:. ,;;;.'",»*",;.~"".;.",..,..~,
APAREAMIENTO
;~~;:
=,:::;-;- c :.;
":'.-
:."'.' :---:'t-- ;~i~~;
,.:.'
~
...;0:¡;.~.;,;;;;w;
EPIDEMIDLOGIA MDDERNA
rllCrll:. c.icrccr:i Ul1 crcclo dc confusión débil: aparear por un factor así
iI11riic:lr:i una rcrdida relativamenle grande de información. en compa-
raci()n con el an&ilisi~ brutu. a causa dc la estrecha correlación con la
cxpo...ición. El &ln¡'lli...is bruto. no obstantc. deja de ser una alternativa
:Inropiad&\ si cllaclor e... un factor dc confusión genuino. Una alternativa
r:I'/.(\nablc de apareamiento de un factor de confusión la constitu~'e el
;ln¡llisi~ e...tratificado sin aparear. Hacerlo me.iora teóricamente la eficien-
l"1;l ai C...l;lhiliz;lr la razón controles,ca...o~ que habrá en ~I análisis. pero la
rcdllce de hcch(1 porquc causa pérdida de información en algunos estra-
I()S Cl1 los qllc 1;1 información de cxposición fuese concordante. Si los
cstral(\~ clcmcnlíllcs corre...polldicn1cs a cada con.junto apareado tienen
Ul1 I)llmcr(\ ra7011ablemcnte !!r:.lnde de col1lroles. es improbable una
t'()nCOrdaI1cia completa: por cl contrario. ti.ll concordancia es mu~. pr()-
h;lblc cu&lndo i() que se aparea es una pare.ja. Si en el análisis dichos
cstr¡\tos clementales pueden combin:.lrse. lo que es una posibilidad cuan-
d() ~ál() h¡I~. uno., pocos factores de ap:.lreamiento con un modesto
nllmCr() de categorias. es mucho menos probable que ha~'a márgenes
cer(\ p:.lra la~ tahlas de 2 x.? de dich() análisis. La probabilidad se
rcdllce aun mil~ si lo~ faclore~ de apareamiento no están fuertemente
l:orrelacion&\dos con la cxposición. aunque deberia recordarse que la
c(\nfu~il\n que impulsa a aparcar depende de 1:.\ magnitud de la asocia-
cil)n entre el factor potencinl de conru...ián ~. la exposición: si no ha~.
a"()ciacii)n. n() híl~ t:onfu~ión. Si sc picnst\ que e! diseño de un estudio
r')d(i;1 Ilc\'ar :1 nluch()~ estr¡llo~ clcmenlales con márgenc... cero. el \'alor
(1l:1ararc;lmienl() c...tt\hilizand() la ra7.i)ll cnlre caso~ ~' controle~ de c:.\ra (1
nlcj()rar 1:1cficit'nci:¡ del e~tudio debe scr sopesado frcnte a la pérdida de
inf~)rlllación dcri\.adu de] hecho de que ha~.a historias de exposición
conC()rd:lnle~. Aparear sobre un factor de confusión débil que fuese un
correlat() fuertc de In exposición podria ser considerado como una forma
dc sohrcapare(1miento. ya que aparear en si resulta caro y puede condu-
cir a un ani\lisis menos eficiente que la alternativa de estratificar sin
ararc¡lmiento. La forma fundamental de me.jorar la eficiencia del estudio
l'uanc.l(\ ...e con...ic.lera la posibilidad de aparear por un correlato fuerte de
la exr()sici()n con~iste en aumentar la razón de controles a casos. dismi-
nll~.cnd() de e~e modo la probabilidad de que aparezca un margen cero
en la labIa de 2 x 2 que corresponde a cada conjunto apareado.
Otra raz()n por la que algunas veces se emplea la técnica que nos ocupa
es ohtcner comparabilidad en la calidad de la información recogida. Una
~:;:;;:"c ~.
,.0;~
¡~?~
.
1 APAREAMIENTO 279
sitll:ICiilll líric:t Cll 1:1 qtlc tal aparcamicnto podría llevarse a cabo seria
1 tlll csl tldí(} dc ca!\o-(;olttrol
111tlcrt(} ya y 11t1hicra que entrevistar
cn el qtle alguno o todos los casos hubiesen
a otras personas para obtener
información ,tccrca de la exposición y de posibles factores de confusión.
~
r. 1 En principio. los controles de los casos fallecidos deberían estar vivos, ~\.
::.:
porque constituyen una muestra de la población origen que dio lugar a
los C,lSOS. En la pritctica, como se presume por lo general que los datos
dc entrevist,tr ,1 tcrcer,ts personas diferiritn en calidad respecto de los que
H se obtendrían entrevistando directamente a los sujetos, muchos investi-
~adorcs prefieren ap,lre,lr a C,tSOS muertos controles muertos. No está
claro. sin emb,lrgo. quc sca justificable aparear según la calidad de la
p
~l informaci(>n. Si bien el uso de estos controles muertos puede justificarse
cn csttldio~ dc ttmort"lidad proporcional». esencialmente como una con-
\'cnienci,t (\'ca~c (."r. (}). no Itay certeza de que aparear sobre la calidad
f
,J UC inf(}rm:ll:i(ln rt:lillzc,t cl scsgo tot,ll, M uchas de las asunciones acerca
UC la <:~tlill,lu uc I(>s datos rccogidos a terccras personas. por ejemplo. no
cstiln comprohadas {Gordis. 1982). Más ,lún. la comparabilidad de la
l:alidad de la información sigue permitiendo el sesgo debido a la ciasifi-
(.'~lción incorrecta no diferencial. que es más grave en los estudios aparea-
dos que en los que no lo están (Greenland. 1982) y que puede ser más
severo que el sesgo debido a una clasificación incorrecta diferencial que
surgiese de la no-comparabilidad (Greenland y Robins, 1985b).
Resumiendo. los lados oscuros que tiene el apareamiento en los
cstudios de c~lso-control y la relación del apareamiento con la confusión
:' con la eficiencia del estudio. son mucho más complicados de lo que
lIno cn principio pudiera suponerse. Se ha empleado frecuentemente esta
técnic,1 en ocasiones en que hubieran sido preferibles alternativas más
scncillas :' más baratas. Aparear está claramente indicado sólo en cir-
<:unst,lncias estrictamente definidas. En muchas situaciones de estudio, la
uccisii)n dcsc~lnsa cn consideraciones de coste y eficiencia que bordean lo
I impondcr:lhlc.
J.
".~~
..
;~1;j¡~~¡i1f~
~
28(\ EPIDEMIOLOGIA
MODERNA
:1
,.."..
~".--;c:
-~
~\~tc: :?;':::~;¡:
.' oc
;~~.
:'3.
\~~j~~:~r~~ .$~~:~J;
C-:..
APAREAMIENTO 281
a cvlltrol apareallo
,.1
D
a E u T E u T
(":ISO o o
o o
m ('¡l11lrll\
T()talc~ 2 o 2 o 2 2
I9 .
,~:~~~ :!5&:
APAREAMIENTO 283
'1
I:.~TIMACION I>UNTUAL DEL RIESGO RELATIVO
l.ON R CONTI~OLES APARE/\DOS EN CADA CASO
1.3hla 13.6. R('.Sllm('I' dl' I(),s datOS. cllal'do .se tienel' R col1lroles aparl'ados
(I cadll ('a,s(). il'dical'do la jrecllencia (I;J de lo.s COI'j,II1lOS
a!'ar('(IJn,s ('()I' cad(l !'atróll de e.~!,osición pn,sihle
,H
Número de controles expuestos
o 2 3 R
4
u
~
.,~
;~~..
\fr~\~\r:\:~~;W~
.:lffl;;.~:~;';;:;:~.~;,
I' .~~J~t~~~~l~.
inr(}rmati\'os SOll aqllellos pclra los cuales I ~ //1 ~ R. con todos los I
t(}tall's n1:1r~il1:lles n(} il!uc\les a cero, Parcl un valor dado de m. hay dos
r:llr(}nl's
r(}IIUl'11
rl)~ihlcs
:1 quc el casI}
ut: cxposición
se.1 CxpUC$to
p.lrc\ el conjunto
). III -I controles
ap.\rccldo.
también
que corres-
lo sean
1
11 :1 lllll' l'1 Cc\SI) '1() i() sca ). III controles si lo 5Can, ¡\ partir de la
llislril,\lIl'il)'l hipcr~c()mélric:1 1l() cel1lral, 1:1 probc1bilidad de quc, dados
1/1 s\lil'I(1S cXPUCSII}S, 11n Ca~(1 lo ~C;¡ t;¡mhicn, e~: ]
111(OI~)
I'r Il';ISII SC;I l'xrIICSI<\, uC\<los 1111 =
I~ + -111 + 111(OR)
OR
[13.3]
III
:I
;..1
r:lr;1 III = I. h;I~. 1111 1()lal <.Ic f;(1 + .fr;, C(}J1.iuJ11O.C;). dado que exacta-
mc111L' I sli.icl(} dc liJ1 c(}n.illnto e.c;til exrueslo. la probabi)idad de exposi-
l.i()I1. :1 partir dc I;\ ccliaci()J1 [ 13.J]. es OR/(OR + R). La probabilidad
1
<.Ir ()hscr\.(\r ex.lclameJ1te ./1(1 y .I~I con.iuntos con el caso expuesto )' no-
j
CXrIICSI(). rcsrccti\.ameJ1te. dado un total de.I;() + .k\ conjuntos con un
Pcl
sll.icl() cxrllc~to c.c;
.j
+ 1;¡.1" OR )'; 1
I)r =
~ I RJI ( I; ."1
1/1: .1; ,111 )((R+ 171)i177 + OR
(R + -I1l)i,11
[ 13.5]
R + IR)r;,...
.."'
~
;iil.~~
~
~.
rI
~1
111
R
\
Lo
"'=
j u
b,
:;:f~i~1:~
t~
~~~ ~~
.,~-:.:.:
;j~~;:~
~
jf~;~ :ii~1
~~ ~
1 ;
~~'::
Control ;Íj:
.;.
C:ISO
..
.' A
..¡. ..¡.
-
--
+ -;- +
+ +
+ + +
- + - +
+
+ ...
;
!'
-! =- :Ihorlll indll'idn prC\,íll; -= no ahorlo inducido f
rrCVI(\,
4~.
:!¡:-
.-.~.~¡~:7~:'.
~
-"--.
~;
-,,-:
.,~
APAREAMIENTO 287
":lhl:l 13.7. P(/(r(ill d(' ('.,"pn.\"iciÓlI (le 1(1.\" 1('1' ('(1IljUIl((I.\" (111(/r('(((/(J.\.
(1('1 ('j('III"I(1 13.1
---
2 3 4
I (.I )
R
¿ r L .I'I. ," -, 1 R + fo.m-
'" = I ¡;.m- = o
L [13.8]
1( L 00 m= 1 (R + -1'1 OR
Los dalos del ejemplo 13.2 provienen de un estudio de infarto de
mi()cardio c hisloria de consumo de c:lfe (Jick el al., 1973). Los autores
:'".;,,;'
i
"':
,;,¡;:~~
~~
¡~: :~¡j
~~¡\~
:¡::'~~;:~:~~;:~;;:
,-:;;.,
'
f 'f;
j .-~:
illtclll:lron LlrarC:lr dos controles a CL\dL\ ca~o. pero para 27 de éstos sólo
Ilahi:l un c:ol1lrol Llrarcado disponible. El re~ultado fueron 27 pare5
:Ir:trc:luos ~. R~ lriplcles Llpare.ldos. El us<, de estos dato5 y de la ecua-
l'j{111 II.\.X I par:1 uclcrmil1.\r el e~lim:td(1 dc mi\xima proh.lbilidad de la
r:1/1111llr \'l:III:t.i:1 pr(1UIIC:C 1:1siJ:!uicl1lC l:CII:ICii111 rroh:thilislic.\:
~ l
J = o
I + --:;:::;..
~l)
-3joi.- ~-
' ...'
) 1{ () l~ -1 .OR
O R + 2 O r~ + I i':!
U;111d11 Sl: rc.:sllclvc 1;1 al1lcri()r ccuaci¿)11 por cl1sayo y error. sale óR
~.I).
-,-- ~-
Parc~ ararc¡id()~ Triplcte~ apareado~
() o
I
<..;!,(\ 1
(\~ 1;11:.1~ ;11 ui~1 ¡; F t~ 2:; 4
II 1;l/;I~ ;11 di:1 .1:, ~ 20 22 3
[13.9]
Ii !~:~;\~
~~~:?::.
~,:.:
~
,;;.
::!¡;t~:\~~;t~~~ r,~:.
.:o;¡;,,:..:
I
l"OM PI~()13,\l.ION 1)1: I1IP()TESIS PAR¡\ PARES
DE (',\SO-CONTROL i\PARE..\DOS
p de Fisher =
11~flnt ('¡¡0 + .fol
Jln+Jol
k = J lO k
)(~) [13.10]
8
p:t ra I; o ~ .f~ I. Si .1;)I > .1;o. la cola inferior debe calcularse mediante
suma sobre el rango O ~ 1\ ~ .1;0.
Para oblener el valor exaclo de la media P, sólo habria que incluir la
mitad de la probabilidad de los datos observados. Para la cola superior,
e5la modificación da:
Si .I~ I > .1;o. la cola inferior debe calcularse mediante suma sobre el
rango O ~ k' ~ ,1;o -I.
l~onsideremos los datos del ejemplo 13.2 en relación sólo a los pares
:lrarc~ldos. Los 16 pares para los cuales la historia de exposición era
1.:()llcordalllc no conlribuycn a la evaluación y deben ser ignorados. De
,~.
.:-~: ~,
;~.-;:
I~
.::~:::~:~;::
:\~~.
\~:f~f\\;::.:~:;;; .:~¿;
::f'
~,.
(1.070
Ulilizand() C\'l',\"1 estadíslic() de Mantel-Haenszel (rórmula [12.38]) se
rlledc calculttr un vt¡lor de p aprOXim(ldo. Para pare~ apareados. queda
simpliflc(ld() a
quc es una f()rma dcllest descrito en primer lugar por McNemar (1947)
~ ,\1 quc se c<'nocc frccuenlemente como lest de McNemar.
Par..\ I()s datos de los pares apareado.' del e.iemplo 13.2. esta fórmula
d;1
8- ~
z = :i-i = .51
,
l1\IC l:()rrcspondc a un \'al(1r del' c()n \Ina l:ola de 0.07. I() que concuerda
!,\icl1 l:()n cl valor CX¡IClO de 1¡\ mcdi¡\ I' inclus<, para estos números
,..~
i
manirlC~lamentc pequeños. ;.1
P'1
j
COMPROB/\CION DE HIPOTESIS CUANDO SE TIENE R I
, 'f
..
..;.
:~."'T;:.-.
.~.
~iJ~~} -,...
:~~:f:
.rr ,;;:::.;;.~:~:~~;;.~.: .,.~.. -c~rt,~(i;
n
APAREAMIENTO 291
" I ,~
'I I ."' I + ' ~(. .1/1
) I 11' ) k," 'R + 1- )
11' f;.~-,+fn.~-k,
--
"
I.
II /II:
II
I 1,'!I R + I , R +
I [13.13]
:I II = \
I!
/; .1"-
." !
\R f .J- .
~ 1\11 =
'-' 1.111- I' h.m
m=1
R
k = )~ k m
m=1
~ .
1:1 stlmalorio de la cola incluye todas las combinación de los datos que
podrian dar origen a lodos los \'alores de k en el rango que va desde a
;i 1,~\Sla .\11" Para ¡~\ probabilidad de la cola inferior. e! rango de! sumato-
4
,
.
) rio de ". V~\ desde O h~\sta a.
" P~\ra oblener el valor medio de p exacto. es necesario incluir sólo la
s
~ mit~\d de la prob,\bilidad para k = a. de la manera siguiente:
k=7+lm=1 km R + I R + 1
[13.14]
.l
g
$.
i¡j~:
:;;~:.':;.::.".'::""': , :-:,;-.-;',"
~
.
::f.::~~:~: ,o;.
:~~:~:
~~~t\~f\tf~~'
= = O.()OOOO354
\~
'1
J)ar.! 1(\-, .d.\10S ohscr\.ados. la probabilidad es
-.1
i
~1
,:1
!'"1
.~l
--\
~
-..r:
;~:-.~.
.
:;-'J~'!
.--
..'.
:::~~~t~~~
1~J~:=
APAREAMIENTO 293
llUC C-" poc;o mils de la mitad del valor exacto de p de Fisher. ya que el
J rcsllltad() oh-"crvad() cs el scgundo resultudo más extremo posible en la
L'ola superior.
La L'omprobacióll aproximada de hipótesis con R controles uparea-
ti{)-" ,l cad,l caso puede. una vez m,1s. obtenerse con la prueba de Mantel-
Ilaenszel (f()rmula [12.38J). Con un caso y R controles en cada estrato.
1;¡ prucha puede replantearse en términos de la distribución de los
(.."onjunt()s ,1pareados como:
z = [13.15]
23
--
5
x
ki::-" ,~ III ~ I km R + l R + 1
[13.16]
-$
.-.::;;,¿¡~~~~.:;
';': :
~
~"
II
111
10".
'R + -',I +.fn... -k
~ I rol n (II.," R + I R+
-1-" R ,"~I k",
\',
\
'fl.", -t. ./o.nl III Ion.
R+ -m ,11-*-1 +1;,-*-1..*
7. II
"'
R + I R+
[13.17]
':1
i
z = [13.18] r.,
I, f
i '- I; .",-
\' 1¡'" "' "
+ 16 -(~)(:
z = = 2,79
v
lJIIl' L"(\rrC~r(\lltll' a lill \'alar de J> can una cola de 0.0026. en buena
t'(\nson:lncia con cl \'alar tic la medi.1 !' ~urcrior.
,;,. .
iB .,~~.
c.;,..."..,
Al..,"'~
~;~~~~
..
, :..;;.;;~~~~."i;i;,~'oi.;;:'",;.: ~",k:";,;.;;oc",x;,;'.;:;:.~~~->:;,-;;:::.,-;;:-~:'.;,:" ~.~
\PAREAMIENTO 295
:XI.?
, = -:;
I ~f;o + JOl ( )( QR ) flO ( I +
-ho 1 .}101
-+- J.,lt¡.r,t,
¿
('I"
.I()
+ í
"'(II
)(QR + r"\R
~
1
) ( k
-/
QR
I
+
) fIO+fOI-k
[13.21]
.
JOI
-:x/2 = ~ ( J~o + J~1\ ( ~' ,110 1
+
2\ ,ho }\OR: + 1, .,()""R:+l
+
f'nffn, (1;0 + 101\ ( ~ \k
1 flo+fol-t
[13.22]
k=fIU+l k} -o-R: + 1} ,O'R:+T1
,[~
i~~..
I-~
~
::~~}:~;;
','::. :j~i~
.,.,...
~\\:~.:'{
-~-
~~r,\ ..\~\~.:
2~(; EPIDEMIOLOGIAMODEnNA
hil\omíal ~sljm¡I(lo ror och() éxílo~ cn II el\sayos. Los límíles de con- :,:.1 p
l.('rrl.~r()I1(I~ :1 lIl1 i I1lcr\.., I() dc conlia I\Z:I cxaclo dc Fjsher al 90 por t ()O ] q
l)() r()r I()l). Lo ¡\mrli() dc los Ijmile.' rcnc.i.¡ I() pequeilo del númer() de d
a
r¡lrCS disl.ord¡ll\(es.
1
r¡lr¡1 parcs dc C¡lS()-conlrol ¡lparc.\dos sc pueden delerminar Ijmiles d
;. {
f I;
[13.24] :¡
9 t
~j i
t
J (:
: ~
.
[ 13.25]
¡1
,,~.
.;j~~~.
:::~":¡:
¿,~~:.
"",",,,j,~~~;~;~~~
J APAREAMIENTO
T l
~
' z'
+ ~ + Z J '~
'r '1 "',
+ -
Z2
"7'
J [ 13.26]
T + 22 T 2T- TJ 4T2
c:
~~
.~
.:~~..:,~.;.;.:.~:.::.. !~~
:r\~~tr~~~i~r~ir
~
:~~~?~i; .~;...
4c !iii'J~
EPIDEMIOLOGIA MODERNA l
la r¡¡ZOn de venl.¡.i¡¡. Par.l dalO$ apare.¡dos de caso-control. la varianza
<.\cl cstimcl<.\() de milXima probabilidad de la razón de venta.ia ha sido ~~
<.\cSLli¡a por tvtiettinen (19701. Como e$ habitual con los eslimadore$ de Jr
r;¡z(,¡l. los limites de cOl1fianZCI se obtienen por transrormaciól1 logarilmi-
<:;1 (Icl e~timad(1 )' luego se invicrle lal lr.¡n~rormación. Para pare.jas
;¡rilrc;l<.\as. la f()rmula de mueslra grande de la varianza dellogarilmo de 1~
1:1 r:¡7.()ll <.\c vcl1la.ja es
1
[ 13.27] A
.1JIJ.fII J
.I~ I .-.~
~
~,
L I ( I; o ) + Z I Ii (' + .f~ I
ex p I1 --- J n
[ 13.29]
r -I f .(
/(111 \. .IO.IOJ
-IR p
1);lr:\ I()s d:ltos de p:lre.i:ls :lp:lrc:ld:ls dcl c.jempl() 13..:.. la varianza se o
L'~lim:1 :1 r;lrtir dl' l.1 r()rmul.1 [ 1~..:.7J ~. e~ II '2A = O.45~ ~' los limites de
"te'
collri.lnz.\ :III.)() por 100. COn las rórmul.ls [ I J.2g] ~. [ 13.29]. dando 0.88 y
X.12. Co!lsider.l!ld() la~ pocos pares implicadas. esta aproximación da
cxcelentc~ rcslllt;ld()~ rar;1 los d:llos I.JUl' IJ()S ocupan: el pU!lt() de delimi- "
tL\Ci()1l i!lrerior es c.I.C;i i!!u;11 al limite infcri()r exacto dc la media p -\' el I
~
super!or estil r.1ZOllableme!lte cerca del correspondiente limite exacto
q
supcrl()r. ,~ II
C-am() los estim.tdores de máxima probabilidad y de Mantel-Haens- "
lci sall las mismas p.lra pares .1pareado~ de caso-control. no es sor- ..ic
c
prL'lldc!lte el}C()ntr.lr que I.1 r¿)rmula [ 1.:..5g] de la varianza del logaritmo
~] . r
dcl c.c;tim.ldor de M.lntel-Haensze1 sca idéntica a la rórmula [13.27].
c
cu;lnd() sc .lplic.1 .1 dichas p.lre.ia~ .1r.lrC:ldCls.
(
()tr.1 f()rm.1 de .1bordar las limj\e~ dc callri.1nza apraximado~ de la
r.lz(\JJ dc \'cnt.l.i.l. estimados a p.lrtir dl' pares de cas()-control aparcados.
cs el métod('\ basado. en el test. Con este tipo de pares, los limites !;11
"j
h.I.C;.ldos en dicho les\ son:
~~
.10 } (I fZlxl
J
[ 13.30]
~j
f~1
¡~~~~\~t~~ ..~.
:,':~.
t1~;~~
j;~~.i;~~~::-
c.; ~\\l~~t~~m;. ¡~ ~~~.t;~~':
-
,...'-o!... :l:ru[=j c ,~>;.:~..."' ,~,~~~:':i-.~:.;:0.;:"~
()I{ ) ~"
n.-
'I.", Cm ~;
I) tl¡lll\~
",-1" /1".1-1
.II' ".¿)-R."~-(",/ "OR+Cm
[13.31]
lllllllll: ( .,,' = (R + I -1111/11,. y el reslo de los símbolos siguen la
11(11:ICi()11 uc la labia 13.6. La expresión [13.31] represenla el producto de
I~ rr(lh;lhiliuadc~ hin()mialc~. CI1 las que el parámetro binomial corres-
r()lluil:111l: a la prohahiJidad de «éxito>l (es decir. un conjunlo apareado
1."(111 liI1 C:ISO cxpUCSlO. dado que el conjunto tuviese m sujetos expuestos),
l:S
I)r (t:~IS() ~xpucsto d~ldos 111sujetos expuestos} =
OR
o R + (R + I -IJ7 111/1
\.IUC puctle tieriv:lrse de la distribución hipergeomélrica no central. Los
limitcs dc c()nlianz:l cxacto$ $C determinarán reiterativamente. sumando
l:1 \'al()r tic la cxpresi()ll [ 13.3 I J, para todo resultado posible de los datos
liuC se ap:lrtara por igl.l.\I. o de forma más extrema. respecto de la
Ilip()lcsi~ nul.\. comcl1z.\ndo desde los dalos observados; la suma se
c:llcl.1l.\ p:lr.\ valorc$ de ens.\yo de la razón de ventaja. hasta que el área
\.le 1.1c()I.\ se.1 igl.l:lJ .~I \'.llar deseado. De este modo. los límites exactos de
B I:isltcr SOll I.\s soll.1ci()ncs de 1.\5 siguientes ecuaciones:
\ .
) km
-o-R:
x/2 =
-o-R + C:
m
[ 13.33]
~~
"':
;~~;
,',;;.;.;..,...,:'
:-=.¿.~-;.¡:.:;
:;~~\\;1\W.l\~
~;
f~:
/J.
( .1 ) ( ( ) 1{ I ..¡) )f~ I- 4) ,5. ()I~ .+- 1/2, ,3 6R":j:"""i;;J
)1
B 4
) ¡ OR
)()
J. 5 , OR ) (3)('
~ OR \ 3
?1= (4 \(5R:¡:-:¡ 5 (~ 3 ,OR + 213) ~
I :~;
"
,
Il.1 probabilidad del resultado mils extremo). ",
I>ara \:1 limite exacto de confi¡,ln7.a inferior de Fisher hay que sustituir
I(\s \'all)rCS Jc cns.ly() Je 1.1 r.1zún dc ventaja en est,ls exprcsiones hasta
lIUC l.I sum.l de los cuatro sumandos se.1 igual a :x¡2. El superior se
(;btiene l:ncontr.lndo el \'alor de la razón de ventaja para el cual P.1 sólo
es I -~í2. ( Los restantes términos ?1' P2 y ?3 están incluidos en la otra
C()1.1 p.lrn el limite superior de Fisher.) Si se decide que :x sea el lO por
I ()(). los límites de confianza exactos Fisher ai 90 por 100, se halla que
SOll 3. i8 para el límite inferior y 496 para el superior.
Par.1 obtener los límites de confianza exactos de la media ?, se
emple,l el mismo procedimiento. excepto que únicamente se incluye en el
sum,ltorio la mit¡,ld de las probabilidades calculadas para PII ?2 y ?3: el
limite inferil)r es el \,.llor Je la razón de ventaja para la cuaI1/z(PI + ?~
+ ¡>.,) + ¡>.¡ = ~/2 y el superior. el v¡,llor de dicha razón de ventaja para
cl cual 1;'~(PI + P2 + ¡>J) + ¡>4 = I -1/2. Medíante ensayo y error,
plIC'C;.puedcn calclllarsc los límites exactos de la medía ? al 90 por 100 y
S()11 4.59 y 252. La gran discrepancia entre los dos límites superiores
CX.lt:tl)S. el de l:isllCr y el de la medía ? proviene del hecho de que sólo
h.ly un result¡,ldo posible más extremo que el realmente observado: el
4ue los puntos de delimitación superiores del intervalo de confianza sean
t.1n diferentes como 252 y 496, difícilmente va a afectar a la inter-
pretación epidemiológica.
¡\ p¡'lrtir de 1¡,1Sfórmulas [13.28] y [13.29], cuando se las amplía a R
¡;untroles. se pueden obtener límites de confianza aproximados del esti-
m.ldu de máxima probabilidad de la razón de ventaja con R controles
,I p.1rea d os.
;,~
.~..
¡¡~;q
~;
~
;t:if~t :~:;.;'~
..:;,"-
.,.:.: 11 :~r~\\:~6~f
[\~,~
"1r
I
302 EPIDEMIOLOGIA MODERNA
si<)n de ILI expresión [ 13.27] para 10$ citado$ R controles es: I :li
-1"
[ 13.36] ,rl
.-f~
'.f"
--
(\()l1d(' OI~ e~ el cstimc.ld() de milXimc.l probabilidad condicional de la
r¡lzl)11 d(' \'cnlu.ia. C IIi es ( R + J -III)/III y las ,r siguen la notación de
1¡1 l;lbl¡¡ 13.6. Los limile~ de confianza aproximados se calculan como
sIgue: .
I -
Varlill(()RIJ:;;;.
L 44 50(3¡2) 30{2/3 J -
'"1 .--+ .,
.:..:..6 (22-:-(; +4)~ +(.:.:..6 + 31'2)2 {22.6 + 213)-
.
== 1.1282
0.8864 .'.1
,~bl
,
IR
I() quc da un intervalo de confianza aproximado al 90 por J 00, a partir
dc I¡¡~ ecuaciones [13.37] y [13.38]. de
Jn
~J (
lel
"-
v.::
'.!.
.,~i~~-,,:0;.
:'~, :-..
:.~;~ ,.~..!\..
..~,,;..
~
~f:.~:
~~I~f ;'~:\~~.;.\\;
f)iJ'~
APAREAMIENTO 303
R (R + 2 III)(R +
\p,R. =
L.. I I L .1;.nl-1 [ 13.39]
III ; I
R 1)(R + I
I ' (nl -III)
~Q;R; = \
, 1.ln- I [ 13.40]
",--;- 1
9 ~
'-
I
PiSj = [13.41]
R
I . R + -111
\ R. = \
I I.m- I [ 13.43]
Lo I
,"";"1 R +
R 111
"i:' "i:' ,.
L.. .)i = ~ I().m (R + 1) [13.44]
I m-1
¡\plic:.1ndo est:.1 ri)rmula :.1 los dalos del ejemplo 13.1. para los cuales
OR\t11 = 33. 1:.1varianza se calcula que es 1.5179. para un intervalo de
<.:011
fianz:.l al 90 por I ()O de
B 6R(1 t7:llJ
.~r9
'~.~~7:
~
~:~i%%:~;j
:-.,:::'::.:.:.
;;;;:.,',.;.'
r.l1
~:
r ,I
:
~'.
¡;;
~.:
30.: EPIDEMIOLOGIA
MODERNA
,t!.
f¡.
,~
¡1
I:Sl'l 1\1"('1 ( >N I)EL I NTEI~V ALO CON UN NU M ERO \' ARIABLE ".
~;
,.
,
~
.: ~
:~=':
~; ~!~~
~
:1;~: :~\~~ill:l~\;~~
"- c
¿
~
~
~~.
r~
¡~:
~\~
1J:
~~:'
v /, ~
;ir 1.111(OR)] = ~'
[ 13.46]
00 I Í (.I;.m-I + ./~.m)Cm
R In- I (00 + C",)2
~~.
/'-
\¡'ar [111 (Of~ = t
-., 1- JI )R(2} 26(1/2) 1 ~
,1)XjSL ().9xJ5+I"j1-+- f-'.9R35+2)2 + ( 1.9835 + 1/2)2 J
= {).()ó20
.:;}~
:ii~~~~;~;
~1~~ ;~~;;.
.",...~I.~,'.t'.;¡:Ji'
j;~.:::'!~.;;:~;;:;.;,¡¡,~~.
.
~
:~~~~~~~r:
{f~}~; $~\\f?~~
~,
~-- ,~~;;
,
11(' rll<:(IC Cll Ic'~ dl' C;!S()S : c()l1lr()lc.<;: PllCdc imredir 1,1 c()nrusi()n. Las
L'('J11r;lr;IL.i(,J1CS hrlll;ls dl' ric.<;!!(, rr(),.iJ1iel1leS dc UI1 estlldi() de $eguimien-
1(1 ílr;lrc;IJ(, c;lrCL.CJl dl' ~CS!!(\ <.'()11reSrCCI() a los raclore~ de ap.1reamiel1-
1('. JL.I,iJ(\ ;1 1;1 ;lliSL'I1Ci;1 Jl. íIS()ci;l<.'i(,J1 el11rc la cxr().<;iciól1 ~' ésl()s CJ1 e!
'L.II(1 dl. I(,s Sll.icl('~ dL'1 csllldi(\ t.liaJ1J() sc iJ1icia el ~ef!liimienl().
¡\ I':.'sar dc CSI,I crjcílci;l. I(,~ csllltlj()~ dc $cgllimicl1l() ar,lrcad()~ ~()11
.,
r;lr(l.. L;I ra7()11 rllJ1damCl1lal e., cl el1('rmc c()$te de aparear grandes ] !
L.('11('rlcs: CSI()1; csIlJdi~s tjCJ1CJ1 ()rdiJ1ariamCl1le mucho~ m,is $u.iel()s que
1(\, d:.' L';I~('-<.'()lllr()1 ~. cl i\r;lrcamicl1l() cs. r()r re);l ~cncral. un proce$o el1
L.IlIIJL..SC C()ll~llmc Ijcmp(). Wa)kcr (1l)~21 híl ~ligerid() lin mélodo rara
n1t..¡('r;11' L.si;1 I'()hrl. efjt'icncii\ el1 rclaci()Jl al c()sle. limitando la recogida
J ~
r
!
J(.. J;II()~ ¡IL.l'rt';1 dc raclores dc COllrllSi()n n(\ arareados a aqucllos con-
.ilInl('S CI1 I()s qllc se rrodllcc lil1 ac()nlecjmiel1to. Otra razón por la que
r3;; i
j
:. i
1(" csI\IJi(,~ dc scg\limicl1l() ap,lread(,~ SOll raros es qlle e) apareamiento
!
s(\I(\ rlIL'(Il: scr ra7()l1ahlcmCI1IC Ilc\ad() ,1 C,lh() C()11 $l:.ielos como tale.<;. en ¡
I:lnl(\ <.JliL' CJl cli"l<.Jliicr esllldi() dc $c.!:!uimielllo a )arg() plazo. J3 medida
rl r
()rlim;1 dL' cxrl'ricnL.i;1 qllc dchc scr li~ada es la dc rcr.<;ona-ticmro. Sj U f
cn lill C.,\tlldi() dc .'\c~llimicl1l() ,1 larg() rla7;o .<;cemrlca el aparcamiento en
cl nl()mcnl() d(' la .<;clccci()11 dcl sllicto. la.<; di.<;tribllCiolles idél1lica.<; entre
scrics
L'('l1r()rmL'
c()mraradas
1;1 l'xrL'ricl1cia
dc )()S ract('rcs
dc scglljmient()
.r()r I()s qu('
dC' los
.<;e,Irarea
grupos
rodría
c()mrarados
cambiar
co-
J
n1CI17;ISl' a dircrir.
1);lr;1 C~llIdi()" (\rarc:ld(,s Cll (11Jr cl rcri()(I() dc ,';c~liimicnl(' c~ ~lIfi-
l:ir;111l'mcntc t'()rl() com(' 1',lr" .illstiril:;lr cl IIS(' (IL' (lal()s dc il1citlcncia
(\L'11111111;1(1;1
l'll '.C7 ur I(),'; dl' tas;l!' UL. il1L'idcIICi¡l. lill (\Ilillisis hrllt() dc I()s
~%:f:~m~~
~~~~1: ~.
\~~1¡~ ~4.
...
:?::::~:~;
APAREAMIENTO 307
.1;0 + 101
[ 13.50]
~ (~ 1 + j~O}(~ I + 101}
[1
--."'": '~~.~.~.".
.;:.".?::'~.:~~:;.c,.?;.:~.~.'..
Lo~ c.C;limado~ dcl crcCl() qllc sc hallall " rarlir de las rórmulas
[ I ~.4 7] ~. [ I ~.4RJ .c;on 105 que se ()hlieJ1cJ1 de los dalos crudos. pero las
corrc.c;p()ndicnlc~ \."rian7.a~ dc la~ rórmula.c; [13.49J y [13.50J son meno-
rcs. p(\r 1(, gcncr"l. quc I".c; quc .c;cc()l1~i~uen c()n un análisis bruto. Otro
p()sihlc "hortla.ic dc 1" c~timaci<)11 dcl inlCrval() dc confianza consiste en ]
Illili7.;lr limiles dc confiaJ17.a ha~ad()s en cl 1(..\"1.ulilizand() la X de la
r(,rmlll;1 [ 1.~.121.
1:1 cicl1'pl(\ I-'..~ illlslr;1 dalos dc un c.c;llldi() dc ~c~uimiel'l() dc 45g
'1111.it"rl'scn,h;lr,,7.:'d;ls lll'l' h;lhi:\11 1()1'1"(1() prcvi:\mcl1lc al1lic()nCCplivos
(\r¡llcs: cl !!rllp(' dc c()mp;lraci()n C()"si.c;IC cn un nllmcr() igu,,1 de mll.ieres
(IIIC "II"C;1 I(\s h;¡hi:\n utili7.;¡d(1 ~' tlilC rllCr()ll ;'p"rc"d;¡s il1didllCIlmcnlc a
1;ls CXpIJCst:\S .c;e~l,ll cd;I(1 y Illll'lCr(' dr: 11i.i(\s( 1{(\hiJ1S()n. 1971 ). Los p;¡res
Sc)ll clasific:ldo~ sc~lln si c;¡d" m;¡drc h" d:ld(, :1 IIIZ ;¡ UJ1t,iñ() qllc tllviesc
Ilna dl' CI' l rc lIn !! rll P() dr CIJ10rm;¡ lidíldcs P('t cnci;¡lmcl1lC rcl;¡ci()n:\das ~
C()11 lil cx r()sici()n .( El Icct ()r dche rep;¡ r;¡ r e11 qlle csl()~ d;¡ t()S. ;¡ li nqlle I
p;lrcccn tIc iJ1cideJ1ci;¡ aclImlllCIda. S()1l rc;¡lmcntc dc rrcvalcJ1cia. PUCSl()
quc eslíill cxcluid()~ los ab()rt()s).
A J)()rmalid¡ld Anormalidad
Total
I t
~:
prc~cntc
au~cntc
t\,1ildrr cxpllcsta
Anormalidad prcscntr 2f\ 85 113
,\n(")rmalidad ausente 61 284 345
0.0524 :t
,
..(,45,\./O.OOU6l)(}
-
= O,OU9, 0.096 n
Es po~ihlc. tamhién. utilizar el abordajc ba~ado en el f('.~f. sobre la base
dc la % que se ohticnc de la rórmula [13. 12]. aplicada a 105 datos del
u
~~-~7
~I ¡~~~~;
:~~
~ íQI.I
, ;.i;.~.;i
-,
APAREAMIENTO 309
~--
~-icmplo 1.1..1.. El valor de X par,l este ejemplo es (85 -61)/~f46 =
l.lJX6. dando lIn intervalo de confianza de la diferencia de tasas al 90
r()r lO() dc
V:¡r(l{bl = (113)(345)
4582 + (89~ = 0.000748
4582
La razón de riesgo puede estimarse a partir de los datos del ejemplo 13.3
como 113/89 = 1.27, utilizando la fórmula [ 13.48]. La varianza de la
transformación logaritmica. tomando el apareamiento en cuenta es. a
partir de la fórmula [ 13.50]
.- 85 + 61
Var[)n(RI~)J ~ = 0.0145
~
.'
(113)(89)
Exposición a anticonceptivos
Sí No Total
---
Bebé normal
Si.
No. 113 89 202
345 369 714
458 916
o Tolal 458
t
i'
,
~~~
.;~r: It{;
~
%~:
;'ii
,..
EPIDEMIOLOGIA MODERNA
J
3'0
Los limites de confianza de la razón de riesgo basados en el test, al 90
I
quc c()rrcsronde a un intervalo de confianza al 90 por 100 de
--
mICIII().
El an;lli~is de estudio~ de seguimiento apareados que tienen varios
su.iclOS no-expuestos aparcados con cada su.ieto expuesto es análogo al
quc se emplea para dalos apareados. Los datos crudos proporcionan un
estimado del efect() no sesgado. en tanto la razón de apareamiento sea
COI1~tante. Si \'aria. dehen aplicarse los métodos del capitulo I:. para
dat()s dc scguimicnlo, agrupand() a lo~ su.ieto~ en estratos según categC'-
rialsl dcl (dc losl factortes) dc aparc¡\mienlo. dc cara a asegurar el control I
til' la 1.:1)11fusi()n.
lJna dc I¿I~ uifcrcncia~ con re~pcct() al apareamient() entre los est\l-
uio~ dc scguimient() I. los de casC'-conlrol es la cantidad de informaci¿)n
quc proporcional1 los dalOS acerca del efectC' de un factor de aparea-
n1ientC' sobre la ocurrencia de enfermedad. En un estudio de caso-
conlrol Il() existe manera de evaluar directamente el efecto de un factor
quc huhicse.sido apareado. El proceso de selección asegura una distribu-
ci()n idclltica, tant() en casos como en controles. de cualquier factor
:Iparcau(). En uno de se!:!uimiento. sin embargo. la identidad de distribu-
I.:i()n sr con~i!:!lIc para su.ietos expuestos y nC' expuestos. antes de que se
(Irsarrollc 1;1cnfcrmcd;ld. El resultado enlre sll.ietos clasilicados a niveles
tiifcrcl1lcs dc U\1 factor de apareamiento está aún por determinar y
PllCUC. por tanto. ser e\'aluado mediante una comparación directa que
110 cst;i confundida por Itl exposición.
J:","~:0:;...'~
!t~f~¡~~ii
..~ :.-.:.::::J..;:~;::.-;::~
:::¡;;r;~¡;:.:~:;:¡~i
;~
-:~,;~ ; ;i/~~.
i~~*1(:~~j~:
I:: ~Y1
APAREAMIENTO 3"
Caso expuesto. . 31 9 40
B Control expuesto 15 5 20
Totales. ... 46 14 60
..
~
1?(.;:?-~¡if,..:::;:.::I.;l~;;;;;::::.~:.::;:
."..
~!~
[t i~.
~8~1 ::~
:11::
.",.,o¡;..
.-:';:~ i~~;';
.~.,~:.:
~
~
APAREAMIENTO 313
í ,
...
".
."'
;~~~;
~-~~
EPIDEMIOLOGIA MODERNA
3'~
micnto. otro~ f(lctore~, El análisis de regresión logistica condicional
ofrece al.l!llna~ ventaj(ls. no obstante. Una. fundamental, es la capacidad
p:lra c('1ntrolar convenientemente otros factores que fueron medidos,
rcr(, n(' ~c (lpare(1 por ellos, Utilizand('1 el análisi~ estratificado conven-
t'i(\11al. frcc\lentemcntc n(' hay form(l algun(1 de controlar de modo efccti-
"\'('I I()s factores dc aparcamiento ~' l('1s factores no incluidos en el algorit-
mt\ dl' aparcamicnto,
(Ic :Iparcar y dclcrminar
Si rcslllla de hcch('1 po~ible que, al ev(lluar el efect('1
que ha introdllcido poca ('1 ninguna confusión
I
drhidil ,1 los fact()rcs por los que sc rc.lliz(). los conjunto~ aparcados
plldicscn rc~ultar deS!!.l,iad()s ~' lo~ datos. estratificados por factores
s(\I'1re los q\le n() se h:\bia aparcado, Si, por cl contrario. el apareamicnlo
h,1 iI1Ir()dllt'ic.lo una c('1rrelaci()n m(lteri(ll cn la~ hi~torias de exposición
cnlrc casos ~' controlc$. cl an:\lisis dc re!!rcsión logistic.1 condicional (u
('Ilrt)" mt)dclos condici('1n:l1c~1 permitc tanto eliminar la confusión intr('1-
dllt'ida por el aparcamiCnl(1 como cl c()nlrol de f(ICIOres de confusión
adit'iooalcs O(\ .1parcac.lo~, E~ t:1mbien p('1~ible. aunque inhabitual. que
10" f:lctores de aparcamienlo e~tl1vie~en c('1nfllndiendo sólo sobre la con-
dit'i()n del c('1nlr('11 dc los facl('1res dc confll~ión no apareados (Fisher y
r.llil. \q74: t\1icttincn. 1974). situ(lci()n quc el análisi~ logístico condicio-
n:11 pllede di(\.l!noslicar ~' :1 la que puede h(\cer frente con efectividad,
E~le úllim('I met('1do permite de igual modo la e\'aluación. simultánea-
I
mcntc. dc 1:1exp('1~ici()o a \'arios niveles. proce$o que es de cualquier otra
f()rma cspct'ialmeotc
1ól. El il1con\'coicnlc
dificil cuaodo sc lici1en datos (\p(lreados (véase Cap.
del aborda.ic multi\'ariad('1 es qllC se requiere una I
complllad('1r.\ ~. Sll corresp('1ndientc ,\.{~/(II'(lr('. p(lr.l el anillisis: el cstralifi-
cad(, t'on\'cncion.\1 $(11('\rcquiere un I~lpiz, un papel )'. quizás. un.\ calcu-
lador.1 de bolsillo.
L(\ con$trucción del modelo multivariado para el análisis de re!!re-
$i()n 1('1.l!í$tica se discule en el pr6xim() capitulo, lo mismo que la teoría
qllC sllby.1ce tras dicl1('1 mét()do,
1~1:1;"1:.'~':N('IAS
Hreslo\\". N. Odd~ rali() e~timalor~ \\'hen thc data arc sparse. Bimll('lrik{/
19R 1:fi~:73-R4.
Fi~hcr. L.. :Ind Palil. K. Malching and unrelaledness. Am. J. Epidemiol.
I
1974:1()():347.349.
G()rdis. L. Should~ dcad ca~es be malched lo dead conlrols? Am. J. Epidemiol.
.~;-.:
1~t:
~
;~~;;~\i~~~~: ¡~~:
~~;;"'
l 315
APAREAMIENTO
.--~-
Kl\Cpscii. T. Unm~llchcd analysis or malched dala: rs lhe hias always conserva-
tjvc'? ..1,11.J. E,li(ll.mi(ll. 19R4:120:463-464.
l.lihin. J. H. ¡\n cmpiric~11 cvalualion or lhe usc or condilional and uncon-
Jiti(\IILlllikclilll)l)l.IS ror C¡I~c-conlrol dalLI. 8i(ml(.(rikll 19RI:68:567-571.
¡\1l:Ncmar. (). Notc 1111lhc 5Llmpling or lhe diITercncc bclwccn corrected r>ropor-
t i()11S ()r rCr(;CntLIgc~. P.'i.l.(.h(I"I('(rik(1 1947; 12: 153-157.
i\1icttjncn. (). S. IndividllLII mLltchinl! with mullirlc conlrol~ in the case or all-or-
n()nc rCSrt\n!;cs. IJillnl('(ril..'i 19(,9::.5:.1:1.9-355.
~.'icttincn. (). S. l:stimLltion or rclatjvc ri~k rrom individually matched scries.
IJim,I(.(ri(..'i Il)7();.;6:75-R6.
-J \Iictlincn. (). s. (.tll1rollndinl! and crrcct modi(jcalion. Ilm. J. E"i(/(""i(l/.
Il)7J: 1()(): "I) ".1.
\lil.:ttjncll. (). S. Strati(jI.:LltilIn h: ;1 mul(ivari.llc conroundcr score. /11". J.
1;.'I'(/¡."li(I¡. Il)7(,: I ()4:(}()q-h2().
1'(I(,lc. (. 1:,r(l'lirl.: (Ipr(lrtllnity in I.:.Isc-con(rol 5lUdics. Anl. J. E"i(/('"li(JI.
Il)X(,: I ~:: ": "X.
l)rl.:nlil.:c. I~. L.. ;Intl Brcsl{"1\v. :-.J. E. Relrospective studies and railurc timc
m('JI.:I!;. Ili(lnl(.(rI¡.;1'197R:65:1."3-158.
1{{lhins. .1. \'1.. IJrcslo\\'. N.. Llnd Grecnland. S. Eslima(ors or lhe Mantcl-
Ilat:nsl.ci varian(;c con5i5tcnt ¡n
m(ll1cls. Ili(Jnl(.(r;{..\" 19R6:42:311-3:.3. bOlh sparsc
.-- dala Llnd lar2e slrata limitin2
F1
í"'
I¡J
~~~1~ ,~
':;:f::~~~!¡ ~.
:-;;~:~'::c:::.:
~:;' ~I') ~
~
:.,
:::.:
,;..
.,;.
r~"
14.
;::..
;,-,,:
;;1:
"~
~...
J ~'"':
~~',
..~;
~,
.:
!':':.
~
;,.,
~
fi
317
~
j~;~t:t~~~~~'
--
r.iJ
I
31p EPIDEMIOLOGIA
MODERNA
<.:;¡pitui('s dc c~tl' libro podrian haber sido aplicados, pero se los dejó de
lild() Cl1 r;¡\.or dcl anillisi~ multivariado y con otras en las que se aplica a
I(IS diltos \';¡rios modclos multivariados. cu~lndo con uno o dos habria
,id(, c;uli<.:icI1IC, Al cridemiúlogo. de el1lrada. le merece má~ la pena
ilrl'~;¡rsl:. ~icl11prc quc rue~c posible. el1 lo.c; procedimientos del análisis
~,lr;¡tili<.:ildo. quc ~on má.c; directo~ y que en~endran una mayor familiari-
(l;¡d l\)11 I()s dato~ tanto p~lr.1 el inve~tigador como para e] Icctor.
( "u;¡l1d(, e] citad() anilli~ic; estratific~ld(' sr h~lce impracticable. el mul-
11\.ariild() es il1dudahlcmel1tc lJtil com(' ahordaie allalitico. La viahilidad
(I~ 111.'\ar .1 c;¡h() cl cstr~ltilicadt' depelldc del numero de subcategoria.c; a
1\, I;¡r!!(' d~ las cualc.C\ hclyil quc dispcr~l.lr It).c; datos: sí son demasiado
I1UIll~rl)Sol.'i. los datos qucdariln e~troltilicoldo~ de rorma en extremo delga-
d:\ il II' l;¡rl1l'
-~ dc dich:ls suhcatc{!oria.c; \ el al1i\lisi.c; se volverá ineficiente
..
1(, 1.1111.. c~ i() llli~nl(1 que decir quc lo.c; estim.ldo.c; resultante~ serán impre-
cisos. r;1 an:ilisis lllui\i\'ariad() proporciona una manera de preservar la
precisil)n al ticmp<) que se controlan mucha.c; variables. postulando un
m(,dc]<1 miltcmiltico quc permitc utilizar lo.c; d~lto~ de modo más eficiente
paril e~timilr simultilneolmente mucho~ erectos. La medida en quc e~te
!.'r<)<.:cso al1:lli\ico repre~el1tc uno\ me.ior:l el1 la eficiencia. y no sólo un
s<.:s~('. dcpcl1dc dc la adccuación
IllIIÓl'I(1 mil\Cmiltico.
dc las .lsuncione.c; incorporadas
Un :lnilli.c;i.c; es\ratilicoldo. quiz(i.c; limitado
en el
a alguna~
I t
\.ilriilhlcs cl;¡vc. coIl~tituye con rrecuenci:l UI1 prúiogo sensato del multi-
~
\.ilriaÓI). rlle~\O quc ruede arro.iar luz ~ohre cl groldo el1 que los dato.c; se
rnllCS\roln col1rorme~ COI1 la~ aSUI1CiOlle~ dc un modelo multivariado I
!.'articular. Pese iI que c()nsumc mil~ tiempo. una combinl.-lci()n de estrate-
!-!ias analitica.c; suc!c ser mi\s rructircra el1 cuanto a dar pistas sobre los
(lato~ qUl' cuo\lquicr ahorda.ic por scraroluo. I
<.'ul.lndo se ha ortoldo par un análisis multi\'ariado. el tiempo que se
cmrlca en rll.lnilicar la con~\rucci()n dc UI1() () UI1O~ pocos modelos de e~te
\ir(). el1'\"e7 de ordcn~\r por la~ buenas la generación de ,'arios direrentes. .I'
I
tt.'lldrii C"l)mO producto trab~l.iar meno~ ~. con resultados más claros. En
1;¡.; 111l'.i(:\tescircunstancia~. e] producto final seri\ un resumen elegante de
1{" d;¡t()s. dt=~cribiend() la.c; complicadas
mul'h;¡~ \"ariablc.c;.
il1\errelaciones existentes entre I
r:n su scl1tid() mil~ I.lmplio. análisis multi\'ariado es cualquier análisis
lll' dat('1~ que tom;¡ mucha~ \'ariablc.c; en cuenta. Un concepto unificador
qll~ c;l1h~.ace a sus diferen\es \iras e.c;el uso de un modelo matemático
quc rcsp()l1dc dc 1.1 intcrrelación en\re la.<; ,'ariables del análisis. Las
l.<.:II;¡<.:i(,nl'~ pr()hilhilisticas prcscntad.\s en el capítulo 12 para estimar
n)l'Jid;¡s l.,.'idcmi(l!cI!!iL':ls dcl crc<.:t<,;llliem!.'(' que se conlrolaha 11.1conru-
sic,I\. SI)I\ c.icmplos dc I()s 1111)dcl<).<;miltcm:i\icos que constituyen un
:In:i!ic;i~ multi\.ariad(). MIICh<ls Olr()S Il:ln .'ij<lo desarrollados. h.lbilual-
11\~ntl.. <.:011!.'ropi)sil<)S c~pl:ciali7.ados. El oln.iiisi.<; por ractores. por e.icm- I
pl(\. es \In:l mctotl()lo~ia cOI1Cebid.l rara c()I~lpsar UI} número grande de
\.ilriilhlc~ predictoras CIl otr{) nlti.c; pequeño de «factore~) que representan
suh!:!ruros corrclacionatlo~ del con.iunt<' dc volriables origil1al. El an{ilisis
dl' sl'rics tcmporolle~ cs UI1 mctodo diri~id() a evaluar la asociación entre
~.~"'.!:~...,::,.":.;.; ,..':;.;~'-c.~~T~~.:'-:{:
.:~
;~~;
~~~1¡
c.;.~.: :,:,:.."'...;.,.;,~"
.--1.~*"~/.<~ ,..~ "
~-
~
] lt:mp()r,llcs.
1:1 ,111illi~is 111t1ltivari,ldo es un lema avanzado que ha sido objeto de
IIIUI:II~}S lihr(}s. lJn,l discusión plenu de sus aplicacioncs resulta impo~ible
a<lui. !)()r I:Onlr,l. el objetivo de este capílulo es describir en términos
I SClIl:ill(}s los m(}delo~ matemáticos
I.:stra tC!:!i,l q tiC el epidemiólogo
básicos que se utilízan y discutir
debe adoptar para construir e interpretar
la
1 111(}dcl(}s multivari¡ldos.
j
IfIJ(,/fl 1;,I('fll
1:1 Il\odcll) lI\;is rulldamental que describe la relación entre dos variables
cs la lilll:~1 re(;ta. E! modelo lil\eal par~1 dos de dichas variables sirve de
Irall\p()lill para l)lrOS lI\¡is (;u11\pli(.;ados. entre dos o más de ellas. La
l:(;lla(;i(,ll dc la lillCa recIa que rclaciona dos variables tiene dos paráme-
Ir(I,. f(lrllllllilU()' !lahilualmcnlc como 1.1 intercepción. o constante y la
pcndicl1lc. o cucli(;icnte-:
\', Ih'¡ T. J
a
i~
f:~:l~~~~.1~*~~
!ffl' ..,~..~w'
¡t~~~~
~;;:' r*;~~~~~~
,,!,~:' ~t.~~~
;;-
:~~1l~~f~
~IJí
~:
1 ri.
~~
~t
r,,:
32(! EPIDEMIOLOGIA MODERNA
,-,
.,.
~;
;;I:
¡¿
.
:;:.c
I [:,
x +x,
;
"
;
;
i
!
-y
Fig. 14. I{('"r(',\('///(/("iril/ ,f!r(ifl("11 (Ir' J(/ ('("/,(I("i,i/1 tiC' /(1/{/ J;//('11 r('C1a
cana como para quc .c;can razonable~ la~ inferencia~ que se extraen
s()hre I¿I ba.c;e dcl mismo. L(1 separación de los datos respecto del
modclo puede rene.iar una discrepancia entre este ~. la naturaleza. así
como fuentes de inexactitud (1 I~! hor:l de obtener la informacil)n. Un
(,h.ictiv() scnsato consiste en ele.1:!ir UI1 m('dl'lo que se a.iuste a los dato~
Sllficicntcmcnte como para quc la milyor fucntc de scparación dc los mi~-
m()s con rcspccto al modelo pr()\,en~a de inexactitudes inherentes a ellos
: n() dc I() inapropiado de éste.
La figura 14.2 ilustra una relación casi lineal entre el número de ;
~
ci!:!arrillos fumados al dia y la mortalidad por cáncer laringeo estanda- ,
"
rizada por edades (Rothman ('I al.. 1980). Raras veces siguen unos .,
t
datos epidemiológicos un patrón lineal de forma tan cercana como éstos. .~
1
Cuando las obser\'aciones no caen exactamente sobre una línea, pero ,...
siguen mostrundo un patrón básicamente lineal a pesar de una cierta ;i
~~~~~~¡~~~i~li~;
,."".,
",~'
¡~~ir~¡
::<~:::;;~~i~ik~~
(~:
ANALISIS MUlTlvARIA[Ja 321
~
~
~
~
c
':J
01
~
U)
~
~
«I
N
"t:
~
-0
C
~
tí
~
~
«I
:2
m
~
O
~
o 10 20 30 40 50
Cigarrillos fumados al día
Fig. 14.2. M orlalidad c.\'la1ld{"i:oda por ('{1{/{1d('hi{lo o ('(i1l{'('r larí1l,r:('o, ,\,('ltli1l ('1
mím('ro d(' cigarrillo.\' jiIIlIOdo.\' diariam('1Il('. (1 p{,,'ir dr lo.\' d(110,\,d{' Kahll ( Rnlh-
man et al.. 1980).
~:
,.,
.t
~.
322 EPIDEMIOL
E~ltl ccut\ciól1 sif!uc siel1do lineal. pero la linea recla cruzn un espacio
(,.'(tI1 mils dl.: dos dimensiol1es. una por ctlda variable dc la ecuación. f
il1L.Illill:1 1:1 \'arjahlc ucpelldiel11e.
1:1 r:ls!.!() cl:lvc ucl al1illisis mullivtlri:lu(). quc Ic hacc scr Ul1tl Iccnica
1;111 \llil rtlr:1 cl tll1illisis cridcl\1i(tli)~i(,.'(I. csl;i Cl1 cl hcchl) uc quc Itl il1fc-
r\.,ll(i;l h:lsall:l Cl1 cl c()cricicl11C <ic ciI;llq\licr \'ari:lhlc illdcrCIldienl(' del
11,(1ucl() CSI:"I C()11llici()l1adtl tl I:I~ rcslal\ll:~ \.:Iri:lhlc~ iI1UCrcl1dicl1lcs del
11\IS111('. r:Sl;1 il1ll.:rrrcl:l(,.'i()l1 c()l1dici()11;,1 si~l1ific;I q\ll' CI1 \111 m()ucl() SCI1-
l.illl\ Sl. rlll:Jl. (,.'(11\lr(tl:lr sim\lll;il1c:1111~111l. 1..1C()11r\l~ii)l1 (Ichi(ltl ¡1 lii1 ~ral1
1111111L'r('d rtlClltrC~ ~ qllC !\C r11cdr dCICrmil1tlr :1 p:lrtir dc I()s c()cfi-
l.il;l1lL'S :I(lcc\l¡ld()~; cl cfcct(l d(' C:ldtl r:lCI()r. 5in q\lc 1()5 rC51tlnte5
f:I'L.I ( 1rl:S ucl m()licl( 1 acIlICl1 col1f u I1d icndl)llI. siem rrc q liC las tlsul1ciol1es
11l;11L'111ill ic:ls dc J ich(, m()dcl() 5ca 11 rtl7.()I1¡1 hlc5.
7 1'(11'.\:1 (11'/11(1(.i,III('
,¡/'1,,1(}/1('/(¡ lí,I('(/, tllltili.\i.\ l(.1gi.\" I j('(}
c:an!idad de d~ltOS.
El\ \1n ~Inilli~is cpidcmiológico es comun que una variable tenga sólo
dos ,.alores, quc corrcsponden a 1.1rresencia o ausencia de enfermedad o
a l.1 rrc~encia o ~\\1~cnci.\ dc cxpo~ición. A los modeló5 de regresión
ha~ados en \ariablc~ dcpendiente~ dicot¿)micas se los conoce como «re-
J;rcsionc~ binaria~». Sllpongamos qlle sc llevase a cabo un estudio de
se~uimicnto para evaluar la aparición de enfermedad en un grupo ex-
ruc~t(' ~. otro n()-cxpllesto. En ~u forma má~ sencilla, los dato~ consisti-
rian CI\ do~ oh~crv.\cione~ hinarias ror cad~l sujelo: ~i e~tahn expue~to, o
110. y si hahia caído enfermo al final de1 período de seguimiento. o no.
~
¡j'.;:
~;~
,0-.,-
c~..';»:;,,:~~.;.;..,
IG
~:., .-~ ,.~ ~ :..
'.> :-:..'.~..;:V'.;~.~
~. ~~
\~~~!~\;~~~~~~J~~:~~.'.;:~:
~
I.
I~ .~:;."
...
s
I ::; .:
:::
:;.
.J
10
Ü
C
al
-0
l ~
~
""'
~
:/1
~
0-
Edad
I Los dalos del ejemplo 11.4 ilustran tal situación: si tanto la variable
illdepcn<.\icntc Com() la dependiente son binnrias, los datos se resumen
mcdi¡lntc UJ1¡1tahla de 2 x 2. Se puede ¡lplic¡lr a los mismos una regre-
D sión t¡lmbién hinari¡l: resulta convenicnte codificar cada una de las
\:ari:lhlcs con los valores O (> I dcl1otan<.\o. rcspectiV¡lmente, la ausencia y
presencia de exposición o de enfermedad. Utilizando este esquema de
codificación, el término constante ao corresponde a la incidencia acumu-
l¡lda en el grupo no-expuesto. Por lo tanto, al. el coeficiente de la
v¡\riable independiente del modelo, corresponde a la diferencia de inci-
~ dencias acumuladas (o diferencia de riesgos) entre los expuestos y los
l1o-expuestos. Por supuesto, la diferencia de riesgo se puede estimar de
forma direct¡\ a partir de la tabla de 2 x 2 que describe los datos. con lo
que la regresión lineal, cuando se tienen datos binarios sencillos, resulta
innecesari¡l. El modelo de regresión, sin embargo. se puede extender
filcilmente para ¡lcomodar muchas variables adicionales y es ahí donde
~
~, radica su ventaja. Si se hiciesen diez observaciones más por cada sujeto,
..~
rcprescntando diez f,lctores de confusión, podría controlárselos simple-
mente ¡lñ,\diendo al modelo lineal una cantidad tan pequeña de términos
como diez, que corresponderían a los diez factores de confusión citados.
, ~~~
}~~~;:i~;:t~;;::.. .::.
,.;:~~~je:
.;~
~
~~ lh
}"
111
= a() + al ).'1 [14.3]
J -}'
(,"" +al.\"
)' = .
,,;;-":j--;;-;T ---,,-Ion+ol.\:tl
[14.4]
+ (' 4- (
:~
;~~'
.4-'..
:"!,1
Clo
(I() = In
[ 14.5]
r-1
U
~~
;ii~~.
1\
;~~:;~~\\~\~:
~-
..,
32r; EPIDEMIOLOGIA MODERNA
..
,t
}
i ~
f;-i~, 14.4. EII (,1111(}(/('1(1 1(},!!:;,\'li('(1 ,\,(' 11all(1 illlplíCil(1 un(1 re/ación e-'\'pollellcia/
('III/'(' 1';"('1(',\ (1(' c.\.,,(},\'i('i(in l11Iílli,,/(',\' .1' ,.ie,\,.~(1 d(' l'1!ft'rmedad,
"'1
, t
.~
'.
;~~
~~jj¡:
;~~;.: :~~¡~,
~
;'.;1',:
~i¡il
;:'.{:~~ft;~;
AL
111~ ;l~rg~~r~~~~:~:f:'
~~:.~:.-.
:':":1
I.
::.~¡~:}¡
'.-:~~] ¡~~.:¡~\;
32P EPIDEMIDLOGIA MODERNA
r
10 1!cncral. eslos do.c; abordajes son más o menos. si es que no exacta-
mcnlc. cquiv.1Iellle.c; ( Breslo\\' y Powers. 197H), Resulta generalmenle más
1 ~
r:icil uliliwr a la cl1rermedad como variable dependiente, porque este
(
IlICtod() pcrmilc la evaluación dcl crccl() de divers.l$ variables de exposi-
ri()11 dirL'rcntcs cn UI1 nlism(\ 111()dl:I(\ ~. rllCdc rilcilmcnlc d.1r cabid.1 .1
L'XI')osici()ncs medid~l.C; con más dl: dos c:1lc~orias.
.E~t;1 1!1,Cji)l) dc «rjc~!!o» cs. c()m() sc VC. 31!!() djrcrcntc a la que sc mí\ncjí\ con cl
lI()mhrc ((rj~k» el1 mllch()~ tcxt()~ dc erjdemi()I()~i;¡. En in!!Jcs. 1;¡ conrllsiól1 no es rosiblc.
ror cl II~O dc do~ r:'I:lhr:ls distillt:l~. «risk» y «hnz:lrd». ( "'. dcl T.}
I
i~
~$~tJ:1:..
~
,;:~::;
:\ft~~i\~\;~~:
;rf~~~ !~~I~I
~!
ANALISIS MULTIVARIADO 329
li(\r:ls lit: quc sc disr()l1e l1uy día. dados lo~ grandes conjuntos de datos ¡:;
~,.
<.JUCS()11<.:1)1111111I.'S ;1 ~sle nivel en los seguimientos epidemiológicos rela-
<.:ionados ~UII 1.1ill\"cslieación etioióeíca. En circunstancias así. una alter- ~:
11ati\.~1 r~IZOI1~lhle cs ~lg;upar los d~ltOS por periodos de tiempo yjo edad.
l.:oI1siderand() .1 1.1 vez un modelo logistico condicion~ldo segun las
Jivers~ls c~llegorí~ls temporales YlO etarias. pero no segun los muchos
subconjuntos Je individuos que permanecen bajo observación en cada
runt() en el tiemp() (Breslow. 1979: Abbott. 1985). Sí. como se espera,
continua el progreso tecnológico en el equipamiento in[ormático, el
tiempo y el coste de los cálculos que se precisan para adecuar a un
~ nllmero grande de datos un modelo de riesgos proporcionales puede que
t1 pronto resulte de poca importancia.
El müdelo que nos h~l ocup~ldo es uno de entre una variedad de
métodos que sirven para estudiar datos con problemas en el eje tempo-
r.11. K.1lbncisch y Prcntice ( 1980) dan una excelente descripción de estos
mé!oJ(}s.
,\ f (Id(,/(1,\' fl',!,'-lill('(II(',\"
~~~;~:.;:: ~~~;:.i~ -~
.,,1
c~*: ,,;-:-¡~.~.
33(1 EPIDEMIOLOGIA
---~-
MODERNA
J
com() Ull:1 ful1cii)11 lincal a buse de tcrmil1os, Dichos términos correspon-
dcn a cílda variahlc dc la labia mullidimensiol1al, al tiempo que existen
\'ari:ls comhinacioncs de \'ariables represenlando los correspondienles
Icrmillos dc iIIICracci()t!. Los lolules marginales de la tabla multidimen-
si()I1¡11prororcional1 rcslricciol1es a los \'alores esperados que se conside-
r¡111adccllados r~lra 1~lsccldas,
( ()II cl modcl() arroriado. esrccific~ldo en el conlexlo, de predictor
hillilri() \' v:lri:lhlc~ dr rcsull:ldos. 1:1SOlllCi()11 de máxima probabilidad de
IIII III()(I~I() 1o'J!.-lillc:11 scril idcnlica a la solllción de máxim~1 rrobabilidad
ll\.' I(IS \'al()rcs c~rcrad()s rara la eslim(lcii)n de la razón de venlaja In"
t.('mlln CI1 lit! <:onjllt!l(1 de lahla~ dc :! >< 2. de la manera que se describía
cn el carillll<" I.:.: El cslimad<" de m~iximil rrob.lbilidad de la razón de
1¡;
vl.:nt¡l.i:1 rllcd(' ohlenersc a rartir dc los valores esrcrados de celda del SU
nl(IJ\.'I(1 1(,~-lil1cill lil1¡1 \'c'/. :Idccllallll, ,iIISI(1 l"(lm() ~C Ilacía a parlil dc loS
\¡II()rcs lambicll adccllado~ qllc eman~lball de la ecuílción [1.:.,25], Más
al In, lin m()dcll) de regresiót! lof!istica aprori(ldamenle especificado dará r,\
lambién los mismos reSUll~\dos, Todos e~los mélodos son reformulacio- I.c 1i¡
I1Cs matem:itica~ de un mismo modclo sut1yacente. el de una razón de
vcnla,ia qllc es con~lantc a I() larg<" dc la~ cat.egorias de uno o más
.~Il
f:lclores distintos: es un modelo mulliplicativo porque conforme cambia m
lit tasa dc los n<,,-expuestos. la tasa de los expuestos debe multiplicarse
ror lil1 faclor constante de cara a que la razón de tasas de .incidencia, o 1~
1¡1 ra7()n dr \'Clllaia. seall i!!lialmentc cOnslantes.
l(,s modelos iof!-lincal~~ han sid<" rorlllares enlre lo~ estadislicos
!)()rqlle ()frecen lil1a esrecie de ncxit1ilid¡ld cstadistica: 11<"exislc esrecifi-
l"ilt"í()11 (Ir Ul1a \'ilriat1lc dcrCI1(licJlte ~. ()lr(1 <:Oll,illl1t(' d(' \'uri~lhlc~ illdc-
rl.:l1dic:IIIC:;. ni d\.. lil1¡\ cnfcrlllC:d:ld ~' lilla \':II iablc: dc cxrosicil)n todas I S(
:::~l~!~.
,.,;o.
"",..
:~~".fij:;;.*: .: ,
-~I.
l ANALISIS MULTIVARIAOO 331
.\ 1 ( 1(/('/( 1,\' 1111//' ;!'(ir ;,1(/(1.\' f1l1 r(1 ('.V, 11(/;0.\" d(' ('{1.\,(1-('(1111r(l/ OfJ{lr('(I{/OS
~
,
:~,~::; :,;:; :
$.
;~~.
X:~I~1~
3 ~.
.).
EPIDEMIOLOGIA MODERNA
~~:
:!¡t:i~~~i~ ~~~}~¡:
\;f\~1~\~f\\\1
--'--' ;;,,-- ..,.;;;..:.;
;..~~~ :
Q ."
~~
':~~;.
334 EPIDEMIDLOGIA MODERNA
~.
~II¡~
.m:~i~~r~;~~~~:;:~1fu~:
"1> "...v , ~,~;
.,
ANALISISMULTIVARIADO 335
llll~ 1:1 illr()rlllaci()11 tic lo~ dato~ sobre cxpo~ición. sca ordenada por
rallgo I) (;olltinua. sc pierde y se necesitarán ahora varios términos en el
m()delo dondc ante~ .~()Io ~e requeria uno. Es verdad que la potencia
l:st:ldistica de una prueba de tendencia que evaluase una relación dosis-
rcspuest.l. incorporada en el v.llor de p adscrito al coeficiente de una
variable continua. se pierde con este método. Por el contrario, la inclu-
si()n de varios términos de exposición permite utilizar la información
acerc.l de cada nivel de exposición para generar estimados del efecto que
no cstcn constreñidos a seguir ningun patrón especifico. La simplicidad
cs algo que en un modelo multivariado se ha visto casi siempre como
mlly descable. pero su lógica interna se basa habitualmente en la adop-
t:il)ll II~ m(){I~llls 1.:1111 pr{)p()sitos prcdictore$ o descriptivos. Cuando se
L.II)rl(;;111 1111111t:111,. I.:CIIII() .!.!t:llt:r:lllllt:lll~ -;c 11:ICCcn cpidcmiologia. para
11¡II.:t:rillf~rt:ll(;i:1 "llhrt: l:1 ral')ci tic r:ll.:tl)rCS cspccificoS. la simplicidad del
Ill()dclo Il() l:S lina IllCt.l importante. PI)r tanto. la inclusión de varios
términos en vez de lino no representa un inconveniente real en lo que a
I.l complejidad dei modelo se refiere. La ventaja de ser capaz de estimar
por separado. sin un patrón impuesto. el efecto a cada nivel de exposi-
ción con relación a un nivel basal. supera las desventajas de este aborda-
je en la mayoria de las situaciones. Cuando hay datos suficientes. relacio-
nc$ de dosis-respuesta complicadas como las que tienen forma de U o
I U invertida. pueden detectarse y estimarse sin temor a que el modelo no
describie$e .ldecuadamente los datos.
Tras definir cl término o términos de exposición del modelo. el
I in\,estigador
planteamientos
debe (;entrarse.en los factores de confusión. Para éstos. los
son en gran medida los mismos que para la exposición.
Cad.l \'.lriable debe ser traducida para introducirla en uno o más térmi-
nos del modelo. De nuevo es deseable usar un conjunto de- términos
indic.ldores que permita una relación menos constreñida entre el factor
que confunde y la enfermedad. La meta analítica es un tanto diferente
para las variables de confusión. En vez de realizar inferencia acerca del
erecto del factor que actua confundiendo. el objetivo es tomar en consi-
deración el mismo. de forma que el efecto de la exposición no resulte
distorsionado. Para conseguirlo. no obstante. se necesita esencialmente
~ dar en el modelo el mismo tratamiento a dicho factor de confusión que a
la exposición. Para el primero no resulta importante apuntar ajustada-
mente la forma de I.l curva de dosis-respuesta, pero. por otra parte. hay
poco que ganar por lo general reduciendo el número de términos del
Illodelo. a no ser que los datos estuviesen desperdigados o deficiente-
Illcnte distribuidos. Más aun. en algunos análisis un factor de confusión
de la exposición podría tener por derecho propio algun interés, en tanto
que constituye exposición. Si las variables en cuestión están definidas de
manera óptimí.l en el modelo, se pueden realizar con facilidad inferencias
~
:Iccrca de Ií.l exposición y de varios factores de confusión a partir de un
(¿1
modelo único. Por el contrario. si se sabe que el citado factor de confu-
sión tiene una relación «monótona) con el resultado enfermedad, es
posible conseguir un mejor control de la confusión manteniendo la
EJ
's~
.:-:~: {~:,:.;;
~
~~~f;~~ ;\~
:..
~
$(:
{~~~¡¡:: ;11~
',JIJ; ~~
~:, :.~~~.
:~~
\~J~~
:jL;~.:;-
~.
.~:h~~
33~
~.
I
ANALISISMULTIVARIADO 339
hict1 COl! UI! prohlcma de regresión clilsica. ya quc /o tipico es que midan
l:ll una e$cala (.'olltinua no $(>Io la variable rcsult~ldo. sino también a
todas I~l$ v~lriables independientes. Puesto quc la unidad de observación
c~ una población. la información sobre variables predictoras se mide
como un promedio de población. que es una variable continua. Inclu$o
vari~lbles discretas. como el género, se hacen continuas cuando se las
promedia para ulla población: el género es una variable binaria. pero la
proporción de una población que son varones es esencialmente conti-
nu~l.
Aunque con dato~ a~i podria parecer que un modelo de regresión
L'1..1~ic~1 enc~lj~lria hicn. hay que llevar con claridad en la mente algunos
1t1:lticcs a la hor:1 tic re~lli7.ar el anillisis. Primero. dado que cada unidad
(Ic ()hscrvacii)11 cs Ijll:1 pohlación y pue~to que las poblaciones difieren en
1:1111:lri().la (.'alltitl:lti tic informaci(>n de cada unidad observacional diferi-
,:;i. 1):lr:t tom;lr c~to adccuadamente en consideración en el análisis. la
rL'~rcsii)l! dchcr~i ser ponderada. Este procedimiento toma en cuenta
a~ignar ;1 cada ob~ervación un peso que refleje la cantidad relativa de
información incorporada en Ja misma. Como pesos podrían tomarse los
reciprocos de la varianza estimada de cada observación; para una tasa
de incidencia o de mortalidad. serian el cuadrado del denominador
dividido por el numerador. Otro esquema razonable de ponderación es
pesar cad~1 observación simplemente según el tamaño del denominador
de la tasa.
Un segundo punto a tener presente es que los coeficientes del modelo
habitualmente no pueden convertirse a las medidas epidemíológicas
usuales del efecto. Aunque la variable resultado pudiera ser una medida
del tipo de una tasa de incidencia o de mortalidad. las variables indepen-
dientes representan. como mucho, valores promedios de exposición y no
pueden reflejar con exactitud el efecto de un cambio en el nivel de la
exposición sobre la ocurrencia de la enfermedad, a no ser que la asun-
ción lineal del modelo fuese razonablemente exacta. La más de las veces.
las variables independientes del mismo son en cualquier caso aproxíma-
I das. por lo que la interpretación epidemiol()gica de los coeficientes resul-
t~l problemática. estando en el mejor de los casos sujeta a considerable
~e$go. Los estim~ldos del erecto de los estudios epidemiológicos pueden
I cstar grandemente exagerados
~csgo «de cruce de niveles» (Morgenstern,
por un fenómeno que se conoce como
1982). Con todo, teniendo
datos ecológicos las inferencias epidemiológicas son ocasionalmente po-
sibles y hasta podria ser factible valorar el grado de sesgo (Stevens y
Moolgavkar, 1984). Ejemplo de variables aproximadas son los datos
sohre impuesto~ recaudados por consumo de cígarrillos o de alcohol, en
lug~lr
~ U ndetercer
loS reales
punto sobrees queel elconsumo
control de de launos u otro. resulta dificil en los
confusión
]
anillisis ecológicos. puesto que las observacíones individuales son datos
promedio o datos aproximados de poblaciones, llevando por ello a
asociaciones atenuadas e intercorrelaciones entre varíables que limitan el
control de la confusión {Greenland, 1980; Morgenstern, 1982). Más aún,
.J
~~~::~;~,
~;~~Ifr~
~~c
;~~~~~~~;J~~
,~
1;:;'
340 EPIDEMIOlOGIA
MODERNA
CI' I()s cslll<.1i()S ccol()gicos c,<; ror I() gencral mils dificil oblencr dato~
..illllicr:1 :Irr()xima<.1os dc all!l1n()~ r:lCl()rC~ ql1C ~e c()n()ce o ~c ~o~pccha
l'lll. ;ICIII:I" t'()"fll"dicndo. L:I f:lll:l dc di~rnnibilidad de información II:",) W;
.~ "!1; " -
r:111!!(1dl. mc,,()s infinil() ;1 mils inrinilo. rer() 1:1lasa de incidencia .vn ~ólo
~.C.:;,
llc ccr(1 :1 m;'ls inrinil('. La i"c()mpar~lhilidad dc los rangos puede ser :i j' -
rt:..l1cll;, m()dificLl"d(, 1:1 l:ls:l <.I(' i"cidenci:l mediante lransrormación I()-
~:Iritl"ic;t [;.n ta"I() qlll' csl:l tran~rOrmLICi()I' cs malem,ilicamcnlc alrac-
li\.;I. pl)rqlll' prc\,icnc ql1C cl m()<icl(, rr()dl17.C:l e~limad()s negalivo~ de la
l:lS:I <ic i"ci<ienciLI.la rri"cir,11 c()nsideraci()" cs si elm()dcl() multiplicati.
\,(1 qllC rL'sl111:l c()nslil\lyC \11':1 mc.ior dcscrirció" dc los dal()S ql1e el
:I<iili\'(' qllC sc arlic:l si" dich:l lransform~lci()n logLlrilmica. Los lérminos
C()I'li"II().; <.Icl m()(lcl() mllllirlic"liv(\ tc"drían. cnm() en el modelo logisli-
l.(I. 11";1 rcl;lci()J1 cxro"CI'Ci;11 I()~ u"o~ COII lo~ olr()s. Scria posible em-
rlC;lr \I" con.iunl(\ dc \,:Iri;,hlcs il,dicad()r:ls p:lra cada variable conlinua
, .
<icl m()<icl(). pcro r\leSI() ql'C Itls v:lrinblc~ conlinuas son promedios de : :;..,
i;..~~. .
r()hl:lcii",. sc vl1clven m\lci,() m;'ls diricile~ dc inlerrrelar. A n() ser que
\1":1 r:17()I' csrccíric;, 1(\ dcm:l"d:lsc. parccc prercriblc llevar a cabo la
m:I\.()ri" <ic lo~ :IJ1;',li~i~ ccoli)1!icos ml1lli\'ariados como regresiones linea-
.~
Il.S "(1 Ir;l"srorm:ld:ls.
f1
¡J
"..::m~
:~~:
11it
~
'.:~~;~::~\:~~. ~.;~t.~::
; ~.;.: :
IllClllc I;U:Illtl() SC rrl:~l:lllaI1 allccl(.)r I(.)s tlat(.)s eslratilicad(.)s para que los
c~cruliI1e. L~I pril1cipallimitación del análisis estratificado es su incapaci-
ti~ld para hacer frente a mi1s de unas pocas variables a la vez. a no ser
que cl ap.lrc~lmiento haya proporcionado distribuciones similares, a lo
largo tic los cstr.1tos. de las series comparad.1s. Sin .1pareamiento. confor-
j mc cl número de ohscrvaciones dentro de los estratos disminuyese con el
:Iumento dcl nllmcr(.) dc éstos. 1.1 r.1zón de controles a casos (o en
cstudios de seguimiento. la razón de sujetos no-expuestos a expuestos)
nuctu.1ril al .1Zar cn OI1d.IS dcscontrol.ld.1s sobre el valor medio; estas
nuctu.lcioncs inycct.1n tlclnasi.ldo error alcatorio al proceso de estima-
l;i()11. <:ausantl() 1Iila pcrtlitla tic cficicncia del estudio que pone en
ri~It1().
IJ~ls \CJII~I.jas y limit.lcioncs dcl ~ln~llisis multivariado son en gran
mctlida I~I im.lgcncll espcjo de las del análisis estratificado. Mientras que
cl :In.ilisis cstratificado sc vuelve ineficiente frente a muchas covariables,
cl multivariudo es por lo general muy eficiente. Por el contrario. en el
~ln~llisis multiv.lriado se echa en falta la capacidad de captación global
lJue licne el primero. La computadora viene a intercalarse como intrusa
cntre las observaciones crudas y las medidas epidemiológicas que resul-
t¡ln tle cllas. oscureciendo a los ojos tanto del investigador como del
Icctor algunas de las interrelaciones entre las variables del estudio que
p()sccn m.\s scntido. Sólo una larga experiencia con el modelaje multiva-
riatlo cmpe7..1r:i a parecerse a la sensibilidad tratando datos que se
\)hticnc dc un ~In.ilisis cstratificado. Los cillculos son tan complicados
quc cl invcstigador se ve obligado a depender por completo del equipo
inform.itico y dcl .\,(~/i),.llr(' de que disponga. Los errores de dicho s~fi1\.a-
r(' puedcn p.lsar desapercibidos a través de muchos análisis. porque no
h.1y rorm.1 sencilla de comprobarlos en su integridad. Además, la eficien-
L'ia cst.1distica tle los modelos multivariados tiene un precio, que es la
asunción de que una forma matemática dada describa la relación de las
vari.1bles del estudio. La extrapolación más allá de los límites de las
\)hServ.1Ciones. que es algo que muchos investigadores son reacios a
R
l~l hacer y que es fi1cil de eludir en los análisis estratificados, resulta dificil
(le evitar en los modelos multivariados. Ciertamente, en un análisis
multivariado 1.1extrapolación y la interpretación son cuestiones criticas
a la hora de ganar en eficiencia. Asumiendo que el modelo matemático ¡:
~
tlcscrihe la distribución condicional de una variable sobre un rango de
v:llorcs p~lra los cu.1les f.1It~ln 1.ls obscrvaciones directas, el modelo puede
cxpres.lr 1.1rel.1ción combinada de muchos factores simultáneamente con
scncille7. y elcg.lncia. Si el modelo es incorrecto, sin embargo, la mejora
(Ic cficicnci.l pucdc quedar negada por un grado intolerable de sesgo:
q Inils ~lún. t.11scsgo no seri1 detcctable sin esfuerzos especiales y la precau-
¡'-1
~ ción que c.1racteriza a esfuerzos así puede verse minada frente al gancho
scductor de un modelo nítido y de aspecto eficiente.
I~stos inconvcnientes que tiene el análisis multivariado convierten al
~f.
;~~:
~~\~r~
fl'lDEMIOLOGII\ MOOEnNI\
j
una \'ariahle continua unica que atIne la información rele\'ante acerca de
la~ pr<.'picdade~ de toda~ las variables a este respecto (Bunker el al.,
1969: Miettinen. 1976: Rosenbaum )' Rubin. 1983). Consideremos un 1
expcriment(\ aleatorio. Una propensión para desarrollar enfermedad, si
l,l r,lndClmización funcion:l bien debería estar distribuida por igual entre
los ~rupos dc intcr\'ención, No hay. no obstante. forma directa de com-
1
pr()h:lr estas distrihuciones. puestCl quc la propensión a la enfermedad
n() pucdc medir~c direclamentt' mils quc midiendo la incidencia de la
misma. quc es el rc$ultado del estudio ~; quc pCldria verse innuenciada
por la intervención en si. Lo que $e necesita para evaluar la eficacia de
dicha randomización es alguna indicación del riesgo de enfermedad
cntre lo~ individuos de los diferentes grupo$ de tratamiento aparte del
efecto de la intcrvencíón, La distribución de los factores de riesgo cono- n
:~
:t~~ ~~::;;~~
ANALISIS MULTIVARIADO 343
nc .
[r.
:i~~;
~i: ;*
::~~tr~t\f:~~ ~1;~¡~;:;!:!~ :~;%.
::;~4;;;.::;;~
EPIDEMIOLOGIA MODERNA
J~I:I:I:I{I:N(.I¡\S
-*
...:~.t~~:
;~'>:: ~~~\,:~~.¡
~:
J Micllincn. O. S. Strt\lilication
l:.il;(I(.I11;(,I. 197(,: J04:609-620.
by il multivariate conrounder score. A",. J.
I)rcnlit;c. 1{. l)sc l)f thc lugi~lic model in retrospective studies. Biom('lric.\" l~.
l~i(,:.~?::,q4-(,()h.
I)rclllit;c. 1{. I~.. alld P~'kc. I~. Ll)gislic dise~lsc incidence models and C3Se-COnlrol
dal:l. 11i(I/II(.fri".(( 1979:66:408-41 ::..
l)rl:llllcc. I~. L.. :Illtl Bresll)\V. N. E. Relrospective studies and failure time
m()uc¡~. ní(II11('frika 1975:65: 153-15S.
J{()scllh~llIm. p R.. and RlIbin. D. The ccntral role of lhe propensity score in
()h~cr\'alion~11 stlldies ror causal effects. Bi(l/lll.'rika 1983:70:41-45.
I{()lllmall. K. J.. (..ann. C. I.. 1:I~lndcrs. D.. et al. Epidemiology of laryngeal
c;l"ccr. 1:,,;tl(.I/I;(II. RC1.. 19R():2:195-?09.
SIC\,I:IIS. J{. ( i.. antl Ml)()lg:lvk~lr. S. 11. 1\ cohort ~malysis or lung c3ncer and
~m()kin{! ill Hritish malcs. ..11/1.J. Ep;tl{!mi()/. 1984:119:624-641.
rll()mas. D~ C. (Jcllcral rc¡alivc risk modeis ror sur\,ival time and matched C3SC-
¡;1)lllr()1 an~llvsis. /J;(II,'(.'r;('.~ 1981 :37:673-676.
W¡llkcr. 1\. M. ÉmCienl ~Is~essment or ¡;onfounder effecls in matched folJow-up
,tlldics. :1""i. .)I(lf. 19R2: 31:::.93-297.
\V.llkcr. 1\. M.. alld Rolhman. K. J. Models or v3r~'ing paramelric form. ..111,.J.
E,,;tl(.I/,;(II. 19R~:115:129-137.
s
m i
i
~
r.l
ü 4
":;:.:':[:;.-\:..j::,;,:~:~;:r~;.
'!~
11'11~ ~~~.
8!1
N.
15. NTERACCIONES ENTRE CAUSAS
I
J ,-,...
;~
~É~
¡~1~~~~~.
~:;~;.;.~.e.",
-' g "
.,.. ...~.
, ~
~
~
',:
t\SI!l:Slc\
Ilm:1 i
~
S() 1(1
I)(\r l'll'(\I\tr:lri(\. si Sl' l':III.:I/!:lll n\r(litl:ls tll'1 cfcct(\ cn f(\rm:1 tic ra7.(\n
p:\ r:1 I.:u :1¡<.1II icr:1 tic I:\s c x p()sil.:i()ncs tlcn t r(' tic cada ca tcgoría dc la o! ra. 1
...
sr Cl\ClICl1tr:l quc dich~1 r,lZÓI1 cs uniformc. Así pucs. los fumadores .'t
expcrimcllt:ln una incidencia de c¡mcer de pulmóll que es diez veces la de
los n(\ fumadores t~ll\tO en presencia como en ausencia de exposición
ashesto. Dc form:l ~imilar. 1:1 exposiciól\ ,II asbe~to se relaciona con un
al I
~Iunlcnlo dr I~I incidellcia dl' C¡II\CCr dc pulmóll dc cinc() veces. en
ft/m:ldoreS ~. n() fum,ldorcs. lJtili7.~llld(). pucs. como guía la medida del
cfect(\ qUl' :ldopta 1:1 form~1 de r:l7.()n. n() cxiste illdic~lción de modific~i-
I
cii"ln al!!ul1a dcl CfCCto dcl rum~lr debida ~ll ashest(' () vicever~a. Equi\'a-
Iclltcmcl1tc.
I\alcs
CU;II<.1uier modclo m(\tem:iticl)
o. lo que es 10 mismo. ulla relaci()n multiplicativa
basad() Cl1 efcctos prop()rcil\-
entre los
1
J I
f~lctores n() il1dic:lril 5ohrc la b~l.'\e de c.'\to5 datos interacción ninguna i-
clltrc 10." cit:\doS agcntes. Por cjemplo. el coeficiente de un término que
ft/esc pr(\duct(\ e/1tre a5be5tos ~. fumar ell un aná1isis de regresión logísti- I
C¡l mllltiple ba.,\ada ell datos conformes con las tasas de la tabla 15.1
scrí~1 cero: un alli\lisis log-lineal. que tiene igualmente como premisa un
model{"\ multiplicativo. también indicaria auscncia de interacción. En
rea)id~\d. cualquier evaluación estadi.'\tica de la heterogeneidad de la
razón de tasas n() encontraria discrepancia respecto de la hipótesis nula ;,
mente alguna otra medida del efect() se pueden utilizar todas igual de .~
.
bien para evaluar dicha interacción. Estos investigadores sostienen que
la converiiencia estadistica a la hora de conducir el análisis constituve
\lIla parte' integral del proceso de decisión. que determina la medida" a
utilizar para evaluar la inleracción entre variables. Darroch (1974) utili-
7.("1diver,c;os criterios dc conveniencia estadísticn )' concluía que «la defi- I
11ición multiplicati\'tl (de no interacciól1) es preferible por un pequeño
m:\rgen», De formtl similar, ~'nlter y Holford (1978). que también expre-
,c;~\ro1lsu preferencia por modelo~ multiplicativos. argumentaban que «la R
J;1
;,~;;
.: ,
;-;.-"
;!~~,:
~.;.;
INTERACCIONES
ENTRECAUSAS 349
DEr-INICION DE INTERACCION
~
Utilizando como marco conceptual el modelo causal general presentado
I.:n cll.::lrítulo 2. resulta rosiblc desarrollar una definición no ambigua de
1 1.1 intcr.tcci()n
stlliciclltcs
epidemiológica.
UC cnf'crmcuad
En dicho modelo se veía que las causas
comprcnden un.t constelación de causas com-
:]
I
--"':.;
:~
j~~'
.::~;:~~~~~~~~
r-. .~;.
distintils
(Icurrcnci¡¡
dc call~a~
d(' Cilll"'~IS
~lIficienle~.
~lIrlcienles
Un,l
quc
p(\rlC
Conlienen
de la suma
e) faclor.
e~ la
que
lasa
es la tasa
de
;; ~
¡ ;
~
l\lIC jntcrc~a. La ()Ir¡¡ r.lrle es )¡¡ lil~a dc ocurrcncia dc las causas surlcien-
J I ~.
Ic~ qllC C.lrcccn del mi~m(). Si n() cxi!\IC C()nrllsión. esla úllima tasa se
.:' ~
:c
<:(Irrcsr()ndc l¡¡mhicn c()n ¡¡¡ l(l~a cl1lrc )os n(l-expueslos. Por ¡o lanto. ¡a .,
,.
~
~ ~
I
~ .,
.,
(). CIl Icrmill()~ dc la~ (I:lrla~» cau$ale~ que corre~pondcn a loS compo-
I1C'1lc~ dc la~ medida~ epidcmi()lógica~. i...I
j
[ J G
u;
<
~
';' fl
Ij
I
..¡
~. !
ti('llt1C l! rCrrCSCIllcl Cal1s:ts C()mrmlCl1leS dc cl1rcrmcd,ld de$con()cida$ o
r()1111)('I1CI1ICSllllc simrlcmc11tc 1l() cslil11 csrecificad,\~ el1 e$le an{llisi~ en
rCIrlirlllCIr. /\si rtlcs. mcdir cl CrCCl(' tic la cxr()Rición A rcql1icre sepnrar
l'1\ Uf'S l"()mr()11Cl1lCS la laRa dc ocurrcl1ci:t dc la enrermedad enlre genle
l\tlL' tiL'I\L' tlil"lt:, cxl'osici(,11 /1: U11rrimcr(' quc rerreRenla lo~ epiRodio.<; de
.L-'l
~j
~t~
~
--;.-~-.-;
".:-,--
"'. ¡':}f
~~~f:~f:~~~:i:
,.~ ~1:!f\~\~~: ~T~~~
.:~.:
:::::~.;;:
1 IN7ERACCIONES
ENTRECAUSAS 351
1
I.a !:!t:IIIC CXrllt:~I:1 .1 ,.1 y 11 pucoc ocsarrollar la enrcrmedad a partir
\Il' t:uallluicra llc I:~la-" cl~lscs OC mcc~ll1ismos. La tasa oe ocurrencia de
11)smcc~ll1ismo-" completos que col1lienen ~l /I y E. que corresponde a la
I mctlida
ructlc scr ~lb~olllta
llclil1id~l llelt:omo:
erecto inlcractivo de los ractores .4 .v E en cuestión.
¡c
¡
~~
~,
~
~-
!i'
'--
@ ,,'
j:
.,
~
~
'é-:
:¡¡
"
;;
¡;
r;
.;
~
~
!
:1
i
R(/IB) = R(iliJ) + R(AB) -R(AB) [15.2]
,
(
"
1-) !'
R(A B) -R(,;r m
ill [15.3]
il ...
~.
~;~~.
.,;::.);;:
~~~\t';' i;I~;:lr;~'[
3!i:' EPIDEMIOLOGIA MODERNA
.JC\ I.IIIL' rL'rrCS(.'lll:1 lil l'()11Úil'i()ll (Ic :1(lilii\'iú;11.1 Úl' I()s crCCI()S í\hs()lliI()S o. I()
I.llil.. I.'S 1;1 mism:1 l'()S:I. 1(1 '111ir()rllliú(I~1 Úl.. I:IS ÚirCr(.'11Ci(,S dc las(ls ÚC UI1
r¡II..I(lr ¡1 1(1 Ií\r~c' ú(.' I()s cslr:ll()s ú(.'1 (1)lrc). Sc puCÚC rcrormular I.. cxprc-
SiC'11 11.l\.)J (.,11 Icrmi\1()s d(.' Crccl() rCI¡llivl.l lvé(,sc rórmUI,1 [ 4.1 ]). dividiel1-
Ú(, r(11 R( ..T7jl:
..
-~::.y:;:~.~'::~;.
.::~:::~~::::;:
;;:."::;?;:.,
:¡;~~::::~.
"..
-
...
:;{:i
::::0::-::;:.:.-';;
:~~:.:~~~f~,':::,
.,,-., ~ ..
:~~;,~
¡:f~;t~. :::.:;;:~~\;~
~:~:~1~J~!:~~
.di
Anliconccplivos orulcs
Uso
J Sí No
Severidad de la hipertensión
Severa 13.6 6.9
.1 1.0.
Normal 3.1
!()S dos riesgos son independientes. eso debería implicar que una mujer t
informada que arrontase la decisión de utilizar anliconceptivos orales y
s()pcsase en dicha decisión el riesgo de surrir un a.v.c., no necesitaría
Ici'l:r cn cucnta SU rresi()n ,1rteri,11. 1ndependencia significa que se puede
I rc:1lizar la C\,:lIUt1Ci()11del rie.,;go de los anticonceptivos orales sin referen-
l.:i,l a la tcnsii)11 ,lrtcri,ll.
Lo quc ~l; sigue ,de esto es que una interacción negativa debería
J
-~~
~~:
c-",;:~.
~fIJj~J
1
3~4 EPIDEMIOLOGIA
MODERNA
:~:.[~~j
¡~,~.'
~~:~il
~
' :.::.; ,.{:;;,;-.
,-.,- -
:~~.\~~~;
..~,
~~~
:cc
..:.~;...,~ ;",,;:,:,,;,.;;,;:.;,.~,,~:,~;,;;;
INTERACCIONES
ENTRE
CAUSAS 355
,.~~¡¡:;
;~~~~.
..:;::-;¡;,
;:;:;::;;'-,~,::';:i:;! ,
~
",::-:;i-o,:
.-/.;:~:~
-f¡.t;
I~
a
I~.
(
"'
I~
'.-i~. IS.I. l)(I.1 ('m/.~(lol ,IO,!(¡(,;(,111C'.t;,1(' ('/!ll,rme(I(ld ('(11/ 11110 ('(/11,\"0 ('(JmpOI/C'l/l('
111/1/11/1.
~':ij~;.
.
:~~.
,~~Ir
.',; ::~rt
~
1[~;
:.~~;f~t~~
,
~ .1
..,#'
I:il!. 15.2. !),1\' ,'(11',\11,\ \'II/it';('111t',\' tlt' l'II!(".lllt'tI(lt1 /'(III 1(11(/ t'(//I,~(/ ('(}/1Ipml('llh'
'"11/,,111,.
:~~~;¡¡í
-,$
,¡~.
~
358
1):,r:1 L'\.:llli:lr 1.ls inlcr.,ccioncs h.ln si<.1() propllc~IOS mllchos m¿lo<.1os ba-
S:IU()S CI1 1;1 COI11prob.ICii)11 <.Ic hipi)lcsis cstadí~tic.l.C;. PoC()S <.Ic cllo.c;. sjl1
L'mh:lr!!(). ~c cenlr.111 CI1 l.1 cslím.lcii}n dc p~,ri\mctr()s quc orrczc:.ln alguna
il1lcrprCI:lcii}n epidemiol()~jc¡1 uc I()s creclos jnter:.,clivos :lnilloga a I~I
cslim~lci()n <.Ic crcclos lll1i(.'(}s.
IJ:I mc<.1i<.1¡1<1t' il1lcraCl.i()11 uCril1iU¡1 CI1 1;1 ccll:lcii}11 [ 15.1 J cs la al1illoga
par¡1 <.Iici1(\ Crcclos inlcracliv()s .1 1:1 mc<.1iua .Ihsolul.' dc ereclos senci.
Ilos: CJ1 1¡lnl() q\IC lal. dchc !\cr visla COI11() la mcdida epidemiológica de
il1lcraccii)n mils rundamcnt.ll (Koopman. 1981 J. Se la puedc reescrjbjr
a~l:
I(ABI
¡\P(/tB¡
R(An¡
A B
u
A +
+ +
,~
u ;
::~.-.".,.~.,-~
'~
j)~~\\~~%~l
~~~~J
;:,"":...:-'-'
1 359
INTERACCIONES ENTRE CAUSAS
AP(.4B) = [15.8]
..\ P( A E)
@
¡\P*(/IB) = - =
.,\P(.-l .¡. E)
[15.9]
RR(A B) -1
f\.P(..t + E) = -- [15.10]
RR(AB)
¡:
ser;lll cer() Cll:lI\U() ll)s r:lclorcs tengan erectos aditivos. t
::J =
':~
;~%:
~
La r.lz()n .) seril il!ual a la unidad bajo COildiciones de aditividad. excede-
r¡i a la unidad sí~la direrencia de tasas observada para exposición con-
l~~
.illllta cxcedc .1 l.1 magnitud predicha ~ohrc la base de la suma de las
f!r
<.lircrcnci.ls de tu~a.c; y seril menor a uno cuando lu aditividad de lo~
crcct().c; ~cparado~ predice un valor mayor que el observado. La presenta-
c.:i()n de la rórmula [ 15.11 J e~taba inicialmente circunscrita al ámbito de Jci
es
!:IS uirl'rCIlCias de riesgo. per() una rormulación ba~.lda en lus diferencias
u:.: t;JS:IS cs m.is SCllCill.1 y collceptu.llmcntc equi\'alentc. L.l razón S es
.ln.il()¡;;J .11p.lr:imctr() dl: 1:1razón UC tasas. en la medida en que propor-
t'i()n.1 lln:\ c~cala rclativa para medir la interacción de dos factores de
n(
rics!!('. en dondc la unid.ld repre~enta el punto nulo que delimita los ¡
' 1 nt
..)
n"
[15.12]
lí
¡¡
C11 ll()11JI.' r~ r~( I JC11()ta 1:1 r:17.()11 Jc t:tS:1S en rcl.lci()n
La adici()n de «cxcesos de riesgos relativos» para
con
evaluar
la t.lS.1 R(AB).
sinergismos
1 p
n
(Coll' ~. MacM.lhon. 1971) es equivalentc en el plano lógico al uso del a
i11dicc .). como re$ult:t evidenle a partir de la estructura de la expresión
115.~1. j f(
1(/181
I{ER RI~(/lJJ) RR(,1[j¡ RR(AB) +
.:,
1
u
[15.13]
[15.J4]
iI~~; ~~
¡~-~.
~~~~~~~
~
INTERACCIONES
ENTRE
CAUSAS 361
Fum;ldor
N('1
('asos 3 8
C'ontrolcs 20 -18
Si
Ca~()~ 6 225
t~ontrolcs 12 166
-
I.
3¡;2 EPIDEMIOLOGIA MODERNA
--~
,,:..
.
.-~
1~1~.f = (1~1(3) = 2.96 I.~
1:1 c~limacJ() tic la ra7.()11cJc ta$nS para li$O del alcohol. en ausencia de
((rlll1\ar>1 e$:
RR II --(61(201
(12)(31 = 3.3~
"1;\~
1:1 cstimadn <ic 1:1 raz()!1 dc tasa., de la e.xposición combinada en .~
J'l'I:IL.i(:ln L.(I!1 la cxrnsici()n a !1illgün factor es:
(225)(20) = 9.04
(J66)(3)
!ti
,~~':' :~~:
~~1~¡i*:~:
r~r*}~,~
;l~~l~U{~G:,~kji:~~
]~
,\rf m ().41
0.47
\ 11"'(rll I
O.Xl)
:\ I)( 111
llc.: c.:II()".
I ~lili/;111ll() -.;i ¡lllii<.:c lic .;incrgismo. .). de la fórmula [15"12] para
IIIC.:uir la iolCril(..<.:i(}11 l:olrC fumar v hcbcr .11cohol en la ocurrencia de
l.:i\I\l:t:r ()ral. l)hICOl:mIls: .
9.()4 -
,). .87
2.96 + 333 2
.~7
\ 1)*(111 ~ 0.47
.5" .87
I{I;.I:I:I~I:N(:IAS
(i\ll:. I).. al1d ~1acMal1(\I1. n. ,\llrihul,lble risk perccnt in case-control studics.
n
;C;~f~{t JJ1fl~;~¡~f
~~%
¡j¡:
';;~'i'.
~
:~~l~~~~\\\~~t
Iv .~~~~ .
"
,.
I
l':
f~'
~
,:.
I.'
,~-
f ::'
,:
"
¡'-
¡:'
..
~:
11.ISt.1 :Iqui. I.1 discusi()11 del an{llisis de datOS ha presumido que las
\.Iri.lhlt;s dt; I.:xp()sici(111 cslahan medidas sobre una csc.1la dicolómica.
:\qucil.ls quc lo esluviesen segtln una cscaia nominal con más de dos
calcgori.1S. pueden ser tratad.l; a erectos analilicos como un conjunto de
'!~Iriabl~$ dicolámic.ls. comparando c.lda categoria con una. de referen-
L"ia: :Isi pucs. un c$tudio que relacionase el origen étnico de los residentes
Cl1 I1 ¡Iwai I.:on la inl:idencia de un.l enfermedad. podria tomar como
1.::ltcg()ria dc rcfcrclll:ia cl tlncestro haw.liano y considerar los ancestros
I.:llino. j~lPOnés y ~uropeo como tres "ariables distintas. De cara al anáii-
sis. v.lriablcs de cxposición que fuesen ordinales o continuas podrían
igu~llmente C()I.lpsarsc en dicotomías. La cuestión es que el uso de más
de dos categorí.ls lo 11()rmal es que divida los datos de forma demasiado
ri11.1como par.l dar l:.lhidtl al control de la confusión y seguir mantenien-
-,
p do a la vez un~l razonable precisián en la estimación. El hecho de
i l:OlapS.lrl.1S. sin cmhargo. implic.l también un~l degrad.1ción de la escala
de medición subyal:cnte y la pérdida de información potencialmente
importante. El gr.ldo en que los dalos indicasen una tendencia del efecto
a lo largo de varios niveles de exposición o la ausencia de tal tendencia.
puede arrojar luz .lcerca de la biologia de la relación sometida a estudio
y gUi.l de cara a cualquier intervención en términos de salud pública.
L~I pérdida de información que se sufre al Col.lpsar en categorías una
,'ariahlc cO11tinua sC mitiga m.ll1tcl1icndo para la misma más de dos
l:atcgorías orden~ldas por r.ll1go. Es I()gico. 110 ()hstante. plantearse pri-
Incro si siquiera resulta l1eces.lrio l:OI~lPS.lr en c.ltegorías. Teóricamente
debcrítl ser posible extraer mils inrormaciún de. los dalos utilizando en el
anillisis los valores reales de las observacione~. en vez de sus frecuencias
cn categorías seleccionadas. Es decir. en vez de basar un análisís en
l:atcgorias de gente que. por ejemplo. fuma O. de I a lO cigarrillos. de 11
~I 20. de 21 a 40 o de 41 .a 60 al día. debería resultar más informativo
utiliztlr el número real de cigarrillos fumados al día por cada sujeto
individual. P.lra extraer de mediciones continuas toda la informacíón
L"uantit~lliv.l prescnte cn l.lS observaciones. existen muchas técnicas esta-~
365
-~
c':: .
~¡~~;
-
I:stadislicos dcllir() dcl dc la ¡; dicl\<) lest pucdc hasar.'\e en loS \'alores rea- ~
;.~
~
;;:-{~ti
:~~\f;
-~~,,;;... :~.:;;;;.:~.;:-~..,,;;;¡;~:~:;;;,.:;:.:;;;¡;;.
,
a
Ilasl;1 ;1<.1lli. I~I <.Iiscllsi()n de! :lnillisis de daloS ha presumido que las
\ ;Iriahll:s dc cxp()si<.:i(ln cslahan medidas sobre una escala dicotómica.
1\4l1ciI~IS 4l1c lo c~lu,'iesen .'icgtln una csc~lla nominal con más de dos
c:ltcgori~ls. puedcll ser tratad~IS a efectos analiticos como un conjunto de
,'ariablcs dicotómicas. comparando cada categoria con una de referen-
cia: asi PllCS. un CSIudio que relacionase el origen étnico de los residentes
cn I fawai con la iI1<.:iden<.:ia de una enfermedad. podria tomar como
1::llc!!ori;1 <.Ic rcfcrcll(;ia cl ancestro 11~lwaiano v considerar los ancestros
--
cllino. j(lponeS :" ~uropeo como tres ,'ariables distintas, De cara al análi-
sis. variables de cxposición que fuesen ordinales o continuas podrian
igu~llmenle COI(lpSarSC en dicotomias. La cuestión es que el uso de m(ís
de doS categorias lo 11()rmal es que divida los dalos de forma demasiado
lina como par~1 d~lr c~lhida ~11conlr()1 de la confusión y seguir mantenien-
do a la vez una razonable precisión en la estimación. El hecho de
colapsarltlS. sin cmhargo, implica también una degradación de la escala
de medicióll subya<.:cnte y la pcrdida de información potencialmente
importanle. El grado en que los dat()s indicasen una tendencia del efecto
D :I lo largo de varios niveles de exposición o la ausencia de tal tendencia.
puede arrojar luz acerca de la biologia de la relación sometida a estudio
y guía de cara a cutllquier intervención en términos de salud pública.
L~l pérdida de información que se sufre al colapsar en categorías una
,'ariahlc conlinuCl sc mitiga mtl11lcnicndo p~lrtl la misma más de dos
(;:llcgorias l)rdell¡ld~lS por r:lngo, Es I()gi(;(). 110 ()bstante. plantearse pri-
mcro si siquiera rcsulta necesario colaps:lr en Ctltegorías, Teóricamente
m debería ser posible extr:ler mils información de.lo~ datos utilizando en el
anilli~is los valores reales de las observaciones, en vez de sus frecuencias
cn Ctltegorías seleccionadas. Es decir, en vez de basar un análisis en
(;atc~orías de gente que. por ejemplo. fuma O, de 1 a lO cigarrillos, de 11
a 20. de 21 a 40 0 de 41 a 60 al día, debería resultar más informativo
Iltilizar el número real de cigarrillos fumados al día por cada sujeto
individual. Ptlra extraer de mediciones continuas toda la información
L'uanliltltiva prescnte en las observaciones, existen muchas técnicas esta-~
365
~~~¡*¡i] t~~f~~~~;;~~{
:i:':.;j~J
c~~::.
¡:~:~¡!f~;:;?::iiy:~ :~~'
~~;;,;:~~j~t~~tJt}:. ¡m¡~~?¡ :.~:
:~~~t~~;:
t
.~
"
,;.
'o:
':";c",;;!:;.~,\,,. ':;.$'
~~.
~
", ~Jf::!
ANALISISCONNIVELESDE EXPOSICION
MULTIPLES 367
15.6 0.05
2. 21.8 2. 0.2
3. 0.05 3. 0.3
4. 0.05 4. 1.4
5. 0.2 5. 0.05
6. O.OS 6. 0.05
7. 12.4 7. I..:.
8. ().O5 8. 0.05
9. 0.05 9. 0.4
10. 0.2 10. 0.05
0.05 0.05
12. 2.3 12. 3.3
o
.J.", ...,
-=-
B[;;:¡~fu\:i~;.~:l;¡¡i
iJ
i~~~J
:, ,,~:~i"...*
;r¡
¡ftf!::;~¡,~~::¡~m~ .~-
j;.~;i~~.::.;
,~~::~::..:
2~~:.. :~c';~lt*~: ,~.:.:.,;,;:,::
,..:-
i:-
I f~
~
36!1 EPIDEMIOLOGIA MODERNA
cn v..llore~ medios.
La desproporcionada innuencia de la~ observaciones extremas es
un() ~ólo de los varios problema~ que podrian surgir de un análisis que ,
medad. Estc problema fue detectado por MacMahon el al. (1970). que
fucron los primeros en informar de la gran relación existente entre la
edad en el primer parto )' el ries{!o de cáncer de mama (Fig. 16.1 ).
..-
Comcntal1do la~ razones de por qué semc.iante hecho no habia sido
informad() previamente. llam..\b..\11 1..1..\tenciól1 sobre lo siguiente:~
I
E~tc nC' e~ en modo algunC' el primcr estudio en el que se haya
ohscr\'ado un;¡ dircrcncia cn cüncer de mama entre caso~ y controle~
~c!:!\m la cdad durantc el primcr parto. En mucha~ comparaciones
previas de ca~os del citado tumor y mujere.c: no arectadas, se había
encontrado quc los casos eran. por término medio. mas vie.ias al
ca~ar~e. al tener el primer embarazo o cn ambas cosas. (...) Sin embargo,
parecc quc la gente que primero traba.ió en el tema no. consideró que
la~ dirercncia~ rue~cn ~uficientcmentc importante~ como para juslificar
t:
una exploración dctallada. Del rallo en no darse cuenta de la magnitud
dc la~ difcrcncias dc ric~go rclativo quc ~ubyacen a la relación, puede ,~
haber re.c;ultado la aparenle falla dc intcrés en ésta. Semejante incapa- ~
cidad p¡ira rcconocer la fucrz:1 dc la relación puede ser atribuida
fundamcntalmenlc al hecl\o dc ulilizar análisis basado.c: en e~ladislicas
dc rcsumen. dcl lipo dc la~ media~ y lo!' réditos, En los paises donde se
c-. -~~~~;
~;::
;.:;~~.~~,.
.:.:.;,:,.
;:::~;,:; ,,"'
~
l~;\~~;; :?~
~. ~g~
.
1.4
.
.
] .
.
.
J Mujeres nulíparas
.
1.0
o
~ .
;; . .
.
"§ .
. .
o
01
0.8 .
tn
I .~
cx:
. .
.
.
0.6 .
.
. e e ¡:
,
~'
. ~
. ~
0.4
. ~
~
0.2
! I I I I' ,
o 15 20 25 30 35 40
..:,~ "
~~: :~1;
:.t~:;:
:;~1§-'1
I
ANALISISCONNIVELESDEEXPOSICION
MULTIPLES 37'
¡~.
372 EPIDEMIOLOGIA MODERNA
~ a.
L., II.. -.!..
.,
SSR =
, c.
,
~ h.
16.1]
L., "'. -.!..
I.' ( 1I
Varones
Numero de cigarrillos fumados al dia
o 1-4 5-14 5+
M ll.jcrc~
Númcru de cig:lrrillus rum¡ldu~ al día
-
o 1.4 5-14 15 +
".iI~().. 19 7 .I 19 15
('(\Illrolcs 32 12 lO 6
;~m(
71
373
t~
dos es 5.3/2.5 = 2.1. Un análisis de esos mismos datos. utilizando el ti
...
~
.
.
,.
..c.. ..' c -
:..~t
;~;~:
'~~: i~~.
1~~~~~I:i
~
"
¡~
0:;!0'..
W?.Q':-:. -, .-:-,
~{fj~- ~\~:
o:.;:
t
17' EPIDEMIOLOGIA MODERNA
j
ESTUDIOS DE SEGUIMIENTO
Para lomar Cll cuenla el palrón de loS efecloS a lo largo de una serie
,.[,
ordcnada de calegoria~ de exposición, el invesligador pu.ede poner en pie
tIna ectlación dc regre~ión. La expresión más sencilla de tendencia es una
rcgrcsi{)n de linea rccta.
('onside(.cm()~ la adecuación dc una regresión lineal simple a un
conjtll1to de d~lto~ de ta~as de incidencia brutas. La incidencia de cáncer
dc m~lma entre mtljcre~ de Hiroshima )' Nagasaki que tenian diez o más
afi()~ dc edad en el momenl() de la explosión atómica está dada en el
iii
":":~
~~;~;~::
,-,.v:.i';:-
¡~~j[:
fli
ANALISIS CON NIVELES DE EXPOSICION MULTIPLES 375
7.37
7
6 5.92
5,54
RR
1
2.48-
2.15~
¿
1,814
0.72.¡.. 0.83
0.59
..
,.-c.c.~'.".'~~
tf:
::~~
ti~"~~;
~.
. ~R~ ~~~~. ,§4s~:
~
:\~\~~\~l~l\\\~ ::r:tf~;.
..~~~:\ :;;;.-,-,
~~"'. ;"",,:.~
11¡1. l\si~11cmos " la!\ cuatr() calcporia!\ dc Il}S datos dcl ejcmplo 16.~ las
,
rlllltllal'i(}I1C~ dl' (). 5. 55 ~. I )(). l{crrC!\Cl1t¡111 los punto~ mitad dc la
l'¡IIc.:!!l}ri:l. CXl'cpl(\ CI1 cl C(IS(' dc lil mily()r. <.IIIC rcqllicrc UI1(1 puntuación
ilrhitrari(1 ror tener uno~ limite~ il1defil1ido~. Si ~c dispol1e de 1(1 inrorma- 1
;
.
ci(}I1. e~ prererihle asif!I1(lr plll1tuilcione~ qlle rcpre~cntcn el valor medio
o<: 1¡1cxr()~ici(}11 CI1 cl ~CI1O dc c~" catc~()ri(l. (Nótc~c quc p(lra e~tos datos
0<: SI.:~lilmicl1t(). cl v(ll()r mcdi() CI1 tcrmillo~ idcale.C\ 110 ~eriil lil media no
r('110Crilda de t()d().C\ I().C\~u.jelos dl' csa c:llcf!oric.l. ~il1() má~ bien unc.1 que J
](, cstll\.icsl' ~Cglll1 la c()l1trihllción de cadc.1 liI10 de ello~ en término~ dc
rcrS('I1¡I-licmr().) Con dc.ltO~ ordinales ~ill vC.1Iore~ de exro~ici(}I1.illhcren-
tcs. si sc quicrc eslimar tel1c.1encic.ls ~if!uC sielldo neccsario asignar run- ]
tuaci()nes. ,!UJ1que rue5e arhitrariamente. Ell ca~o.C\ 3sí.l() que usualmente
sc utilizan ~()n puntu"ci()ne~ unir()rmcmcnte il1cremcntada~ que corres-
r('nc.lan al r.Jng() dc cada cate~()ria.
i
I.:j('mpl,}
Ih
I (,.3.
1J i,.I"i/¡1/l'11
( .(,,'i(I,\ (1(' "(i",.,.r ti(' "I(f"'('
I' 1\(I.~(','i((k i q1((' 1('lli(f11 tli(':
.\" fJ('r,\(m(,-(f';(J,\"
() 11'(i,\ ll';(I.\ ti('
(I ri(',\',~(1 fJ(fr(1 111'(I(.r(.,'i
(.ti(lti (." (.J 111m,I(.,11(J .
1
.'I
(h, II( (..\.fJI(L\"i(;1/ (fl(;l/Ii(.(I. .'i('.l'1il/ 1(1 ti(I.\:i,\ ti(' ,.~,tli(f('i(;,1 ('I/ r(ftl ( M ("G,.('J!(Jr ct aL J9ii )
~
Dosi~ (cn radJ 1
,i -",.
,.. '-
," ..
'. --fJ.
, , "
, ;,
...
c c' .'
h, = [16.3]
illttrCcpción:
,~.
~. .
:~~:
.;.;-:';,;
::¡~t-~:
;:\~t~~Jl~;I:!
i~~
ANALISIS CON NIVELES DE EXPOSICION MULTIPLES 377
~ I;i~. 16.3. !m.i(/¡'/"./I/ ( /I,(" J tI(' ("(in("('/" tI,' "'(1111(/ .t(',!!lín la tln.ti.t tI(' ratliación en
~
'.1/tI. !"/'.(/ !,1.\"1/¡/'(1.\"1/¡'/ t';(,/"fl/'1 lfí..;. '.'111 IIII11 ,('ntl('ncia lin('a/ es'i/',ada. ~
~
"
1 /;:
~
~
.
Jonde:
n "
-}.' -.J~1 )¿... Ir J' . I .J'
I;= I "'t~j
] n
,v "
I Ir, 2:: II'
;" I J
j = I
.c.
~~
}~;k::l;,i{~~~~,:~ '~¡~~~:
:~~~~¡;\~1J\~f~~}1;
;:f.~::
.
~
-1
37f1 EPIDEMIOLOGI/I MODERNA
j=
I.
I
11' ]
SE(/; = [16.5]
"I. N~
!\12
II = -1-
a. I
par;¡ cad;1 dat() puntual j (Las tagas de magnitud cero pueden plantear
lill prohlcm.l. plle~lo que el res() seria infinilo. Una solución es añadir
lllla cantidad arhitraria. com(\ rt)(lri;1 ~cr (1.5. al numerador de cada tasa:
()Ira. ulilizar un esqucma dc ponucración modificado. del tipo de 11" =
1\. J
.,.1
Para tasas de incidencia estandari7.adas (SI R la varianza es:
., a;
i ,ri~
Var (SIR = )
dondc 11"jse refierc al peso de estand arización del estrato i. (No se deben
conrundir los pesos que se emplean para estandarizar cada tasa con los
utilizados para la regresión dc la tendencia de tasas estandarizadas,
rcspectiv3mente.) El peso de rc!:!resi ()n para cada tasa estandarizada. al
calcular los "coeficientes de rc!:!rcsi ()n. es el reciproco. de la anterior
\'afIanza:
;~
I.~
;;, ,
",~
".."'
;::,:;;;~:~;~~;;::;;;¡;.;¡;~:~~:;";;.~:;:~:;¡'-;:~;:'.;~:~:::i¡"¡i~:;;:i~~;;
,,---, J,. .-J..H.;..:J;;~.~,..1i?Z..~..
¡~.:.
.::¡:
I:::
n ~
í ".t~f ~i
j= I
SE(/;f»)
J I;~.'
)~
~
í
y la cOVariallZ;1 dc 1;/1 con I; ~~
íi
"
~ Ihn.
--j=1 -r. "'r'(j
(ov ht) = n --" " -,2
Yk = ¡jo + ¡j¡-\,k
I
Cl)ll
n n
"'t\'f -2.\"k L 11!j.\'j + .'(f L Wj
.:...
-n --n j=1 n j=1 --
SE( }rJ =
J2
] L 11't\J ¿ Ilj -L Ilj.\, j
.j=1 j=1 j=1
:¿;~I~:
~
EPIDEMIOLOGIA. MODERNA
44 :.t 1.645(62)
= 339 x 10-6 año 543 x 10-6 año
10'. años
~~~..:~d.;;¡fi~~;:
= ~~ J-
II j((1 j t- hj: L-..v-;- + :V,>
I --hr-.
,,~
J
-
NIIVf)
~ 11'.- aij
i- I b..
.I} I
SO j = -r;;-
L 1\'
11'. = ¿.
J ~!l + NiQ
-al}
2. 11'i! b2
i II N,lNio
i
El error estándar de I;' se estima ~lsí:
8 --",-
1-- \l'j
+
L \\'j-\J
~2 +
2 L \\!j"\J
--
."1 hi ha bah1
SE(/;'. = ~ ~~[fWJ~
SE(RRk) ~ .~kSE(6'~
~-.;:;!;~:
;r:~::~~;
:~::¡;::~;"f**~:" :~.
~
382 EPIDEMIOLOGIA MODERNA
1 ANALISISCONNIVELESOEEXPOSICION
MULTIPLES 383
r:I7.()ll dc tasa.'\. Ull ejemplo podría ser volver a analizar los datos de la
ri~ura I ó.2 para t.:valuar si cxistcn tcl1dencias. Dichos análisis provienen
tic un al1illisis tle rcgresión logística y no se dipone ni de las frecuencias
origin(llcs ni de las venlajas de casos a controles. Pese a todo, sigue
sicndo posible estimar una línea de tendencia lineal en los eslimados,
:lul14ue se~l menos eficienlemente que si se tuviese acceso a los dalos
()ri~incllcs. El pclrillnetro h' de la ecuación [ 16.6] se puede estimar direc-
lamente a partir de csla otra:
" , [16.7]
, \V :.\"-J'
I I
-,
i=-
11' -
I 1 1 l
RR7 -+ -+ -+ -J
) a h c d
JI5
j=l
Para cualquier valor de exposición, .~k' el valor estimado de la razón
Jc la$c.lS. RRk, se ruede obtener a partir de la fórmula [16.6] utilizando
~I ~slimado de la rendiente que recoge la expresión [16.7]. El error
~$Iilndc.lr de Ic.l razón de tasas estimada es simplemente:
SE(RRk) ~ .'t'kSE(6':
~
.; :~¡~1~l.
:1~
.:\~~:!%~;~¡:~~~. .,::;?:-:::
il:ll~
J
384 EPIDEMIOLOGIA MODERNA
r;lr;1 \';Iri()~ racl()rc$ dc conrll'C;ióI1. Lo~ rC$O$ para adccuar una line,\ de
ICI1dcIICi,l:I I()~ dalo$ punlllale$ de la citad,1 figur,\ 16.2 pucden determi- !
:.::;.;:::~~,:::;:'::j~."..:.,"::;:::;:'~:::;.:.cc;~
:~~~:
.-
':~: ,\~,~~l:;\{~~¡~:~-
;::-:.
1.:(~11
ci Jc 11il1gulla cj()raci()11. lencmos. utilizando la ecuación de regre-
,1()ll:
.--,
I~I~..".. = + (0.555)3= 2.66
/"'-
SE(I~I~..,I..
= 3(0.344) = .032
.,.
.t~:;::.
~
~1~li';,1:;~:
~
) a;
~~ , j )2
L J\Tjo\j
1.
(~ "i )~(~ f\/j
dl\Jldc .\j rcprc$enla la puntuación asignada al nivel de exposición j e i
rcpre$enta el indice del factor de estratificación para el cual el despliegue
de lo~ datos de la tabla 16.3 representa un estrato. El test de ampliación
de Mantel. en la forma dada aquí. puede ser entendido como una
~eneralización a lo~ estrato~ de un test de tendencia lineal en proporcio-
nc~. PUC$lO que se trata de un tesl asintótico. como el de Mantel-
~~1~,;1k
',',~~.
~
?":::.
.fflj'
~i:c.
l r'"
o 2
( 'asl IS
lJ() {11 lI~ al
No t:asos hn h, h~ hl
Tolal Nn N N2 Ni
il-?,
rara llllC sc r.:lilllplit:sc la r.:()l1dicil)n asintóIic~l.
~~~'
I rl1 tCsl de telldcncia lineal no tiene incorporada ninguna asunción
..'
Ilc lilll.'alidad: Sc limita a poner a prlleb;.l el c'OI"!,')I'(!I/fe lineal de la
ll.'ll(It:11Ci:\. \."llalqlliera que fuese la lendencia real. I\si pues, es útil para ~~
*.
(Ict~clar r.:lialqllier rclación monótona existente entre exposición yenfer-
m~u:lti. il1cillSO si la relación 110 es line;.ll. Por supuesto. puede haber ~;
",:~
;~~
Mantcl. ~1i~-rJ.
¡\ pcs~lr tic II) .ll1tcriormente dicho. el test de ampliación de Mantel
¡;o"slituvc. sill c.;mhar\!o. incluso con datos de caso-control. una forma J~
;i~
v(ilid(l dé pl)IlCr ~1prU~b(l la hipótesis nUI(l de que no existe una relación
moI1()ton(l ~ntre exposición y enfermedad. Su interpretabilidad deriva
dcl hccho de que unc.l ~lusencía de tendencia significa exactamente eso:
1
,
:~~
";:.i.~~.
1~
.~
;f~:~~l
tr1~tt~~
~~;;i~\\~~~i~~
'-
-~-;:~.'-~..;;., -;,:.,..;.:,;,~.~:;;;~. ,.~~, ;~~;...;;;..
o 2 ~ Totul
)
Nivcl
qllC IIIn1!;fie.\"IO1!
dc la.\"a.~
de exposición
,
.,
() 3 Total
l)i 50 ~54 ~
(.olllrolc~ 80 57
,~~
c .
:f;fJ~I~:
~
::;;
:~ ;71~
/\N/\LISIS CON NIVELES DE EXPOSICION MUL TIPLES 389
~~wl
:~~i ,..
;¡~~
.l~r~~~~~:
~I~¡;*;m:1~~f¡ )~¡~*:~ ::.;;;:;'
c.
':;: .~,.
,. ."~~~"-~~
;(.~;
~-..,.
..T!l:~~ -¡
J~(,Scnh.ltIm. P. R..
:t!!C-:td.i\l~lCO :tndB;()"I(.'r;('.~
r:tIC!\. R\lhin. D.19R4:4():4:'\7-44:;.
R. Dimctlltic~ with re{!rcssion
~ analvses
. or
Thom~I~. D. C. Gcncral rCI:lli\'e ri~k modcl~ ror stlrvi\,allimc and matchcd casc.
conlrl\1 :tMI~'~i~ Ri(,m("'.i('.~ 19R 1::17:(i73-(i76.
'1.(\lln~. T. R.. KC1narck. M. S.. and Tsi~llis. A. A Epidcmiologic ~Iudy or drin-
kin~ \V:tlcr chl()rill:ltion C1nd Wi~consill fcmalc canccr mortality. J. Na'.
~
(.(m("(". In.~l. 19RI:(i7:1191.1198.
I
t [
ti J
.~~;rn: .;:¡~~
.~~t::
,;~;J*~1[f~~¡~i~' [~!.;¡fu~}i~~~~~
INDICE
Oportunidad de exposición, 76, 277 Razón de probabilidad, test de hetero- Sección transversa
geneidad, 248-253 83
Parámetro de perturbación, 181 Razón de reparto, 115-118 Seguimiento, dato
Parejas de caso control apareadas Razón de tasas, 45, 193-194 185-197. V(
comprobación de hipótesis para, 289- Razón de tasas de incidencia (IRR), 45, estratificad(
290 186,207-209,216,235-239 Selección de series
estimación del intervalo para, 295- Razón de tasas estandarizadas (RTE).
299 Selección, sesgo dI
Véase también SRR Series de comparal
estimación puntual del riesgo relativo
Razón de ventaja (ORl, 74, 74, 181, 189, se Razón d.
a partir de, 281-282
212-213,280-281,331 Sesgo, 96-109
Período de inducción, 19-20,82,83-84 estimación de la, 325
máx imo,78 de confusión, I(
estimación puntual a partir de datos de información,
mínimo, 67-69, 70
de caso-control apareados, 280- de memoria, 99
Periodo de latencia, 20, 67
288 de selección, 96·
Período de seguimiento, 69
intervalos de confianza de, 242-246 diagnóstico, 97
Persona-tiempo, medida, 31-33
Reducción de los datos, 149, 153-156 Significación esta,
PMR (razón de mortalidad proporcio-
Regresión binaria, 322-324
nal), 84-85 146, 203
Regresión lineal, 319-320
Población Significación, con
Regresión lineal múltiple, 320
dinámica, 31-33 138
Regresión lineal simple, 319
fija, 31-33 Simpson, paradoj,
Regresión logística condicional
Politica y ciencia, 26 Situación estable I
análisis, 314
Pooling directo, 205-213 38-40
Regresión' logística multiple, 7, 313-314,
Pooling o conjuntamiento, 205, 371, 373 SMR (Stardardiz<
325
con estimadores de Mantel-Haenszel, Regresión ponderada, 260-262, 320-321, Véase RMI
219-220 375-385
con varianzas inversas, 205-213 Sobreapareamient
Regresión, análisis, logístico condicio- Sobredimensionan
con varios niveles de exposición, 373
directo,205-213 nado de, 314 SR R (Standardize
Regresión, coeficientes, estandarizados RTE
utilizando el método de maxima pro-
de, 338 Stándard, 50-53
babilidad,213-218
Porcentaje de riesgo atribuible, 18,47- Relación multiplicativa, 327-328, 330, Suficiente, causa,
48 331 , 348-349 355-357
Potencia. Véase Cálculos y curvas de Relativo, efecto, 45-47 Surgeon General,
Precisión en las mediciones, 90-95 Relativo, riesgo, 45, 74 sobre taba(
mejora de la, 115-118 exceso de, 45, 352-353 «S», Véase Indice
Prevalencia, 30, 39-41 debido a la interacción (RERI),
Prevalencia puntual, 39 360-363
Principio de incertidumbre, 13-14 Representatividad, 75, 110-112 Tabaco
Principio de incertidumbre de Heisen- RERI (Relative Excess Risk due to y cáncer de pul
berg, 13-14 Interaction), 360-363 y enfermedad Ci
Promotor, término, 20 Respuesta, codificación de, 149-151 Tablas estratifica(
Proporción atribuible, 18,47-48 Restricción, 127-128 comprobación I
a la interacción, 359-363 Retrospectivos, estudios, 80 da en, 230·
Punto nulo, 142, 143 Retrospectivo, estudio de cohortes, 70 comprobación I
Puntuación de resumen de la confusión, Riesgo, 35-36,45 228-230
342-344 atribuible, 44-45 Tamaño de un es
relativo. Véase relativo Tamaño, eficienci
Racionalismo, 12 Riesgo relativo, modelo generalizado Tasa de mortalidl
Radiación, 67, 97, 224 de, 327-328, 332, 389 especifica por e
Rastreo de sujetos, 71 Riesgos competidores, 36, 38 promediada en
Razón crítica, 47 Riesgos, razón de, 45, 186, 189,240-242 Tasas crudas, 50
Razón de incidencia acumulada. Véase Riesgo, diferencia de, 44, 185,239-240 Tasas, estandariz¡
también Estimación puntual Riesgo, factor(es) de, Tasa(s) de incidcr
Razón de morbilidad estandarizada
(RME), 53-58, 255-260. 371-373
apareamiento de, 277-278
extraños, 104-106 ,
, constante, 38
valor numérico
Razón de mortalidad proporcional Screening o cribaje, 168 Tendencia
(RMP), 84-86 SD. Véase Desviación estándar análisis multiv:
INDICE 397
Sección transversal, estudios de, 60, 81- componente lineal de la, 387
83 comprobación de hipótesis estadística
Seguimiento, datos de, estimación con, acerca de, 386-388
185-197. Véase también Análisis global, estimación de, 373-385
estratificado no lineal, 380
Selección de series de control, 85 Tendencia lineal en el efecto, 373
Selección, sesgo de, 96-98 Teorema del limite central, 156
Series de comparación, tamaño de. Véa- Término de error, modelo lineal, 319
se Razón de reparto Término iniciador, 20
Sesgo,96-109 Términos de interacción en modelos
de confusión, 103-109 multivariados, 336-338
de información, 97-103 Términos producto en modelos multi-
de memoria, 99 variados, 336-338
de selección, 96-97, 118-122 Test de la T (t-test), 203, 366-367
diagnóstico, 97 Test de Mann-Whitney, 367
Significación estadística, 7, 93-95, 133- Tiempo de espera, 36, 38-39,40, 366
146, 203 Tifus, 24
Significación, comprobación de, 133- Tipo 11, error (error beta), 92-93, 135-
138 136
Simpson, paradoja de, 104 Tipo 1, error (error alfa), 92, 135
Situación estable (población en), 32-33, Transformación logaritmica, 164
38-40
SMR (Stardardized Morbidity Ratio). Uniforme, efecto, 248-253, 355
Véase RME
Sobreapareamiento, 276-278 Vacuna contra la hepatitis B, 63
Sobredimensionamiento, 101 Validez, 96-112
SRR (Standardized Rate Ratio). Véase externa, 96-97, 111-112
RTE interna, 96-110
Stándard, 50-53 mejora de, 118-130
Suficiente, causa, 16-18,43-44,350-351, Valor de la P de Fisher, 175-176
355-357 Valores de P, 133-136, 138-140, 156-
Surgeon General, U.S.A., informe del, 162,168-170
sobre tabaco y salud, 3 de la media P, 158
HS". Véase Indice de sinergismo exactos, 158
Valores extremos, 367-370
Variabilidad aleatoria, determinación
Tabaco de, 133-144
y cáncer de pulmón, 6, 15-17 Variable de exposición, 333-335
Y enfermedad cardiovascular, 22, 207 Variables de escala continua, 333-335
Tablas estratificadas de 2 x 2 Variables de escala nominal. 150, 332-
comprobación de hipótesis aproxima- 333, 370
da en, 230-232 Variables de escala ordinal, 335
comprobación de hipótesis exacta en, Variación biológica, 59
228-230 Ventaja, 40, 324
Tamaño de un estudio, 91 Ventaja de prevalencia, 40
Tamaño, eficiencia de, 272-275 Verificabilidad, 12-14
Tasa de mortalidad, 32 Viena, Círculo de. 13
específica por edad, 49-52 Vitamina e, 63
promediada en el tiempo, 35-36
Tasas crudas, 50 Wilson, fórmula de, 297
Tasas, estandarización de, 49-58
, Tasa(s) de incidencia, 29-36
constante, 38
Yates, ((corrección de», 158-159
yalor numérico de. 35
Tendencia Zelen, procedimiento de, 252
análisis multivariado de. 388-389 Z, valor, 159