Sunteți pe pagina 1din 12

Estadística descriptiva e inferencial

Pedro Romero Aroca, Carlos Lázaro García, Julio José González López

1. Introducción

2. Estadística descriptiva

a) Definir una distribución de datos. Índices de

centralización y dispersión

b) Consideraciones estadísticas acerca de la agudeza

vidual

c) Leyes teóricas que se ajustan a distribuciones

biológicas

d) Representaciones gráficas

3. Programas estadísticos. SPSS

4. Estimación de parámetros

a) Estimación puntual y por intervalos

b) Inferencia bayesiana

1. INTRODUCCIÓN

La estadística da sentido a la información acumulada en los trabajos de investigación. Muchos


profesionales se sienten intimidados ante ella porque

creen que se trata de un campo complejo y extraño,

ignorando que no es necesario ser un experto para

utilizar e interpretar la inmensa mayoría de las herramientas estadísticas utilizadas en los estudios
clínicos. Al igual que no es preciso saber programación

para utilizar los programas de ordenador más habituales, no se precisa tener una elevada base
matemática para utilizar correctamente la estadística. Solo

tenemos que tener claro cuándo y cómo aplicar de

manera apropiada los test estadísticos más frecuentes

y comprender su verdadero significado. Si necesitamos algo más complejo debemos hacer lo mismo

que hacemos con toda naturalidad en nuestra profesión: consultar con un especialista.
Los métodos estadísticos se clasifican en descriptivos e inferenciales. Los métodos descriptivos
caracterizan las variables y se utilizan en trabajos descriptivos y para definir nuestra muestra como
primer paso

para realizar un análisis. La estadística inferencial,

en cambio, infiere alguna propiedad de la población

a partir de nuestra muestra y se divide en dos tipos

principales de técnicas: estimación de parámetros y

contraste de hipótesis (estadística analítica). En este

capítulo abordaremos la estadística descriptiva y la

estimación de parámetros, reservando el próximo capítulo para el contraste de hipótesis.

2. ESTADÍSTICA DESCRIPTIVA

a) Definir una distribución de datos. Índices de

centralización y dispersión

Vamos a aprender, antes que nada, a resumir

todos los datos que hemos recopilado de nuestros

pacientes en índices (por ejemplo, media o desviación típica) que representan fielmente cada una de

las variables registradas. Las mayoría de las pruebas

estadísticas se sustentan en el uso de estos índices.

Para poder resumir de manera eficaz una variable,

debemos responder a tres preguntas:

– ¿Cuántos individuos hay en nuestra muestra?

Tamaño muestral (n).

– ¿Cuál es el valor central de la distribución? Medidas de centralización.

– ¿Los datos están muy próximos o muy dispersos? Medidas de dispersión.

Medidas de centralización. Cuando medimos una

variable cuantitativa, observamos que hay valores

muy frecuentes en torno a los cuales se agrupan lo

demás, mientras que los valores extremos (muy altos

o muy bajos) son muy raros. A ese valor central es al


que denominamos media aritmética (x). Su cálculo

«El auge de la estadística en el Siglo XX, como el de la geometría en el siglo III antes de Cristo, parece
marcar

una de las grandes eras o periodos críticos en el desarrollo

del conocimiento humano»

Sir Ronald A. Fisher

166 22. Estadística descriptiva e inferencial

es sencillo: basta con sumar todos los valores medidos y dividir la suma entre el total de observaciones

(n).

La media aritmética se usa como índice de centralización en muestras grandes y variables que siguen
una distribución normal y es con mucho la más

utilizada, pero no la única. Para muestras pequeñas,

asimétricas, y que no siguen la curva de Gauss, existen otras medidas de centralización: La mediana: es

el valor que divide a la muestra en dos partes iguales,

una vez ordenadas todas las medidas de menos a mayor. Es equivalente del percentil 50 (P50) o del
segundo cuartil (Q2). Si el tamaño muestral es impar, es el

valor que queda en el medio. Si el tamaño muestral

es par, es la media aritmética (o semisuma) de los dos

valores centrales. La moda es el valor más repetido

de la distribución. Una distribución normal es unimodal (esto es, hay una única moda, que coincide

con la media y la mediana), pero puede haber distribuciones bimodales (con dos modas) o con más de

dos modas. Otras medidas de centralización, menos

usadas en investigación clínica, son la media geométrica y la media armónica.

Medidas de posición. La interpretación de estos

índices es similar al de la mediana. Se trata de índices

que dividen a la muestra en X partes iguales.

– Cuartiles: son los 3 valores que dividen la

muestra en 4 partes de igual tamaño.

– Deciles: son los 9 valores que dividen la muestra en 10 partes de igual tamaño.

– Percentiles: son los 99 valores que dividen la


muestra en 100 partes de igual tamaño.

Medidas de dispersión. La forma más sencilla de

explicar la dispersión de nuestros datos consiste en

calcular la extensión del intervalo entre el menor valor observado y el mayor. Este índice es el rango o

recorrido. Sin embargo, el rango se ve muy afectado

por los valores extremos y es útil para describir la

dispersión de muestras pequeñas, asimétricas, o que

no siguen una distribución normal.

Para variables normales y muestras grandes, las

medidas de dispersión más usadas son la varianza, y

la desviación típica (o estándar).

Una primera iaproximación para definir la dispersión de las observaciones es calcular la diferencia entre
la media aritmética y cada observación. El

problema que tendremos aquí es que la mitad de las

diferencias tendrán un resultado negativo y la mitad

un resultado positivo. Por tanto, si calculamos directamente la media de estas diferencias, el resultado

siempre será 0. Para solucionar esto, podríamos calcular la media de los valores absolutos de cada una

de las diferencias. El resultado de esto es la desviación media:

Sin embargo, este índice es poco útil. Otra forma

que tenemos de deshacernos de los signos negativos

es elevar al cuadrado, por lo que el resultado de este

índice estará medido con las unidades originales elevadas al cuadrado. Promediando este sumatorio de

los cuadrados de las diferencias, el índice que obtenemos es la varianza (V):

Por ejemplo, si estamos calculando la varianza de

una longitud axial, medida en mm, el resultado de la

varianza estará dado en mm2. Si queremos que el valor del índice de dispersión venga dado en las
mismas

unidades que la media aritmética, la solución consiste en hallar su raíz cuadrada. Al resultado de esto es

a lo que llamamos desviación típica, o estándar (SD):


b) Consideraciones estadísticas de la agudeza

vidual

El cálculo de la media y la desviación estándar de

la agudeza visual no es difícil, pero se hace de una

manera incorrecta en múltiples estudios de investigación. El problema reside en que los optotipos
actuales siguen una progresión geométrica, no aritmética

(el tamaño del optotipo correspondiente a una AV de

0,1 no es el doble que la que corresponde a 0,2, sino

que cada paso de nivel supone un cambio de 0,1 unidades logarítmicas). Por ello debe utilizarse la media

geométrica, no la aritmética. La forma más sencilla

de calcular la medida de un grupo de agudezas visuales es utilizar no los optotipos de Snellen, sino

los optotipos de LogMAR (que significa logaritmo del

ángulo mínimo de resolución) y calcular entonces la

media aritmética de los valores obtenidos. Si no disponemos de éstos, debemos convertir cada valor al

LogMAR equivalente y seguidamente hacer la media,

22. Estadística descriptiva e inferencial 167

volviendo a hacer la conversión a la escala decimal

del resultado. También vale con hacer una transformación logarítmica de los valores decimales, con lo

que consigue normalizar la distribución. La tabla I da

una equivalencia de ambos parámetros y existen calculadoras on-line para el mismo propósito
(www.infodoctor.org/gipi/f/calculos_optotipos.xls). Lo mismo

que ocurre para el cálculo de la media, sucede para

otros cálculos estadísticos, tales como t de Student,

ANOVA, correlaciones. Siempre deben utilizarse los

valores del LogMar.

Otro problema se plantea con las agudezas visuales computadas como «contar dedos» «movimiento

de manos», «percepción de luz» y «no percepción

de luz». Holliday da las siguientes recomendaciones

de equivalencia:
– «Contar dedos»: se puede asumir que, en pies

se puede hacer un equivalente con un cociente entre

el número de pies a los que se ha contado dedos y

200 de denominador A 10 pies la AV sería de 10/200

y a 2 pies 2/200. Si lo tomamos en metros, es lo mismo con un denominador de 60. Por ejemplo, si se

cuenta dedos a 3 metros 3/60= 0,03 en escala decimal y a 1 metro 1/60=0,016.

– Si no cuenta dedos y solo ve movimiento de

mano, los denominadores son, respectivamene 2000

y 600. Es decir, que movimiento de manos a un metro es 1/600= 0,0016 en escala decimal.

– La agudeza visual reducida a la percepción de

luz y no percepción de luz, según Holliday no son

medidas reales de la agudeza visual y por lo tanto

estos casos deberían ser excluídas del estudios y señaladas como criterio de exclusión en el material y

métodos. Ese punto es muy discutible, ya que da lugar a un sesgo evidente.

Otro caso muy frecuente se da en pacientes que

no leen todos los optotipos de una línea. Una solución, probablemente la más utilizada, es tomar la

línea con mayor agudeza visual en la cual el paciente ha sido capaz de ver la mayoría de los optotipos

(por ejemplo, 3 de 5). Un método más exacto es interpolar entre los valores vistos completamente y los

parcialmetne con el cociente de letras vistas, siempre

sobre el LogMar.

Ejemplo 22.1

Un paciente ve todas las letras de la fila

de optotipos correspondientes a 20/50

(0,4), pero sólo tres de cinco de la fila de

20/40 (0,5). En escala LogMar ambas escalas corresponden a +0,4 y +0,3. Y 3 de

5 letras corresponden a 3/5 del intervalo

entre +0,4 y +0,3, que es +0,36, el valor

que debe ser tomado.

Ejemplo 22.2
Vamos a hallar la media de la AV de los 7

ojos que se detallan en la siguiente tabla:

Datos de agudeza visual

Ojo AV

(pies)

Equivalente

Snellen

en pies

Equivalente

decimal

LogMar

equivalente

1 20/10 20/10 2 -0,3

2 20/10(-2) 20/10(-2) 2 (-2) -0,25

3 20/40 20/40 0,5 0,3

4 20/40(+3) 20/40(+3) 0,5 (+3) 0,24

5 20/200 20/200 0,1 1

6 Cuenta

dedos a 2

pies (=60

cm)

2/200 0,01 2

7 Movimiento

de manos

a 2 pies

(=60 cm)

2/2000 0,001 3

Medias 20/142 0,141 0,85


Las agudezas visuales se han pasado todas a LogMar (última columna), respetando la conversión de
interpolación anteriormente citada de aquellos pacientes

que solo veían unos cuantos optotipos

Tabla I . Correspondencia entre agudezas

visuales

Equivalente

Snellen (pies)

Equivalente decimal (minutos)

Equivalente

LogMAR

20/16 1,25 -0,10

20/20 1 0

20/25 0,8 +0,10

20/32 0,63 +0,20

20/40 0,5 +0,30

20/50 0,40 +0,40

20/63 0,32 +0,50

20/100 0,2 +0,7

20/200 0,1 +1

20/400 0,05 +1,3

168 22. Estadística descriptiva e inferencial

de su última fila (paciente 2 y 4) y las

conversiones de contar dedos y movimiento de mano (paciente 5 y 6)

c) Leyes teóricas que se ajustan a distribuciones

biológicas

Las variables de una población en muchas ocasiones

se ajustan a modelos matemáticos preestablecidos. Si

sabemos que la variable que estudiamos se asocia a un


modelo conocido, eso significa que tenemos un enorme poder sobre ella. Al tener la fórmula
matemática que

siguen nuestros datos podemos, por ejemplo, dibujar

la curva que expresa ese modelo y aplicar test estadísticos que están basados precisamente en que
nuestras

variables siguen determinados modelos matemáticos y

no otros. Hay modelos a los que se ajustan una gran

cantidad de mediciones en la naturaleza y el modelo de

distribución normal o de Gauss es el más frecuente y conocido. Saber si nuestras variables siguen una
distribución normal es vital para utilizar más tarde las pruebas

estadísticas más frecuentes, llamadas paramétricas (ver

capítulo 21, contraste de hipótesis). Existen otras distribuciones que también se dan en la naturaleza,
como la

distribución binomial o la de Poisson, pero su descripción queda fuera del ámbito de este trabajo.

Distribución normal de Gauss: La distribución

normal fue descrita inicialmente por A. Moivre y posteriormente desarrollada por C.F. Gauss, por lo que

es también conocida comúnmente como «Curva de

Gauss» (fig. 1) La distribución de una variable normal

está determinada por su media (m) y desviación típica (s). Las propiedades de una distribución normal se

describen en la tabla II.

d) Representaciones gráficas

Las representaciones gráficas son un medio muy

útil para entender los estudios estadísticos, debido a

que una imagen penetra más fácilmente en nuestro

entendimiento de los resultados que la observación

simple de series numéricas.

Utilidad de las representaciones gráficas (1, 2):

1. Permiten que nos demos cuenta del desarrollo

de cualquier fenómeno estadístico fácilmente

2. Facilitan la observación y detección de relaciones entre series de datos, en las que aún no se ha
analizado matemáticamente su posible relación.

3. Nos ayudan a juzgar la exactitud de los resultados obtenidos, tras el análisis matemático.

4. Facilitan la observación de la interdependencia que pudiera existir entre dos variables.

Si bien las representaciones gráficas son muy útiles para observar de forma clara y resumida la
información recogida sobre la variable estudiada (es muy

cierto el aserto que una imagen vale más que mil palabras), hemos de ser muy prudentes al
confeccionar

o interpretar las mismas, puesto que una misma información se puede representar de formas muy
diversas,

y no todas ellas van a ser válidas.

Variables cualitativas y cuantitativas discretas

– Diagrama de barras o columnas: Se realizan

sobre dos ejes de coordenadas, uno de abscisas (horizontal) y otro de ordenadas (vertical). En el de
abscisas se disponen los valores de la variable, y en el ordenadas la escala de frecuencias a partir del
valor 0.

La altura del valor de cada variable en las ordenadas

corresponderá a la frecuencia de cada variable. Es

importante en la elaboración de este gráfico tener en

cuenta que sea cual sea la frecuencia considerada, la

escala siempre debe iniciarse en cero y coincidir con

el cero de ordenadas. La representación puede realizarse de forma horizontal, como en la figura 2 o bien

con el cero de frecuencias en vertical, además como

presentamos los distintos valores de frecuencias pueden dibujares uno junto a otro o bien separados
entre

ellos.

– Sectores circulares. Este gráfico se construye

repartiendo los 360º del círculo proporcionalmente

a la intensidad que registra el fenómeno considerado

y expresado generalmente en forma de porcentaje.

Cada sector que se forma debe ajustarse a la frecuencia de aparición de los valores de la variable
estudiada, para ello es preciso calcular los grados del ánguFig. 1: Distribución normal y sus porcentajes
respecto de la
desviación estándar.

22. Estadística descriptiva e inferencial 169

lo de su sector circular, una vez repartidos los 360º

del círculo en los diferentes sectores, uno por cada

variable, se puede trazar la imagen. En el ejemplo

que presentamos en la figura 3, definimos dos sectores diferenciados que corresponden al porcentaje
de

hombres y mujeres de la muestra de un estudio de

prevalencia de retinopatía diabética (3).

– Pictogramas y cartogramas. Los pictogramas

son gráficos especiales, en que para hacer más llamativo el mismo, se dibujan en lugar de barras, figuras

representativas de la variable estudiada, por ejemplo

el caso típico es la representación del crecimiento

de la población de un determinado País, de manera

que se van representando imágenes progresivamente

más altas de un sujeto, que representan el aumento

de la población. Los cartogramas son mapas geográficos en los que la intensidad de la variable estudiada

en diferentes regiones, se representan por ejemplo,

mediante la intensidad del rayado o de la coloración

de cada una de ellas, son muy utilizados para señalar

datos demográficos como densidad de población o

prevalencia de una determinada enfermedad en las

distintas regiones de un país o del mundo.

– Diagrama polar: Es una forma de gráfico similar

a los sectores circulares, por ejemplo si queremos representar la asistencia anual, de los pacientes
diabéticos a una unidad de cámara no midriática, para realizarse las retinografías de control del fondo
de ojo, en

este caso para reproducir la gráfica representaremos

el número de pacientes vistos en cada mes mediante

una línea con punto 0 y que se irán disponiendo en


forma circular una al lado de la otra separadas por el

ángulo polar, dando lugar a una circunferencia dividida en los doce meses del año. Cada línea formará

un radio propio de longitud proporcional al número

de visitas realizadas cada mes en la unidad de cámara no midriática (4). En estos gráficos siempre se
traza

un círculo con radio en la media aritmética, y así se

puede visualizar mejor las variaciones de asistencia

según los meses del año (fig. 4).

S-ar putea să vă placă și