Sunteți pe pagina 1din 27

1

1.1

Ejemplo de anlisis descriptivo de un conjunto de datos


Introduccin
En este ejemplo se analiza un conjunto de datos utilizando herramientas de estadstica descriptiva. El objetivo es repasar algunos conceptos bsicos y proporcionar un gua de trabajo que sirva de referencia en el anlisis descriptivo. A lo largo del ejemplo, se comentaran los procedimientos propios de SPSS y se propondrn algunas cuestiones de interpretacin de resultados.

1.2

Base de datos
La base de datos para este ejemplo se encuentra en la pgina: http://www.udl.es/usuaris/q3695988/WebCursPrimer/ En dicha pgina, seleccionar la opcin Casos Prcticos en la barra izquierda. Una vez en Casos prcticos, seleccionar la base de datos del ejemplo: Factores implicados en la evolucin a ciertas intervenciones quirrgicas.

1.3

Enunciado general del ejemplo


En un estudio se quiere evaluar la posible relacin entre determinados factores clnicos y la evolucin observada en determinados procesos post operatorios relacionados con una patologa. Para ello, se han recogido los datos de un conjunto de pacientes sometidos a intervencin quirrgica en el ltimo ao. La informacin recogida es la siguiente: Gnero: IMC Concentracin 1 Concentracin 2 Concentracin 3 Gravedad al ingreso: Ingreso: Evolucin 1 Hombre, 2 Mujer Indice de masa corporal

+, ++, +++ 1 Programado, 2 Urgencia +, ++, +++

1.4

Objetivos
Realizar una descriptiva completa del conjunto de datos, justificando en cada caso el mtodo elegido Estimar el rango de normalidad de los metabolitos incluidos en este estudio en funcin de la evolucin de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronstico de evolucin. Determinar si la evolucin est relacionada con la gravedad al ingreso. Qu factores pueden influenciar esta relacin? Comparar las concentraciones de los metabolitos entre hombres y mujeres. Estudiar la relacin entre los niveles de los metabolitos y la evolucin

EJEMPLO ANLISIS DE DATOS

-1-

2
2.1

Anlisis
Realizar una descriptiva completa del conjunto de datos, justificando en cada caso el mtodo elegido
Variables cualitativas En este conjunto de datos, disponemos de distintas variables cualitativas (gnero, gravedad al ingreso, ingreso y evolucin. Por otra parte, disponemos de distintas variable cuantitativas (imc, y las distintas concentraciones). Empezaremos realizando una descriptiva de las variables cualitativas, teniendo en cuenta las distintas variables de que se dispone y los objetivos del estudio. Para ello, fundamentalmente podemos utilizar grficos de barras y tablas de porcentajes. En primer lugar, estudiaremos los resultados de la base de datos desde el punto de vista de tablas de porcentajes, relacionando la gravedad al ingreso con la evolucin de los pacientes. El procedimiento para obtener esta tabla es: Analizar>Estadisticos descriptivos>Tablas de contingencia Seleccionaremos la gravedad al ingreso en las filas y la evolucin en las columnas:

2.1.1

A continuacin, indicaremos en la opcin Casillas.. que nos interesan los porcentajes de fila:

EJEMPLO ANLISIS DE DATOS

-2-

El resultado que se obtiene es:


Tabla de contingencia GRAVEDAD * EVOLUCIO EVOLUCIO ++ 23 43,4% 25 56,8% 31 39,2% 79 44,9%

+ GRAVEDAD + ++ +++ Total Recuento % de GRAVEDAD Recuento % de GRAVEDAD Recuento % de GRAVEDAD Recuento % de GRAVEDAD 12 22,6% 12 27,3% 41 51,9% 65 36,9%

+++ 18 34,0% 7 15,9% 7 8,9% 32 18,2%

Total 53 100,0% 44 100,0% 79 100,0% 176 100,0%

Los porcentajes parecen indicar que la gravedad al ingreso comporta una peor evolucin. Para evaluar este punto, podemos calcular los residuales ajustados. En la opcin Casillas seleccionaos esta opcin:

La nueva tabla ser:

EJEMPLO ANLISIS DE DATOS

-3-

Tabla de contingencia GRAVEDAD * EVOLUCIO EVOLUCIO ++ 23 43,4% -,3 25 56,8% 1,8 31 39,2% -1,4 79 44,9%

+ GRAVEDAD + Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD 12 22,6% -2,6 12 27,3% -1,5 41 51,9% 3,7 65 36,9%

+++ 18 34,0% 3,6 7 15,9% -,5 7 8,9% -2,9 32 18,2%

Total 53 100,0% 44 100,0% 79 100,0% 176 100,0%

++

+++

Total

Donde puede verse que, efectivamente, podemos concluir que el porcentaje de pacientes con gravedad (+++) al ingreso evoluciona peor (+) que el resto.

EJEMPLO ANLISIS DE DATOS

-4-

Podemos estimar la probabilidad de que un paciente con una gravedad (+++) al ingreso tenga una evolucin (+). Para ello, recordad que el intervalo de confianza (95%) para una probabilidad es:

p0 1.96

p 0 (1 p 0 ) n

(1)

Utilizando esta expresin podemos calcular, para el grupo de gravedad (+++) al ingreso:

0.52 1.96 0.52 0.11 (0.41,0.63)

0.52 0.48 79

(2)

Este resultado puede compararse con el resultado para los pacientes con gravedad (+) al ingreso

0.23 1.96 0.23 0.11 (0.12,0.34)

0.23 0.77 53

(3)

Podis comprobar que ambos intervalos no se solapan, indicando que la probabilidad de evolucionar desfavorablemente es superior en el grupo de mayor gravedad al ingreso. Ejercicio: calcular los intervalos de confianza para todas las probabilidades de la tabla anterior. Discutir los resultados y relacionarlos con la interpretacin de los residuales ajustados. Los resultados de una tabla de contingencia pueden representarse mediante una grfica de barras. Para ello, utilizaremos la opcin Grficos>Barras, seleccionando la opcin de Agrupado

EJEMPLO ANLISIS DE DATOS

-5-

En el cuadro de dilogo correspondiente, indicaremos:

Es importante seleccionar la opcin % de casos para que los resultados se expresen segn porcentajes. En el eje de categoras situaremos la evolucin, y los grupos vendrn definidos por gravedad. El resultado ser:
60

50

40

30

20

GRAVEDAD
+

Porcentaje

10 ++ 0 + ++ +++ +++

EVOLUCIO

Donde se indican los mismos porcentajes de la tabla anterior. Puede apreciarse que el porcentaje de pacientes con evolucin desfavorable (+) aumenta con la gravedad al ingreso, mientras que la proporcin de pacientes con buena evolucin (+++) disminuye. Ejercicio: Copia los resultados de la tabla a un fichero de Excel y calcula los intervalos de confianza para cada probabilidad. Incluye unas barras de error que complementen la grfica de barras.

EJEMPLO ANLISIS DE DATOS

-6-

Hasta este punto, hemos relacionado la evolucin con la gravedad al ingreso. Seria interesante explorar si esta relacin es similar en hombres y mujeres. Para ello, podemos repetir la tabla de contingencia incluyendo la variable gnero como una capa. Con ello, se realizar una tabla independiente para hombres y mujeres:

El resultado que obtendremos ser:


Tabla de contingencia GRAVEDAD * EVOLUCIO * GENERO EVOLUCIO ++ 9 39,1% -,4 7 41,2% -,2 20 45,5% ,5 36 42,9% 14 46,7% ,0 18 66,7% 2,5 11 31,4% -2,3 43 46,7%

GENERO Hombre

+ GRAVEDAD + Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD 6 26,1% -1,4 4 23,5% -1,4 22 50,0% 2,4 32 38,1% 6 20,0% -2,2 8 29,6% -,8 19 54,3% 2,9 33 35,9%

+++ 8 34,8% 2,3 6 35,3% 1,9 2 4,5% -3,6 16 19,0% 10 33,3% 2,8 1 3,7% -2,2 5 14,3% -,6 16 17,4%

Total 23 100,0% 17 100,0% 44 100,0% 84 100,0% 30 100,0% 27 100,0% 35 100,0% 92 100,0%

++

+++

Total Mujer GRAVEDAD +

++

+++

Total

Puede apreciarse que no la tendencia es similar en ambos casos. Ejercicio: Estima la probabilidad de que una mujer con gravedad (+++) al ingreso evolucione desfavorablemente (+). Compara este resultado con el correspondiente para los hombres. Repite este clculo para el evolucin (+++).

EJEMPLO ANLISIS DE DATOS

-7-

Utilizando los mismos procedimientos, exploraremos la posible relacin entre el tipo de ingreso y la evolucin. Obtenemos:
Tabla de contingencia INGRESO * EVOLUCIO EVOLUCIO ++ 39 47,6% ,7 40 42,6% -,7 79 44,9%

+ INGRESO Programado Recuento % de INGRESO Residuos corregidos Recuento % de INGRESO Residuos corregidos Recuento % de INGRESO 24 29,3% -2,0 41 43,6% 2,0 65 36,9%

+++ 19 23,2% 1,6 13 13,8% -1,6 32 18,2%

Total 82 100,0% 94 100,0% 176 100,0%

Urgencias

Total

De estos resultados, podemos indicar que los pacientes de urgencias presentan una proporcin superior de evolucin desfavorable, si bien los resultados no son muy significativos. En este caso, seria conveniente considerar la gravedad al ingreso:
Tabla de contingencia INGRESO * EVOLUCIO * GRAVEDAD EVOLUCIO ++ 14 43,8% ,1 9 42,9% -,1 23 43,4% 11 64,7% ,8 14 51,9% -,8 25 56,8% 14 42,4% ,5 17 37,0% -,5 31 39,2%

GRAVEDAD +

+ INGRESO Programado Recuento % de INGRESO Residuos corregidos Recuento % de INGRESO Residuos corregidos Recuento % de INGRESO Recuento % de INGRESO Residuos corregidos Recuento % de INGRESO Residuos corregidos Recuento % de INGRESO Recuento % de INGRESO Residuos corregidos Recuento % de INGRESO Residuos corregidos Recuento % de INGRESO 5 15,6% -1,5 7 33,3% 1,5 12 22,6% 3 17,6% -1,1 9 33,3% 1,1 12 27,3% 16 48,5% -,5 25 54,3% ,5 41 51,9%

+++ 13 40,6% 1,3 5 23,8% -1,3 18 34,0% 3 17,6% ,3 4 14,8% -,3 7 15,9% 3 9,1% ,1 4 8,7% -,1 7 8,9%

Total 32 100,0% 21 100,0% 53 100,0% 17 100,0% 27 100,0% 44 100,0% 33 100,0% 46 100,0% 79 100,0%

Urgencias

Total ++ INGRESO Programado

Urgencias

Total +++ INGRESO Programado

Urgencias

Total

Ejercicio: Utilizando tablas de frecuencias, explora la relacin entre la evolucin de los pacientes y su gravedad al ingreso teniendo en cuenta el tipo de ingreso y el gnero. Discute las limitaciones de los resultados que obtengas.

EJEMPLO ANLISIS DE DATOS

-8-

2.1.2

Variables cuantitativas Al realizar una descriptiva de la variables cuantitativas, es conveniente, en primer lugar, comprobar si se comportan como una normal. Para ello, podemos utilizar grficas P-P. El procedimiento es: Grficos>P-P:

El resultado para conc1 es:

Normal grfico P-P de CONC3


1,0

,8

Prob acum esperada

,5

,3

0,0 0,0 ,3 ,5 ,8 1,0

Prob acum observada

EJEMPLO ANLISIS DE DATOS

-9-

Normal grfico P-P sin tendencia d


,03

,02

,01

Desviacin de Normal

0,00

-,01

-,02 -,2 0,0 ,2 ,4 ,6 ,8 1,0 1,2

Prob acum observada


Puede observase que la grfica P-P se acerca bastante a la diagonal, sin que la grfica de desviaciones muestre diferencias importantes respecto a los valores esperados segn la distribucin normal. Ejercicio: Comprobar la normalidad del resto de variables cuantitativas. Podemos completar este anlisis descriptivo de la normalidad mediante histogramas. Para ello, seleccionamos Grficos>Histograma:

EJEMPLO ANLISIS DE DATOS

- 10 -

El resultado para conc3 es:


50

40

30

20

10 Desv. tp. = 4,48 Media = 42,8 0 32,6 37,2 41,8 46,4 51,0 N = 176,00

CONC3

Ejercicio: Estudia la distribucin del resto de variables cuantitativas mediante histogramas Para el estudio descriptivo de variables cuantitativas continuas, es ms interesante utilizar diagramas de cajas. Este tipo de grficas nos permite comparar la distribucin de cada variable en funcin de distintas variables cuantitativas. As, podemos comparar la distribucin de conc3 en funcin de la gravedad al ingreso. Para ello, seleccionamos: Graficos>Diagramas de Cajas>Simple:

EJEMPLO ANLISIS DE DATOS

- 11 -

Obtenemos:
60

118

50

40

39

30

CONC3

20
N= 53 44 79

++

+++

GRAVEDAD

Podemos apreciar que no se observan cambios importantes en la distribucin de esta variable en los distintos grupos de pacientes segn la gravedad al ingreso. Los valores extremos en el caso de gravedad (+++) indican individuos con valores alejados del resto. Estos valores deben validarse para excluir errores en la entrada de datos. Mediante diagramas de cajas, podemos explorar la distribucin de una variable en funcin de dos variables cualitativas. Por ejemplo, podemos verificar si el tipo de ingreso y la gravedad determinan diferencias en la distribucin de conc3. Para ello utilizaremos: Graficos>Diagramas de Cajas>Agrupados:

EJEMPLO ANLISIS DE DATOS

- 12 -

60

68

50

40

39

30

INGRESO
Programado

CONC3

20
N= 32 21 17 27 33 46

Urgencias + ++ +++

GRAVEDAD
Podemos observar que no se producen variaciones apreciables. Ejercicio: Determina si la gravedad al ingreso y el gnero determinan alguna variacin importante en la distribucin de imc, y de las concentraciones.

EJEMPLO ANLISIS DE DATOS

- 13 -

El anlisis exploratorio de estos datos nos indica que existen algunas diferencias importantes en funcin de la edad:
130

120

110

75 37

100

90

CONC2

80
N= 84 92

Hombre

Mujer

GENERO

Esta descriptiva puede completarse mediante tablas de medias y desviaciones tpicas. Para ello podemos utilizar Analizar>Comparar Medias>Medias:

Informe CONC1 GENERO Hombre Mujer Total Media 51,670 51,748 51,711 Desv. tp. 2,3444 2,6864 2,5221 N 84 92 176

EJEMPLO ANLISIS DE DATOS

- 14 -

Podemos completar el anlisis, introduciendo distintas capas y pivotando la tabla resultante. As, podemos comparar las medias en funcin del gnero, ingreso y gravedad:
Informe CONC1 Programado Desv. tp. 3,0 2,6 2,1 2,8 2,7 3,4 2,7 3,0 2,8 3,4 2,4 2,9 INGRESO Urgencias Desv. tp. 1,9 1,9 1,9 1,9 2,8 1,5 2,1 2,2 2,3 1,6 2,0 2,0 Total Desv. tp. 2,5 2,4 1,9 2,3 2,7 2,4 2,4 2,7 2,6 2,5 2,1 2,5

GENERO Hombre

Mujer

Total

GRAVEDAD + ++ +++ Total + ++ +++ Total + ++ +++ Total

Media 52,9 54,2 50,7 52,1 53,6 51,1 51,3 52,3 53,3 52,2 51,0 52,2

N 12 6 17 35 20 11 16 47 32 17 33 82

Media 52,1 51,8 50,9 51,4 52,3 51,4 50,5 51,2 52,2 51,6 50,7 51,3

N 11 11 27 49 10 16 19 45 21 27 46 94

Media 52,5 52,7 50,8 51,7 53,2 51,3 50,9 51,7 52,9 51,8 50,8 51,7

N 23 17 44 84 30 27 35 92 53 44 79 176

Desde el punto de vista exploratorio, es interesante determinar la posible relacin entre variables cuantitativas. Esta descriptiva puede realizarse mediante grficas de dispersin: Graficos>Dispersin:

Obtenemos:

EJEMPLO ANLISIS DE DATOS

- 15 -

120

110

100

90

CONC2

80 44 46 48 50 52 54 56 58 60

CONC1

Puede observarse que no existe una tendencia evidente entre los valores de ambas variables. Ejercicio: Utilizando los procedimientos anteriores, realiza una descriptiva completa de los datos. En funcin de los resultados, indica una interpretacin global de los mismos en funcin de los objetivos que se han planteado.

EJEMPLO ANLISIS DE DATOS

- 16 -

2.2

Estimar el rango de normalidad de los metabolitos incluidos en este estudio en funcin de la evolucin de los pacientes. Evaluar la posibilidad de utilizar alguno de estos metabolitos como pronstico de evolucin.
Si podemos admitir una distribucin normal, el intervalo de normalidad al 95% se calcula como:

X 1.96 s

(4)

Para ello, debemos calcular las medias y desviaciones tpicas correspondientes a los casos de inters. Vamos a calcular dichas medias para hombres y mujeres:
Informe GENERO Mujer 60,89 4,488 ,468 92 20,50 ,955 ,100 92 51,748 2,6864 ,2801 92 93,932 6,2720 ,6539 92 40,880 3,7652 ,3925 92

EDAD

IMC

CONC1

CONC2

CONC3

Media Desv. tp. Error tp. de la media N Media Desv. tp. Error tp. de la media N Media Desv. tp. Error tp. de la media N Media Desv. tp. Error tp. de la media N Media Desv. tp. Error tp. de la media N

Hombre 53,64 4,949 ,540 84 22,51 ,951 ,104 84 51,670 2,3444 ,2558 84 104,370 6,0601 ,6612 84 45,000 4,2134 ,4597 84

Total 57,43 5,939 ,448 176 21,46 1,385 ,104 176 51,711 2,5221 ,1901 176 98,914 8,0756 ,6087 176 42,847 4,4777 ,3375 176

En funcin de estos resultados, los valores normales (que expresan entre que valores esperamos el 95% de los resultados individuales) para conc2 serian, para los hombres:

104.37 1.96 6.06 104.37 11.88 (92.49,116.25)


Para las mujeres serian:

(5)

93,93 1.96 8.07 93.93 15.82 (78.11,109.75)

(6)

Puede verse que los resultados esperados se sitan ligeramente por debajo en hombres que en mujeres.

EJEMPLO ANLISIS DE DATOS

- 17 -

Ejercicio: Calcula los intervalos de referencia para el resto de variables

Ejercicio: Calcula los intervalos de referencia de cada variable segn el grado de evolucin Si estamos interesados en determinar qu variable puede ser utilizada para clasificar a los pacientes para predecir su posible evolucin, debemos establecer qu variable presenta diferencias de distribucin en funcin de la evolucin. Para ello, podemos empezar utilizando diagramas de barras:
70

60
60 157 122

50

CONC1

22

40
N= 65 79 32

++

+++

EVOLUCIO

Puede observarse que existe una relacin entre la evolucin y la conc1. Esta variable podra utilizarse como indicativo de evolucin en el diseo de un criterio diagnstico. Para explorar esta posibilidad, podemos calcular una curva ROC. El procedimiento indica si la variable en cuestin puede discriminar un determinado grupo de pacientes. En este caso, tomaremos como grupo de inters al grupo (+++). El procedimiento es: Grficos>Curva COR

EJEMPLO ANLISIS DE DATOS

- 18 -

El resultado que se obtiene es:

Curva COR
1,0

,8

,5

Sensibilidad

,3

0,0 0,0 ,3 ,5 ,8 1,0

1 - Especificidad
Los segmentos diagonales son producidos por los empates

Podemos apreciar que esta variable discrimina bien entre el grupo de buena evolucin (+++) y el resto de grupos. Podemos incluir a las otras variables en la misma grfica:

Curva COR

1,0

,8

,5

Procedencia de la cu
CONC3

Sensibilidad

,3 0,0 0,0 ,3 ,5 ,8 1,0

CONC2 CONC1

1 - Especificidad

Los segmentos diagonales son producidos por los empates.

EJEMPLO ANLISIS DE DATOS

- 19 -

Podemos apreciar que conc3 no discrimina en absoluto, mientras que conc2 proporciona alguna discriminacin pero en menor medida que conc1.

2.3

Determinar si la evolucin est relacionada con la gravedad al ingreso. Qu factores pueden influenciar esta relacin?
Podemos estudiar esta relacin mediante tablas de contingencia. En primer lugar, tenemos:
Tabla de contingencia GRAVEDAD * EVOLUCIO EVOLUCIO ++ 23 43,4% -,3 25 56,8% 1,8 31 39,2% -1,4 79 44,9%

+ GRAVEDAD + Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD 12 22,6% -2,6 12 27,3% -1,5 41 51,9% 3,7 65 36,9%

+++ 18 34,0% 3,6 7 15,9% -,5 7 8,9% -2,9 32 18,2%

Total 53 100,0% 44 100,0% 79 100,0% 176 100,0%

++

+++

Total

Pruebas de chi-cuadrado Sig. asinttica (bilateral) ,000 ,000 ,000

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

Valor 21,976a 21,339 18,551 176

gl 4 4 1

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 8,00.

Por lo tanto, como ya habamos comentado en el apartado 2.1.1, se observa una relacin significativa entre la gravedad al ingreso y la evolucin, de manera que la probabilidad de una buena evolucin esta asociada a una menor gravedad al ingresos.

EJEMPLO ANLISIS DE DATOS

- 20 -

Si consideramos el tipo de ingreso y el gnero como posibles factores de confusin encontramos:


Tabla de contingencia EVOLUCIO ++ 9 39,1% -,4 7 41,2% -,2 20 45,5% ,5 36 42,9% 14 46,7% ,0 18 66,7% 2,5 11 31,4% -2,3 43 46,7%

GENERO Hombre

+ GRAVEDAD + Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD 6 26,1% -1,4 4 23,5% -1,4 22 50,0% 2,4 32 38,1% 6 20,0% -2,2 8 29,6% -,8 19 54,3% 2,9 33 35,9%

+++ 8 34,8% 2,3 6 35,3% 1,9 2 4,5% -3,6 16 19,0% 10 33,3% 2,8 1 3,7% -2,2 5 14,3% -,6 16 17,4%

Total 23 100,0% 17 100,0% 44 100,0% 84 100,0% 30 100,0% 27 100,0% 35 100,0% 92 100,0%

++

+++

Total Mujer GRAVEDAD +

++

+++

Total

Tabla de contingencia EVOLUCIO ++ 14 43,8% -,6 11 64,7% 1,6 14 42,4% -,8 39 47,6% 9 42,9% ,0 14 51,9% 1,2 17 37,0% -1,1 40 42,6%

INGRESO Programado

+ GRAVEDAD + Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD 5 15,6% -2,2 3 17,6% -1,2 16 48,5% 3,1 24 29,3% 7 33,3% -1,1 9 33,3% -1,3 25 54,3% 2,1 41 43,6%

+++ 13 40,6% 3,0 3 17,6% -,6 3 9,1% -2,5 19 23,2% 5 23,8% 1,5 4 14,8% ,2 4 8,7% -1,4 13 13,8%

Total 32 100,0% 17 100,0% 33 100,0% 82 100,0% 21 100,0% 27 100,0% 46 100,0% 94 100,0%

++

+++

Total Urgencias GRAVEDAD +

++

+++

Total

EJEMPLO ANLISIS DE DATOS

- 21 -

Estos resultados parecen indicar ambos factores no influencian de manera significativa la relacin entre la gravedad al ingreso y la evolucin. Finalmente, aunque no disponemos de muestra suficiente, podemos considerar todos los factores simultneamente:
Tabla de contingencia GRAVEDAD * EVOLUCIO * GENERO * INGRESO GENERO Hombre EVOLUCIO ++ +++ 4 6 33,3% 50,0% -,8 2,8 3 2 50,0% 33,3% ,4 ,7 8 0 47,1% ,0% ,5 -3,1 15 8 42,9% 22,9% 5 2 45,5% 18,2% ,2 ,2 4 4 36,4% 36,4% -,5 2,0 12 2 44,4% 7,4% ,2 -1,9 21 8 42,9% 16,3% Mujer EVOLUCIO ++ +++ 10 7 50,0% 35,0% -,1 1,6 8 1 72,7% 9,1% 1,6 -1,3 6 3 37,5% 18,8% -1,3 -,5 24 11 51,1% 23,4% 4 3 40,0% 30,0% -,2 2,2 10 0 62,5% ,0% 2,0 -1,8 5 2 26,3% 10,5% -1,8 -,1 19 5 42,2% 11,1%

INGRESO Programado

+ GRAVEDAD + Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD Residuos corregidos Recuento % de GRAVEDAD 2 16,7% -1,6 1 16,7% -1,0 9 52,9% 2,3 12 34,3% 4 36,4% -,3 3 27,3% -1,0 13 48,1% 1,2 20 40,8%

Total 12 100,0% 6 100,0% 17 100,0% 35 100,0% 11 100,0% 11 100,0% 27 100,0% 49 100,0%

+ 3 15,0% -1,4 2 18,2% -,6 7 43,8% 2,1 12 25,5% 3 30,0% -1,2 6 37,5% -,9 12 63,2% 1,9 21 46,7%

Total 20 100,0% 11 100,0% 16 100,0% 47 100,0% 10 100,0% 16 100,0% 19 100,0% 45 100,0%

++

+++

Total Urgencias GRAVEDAD +

++

+++

Total

EJEMPLO ANLISIS DE DATOS

- 22 -

Pruebas de chi-cuadrado Sig. asinttica (bilateral) ,019 ,005 ,002

INGRESO Programado

GENERO Hombre

Mujer

Urgencias

Hombre

Mujer

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

Valor 11,792a 14,805 9,501 35 7,033b 6,935 3,670 47 5,089c 4,774 1,509 49 9,694d 10,415 3,683 45

gl 4 4 1

4 4 1

,134 ,139 ,055

4 4 1

,278 ,311 ,219

4 4 1

,046 ,034 ,055

a. 6 casillas (66,7%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 1,37. b. 5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 2,57. c. 7 casillas (77,8%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 1,80. d. 5 casillas (55,6%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 1,11.

Podemos observar que en algunos casos, la relacin deja de ser significativa. Parte de este cambio es debido a la falta de casos, sin descartar totalmente la posibilidad de interacciones significativas que determinen una evolucin distinta en cada tipo de paciente. Por lo tanto, seria conveniente disear un estudio ms completo y utilizar tcnicas estadsticas ms potentes (multivariantes) para explorar el problema.

2.4

Comparar las concentraciones de los metabolitos entre hombres y mujeres.


La comparacin descriptiva de las concentraciones entre hombres y mujeres puede hacerse mediante diagramas de cajas. Por ejemplo, para conc2 tenemos:
130

120

110

75 37

100

90

CONC2

80
N= 84 92

Hombre

Mujer

GENERO

EJEMPLO ANLISIS DE DATOS

- 23 -

Podemos ver que existen diferencias apreciables. Podemos completar esta descripcin mediante el clculo de ndices muestrales:
Informe CONC2 GENERO Hombre Mujer Total Media 104,4 93,9 98,9 Desv. tp. 6,1 6,3 8,1 Error tp. de la media ,7 ,7 ,6 Mnimo 90,6 83,5 83,5 Mximo 118,2 110,6 118,2 N 84 92 176

Finalmente, podemos comparar ambos grupos y estimar la diferencia de muestras. Para ello utilizaremos la opcin: Analizar>Comparar Medias>Prueba T para dos muestras independientes

Debemos definir los cdigos de la variable gnero para definir los grupos que queremos comparar:

El resultado es:
Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior 8,6004 8,6033 12,2770 12,2742

F CONC2 Se han asumido varianzas iguales No se han asumido varianzas iguales ,032

Sig. ,858

t 11,208 11,225

gl 174 173,434

Sig. (bilateral) ,000 ,000

Diferencia de medias 10,439 10,439

Error tp. de la diferencia ,9314 ,9299

En este punto, debemos recordar que la prueba de Levene para la igualdad de varianzas permite evaluar si las muestras son compatibles con la hiptesis de que las varianzas poblacionales son iguales. En este caso, p=0.858, lo que indica que podemos asumir que las varianzas son iguales.

EJEMPLO ANLISIS DE DATOS

- 24 -

La prueba de T evala si las muestras son compatibles con la hiptesis de igualdad de medias poblacionales. En este caso, siguiendo la primera fila puesto que asumimos igualdad de varianzas, p=0.000, lo que indica que las muestras no son compatibles con la hiptesis. La estimacin de la diferencia de medias es entre 8.6 y 12,3, indicando que la concentracin media en los hombres (grupo 1) es superior a la de las mujeres. Ejercicio: Evaluar la igualdad de medias poblacionales en el resto de variables en funcin del sexo

2.5

Estudiar la relacin entre los niveles de los metabolitos y la evolucin


La descriptiva de respecto a la evolucin de los pacientes proporciona el siguiente resultado:
130

120

110

100

90

CONC2

15

80
N= 65 79 32

++

+++

EVOLUCIO

Indicando que puede existir una relacin significativa entre el nivel de conc2 y la evolucin, sin que ello implique necesariamente una relacin causa-efecto. Podemos estimar el valor medio de conc2 para cada nivel de evolucin. Para ello utilizaremos: Grficos>Barras de error>Simple:

EJEMPLO ANLISIS DE DATOS

- 25 -

120

110

95% IC CONC2

100

90
N= 65 79 32

++

+++

EVOLUCIO

Puede observarse que el valor medio se incrementa en cada grupo de evolucin. A partir de estos resultados, podemos aventurar al interpretacin de que las diferencias son significativas, dado que los intervalos no se solapan. Sin embargo, esta interpretacin es provisional y deberamos emplear un procedimiento estadstico que permitiera evaluar esta hiptesis. El procedimiento adecuado en este caso sera el anlisis de la varianza (ANOVA). Podemos evaluar el posible efecto de otras variables. As, por ejemplo, si seleccionamos Graficos>Barras de error>Agrupados:

EJEMPLO ANLISIS DE DATOS

- 26 -

Obtenemos:
120

110

100

95% IC CONC2

GENERO
90 Hombre

80
N= 32 33 36 43 16 16

Mujer + ++ +++

EVOLUCIO

En esta grfica, podemos observar que la concentracin media es superior en hombres a cualquier nivel de evolucin y que las diferencias son constantes. Por otra parte, la relacin entre la concentracin media y la evolucin es similar en hombre y mujeres. Por lo tanto, podramos concluir que la relacin entre evolucin y concentracin es independiente del gnero. Como en el caso anterior, deberamos utilizar un procedimiento de ANOVA para verificar esta interpretacin. Ejercicio: Determina si la gravedad al ingreso es un factor que modifique la relacin entre conc2 y la evolucin.

EJEMPLO ANLISIS DE DATOS

- 27 -