Sunteți pe pagina 1din 10

Taller N°3: Descripción de

variables numéricas
Steev Loyola, TM, MSc
Gianfranco Arroyo, MV, MSc

Facultad de Medicina Alberto Hurtado


Escuela de Tecnología Médica
1
Tópicos de la clase
• Comandos para resumir variables numéricas
– summarize (opción detail)
– tabstat (opciones by y statistics)
– histogram
– graph box (opciones by y over)
Pasos para abrir la base de datos de
Framingham, y un do.file
• Para abrir la base. Entren a Stata > Archivo >
Abrir
• También pueden abrir con el comando “use”
– use “C:/Users/Descargas/framingham.dta”
• Recuerden: Stata no puede abrir archivos
comprimidos
• También abran el .do file y sigamos paso a
paso (con el comando doedit, o Ctrl+9)
Comandos clave
- describe Para ver las variables y sus etiquetas
- codebook Para ver detalles por variable
- lookfor Para ubicar una variable entre muchas
- count Para contar cuantos datos hay
- clear Para borrar todo si es que es necesario
USANDO COMANDO SUMMARIZE (SUM)
summarize = sum

summarize glucosa

Variable | Obs Mean Std. Dev. Min Max


-------------+---------------------------------------------------------
glucosa | 4,037 82.18578 24.39958 40 394

. sum glucosa

Variable | Obs Mean Std. Dev. Min Max


-------------+---------------------------------------------------------
glucosa | 4,037 82.18578 24.39958 40 394

¿Encuentra
diferencias
entre las
salidas?
Usando el comando summarize
sum var#, d

sum glucosa

Variable | Obs Mean Std. Dev. Min Max


-------------+---------------------------------------------------------
glucosa | 4,037 82.18578 24.39958 40 394

. sum glucosa,d

Nivel de glucosa en ayunas(mg/dL)


-------------------------------------------------------------
Percentiles Smallest
1% 55 40
5% 62 40 ¿Cómo
10% 65 43 Obs 4,037
25% 72 44 Sum of Wgt. 4,037 interpreta la
50% 78 Mean 82.18578 media y la
Largest Std. Dev. 24.39958
75% 87 370 mediana?
90% 99 386 Variance 595.3396
95% 110 394 Skewness 6.192452
99% 186 394 Kurtosis 60.45959
Podemos usar condicionales para resumir
variables numéricas en función a otra
variable
sum var# if var_cat == 0
sum var# if var# (>,<, >=,<=)
sum ldl if edad>=65, d

Colesterol LDL (mg/dL)


-------------------------------------------------------------
Percentiles Smallest
1% 73 73
5% 106 88
10% 113 94 Obs 72
25% 132.5 106 Sum of Wgt. 72

50% 161 Mean 159.9444


Largest Std. Dev. 38.88839
75% 184.5 220
90% 213 221 Variance 1512.307
95% 220 233 Skewness .4082754
99% 288 288 Kurtosis 3.381255
tabstat es un comando para calcular
estadísticos de una variable numérica

tabstat var#, statistics(…)


tabstat var#, s(…)
tabstat p_dias , s(n mean min p25 p50 p75 max)

variable | N mean min p25 p50 p75 max


-------------+----------------------------------------------------------------------
p_dias | 4434 83.08356 48 75 82 90 142.5
Presentando gráficas con Stata

Usando lo siguientes comandos:

histogram var# graph box var#


.01

140
.008

120
Presion diastolica (mmHg)
.006
Density

100
.004

80
.002

60
0

0 200 400 600


40

Colesterol LDL (mg/dL)

9
Manos a la obra….
Pasos para el taller:
1. Abra la base de datos de bd_bioUPCH_framinham.dta
2. Cree un do file.
• Guarde record de todos sus comandos. Se
recomienda registrar detalles del porqué usan cada
comando
3. Más ejemplos? Sigamos el do file del taller
4. Resumamos las variables;
• Edad
• Colesterol

10

S-ar putea să vă placă și