Documente Academic
Documente Profesional
Documente Cultură
Estadística Descriptiva
Formato:
PROC FREQ opciones;
<instrucciones generales>
opciones
DATA = data set selecciona el data set que se ordenará
Instrucciones generales del procedimiento FREQ.
TABLES <var1> * <var2> * ... /opciones;
Int LI LS PM
1 165
2
3
4
• Máximo: 25981
Int LI LS
• Mínimo: 165 1 165 6619
• Recorrido:25816 2 6619 13073
• Amplitud:6454
3 13073 19527
4 19527 25981
PROC FORMAT
PROC FORMAT;
VALUE Name(options)
Range1 = 'Label1'
Range2 = 'Label2' ;
Run;
PROC GCHART;
VBAR variable /MIDPOINTS=(valor menor TO valor mayor BY intervalo)
Cuantiles:
MEAN es el valor medio proc means max min mean std range data=salarios;
MEDIAN es la mediana var salario;
STD es la desviación estándar output out=resultado max=maximo mean=media;
STDERR es el error estándar proc print data=resultado;
RANGE es el rango Run;
Los estadísticos a incluir en el proc means y en el
dataset_salida mediante la instrucción OUTPUT son:
N Número de observaciones no faltantes.
NMISS Número de observaciones faltantes.
NOBS Número de observaciones.
MEAN Media.
STDMEAN Desviación estándar de la media.
SUM Suma de los valores.
STD Desviación estándar.
VAR Varianza.
CV Coeficiente de variación.
USS Suma de cuadrados no corregida.
CSS Suma de cuadrados corregida.
SKEWNESS Asimetría.
KURTOSIS Kurtosis.
SUMWGT Suma de los pesos de los valores.
MAX Valor máximo.
MIN Valor mínimo.
RANGE Rango de valores.
Q3 Percentil del 75% (3er Cuartil).
Ejercicio
Utilizando la tabla senadores obtener los siguientes
parámetro estadísticos: Máximo Mínimo Media
Moda Mediana Varianza Dev tip Coeficiente de
variación Kurtosis Asimetría.
Tabla de frecuencias.
g2> 0 g2 = 0
g2< 0
Asimetría
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden
a reunir más en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se
tienden a reunir más en la parte derecha de la media.
Uso del procedimiento
UNIVARIATE
Permite el cálculo de estadísticas univariadas simples para variables numéricas.
Es apropiada para variables continuas o para variables discretas con un gran
número de valores, si estos valores tienen una media.
SINTAXIS:
PROC UNIVARIATE opciones DATA=Nombre del programa;
VAR listado de variables;
BY variable;