Sunteți pe pagina 1din 15

PASO DATA

Pgina en blanco

Statistical Analysis System

DATA

1 Captulo:CreacindeunarchivoSAS
Hay varias formas de crear archivos de datos para utilizarlos en el SAS: 1. Introducir datos por el teclado directamente a un DataSet. 2. Importar datos con el importador de SAS. 3. Leer datos de un archivo de datos plano (archivo ASCII). 4. Leer datos desde un formato diferente directamente a SAS. De cualquiera de las formas anteriores el objetivo es crear un archivo de datos SAS que llamaremos DataSet. Un DataSet es un fichero que almacena (guarda) los datos y tambin ciertas caractersticas asociadas a ellos como su tipo, numrico o cadena, su formato de lectura (INFORMAT), su formato de escritura (INFORMAT), etc. Un DataSet es un archivo rectangular donde las columnas son las variables y las filas son los casos u observaciones.

Introducir datos por el teclado


La forma ms directa de introducir datos en SAS es por medio de la ventana ViewTable. Utilizando ViewTable se puede crear un fichero de datos y definir las caractersticas fundamentales de las variables que lo componen (nombre, longitud y tipo). Se accede a ella con la secuencia: Tools -> Table Editor Y se abre la ventana ViewTable.

1-

Statistical Analysis System

DATA

En la ventana ViewTable se distinguen filas y columnas. Las filas corresponden a la informacin que se recoge de un individuo, es lo que se llama caso. Las columnas se corresponden a los distintos tipos de informacin que se recoge de un caso, son las variables. Para introducir un dato se sita el cursor en la celda y se teclea el valor. Por ejemplo, en la celda 1,A (primer caso, variable A) se introduce el valor 2. Queda de la forma siguiente.

2-

Statistical Analysis System

DATA

Para definir los atributos de las variables, por ejemplo de la variable A, se sita el cursor en el nombre de la variable y se pulsa el botn derecho del ratn. Se obtiene la ventana de Column Attributes,

En esta ventana se puede cambiar o definir: Name Label Nombre de la variable. Etiqueta de la variable

Type (el tipo de variable): Character (cadena o carcter) y Numeric (numrica) Length Format Informat Longitud de la variable. Formato de salida o de escritura. Formato de entrada o de lectura.

Como ejemplo vamos a crear un fichero de datos SAS llamado Alumnos_VT. Los datos son los siguientes. Nombre Sexo Edad Peso Talla Alicia Tomas Felipe Julia M H H M 14 11 16 11 69 57 72 51 112 85 150 50

3-

Statistical Analysis System

DATA

Una vez introducidos los datos para guardar el conjunto de datos y estando la ventana ViewTable activada se selecciona Save As y se obtiene la ventana siguiente.

Donde se puede seleccionar la librera SAS donde se guardar el fichero. Creamos la librera Ejemplo. Para ello se pulsa el icono, ventana como se ve, , (Create new library) y se rellena la

En esta ventana se define la librera en la carpeta fsica E:\Datos_Ejemplos. El resultado final es,

4-

Statistical Analysis System

DATA

Se ha creado el fichero de datos SAS Ejemplo.Alumnos_VT

es un fichero fijo

almacenado en la librera Alumnos (que fsicamente esta almacenada en la carpeta E:\Datos_Ejemplos). Para cerrar la ventana ViewTable se pulsa la x de la propia ventana.

5-

Statistical Analysis System

DATA

Importar datos con el importador de SAS.


Cuando el fichero de datos est en un formato propietario de otro programa como Excel o Access es til emplear el importador de SAS. Para acceder al importador se selecciona,

File -> Import Data

Aparece la ventana,

Permite seleccionar entre:

6-

Statistical Analysis System Standard data source User-defined formats

DATA

Por defecto aparece marcada la primera opcin y dentro de ella nos propone la opcin del que el fichero de datos es del tipo Excel 97, 2000 or 2002. En este momento el importador no soporta el formato de la ltima versin de Excel. Las opciones ms importantes son los formatos Excel, Access, dBase, Lotus 1-2-3, texto plano en sus modalidades csv (comma separated values), Tab delimited file y Delimited file. Ejemplo 1: Importar un archivo de datos EXCELL. Importar el archivo EXCELL Detrano_Punto.xls Abrimos el Importador de SAS.

File -> Import Data

7-

Statistical A Analysis Sy ystem Apar rece la vent tana,

DATA D

8-

Statistical A Analysis Sy ystem

DATA D

Y al pulsar Finis se obtien el fichero de datos importado. En este cas el datas se sh ne o i so set llama Detrano y se encue a entra en la librera tem mporal WORK. Por lo tanto el fic chero cread en SAS es: work.d do detrano. Al ser un fichero tempor desapare ral ecer al finalizar la se esin SAS.

9-

Statistical Analysis System

DATA

Ejemplo 2: Importar un archivo de datos ASCII delimitados por tabulador. Importar el archivo empleados_tab.txt File -> Import Data

10 -

Statistical Analysis System

DATA

Ejercicios Importar los ficheros siguientes: Tv.Phy.LE.xls, U.S. Unemployment Rates.xls, Neonatal.xls, Resultados_Encuestas.

11 -

Statistical Analysis System

DATA

Los datos se leen desde un archivo plano


Por medio del paso DATA se puede leer los archivos planos. Un archivo plano tambin llamado archivo ASCII o de texto es un archivo donde la informacin est sin codificar. Por ejemplo, un archivo de Word presenta una codificacin especial de forma que aparte de la informacin hay unos cdigos de control que por un lado guardan informacin sobre el fichero, tipo de letra, tamao, etc, y a la vez slo se puede ver con el programa Word. La mayor parte de los programas pueden escribir sus archivos en forma de archivo plano por lo que es una forma segura de trasladar la informacin desde un programa a otro. Sin embargo, los metadatos que acompaan a la mayor parte de los ficheros propietario se pierden. Por ejemplo, si se exporta con Word a un archivo ASCII, este nuevo archivo no guardar la informacin de ttulos, negritas mrgenes, etc. El archivo plano del que leeremos los datos podr estar en el mismo archivo de cdigo SAS o bien en un archivo diferente almacenado en alguna unidad del ordenador que estemos utilizando. Para leer un archivo ASCII necesitamos el conjunto de los comandos: DATA nombre_fichero; INPUT...; DATALINES; datos ; El archivo de datos SAS creado, DataSet, es el nombrado en la sentencia DATA Ejemplo: Creacin de un conjunto de datos SAS temporal con el fichero de datos en el archivo de cdigos.
DATA alumnos; /* Paso data: Se crea el DataSet alumnos */ INPUT Nombre $ 1-11 Sexo $ 12 EDAD 14-15 Peso 17-18 Talla 20-22; DATALINE; /* CARDS es la forma antigua de DATALINE */ Alicia M 14 69 112 Tomas H 11 57 85 Felipe H 16 72 150 Julia M 11 51 50 ; PROC SORT; BY NOMBRE; /*1 Paso PROC: Se ordena el DataSet alumnos por nombre */ PROC PRINT;/*2Paso RUN;
PROC: imprime el fichero alumnos en la ventana de resultados*/

DATA nombre_archivo; INFILE...; INPUT...;

12 -

Statistical Analysis System

DATA

El cdigo anterior crea el archivo temporal alumnos. El archivo alumnos no es un fichero del sistema operativo, es un fichero del entorno SAS. Al finalizar la sesin SAS alumnos desaparece. Los datos en el fichero alumnos se escriben despus del comando CARDS y se leen con el formato definido en el comando INPUT. El procedimiento PROC SORT ordena el archivo alumnos segn la variable Nombre. El procedimiento PROC PRINT lo presenta en la pantalla OUTPUT. En SAS tiene definidos gran cantidad de formatos los principales son el numrico y el alfanumrico o variables carcter que se denotan por el smbolo $ despus del nombre de la variable: Nombre $ EDAD Variable cadena o alfanumrica. Variable numrica.

Los comentarios es SAS se declaran de dos formas distintas: 1. por la secuencia /* y terminan con la secuencia */. 2. Por la secuencia * y terminando como cualquier otra sentencia SAS, es decir con ; . Un comentario es una sentencia que no se ejecuta. Ejemplo: Creacin de un conjunto de datos SAS temporal con el fichero de datos en un archivo de datos externo.
DATA COCHES; INFILE "F:\COCHES.DAT"; /* Da el camino y nombre del fichero ASCII */ INPUT CONSUMO 1-2 MOTOR 3-6 CV 7-9 PESO 10-13 ACEL 14-17 ANO 18-19 ORIGEN 20 CICLINDR 21; /* Describe como son las variables del fichero */ PROC PRINT; RUN; LIBNAME FF 'A:\'; /* El nombre de la librera es arbitrario */ DATA FF.COCHES; INFILE "A:\COCHES.DAT"; INPUT CONSUMO 1-2 MOTOR 3-6 CV 7-9 PESO 10-13 ACEL 14-17 ANO 18-19 ORIGEN 20 CICLINDR 21; PROC PRINT; RUN;

El camino y nombre del comando INFILE depende del sistema operativo en el que estemos trabajando.

13 -

S-ar putea să vă placă și