Documente Academic
Documente Profesional
Documente Cultură
Prctica 1
INTRODUCCIN AL PROGRAMA SPSS
Y MANEJO DE DATOS
Objetivos:
En esta prctica, se pretende familiarizar a los estudiantes con la base de datos
incorporada en la aplicacin SPSS. A lo largo de la prctica los estudiantes aprendern
a introducir datos desde el teclado, manejar el editor de esta aplicacin, crear nuevas
variables como transformacin de las variables originales, filtrar datos y fundir e
importar archivos de datos.
ndice:
1.
2.
3.
4.
5.
6.
7.
8.
Aspectos tcnicos
Entrar al programa
Definicin de Datos
Introduccin y Edicin de datos
Transformacin de una Variable
Recodificacin de una Variable
Filtrado de datos
Ejercicios
1. Aspectos tcnicos
El programa SPSS para Windows es una versin para ordenadores personales del
paquete estadstico SPSS (Statistical Package for Social Sciences).
El programa trabaja con 3 tipos de archivos:
los archivos de datos propios de SPSS.
.sav
los archivos de grficos y resultados de SPSS.
.spo
los archivos de sintaxis de SPSS.
.sps
Adems, permite importar archivos creados con otras aplicaciones: Excel, Lotus, Dbase, ...
y exportar archivos de datos y grficos.
2. Entrar al programa
Seleccionamos SPSS y se abrir una ventana de opciones a realizar:
El primer paso a realizar para trabajar con un archivo de datos es definir las variables.
Para definir cada variable hay dos procedimientos:
hacer doble clic sobre el encabezamiento de la variable o
seleccionar, en la parte inferior, la pestaa Vista de variables.
Observa que hay una fila para cada variable y que existen 10 columnas: Nombre, Tipo,
Anchura, Decimales, Etiqueta, Valores, Perdidos, Columnas, Alineacin y Medida. La
definicin de una variable se basa en las opciones que se ofrecen en esa ventana:
Asignar un Nombre a cada variable, cumpliendo las siguientes reglas:
Nombres con no ms de 8 caracteres (siendo siempre el primero una letra o @).
No utilizar smbolos como &, /, $, etc.
No utilizar nunca espacios en blanco.
No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, o
WITH.
Pulsa los tipos Fecha, Dlar, Moneda personalizada y Cadena y observa los formatos
permitidos.
Para salir, sin modificar el tipo original de la variable, pulsa Cancelar.
Observa el tipo del resto de variables.
Asignar una Etiqueta a cada variable de no ms de 120 caracteres (entre 30 y 40 es
el valor recomendado) que nos permita tener ms informacin sobre esa variable.
Definir Perdidos: permite definir los valores de los datos especificados como
perdidos por el usuario. A menudo es til para saber por qu se pierde informacin.
Por ejemplo, se puede querer distinguir el dato perdido correspondiente a un
entrevistado que se niega a responder del dato perdido debido a que la pregunta no
afectaba a dicho entrevistado. Los valores de datos especificados como perdidos por
el usuario aparecen marcados para un tratamiento especial y se excluyen de la
mayora de los clculos.
Sitate en el campo correspondiente a Perdidos de cualquier variable y pincha sobre
el recuadro coloreado, aparece:
Los cdigos asignados a los valores ausentes deben de ser coherentes con el tipo de
variables declarado: numricos para las numricas y alfanumricos para las
alfanumricas (mximo 9 caracteres). Se pueden introducir hasta 3 valores perdidos
(individuales) de tipo discreto, un rango de valores perdidos o un rango ms un valor
de tipo discreto. Slo pueden especificarse rangos para las variables numricas.
Estos valores ausentes son denominados por SPSS "valores ausentes definidos por el
usuario" (user-defined missing values), a diferencia de los definidos por el sistema
(system-missing values o sysmis). Estos ltimos corresponden a los que establece el
sistema para los espacios en blanco y caracteres ilegales que puedan haber en el
archivo de datos. Aparecen en los listados representados por comas.
Observa cmo han sido definidas todas las variables del archivo AMBIENTE.
Para salir de cada ventana, pulsa Cancelar. As evitars modificar el archivo.
Una vez tengas la ventana del Editor de datos del SPSS abierta y vaca, lee atentamente
las siguientes instrucciones antes de introducir datos:
Debemos definir las variables adecuadamente (en Vista de variables) de forma que
despus podamos empezar a introducir los datos en cualquier orden (en Vista de
datos).
Para introducir los datos, nos situamos en una casilla, tecleamos su valor y pulsamos
Intro o el Tabulador o nos situamos con el ratn en otra casilla. Podemos introducir
los datos por filas o columnas indistintamente.
10
Una vez introducidos los datos podemos considerar el modificarlos, ya sea para
introducir o ampliar con nuevos valores o para rectificar alguno ya introducido. La
edicin de datos en SPSS contiene comandos para: cortar, copiar, pegar, eliminar y
buscar (similar a otras aplicaciones Windows), insertar variables o casos, ir al caso,
ordenar casos, ... y se encuentran en el men Edicin y Datos.
Ejercicio 2.
1 - Insertar, entre los individuos 4 y 5, los datos correspondientes al siguiente
individuo: 2,9473
6,9708
Alto
Alicante
Para ello, nos situamos en el individuo n 5 y seleccionamos Insertar caso.
2 - Modificar el valor de la variable sulfato del individuo 11, por 2,2
3 - Modificar las especificaciones (nombre, tipo y formato columna ) de las variables
para que tengan la presentacin que t desees.
4.- Asignar las siguientes etiquetas de variable:
ozono
nivel de ozono registrado
provin
provincia del lugar de recogida de datos
5.- Sitate en Vista de datos y coloca la flecha del ratn encima del nombre de cualquier
variable, qu observas?
6.- Asignar etiquetas de valor a las variables ozono y provin:
ozono:
0 = normal, 1 = alto
provin:
1 = Alicante, 2 = Castelln, 3 = Valencia
7.- Pulsa el smbolo de etiqueta de la barra de herramientas, qu observas?
8.- Guardar las modificaciones en el archivo ambiente1.sav
11
3. pulsa Aceptar.
Para construir estas expresiones pueden usarse operadores aritmticos como +, -, *, /,
** y funciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN, ABS, MOD10,
TRUNC, RND, entre otras muchas:
12
MOD10
Resto resultante de dividir entre 10.
TRUNC
Parte entera de un nmero.
RND
Redondeo al entero ms cercano.
Pulsando el botn derecho sobre le nombre de la funcin, aparece su descripcin.
El argumento de las funciones debe ir entre parntesis.
Existen funciones particulares como UNIFORM y NORMAL, que se utilizan para la
generacin de variables aleatorias. Son de bastante utilidad en estudios de simulacin.
Es importante tener cuidado con el orden de utilizacin de los operadores y no olvidar
que los valores antiguos pierden su vigencia al recodificar una variable sobre el mismo
nombre.
El botn SI... permite realizar modificaciones similares, pero sujetas a que se verifique
una condicin lgica. Se incluirn aquellos casos que verifiquen la condicin. Los que
no la cumplan pasarn a ser valores ausentes definidos por el sistema.
Por ejemplo, si queremos modificar slo las observaciones realizadas en Alicante, en
una nueva variable new2_pH, deberemos :
pulsar en el recuadro Si ...
seleccionar Incluir si el caso satisface la condicin
escribir la condicin: provin = 1
Una expresin lgica es una expresin que puede ser evaluada como verdadera o falsa
en funcin de los valores de las variables en ella relacionadas. El nexo de las variables
son los operadores de relacin: = , >= , <= , < , > , ~= . Es posible formar expresiones
complejas, utilizando los operadores lgicos: AND (&), OR ( | ), NOT (~).
13
Vamos a ver cmo recodificar la variable sulfato en una nueva variable llamada
niv_sulf, clasificndolo en: bajo [0,3), medio [3,6), alto [6,9) y muy alto [9,11].
14
Ejercicio 4.
1. Aadir, a la variable niv_sulf las etiquetas de valores para leer baja, media, alta y
muy alta.
2. Recodificar la variable provin en una nueva variable cod_prov que contenga los
prefijos telefnicos de la provincia: Alicante 965, Castelln 964 y Valencia 963.
15
7. Filtrado de datos
El programa SPSS permite seleccionar determinados casos para un prximo proceso,
bien temporalmente o de forma permanente, sobre la base de un criterio lgico o de una
decisin aleatoria. Para ello seleccionaremos el men Datos/Seleccionar casos...
16
Todos los casos: indica que quiere procesar todos los casos del archivo de datos de
trabajo.
Si se satisface la condicin: indica que quiere procesar slo los casos que satisfagan
una condicin lgica. Para especificar o cambiar la condicin, pulse en Si. Esta
alternativa crea la variable filter_$, que el sistema crea para controlar el filtrado de
datos.
Muestra aleatoria de casos: indica que queremos seleccionar los casos de forma
aleatoria para su procesamiento. Si ha tecleado las especificaciones de muestreo,
stas aparecern junto al botn de comando Muestra. Si no, o si quiere cambiarlas,
pulse en Muestra (vase ms adelante). Esta alternativa tambin crea la variable
filter_$.
Basndose en el rango del tiempo o de los casos: permite seleccionar los casos
deseados siempre que sean consecutivos, por ejemplo del 3 al 27.
Usar variable de filtro: indica que quiere utilizar los valores de una variable
numrica existente para controlar el filtrado de casos. Seleccione la variable de la
lista de la izquierda. Los casos cuyo valor sea 0, o ausentes, en la variable de filtro se
excluyen del anlisis.
Ejercicio 5
Seleccionar, para trabajar durante una sesin, los valores de pH por debajo de 6,0.
Desactivar el filtrado anterior
Seleccionar los 8 primeros datos de todas las variables ($casenum < 9).
Desactivar el filtrado anterior
8. Ejercicios
1.- Introduce ( y guarda en ficheros adecuados) los datos de los problemas 9, 11 y 16
del tema 1. En el ejercicio 11 crea una nueva variable en la que estn los datos en
grados centgrados :C=(F-32)/1.8.
2. Archivo de datos CEREBROS:
a.
b.
c.